Парализирана жена ''проговори'' с помощта на цифров аватар
Тежко парализирана жена успя да говори чрез аватар с помощта на технология, която преобразува мозъчните ѝ сигнали в реч и изражения на лицето.
Постижението поражда надежди, че интерфейсите мозък-компютър (BCI) могат преобразят живота на хората, които са загубили способността си да говорят поради заболявания като инсулти и амиотрофична латерална склероза (ALS), съобщава "Гардиън", цитиран от БГНЕС.
Досега пациентите трябваше да разчитат на разочароващо бавни синтезатори на реч, които изписват думи с помощта на проследяване на очите или малки движения на лицето, което прави естествения разговор невъзможен.
Най-новата технология използва миниатюрни електроди, имплантирани на повърхността на мозъка, за откриване на електрическа активност в частта на мозъка, която контролира говора и движенията на лицето. Тези сигнали се преобразуват директно в реч и изражение на лицето на дигитален аватар, включително усмивка, намръщване или изненада.
Нашата цел е да възстановим пълноценния, въплътен начин на общуване, който наистина е най-естественият начин да разговаряме с другите. Тези постижения ни приближават много повече до превръщането на това в реално решение за пациентите, казва професор Едуард Чанг, който ръководи работата в Калифорнийския университет в Сан Франциско (UCSF).
Пациентката, 47-годишната Ан, е тежко парализирана, тъй като преди повече от 18 години е получила инсулт на мозъчния ствол. Тя не може да говори или да пише и обикновено общува с помощта на технология за проследяване на движенията, която ѝ позволява бавно да избира букви със скорост до 14 думи в минута. Тя се надява, че технологията на аватара ще ѝ позволи в бъдеще да работи като консултант.
Екипът имплантира тънък колкото хартия правоъгълник от 253 електрода по повърхността на мозъка на Ан в областта, която е от решаващо значение за говора. Електродите прихващат мозъчните сигнали, които, ако не беше инсултът, щяха да контролират мускулите на езика, челюстта, ларинкса и лицето ѝ.
След имплантирането жената работи с екипа, за да обучи алгоритъма на системата за изкуствен интелект да открива уникалните ѝ мозъчни сигнали за различни звуци на речта, като повтаря многократно различни фрази.
Компютърът е научил 39 характерни звука, а езиковият модел в стил Chat GPT е бил използван за преобразуване на сигналите в разбираеми изречения. След това той се използва за управление на аватар с персонализиран глас, който звучи като гласа на Ан преди травмата, въз основа на запис на нейния говор по време на сватбата ѝ.
Технологията не е съвършена, като в 28% от случаите при тестово изпитване, включващо повече от 500 фрази, тя декодира думите неправилно и генерира текст от мозъка със скорост 78 думи в минута, в сравнение с 110-150 думи, които обикновено се произнасят в естествен разговор.
Въпреки това учените твърдят, че последните постижения в областта на точността, скоростта и усъвършенстването показват, че технологията вече е на етап, в който може да бъде практически полезна за пациентите.
"Това е доста голям скок в сравнение с предишните резултати. Намираме се в критична точка", коментира проф. Ник Рамзи, невролог от Университета в Утрехт, Нидерландия, който не е участвал в изследването.
Следващата важна стъпка е да се създаде безжична версия на BCI, която да може да се имплантира под черепа.
"Осигуряването на възможност за хората да управляват свободно собствените си компютри и телефони с тази технология би имало дълбоко въздействие върху тяхната независимост и социални взаимодействия", посочва д-р Дейвид Моузес, доцент по неврологична хирургия в UCSF и съавтор на изследването.