W 1985 r. Stephen Hawking, bodaj najwybitniejszy astrofizyk naszych czasów, bezpowrotnie stracił głos. Ale nie przestał mówić. Bo choć w kolejnych latach stwardnienie zanikowe boczne, na które chorował, nieubłaganie wyniszczało jego organizm, coraz bardziej ograniczając geniuszowi możność komunikowania się ze światem, z pomocą przyszły mu nauka i technologia. Początkowo używał do tego specjalnych kart z literami, które wskazywał uniesieniem brwi, łącząc je w wyrazy i zdania, później wykorzystywał elektroniczny kliker i program Equlizer, działający na komputerze Apple II. Wybrane na ekranie słowa wypowiadał za profesora syntezator mowy.
Ostatnim narzędziem, które umożliwiało Hawkingowi pisanie, redagowanie, poruszanie się po internecie i mówienie, był system ACAT (Assistive Context Tiilkit). Dzięki codzienność uczonego w ostatnich latach jego życia nie była już taką udręką jak wcześniej. To właśnie ACAT wytworzył metaliczny, syntetyczny głos, którym Stephen Hawking przemawiał do świata – i z którego go zapamiętaliśmy.
Gdyby zmarły przed 5 wielki Brytyjczyk żył nadal, pewnie niecierpliwie przyglądałby się osiągnięciom naukowców z Radboud University i UMC Utrecht.
Udało im się bowiem przekształcić w mowę już nie prymitywne ruchy kursora kierowanego przez człowieka skurczami mięśni czy ruchem gałek ocznych – ale sygnały pochodzące bezpośrednio z mózgu. Umożliwiło to odpowiednie połączenie implantów mózgu ze sztuczną inteligencją.
Sukces potwierdził eksperyment przeprowadzony przez zespół Julii Bierezuckiej, badaczki z Donders Institute for Brain, Cognition and Behaviour Uniwersytetu Radboud i UMC Utrecht. Uczeni poprosili pacjentów cierpiących na padaczkę, którym tymczasowo wszczepiono implanty mózgowe, o wypowiedzenie 12 wybranych słów, a w tym czasie mierzono aktywność ich mózgów. Tak powstały neurologiczne mapy wiążące aktywność mózgu z mówieniem. Sztuczna inteligencja pomogła z kolei przełożyć tę aktywność na mowę.
Innymi słowy, dzięki obserwacji aktywności mózgu możliwe stało się nie tylko zgadywanie tego, co człowiek chce powiedzieć, ale przeobrażenie tego zamiaru w słyszalne dźwięki – słowa. Więcej: dzięki zaawansowanej cyfrowej rekonstrukcji dźwięku ta mowa brzmiała jak naturalny głos danej osoby.
Czasy, gdy schorowani ludzie przemawiali cybernetycznym głosem robotów, mijają bezpowrotnie.
Oczywiście to tylko początek. Na razie system pozwala przewidywać jedynie pojedyncze słowa, ale nie całe zdania. Zastosowanie dużych modeli językowych pozwoli jednak wkrótce przekroczyć i tę barierę – ba!, możliwe będzie przewidywanie i transformowanie na mowę całych akapitów.
Czekamy na kolejne eksperymenty, doskonalsze implanty, bogatsze bazy danych i lepszą sztuczną inteligencję. Odliczanie trwa.
Zdjęcie zajawka: Tim Anderson/Domena Publiczna CC BY-NC-ND 2.0
Zostaw komentarz
You must be logged in to post a comment.