Istraživači sa UCSF-a obučili su algoritam za raščlanjivanje značenja iz neuronske aktivnosti.
- Neuronska aktivnost učesnika prikuplja se dok izgovaraju 50 rečenica.
- Algoritam mašinskog učenja razvija predviđanje mogućeg značenja prikupljenih podataka.
- Tačnost sistema varira, ali rezultati su obećavajući.
To je samo početak, ali je prilično uzbudljivo: sistem koji prevodi aktivnost mozga u tekst. Za one koji nisu fizički u stanju da govore, kao što su na primer ljudi sa ‘Locked-in’ sindromom (LIS) ili sindrom ‘zarobljenosti u sopstvenom telu’, ovo bi moglo da promeni život.
Trenutno to je poput gledanja kroz gustu maglu, ali istraživači iz laboratorije Chang sa Kalifornijskog univerziteta u San Francisku obučili su algoritam mašinskog učenja kako bi izvukli značenje iz neuronskih podataka.
Joseph Makin, koautor ovog istraživanja kaže za The Guardian: “Nismo još stigli dotle, ali mislimo da bi ovo mogla biti osnova govorne proteze.”
Istraživanje je objavljeno u časopisu Nature Neuroscience.
Prisluškivanje
Kako bi trenirali njihovu veštačku inteligenciju, Makin i koautor Edward F. Chang su “prisluškivali” neurološku aktivnost četvorice učesnika. Kao epileptičaru, svakom od učesniku su implantirane elektrode u mozak radi praćenja epileptičnih napada.
Učesnicima je dostavljeno 50 rečenica koje su morali pročitati naglas najmanje tri puta. Dok su to radili, neuronski podaci su prikupljeni od strane istraživača. (Takođe su napravljeni audio snimci.)
Studija navodi pregršt rečenica koje su učesnici izgovarali, a među njima su:
- “Ti muzičari su čudesno usklađeni.”
- “Nosila je topli mekani vuneni kombinezon.”
- “Ti su lopovi ukrali trideset dragulja.”
- “U kuhinji vlada haos.”
Zadatak algoritma je bio da analizira prikupljene neuronske podatke i predvidi šta je rečeno prilikom generisanja podataka. (Podaci povezani sa neverbalnim zvucima uhvaćenim u audio snimku učesnika prvo su uzeti u obzir.)
Algoritam istraživača prilično je brzo naučio da predviđa reči povezane sa delovima neuronskih podataka. Veštačka inteligencija je predvidela da podaci dobijeni kada je rečeno:”Mala ptica je posmatra metež”, znače: “Mala ptica gleda gleda metež”, što je sasvim blizu, dok je rečenica “Merdevine su korišćene za spašavanje mačke i čoveka” previđena je kao, “Koje će se merdevine koristiti za spašavanje mačke i čoveka.”
Tačnost je varirala od učesnika do učesnika. Makin i Chang su otkrili da je algoritam zasnovan na jednom učesniku bio u prednosti pri treniranju za drugog učesnika, sugerišući da bi trening veštačke inteligencije mogao da postane lakši vremenom i ponovljenom upotrebom.
Iz Guardian-a su razgovarali sa stručnjakom Christian Herff, koji sistem smatra impresivnim jer koristi manje od 40 minuta podataka dobijenih kroz trening svakog od učesnika, što je bolje nego kod drugih pokušaja gde je potrebna daleko veća količina vremena da izvuku tekst iz neuronskih podataka. On kaže, “Time postižu nivo tačnosti koji do sada nije postignut.”
Raniji pokušaji da se izvuče govor iz neuronske aktivnosti bili su usredsređeni na foneme od kojih su izgrađene govorne reči, umesto toga Makin i Chang su se fokusirali na celokupne reči. Iako zasigurno ima više reči od fonema, i stoga to predstavljalo veći izazov, studija navodi da, “na proizvodnju bilo koje određene foneme u kontinuiranom govoru snažno utiču fonemi koji su joj prethodili, što smanjuje njenu prepoznatljivost.” Da bi umanjili poteškoće u pristupu baziranom na rečima, izgovorene rečenice su koristile ukupno samo 250 reči.
Kroz neuronsku maglu
Jasno je da ipak ima prostora za napredak. Veštačka inteligencija je takođe predvidela rečenicu „Ti muzičari su čudesno usklađeni“ kao „Spanać je bio poznati pevač“. “Nosila je topli mekani vuneni kombinezon”, pogrešno je predviđena kao: “Oaza je bila fatamorgana.” “Ti su lopovi ukrali trideset dragulja”, pogrešno je protumačena kao: “Koje pozorište prikazuje majku gusku”, dok je algoritam predvideo podatke za “U kuhinji je haos” kao “Tu je je pomaže mu da ukrade kolačić.”
Naravno, vokabular koji je uključen u ovo istraživanje je ograničen, kao i primeri rečenica. “Ako pokušate izaći izvan [50 korištenih rečenica], dekodiranje postaje mnogo gore”, napominje Makin, pozivajući se na ograničenja u svojoj studiji. Drugo očigledno ograničenje dolazi iz činjenice da je veštačka inteligencija bila obučena iz rečenica koje je svaki učesnik izgovorio naglas, što je nemoguće kod pacijenata sa LIS sindromom.
Ipak, istraživanje Makin-a i Chang-a ohrabruje. Predviđanja za jednog od njihovih učesnika zahtevala su samo malu korekciju od 3%. To je zapravo bolje od stope od 5% greške koja se pronalazi u transkriptima koje su radili ljudi.
Priredila: Dajana Krnajski
Izvor: Big Think