Zašto bi povezivanje sa našim „gerbilskim mozgom“ moglo pomoći mašinama da bolje čuju
Istraživači sa australijskog Univerziteta Makvori opovrgavaju 75 godina staru teoriju o načinu na koji ljudi određuju odakle zvuci dolaze.
U 1940-im je razvijen inženjerski model radi objašnjenja kako ljudi mogu da lociraju izvor zvuka na osnovu razlika od samo nekoliko desetina milionitih delova sekunde kad zvuk stigne do svakog uva.
Taj model je radio na teoriji da moramo imati skup specijalizovanih detektora čija jedina funkcija je utvrđivanje odakle zvuk dolazi, sa lokacijom u prostoru predstavljenom namenskim neuronom. Njegove pretpostavke otada usmeravaju i utiču na istraživanje – i kreiranje audio-tehnologija.
Međutim, nova studija sa Univerziteta Makvori pokazuje da ideja nervne mreže posvećene prostornom slušanju nije verodostojna, piše EurekAlert.
Profesor Dejvid Mekalpajn proveo je proteklih 25 godina dokazujući da životinje zapravo koriste mnogo oskudniju nervnu mrežu, sa neuronima na obe strane mozga koji izvršavaju ovu funkciju pored ostalih.
Putem kombinacije specijalizovanih slušnih testova, najsavremenijeg skeniranja mozga i upoređivanja sa mozgovima drugih sisara, uključujući rezus majmune, naučnici su sad prvi put pokazali da ljudi takođe koriste te prostije mreže.
„Volimo da mislimo da su naši mozgovi mnogo razvijeniji nego kod drugih životinja, ali to je samo arogancija“, kaže Mekalpajn. „Pokazali smo da su gerbili kao zamorci, zamorci kao rezus majmuni, a rezus majmuni kao ljudi u ovom pogledu. Prost, energetski efikasan oblik nervnog sklopa izvodi ovu funkciju – takoreći naš gerbilski mozak“.
Istraživači su takođe pokazali da ista nervna mreža razdvaja govor od pozadinskih zvukova – što je značajno za oblikovanje i slušnih aparata i elektronskih pomoćnika u telefonima.
Sve vrste mašinskog slušanja imaju problem sa slušanjem u bučnom okruženju. To otežava ljudima sa slušnim aparatima da raspoznaju jedan glas na bučnom mestu, i pametnim uređajima da razumeju kad im govorimo.
Umesto usredsređivanja na velike jezičke modele koji se trenutno koriste, sugerišu naučnici, potreban je mnogo jednostavniji pristup. Veliki jezički modeli su sjajni u predviđanju sledeće reči u rečenici, ali pokušavaju da urade previše.
Sposobnost lociranja izvora zvuka je ono što je bitno u ovom pogledu, a da bismo to uradili nije nam potreban „dubokoumni“ jezički mozak. Druge životinje to mogu da urade, a one nemaju sposobnost govora.
Dok slušamo, naši mozgovi ne prate zvuk sve vreme, što veliki jezički procesori pokušavaju da rade. Umesto toga, mi – i druge životinje – koristimo naš „plitki mozak“ da razaberemo vrlo male delove zvuka, uključujući govor, i koristimo te deliće da označimo lokaciju, a možda čak i identitet izvora.
Ne moramo verno da rekontruišemo visokokvalitetni signal da bismo to uradili, već razumemo kako naš mozak predstavlja taj signal u nervnom smislu, znatno pre nego što stigne do centra za jezik u korteksu.
„To nam pokazuje da mašina ne mora da bude istrenirana za jezik kao ljudski mozak da bi uspešno čula. Potreban je samo taj gerbilski mozak“, kažu naučnici.
(Telegraf Nauka/EurekAlert)