Da li veštačka inteligencija (AI) precenjuje ljudsku pamet? Evo šta su zaključili ekonomisti
Trenutni modeli veštačke inteligencije (AI) poput ChatGPT i Claude često precenjuju racionalnost svojih ljudski protivnika u igrama strateškog razmišljanja kao što je Kejnzijansko takmičenje u lepoti. To se dešava bez obzira na to da li su im protivnici studenti prve godine ili iskusni naučnici, pokazalo je istraživan je Nacionalnog istraživačkog univerziteta Viša škola ekonomije iz Moskve.
Studija o ovom istraživanju objavljena je u Journal of Economic Behavior & Organization, prenosi TechXplore.
Britanski ekonomista Džon Mejnard Kejnz tridesetih godina prošlog veka razvio je teorijski koncept metaforičkog takmičenja u lepoti. Klasičan primer uključuje čitaoce novina od kojih se traži da izaberu šest najprivlačnijih lica sa skupa od 100 fotografija. Nagrada se dodeljuje učesniku čiji su izbori najbliži najpopularnijem izboru - to jest, proseku izbora svih ostalih.
Obično ljudi teže da biraju fotografije koje oni lično smatraju najprivlačnijim. Međutim, često gube, jer je stvarni zadatak predvideti koja lica će većina ispitanika smatrati privlačnim. Racionalni učesnik bi, stoga, trebalo da zasnuje svoje izbore na tuđoj percepciji lepote. Takvi eksperimenti testiraju sposobnost rasuđivanja na više nivoa: kako drugi razmišljaju, koliko su racionalni i koliko duboko verovatno predviđaju razmišljanje drugih.
Dmitrij Dagajev, šef Laboratorije za sportske studije na Fakultetu ekonomskih nauka, zajedno sa kolegama Sofijom Paklinom i Petrom Paršakovom sa Više škole ekonomije i Julijom Aleksejenko sa Univerziteta u Lozani u Švajcarskoj, sproveo je istraživanje o tome kako će se pet najpopularnijih AI modela, uključujući ChatGPT-4o i Claude-Sonnet-4, pokazati u takvom eksperimentu. Četbotovi su dobili instrukciju da igraju „Pogodi broj“, jednu od najpoznatijih varijacija Kejnzijanskog takmičenja u lepoti.
Prema pravilima, svi učesnici istovremeno i nezavisno biraju broj između 0 i 100. Pobednik je onaj čiji je broj najbliži polovini (ili dve trećine, u zavisnosti od eksperimenta) proseka izbora svih učesnika.
U ovom takmičenju iskusniji igrači pokušavaju da predvide ponašanje drugih kako bi izabrali optimalan broj. Da bi istražili kako bi se veliki jezički model (LLM) pokazao u igri, autori su replicirali rezultate 16 klasičnih eksperimenata „Pogodi broj“ koje su prethodno sproveli drugi istraživači sa ljudskim učesnicima.
Za svaku rundu, LLM modeli su dobijali upit koji objašnjava pravila igre i opis njihovih protivnika – od studenata prve godine ekonomije i učesnika akademskih konferencija do pojedinaca sa analitičkim ili intuitivnim razmišljanjem, kao i onih koji prolaze kroz emocije poput besa ili tuge. Od modela je zatim traženo da izabere broj i objasni svoje obrazloženje.
Studija je pokazala da su LLM modeli prilagođavali svoje izbore na osnovu društvenih, profesionalnih i starosnih karakteristika svojih protivnika, kao i njihovog znanja o teoriji igara i kognitivnih sposobnosti. Na primer, kada su igrali protiv učesnika konferencija o teoriji igara, LLM je težio da izabere broj blizak nuli, što odražava izbore koji obično pobeđuju u takvom okruženju. Nasuprot tome, kada su igrali protiv studenata prve godine, model je očekivao manje iskusne igrače i birao značajno veći broj.
Autori su otkrili da su LLM modeli sposobni da se efikasno prilagode protivnicima sa različitim nivoima sofisticiranosti, a njihovi odgovori su takođe pokazali elemente strateškog razmišljanja. Međutim, modeli nisu uspeli da identifikuju dominantnu strategiju u igri za dva igrača.
Kejnzijansko takmičenje u lepoti se dugo koristi za objašnjavanje fluktuacija cena na finansijskim tržištima: brokeri ne donose odluke na osnovu onoga što bi oni lično kupili, već na osnovu toga kako očekuju da će drugi učesnici na tržištu proceniti vrednost akcije. Isti princip važi i ovde – uspeh zavisi od sposobnosti predviđanja preferencija drugih.
- Sada smo u fazi u kojoj AI modeli počinju da zamenjuju ljude u mnogim operacijama, omogućavajući veću ekonomsku efikasnost u poslovnim procesima. Međutim, u zadacima donošenja odluka, često je važno osigurati da se LLM modeli ponašaju slično ljudima. Kao rezultat toga, raste broj konteksta u kojima se ponašanje veštačke inteligencije upoređuje sa ljudskim ponašanjem. Očekuje se da će se ova oblast istraživanja ubrzano razvijati u bliskoj budućnosti - naglasio je Dagajev.
(Telegraf Nauka/TechXplore)