Vreme čitanja: oko 3 min.
Roboti sa novim algoritmom "dizajnirane nasumičnosti" uče brže i efikasnije sakupljajući podatke u hodu
Vreme čitanja: oko 3 min.
Inženjeri sa Severozapadnog univerziteta u Sjedinjenim Državama razvili su novi algoritam veštačke inteligencije (AI) namenjen specijalno za pametnu robotiku.
Pomažući robotima da brzo i pouzdano uče složene veštine, novi metod bi mogao značajno poboljšati praktičnost – i bezbednost – robota za niz primena, uključujući samovozeće automobile, dostavljačke dronove, pomoć u domaćinstvu i automatizaciju, piše EurekAlert.
Uspeh tog algoritma leži u sposobnosti ohrabrivanja robota da istražuju svoja okruženja što je nasumičnije moguće kako bi stekli raznovrsna iskustva.
Ova „dizajnirana nasumičnost“ popravlja kvalitet podataka koje roboti sakupe o svojoj okolini. Upotrebljavajući kvalitetnije podatke, pak, simulirani roboti su demonstrirali brže i efikasnije učenje, poboljšavajući ukupnu pouzdanost i učinak.
U poređenju sa drugim AI platformama, simulirani roboti sa novim algoritmom Severozapadnog univerziteta postojano su nadmašivali najsavremenije modele. Novi algoritam, zapravo, radi toliko dobro da su roboti naučili nove zadatke i uspešno ih obavili u jednom pokušaju – učinivši šta treba iz prvog puta. Aktuelni modeli AI, nasuprot tome, omogućavaju sporije učenje putem pokušaja i pogrešaka.
„Druge AI platforme mogu biti nepouzdane“, kaže inženjer Tomas Berueta. „Ponekad će obaviti zadatak kako treba, ali će u nekim slučajevima biti sasvim neuspešni. S našom platformom, dok je robot uopšte sposoban da obavi zadatak, svaki put kad ga aktivirate možete očekivati da će uraditi upravo ono što mu je rečeno“.
Radi obuke algoritama mašinskog učenja, istraživači i programeri koriste velike količine podataka, pažljivo filtrirane i organizovane. AI uči iz tih podataka, putem pokušaja i pogrešaka, do postizanja optimalnih rezultata.
Dok taj proces dobro funkcioniše za bestelesne sisteme kao što su ChatGPT i Gugl Džemini (ranije Bard), ne funkcioniše za sisteme AI sa telesnom konstrukcijom kao što su roboti. Roboti sami sakupljaju podatke, bez pomoći ljudi.
Tradicionalni algoritmi nisu kompatibilni sa robotikom na dva načina. Prvo, bestelesni sistemi imaju prednost sveta gde fizički zakoni ne važe. Drugo, individualni neuspesi nemaju posledice. Za aplikacije kompjuterske nauke, važno je jedino da je uspešna u većini slučajeva. U robotici, jedan neuspeh može biti katastrofalan.
Radi prevazilaženja ovog jaza, inženjeri su razvili novi algoritam koji obezbeđuje da roboti sakupljaju visokokvalitetne podatke „u hodu“. U suštini, algoritam MaxDiff RL naređuje robotima da se kreću nasumičnije kako bi sakupili obuhvatne, raznovrsne podatke o svojim okruženjima. Učeći putem samostalno sakupljenih nasumičnih podataka, roboti stiču neophodne veštine da obave korisne zadatke.
Radi testiranja novog algoritma, istraživači su ga uporedili sa aktuelnim, najnaprednijim modelima. Pomoću kompjuterskih simulacija su zatražili od simuliranih robota da izvrše niz standardnih zadataka. Roboti sa MaxDiff RL su učili brže od drugih modela. Takođe su pravilno izvršili zadatke mnogo doslednije i pouzdanije nego drugi.
Možda još impresivnije, roboti sa MaxDiff RL su često izvršavali zadatak pravilno iz prvog pokušaja, i to čak kad su počeli bez ikakvog znanja.
„Naši roboti su bili brži i agilniji – sposobni za efikasnu generalizaciju naučenog i primenu na nove situacije. Za primene u stvarnom svetu, gde se ne može priuštiti neograničeno vreme za pokušaje i pogreške, to je ogromna prednost“, kaže Berueta.
Pošto je MaxDiff RL generalni algoritam, može se koristiti za razne svrhe. Istraživači se nadaju da će doprineti rešavanju fundamentalnih problema, omogućavajući pouzdano odlučivanje u pametnoj robotici.
Ne mora se koristiti samo za robotska vozila koja se kreću unaokolo. Može se koristiti i za stacionarne robote – kao što je robotska ruka u kuhinji koja uči na napuni mašinu za pranje posuđa.
Dok zadaci i fizičke sredine postaju složeniji, uloga telesne konstrukcije postaje bitniji faktor u procesu učenja. Ovo je važan korak ka stvarnim sistemima koji obavljaju komplikovanije, interesantnije zadatke.
(Telegraf Nauka/EurekAlert)
Video: Gruber: Zadovoljna sam saradnjom Srbije i SAD u oblasti nauke
Nauka Telegraf zadržava sva prava nad sadržajem. Za preuzimanje sadržaja pogledajte uputstva na stranici Uslovi korišćenja.