Kazne ne sprečavaju AI da vara, samo postaje bolji u tome

Kažnjavanje veštačke inteligencije (AI) zbog obmana i štetnih akcija ne sprečava je da se ponaša na pogrešan način, samo je tera da postane bolja u prevarama. To je pokazala nova studija tima OpenAI, tvorca ChatGPT-ija.

Otkako su krajem 2022. veliki jezički mofeli (LLM) postali poznati široj javnosti, mnogi su često prijavljivali obmane i opasne sposobnosti veštačke inteligencije. Ove akcije uključuju sve od laganja, varanja i skrivanja do pretnji smrću, krađom nuklearnih šifara i stvaranjem smrtonosne pandemije, piše LiveScience.

Sada je eksperiment pokazao da je smirivanje ovog „lošeg ponašanja“ tokom treninga teže nego što se mislilo.

Istraživači u OpenAI dali su zadatak novom, još skrivenom modelu ciljeve koji mogu da budu sprovedeni laganjem, varanjem ili prečicama. Tim je otkrio da je AI prevarom povećao sopstvenu nagradu. Međutim, kažnjavanje modela nije popravilo njegovo ponašanje, samo je njegova obmana postojala manje vidljiva. Kompanija je objavila istraživanje u blogu i ono tek treba da prođe stručnu recenziju.

- Dok programeri mogu da prate i obeležavaju loše ponašanje, praćenje je veoma nepouzdano. Ako se primeni stroga kontrola, modeli uče da kriju svoje namere, a nastavljaju loše da se ponašaju – naveli su oni.

Oni su pratili modele koji koriste metodu „lanac misli“ kako bi objasnili svoju logiku. Oni tu objavljuju svoj plan sa svakim korakom koji naprave, pa je lako pratiti ih. Istraživači su koristili metode pritiska i kažnjavanja, ali su otkrili da je AI nastavio da vara, samo je postao bolji u tome i bilo je sve teže otkriti prevaru.

- Agent treniran pritiskom i dalje je naučio da hakuje, samo je varao neprimetno jer je naučio kako da skriva svoje namere u „lancu misli“ – naveli su istraživači.

(Telegraf Nauka/LiveScience)

Šokantno ponašanje veštačke inteligencije: Kazne ne sprečavaju AI da vara, samo postaje bolji u tome

Video: Božić: Sporazum Artemis prilika za SRB da učestvuje u programima istraživanja svemira

Teme

Komentari

Najnovije iz rubrike Fizika

Fizika

Kvantni toplotni motor koji istovremeno proizvodi rad i hlađenje

Fizika

Letnja škola i međunarodni simpozijum fizike jonizovanih gasova u SANU

Fizika

Fajnmanovi integrali: Novi metod organizacije ubrzava vreme računanja 1.000 puta

Video dana

DRAMA NA AERODROMU! Turčin napao policajca, pokušao da mu otme pištolj pa uzvikivao "Alahu akbar"!

Milica Pavlović stigla u Budvu! Na licu ni trunka šminke, stajling papreno skup: Sandale od 800€ su HIT sezone

DRAMA U RESNIKU! Žena (54) skočila u bazen i ostala nepomična: Odmah pokušana reanimacija, pa usledio MUK!

Uživo Vučić u poseti selu Vasilj kod Knjaževca, obilazi mobilnu ambulantu

Đedović: Postoje indikacije da će NIS dobiti od OFAC-a licencu za nastavak rada

Uživo <% item.title %>

Šokantno ponašanje veštačke inteligencije: Kazne ne sprečavaju AI da vara, samo postaje bolji u tome

Preporučujemo

Odbačena Maskova raketa juri ka Mesecu: Sudar se predviđa za sredu, eksplozija će imati snagu kao 3 tone TNT-a

Otvaranje Kazimirove grobnice bila je smrtonosna greška: 15 ljudi preminulo, a krivac je mešavina gljivica

Povezane vesti

Srpski naučnici prepoznati u oblasti robotike i veštačke inteligencije

Veštačka inteligencija koja poznaje zakone fizike mogla bi da ubrza razvoj kvantnih računara

„Nalazimo se na početku nove ere“: AI i kvanto računarstvo ubrzavaju razvoj kvantnih materijala

Naučnici razvijaju ultrarobustne modele mašinskog učenja sposobne za stabilne molekularne simulacije

Video: Božić: Sporazum Artemis prilika za SRB da učestvuje u programima istraživanja svemira

Podelite vest:

Teme

Komentari

Najnovije iz rubrike Fizika

Fizika

Kvantni toplotni motor koji istovremeno proizvodi rad i hlađenje

Fizika

Letnja škola i međunarodni simpozijum fizike jonizovanih gasova u SANU

Fizika

Fajnmanovi integrali: Novi metod organizacije ubrzava vreme računanja 1.000 puta

Video dana