Doktor GPT: Odgovori AI na zdravstvene upite tačni u skoro 76% slučajeva

Veštačka inteligencija ima perspektivu kao podrška lekarima, ali je zdravstvena pitanja najbolje ostaviti doktorima, kažu istraživači sa Pensilvanijskog državnog univerziteta.

Četbotovi na bazi veštačke inteligencije (AI) odgovaraju na svakodnevna zdravstvena pitanja običnih korisnika sa skoro 76% tačnosti, što izaziva zabrinutost oko njihove pouzdanosti u primenama usmerenim ka korisnicima u stvarnom svetu.

Istraživači su želeli da razumeju kako prosečna osoba koristi AI za probleme povezane sa zdravljem i koliko tačno AI odgovara na svakodnevne medicinske upite. Otkrili su da bi u pogledu zdravstvene zaštite, naročito specijalizovanih oblasti poput neurologije i dermatologije, AI alati mogli najbolje funkcionisati u rukama kvalifikovanih lekara, a ne pacijenata. Nalazi će biti predstavljeni na konferenciji FAccT u Montrealu od 25. do 28. juna.

„Naš rad se eksplicitno fokusira na zdravstvene scenarije o kojima bi prosečan korisnik interneta mogao pitati AI, što je perspektiva koju prethodno istraživanje o velikim jezičkim modelima (LLM) i zdravstvenoj zaštiti nije obuhvatilo. Želeli smo da razumemo - ako ljudi koriste LLM kao što je ChatGPT radi upoznavanja sa simptomima, kao što smo koristili Gugl - koliko je LLM tačan u odgovaranju na ta pitanja i koliko bi ti odgovori mogli biti štetni“, kažu istraživači.

Organizovano je AI takmičenje pod nazivom „Dijagnostika-ton“ sa 34 učesnika i 212 upita i odgovora od veštačke inteligencije na stvarne i izmišljene zdravstvene probleme, iz perspektive pacijenta i perspektive lekara. Učesnicima je dozvoljeno da izaberu jedan od četiri velika jezička modela: ChatGPT-4o, ChatGPT-3.5, Gemini-1.5 Pro i Llama3-8b.

Istraživači su zatim zatražili od devet sertifikovanih lekara da procene tačnost odgovora koje je generisala veštačka inteligencija i koliko bi mogli biti štetni. Sveukupno, 76,2% odgovora od LLM dalo je tačne informacije. Specijalnosti kao što su akušerstvo i ginekologija i otorinolaringologija zabeležile su najbolji učinak LLM. Interna medicina, neurologija i dermatologija imale su najgori učinak veštačke inteligencije. Osim toga, veoma specifični upiti i upiti dugi između 60 i 250 karaktera rezultirali su tačnijim odgovorima.

Zatim su osnovni modeli svakog LLM obučavani pomoću medicinskih udžbenika, kliničkih smernica i istraživačkih radova koji su uključeni u nastavni plan i program medicinskih škola da bi se videlo da li će dodatna obuka povećati validnost odgovora. Medicinski stručnjaci i studenti su procenili odgovore osnovnih LLM i odgovore unapređenih LLM kako bi utvrdili koji su klinički adekvatniji. Prednost je data odgovorima osnovnih Gemini i Llama modela naspram unapređenih modela, bez značajne razlike u slučaju ChatGPT modela.

„Ulazimo u novo doba zdravstvene zaštite i AI je značajan deo toga. Postoji stvarna prilika za transformaciju zdravstvene zaštite, za integraciju ovih novih alata da bi kliničari mogli da ih koriste u cilju poboljšanja brige o pacijentima“, kažu istraživači.

Takođe su primetili da su stope grešaka AI veće od 20%, što je otprilike dvostruko više od stope grešaka ljudi lekara. Te greške bi mogle biti štetne za pacijente.

„Ne mislim da će AI zameniti ljude kao lekare, ali mislim da postoji ogromna prilika da usavršimo današnje lekare kao nikad ranije“, kaže Dženifer Krašnevski sa Medicinskog koledža, sugerišući da se trenutni AI modeli mogu pokazati kao bolji alati za medicinske stručnjake nego za pacijente.

Sve u svemu, studija ističe potencijalne korisne i štetne uticaje koje AI može imati na ključni aspekt svačijeg života.

„Svidelo se to nama ili ne, ljudi će nastaviti da koriste AI za dijagnostikovanje svojih zdravstvenih problema“, kažu autori studije. „Razumevanjem obrazaca njihove upotrebe i testiranjem validnosti učinka AI, naš projekat pomaže da se unapredi znanje o najboljim i najgorim načinima upotrebe veštačke inteligencije za medicinske savete“.

(Telegraf Nauka/EurekAlert)

Doktor GPT: Odgovori AI na zdravstvene upite tačni u skoro 76% slučajeva

Video: Intervju sa Edvardom Fergusonom

Teme

Komentari

Najnovije iz rubrike Medicina

Medicina

Da li su žene bolje od muškaraca u obavljanju više zadataka istovremeno? Bračni par naučnika srušio mit

Medicina

Da li popularna dijeta povećava rizik od raka tankog creva? Evo šta je pokazalo istraživanje

Medicina

Studija kaže da vejping ili pušenje smanjuju kondiciju mladih ljudi za 15%

Video dana

U hostelu u Surčinu policija zatekla 13 stranih državljana: Muškarac zadržan zbog krijumčarenja ljudi

Katastrofalna greška Mađara u dresu Vojvodine, u svojoj zemlji "pocrveneo" posle 8 minuta, Voša na konopcima

Ako dobijete stomačni virus OVO nikako ne činite! Naša doktorka upozorava: "Svaki dan neko završi na infuziji"

Ispovest srpskog boksera koji je s polomljenom rukom doneo Srbiji zlato: "Boksovao sam samo levom..."

Nasred jahte ogroman džakuzi: Melina sa ćerkom lumpovala na Mikonosu - Đina sad pokazala u kakom luksuzu uživa

Uživo <% item.title %>

Doktor GPT: Odgovori AI na zdravstvene upite tačni u skoro 76% slučajeva

Preporučujemo

Dečak se nije smrzao do smrti, već… Forenzička analiza i skeniranje otkrili nešto neobično o mumiji sa Ploma

Studija kaže da vejping ili pušenje smanjuju kondiciju mladih ljudi za 15%

Povezane vesti

Prvi put testirana na ljudima vakcina koju je dizajnirala veštačka inteligencija

Novi alat veštačke inteligencije predviđa oblik jedne milijarde proteina

Šta oblikuje naše snove? Veliko istraživanje nudi određene odgovore

Ruski naučnici razvili dva AI asistenta: Pomažu lekarima da otkriju poremećaje spavanja

Video: Intervju sa Edvardom Fergusonom

Podelite vest:

Teme

Komentari

Najnovije iz rubrike Medicina

Medicina

Da li su žene bolje od muškaraca u obavljanju više zadataka istovremeno? Bračni par naučnika srušio mit

Medicina

Da li popularna dijeta povećava rizik od raka tankog creva? Evo šta je pokazalo istraživanje

Medicina

Studija kaže da vejping ili pušenje smanjuju kondiciju mladih ljudi za 15%

Video dana