Mašinsko učenje u cilju etički automatizovane transkripcije ranih modernih tekstova
Tokom protekle dve decenije, masovna digitalizacija drastično je promenila teren naučnog istraživanja.
Sposobnost traganja za određenim ključnim rečima u digitalnim transkripcijama izvora štedi dragoceno vreme i naučnici nisu više ograničeni na arhive ili biblioteke ako žele da pregledaju neki tekst.
Međutim, sa širenjem digitalnih transkripcija stižu nove brige u pogledu rada neophodnog za omogućivanje takve dostupnosti. Novi članak predlaže metode za istraživače da dođu do transkripcija digitalizovanih ranih modernih izvora uz izbegavanje neetičkih praksi.
„Otključavanje digitalizovane arhive ranih modernih tekstova: Automatizovana transkripcija ranih modernih štampanih knjiga“ počinje sa kratkom istorijom dve vrste softvera za transkripciju.
Optičko prepoznavanje znakova (OCR) se pokazalo kao pogodno za transkripciju radova s kraja 19. veka i iz 20. veka. Međutim, zbog nepravilnosti uobičajenih u ranoj modernoj štampi, OCR nije prikladan za pouzdanu transkripciju ovih izvora.
Stoga su se naučnici okrenuli Prepoznavanju ručno pisanog teksta (HTR). Transkribus, vodeći HTR softver, omogućava korisnicima da ili konsultuju javno dostupne softverske modele transkripcije ili da obučavaju sopstvene modele.
U poređenju raznih HTR modela testiranih na izboru stranica iz četiri kolekcije iz 16. veka, naglašena je sposobnost Transkribusa da omogući stvaranje namenskih transkripcionih modela usklađenih sa specifikacijama željenog izvora u pet osnovnih koraka.
Pomoću modela Transkribusa, istraživači mogu da generišu podatke neophodne za treniranje sopstvenih visokopreciznih modela. Ovaj proces ne zahteva, niti je poželjno, oslanjanje na rad spolja, poput rada diplomiranih stuenata ili radnika na globalnom jugu.
„Pošto precizna i automatizovana transkripcija rane moderne štampe više nije cilj, već je realnost, oblast ranih modernih studija mora razmotriti koja kombinacija ljudskog rada i tehnologije mašinskog učenja će biti prihvaćena, podržana i na kraju oblikovati budućnost istraživanja“, kažu autori.
Samo insistiranjem na etičkim radnim praksama naučnici mogu izbeći povećanje neravnopravosti u akademskoj hijerarhiji ili održavanje trajnih nejednakosti kolonijalizma.
(Telegraf Nauka/Phys.org)
Video: Projekat o osnaživanju Romkinja iz Srbije uzor evropske naučne zajednice, osvojio Grand Prize
Nauka Telegraf zadržava sva prava nad sadržajem. Za preuzimanje sadržaja pogledajte uputstva na stranici Uslovi korišćenja.