V Microsofotvem raziskovalnem centru za umetno inteligenco (AI) so sporočili, da so podrli rekord v številu napak, ki jih naredi računalniški sistem za prepisovanje slišanega govora v pisno obliko. Ta je odslej po njihovih testih na ravni profesionalnih prepisovalcev. Ali to naznanja konec služb za prepisovalce?
Microsoft zadnje leto intenzivno razvija računalniške sisteme umetne inteligence, ki bodo nekega dne postali del našega vsakdana. Po le enem mesecu, ko so podrli rekord v zanesljivosti prepoznave slišanega govora, jim je to uspelo ponovno: dosegli so le 5,9-odstotne napake pri prepoznavi (prej 6,3 odstotka). Ta stopnja pomeni, koliko napak naredi sistem pri prepisovanju slišanega govora, torej koliko besed izpusti, nadomesti z drugačnimi ali dodaja nepotrebne besede.
Poslušali so dvosmerne pogovore in družinske pogovore
Raziskovalci so Microsoftov računalniški sistem postavili ob bok skupini profesionalnih prepisovalcev in skupaj poslušali isti govor ter čim bolj natančno prepisali slišano. Prepisovalci so govor poslušali prek telefona in s tem dosegli pravično testiranje, saj tudi računalnik govor posluša prek mikrofona. Govor je vključeval dvosmerne pogovore in preproste pogovore med družinskimi člani.
Sistem napačno prepisuje, ljudje izpuščajo besede
Kot so pri Microsoftu zapisali v izsledkih raziskave, ki si jo lahko v celoti preberete na tej povezavi, so tako računalniški sistem kot prepisovalci zgrešili na skoraj istih mestih. Računalniški sistem je napačno prepisoval medmete, kot sta “uh huh” in “uh”, saj ni razlikoval pomenske razlike med obema. Na drugi strani so prepisovalci večkrat izpuščali določene besede, kot na primer besedo I (jaz), ki je sistem ni izpustil.
V raziskavi piše, da je prišlo do izpuščanja ali zato, ker tudi z izpustom besede ne razpade pomen povedi, ali ker potreba po produktivnosti zahteva hitro prepisovanje. Pod črto pa je umetna inteligenca po številu napak za las premagala prepisovalce.
Drastično zmanjšali čas za treniranje sistema
Rekord je Microsoftu uspel s treniranjem sistema, za katerega so porabili 2000 ur. Tak kratek čas treninga (od prejšnjega tromesečnega) so dosegli s paraleliziranjem podatkov s pomočjo mrežnega orodja za umetno inteligenco, ki je osnovano na strežniški mreži sistema Linux. Ta sistem bi lahko uporabili pri Microsoftovi asistentki Cortani v mobilnih telefonih in napravah, predvsem pa bi lahko koristila gluhim osebam pri uporabi računalnikov.
Mitja Godnič