Pasitelkę neuroninius tinklus ir kalbos technologijas, Vytauto Didžiojo universiteto (VDU) mokslininkai išvystė šnekos sintezės technologiją, kuri jau taikoma ne tik šios aukštosios mokyklos tinklalapyje bei šalies naujienų portaluose, bet netrukus bus įdiegta ir Seimo interneto svetainėje.
Internete neseniai atsirado naujas balsas – bet kokį lietuvišką tekstą jau dabar galima išgirsti perskaitytą sklandžia, natūraliai skambančia lietuvių kalba. Tačiau šis balsas yra ne žmogaus, o kompiuterio, kuris tekstus perskaito automatiškai. Pasak šių technologijų vystymo projekto vadovo, VDU Informatikos fakulteto docento dr. Dariaus Amilevičiaus, universiteto informatikai ir humanitarai jau daug metų bendromis pastangomis vystė šnekos sintezės prototipą ir jam reikalingus papildomus sprendimus, pavyzdžiui, automatinį kirčiuoklį. Bet iki šiol nebuvo deramų sąlygų, rinkos poreikio ir finansavimo, kad šį technologinį sprendimą būtų galima paversti išbaigtu, tinkamu komerciniam taikymui.
„Panaudodami pažangiausias technologijas, projekte šį prototipą perkėlėme į naują lygmenį: suteikėme neuroninį balsą, kurio natūralumas jau mažai skiriasi nuo žmogaus. Šiuo metu kuriamas antrasis neuroninis balsas, tobulinamas santrumpų ir skaitmenų pavertimas tekstu. Planuojama įdiegti ir nelietuviškos rašybos žodžių sintezės metodus“, – vykdomus darbus pristato doc. dr. D. Amilevičius.
Anot vieno iš pagrindinių šios technologijos kūrėjų, VDU Informatikos fakulteto profesoriaus Gailiaus Raškinio, vystant kalbos technologijas teko susidurti su įvairiais iššūkiais. Pastaruoju metu, žinoma, darbą apsunkino karantino sąlygos, kadangi reikėjo padaryti nemažai garso įrašų, o tai nebuvo paprasta dėl judėjimo ribojimų ir uždarytų patalpų. Tačiau ne ką mažesnis iššūkis buvo ir pačios kalbos kaip fenomeno sudėtingumas, ypač lietuvių.
„Bandant aprašyti kalbos reiškinius taisyklėmis, susiduriama su daugybe išimčių. Pavyzdžiui, tekste rašoma „Caritas“, bet tariama „Karitas“. Arba – trumpinys „gen.“ vienoje vietoje gali reikšti „generolas“, o kitoje – „generalinis“ ir taip toliau. Tai tik kalbinių problemų ledkalnio viršūnė“, – pasakoja VDU mokslininkas, pridurdamas, kad nemažas iššūkis buvo ir didelių skaičiavimo pajėgumų, galingos kompiuterinės technikos poreikis, būdingas taikant giliojo mokymo technologijas.
Specialistai kalbos technologijas vysto naujame projekte, kurį universitetas vykdo drauge su jo atžaline įmone „Intelektika“, sakoma VDU pranešime. Vystoma ne tik jau šnekos sintezė, kai tekstas paverčiamas balsu, bet ir priešingas procesas – kalbos automatinis užrašymas tekstu.
Doc. dr. D. Amilevičius pabrėžia, kad šios technologijos nuo žmogaus pečių nuima daug rutininių darbų, leidžia atpalaiduoti rankas nuo klaviatūros, o akis – nuo ekrano. „Atsiveria virtualių asistentų, mokytojų, slaugos robotų, teisininkų, medicinos konsultantų ir kitos galimybės. Pavyzdžiui, medicinos sektoriuje tai gali atlaisvinti personalą nuo administracinio, duomenų suvedimo darbo, o sutaupytą laiką skirti pacientams“, – inovacijų privalumus įvardija mokslininkas.
Kalbos automatinis užrašymas tekstu buvo vystomas ir ankstesniame VDU projekte „Semantika-2“ – jo metu sukurtas bazinis modelis, kurio pagrindu internete jau dabar teikiamos nemokamos viešosios paslaugos, įvairių garso įrašų automatinis transkribavimas. „Bazinis modelis suteikė plačių galimybių tolesniam vystymui – tai ir daroma naujajame projekte. Tobuliname šį modelį, kad jis tinkamai atpažintų žemos kokybės signalus, pavyzdžiui, skambučių centrų telefoninius įrašus. Išvystytas sprendimas automatiškai tekstu pavers populiariausiomis platformomis („Zoom“ ir „Microsoft Teams“) organizuojamų vaizdo konferencijų įrašus“, – planus atskleidžia prof. G. Raškinis.
Lietuvių kalbai taikyti tokias technologijas nėra paprasta – lietuviškai kalba sąlyginai mažai žmonių pasaulyje, todėl ši kalba nėra komerciškai patraukli informacinių technologijų milžinams, tokiems kaip „Google“ ar „Microsoft“. Tad jei šioje srityje dirbantys mokslininkai nesulauktų reikiamos ES struktūrinių fondų ir šalies biudžeto paramos, apie lietuvių kalbos technologijų pažangą kalbėti būtų sunku arba neįmanoma, nors ligšiolinis Lietuvos įdirbis į kalbos technologijas gali būti vertinamas gana teigiamai.
„Jei lyginsimės su sprendimais anglų kalbai, atsiliekame kokybės, sprendimų tikslumo požiūriu. Tačiau jei lyginsimės su kitomis, mažiau kalbos išteklių turinčiomis kalbomis, neatsiliekame nuo bendro vidurkio, o kai kuriais atvejais netgi jį viršijame, ypač šnekos sintezės ir šnekos atpažinimo srityse.
Vytauto Didžiojo universitetas nuo pat atsikūrimo buvo lietuvių kalbos technologijų pionierius. Prieš dvidešimt metų profesorės Rūtos Petrauskaitės pasėta tekstynų lingvistikos ir kalbos technologijų tyrimų sėkla universitete rado tinkamą terpę. Todėl ji labai greitai prigijo ir jau duoda puikius vaisius – pirmiausia dėl VDU gilias tradicijas turinčio glaudaus bendradarbiavimo tarp informatikų ir humanitarų“, – primena doc. dr. D. Amilevičius. Jo teigimu, į ateitį galima žiūrėti optimistiškai – Lietuva ir dabartinė jos Vyriausybė planuoja skirti pakankamai daug dėmesio lietuvių kalbos skaitmeninimui bei skaitmenizavimui.
VDU pranešime primenama, kad šio universiteto mokslininkų kalbos technologijų tyrimai savo laiku leido Lietuvai pralenkti „Google“ – VDU įvykdė projektą, kurio metu buvo sukurta pirmoji mašininio vertimo sistema iš anglų į lietuvių kalbą. Dabar kalbos technologijas VDU kartu su savąja įmone UAB „Intelektika“ vysto projekte „Dirbtinio intelekto ir giliojo mokymosi technologijomis grįstų kalbos technologijų MTEP rezultatų komercinimas (ASTRA)“.
Informacijos šaltinis – ELTA
2021.03.21; 07:00