VU mašininio vertimo sistema – kelias, kuriuo keliauti gali visi

Vilniaus universiteto Taikomųjų mokslų instituto mokslininkai sukūrė patogią mašininio vertimo sistemą, grįsta statistiniu metodu. Į anglų ir prancūzų kalbas ir iš jų verčianti svetainė ne tik prilygsta populiariajai vertimo sistemai „Google Translate“, tačiau kai kuriais atvejais ją ir pranoksta.

Gramatikos taisyklės nereikalingos

Vienas iš svetainės kūrėjų Virginijus Dadurkevičius įvardija du pagrindinius būdus, kaip kompiuteris gali versti vienos kalbos tekstus į kitą – tai taisyklinis ir statistinis vertimai. „Galima surašyti daugybę taisyklių, kaip ir koks daiktavardis verčiamas, kaip keičiasi žodžių tvarka. Šio metodo problema ta, kad tų taisyklių į vieną sistemą reikia surašyti tūkstančius, tarpusavyje jos tampa priklausomos, sunku, nekeičiant senų, pridėti naujas, toliau gerinti kokybę“, – teigia jis.

Anot V. Dadurkevičiaus, statistiniais principais paremtą mašininį vertimą tobulinti daug paprasčiau. Tokia sistema verčia lygindama jau išverstus tekstus. Taikomųjų mokslų instituto tyrėjai, naudodamiesi Europos Parlamento dokumentais, interneto platybėse esančiais tekstais, knygomis, filmų subtitrais ir kitais šaltiniais, savo svetainės galimybes gali plėsti „maitindami“ ją papildoma žaliava. „Atsiranda naujų situacijų, informacijos, kuri gan paprastai patikslina patį vertimą“, – sako V. Dadurkevičius.

Nors didelė dalis jaunų žmonių kalba angliškai, gali bent atpažinti kitų lotyniškos abėcėlės pagrindu gyvuojančių kalbų nuotrupas, pasak V. Dadurkevičiaus, mašininio vertimo sistemų reikšmė tik augs. „Viskas labai apsunksta, kai susiduriame su kitomis rašto sistemomis, tokiomis kaip japonų, kinų, arabų kalbos. Rytų kultūros ir ekonomikos įtaka pasaulyje didėja. Statistiniu pagrindu veikianti mašininio vertimo sistema mums tikrai gali labai pagelbėti“, – įsitikinęs jis.

Sistemos galimybės

Vilniaus universiteto mašininio vertimo sistema patogiai ir greitai verčia informacinių technologijų, teisės ir bendro pobūdžio sričių tekstus. Ji pritaikyta populiariausių naršyklių („Chrome“, „Firefox“, „Internet Explorer“, „Safari“ ir „Opera“) naujausioms versijoms. Sistema gali išversti pavienį tekstą, dokumentą ar net visą internetinę svetainę.

„Versdama failą, programa išlaiko pradinį formatą. Tai, kas buvo pajuodintu šriftu ar kursyvu, taip ir išliks“, – pasakoja V. Dadurkevičius. Sistema naudotis galima ne tik pačioje svetainėje. Pasitelkus taikomųjų programų sąsają, šią paslaugą įmanoma integruoti į savo sukurtą programą. Dar vienas aktualus Vilniaus universiteto mašininio vertimo sistemos niuansas – nėra naudojimo apribojimų. „Ji tarsi kelias, kuriuo važiuoti gali bet kas. Mašininio vertimo paslauga gali naudotis ir pavieniai žmonės asmeniniams tikslams, ir komercinės struktūros, siekdamos naudos sau“, – tvirtina V. Dadurkevičius.

Svetainės kūrėjų teigimu, savo kokybe ji pajėgi konkuruoti su „Google Translate“. Žinoma, vertinant vienos ar kitos sistemos pranašumus, būtina atsižvelgti į teksto, kurį norima versti, specifiką.

„Reikia pabrėžti, kad mašininis vertimas nėra žmogaus vertimas. Neatitikimų tikrai gali pasitaikyti, nes ir žaliavoje – net ir Europos Parlamento dokumentuose – galima aptikti klaidų“, – apie vertimų sistemų trūkumus kalba V. Dadurkevičius.

Projekto vadovas dr. Arūnas Samuilis pabrėžia ne tik techninį šios svetainės aspektą. „Labai svarbu tai, kad mūsų specialistai, kurdami šią sistemą, patys patobulėjo, įvertino šiuolaikinę informacinių technologijų, susijusių su lingvistiniais resursais, situaciją pasaulyje“, – džiaugiasi jis.

Su svetaine susipažinti galite čia.

Projektas Nr. VP2-3.1-IVPK-12-K-01-002 „Anglų–lietuvių–anglų ir prancūzų–lietuvių–prancūzų kalbų mašininio vertimo, paremto statistiniais metodais, sistemos sukūrimas“ finansuojamas Europos regioninės plėtros fondo ir Lietuvos Respublikos biudžeto lėšomis. Projekto vykdytojas – Vilniaus universitetas.
Šaltinis čia