Jūratė Žuolytė. Pusę amžiaus puoselėta svajonė prakalbinti mašiną tapo tikrove

Daugeliui yra tekę matyti istorinių nuotraukų, kuriuose užfiksuoti pirmieji kompiuteriai, atliekantys dabartiniu supratimu labai primityvius veiksmus, bet dydžiu lenkiantys solidžią spintą. O norint į juos suvesti informaciją, buvo daromos specialios kortelės, kuriomis perforatoriumi būdavo tam tikrose vietose išbadomos skylutės, taip užkoduojant raidę ar skaičių. Vienoje kortelėje tilpdavo 80 baitų informacijos, tai yra maždaug tiek ženklų. „Tų kortelių būdavo krūva, didžiausi lagaminai“, ‒ šypsosi prof. L. Telksnys.

Be to, kad duomenų suvedimas kortelėmis buvo labai nepatogus, būdavo ir kita problema: didelė klaidų tikimybė. „Viskas veikdavo taip: programuotojas užrašydavo ant popieriaus, ką jis nori įvesti į mašiną, o tuomet susėsdavo dvi mergaitės ir tose kortelėse perforuodavo vienodą tekstą. Dviejų reikėjo todėl, kad atlikdamos šimtą veiksmų jos padarydavo bent vieną klaidą, o tai yra baisiai daug. Todėl įdėjus abi korteles mašina patikrindavo, ar jos sutampa, ir, jei taip, tada įvesdavo. Tada iš 10 tūkstančių ženklų vis tiek likdavo viena klaida, toks „skersas“ buvo tas duomenų įvedimas“, ‒ pasakoja prof. L. Telksnys.

Pusę amžiaus puoselėta svajonė prakalbinti mašiną tapo tikrove

© Žurnalo „Jaunimo gretos“ nuotr.

Stebėdamas tokį procesą prof. L. Telksnys vis galvodavo, kad jį turi būti įmanoma patobulinti. Juk žmonės bendrauja kur kas sklandžiau, tad gal taip galėtų ir mašinos? „Kai mes bendraujame, mūsų galvose atsiranda mintys, smegenys tas mintis paverčia komandomis, kurių klausydami mes kalbame. O kai mes kalbame, mūsų kalbos padargai žaidžia mikrobaletą. Kalbėdami ženklus mes paverčiame garsais, jie, pasiekę ausį, suvirpina atitinkamus neuronus – tuomet jūs suprantate, ką išgirdote. Galvojant apie tai, iškilo klausimas, ką turime daryti, kad galėtume į mašinas greičiau įvesti duomenis. O dar geriau būtų, jei galėtume tiesiog kažką pasakyti mašinai“, – apie idėjos užuomazgas pasakoja profesorius.

Sutelkė skirtingų sričių mokslininkus

Pusę amžiaus trukusiai istorijai aprašyti prireiktų knygos, bet, trumpai sakant, per visą tą laiko buvo kuriami teoriniai pagrindai būsimam išradimui. „Projektas LIEPA, kurio metu buvo sukurtas lietuvių šnekos sintezatorius, buvo skirtas pačių galutinių produktų sukūrimui. Bet kad jie galėtų atsirasti, reikėjo kelių dešimtmečių įdirbio“, – sako G. Navickas.

Įgyvendinti technologiniam sprendimui reikėjo įvairių sričių žinių: jėgas dėl šio tikslo suvienijo filologai, fonetikai, fizinių mokslų ir informacinių technologijų specialistai. Sintezatoriaus kūrėjas P. Kasparaitis, fizinių mokslų daktaras, pats kalba lyg fonetikas ar filologas. Rengdamas savo disertaciją jis kruopščiai išsinagrinėjo visą lietuvių kalbos gramatiką, viską, kas parašyta apie linksniavimą, asmenavimą, kirčiavimą ir kitas taisykles, kad visa tai galėtų perkelti į kompiuterines programas. „Tik kirčiavimas lietuvių kalba labai sudėtingas“, – atsidūsta jis. Tačiau be jo – nė iš vietos. Juk neteisingas kirtis gali visiškai pakeisti žodžio prasmę.

Mokslininkai įsitikinę – tokie fundamentiniai tyrimai būtini, ir niekas kitas jų už lietuvius nepadarys. „Būna, kiti sako, kad „Google“ jau padarė. Bet tokioms kompanijoms kaip „Google“ Lietuva ir jos 3 milijonai gyventojų visai neįdomūs, o kas padaryta anglų kalbai, mums netinka“, – sako G. Navickas.

Sėkmė slypi detalėse

Kalbant apie pačią sukurtą technologiją, iš pirmo žvilgsnio ji gali atrodyti gana paprasta. Į kompiuterį yra įrašomi diktorių balsai, skaitantys daug įvairaus teksto. Vėliau, kai gaunamas naujas tekstas, kompiuteris ieško pažįstamų žodžių junginių, atskirų žodžių, skiemenų, blogiausiu atveju – garsų.

Tačiau čia paprastumas ir baigiasi. Jei lietuvišką abėcėlę sudaro 32 raidės, garsų turime kur kas daugiau, šiame įrankyje jų skaičiuojama 92. Be to, nepakanka atrasti tokio paties skiemens ar raidės, jis dar turi būti ir tokiame pačiame kontekste, tai yra, žodžio pradžioje ar pabaigoje, po balsės ar priebalsės ir pan. Jei tai atitinka – galima klijuoti lyg galvosūkį. „Tačiau jei iš laikraščio iškirptumėte raides ir suklijuotumėte, mūsų akys tai lengvai perskaitytų. Suklijavus garsus gaunamas didelis traškėjimas – dr. P. Kasparaitis atliko didžiulį darbą, kad jo neliktų“, – kolegą giria prof. L. Telksnys.

Be to, reikia sugalvoti, kaip kompiuteris turi suprasti, kaip skaityti skaičius, pavyzdžiui, vietoj šimto nesakydamas vienas nulis nulis, taip pat trumpinius ar ženklus. O išsprendus begalę tokių niuansų, tenka pagalvoti ir apie tokius dalykus, koks balsas kokiam klausytojui bus malonesnis. „Šį įrankį jau išbandė ir moksleiviai. Jų pastaba buvo, kad norėtų klausytis jaunesnio balso, matyt, mokytojų balsai jiems jau įkyrėję, o mes apie tai net nepagalvojome“, – juokiasi prof. L. Telksnys.

Pridėti naują balsą taip pat nėra lengvas uždavinys. Juk kiekvieną jį kompiuteris turi atpažinti. „Kad gautume apie 4 valandų įrašą, su profesionaliu diktoriumi įrašinėjame 3-4 dienas. O juk net to paties žmogaus balsas vienoks ryte, kitoks popiet, dar kitoks kai jis pavargęs, laimingas ar liūdnas. Tačiau mums reikia tuos įrašus kažkaip suvienodinti“, – pasakoja dr. P. Kasparaitis.

Tobulėjančios technologijos, leidžiančios klausytis užuot skaičius kompiuteryje esančią informaciją ar jį valdant balsu, itin reikalingos silpnaregiams ir neregiams. Mokslininkai neslepia iš jų sulaukę didelio susidomėjimo ir noro įsijungti į procesą. Sprendžiant šį klausimą vėl teko išsiaiškinti jų poreikių subtilybes. „Silpnaregiai ar neregiai nemato ekrano, jie jį girdi. Ar pastebite, kad mes tekstą ekrane kartais tiesiog perbėgame akimis? Pasirodo, jie taip pat greitai perbėga garsą, tad jiems pritaikytus įrašus mes pagreitinome: neįgudusiai ausiai net sunku suprasti. Jei įgarsinamos, pavyzdžiui, knygos, jos skaitomos lėtai, bet greitai vartojamai informacijai to nereikia“, – pasakoja G. Navickas.

Planuose – lietuviškai kalbinamos mašinos

Šiuo metu mokslininkai jau ruošiasi naujam projekto etapui, kuriame daugiau dėmesio skirs ne tik jau sukurto šnekos sintezatoriaus tobulinimui, bet ir balso atpažinimo technologijoms. Pasaulyje jau veikia panašios sistemos anglų ar kitomis užsienio kalbomis, bet lietuviškai iki šiol su mašinomis kalbėti negalėjome.

„Jūs pareinate namo, gaminate valgį, ruošiatės ir tiesiog pasakote kompiuteriui „Paskaityk man DELFI naujienas. Tokių dalykų nereikės ilgai laukti, dešimtmečio neužtruks“, – įsitikinęs prof. L. Telksnys, matantis ir tokių technologijų pritaikymo vystant tarpkalbinius ryšius galimybes. Jau eksperimentuojama su tokiais įrenginiais, kai technologijos bendraujant iškart verčia žmogaus kalbą ir leidžia paprasčiau komunikuoti su kitakalbiais.

Mokslininkai sako, kad ši technologija prisidės ir prie lietuvių kalbos puoselėjimo. „Jei žmonės norės, kad jų tekstas būtų taisyklingai perskaitytas kompiuterio, jie turės jį teisingai ir užrašyti. Jei reikalingos, pavyzdžiui, užsienietiškos pavardės, jas reikia rašyti lietuviškai, skliausteliuose įrašant originalo kalba, jei norime, kad paieškos sistemos jas paprasčiau rastų duomenų bazėse. Taigi lietuviško teksto nereikėtų užteršti jei ne dėl kažkokių kitokių, tai grynai dėl praktinių priežasčių“, – sako prof. L. Telksnys.

Delfi