Didžioji mūsų kalbos paslaptis: kiek lietuvių kalboje yra žodžių?

Kiek žodžių lietuvių kalboje yra dabar? Atsakymą į šį klausimą 15min aiškinosi drauge su Vilniaus universiteto docente, humanitarinių mokslų daktare Vilma Zubaitiene. Šios mokslininkės tyrimų sritis yra būtent leksikologija – kalbotyros šaka, tyrinėjanti kalbos žodyną.

Kiek milijonų? Žiūrint, kaip skaičiuosime

Paklausta, ar galima bent apytiksliai pasakyti, kiek lietuvių kalboje yra žodžių, V.Zubaitienė atsako – deja, ne.

Jos teigimu, tai lemia bent kelios priežastys. Viena jų – kalba nuolat kinta. Niekas tiksliai negali pasakyti, kurie senoviniai žodžiai iš gyvosios kalbos jau yra išnykę, o kurie galbūt dar kur nors vartojami. Antra vertus, nuolat atsiranda ir daug naujų žodžių.

Tikslesnis klausimas, į kurį, filologės teigimu, atsakymą pateikti jau galima – kiek žodžių patenka į žodynus.

Didžiausios apimties žodynas Lietuvoje – Lietuvių kalbos žodynas (LKŽ). Jame yra daugiau kaip 11 milijonų žodžių (tiek antraštinių, tiek pateiktų žodyno straipsniuose).

Šio žodyno chronologinės ribos, pasak V.Zubaitienės, apima lietuvių kalbą nuo pirmųjų lietuviškų rašto šaltinių iki XXI amžiaus.

Iš viso išleista 20 žodyno tomų, kurių bendra apimtis – apie 22 tūkst. puslapių. Prie jo dirbo kelios kalbininkų kartos.

Medžiagą žodynui Kazimieras Būga pradėjo rinkti dar 1902 m., o pirmasis tomas, kurio rengimui vadovavo Juozas Balčikonis ir kuris apėmė A ir B raides, pasirodė 1941 m.

Antrasis tomas pasirodė 1947 m., trečiasis – 1956 m., vėliau tomai pasirodydavo kas 3–5 metai.

Kartoteka, kuria paremtas žodynas, sudaro apie 4,5 milijono žodžių vienetų, užrašytų šimtų žodžių rinkėjų visoje Lietuvoje.

Dėl sovietinės ideologijos reikalavimų į žodyną vengta įtraukti krikščioniškus ir pagoniškus terminus, taip pat vengta seksualinio pobūdžio sąvokų – pavyzdžiui, žodžio „mylėtis“ reikšmė pateikiama tik kaip ‘vaišinti’ ar ‘draugauti’.

Paskutinis XX LKŽ tomas pasirodė 2002 m., o 2005 m. buvo parengta internetinė žodyno versija. Vėliausi rašto pavyzdžiai, kuriais iliustruojami žodyno žodžiai, yra iš 2001 m., anksčiausi – iš 1547 m. (Mažvydo katekizmas).

Vis dėlto, pabrėžia V.Zubaitienė, nors tai yra didžiausias žodynas Lietuvoje, LKŽ toli gražu neapima visų lietuvių kalbos žodžių ir jo su visa lietuvių kalba ir jos atmainomis (dialektais, žargonu) sugretinti negalima.

„Trūksta naujadarų. Tokių žodžių kaip „sauskelnės“, „kompiuteris“ ar „indaplovė“ žodyne dar nėra, nes jie, kaip ir dalykai, kuriuos jie apibūdina, lietuvių kalboje atsirado jau po to, kai buvo išleisti tų raidžių žodyno tomai“, – sako leksikologė.

Iš kalbos žodžių neišmesi

Lygiai taip pat, pažymi mokslininkė, LKŽ yra daug archajiškų žodžių, paimtų iš senųjų lietuvių kalbos raštų.

Pasakyti, ar Lietuvoje dar yra bent vienas žmogus, kuris vartoja tuos žodžius gyvojoje kalboje, jos teigimu, dažnai neįmanoma.

„Vienas dalykas yra naujadarai, kurių nesuskaičiuosi, kitas – archaizmai, kurie senuosiuose raštuose yra, bet vartosenoje yra nunykę.

Tai tos ribos yra dėl to labai neaiškios. Tu negali pasakyti, kiek yra žodžių“, – pabrėžia mokslininkė.

Ar iš LKŽ nebevartojamas žodis galėtų būti išbrauktas, jei šį žodyną būtų nutarta atnaujinti? Pasak V. Zubaitienės, tikrai ne.

„Iš LKŽ žodžių niekas nebraukytų vien todėl, kad šis žodynas yra tezauro tipo. Jame nėra skirstymo nei pagal stilius, nei pagal tai, ar žodis yra tarmės, ar rašto. Tai vienintelis žodynas, kuris tarsi apima visą tiek rašytinės lietuvių kalbos, tiek nuo 1902 m. renkamą gyvosios kalbos leksiką, išskyrus žargoną. Todėl žodžių tikrai niekas nebrauks“, – sako V.Zubaitienė.

Suskaitmenintą žodyno papildymų kartoteką, kurioje – apie 0,5 mln. naujų įrašų, galima rasti internete. Tačiau šią papildymų kartoteką sudaro daugiausia tarmiški žodžiai, paremti tarmiškų žodžių rinkėjų darbu, rankraštiniais žodynais. Naujadarų joje nėra. Ir ne tik naujadarų.

Nerasime ir žargono

Lietuvių kalbos žodyne nėra ir žargoninių žodžių. Egzistuoja, pasak V.Zubaitienės, specialūs žargono žodynai, pavyzdžiui, Roberto Kudirkos parengtas kalėjimo, kriminalinio ir narkomanų žargono žodynas.

Docento Roberto Kudirkos sudarytas kalinių žodynas

Docento Roberto Kudirkos sudarytas kalinių žodynas

Be to, VU Filologijos fakultetas yra surinkęs 262 puslapių apimties lietuvių žargono bazę. Ši bazė prasideda nuo „abaldielnas“ ir „abarotai“, o baigiasi su „zviozda“ ir „žvyras“ (čia omenyje turimos merginos). Tokie žodynai gali aprėpti žodžius, kurių nėra didžiajame žodyne.

Taip pat į LKŽ nebuvo įtraukiami specifiniai terminai, kuriuos vartoja tik tam tikros srities atstovai, tarkime, mokslininkai ar sportininkai.

Naujus mokslo, kompiuterijos ar kitokius specifinius atskirų sričių terminus tvirtina Valstybinė lietuvių kalbos komisija (VLKK). Atsiradus naujam žodžiui ir komisijai jį patvirtinus, jis būna įtraukiamas į VLKK terminų banką.

Viešojoje erdvėje vartojamus bendro pobūdžio lietuvių kalbos naujadarus, pasak mokslininkės, renka Lietuvių kalbos institutas. Nuolat pildomame šio instituto naujadarų duomenyne yra keli tūkstančiai XX a. pabaigoje ir vėliau pradėtų vartoti lietuviškų žodžių su vartosenos pavyzdžiais.

Šiame žodyne jau yra ir „asmenukė“, ir „afterpartis“, ir „ajurveda“. Jame galima rasti netgi naujų žodžių su raidėmis, kurių lietuvių abėcėlėje nėra, pavyzdžiui, „networkingas“.

Tačiau, pažymi V.Zubaitienė, dėl tyrėjų trūkumo didelės dalies lietuvių kalbos naujadarų ir toks duomenynas aprėpti negali.

Kas yra žodis?

Pasak V.Zubaitienės, bandant skaičiuoti žodžius lietuvių kalboje neįmanoma išvengti ir klausimo, kas apskritai yra žodis.

„Kas yra žodis? Dabar aš jums pasakysiu garsą, tarkime, „aaa“. Arba „pšššš“. Ar čia žodžiai, ar ne?

Be konteksto čia tik garsas. Bet kontekste jie gali tapti žodžiais. Reikš triukšmą ar panašiai. Arba „kai kur“, „kas nors“, „bet kas“. Tai samplaikos, kurias automatinės programos skaičiuos kaip atskirus žodžius. Tai kur yra žodžių ribos?“ – atkreipė dėmesį V.Zubaitienė.

Taip pat ji akcentavo, kad lietuvių kalboje labai lengva kurti naujus žodžius tiesiog pridedant priešdėlius ar priesagas.

„Lietuvių kalba turi tokius darinius kaip „lapas – lapelis“, „namas – namukas“ ir panašiai. Niekas žodynuose tų atskirų, mažybinių formų nefiksuoja. Tačiau mes juk žinome, kad „lapas“ ir „lapelis“ yra atskiri žodžiai, ir išgirdę šiuos du žodžius galvojame apie truputį skirtingus dalykus“, – aiškina mokslininkė.

Jos teigimu, lietuvių kalboje priesagų ir priešdėlių gausu, ir kartais jos naujam žodžiui suteikia sinoniminį atspalvį, o kartais – visiškai priešingą. Lietuviakalbis žmogus žodžio prasmę supras iš konteksto, tačiau žodynas jos gali ir „nepagauti“.

Kalba visada lenks žodynus

Greta LKŽ, sako V.Zubaitienė, egzistuoja ir „Dabartinės lietuvių kalbos žodynas“ (DLKŽ), kuriame yra apie 80 tūkst. žodžių. Šio žodyno tikslas, kaip sako ir jo pavadinimas, atspindėti jau realią dabartinę lietuvių kalbą, kokia ji yra vartojama.

Pirmasis DLKŽ leidimas pasirodė 1954 m. Paskutinis, septintasis, leidimas – 2012 m. Tačiau paskutinį kartą pagrindinė žodyno dalis naujais žodžiais iš esmės buvo pildoma prieš 2002 m. pasirodžiusį penktąjį leidimą.

Vėlesni leidimai iš esmės skiriasi tik struktūra bei tuo, kad juose pataisytos kai kurios klaidos, o turinio pakeitimai ir papildymai yra minimalūs – pavyzdžiui, žodį „sosiska“ pakeitė žodis „dešrelė“.

Kai kurie nauji žodžiai, tokie kaip „čiulpinukas“ ar „sauskelnės“, pasak V.Zubaitienės, buvo įtraukti į septintojo žodyno leidimo priedą, tačiau į patį žodyną priedas integruotas nebuvo.

„Realios lietuvių kalbos vartosenos leksikografijos žodyno mes šiuo metu neturime. Bendrinės lietuvių kalbos žodynas dar tik rengiamas. Be parengtų kelių raidžių ištisų žodynų straipsnių, teturime antraštyną – dar neaprašytų lietuvių kalbos žodžių sąrašą“, – sako V.Zubaitienė.

Visgi ji pabrėžia, kad bet koks dabartinės kalbos žodynas, net jei ir būtų atnaujinamas kasmet, visuomet atsiliks nuo realios kalbos.

„Leksikografiniai darbai visą laiką vėluos. Nes leksika yra kintantis dalykas. Šiandien kas nors tikrai pavartojo kokį nors naujadarą, kuris dar nėra fiksuotas jokiame žodyne.

Nes žmogui tiesiog prireikė tam tikros reikšmės žodžio, jis prie kokio nors žodžio pridėjo naują priesagą ar panašiai, ir išėjo naujadaras. Bet kol tas naujadaras pateks į žodyną, bet kokiu atveju praeis šiek tiek laiko“, – sako filologė.

Apibendrindama V.Zubaitienė teigia, kad bet kokio žodyno žodžių skaičius priklauso nuo tikslo, kurio siekiama konkrečiu žodynu – ar parodyti kalbos raidą, ar atskleisti tam tikros srities terminus, ar padėti susikalbėti su kitakalbiu, ar dar ko nors.

Lyginti kalbas taip pat sunku

Tad kiek žodžių yra lietuvių kalboje, mes nežinome. Tačiau galbūt galima palyginti lietuvių kalbą su kitomis kalbomis ir pasakyti, ar, pavyzdžiui, lietuvių kalboje žodžių daugiau negu anglų kalboje?

Pasak V.Zubaitienės, tokią užduotį įvykdyti irgi vargiai pavyktų. Skiriasi kalbų tipai. Jos teigimu, kompiuterinės programos, ištiriančios, kiek žodinga yra kalba, išties egzistuoja – įkėlus tekstą į tokią programą, ji suskaičiuos, kiek skirtingų žodžių yra tekste, kokių yra tekste daugiausiai.

Bet pritaikomos lietuvių kalbai, tokios programos susiduria su iššūkiais.

„Yra kalbų, kurios neturi tokių žodžių darybos priemonių kaip lietuvių kalba. Jų žodžius suskaičiuoti lengviau. Bet mūsų kalba turi gausybę darybos priemonių. Sakykime „namas“, „namelis“ ir „namukas“. Programa juos visus atpažins kaip skirtingus žodžius“, – teigia kalbininkė.

Be to, jos teigimu, tokios programos neatpažįsta daugiareikšmių žodžių, kurie priklausomai nuo konteksto įgyja vis naujas reikšmes.

„Jei taip pat rašomas žodis turi kelias reikšmes, gali sakyti, kad tai yra keli skirtingi žodžiai. Štai veiksmažodis „eiti“ junginyje „eina sau“ gali turėti visai kitą negu įprasta reikšmę ir pavartojamas nuostabai reikšti. Taip pat homonimija. Tarkime, „plaukų kasa“ ir „parduotuvės kasa“ – žodžiai tokie pat, o reikšmės skirtingos. Kai kurios automatinės programos tokiais atvejais bando atpažinti žodžio reikšmę pagal žodžius, esančius šalia, bet tos galimybės irgi ribotos. Todėl ir automatiniai tekstų vertėjai susiduria su iššūkiais“, – pabrėžia lingvistė.

Ugnius Antanavičius

15min.naujas