Ar žinote, kokie yra 10 pačių dažniausių lietuviškų žodžių?

Koks yra dažniausias lietuviškas žodis? O kokie yra 10 dažniausių lietuviškų žodžių, su kuriais mes susiduriame? Į šį klausimą atsakyti nėra sunku. Vien rašant šią pastraipą, visi jie buvo pavartoti. Ir tai, kad taip padarėme, neturėtų stebinti.

Tai, kokie lietuviški žodžiai yra patys dažniausi, 2009 m. aprašė Vytauto Didžiojo universiteto mokslininkai.

Kaip jie tai ištyrė? Jie pasitelkė morfologiškai anotuotą tekstyną, kuris struktūra panašus į „Dabartinės lietuvių kalbos tekstyną“, taip pat sudarytą VDU. Tačiau naudotas morfologiškai anotuotas tekstynas yra daug mažesnis – jį sudaro 790 tipiškiausių lietuvių kalbos tekstų, apimančių 4 rašytinės kalbos žanrus – mokslinę literatūrą, grožinę literatūrą, periodiką ir oficialius dokumentus.

Drauge visus tekstus sudarė beveik milijonas žodžių. Būtent juos visus išanalizavus ir suskaičiavus, koks žodis kiek kartų juose kartojasi, sudarytas dažninis lietuvių kalbos dažninis žodynas. Paaiškėjo, kad dažniausias rašytinės lietuvių kalbos žodis – jungtukas „ir“.

O kokie yra 10 dažniausių lietuvių kalbos žodžių? Dešimtuką matote žemiau. Dar žemiau rasite informaciją, kiek kartų tekstyne pasikartojo tas žodis (arba jo formos – skirtingus to paties žodžio linksnius ir pan. žodynas traktuoja kaip tą patį žodį).

1. ir

2. jis

3. būti

4. tas

5. į

6. kad

7. aš

8. kuris

9. su

10. šis

Žodis „ir“ tekstyne pasikartojo 28 174 kartus, žodis „jis“ ir įvairios jo formos (jie, jo, jos ir t. t.) – 18 117 kartų, žodis „būti“ ir įvairios jo formos (buvo, yra, būtų ir t. t.) – 17 128 kartus, žodis „tas“ ir įvairios jo formos (ta, tie ir t. t.) – 8819 kartų, žodis „į“ – 8369 kartus, žodis „kad“ – 7487 kartus, žodis „aš“ ir įvairios jo formos (mūsų, mes, man ir t. t.) – 6522 kartus, žodis „kuris“ ir įvairios jo formos (kurie, kurio, kuriam ir pan.) – 5831 kartą, žodis „su“ – 5533 kartus, žodis „šis“ ir įvairios jo formos (šie, šios ir t. t.) – 5309 kartus.

Kokie dažniausi lietuviški daiktavardžiai?

Kaip matome, dažniausiai rašytinėje lietuvių kalboje sutinkami žodžiai , išskyrus „būti“, yra įvardžiai, jungtukai ir prielinksniai. Tai suprantama – kalbant be šių žodžių išsiversti neįmanoma, jie daug universalesni negu daiktavardžiai ar veiksmažodžiai.

Tačiau kokie yra dažniausiai sutinkami kitų kalbos dalių žodžiai? Žodynas pateikia atsakymą ir į šį klausimą.

5 lietuviškuose tekstuose dažniausiai sutinkami daiktavardžiai yra šie: darbas, žmogus, Lietuva, metai, laikas.

5 lietuviškuose tekstuose dažniausiai sutinkami veiksmažodžiai yra šie: būti, galėti, turėti, reikėti, nebūti.

5 lietuviškuose tekstuose dažniausiai sutinkami būdvardžiai yra šie: didelis, svarbus, naujas, geras, įvairus.

5 lietuviškuose tekstuose dažniausiai sutinkami prieveiksmiai yra šie: tik, labai, jau, dar, daug.

O jei skirtingas to paties žodžio formas laikysime skirtingais žodžiais?

Dažniausių lietuvių kalbos žodžių dešimtuką galima sudaryti ir kiek kitaip. Jei skirtingas to paties žodžio formas (pvz, jis ir ji), traktuojame kaip skirtingus žodžius, dešimtukas šiek tiek pasikeičia. Tuomet jis atrodo taip:

1. ir

2. į

3. kad

4. yra

5. su

6. iš

7. o

8. ir

9. tai

10. buvo

Tai, kad „ir“ šiame sąraše yra dukart, nėra klaida: pirmąkart „ir“ į sąrašą pateko kaip jungtukas, antrąkart – kaip dalelytė.

„Ir“ kaip jungtukas tekstyne kartojasi 28 174 kartus, „į“ – 8369 kartus, „kad“ – 7487 kartus, „yra“ – 5621 kartą, „su“ – 5533 kartus, „iš“ – 5015 kartų, „o“ – 4816 kartų, „ir“ kaip dalelytė – 4539 kartus, „tai“ – 4178 kartus, „buvo“ – 3952 kartus.

Žodyno autoriai taip pat nustatė, kad daiktavardžiai sudaro 39,37 proc. tekstyno, veiksmažodžiai – 20,51 proc., įvardžiai – 8,71 proc., jungtukai – 7,62 proc., būdvardžiai – 7,33 proc., prieveiksmiai – 6,72 proc., prielinksniai – 4,65 proc., kitos kalbos dalys – po mažiau negu 2 proc.

Andriaus Utkos 2009 m. sudarytą dažninį rašytinės lietuvių kalbos žodyną, pagal kurį parengtas straipsnis, galite rasti čia.

Pirmąjį dažninį lietuvių kalbos žodyną dar 1977 m. sudarė Vida Žilinskienė, dirbusi su Vilniaus universitete buvusia skaičiavimo mašina „Minsk-22“. Jau atkūrus Nepriklausomybę ji kartu su Laima Grumadiene parengė atnaujintą rašomosios lietuvių kalbos dažninį žodyną.

Ugnius Antanavičius
15min.naujas