You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
Arvudes iseloomustab valimit Tabel 1 (valim on varjundatud halliga). Polüseemseks<br />
sõnaks on loetud märksõnad, millel EKSS eristab kaks või rohkem põhitähendust (tähistatud<br />
araabia numbriga) – neid on valimis kokku 185 (22%). Kõik ülejäänud on ühe põhitähendusega<br />
ehk monoseemsed sõnad (EKSS-is ilma tähendusnumbrita) – kokku 658 ehk<br />
78%. Et lihtnimisõnadest koosnev valim paremini välja joonistuks, on seda kõrvutatud<br />
(sama vihiku) liitnimisõnadega (liitsõna andmed on esialgsed 4 ), samuti (sama vihiku) kõigi<br />
sõnade andmetega. Viimaks on välja toodud kõigi sõnade andmed kogu EKSS-i põhjal (A–<br />
Y, kokku 26 vihikut). Tabelist nähtub, et ka enamik lihtnimisõnu (78%) on eesti keeles ühe<br />
põhitähendusega, rääkimata liitsõnadest, mis on valdavalt monoseemsed (95%). Kui<br />
hõlmata kõik sõnad, s.t ka muud sõnaliigid, siis on eesti keeles (resp. EKSS-is) polüseemne<br />
umbes iga kümnes sõna (tabeli põhjal 9,4–10,5%).<br />
Tabel 1.<br />
Ülevaade valimist<br />
Lihtnimisõnad<br />
(= VALIM)<br />
Liitsõnad<br />
(nimisõnad)<br />
Kõik sõnad<br />
(21. vihik: T–tinakas)<br />
Kõik sõnad<br />
(EKSS: A–Y)<br />
märksõnu<br />
kokku<br />
843 3 200<br />
(andmed ei<br />
ole lõplikud)<br />
5 632<br />
(sh nimisõnu ca 70%)<br />
137 767<br />
sh polüseemseid<br />
sõnu<br />
185<br />
(22%)<br />
195<br />
(5%)<br />
532<br />
(9,4%)<br />
14 432<br />
(10,5%)<br />
sh<br />
monoseemseid<br />
sõnu<br />
658<br />
(78%)<br />
3 705<br />
(95%)<br />
5 100<br />
(90,6%)<br />
123 335<br />
(89,5%)<br />
Töös esitatud tähendusüksused ja kasutusnäited on üldjuhul pärit EKSS-ist (valimist,<br />
esitatud ilma viiteta). Mõnevõrra on kasutatud ka muid, enamasti trükikirjanduse näiteid<br />
(Internetist, tekstikorpusest, ajakirjandusest – neile on lisatud allikaviide). EKSS-i sõnaartiklite<br />
esitust on kohandatud: artikleid on lühendatud; märksõna korratakse iga põhitähenduse<br />
juures (alltähenduse korral märksõna ei korrata); grammatiline info on esitatud<br />
noolsulgudes (muutmisinfo on üldiselt ära jäetud); iga tähendusüksuse juures on esitatud<br />
LIIGISUHE ehk semantiline tüüp (tähenduseristuse järel, kapiteelkirjas – vt lähemalt ptk<br />
5.4), nt (1):<br />
(1) tara 1 ESE_INSTRU maa-ala piirav tõke, aed.<br />
tara 2 KOHT_ALA aiaga piiratud ala karja jaoks.<br />
|| KOHT_ALA (poollahtine) varjualune, suvelaut.<br />
| KOHT_ALA (üldisemalt). Kohviku ette ehitatud taras istus üksik mees.<br />
tara 3 ESITUS_KUJUTIS ka meteor. Kuu v Päikese ümber nähtav rõngas.<br />
|| ESITUS_KUJUTIS (üldisemalt:) ring, rõngas. .. pühaduse tara.<br />
tara 4 KOHT_ALA karjaaed (2. täh) (piiratud ala kalade jaoks).<br />
Otsese eeskujuna on kasutatud kaht inglise keele leksikaalset baasi: CoreLex (Buitelaar<br />
1998a, 1998b) ja SIMPLE (Lenci jt 2000). (Kummastki on juttu süstemaatilise polüseemia<br />
kajastamise võimalusi vaagivas peatükis, vt 3.6) Mõlemad projektid on samamoodi<br />
4<br />
Andmed ei ole lõplikud, sest liitsõnad ei ole andmebaasi sisestatud täies ulatuses. Suhtarvud on üle<br />
võetud väiksema, umbes kaks kolmandikku hõlmava kogumi pealt.<br />
20