23.07.2013 Views

Počítačové zpracování přirozeného jazyka

Počítačové zpracování přirozeného jazyka

Počítačové zpracování přirozeného jazyka

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

nezajímali a ani nezajímají o to, co již bylo vytvořeno a je nyní k dispozici<br />

v oblasti tvoření slov. Přitom výsledky již získané v oblasti tvoření slov<br />

jsou podle našeho názoru spolehlivější a méně arbitrární, protože se opírají o<br />

konkrétní slovotvorné procesy existující v jednotlivých přirozených jazycích.<br />

Jako příklad lze uvést zatím neexistující sémantickou síť, jejíž uzly budou<br />

tvořeny kořeny daného <strong>jazyka</strong>.<br />

Slovotvorba představuje v rámci morfologie samostatnou subdisciplinu a<br />

k jejímu algoritmickému popisu se teprve začíná přistupovat v základních<br />

obrysech. Jednou z prvních věcí potřebných v tomto ohledu pro češtinu je<br />

vytvoření tzv. derivačního slovníku, tj. slovníku, jehož základními položkami<br />

jsou kořeny českých slov plus morfémy, které se s kořeny mohou kombinovat.<br />

Předpokládaný počet slovních kořenů nebude pravděpodobně příliš velký,<br />

odhadem lze říci, že by se v češtině měl pohybovat kolem 12000 položek.<br />

Jakmile se podaří získat pokud možno úplný inventář českých kořenů, lze<br />

se pokusit o jejich seskupení do sémantické sítě, která může tvořit jádro lexikální<br />

databáze nového typu. V dalším se pokusíme naznačit, jak by mohla<br />

vypadat sémantická síť využívající přirozených sémantických vztahů existujících<br />

kolem jednotlivých kořenů a jejich derivátů tvořících útvary, jež jsou<br />

jinak známy pod termínem slovotvorná hnízda:<br />

boj- –act– boj-ova-t<br />

–loc– boj-iště<br />

–ag– boj-ov-ník –gen– boj-ovn-ice<br />

–ag2– boj-uj-ící<br />

–qua1– boj-ov-ný –qua2– boj-ovn-ost<br />

–qua3– boj-ov-ý<br />

prác/prac- –act– prac-ova-t<br />

–loc1– prac-ov-iště<br />

–loc2– prac-ov-na<br />

–ag1– prac-ov-ník –gen– prac-ovn-ice<br />

–ag2– prac-uj-ící<br />

–qua1– praco-ov-ní –qua2– prac-ov-i-t-ý –qua21 – prac-ov-i-t-ost<br />

kve/kvé/kvě- –act– kvé-s-t<br />

–ag– kvě-t květ-ina květin-ář<br />

–loc1– květin-áč<br />

–loc2– květin-ářství<br />

37

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!