Počítačové zpracování přirozeného jazyka
Počítačové zpracování přirozeného jazyka
Počítačové zpracování přirozeného jazyka
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
9 Dialogové systémy, inference<br />
9.1 Analýza promluvy, promluvové objekty<br />
9.2 Anafora, anaforické vztahy<br />
9.3 Odkazovací výrazy, rozpoznávání antecedentů<br />
9.4 Historie promluvy a promluvový zásobník<br />
9.5 Segmenty v promluvě<br />
10 Závěr<br />
Pokusme se shrnout výše uvedené výsledky. V oblasti české morfologie se nám<br />
podařilo vytvořit algoritmický popis české deklinace a konjugace pokrývající odhadem<br />
80 % české slovní zásoby – náš současný slovník českých kmenů kmenů<br />
čítá něco přes 170 000 položek. V algoritmickém popisu se dále propracovává<br />
systém vzorů, zejména u sloves dochází k propojení vzorů s prefixy včetně začlenění<br />
popisu vidů, což vede k výraznému zpřehlednění této části popisu zahrnující<br />
asi 70 000 českých sloves a také k jeho další optimalizaci (zkrácení o více než<br />
50 %). K dispozici již je první verze lemmatizátoru, který byl začleněn do první<br />
varianty počítačového synonymického slovníku češtiny (v rozsahu kolem 20 000<br />
hesel) a po dokončení potřebných úprav bude existovat i jako samostatný modul<br />
použitelný např. v rešeršních systémech a dalších vhodných aplikacích. Práce na<br />
algoritmickém popisu bude dále pokračovat zejména v oblasti slovotvorby, v níž<br />
bychom rádi dospěli k vytvoření slovotvorného automatu, tj. programu, který by<br />
modeloval hlavní slovotvorné procesy v češtině a měl by schopnost interaktivně<br />
se učit.<br />
Jak jsme ukázali v další části práce, využili jsme příznivých vlastností prologu<br />
a v programu klara naznačili integraci algoritmického popisu morfologie<br />
a syntaxe. V programu klara ii je pak tento postup ilustrován na českých slovesech<br />
označujících komunikaci a je ho využito i pro vytvoření jednoduchého,<br />
avšak dostatečně zajímavého programu překládajícího věty se slovesy komunikace<br />
z češtiny do angličtiny. Naším nejbližším cílem v tomto ohledu je pokusit se<br />
o integraci české morfologie a syntaxe na kvalitativně vyšší úrovni dané velkým<br />
rozsahem slovníku, s nímž je již schopen pracovat morfologický analyzátor, a vytvořit<br />
syntaktický analyzátor (generátor) schopný pracovat se souvislými českými<br />
121