23.07.2013 Views

Počítačové zpracování přirozeného jazyka

Počítačové zpracování přirozeného jazyka

Počítačové zpracování přirozeného jazyka

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

9 Dialogové systémy, inference<br />

9.1 Analýza promluvy, promluvové objekty<br />

9.2 Anafora, anaforické vztahy<br />

9.3 Odkazovací výrazy, rozpoznávání antecedentů<br />

9.4 Historie promluvy a promluvový zásobník<br />

9.5 Segmenty v promluvě<br />

10 Závěr<br />

Pokusme se shrnout výše uvedené výsledky. V oblasti české morfologie se nám<br />

podařilo vytvořit algoritmický popis české deklinace a konjugace pokrývající odhadem<br />

80 % české slovní zásoby – náš současný slovník českých kmenů kmenů<br />

čítá něco přes 170 000 položek. V algoritmickém popisu se dále propracovává<br />

systém vzorů, zejména u sloves dochází k propojení vzorů s prefixy včetně začlenění<br />

popisu vidů, což vede k výraznému zpřehlednění této části popisu zahrnující<br />

asi 70 000 českých sloves a také k jeho další optimalizaci (zkrácení o více než<br />

50 %). K dispozici již je první verze lemmatizátoru, který byl začleněn do první<br />

varianty počítačového synonymického slovníku češtiny (v rozsahu kolem 20 000<br />

hesel) a po dokončení potřebných úprav bude existovat i jako samostatný modul<br />

použitelný např. v rešeršních systémech a dalších vhodných aplikacích. Práce na<br />

algoritmickém popisu bude dále pokračovat zejména v oblasti slovotvorby, v níž<br />

bychom rádi dospěli k vytvoření slovotvorného automatu, tj. programu, který by<br />

modeloval hlavní slovotvorné procesy v češtině a měl by schopnost interaktivně<br />

se učit.<br />

Jak jsme ukázali v další části práce, využili jsme příznivých vlastností prologu<br />

a v programu klara naznačili integraci algoritmického popisu morfologie<br />

a syntaxe. V programu klara ii je pak tento postup ilustrován na českých slovesech<br />

označujících komunikaci a je ho využito i pro vytvoření jednoduchého,<br />

avšak dostatečně zajímavého programu překládajícího věty se slovesy komunikace<br />

z češtiny do angličtiny. Naším nejbližším cílem v tomto ohledu je pokusit se<br />

o integraci české morfologie a syntaxe na kvalitativně vyšší úrovni dané velkým<br />

rozsahem slovníku, s nímž je již schopen pracovat morfologický analyzátor, a vytvořit<br />

syntaktický analyzátor (generátor) schopný pracovat se souvislými českými<br />

121

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!