Počítačové zpracování přirozeného jazyka
Počítačové zpracování přirozeného jazyka
Počítačové zpracování přirozeného jazyka
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
automatů a trie struktury – tohoto přístupu je použito v morfologickém<br />
analyzátoru a lemmatizátoru pro češtinu ajka podrobně popsaném<br />
v práci (Sedláček, 1999). Detailněji se této problematice budeme<br />
věnovat níže.<br />
• syntaktické struktury vět: postihují vztahy mezi prvky (slovy), z nichž<br />
se věty či rozsáhlejší jazykové výrazy skládají. Jinak řečeno, pomocí<br />
syntaktických struktur reprezentujeme stavbu vět a jazykových výrazů,<br />
zachycujeme jimi, jak se jednoduché (atomické) větné složky (obvykle<br />
slova) seskupují do větších celků, jak jedny větné složky modifikují<br />
druhé, vyznačují, které výrazy jsou ve větě nejzávažnější – gramaticky<br />
i významově. Mějme např. věty<br />
(1) Honza prodal ten počítač Petrovi.<br />
(2) Počítač byl prodán Petrovi (Honzou).<br />
(3) Počítač se prodal (někdo někomu).<br />
Tyto věty sdílejí určité strukturní i významové (sémantické) vlastnosti,<br />
které by měly být v reprezentaci zachyceny. V obou větách jde sémanticky<br />
o činnost prodávání, přesto se však v jistém podstatném ohledu<br />
od sebe liší.<br />
Když se podíváme na věty jako<br />
(4) Honza dal knihu.<br />
(5) Eva jsou v kuchyni.,<br />
je zřejmé, že jsou určitým způsobem neúplné, deviantní. Můžeme o nich<br />
říci, že nejsou gramaticky správné. I tyto vlastnosti je potřeba v reprezentacích<br />
syntaktických struktur vhodným způsobem zachytit.<br />
Pak jsou tu případy víceznačných konstrukcí jako<br />
(6) Hutě železa vyrábějí málo.<br />
či<br />
(7) Kritika poslanců vedla k rozpadu koalice.<br />
Je vidět, že každá z uvedených vět dává nejméně dvě různá čtení, která<br />
bychom chtěli vhodným způsobem reprezentovat, tj. zachytit je v našich<br />
zamýšlených syntaktických reprezentacích.<br />
Syntaktické struktury se v současnosti standardně reprezentují pomocí<br />
stromových struktur, resp. grafů-stromů (frázových ukazatelů, strukturních<br />
popisů opírajících se o formalismus nekontextových gramatik),<br />
které reprezentují větné struktury v termínech jejich složek. Pro věty<br />
(1) a (2) můžeme mít reprezentace jako (1a) a (2a). Existuje také mož-<br />
15