23.07.2013 Views

Počítačové zpracování přirozeného jazyka

Počítačové zpracování přirozeného jazyka

Počítačové zpracování přirozeného jazyka

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

automatů a trie struktury – tohoto přístupu je použito v morfologickém<br />

analyzátoru a lemmatizátoru pro češtinu ajka podrobně popsaném<br />

v práci (Sedláček, 1999). Detailněji se této problematice budeme<br />

věnovat níže.<br />

• syntaktické struktury vět: postihují vztahy mezi prvky (slovy), z nichž<br />

se věty či rozsáhlejší jazykové výrazy skládají. Jinak řečeno, pomocí<br />

syntaktických struktur reprezentujeme stavbu vět a jazykových výrazů,<br />

zachycujeme jimi, jak se jednoduché (atomické) větné složky (obvykle<br />

slova) seskupují do větších celků, jak jedny větné složky modifikují<br />

druhé, vyznačují, které výrazy jsou ve větě nejzávažnější – gramaticky<br />

i významově. Mějme např. věty<br />

(1) Honza prodal ten počítač Petrovi.<br />

(2) Počítač byl prodán Petrovi (Honzou).<br />

(3) Počítač se prodal (někdo někomu).<br />

Tyto věty sdílejí určité strukturní i významové (sémantické) vlastnosti,<br />

které by měly být v reprezentaci zachyceny. V obou větách jde sémanticky<br />

o činnost prodávání, přesto se však v jistém podstatném ohledu<br />

od sebe liší.<br />

Když se podíváme na věty jako<br />

(4) Honza dal knihu.<br />

(5) Eva jsou v kuchyni.,<br />

je zřejmé, že jsou určitým způsobem neúplné, deviantní. Můžeme o nich<br />

říci, že nejsou gramaticky správné. I tyto vlastnosti je potřeba v reprezentacích<br />

syntaktických struktur vhodným způsobem zachytit.<br />

Pak jsou tu případy víceznačných konstrukcí jako<br />

(6) Hutě železa vyrábějí málo.<br />

či<br />

(7) Kritika poslanců vedla k rozpadu koalice.<br />

Je vidět, že každá z uvedených vět dává nejméně dvě různá čtení, která<br />

bychom chtěli vhodným způsobem reprezentovat, tj. zachytit je v našich<br />

zamýšlených syntaktických reprezentacích.<br />

Syntaktické struktury se v současnosti standardně reprezentují pomocí<br />

stromových struktur, resp. grafů-stromů (frázových ukazatelů, strukturních<br />

popisů opírajících se o formalismus nekontextových gramatik),<br />

které reprezentují větné struktury v termínech jejich složek. Pro věty<br />

(1) a (2) můžeme mít reprezentace jako (1a) a (2a). Existuje také mož-<br />

15

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!