Počítačové zpracování přirozeného jazyka
Počítačové zpracování přirozeného jazyka
Počítačové zpracování přirozeného jazyka
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
– Požadavek přirozenosti vede lingvisty k tomu, aby popis byl formulován<br />
přehledně a srozumitelně, byl snadno modifikovatelný a vyjadřoval<br />
relevantní generalizace.<br />
– Poměrně nevelké notační modifikace mohou na jedné straně výrazně<br />
omezit třídu vyjádřitelných gramatik a na druhé straně mohou naopak<br />
vést k radikálnímu zvýšení potenciální matematické mohutnosti charakterizovaného<br />
systému.<br />
– Formalismus gramatik vytvářený teoretickými lingvisty je obvykle<br />
předmětem pozornosti jen pro další teoretické lingvisty. Gramatické<br />
formalismy pro počítače musí být podobně jako programovací jazyky<br />
srozumitelné jak pro lidi, tak i pro stroje a navíc zvládnutelné v realistickém<br />
čase. Problémy, které vznikají při navrhování gramatických<br />
formalismů, jsou vskutku shodné s otázkami, které se objevují při návrzích<br />
deklarativních počítačových jazyků pro reprezentaci znalostí.<br />
3. jak deskriptivně adekvátní má daný popis být? – např. jde-li nám o popis<br />
naprosto přesný či jen přibližně adekvátní.<br />
Formalismy, k nimž obrátíme svou pozornost v dalším výkladu, budou reprezentovat<br />
v podstatě nekontextové frázové gramatiky a budou to gramatiky<br />
vymezených klauzulí (dcg) a případně i formalismus gt (Smrž, Horák, 2001).<br />
Všechny druhy gramatik užívaných v počítačové lingvistice využívají v té<br />
či oné podobě:<br />
• reprezentaci syntaktických kategorií nebo „slovních druhů<br />
• datové typy pro slova (slovní formy, tj. slovník)<br />
• datové typy pro syntaktická (morfologická) pravidla<br />
• datové typy pro syntaktické struktury.<br />
Celou gramatiku lze pak chápat jako užití konkrétních datových typů složených<br />
z uvedených tří jednotek. Analyzátor je algoritmus, který bere gramatiku<br />
spolu s předloženým řetězem a snaží se vrátit jednu nebo více instancí<br />
datového typu syntaktické struktury. Úplný gramatický formalismus tedy poskytuje<br />
notaci pro specifikování syntaktických kategorií, slovníkových hesel,<br />
gramatických pravidel (ev. i více typů) a syntaktických struktur.<br />
52