23.07.2013 Views

Počítačové zpracování přirozeného jazyka

Počítačové zpracování přirozeného jazyka

Počítačové zpracování přirozeného jazyka

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

– Požadavek přirozenosti vede lingvisty k tomu, aby popis byl formulován<br />

přehledně a srozumitelně, byl snadno modifikovatelný a vyjadřoval<br />

relevantní generalizace.<br />

– Poměrně nevelké notační modifikace mohou na jedné straně výrazně<br />

omezit třídu vyjádřitelných gramatik a na druhé straně mohou naopak<br />

vést k radikálnímu zvýšení potenciální matematické mohutnosti charakterizovaného<br />

systému.<br />

– Formalismus gramatik vytvářený teoretickými lingvisty je obvykle<br />

předmětem pozornosti jen pro další teoretické lingvisty. Gramatické<br />

formalismy pro počítače musí být podobně jako programovací jazyky<br />

srozumitelné jak pro lidi, tak i pro stroje a navíc zvládnutelné v realistickém<br />

čase. Problémy, které vznikají při navrhování gramatických<br />

formalismů, jsou vskutku shodné s otázkami, které se objevují při návrzích<br />

deklarativních počítačových jazyků pro reprezentaci znalostí.<br />

3. jak deskriptivně adekvátní má daný popis být? – např. jde-li nám o popis<br />

naprosto přesný či jen přibližně adekvátní.<br />

Formalismy, k nimž obrátíme svou pozornost v dalším výkladu, budou reprezentovat<br />

v podstatě nekontextové frázové gramatiky a budou to gramatiky<br />

vymezených klauzulí (dcg) a případně i formalismus gt (Smrž, Horák, 2001).<br />

Všechny druhy gramatik užívaných v počítačové lingvistice využívají v té<br />

či oné podobě:<br />

• reprezentaci syntaktických kategorií nebo „slovních druhů<br />

• datové typy pro slova (slovní formy, tj. slovník)<br />

• datové typy pro syntaktická (morfologická) pravidla<br />

• datové typy pro syntaktické struktury.<br />

Celou gramatiku lze pak chápat jako užití konkrétních datových typů složených<br />

z uvedených tří jednotek. Analyzátor je algoritmus, který bere gramatiku<br />

spolu s předloženým řetězem a snaží se vrátit jednu nebo více instancí<br />

datového typu syntaktické struktury. Úplný gramatický formalismus tedy poskytuje<br />

notaci pro specifikování syntaktických kategorií, slovníkových hesel,<br />

gramatických pravidel (ev. i více typů) a syntaktických struktur.<br />

52

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!