13.07.2015 Views

pdf ke stažení - Ústav českého jazyka a teorie komunikace

pdf ke stažení - Ústav českého jazyka a teorie komunikace

pdf ke stažení - Ústav českého jazyka a teorie komunikace

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

důležitou složkou celé koncepce je zpracování frazémů, kolokací a idiomů• pravidla využívají (popř. hodlají využívat) veš<strong>ke</strong>rých zdrojů syntaktickýchinformací, zejména různých slovníků : např . slovníky kolokací a idiomů ,valenční slovníky, slovniky homonym a homonymních tříd atd.Obecně není metoda pravidly řízené disambiguace ve světě přlliš rozšířená ,a to patrně z těchto (ne vždy oprávněných) důvodů :vyvíjet syntaktická pravidlaje velice obtížné - vyžaduje to od autoru hlubokývhled do syntaktické struktury věty• syntaktických konfigurací je v jazyce příliš mnoho, a tak se předem rezignujena to, že by se systém <strong>jazyka</strong> dal vůbec postihnout• neumíme-Ii zpracovat složité souvěti , rezignujeme i na věty jednodušší• pravidla jsou jazykově závislájednoznačně se podali určit jen málo slovních tvaru, zbytek se stejně budemuset "hádat"• má se zato, že úspěšnost nebude vyšší než disambiguace stochastickýmimetodaminepodaří se udržet celý systém pravidel, kterých bude muset být velicemnoho (řádově nejméně stovky), plně konzistentní.Na zák ladě dosavadní práce na pravidly řízené disambiguaci vyslovujioptimistický názor, že je možné vyvinout syntaktická pravidla, která povedouk vynikající, tj. takřka bezchybné disambiguaci českých korpusových textů. Jeovšem jasné, že takových pravidel budou nejméně stovky.2.2.3 Kombinovaná metod. disambiguaceTřeti možností, jak automaticky disambiguovat elektronické texty v jazykovýchkorpusech, je kombinace obou výše popsaných metod. Zdá se, že proflektivní jazyky, konkrétně pro češtinu, je vhodné volit sériově spřaženéprogramové moduly tak, že modul pravidly řízené disambiguace je předřazenmodulu stochastickému, tj. výstup pravidlového modulu je vstupem do modulustochastického. Tato koncepce vycházi z toho, žestochastický modul se oběas dopusti hrubé chyby při disambiguaci syntaktickyjednoduchých struktur a pravidlový modul právě tyto jednoduché strukturydokáže sám bezchybně disambiguovat, takže stochastický modul se jimi pakuž nezabývápravidlový modul provede částečnou disambiguaci, tj. odstraní některé zcelajistě nesprávné interpretace nabízené morfologickým analyzátorem, a takzúží stochastickému modulu prostor pro rozhodováni, což má za následek71

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!