13.07.2015 Views

pdf ke stažení - Ústav českého jazyka a teorie komunikace

pdf ke stažení - Ústav českého jazyka a teorie komunikace

pdf ke stažení - Ústav českého jazyka a teorie komunikace

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

pozic je jednoznačně stanoven (např. I. pozice obsahuje identifikaci slovníhodruhu, 2. pozice obsahuje jemnější kategorizaci slovního druhu vymezenéhohodnotou na 1. pozici, 3. pozice identifikuje jmenný rod, 4. pozice číslo, 5.pozice pád atd.) Každá morfologická značka je tak tvolena patnáctici znaků -např . morfologická značka NNMSI-----A-- pfifazená např . slovu chlapecoznačuje: N = substantivum, N = obyčejné (ničím nespecifické) substantivum,M = maskulinum, S = singulár, I = nominativ, A = kladná, nikoli negativnípodoba slova - tato značka vyjadřuje protiklad typu víra/nevíra. Je-Ii dané slovomorfologicky, popř. lexikálně či slovnědruhově víceznačné (např. výše zmíněnýtvar lOl/čím nebo tvar prosí, což je slovesný tvar 3. osoby čísla singulárui plurálu slovesa prosit, je morfologicky charakterizován dvěma odlišnýmiznačkami, které se liší hodnotou na pozici čísla), opatří je morfologickýanalyzátor tolika značkami, kolik má toto slovo lexikálních, slovnědruhovýcha morfologických významů (včetně příslušných lemmat).2.2 Automatická morfologická disambiguaceAutomatická morfologická analýza textu, která spočívá ve správném přiřazeníveš<strong>ke</strong>rých možných na kontextu nezávislých morfologických interpretacíkaždému slovnímu tvaru v textu, je úkolem pracným, ale relativně nenáročnýma lze ji obecně řešit prakticky bezchybně. Jakkoli má význam sama o sobě, lzeji především chápat jako nutný předstupeň k řešení úkolu nesrovnatelnt!náročnějšího - nalézt náležitou slovnědruhovou a morfologickou interpretacidaného slovního tvaru.V konkrétním textu má každé slovo takřka vždy jen jedinou morfologickou,lexikální či slovnědruhovou ínterpretaci a tuto informaci je třeba ve značkovanémtextu stanovit procedurou zvanou morfologická disambiguaceldesambiguace (zjednoznačnění), tj . výběrem správné interpretace ze všechinterpretaCí poskytnutých morfologickým analyzátorem. Mluvčí <strong>jazyka</strong> (v našempřípadě češtiny) nemá s "ruční", tj. neautomatickou disambiguaci zpravidlavelké potiže (ač existují samozřejmě případy, kdy je výběr správné morfologickéa slovnědruhové interpretace obtížný i pro člověka). Snadno např. určí slovnidruh a morfologické vlastnosti všech slov věty(5) Ty ženy snědí tři slanečky.tj. bel problémů stanov i tyto slovnědruhové a morfologické charakteristiky:ty: tvar=ty, lemma=ten, slovní_druh=zájmeno, poddruh=demonstrativum.pád=nominativ, jmenný rod=femininum, číslo=plurál

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!