23.07.2013 Views

Počítačové zpracování přirozeného jazyka

Počítačové zpracování přirozeného jazyka

Počítačové zpracování přirozeného jazyka

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

finice, můžeme vidět, že jednotlivé významy se překrývají nebo naopak nejsou<br />

dostatečně přesně odlišeny, např. není dost jasné, v čem přesně spočívá rozdíl<br />

mezi významem ... a významem ... Dosvědčují to ostatně i příklady uváděné u<br />

jednotlivých významů, např. ... Uživatel – člověk si takto rozlišenými významy<br />

snad jakž takž poradí, ovšem pro počítačové <strong>zpracování</strong> jsou významy rozlišené<br />

(a definované) uvedeným způsobem prakticky nepoužitelné.<br />

S podobnou situací se ovšem můžeme setkat i u anglických slovníků obecně<br />

považovaných za velmi kvalitní. Porovnáme-li např. jen počet významů slovesa<br />

get uváděných ve WordNetu 1.5 (1995) a v NODE (New Oxford Dictionary of<br />

English, 1998), zjistíme ke svému překvapení, že první uvádí pro get 19 významů,<br />

zatímco NODE jen 8. Tak velký rozdíl nemůže ovšem být náhodný a je zjevně<br />

způsoben použitím rozdílných technik budování slovníku. NODE – je budován<br />

na korpusových textech – poměrně rozsáhlé konkordance byly podrobeny pečlivé<br />

lexikografické analýze a jednotlivé významy byly získány tříděním a seskupováním<br />

podobných kontextů. WN 1.5 byl vytvářen skupinou nadšených laiků, kteří se<br />

zjevně nepřidržovali pevných rozlišovacích kritérií a jejich výsledky svědčí o tom,<br />

že převážně používali techniku, kterou lze charakterizovat jako ”sense splitting”,<br />

tj. snažili se rozlišovat jednotlivé významy co nejjemněji. Dá se však ukázat, že<br />

významy rozlišené ve WN 1.5 nelze vždy doložit korpusovými daty, např. WN<br />

1.5 uvádí sloveso sabre ve významu to kill with sabre = zašavlovat. BNC však<br />

neobsahuje ani jeden výskyt tohoto slovesa a lze úspěšně pochybovat, že by šlo<br />

jen o rozdíl mezi britskou a americkou angličtinou. Co je horší, některé významy<br />

slovesa get uvedené ve WN 1.5 s obtížemi rozlišují i rodilí mluvčí angličtiny.<br />

Nepříjemné je to, že WN 1.5 včetně novějších verzí je velmi populární a mnozí<br />

badatelé opírají své výsledky o data, jak jsou k dispozici ve WN 1.5 – spolehlivost<br />

těchto výsledků musí být bohužel v nezanedbatelné míře pokládána za spornou.<br />

Se zajímavou myšlenkou přišel ve své disertační práci (i jinde, citovat) P.<br />

Hanks, který do jisté míry zpochybňuje existenci významů jako takových a mluví<br />

o významových potenciálech – (Hanks, 2002).<br />

... it makes sense to ask whether words do in fact have meaning at all. The<br />

question is a serious one, and it is being asked by lexicographers, of all people. Sue<br />

Atkins, for example, is quoted by Kilgarriff (1999) as saying, ”I don’t believe in<br />

word meanings”. And this scepticism has a long and respectable history. To take<br />

just one example, Frege (1884), in introducing the principle of compositionality,<br />

argued that words only have meaning when they are put together in clauses or<br />

propositions.<br />

This raises questions of fundamental importance to the enterprise of word<br />

sense disambiguation and dictionary making. If senses don’t exist, then there is<br />

68

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!