23.07.2013 Views

Počítačové zpracování přirozeného jazyka

Počítačové zpracování přirozeného jazyka

Počítačové zpracování přirozeného jazyka

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

vznikl v Evropě. Za zmínku stojí, že G. A. Miller byl zpočátku blízkým spolupracovníkem<br />

N. Chomského a podílel se s ním na dvou fundamentálních kapitolách<br />

v příručce Handbook of Mathematical Psychology, (Introduction to Formal Description<br />

of Natural Language, Finitary Models of Language Users) publikované<br />

v r.1967 (Chomsky, Miller, 1967). Zatímco Chomsky se více méně stále přidržuje<br />

svých názorů na primárnost syntaktické roviny v popisu <strong>jazyka</strong>, G. A. Miller obrátil<br />

plně svou pozornost k lexikální sémantice a jako psycholog a psycholingvista se<br />

pokusil o přístup, který charakterizuje jako psycholexikologii. V jejím rámci usiluje<br />

spolu s Johnsonem-Lairdem (Miller, Johnson-Laird, 1976) o poznání toho,<br />

jak je organizována naše lexikální paměť, na jakých principech jsou budovány<br />

naše mentální slovníky. Počátek psycholexikologie je spojen se studiem slovních<br />

asociací, s pokusy o modelování mentálního slovníku, výchozí myšlenkou bylo<br />

organizovat slovník konceptuálně spíše než abecedně. Tento výzkum ho přivedl<br />

k pokusu vytvořit právě WordNet.<br />

6.4.3 Struktura WordNetu<br />

WordNet čili slovní síť je slovník podle autorů založený na psycholingvistických<br />

principech. Např. ve verzi 1.5 obsahuje téměř 120 000 hesel - z toho cca 67<br />

000 jednoduchých slovních tvarů a kolem 53 000 kolokací. To dává přes 91<br />

000 slovních významů či synonymických řad (synsets). Nejvýraznější rozdíl mezi<br />

WordNetem a standardními slovníky je mj. v tom, že WordNet člení slovník do<br />

pěti kategorií: substantiva, verba, adjektiva, adverbia a funkční slova (synsémantika).<br />

Fakticky jsou synsémantika ponechána stranou, to se opírá o pozorované<br />

řečové projevy afatických pacientů, z nichž vyplývá, že funkční slova jsou s velkou<br />

pravděpodobností uložena odděleně od ostatní slovní zásoby a tvoří součást<br />

syntaktické složky <strong>jazyka</strong>.<br />

Uvedené členění se opírá o asociační experimenty, které ukazují, že když informanti<br />

měli reagovat prvním slovem, které je napadlo, na předložená slova patřící<br />

k různým slovním druhům, reakce vypadaly následovně:<br />

– na substantiva - substantivem : 79 – na adjektiva - adjektivem : 65 – na slovesa<br />

- slovesem : 43<br />

Dále se WordNet liší od standardních slovníků v tom, že jednotlivé slovní druhy<br />

jsou v něm organizovány rozdílně – přihlíží se důsledně k jejich odlišné sémantické<br />

povaze:<br />

- substantiva jsou ve WordNetu (modelu lexikální paměti) organizována jako tématické<br />

hierarchie,<br />

- slovesa jsou organizována na základě různých vztahů vyplývání (entailment,<br />

90

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!