Počítačové zpracování přirozeného jazyka
Počítačové zpracování přirozeného jazyka
Počítačové zpracování přirozeného jazyka
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
vznikl v Evropě. Za zmínku stojí, že G. A. Miller byl zpočátku blízkým spolupracovníkem<br />
N. Chomského a podílel se s ním na dvou fundamentálních kapitolách<br />
v příručce Handbook of Mathematical Psychology, (Introduction to Formal Description<br />
of Natural Language, Finitary Models of Language Users) publikované<br />
v r.1967 (Chomsky, Miller, 1967). Zatímco Chomsky se více méně stále přidržuje<br />
svých názorů na primárnost syntaktické roviny v popisu <strong>jazyka</strong>, G. A. Miller obrátil<br />
plně svou pozornost k lexikální sémantice a jako psycholog a psycholingvista se<br />
pokusil o přístup, který charakterizuje jako psycholexikologii. V jejím rámci usiluje<br />
spolu s Johnsonem-Lairdem (Miller, Johnson-Laird, 1976) o poznání toho,<br />
jak je organizována naše lexikální paměť, na jakých principech jsou budovány<br />
naše mentální slovníky. Počátek psycholexikologie je spojen se studiem slovních<br />
asociací, s pokusy o modelování mentálního slovníku, výchozí myšlenkou bylo<br />
organizovat slovník konceptuálně spíše než abecedně. Tento výzkum ho přivedl<br />
k pokusu vytvořit právě WordNet.<br />
6.4.3 Struktura WordNetu<br />
WordNet čili slovní síť je slovník podle autorů založený na psycholingvistických<br />
principech. Např. ve verzi 1.5 obsahuje téměř 120 000 hesel - z toho cca 67<br />
000 jednoduchých slovních tvarů a kolem 53 000 kolokací. To dává přes 91<br />
000 slovních významů či synonymických řad (synsets). Nejvýraznější rozdíl mezi<br />
WordNetem a standardními slovníky je mj. v tom, že WordNet člení slovník do<br />
pěti kategorií: substantiva, verba, adjektiva, adverbia a funkční slova (synsémantika).<br />
Fakticky jsou synsémantika ponechána stranou, to se opírá o pozorované<br />
řečové projevy afatických pacientů, z nichž vyplývá, že funkční slova jsou s velkou<br />
pravděpodobností uložena odděleně od ostatní slovní zásoby a tvoří součást<br />
syntaktické složky <strong>jazyka</strong>.<br />
Uvedené členění se opírá o asociační experimenty, které ukazují, že když informanti<br />
měli reagovat prvním slovem, které je napadlo, na předložená slova patřící<br />
k různým slovním druhům, reakce vypadaly následovně:<br />
– na substantiva - substantivem : 79 – na adjektiva - adjektivem : 65 – na slovesa<br />
- slovesem : 43<br />
Dále se WordNet liší od standardních slovníků v tom, že jednotlivé slovní druhy<br />
jsou v něm organizovány rozdílně – přihlíží se důsledně k jejich odlišné sémantické<br />
povaze:<br />
- substantiva jsou ve WordNetu (modelu lexikální paměti) organizována jako tématické<br />
hierarchie,<br />
- slovesa jsou organizována na základě různých vztahů vyplývání (entailment,<br />
90