všechny slajdy
všechny slajdy
všechny slajdy
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Pˇríklad bázové komponenty<br />
pravidla:<br />
S → NP VP<br />
NP → (D) A* N PP*<br />
VP → V (NP) (PP)<br />
PP → P NP<br />
Chomského teorie syntaxe Standardní teorie syntaxe<br />
lexikon:<br />
D: ten, ta<br />
A: velk´y, hněd´y, star´y<br />
N: pták, psem, lovec, já, lesa<br />
V: loví, jí, ˇsli<br />
P: se, do<br />
věta: Ten star´y lovec se psem ˇsli do lesa.<br />
syntaktick´y strom:<br />
D<br />
Ten<br />
A<br />
star´y<br />
NP<br />
N<br />
lovec<br />
P<br />
se<br />
S<br />
NP<br />
N<br />
psem<br />
VP<br />
V<br />
ˇsli<br />
P<br />
do<br />
Úvod do počítačové lingvistiky 5/11 21 / 24<br />
V´ychodiska syntaktické anal´yzy Návrh podklad˚u a datov´ych struktur<br />
Návrh podklad˚u a datov´ych struktur<br />
◮ syntaktick´y (odvozovací, derivační) frázov´y strom – kompletní<br />
hierarchick´y popis struktury věty<br />
PP<br />
N<br />
lesa<br />
◮ úkol syntaktické anal´yzy = pro danou gramatiku a dan´y vstup (větu)<br />
dát vˇsechny odvozovací stromy<br />
◮ existují techniky pro kompaktní uloˇzení lesa takov´ych strom˚u (chart<br />
parsing)<br />
◮ jelikoˇz se zab´yváme v´yhradně syntaktickou strukturou a nevylučujeme<br />
a priori derivační stromy s absurdní interpretací, má větˇsina vět<br />
mnoho r˚uzn´ych syntaktick´ych strom˚u<br />
Obehnat ˇ Saloun˚uv pomník mistra Jana Husa na praˇzském<br />
Staroměstském náměstí ˇziv´ym plotem z hust´ych keˇr˚u s trny<br />
navrhuje občanské sdruˇzení Společnost Jana Jesenia.<br />
Pocet uspesnych stromu = 57102672<br />
Úvod do počítačové lingvistiky 5/11 23 / 24<br />
Chomského teorie syntaxe Standardní teorie syntaxe<br />
Pˇríklad transformačních pravidel<br />
napˇr. pasivizace (v angličtině):<br />
John chose a book.<br />
NP1 – Aux – V – NP2<br />
1 – 2 – 3 – 4 → 4 – 2+be+en – 3 – by+1<br />
pˇresuny + vloˇzení + změny-rysu<br />
◮ transformace:<br />
• obligatorní – napˇr. pˇresun slovesné koncovky za sloveso<br />
• fakultativní – napˇr. pasivizace, tvorba otázek, negace (změna v´yznamu)<br />
◮ pravidla bázové komponenty – popisují strom hloubkové struktury<br />
v obvyklém poˇradí<br />
◮ transformace umoˇzňují jeho změny na r˚uzné povrchové varianty<br />
(trpn´y rod, otázka, . . . )<br />
◮ stopa (trace) – ukazuje, kde byl prvek pˇred pˇremístěním<br />
Úvod do počítačové lingvistiky 5/11 22 / 24<br />
V´ychodiska syntaktické anal´yzy Návrh podklad˚u a datov´ych struktur<br />
Návrh podklad˚u a datov´ych struktur – pokrač.<br />
Automatická anal´yza syntaxe musí vˇzdy projít tˇremi fázemi:<br />
1. musí b´yt zvolena notace pro zápis gramatiky – gramatick´y<br />
formalismus<br />
2. musí b´yt ve zvoleném formalismu napsána gramatika pro kaˇzd´y jazyk,<br />
kter´y bude zpracováván<br />
3. musí b´yt vybrán nebo navrˇzen algoritmus, kter´y určí, zda dan´y vstup<br />
odpovídá gramatice, a pokud ano, jak´y popis mu odpovídá<br />
Úvod do počítačové lingvistiky 5/11 24 / 24