Počítačové zpracování přirozeného jazyka
Počítačové zpracování přirozeného jazyka
Počítačové zpracování přirozeného jazyka
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Důležitým prostředkem pro grafické vyjádření struktury věty (její derivace) je grafstrom,<br />
který se nazývá derivační nebo syntaktický strom věty. Přesněji řečeno,<br />
strom je orientovaný acyklický graf s následujícími vlastnostmi:<br />
1. existuje jediný uzel, tzv. kořen stromu, do něhož nevstupuje žádná hrana,<br />
2. do všech ostatních uzlů vstupuje právě jedna hrana,<br />
3. uzly, z nich žádná hrana nevystupuje, se nazývají koncové (terminální) nebo<br />
také listy,<br />
4. při kreslení se zachovává konvence, že kořen je nejvýše a všechny hrany<br />
jsou orientovány směrem dolů,<br />
5. uspořádání hran zachovává slovoslednou relaci, tj. pořadí slov ve větě (zleva<br />
doprava).<br />
Je-li G gramatika, pak řetězec α ∈ (N ∪ T ) ∗ se nazývá větná forma právě tehdy,<br />
když platí S ∗<br />
=⇒ α, tj. řetězec α je generovatelný z počátečního symbolu S.<br />
Větná forma, která obsahuje pouze terminální symboly, se nazývá věta. Jazyk<br />
L(G) generovaný gramatikou G je definován množinou všech vět:<br />
L(G) = {w|S ∗<br />
=⇒ w ∧ w ∈ T ∗ }.<br />
Množinu vět generovaných gramatikou nazýváme jazyk a dále rozlišujeme slabou<br />
generativní kapacitu gramatiky, jíž je jazyk L(G) (množina všech vět generovaných<br />
gramatikou G), který je gramatika G schopna generovat, a silnou generativní<br />
kapacitu – což je množina syntaktických stromů (strukturních popisů)<br />
přiřazovaných větám <strong>jazyka</strong> L generovaného gramatikou G.<br />
5.4 Typy gramatik<br />
Gramatiky lze klasifikovat do typů podle tvaru přepisovacích pravidel. Je obvyklé<br />
vymezovat čtyři typy gramatik, které se nazývají typ 0, typ 1, typ 2 a typ 3.<br />
5.4.1 Typ 0<br />
Gramatika typu 0 obsahuje pravidla v nejobecnějším tvaru, kdy platí<br />
α → β, α ∈ (N ∪ T ) ∗ N (N ∪ T ) ∗ , β ∈ (N ∪ T ) ∗ .<br />
Protože se neklade žádné omezení na tvar pravidel a povoluje se přepisovat řetězce<br />
na řetězce, mluvíme také o neomezených přepisovacích systémech.<br />
57