23.07.2013 Views

Počítačové zpracování přirozeného jazyka

Počítačové zpracování přirozeného jazyka

Počítačové zpracování přirozeného jazyka

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Důležitým prostředkem pro grafické vyjádření struktury věty (její derivace) je grafstrom,<br />

který se nazývá derivační nebo syntaktický strom věty. Přesněji řečeno,<br />

strom je orientovaný acyklický graf s následujícími vlastnostmi:<br />

1. existuje jediný uzel, tzv. kořen stromu, do něhož nevstupuje žádná hrana,<br />

2. do všech ostatních uzlů vstupuje právě jedna hrana,<br />

3. uzly, z nich žádná hrana nevystupuje, se nazývají koncové (terminální) nebo<br />

také listy,<br />

4. při kreslení se zachovává konvence, že kořen je nejvýše a všechny hrany<br />

jsou orientovány směrem dolů,<br />

5. uspořádání hran zachovává slovoslednou relaci, tj. pořadí slov ve větě (zleva<br />

doprava).<br />

Je-li G gramatika, pak řetězec α ∈ (N ∪ T ) ∗ se nazývá větná forma právě tehdy,<br />

když platí S ∗<br />

=⇒ α, tj. řetězec α je generovatelný z počátečního symbolu S.<br />

Větná forma, která obsahuje pouze terminální symboly, se nazývá věta. Jazyk<br />

L(G) generovaný gramatikou G je definován množinou všech vět:<br />

L(G) = {w|S ∗<br />

=⇒ w ∧ w ∈ T ∗ }.<br />

Množinu vět generovaných gramatikou nazýváme jazyk a dále rozlišujeme slabou<br />

generativní kapacitu gramatiky, jíž je jazyk L(G) (množina všech vět generovaných<br />

gramatikou G), který je gramatika G schopna generovat, a silnou generativní<br />

kapacitu – což je množina syntaktických stromů (strukturních popisů)<br />

přiřazovaných větám <strong>jazyka</strong> L generovaného gramatikou G.<br />

5.4 Typy gramatik<br />

Gramatiky lze klasifikovat do typů podle tvaru přepisovacích pravidel. Je obvyklé<br />

vymezovat čtyři typy gramatik, které se nazývají typ 0, typ 1, typ 2 a typ 3.<br />

5.4.1 Typ 0<br />

Gramatika typu 0 obsahuje pravidla v nejobecnějším tvaru, kdy platí<br />

α → β, α ∈ (N ∪ T ) ∗ N (N ∪ T ) ∗ , β ∈ (N ∪ T ) ∗ .<br />

Protože se neklade žádné omezení na tvar pravidel a povoluje se přepisovat řetězce<br />

na řetězce, mluvíme také o neomezených přepisovacích systémech.<br />

57

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!