kontextfrei

Theoretische Informatik I 

Einheit 3.3 

Eigenschaften kontextfreier Sprachen 

1. Abschlußeigenschaften 

2. Normalformen 

3. Prüfen von Eigenschaften / Syntaxanalyse 

4. Wann sind Sprachen nicht kontextfrei?

Abschlußeigenschaften kontextfreier Sprachen 

Typ-2 Sprachen sind komplizierter als Typ-3 Sprachen 

• Abgeschlossenheit gilt nur für 6 Operationen 

– Vereinigung zweier kontextfreier Sprachen L1 ∪ L2 

– Spiegelung einer kontextfreien Sprache L R 

– Hülle einer kontextfreien Sprache L ∗ 

– Verkettung zweier kontextfreier Sprachen L1◦L2 

– Substitution/Homomorphismus einer kontextfreien Sprache σ(L) 

– Inverser Homomorphismus einer kontextfreien Sprache h −1 (L) 

• Keine Abgeschlossenheit für 

– Komplement einer kontextfreien Sprache L 

– Durchschnitt zweier kontextfreier Sprachen L1 ∩ L2 

– Differenz zweier kontextfreier Sprachen L1 - L2 

• Nachweis mit Grammatiken und PDAs 

– Modelle sind ineinander umwandelbar – wähle das passendste 

– Negative Nachweise mit einem Typ-2 Pumping Lemma 

THEORETISCHE INFORMATIK I §3: KONTEXTFREIE SPRACHEN 1 EIGENSCHAFTEN KONTEXTFREIER SPRACHEN

Substitutionen von Sprachen 

Verallgemeinerung von Homomorphismen 

• Abbildung σ von Wörtern in Sprachen 

σ:Σ ∗ →L ist Substitution, wenn σ(v1..vn) = σ(v1)◦..◦σ(vn) für alle vi ∈Σ 

σ(L)= {σ(w) | w ∈L} ist das Abbild der Wörter von L unter σ 

• Beispiel: σ(0)={a n b n | n ∈ N}, σ(1)={aa, bb} 

– σ:{0, 1} ∗ →L ist eindeutig definiert durch σ(0) und σ(1) 

– σ(01) = {a n b n | n ∈N}◦{aa,bb} 

= {w ∈{a, b} ∗ | w = a n b n+2 ∨w = a n b n aa für ein n ∈N} 

– σ({0} ∗ ) = {anbn |n∈N} ∗ 

= {w ∈{a, b} ∗ | w = an1bn1an2bn2..an kbnk für ein k und ni ∈N} 

• Extrem ausdrucksstarker Mechanismus 

– L1 ∪ L2 = σ({1,2}) für σ(1)=L1, σ(2)=L2 

– L1◦L2 = σ({12}) für σ(1)=L1, σ(2)=L2 

– L∗ = σ({1} ∗ ) für σ(1)=L 

. 


Abgeschlossenheit unter Substitutionen 

L ∈L2, σ Substitution, σ(a) ∈L2 für a ∈T ⇒ σ(L) kontextfrei 

• Beweis mit Grammatiken 

“Ersetze a ∈T durch Startsymbol der kontextfreien Grammatik für σ(a)” 

Seien L und σ(a) kontextfrei für alle a ∈T 

Dann gibt es Typ-2 Grammatiken G = (V , T , P , S) mit L = L(G) 

und Ga = (Va, Ta Pa, Sa) mit σ(a) = L(Ga) 

Dann ist σ(L) = σ(L(G)) = {σ(a1)◦..◦σ(an) | S ∗ 

−→ a1..an} 

= {w1..wn | ∃a1..an. S ∗ 

∗ 

−→ a1..an ∧Sa −→ wi} i 

Sei Pσ = {A→ασ | A→α ∈P } ∪ 

a ∈TPa, wobei ασ aus α ∈(V ∪T) ∗ 

entsteht, indem jedes a ∈T durch Sa ersetzt wird 

und Gσ = (Vσ, Tσ, Pσ, S) wobei Vσ = V ∪ 

a ∈ T Va und Tσ = 

Dann gilt w1..wn ∈L(Gσ) ⇔ S ∗ 

−→ Gσw1..wn 

⇔ ∃a1..an ∈T ∗ . S ∗ 

−→ Ga1..an ∧Sai 

⇔ w1..wn ∈ σ(L) 

Also ist σ(L) kontextfrei 

a ∈ T Ta 

∗ 

−→ Ga i wi 


Vereinigung, Verkettung, Hülle, Homomorphismen 

Verwende Abgeschlossenheit unter Substitutionen 

• L1, L2 kontextfrei ⇒ L1 ∪ L2 kontextfrei 

– Sei σ(1)=L1 und σ(2)=L2 

– Dann ist σ:{1, 2}→L2 Substitution und L1 ∪ L2 = σ({1,2}) ∈ L2 

• L1, L2 kontextfrei ⇒ L1 ◦L2 kontextfrei 

– Sei σ(1)=L1 und σ(2)=L2 

– Dann ist σ:{1, 2}→L2 Substitution und L1◦L2 = σ({12}) ∈ L2 

• L kontextfrei ⇒ L ∗ kontextfrei 

– Für σ(1)=L ist σ:{1}→L2 Substitution und L ∗ = σ({1} ∗ ) ∈ L2 

• L kontextfrei ⇒ L + kontextfrei 

– Für σ(1)=L ist σ:{1}→L2 Substitution und L + = σ({1} + ) ∈ L2 

• L ∈L2, h Homomorphismus ⇒ h(L) kontextfrei 

– Für σ(a)={h(a)} ist σ:T →L2 Substitution und h(L) = σ(L) ∈ L2 


Abschluß unter Spiegelung 

L kontextfrei ⇒ L R ={wn..w1 | w1..wn ∈L} kontextfrei 

• Beweis mit Grammatiken 

– Bilde Spiegelgrammatik zu G = (V , T , P , S) mit L = L(G) 

– Setze GR = (V , T , PR, S) mit PR = {A→α R | A→α ∈P } 

– Dann gilt für alle A ∈V , w ∈(V ∪T) ∗ : A ∗ 

−→ G w ⇔ A ∗ 

−→ G R w R 

· Beweis durch Induktion über Länge der Ableitung 

– Also L(GR) = {w ∈T ∗ | S ∗ 

−→ G R w} = {v R ∈T ∗ |S ∗ 

−→ Gv} = (L(G)) R 

• Beweis mit PDAs ähnlich wie bei Typ-3 Sprachen 

– Bilde Umkehrautomaten zu P = (Q, Σ, Γ, δ, q0, Z0, F ) mit L=LF(P) 


Abschluß unter inversen Homomorphismen 

L ∈L2, h Homomorphismus ⇒ h −1 (L) kontextfrei 

• Beweis mit Pushdown Automaten 

“Berechnung von h vor Abarbeitung der Wörter im Automaten” 

Sei L kontextfrei und P = (Q, Σ, Γ, δ, q0, Z0, F ) ein PDA 

mit L = LF(P) = { v ∈Σ∗ | ∃q ∈F. ∃β ∈Γ∗ . (q0,v,Z0) ⊢ ∗ 

(q,ǫ, β) } 

Dann ist h−1 (L) = {w ∈Σ ′∗ | ∃q ∈F. ∃β ∈Γ∗ . (q0,h(w),Z0) ⊢ ∗ 

(q, ǫ,β) } 

Konstruiere PDA Ph = (Qh, Σ’, Γ, δh, q0 , Z0, Fh) mit der Eigenschaft 

h 

(q0 ,w,Z0) ⊢ h ∗ 

(qh, ǫ, β) ⇔ (q0, h(w),Z0) ⊢ ∗ 

(q,ǫ, β) für Endzustände 

Ein Ansatz wie δh(q, a,X) = ˆ δ(q, h(a),X) funktioniert nicht! 

Wie bei DEAs muß h(a) schrittweise in den Zuständen abgearbeitet werden 

Setze Qh = Q × {v ∈Σ∗ | v Suffix von h(a) für ein a ∈Σ’} 

δh( (q,ǫ), a, X ) = {( (q,h(a)), X )} a ∈Σ’, X ∈Γ 

δh( (q,bv), ǫ, X ) = {( (p,v),α)|(p,α) ∈δ(q,b,X)} b ∈Σ∪{ǫ}, v ∈Σ∗ , X ∈Γ 

q0 = (q0,ǫ) Fh = {(q,ǫ)|q ∈F } 

h 

Dann gilt ((q,ǫ),a,X) ⊢ ∗ 

P ((p,ǫ),ǫ,β) ⇔ (q,h(a),X) ⊢ h ∗ 

P (p,ǫ,β) 

Also ist h−1 (L) = L(Ph) und damit kontextfrei 


Durchschnitt, Komplement und Differenz 

Abgeschlossenheit gilt nicht für diese Operationen 

• Durchschnitt: L1, L2 ∈L2 ⇒ L1∩L2 ∈L2 

– L = {0 n 1 n 2 n |n∈N} ist nicht kontextfrei (Beweis später) 

– Aber L = {0 n 1 n 2 m |n,m∈N} ∩ {0 m 1 n 2 n | n,m∈N} 

und {0 n 1 n 2 m |n,m∈N} und {0 m 1 n 2 n | n,m∈N} sind kontextfrei 

(Regeln für erste Sprache: S→AB, A→0A1, A→01, B→2B, B→2) 

Der Durchschnitt kontextfreier und regulärer Sprachen ist kontextfrei 

(HMU Satz 7.27) 

• Komplement L ∈L2 ⇒ L ∈L2 

– Es ist L1∩L2 = L1∪L2 

– Bei Abgeschlossenheit unter Komplementbildung würde 

Abgeschlossenheit unter Durchschnitt folgen 

• Differenz: L1, L2 ∈L2 ⇒ L1−L2 ∈L2 

– Es ist L = Σ ∗ −L 

– Aus Abschluß unter Differenz folgt Abschluß unter Komplement 


Tests für Eigenschaften kontextfreier Sprachen 

Welche Eigenschaften sind automatisch prüfbar? 

• Ist eine kontextfreie Sprache leer? 

– Entspricht Test auf Erreichbarkeit von Endzuständen 

– Nicht ganz so einfach, da Stackinhalt die Erreichbarkeit beeinflußt 

• Zugehörigkeit: gehört ein Wort zur Sprache? 

– Verarbeitung durch Pushdown-Automaten ist nichtdeterministisch 

– Deterministische Pushdown-Automaten sind nicht mächtig genug 

– Frage nach Zugehörigkeit beinhaltet oft Frage nach Ableitungsbaum 

• Äquivalenz: sind zwei Typ-2 Sprachen identisch? 

– Zusammenfassen äquivalenter Zustände im PDA kaum durchführbar 

• Kontextfreie Grammmatiken sind zu kompliziert 

– Analyse braucht einfachere Versionen von Typ-2 Grammatiken 

– Bringe Grammatik auf “Normalform” (äquivalente einfachere Struktur) 


Die Chomsky Normalform 

Trenne Variablen von Terminalsymbolen 

• Grammatik in Chomsky-Normalform 

– Grammatik G= (V , T , P , S), bei der jede Produktion die Form 

A→B C oder A→a hat (A, B, C ∈V , a ∈T ) 

– Grammatiken in Chomsky Normalform sind auch kontextsensitiv 

• Jede kontextfreie Grammatik G mit ǫ ∈L(G) ist in 

Chomsky-Normalform transformierbar 

1. Eliminierung von ǫ-Produktionen A → ǫ 

2. Eliminierung von Einheitsproduktionen A → B 

3. Eliminierung unnützer Symbole 

4. Separieren von Terminalsymbolen und Variablen in Produktionen 

5. Aufspalten von Produktionen A → α mit |α|>2 

Aufblähung/Transformationszeit quadratisch relativ zur Größe von G 


ǫ-Produktionen eliminieren 

• ǫ-Produktionen sind überflüssig, falls ǫ ∈L(G) 

– Variablen A ∈V mit A ∗ 

−→ ǫ sind eliminierbar 

– Menge eliminierbarer Symbole kann iterativ bestimmt werden 

· Ist A → ǫ ∈ P dann ist A eliminierbar 

· Ist A→X1..Xn ∈ P und alle Xi eliminierbar, dann ist A eliminierbar 

– Verfahren terminiert nach maximal |V | + 1 Iterationen 

• Erzeuge Grammatik ohne eliminierbare Symbole 

– Für G= (V , T , P , S) bestimme alle eliminierbare Variablen 

– Für A→α ∈ P mit eliminierbaren Symbolen X1, ..,Xm in α erzeuge 

2 m Regeln A→αi1,..,i k ({i1,..,ik} Teilmenge von {1, ..,m}) 

– Entferne alle Regeln der Form A → ǫ (auch neu erzeugte) 

– Wenn S eliminierbar ist, kann S ′ → S und S ′ → ǫ ergänzt werden 

• Erzeugte Grammatik ist äquivalent 

– Zeige A ∗ 

−→ ′ w ⇔ A 

G ∗ 

−→ w ∧ (w=ǫ ∨ A=S G ′ ) 

durch Induktion über Länge der Ableitung 


Elimination von ǫ-Produktionen am Beispiel 

P = { S→AB, A→aAA | ǫ, B→bBB | ǫ } 

• Ermittlung eliminierbarer Symbole 

1.: A und B sind eliminierbar 

2.: S ist ebenfalls eliminierbar 

• Verändere Regeln der Grammatik 

– Aus S→AB wird S→AB | A | B 

– Aus A→aAA |ǫ wird A→aAA | aA | a 

– Aus B→bBB | ǫ wird B→bBB | bB | b 

Grammatik erzeugt L(G)−{ǫ} ohne ǫ-Produktionen 

• Ergänze neues Startsymbol 

– S war eliminierbar: ergänze Produktionen S ′ → S | ǫ 

Grammatik erzeugt L(G) mit initialer ǫ-Produktion 


Einheitsproduktionen eliminieren 

Einheitsproduktionen verlängern Ableitungen 

und verkomplizieren technische Beweise 

• Bestimme alle Einheitspaare (A,B) mit A ∗ 

−→ B 

– Wie üblich ... iteratives Verfahren: 

· Alle Paare (A,A) für A ∈V sind Einheitspaare 

· Ist (A,B) Einheitspaar und B→C ∈ P dann ist (A,C) Einheitspaar 


• Erzeuge Grammatik ohne Einheitsproduktionen A → B 

– Bestimme alle Einheitspaare in G 

– Für jedes Einheitspaar (A,B) erzeuge Produktionen 

{A→α | B→α ∈P keine Einheitsproduktion} 

• Erzeugte Grammatik ist äquivalent 

– Ableitungen in G ′ sind “Kurzformen” von Ableitungen in G 

Beweis, wie immer, durch Induktion über Länge der Ableitung 


Elimination von Einheitsproduktionen am Beispiel 

P ′ = { E → T | E+T , T → F | T∗F , F → I | (E) 

I → a | b | c | Ia | Ib | Ic | I0 | I1 } 

• Bestimme alle Einheitspaare (A,B) mit A ∗ 

−→ B 

1.: (E,E), (T ,T ), (F ,F ) und (I,I) sind Einheitspaare 

2.: (E,T ), (T ,F ) und (F ,I) sind ebenfalls Einheitspaare 

3.: (E,F ) und (T ,I) sind ebenfalls Einheitspaare 

4.: (E,I) ist ebenfalls Einheitspaar 

5.: Keine weiteren Einheitspaare möglich 

• Erzeuge Grammatik ohne Einheitsproduktionen 

– Einheitspaare mit E: {E→E+T | T ∗F | (E) | a | b |c|Ia | Ib | Ic |I0 |I1} 

– Einheitspaare mit T : {T →T ∗F | (E) | a | b | c |Ia | Ib | Ic |I0 | I1} 

– Einheitspaare mit F : {F →(E) | a | b | c | Ia |Ib |Ic | I0 | I1} 

– Einheitspaare mit I: {I→a | b | c |Ia | Ib | Ic |I0 | I1} 


Unnütze Symbole eliminieren 

• X nützlich, falls S ∗ 

−→ αXβ ∗ 

−→ w ∈T ∗ 

– Erzeugend (X ∗ 

−→ v ∈T ∗ ) und erreichbar (S ∗ 

−→ αXβ) 

• Beispiel: P = { S→AB | a, A→b } 

· Erreichbar: S, A, B, a, und b erzeugend: S, A, a, und b 

– Nach Elimination von B: { S→a, A→b } 

· Erreichbar: S und a erzeugend: S, A, a, und b 

– Nach Elimination von A: { S→a } 

· Erreichbar: S und a erzeugend: S und a 

Erzeugte Produktionenmenge ist äquivalent zu P 

• Eliminationsverfahren für G mit L(G)=∅ 

– Eliminiere nichterzeugende Symbole und Produktionen, die sie enthalten 

– Eliminiere unerreichbare Symbole und Produktionen, die sie enthalten 

Resultierende Grammatik G ′ erzeugt dieselbe Sprache wie G 

G ′ enthält nur nützliche Symbole und S ∈V ′ 

Also w ∈L(G) ⇔ S ∗ 

−→ w ⇔ S G ∗ 

−→ ′ w ⇔ w ∈L(G 

G ′ ) 


Berechnung erzeugender/erreichbarer Symbole 

• Generiere Menge erzeugender Symbole iterativ 

– Alle Terminalsymbole a ∈T sind erzeugend 

– Ist A→X1..Xn ∈ P und alle Xi erzeugend, dann ist A erzeugend 


• Generiere Menge erreichbarer Symbole iterativ 

– S ist erreichbar 

– Ist A→X1..Xn ∈ P und A erreichbar dann sind alle Xi erreichbar 

– Verfahren terminiert nach maximal |V | + |T | Iterationen 

• Beispiel: P = { S→AB | a, A→b } 

– Erzeugende Symbole: 1.: a und b sind erzeugend 

2.: S und A sind ebenfalls erzeugend 

3.: Keine weiteren Symbole sind erzeugend 

– Erreichbare Symbole: 1.: S ist erreichbar 

2.: A, B und a sind ebenfalls erreichbar 

3.: b ist ebenfalls erreichbar 


Erzeugung der Chomsky-Normalform 

Nur Produktionen der Form A→B C oder A→a 

• Jede kontextfreie Grammatik G ist umwandelbar in eine 

äquivalente Grammatik ohne unnütze Symbole, (echte) 

ǫ-Produktionen und Einheitsproduktionen 

– Falls L(G) = ∅, wähle G ′ = (V , T , ∅, S) (Test auf ∅ später) 

– Sonst eliminiere ǫ-Produktionen, Einheitsproduktionen, unnütze Symbole 

• Separiere Terminalsymbole von Variablen 

– Für jedes Terminalsymbol a ∈T erzeuge neue Variable Xa 

– Ersetze Produktionen A→α mit |α|≥2 durch A→α X (a ∈T ersetzt durch Xa) 

– Ergänze Produktionen Xa→a für alle a ∈T 

• Spalte Produktionen A → α mit |α|>2 

– Ersetze jede Produktion A→X1..Xk durch k−1 Produktionen 

A→X1Y1, Y1→X2Y2, ...Yk−2→Xk−1Xk, wobei alle Yi neue Variablen 


Erzeugung der Chomsky-Normalform am Beispiel 

P = {E→E+T | T∗F | (E) | a | b | c | Ia | Ib | Ic | I0 | I1 

T→T∗F | (E) | a | b | c | Ia | Ib | Ic | I0 | I1 

F→(E) | a | b | c | Ia | Ib | Ic | I0 | I1 

I→a | b | c | Ia | Ib | Ic | I0 | I1 } 

• Separiere Terminalsymbole von Variablen 

P ′ = {E→EX+T | TX∗F | X (EX ) | a |b|c|IXa |IXb |IXc | IX0 | IX1 

T →TX∗F | X (EX ) | a |b|c|IXa | IXb | IXc |IX0 |IX1 

F →X (EX ) | a | b | c |IXa | IXb | IXc | IX0 |IX1 

I→a |b|c|IXa | IXb | IXc |IX0 |IX1 

Xa→a, Xb→b,Xc→c, X0→0,X1→1, X+→+,X∗→∗,X (→(,X )→) } 

• Spalte Produktionen A → α mit |α|>2 

P ′ = {E→EY1 | TY2 | X (Y3 | a |b|c|IXa | IXb | IXc |IX0 | IX1 

T →TY2 | X (Y3 | a | b |c|IXa | IXb | IXc |IX0 |IX1 

F →X (Y3 | a | b | c |IXa | IXb | IXc | IX0 |IX1 

I→a |b|c|IXa | IXb | IXc |IX0 |IX1 

Y1→X+T, Y2→X∗F, Y3→EX ) 

Xa→a, Xb→b,Xc→c, X0→0,X1→1, X+→+,X∗→∗,X (→(,X )→)} 


Tests für Eigenschaften kontextfreier Sprachen 

• Ist eine kontextfreie Sprache leer? 

– Für G = (V , T , P , S) gilt 

L(G) ist leer genau dann wenn S nicht erzeugend ist 

– Menge erzeugender Variablen kann iterativ bestimmt werden 

– Mit speziellen Datenstrukturen ist Test in linearer Zeit durchführbar 

• Gehört ein Wort zu einer kontextfreien Sprache? 

– Naive Methode für den Test w ∈L(G): 

1. Erzeuge Chomsky-Normalform G ′ von G 

(Details ins HMU §7.4.3) 

2. In G ′ erzeuge alle Ableitungsbäume mit 2|w| − 1 Variablenknoten 

3. Teste, ob einer dieser Bäume das Wort w erzeugt 

– Hochgradig ineffizient, da exponentiell viele Bäume zu erzeugen 

– Iterative Analyseverfahren sind besser 


Syntaxanalyse: COCKE-YOUNGER-KASAMI ALGORITHMUS 

Bestimme Variablenmengen, aus denen w i..w j ableitbar 

• Eingabe: Grammatik G = (V, T, P, S) in Chomsky-NF, w ∈T ∗ 

• Berechne Mengen Vi,j = {A ∈V | A ∗ 

−→ wi...wj} iterativ 

j=i: Vi,i = {A ∈V | A→wi ∈P} 

j>i: Vi,j = {A ∈V | 

∃i≤k

Der CYK-Algorithmus am Beispiel 

{ S → AB|BC, A → BA|a, B → CC|b, C → AB|a } 

• Prüfe w = baaba ∈L(G) 

• Berechne V i,j = {A ∈V | A ∗ 

−→ w i...w j} 

{S, A, C} 

— {S, A, C} 

— {B} {B} 

{S, A} {B} {S, C} {S, A} 

{B} {A, C} {A, C} {B} {A, C} 

b a a b a 

• S ∈V1,5, also w ∈L(G) 


Unentscheidbare Probleme für Typ-2 Sprachen 

Die folgenden Probleme können nicht getestet werden 

• L(G) = T ∗ Welche Menge beschreibt G? 

• L(G1) = L(G2) Äquivalenz von Grammatiken 

• L(G1)⊆L(G2) 

• L(G1)∩L(G2) = ∅ 

• L(G) ∈L3 

• L(G) ∈L2 

• L(G1)∩L(G2) ∈L2 

kontextfreies Komplement? 

kontextfreier Schnitt ? 

Beweise brauchen Berechenbarkeitstheorie / TI-2 


Grenzen kontextfreier Sprachen 

Warum ist L = {0 n 1 n 2 n | n ∈ N} nicht kontextfrei? 

• Typ-2 Grammatiken arbeiten lokal 

– Anwendbarkeit einer Produktion hängt nur von einer Variablen ab 

(der Kontext der Variablen ist irrelevant) 

– Eine Regel kann nur an einer Stelle im Wort etwas erzeugen 

– Eine Typ-2 Grammatik kann entweder 0/1 oder 1/2 simultan erhöhen 

aber nicht beides gleichzeitig 

– Grammatik müßte die Anzahl der 0/1 oder 1/2 im Voraus bestimmen 

und diese Anzahl für die 2 bzw. 0 im Namen der Variablen codieren 

• Grammatiken sind endlich 

– Es gibt nur endlich viele Variablen 

– Für n>|V | muß eine Variable X doppelt benutzt worden sein 

zur Codierung von 0 n 1 n und 0 i 1 i mit i

Das Pumping Lemma für kontextfreie Sprachen 

Wie zeigt man, daß eine Sprache nicht kontextfrei ist? 

• Für jede kontextfreie Sprache L ∈L2 gibt es eine Zahl n ∈N, so daß 

jedes Wort z ∈L mit Länge |z|≥n zerlegt werden kann in 

z = u v w x y mit den Eigenschaften 

(1) v◦x=ǫ, 

(2) |v w x|≤n und 

(3) für alle i ∈N ist u v i w x i y ∈ L 

• Aussage ist wechselseitig konstruktiv 

– Die Zahl n kann zu jeder kontextfreien Sprache L bestimmt werden 

– Die Zerlegung z = u v w xy kann zu jedem Wort z ∈L bestimmt werden 

• Beweis benötigt Chomsky-Normalform 

– Ableitungen der Länge k können maximal Wörter der Länge 2 k erzeugen 

– Ableitungen der Länge k>|V | benutzen ein Hilfssymbol X doppelt 

– Die Schleife der Ableitung von X aus X kann beliebig wiederholt werden 


Beweis des Pumping Lemmas 

Für jede Sprache L ∈L2 gibt es ein n ∈N, so daß jedes z ∈L 

mit Länge |z|≥n zerlegt werden kann in z = u v w x y mit 

(1) v◦x=ǫ, (2) |v w x|≤n (3) u v i w x i y ∈ L für alle i ∈N 

Beweis mit Grammatiken in Chomsky-Normalform 

– Für L = ∅ oder L = {ǫ} gilt die Behauptung trivialerweise 

– Andernfalls sei G= (V , T , P , S) in Chomsky-Normalform mit L = L(G) 

– Wähle n=2 |V | und betrachte z=z1..zm mit |z|≥n 

– Dann hat jeder Ableitungsbaum für z eine Tiefe von mindestens |V |+1 

– Sei X0, ...Xk die Folge der verarbeiteten Variablen auf dem längsten Pfad 

Dann erscheint eine Variable zweimal: Xi = Xj für ein i

Anwendungen des Pumping Lemmas 

• L = {0 m 1 m 2 m | m ∈ N} ist nicht kontextfrei 

– Verwende Kontraposition des Pumping Lemmas 

(∀n ∈N. ∃z ∈L. |z|≥n ∧ ∀u,v,w,x, y ∈T ∗ .(z = u v w x y 

∧ v◦x=ǫ ∧ |v w x|≤n) ⇒ ∃i ∈N. u v i w x i y ∈ L) ⇒ L ∈L2 

– Sei n ∈N beliebig. Wir wählen z = 0 m 1 m 2 m für ein m>n 

– Sei u,v,w,x, y ∈T ∗ beliebig mit z = uv w x y, 

und (1) v◦x=ǫ und (2) |v w x|≤n 

– Wir wählen i = 0 und zeigen uw y = u v i w x i y ∈ L 

– Wegen (2) enthält v w x keine Nullen oder keine Zweien 

· Falls v w x keine Null enthält, dann enthält u w y genau m Nullen 

aber wegen (1) weniger Einsen und/oder Zweien 

· Falls v w x keine Zwei enthält, dann enthält u w y genau m Zweien 

aber wegen (1) weniger Nullen und/oder Einsen 

– Damit kann u w y = u v 0 w x 0 y nicht zu L gehören 

– Mit dem Pumping Lemma folgt nun, daß L nicht kontextfrei ist 

• L ′ = { ww | w ∈{0, 1} ∗ } ∈ L2 

– Ähnliches Argument mit Wörtern der Form 0 m 1 m 0 m 1 m 


Rückblick: Eigenschaften kontextfreier Sprachen 

Kontextfreie Sprachen sind deutlich komplizierter 

• Abschlußeigenschaften 

– Operationen ∪, R , ◦, ∗ , σ, h −1 erhalten Kontextfreiheit von Sprachen 

– Keine Abgeschlossenheit unter ∩, , - 

• Automatische Prüfungen 

– Man kann testen ob eine kontextfreie Sprache leer ist 

– Man kann testen ob ein Wort zu einer kontextfreien Sprache gehört 

– Man kann nicht testen ob zwei kontextfreie Sprachen gleich sind 

Viele wichtige Fragen sind nicht automatisch prüfbar 

• Pumping Lemma 

– Wiederholt man bestimmte Teile genügend großer Wörter einer kontextfreien 

Sprache beliebig oft, so erhält man immer ein Wort der Sprache 

– Konsequenz: viele einfache Sprachen sind nicht kontextfrei 

Für diese sind aufwendigere Mechanismen erforderlich ↦→ TI-2

kontextfrei

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?