Handout - Institut fÃ¼r Theoretische Informatik - Technische ...

Theoretische Informatik 1 

Jürgen Koslowski 

Institut für Theoretische Informatik 

Technische Universität Braunschweig 

WS 2010/2011 

http://www.iti.cs.tu-bs.de/˜koslowj/Theo1 

Jürgen Koslowski (TU-BS) Theoretische Informatik 1 WS 2010/2011 1 / 191

Outline 

Hintergrund und Motivation 

Übersicht: Hintergrund und Motivation I 

1 Hintergrund und Motivation 

Was ist Theoretische Informatik 

Ziele der Vorlesungen “Theoretische Informatik 1+2” 

Vorgehensweise 

Hintergrund: Lösbarkeit 

Hintergrund: Komplexität (TheoInf 2) 


Outline 

Endliche Automaten 

Übersicht: Endliche Automaten I 

2 Endliche Automaten 

Geschichtliches 

erste Beispiele 

Ziel der Modellierung 

Probleme=formale Sprachen 

Endliche Automaten über X und die von ihnen erkannten Sprachen 

Weitere Beispiele 

Erste Automatenkonstruktionen 

Determinismus vs. Nichtdeterminismus 

Das Pumping-Lemma für reguläre Sprachen 

Erste Abschlußeigenschaften regulärer Sprachen 

ε-Übergänge 

Residuierung 

Reguläre Ausdrücke 

Minimierung von DEAs 


Outline 


Übersicht: Endliche Automaten II 

Regularitätsnachweise 

Universelle Automaten 

Kritik am Autmatenbegriff 


Outline 

Kontextfreie Sprachen 

Übersicht: Kontextfreie Sprachen I 

3 Kontextfreie Sprachen 

Idee einer formalen Grammatik 

Kontextfreie Grammatiken und Sprachen 

Kontextfreie und reguläre Sprachen 

Ableitungsbäume 

Das Pumping Lemma für kontextfreie Sprachen 

Abschlußeigenschaften kontextfreier Sprachen 

Normalformen und Anwendungen 

Kellerautomaten 

Deterministisch kontextfreie Sprachen 


Outline 

Mathematischer Hintergrund 

Übersicht: Mathematischer Hintergrund I 

4 mathematischer Hintergrund 

Mengen 

Relationen und Funktionen 

Äquivalenzrelationen 

Tupel als Funktionen 

Abzählbarkeit 



Was ist Theoretische Informatik 


Auf die Frage “Was ist Informatik” liefert z.B. Wikipedia entweder auf 

Deutsch oder auf Englisch die Erkenntnis, daß es sich um 

⊲ mehr handelt als nur das Wissen über Aufbau, Funktionsweise und 

Programmierung von Computern. 

Speziell widmet sich die theoretische Informatik 

⊲ dem formalen mathematischen Unterbau für die Methoden der 

Informatik 

⊲ grundlegenden Fragen der Informationsverarbeitung, unabhängig von 

konkreten Computern 


Hintergrund und Motivation Ziele der Vorlesungen “Theoretische Informatik 1+2” 

Es sollen Werkzeuge und Methoden bereitgestellt werden zur 

Beantwortung folgender Fragen: 

(1) Welche (Klassen von) Probleme(n) kann ein Computer/Algorithmus 

überhaupt lösen 

Hintergrund 

(2) Wie effizient kann ein Computer/Algorithmus die Probleme 

bestimmter Klassen lösen 

Zu diesem Zweck werden wir in “Theoretischer Informatik 1” 

einfache Modelle von Computern betrachten 

die durch sie lösbaren Probleme klassifizieren 

Abschlußeigenschaften der entsprechenden Klassen untersuchen 

Hintergrund 

eine alternative Charakterisierung der Problemklassen kennenlernen 

(mittels Grammatiken) 

bestimmte (Rechen-)Methoden/Algorithmen erlernen 



Vorgehensweise 

Unsere Vorgehensweise wird mathematischer Natur sein: 

Betrachtung abstrakter Modelle von Computern/Algorithmen 

mathematisch präzise Argumentation 

in Hausaufgaben und Klausur: klares Formulieren und vollständiges 

Aufschreiben von Argumenten sind zu üben! 

Zum unverzichtbaren Handwerkszeug gehören: 

Definitionen 

Sätze 

Propositionen 

Lemmata 

Beweise 

Einführung und Namensgebung abstrakter Konzepte; 

Grundlegende Aussagen über die Struktur oder 

Verknüpfungen der Konzepte; 

Interesante Aussagen über die Konzepte; 

Hilfssätze eher technischer Natur; 

Ketten logischer Schlußfolgerungen, um ggf. mit Hilfe 

expliziter Konstruktionen die Gültigkeit von Sätzen/ 

Propositionen/Lemmata nachzuweisen; 

(Detailliertheit gemäß der 

mathematischen Reife der Zielgruppe) endliche Automaten 



Hintergrund: Lösbarkeit 

Diese Frage wurde schon in den 1930’er Jahren von Alan Turing betrachtet 

(vergl. auch folgenden Lebenslauf ), bevor es überhaupt Computer gab. 

Insofern ist die theoretische Informatik die älteste Informatik-Disziplin, 

wenn auch jung im Vergleich zu anderen Wissenschaften. 

Beispiel (Primfaktorzerlegung) 

Gegeben eine positive natürliche Zahl: bestimmen Sie ihre Zerlegung in 

Primfaktoren. (leicht per Computer implementierbar; brute force oder geschicktere Vorgehensweise) 

Beispiel (Halteproblem) 

Gegeben ein Programmtext in Ihrer bevorzugten Programmiersprache und 

eine Eingabe: bestimmen Sie, ob eine Endlosschleife auftritt. 

(nicht per Computer lösbar) 

Return 


Hintergrund und Motivation Hintergrund: Komplexität (TheoInf 2) 

In den 1960’er Jahren begann Stephen Cook, den Unterschied zwischen 

“leichten” und “schweren” per Computer lösbaren Problemen zu 

präzisieren: 

“leicht” in der Praxis existiert ein “effizienter” Lösungsalgorithmus 

“schwer” in der Praxis existiert kein solcher Lösungsalgorithmus 

“effizient” die Laufzeit ist polynomial in der Größe der Eingabe 

Beispiel (leicht) 

Das Sortieren einer Liste von Zahlen. 

Beispiel (schwer) 

Das Optimieren einer Rundreise durch gegebene Städte gemäß Reisekosten 

oder Entfernung oder Zeit; bekannt als “Problem des Handlungsreisenden” 

oder TSP (Travelling Salesman Problem). 

Return 



Geschichtliches 


Die Geschichte des Studiums endlicher Automaten beginnt in den 

1940’er/1950’er Jahren. Ihre Bedeutung und ihr Anwendungsbereich 

haben seither ständig zugenommen, z.B.: 

Schaltungsentwurf 

lexikalische Analyse von Programmtexten im Compiler 

schnelle Textsuche 

automatische Verifikation von Hard- und Software 

Modellierungssprachen 

Als Modell konkreter oder abstrakter “Systeme” verfügen sie über ein 

endliches Gedächtnis (über die Systemvorgeschichte), in Form sogenannter 

Zustände. Zustandsänderungen erfolgen mittels markierter sog. Übergänge 

oder Transitionen, die mit gewissen Labeln versehen sind.. 




Beispiel (Lichtschalter) 

start 

aus 

s 

s 

an 

Systemstart, Anfangszustand 

“guter” oder Endzustand 

”markierter” Übergang; 

Zustandsänderung bei Eingabe s 

Beispiel (Texterkennung des Worts “theo”) 

t h e o 

start t th the theo 




Beispiel (Getränkeautomat: instant Tee/Kaffee für 1€) 

z 

mögliche Aktionen 

1€ zahlen 

start 

e 

S 

e 

t 

k 

Tee-Taste drücken 

Kaffee-Taste drücken 

T 

z 

K 

e 

Becher entnehmen 

t 

1€ 

k 

Münzschlitz nur offen im Startzustand; 

Tasten nur aktiv im Zustand 1€; 

Becher nur vorhanden in Zuständen T und K ; 

Achtung: wir ignorieren die Zeit, etwa beim Prüfen des 1€-Stücks, 

oder beim Befüllen der Becher. 

Kritik 




Was macht einen Automaten aus, informelle Idee: 

Gerichteter Graph mit endlich vielen Zustände; darunter ausgewählte 

Anfangs- und Endzustände; 

die Zustandsübergänge (Kanten) werden durch externe Eingaben 

gesteuert; diese liefern Label/Markierungen; 

die Ausgaben haben die Form ja/nein, je nachdem, ob ein Endzustand 

vorliegt oder nicht. 

die Label-Folgen entlang derjenigen Wege im Graphen, die einen 

Anfangs- mit einem Endzustand verbinden, sind “interessant”. 



Ziel der Modellierung 

Soll das Verhalten des Systems in jedem Zustand und bei jeder 

möglichen Eingabe eindeutig bestimmt sein, führt dies zum Begriff 

des vollständig deterministischen Automaten; 

in der realen Welt sind Systeme nicht-deterministisch, da nicht 

vollständig spezifizierbar (philosophisches Problem); wie funktioniert 

z.B. der Getränkeautomaten in folgenden Fällen 

− Kaffee/Tee verbraucht; 

− falsche Münze eingegeben; 

− Geldspeicher voll; 

− Tastenkontakt verrostet; 

− kosmische Strahlung stört den Schaltkreis zur Geldprüfung; 

− . . . 

Bevor wir die Frage “Was ist ein Automat” genauer erörtern, wollen wir 

uns zunächst den “Labeln” oder “Markierungen” der Kanten zuwenden, 

sowie endlichen Folgen solcher Label. 




Eine naiver (aber in allen Lehrbüchern unkritisch übernommener) Ansatz 

faßt die Markierungen (oder Label) entlang der Übergänge zu einer 

unstrukturierten Menge zusammen: 

Definition (Alphabet, Buchstabe, Wort, Präfix, formale Sprache) 

Eine nichtleere endliche Menge heißt Alphabet, ihre Elemente nennen 

wir Buchstaben. 

Für n ∈ N nennen wir eine Folge w = s 0 s 1 . . . s n−1 von Buchstaben 

s i ∈ X , i < n , ein Wort (über X ) der Länge |w| = n . Im Fall 

n = 0 erhalten wir das leere Wort ε . Die Menge aller Wörter über X 

bezeichnen wir mit X ∗ . 

formal 

⊑ bezeichnet die Präfix-Relation auf X ∗ : 

u ⊑ w gdw ∃v ∈ X ∗ . uv = w 

Unter einer (formalen) Sprache L über X verstehen wir eine 

beliebige Teilmenge von X ∗ . 




Wörter s 0 s 1 . . . s n−1 dienen als Abkürzungen für Tupel 〈s 0 , s 1 , . . . , s n−1 〉 , 

ohne Anfangs-, End- und Trennsymbole. Damit Wörter über X eindeutig 

in Buchstaben aus X zerlegt werden können, vereinbaren wir, daß die 

Buchstaben in X nicht selber als Wörter unterschiedlicher Länge über 

einer anderen Menge Y dargestellt sind . 

Beispiel 

Wähle as X die Menge der Dezimalzahlen von 0 bis 99 . dann liefern die 

Tupel 〈1, 3, 1, 3〉 , 〈1, 3, 13〉 , 〈1, 31, 3〉 , 〈13, 1, 3〉 und 〈13, 13〉 alle 

dasselbe Wort 1313 . 

Bemerkung 

Will man mit Wörtern über X ∗ arbeiten, darf man die Elemente aus X ∗ 

nicht als Wörter über X darstellen, sondern muß Tupel verwenden. Bei 

Wörtern über X n für festes n entfällt diese Einschränkung für die 

Elemente von X n . 




Proposition 

Für jede Menge X trägt die Menge X ∗ aller endlichen Wörter über X 

die algebraische Struktur eines Monoids mit 

assoziativer Multiplikation mittels Konkatenation 

〈s 0 s 1 . . . s n−1 , t 0 t 1 . . . t m−1 〉 ↦→ s 0 s 1 . . . s n−1 t 0 t 1 . . . t m−1 

neutralem Element ε , dem leeren Wort über X . 

Dieses Monoid ist genau dann kommutativ, wenn |X | ≤ 1 gilt. 

Proposition 

P(X ∗ ) trägt neben den Booleschen Operationen Vereinigung ∩ , 

Durchschnitt ∪ , Komplement (−) c und der Inklusions-Ordnung ⊆ auch 

eine von X ∗ induzierte i.A. nicht kommutative Monoid-Struktur, bzgl. der 

die Singleton-Abbildung X ∗ {} 

P(X ∗ ) ein Homomorphismus ist (damit 

ist X ∗ isomorph zu einem Untermonoid). 




Definition 

Jede formale Sprache L ∈ X ∗ 

E-Problem) wie folgt: 

definiert ein Entscheidungsproblem (kurz 

Für jede Eingabe w ∈ X ∗ 

Beispiel (E-Probleme einiger formaler Sprachen) 

ist zu entscheiden, ob w ∈ L gilt. 

(0) {a, b} 2 = {aa, ab, ba, bb} : w ∈ {a, b} ∗ auf |w| = 2 testen. 

(1) { a n b n : n ∈ N } : w ∈ {a, b} ∗ testen, ob |w| gerade und jeder 

Buchstabe der vorderen (hinteren) Häfte ein a ( b ) ist. 

(2) {|} ∗ = { | n : n ∈ N } ∼ = N : trivialer Test. 

(3) { | p : p Primzahl } : n ∈ N auf Primalität testen. 




Später werden wir die Begriffe “E-Problem” und “Sprache” im obigen 

Sinne synonym verwenden. 

In der Realität ist man eher an Berechnungsproblemen (kurz 

B-Problemen) interessiert, etwa der Primfaktorzerlegung von n ∈ N , 

oder einer kosten-optimalen Reiseroute. 

Dennoch kann die Einschränkung auf E-Probleme sinnvoll sein, da 

“schwere” E-Probleme nur von “schweren” B-Problemen herrühren 

können. 

Um z.B. das B-Problem des Handlungsreisenden als Sprache 

betrachten zu können, erweitert man es zunächst mittels einer 

“Kostenschranke” K zu einem E-Problem das fragt: exitiert eine 

Rundreise, deren “Kosten” maximal K betragen 

Außerdem wird es nötig sein, Probleme mit Hilfe geeigneter 

Alphabete zu codieren. 


Endliche Automaten Endliche Automaten über X und die von ihnen erkannten Sprachen 

Formale Definition endlicher Automaten 

Definition 

Ein nicht-deterministischer endlicher Automat (NEA) A = 〈Q, X , δ, I , F 〉 

besteht aus 

einer endlichen Menge Q sogenannter Zustände; 

einem Alphabet X ; 

Relationen δ(a) ⊆ Q × Q für jedes a ∈ X ; 

Teilmengen I , F ⊆ Q von Anfangs- bzw. Endzuständen. 

Der Automat A heißt 

deterministisch (DEA), falls alle Relationen δ(a) partielle Funktionen 

sind und es höchstens einen Anfangszustand q 0 gibt; 

vollständig deterministisch (vDEA), oder kurz vollständig, falls alle 

δ(a) Funktionen sind und es genau einen Anfangszustand q 0 gibt. 

Relation etc. 



Einige Anmerkungen: 

Jeder vDEA ist ein DEA, und jeder solche ist ein NEA. 

Die graphische Darstellung mittels ausgezeichneter Zustände und 

markierter Übergänge haben wir bereits kennengelernt. 

Man kann eine Relation Q r Q als gerichteten Graphen mit 

Knotenmenge Q darstellen, dessen Kanten genau den geordneten 

Paaren aus r entsprechen. Bei gleichzeitiger Betrachtung mehrerer 

Relationen Q δ(a) Q, a ∈ X , unterscheiden wir die entsprechenden 

Pfeilmengen mittels Markierungen a ∈ X an den jeweiligen Pfeilen. 

Man spricht dann von einem markierten Transitionssystem (labeled 

transition system), oder kurz LTS. 

Die Familie von Relationen X δ P(Q × Q) kann equivalent auch als 

einzelne Relation Q × X δ′ Q, oder als Funktion Q × X δ′′ P(Q) 

dargestellt werden. Man findet alle Varianten in der Literatur. 

Teilmengen von Q entsprechen Relationen 1 Q. 

Für w = a 0 a 1 . . . a n−1 setzen wir δ(w) := δ(a 0 ); δ(a 1 ); · · · ; δ(a n−1 ) . 



Welche Bedeutung haben die Wege von Anfangs- zu Endzuständen 

Definition (Spracherkennung durch NEAs) 

A = 〈Q, X , δ, I , F 〉 erkennt das Wort w = s 0 s 1 . . . s n−1 ∈ X ∗ , falls 

1 I Q δ(s 0) 

Q δ(s 1) 

. . . 

δ(s n−1 ) 

Q F op 1 = 1 

1 

1 (⋆) 

Die von A erkannte Sprache L(A) ⊆ X ∗ 

erkannten Wörtern. 

besteht genau aus den von A 

(⋆) bedeutet, daß q ∈ I , p ∈ F und ein Weg der Länge n von q nach p 

mit Kantenlabeln s 0 , s 1 , . . . , s n−1 existiert. 

Für (manche) Informatiker scheint diese Definition zu abstrakt und wenig 

operational zu sein. Betrachten wir zunächst ein Beispiel, und formulieren 

dann denselben Sachverhalt etwas umständlicher: 



Beispiel 

Für einen Automaten A = 〈{q 0 , q 1 , q 2 }, {0, 1}, δ, {q 0 }, {q 2 }〉 können wir 

δ durch Auflisten der Relationen, tabellarisch oder mittels eines Graphen 

mit markierten Kanten angeben (Mehrfachlabel sind zulässig): 

δ(0) = {〈q 0 , q 0 〉, 〈q 1 , q 2 〉, 〈q 2 , q 0 〉} 

δ(1) = {〈q 0 , q 1 〉, 〈q 1 , q 1 〉, 〈q 2 , q 1 〉, 〈q 2 , q 0 〉} 

0 

start 

q 0 

0, 1 

1 

1 

q 2 

q 1 

0 

1 

Zustand 0 1 

q 0 q 0 q 1 

q 1 q 2 q 1 

q 2 q 0 q 0 , q 1 

Zustand 0 1 

q 0 q 0 q 1 I 

q 1 q 2 q 1 

q 2 q 0 q 0 , q 1 F 

I und F lassen sich leicht zusätzlich in der Tabelle markieren. 

Welche Sprache L(A) erkennt der Automat A 

Während z.B. 0110 erkannt wird, gilt das für 0101 nicht. 



Definition (Konfiguration, Folgekonfigration, Berechnung) 

Die Elemente von Q × X ∗ heißen Konfigurationen des NEA A . 

Interpretation: aktueller Zustand und Rest der Eingabe. 

〈q, w〉 ⊢ 〈p, u〉 gdw. ∃a ∈ X . w = au ∧ 〈q, p〉 ∈ δ(a) 

spezifiziert eine Relation ⊢ (Folgekonfiguration) auf Q × X ∗ . 

Falls q ∈ I und 〈q, w〉 ⊢ ∗ 〈p, ε〉 , so existiert eine Berechnung von w . 

Diese ist akzeptierend, sofern p ∈ F gilt. 

⊢ ∗ 

Ist A speziell ein DEA (vDEA), so besitzt jedes Wort w ∈ X ∗ 

(genau) eine Berechnung. 

höchstens 

Satz 

Ist A = 〈Q, X , δ, I , F 〉 ein NEA, so besteht L(A) genau aus denjenigen 

Wörtern w ∈ X ∗ , die eine akzeptierende Berechnung in A besitzen. 



Jeder Berechnungsschritt ⊢ “verbraucht” einen Buchstaben, also hat jede 

Berechnung von w die Länge |w| . 

Beispiel (Fortsetzung) 

0 

Vermutung 

start 

q 0 

0, 1 

L(A) besteht aus allen Binärwörtern 

mit dem Postfix 10 . 

1 

1 

q 2 

q 1 

0 

1 

Begründung 

q 2 ist nur von q 1 aus mit Eingabe 

0 erreichbar. 

q 1 ist nur mit der Eingabe 1 

erreichbar, und zwar von allen drei 

Zuständen aus. 

Jedes Binärwort führt vom 

Anfangszustand aus zu einem der 

drei Zustände, denn man kann 

nicht “steckenbleiben”. 

Kann man dieses Ergebnis auch erhalten, ohne nachzudenken 

Ja, mit Hilfe des Kleene’schen Algorithmus (in Kürze)! 




Beispiel 

Die Menge G ⊆ N aller geraden Zahlen wird akzeptiert von: 

start 

q 0 

| 

| 

q1 

start 

1 

q 0 

0 

q1 

bei Verwendung des 

Alphabets X = {|} 

(unäre Codierung) 

1 

0 

q 2 q 3 

1 

bei Verwendung des 

Alphabets X = {0, 1} 

(binäre Codierung) 

0 

Beispiel (Beweis später) 

Die Menge P ⊆ N aller Primzahlen wird von keinem endlichen Automaten 

akzeptiert, unabhängig von der Codierung. 




Beispiel 

L = { w ∈ {0, 1} ∗ : |w| 0 , |w| 1 gerade } wird von folgendem Automaten 

erkannt: 

start 

q 0 

1 

1 

q1 

0 0 0 0 

1 

q 2 q 3 

1 

Beispiel 

Welche Sprache erkennt dieser Automat 

start 

q 0 

1 

1 

q1 

0 0 0 0 

1 

q 2 q 3 

1 

Offenbar L ′ = { w ∈ {0, 1} ∗ : |w| 0 gerade ∧ |w| 1 ungerade } 




Zustände, die von keinem Anfangszustand aus entlang eines Weges 

erreichbar sind, tragen nichts zur erkannten Sprache eines NEA bei. 

Definition 

Für einen NEA A = 〈Q, X , δ, I , F 〉 sei der erreichbare Automat 

A (r) := 〈Q (r) , X , δ (r) , I , F (r) 〉 gegeben durch 

besteht aus den Zuständen, die von einem Anfangszustand aus 

entlang von Wegen erreichbar sind; 

Q (r) 

δ (r) (a) ist die Einschränkung von δ(a) auf Q (r) , a ∈ X ; 

F (r) := Q (r) ∩ F . 

A heißt erreichbar, wenn A = A (r) 

Proposition 

gilt. 

Jeder NEA A erfüllt (A (r) ) (r) = A (r) sowie L(A) = L(A (r) ) . 




Wie berechnet man den Automaten A (r) 

Algorithmus 

Eingabe: ein NEA A = 〈Q, X , δ, I , F 〉 mit n Zuständen 

Ausgabe: der erreichbare NEA A (r) = 〈Q (r) , X , δ (r) , I , F (r) 〉 

⊲ Lege eine Tabelle an deren Zeilen mit Anfangs- und deren Spalten mit 

Nichtanfangs-Zuständen indiziert sind. 

⊲ Gesucht wird pro Spalte p ein Zeuge w ∈ X ∗ , der einen Weg vom 

Anfangszustand der Zeile nach p beschreibt. 

⊲ Initialisierung: ist Zelle 〈p, q〉 leer und gilt 〈q, p〉 ∈ δ(a) , so wird a 

in die Zelle geschrieben. Ob außerdem noch 〈q, p〉 ∈ δ(b) gilt, ist 

irrelevant. 

⊲ Rekursion: wir testen systematisch Zeugen der Länge < n um noch 

leere Positionen zu füllen. 

Zustände, in deren Spalten kein Zeuge auffindbar ist, werden aus Q 

entfernt und die entsprechenden Zeilen der δ -Tabelle gestrichen. 




Beispiel 

0 

1 

1 

1 

start q 0 

q 1 q 2 q 3 start 

1 

0 

1 

1 0 

1 

1 

1 

0 

0 

1 

start q 4 

q 5 q 6 

q 7 0, 1 

0 

1 

0 

1 

0 0 

0 

0 

1 

1 

0 q 8 q 9 q A q B 1 

1 

0 

0 

0 

Zustand q 1 q 2 q 5 q 6 q 7 q 8 q 9 q A q B 

q 0 1 

q 3 1 10 

q 4 0 0001 000 00 




Definition 

Automaten heißen äquivalent, wenn sie dieselbe Sprache erkennen. 

Definition 

Für einen NEA A = 〈Q, X , δ, I , F 〉 ist der Potenzmengenautomat (PMA) 

P(A) := 〈P(Q), X , ¯δ, {I }, ¯F 〉 gegeben durch: 

¯δ(a) 

U 

P(Q) P(Q), (1 Q) ↦→ (1 Q δ(a) Q), 

U; δ(a) ist das Bild von U unter der Relation δ(a) 

U ∈ ¯F gdw U; F op = 1 (gdw U ∩ F ≠ ∅ ) 

für alle U ⊆ Q und a ∈ X . 

U 

Proposition 

Für jeden NEA A sind P(A) sowie P(A) (r) 

vDEAs. 




Beispiel (Potenzmengenautomat) 

1 

0 

1 

start 

q 0 

0 

start 

q 1 

0 

0, 1 

0 

1 

0 

1 

0 

0 

1 

− 

0 

q 1 

q 0 

q 0 , q 1 start 

q 1 , q 2 

q 0 , q 1 , q 2 

q 0 , q 2 

1 

Einige Berechnungen: 

q 2 

01 : 〈q 0 , 01〉 ⊢ 〈q 1 , 1〉 ⊢ 〈q 2 , ε〉 akzeptiert 

〈q 0 , 01〉 ⊢ 〈q 2 , 1〉 ⊢ 〈q 2 , ε〉 akzeptiert 


010 : hat keine Berechnung 

10 : 〈q 0 , 10〉 ⊢ 〈q 0 , 0〉 ⊢ 〈q 1 , ε〉 akzeptiert nicht 


1 

0 

1 

1 

q 2 

0 1 

Die beiden von {q 0 , q 1 } aus nicht erreichbaren Zustände {q 0 } 

und {q 0 , q 1 , q 2 } können unbesorgt entfernt werden. 

Übrig bleibt der erreichbare Potenzmengenautomat; dort haben 

alle Wörter aus X ∗ genau eine Berechnung: 

〈{q 0 , q 1 }, 01〉 ⊢ 〈{q 1 , q 2 }, 1〉 ⊢ 〈{q 2 }, ε〉 

〈{q 0 , q 1 }, 010〉 ⊢ 〈{q 1 , q 2 }, 10〉 ⊢ 〈{q 2 }, 0〉 ⊢ 〈∅, ε〉 

〈{q 0 , q 1 }, 10〉 ⊢ 〈{q 0 , q 2 }, 0〉 ⊢ 〈{q 1 , q 2 }, ε〉 




Bei wachsender Zustandszahl kann die graphische Darstellung eines 

PMA’n schnell unübersichtlich werden; darüberhinaus gibt es keine 

Standardanordnung der Knoten, und für verschiedene Darstellungen ist es 

schwer zu überprüfen, ob sie denselben Automaten beschreiben. Das 

spricht für die tabellarische Variante: 


1 

start 

q 0 

0 

0 

q 2 

start 

1 

q 1 

Zustand 0 1 

q 0 q 1 , q 2 q 0 I 

q 1 q 1 q 2 I 

q 2 − q 2 F 

1 

0 

Zustand 0 1 

{q 0 , q 1 } {q 1 , q 2 } {q 0 , q 2 } I 

{q 1 , q 2 } {q 1 } {q 2 } F 

{q 0 , q 2 } {q 1 , q 2 } {q 0 , q 2 } F 

{q 1 } {q 1 } {q 2 } 

{q 2 } ∅ {q 2 } F 

∅ ∅ ∅ 

{q 0 } {q 1 , q 2 } {q 0 } 

{q 0 , q 1 , q 2 } {q 1 , q 2 } {q 0 , q 2 } F 

Die Zeilen für die Singleton-Zustände ergeben sich direkt 

aus den Zeilen für den Ausgangsautomaten, die anderen 

entsprechend durch Vereinigung solcher Zeilen. Der Zustand 

∅ kann nicht verlassen werden. 




Algorithmus 

Eingabe: ein NEA A = 〈Q, X , δ, I , F 〉 in Tabellenform 

Ausgabe: Tabelle des erreichbaren PMA P(A) (r) 

⊲ Lege eine Tabelle für einen vDEA über X an. 

⊲ Die erste Zeile ist für den einzigen Anfangszustand I bestimmt. 

⊲ In Zeile R ⊆ Q ergibt sich der Eintrag ¯δ(a)(R) ⊆ Q für a ∈ X 

durch Zusammenfassen der entsprechenden Werte aller Zeilen q ∈ R 

aus der Tabelle für A . 

⊲ Falls ¯δ(a)(R) ⊆ Q noch nicht als Zeilenlabel vorkommt, wird eine 

neue Zeile mit diesem Label eingerichtet; 

⊲ R ist Endzustand von P(A) (r) , sofern mindestens ein Element von R 

Endzustand von A ist. 

Der Algorithmus terminiert nach höchstens |P(Q)| Zeilen. 




Satz 

Jeder NEA ist zu seinem (erreichbaren) PMA äquivalent. 

Beweisidee. 

Eine P(A)-Berechnung 〈I , w〉 ⊢ 〈R 1 , a 1 . . . a n−1 〉 ⊢ · · · ⊢ 〈R n , ε〉 hat als 

Zustände genau die komponierten Relationen gemäß 

1 

I 

Q δ(a 0) 

Q δ(a 1) 

· · · 

δ(a n−1 ) 

Q 

R n schneidet F nichtleer gdw (1 

R n Q 

F op 1) = (1 

1 

1). 

Folgerung 

Zu jedem NEA existiert ein äquivalenter vDEA. 

Definition 

Sprachen, die von einem NEA (DEA, vDEA) erkannt werden konnen, 

heißen regulär, oder alternativ, vom Typ 3. 




Für die Implementation ist das potentiell exponentielle Wachstum der 

Zustandsanzahl von P(A) (r) gegenüber A ein Nachteil: 

Beispiel (für exponentielles Zustandswachstum) 

0, 1 

A n : 1 0, 1 0, 1 0, 1 

start q 0 q1 q 2 . . . q n 

(für n > 0 ) 

erkennt offenbar die Sprache L n 

von rechts eine 1 steht, formal: 

aller Binärwörter, bei denen in Position n 

L n = L(A n ) = { w : ∃u, v ∈ {0, 1} ∗ . w = u1v ∧ |v| = n − 1 } 

Lemma 

Ein vDEA A mit L(A) = L(A n ) hat mindestens 2 n 

Zustände. 

Beweis. 

Betrachte die Berechnungs-Endpunkte aller Wörter w ∈ X n . 




DEAs lassen sich einfacher in äquivalente vDEAs umwandeln: 

Definition 

Für einen DEA A = 〈Q, X , δ, I , F 〉 erweitern wir die (potentiell) partiellen 

I 

Funktionen 1 Q und Q δ(a) Q zu totalen Funktionen indem wir Q 

um einen neuen Zustand ⊥ vergrößern. Das liefert einen vDEA 

A ⊥ := 〈Q + {⊥}, X , δ ⊥ , I ⊥ , F 〉 mit 

{ 

{ 

⊥ falls δ(a)(q) undef. I falls I ≠ ∅ 

δ ⊥ (a)(q) = 

I ⊥ = 

δ(a)(q) sonst 

{⊥} sonst 

δ ⊥ (a) ist strikt in dem Sinne, daß δ ⊥ (a)(⊥) = ⊥ gilt. 

Im Falle eines vDEA A ist der neue Zustand ⊥ in A ⊥ isoliert, 

insbesondere also unerreichbar. Somit gilt (A ⊥ ) (r) = A (r) . 

Proposition 

Jeder DEA A ist zu A ⊥ 

äquivalent. 




Beispiel 

Die Sprache aller Binärwörter mit Präfix 010 und Postfix 1 , formal 

L = { w ∈ {0, 1} ∗ : ∃u ∈ {0, 1} ∗ . w = 010u1 } , wird von folgendem 

weniger übersichtlichen übersichtlichen aber nicht vDEA vollständigen erkannt: DEA erkannt: 

0 start q 0 q1 

1 

q 2 

0 

q 3 

1 

q 4 

0 

1 

⊥ 

0 

1 

0, 1 

0 1 

informelle Terminologie 

Ein Zustand q eines vDEA, der δ(a)(q) = q für alle a ∈ X erfüllt und 

kein Endzustand ist, wird gelegentlich Papierkorb-Zustand , oder schwarzes Loch , 

oder Hotel California Zustand (HCZ) genannt. 




Existieren nicht-reguläre Sprachen 

Bevor wir uns den Abschlußeigenschaften der Klasse der regulären 

Sprachen zuwenden, wollen wir untersuchen, ob überhaupt Sprachen 

existieren, die nicht regulär sind. Sollte dies nicht der Falls sein, könnten 

wir uns die Untersuchung der Abschlußeigenschaften sparen. Idee: 

Wir suchen eine Eigenschaft, die alle regulären Sprachen haben 

müssen. 

Jede Sprache, die diese Eigenschaft nicht hat, kann folglich nicht 

regulär sein. (In logischer Terminologie ist dies die Kontraposition 

der vorigen Aussage.) 

Dieser Ansatz dient dazu, Regularität zu widerlegen. 




Satz (Das Pumping-Lemma für reguläre Sprachen, PL(reg)) 

Zu jeder regulären Sprache L ⊆ X ∗ existiert eine Zahl n L > 0 , so daß 

jedes Wort w ∈ L mit |w| ≥ n L eine Zerlegung w = xyz mit 

x, y, z ∈ X ∗ besitzt, die folgende Bedingungen erfüllt: 

(0) y ≠ ε ; (1) |xy| ≤ n L ; (2) ∀k ∈ N. w k := xy k z ∈ L . 

Beweis. 

Wähle einen vDEA A mit L(A) = L . Setze n L := |Q| . Für w ∈ L mit 

|w| ≥ n L sei p ∈ Q der erste Zustand, der mehrfach bei der Berechnung 

von w vorkommt, und x bzw. xy die Präfixe von w bis zum ersten 

bzw. zweiten Auftreten von p , und z das Postfix mit w = xyz . 

〈q 0 , w k 〉 ⊢ ∗ 〈p, y k z〉 ⊢ ∗ 〈p, z〉 ⊢ ∗ 〈q, ε〉 

ist dann für jedes k ∈ N akzeptierend, da w = w 1 ∈ L . 




Beispiel 

Die Sprache L = { a i b i : i ∈ N } ⊆ {a, b} ∗ 

ist nicht regulär: 

Für n > 0 betrachte w := a n b n = xyz mit y ≠ ε und |xy| ≤ n .Wegen 

|y| b = 0 folgt |xy 2 z| a > |xy 2 z| b und somit xy 2 z /∈ L . Da n generisch 

war, ist L nicht regulär. 

Beispiel 

Die Menge P ⊆ N ∼ = {|} ∗ 

aller Primzahlen ist nicht regulär: 

Für n > 0 betrachte die nächstgrößere Primzahl p und das Wort 

w := | p = | a | b | c = | a+b+c mit b > 0 und a + b ≤ n . 

Für k ∈ N setze w k = | a | kb | c = | a+kb+c . Speziell für k = a + c ist der 

Exponent a + kb + c = (a + c)(1 + b) keine Primzahl, also gilt w k /∈ P . 

Da n generisch war, ist P nicht regulär. 




Die Widerlegung der Regularität einer konkreten Sprache L ⊆ X ∗ mittels 

des PL folgt immer demselben 

Schema 

Man überprüft eine generische Zahl n > 0 auf Ihre Eignung als Konstante 

n L aus dem Pumping Lemma und verwirft sie: 

(0) wähle ein spezifisches Wort w ∈ L mit |w| ≥ n ; 

typischerweise wird w vom Wert n als Parameter abhängen; 

(1) betrachte eine generische Zerlegung w = xyz mit y ≠ ε und 

|xy| ≤ n ; dies sind ihre einzigen bekannten Eigenschaften; 

(2) optional: beschreibe das allgemeine Wort w k = xy k z , k ∈ N ; 

(3) finde einen spezifischen Wert k 0 ∈ N mit w k0 /∈ L . 

Da n generisch war, entfällt jedes n > 0 als Kandidat für n L , also kann 

L nicht regulär sein. 

Die wesentliche Arbeit besteht in der geschickten Wahl von w ∈ L (0) 

und in der Bestimmung von k 0 (3). 





Satz 

Endliche Vereinigungen regulärer Sprachen sind regulär. 

Beweis. 

Als leere Vereinigung wird ∅ ⊆ X ∗ vom leeren Automaten erkannt 

(natürlich auch von vielen anderen Automaten). 

Sind L i ⊆ Xi ∗ regulär mit L(A i ) = L i für Automaten 

A i = 〈Q i , X i , δ i , I i , F i 〉 , i < 2 , definiere deren disjunkte Vereinigung 

A 0 + A 1 = 〈Q 0 + Q 1 , X 0 ∪ X 1 , δ 0 + δ 1 , I 0 + I 1 , F 0 + F 1 〉 

wobei (δ 0 + δ 1 )(a) := δ 0 (a) + δ 1 (a) . Je nachdem, ob die Berechnung in in 

I 0 oder in I 1 beginnt, werden Wörter in L 0 bzw. L 1 erkannt, woraus 

L(A 0 + A 1 ) = L 0 ∪ L 1 folgt. 

Achtung: A 0 + A 1 

ist i.A. nicht deterministisch! 




Satz 

Komplemente regulärer Sprachen sind regulär. 

Beweis. 

Ist L ⊆ X ∗ regulär, wähle einen vDEA A = 〈Q, X , δ, I , F 〉 mit L(A) = L . 

Da jedes Wort genau eine Berechnung hat, akzeptiert der Automat 

A ′ = 〈Q, X , δ, I , Q \ F 〉 das Komplement ¯L := X ∗ − L von L . 

Folgerung 

Endliche Durchschnitte regulärer Sprachen sind regulär. 

Beweis. 

Endliche Durchschnitte sind Komplemente endlicher Vereinigungen 

(Stichwort: de Morgan’sche Regeln. 




Satz 

Jede endliche Sprache ist regulär. 

Beweis. 

Jede endliche Sprache ist endliche Vereinigung von Singleton- Sprachen, 

damit genügt es, diese als regulär nachzuweisen. 

Für w = s o s 1 . . . s n−1 ∈ X ∗ benötigen wir n + 1 Zustände, die wir mit 

den Präfixen von w codieren, und n Übergänge: 

s 0 s 1 s 2 s n−2 s n−1 

start ε 

s 0 s 0 s 1 . . . s 0 . . . s n−2 w 

Der einzige Weg vom Start- zum Endzustand erkennt w . 




Definition 

Die Spiegeloperation X ∗ 

sp 

X ∗ ist rekursiv definiert: 

sp(ε) := ε und sp(aw) := sp(w)a für a ∈ X und w ∈ X ∗ 

Für L ⊆ X ∗ heißt sp[L] = { sp(w) : w ∈ L } Spiegelbild von L . 

Ein Palindrom über X ist ein Wort w ∈ X ∗ 

mit 

w = sp(w) 

Offenbar ist die Spiegeloperation selbst-invers, sowohl für Wörter wie auch 

für Sprachen, d.h., für w ∈ X ∗ und L ⊆ X ∗ gilt 

sp(sp(w)) = w und sp[sp[L]] = L 




Satz 

Spiegelbilder regulärer Sprachen sind regulär. 

Beweis. 

Ist L ⊆ X ∗ regulär, wähle einen NEA A = 〈Q, X , δ, I , F 〉 mit L(A) = L . 

Der duale Automat A op = 〈Q, X , δ op , F , I 〉 entsteht durch Vertauschen 

der Anfangs- und Endzustandsmengen sowie durch Umkehrung der 

Übergänge 

δ op (a) := (δ(a)) op 

(Akzeptierende) A-Berechungen von w ∈ X ∗ entsprechen nun bijektiv 

(akzeptierenden) A op -Berechnungen von sp(w) . 

Achtung: Um A op als NEA auffassen zu können, bedarf es einer 

selbst-dualen Definition eines NEA; speziell müssen Mengen von 

Anfangszuständen anstelle einzelner Anfangszustände erlaubt sein! 




Was passiert, wenn man das Alphabet ändert 

Satz 

Homomorphe Urbilder regulärer Sprachen sind regulär. Genauer: für einen 

Monoid-Homomorphismus X ∗ h 

Y ∗ , d.h., 

ist mit R ⊆ Y ∗ 

Beweis. 

(0) h(ε) = ε ; (1) h(uv) = h(u)h(v) für u, v ∈ X ∗ 

auch das Urbild h −1 [R] = { w ∈ X ∗ : h(w) ∈ R } regulär. 

Wähle einen vDEA A = 〈Q, Y , δ, {q 0 }, F 〉 mit L(A) = R und definiere 

X δ′ P(Q × Q) durch 

δ ′ (a) := δ(b 0 ); δ(b 1 ); · · · ; δ(b n−1 ) für h(a) = b 0 b 1 . . . b n−1 ∈ Y ∗ 

Dann ist 〈Q, X , δ ′ , {q 0 }, F 〉 ein vDEA, der h −1 [R] akzeptiert. 

Der Beweis für homomorphe Bilder kann später leichter geführt werden. 


ε-Übergänge 


ε - Übergänge 

Weitere Fragen nach der Abgeschlossenheit der Klasse der regulären 

Sprachen betreffen die Monoid-Strukturen einerseits auf den Mengen der 

Sprachen, andererseits auf den Mengen der Wörter; genauer: 

Abgeschlossenheit unter Konkatenation von Sprachen 

L · M := { uv : u ∈ L ∧ v ∈ M } für L, M ⊆ X ∗ 

Formen die regulären Sprachen über X ein Untermonoid von 

〈P(X ∗ ), ·, {ε}〉 

Abgeschlossenheit unter homomorphen Bildern, d.h., wohin bilden 

Homomorphismen X ∗ h 

Y ∗ , d.h., Abbildungen, die mit der 

Monoid-Stuktur verträglich sind, reguläre Sprachen über X ab 

(Wie gerade gesehen, erhalten Urbilder Regularität.) 

Zumindest die erste Fragen läßt sich beantworten, wenn wir neben den 

Buchstaben aus X ein weiteres Kantenlabel zulassen. 




Die naive Lösung des Konkatenationsproblems ist klar: um L · M 

akzeptieren zu können, wählt man Automaten A bzw. B mit L(A) = L 

und L(B) = M . Dann verbindet man alle Endzustände in A mit allen 

Anfangszuständen in B . 

Problem: Welche Label sollen diese neuen Übergänge haben Bei 

Berechnungen dürfen hier keine Eingabesymbole verbraucht werden. 

Versuch der Lösung: Die Labelmenge um das leere Wort ergänzen, also 

X 0 + X 1 = {ε} + X =: X ε zulassen. 

Problem 0: Kann man diese neuen Label später wieder eliminieren 

Problem 1: Was ist nun der korrekte Determinismus-Begriff 




Definition 

Ein nicht-deterministischer endlicher Automat mit ε-Übergängen (εNEA) 

A = 〈Q, X ε , δ, I , F 〉 besteht aus 

einer endlichen Zustandsmenge Q ; 

einem Alphabet X ; 

Relationen δ(a) ⊆ Q × Q für jedes a ∈ X ε ; 

Teilmengen I , F ⊆ Q von Anfangs- bzw. Endzuständen. 

Der Automat A heißt deterministisch (εDEA), falls 

es höchstens einen Anfangszustand q 0 gibt; 

die Relationen δ(a) , a ∈ X ε , partielle Funktionen sind; 

D(δ(ε)) ∩ D(δ(a)) = ∅ für alle a ∈ X ; 

F ; δ(ε) ⊆ F . 

Übergänge mit Label ε heißen auch spontane Übergänge. 





Jeder NEA ist ein εNEA, mit δ(ε) = ∅ . 

Manche Authoren führen ein separates Label ≠ ε für spontane 

Übergänge ein; bisher sehe ich darin keinen Vorteil. 

Es gibt keine vollständigen εDEAs: fordert man Funktionen δ(a) für 

a ∈ X ε , so hat man in jedem Zustand die Option, den nächsten 

Buchstaben zu verarbeiten oder stattdessen einen ε-Übergang zu 

vollziehen. Genau dies verhindert aber die Bedingung 

D(δ(ε)) ∩ D(δ(a)) = ∅ für alle a ∈ X . Also schließen sich die 

Existenz spontaner Übergänge und die Existenz einer Funktion δ(a) 

im deterministischen Fall aus. 

Im deterministischen Fall soll die Forderung F ; δ(ε) ⊆ F Übergänge 

in Nicht-Endzustände verhindern, nachdem ein Wort bereits 

akzeptiert wurde. Damit können akzeptierende Berechnungen ihren 

Status nicht mehr ändern. ε-Übergänge von Nicht-Endzuständen in 

Endzustände sind nicht verboten. 




Wie funktioniert die Spracherkennung bei εNEAs, wie sind die Begriffe der 

Konfiguration und der Berechnung anzupassen 

Es ist nicht auszuschließen, daß mehrere (= endlich viele) spontane 

Übergänge hintereinander stattfinden; der Effekt solcher Verknüpfungen ist 

von “einfachen” spontanen Übergängen nicht zu unterscheiden (denn 

unsere idealisierten Übergänge erfolgen instantan, d.h., ohne zeitliche 

Ausdehnung). 

Daher bietet es sich an, die Relation δ(ε) unter Komposition 

abzuschließen, d.h., ihre reflexive transitive Hülle zu betrachten: 

δ ∗ (ε) = ⋃ { δ n (ε) : n ∈ N } 

wobei δ n (ε) die n-fache Komposition der Relation Q δ(ε) Q mit sich 

bezeichnet. Anschauliche Interpretation: δ ∗ (ε) beschreibt die 

Erreichbarkeit mittels ε-Übergängen. 




Definition (Spracherkennung durch εNEAs) 

A = 〈Q, X ε , δ, I , F 〉 erkennt w = s 0 s 1 . . . s n−1 ∈ X ∗ , falls 

1 

I 

Q 

δ ∗ (ε) 

Q 

δ(s 0 ) 

Q 

δ ∗ (ε) 

Q 

δ(s 1 ) 

Q 

. . . 

Q 

δ(s n−1 ) 

Q 

δ ∗ (ε) 

Q 

F op 

1 

mit der Relation 1 

1 

1 übereinstimmt. 

D. h.: es existiert ein Weg der Länge ≥ |w| von einem Anfangs- zu einem 

Endzustand, entlang dessen die Label s 0 , s 1 , . . . s n−1 in dieser 

Reihenfolge auftreten, und sonst höchstens noch ε . 

Die Begriffe der Konfiguration, der Berechnung und der Akzeptanz bleiben 

unverändert, einzig den Begriff der Folgekonfiguration müssen wir an die 

erweiterte Labelmenge anpassen: 

〈q, w〉 ⊢ 〈p, u〉 gdw. ∃a ∈ X ε . w = au ∧ 〈q, p〉 ∈ δ(a) 




Eine Berechnung von w ∈ X ∗ mittels eines NEA muß genau |w| Schritte 

haben, im Falle eines εNEA kann sie auch länger ausfallen. 

Zwar kommt δ ∗ (ε) nicht explizit in der Definition der Folgekonfiguration 

vor, aber dieser Aspekt steckt bereits im Begriff der Berechnung 

〈q, w〉 ⊢ ∗ 〈p, ε〉 (wie schon für NEAs). 

Dagegen zeigt der obige Begriff der Spracherkennung, wie ε-Übergänge 

eliminiert werden könnten: per Absorbtion durch die “normalen” 

Übergänge. Dafür gibt es mindestens drei Möglichkeiten: 

δ L (s 0 ) δ L (s 1 ) (F L ) op 

1 

Q 

I I L δ(s 0 ) 

I B 

δ ∗ (ε) 

Q 

δ B (s 0 ) δ B (s 1 ) 

Q 

δ ∗ (ε) 

Q 

δ(s 1 ) 

Q 

. . . 

Q 

δ(s n−1 ) 

Q 

δ ∗ (ε) 

δ B (s n−1 ) 

F B 

Q 

F op 

(F R ) op 

1 

I R δ R (s 0 ) δ R (s n−1 ) 

von links, rechts oder, wegen δ ∗ (ε); δ ∗ (ε) = δ ∗ (ε) , beidseitig. 




Proposition ( ε-Elimination) 

Für jeden εNEA A = 〈Q, X ε , δ, I , F 〉 ist A @ = 〈Q, X , δ @ , I @ , F @ 〉 , 

@ ∈ {L,R,B} , ein äquivalenter NEA mit 

δ L (a) := δ ∗ (ε); δ(a) 

δ R (a) := δ(a); δ ∗ (ε) 

δ B (a) := δ ∗ (ε); δ(a); δ ∗ (ε) 

(a ∈ X ) 

I L := I 

I R := I ; δ ∗ (ε) 

I B := I ; δ ∗ (ε) 

F L := F ; δ ∗ (ε) op 

F R := F 

F B := F ; δ ∗ (ε) op 

Offenbar gilt ( A R) op = (A op ) L sowie A B = ( A L+ε)R = ( A R+ε)L . 

Proposition 

Für einen deterministischen εNEA A ist A L 

ein DEA. 

Beweis. 

D(δ(ε)) ∩ D(δ(a)) = ∅ garantiert, daß δ ∗ (ε); δ(a) eine partielle Funktion 

bleibt, und I L = I ist ohnehin ein Singleton. 




Beispiel 

A : 

start 

q 0 

ε 

0 

q 2 

ε 

q1 

Zustand ε 0 1 

q 0 q 2 q 1 − I 

q 1 − − q 2 F 

q 2 q 1 − − 

Die ε - Erreichbarkeits-Relation δ ∗ (ε) bestimmt man 

rekursiv mit einer Binärmatrix, die mit δ(ε) sowie 

∆ Q initialisiert wird: 

q 0 q 1 q 2 

q 0 1 1 1 

q 1 1 

q 2 1 1 

Die Bearbeitung erfolgt zeilenweise: Für jede Eins in 

Position 〈i, j〉 , i ≠ j , wird Zeile i durch ihre 

komponentenweise Disjunktion ( ∨ ) mit Zeile j 

ersetzt, bis keine neuen Einsen auftreten. 

1 

Die Tabelle für A L enthält eine Hilfs-Spalte für die 

ε - Erreichbarkeit. Analog zur PMA-Konstruktion werden die 

Elemente der entsprechenden Menge in die Spalten für 

a ∈ X eingetragen. 

Zustand ε ∗ 0 1 

q 0 q 0 , q 1 , q 2 q 1 q 2 I , F 

q 1 q 1 − q 2 F 

q 2 q 1 , q 2 − q 2 F 

q i ist genau dann Endzustand in A L , wenn von q i aus ein 

Endzustand von A erreichber ist. 

A L : 

start 

Die Übergänge der Automaten A R und A B sind etwas 

umständlicher zu berechnen, da in beiden Fällen die 

ε - Nachfolger der Zielzustände aus A zu betrachten sind. 

Daß A L 

q 0 

1 

0 

q 2 

deterministisch ist, ist hier Zufall! 

1 

q1 

1 





start 

q 0 

0 

q1 

start 

q 0 

0 

q1 

A : 

ε 

q 2 

ε 

1 

A L : 

1 

q 2 

1 

1 

A R : 

start 

start q 0 

0 

q 1 

start q 2 

1 

1 

A B : 

start 

0, 1 

start q 0 

q 1 

start q 2 1 

1 

1 1 

1 

Man beachte, daß A R und A B nicht deterministisch sind, schon allein da 

sie mehr als einen Anfangszustand haben. 

Es gibt weitere zu A äquivalente NEAs mit den nicht-spontanen 

Übergängen aus A , die untersuchen wir aber nicht. 




Algorithmus 

Eingabe: ein εNEA A = 〈Q, X ε , δ, I , F 〉 in Tabellenform 

Zwischenergebnis: Matrix der ε-Erreichbarkeits-Relation δ ∗ (ε) 

⊲ Initialisiere eine Q × Q -Matrix mit Einsen in der Diagonale und in 

den durch δ(ε) bestimmten Positionen. 

⊲ Zeilenweise iterativ bis Matrix stabil: für jede 1 in Position 〈q, p〉 

mit q ≠ p wird Zeile p mittels komponentenweiser logischer 

Disjunktion (“oder”) zu Zeile q hinzugefügt. 

⊲ Leere Positionen werden mit Nullen beschrieben. 

Ausgabe: ein äquivalenter NEA A L in Tabellenform δ ∗ (ε) 

⊲ Lege eine Tabelle für einen NEA über X an mit einer Hilfs-Spalte ε ∗ 

für ε-Erreichbarkeit (nach der Zustands-Spalte). 

⊲ 

Übertrage hier die ε-erreichbaren Zustände gemäß obiger Matrix. 

⊲ Restliche Spalten: Vereinigung analog zur PMA-Konstruktion bzgl. 

der Werte in Spalte ε ∗ (nur ohne Mengenklammern). 




Satz 

Konkatenationen regulärer Sprachen sind regulär. 

Beweis. 

Die leere Konkatenation {ε} ist als endliche Sprache regulär. 

Sind L 0 , L 1 ⊆ X ∗ regulär mit L(A i ) = L i für NEAs 

A i = 〈Q i , X , δ i , I i , F i 〉 , i < 2 , definiere deren Konkatenation 

A 0 A 1 = 〈Q 0 + Q 1 , X ε , δ 0 δ 1 , I 0 , F 1 〉 

mit (δ 0 δ 1 )(ε) := F 0 × I 1 und (δ 0 δ 1 )(a) := δ 0 (a) + δ 1 (a) für a ∈ X . 

Akzeptieren 〈q i , u i 〉 ⊢ ∗ 〈p i , ε〉 in A i , i < 2 , so auch 

〈q 0 , u 0 u 1 〉 ⊢ ∗ 〈p 0 , u 1 〉 ⊢ 〈q 1 , u 1 〉 ⊢ ∗ 〈p 1 , ε〉 in A 0 A 1 . Umgekehrt braucht 

jede akzeptierende Berechnung 〈q 0 , w〉 ⊢ ∗ 〈p 1 , ε〉 in A 0 A 1 genau einen 

Übergang 〈p 0 , q 1 〉 ∈ δ(ε) . Dieser zerlegt w als w = u 0 u 1 mit 

akzeptierenden A i -Berechnungen 〈q i , u i 〉 ⊢ ∗ 〈p i , ε〉 . Also gilt 

L 0 L 1 = L(A 0 A 1 ) = L((A 0 A 1 ) L ) . 




Was passiert, wenn wir die Endzustände eines Automaten A mittels 

ε-Übergängen nicht mit den Anfangszuständen eines anderen Automaten, 

sondern mit denen von A selbst verbinden Diese Konstruktion verdient 

einen eigenen Namen: 

Definition (Feedback-Automat) 

Der Feedback-Automat A + = 〈Q, X ε , δ + , I , F 〉 für einen εNEA 

A = 〈Q, X ε , δ, I , F 〉 ist spezifiziert durch 

Satz 

δ + (a) = δ(a) und δ + (ε) := δ(ε) ∪ (F × I ) 

L(A) = L impliziert L(A + ) = L + := ⋃ { L n : n > 0 } . 

Achtung: L n bezeichnet hier die n-fache Konkatenation von L mit sich, 

nicht das n-fache cartesische Produkt! 




Das Konstrukt L + erlaubt keine 0-fache Iteration. 

Definition (Iteration oder Kleene-Stern) 

Der Kleene-Stern P(X ∗ ( ) 

) 

⋆ P(X ∗ ) bildet L ⊆ X ∗ ab auf 

L ⋆ := {ε} ∪ L + = ⋃ { L n : n ∈ N } ⊆ X ∗ 

Bemerkung 

Die Ähnlichkeit der Notationen ( ) ⋆ und ( ) ∗ 

ist ärgerlich! 

Aber die Operatoren beziehen sich auf verschiedene binäre Operationen: 

Konkatenation für ( ) ⋆ bzw. cartesisches Produkt für ( ) ∗ . Man beachte: 

für Sprachen L ⊆ X ⊆ X ∗ gilt L ⋆ = L ∗ . 

Ist X echte Teilmenge von L ⊆ L ⋆ ⊆ X ∗ , so ist X ∗ auch echte 

Teilmenge von L ∗ . 

Von nun an wird ( ) ⋆ für uns wichtiger sein! 




Satz 

Für eine reguläre Sprache L ∈ X ∗ sind L + und L ⋆ regulär. 

Beweis. 

Falls L = L(A) wird L + vom Feedback-Automaten A + akzeptiert. L ⋆ ist 

Vereinigung regulärer Sprachen. 

Rechenregeln 

∅ ⋆ = {ε} und ∅ + = ∅ ; 

L ⊆ L + ⊆ L ⋆ (Extensivität); 

(L ⋆ ) ⋆ = L ⋆ und (L + ) + = L + (Idempotenz); 

L ⊆ M impliziert L + ⊆ M + 

ε ∈ L genau dann wenn L + = L ⋆ ; 

L ⋆ = (L + ) ⋆ = (L ⋆ ) + . 

und L ⋆ ⊆ M ⋆ (Isotonie); 




Um die noch offene Frage nach dem Verhalten regulärer Sprachen unter 

homomorphen Bildern zu beantworden, könnte man das Automatenmodell 

weiter verallgemeinern, indem man alle endlichen Wörter als Label zuläßt. 

Dann ließe sich für einen Homomorphismus X ∗ Y ∗ und einen 

Automaten A = 〈Q, X , δ, I , F 〉 ein entsprechend verallgemeinerter 

Automat h(A) = 〈Q, X ∗ , h(δ), I , F 〉 über Y mit demselben 

unterliegenden Graphen konstruieren, bei dem nur die Label a ∈ X durch 

die Label h(a) ∈ Y ∗ ersetzt werden. 

Anschließend wäre zu untersuchen, wie sich Übergänge mit Labeln der 

Länge > 1 durch Übergänge mit Labeln der Länge 1 ersetzen lassen, was 

nicht schwer ist. 

In dieser Vorlesung wollen wir dies aber vermeiden und unser offenes 

Problem stattdessen im Rahmen des übernächsten Abschnitts über 

“reguläre Ausdrücke” lösen. 

Zuvor wollen wir aber die Grenzen des Pumping Lemmas PL(reg) ausloten. 

h 



Residuierung 

Zwei weitere Operationen sind eng mit der Konkatenation verwandt: 

Definition 

Für Sprachen L, M ⊆ X ∗ 

heißen die folgenden “Brüche” 

M/L := { u ∈ X ∗ : {u}L ⊆ M } , L\M := { v ∈ X ∗ : L{v} ⊆ M } 

Links- bzw. Rechts-Residuierung von M bzgl. L . 

Proposition 

Jede Sprache M ⊆ X ∗ erfüllt M/{ε} = M = {ε}\M . 

Beispiel (mit X = {a, b} ) 

{ a n b n : n ∈ N }/{b 2 } = { a k+2 b k : k ∈ N } 

{ a n b n : n ∈ N }/{b} ∗ = ∅ 

{a 2 , a 3 }\{ w : |w| a > |w| b } = { w : |w| a − 1 > |w| b } 



Residuierung 

Satz 

Residuierung mit beliebigen Sprachen bewahrt Regularität. 

Beweis (für Links-Residuierung) 

Ist M ⊆ X ∗ regulär, wähle einen vDEA A = 〈Q, X , δ, {q 0 }, F 〉 mit 

L(A) = M . Definiere eine neue Endzustandsmenge wie folgt: 

F L := { q ∈ Q : ∀v ∈ L. δ(v)(q) ∈ F } 

Nach Konstruktion erkennt A L := 〈Q, X , δ, {q 0 }, F L 〉 genau die Wörter 

u ∈ X ∗ mit {u}L ⊆ M . D.h. L(A L ) = M/L ist regulär. 

Achtung: die Bestimmung der Menge F L 

ihres Komplements 

kann aufwändiger sein als die 

Q − F L = { q ∈ Q : ∃v ∈ L δ(v)(q) /∈ F } 



Residuierung 

Es gibt nicht-reguläre Sprachen, die die Bedingungen des Pumping 

Lemmas für reguläre Sprachen erfüllen: 

Beispiel 

M = {a, b} ∗ ∪ {c} + { a n b n : n ∈ N} erfüllt die Bedingungen des Pumping 

Lemmas mit n M = 1 : 

w ∈ M mit |w| ≥ 1 zerlegen wir als w = yz mit |y| = 1 . Damit gilt 

y ≠ ε und |xy| ≤ 1 , aber auch w k = y k z ∈ M für jedes k ∈ N , wobei 

einzig der Fall y = c und k = 0 interessant ist. 

Andererseits ist { a n b n : n ∈ N} bekanntlich nicht regulär. Wegen 

{ a n b n : n ∈ N} = ({c} ∗ { a n b n : n ∈ N}) ∩ {a, b} ∗ 

kann also auch M nicht regulär sein. 

= ({c}\M) ∩ {a, b} ∗ 





Ziel Wir wollen alle regulären Sprachen über X aus möglichst einfachen 

Sprachen und nach möglichst einfachen Regeln aufbauen. 

Zur Verfügung stehen neben den Buchstaben aus X 

die nulläre Vereinigung ( ∅ ), 

die binäre Vereinigung ( ∪ ), 

das unäre Komplement ( ( ) c ), 

der nulläre Durchschnitt ( X ⋆ ), 

der binäre Durchschnitt ( ∩ ), 

die nulläre Konkatenation ( {ε} ), 

die binäre Konkatenation ( · ), 

die binären Residuierungen ( / und \ ), 

die unäre Iteration bzw. der Kleen-Stern ( ( ) ⋆ ). 




Wir wählen einen indirekten syntaktischen Ansatz, der uns endliche 

“Baupläne” für alle regulären Sprachen liefern wird. 

Das Alphabet X wird um endlich viele “formale Operations- 

Symbole” einer vorgegebenen “Stelligkeit” (arity) erweitert; 

wir betrachten Bäume, deren innere bzw. äußere Knoten mit 

Operations-Symbolen der entsprechenden Stelligkeit bzw. 0-stelligen 

Konstanten markiert sind; diese Bäume sind aus elementaren Bäumen 

geringer Tiefe zusammengesetzt; 

es gibt mehrere Möglichkeiten, die Bäume zu “linearisieren”; das führt 

zu sog. “regulären Ausdrücken”; 

wir definieren eine Semantik-Abbildung, die Bäumen bzw. regulären 

Ausdrücken reguläre Sprachen zuordnet; reguläre Ausdrücke mit 

derselben Semantik heißen “äquivalent; 

aus einem Automaten A wird sich ein regulärer Ausdruck R(A) mit 

Semantik L(A) extrahieren lassen (Kleene-Algorithmus). 




Außer den Konstanten aus X , die zu 0-stelligen Konstanten werden, 

abstrahieren wir 5 der 10 zur Verfügung stehenden Operationen: 

· + ⋆ ∅ ε a , a ∈ X 

sollen die Operationen Konkatenation, Vereinigung und Kleene-Stern 

symbolisieren, sowie die Konstanten ∅ , {ε} und {a} , a ∈ X 

symbolsieren. Als alternative Bezeichnungen sind auch ⊔ statt + , 0 

statt ∅ , und 1 statt ε verbreitet. 

Die aus diesen Elementarbausteinen konstruierbaren regulären Bäume sind 

zwar sehr übersichtlich, in ihrer 2-dimensionalen Struktur aber nur schlecht 

maschinenlesbar, und ein typographischer Alptraum (damals gab es noch 

kein TikZ/PGF ). 

Also werden wir die Bäume linearisieren, d.h. auf bestimmte Wörter über 

einem Alphabet abbilden, das X + {·, +, ⋆, ∅, ε} enthält. Das kann auf 

mindestens drei verschiedene Weisen geschehen. 




Die binären Operationssymbole · und ⊔ : können als Infix-, Präfix- oder 

Postfix-Opertoren gehandhabt werden: 

Beispiel (Linearisierungen eines regulären Baums) 

a 

· 

+ c 

⋆ 

b 

Infix-Schreibweise (erfordert Klammern): 

((a + (b) ⋆ ) · c) oder kürzer (a + b ⋆ ) · c 

Präfix-Schreibweise: 

· + a ⋆ bc 

Postfix-Schreibweise, oder RPN: 

ab ⋆ +c · 

Definition 

Infix-linearisierte reguläre Bäume heißen reguläre Ausdrücke. 




Die Infix-Schreibweise erscheint uns nur deshalb natürlich, weil wir sie 

von klein auf gewohnt sind. Sie erfordert weiteren syntaktischen 

Ballast in Form von Klammern, und zu dessen Eindämmung 

Vereinbarungen über Operatoren-Präzedenz: 

⋆ bindet stärker als · bindet stärker als + . 

Die Klammern sowie die Operator-Präzedenzen entfallen bei den 

anderen Varianten. 

Bei der Präfix-Schreibweise müssen wir uns für jedes gelesene 

Operatorsymbol (dessen Stellichkeit ist bekannt) die nötigen 

Argumente durch vorausschauendes Lesen beschaffen; dabei kann die 

Auswertung weiterer Teilausdrücke erfoderlich sein. Die Anzahl 

teilausgewerteter Ausdrücke ist unbeschränkt. 

Die Postfix-Schreibweise eliminiert die Nachteile der Präfix- 

Schreibweise mittels eines Stacks; speziell kann jeder Operator zum 

Zeitpunkt seines Auftretens verarbeitet werden, seine Argumente 

stehen bereits auf dem Stack. RPN may the FORTH be with you 




Definition 

Wir definieren die Semantik-Abbildung X -RegEx X -Reg per 

struktureller Induktion über den Aufbau regulärer Ausdrücke: 

regulärer Ausdruck r erzeugte Sprache L(r) 

a 

{a} 

∅ 

∅ 

ε 

{ε} 

r 0 + r 1 L(r 0 ) ∪ L(r 1 ) 

r 0 · r 1 L(r 0 )L(r 1 ) 

r ⋆ 

(L(r)) ⋆ 

(r) 

L(r) 

Reguläre Ausdrücke mit gleicher Semantik heißen äquivalent ( ≈ ). 

Aus Schlampigkeit wird häufig “ = ” anstelle von “ ≈ ” verwendet. 

L 




Satz (Kleene’scher Satz, 1. Hälfte) 

Die Semantik jedes regulären Ausdrucks ist regulär. 

Interessanter ist die umgekehrte Richtung: ist jede reguläre Sprache die 

Semantik eines regulären Ausdrucks 

Beispiel 

Reguläre Ausdrücke mit vorgegebener Semantik über X = {a, b} : 

{ w : w beginnt und endet mit ab } : ab + ab(a + b) ⋆ ab 

{ w : w beginnt oder endet mit ab } : ab(a + b) ⋆ + (a + b) ⋆ ab 

{ w : |w| a ≥ 2 } : (a + b) ⋆ a(a + b) ⋆ a(a + b) ⋆ 

{ w : |w| a mod 2 = |w| b mod 5 = 0 } : 

Ziel ist es nun, jedem Automaten A einen regulären Ausdruck r mit 

L(r) = L(A) zuzuordnen. 




Definition 

Für einen X -Automaten A mit fortlaufend durchnummerierter 

Zustandsmenge Q = { q i : i < n } definieren wir ausgehend von 

L ij := { w ∈ X ⋆ : 〈q i , w〉 ⊢ ⋆ 〈q j , ε〉 } 

für i, j < n 

die Hilfs-Sprachen L k ij ⊆ L ij für k ≤ n , indem wir nur Wörter mit 

mindestens einer Konfigurationsfolge 〈q i , w〉 ⊢ ⋆ 〈q j , ε〉 zulassen, deren 

Zwischenzustände q r der Bedingung r < k a genügen ( q i und q j sind 

von dieser Einschränkung ausgenommen). 

a Starten die Zustandsnummern mit 1 , ist hier r ≤ k zu verlangen! 

Im Falle |Q| = n gilt für k ≥ n offenbar L k ij = L ij . 

Natürlich ändern sich diese Hilfs-Sprachen, wenn man die Zustände anders 

nummeriert. Werden Zustände mit Index < n − 1 entfernt, ist zwingend 

umzunummerieren. 




Proposition 

Für A = 〈{ q i : i < n }, X ⋆ , δ, I , F 〉 genügen die Hilfs-Sprachen L k ij 

i, j, k < n der Rekursion 

= L k ij ∪ L k ( 

ik L 

k 

)⋆ 

kk L 

k a 

kj 

L k+1 

ij 

für 

a Zustandsnummerierung ab 1 liefert hier eine andere Rekursionsformel! 

Beweis. 

“ ⊇ ” Rechts können Zwischenzustände mit Index > k vermieden werden. 

“ ⊆ ” Jedes w ∈ L k+1 

ij 

\ L k ij 

eine (keine) Konfigurationsfolge, deren 

Zwischenzustände q r der Bedingung r ≤ k ( r < k ) genügen. Das erstbzw. 

letztmalige Auftreten von q k in dieser Folge liefert eine Zerlegung 

w = xyz mit x ∈ L k ik , y ∈ ( L k kk)⋆ und z ∈ L 

k 

kj 

. 

Rechenregeln (anwendbar, falls i = k oder j = k ) 

L ∪ MM ⋆ L = M ⋆ L und L ∪ LM ⋆ M = LM ⋆ . 




Satz (Kleene’scher Satz, 2. Hälfte) 

Jede reguläre Sprache ist Semantik eines regulären Ausdrucks. 

Beweis. 

Für jeden εNEA A = 〈{ q i : i < n}, X ε , δ, I , F 〉 gilt 

L(A) = ⋃ { L n ij : q i ∈ I ∧ q j ∈ F } 

Die Rekursionsformel reduziert die Identifikation der Sprachen L k ij 

mit 

k ≤ n als Semantiken regulärer Ausdrücke auf den Fall k = 0 . Aber 

L 0 ij = { a ∈ X ε : 〈q i , q j 〉 ∈ δ(a) } 

ist Semantik eines regulären Ausdrucks, der endliche Summe von 

Symbolen aus X und evtl. ε ist. 




Beispiel 

0 

start 

q 0 

1 

0 

1 0 

q 2 

q 1 

1 

Ausgehend von L(A) = L 3 02 bestimmen wir 

rückwärts die Sprachen L k ij , und dann 

vorwärts möglichst einfache erzeugende 

regulären Ausdrücke: 

ij \ k 0 1 2 3 

00 ε + 0 

01 1 

02 ∅ 

10 ∅ 

0 `L0 0L ⋆0 01 00´⋆L 

1 ∪ L0 0 

00`L0 01 00´⋆L 01 

0 `L0 ∅L 0 02 00´⋆L ∪ L0 0 

00`L0 02 00´⋆L 02 L 1 02 ∪ 1 

0 ⋆ 11 ⋆ 001`L1 11´⋆L 12 

∪ L2 2 

0L ⋆2 0211 `L2 ⋆ 22´⋆ 

0`01 02`L2 ⋆ 22´⋆L 

0 + 10 ⋆ 22 11 ⋆ 0´⋆ 

11 ε + 1 ε L 0 11 + ∪ 1 L0 0 

10`L0 00´⋆L 01 

12 0 0L 0 12 ∪ L0 10`L0 00´⋆L 0 

02 

20 1 

21 0 0 L 0 + 10 ⋆ 21 ∪ L0 0 

20`L0 1 00´⋆L 01 

22 ε εL 0 22 ∪ L0 0 

20`L0 00´⋆L 02 L 1 22 ∪ L1 1 

ε + 01 ⋆ 21`L1 0 + 11´⋆L 

10 ⋆ ⋆ 12 0 




Algorithmus 

Eingabe: ein ∗NEA A = 〈Q, X ∗ , δ, I , F 〉 mit n Zuständen, 

durchnummeriert von 0 bis n − 1 

Ausgabe: ein regulärer Ausdruck r mit L(r) = L(A) 

⊲ Lege eine ij\k -Tabelle an mit i, j < n und k ≤ n . 

⊲ Identifiziere L(A) als Vereinigung geeigneter Sprachen L n ij . 

⊲ Finde mit der Rekursionsformel L k+1 

ij 

= L k ij ∪ Lk ik( 

L 

k 

kk 

)⋆ L 

k 

kj 

alle für 

L(A) benötigten Hilfs-Sprachen und Tabellenfelder. 

⊲ Inspektion von A liefert reguläre Ausdrücke rij 0 mit L(rij 0) 

= L0 ij 

die erste Spalte der Tabelle. 

⊲ Schreibe gemäß der Rekursionsformel für aufsteigendes k reguläre 

Ausdrücke in die relevanten Tabellenfelder, wobei elementare 

Vereinfachungen (s.u.) gleich vorzunehmen sind. 

für 




Folgerung 

Die regulären Sprachen über X bilden den Abschluß der Singleton- 

Sprachen {a} , a ∈ X , unter den Operationen endliche Vereinigung, 

endliche Konkatenation und Kleene-Stern. 

Kleene Algebra 

Rechenregeln für die Äquivalenz regulärer Ausdrücke 

r + s ≈ s + r , r + ∅ ≈ r , r + r ≈ r (elementar) 

r · ε ≈ r , r · ∅ ≈ ∅ (elementar) 

r · (s + t) ≈ r · s + r · t 

(elementar) 

∅ ⋆ ≈ ε , (r ⋆ ) ⋆ ≈ r ⋆ (elementar) 

(r + s) ⋆ ≈ r ⋆ · (s · r ⋆ ) ⋆ ≈ (r ⋆ · s ⋆ ) ⋆ 

(r · s) ⋆ r ≈ r(s · r) ⋆ 

L(r ⋆ ) ⊆ L(s ⋆ ) impliziert r ⋆ · s ⋆ ≈ s ⋆ 

L(r) ⊆ L(s ⋆ ) impliziert (r + s) ⋆ ≈ s ⋆ 




Beispiel (für den Nachweis einer Rechenregel) 

L ( (r · s) ⋆ · r ) = ( L(r)L(s) ) ⋆ L(r) 

= ⋃ { ( 

L(r)L(s) 

) n : n ∈ N 

} 

L(r) 

= ⋃ { ( 

L(r)L(s) 

) nL(r) : n ∈ N 

} 

= ⋃ { 

L(r) 

( 

L(s)L(r) 

) n : n ∈ N 

} 

= L 

( 

r · (s · r) 

⋆ ) 

Beispiel (für den Nachweis einer weiteren Rechenregel) 

Wegen ε ∈ L(r ⋆ ) gilt immer L(r ⋆ s ⋆ ) = L(r ⋆ )L(s ⋆ ) ⊇ L(s ⋆ ) . 

Somit impliziert L(r ⋆ ) ⊆ L(s ⋆ ) die Äquivalenz r ⋆ · s ⋆ ≈ s ⋆ , denn 

L(r ⋆ s ⋆ ) = L(r ⋆ )L(s ⋆ ) ⊆ L(s ⋆ )L(s ⋆ ) = (L(s)) ⋆ (L(s)) ⋆ 

= ⋃ { 

(L(s)) n : n ∈ N } ⋃{ 

(L(s)) k : k ∈ N } 

= ⋃ { 

(L(s)) m : m ∈ N } = L(s ⋆ ) ⊆ L(r ⋆ s ⋆ ) 




Anmerkungen: 

Das Konkatenationssymbol “ · ” wird oft weggelassen. 

Wegen ∅ ⋆ ≈ ε ist der Baustein ε redundant; zur Abkürzung kann 

man auch r + für rr ⋆ ≈ r ⋆ r , oder r für r + ε , oder 

Symbolbereiche wie (a − z) einführen. 

Reguläre Ausdrücke können genauso unübersichtlich sein wie 

Automaten, aber sie sind besser maschinell zu bearbeiten. 

Für reguläre Sprachen, die mittels Durchschnitt, Komplement, 

Residuierung oder Shuffle konstruiert wurden, sind eher komplizierte 

reguläre Ausdrücke zu erwarten. 

Umnummerierung von Q liefert i.A. einen anderen regulären 

Ausdruck für L(A) . Insbesondere gibt es außer in elementaten Fällen 

keine Normalformen für reguläre Ausdrücke, d.h., keine “besten”, 

“kürzesten” oder “einfachsten” Ausdrücke für eine gegebene 

Semantik. 




Satz 

Reguläre Sprachen sind unter homomorphen Bildern abgeschlossen. 

Genauer: für einen Monoid-Homomorphismus X ∗ h 

Y ∗ , d.h., 

(0) h(ε) = ε ; (1) h(uv) = h(u)h(v) für u, v ∈ X ∗ 

ist mit R ⊆ X ∗ auch das Bild h[R] = { h(w) : w ∈ R } ⊆ Y ∗ regulär. 

Beweis. 

˜h ersetzt a ∈ X in r ∈ X -RegEx 

durch h(a) , also ˜h(r) ∈ Y -RegEx . 

h[ ] 

P(X ∗ ) P(Y ∗ ) erhält immer 

Vereinigungen und Singletons (speziell ∅ 

und {ε} ), für einen Homomorphismus h 

zusätzlich Konkatenation und Iteration 

von Sprachen. Also folgt für die Semantik 

X -RegEx 

˜h 

Y -RegEx 

L X 

L Y 

X -Reg Y -Reg 

inc 

inc 

P(X ∗ ) P(Y ∗ ) 

h[ ] 



Minimale vDEAs 


Unsere Haupt-Konstruktionen von vDEAs (erreichbarer PMA) vermeidet 

unerreichbare Zustände, aber können wir auch sicher sein, daß in vDEAs 

die Zustandszahl minimal ist (Effizienz der Implementierung) 

Nein, denn wir können die Zahl der erreichbaren Zustände vergrößern, 

ohne die akzeptierte Sprache zu verändern: 

Beispiel 

1 

start q 0 q1 

1 

0 

0 0 0 0 

0 

1 

q 2 q 3 q 4 

1 

1 

Umgekehrt gilt es festzustellen, ob in einem vDEA evtl. Zustände 

zusammengefaßt werden können, wie q 3 und q 4 im obigen Beispiel. 




Das Mittel der Wahl zur Identifikation gewisser Elemente einer Menge ist 

die Äquivalenzrelation . 

Gesucht ist die größte ÄR ∼ auf Q , bei der die Zusammenfassung 

äquivalenter Zustände die erkannte Sprache nicht verändert. 

Abkürzung für NEAs 

Zur Erinnerung: für w = a 0 a 1 . . . a n−1 setzen wir 

( 

) 

δ(w) := δ(a 0 ); δ(a 1 ) . . . δ(a n−1 ) = δ(a n−1 )◦. . . δ(a 1 )◦δ(a 0 ) für DEAs 

Insbesondere dürfen von q 0 aus erreichbare Zustände p und q nur dann 

äquivalent sein, falls für jedes w ∈ X ∗ gilt 

δ(w)(p) ∈ F gdw. δ(w)(q) ∈ F 

Denn: aus p = δ(u)(q 0 ) ( q = δ(v)(q 0 ) ) und δ(uw)(q 0 ) = δ(w)(p) /∈ F 

( δ(vw)(q 0 ) = δ(w)(q) ∈ F ) folgt uw /∈ L(A) ( vw ∈ L(A) ). Faßt man 

p und q zusammen, wird aber auch uw akzeptiert, Widerspruch. 




Folgende Abbildung induziert einen Kandidaten ∼ für die gesuchte ÄR: 

Q L P(X ∗ ) , q ↦→ { w ∈ X ∗ : δ(w)(q) ∈ F } 

Definition 

Zustände p, q ∈ Q heißen bisimilar ( p ∼ q ), falls L(p) = L(q) . 


1 

start q 0 q1 

1 

0 

0 0 0 

0 

1 

q 2 q 3 q 4 

1 

1 

L(q 0 ) = { w ∈ {0, 1} ∗ : |w| 0 mod 2 = |w| 1 mod 2 = 0 } 

L(q 1 ) = { w ∈ {0, 1} + : |w| 0 mod 2 = |w| 1 mod 2 − 1 = 0 } 

L(q 2 ) = { w ∈ {0, 1} + : |w| 0 mod 2 − 1 = |w| 1 mod 2 = 0 } 

L(q 3 ) = { w ∈ {0, 1} + : |w| 0 mod 2 = |w| 1 mod 2 = 1 } 

L(q 4 ) = { w ∈ {0, 1} + : |w| 0 mod 2 = |w| 1 mod 2 = 1 } 

Einzig q 3 und q 4 sind verschieden und bisimilar. 

Liefert Bisimilarität auch sonst die gewünschte Verkleinerung 




Satz 

Jeder vDEA A = 〈Q, X , δ, {q 0 }, F 〉 ist äquivalent zum Faktorautomaten 

A/∼ = 〈Q/∼ , X , δ ∼ , {[q 0 ] ∼ }, F /∼ 〉 mit 

δ ∼ (a)[q] ∼ := [δ(a)(q)] ∼ 

Ist A erreichbar, sind alle zu A äquivalenten vDEAs mit minimaler 

Zustandszahl zu A/∼ isomorph. 

Beweis der Wohldefiniertheit von δ ∼ (a) , a ∈ X , und von F /∼ 

Zu klären ist, ob aus p ∼ q auch δ(a)(p) ∼ δ(a)(q) folgt, also die 

Definition von δ ∼ (a)[q] ∼ von der Wahl des Repräsentanten der 

Äquivalenklasse unabhängig ist. Aber L(p) = L(q) impliziert für a ∈ X 

L(δ(a)(p)) = {a}\L(p) = {a}\L(q) = L(δ(a)(q)) 

Wegen q ∈ F gdw ε ∈ L(q) ist zudem ∼ auf F beschränkbar. 




Beweis von L(A) = L(A/∼ ) 

Mit obiger Abkürzung, und da es sich um vDEAs handelt, gilt 

L(A) = { w ∈ X ∗ : δ(w)(q 0 ) ∈ F } 

L(A/∼ ) = { w ∈ X ∗ : δ ∼ (w)[q 0 ] ∼ ∈ F /∼ } 

Gemäß Definition von δ ∼ 

sind die Bedingungen aber äquivalent: 

δ ∼ (w)[q 0 ] ∼ = [δ(w)(q 0 )] ∼ ∈ F /∼ gdw δ(w)(q 0 ) ∈ F 

Sofern A erreichbar ist, gilt dies auch für A/∼ . Folglich existiert dann zu 

jedem Zustand [q] ∼ von A/∼ ein Wort w [q] ∈ X ∗ mit 

δ ∼ (w [q] )[q 0 ] ∼ = [q] ∼ 

w [q]∼ heißt Zeuge für die Erreichbarkeit von [q] ∼ . 




Beweis der Minimalität bei erreichbarem A 

Der vDEA B = 〈R, X , σ, {r 0 }, G〉 sei äquivalent zu A . Sind A- Zustände 

p, q ∈ Q nicht bisimilar, existiert o.B.d.A. u ∈ X ∗ mit u ∈ L(p) − L(q) , 

und folglich w [p] u ∈ L(A) = L(B) . Wegen w [q] u /∈ L(A) = L(B) können 

die B -Zustände σ(w [p] )(r 0 ) und σ(w [q] )(r 0 ) nicht übereinstimmen, d.h., 

|Q/∼ | ≤ |R| . Falls |Q/∼ | = |R| , dienen die Wörter w [q] auch in B für 

alle Zustände als Erreichbarkeitszeugen, folglich gilt B ∼ = A/∼ . 

Definition 

Für jeden vDEA A heist A min 

:= A (r) /∼ 

Minimalautomat. 

Proposition 

Für jeden vDEA A stimmt A (r) /∼ mit (A/∼ ) (r) überein. 

Allerdings geht die Berechnung von A (r) /∼ 

schneller. 




Alle Sprachen L(q) , q ∈ Q , zwecks Minimierung von A zu berechnen 

erweist sich als ineffizient. 

Einfacher ist die Bestimmung nicht äquivalenter Zustandspaare, das liefert 

die Nullen in der Binärmatrix für ∼ . Wir verfahren ähnlich wie bei der 

ε-Erreichbarkeits-Relation für εNEAs. 

Algorithmus 

Eingabe: ein (erreichbarer) vDEA A = 〈Q, X , δ, I , F 〉 . 

Ausgabe: Binärmatrix für die ÄR ∼ 

⊲ Aufgrund der Symmetrie kann man sich auf das Dreieck unterhalb der 

Diagonale (aus Einsen) beschränken. 

⊲ Initialisierung der Positionen 〈p, q〉 , q 

eine Komponente ein Endzustand ist 

⊲ Zeilenweise iterativ bis Matrix stabil: 0 in Position 〈p, q〉 , falls 

a ∈ X existiert mit 0 in Position 〈δ(a)(p), δ(a)(q)〉 . 

⊲ Leere Positionen werden mit Einsen beschrieben. 




Die Bisimilarität-Relation ∼ zeigt, welche Identifikationen von Zuständen 

den Minimalautomaten liefern. 

Zumal bei durchnummerierten Zuständen ist es zweckmäßiger, mit 

Repräsentanten statt mit Äquivalenzklassen als neuen Zuständen zu 

arbeiten. 

Algorithmus 

Eingabe: ein vDEA A = 〈Q, X , δ, I , F 〉 samt Bisimilarität ∼ 

Ausgabe: Faktorautomat bzgl. ∼ 

⊲ Auswahl eines (canonischen) Representanten aus jeder ÄK. 

⊲ Tabelle: Streichen aller Zeilen von Nicht-Repräsentanten; dann 

Ersetzen aller Zielzustände durch ihre Repräsentanten. 

⊲ Graph: Ersetzen aller Knotennamen durch die Namen der 

entsprechenden Repräsentanten; dann Zusammenfassen aller Knoten 

mit demselben Namen. 




Beispiel 

a 

A: (r) min : : 

b 

start 

b a, bb 

q 7 q 1 q 0 

a 

q 2 

q 3 q 6 q 5 q 4 

b 

b 

b 

a, b a 

a 

a 

a 

b 

a 

Zur Berechnung von A (r) : 

A (r) 

min a b 

q 0 q 21 

q 1 

I 

q 1 q 5 q 1 

q 2 q 5 q 2 

q 3 q 3 q 3 F 

q 4 q 2 q 5 F 

q 5 q 0 q 6 

q 6 q 6 q 3 

q 7 q 3 q 1 

Zustand q 0 q 1 q 2 q 3 q 4 q 5 q 6 q 7 

Zeuge ε b a babb − ba bab − 

Zur Berechnung von A min : 

q 0 1 

q 1 0 7 1 

q 2 0 8 1 1 

q 3 0 0 0 1 

q 5 0 4 0 5 0 6 0 1 

q 6 0 0 0 1 0 2 0 0 3 1 

q 0 q 1 q 2 q 3 q 5 q 6 

Ein trennender X - Buchstabe genügt für einen 0 - Eintrag. 

0. δ(b)(q 0 ) = q 1 ≁ q 3 = δ(b)(q 6 ) 

1. δ(b)(q 1 ) = q 1 ≁ q 3 = δ(b)(q 6 ) 

2. δ(b)(q 2 ) = q 2 ≁ q 3 = δ(b)(q 6 ) 

3. δ(b)(q 5 ) = q 6 ≁ q 3 = δ(b)(q 6 ) 

4. δ(b)(q 0 ) = q 1 ≁ q 6 = δ(b)(q 5 ) 

5. δ(a)(q 1 ) = q 5 ≁ q 0 = δ(a)(q 5 ) 

6. δ(b)(q 2 ) = q 5 ≁ q 6 = δ(b)(q 5 ) 

7. δ(a)(q 0 ) = q 2 ≁ q 5 = δ(a)(q 1 ) 

8. δ(b)(q 0 ) = q 1 ≁ q 5 = δ(b)(q 2 ) 




Wie steht es mit der Minimierung von DEAs 

Jeder DEA A ist äquivalent zu A ⊥ , (A ⊥ ) (r) und (A ⊥ ) min 

; diese 

vDEAs haben höchstens einen Zustand mehr als A . 

Besitzt ein erreichbarer vDEA B einen HCZ ⊥ , so kann dessen 

Aquivalenzklasse [⊥] ∼ kein Endzustand von B/∼ sein und muß 

δ ∼ (a)[⊥] ∼ = [⊥] ∼ für jedes a ∈ X erfüllen, ist also wieder ein HCZ. 

Damit vererbt sich ein HCZ von (A ⊥ ) (r) auf (A ⊥ ) min 

. Entfernt man 

diesen, bleibt ein äquivalenter DEA übrig. 

Also stimmt der minimale DEA für A entweder mit dem 

Minimalautomaten für A ⊥ überein, oder hat einen Zustand weniger 

als dieser. 

Bisimilarität ist auch für NEAs und εNEAs ein sinnvoller Begriff, aber die 

entsprechende Relataion ist ungleich schwerer zu berechnen. 

Wir werden dieses Thema hier nicht weiterverfolgen. 





Methoden zum Regularitätsnachweis: 

Konstruktion von Automaten (εNEA, NEA, (v)DEA); 

Konstruktion aus einfacheren regulären Sprachen gemäß der 

Abschlußeigenschaften; 

Spezialfall: Einschränkung auf einelementige Sprachen aus 

einbuchstabigen Wörtern, endliche Vereinigungen und 

Konkatenationen, sowie Kleene- Stern (reguläre Ausdrücke); 

Kombination der obigen Methoden. 

Das Arsenal zur Widerlegung der Regularität ist kleiner: 

Anwendung des Pumping Lemmas für reguläre Sprachen 

(Kontraposition); 

Konstruktion aus einfacheren Sprachen gemäß der Abschlußeigenschaften 

für reguläre Sprachen und Nachweis, daß mindestens 

eine dieser einfacheren Sprachen nicht regulär ist. 




Beispiel 

L sei die Menge aller Wörter über X = {0, 1, 2, . . . , 9} , die eine durch 6 

teilbare Dezimalzahl darstellen, ohne führende Nullen. 

Wir stellen L als Durchschnitt von drei regulären Sprachen dar: 

L 0 = L(0 + (1 − 9)(0 − 9) ⋆ ) , keine führenden Nullen; 

L 1 = L((0 − 9) ⋆ (0 + 2 + 4 + 6 + 8)) gerade Zahlen; 

L 2 bestehe aus den Darstellungen durch 3 teilbarer Zahlen, d.h., aus 

Wörtern mit durch 3 teilbarer Quersumme. 

Wegen L 0 brauchen wir uns in L 1 und L 2 um führende Nullen nicht 

mehr zu kümmern. Nach Konstruktion gilt nun 

L = L 0 ∩ L 1 ∩ L 2 

Sowohl L 0 als auch L 1 sind als Semantiken regulärer Ausdrücke regulär. 

Nachzuweisen bleibt die Regularität von L 2 . 





Zu diesem Zweck konstruieren wir einen Automaten A 2 mit L(A 2 ) = L 2 : 

Design-Idee: Zustand i < 3 representiert den Rest modulo 3 der Summe 

der bisher verarbeiteten Ziffern. Die Übergänge erfüllen 

〈i, j〉 ∈ δ(a) gdw (i + a) mod 3 = j (∗) 

A 2 : 

start 

0 

x 

y 

y 

z 

z 

z 

1 

2 

y 

x 

x 

mit 

x ∈ {0, 3, 6, 9} 

y ∈ {1, 4, 7} 

z ∈ {2, 5, 8} 

“ L(A 2 ) ⊆ L 2 ”: Da 0 einziger Endzustand ist, ist die Quersumme jedes 

erkannten Worts durch 3 teilbar. 

“ L(A 2 ) ⊇ L 2 ”: Induktion über |w| mit Hilfe von (∗) : der Rest der 

Ziffernsumme bestimmt den Zustand am Ende der Berechnung. 




Beispiel 

max(L) bezeichne die Sprache aller Wörter in L , die maximale Länge 

haben, d.h., nicht echtes Präfix eines anderen Worts aus L sind. Zum 

Beispiel: 

max(∅) = ∅ 

max(L(a ⋆ b ⋆ )) = ∅ 

max({ a n b n : n ∈ N } = { a n b n : n ∈ N } 

max(L(a ⋆ b ⋆ a)) = L(a ⋆ b + a) 

Wir zeigen, daß sich Regularität von L auf max(L) vererbt. 

A = 〈Q, X , δ, {q 0 }, F 〉 sei ein minimaler vDEA mit L(A) = L . Ob w ∈ L 

zu einem echt längeren Wort in L fortgesetzt werden kann, ist durch den 

Zustand p w := δ(w)(q 0 ) ∈ F bestimmt: sind Endzustände entlang 

nichtleerer Wege von p w aus erreichbar 

Also wird max(L) von A ′ = 〈Q, X , δ, {q 0 }, F ′ 〉 akzeptiert, mit 

F ′ := { p ∈ F : ∀w ∈ X + . δ(w)(p) /∈ F } 




Beispiel 

chp(L) bestehe aus allen Wörtern uv ∈ X ∗ , mit |u| = |v| und uav ∈ L 

für ein a ∈ X . D.h., aus allen L-Wörtern ungerader Länge wird der 

mittlere Buchstabe entfernt. Erhält diese Operation Regularität 

Betrachte die Semantik L des regulären Ausdrucks a ⋆ cb ⋆ . Wegen 

chp(L) = { u ∈ chp(L) : |u| c = 0 } + { u ∈ chp(L) : |u| c = 1 } 

ist die Sprache 

= { a n b n : n ∈ N } + { u ∈ chp(L) : |u| c = 1 } 

chp(L) ∩ {a, b} ∗ = { a n b n : n ∈ N } 

nicht regulär. Da aber {a, b} ∗ regulär ist, kann das für chp(L) nicht 

gelten. Also lautet die Antwort: Nein. 





Ohne die Beschränkung auf endliche Zustandsmengen kann jede Sprache 

von einem vollständig deterministischen Automaten akzeptiert werden: 

Definition 

Auf der Menge P(X ∗ ) definieren wir Übergangsfunktionen 

P(X ∗ ) 

∇(a) 

P(X ∗ ), L ↦→ {a}\L 

für a ∈ X 

Φ ⊆ P(X ∗ ) besteht aus genau den Sprachen, die ε enthalten. 

Satz 

Der vDA A(L) := 〈P(X ∗ ), X , ∇, {L}, Φ〉 (r) akzeptiert L . 

Beweis. 

w = a 0 . . . a n−1 ∈ L gdw ε ∈ {a n−1 }\ . . . \{a 0 }\L gdw ε ∈ {w}\L . 




Satz 

Für endliches Alphabet X ist L ∈ X ∗ ist genau dann regulär, wenn der 

Automat A(L) endlich ist. Bis auf Umbenennung der Zustände stimmt 

A(L) dann sogar mit dem Minimalautomaten für L überein. 

Beweis. 

Da A(L) , wie gerade gezeigt, L akzeptiert, folgt aus der Endlichkeit von 

A(L) die Regularität von L . 

Umgekehrt sei A ein Minimalautomat für L mit n Zuständen. Falls A(L) 

mehr Zustände hat, existieren u, v ∈ X ∗ , die vom Anfangszustand in A 

zum selben Zustand führen, in A(L) aber nicht, d.h., ∇(u)(L) ≠ ∇(v)(L). 

Wähle w in der Differenz dieser Sprachen. Dann erkennt A(L) genau eins 

der Wörter uw und vw , während A entweder beide oder keines erkennt, 

Widerspruch. 




Wie groß sind die relevanten Zustandsmengen Da für jede nichtleere 

abzählbare Menge X die Menge X ∗ abzählbar unendlich ist, handelt es 

sich bei P(X ∗ ) um eine überabzählbare Menge! (Im Fall X = ∅ ist X ∗ 

ein- und P(X ∗ ) zwei-elementig.) 

Andererseits ist jede Teilmenge L der abzählbaren Menge X ∗ ebenfalls 

abzählbar. Wegen der Erreichbarkeit aller Zustände kann A(L) also nur 

abzählbar viele Zustände haben. 

⊲ Warum verwendet man nicht ein abzählbares Alphabet, in dem sich 

bis auf Isomorphie alle endlichen Alphabete wiederfinden lassen 

⊲ Für jede reguläre Sprache L über einem endlichen Teilalphabet hätte 

der entsprechende Automat A(L) endlich viele Zustände, und von 

den unendlich vielen Übergängen landeten nur endlich viele nicht im 

Hotel California Zustand ∅ . 




Satz 

Für abzählbar unendliches Alphabet X ist L ∈ X ∗ ist genau dann regulär, 

wenn der durch Entfernen des Hotel California Zustands ∅ aus A(L) 

entstehende DA endlich ist. 

Beweis. 

Wir müssen nur noch zeigen, daß die Bedingung hinreichend ist. Aber aus 

der Endlichkeit des um den HCZ ∅ verminderten Automaten folgt sofort, 

daß in den Wörten von L nur endlich viele der Buchstaben in X 

vorkommen. Über dem entsprechenden Teilalphabet wird L nun durch 

einen DEA akzeptiert. 

Achtung: Bei der Arbeit mit einem abzählbar unendliche Alphabet X ist 

Vorsicht geboten: Z.B. ist das Komplement einer regulären Sprache 

natürlich relativ zum relevanten endlichen Teilalphabet zu verstehen, nicht 

relativ zu X ! 




Zurück zu endlichen Alphabeten! 

Definition 

Jede Sprace L ⊆ X ∗ induziert eine sog. Nerode Relation N L ⊆ X ∗ × X ∗ : 

Satz 

〈u, v〉 ∈ N L gdw ∀w ∈ X ∗ . uw ∈ L ⇔ vw ∈ L 

N L ist eine Äquivalenzrelation, und L ⊆ X ∗ ist genau dann regulär, wenn 

N L endlich viele Äquivalenzklassen hat. 

Beweis. 

Umschreiben der definierenden Bedingung liefert 

〈u, v〉 ∈ N L gdw {u}\L = {v}\L 

Damit ist N L offenbar eine ÄR, und ihre Äquivalenzklassen entsprechen 

bijektiv den Zuständen des Automaten A(L) . 




Kritik am traditionellen Automatenbegriff 

Ist es wirklich essenziell, wie im Fall von vDEAs, in jedem Zustand einen 

Übergang mit jedem möglichen Label zu verlangen Oder ist dies nur 

Nebeneffekt des Wunsches, mit Funktionen zu arbeiten, statt mit 

partiellen Funktionen oder gar Relationen 

Im Gegensatz zu DEAs vertragen vDEAs z.B. keine Vergrößerung des 

Alphabets. Ggf. ist dann ein Hotel California Zustand hinzuzufügen. 

Andererseits kann man im Falle eines DEA nie sicher sein, ob nicht ein 

wichtiger Übergang vergessen wurde. 

Schon beim Getränkeautomaten deutete sich die Möglichkeit an, daß lokal, also 

für jeden Zustand, unterschiedliche Aktionen verfügbar sein können. 

⊲ Statt mit einer unstrukturierten Labelmenge hätten wir es dann mit 

einem Label- oder besser Kontroll-Graphen zu tun; 

⊲ und anstelle einer Labelfunktion wäre nun ein Graphen- 

Homomorphismus zu betrachten, der Knoten und Kanten erhält. 




Beispiel (Getränkeautomat: LTS revisited) 

start 

ψ 

T 

S 

ζ 

ϕ 

K 

l 

0 

e 

2 

z 

wobei 

l(S) = 0 

l(T ) = l(K) = 2 

l(1€) = 1 

l(ϕ) = l(ψ) = e 

τ 

κ 

t 

k 

l(ζ) = z 

l(τ) = t 

1€ 

1 

l(ζ) = z 

Achtung: hier sind alle Kanten tatsächlich mit ihren Namen markiert! 

Bisher waren links immer nur deren l-Werte als Label verwendet 

worden, weshalb dasselbe Label auch mehrfach auftauchen konnte. 

Auch ein Alphabet X kann als Kontroll-Graph aufgefaßt werden, mit 

nur einem Knoten und den Elementen von X als Loops. 

Als “Sprachen” über einem Kontroll-Graphen wären nun Mengen von 

Wegen zu betrachten. Dieses Gebiet scheint noch weitgehend 

unerforscht zu sein, speziell wenn der Kontroll-Graph über eine 

Kompositions-struktur verfügt (also eine Kategorie ist). 




⊲ Reguläre Sprachen waren eine erste Approximation von E-Problemen, 

und endliche Autamaten dienten der algorithmischen Problemlösung. 

⊲ Aber bereits einfache Sprachen sind nicht regulär und erfordern 

stärkere Automaten, z.B. { a n b n : n ∈ N } . 

⊲ Zunächst wollen wir aber ein neues Paradgima zur Sprachbehandlung 

vorstellen: die Spracherzeugung im Gegensatz zur bisher betrachteten 

Spracherkennung. 

⊲ Dies entspricht eher der historischen Entwicklung der formalen 

Sprachentheorie aus der Linguistik (vergl. auch Noam Chomsky ) 

Als mögliche Anwendungen erwähnen wir nur 

den Compilerbau, was sowohl die Syntax von Programmiersprachen 

als auch die Implementation von Parsern angeht; 

den Austausch strukturierter Informationen im WEB (Document Type 

Definition in XML). 




Reguläre Ausdrücke zeigen, wie Wörter einer regulären Sprache auch 

anders als in einem links-rechts-Durchlauf konstruierbar sind: 

Beispiel 

Wie setzt sich L S = L(a(a ⋆ + b ⋆ )b) aus L R = L(a ⋆ + b ⋆ ) , L A = L(a ⋆ ) 

und L B = L(b ⋆ ) zusammen Betrachte semantische Ungleichungen in den 

Mengenvariablen S , R , A und B : 

S ⊇ {a}R{b} , R ⊇ A ∪ B , A ⊇ {a}A ∪ {ε} , B ⊇ {b}B ∪ {ε} 

Offenbar bilden die obigen Sprachen 〈L S , L R , L A , L B 〉 einen Fixpunkt für 

dieses Ungleichungssystem, und zwar den kleinsten. Der größte Fixpunkt 

ist gegeben durch 〈X ∗ , X ∗ , X ∗ , X ∗ 〉 . 

Aber wie findet man den kleinsten Fixpunkt eines Ungleichungssystems mit 

Konkatenationen und Vereinigungen von Sprachen auf der rechten Seite 





Ein Ungleichungssystem wie 

S ⊇ {a}R{b} , R ⊇ A ∪ B , A ⊇ {a}A ∪ {ε} , B ⊇ {b}B ∪ {ε} 

kann prinzipiell mehrere Fixpunkte haben, d.h., Lösungen mit Gleichheit in 

allen Komponenten, aber es gibt immer einen bzgl. Mengeninklusion 

kleinsten Fixpunkt, der ausgehend von S 0 = R 0 = A 0 = B 0 = ∅ iterativ 

berechnet werden kann: 

S k+1 := {a}R k {b} 

R k+1 := A k ∪ B k 

A k+1 := {a}A k ∪ {ε} 

B k+1 := {b}B k ∪ {ε} 

liefert den 

Fixpunkt 

L S = ⋃ i∈N S i = L(a(a ⋆ + b ⋆ )b) 

L R = ⋃ i∈N R i = L(a ⋆ + b ⋆ ) 

L A = ⋃ i∈N A i = L(a ⋆ ) 

L B = ⋃ i∈N B i = L(b ⋆ ) 




Diese Beobachtungen sind nicht auf reguläre Sprachen beschränkt: 

Beispiel 

L S := { a n b n : n ∈ N } ist der kleinste Fixpunkt der Ungleichung 

Beispiel 

S ⊇ {ε} ∪ {a}S{b} 

Die Sprache L := { w ∈ X ∗ : w = sp(w) } der Palindrome über X ist der 

kleinste Fixpunkt der Ungleichung 

S ⊇ {ε} ∪ ⋃ { {a} : a ∈ X } ∪ ⋃ { {a}S{a} : a ∈ X } 

Die iterative Lösung solcher (Systeme von) Ungleichungen kann allerdings 

mühsam sein. Geht das auch einfacher Wir wollen versuchen, das oben 

beschriebene Verfahren zu syntaktisieren: 



Kontextfreie Grammatiken 


Neben den Elementen von X , bei denen wir wie von den regulären 

Ausdrücken gewöhnt, die Mengenklammern weggelassen, benötigen wir 

sog. Variablen, die wir meist mit Großbuchstaben bezeichnen. 

Definition (kontextfreie Grammatik, traditionell) 

Eine kontextfreie Grammatik (kfG) G = 〈V, X , S, 

〉 besteht aus 

disjunkten Mengen X (Konstanten) und V (Variablen); 

einer ausgezeichneten Variable S ∈ V , dem Startsymbol; 

einer endliche Relation 

⊆ V × (X + V) ∗ aus sog. Produktionen. 

Für jeden Kontext 〈u, v〉 ∈ (X + V) ∗ × (X + V) ∗ und jede Produktion 

A w ist uwv aus uAv direkt ableitbar, wir schreiben dafür: 

Die reflexive transitive Hülle 

uAv 

uwv 

∗ heißt Ableitbarkeits-Relation. 




Achtung: zwar wird pro Ableitungsschritt genau eine Variable ersetzt, aber 

dies ist weniger wichtig als es zunächst erscheint. 

Mehrere Produktionen A w i , i < n , mit derselben linken Seite können 

vorkommen, insofern sind kfG’n automatisch nicht-deterministisch. Oft 

faßt man solche Produktionen abkürzend wie folgt zusammen 

Konzeptionell abstrahieren 

A 

w 0 | w 1 | . . . | w n−1 

⊲ die Variablen in V die obigen Mengenvariablen über X ∗ ; 

⊲ die Konstanten a ∈ X die Sprachen {a} (wie bei regulären 

Ausdrücken wird auf Mengenklammern verzichtet); 

⊲ die Konkatenation von Symbolen die Konkatenation von Sprachen; 

⊲ der Pfeil die Obermengenrelation ⊇ . 

⊲ der vertikale Strich | die Vereinigung ∪ (pro Ableitungsschritt wird 

aber nur eine der rechten Alternativen verwendet). 




Definition 

Die von einer kfG G = 〈V, X , S, 〉 erzeugte Sprache ist definiert als 

L(G) := { w ∈ X ∗ : S ∗ w }. Eine Sprache L ⊆ X ∗ heißt kontextfrei, 

wenn mindestens eine kfG G existiert mit L(G) = L . 

Beispiel 

G = 〈{S}, {a, b}, S, 〉 mit S aSb | ε erzeugt L = { a n b n : n ∈ N } : 

L ⊆ L(G) : Wendet man die erste Produktion n-mal und die zweite 

einmal an, so wird a n b n erzeugt. 

L(G) ⊆ L : Im Startsymbol und allen Outputs der Produktionen gibt es 

gleichviele Symbole a auf der linken wie Symbole b auf der rechten Seite. 

Die Substitution für die zentrale Variable erhält diese Eigenschaft. 




Das folgende Beispiel mag auf den ersten Blick überraschen: 

Beispiel (reguläre Ausdrücke) 

Die regulären Ausdrücke über einem Alphabet X bilden eine kontextfreie 

Sprache. Als kfG verwenden wir 

G = 〈{r}, X + {0, 1, e, ∅, +, ·, ⋆ , (, )}, r, 〉 mit 

r 

a ∈ X | 0 | 1 | e | ∅ | r + r | r · r | r ⋆ | (r) 

(Da aus technischen Gründen ε als Element unserer Alphabete nicht 

zulässig ist, andererseits aber ε einen speziellen regulären Ausdruck 

bezeichnet (schlecht!), haben wir an dieser Stelle ε durch e ersetzt.) 

Den Nachweis, daß L(G) im Wesentlichen die Sprache der regulären 

Ausdrücke über X ist, überlassen wir der LeserIn. 

Jetzt stellt sich die Frage, ob auch jede reguläre Sprache mit Hilfe einer 

kfG erzeugt werden kann. 




Definition 

Eine kfG G = 〈V, X , S, 〉 heißt linear, wenn die rechte Seite jeder 

Produktion höchstens eine Variable enthält. Sie heißt links- bzw. 

rechts-linear, wenn zudem die Variablen auf der rechten Seite der 

Produktionen immer am Anfang bzw. Ende auftreten. 

Satz 

Die regulären Sprache stimmen genau mit den kontextfreien Sprachen 

überein, die durch eine rechts-lineare kfG erzeugbar sind. 

Beweis 

Zu einem vDEA A = 〈Q, X , δ, {q 0 }, F 〉 mit L = L(A) konstruieren wir 

eine rechts-lineare Grammatik G = 〈Q, X , q 0 , 〉 wie folgt: 

q ap gdw 〈q, p〉 ∈ δ(a) und q ε gdw q ∈ F 




Beweis (Fortsetzung) 

Induktion über die Wortlänge liefert eine Äquivalenz zwischen 

Berechnungen 〈q 0 , s 0 . . . s n−1 〉 ⊢ 〈q 1 , s 1 . . . s n−1 〉 ⊢ · · · ⊢ 〈q n , ε〉 

und Ableitungen q 0 s 0 q 1 . . . s 0 . . . s n−1 q n 

Die Berechnung ist genau dann akzeptierend wenn q n ∈ F gilt, d.h., wenn 

die Ableitung um s 0 . . . s n−1 q n s 0 . . . s n−1 ergänzt werden kann. 

Achtung: Die rechten Seiten obiger Produktionen gehören zu X × V + {ε} . 

Für eine beliebige rechts-lineare kfG G = 〈V, X , S, 〉 liefert das 

Nachspielen der obigen Konstruktion leider nur einen ∗NEA (in dieser VL 

nicht betrachtet). Um zumindest einen εNEA zu erhalten, ist G in eine 

äquivalente Grammatik G ′ = 〈V ′ , X , S, 〉 umzuwandeln, so daß deren 

Produktionen rechte Seiten in X ε + (X ε × V) + {ε} haben. 





Für R a 0 a 1 . . . a n−1 T mit n > 1 führen wir n − 1 spezifische neue 

Variable U i , i < n − 1 , ein und simulieren die Produktion durch 

R a 0 U 0 , U i a i+1 U i+1 für i < n − 2, U n−2 a n−1 T (∗) 

Die neuen Produktionen (∗) können nur die ursprüngliche Produktion 

R a 0 a 1 . . . a n−1 T simulieren, sonst nichts. Damit folgt L(G ′ ) = L(G) . 

Nun konstruieren wir aus G ′ 

einen εNEA A = 〈V ′ , X ε , δ, {S}, F 〉 mit 

〈B, C〉 ∈ δ(a) gdw B aC , B ∈ F gdw B ε 

Für w = s 0 s 1 . . . s n−1 ∈ X ∗ mit s i ∈ X ε , i < n , und Variable B i+1 , 

i < n , erhalten wir wie oben eine Äquivalenz zwischen G ′ -Herleitungen 

und akzeptierenden A-Berechnungen von w . Folglich gilt w ∈ L(G ′ ) 

gdw w ∈ L(A) . 




Bevor wir Abschlußeigenschaften kontextfreier Sprachen untersuchen, ist 

zu klären, ob alle Sprachen kontextfrei sind. Dazu eine Vorüberlegung. 

In Analogie zu regulären Ausdrücken kann man die Produktionen einer 

kontextfreien Grammatik als elementare Bausteine für Ableitungsbäume 

auffassen, mit der linken (rechten) Seite als Eingabe (Ausgabe). 

Allerdings sind diesmal die Kantenlabel aus X + V wichtiger als die 

Knotenlabel (Namen oder Nummern der Produktionen). 

Beispiel (für G = 〈{S, T }, {0, 1}, S, 〉) 

Die fünf Produktionen S 0S1S | 1S0S | T und T 0T | ε entsprechen 

den Knoten 

S 

S 

S 

T 

T 

0 

1 

2 

3 

4 

0 S 1 S 

1 S 0 S 

T 

0 T 




Satz 

Für eine kfG G = 〈V, X , S, 〉 stimmt L(G) mit der Sprache aller 

Wörter w ∈ X ∗ überein, für die ein Ableitungsbaum mit Input S und 

Output w existiert. 

Beweis. 

In einer Ableitung von w ∈ L(G) bestimmt jeder Schritt eine “aktuelle” 

zu ersetzende Variable und eine anzuwendende Produktion. 

Entsprechendes Zusammensetzen der Produktionen-Knoten liefert einen 

Ableitungbaum mit Input S und Output w . 

Umgekehrt können wir aus einem Ableitungsbaum für w ∈ X ∗ sequenziell 

alle Produktionen-Knoten ohne Nachfolge-Knoten entfernen und erhalten 

auf diese Weise rückwärts eine Ableitung von w (diese wird i.A. nicht 

eindeutig sein). 





Verschiedene Ableitungen können denselben Baum erzeugen: 

aufgrund der Kontextfreiheit sind “parallele” Unterbäume B 0 und B 1 

(so daß B i nicht Unterbaum von B 1−i ist) insofern unabhängig 

voneinander, als die zeitliche Abfolge der Ableitungsschritte in B 0 

relativ zu denen in B 1 völlig beliebig ist. Erzeugen zwei Ableitungen 

denselben Baum, so verwenden sie dieselben Produktionen gleich 

häufig, nur in anderer Reihenfolge. 

Es spräche Einiges dafür, derartige Unterschiede zu ignorieren, etwa, 

indem man die simultane Ersetzung aller aktuellen Variablen zuläßt. 

Für uns werden Ableitungsbäume wichtiger sein als Ableitungen. 

Ein Wort kann aber auch verschiedene Ableitungsbäume haben, vergl. 

HA. Im Gegensatz zum obigen Phänomen ist dies ein Ausdruck von 

echtem Nichtdeterminismus. 




Das Pumping Lemma für kontextfreie Sprachen, PL(kf) 

Analog zum regulären Fall, suchen wir eine Eigenschaft, die alle 

kontextfreien Sprachen haben müssen. 

Jede Sprache, die diese Eigenschaft nicht hat, kann folglich nicht 

kontextfrei sein. 

Dieser Ansatz dient wieder dazu, Kontextfreiheit zu widerlegen und liefert 

als Korollar zu folgendem Satz wieder ein Pumping Lemma. 

Satz (Lemma von Ogden) 

Zu jeder kontextfreien Sprache L ∈ X ∗ existiert eine Zahl n L > 0 , so daß 

jedes Wort u ∈ L mit mindestens n L (z.B. rot) markierten Positionen 

zerlegbar ist als u = vwxyz mit v, w, x, y, z ∈ X ∗ und 

(0) wy enthält eine Markierung (1) wxy enthält ≤ n L Markierungen 

(2) ∀k ∈ N. u k := vw k xy k z ∈ L 




Beweis (Illustration umseitig) 

Für eine kfG G = 〈V, X , S, 〉 mit L(G) = L setze n L := r |V|+1 , wobei 

r die maximale Output-Länge der Produktionen ist. 

In einem Ableitungsbaum B für u ∈ L mit ≥ n L (z.B. rot) markierten 

Positionen markieren wir alle Knoten (z.B. rot), in denen sich die Wege 

von S zu den markierten u -Positionen verzweigen. Wähle unter allen von 

S startenden Wegen einen mit maximaler Anzahl m markierter Knoten. 

Da u mindestens r |V|+1 Markierungen hat, gilt m > |V| . 

Mindestens zwei der letzten |V| + 1 markierten Knoten dieses Weges 

haben denselben Input. |V| + 1 beschränkt die “markierte Tiefe” der 

zugehörigen Unterbäume B ′ und B ′′ ; diese liefern als Output wxy mit 

≤ n L Markierungen bzw. x . Die von der B ′ -Wurzel aus entlang 

verschiedener Zweige erreichbaren markierten u -Positionen gehören nicht 

sämtlich zu x , also enthält wy eine solche. Nach Konstruktion kann nun 

die Differenz B ′ − B ′′ iteriert werden, woraus u k ∈ L für k ∈ N folgt. 




′′ 

B ′′ y 

Von der Wurzel von B ′ sind ≥ 2 

− 

markierte u -Positionen erreichbar, 

x 

daher muß eine in wy liegen. 

w 

B ′ −B B ′ 

Positionen von wxy markiert. 

Die schwarze Kurve ist ein Weg von der 

Gegeben: kfG G = 〈V, X , S, 〉 für L 

Wurzel S mit maximaler Anzahl m 

und ein Ableitungsbaum für u ∈ L mit 

markierter Knoten (von denen aus 

≥ n L := r |V|+1 markierten Positionen. jeweils mindestens zwei markierte 

S 

u -Positionen erreichbar sind). 

Mindestes zwei der letzten |V| + 1 

markierten Knoten auf diesem Weg 

− haben denselben Input; die 

• 

entsprechenden Unterbäume B ′ und 

B ′′ liefern eine Zerlegung u = vwxyz . 

k -faches Iterieren von B ′ − B ′′ 

z 

liefert u k = vw k xy k z ∈ L . 

|V|+1 

v 

• 

|V| + 1 beschränkt die markierte 

Tiefe von B ′ , daher sind ≤ n L 




Werden alle Positionen von u markiert, so erhalten wir 

Corollar (Das Pumping-Lemma für kontextfreie Sprachen, PL(kf)) 

Zu jeder kontextfreien Sprache L ∈ X ∗ existiert eine Zahl n L > 0 , so daß 

jedes Wort u ∈ L mit |w| ≥ n L eine Zerlegung u = vwxyz mit 

v, w, x, y, z ∈ X ∗ besitzt, die folgende Bedingungen erfüllt: 

(0) wy ≠ ε ; (1) |wxy| ≤ n L ; (2) ∀k ∈ N. u k := vw k xy k z ∈ L . 

Beispiel ( L = { a i b j c k d l : i = j = k ∨ l = 0 } ) 

L ist nicht kontextfrei (Lemma von Ogden, vergl. HA), erfüllt aber die 

Bedingungen des PL(kf) mit n L := 1 : 

Von Interesse ist einzig der Fall a i b i c i d l ∈ L mit i, l > 0 . 

Setze v = a i b i c i d l−1 , w = d und x = y = z = ε . Für k ∈ N gilt dann 

u k = uv k xy k z = a i b i c i d l−1+k ∈ L . 

Dennoch genügt das PL(kf) häufig in der Praxis. 




Beispiel (PL(kf)) 

Die Sprache L = { a n b n c n : n ∈ N } ⊆ {a, b, c} ∗ 

ist nicht kontextfrei: 

Für n > 0 betrachte u := a n b n c n = vwxyz mit wy ≠ ε und |wxy| ≤ n . 

Letzteres impliziert, daß wy nicht gleichzeitig die Buchstaben a und c 

enthalten kann. Also folgt |u 2 | a ≠ |u 2 | c und somit u 2 /∈ L . Da n beliebig 

war, ist L nicht kontextfrei. 

Beispiel (PL(kf)) 

Die Menge P ⊆ N ∼ = {|} ∗ 

aller Primzahlen ist nicht kontextfrei: 

Für n > 0 betrachte die nächstgrößere Primzahl p und das Wort 

u := | p = | s | t | a | b | c = | s+t+a+b+c mit t + b > 0 und t + a + b ≤ n . 

Für k ∈ N setze u k = | s | kt | a | kb | c = | s+a+c+k(t+b) . Speziell für 

k = s + a + c ist s + a + c + k(t + b) = (s + a + c)(1 + t + b) keine 

Primzahl, also gilt u k /∈ P . Da n beliebig war, ist P nicht kontextfrei. 




Die Widerlegung der Kontextfreiheit einer konkreten Sprache L ⊆ X ∗ 

mittels Lemma von Ogden (PL(kf)) folgt immer demselben 

Schema 

Man überprüft eine generische Zahl n > 0 auf Ihre Eignung als Konstante 

n L aus dem Pumping Lemma und verwirft sie: 

(0) wähle ein spezifisches Wort u ∈ L mit ≥ n Markierungen ( |u| ≥ n ); 

typischerweise wird u vom Wert n als Parameter abhängen; 

(1) betrachte eine generische Zerlegung u = vwxyz mit mindestens einer 

Markierung in wy ( wy ≠ ε ) und ≤ n Markierungen in wxy 

( |wxy| ≤ n ); dies sind ihre einzigen bekannten Eigenschaften; 

(2) optional: beschreibe das allgemeine Wort u k = vw k xy k z , k ∈ N ; 

(3) finde einen spezifischen Wert k 0 ∈ N mit u k0 /∈ L . 

Da n generisch war, entfällt jedes n > 0 als Kandidat für n L , also kann 

L nicht kontextfrei sein. 

Die geschickte Wahl von u ∈ L samt Markierung (0) und die Bestimmung 

von k 0 (3) erfordern die meiste Arbeit. 





Satz 

Kontextfreie Sprachen sind unter abgeschlossen unter endlicher 

Vereinigung und endlicher Konkatenation. 

Beweisidee (der binäre Fall genügt). 

Die Vereinigung zweier kfG’n G i , i < 2 , mit disjunkten Variablenmengen 

hat zwei Startsymbole, S 0 und S 1 und ist somit keine kfG. Fügt man 

aber ein neues Startsymbol S und Produktionen S S 0 sowie S S 1 

hinzu, so erhält man eine kfG, die L(G 0 ) ∪ L(G 1 ) erzeugt. Verwendet man 

stattdessen die neue Produktion S S 0 S 1 , so erzeugt die resultierende 

kfG L(G 0 )L(G 1 ) . Details als HA. 

Vielleicht überraschend sind kontextfreie Sprachen nicht unter binären 

Durchschnitten, also auch nicht unter Komplementen abgeschlossen: 




Beispiel 

Die Sprache L 0 = { a n b n : n ∈ N}{c} ∗ ist als Konktenation kontextfreier 

Sprachen wieder kontextfrei; analoges gilt für L 1 = {a} ∗ { b n c n : n ∈ N } . 

L 0 ∩ L 1 = { a n b n c n : n ∈ N } 

ist nicht kontextfrei, dafür aber L 0 ∩ L 1 = ¯L 0 ∪ ¯L 1 . Um ¯L 0 als kontextfrei 

nachzuweisen, vereinige drei reguläre Sprachen (“ein b vor einem a ”, 

“ein c vor einem b ” und “ein c vor einem a ”) und zwei kontextfreie 

Sprachen ( a n b m c k mit n < m sowie n > m , vergl. HA). Analog für L 1 . 

Proposition 

Die Spiegelung einer kontextfreien Sprache ist kontextfrei. 

Beweisidee. 

Man spiegelt einfach die rechten Seiten aller Produktionen. 




Satz 

Iteration bzw. Kleene-Stern erhalten die Kontextfreiheit von Sprachen. 

Beweisidee. 

Eine kfG mit Startsymbol S wird um ein neues Startsymbol @ und 

Produktionen @ S@ | ε ergänzt. 

Satz 

Homomorphe Bilder kontextfreier Sprachen sind wieder kontextfrei. 

Beweis. 

h 

Ist X ∗ Y ∗ ein Homomorphismus und ist G = 〈V, X , S, 〉 eine kfG, 

so gilt das auch für h[G] := 〈V, Y , S, 

′ 〉, deren Produktionen aus 

G -Produktionen durch Ersetzung aller Buchstaben a ∈ X durch Wörter 

h(a) ∈ Y ∗ entstehen. Damit liefert jeder G -Ableitungsbaum einen 

h[G]-Ableitungsbaum. Umgekehrt hat jede h[G]-Produktion mindestens 

ein Urbild, also folgt L(h[G]) = h[L(G)] . 




Beispiel 

Kontextfreiheit bleibt unter Residuierung nicht notwendig erhalten: 

M = {d}{ a n b n : n ∈ N }{c} ∗ ∪ {e}{a} ∗ { b n c n : n ∈ N } 

ist als Vereinigung von Konkatenationen kontextfreier Sprachen 

kontextfrei. Aber 

ist nicht kontextfrei. 

{d, e}\M = {d}\M ∩ {e}\M = { a n b n c n : n ∈ N } 

Um festzustellen, unter welchen Einschränkungen Residuierung evtl. doch 

Kontextfreiheit erhält, und wie es mit homomorphen Urbildern 

kontextfreier Sprachen aussieht, wenden wir uns nun Normalformen 

kontextfreier Grammatiken zu, die auch für weitere Zwecke nützlich sind. 




Das Wortproblem für kf Grammatiken 

Für einen DEA A über X und ein Wort w ∈ X ∗ läßt sich in linearer Zeit 

feststellen, ob w ∈ L(A) gilt: man führt die einzig mögliche Berechnung 

durch. Genau dann, wenn diese nicht steckenbleibt und zu einem 

Endzustand führt, gilt w ∈ L(A) . Jeder Berechnungsschritt verbraucht ein 

Symbol. 

Ist A nichtdeterminstisch (aber ohne ε-Übergänge), so kann die Zahl der 

möglichen Berechnungen exponentiell in |w| sein. Die Potenzmengenkonstruktion 

spiegelt dies wider: um die Zahl der möglichen Berechnungen 

auf eine zu reduzieren, nimmt man ein potentiell exponentielles Wachstum 

der Zustandsmenge in Kauf. 

Analog kann man für eine kfG G = 〈V, X , S, 〉 und ein Wort w ∈ X ∗ 

fragen, ob w ∈ L(G) gilt. Dies kann mit Hilfe des sog. CYK-Algorithmus 

festgestellt werden, der erfreulicherweise zumindest polynomial in |w| ist, 

und bei geschickter Anwendung linear in der Größe |G| der Grammatik; 

allerdings muß diese eine spezielle Normalform haben. 




Zunächst wollen wir “überflüssige” Variable entfernen: 

Proposition 

Eine Variable U ∈ V einer kfG G = 〈V, X , S, 

unproduktiv, falls aus U ∗ w folgt w /∈ X ∗ ; 

unerreichbar, falls aus S ∗ w folgt |w| U = 0 . 

〉 heißt 

Entfernen derartiger Variablen läßt die erkannte Sprache L(G) invariant. 

Im Folgenden setzen wir voraus, daß weder unproduktive noch 

unerreichbare Variablen vorhanden sind. Erst dann ist es sinnvoll, die 

Größe einer Grammatik mit Hilfe ihrer Produktionen zu definieren: 

Definition 

Eine kfG G = 〈V, X , S, 

〉 hat die Größe 

|G| := ∑ A∈V 

∑ 

1 + |α| 

A→α 




Umwandeln einer kfG (ohne überflüssige Variablen) in die gewünschte 

Normalform erfordert Arbeit und kann die Grammatik vergrößern. Diesem 

Aspekt wurde aber erst kürzlich (2009) von Martin Lange und Hans Leiß (LMU 

München) die gebührende Aufmerksamkeit zuteil; dieser Abschnitt des 

Scripts stützt sich auf ihren Artikel 

To CNF or not to CNF An Efficient Yet Presentable Version of the CYK 

Algorithm, Informatica Didactica 8 (2008–2010), 21pp. 

Lange und Leiß listen einige für CYK relevante Normalformen auf und ihre 

Beziehungen bzgl. Inklusion (“CNF” steht für Chomsky Normalform) 

2LF 

Name Form der Produktionen 

CNF −ε A BC | a 

2NF 

CNF A BC | a , S ε (∗) 

CNF +ε A BC | a | ε 

CNF 

S2F A α mit |α| = 2 

+ε C2F 

C2F A BC | B | a , S ε (∗) 

2NF A α mit |α| ≤ 2 

CNF 

2LF A uBvCw | uBv | v , u, v, w ∈ X ∗ 

CNF −ε 

S2F 

(∗) Falls die Produktion S ε auftritt, darf S nicht auf der rechten Seite einer anderern Produktion vorkommen. 



Der CYK Algorithmus 


Um für eine kfG G in 2NF zu entscheiden, ob w ∈ X + zu L(G) gehört, 

werden im Wesentlichen alle möglichen Ableitungsbäume für w rückwärts 

aufgebaut, mittels einer “Divide-and-Conquer” Strategie mit Speicherung 

von Zwischenergebnissen, die als dynamischen Programmierung bekannt ist. 

Genauer: für jedes Teilwort w i,j von Position i bis Position j des Worts 

w wird die Menge V i,j aller Variablen konstruiert, aus denen w i,j 

herleitbar ist. Dies kann induktiv erfolgen. 

Für eine kfG in CNF wurde der Algorithmus unabhängig von John Cocke 

and Jacob T. Schwartz (1970), Tadao Kasami (1965) und Daniel H. 

Younger (1967) entdeckt und ist folglich als CYK-Algorithmus bekannt. 

In der Version von Langer und Leiß für G in 2NF werden zusätzlich die 

klassisch berechneten Mengen unter Vorgängern bzgl. einer bestimmten 

Relation abgeschlossen, die vorweg zu bestimmen ist. Spätestens dabei 

stellt sich heraus, ob ε ∈ L(G) gilt (was im Fall der CNF trivial ist). 




Skizze des klassischen CYK-Algorithmus 

Eingabe: kfG G = 〈V, X , S, 〉 in CNF und w ∈ X + mit |w| = n 

Ausgabe: JA gdw S ∈ V 0,n−1 := { A ∈ V : A ∗ w }, 

⊲ Initialisierung: V i,i := { A ∈ V : A 

w i,i = s i } für i < n 

⊲ Zeilenweise rekursiv: A ∈ V i,j gdw i ≤ h < j und A BC 

existieren mit B ∈ V i,h und C ∈ V h+1,j , für i < j < n . 

Beispiel 

G = 〈{S, A, B, C}, {a, b}, S, 〉 

S 

A 

B 

C 

AB | BC 

BA | a 

CC | b 

AB | a 

Gilt w = baaba ∈ L(G) Ja! 

0≤j≤5 

− 

S, C, A 

A, S, C 

− B B 

A, S B S, C A, S 

0≤i≤5 

B A, C A, C B A, C 

b a a b a 




Die Umwandlung einer allgemeinen kfG in eine der drei Varianten der CNF 

verwendet üblicherweise vier Schritte: 

(Term) Ersetzen von Konstanten in rechten Seiten der Länge > 1 ; 

(Bin) Ersetzen von Produktionen mit zu langer rechter Seite; 

(Del) Entfernen von Lösch-Produktionen A ε (nicht bei CNF +ε ); 

(Unit) Entfernen von Variablenumbenennungen A B. 

Die Reihenfolge ihrer Anwendung entscheidet darüber, wie sich die Größe 

der Ausgangsgrammatik G ändert: (Del) vor (Bin) kann exponentielles 

Wachstum der Grammatik G ′ bewirken! 

⊲ Hopcroft/Motwani/Ullman 2001: (Del) ; (Unit) ; (Term) ; (Bin) 

liefert |G ′ | ≈ 2 2|G| , was die Authoren aber nicht erwähnen; 

⊲ Rich 2007: (Bin) ; (Del) ; (Unit) ; (Term) liefert |G ′ | ≈ |G| 2 , 

was die Authorin auch erwähnt; 

Weitere Beispiele finden sich in Tabelle 3 des Artikels von Lange und Leiß. 




Die Einsicht von Lange und Leiß besteht darin, zwei für die Schritte (Del) 

und (Unit) nötigen Hilfsergebnisse statt zur Grammatikumwandlung 

direkt beim CYK-Algorithmus einzusetzen. 

Darüberhinaus erweist sich der Schritt (Term) als überflüssig, also bleibt 

einzig (Bin) übrig, was die Grammatik nur linear vergrößern kann. 

Liegt G schon in CNF −ε oder CNF vor, kann der CYK-Algorithmus wie 

bisher direkt angewendet werden: die Berechnung der Hilfsergebnisse 

erübrigt sich (nicht so im Fall einer allgemeinen 2NF Grammatik). 




Satz 

Zu jeder kfG G = 〈V, X , S, 〉 existiert eine äquivalente Grammatik 

G ′ = 〈V ′ , X , S, 

′ 〉 in 2NF, die in linearer Zeig bzgl. |G| berechnet 

werden kann, und deren Größe linear in |G| ist. 

Beweis. 

Ersetze jede Produktion A x 0 x 1 . . . x n−1 mit x i ∈ V + X und n > 2 

durch Produktionen 

A 

′ x 0 B 1 , B 1 ′ x 1 B 2 , . . . , B n−2 ′ x n−2 x n−1 

wobei die B i , 0 

ursprüngliche Produktion sind. Dies erfordert einen Durchlauf durch die 

Grammatik G , und die Anzahl der neuen Variablen ist durch |G| 

beschränkt. Die Äquivalenz folgt sofort aus der Betrachtung der 

Ableitungsbäume. 




Definition 

Die Menge der nullierbaren Variablen einer kfG G = 〈V, X , S, 

〉 ist 

E G := { A ∈ V : A + ε } 

während ihre Einheitsrelation gegeben ist durch 

U G := { 〈A, y〉 ∈ V × (V + X ) : ∃α, β ∈ E ∗ G . A αyβ } 

Lemma 

Jede kfG G = 〈V, X , S, 

〉 erfüllt E G = E |V| , wobei 

E 0 = { A ∈ V : A ε } und E i+1 = E i ∪ { A ∈ V : ∃α ∈ E + i 

. A α } 

Beweis. 

Hausaufgabe. 




Algorithmus (Berechnung der nullierbaren Variablen in linearer Zeit) 

Eingabe: eine kfG G = 〈V, X , S, 〉 in 2NF 

Ausgabe: Menge E der nulierbaren Variablen 

Initialisierung: E := ∅ ; T : ∅ ; for all A ∈ V do o(A) := ∅ ; 

for all A B do o(B) := o(B) ∪ {A} ; 

for all A BC do o(B) := o(B) ∪ {〈A, C〉} ; o(C) := o(C) ∪ {〈A, B〉} ; 

for all A ε do E := E ∪ {A} ; T := T ∪ {A} ; 

while T ≠ ∅ do 

entferne ein B aus T ; 

for all A, 〈A, C〉 ∈ o(B) mit C ∈ E do 

if A /∈ E then E := E ∪ {A} ; T := T ∪ {A} ; 

return E 

Satz 

Zeit- und Raumbedarf des obigen Algorithmus sind linear in |G| . 




Satz 

Für eine kfG G in 2NF sind Zeit- und Raumbedarf bei der Berechnung 

der Einheitsrelation U G linear in |G| . 

Beweis. 

Wir betrachten U G als Graph auf der Menge V + X . Nach Berechnung 

von E G wird für jede Produktion A y, A By oder A yB mit B 

nullierbar die Kante 〈A, y〉 hinzugefügt. 

Satz 

Für jedes y ∈ V + X ist der Zeit- und Raumbedarf bei der Berechnung 

der Menge U ∗ G (y) ihrer U∗ G 

-Vorgänger linear in |G| . 

Beweis. 

Die Berechnung der Erreichbarkeitsrelation in einem Graphen ist linear in 

der Summe der Knoten- und Kantenzahl. 




CYK(LL)-Algorithmus (explizite Version) 

Eingabe: kfG G = 〈V, X , S, 〉 in 2NF, U G , w = s 0 . . . s n−1 ∈ X + 

Ausgabe: Entscheidung, ob w ∈ L(G) . 

for i < n do V i,i := U ∗ G (s i) 

for 0 < j < n do 

for j > i > 0 do V ′ i,j := ∅ ; 

for i ≤ h < j do 

for all A yz 

if y ∈ V i,h and z ∈ V h+1,j then V ′ i,j := V′ i,j ∪ {A} 

V i,j := U ∗ G [V′ i,j ] = ⋃ y∈V ′ U ∗ i,j G 

(y) ′ 

if S ∈ V 0,n−1 

then return “yes” else return “no” 

Satz 

Der Zeit- und Raumbedarf des obigen Algorithmus bewegt sich in der 

Größenordnung von |G| · |w| 3 bzw. |G| · |w| 2 . 




Da die Größe der binäre Normalform und der Zeitbedarf für die 

Berechnung von E G und U G linear in |G| sind, ergibt sich 

Corollar 

Die Lösung des Wort-Problems für eine kfG G und ein Wort der Länge n 

benötigt größenordnungsmäßig |G| · n 3 Zeit und |G| · n 2 Raum. 

Beispiel 

Über dem Alphabet X = {a, b, 0, 1, (, ), +, ∗} betrachten wir die 

Grammatik G = 〈{E, T , F , I }, X , E, 〉 mit folgenden Produktionen 

E 

T | E + T 

F 

aI | bI | (E) 

T 

F | T ∗ F 

I 

0I | 1I | ε 

Nachzählen liefert 4 Variable, 10 Produktionen und |G| = 29 . 

Offenbar handelt es sich bei L(G) um die Sprache der arithmetischen 

Ausdrücke in + und ∗ , mit Identifiern der Form u ∈ {a, b}{0, 1} ∗ . 





Die Umformung in binäre Normalform liefert die G ′ -Produktionen 

E 

T 

T | EQ 

F | TR 

Q 

R 

+ T 

∗ F 

F aI | bI | (S 

I 0I | 1I | ε 

S E) 

Nachzählen liefert 7 Variable, 13 Produktionen und |G ′ | = 35 . 

Nur I is nullierbar, also E G = {I } . Weiter gilt 

U G ′ = {〈E, T 〉, 〈T , F 〉, 〈F , a〉, 〈F , b〉, 〈I , 0〉, 〈I , 1〉} 

woraus sich z.B. folgende Vorgängermengen ergeben 

U ∗ G (a) = {a, E, T , F } U ∗ G (0) = {0, I } U ∗ G (T ) = {T , E} 

U ∗ G (b) = {b, E, T , F } U ∗ G (F ) = {F , T , E} (I ) = {I } 

U ∗ G 





Wir prüfen, ob w = (a0 + b) ∗ a zu L(G) gehört: gilt E ∈ V 0,7 Ja! 

T E 

0 ≤ j ≤ 7 

− 

− 

E, T 

F − − 

− S − − 

0 ≤ i ≤ 7 

− E − − − 

− − − − − − 

E, T 

− F − Q S − R 

E, T , F I E, T , F E, T , F 

( a 0 + b ) ∗ a 




Beispiel 

Wandelt man die obige Grammatik G = 〈{E, T , F , I }, X , E, 

Produktionen 

E T | E + T F aI | bI | (E) 

T 

F | T ∗ F 

I 

0I | 1I | ε 

〉 mit den 

gemäß (Del) ; (Unit) ; (Term) ; (Bin) mechanisch(!) in CNF um, so 

erhält man eine hochgradig redundante Grammatik der Größe 84: 

E AI | a | BI | b | (Q 0 | TR 0 | ES 0 

T AI | a | BI | b | (Q 1 | TR 1 

F AI | a | BI | b | (Q 2 

I CI | 0 | DI | 1 

Q 0 E) 

Q 1 E) 

Q 2 E) 

R 0 

R 1 

∗ F 

∗ F 

S 0 + T A a 

während (Del) ; (Unit) ; (Term) ; (Bin) ebenfalls viel Redundanz und 

eine Größe von 75 liefert: 

E 

T 

AI | a | BI | b | (Q | TR | ES 

AI | a | BI | b | (Q | TR 

F AI | a | BI | b | (Q 

I CI | 0 | DI | 1 

Q E) 

R 

S 

∗ F 

+ T 

A 

B 

a 

b 

C 0 

D 1 

B 

b 

C 0 

D 1 




Im Falle einer kfG in CNF kann man aus CYK-Tabellen durch 

Rückverfolgung des Startsymbols direkt Ableitungsbäume extrahieren: 

Beispiel ( S AB | BC, A BA | a, B CC | b, C AB | a ) 

− 

S, C, A 

A, S, C 

A 

S 

0 

B 

− 

B 

B 

B 

2 

A 

C 

4 

C 

A, S 

B 

S, C 

A, S 

5 

3 

A 

6 

B 

7 

B 

A, C A, C B 

A, C 

b a a b a 

b 

a 

3 

a 

5 

b 

a 

Es kann mehrere solche Ableitungsbäume geben. Im obigen Beispiel kann 

man statt mit der Produktion S AB (Nr. 0) auch mit S BC (Nr. 1) 

beginnen, wie umseitig ausgeführt wird. 




Beispiel ( S AB | BC, A BA | a, B CC | b, C AB | a ) 

− 

− 

S, C, A 

B 

A, S, C 

B 

A, S B S, C A, S 

B 

A, C 

A, C B 

A, C 

b a a b a 

S 

B 

1 

C 

5 

A 

6 

B 

b 4 

C 

4 

C 

a 

A 

3 

6 

B 

5 

7 

a 

a 

b 

Bei einer 2NF, die keine CNF ist, wird der resultierende Baum beim 

Auftreten von echten U ∗ G 

-Vorgängern neben G -Produktionen noch 

Knoten enthalten, die G -Ableitungen der Form A 

∗ y mit A ∈ V und 

y ∈ V + X entsprechen, in deren Verlauf evtl. Variablen nulliert werden. 

Um einen echten G -Baum zu erhalten, sind diese Knoten durch die 

entsprechenden Ableitungen zu ersetzen. 




Die Greibach Normalform (GNF) 

Definition 

Eine kfG G hat Greibach Normalform (GNF), falls alle Produktionen die 

Form A aP ∈ X V ∗ oder S ε haben, wobei im letzteren Fall S nicht 

auf der rechten Seite einer Produktion auftreten darf. 

Insbesondere werden hier nichtleere Wörter von links nach rechts mit 

genau einer neuen Konstante pro Ableitungsschritt erzeugt. 

Jede(r) Ableitung(sbaum) für w ∈ X + enthält |w| Produktionen; 

das erlaubt wie oben die Definition einer Entscheidungsprozedur für 

die Zugehörigkeit zu L(G) ; 

Grammatiken in GNF können sehr leicht in Kellerautomaten (verl. 

nächster Abschnitt) ohne ε-Übergänge umgewandelt werden. Diese 

sind insofern nützlich, als sie immer terminieren. 




Leider ist die Umwandlung einer beliebigen kfG in eine äquivalente kfG in 

GNF noch umständlicher, als die Umwandlung in CNF. Insofern gehen die 

Beweis der folgenden Ergebnisse über den Rahmen dieser Vorlesung hinaus. 

Lemma 

Jede kf Sprache wird durch eine kfG G = 〈V, X , S, 

höchstens S nullierbar ist; 

Konstanten nur in Produktionen der Form A 

keine links-rekursive Produktion der Form U 

vorkommt. 

〉 erzeugt, bei der 

a ∈ X auftreten; 

Uv ∈ {U}(V + X ) ∗ 

Während die ersten beiden Bedingungen mittels (Del) und (Term) 

realisiert werden können, ist die dritte nicht so einfach umzusetzen. 

Satz 

Jede kontextfreie Sprache wird durch eine kfG in GNF erzeugt. 

Aber einige Konsequenzen sind durchaus für uns interessant: 




Proposition 

Für jede kontextfreie Sprache M ∈ X ∗ und jedes Wort w ∈ X ∗ sind die 

Residuierungen {w}\M bzw M/{w} wieder kontextfrei. 

Beweis. 

Es genügt, sich auf Wörter der Form a ∈ X zu beschränken. Wähle eine 

Grammatik G = 〈V, X , S, 〉 mit L(G) = M in GNF, bei der oBdA S 

nicht auf der rechten Seite einer Produktion vorkommt. 

Wir ersetzen jede Produktion @ aT ∈ X V ∗ durch @ T , entfernen 

alle Produktionen @ bT mit b ≠ a und erhalten eine kfG G ′ . Der 

Vergleich der G -Ableitungsbäume und der G ′ -Ableitungsbäume zeigt 

L(G ′ ) = {a}\M . Aufgrund der Abgeschlossenheit kontextfreier Sprachen 

unter Spiegelung ist auch M/{a} kontextfrei. 

Dieses Ergebnis eignet sich wie das Lemma von Ogden bzw. das PL(kf) 

zur Widerlegung der Kontextfreiheit mancher Sprachen. 




Beispiel 

Wir wissen bereits, daß die Sprache L = { a i b j c k d l : i = j = k ∨ l = 0 } 

nicht kontextfrei ist. Mit Hilfe des obigen Ergebnisses können wir aber das 

Lemma von Ogden umghen: Da folgende Sprache nicht kontextfrei ist 

L/{d}∩{a, b, c} ∗ = { a n b n c n :n ∈ N }{d} ∗ ∩{a, b, c} ∗ = { a n b n c n :n ∈ N } 

können weder L/{d} (wegen der Regularität von {a, b, c} ∗ ) noch L 

(nach obigem Satz) kontextfrei sein. 

Achtung: Hierdurch wird das Lemma von Ogden nicht überflüssig! 

Man betrachte etwa die Sprache 

L ′ = { a i b j c k d l : i = j = l ∨ k = 0 } 

Hier hilft der Residuierungstrick nicht weiter, während das Lemma von 

Ogden wie zuvor angewendet werden kann. 




Satz 

Homomorphe Urbilder kontextfreier Sprachen sind wieder kontextfrei. 

Beweis. 

h 

Jeder Homomorphismus X ∗ Y ∗ ist durch seine Einschränkung 

X i X ∗ h 

Y ∗ eindeutig bestimmt. Ist G = 〈V, Y , S, 〉 eine kfG in 

GNF mit L(G) = M , so konsturiere h −1 [G] = 〈V, X , S, 

′ 〉 wie folgt: 

Falls für U ∈ V und a ∈ X eine G -Ableitungen der Form U 

∗ h(a)W 

mit W ∈ V ∗ existiert, so ist U ′ aW eine Produktion von h −1 [G] . 

Ersetzt man in einem h −1 [G]-Ableitungsbaum von w ∈ L(h −1 [G]) jeden 

Knoten durch den entsprechenden G -Baum, so erhält man einen 

G -Ableitungsbaum von h(w) ∈ M , d.h., w ∈ h −1 [M] . Umgekehrt lassen 

sich in einem G -Ableitungsbaum von h(s 0 s 1 . . . s n−1 ) ∈ M Teilbäume 

zusammenfassen, deren Ausgaben mit h(s i ) , i < n , beginnen. Daher 

folgt s 0 s 1 . . . s n−1 ∈ L(h −1 [G]) . 




Wozu sind Ergebnisse über homomorphe Bilder bzw. Urbilder gut 

Definition 

Die Dyck-Sprache D 1 über dem Alpahbet {(, )} aus einer öffnenden 

Klammer ( und einer schließenden Klammer ) besteht aus allen “korrekt 

geklammerten Ausdrücken”. 

Offenbar ist D 1 kontextfrei; sie wird z.B. von der kfG 〈{S}, {(, )}, S, 〉 

mit den Produktionen S ε | (S) | SS erzeugt. 

Der folgende Satz geht weit über den Rahmen dieser Vorlesung hinaus, ist 

aber eines the Highlights der Theorie formaler Sprachen (und hoffentlich 

ein Appetithappen für eine entsprechende Vorlesung): 

Satz (Chomsky-Schützenberger (1963)) 

Jede kontextfreie Sprache ist homomorphes Bild eines Durschschnitts einer 

regulären Sprache mit einem homomorphen Urbild von D 1 . 





Ziel: den Begriff des endlichen Automaten so zu verallgemeinern, daß 

genau die kontextfreien Sprachen akzeptiert werden. Als Sonderfall sollen 

sich endliche Automaten ergeben, die alle regulären Sprachen erkennen. 

Problem: Um eine kontextfreie aber nicht reguläre Sprache akzeptieren zu 

können, brauchen wir zwingend eine abzählbar unendliche Zustandsmenge. 

Ausweg: Zu jedem Zeitpunkt wird nur ein endlicher Teil dieser 

Zustandsmenge “sichtbar” bzw. zugänglich sein (Eisbergprinzip). Genauer: 

wir verwenden ein cartesisches Produkt einer endliche Menge “äußerer 

Zustände” (wie bei endlichen Automaten) und einer abzählbaren 

Parametermenge der Form B ∗ für B endlich. Für nichtleere Parameter 

möge nur das erste Symbol “sichtbar” sein. Falls B = ∅ , also B ∗ = {ε} , 

soll der Automat wie ein εNEA aussehen. Im allgemeinen Fall kann ein 

Zustandswechsel auch den Wert des Parameters durch Ersetzen des 

“sichtbaren” Teils ändern, wobei der “unsichtbare” Teil wachsen kann. 




Weitere Vorüberlegungen: 

⊲ Endliche Automaten erkennen Wörter in einem Durchlauf von links 

nach rechts, wobei NEAs (wie auch (v)DEAs) pro Schritt genau einen 

und εNEAs höchstens einen Buchstaben abarbeiten. 

⊲ Wie auf Seite 116/117 gesehen, entsprechen NEAs mit einem 

Anfangszustand dabei im Wesentlichen rechts-linearen kfG’n in GNF: 

zunächst wird pro Ableitungsschritt eine Konstante erzeugt; zum 

Schluß wird die Variable entfernt oder durch eine Konstante ersetzt. 

⊲ Für allgemeine kfG’n in GNF ist der Verbleib der zusätzlichen 

Output-Variablen zu klären. Diese sind zwecks späterer Verwendung 

zwischenzuspeichern, brauchen aber erst sichtbar zu werden, wenn 

alle vorherigen Variablen verbraucht worden sind. 

⊲ Letztlich existiert für jede kfG ein Automat, bei dem (V + X ) ∗ zur 

cumulativen Speicherung der bisher nicht bearbeiteten Teile der 

rechten Seiten bisher verwendeter Produktionen dient. 

Wir führen nun den Datentyp des “Kellers” bzw. “Stacks” ein. 




Definition 

Für eine Menge B besteht ein Keller oder Stack vom Typ B aus der 

Menge B ∗ zusammen mit zwei inversen Operationen 

definiert durch 

{ε} + B × B ∗ 

push 

pop 

push(ε) = ε , push(b, m) := bm 

{ 

〈b, n〉 falls m = bn mit b ∈ B und n ∈ B ∗ ; 

pop(m) = 

ε falls m = ε. 

Wir vereinbaren, Stacks horizontal als Wörter über B zu schreiben und 

von links zu befüllen, damit liefert pop im nichtleeren Fall das erste 

Element und den verbleibenden Rest-Stack. 

B ∗ 




Definition (Kellerautomat) 

Ein Kellerautomat K = 〈Q, B, X , δ, I , F 〉 besteht aus 

einer endlichen Menge Q äußerer Zustände; 

einer endlichen Menge B (Kelleralphabet) und einem Alphabet X ; 

Relationen Q × (B ε ) 

δ(a) 

Q × B ∗ für a ∈ X ε ; 

Mengen von (äußeren) Anfangs- bzw. Endzuständen I , F ⊆ Q . 

K heißt deterministisch, sofern 

es höchstens einen Anfangszustand q 0 gibt; 

die Relationen δ(a) , a ∈ X ε , sämtlich partielle Funktionen sind; 

D(δ(ε)) ∩ D(δ(a)) = ∅ für alle a ∈ X ; 

F ; δ(ε) ⊆ F . 

Achtung: Für B = ∅ erhalten wir im Wesentlichen die Definition eines 

εNEA, denn in diesem Fall ist B ε = {ε} + B ∼ = B ∗ = {ε} ein-elementig. 




Bei den Zuständen sollte eigentlich unterschieden werden zwischen 

globalem oder parametrisiertem Zustand 〈q, m〉 ∈ Q × B ∗ , in dem 

sich der Automat K befindet; falls B ≠ ∅ ist diese Menge unendlich; 

äußerem Zustand q ∈ Q als Bindeglied zu εNEAs ( B = ∅ ); 

innerem Zustand m ∈ B ∗ zur Speicherung unbeschränkt großer 

endlicher Informationen, von denen nur eine aktuell zugänglich ist; 

sichtbarem Zustand 〈q, b〉 ∈ Q × B ε , der die aktuell möglichen 

Übergänge bestimmt; diese Menge ist endlich. 

Arbeitsweise eines Kellerautomaten: 

⊲ Pro Schritt wird höchstens ein Buchstabe der Eingabe verarbeitet; 

⊲ 

Übergänge beschreiben differenzielle Zustandsänderungen abhängig 

vom “sichtbaren” Teil des aktuellen Kellers ( b für bm ∈ B + , bzw. ε 

sonst). Neben einer Änderung des äußeren Zustands ersetzt ein Wort 

r ∈ B ∗ den “sichtbaren” Teil des Kellers; mit r = ε kann ein 

vorhandenes Top-Element gelöscht werden; 

⊲ am Anfang und Ende möge der Keller leer sein (Konvention). 




Definition 

Elemente von Q × B ∗ × X ∗ heißen Konfigurationen des Kellerautomaten. 

Interpretation: aktueller globaler Zustand und Rest der Eingabe. 

〈q, bm, au〉 ⊢ 〈p, rm, u〉 gdw a ∈ X ε ∧ 〈〈q, b〉, 〈p, r〉〉 ∈ δ(a) 

〈q, ε, au〉 ⊢ 〈p, r, u〉 gdw a ∈ X ε ∧ 〈〈q, ε〉, 〈p, r〉〉 ∈ δ(a) 

spezifizieren eine Relation ⊢ (Folgekonfiguration) auf Q × B ∗ × X ∗ . 

Definition 

K = 〈Q, B, X , δ, I , F 〉 akzeptiert w ∈ X ∗ , falls Zustände q ∈ I und 

p ∈ F existieren mit 〈q, ε, w〉 ⊢ ∗ 〈p, ε, ε〉 . 

Einschub: Die relationale Beschreibung der Akzeptanz erfordert absolute 

statt differentielle Zustandsänderungen, daher ist Q × B ε δ(a) 

Q × B ∗ , 

a ∈ X ε , in Q × B ∗ γ(a) 

Q × B ∗ umzuwandeln: 




Definition 

Q × B ∗ 

γ(a) 

Q × B ∗ 

Q × pop 

Q × (〈id, ι〉 + B × B ∗ ) 

Q × ({ε} + B × B ∗ ) 

Q × B ∗ × B ∗ 

Q × concat 

δ(a) × B ∗ 

Q × ({ε} × B ∗ + B × B ∗ ) 

∼= 

Q × ({ε} + B) × B ∗ 

id 

〈id, ι〉 faßt die Spanne {ε} {ε} B ∗ aus Identität und Inklusion 

zu einer Abbildung {ε} {ε} × B ∗ zusammen. Die Distributivität von 

× über + liefert den unteren Isomorphismus. 

Die Akzeptanz von Wörtern durch Kellerautomaten kann nun wie für 

εNEAs mittels Relationenprodukten der γ(a) , a ∈ X , formuliert werden. 

Wir werden das hier aber nicht weiterverfolgen. 

Jürgen Koslowski (TU-BS) Theoretische Informatik 1 WS 2010/2011 162 / 191 

ι



Darstellung von Kellerautomaten 

Wir entwickeln die graphische Darstellung von εNEAs fort. Falls b ∈ B ε 

so schreiben wir 

q 

b/a/r 

p 

anstelle von 

〈〈q, b〉, 〈p, r〉〉 ∈ δ(a) 

(Äußere) Anfangs- und Endzustände werden markiert wie zuvor. 

Auch wenn die resultierenden Graphen äußerlich den bekannten εNEAs 

entsprechen, ist zu beachten, daß die neuen Pfeile nicht notwendig 

komponierbar sind, da ihre Label auch Zustandsinformationen tragen: 

b/a/r b ′ /a ′ /r ′ ist (nicht) komponierbar, sofern 

q p o 

r ∈ B + (nicht) mit b ′ beginnt. 

Falls r = ε , kommt es auf das aktuelle Stack-Element unterhalb von b ′ 

an, ob eine Komposition möglich ist. 




Im Gegensatz zu εNEAs stellen die Graphen für Kellerautomaten keine 

lauffähigen Automaten dar, sondern sind bloß Alternativen zur tabellarischen 

Darstellung von δ . Um einen Durchlauf des Kellerautomaten 

nachzuvollziehen, ist zwingend über den gesamten Kellerinhalt 

buchzuführen, wie das etwa in Konfigurationen geschieht. 

Beispiel 

Die Dyck-Sprache D 1 der korrekt geklammerten Ausdrücke über den 

Alphabet X = {(, )} mit öffnender Klammer ( und schließender Klammer 

) wird von der kfG 〈{S}, {(, )}, S, 〉 mit den Produktionen 

S ε | (S) | SS erzeugt, und vom KA 〈{q 0 }, {(}, {(, )}, δ, {q 0 }, {q 0 }〉 mit 

folgenden Übergängen erkannt: 

start 

q 0 

ε/(/( 

(/)/ε 

(/(/(( 

( ) 

q 0 ε q 0 ( I , F 

( q 0 (( q 0 ε 




Beispiel 

Die Sprache L = { a n b n : n ∈ N } hat zwar eine einfachere Beschreibung 

als D 1 , benötigt aber einen Kellerautomaten mit zwei Zuständen. Das 

folgt weil L ≠ L ⋆ , wohingegen D 1 = D ⋆ 1 gilt. Ein Kellerautomat 

〈{q 0 , q 1 }, {a}, {a, b}, δ, {q 0 }, {q 0 , q 1 }〉 für L ist gegeben durch 

ε/a/a 

start 

q 0 

a/a/aa 

a/b/ε 

q1 

a/b/ε a b 

q 0 ε q 0 a I , F 

a q 0 aa q 1 ε 

q 1 ε F 

a q 1 ε 

Zwar hatten wir zur Motivation von Kellerautomaten speziell Grammatiken 

in GNF betrachtet, die den buchstabenweisen Aufbau der Wörter von links 

nach rechts ermöglichen, aber die folgende Idee, kfG’n in Kellerautomaten 

zu übersetzen,funktioniert auch im allgemeinen Fall: 

Verwende den Stack zur Simulation der Produktionen 




Definition 

Zu einer kfG G = 〈V , X , S, 〉 definieren wir einen Kellerautomaten 

K(G) = 〈{q 0 , q 1 }, V + X , X , δ, {q 0 }, {q 1 }〉 wie folgt: 

start 

q 0 

ε/ε/S 

q1 

U/ε/ω 

a/a/ε 

mit U ω und a ∈ X 

Satz 

Jede kfG G = 〈V , X , S, 〉 erfüllt L(G) = L(K(G)) . 

Beweis 

Betrachte ω = ω 0 . . . ω n−1 ∈ (V + X ) n mit n > 0 und w ∈ X ∗ . Jede 

Konfigurationenfolge 〈q 1 , ω, w〉 ⊢ ∗ 〈q 1 , ε, ε〉 und jede Ableitung ω 

∗ w 

zerlegt w als w = w 0 . . . w n−1 mit 〈q 1 , ω i , w i 〉 ⊢ ∗ 〈q 1 , ε, ε〉 (nach 

Definition von K(G) ), bzw. w = w 0 ′ . . . w n−1 ′ mit ω i 

∗ w 

i ′, 

i < n . Dabei 

gilt ω i ∈ X gdw w i = ω i bzw. w 

i ′ = ω i . 





Für U ∈ V setzen wir L U := { w ∈ X ∗ : 〈q 1 , U, w〉 ⊢ ∗ 〈q 1 , ε, ε〉 } bzw. 

L ′ U := { w ∈ X ∗ : U ∗ w } sowie L a = L ′ a = {a} . 

Induktion über die Tiefe der Ableitungsbäume zeigt: ∀U ∈ V . L ′ U ⊆ L U 

Für Produktionen ohne Variablen im Output ist die Behauptung klar. 

Wir nehmen an, die Behauptung gilt für Baumtiefe < k . Falls w ∈ L ′ U 

einen Baum der Tiefe k benötigt, greift die Behauptung für alle 

Unterbäume der ersten Produktion S ω 0 . . . ω n−1 . Konkatenation der 

entsprechenden Teilwörter in L ′ ω i 

, i < n , liefert die Behauptung. 

Umgekehrt stellen wir fest, daß in 〈q 1 , U, w〉 ⊢ ∗ 〈q 1 , ε, ε〉 spontane 

Übergänge genau G -Ableitungsschritten entsprechen, während die 

nicht-spontanen Übergänge G -erzeugte Konstanten auf dem Stack mit 

der Eingabe vergleichen. somit folgt auch ∀U ∈ V . L U ⊆ L ′ U . 




Korollar 

Jede kontextfreie Sprache wird von einem Kellerautomaten akzeptiert 

Der Nachweis der umgekehrten Richtung ist etwas umständlicher. 

Satz 

Jede von einem Kellerautomaten akzeptierte Sprache ist kontextfrei. 

Beweisidee 

Der Kellerautomat K = 〈Q, B, X , δ, I , F 〉 wird zunächst normalisiert zu 

K ′ := 〈Q + {i, f }, B + {⊥}, X , δ ′ , {i}, {f }〉 . Für δ ′ -Übergänge gilt: 

〈〈q, b〉, 〈p, m〉〉 

mit b ∈ B bleibt erhalten; 

〈〈q, ε〉, 〈p, m〉〉 wird ersetzt durch 〈〈q, ⊥〉, 〈p, m⊥〉〉; 

〈〈i, ε〉, 〈q, ⊥〉〉 

〈〈p, ⊥〉, 〈f , ε〉〉 

mit q ∈ I wird neu hinzugefügt; 

mit p ∈ F wird neu hinzugefügt. 




Beweisidee (Fortsetzung) 

Man kann L(K) = L(K ′ ) zeigen; informell arbeitet K ′ nach dem ersten 

Übergang wie K , bis auf das Kellerende ⊥ . Ist nach Abarbeitung der 

Eingabe ein alter Endzustand erreicht, kann ein Keller der Form ⊥ geleert 

werden, was zur Akzeptanz im Zustand f führt. 

Für jedes 〈q, b, p〉 ∈ Q × (B + {⊥}) × Q setze 

U(q, b, p) := { w ∈ X ∗ : 〈q, b, w〉 ⊢ ∗ 〈p, ε, ε〉 } 

Diese Mengen zusammen mit S bilden die Variablen unserer Grammatik. 

Die ersten Produktionen sind 

S U(q, ⊥, f ) mit q ∈ I und U(p, ⊥, f ) ε mit p ∈ F 

Offenbar gilt L(K ′ ) = ⋃ q∈I 

U(q, ⊥, f ) . Die übrigen Produktionen werden 

durch die K ′ -Übergänge induziert (die Idee dazu liefern Systeme 

semantischer Ungleichungen, vergl. S. 109ff). 




Beweisidee (Fortsetzung) 

Jeder K ′ -Übergang 〈〈q, c〉, 〈p, b 0 . . . b n−1 〉〉 ∈ δ ′ (a) mit q, p ∈ Q , 

c ∈ B + {⊥} , n ∈ N , b i ∈ B für i < n , a ∈ X ε und jede Zustandsfolge 

z ∈ Q n induziert eine Produktion 

U(q, c, z n−1 ) aU(p, b 0 , z 0 )U(z 0 , b 1 , z 1 ) . . . U(z n−2 , b n−1 , z n−1 ) 

Interpretation: der Übergang von q in den Zustand z n−1 unter Abbau 

genau eines Stackelements c kann mittels eines Worts aw 0 . . . w n−1 

erfolgen, falls nach Verarbeitung des Inputs a , Übergang in den Zustand 

p und Aufstocken des Stacks um b 0 . . . b n−1 dieser mittels der Wörter w i 

und der Zwischenzustände z i wieder abgebaut werden kann. 

Mit den früheren Produktionen zeigt dies L(G) = L(K ′ ) = L(K) 

Obige Produktionen haben fast Greibach Normalform, allerdings 

müssen die Outputs nicht mit einer Konstante beginnen. 

I.A. sind viele Variablen unproduktiv oder unerreichbar. 




Erlaubt man mehr als einen Stack, können Sprachen akzeptiert werden, die 

nicht kontextfrei sind: 

Beispiel 

L = { a n b n c n : n ∈ N } wird von einer 2-Stack-Maschine akzeptiert: Idee: 

ausgehend von zwei leeren Stacks befülle den ersten Stack mit allen 

Symbolen a , den zweiten Stack mit allen Symbolen b und überprüfe, ob 

die Anzahl der Symbole c mit der Länge beider Stacks übereinstimmt. 

Auf diese Weise erhalten wir eine Hierarchie von Maschinen: 

⊲ Kellerautomaten “ohne Stack” ( B = ∅ ), d.h., εNEAs; diese erkennen 

genau die regulären Sprachen; 

⊲ (normale) Kellerautomaten mit einem Stack; diese erkennen genau die 

kontextfreien Sprachen; 

⊲ Kellerautomaten mit zwei Stacks; diese erweisen sich als äquivalent zu 

(den populäreren) Turing-Maschinen und sind die mächtigsten 

bekannten Automaten. Erlaubt man mehr als zwei Stacks, wird die 

Klasse der akzeptierten Sprachen nicht größer (vergl. TheoInf2). 




Definition 

Eine Sprache heißt deterministisch kontextfrei, wenn sie von einem 

deterministischen Kellerautomaten erkannt werden kann. 

Beispiel 

Die Sprachen D 1 und { a n b n : n ∈ N } sind deterministisch kontextfrei, 

denn die auf den Seiten 152 bzw. 153 angegebenen Kellerautomaten für 

diese Sprachen sind deterministisch: 

In beiden Fällen gibt es keine spontanen Übergänge. Damit reduziert sich 

die Überprüfung des Determinismus darauf festzustellen, ob mehrere 

Kanten vom selben sichtbaren Zustand aus dasselbe mittlere Label tragen. 

Proposition 

Die Klasse der deterministisch kontextfreien Sprachen enthält die Klasse 

der reguären Sprachen echt. 

Aber ist jede kontextfreie Sprache schon deterministisch kontextfrei 




Satz 

Durchschnitte von regulären mit (deterministisch) kontextfreien Sprachen 

sind wieder (deterministisch) kontextfrei. 

Beweis. 

Betrachte Kellerautomaten K i = 〈Q i , B i , X i , δ i , I i , F i 〉 , i < 2 , mit 

B 0 = ∅ . Also ist K 0 ein verkappter εNEA. Der Durchschnittsautomat 

K := 〈Q 0 × Q 1 , B, X 0 ∩ X 1 , δ, I 0 × I 1 , F 0 × F 1 〉 habe folgende Übergänge: 

b/a/r 

〈q, p〉〈q ′ , p ′ 〉 in K 

gdw 

a 

q q ′ in K 0 

b/a/r 

p p ′ 

in K 1 

Akzeptierende K -Berechnungen entsprechen genau Paaren akzeptierender 

K i -Berechnungen, folglich gilt L(K 0 ∩ K 1 ) = L(K 0 ) ∩ L(K 1 ) . 

Im Falle von B 0 ≠ ∅ können wir keinen gemeinsamen Stack finden, da die 

Längen der Einzel-Stacks im Allgemeinen unabhängig fluktuieren. 




Proposition 

Für eine deterministisch kontextfreie Sprache L ∈ X ∗ 

und k ∈ N ist auch 

deterministisch kontextfrei. 

P k (L) = { w ∈ L : |{ u ∈ L : u ≤ w }| = k } 

Beweisidee 

Ausgehend von einem deterministischen Kellerautomaten K für L ersetzt 

man die Menge Q der äußeren Zuständen durch Q × (k + 1) × 2 . 

Die erste der “Buchhaltungkomponenten” zählt, wieviele Präfixe des zu 

bearbeitenden Wortes bereits als Elemente von L identifiziert wurden. 

Solange diese Zahl kleiner ist als k , drückt die zweite, Boole’sche, 

Komponente aus, ob die Eingabe schon mitgezählt wurde. Sonst 

verwendet man sie um festzustellen, ob Anzahl der Präfixe in L mit k 

übereinstimmt, oder größer ist. Dies funktioniert, da alle Wörter aus L 

genau eine Berechnung haben. 




Beispiel 

Annahme: die kontextfreie Sprache L = { w sp(w) : w ∈ {a, b} ∗ } ist 

deterministisch kontextfrei. Dann hat auch die Sprache L ′ := P 3 (L) ∩ R 

mit R = L ((ab) + (ba) + (ab) + (ba) + ) diese Eigenschaft. L ′ enthält alle 

Wörter r sp(r) ∈ R mit einem echten Präfix ε ≠ t sp(t) . Falls t mit a 

endet, folgt t = r , Widerspruch. Also muß t mit b enden. Symmterrie 

und die Präfixeigenschaften zeigen 

L ′ = { (ab) p (ba) p+j (ab) p+j (ba) p : p > 0 ∧ j ∈ N } 

Für n > 0 betrachte eine Zerlegung (ab) n (ba) n (ab) n (ba) n = vwxyz mit 

wy ≠ ε und |wxy| ≤ n . Damit u k = vw k xy k z ∈ L ′ für alle k ∈ N , 

dürfen aa und bb weder in w noch in y enthalten sein. Falls w in 

einem Teilwort (ab) n bzw (ba) n enthalten ist, muß y im folgenden 

Teilwort (ba) n bzw. (ab) n enthalten sein, woraus u 0 /∈ L ′ folgt. Nach 

dem PL(kf) ist L ′ also nicht kontextfrei, und somit L ebensowenig. 




Die Klasse der deterministisch kontextfreien Sprachen hat recht 

ungewöhnliche Abschlußeigenschaften: 

⊲ nicht unter binären Durchschnitten, vergl. HA.; 

⊲ unter Komplementbildung (umständlich); aufgrund der 

de Morgan’schen Regeln also nicht unter binären Vereinigungen; 

⊲ weder unter Konkatenation noch unter Iteration; 

⊲ nicht unter der Spiegeloperation. Dies schließt eine Charakterisierung 

der deterministisch kontextfreien Sprachen durch eine leicht 

beschreibbare Klasse von kontextfreien Grammatiken aus. 

Insbesondere kann es nicht genügen zu fordern, daß jede Variable nur 

als Input einer einzigen Produktion auftritt. 

Von Programmiersprachen muß man verlangen, daß sie in geeigneter Form 

deterministisch und mit Hilfe von Grammatiken darstellbar sind. 

Möglicherweise haben wir hier eine Demarkationslinie zwischen Mathematik 

und Informatik erreicht. 




Definition 

Unter einem Parser für eine kfG G versteht man ein Programm, das die 

Zugehörigkeit eines Worts w zu L(G) entscheidet, indem es einen 

Ableitungsbaum konstruiert. 

Wir sind natürlich vorrangig an deterministischen Parsern interessiert. 

Definition 

Unter einer LR(k)-Grammatik G versteht man eine kfG, für die ein 

deterministischer Parser existiert, der für jedes w ∈ L(G) in einem 

Durchlauf von links eine Rechtsableitung von w erzeugt und dabei 

höchstens k Symbole im Voraus liest. 

Definition 

Eine kontextfreie Sprache heißt LR(k)-Sprache, wenn sie von einer 

LR(k)-Grammatik erzeugt werden kann. 




Die folgenden Ergebnisse werden sicherlich in anderen praxisorientierten 

Vorlesungen angesprochen werden: 

Satz 

Die Klasse der deterministisch kontextfreien Sprachen ist die Vereinigung 

der Klassen aller LR(k)-Sprachen mit k ∈ N . 

Satz 

Für jedes k ∈ N ist die Klasse der LR(k)-Sprachen in der Klasse der 

LR(1)-Sprachen enthalten. Damit entspricht letztere der Klasse der 

deterministisch kontextfreien Sprachen. 

LR(1)-Sprachen erlauben einen tabellen-basierten Anzatz zum 

deterministischen Parsen; leider können diese Tabellen unpraktikabel groß 

werden. 

Eine eingeschränkte Klasse läßt sich aber mit sogenannten LARL-Parsern 

(lookahead LR-Parsern) effizient behandeln, und dies schließt fast alle in 

der (Informatik-) Praxis relevanten Sprachen ein. 


mathematischer Hintergrund 

Mengen 

Mathematischer Hintergrund 

Definition (Menge, Element) 

Eine Menge ist eine Zusammenfassung unterscheidbarer Objekte zu einer 

Gesamtheit. Die Zugehörigkeit eines Objekts a zu einer Menge A wird 

mit a ∈ A ausgedrückt; a heißt Element von A . 

Definition 

Speziell hat die leere Menge ∅ keine Elemente, während N die Menge der 

natürlichen Zahlen 0, 1, 2, . . . bezeichnet. 

Definition (Teilmenge, Potenzmenge) 

A heißt Teilmenge von B ( A ⊆ B ), falls x ∈ A ⇒ x ∈ B . Die 

Potenzmenge P(B) besteht aus allen Teilmengen von B . 

Jede Menge A erfüllt A ⊆ A , ∅ ⊆ A , A ∈ P(A) und ∅ ∈ P(A) . 



Mengen 

Definition (Aussonderung) 

Ist A eine Menge und ϕ eine Eigenschaft, die Objekte haben können, so 

bezeichnet 

A(ϕ) := { x : x ∈ A ∧ ϕ(x) } ⊆ A 

die Teilmenge aller Elemente aus A mit der Eigenschaft ϕ ; alternative 

Schreibweise: A(ϕ) = { x ∈ A : ϕ(x) } . Daß es sich bei A(ϕ) wirklich um 

eine Menge handelt, ist der Inhalt des Aussonderung-Axioms (engl. 

comprehension). 



Mengen 

Definition (Durchschnitt, Vereinigung) 

Der Durchschnitt bzw. die Vereinigung zweier Mengen A und B sind 

gegeben durch 

A ∩ B := { x : x ∈ A ∧ x ∈ B } 

A ∪ B := { x : x ∈ A ∨ x ∈ B } 

Im Falle einer Teilmenge A ⊆ P(X ) erhalten wir 

⋂ 

A := { x : ∀A ∈ A. x ∈ A } ⊆ X 

⋃ 

A := { x : ∃A ∈ A. x ∈ A } ⊆ X 



Mengen 

Definition (cartesisches Produkt) 

Das cartesische Produkt zweier Mengen A und B ist 

A × B := { 〈a, b〉 : a ∈ A ∧ b ∈ B } 

wobei 〈a, b〉 ein geordnetes Paar bezeichnet. Die Spezifikation für 

geordnete Paare verlangt 

〈a, b〉 = 〈c, d〉 gdw (a = c ∧ b = d) 

Im Spezialfall A = B schreiben wir abkürzend A n für das n-fache 

cartesische Produkt von A mit sich. 

Achtung: Die Schreibweise ( ) n für ein n-faches Produkt wird auch in 

anderen Situationen benutzt, ist also kontextsensitiv. 



Mengen 

Definition (disjunkte Vereinigung) 

Die Summe oder disjunkte Vereinigung zweier Mengen A and B : 

A + B := (A × {0}) ∪ (B × {1}) 

Jede andere Methode zur “Disjunktifizierung” der Mengen A und B ist 

ebenfalls zulässig, z.B. folgende von Paul Taylor 

A + B ∼ = { 〈U, V 〉 ∈ P(A) × P(B) : |U| + |V | = 1 } 

Proposition 

Die Menge X ∗ 

aller endlichen Wörter über einer Menge X erfüllt 

X ∗ = ∑ { X n : n ∈ N } 

Return 




Definition (Relation, partielle Funktion, Funktion) 

Unter einer Relation r von einer Menge A in eine Menge B verstehen 

wir eine Teilmenge r ⊆ A × B ; Schreibweise: A r B. Ihr 

Definitionsbereich ist D(r) := { a ∈ A : ∃b ∈ B. 〈a, b〉 ∈ r } . Die 

Komposition mit einer Relation B s C definiert man als 

r; s := {〈a, c〉 ∈ A × C : ∃b ∈ B. 〈a, b〉 ∈ r ∧ 〈b, c〉 ∈ s } 

Eine Relation A r B heißt partielle Funktion (A r B), bzw. Funktion 

(A r B), falls jedes a ∈ A zu höchstens, bzw. genau, einem b ∈ B in 

Relation steht (das dann mit r(a) bezeichnet wird). 

D.h., wir identifizieren (partielle) Funktionen mit ihren “Graphen”. Die 

“Verknüpfung” von Funktionen A f B g C erfüllt g ◦ f = f ; g . 

Return 




Definition (spezielle Relationen) 

Für jede Menge A setze ∆ A = { 〈a, a〉 : a ∈ A } . 

Die zu A r B duale Relation B r op A ist durch 〈b, a〉 ∈ r op 

gdw. 〈a, b〉 ∈ r spezifiziert. 

A r A heißt 

( r ) reflexiv, falls r 0 := ∆ A ⊆ r ; 

( t ) transitiv, falls r; r ⊆ r ; 

(s) symmetrisch, falls r = r op ; 

(a) antisymmetrisch, falls r ∩ r op ⊆ ∆ A ; 

(PO) Prä-Ordnung, sofern (r) und (t) erfüllt sind; 

(HO) Halbordnung, sofern (r), (t) und (a) erfüllt sind; 

(ÄR) Äquivalenzrelation, sofern (r), (t) und (s) erfüllt sind. 

r ∗ = ⋃ n∈N r n heißt reflexive transitive Hülle von A r A. 

Relationen 1 B sind Teilmengen von B . 

Funktionen 1 B sind Elemente von B . Return 




Definition 

(a) Für eine ÄR E ⊆ Q × Q ist [q] E := { p ∈ Q : p E q } die 

Äquivalenzklasse von q bzgl. E . 

(b) Eine Partition K ⊆ P(Q) von Q besteht aus nichtleeren paarweise 

diskunkten Teilmengen von Q mit ⋃ K = Q . 

Satz 

Die Äquivalenzrelationen auf einer Menge Q entsprechen bijektiv den 

Partitionen der Menge Q . 

Beweis. 

Die Äquivalenzklassen einer ÄR partitionieren Q . Umgekehrt definiert 

man Elemente von Q als äquivalent, wenn sie zur selben Menge in der 

Partition gehören. 




Proposition 

Jede Abbildung Q L B induziert eine Äquivalenzrelation ∼ L via 

p ∼ L q gdw . L(p) = L(q) 

Das L-Bild L[Q] = { L(q) : q ∈ Q } ist in canonischer Weise isomorph zur 

sogenannten Faktormenge Q/∼ L := { [q] ∼L : q ∈ Q } aller 

∼ L -Äquivalenzklassen. 

Beispiel 

Die Preisfunktion auf allen Artikeln eines Supermarkts: Toilettenpapier 

ist äquivalent zu Haarfestiger, ist äquivalent zu Dosen-Kohlrabi. . . 

Division durch n mit Rest: liefert die Funktion 

N modn n = { i : i < n }. 

Minimierung 



Tupel als Funktionen 

Definition 

B A bezeichnet die Menge aller Funktionen von A nach B . 

Dies imitiert die Schreibweise B n für die Menge aller n-Tupel über B , 

also das n-fache cartesische Produkt der Menge B mit sich. 

Interpretiert man die Zahl n als Menge ihrer Vorgänger, d.h., 

n = { k ∈ N : k < n } und speziell 0 = ∅ 

so stimmen n-Tupel über B mit Funktionen n 

Folgerung 

ε 

B überein. 

Alle Inklusionsabbildungen ∅ X , X eine Menge, stimmen mit der 

einzigen Teilmenge ∅ ⊆ ∅ × X = ∅ überein. 




Definition 

Eine Menge B heißt abzählbar, wenn es eine injektive Abbildung B 

gibt. Anderfalls heißt sie überabzählbar. 

N 

Satz 

Teilmengen, endliche cartesische Produkte und abzählbare Vereinigungen 

abzählbarer Mengen sind wieder abzählbar. Dagegen sind Potenzmengen 

abzählbar unendlicher Mengen überabzählbar. 

Beweis für Teilmengen 

Für jede Teilmenge C einer abzählbaren Menge ist die Inklusionsabbildung 

C i B injektiv, also auch ihre Komposition mit einer 

injektiven Abbildung B j N. 




Beweis für binäre cartesische Produkte 

Es genügt, die Abzählbarkeit von N × N zu zeigen: 

4 

3 

2 

1 

10 

9 

3 

2 

11 

8 12 

4 7 13 

0 0 1 5 6 14 

0 1 2 3 4 

Beweis für abzählbare Vereinigungen 

⋃ { Bi : i ∈ N } = ∑ { B i − ⋃ { B j : j 

Also genügt, sich auf abzählbare disjunkte Vereinigungen zu beschränken. 

Aber N × N ist die disjunkte Vereinigung abzählbar vieler Kopien von N 

und abzählbar. 




Beweis für Potenzmengen 

Es genügt zu zeigen, daß P(N) überabzählbar ist. Wir nehmen an, 

g 

P(N) N ist injektiv. Aufgrund der Injektivität erfüllt 

K := { g(B) : B ⊆ N ∧ g(B) /∈ B } die Bedingung g(K) ∈ K 

gdw g(K) /∈ K , Widerspruch. (Dieses Argument funktioniert für jede 

Menge anstelle von N .) 

Folgerung 

Für jede nichtleere abzählbare Menge X ist X ∗ 

abzählbar unendlich. 

Beweis. 

X ∗ = ∑ { X n : n ∈ N } ist abzählbare disjunkte Vereinigung endlicher 

Produkte einer abzählbaren Menge. 

universelle Automaten

Handout - Institut fÃ¼r Theoretische Informatik - Technische ...

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?