Logik und Künstliche Intelligenz - Hochschule Heilbronn

Logik und 

Künstliche Intelligenz 

Vorlesung an der 

Hochschule Heilbronn 

(Stand: 25. Juli 2008) 

Prof. Dr. V. Stahl 

Copyright 2006 by Volker Stahl. All rights reserved.

“Mathematics may be defined as the subject 

in which we never know what we are talking about, 

nor whether what we are saying is true.” 

2 

Bertrand Russell

Inhaltsverzeichnis 

1 Why? 5 

2 Mengen 8 

2.1 Der Begriff der Menge . . . . . . . . . . . . . . . . . . . . . . 8 

2.2 Beziehungen zwischen Mengen . . . . . . . . . . . . . . . . . . 11 

2.3 Comprehension Principle . . . . . . . . . . . . . . . . . . . . . 17 

2.4 Russelsche Antinomie . . . . . . . . . . . . . . . . . . . . . . . 18 

2.5 Operationen auf Mengen. . . . . . . . . . . . . . . . . . . . . . 21 

2.6 Paare . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 

2.7 Kartesische Produkte . . . . . . . . . . . . . . . . . . . . . . . 30 

3 Relationen 33 

3.1 Der Begriff der Relation . . . . . . . . . . . . . . . . . . . . . 33 

3.2 Zerlegungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 

3.3 Äquivalenzrelationen und erste Beweistechniken . . . . . . . . 41 

3.4 Ordnungsrelationen . . . . . . . . . . . . . . . . . . . . . . . . 58 

3.5 Umkehrrelation . . . . . . . . . . . . . . . . . . . . . . . . . . 61 

4 Beweistechniken 63 

4.1 Allgemein anwendbare Beweistechniken . . . . . . . . . . . . . 63 

4.2 Beweistechniken für aussagenlogische Symbole . . . . . . . . . 64 

4.3 Beweistechniken für Quantoren . . . . . . . . . . . . . . . . . 66 

4.4 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . 69 

5 Funktionen 71 

5.1 Rechtseindeutige Relationen . . . . . . . . . . . . . . . . . . . 71 

5.2 Partielle Funktionen . . . . . . . . . . . . . . . . . . . . . . . 75 

5.3 Definitionsbereich, Wertebereich . . . . . . . . . . . . . . . . . 76 

5.4 Totale Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . 77 

5.5 Erweiterung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 

5.6 Komposition von Funktionen . . . . . . . . . . . . . . . . . . . 81 

5.7 Surjektiv, injektiv, bijektiv . . . . . . . . . . . . . . . . . . . . 84 

5.8 Umkehrfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . 92 

5.9 Funktionsterme für Umkehrfunktionen . . . . . . . . . . . . . 97 

5.10 Kommutativ, assoziativ, distributiv . . . . . . . . . . . . . . . 99 

5.11 Folgen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 

5.12 Abzählbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . 102 

3

6 Aussagenlogik 107 

6.1 Boolesche Funktionen . . . . . . . . . . . . . . . . . . . . . . . 107 

6.2 Rechengesetze für Boolesche Funktionen . . . . . . . . . . . . 109 

6.3 Formeln der Aussagenlogik . . . . . . . . . . . . . . . . . . . . 111 

6.4 Semantik der Aussagenlogik . . . . . . . . . . . . . . . . . . . 112 

6.5 Syntaktische Vereinfachungen . . . . . . . . . . . . . . . . . . 115 

6.6 Konjunktive Normalform . . . . . . . . . . . . . . . . . . . . . 116 

6.7 Tautologien . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 

6.8 Logische Schlussfolgerungen . . . . . . . . . . . . . . . . . . . 119 

7 Prädikatenlogik 123 

7.1 Syntax der Prädikatenlogik . . . . . . . . . . . . . . . . . . . . 123 

7.1.1 Terme, atomare Formeln, Formeln . . . . . . . . . . . . 123 

7.1.2 Freie und gebundene Variablen. . . . . . . . . . . . . . 125 

7.1.3 Substitution . . . . . . . . . . . . . . . . . . . . . . . . 127 

7.1.4 Syntaktische Vereinfachungen. . . . . . . . . . . . . . . 128 

7.2 Semantik der Prädikatenlogik . . . . . . . . . . . . . . . . . . 129 

7.3 Rechenregeln für Formeln der Prädikatenlogik . . . . . . . . . 134 

7.3.1 Äquivalente Formeln . . . . . . . . . . . . . . . . . . . 134 

7.3.2 Regeln der Aussagenlogik . . . . . . . . . . . . . . . . 135 

7.3.3 Regeln für Quantoren . . . . . . . . . . . . . . . . . . . 137 

7.3.4 Gebundene Umbenennung . . . . . . . . . . . . . . . . 138 

7.3.5 Pränex Normalform . . . . . . . . . . . . . . . . . . . . 139 

7.4 Logische Folgerungen . . . . . . . . . . . . . . . . . . . . . . . 140 

7.4.1 Schlussfolgerungsregeln . . . . . . . . . . . . . . . . . . 141 

7.4.2 Konsistenz . . . . . . . . . . . . . . . . . . . . . . . . . 142 

A Kardinalzahlen und Kontinuumshypothese 144 

B Axiomensysteme und Theorien 149 

B.1 Modellbasierte Theorien . . . . . . . . . . . . . . . . . . . . . 149 

B.2 Axiomatische Theorien . . . . . . . . . . . . . . . . . . . . . . 150 

C Zermelo-Fraenkel Set Theory 152 

C.1 Zorn’s Lemma . . . . . . . . . . . . . . . . . . . . . . . . . . . 159 

C.2 Wohlordnungsprinzip . . . . . . . . . . . . . . . . . . . . . . . 159 

D Neuman-Bernays-Gödel Set Theory 161 

E Literaturverzeichnis 162 

4

V. Stahl Logik und Künstliche Intelligenz Seite 5 

1 Why? 

Können Maschinen denken? Diese Frage wurde erstmals von Alan Turing 

im Jahr 1950 [21] gestellt, d.h. in einer Zeit als Computer in ihrer Entwicklung 

noch ganz am Anfang waren. Die Beantwortung dieser Frage scheiterte 

daran, dass wir zwar ein intuitives Verständnis der Begriffe “Denken” und 

“Intelligenz” haben, diese jedoch nicht exakt definieren, d.h. messbar machen 

können. Turing’s Ausweg bestand darin, sich ein Spiel zu überlegen, das nach 

unserer Intuition auf jeden Fall Intelligenz erfordert. Turing reduzierte seine 

Frage dann darauf, ob eine Maschine in der Lage ist, dieses Spiel so gut zu 

spielen wie ein Mensch. Auch heute sind Computer noch weit davon entfernt, 

in diesem Turing Test nur annähernd an die Leistungsfähigkeit des Menschen 

heranzukommen. 

Nach unserer Intuition setzt Intelligenz die Fähigkeit zu Denken voraus. 

Denken wiederum besteht im Wesentlichen aus einer Reihe von logischen 

Schlussfolgerungen, d.h. der Fähigkeit aus bekannten Fakten neues Wissen zu 

erschließen. Hiermit haben sich bereits die großen Griechischen Philosophen 

beschäftigt. Folgendes Beispiel geht auf Aristoteles zurück: 

Bekanntes Wissen 

• Jeder Mensch ist sterblich. 

• Sokrates ist ein Mensch. 

Erschlossenes Wissen 

• Sokrates ist sterblich. 

In der Tat ist auch eine Maschine in der Lage, solche Schlussfolgerungen zu 

ziehen. Sie versteht dabei allerdings nicht, was ein Mensch ist, oder was es 

bedeutet sterblich zu sein. Alles was eine Maschine kann ist Zeichenketten 

(Daten) nach bestimmten Regeln (Programmen) umzuformen. Damit logische 

Schlussfolgerungen maschinell durchgeführt werden können, sind somit 

zwei Schritte erforderlich: 

• Wissen muss durch Zeichenketten dargestellt werden (Wissensrepräsentation). 

• Es müssen Algorithmen zur Umformung dieser Zeichenketten gefunden 

werden, die logischen Schlussfolgerungen entsprechen (Wissensverarbeitung).


Die Schritte sind nicht voneinander unabhängig. Das Problem der Wissensrepräsentation 

könnte trivialerweise dadurch gelöst werden, dass man natürlichsprachlichen 

Text verwendet. Algorithmen, die Wissen in dieser Form verarbeiten 

können, sind allerdings äußerst komplex. Die derzeit erfolgreichsten 

Systeme verwenden die Sprache der Logik erster Ordnung zur Wissensrepräsentation 

und die Resolutionsmethode zur Wissensverarbeitung. In der 

Logik erster Ordnung würde das Beispiel von Aristoteles wie folgt aussehen: 

Bekanntes Wissen 

• ∀x Mensch(x) → Sterblich(x) . 

• Mensch(Sokrates). 

Erschlossenes Wissen 

• Sterblich(Sokrates). 

Ähnliche Mechanismen findet man auch in semantischen Netzen und objektorientierten 

Programmiersprachen. Hier würde man sagen, dass Menschen 

eine Spezialisierung (oder abgeleitete Klasse) der sterblichen Objekte sind, 

und dass Sokrates eine Instanz der Klasse Mensch ist. 

Um die Wissensverarbeitung zu vereinfachen ist es wichtig, bei der Wissensrepräsentation 

mit möglichst wenigen, allgemeinen Konzepten auszukommen. 

Eines dieser Konzepte sind Eigenschaften (Relationen). Im Beispiel 

sind Mensch und Sterblich Eigenschaften, die ein Objekt haben kann oder 

nicht. Sokrates ist ein konkretes Objekt (Konstante), auf welches diese Eigenschaften 

zutreffen. Um über Objekte im Allgemeinen zu sprechen, werden 

Variablen (im Beispiel x) verwendet. Logische Implikationen werden mit → 

bezeichnet. Das Symbol ∀ (Allquantor) bedeutet “für alle”. Der erste Satz 

besagt somit, dass für jedes Objekt x gilt, wenn x ein Mensch ist, dann ist 

x sterblich. Relationen können auch Eigenschaften beschreiben, die mehrere 

Objekte miteinander in Beziehung setzen, z.B. 

ÄlterAls(Sokrates, Aristoteles). 

Neben Relationen spielen Funktionen eine wichtige Rolle, um eindeutig Objekte 

identifizieren zu können, ohne ihnen einen konkreten Namen geben zu 

müssen, z.B. 

VaterVon(Sokrates). 

Relationen und Funktionen sowie deren Eigenschaften lassen sich sehr elegant 

durch Mengen beschreiben. Der Begriff der Menge ist übrigens für mathematische 

Verhältnisse relativ neu: Er wurde Ende des 19. Jahrhunderts


von Cantor eingeführt und gilt mittlerweile als Fundament für die gesamte 

Mathematik. 

In der Vorlesung werden wir uns zunächst ausgiebig mit Mengen, Relationen 

und Funktionen beschäftigen. Wir werden dabei die Sprache der 

Logik erster Ordnung bereits beispielhaft verwenden um die Notation zu 

vereinfachen. Als Vorläufer zur Logik erster Ordnung wird die Aussagenlogik 

behandelt, an der elementare Begriffe wie z.B. “logische Schlussfolgerungen” 

erklärt werden können. Anschließend wird die wesentlich ausdrucksstärkere 

Sprache der Logik erster Ordnung formal exakt definiert. Besonders wichtig 

ist hierbei die Unterscheidung zwischen Syntax (Zeichenketten und deren 

maschinelle Verarbeitung) und Semantik (Bedeutung der Zeichenketten). 

Maschinen arbeiten ausschließlich auf der syntaktischen Ebene, während sich 

der Mensch ausschließlich für die Bedeutung der Dinge interessiert, über die 

er nachdenkt. Gerade an dieser Grenze zwischen Syntax und Semantik tauchen 

viele Probleme auf, von denen bewiesen wurde, dass sie unlösbar sind. 

Zum Schluss wird die Resolutionsmethode vorgestellt. Dies ist ein Algorithmus, 

mit dem Zeichenketten der Logik erster Ordnung so verarbeitet werden 

können, dass das Resultat einer logischen Schlussfolgerung auf semantischer 

Ebene entspricht. In gewissen Grenzen ist es also tatsächlich möglich, denkende 

Maschinen zu konstruieren.


2 Mengen 

Spätere Generationen werden die Mengenlehre als Krankheit betrachten, 

von der der Mensch genesen ist. 

Henri Poincaré 

...all mathematical theories may be regarded as extensions of 

the general theory of sets .... On these foundations I state that 

I can build up the whole of the mathematics of the present day. 

2.1 Der Begriff der Menge 

Nicolas Bourbaki, 1949 

Der Begriff der Menge bildet den Ausgangspunkt für alle mathematischen 

Überlegungen. Sämtliche anderen mathematischen Objekte wie Relationen, 

Funktionen und sogar Zahlen kann man als spezielle Mengen definieren. Dieser 

Zugang zur Mathematik geht auf Cantor und Frege zurück und entstammt 

dem Wunsch zu verstehen, was der eigentliche “Kern” der Mathematik ist. 

Abgesehen davon, dass dadurch viele Dinge einfacher und klarer werden, 

kommt diese Vorgehensweise insbesondere auch dem Informatiker entgegen: 

Will man mathematische Objekte im Rechner verarbeiten, so genügt es im 

Prinzip eine geeignete Datenstruktur für Mengen zu implementieren. 

Es ist sehr wichtig, keine unbewiesenen Annahmen zu treffen, 

aber noch wichtiger ist es, keine Worte zu benutzen, hinter denen 

sich kein klarer Sinn verbirgt. 

W. K. Clifford 

Nun kann zwar die ganze Mathematik auf dem Begriff der Menge aufgebaut 

werden, das bedeutet aber, dass man bei der Definition des Begriffs Menge 

auf keine anderen Objekte der Mathematik zugreifen kann. Dies führte zu 

Anfang des 20. Jahrhunderts zu einer großen Verwirrung, was genau unter 

einer Menge zu verstehen ist. Die bis dahin allgemein akzeptierte intuitive 

Vorstellung einer Menge führt nämlich — wie 1901 von Russel gezeigt — zu 

Widersprüchen. 

Folgende Definition stammt von Cantor aus dem Jahr 1895: 

Definition 2.1 (Menge,Element) 

Eine Menge ist eine Zusammenfassung M von wohlunterschiedenen 

Objekten unserer Anschauung oder unseres Denkens, welche 

Elemente von M genannt werden, zu einem Ganzen.


Notation 2.2 (∈, ∈) 

Um auszudrücken, dass ein Objekt x Element einer Menge M ist, 

schreibt man x ∈ M, ist x kein Element von M schreibt man x ∈ M. 

Notation 2.3 

Mengen kann man auf verschiedene Weisen schreiben. Die einfachste 

Möglichkeit ist die aufzählende Schreibweise in der man alle ihre Elemente 

hinschreibt. Hierzu verwendet man geschweifte Klammern, 

die Elemente werden durch Kommas getrennt. 

Beispiel 2.4 Die Menge M = {2, 3, 5} hat die Elemente 2, 3 und 5 und 

sonst keine weiteren Elemente. Es gilt also z.B. 5 ∈ M aber 7 ∈ M. 

Eine Menge ist einzig und allein dadurch definiert welche Objekte sie als 

Element enthält und welche nicht. Wenn zwei Mengen A und B genau die 

selben Elemente enthalten sind sie folglich gleich. Man schreibt dann A = B, 

andernfalls A = B. 

Notation 2.5 

Die Reihenfolge, in der die Elemente einer Menge hingeschrieben 

werden, spielt keine Rolle. 

Eine Menge M kann ein Objekt x entweder als Element enthalten oder nicht, 

es gilt also entweder x ∈ M oder x ∈ M. Insbesondere kann ein Objekt nicht 

“mehrmals” in einer Menge enthalten sein. Welche Menge ist also gemeint 

wenn man z.B. {3, 2, 2, 5, 5, 3, 5} schreibt? Eine Menge ist einzig dadurch 

definiert, welche Elemente sie enthält, in diesem Beispiel sind das die Zahlen 

2,3 und 5 und sonst nichts. Es handelt sich also um eine Menge mit genau 3 

Elementen, genauer gesagt um die Menge {2, 3, 5}, d.h. 

{2, 2, 3, 5, 5, 5} = {2, 3, 5}. 

Aus Gründen der einfacheren Lesbarkeit wird man natürlich wenn man eine 

Menge hinschreibt in aller Regel jedes Element nur einmal angeben. 

Eine spezielle Menge ist die Menge, die gar keine Elemente enthält. Diese 

Menge wird auch leere Menge genannt. 

Notation 2.6 

Die leere Menge wird durch {} oder auch ∅ bezeichnet.


Für jedes beliebige Objekt x gilt also x ∈ ∅. 

Mengen müssen ihre Elemente nicht notwendigerweise nur aus Zahlen 

rekrutieren. Laut Cantor können Mengen aus beliebigen Objekten unserer 

Anschauung oder unseres Denkens bestehen. Man kann also z.B. auch die 

Menge aller Häuser von Heilbronn definieren und wenn man Lust hat, zu 

dieser Menge noch die Zahl 23 dazunehmen. Es ist insbesondere also auch 

gar nicht nötig, dass die Elemente einer Menge in irgend einer Weise den 

selben Typ haben. 

In der Informatik findet man Mengen in Form von Datentypen. In Java 

oder C++ ist z.B. 

usw. 

int = {−2 31 , . . .,2 31 − 1} 

float = Menge der 32 Bit Gleitkomma Zahlen 

Dadurch dass wir uns mit Mengen beschäftigen, werden Mengen ihrerseits 

wiederum zu Objekten unserer Anschauung oder unseres Denkens. Man 

kann daher auch Mengen von Mengen bilden, d.h. Mengen, deren Elemente 

ihrerseits wiederum Mengen sind. 

Beispiel 2.7 Die Menge {2, 3}, {5} hat zwei Elemente, nämlich die 

Menge {2, 3} und die Menge {5}, d.h. 

{2, 3} ∈ {2, 3}, {5} 

{5} ∈ {2, 3}, {5} 

Es ist wichtig den Unterschied zwischen der Zahl 5 und der Menge {5} festzuhalten. 

Insbesondere gilt im vorigen Beispiel 

5 ∈ {2, 3}, {5} . 

Beispiel 2.8 Um die Verwirrung komplett zu machen betrachten wir 

nun im Gegensatz zum vorigen Beispiel die Menge {2, 3}, 5 . Diese 

Menge hat ebenfalls zwei Elemente, nämlich die Menge {2, 3} und die 

Zahl 5, d.h. 

{2, 3} ∈ {2, 3}, 5 

5 ∈ {2, 3}, 5 

aber 

{5} ∈ {2, 3}, 5


Man kann diesen Prozeß natürlich beliebig weitertreiben und z.B. Menge von 

Mengen von Mengen definieren und damit recht komplizierte Dinge aufbauen. 

Mengen mit endlich vielen Elementen bezeichnet man als endliche Mengen, 

Mengen mit unendlich vielen Elementen als unendliche Mengen. Bei 

unendlichen Mengen kann man natürlich nicht alle Elemente hinschreiben. 

Eine Möglichkeit besteht darin, einfach ein paar Elemente der Menge aufzuzählen 

und anzunehmen, dass der Leser sich schon denken kann welche 

Menge gemeint ist. 

Beispiel 2.9 

{1, 2, 3, . . .} Menge der natürlichen Zahlen, N 

{0, 1, 2, 3, . . .} Menge der natürlichen Zahlen mit Null, N0 

{. . .,−2, −1, 0, 1, 2, . . .} Menge der ganzen Zahlen, Z 

{2, 3, 5, 7, 11, . . .} Menge der Primzahlen 

Die Begriffe “endlich” und “unendlich” haben wir nicht exakt definiert und 

müssen uns daher zunächst auf unsere intuitive Vorstellung verlassen. Tatsächlich 

ist diese Angelegenheit manchmal recht verwirrend: So gibt es z.B. unendlich 

viele natürliche Zahlen, aber jede natürliche Zahl hat nur endlich viele Dezimalstellen. 

Die exakte Definition einer unendlichen Menge kommt in Anhang 

A. 

2.2 Beziehungen zwischen Mengen 

Im Folgenden seien A und B Mengen. 

 

Definition 2.10 (Teilmenge ⊆) 

A ist eine Teilmenge von B, geschrieben 

 

A ⊆ B, wenn jedes Element 

von A auch Element von B ist. 

 

Abbildung 2.1: Teilmenge


Beispiel 2.11 

{2, 3} ⊆ {2, 3, 5} 

N ⊆ Z 

∅ ⊆ N 

Z ⊆ Z 

Beispiel 2.12 Dass jeder Mensch sterblich ist, lässt sich unter Verwendung 

von Mengen auch so ausdrücken: Die Menge aller Menschen ist 

eine Teilmenge der Menge aller sterblichen Dinge. Da Sokrates Element 

der Menge aller Menschen ist, ist Sokrates somit auch Element 

der Menge aller sterblichen Dinge, siehe Bild 2.2. 

Sterblich 

Mensch 

Sokrates 

Abbildung 2.2: Jeder Mensch ist Sterblich und Sokrates ist ein Mensch. 

In der Mathematik und allgemein bei logischen Überlegungen trifft man immer 

wieder auf die selben Formulierungen: 

wenn ...dann ... 

...genau dann wenn ... 

...und ... 

...oder ... 

nicht ... 

für alle ...gilt ... 

es gibt ein ...so dass .... 

Um Zweideutigkeiten zu vermeiden, sollte man bei mathematischen Aussagen 

möglichst auf diese Formulierungen zurückgreifen. Die Teilmengendefinition 

lässt sich damit wie folgt schreiben:


A ist Teilmenge von B genau dann wenn 

für alle Objekte x gilt 

wenn x ∈ A 

dann x ∈ B. 

Hat man eine Aussage auf diese Form gebracht, kann man viel Schreibaufwand 

sparen, indem man Symbole für die häufig verwendeten Formulierungen 

verwendet: 

Symbol Bedeutung 

. . . → . . . wenn ...dann ... 

. . . ↔ . . . ...genau dann wenn ... 

. . . ∧ . . . ...und ... 

. . . ∨ . . . ...oder ... 

¬... nicht ... 

∀ . . . für alle ...gilt ... 

∃ . . . es gibt ein ...so dass ... 

Formulieren wir nun die Definition der Teilmengenbeziehung mit diesen Begriffen. 

A ist Teilmenge von B genau dann wenn 

für jedes Objekt x gilt: 

wenn x ∈ A ist, dann ist x ∈ B. 

Unter Verwendung der neuen Symbole kann man das sehr kompakt schreiben: 

A ⊆ B ↔ ∀x (x ∈ A → x ∈ B). 

Die Symbole ∀ und ∃ heißen Allquantor und Existenzquantor. In der Formel 

treten 3 Variablen auf: A, B und x, wobei sich der Allquantor auf x bezieht. 

Variablen, die einem Quantor zugeordnet sind, heißen gebundene Variablen, 

während A und B freie Variablen sind. 

Auf die Symbole →, ↔, ∧, ∨, ¬ werden wir in Kapitel 6 über Aussagenlogik 

genauer eingehen. Vorweg sei erwähnt, dass man mit diesen Symbolen 

Aussagen miteinander verknüpft. So werden z.B. die Aussagen x ∈ A und 

x ∈ B durch → verknüpft zu der Aussage x ∈ A → x ∈ B. Der Witz 

dabei ist, dass man aus den Wahrheitswerten der Teilaussagen sehr einfach 

auf den Wahrheitswert der Gesamtaussage schließen kann und zwar unter


X Y X ∧ Y X ∨ Y X → Y X ↔ Y 

wahr wahr wahr wahr wahr wahr 

wahr falsch falsch wahr falsch falsch 

falsch wahr falsch wahr wahr falsch 

falsch falsch falsch falsch wahr wahr 

X ¬X 

wahr falsch 

falsch wahr 

Tabelle 2.1: Wahrheitstabllen der aussagenlogischen Symbole. 

Verwendung von Wahrheitstabellen. Weiß man z.B. dass x ∈ A wahr ist, 

und x ∈ B falsch ist, dann weiß man, dass die Aussage x ∈ A → x ∈ B 

falsch ist. In Tabelle 2.1 sind die Wahrheitstabellen der aussagenlogischen 

Symbole zusammengefasst. Große Verständnisprobleme bereiten oft die unsymmetrischen 

Wahrheitswerte von →. Wie man der Tabelle entnimmt, ist 

die Aussagen X → Y immer wahr, wenn X falsch ist — ganz egal ob Y 

dann wahr oder falsch ist. Die Aussage “wenn Bäume rot sind, dann können 

Elefanten fliegen” ist somit rein logisch gesehen wahr. 

Beispiel 2.13 

• Die Aussage √ 2 ∈ Z → √ 2 ∈ N ist wahr. 

• Die Aussage √ 2 ∈ Z → √ 2 ∈ R ist wahr. 

• Die Aussage √ 2 ∈ R → √ 2 ∈ Z ist falsch. 

Statt A ⊆ B schreibt man auch B ⊇ A und sagt B ist eine Obermenge 

von A. In Kurzschreibweise liest sich diese Definition wie folgt: 

B ⊇ A ↔ ∀x (x ∈ A → x ∈ B). 

Ausdrücke dieser Form heißen Formeln der Prädikatenlogik. Abgesehen davon, 

dass man durch solche Formeln Aussagen sehr kompakt und unmissverständlich 

darstellen kann, haben sie noch einen weiteren Vorteil: Es gibt ein paar 

einfache Rechengesetze, nach denen diese Formeln umgeschrieben werden 

können, siehe Kapitel 7.3. Statt 

x ∈ A → x ∈ B 

kann man z.B. gleichbedeutend schreiben 

oder 

x ∈ B → x ∈ A 

x ∈ A ∨ x ∈ B 

usw. Dass diese Ausdrücke tatsächlich äquivalent sind, kann man durch folgende 

Wahrheitstabelle verifizieren:


x ∈ A x ∈ B x ∈ A → x ∈ B x ∈ B → x ∈ A x ∈ A ∨ x ∈ B 

wahr wahr wahr wahr wahr 

wahr falsch falsch falsch falsch 

falsch wahr wahr wahr wahr 

falsch falsch wahr wahr wahr 

Da es sich hierbei um Symbolmanipulation nach rein syntaktischen Regeln 

handelt, kann auch der Rechner solche Umformungen durchführen. Er muss 

hierbei nicht “verstehen” was die Formeln bedeutet, es genügt vollkommen 

wenn er die Rechengesetze kennt. Damit sind Maschinen in gewissen Grenzen 

in der Lage logische Schlussfolgerungen durchzuführen und Aussagen automatisch 

zu beweisen oder zu widerlegen. Mehr dazu in Kapitel ??. 

Definition 2.14 (Gleichheit von Mengen) 

A und B sind gleich, geschrieben A = B, genau dann wenn A ⊆ B 

und B ⊆ A. 

Oder kompakt: 

A = B ↔ (A ⊆ B ∧ B ⊆ A). 

Äquivalent kann man Mengengleichheit auch so definieren: 

A = B ↔ ∀x (x ∈ A ↔ x ∈ B). 

A und B sind also gleich, genau dann wenn sie die selben Elemente haben. 

Dies wird auch Extensionality Principle genannt. Nach unserer intuitiven 

Vorstellung einer Menge scheint das Extensionality Principle absolut selbstverständlich. 

Die Cantorschen Mengendefinition allein erzwingt jedoch nicht, 

dass es z.B. nur eine einzige Zusammenfassung der Zahlen 1, 2, 3 gibt. Man 

könnte sie z.B. einmal durch eine Plastiktüte zusammenfassen und ein anderes 

Mal in Geschenkpapier mit roter Schleife einwickeln. Dadurch würde man 

verschiedene Objekte erhalten, die aber die selben Elemente haben. Damit 

Mengen also tatsächlich dem entsprechen, was wir uns intuitiv unter ihnen 

vorstellen, muss das Extensionality Principle explizit gefordert werden. Man 

hätte es auch so formulieren können, dass es zu gegebenen Objekten nur eine 

einzige Menge gibt, die genau diese Objekte enthält. Aus dem Extensionality 

Principle folgt somit unter anderem, dass die Elemente einer Menge ungeordnet 

sind. Andernfalls ließen sich z.B. die Zahlen 1, 2, 3 zu unterschiedlichen 

Mengen zusammenfassen, die sich nur in der Reihenfolge der Elemente unterscheiden.


Definition 2.15 (Echte Teilmengen ⊂) 

A ist eine echte Teilmenge von B, geschrieben A ⊂ B, genau dann 

wenn A ⊆ B und A = B. 

Statt A ⊂ B schreibt man auch B ⊃ A und sagt B ist eine echte Obermenge 

von A. Die Formeln für A ⊂ B ist 

die Formel für A ⊃ B ist 

A ⊆ B ∧ A = B, 

A ⊇ B ∧ A = B. 

Alternativ kann man A ⊂ B auch so definieren, dass A ⊆ B ist und ausserdem 

B mindestens ein Element haben muss, das nicht in A ist. Die Formel 

hierfür ist 

A ⊆ B ∧ ∃x (x ∈ B ∧ x ∈ A). 

Dass diese beiden Definitionen der echten Teilmenge äquivalent sind, kann 

von einer Maschine in wenigen Millisekunden bewiesen werden. 

 

Definition 2.16 (Disjunkte Mengen) 

A und B heißen disjunkt wenn sie keine gemeinsamen Elemente 

haben. 

ÒØ×ÙÒØ ×ÙÒØ 

Abbildung 2.3: Disjunkte Mengen 

Um zu einer Formel zu kommen, schreiben wir die Definition von disjunkten 

Mengen etwas um: A und B heißen disjunkt, wenn es kein Objekt x gibt, das 

(gleichzeitig) in A und in B ist. Damit erhält man 

Allgemein darf man in einer Formel 

¬∃x (x ∈ A ∧ x ∈ B). 

¬∃x...


ersetzen durch 

∀x¬.... 

Damit erhält man die alternative Definition 

Weiterhin darf man 

ersetzen durch 

Damit erhält man 

∀x¬(x ∈ A ∧ x ∈ B). 

¬(. . . ∧ . . .) 

(¬...) ∨ (¬...). 

∀x (x ∈ A ∨ x ∈ B). 

Zurückübersetzt in natürliche Sprache besagt diese Formel, dass A und B 

disjunkt sind genau dann wenn jedes Objekt x entweder nicht in A oder 

nicht in B ist — was natürlich richtig ist. 

2.3 Comprehension Principle 

Meistens beschäftigt man sich mit Mengen, deren Elemente durch eine Eigenschaft 

E beschrieben sind, z.B. die Menge der Objekte, die die Eigenschaft 

erfüllen, eine gerade natürliche Zahl zu sein. 

Notation 2.17 

Die Menge, die aus genau den Objekten besteht, die eine Eigenschaft 

E erfüllen wird durch 

Beispiel 2.18 

{x | x erfüllt E} 

bezeichnet. Man sagt dazu auch “die Menge aller x, die E erfüllen”. 

• {x | x ist Primzahl } 

Menge der Primzahlen. 

• {x | x ∈ N und x ist durch 3 teilbar } 

Menge der durch 3 teilbaren, natürlichen Zahlen. 

• {p/q | p ∈ Z, q ∈ N} 

Menge der rationalen Zahlen Q.


Im letzten Beispiel hätte man eigentlich schreiben müssen 

{x | es gibt ein p ∈ Z und ein q ∈ N so dass x = p/q}, 

aber solang klar ist was gemeint ist, sind Vereinfachungen in der Notation 

durchaus erlaubt. 

Dass es zu jeder Eigenschaft E eine Menge gibt, die aus genau den Objekten 

besteht, die die E erfüllen, heißt Comprehension Principle. Es bedeutet, 

dass Mengen und Eigenschaften im Prinzip das Selbe sind: Eine Eigenschaft 

ist definiert durch die Menge aller Objekte, die die Eigenschaft erfüllen, und 

diese Menge ist wiederum durch die Eigenschaft definiert. Die Eigenschaft 

“rot” kann man z.B. definieren als die Menge aller roten Objekte oder die 

Zahl drei als die Menge aller dreielementigen Objekte. 

Das Comprehension Principle ist ein sehr mächtiges Instrument um Mengen 

zu definieren. Da es kein Objekt x gibt, für das x = x gilt, lässt sich auch 

die leere Menge mit dem Comprehension Principle definieren: 

2.4 Russelsche Antinomie 

∅ = {x | x = x}. 

Seit man begonnen hat, die einfachsten Behauptungen zu beweisen, 

erweisen sich viele von ihnen als falsch. 

Bertrand Russel 

Das Comprehension Principle scheint offensichtlich richtig, es erwies sich jedoch 

zu Anfang des 20. JH als verheerender Irrtum und stellte die gesamte 

Welt der Mathematik in Frage. Der Irrtum beschränkt sich nicht nur auf die 

Mengenlehre oder die Mathematik sondern manifestiert sich in allen Bereichen 

des logischen Denkens. Insbesondere ist er auch verantwortlich für die 

vielen unentscheidbaren Problemen der Informatik wie z.B. dem Halteproblem. 

Prominentestes Opfer dieses Irrtums war Frege, der gerade ein Werk über 

die Grundlagen der Mathematik basierend auf Mengen und Logik vollendet 

hat, als er den berühmten Brief von Russel bekam .... Hierin wird eine 

Eigenschaft E definiert, zu der es keine Menge 

gibt. 


Das Comprehension Principle erlaubt es, die Menge M aller Mengen zu 

definieren, d.h. 

M = {x | x ist eine Menge}.


Diese Menge enthält alle Objekte, die die Eigenschaft erfüllen eine Menge zu 

sein, also z.B. 

{2, 3, 5} ∈ M 

{2, 3}, 5 ∈ M 

∅ ∈ M 

Interessanterweise ist M selbst aber auch ein Objekt, das die Eigenschaft 

erfüllt eine Menge zu sein, und somit gilt 

M ∈ M. 

Es ist zunächst kontraintuitiv, dass eine Menge sich selbst als Element enthalten 

kann. Nach dem Comprehension Principle ist das aber völlig legitim. 

M ist bei weitem nicht die einzige Menge, die sich selbst enthält. Auch die 

Menge 

G = {x | x ist kein Gänseblümchen } 

enthält sich selbst: G ist eine Menge und somit kein Gänseblümchen, daher 

ist 

G ∈ G. 

Da jede Menge die Eigenschaft hat, kein Gänseblümchen zu sein, gilt 

M ⊆ G. 

Andererseits ist M aber auch kein Gänseblümchen, somit gilt 

M ∈ G. 

Weiterhin ist G eine Menge und daher auch 

G ∈ M. 

Es gibt also Mengen, die sich nicht nur selbst enthalten sondern auch gegenseitig 

und außerdem kann eine noch Teilmenge der anderen sein. Das alles 

entspricht zwar nicht gerade unserer intuitiven Vorstellung von Mengen, ist 

aber eine zwingende Folge des Comprehension Principles. 

Ein erstes Beispiel einer Eigenschaft, aus der sich keine Menge konstruieren 

lässt, wurde von Russel im Jahr 1901 gefunden und ging als Russelsche 

Antinomie in die Geschichte ein. Wie wir gesehen haben, gibt es (zugegebenermaßen 

recht seltsame) Mengen, die sich selbst enthalten. Bezeichnen wir 

die Menge aller Mengen, die sich selbst enthalten mit S, d.h. 

S = {x | x ist eine Menge und x ∈ x}.


Da M eine Menge ist, die sich selbst enthält (d.h. M ∈ M), gilt 

M ∈ S. 

Außerdem ist jedes Element von S eine Menge und somit 

S ⊆ M. 

Schauen wir uns nun die anderen (normalen) Mengen an, d.h. Mengen wie 

{1, 2, 3}, Q, ∅, usw., die sich nicht selbst enthalten. Es geht also um die 

Eigenschaft, eine Menge zu sein, die sich nicht selbst als Element enthält, d.h. 

eine harmlose Eigenschaft, die eigentlich von fast allem erfüllt wird außer so 

exotischen Dingen wie z.B. der Menge M aller Mengen. Sei also R die Menge 

aller Mengen, die sich nicht selbst als Element enthalten, d.h. 

Es gilt somit z.B. 

R = {x | x ist eine Menge und x ∈ x}. 

{1, 2, 3} ∈ R, Q ∈ R, ∅ ∈ R, M ∈ R, G ∈ R. 

Wir zeigen nun, dass R keine Menge ist, d.h. R ∈ M. Offensichtlich ist jede 

Menge entweder in R oder in S. Wenn R eine Menge wäre, müsste gelten 

entweder R ∈ R oder R ∈ S. 

Beide Möglichkeiten führen jedoch zu einem Widerspruch: 

• Angenommen R ∈ R, dann wäre laut Definition R eine Menge, die 

sich nicht selbst als Element hat, d.h. R ∈ R, was ein Widerspruch zur 

Annahme ist. 

• Angenommen R ∈ S. Dann wäre laut Definition R eine Menge, die sich 

selbst enthält, d.h. R ∈ R. Da aber R und S disjunkt sind, folgt R ∈ S, 

was ein Widerspruch zur Annahme ist. 

Es gilt also weder R ∈ R noch R ∈ S. Da aber jede Menge entweder in R 

oder in S ist, ist R keine Menge. Es gibt also tatsächlich Eigenschaften, aus 

denen keine Menge konstruiert werden kann! Diese bittere Erkenntnis war 

ein Schock für die gesamte mathematische Welt zu Anfang des 20. Jahrhunderts. 

Viele Theorien, die bis dahin auf einer intuitiven Vorstellungen des 

Mengenbegriffs basierten, mussten neu durchdacht und formuliert werden. 

Berühmte Mathematiker, wie z.B. Ernst Zermelo, Abraham Fraenkel, John 

von Neumann, Paul Bernays und Kurt Gödel (siehe Anhang C und D) haben


sich daraufhin mit der Entwicklung einer widerspruchsfreien Mengentheorie 

beschäftigt und darauf die gesamte Mathematik aufgebaut. 

Eine ähnliche logische Überlegung, wie sie hinter der Russelschen Antinomie 

steckt, führte 1931 zu den Gödelschen Unvollständigkeitssätzen. Diese 

besagen (anschaulich ausgedrückt), dass man die Korrektheit der Mathematik 

nicht mit den Methoden der Mathematik beweisen kann. Genau dies war 

jedoch das Ziel des Hilbertschen Programms, das damit gescheitert war. Die 

Stimmung der Zeit drückt folgendes Zitat aus: 

Niemand soll uns aus dem Paradies vertreiben, das Cantor geschaffen 

hat. 

David Hilbert 

ÅÅÒÐÐÖÅÒÒ Å É 

Ë×ÐØ×ÑÅÒÒ ××Ð×ØÒØÐØÒ ÊÒÓÖÑÐÅÒÒ ×ÒØ×Ð×ØÒØÐØÒ 

Aber das nur am Rande — die Eigenschaften mit denen wir uns beschäftigen 

werden, sind immer so, dass eine entsprechende Menge dazu existiert. Anders 

ausgedrückt: Das Comprehension Principle gilt nach wie vor in entsprechend 

eingeschränkter Form, siehe Anhang C. 

Abbildung 2.4: Russelsche Antinomie 

2.5 Operationen auf Mengen. 

Definition 2.19 (Mächtigkeit endlicher Mengen) 

Ist A eine endliche Menge, so ist die Mächtigkeit von A, geschrieben 

|A|, definiert als die Anzahl der Elemente von A. 

Beispiel 2.20 

|{2, 3, 5}| = 3 

|∅| = 0


Genaugenommen ist diese Definition der Mächtigkeit einer endlichen Menge 

nicht akzeptabel weil vorausgesetzt wird, was die “Anzahl” der Elemente 

einer Menge ist. Bisher haben wir ja noch nicht einmal definiert was Zahlen 

sind! Um es richtig zu machen, braucht man noch eine ganze Menge Theorie 

– die Lösung kommt in Anhang A. 

Definition 2.21 (Vereinigungsmenge) 

Die Vereinigungsmenge von A und B ist definiert als 

A ∪ B = {x | x ∈ A ∨ x ∈ B} 

Die Definition der Vereinigungsmenge zweier Mengen A und B beruht somit 

auf dem Comprehension Principle. Die zugrundeliegende Eigenschaft ist x ∈ 

A ∨ x ∈ B. 

Beispiel 2.22 

Schauen wir uns den Ausdruck 

{2, 3, 5} ∪ {3, 6, 9} = {2, 3, 5, 6, 9} 

N ∪ Z = Z 

{x | x ∈ A ∨ x ∈ B} 

genauer an. Es sind hier die Variablen A, B und x im Spiel. Man kann für A 

und B Mengen einsetzen und erhält dadurch wiederum eine Menge, nämlich 

die Vereinigungsmenge von A und B. Somit sind A und B freie Variablen. 

Wenn man für x ebenfalls eine Menge einsetzen würde, würde ein sinnloser 

Ausdruck herauskommen. Es handelt sich daher bei x um eine gebundene 

Variable. 

Definition 2.23 (Schnittmenge) 

Die Schnittmenge von A und B ist definiert als 

A ∩ B = {x | x ∈ A ∧ x ∈ B} 

Die Definition der Schnittmenge zweier Mengen A und B beruht somit auf 

dem Comprehension Principle. Die zugrundeliegende Eigenschaft ist x ∈ 

A ∧ x ∈ B. Offensichtlich sind A und B disjunkt genau dann wenn die 

Schnittmenge von A und B leer ist, d.h. 

A ∩ B = ∅.


Beispiel 2.24 

{−2, 5, 9} ∩ N = {5, 9} 

{x | x ∈ Q ∧ x > 5} ∩ {2, 3} = ∅ 

Definition 2.25 (Mengendifferenz) 

Die Mengendifferenz von A und B ist definiert als 

A \ B = {x | x ∈ A ∧ x ∈ B} 

Auch die Definition der Mengendifferenz zweier Mengen A und B beruht 

auf dem Comprehension Principle. Die zugrundeliegende Eigenschaft ist x ∈ 

A ∧ x ∈ B. 

Beispiel 2.26 

{2, 3, 5} \ {2, 6} = {3, 5} 

Z \ N = {0, −1, −2, . . .} 

Ò 

Abbildung 2.5: Vereinigungsmenge, Schnittmenge, Mengendifferenz 

 

Definition 2.27 (Potenzmenge) 

Die Potenzmenge von A ist definiert als 

P(A) = {B | B ⊆ A}. 

Die Potenzmenge einer Menge A ist also die Menge aller Teilmengen von A. 

Auch hier findet man das Comprehension Principle wieder. Die zugrundeliegende 

Eigenschaft ist Teilmenge von A zu sein. Man beachte, dass die leere 

Menge ∅ immer Element der Potenzmenge von A ist, ganz egal was A ist.


Beispiel 2.28 

P({1, 2, 3}) = ∅, {1}, {2}, {3}, {1, 2}, {1, 3}, {2, 3}, {1,2, 3} 

P(∅) = ∅ . 

Manchmal wird statt P(A) auch 2 A geschrieben. Dies ist dadurch motiviert, 

dass für endliche Mengen A gilt 

|P(A)| = 2 |A| . 

Dieser Sachverhalt lässt sich durch folgendes Diagramm veranschaulichen: 

| | 

A P() 

−−−→ P(A) 

⏐ ⏐ 

⏐ 

 

|A| −−−→ 

2 x 

⏐ 

| | 

|P(A)| = 2 |A| 

Die Potenzmengenoperation auf Mengen entspricht somit der 2 x Operation 

auf ihren Kardinalitäten. 

2.6 Paare 

Da das Rechnen mit “reinen” Mengen schnell langweilig wird, sollten 

wir uns zügig daran machen, neue Dinge mit Mengen zu konstruieren. In der 

Sprache des Informatikers sind Mengen Container für irgend welche Objekte. 

Eine charakteristische Eigenschaft ist, dass die Elemente einer Menge ungeordnet 

sind. Es macht also keinen Sinn vom “ersten” oder “zweiten” Element 

der Menge zu sprechen. Ausserdem kann ein Objekt nicht mehrmals in einer 

Menge drin sein — es gibt nur die Optionen in der Menge zu sein oder nicht 

in der Menge zu sein. 

Es wäre sicherlich nützlich, auch einen Container Typ zu haben, der 

konträre Eigenschaften mitbringt: 

• Die Objekte in dem Container sollen geordnet sein, d.h. es soll festgelegt 

sein, welches das erste, zweite, dritte, usw. Objekt in dem Container 

ist. 

• Ein und das selbe Objekt darf auch mehrmals (an unterschiedlicher 

Position) im Container sein.


Diese zweite Art von Containern heißt Tupel. Um Tupel von Mengen zu 

unterscheiden, werden runde Klammern statt der geschweiften Klammern 

verwendet. So ist z.B. 

(7, 7, −1) 

ein Tupel mit 3 Komponenten. Die erste Komponente ist 7, die zweite ist 

ebenfalls 7 ud die dritte ist −1. Bei Tupeln ist die Reihenfolge festgelegt, 

d.h. 

(7, 7, −1) = (7, −1, 7). 

Weiterhin kann ein Objekt mehr als einmal im Tupel vorkommen, d.h. 

Bei Mengen gilt hingegen 

(7, 7, −1) = (7, −1). 

{7, 7, −1} = {7, −1} = {7, −1, 7}. 

Wie versprochen kann man jedes Objekt in der Mathematik aus Mengen 

konstruieren — insbesondere auch Tupel. Dies scheint zunächst kontraintuitiv: 

• Den Mengen ist Ordnung völlig fremd, woher soll also die Ordnungsinformation 

in einem Tupel kommen? 

• Eine Menge würde aus zwei gleichen Objekten ohne zu zögern eines 

machen, wie lässt sich also das zweite in einem Tupel retten? 

Beginnen wir mit dem einfachsten Fall, einem Tupel welches nur zwei 

Objekte aufnehmen kann. Solche Minimaltupel werden auch Paare genannt. 

Zunächst wird gezeigt, wie man ein Paar unter ausschließlicher Verwendung 

von Mengen konstruieren kann. Dann wird gezeigt, dass ein Paar auch 

tatsächlich die geforderten Eigenschaften hat, nämlich 

• dass man aus zwei beliebigen Objekten ein Paar machen kann 

• und umgekehrt von jedem Paar eindeutig sagen kann, was die erste und 

was die zweite Komponente ist. 

Der Informatiker würde sagen, dass man einen Konstruktor und Zugriffsoperationen 

braucht. 

Definition 2.29 (Konstruktion eines Paars aus zwei Objekten) 

Das Paar bestehend aus der ersten Komponente a und der zweiten 

Komponente b ist die Menge 

(a, b) = {a}, {a, b} .


Beispiel 2.30 Das Paar bestehend aus der ersten Komponente 2 und 

der zweiten Komponente 5 ist die Menge 

Man beachte, dass 

aber 

falls a = b. 

(2, 5) = {2}, {2, 5} . 

{a, b} = {b, a} 

(a, b) = (b, a) 

Beispiel 2.31 (2, 5) = {2}, {2, 5} = {5}, {5, 2} = (5, 2). 

Beispiel 2.32 

(2, 2) = {2}, {2, 2} 

= {2}, {2} 

= {2} . 

Definition 2.29 legt fest, wie man aus zwei Objekten ein Paar konstruiert. 

Ein Paar ist somit eine Menge mit speziellen Eigenschaften: 

Definition 2.33 (Paar) 

Eine Menge M ist ein Paar, wenn es zwei Objekte a und b gibt, so 

dass 

M = {a}, {a, b} . 

In der Sprache der Prädikatenlogik liest sich diese Definition wie folgt: 

 

Paar(M) ↔ ∃a ∃b M = {a}, {a, b} 

. 

Die freie Variable in dieser Formel ist M, während die Variablen a und b 

durch einen Existenzquantor gebunden sind. 

Beispiel 2.34 Die Menge 

{1}, {1, 2, 3} 

ist kein Paar. Andererseits ist die Menge 

{7, ∅}, {∅}


ein Paar, denn für a = ∅ und b = 7 gilt 

(∅, 7) = {∅}, {∅, 7} 

= {7, ∅}, {∅} . 

Auch die Menge {3} ist ein Paar, obwohl sie auf den ersten Blick 

gar nicht so aussieht: 

(3, 3) = {3}, {3, 3} 

= {3}, {3} 

= {3} . 

Hat man ein Paar {a}, {a, b} gegeben, so kann man eindeutig darauf 

zurückschließen, dass a die erste Komponente und b die zweite Komponente 

ist. Es gibt also keine Objekte a ′ = a oder b ′ = b mit 

{a}, {a, b} = {a ′ }, {a ′ , b ′ } . 

Theorem 2.35 

Ist M ein Paar, dann gibt es genau ein Objekt a und genau ein 

Objekt b so dass 

M = {a}, {a, b} . 

In der Sprache der Prädikatenlogik liest sich dieses Theorem wie folgt: 

 

∀M Paar(M) → ∃!a ∃!b M = {a}, {a, b} 

. 

Das neue Symbol ∃! bedeutet hierbei “es gibt genau ein”. 

Beweis. Angenommen 

{a}, {a, b} = {a ′ }, {a ′ , b ′ } . 

Zu zeigen ist, dass dann zwingend folgt a = a ′ und b = b ′ . Setzt man 

die Definition der Mengengleichheit in die Annahme ein, erhält man 

{a}, {a, b} ⊆ {a ′ }, {a ′ , b ′ } und 

{a}, {a, b} ⊇ {a ′ }, {a ′ , b ′ } . 

Geht man auf die Definition von ⊆ zurück, erhält man aus der ersten 

Teilmengenbeziehung 

{a} ∈ {a ′ }, {a ′ , b ′ } .


Hieraus folgt 

In beiden Fällen folgt a = a ′ . 

{a} = {a ′ } oder {a} = {a ′ , b ′ }. 

Setzt man a = a ′ in die Annahme ein, erhält man 

{a}, {a, b} = {a}, {a, b ′ } . 

Man betrachtet nun zwei Fälle: 

• Angenommen a = b. Dann ist 

{a}, {a, b} = {a} 

und somit {a} = {a}, {a, b ′ } . 

Folglich muss b ′ = a sein. Damit ist dann aber 

und somit b ′ = b. 

• Angenommen a = b. Dann muss 

sein und somit 

Da a = b, folgt b = b ′ . 

b ′ = a = b 

{a, b} = {a, b ′ } 

b ∈ {a, b ′ } 

Damit lässt sich definieren, was man unter dem Begriff “erste Komponente” 

und “zweite Komponente” eines Paars versteht: 

Definition 2.36 (Erste und zweite Komponente eines Paars) 

Die erste bzw. zweite Komponente eines Paars M ist das eindeutig 

bestimmte Objekt a bzw. b so dass 

M = {a}, {a, b} . 

Die erste bzw. zweite Komponente eines Paars M wird oft mit π1(M) bzw. 

π2(M) bezeichnet. Bei π1 bzw. π2 handelt es sich um die sog. Projektionsfunktionen, 

die jedem Paar seine erste bzw. zweite Komponente zuordnen.


Der essentielle Unterschied zwischen dem Paar (a, b) und der Menge {a, b} 

liegt darin, dass man beim Paar (a, b) sagen kann, welches die erste Komponente 

und welches die zweite Komponente ist, bei der Menge {a, b} hingegen 

nicht. Ist nämlich {A, B} ein Paar, so gilt entweder A ⊆ B oder B ⊆ A. Im 

ersten Fall ist die erste Komponente das (einzige) Element von A, im zweiten 

Fall ist die erste Komponente das (einzige) Element von B. Es ist durchaus 

zulässig dass bei einem Paar beide Komponenten gleich sind. So ist z.B. (3, 3) 

das Paar mit erster und zweiter Komponente 3. 

Aufgrund von Definition 2.29 ist klar, wie man aus zwei Objekten ein 

Paar macht. Somit liegt auf der Hand, wie man aus drei Objekten ein Tripel 

konstruiert: Man macht aus den ersten zwei ein Paar und daraus und dem 

dritten wiederum ein Paar und nennt das Ergebnis Tripel. 

Beispiel 2.37 Das Tripel (4, 1, 9) ist nichts anderes als ein Paar, dessen 

erste Komponente (4, 1) und dessen zweite Komponente 9 ist, d.h. 

(4, 1, 9) = (4, 1), 9 

= {(4, 1)}, {(4, 1), 9} 

{{4}, 

= {4, 1}} , {{4}, {4, 1}}, 9 

Iteriert man diesen Prozess, erhält man n-Tupel: 

Definition 2.38 (n-Tupel) 

Ein n-Tupel (x1, x2, . . .,xn) von Objekten x1, x2, . . .,xn ist definiert 

durch 

(x1) = x1 

(x1, x2, . . .,xi+1) = ((x1, x2, . . .,xi), xi+1), i = 1, . . .,n − 1. 

Bemerkung. Vorsicht: Nach unserer Definition ist 

ein Tripel, aber 

(x1, x2, x3) = ((x1, x2), x3) 

(x1, (x2, x3)) 

ist kein Tripel! Insbesondere ist ((x1, x2), x3) = (x1, (x2, x3)). Die erste 

Komponente vom ersten Term ist (x1, x2), die erste Komponente 

vom zweiten Term ist x1, was offensichtlich nicht das selbe ist. (Es 

ist recht instruktiv, die Definition eines Paars heranzuziehen und die 

beiden Ausdrücke als Mengen zu schreiben.)


2.7 Kartesische Produkte 

Hat man zwei Mengen A und B, dann kann man Paare bilden, bei denen die 

erste Komponente aus A ist und die zweite aus B. Die Menge aller solcher 

Paare heißt das kartesische Produkt von A und B. 

Definition 2.39 (Kartesisches Produkt) 

Das kartesische Produkt von A und B ist definiert als 

Beispiel 2.40 

A × B = {(a, b) | a ∈ A ∧ b ∈ B}. 

{0, 1} × {0, 1} = {(0, 0), (0, 1), (1, 0), (1, 1)} 

{1, 3, 5} × {2, 4} = {(1, 2), (1, 4), (3, 2), (3, 4), (5, 2), (5,4)} 

Beispiel 2.41 Sei 

eine Menge von Farben und 

A = {rot, grün, blau} 

B = {Ford, BMW} 

eine Menge von Automarken. Im kartesischen Produkt trifft jede Farbe 

aus A auf jede Automarke aus B: 

A × B = {(rot, Ford), (rot, BMW), (grün, Ford), (grün, BMW) 

(blau, Ford), (blau, BMW)} 

Kartesische Produkte lassen sich als Punkte in einem Koordinatensystem 

darstellen, wobei die Achsen durch die beiden Mengen beschriftet 

sind, siehe Bild 2.6. 

Theorem 2.42 

Für jede Menge A gilt A × ∅ = ∅ und ∅ × A = ∅. 

Beweis. Mit der Definition des kartesischen Produkts erhält man 

A × ∅ = {(a, b) | a ∈ A ∧ b ∈ ∅}. 

Da es kein b gibt, welches die Eigenschaft b ∈ ∅ erfüllt, existiert auch 

kein Paar (a, b) welches die Eigenschaft a ∈ A, b ∈ ∅ hat. Somit ist 

A × ∅ = ∅. Der Beweis von ∅ × A = ∅ ist analog.

ÅÏ ÐÙÅÏ 

V. Stahl 

ÓÖ ÖÓØÅÏ ÖÙÒÅÏ 

Logik und Künstliche Intelligenz Seite 31 

ÖÓØÓÖ ÖÓØ ÖÙÒÓÖ ÖÙÒ ÐÙÓÖ ÐÙ 

Abbildung 2.6: Darstellung eines kartesischen Produktes in einem Koordinatensystem. 

Die Bezeichung “Produkt” für A×B ist dadurch motiviert, dass für endliche 

Mengen A, B gilt 

|A × B| = |A| |B|. 

Wie im Fall der Potenzmengen lässt sich auch dieser Zusammenhang durch 

ein Diagramm veranschaulichen: 

A, B 

⏐ 

 

| | 

kartesisches Produkt 

−−−−−−−−−−−−−−−−→ A × B 

⏐ 

|A|, |B| −−−−−−−−−−−→ 

Multiplikation 

⏐ 

| | 

|A × B| = |A| |B| 

Das kartesische Produkt von Mengen entspricht somit der Multiplikation 

ihrer Kardinalitäten. 

Definition 2.43 (n-faches kartesisches Produkt) 

Für jedes n ∈ N ist das n-fache kartesische Produkt A n von A 

definiert durch 

A 1 = A 

A i+1 = A i × A, i = 1, . . ., n − 1. 

Die Elemente von A n sind also genau die n-Tupel von Elementen von A.


Beispiel 2.44 

{0, 1} 3 = {0, 1} 2 × {0, 1} 

= {(0, 0), (0, 1), (1, 0), (1, 1)} × {0, 1} 

= {((0, 0), 0), ((0, 0), 1), ((0, 1), 0), ((0,1), 1), 

((1, 0), 0), ((1, 0), 1), ((1, 1), 0), ((1, 1),1)} 

= {(0, 0, 0), (0, 0, 1), (0, 1, 0), (0, 1,1), 

∅ 4 = ∅ 

N 1 = N 

(1, 0, 0), (1, 0, 1), (1, 1, 0), (1, 1, 1)} 

Ist A endlich, so gilt offensichtlich |A n | = |A| n . 

Bemerkung. Die Schreibweise A × A × A verleitet zur Annahme, dass 

und 

(A × A) × A 

A × (A × A) 

das selbe ist. Dies ist jedoch nicht der Fall wie man sieht wenn man sich 

die Definition eines Paars vergegenwärtigt! Wie gesagt, ist bei jedem 

Paar eindeutig festgelegt, was die erste Komponenten ist. Ist x ∈ (A × 

A) × A, so ist die erste Komponenten von x ein Element von (A × A). 

Ist hingegen x ∈ A ×(A ×A), so ist die erste Komponente ein Element 

von A. Wir halten daher explizit fest, dass 

(A × B) × C = A × (B × C) 

für alle nichtleeren Mengen A, B, C.


3 Relationen 

Beispiele von Relationen sind Ihnen sicher schon einige bekannt, z.B. die 

kleiner-gleich Relation auf den natürlichen oder ganzen Zahlen. In diesem 

Kapitel zeigen wir zunächst, dass auch Relationen nichts anderes sind als 

Mengen mit einer bestimmten Struktur und diskutieren dann ein Eigenschaften 

spezieller Relationen. 

3.1 Der Begriff der Relation 

Definition 3.1 (Relation auf A und B) 

Eine Menge R heißt Relation auf A und B wenn 

R ⊆ A × B. 

Definition 3.2 (Relation) 

Eine Menge R heißt Relation, wenn es Mengen A und B gibt so 

dass 

R ⊆ A × B. 

Eine Relation ist also einfach eine Menge von Paaren. 

Beispiel 3.3 N ist keine Relation. Die Menge 

Ist 

ist eine Relation. Andererseits ist 

keine Relation. 

so schreibt man auch 

{(2, 3), (6, 11)} 

{(2, 3), (6, 11), 27} 

(a, b) ∈ R 

a R b 

und sagt a steht in Relation R zu b oder das Paar (a, b) erfüllt R. Ist A = B, 

d.h. R ⊆ A × A so sagt man auch R ist eine Relation auf A.


Beispiel 3.4 Die kleiner-gleich Relation auf den natürlichen Zahlen ist 

nichts anderes als die Menge aller Paare (a, b) ∈ N×N, für die a kleiner 

oder gleich b ist: 

≤N = { (1, 1), (1, 2), (1, 3), . . ., 

(2, 2), (2, 3), (2, 4), . . ., 

(3, 3), (3, 4), (3, 5), . . ., 

. . . 

. .. 

} 

Statt (3, 5) ∈ ≤N schreibt man üblicherweise auch 3 ≤N 5. Das ist zwar 

von der Notation her prägnanter, verschleiert aber völlig die Tatsache, 

das Relationen einfach Mengen von Paaren sind. 

Beispiel 3.5 Die kleiner Relation auf den natürlichen Zahlen


 

 

 

 

 

Abbildung 3.1: ≤N Relation (links) und


 

 

 

Abbildung 3.3: σ Relation (links) und ≡3 Relation (rechts). 

Beispiel 3.11 Einige Relationen sind uns schon im Kapitel 2 begegnet 

ohne dass wir diese explizit als Relationen bezeichnet haben. So ist z.B. 

⊆ eine Relation auf der Menge aller Mengen. Zwei Mengen A und B 

stehen in Relation ⊆ wenn A Teilmenge von B ist. Statt 

kann man somit auch schreiben 

A ⊆ B 

(A, B) ∈ ⊆ . 

Ist M die Menge aller Mengen, so gilt 

da ⊆ eine Relation auf M ist. 

⊆ ⊆ M × M 

Beispiel 3.12 Auch ∈ ist eine Relation. Sei O die Menge aller Objekte 

à la Cantor und M die Menge aller Mengen. Dann ist ∈ eine Relation 

auf O und M. Statt 

5 ∈ N 

kann man somit auch schreiben 

Es gilt also 

(5, N) ∈ ∈ . 

∈ ⊆ O × M.


 

 

ÊÊ 

Abbildung 3.4: Beschreibung von Geraden und Kurven durch Relationen auf 

R 

 

 

ÊÊ 

 

ÊÊÔ 

 

 

ÊÊÔ 

Abbildung 3.5: Beschreibung von Kreisen und ausgefüllte Kreisen durch Relationen 

auf R


σ 

=N 

σ∪ =N 

1 2 3 4 

1 2 3 4 

1 2 3 4 

Abbildung 3.6: Darstellung von Relationen durch Graphen. 

Manchmal ist es hilfreich, eine Relation auf einer Menge A durch einen 

Graphen darzustellen. Man zeichnet hierbei die Elemente von A als Knoten 

(Punkte) und für alle Paare (a, b) ∈ A zeichnet man einen Pfeil von a 

nach b. Ein paar Beispiele sind hierzu in Bild 3.6 dargestellt. 

Da A n = A n−1 ×A ist jede Teilmenge von A n eine Relation R ⊆ A n−1 ×A. 

Solch eine Relation wird auch n-stellige Relation auf A genannt. In Erweiterung 

dieser Sprechweise nennt man Teilmengen von A auch einstellige Relationen 

auf A. 

3.2 Zerlegungen 

Bevor’s mit Relationen weitergeht, beschäftigen wir uns mit dem Begriff der 

Zerlegung einer Menge. Eine Menge zu zerlegen heißt anschaulich, ihre Elemente 

in Gruppen einzuteilen, aus jeder Gruppe eine Menge zu bilden und 

die entstehenden Mengen wieder zu einer Menge zusammenzufassen. Aus 

einer Zerlegung einer Menge A kann man unmittelbar eine Relation auf A 

ableiten, indem man definiert dass genau die Elemente einer Gruppe zueinander 

in Relation stehen sollen. Relationen dieser Bauart haben ganz spezielle 

Eigenschaften und heißen Äquivalenzrelationen. 

Zerlegungen trifft man im Alltag immer dann an, wenn eine Menge in 

Gruppen aufgeteilt wird: 

Beispiel 3.13 Die Menge der Menschen lässt sich zerlegen in Männer 

und Frauen. Ist A die Menge aller Menschen, K1 die Menge der Männer 

und K2 die Menge der Frauen, so ist 

eine Zerlegung von A. 

Z = {K1, K2} 

. . . 

. . . 

. . .


Abbildung 3.7: Zerlegung der Menge {1, 2, 3, 4, 5}, siehe Beispiel 3.16. 

Beispiel 3.14 Eine andere Zerlegung der Menge aller Menschen erhält 

man z.B., wenn man sie in Kinder, Jugendliche und Erwachsene einteilt. 

Sei wieder A die Menge aller Menschen, K1 die Menge der Kinder (0- 

12 Jahre), K2 die Menge der Jugendlichen (13-17 Jahre) und K3 die 

Menge der Erwachsenen (älter als 18 Jahre). Dann ist 

ebenfalls eine Zerlegung von A. 

Z = {K1, K2, K3} 

Beispiel 3.15 Die Menge Q der rationalen Zahlen kann man zerlegen in 

positive, negative und Null. Sei 

Dann ist 

Q + = {x | x ∈ Q ∧ x > 0}, Q − = {x | x ∈ Q ∧ x < 0}. 

eine Zerlegung von Q. 

Z = {Q + , Q − , {0}} 

Beispiel 3.16 Sei A = {1, 2, 3, 4, 5}. Dann ist 

Z = {1, 2}, {3}, {4, 5} 

eine Zerlegung von A. Eine andere Zerlegung ist z.B. 

Z = {1, 4}, {2, 3, 5} 

siehe Bild 3.7. 

Wie das letzte Beispiel zeigt, kann man sich eine Zerlegung einer Menge so 

vorstellen, dass Trennwände in die Menge eingezogen werden. Eine Zerlegung 

Z einer Menge A ist somit eine Menge von Teilmengen von A. Diese 

Teilmengen nennt man auch Klassen der Zerlegung. Wie aus den vorigen 

Beispielen ersichtlich, liegt jedes Element von A in genau einer Klasse. Um’s


nicht unnötig kompliziert zu machen, legt man dabei fest, dass keine Klasse 

leer sein soll. Und hier das Ganze nochmal richtig exakt: 

Definition 3.17 (Zerlegung) 

Eine Menge von Mengen Z heißt Zerlegung von A wenn 

• Jede Menge K ∈ Z ist eine nichtleere Teilmenge von A. 

∀K K ∈ Z → (K ⊆ A ∧ K = ∅). 

• Die Elemente von Z sind paarweise disjunkt. 

∀K ∀K ′ (K ∈ Z ∧ K ′ ∈ Z) → (K = K ′ ∨ K ∩ K ′ = ∅). 

• Jedes Element von A ist in einer Menge K ∈ Z. 

∀a a ∈ A → (∃K K ∈ Z ∧ a ∈ K). 

Je nachdem ob Z endlich oder unendlich ist, spricht man von einer 

endlichen oder unendlichen Zerlegung von A. 

Wenn man die Definition einer Zerlegung umgangssprachlich formuliert, erhält 

man folgende Merkregel: 

Merkregel 3.18 

Eine Menge Z von nichtleeren Teilmengen von A heißt Zerlegung 

von A wenn jedes Element von A in genau einer Menge K ∈ Z ist. 

Beispiel 3.19 Die feinste Zerlegung einer Menge A erhält man, wenn 

man jedes Element von A in eine separate Klasse sperrt. Für 

ist die feinste Zerlegung 

Die feinste Zerlegung von N ist 

A = {1, 2, 3, 4, 5} 

Z = {1}, {2}, {3}, {4}, {5} . 

Z = {1}, {2}, {3}, . . . . 

Vorsicht: Z = N, die Elemente von Z sind Mengen, die Elemente von 

N sind Zahlen!


Beispiel 3.20 Der andere Extremfall einer Zerlegung ist die gröbste Zerlegung. 

Hierbei packt man alle Elemente von A in eine einzige, große 

Klasse. Für 

A = {1, 2, 3, 4, 5} 

ist die gröbste Zerlegung 

Z = {1, 2, 3, 4, 5} 

= {A}. 

Die gröbste Zerlegung von N ist 

Z = {1, 2, 3, . . .} 

= {N}. 

Vorsicht: Z = N, die Menge Z enthält nur ein einziges Element während 

N unendlich groß ist! 

Beispiel 3.21 Sei ≡3 die aus Beispiel 3.9 bekannte Relation 

≡3 = {(a, b) | a ∈ N0, b ∈ N0, a − b ist durch 3 teilbar } 

Unter Verwendung dieser Relation kann man die Menge N0 in drei 

Klassen zerlegen: 

K1 = {x ∈ N0 | x ≡3 0} = {0, 3, 6, 9, . . .} 

K2 = {x ∈ N0 | x ≡3 1} = {1, 4, 7, 10, . . .} 

K3 = {x ∈ N0 | x ≡3 2} = {2, 5, 8, 11, . . .} 

Wie man anhand von Definition 3.17 nachprüfen kann, ist somit 

eine Zerlegung von N0. 

Z = {K1, K2, K3} 

3.3 Äquivalenzrelationen und erste Beweistechniken 

Hat man eine Zerlegung Z einer Menge A, dann kann man mit wenigen 

Handgriffen hieraus eine Relation auf A konstruieren: Man legt einfach fest, 

dass genau die Elemente von A zueinander in Relation stehen sollen, die 

in der selben Klasse von Z sind. In Anlehnung an Z bezeichnet man die 

entstehende Relation mit Äquivalenz bzgl. Z und bezeichnet sie mit ≡Z.


Beispiel 3.22 Eine Zerlegung von A = {1, 2, 3, 4, 5} ist z.B. 

Z = {1, 2}, {3}, {4, 5} . 

Somit stehen 1 und 2 in Relation aber nicht 1 und 3. Es gilt also z.B. 


1 ≡Z 2, 2 ≡Z 1, 1 ≡Z 1, 3 ≡Z 3, 4 ≡Z 5, . . . 

1 ≡Z 3, 2 ≡Z 3, 3 ≡Z 1, . . . 

Als Menge geschrieben sieht ≡Z so aus: 

≡Z = {(1, 1), (1, 2), (2, 1), (2, 2), (3, 3), (4, 4),(4, 5), (5, 4), (5,5)} 

Definition 3.23 (Äquivalenz bzgl. einer Zerlegung) 

Sei Z eine Zerlegung von A. Dann ist die Relation 

definiert durch 

Formal ausgedrückt liest sich das so: 

≡Z ⊆ A × A 

a ≡Z b 

genau dann wenn 

a und b in der selben Klasse von Z sind. 

≡Z = {(a, b) | ∃K K ∈ Z ∧ a ∈ K ∧ b ∈ K}. 

Bemerkung. Ist Z = {K1, K2, K3, . . .} eine Zerlegung von A, dann lässt 

sich die Äquivalenzrelation ≡Z auch definieren durch 

≡Z = (K1 × K1) ∪ (K2 × K2) ∪ (K3 × K3) ∪ . . . 

Beispiel 3.24 Die Menge Q lässt sich zerlegen in die Menge der positiven 

und negativen rationalen Zahlen und {0}, d.h. 

Z = Q + , Q − , {0} . 

Für die zugehörige Äquivalenz bzgl. Z gilt somit, dass alle positiven 

Zahlen miteinander in Relation stehen, alle negativen und Null nur mit 

sich sebst, z.B. 

3 ≡Z 5, −1 ≡Z −3, 0 ≡Z 0, 2 ≡Z 2, . . .



2 ≡Z −3 − 1 ≡Z 4, 0 ≡Z 5, −3 ≡Z 0, . . . 

Man kann also sagen dass für alle a, b ∈ Q gilt a ≡Z b genau dann wenn 

a und b das gleiche Vorzeichen haben. 

Schauen wir uns an, welche Relation herauskommt wenn man von der feinsten 

bzw. gröbsten Zerlegung einer Menge ausgeht: 

Beispiel 3.25 Sei A = {1, 2, 3}. Die feinste Zerlegung von A ist 

Z = {1}, {2}, {3} . 

Somit steht jedes Element von A nur mit sich selbst in Relation ≡Z, 

d.h. 

1 ≡Z 1, 2 ≡Z 2, 3 ≡Z 3 

und sonst nichts: 

≡Z = {(1, 1), (2, 2), (3, 3)}. 

Diese Relation ist nichts anderes als die Gleichheitsrelation auf A. 

Beispiel 3.26 Sei wieder A = {1, 2, 3}. Die gröbste Zerlegung von A ist 

Z = {1, 2, 3} . 

Somit steht jedes Element von A mit jedem in Relation ≡Z, d.h. 

und somit ist 

1 ≡Z 1, 1 ≡Z 2, 1 ≡Z 3, 2 ≡Z 1, 2 ≡Z 2, . . . 

≡Z = {(1, 1), (1, 2), (1, 3), (2, 1), (2, 2), (2,3), (3, 1),(3, 2),(3, 3)} 

Diese Relation ist nichts anderes als das kartesische Produkt von A mit 

sich selbst, d.h. 

≡Z = A × A. 


Für jede Menge A gilt: 

• Ist Z die feinste Zerlegung von A, dann ist ≡Z die Gleichheitsrelation 

auf A, d.h. jedes Element von A steht nur zu sich selbst 

in Relation ≡Z. 

• Ist Z die gröbste Zerlegung von A, dann ist ≡Z = A × A, d.h. 

jedes Element von A steht zu jedem Element von A in Relation 

≡Z.


Egal was für eine Zerlegung Z einer Menge A man anschaut, die die resultierende 

Relation ≡Z hat immer ein paar elementare Eigenschaften: 

• Jedes Element von A ist natürlich in der selben Klasse wie es selbst, 

daher ist 

a ≡Z a für alle a ∈ A 

bzw. 

∀a a ∈ A → a ≡Z a. 

Eine Relation, die diese Eigenschaft hat, heißt reflexiv auf A. 

• Ist a in der selben Klasse wie b, dann ist natürlich auch b in der selben 

Klasse wie a. Somit gilt 

bzw. 

wenn a ≡Z b dann b ≡Z a 

∀a ∀b a ≡Z b → b ≡Z a. 

Eine Relation, die diese Eigenschaft hat, heißt symmetrisch. 

• Ist a in der selben Klasse wie b und b in der selben Klasse wie c, dann 

ist natürlich auch a in der selbe Klasse wie c. Somit gilt 

bzw. 

wenn a ≡Z b und b ≡Z c dann a ≡Z c 

∀a ∀b ∀c (a ≡Z b ∧ b ≡Z c) → a ≡Z c. 

Eine Relation, die diese Eigenschaft hat, heißt transitiv. 

Relationen auf einer Menge A, die alle drei Eigenschaften besutzen, heißen 

Äquivalenzrelationen auf A. 

Ist Z eine Zerlegung von A, so ist ≡Z eine Äquivalenzrelation auf A 

und hat somit sehr ähnliche Eigenschaften wie die Gleichheit. Anstatt zu 

fordern, dass zwei Elemente von A gleich sind, stellt man die schwächere 

Forderung, dass sie in der selben Klasse sind. Dies ist ein Prozess, den man 

in der wirklichen Welt sehr oft beobachtet und der u.a. die Grundlage aller 

Vorurteile ist. Sagt man z.B. “das erste Semester ist faul”, so ist diese Aussage 

zunächst einmal unsinnig, denn ein Semester ist eine Menge von Studenten 

und eine Menge kann weder die Eigenschaft faul oder fleißig besitzen. Was 

ist hier geschehen? Zunächst hat man die Menge A der Studenten in eine 

Menge Z von Semestern zerlegt. Dann hat man die Gleichheit auf der Menge


der Studenten =A durch ≡Z ersetzt. Jeder Student ist nur gleich sich selbst, 

d.h. wenn a und b unterschiedliche Studenten sind, gilt 

a =A b. 

Sind sie jedoch im selben Semester, gilt 

a ≡Z b. 

Ersetzt man nun (in unzulässiger Weise) =A durch ≡Z, sind plötzlich alle 

Studenten eines Semesters gleich und lassen sich bequem über einen Kamm 

scheren. Wenn Sie also wieder einmal Opfer eines solchen Vorurteils werden, 

wissen Sie nun wie man sich dagegen wehrt. 

Äquivalenzrelationen führen jedoch nicht nur zu sozialem Unfrieden sondern 

haben auch ein paar durchaus nützliche Anwendungen: Wenn man z.B. 

ein sehr komplexes Problem lösen muss, ist man oft gezwungen, dies zunächst 

zu vereinfachen indem man von Details abstrahiert. So können z.B. zwei Dinge 

“im Prinzip” gleich sein bis auf ein paar “unwichtige” Details. Diese Art 

der “im Prinzip Gleichheit” lässt sich mathematisch durch Äquivalenzrelationen 

beschreiben. Ersetzt man die exakte Gleichheit durch eine geeignete 

Äquivalenzrelation, bedeutet das nichts anderes als dass man die unwichtigen 

Details unter den Tisch fallen lässt und dadurch die “im Prinzip” gleichen 

Dinge tatsächlich gleich (äquivalent) setzt. Die wesentlichen Eigenschaften, 

die man beim täglichen Umgang mit der Gleichheit ganz selbstverständlich 

voraussetzt, gelten bei Äquivalenzrelationen auch. Diese Eigenschaften heißen 

Reflexivität, Symmetrie und Transitivität und werden nun noch einmal 

genauer untersucht. Im Folgenden sei A eine Menge und R ⊆ A × A eine 

Relation auf A. 

Definition 3.28 (Reflexiv) 

Eine Relation R heißt reflexiv auf einer Menge A, genau dann wenn 

für alle x ∈ A gilt xRx, d.h. 

Beispiel 3.29 

∀x x ∈ A → xRx. 

• ≤N ist reflexiv auf N, da für jedes x ∈ N gilt x ≤N x. Andererseits 

ist aber ≤N nicht reflexiv auf Z, da z.B. −1 ∈ Z aber 

(−2, −2) ∈≤N. 

• ≤Z ist reflexiv auf Z aber nicht reflexiv auf R.


• ≡3 ist reflexiv auf N0. 

• Die in Bild 3.4 links dargestellte Relation ist reflexiv auf R. 

• Die Relation


– Die zu beweisende Formel beginnt mit einem Allquantor. Einen 

Allquantor kann man immer durch eine kleine Zauberformel loswerden 

und zwar: 

Sei a beliebig aber fest gewählt. Zu zeigen: 

a ∈ A → aRa. 

Was hier geschehen ist, ist dass aus der Variablen a eine Konstante 

wurde, d.h. a bezeichnet ab sofort ein konkretes Objekt, auf das 

man im weiteren Verlauf des Beweises Bezug nehmen darf. 

– Die zu beweisende Formel ist vom Typ . . . → . . ., d.h. eine wenn 

– dann Aussage. Der Trick wie man mit solchen Formeln umgeht 

ist, anzunehmen dass der wenn–Teil erfüllt ist. Zu zeigen ist dann 

nur noch der dann–Teil: 

Gegeben: a ∈ A 

zu zeigen: aRa. 

– Noch weiter lässt sich die Formel allgemein nicht vereinfachen. 

Jetzt muss man konkret hinschauen wie die Relation R definiert 

ist. Man setzt also die Definition von R in die Formel ein. Wie’s 

ab hier weitergeht hängt von R ab. 

Beispiel 3.30 Gegeben ist die Relation 

R = {(a, b) | a ∈ R, b ∈ R, |a| = |b|}. 

Es soll untersucht werden ob R reflexiv auf R ist. 

• Beispiele: (2, 2) ∈ R, (−100, −100) ∈ R, (0, 0) ∈ R, .... Da kein 

Gegenbeispiel gefunden wurde, lastet auf R der Verdacht reflexiv 

auf R zu sein. 

• Nun zum Beweis: 

– Zu zeigen: ∀a a ∈ R → aRa. 

– Sei a beliebig aber fest. Zu zeigen: a ∈ R → aRa. 

– Gegeben: a ∈ R. Zu zeigen: aRa. 

– Einsetzen der Definition von R. Zu zeigen: a ∈ R und |a| = |a|. 

Dass a ∈ R ist, folgt aus der Annahme im vorigen Schritt, dass 

|a| = |a| ist offensichtlich. 

An der graphischen Darstellung einer Relation auf R kann man sofort sehen, 

ob sie reflexiv auf R ist. Dies ist nämlich genau dann der Fall, wenn die 

Hauptdiagonale komplett eingezeichnet ist.


Definition 3.31 (Symmetrisch) 

Eine Relation R heißt symmetrisch, wenn für all a, b, für die aRb 

gilt, auch bRa gilt: 

∀a ∀b aRb → bRa. 

Beispiel 3.32 

• Die Relation ≡3 ist symmetrisch: Wenn a − b durch 3 teilbar ist, 

dann auch b − a. 

• Die in Bild 3.4 links und in Bild 3.5 dargestellten Relationen sind 

ebenfalls symmetrisch. 

• Die Relationen ≤N,


– Zu zeigen: 

– Elimination der Allquantoren: 

∀a ∀b aRb → bRa. 

Sei a und b beliebig aber fest gewählt. Zu zeigen: 

aRb → bRa. 

– Es liegt wieder eine wenn–dann Formel vor. Man nimmt an, dass 

der wenn–Teil erfüllt ist und muss dann nur noch den dann–Teil 

zeigen. 

Gegeben: aRb 

zu Zeigen: bRa. 

– Eine weitere Vereinfachung der zu beweisenden Formel ist nicht 

möglich. Man muss daher an dieser Stelle die Definition von R einsetzen. 

Hierbei können wiederum Quantoren und logische Symbole 

auftreten, die man nach dem selben Prinzip abarbeiten muss. 

Beispiel 3.33 Gegeben ist die kleiner gleich Relation ≤N auf N. Es soll 

untersucht werden, ob diese symmetrisch ist. Es ist leicht, ein Gegenbeispiel 

zu finden. So ist z.B. 2 ≤N 3 aber andererseits 3 ≤N 2. Somit 

ist ≤N nicht symmetrisch. 


R = {(a, b) | a ∈ R, b ∈ R, √ a 2 + b 2 ≤ 2}. 

Es soll untersucht werden, ob R symmetrisch ist. 

• Zunächst ein paar Beispiele: 

– 1R − 1, da (1) 2 + (−1) 2 = √ 2 ≤ 2. Andererseits ist aber 

auch −1R1. 

– 0R2, da (0) 2 + (2) 2 = √ 4 ≤ 2. Andererseits ist aber auch 

2R0. 

– ... 

• Nachdem kein Gegenbeispiel gefunden wurde, entsteht der Verdacht 

dass R symmetrisch ist. Um die letzten Zweifler zu überzeugen 

hier der Beweis nach dem oben beschriebenen Schema: 

– Zu zeigen: ∀a ∀b aRb → bRa. 

– Sei a und b beliebig aber fest gewählt. Zu zeigen: aRb → bRa.


– Gegeben: aRb. Zu zeigen: bRa. 

– Einsetzen der Definition von R. 

Gegeben: a ∈ R, b ∈ R, √ a 2 + b 2 ≤ 2. 

zu zeigen: b ∈ R, a ∈ R, √ b 2 + a 2 ≤ 2. 

Da 

b 2 + a 2 = a 2 + b 2 

folgt √ b 2 + a 2 = √ a 2 + b 2 . 

Unter Verwendung der Annahme 

√ a 2 + b 2 ≤ 2 

erhält man somit √ b 2 + a 2 ≤ 2. 

An der graphischen Darstellung einer Relation auf z.B. N, Z, Q oder R kann 

man sofort sehen, ob sie symmetrisch ist. Dies ist nämlich genau dann der 

Fall, wenn alle eingezeichneten Punkte spiegelbildlich zur Hauptdiagonalen 

liegen. 

Definition 3.35 (Transitiv) 

Eine Relation R heißt transitiv, wenn für alle a, b, c für die aRb und 

bRc gilt auch aRc gilt: 

Beispiel 3.36 

∀a ∀b ∀c (aRb ∧ bRc) → aRc. 

• Die Relationen ≤N,


Abbildung 3.9: Graph Darstellung einer transitiven Relation. 

a über eine Zwischenstation b zu c, dann muss auch der direkte Pfeil von a 

nach c vorhanden sein. Im Eisenbahnerjargon nennt man das Transitstrecke. 

Die Relation in Bild 3.9 ist somit transitiv. 

Auf die Gefahr hin, dass es langweilig wird: Wie entscheidet man von einer 

gegebenen Relation R ob sie transitiv ist? 

• Wieder sucht man sich zunächst ein paar Beispiele a, b, c ∈ A, für die 

aRb und bRc gilt. Wenn für eines dieser Beispiele aRc nicht gilt, so ist 

R nicht transitiv. 

• Gilt für alle Beispiele auch aRc, so müssen wir R der Transitivität 

bezichtigen. Um Gewissheit zu bekommen, hilft nur ein Beweis: 


– Elimination der Allquantoren: 

∀a ∀b ∀c (aRb ∧ bRc) → aRc. 

Sei a, b, c beliebig aber fest. Zu zeigen: 

(aRb ∧ bRc) → aRc. 

– Es liegt wieder eine wenn–dann Formel vor, die nach bewährter 

Methode verarbeitet wird: 

Gegeben: aRb ∧ bRc 

Zu zeigen: aRc. 

– Das ∧ Symbol in der Annahme kann man noch eliminieren: 

Gegeben: aRb und bRc. 

– Hier ist wieder der Punkt erreicht, wo der weitere Weg von R 

abhängt. Man muss also nun die Definition von R in die Formeln 

einsetzen. 


≡3= {(a, b) | a ∈ N0, n ∈ N0, a − b ist durch 3 teilbar }. 

Es soll untersucht werden, ob ≡3 transitiv ist.


• Man sucht zunächst ein paar Beispiele a, b, c ∈ N0, für die a ≡3 b 

und b ≡3 c gilt. Dann prüft man nach, ob auch a ≡3 c. Also z.B. 

– a = 1, b = 7, c = 4: 1 ≡3 7, 7 ≡3 4. Tatsächlich gilt auch 

1 ≡3 4. 

– a = 9, b = 0, c = 3: 9 ≡3 0, 0 ≡3 9. Tatsächlich gilt auch 

9 ≡3 9. 

– ... 

• Pech — wir haben kein Gegenbeispiel gefunden, also ... 

– Zu zeigen: ∀a ∀b ∀c (a ≡3 b ∧ b ≡3 c) → aRc. 

– Sei a, b, c beliebig aber fest. Zu zeigen: (a ≡3 b ∧ b ≡3 c) → 

a ≡3 c. 

– Gegeben: a ≡3 b, b ≡3 c. Zu zeigen a ≡3 c. 

– Einsetzen der Definition von ≡3: Gegeben: 

Zu zeigen: 

Da 

a − b und b − c sind durch 3 teilbar. 

a − c ist durch 3 teilbar 

a − c = (a − b) + (b − c), 

a − b und b − c laut Annahme durch 3 teilbar sind und die 

Summe zweier durch 3 teilbarer Zahlen wieder durch 3 teilbar 

ist, folgt dass a − c durch 3 teilbar ist. 

Die Entscheidung ob eine Relation transitiv ist, ist i.a. schwieriger als die 

Entscheidung von Symmetrie oder Reflexivität. Einerseits ist es oft nicht so 

einfach Beispiele zu finden für die aRb und bRc ist, andererseits lässt sich die 

Transitivität im Bild auch nicht unmittelbar ablesen. Oft gibt einem aber ein 

mißlungener Beweisversuch einen Hinweis auf ein Gegenbeispiel. 

Relationen, die reflexiv, symmetrisch und transitiv sind, verdienen einen 

besonderen Namen. 

Definition 3.38 (Äquivalenzrelation) 

R heißt Äquivalenzrelation auf einer Menge A wenn R ⊆ A × A 

und R reflexiv auf A, symmetrisch und transitiv ist. 

Beispiel 3.39


• ≡3 ist eine Äquivalenzrelation auf N0. 

• Die in Bild 3.4 links dargestellte Relation ist eine Äquivalenzrelation 

auf der Menge R. 

• ≤N ist keine Äquivalenzrelation auf N0. 

• ≤Z ist keine Äquivalenzrelation auf Z. 

•


Die Mengen Ki heißen Äquivalenzklassen der Äquivalenzrelation ≡3. 

Da immer wieder die selben Mengen entstehen, hat ≡3 nur 3 Äquivalenzklassen. 

Definition 3.41 (Äquivalenzklasse) 

Ist R eine Äquivalenzrelation auf A und a ∈ A, dann heißt die 

Menge 

Ka = {x | xRa} 

Äquivalenzklasse von a der Äquivalenzrelation R. 

Allgemein gilt, dass die Äquivalenzklassen einer Äquivalenzrelation auf A 

eine Zerlegung von A bilden. 

Theorem 3.42 (Zerlegung in Äquivalenzklassen) 

Ist R eine Äquivalenzrelation auf einer Menge A, so ist für jedes 

a ∈ A 

Ka = {x | xRa} 

eine Äquivalenzklasse von R und 

eine Zerlegung von A. 

Z = {Ka | a ∈ A} 

Der Beweis ist etwas länger, illustriert aber hoffentlich wie man die zuvor 

gelernten Techniken in einem etwas größeren Rahmen anwenden kann. 

Beweis. Sei R eine Äquivalenzrelation auf A und für alle a ∈ A 

Sei weiterhin 

Ka = {x ∈ A | xRa}. 

Z = {Ka | a ∈ A}. 

Zu zeigen: Z ist eine Zerlegung von A. Zuerst setzt man die Definition 

des Begriffs Zerlegung ein (siehe Definition 3.17). Demnach sind drei 

Dinge zu zeigen: 

• Jede Menge K ∈ Z ist eine nichtleere Teilmenge von A. 

∀K K ∈ Z → (K ⊆ A ∧ K = ∅).


Elimination des Allquantors: Sei K beliebig aber fest. Auflösen 

der wenn–dann Aussage: Gegeben K ∈ Z, d.h. es gibt ein a ∈ A 

so dass K = Ka. Zu zeigen 

Ka ⊆ A ∧ Ka = ∅. 

Dass Ka ⊆ A folgt direkt aus der Definition von Ka. Da R reflexiv 

ist, ist a ∈ Ka und somit Ka = ∅. 

• Die Elemente von Z sind paarweise disjunkt. 

∀K ∀K ′ (K ∈ Z ∧ K ′ ∈ Z) → (K = K ′ ∨ K ∩ K ′ = ∅). 

Elimination der Allquantoren: Seien K und K ′ beliebig aber fest. 

Auflösen der wenn–dann Aussage: Gegeben K ∈ Z und K ′ ∈ Z. 

Nach Einsetzen der Definition von Z erhält man: Es gibt a, b ∈ A 

so dass K = Ka und K ′ = Kb. Zu zeigen: 

Ka = Kb ∨ Ka ∩ Kb = ∅. 

Diese Aussage ist äquivalent zu der wenn–dann Aussage 

Ka ∩ Kb = ∅ → Ka = Kb. 

Gegeben Ka ∩ Kb = ∅, zu zeigen Ka = Kb. Aus der Annahme 

folgt, dass es ein c geben muss mit c ∈ Ka ∩ Kb. Setzt man die 

Definition von Ka und Kb ein, erhält man cRa und cRb. Zu zeigen 

ist Ka = Kb. Einsetzen der Definition der Mengengleichheit 

(Definition 2.14) führt auf Ka ⊆ Kb und Kb ⊆ Ka. Wir zeigen 

Ka ⊆ Kb, der Beweis von Kb ⊆ Ka ist analog. Einsetzen der 

Teilmengendefinition (Definition 2.10) führt auf 

∀x x ∈ Ka → x ∈ Kb. 

Einsetzen der Definition von Ka und Kb führt auf 

∀x xRa → xRb. 

Sei x beliebig aber fest. Gegeben xRa, zu zeigen xRb. Aus der 

Annahme cRa und der Symmetrie von R erhält man aRc. Transitivität 

von R liefert xRc. Nochmal Transitivität und die Annahme 

cRb liefert xRb.


• Jedes Element von A ist in einer Menge K ∈ Z. 

∀a a ∈ A → (∃K K ∈ Z ∧ a ∈ K). 

Sei a beliebig aber fest. Gegeben a ∈ A, zu zeigen 

∃K K ∈ Z ∧ a ∈ K. 

Wähle K = Ka. Damit ist K ∈ Z und da R reflexiv ist, folgt aRa 

und laut Definition von Ka ist somit a ∈ K. 

Jede Äquivalenzrelation R auf A liefert also eine Zerlegung von A in Äquivalenzklassen 

von R. Wenn man versucht, sich eine Äquivalenzrelation vorzustellen, 

ist es oft hilfreich, sich die entsprechende Zerlegung in Äquivalenzklassen 

anzuschauen. 


Äquivalenzrelationen und Zerlegungen sind das selbe. Das eine lässt 

sich exakt durch das andere beschreiben. 

Beispiel 3.44 Auf jeder Menge A gibt es zwei extreme Äquivalenzrelationen 

• Die Gleichheit auf A 

=A= {(a, a) | a ∈ A}. 

Hier steht jedes Element nur mit sich selbst in Relation. Die Äquivalenzklassen 

sind somit einelementige Mengen 

Ka = {x | x =A a} 

= {a} 

für jedes a ∈ A. Die zugehörige Zerlegung 

ist die feinste Zerlegung von A. 

• Die Relation 

Z = {Ka | a ∈ A} 

= {a} | a ∈ A 

A × A = {(a, b) | a ∈ A, b ∈ A}.


Hier steht jedes Element mit jedem in Relation. Diese Relation 

hat genau eine Äquivalenzklasse. Für jedes a ∈ A ist 

Ka = {x | (x, a) ∈ A × A} 

= A. 

Die zugehörige Zerlegung ist somit 

Z = {Ka | a ∈ A} 

= {A}, 

d.h. die gröbste Zerlegung von A. 

Die Elemente einer Äquivalenzklasse werden auch Repräsentanten der Äquivalenzklasse 

genannt. 

Definition 3.45 (Repräsentantensystem) 

Sei R eine Äquivalenzrelation auf A. Eine Menge S ⊆ A heißt 

Repräsentantensystem von R wenn S genau ein Element aus jeder 

Äquivalenzklasse von R enthält. 

Beispiel 3.46 Ein Repräsentantensystem von ≡3 ist z.B. {0, 1, 2}. Ein 

anderes Repräsentantensystem ist {0, 4, 8}. 

Beispiel 3.47 Die Quersumme einer natürlichen Zahl ist die Summe aller 

Ziffern der Zahl in Dezimaldarstellung. So ergibt sich z.B. die Quersumme 

von 598 als 5+9+8 = 22. Die Relation ∼ ⊆ N ×N sei definiert 

durch 

∼ = {(a, b) | a ∈ N, b ∈ N, a und b haben die selbe Quersumme} 

Wie man leicht prüft, ist ∼ eine Äquivalenzrelation mit unendlich vielen 

Äquivalenzklassen: 

K1 = {1, 10, 100, 1000, . . .} 

K2 = {2, 11, 20, 110, 200, 1100, 2000,...} 

K3 = {3, 12, 21, 30, 111, 102, 120, 210, 300, . ..} 

. 

Ein Repräsentantensystem von ∼ erhält man wenn man aus jeder Äquivalenzklasse 

genau ein Element nimmt (z.B. das kleinste): 

{1, 2, 3, . . ., 9, 19, 29, 39, . . ., 99, 199, 299, 399, . . .}


Beispiel 3.48 Die Gleichheit auf einer beliebigen Menge A ist eine Äquivalenzrelation 

auf A, wobei jede Äquivalenzklasse aus genau einem Element 

besteht. Das einzige Repräsentantensystem ist somit A selbst. 

Beispiel 3.49 Die Relation ≡ ⊆ (Z×Z\{0})×(Z×Z\{0}) sei definiert 

durch 

≡ = {((a, b), (x, y)) | (a, b) ∈ Z×Z\{0}, (x, y) ∈ Z×Z\{0}, ay = bx} 

Offensichtlich ist (a, b) ≡ (x, y) genau dann wenn 

a/b = x/y 

wobei / die Division in Q ist, also z.B. 


(6, 4) ≡ (12, 8) da 6/4 = 12/8 = 1.5 

(6, 4) ≡ (6, 5) da 6/4 = 6/5. 

Es ist leicht zu sehen, dass ≡ eine Äquivalenzrelation auf Z × Z \ {0} 

ist. Die Äquivalenzklassen von ≡ entsprechen den rationalen Zahlen Q, 

da es für jede rationale Zahl q ∈ Q genau eine Äquivalenzklasse von ≡ 

gibt, für deren Elemente (a, b) gilt a/b = q. 

Beispiel 3.50 Äquivalenzklassen der in Bild 3.5 links dargestellten Relation 

sind z.B. {1, −1}, {2, −2}, {0}, usw. Die Menge aller Äquivalenzklassen 

ist daher 

Z = {{x, −x} | x ∈ R} 

Ein Repräsentantensystem ist somit die Menge aller reeller Zahlen, die 

größer oder gleich 0 sind. 

3.4 Ordnungsrelationen 

Relationen wie ≤N oder >Z sind keine Äquivalenzrelationen weil es an der 

Symmetrie hapert und bei >Z fehlt auch noch die Reflexivität. Dennoch 

spielen diese Relationen eine wichtige Rolle und so haben auch ihre charakteristischen 

Eigenschaften einen Namen verdient. Die Relationen dienen 

dazu, die Elemente einer Menge anzuordnen. Sie legen fest, welches Element 

“vor” welchem kommt. Wenn a vor b ist, dann kann nicht gleichzeitig b vor a 

sein. Die Eigenschaft ist also, dass für zwei verschiedene Elemente a, b nicht 

gleichzeitig aRb und bRa erfüllt sein darf. Das erinnert sehr an Symmetrie:


Hier hat man gefordert, dass wenn aRb gilt, auch bRa gelten muss. Die Ordnungseigenschaft 

nennt man daher Antisymmetrie. 

Definition 3.51 (Antisymmetrisch) 

Eine Relation R heißt antisymmetrisch wenn für keine zwei verschiedenen 

Objekte a = b sowohl aRb als auch bRa gilt: 

∀a ∀b (aRb ∧ bRa) → a = b. 

Beispiel 3.52 Die Relation ≤N ist antisymmetrisch. Wenn a ≤N b und 

b ≤N a, dann muss a = b sein. 

Beispiel 3.53 Die Relation >Z ist ebenfalls antisymmetrisch. Wenn a >Z 

b und b >Z a, dann muss a = b sein. Moment .... Es gibt doch gar 

keine zwei Zahlen a, b ∈ Z für die a >Z b und gleichzeitig b >Z a ist! Ist 

die getroffene Aussage dann überhaupt sinnvoll? Ein gewiefter Anwalt 

würde so argumentieren: Die Aussage lautet wörtlich, dass alle Paare 

von ganzen Zahlen (a, b), die die (zugegebenermaßen unmögliche) 

Eigenschaft besitzen dass a >Z b und b >Z a, auch noch die Eigenschaft 

a = b erfüllen. Wenn diese Aussage falsch wäre, müsste es ein 

Gegenbeispiel geben. Wer eins findet, der spreche jetzt oder schweige 

für immer. Winkeladvokaten wie diesem verdanken wir die Tatsache, 

dass eine wenn–dann Aussage immer wahr ist, sobald der wenn–Teil 

falsch ist. 


R = {(1, 2), (2, 3), (3, 1)}. 

Auch diese Relation ist antisymmetrisch. Allzuviel Ordnung stiftet sie 

jedoch nicht: Sie legt zwar fest, dass 1 vor 2 und 2 vor 3 kommt, gleichzeitig 

aber auch 3 vor 1. Das entspricht nicht unserer Vorstellung einer 

Ordnung! Um halbwegs zu einer Ordnung zu kommen muss man also 

zusätzlich noch Transitivität fordern. 

Definition 3.55 (Halbordnung) 

Eine Relation R heißt Halbordnung auf A wenn R ⊆ A × A und R 

reflexiv auf A, transitiv und antisymmetrisch ist. 

Somit ist ≤N eine Halbordnung auf N. Andererseits ist >Q keine Halbordnung 

auf Q, da >Q nicht reflexiv ist. Das ist kontraintuitiv — warum hat


man die Forderung nach Reflexivität in die Definition des Begriffs Halbordnung 

eingebaut? Ich habe keine Ahnung, es muss wohl ein Pedant gewesen 

sein, der darauf bestanden hat.... 

Halbordnungen kommen unserer Vorstellung einer Ordnung schon recht 

nahe. Andererseits ist aber auch z.B. 

R = {(a, a) | a ∈ N} 

= {(1, 1), (2, 2), (3, 3), . . .} 

eine Halbordnung auf N und diese Relation hat wirklich nichts Ordnendes 

an sich. Ordnung ist nur gewährleistet, wenn man jedes Element von N mit 

jedem anderen vergleichen kann, d.h. für alle a, b ∈ N gilt aRb oder bRa. 

Fordert man diese Vergleichbarkeit noch zusätzlich von einer Halbordnung, 

erhält man eine totale (oder lineare Ordnung): 

Definition 3.56 (totale Ordnung) 

Eine Relation R heißt totale Ordnung auf A wenn R Halbordnung 

auf A ist und 

∀a ∀b aRb ∨ bRa. 

Beispiel 3.57 ≤N ist eine totale Ordnung auf N. 

Fordert man von der Relation R ⊆ A × A zusätzlich noch, dass es in jeder 

Teilmenge B ⊆ A ein Element gibt, das zu allen anderen Elementen von B 

in Relation steht, dann heißt R Wohlordnung auf A. 

Definition 3.58 (Wohlordnung) 

Eine Relation R heißt Wohlordnung auf A wenn R totale Ordnung 

auf A ist und 

∀B ⊆ A ∃x ∈ B ∀y ∈ B xRy. 

Beispiel 3.59 ≤N ist eine Wohlordnung auf N während ≤Z keine Wohlordnung 

auf Z ist. Ist z.B. B die Menge der geraden ganzen Zahlen, 

dann ist B ⊆ Z aber B hat kein kleinstes Element. 

Beispiel 3.60 ≥N ist zwar eine totale Ordnung auf N aber keine Wohlordnung 

auf N. In einer unendliche Teilmenge von N gibt es kein Element, 

das größer gleich allen anderen ist.


Beispiel 3.61 Die Teilmengenrelation auf P(N) ist keine Wohlordnung, 

da sie keine totale Ordnung ist. So gilt z.B. 

weder {2, 3} ⊆ {4} noch {4} ⊆ {2, 3}. 

Beispiel 3.62 Jede totale Ordnung auf einer endlichen Menge ist auch 

eine Wohlordnung. 

Beispiel 3.63 ≤R ist keine Wohlordnung auf R + 0 , da z.B. die Menge 

kein kleinstes Element hat. 

{x | x ∈ R ∧ x > 0 ∧ x < 1} 

In einer Wohlordnung kann es keine unendlich langen Folgen der Form 

geben, da sonst 

. . .R a3 R a2 R a1 

B = {a1, a2, a3, . . .} 

eine Teilmenge von A ist, die kein Element hat, das mit allen anderen Elementen 

von B in Relation steht. Solche Relationen spielen eine Rolle, wenn 

man z.B. beweisen möchte, dass ein Computerprogramm terminiert. 

3.5 Umkehrrelation 

Eine Relation R ⊆ A×B ist eine Menge von Paaren, wobei die erste Komponente 

eines jeden Paars aus A ist und die zweite aus B. Vertauscht man nun in 

jedem Paar die beiden Komponenten, erhält man eine Relation R −1 ⊆ B×A. 

Diese Relation heißt Umkehrrelation von R. 

Definition 3.64 (Umkehrrelation) 

Die Umkehrrelation einer Relation R ist definiert durch 

R −1 = {(a, b) | (b, a) ∈ R}. 

Wenn R ⊆ A × B, dann ist offensichtlich R −1 ⊆ B × A. 


Dann ist 

R = {(1, 2), (2, 2), (2, 3)}. 

R −1 = {(2, 1), (2, 2), (3, 2)}


Beispiel 3.66 Die Umkehrrelation der Nachfolgerrelation auf N ist die 

Vorgängerrelation auf N: 

σ −1 = {(a, b) | (b, a) ∈ σ} 

= {(a, b) | a ∈ N, b ∈ N, a = b + 1} 

= {(2, 1), (3, 2), (4, 3) . . .}. 

Beispiel 3.67 Die Umkehrrelation der kleiner Relation auf N ist die 

größer Relation auf N: 

< −1 

N 

= {(a, b) | (b, a) ∈N . 

Eine Relation R ist symmetrisch genau dann wenn R = R −1 . Mit den in 

diesem Kapitel vorgestellten Techniken müssten Sie in der Lage sein, solche 

Aussagen zu beweisen.


4 Beweistechniken 

Erfahrungsgemäß haben Studenten mit Beweisen oft ihre liebe Not. Ich kann 

und möchte Ihnen aber das Thema nicht ersparen, da Beweisen nichts anderes 

ist als zielorientiertes logisches Denken, und das ist vor allem für Informatiker 

unverzichtbar. Was ich aber für Sie tun kann, ist Ihnen ein paar Rezepte an 

die Hand zu geben, wie Sie Ihren Weg durch mathematische (und natürlich 

auch nichtmathematische) Beweise finden können, siehe [3], Seite 263ff. Noch 

genauer formalisiert werden diese Techniken in Kapitel ??, dies aber mit 

dem Ziel, dass Beweise komplett mechanisch und ohne jegliche menschliche 

Intelligez durchgeführt werden können. Der Nachteil hierbei ist, dass der 

Aufwand astronomisch wächst. 

Ein mathematischer Beweis hat viel Ähnlichkeit mit einem Handel. Manche 

Dinge besitzt man, manche Dinge möchte man gerne haben und durch 

geschickte Transaktionen versucht man alle Dinge, die man haben möchte, 

zu bekommen. Die Dinge, die in einem Beweis gedealt werden sind Aussagen, 

die Transaktionen heißen Beweisschritte. Eine Aussage “besitzt” man, 

wenn man gezeigt hat (oder in einer Fallunterscheidung annimmt), dass sie 

wahr ist. Die Menge dieser Aussagen bezeichnet man mit “Gegeben”. Analog 

bezeichnet man die Menge der Aussagen, die man beweisen möchte, mit “Zu 

zeigen”. Nachfolgend werden Beweisschritte aufgelistet, die auf Aussagen in 

“Gegeben” bzw. “Zu zeigen” anwendbar sind. Ein Beweis ist dann nichts 

anderes als eine Folge solcher Beweisschritte, an deren Ende die zu zeigenden 

Aussagen gegeben sind. 

Die Menge “Gegeben” ist dabei stets wachsend. Hat man einmal von 

einer Aussage gezeigt, dass sie wahr ist, kann man zu jedem Zeitpunkt im 

Beweis auf sie zurückgreifen. Andererseits werden die Aussagen in “Zu zeigen” 

in den auf sie angewandten Beweisschritten durch einfachere Aussagen 

ersetzt. 

Die erste (und oft schwierigste) Hürde bei einem Beweis ist, sich klar 

zu machen welche Aussagen gegeben und welche zu zeigen sind — und dies 

korrekt hinzuschreiben. In der Menge “Gegeben” ist unser gesamtes mathematisches 

Wissen. Die Menge “Zu zeigen” enthält die zu beweisende Aussage, 

d.h. besteht in der Regel aus einem einzigen Element. 

4.1 Allgemein anwendbare Beweistechniken 

Einsetzen von Definitionen. 

Tritt in einer Aussage ein Begriff auf, dann kann man immer die Definition 

des Begriffes einsetzen. Dies gilt sowohl für Aussagen in “Ge-


geben” als auch in “Zu zeigen”. In der Regel sollte man diesen Schritt 

erst dann anwenden, wenn sonst keine Schritte anwendbar sind, da die 

dabei entstehenden Formeln meistens länger werden. 

Beispiel 4.1 

Zu zeigen: A ⊆ B. 

Beweisschritt: Einsetzen der Definition von ⊆. 

Zu zeigen: ∀x x ∈ A → x ∈ B. 

Beispiel 4.2 

Gegeben: R ist reflexiv auf A. 

Beweisschritt: Einsetzen der Definition von “reflexiv”. 

Gegeben: ∀x x ∈ A → xRx. 

Logische Umformungen 

Man kann zu jeder Zeit im Beweis die gegebenen bzw. zu zeigenden 

Aussagen logisch äquivalent umformen. Die wichtigsten Regeln hierzu 

sind in den Theoremen 7.24 und 7.25 zusammengefasst. 

Beispiel 4.3 

Zu zeigen: ¬xRy ∨ ¬yRz ∨ xRz 

Beweisschritt: Logische Umformung. 

Zu zeigen: (xRy ∧ yRz) → xRz 

Beispiel 4.4 

Zu zeigen: ¬∃y ∈ Z ∀x ∈ Z x ≥ y 

Beweisschritt: Logische Umformung. 

Zu zeigen: ∀y ∈ Z ∃x ∈ Z x < y 

4.2 Beweistechniken für aussagenlogische Symbole 

Zu zeigende Aussage vom Typ A → B. 

Da die meisten Theoreme die Form “wenn ...dann ...” haben, kann 

der nachfolgend beschriebene Beweisschritt fast immer als erster im 

Beweis angewandt werden. Er besteht darin, dass man annimmt dass 

A wahr ist, und unter Verwendung dieser Annahme B beweist. 

Beispiel 4.5 

Zu zeigen: c ∈ A → cRc. 

Beweisschritt: Wenn dann Aussage. 

Gegeben: c ∈ A 

Zu zeigen: cRc


Wieso darf man hier einfach annehmen, dass A wahr ist? Dieser Beweisschritt 

ist genaugenommen eine abgekürzte Fallunterscheidung. Im 

ersten Fall nimmt man an, dass A wahr ist, im zweiten, dass A falsch 

ist. Nun kann man sich aber den zweiten Fall sparen, denn wenn A 

falsch ist, ist A → B sowieso wahr, siehe Tabelle 2.1. 

Zu zeigende Aussage vom Typ ¬A. 

In diesem Fall nimmt man A zu den gegebenen Aussagen dazu und 

leitet einen Widerspruch her. 

Beispiel 4.6 

Zu zeigen: ¬∃x x ∈ A ∧ x ∈ B. 

Beweisschritt: Widerspruchsbeweis. 

Annahme: ∃x x ∈ A ∧ x ∈ B. 

Zu zeigen: Widerspruch. 

Gegebene Aussage vom Typ A und A → B. 

Wenn sowohl A als auch A → B gegeben sind, dann kann man auch 

B zu den gegebenen Aussagen dazunehmen. Dieser Beweisschritt heißt 

Modus Ponens. 

Beispiel 4.7 

Gegeben: aRb und aRb → bRa 

Beweisschritt: Modus Ponens 

Gegeben: bRa. 

Gegebene Aussage vom Typ A ∨ B. 

Ist eine Aussage vom Typ A∨B gegeben, dann kann man davon ausgehen, 

dass entweder A oder B wahr ist, oder beide. Entsprechend kommt 

man oft mit einer Fallunterscheidung weiter: 

• Fall 1: Gegeben A und ¬B 

• Fall 2: Gegeben ¬A und B 

• Fall 3: Gegeben A und B 

Häufig kommt man auch schon mit nur zwei Fällen hin: 

• Fall 1: Gegeben A. 

• Fall 2: Gegeben B. 

Gegebene Aussage vom Typ A ↔ B. 

Ist eine Aussage vom Typ A ↔ B gegeben, dann darf man jedes Auftreten 

von A durch B ersetzen und umgekehrt. Dies gilt sowohl für die


gegebenen als auch für die zu zeigenden Formeln. Da Definitionen immer 

die Form A ↔ B haben, entspricht dieser Beweisschritt dem o.g. 

Einsetzen von Definitionen. 

Beispiel 4.8 

Gegeben: A ⊆ B ↔ ∀x (x ∈ A → x ∈ B). 

Zu zeigen: A ⊆ B. 

Beweisschritt: 

Zu zeigen: ∀x (x ∈ A → x ∈ B). 

Andere Beweissituationen können oft durch logische Umformungen auf die 

genannten Situationen reduziert werden. Muss man z.B. eine Aussage der 

Form A ∨ B beweisen, kann man dies z.B. in ¬A → B umformen und o.g. 

Beweisschritt für zu zeigende Aussagen der Form A → B anwenden. 

4.3 Beweistechniken für Quantoren 

Zu zeigende Aussage vom Typ ∀x F(x). 

Hat eine zu zeigende Aussage die Form ∀x F(x), d.h. beginnt mit einem 

Allquantor, dann kann man diesen einfach weglassen indem man sagt 

“sei x beliebig aber fest”. 

Dieser Schritt scheint trivial, was aber hinter den Kulissen passiert ist, 

dass man aus der Variablen x eine Konstante macht und die zu zeigende 

Aussage dadurch vereinfacht. 

Beispiel 4.9 

Zu zeigen: ∀x x ∈ A → xRx. 

Beweisschritt: Sei x beliebig aber fest. 

Zu zeigen: x ∈ A → xRx. 

Mathematisch sauberer wäre es, wenn man tatsächlich ein neues Konstantensymbol 

statt x verwenden würde, da dann keine Verwirrung 

entstehen könnte, was Variablen- und was Konstantensymbole sind. 

Beispiel 4.10 

Zu zeigen: ∀x x ∈ A → xRx. 

Beweisschritt: Sei c beliebig aber fest. 

Zu zeigen: c ∈ A → cRc. 

Zu zeigende Aussage vom Typ ∃x F(x). 

Für diese Beweissituation gibt’s kein einfaches Rezept, und das ist auch


der Grund weshalb Beweise oft schwierig sind. Gefordert ist, dass man 

ein Objekt konstruiert, welches die durch F beschriebene Eigenschaft 

besitzt. Solch ein Objekt kann durch ein bereits eingeführtes Konstantensymbol 

beschrieben werden, oder allgemeiner durch einen Term, in 

dem nur bereits eingeführte Konstantensymbole vorkommen. 

Beispiel 4.11 

Zu zeigen: ∀x ∃y y > x 

Beweisschritt: Sei x beliebig aber fest. 

Zu zeigen ∃y y > x. 

Beweisschritt: Sei y = x + 1. 

Zu zeigen: x + 1 > x. Trivial. 

Gelingt es wie in diesem Beispiel einen Term für ein Objekt mit der geforderten 

Eigenschaft zu finden, spricht man von einem konstruktiven 

Beweis. Leider lässt sich in der Mathematik aber nicht alles konstruktiv 

beweisen (schwieriges Thema...). In diesen Fällen muss man einen 

Widerspruchsbeweis führen: Man nimmt an, dass es kein Objekt mit 

der geforderten Eigenschaft gibt, und leitet damit einen Widerspruch 

her. In obigem Beispiel würde ein Widerspruchsbeweis wie folgt laufen: 

Beispiel 4.12 

Zu zeigen: ∃y y > x. 

Beweisschritt: Widerspruchsbeweis. 

Gegeben: ¬∃y y > x. 

Zu zeigen: Widerspruch. 

Beweisschritt: Äquivalente Umformung. 

Gegeben: ∀y y ≤ x. 

Beweisschritt: Ersetze die allquantifizierte Variable y durch den 

konstanten Term x + 1. 

Gegben: x + 1 ≤ x. Widerspruch. 

Zu zeigende Aussage vom Typ ∃!x F(x). 

Hier muss bewiesen werden, dass es genau ein x gibt, welches die durch 

F beschriebene Eigenschaft besitzt. Der Beweis kann in zwei Teile zerlegt 

werden: 

• Beweisen, dass es mindestens ein solches x gibt, d.h. 

∃x F(x).


• Beweisen, dass es höchstens ein solches x gibt, d.h. 

∀x1, x2 (F(x1) ∧ F(x2)) → x1 = x2. 

Gegebene Aussage vom Typ ∀x F(x). 

Hat eine zu zeigende Aussage die Form ∀x F(x), d.h. beginnt mit 

einem Allquantor, kann man diesen weglassen und im Rest der Formel 

die freien Vorkommen von x durch einen beliebigen, konstanten Term 

ersetzen. 

Beispiel 4.13 

Gegeben: ∀x ∃y x > y 

Beweisschritt: Sei x = √ 2 

Gegeben: ∃y √ 2 > y 

Klar, wenn eine Aussage für jedes Objekt wahr ist, dann auch für ein 

bestimmtes Objekt, das durch einen Term beschrieben wird. 

Gegebene Aussage vom Typ ∃x F(x). 

In diesem Fall weiss man, dass es ein Objekt gibt, welches die durch 

F beschriebene Eigenschaft besitzt. Man fährt fort, indem man dem 

Kind einen Namen gibt, d.h. ein neues Konstantensymbol c einführt 

und sagt 

“sei c so dass F(c) wahr ist. 

Dieses neue Objekt kann man in den nachfolgenden Beweisschritten 

verwenden. 

Beispiel 4.14 

Gegeben: ∃x ∀y x ≤ y 

Beweisschritt: Sei c so dass . . . 

Gegeben: ∀y c ≤ y 

Gegebene Aussage vom Typ ∃!x F(x). 

Hier weiß man, dass es genau ein x gibt, das die durch F beschriebene 

Eigenschaft besitzt. Dieses Wissen kann man äquivalent durch zwei 

einfachere Formeln darstellen: 

• Es gibt mindestens ein x mit der Eigenschaft, d.h. 

∃x F(x). 

• Es gibt höchstens ein x mit der Eigenschaft, d.h. 

∀x1, x2 (F(x1) ∧ F(x2)) → x1 = x2.


4.4 Zusammenfassung 

Ausgangssituation Beweisschritt Regel 

Ann. A → B ¬A ∨ B Umformung 

z.zg. — — 

Ann. — A Wenn-dann Regel 

z.zg. A → B B 

Ann. — A Widerspruchsbeweis 

z.zg. ¬A B, ¬B für beliebige 

Formel B 

Ann. A ∨ B Fall 1: A Fallunterscheidung 

Fall 2: B 

z.zg. — — 

Ann. — — 

z.zg. A ∨ B ¬A → B Umformung 

Ann. A ∧ B A, B 

z.zg. — — 

Ann. — — 

z.zg. A ∧ B Schritt 1: A Zerlegen in 

Schritt 2: B Teilprobleme 

Ann. A ↔ B A durch B ersetzen u.a. Einsetzen 

z.zg. — A durch B ersetzen von Definitionen 

Ann. — — 

z.zg. A ↔ B (A → B) ∧ (B → A) Umformung 

Ann. A, A → B B Modus Ponens 

z.zg. — — 

Tabelle 4.1: Beweisregeln für Aussagenlogische Symbole


Ausgangssituation Beweisschritt Regel 

Ann. ∀x F(x) F(t) für beliebigen Spezialfall 

Term t ohne Variablen 

z.zg. — — 

Ann. — x beliebig aber fest Elimination 

(x ab jetzt Konstante) Allquantor 

z.zg. ∀x F(x) F(x) 

Ann. ∃x F(x) x so dass F(x) Benennen 

(x ab jetzt Konstante) 

z.zg. — — 

Ann. — — 

z.zg. ∃x F(x) F(t) für einen Beispiel konstruieren 

beliebigen Term t 

Ann. ∃!x F(x) ∃x F(x), Umformung 

∀x1, x2 (F(x1) ∧ F(x2)) 

→ x1 = x2 

z.zg. — — 

Ann. — — 

z.zg. ∃!x F(x) ∃x F(x), Umformung 

∀x1, x2 (F(x1) ∧ F(x2)) 

→ x1 = x2 

Tabelle 4.2: Beweisregeln für Quantoren


5 Funktionen 

In diesem Kapitel wird gezeigt, dass auch eine Funktion nichts anderes als 

eine Menge ist. Bei der Konstruktion von Funktionen setzen wir dabei auf den 

bereits bekannten Relationen auf. Es stellt sich heraus, dass eine Funktion 

im Wesentlichen eine Relation mit speziellen Eigenschaften ist. 

Häufig wird unter einer Funktion eine Rechenvorschrift verstanden. So 

sagt z.B. die Funktion f(x) = x 2 , dass man den Input x quadrieren muss, um 

zum zugehörigen Output zu kommen. Für Informatiker sind in Funktionen 

also eng mit Computer Programmen verwandt. Funktionen sind jedoch wesentlich 

allgemeiner und müssen weder mit Zahlen noch mit Rechnen zu tun 

haben. Ist z.B. M die Menge aller Studenten an der FH Heilbronn und für 

alle x ∈ M sei f(x) das Semester von x, dann ist f ebenfalls eine Funktion. 

Generell besteht eine Funktion also aus drei Dingen: 

• Einer Menge A aus der die Argumente (oder Inputs) kommen. Im Beispiel 

ist dies die Menge der Studenten. 

• Einer Menge B aus der die Funktionswerte (oder Outputs) kommen. 

Im Beispiel ist dies die Menge {1, 2, 3, . . .}. 

• Einer Zuordnung von jedem Element aus A zu genau einem Element der 

Menge B. So eine Zuordnung kann man durch eine Relation R ⊆ A×B 

beschreiben, die die spezielle Eigenschaft hat, dass es zu jedem a ∈ A 

genau ein b ∈ B gibt mit aRb. 

Aus der grafischen Darstellung der Mengen A und B und der Relationen R 

durch Pfeile zwischen allen Elementen a ∈ A und b ∈ B mit aRb, erhält man 

die grafische Darstellung einer Funktion, siehe Bild 5.1. 

Entscheidend ist, dass die Relation R jedem a ∈ A genau ein b ∈ B 

zuordnet. Die in Bild 5.2 dargestellten Objekte sind somit keine Funktionen 

obwohl auch hier zwei Mengen A, B und eine Relation R ⊆ A × B im Spiel 

sind! Andererseits darf zwei unterschiedlichen Elementen a1, a2 ∈ A durchaus 

das selbe b ∈ B zugeordnet werden, siehe Bild 5.1. Für die Quadrat Funktion 

ist dies z.B. für a1 = 2 und a2 = −2 tatsächlich auch der Fall. 

5.1 Rechtseindeutige Relationen 

Beispiel 5.1 Sei R ⊆ Z × Z die Relation 

R = {(a, b) | a ∈ Z, b ∈ Z, b = a 3 }.


R ⊆ A × B 

A B 

Abbildung 5.1: Grafische Darstellung einer Funktion. Jedem a ∈ A wird 

genau ein b ∈ B zugeordenet. Es ist erlaubt, dass unterschiedliche a’s das 

selbe b bekommen. Es ist auch erlaubt, dass ein paar b’s leer ausgehen. 

R ⊆ A × B 

A B 

R ⊆ A × B 

A B 

Abbildung 5.2: Links: Keine Funktion weil einem a zwei b’s zugeordnet werden. 

Rechts: Keine Funktion weil einem a gar kein b zugeordnet wird. 

Offensichtlich hat R die Eigenschaft, dass es zu jedem a ∈ Z genau 

ein b ∈ Z gibt, so dass aRb. Daher kann man R auch als Zuordnung 

interpretieren, die jedem Argument a ∈ Z genau einen Funktionswert 

b = a 3 ∈ Z zuordnet. 

Beispiel 5.2 Auch die in Bild 3.1 links dargestellte Relation σ hat die 

Eigenschaft, dass es zu jedem a ∈ N genau ein b ∈ N gibt, so dass 

b = a + 1. Die im gleichen Bild rechts dargestellte Relation ≡3 hat 

diese Eigenschaft jedoch nicht, da z.B. 2 ≡3 2 und 2 ≡3 5. 

Beispiel 5.3 Die in Bild 3.4 rechts dargestellte Relation hat die Eigenschaft, 

dass es zu jedem a ∈ R genau ein b ∈ R gibt mit b = a 2 . Die im 

gleichen Bild links dargestellte Relation hat diese Eigenschaft jedoch 

nicht, da z.B. |2| = |2| und |2| = | − 2|


Definition 5.4 (Rechtseindeutig) 

Eine Relation R heißt rechtseindeutig, wenn es zu jedem a höchstens 

ein b gibt, so dass aRb. 

Ein erster Versuch, diese Definition in eine Formel zu packen, könnte so 

aussehen: 

rechtseindeutig(R) ↔ ∀a ∃b aRb. 

Dies ist jedoch nicht ganz korrekt: Es wird nicht gefordert, dass ein b existiert 

sondern höchstens ein b. “Höchstens ein” bedeutet entweder gar keins 

oder genau eines, aber eben nicht mehr als eines. Die Bedeutung des Existenzquantors 

ist jedoch “mindestens ein”, d.h. eins oder mehrere aber nicht 

keines. Wie kann man “höchstens ein” mit den bereits bekannten Symbolen 

formulieren? Etwas umständlich ausgedrückt würde es so gehen: 

Wenn es zwei Objekte mit der geforderten Eigenschaft gibt, dann 

müssen diese gleich sein. 

Den Pulitzer Preis wird man dafür zwar nicht bekommen, aber wenigstens 

müssen wir nicht noch mehr Symbole einführen. Die korrekte Formel für eine 

rechtseindeutige Relation ist somit 

rechtseindeutig(R) ↔ ∀a ∀b1 ∀b2 (aRb1 ∧ aRb2) → b1 = b2. 

Relationale Datenbanken. Ein Konzept, das der Rechtseindeutigkeit sehr 

ähnlich ist, findet man in Datenbanken wieder. Man spricht dort von Schlüsseln. 

Die Personaldatenbank einer kleinen Firma könnte z.B. wie folgt aussehen: 

Vorname Nachname Personalnummer Rolle 

Hans Müller 10239087 Senior Manager 

Dieter Müller 76239872 Manager 

Kurt Lang 23984751 Manager 

Hans Meier 83982136 Programmierer 

Die Spalte Personalnummer spielt eine besondere Rolle, da durch die Angabe 

der Personalnummer eindeutig eine Person festgelegt ist. Kennt man z.B. nur 

den Nachnamen Müller oder die Rolle Manager, ist nicht klar welche Person 

gemeint ist. Die Personalnummer wird daher Schlüssel genannt. Jede Spalte 

der Tabelle hat einen Typ, so haben z.B. Vorname, Nachname und Rolle den 

Typ String, während Personalnummer den Typ Integer hat. Mathematisch 

gesehen sind String und Integer nichts anderes als Mengen, nämlich die


Menge aller Zeichenketten und die Menge aller ganzer Zahlen. Die Tabelle 

kann somit als Relation 

beschrieben werden. Es gilt z.B. 

während 

R ⊆ String ×String ×Integer ×String 

(Dieter, Müller, 76239872, Manager) ∈ R 

(Hans, Lang, 83982136, Manager) ∈ R. 

Dass die Personalnummer Schlüssel von R ist, lässt sich nun wie folgt ausdrücken: 

für alle x3 ∈ Integer 

existiert höchstens ein x1, x2, x4 ∈ String 

so dass (x1, x2, x3, x4) ∈ R 

Das “höchstens ein” bedeutet nicht, dass es zu jeder ganzen Zahl einen Mitarbeiter 

mit dieser Personalnummer geben muss, es bedeutet aber andererseits, 

dass keine zwei Mitarbeiter die selbe Personalnummer haben können. Das 

Konzept der Schlüssel in Datenbanken ist also im Wesentlichen eine Erweiterung 

des Begriffs der rechtseindeutigen Relation. Um einen noch engeren 

Zusammenhang herzustellen, kann man die Komponenten von R umordnen 

und gruppieren. Es entsteht dann eine Relation 

mit z.B. 

Damit gilt 

R ⊆ Integer ×String 3 

76239872, (Dieter, Müller, Manager) ∈ R. 

für alle x ∈ Integer 

existiert höchstens ein y ∈ String 3 

so dass (x, y) ∈ R, 

d.h. die Relation ist rechtseindeutig, da die Personalnummer Schlüssel ist.


5.2 Partielle Funktionen 

Interpretiert man die linke Seite einer Relation als Argument und die 

rechte Seite als Funktionswert, so sieht man, dass Funktionen im Prinzip 

nichts anderes sind als spezielle Relationen. Die Einschränkung, die man 

dabei aber machen muss ist, dass jedem Argumentwert nur höchstens ein 

Funktionswert zugeordnet ist. Dies ist der entscheidende Unterschied zwischen 

einer Relation und einer partiellen Funktion. Stellt man die härtere 

Forderung, dass jedem Argument genau ein Funktionswert zugeordnet wird, 

erhält man (totale) Funktionen. Das in Bild 5.2 rechts dargestellte Objekt 

ist eine partielle Funktion aber keine (totale) Funktion. 

Im Folgenden seien A, B Mengen und R ⊆ A×B eine Relation. Ein rein 

verwaltungstechnischer Unterschied zwischen einer rechtseindeutigen Relation 

und einer partiellen Funktion ist, dass man bei der partiellen Funktion 

die Mengen A und B noch mit abspeichert. 

Definition 5.5 (Partielle Funktion) 

Ein Tripel f = (A, B, R) heißt partielle Funktion, wenn 

• R ⊆ A × B ist und 

• R rechtseindeutig ist, d.h. für jedes a ∈ A höchstens ein b ∈ B 

existiert mit aRb. 

Die Relation R heißt hierbei Graph der Funktion f. 

Beachten Sie, dass bei der Definition einer partiellen Funktion nicht nur 

der Graph R von f sondern auch die Mengen A und B angegeben werden 

müssen! 

Ist f = (A, B, R) eine partielle Funktion und a ∈ A, so existiert höchstens 

ein Element b ∈ B mit aRb. Dieses Element wird auch kurz mit f(a) bezeichnet 

und Funktionswert von a genannt, falls es existiert. Man sagt daher auch, 

dass f Elemente der Menge A auf Elemente der Menge B abbildet oder noch 

einfacher 

f ist eine partielle Funktion von A nach B.


5.3 Definitionsbereich, Wertebereich 

Definition 5.6 (Definitionsbereich, Wertebereich) 

Sei f = (A, B, R) eine partielle Funktion. 

• Der Definitionsbereich def(f) ⊆ A von f ist 

def(f) = {a ∈ A | es existiert ein b ∈ B so dass aRb } 

= {a | a ∈ A ∧ ∃b b ∈ B ∧ aRb} 

• Der Wertebereich bild(f) ⊆ B von f (auch Bild von f genannt) 

ist 

bild(f) = {b ∈ B | es existiert ein a ∈ A so dass aRb } 

= {b | b ∈ B ∧ ∃a a ∈ A ∧ aRb} 

Bemerkung. Das Bild von f kann man auch kompakt schreiben als 

bild(f) = {f(a) | a ∈ def(f)}. 

Man schreibt hierfür auch oft f(A). 

Ist f = (A, B, R) eine partielle Funktion, dann ist garantiert, dass es zu 

jedem a ∈ A höchstens einen Funktionswert f(a) gibt. Es kann aber durchaus 

passieren, dass es zu einem a keinen Funktionswert gibt. Man sagt dann auch 

dass f an der Stelle a eine Definitionslücke hat bzw. f(a) undefiniert ist. 

Beispiel 5.7 In Bild 5.3 ist eine partielle Funktion f = (A, B, R) dar- 

1 

3 

2 

R ⊆ A × B 

A B 

Abbildung 5.3: Partielle Funktion. 

6 

4 

7 

5


gestellt mit 

A = {1, 2, 3} 

B = {4, 5, 6, 7} 

R = {(1, 4), (3, 6)}. 

Es gilt somit f(1) = 4 und f(3) = 6 während f(2) undefiniert ist. Die 

Funktion hat also an der Stelle 2 eine Definitionslücke. Weiterhin ist 


def(f) = {1, 3} 

bild(f) = {4, 6}. 

f = R, R, {(a, b) | a ∈ R, b ∈ R, ab = 1} 

Dies ist die Kehrwertsfunktion f(x) = 1/x, die für x = 0 nicht definiert 

ist. Der Definitionsbereich von f ist 

def(f) = R \ {0}, 

d.h. f hat an der Stelle 0 eine Definitionslücke. 

5.4 Totale Funktionen 

Wenn eine partielle Funktion keine Definitionslücken hat, nennt man sie auch 

totale Funktion (oder einfach Funktion). 

Definition 5.9 (Totale Funktion) 

Eine partielle Funktion f = (A, B, R) heißt total wenn def(f) = A. 

Eine totale Funktion f = (A, B, R) ordnet also jedem a ∈ A genau ein b ∈ B 

zu. Man sagt auch f ist auf ganz A definiert. Statt totaler Funktion sagt man 

auch einfach Funktion von A nach B. 

Für eine totale Funktion f = (A, B, R) gilt also, dass jedem a ∈ A genau 

ein b ∈ B zugeordnet wird, d.h. 

∀a a ∈ A → (∃!b b ∈ B ∧ aRb). 

Etwas lesbarer werden solche Formeln, wenn man direkt zu den Quantoren 

dazuschreibt aus welcher Menge die quantifizierten Variablen kommen sollen, 

d.h. 

∀a ∈ A ∃!b ∈ B aRb.


Solche Quantoren werden relativierte Quantoren genannt. Für Beweise eignet 

sich die ausführliche Darstellung jedoch besser, da hier die einzelnen 

Beweisschritte quasi schon dastehen. 

Eigentlich braucht man den genau–ein–Existenzquantor ∃! gar nicht, 

sondern kann ihn durch die anderen Symbole ersetzen: Genau ein bedeutet 

mindestens ein und gleichzeitig höchstens ein. Mindestens ein ist die Bedeutung 

des normalen Existenzquantors, höchstens ein kann man wie in Kapitel 

5.1 gezeigt formulieren. Somit erhält man folgende Formel für die Aussage 

“zu jedem a ∈ A gibt es genau ein b ∈ B mit aRb”: 

 

 

∀a ∈ A ∃b ∈ B aRb) 

 

mindestens ein 

∧ ∀a ∀b1 ∀b2 (aRb1 ∧ aRb2) → b1 = b2 

 

höchstens ein 

Definition 5.10 (Menge der partiellen bzw. totalen Funktionen) 

Die Menge der partiellen Funktionen von A nach B wird mit 

A ⇀ B bezeichnet, d.h. 

A ⇀ B = {f | ∃R f = (A, B, R) ∧ R ⊆ A × B ∧ 

∀a ∈ A ∀b1 ∈ B ∀b2 ∈ B (aRb1 ∧ aRb2) → b1 = b2}. 

Die Menge der totalen Funktionen von A nach B wird mit A → B 

bezeichnet, d.h. 

A → B = {f | ∃R f = (A, B, R) ∧ R ⊆ A × B ∧ 

∀a ∈ A ∃!b ∈ B aRb}. 

Um also auszudrücken, dass f eine totale Funktion von A nach B ist, kann 

man einfach schreiben 

f ∈ A → B. 

In der mathematischen Literatur wird statt des ∈ Symbols meistens ein Doppelpunkt 

verwendet, d.h. 

f : A → B. 

Dies ist historisch bedingt und führt dazu, dass sich heute viele Mathematiker 

gar nicht bewusst sind, was A → B wirklich bedeutet. 

Bemerkung. Manchmal wird die Menge der Funktionen von A nach B 

auch mit B A bezeichnet. Dies ist dadurch motiviert, dass es für endliche 

Mengen A, B genau |B| |A| Funktionen von A nach B gibt. 

.


Definition 5.11 (n-stellige Funktion) 

Ist f = (A n , B, R) eine Funktion, so sagt man auch f ist n-stellige 

Funktion auf A. 

Definition 5.12 (m-wertige Funktion) 

Ist f = (A, B m , R) eine Funktion, so sagt man auch f ist m-wertige 

Funktion auf B. 

Beispiel 5.13 Die Funktion f ∈ R → R, f(x) = x 2 ist eine einstellige 

und einwertige Funktion auf R. 

Beispiel 5.14 Die Funktion f ∈ N × N → N, f(x, y) = x + y ist eine 

zweistellige Funktion auf N, siehe Bild 5.4. Der Graph von f ist in 

diesem Fall die Relation 

(1, 1), 2 , (3, 4), 7 , (2, 5), 7 , . . . . 

(1, 1) 

. . . 

(2, 5) 

(3, 4) 

. . . 

N × N N 

Abbildung 5.4: Grafische Darstellung der Additionsfunktion + ∈ N×N → N. 

Beispiel 5.15 Die Funktion f ∈ Z 3 → Z 2 , f(x, y, z) = (xy, xz) ist eine 

dreistellige und zweiwertige Funktion auf Z. 

Für zweistellige Funktionen verwendet man häufig die sog. Infixnotation, d.h. 

das Funktionssymbol steht zwischen den Operanden, z.B. 

und nicht wie üblich davor, d.h. 

a + b oder a/b 

+(a, b) oder /(a, b). 

7 

2 

. . .


5.5 Erweiterung 

Angenommen Sie haben ein Java Funktion geschrieben, die von einer int 

Zahl die Quersumme berechnet. Früher oder später wird ein Benutzer kommen 

und sich beschweren, dass das Programm nur Zahlen bis 2 31 − 1 akzeptiert, 

aber eben nicht größere. Sie müssten dann das Programm so modifizieren, 

dass es beliebig große Zahlen verarbeiten kann, z.B. unter Verwendung 

des Typs BigInteger. Was Sie dabei gemacht haben, ist die ursprüngliche 

Funktion 

f ∈ int → int 

zu erweitern zu einer Funktion 

f ∈ Z → Z, 

siehe Bild 5.5. Dieser Prozess tritt häufig auf wenn im Nachhinein zusätzliche 

5 000 000 000 

23 

. . . 

192 

Z 

48 

. . . 

12 

5 

Z 

. . . 

int int 

Abbildung 5.5: Erweiterung der Quersummenfunktion von int → int nach 

Z → Z. 

Features verlangt werden. Wir werden später darauf zurückkommen wenn 

wir Ringe und Körper erweitern und damit Polynome und komplexe Zahlen 

konstruieren. 

Definition 5.16 (Erweiterung) 

Seien f = (A, B, R) und g = (A ′ , B ′ , R ′ ) zwei Funktionen. Dann 

heißt g Erweiterung von f wenn A ⊆ A ′ , B ⊆ B ′ und R ⊆ R ′ .


Beispiel 5.17 Die Addition auf Z ist eine Erweiterung der Addition auf 

N. 

Nimmt man die Definition der Erweiterung wörtlich, stellt man fest, dass jede 

Funktion Erweiterung von sich selbst ist. Das klingt vertraut — in der Tat ist 

“Erweiterung von” eine reflexive, transitive und antisymmetrische Relation, 

d.h. eine Halbordnung auf der Menge der Funktionen. Es gibt also Relationen 

von Funktionen, Funktionen von Relationen, Mengen von Funktionen von 

Funktionen von Relationen usw. Mathematik ist wie Lego .... 

5.6 Komposition von Funktionen 

Angenommen man hat zwei Funktionen 

f ∈ A → B und 

g ∈ B → C, 

d.h. g bezieht seine Argumente aus genau der Menge, wo f seine Ergebnisse 

abliefert. Für jedes a ∈ A kann man dann zuerst f anwenden und auf das 

Ergebnis g. Was dabei herauskommt ist g(f(a)) ∈ C. Es handelt sich also 

um eine Funktion, die Elemente aus A auf Elemente aus C abbildet. Diese 

Funktion wird mit g ◦ 

 

f bezeichnet, d.h. 

g ◦ 

Æ 

f ∈ A → C 

und heißt Komposition von g und f. 

Abbildung 5.6: Funktionskomposition 

Definition 5.18 (Komposition) 

Seien f ∈ A → B und g ∈ B → C zwei Funktionen. Die Komposition 

g ◦ f von f und g ist definiert durch 

g ◦ f ∈ A → C 

(g ◦ f)(a) = g(f(a)).


Beispiel 5.19 Für die in Bild 5.7 dargestellte Funktion g ◦ f ∈ A → C 

gilt 


1 

2 

Dann ist 

3 

(g ◦ f)(1) = 8 

(g ◦ f)(2) = 10 

(g ◦ f)(3) = 10. 

A f B g 

6 

4 

Abbildung 5.7: Komposition zweier Funktionen. 

7 

5 

f ∈ Z → N0, f(a) = a 2 und 

g ∈ N0 → N, g(a) = a + 1. 

g ◦ f ∈ Z → N, (g ◦ f)(a) = g(f(a)) = a 2 + 1. 

Was immer wieder zu Fehlern führt, ist die Reihenfolge der Argumente 

in der Funktionskomposition. So bedeutet g ◦ f, dass man zuerst f ausführt 

und auf das Ergebnis g anwendet. Man liest g ◦f daher auch als “g nach f”. 

Die Reihenfolge ist deshalb wichtig, weil im Allgemeinen gilt 

g ◦ f = f ◦ g. 

Damit die Komposition f ◦g überhaupt definiert ist, muss die Bildmenge von 

g gleich der Argumentmenge von f sein, was im vorigen Beispiel gar nicht 

der Fall ist. Selbst wenn sowohl g ◦ f als auch f ◦ g definiert sind, sind sie 

trotzdem in der Regel verschieden. 

9 

8 

C 

10



f ∈ Z → N0, f(a) = a 2 und 

g ∈ N0 → Z, g(a) = a − 3. 

Dann ist sowohl g ◦ f als auch f ◦ g definiert: 

g ◦ f ∈ Z → Z, g(f(a)) = a 2 − 3 und 

f ◦ g ∈ N0 → N0, f(g(a)) = (a − 3) 2 = a 2 − 6a + 9 

und somit g ◦ f = f ◦ g. 


Dann ist g ◦ f ∈ N 2 → Z × N mit 

f ∈ N 2 → N, f(a1, a2) = a1 + a2 und 

g ∈ N → Z × N, g(a) = (1 − a, 3a). 

(g ◦ f)(a1, a2) = g(f(a1, a2)) 

Andererseits ist f ◦ g nicht definiert. 


= g(a1 + a2) 

= 1 − (a1 + a2), 3(a1 + a2) 

= (1 − a1 − a2, 3a1 + 3a2). 

f ∈ N → N, f(a) = 3a und 

g ∈ N → N, g(a) = a + 1 

Dann ist sowohl g ◦ f als auch f ◦ g definiert: 

g ◦ f ∈ N → N, g(f(a)) = g(3a) = 3a + 1 und 

f ◦ g ∈ N → N, f(g(a)) = f(a + 1) = 3(a + 1) = 3a + 3 

und somit g ◦ f = f ◦ g. 

Was genau ist eigentlich die Funktionskomposition? Sie nimmt zwei zueinander 

passende Funktionen und liefert eine neue Funktion. Somit handelt 

es sich um eine zweistellige partielle Funktion auf der Menge der Funktionen.


Partiell deshalb, weil man nicht zwei beliebige Funktionen hintereinander 

ausführen kann sondern nur zueinander kompatible. Sei also 

F = {f | ∃A ∃B ∃R f = (A, B, R) ∧ R ⊆ A × B ∧ ∀a ∈ A ∃!b ∈ B aRb} 

die Menge aller Funktionen. Dann ist 

◦ ∈ F × F ⇀ F aber ◦ ∈ F × F → F. 

Man kann nun weitergehen und die Menge aller Paare von Funktionen definieren, 

die hintereinander ausgeführt werden können. Dies wäre 

K = {(f, g) | ∃A ∃B ∃C ∃Rf ∃Rg 

f = (A, B, Rf) ∧ g = (B, C, Rg) ∧ 

⊆ F × F. 

Rf ⊆ A × B ∧ Rg ⊆ B × C ∧ 

∀a ∈ A ∃!b ∈ B aRfb ∧ 

∀b ∈ B ∃!c ∈ C bRgc} 

Damit ließe sich dann sagen, dass ◦ eine Funktion von K nach F ist, d.h. 

◦ ∈ K → F. 

5.7 Surjektiv, injektiv, bijektiv 

Schauen wir uns die beiden Funktionen 

f ∈ Q → Q f(a) = a 2 

g ∈ Q → Q + 0 g(a) = a 2 

an. Die Funktionen sind zwar sehr ähnlich, wenn man aber die Definition von 

Funktionen wörtlich nimmt, muss man zugeben dass sie nicht gleich sind: 

f = (Q, Q, Rf), g = (Q, Q + 0 , Rg). 

Zwei Tripel sind genau dann gleich wenn alle Komponenten gleich sind. Da 

Q = Q + 0 , unterscheiden sich f und g in der zweiten Komponente und somit 

ist f = g. Was die zwei Funktionen aber so ähnlich macht ist, dass sie den 

selben Graph haben. 

Rf = {(a, b) | a ∈ Q, b ∈ Q, b = a 2 } 

= {(a, b) | a ∈ Q, b ∈ Q + 0 , b = a 2 } 

= Rg.


In gewisser Weise ist es also verschwenderisch, in der zweiten Komponenten 

von f alle rationalen Zahlen zu nehmen — die nicht negativen hätten’s 

auch schon getan. Eine Funktion, die in diesem Sinne ökonomisch ist, heißt 

surjektiv. Die Menge in der zweiten Komponente beinhaltet dann nur genau 

die Elemente, die auch als Funktionswerte auftreten können, d.h. zu jedem 

b ∈ Q + 0 gibt’s auch ein a ∈ Q so dass g(a) = b. 

Definition 5.24 (Surjektive Funktion) 

Eine Funktion f = (A, B, R) heißt surjektiv wenn es zu jedem 

b ∈ B (mindestens) ein a ∈ A gibt mit aRb: 

∀b ∈ B ∃a ∈ A aRb. 

Gleichbedeutend kann man auch sagen 

R ⊆ A × B 

A B 

bild(f) = B. 

R ⊆ A × B 

A B 

Abbildung 5.8: Links: surjektive Funktion. Rechts: nicht surjektive Funktion. 

Beispiel 5.25 Die Addition + ∈ Z 2 → Z ist surjektiv. Zu jedem b ∈ Z 

gibt es ein Paar a = (a1, a2) ∈ Z 2 so dass a1 + a2 = b ist. Man kann 

z.B. immer a2 = 0 und a1 = b nehmen. 

Beispiel 5.26 Die Addition + ∈ N 2 → N ist nicht surjektiv: Für b = 1 

gibt es kein Paar von natürlichen Zahlen a = (a1, a2) ∈ N 2 so dass 

a = a1 + a2 = 1. Für alle anderen b ′ s aus N würde es gehen, aber der 

Allquantor ist in der Hinsicht ziemlich kompromisslos. 

Theorem 5.27 

Ist f = (A, B, R) eine Funktion, dann ist (A, bild(f), R) eine surjektive 

Funktion.


Abgesehen davon, dass sie nicht surjektiv ist, ist die oben beschriebenen 

Funktion f ist noch auf eine zweite Weise redundant. Zu jedem positiven 

b ∈ Q gibt es zwei a ′ s in Q so dass f(a) = b, nämlich √ b und − √ b. Diese b’s 

fahren sozusagen zweigleisig. Dem kann man Einhalt gebieten, z.B. indem 

man die Funktion auf nicht negative Argumente einschränkt. Man erhält 

dann 

h ∈ Q + 0 → Q, h(a) = a2 . 

Eine Funktion, die in diesem Sinne eingleisig fährt, heißt injektiv. Zu jedem 

b ∈ Q gibt’s höchstens ein a ∈ Q + 0 so dass h(a) = b. 

Definition 5.28 (Injektive Funktion) 

Eine Funktion f = (A, B, R) heißt injektiv wenn es zu jedem b ∈ B 

höchstens ein a ∈ A gibt mit aRb: 

∀a ∈ A ∀a ′ ∈ A ∀b ∈ B (aRb ∧ a ′ Rb) → a = a ′ . 

Gleichbedeutend kann man auch sagen, dass unterschiedliche Argumente 

auf unterschiedliche Funktionswerte abgebildet werden 

müssen: 

∀a ∈ A ∀a ′ ∈ A a = a ′ → f(a) = f(a ′ ). 

R ⊆ A × B 

A B 

R ⊆ A × B 

A B 

Abbildung 5.9: Links: injektive Funktion. Rechts: nicht injektive Funktion. 

Beispiel 5.29 Die Addition + ∈ N 2 → N ist nicht injektiv. Für b = 3 

gibt’s sowohl a = (1, 2) ∈ N 2 als auch a = (2, 1) ∈ N 2 . 

Beispiel 5.30 Die Funktion f ∈ N → N 2 mit f(a) = (a + 3, 2a) ist 

injektiv. Es gibt zwar nicht zu jedem Paar b = (b1, b2) ∈ N 2 ein a ∈ N 

mit f(a) = b (man nehme z.B. b = (1, 1), die Funktion ist also nicht 

surjektiv) aber zu den Paaren b ∈ N 2 wo’s ein a gibt (z.B. b = (5, 4)), 

gibt’s nur ein einziges a ∈ N (im Beispiel a = 2).


Da die Definitionen sehr ähnlich sind und sich nur in der Reihenfolge der 

Quantoren und durch mindestens, höchstens und genau ein unterscheiden, 

nochmal eine kurze Zusammenfassung: 


Ein Tripel f = (A, B, R) mit R ⊆ A × B ist eine ... 

• partielle Funktion wenn 

zu jedem a höchstens ein b mit aRb existiert. 

• totale Funktion wenn 

zu jedem a genau ein b mit aRb existiert. 

Eine totale Funktion f = (A, B, R) ist ... 

• surjektiv wenn 

zu jedem b (mindestens) ein a mit aRb existiert. 

• injektiv wenn 

zu jedem b höchstens ein a mit aRb existiert. 

Es gibt Funktionen, die weder injektiv noch surjektiv sind. Es gibt auch 

Funktionen, die injektiv aber nicht surjektiv oder surjektiv aber nicht injektiv 

sind. Und schließlich gibt’s noch die Funktionen, die sowohl injektiv als auch 

surjektiv sind: 

Definition 5.32 (Bijektive Funktion) 

Eine Funktion heißt bijektiv, wenn sie injektiv und surjektiv ist. 

Eine bijektive Funktion f = (A, B, R) ist eine eins zu eins Zuordnung: 

Zu jedem a ∈ A gibt’s genau ein b ∈ B (weil f eine Funktion ist) und zu 

jedem b ∈ B gibt’s genau ein a ∈ A (weil f bijektiv ist). Jedes a weiß wo’s 

hingehört und jedes b weiß wo’s herkommt. Da freut sich der Mathematiker. 

Beispiel 5.33 Sei A = {x|x ∈ R, 0 ≤ x ≤ 1} die Menge der reellen 

Zahlen zwischen 0 und 1. Dann ist f ∈ A → A, f(x) = x 2 injektiv, 

surjektiv und somit bijektiv. 

Um von einer Funktion zu entscheiden ob sie bijektiv ist, prüft man ob 

sie surjektiv und injektiv ist. Erfüllt sie eine der beiden Eigenschaften nicht, 

ist sie auch nicht bijektiv.


bijektiv 

R ⊆ A × B 

A B 

R ⊆ A × B 

A B 

weder injektiv noch surjektiv 

R ⊆ A × B 

A B 

injektiv aber nicht surjektiv nicht injektiv aber surjektiv 

R ⊆ A × B 

A B 

Abbildung 5.10: Überblick injektiv und surjektiv. 

Wie entscheidet man nun von einer gegebenen Funktion f ∈ A → B ob 

sie surjektiv ist? 

• Zunächst sucht man sich ein paar Beispiele b ∈ B und prüft, ob es zu 

jedem dieser b’s auch ein a ∈ A gibt, so dass f(a) = b. Bei der Wahl 

der Beispiele sollte man darauf achten, dass die Menge B hierdurch gut 

repräsentiert ist. Ist z.B. B = Z sollte man sowohl positive als auch 

negative Zahlen prüfen. Auch Spezialfälle wie z.B. 0 und besonders 

große oder kleine Zahlen sollten unter den Beispielen sein. Es können 

nun zwei Dinge passieren: 

• Es gibt ein Beispiel b, für das man kein entsprechendes a ∈ A findet 

mit f(a) = b. Hier besteht der Verdacht, dass f nicht surjektiv ist. Es 

könnte aber auch sein, dass man das zugehörige a nur übersehen hat. 

Wenn A endlich ist, kann man alle Elemente von A durchprobieren, 

andernfalls geht man wie folgt vor: 

– Zu zeigen: Es gibt kein a ∈ A mit f(a) = b, d.h. 

¬∃a ∈ A f(a) = b. 

Laut Theorem 7.25 ist dies gleichbedeutend mit 

∀a ∈ A f(a) = b.


– Elimination des Allquantors: 

Sei a ∈ A beliebig aber fest. Zu zeigen f(a) = b. 

– An dieser Stelle muss man die Definition von f einsetzen um weiterrechnen 

zu können. 

• Wenn man andererseits für alle Beispiele b ein a ∈ A gefunden hat 

mit f(a) = b, so besteht der Verdacht, dass f surjektiv ist. Je mehr 

Beispiele geprüft wurden, desto begründeter ist dieser Verdacht. Ganz 

sicher kann man sich dabei aber nicht sein, außer wenn B endlich ist 

und man alle Elemente von b geprüft hat. Andernfalls geht man wie 

folgt vor: 

– Zu zeigen: f ist surjektiv, d.h. 

– Elimination des Allquantors: 

∀b ∈ B ∃a ∈ A f(a) = b. 

Sei b ∈ B beliebig aber fest. Zu zeigen 

∃a ∈ A f(a) = b. 

– So. Jetzt hat man eine Formel, die mit einem Existenzquantor 

beginnt und so etwas zu beweisen ist wirklich schwer. Entweder 

man findet einen Term, mit dem man das gesuchte a in Abhängigkeit 

von b berechnen kann — was darauf hinausläuft die Gleichung 

f(a) = b nach a aufzulösen — oder man behilft sich mit folgendem 

Trick: 

– Widerspruchsbeweis: Man nimmt das Gegenteil an von dem was 

man beweisen möchte und führt das zu einem Widerspruch. Das 

ist ähnlich wie bei einem Gerichtsprozess — wenn der Angeklagte 

beginnt sich in Widersprüche zu verwickeln, weiss man dass er 

gelogen hat. Die Annahme ist also 

¬∃a ∈ A f(a) = b. 

Durch logische Umformung nach Theorem 7.25 erhält man 

∀a ∈ A f(a) = b. 

Unter Verwendung dieser Aussage muss man nun einen Widerspruch 

herleiten. Hierzu muss man im nächsten Schritt wieder auf 

die Definition von f zurückgreifen.


Beispiel 5.34 Sei f ∈ R → R, f(a) = a 2 . 

• Wir wählen das Beispiel b = −2 und finden kein a ∈ R so dass 

a 2 = −2. 

• Es entsteht also der Verdacht, dass es kein a ∈ R gibt mit f(a) = 

−2. 

– Zu zeigen: Es gibt kein a ∈ R so dass f(a) = −2, d.h. 

Umformung ergibt 

¬∃a ∈ R f(a) = −2. 

∀a ∈ R f(a) = −2. 

– Sei a ∈ R beliebig aber fest. Zu zeigen f(a) = −2. 

– Einsetzen der Definition von f. Zu zeigen a 2 = −2. 

– Bekannt ist die Tatsache 

∀x ∈ R x 2 ≥ 0. 

Wenn das für alle x ∈ R gilt, dann sicher auch für x = a. Also 

hat man 

a 2 ≥ 0. 

Hieraus folgt a 2 = −2. 

Beispiel 5.35 Sei f ∈ Z × Z → Z, f(a1, a2) = a1 + a2. 

• Zunächst ein paar Beispiele: 

– Für b = 3 findet man a = (1, 2). 

– Für b = 0 findet man a = (−3, 3). 

– Für b = −10 findet man a = (−5, −5). 

• Es entsteht also der Verdacht dass f surjektiv ist. 

– Zu zeigen: ∀b ∈ Z ∃a ∈ Z 2 f(a) = b. 

– Sei b ∈ Z beliebig aber fest. Zu zeigen: ∃a ∈ Z 2 f(a) = b. 

– Mit der Wahl a = (0, b) gilt f(a) = b. 

Analog geht man vor um von einer gegebenen Funktion f ∈ A → B zu 

entscheiden ob sie injektiv ist.


• Zunächst sucht man sich ein paar Beispiele a ∈ A und berechnet die 

zugehörigen Funktionswerte 

b = f(a). 

Dann versucht man a ′ ∈ A mit a = a ′ zu finden so dass 

b = f(a ′ ) 

Gelingt dies, ist f nicht injektiv da es zwei verschiedene a’s gibt, die auf 

das selbe b abgebildet werden und wir sind fertig. Andernfalls liegt der 

Verdacht nahe, dass f injektiv ist. Ist A endlich, so kann man einfach 

für alle a, ′ ∈ A mit a = a ′ prüfen dass f(a) = f(a ′ ). Falls A unendlich 

ist, ist dies nicht machbar. 

• Der Beweis, dass f injektiv ist, verläuft wie folgt: 


∀a ∈ A ∀a ′ ∈ A a = a ′ → f(a) = f(a ′ ). 

– Elimination des Allquantors. 

Sei a ∈ A und a ′ ∈ A beliebig aber fest. Zu zeigen 

a = a ′ → f(a) = f(a ′ ). 

– Oft ist es einfacher, die Formel an dieser Stelle umzuformen. Eine 

äquivalente Formel ist 

f(a) = f(a ′ ) → a = a ′ . 

– Gegeben f(a) = f(a ′ ). Zu zeigen a = a ′ . 

– An dieser Stelle kann man nicht weiterrechnen ohne die Definition 

von f einzusetzen. Man beginnt dann mit der Gleichung f(a) = 

f(a ′ ) und formt so lang um, bis a = a ′ rauskommt. 

Beispiel 5.36 Sei f ∈ R → R, f(a) = a 2 . Wir wählen das Beispiel 

a = 2 und finden den Funktionswert b = f(2) = 4. Man sucht nun ein 

a ′ ∈ A mit a ′ = 2 so dass f(a ′ ) = 4. In der Tat hat a ′ = −2 diese 

Eigenschaften. Zu b = 4 gibt’s also zwei verschiedene a’s, nämlich 2 

und −2 und damit ist f nicht injektiv. 

Beispiel 5.37 Sei A = {x|x ∈ R, −1 ≤ x ≤ 0} und f ∈ A → R, 

f(a) = a 2 .


• Zunächst wieder ein paar Beispiele 

– Für b = 1 ist a = −1 das einzige a ∈ A mit f(a) = b. 

– Für b = 0 ist a = 0 das einzige a ∈ A mit f(a) = b. 

– Für b = 3 oder b = −4 existiert kein a ∈ A mit f(a) = b. Das 

macht aber nichts — die Eigenschaft injektiv verlangt ja nur, 

dass es nicht mehr als ein a gibt. 

• Es entsteht somit der Verdacht, dass f injektiv ist. 

– Zu zeigen: ∀a ∈ A ∀a ′ ∈ A a = a ′ → f(a) = f(a ′ ). 

– Sei a ∈ A und a ′ ∈ A beliebig aber fest. Zu zeigen a = a ′ → 

f(a) = f(a ′ ). 

– Umformen. Zu zeigen f(a) = f(a ′ ) → a = a ′ . 

– Gegeben f(a) = f(a ′ ). Zu zeigen a = a ′ . 

– Einsetzen der Definition von f: Gegeben 

a 2 = a ′2 . 

Durch Wurzelziehen auf beiden Seiten erhält man 

|a| = |a ′ |. 

– Einsetzen der Definition von A in die Annahme a ∈ A und 

a ′ ∈ A ergibt 

a ≤ 0 und a ′ ≤ 0. 

Daraus folgt 

Also 

bzw. 

5.8 Umkehrfunktion 

|a| = −a und |a ′ | = −a ′ . 

−a = −a ′ 

a = a ′ . 

Hat man eine Funktion f ∈ A → B und ein bestimmtes Element b ∈ B, 

so kann man sich fragen, welche Elemente a aus A durch f auf b abgebildet 

werden. Dies kann genau ein Element sein, mehrere oder aber gar keins. Von 

besonderem Interesse ist natürlich der Fall, wo zu jedem b ∈ B genau ein 

a ∈ A existiert, so dass f(a) = b, d.h. wenn f bijektiv ist. In diesem Fall 

kann man nämlich eine Funktion g ∈ B → A definieren, die jedem b ∈ B das 

entsprechende a ∈ A zuordnet. Diese Funktion nennt man naheliegenderweise 

Umkehrfunktion von f.



f ∈ N0 → N, f(a) = a + 1. 

Offensichtlich gibt es zu jedem b ∈ N genau ein a ∈ N0 mit f(a) = b. 

Für ein gegebenes b ∈ N erhält man das zugehörige a ∈ N0 durch 

a = b − 1. Diese Zuordnung ist nichts anderes als die Funktion 

g ∈ N → N0, g(b) = b − 1. 

Stellt man f und g als Tripel dar, wird das Prinzip der Konstruktion 

einer Umkehrfunktion klar: 

f = N0, N, {(0, 1), (1, 2), (2, 3), . . .} 

g = N, N0, {(1, 0), (2, 1), (3, 2), . . .} 

Es werden lediglich die ersten beiden Komponenten vertauscht und die 

Relation in der dritten Komponente wird durch ihre Umkehrrelation 

ersetzt. 

Im Prinzip kann man zu jeder Funktion 

auf diese Weise das Tripel 

f = (A, B, R) 

g = (B, A, R −1 ) 

bilden. Was dabei herauskommt ist jedoch nur dann eine Funktion wenn f 

bijektiv ist. 

Beispiel 5.39 Sei f ∈ Z → N0 mit f(a) = a 2 . Somit ist 

f = (Z, N0, R) 

= Z, N0, {. . .(−2, 4), (−1, 1), (0, 0), (1, 1), (2, 4), . . .} . 

Vertauscht man die ersten zwei Mengen und geht zur Umkehrrelation 

über, erhält man 

g = (N0, Z, R −1 ) 

= N0, Z, {. . .(4, −2), (1, −1), (0, 0), (1, 1), (4, 2), . . .} . 

Das ist keine Funktion! Die Forderung, dass es zu jedem a ∈ N0 genau 

ein b ∈ Z mit aR −1 b gibt, ist nicht erfüllt.


• Zu a = 4 ∈ N0 gibt es gleich zwei b’s aus Z (nämlich b = 2 und 

b = −2) mit aR −1 b. 

• Weiterhin gibt’s z.B. für a = 3 ∈ N0 gar kein b ∈ Z mit aR −1 b. 

Theorem 5.40 

Ist 

Beweis. 

f = (A, B, R) 

eine bijektive Funktion, dann ist auch 

eine bijektive Funktion. 

g = (B, A, R −1 ) 

• Zu zeigen: Für alle A, B, R gilt wenn f = (A, B, R) eine bijektive 

Funktion ist, dann ist g = (B, A, R −1 ) eine bijektive Funktion. 

• Sei A, B, R beliebig aber fest. 

– Gegeben f = (A, B, R) ist eine bijektive Funktion. 

– Zu zeigen g = (B, A, R −1 ) ist eine bijektive Funktion. 

• Einsetzen der Defintion einer bijektiven Funktion. 

– Gegeben: 


∀a ∈ A ∃!b ∈ B aRb 

 

f ist Funktion 

∀b ∈ B ∃!a ∈ A bR −1 a 

 

g ist Funktion 

und ∀b ∈ B ∃!a ∈ A aRb 

 

f ist bijektiv 

und ∀a ∈ A ∃!b ∈ B bR −1 a 

 

g ist bijektiv 

• Einsetzen der Definition von R −1 : Da aRb genau dann wenn bR −1 a, 

bleibt zu zeigen 

∀b ∈ B ∃!a ∈ A aRb und ∀a ∈ A ∃!b ∈ B aRb. 

Vertauscht man die Reihenfolge dieser beiden Formeln, steht genau 

die Annahme da dass f eine bijektive Funktion ist.


Definition 5.41 (Umkehrfunktion) 

Die Umkehrfunktion einer bijektiven Funktion f = (A, B, R) ist 

die Funktion g = (B, A, R −1 ). 

Statt Umkehrfunktion sagt man auch inverse Funktion. Zu einer bijektiven 

Funktion sagt man daher auch sie sei invertierbar. In der grafischen Darstellung 

erhält man die Umkehrfunktion einer bijektiven Funktion einfach indem 

man die Pfeile umdreht, siehe Bild 5.11. 

f ∈ A → B f −1 ∈ B → A 

R ⊆ A × B 

A B 

Abbildung 5.11: Umkehrfunktion. 

R 

A B 

−1 ⊆ B × A 

Notation 5.42 

Die Umkehrfunktion einer bijektiven Funktion f wird mit f −1 bezeichnet. 

Invertiert man eine Funktion zweimal, landet man wieder bei der Ausgangsfunktion: 

Ist f = (A, B, R) dann ist 

f −1 −1 = B, A, R −1 −1 

= A, B, (R −1 ) −1 

= (A, B, R) 

= f. 

Anders ausgedrückt: Ist g Umkehrfunktion von f, dann ist f Umkehrfunktion 

von g. 

Beispiel 5.43 Die Funktion 

f ∈ R → R, f(a) = a 2 

ist nicht invertierbar, da f nicht injektiv ist. So ist z.B. f(2) = f(−2). 

Eine Umkehrfunktion existiert also deshalb nicht, weil nicht klar ist,


ob sie 4 auf 2 oder auf −2 abbilden soll. Außerdem ist f auch nicht 

surjektiv, es gibt z.B. kein a welches durch f auf −4 abgebildet würde. 

Worauf sollte also die Umkehrfunktion −4 abbilden? 

Beispiel 5.44 Durch Einschränkung des Definitions- und Wertebereichs 

von Beispiel 5.43 erhält man aber eine umkehrbare Funktion: Sei 


R + 0 

= {x | x ∈ R, x ≥ 0} 

f ∈ R + 0 → R + 0 , f(x) = x 2 , 

so ist f invertierbar mit der Umkehrfunktion 

g ∈ R + 0 → R+ 0 , g(x) = √ x. 

Beispiel 5.45 Genauso hätte man im vorigen Beispiel mit 


R − 0 = {x | x ∈ R, x ≤ 0} 

f ∈ R − 0 → R + 0 , f(x) = x 2 , 

eine invertierbar Funktion erhalten. Diesmal wäre die Umkehrfunktion 

aber 

g ∈ R + 0 → R− 0 , g(x) = −√ x. 

Beispiel 5.46 Die Nachfolgerfunktion 

f ∈ N → N, f(x) = x + 1 

ist nicht invertierbar, da sie nicht surjektiv ist: Es gibt kein x ∈ N so 

dass f(x) = 1. Durch Erweiterung von Definitions- und Wertebereich 

auf Z erhält man jedoch eine invertierbare Funktion 

Beispiel 5.47 Die Funktion 

f ∈ Z → Z, f(x) = x + 1. 

f ∈ [0, π] → [−1, 1], f(x) = sin(x) 

ist nicht invertierbar, da z.B. f(π/4) = f(3π/4), siehe Bild 5.12. Verschiebt 

man aber den Definitionsbereich um π/2 nach links, so sieht man daß 

f ∈ [−π/2, π/2] → [−1, 1], f(x) = sin(x)

×ÒÜ Ó×Ü 

Ü Ü 


 

invertierbar ist. 

Andererseits ist 

Abbildung 5.12: Sinus- und Cosinusfunktion 

f ∈ [−π/2, π/2] → [−1, 1], f(x) = cos(x) 

nicht invertierbar, da z.B. cos(−π/4) = cos(π/4). Dafür ist aber 

f ∈ [0, π] → [−1, 1], f(x) = cos(x) 

wieder invertierbar. Dies erklärt, warum für x ∈ [−π/2, π/2] im allgemeinen 

arcsin(sin(x)) = x 

und für x ∈ [0, π] im allgemeinen 

ist. 

arccos(cos(x)) = x 

5.9 Funktionsterme für Umkehrfunktionen 

Häufig werden Funktionen durch die Angabe eines Funktionsterms definiert. 

Ein Funktionsterm ist eine Vorschrift, wie man aus einem gegebenen Input 

den zugehörigen Output berechnen kann, z.B. 

f(x) = 2x + 1. 

Um eine Funktion vollständig zu definieren, muss man natürlich noch die 

Mengen angeben, die die Funktion aufeinander abbildet — also z.B. f ∈ 

R → R.


Oft stellt sich das Problem, zu einer durch einen Term definierten Funktion 

f einen Term für die Umkehrfunktion f −1 zu bestimmen. Hierzu führt man 

eine neue Variable y für den Funktionswert von f an der Stelle x ein und 

erhält dadurch im obigen Beispiel die Gleichung 

y = 2x + 1. 

Der Graph von f ist die Menge der Paare (x, y) ∈ R ×R, die diese Gleichung 

erfüllen. 

Für den Input x ist der Funktionswert von f somit y. Bei der Umkehrfunktion 

ist jedoch y gegeben und gesucht ist das x, dessen Funktionswert y ist. Ist f 

bijektiv, dann existiert genau ein solches x. Um dieses x zu berechnen, muss 

die Gleichung so umgeformt werden, dass x nur noch allein auf der linken 

Seite auftritt. Im Beispiel erreicht man dies durch Subtraktion mit 1 und 

Division durch 2. 

x = (y − 1)/2. 

Damit hat man auch schon einen Term für die Umkehrfunktion: 

Ein etwas schwierigeres Beispiel: 

f −1 (y) = (y − 1)/2. 

f ∈ R 2 → R 2 , f(x1, x2) = (x1 + x2, x1 − x2). 

Auch hier führt man für den Funktionswert von f an der Stelle (x1, x2) eine 

neue Variable y ein. Da y ∈ R 2 , ist es sinnvoll die Komponenten von y auch 

gleich zu benennen. Sei also y = (y1, y2). Dies führt auf das Gleichungssystem 

y1 = x1 + x2 

y2 = x1 − x2. 

Bei der Umkehrfunktion stellt sich das Problem, dass y1 und y2 gegeben 

sind und zugehörige x1 und x2 gesucht sind. Da es sich hier um ein lineares 

Gleichungssystem handelt, ist es einfach einen Term hierfür anzugeben. Mit 

dem Gauß Algorithmus erhält man 

Folglich ist die Umkehrfunktion 

x1 = (y1 + y2)/2 

x2 = (y1 − y2)/2. 

f −1 ∈ R 2 → R 2 , f −1 (y1, y2) = (y1 + y2)/2, (y1 − y2)/2


Terme können beliebig kompliziert sein und auch Fallunterscheidungen enthalten, 

z.B. 

 

x + 1 falls x ungerade 

f ∈ N → N, f(x) = 

x − 1 falls x gerade 

Um hier zu einem Term für die Umkehrfunktion zu kommen, behandelt man 

die Fälle separat. 

Auflösen nach x ergibt 

y = x + 1 falls x ungerade 

y = x − 1 falls x gerade 

x = y − 1 falls x ungerade 

x = y + 1 falls x gerade 

Problematisch ist, dass x immer noch auf der rechten Seite in der Fallunterscheidung 

auftritt. Da x jedoch genau dann gerade ist, wenn y ungerade ist, 

erhält man 

x = y − 1 falls y gerade 

x = y + 1 falls y ungerade 

und damit den Term für die Umkehrfunktion 

f −1 

y − 1 falls y gerade 

(y) = 

y + 1 falls y ungerade 

Damit sind in diesem Beispiel die Funktionen f und f −1 identisch, d.h. f = 

f −1 . 

5.10 Kommutativ, assoziativ, distributiv 

Definition 5.48 (Kommutativ) 

Eine zweistellige Funktion ⊕ ∈ A×A → A heißt kommutativ, wenn 

für alle x, y ∈ A. 

x ⊕ y = y ⊕ x


Beispiel 5.49 Die Addition auf den reellen Zahlen ist kommutativ, da 

x + y = y + x für alle x, y ∈ R. 

Beispiel 5.50 Die Subtraktion auf den reellen Zahlen ist hingegen nicht 

kommutativ, da z.B. 2 − 3 = 3 − 2. 

Definition 5.51 (Assoziativ) 

Eine zweistellige Funktion ⊕ ∈ A × A → A heißt assoziativ, wenn 

für alle x, y, z ∈ A. 

(x ⊕ y) ⊕ z = x ⊕ (y ⊕ z). 

Beispiel 5.52 Die Addition auf den reellen Zahlen ist assoziativ, da (x+ 

y) + z = x + (y + z) für alle x, y, z ∈ R. 

Beispiel 5.53 Die Subtraktion auf den reellen Zahlen ist nicht assoziativ, 

da z.B. (6 − 2) − 3) = 6 − (2 − 3). 

Beispiel 5.54 Das kartesische Produkt × auf Mengen ist nicht assoziativ, 

da (A × B) × C = A × (B × C) für alle A, B, C = ∅. 

Definition 5.55 (Distributiv) 

Seien ⊕, ⊗ zweistellige Funktionen auf A. ⊗ heißt distributiv über 

⊕ wenn 

x ⊗ (y ⊕ z) = (x ⊗ y) ⊕ (x ⊗ z) 


(y ⊕ z) ⊗ x = (y ⊗ x) ⊕ (z ⊗ x) 

Beispiel 5.56 Die Multiplikation auf den reellen Zahlen ist distributiv 

über der Addition auf den reellen Zahlen, denn 

für alle x, y, z ∈ R. 

x(y + z) = xy + xz und (y + z)x = (yx + zx) 

Beispiel 5.57 Die Addition auf den reellen Zahlen ist nicht distributiv 

über der Multiplikation auf den reellen Zahlen, denn z.B. 

2 + (3 × 5) = 2 × 3 + 2 × 5.


5.11 Folgen 

Funktionen, deren Definitionsbereich die natürlichen Zahlen sind, spielen eine 

sehr wichtige Rolle und werden Folgen genannt. 

Definition 5.58 (Folge) 

Eine Funktion f ∈ A → B heißt 

• Folge über B, wenn A = N. 

• Folge der Länge n über B, wenn A = {1, 2, . . ., n}. 

• Endliche Folge über B, wenn es ein n ∈ N0 gibt, so dass A = 

{1, 2, . . ., n}. 

Um Schreibaufwand zu sparen kann man auch einfach Folge sagen statt Folge 

über B. 

Für Folgen ist i.a. eine aufzählende Schreibweise recht praktisch, d.h. wenn 

f eine Folge ist und B aus dem Kontext hervorgeht, schreibt man auch 

f = 〈f(1), f(2), f(3), . . ..〉 

Ist f eine Folge der Länge n, schreibt man 

f = 〈f(1), f(2), . . ., f(n)〉. 

Die spitzen Klammern, die die Folge umschließen kann man auch weglassen 

wenn dadurch keine Unklarheiten entstehen. Ein Spezialfall ist die Folge der 

Länge 0, sie wird durch 〈 〉 bezeichnet. 

Definition 5.59 (Menge der Folgen) 

Für jede Menge B bezeichnet 

• B ∗ die Menge der endlichen Folgen über B 

• N → B die Menge der unendlichen Folgen über B. 

Definition 5.60 (Konkatenation von endlichen Folgen) 

Die Konkatenation conc ∈ B ∗ × B ∗ → B ∗ zweier endlicher Folgen 

f = 〈f1, f2, . . .,fn〉 und g = 〈g1, g2, . . .,gm〉 ist definiert als 

conc(f, g) = 〈f1, f2, . . .,fn, g1, g2, . . .,gm〉.


5.12 Abzählbarkeit 

Bezüglich ihrer Größe unterscheidet man grundsätzlich zwei Arten von unendlichen 

Mengen: Solche, deren Elemente man “durchnumerieren” kann, 

und solche, die so groß sind, dass dies nicht mehr möglich ist. Im ersten Fall 

spricht man von abzählbaren Mengen, im zweiten Fall von überabzählbaren 

Mengen. 

Abzählbarkeit spielt in der Informatik eine ganz zentrale Rolle. Abzählbare 

Mengen kann man im Rechner darstellen, d.h. man kann jedes Element einer 

solchen Menge eindeutig durch eine Bitfolge endlicher Länge codieren. Für 

überabzählbare Mengen geht dies nicht, d.h. egal auf welche Weise man den 

Elementen einer überabzählbaren Menge endliche Bitfolgen zuordnet, wird 

es immer zwei Elemente geben, die die selbe Bitfolge bekommen. 

Wie wir in diesem Abschnitt sehen werden, ist die Menge der reellen Zahlen 

überabzählbar. Das ist auch der Grund, weshalb es keine Programmiersprache 

gibt, die einen Datentyp für reelle Zahlen hat. Stattdessen werden 

Gleitkommazahlen wie float und double verwendet, mit denen man jedoch 

nur eine endliche Teilmenge der reellen Zahlen darstellen kann, so dass es bei 

arithmetischen Operationen zwangsläufig zu Rundungsfehlern kommt. 

Andererseits sind N, Z und sogar Q abzählbar. Dieser Umstand wird z.B. 

von Computer Algebra Systemen wie Maple genutzt um exakte Arithmetik 

mit ganzen oder rationalen Zahlen beliebiger Größe durchzuführen. 

Formal lässt sich der Begriff der Abzählbarkeit wie folgt definieren: 

Definition 5.61 (Abzählbar) 

Eine Menge A heißt abzählbar wenn es eine injektive Funktion 

f ∈ A → N gibt. 

Eine Menge A ist abzählbar, wenn man jedem ihrer Elemente exklusiv einen 

Index aus N zuweisen kann. Das heißt 

• jedes Element aus A kriegt einen Index aus N (f ist eine Funktion von 

A nach N) 

• keine zwei Elemente aus A kriegen den selben Index (f ist injektiv). 

Um die Elemente einer abzählbaren Menge im Rechner darzustellen, kann 

man z.B. einfach die Indices der Elemente binär codieren. 

Beispiel 5.62 Endlichen Mengen sind offensichtlich abzählbar. 

Beispiel 5.63 Die Elemente der Menge N lassen sich in trivialer Weise 

durchnumerieren: 1 ist das erste Element, 2 das zweite, 3 das dritte,


usw. Eine injektive Funktion f ∈ N → N ist also schnell gefunden, z.B. 

f(n) = n und somit ist N abzählbar. 

Beispiel 5.64 Die Elemente von Z lassen sich auch durchnumerieren: 

0 ist das erste Elemente, 1 das zweite, −1 das dritte, 2 das vierte, −2 

das fünfte, usw. Allgemein führt das zu der Funktion f ∈ Z → N die 

jedem Element x ∈ Z genau einen Index aus N zuordnet: 

 

f(x) = 

2x falls x > 0 

−2x + 1 falls x ≤ 0 

Da f sogar bijektiv ist, folgt dass Z eine abzählbare Menge ist. 

Beispiel 5.65 Auch die Elemente von N 2 lassen sich durchnumeriern, 

wie in Bild 5.13 gezeigt ist. Hier sind die Elemente (a, b) von N 2 als 

Punkte in einem zwei dimensionalen Koordinatensystem zusammen mit 

deren Durchnumerierung dargestellt. 

 

Abbildung 5.13: Durchnumerierung von N 2 

f(1, 1) = 1 

f(2, 1) = 2 

f(1, 2) = 3 

f(1, 3) = 4 

f(2, 2) = 5 

f(3, 1) = 6 

f(4, 1) = 7 

. 

. 

Die gleiche Überlegung kann man auch für das kartesische Produkt von beliebigen 

abzählbaren Mengen anstellen. 

Theorem 5.66 

Sind A, B abzählbare Mengen, dann auch A × B. 

Beweis. Seien A und B abzählbare Mengen. Zu zeigen ist, dass eine injektive 

Funktion h ∈ A × B → N existiert. Aus der Annahme folgt, dass


es injektive Funktionen fA ∈ A → N und fB ∈ B → N gibt. Damit ist 

f ∈ A × B → N × N mit 

f(a, b) = (fA(a), fB(b)) 

injektiv. Da weiterhin N 2 abzählbar ist, existiert eine injektive Funktion 

g ∈ N 2 → N. Somit ist h ∈ A × B → N mit 

h(a, b) = g(f(a, b)) 

injektiv, da die Komposition injektiver Funktionen injektiv ist, siehe 

Bild 5.14 

A × B 

f 

N × N 

g 

N 

injektiv injektiv 

g ◦ f 

injektiv 

Abbildung 5.14: Konstruktion einer injektiven Funktion h ∈ A × B → N 

Folglich sind auch 

N 3 = N 2 × N 

N 4 = N 3 × N 

. 

und allgemein N n für beliebiges n ∈ N abzählbare Mengen. Da sich die Menge 

Q der rationalen Zahlen injektiv auf die abzählbare Menge Z × N abbilden 

lässt (man zerlegt die rationale Zahl einfach in ihren ganzzahligen Zähler und 

ihren natürlichzahligen Nenner), ist somit auch Q abzählbar. 

Beispiel 5.67 Man kann sogar zeigen, dass die Menge N ∗ aller beliebig 

(aber endlich) langer Folgen von natürlichen Zahlen abzählbar ist. Den 

Beweis könnte man ähnlich wie im vorigen Beispiel anstellen, man kann 

es aber auch ganz anders machen und direkt eine injektive Funktion 

f ∈ N ∗ → N hinschreiben: 

f(〈x1, x2, . . ., xn〉) = 2 x1 3 x2 5 x3 7 x4 · · · π xn 

n 

Hierbei ist πn die n-te Primzahl. Somit ist z.B. 

f(〈1, 1, 3〉) = 2 1 3 1 5 3 = 750 

f(〈4〉) = 2 4 = 16 

f(〈 〉) = 1


Dass diese Funktion injektiv ist, folgt aus der Tatsache dass jede natürliche 

Zahl eine eindeutige Primfaktorzerlegung hat. Es kann also nicht 

passieren, dass f aus zwei unterschiedlichen endlichen Folgen die selbe 

Zahl generiert. 

Nachdem wir immer “größere” abzählbare Mengen erzeugt haben, ist nun 

die Grenze zu überabzählbaren Mengen erreicht. Ein erstes Beispiel ist die 

Menge 

A = N → {0, 1}. 

Jedes Element von A ist eine 0/1 Folge unendlicher Länge. Diese Menge 

ist nicht zu verwechseln mit der abzählbaren Menge {0, 1} ∗ , deren Elemente 

endliche 0/1 Folgen sind. Der Beweis dass A überabzählar ist, wird durch Widerspruch 

geführt. Man nimmt also an, dass A abzählbar ist, d.h. es existiert 

eine injektive Funktin f ∈ A → N. Somit wird jeder 0/1 Folge eine eindeutige 

Nummer zugeordnet. Man kann damit die 0/1 Folgen nach aufsteigender 

Nummer sortieren und in einer Tabelle anordnen. 

Erste Folge f1 = 〈1, 1, 0, 0, 1, 1, . . .〉 

Zweite Folge f2 = 〈0, 1, 1, 0, 0, 1, . . .〉 

Dritte Folge f3 = 〈0, 0, 0, 1, 1, 0, . . .〉 

... ... 

Jede unendlich lange 0/1 Folge müsste somit irgendwo in dieser Tabelle auftreten, 

d.h. für jede Folge f ∈ A existiert ein n ∈ N so dass f = fn. Anhand 

dieser Tabelle wird nun eine Folge ˆ f ∈ A konstruiert durch 

Im Beispiel ist somit 

ˆf(i) = 1 − fi(i), i = 1, 2, . . . 

ˆf(i) = 〈0, 0, 1, . . ., 〉. 

Somit unterscheidet sich ˆ f von jeder Folge fi in der Tabelle weil 

ˆf(i) = fi(i) für alle i. 

Daher ist ˆ f nicht in der Tabelle, was im Widerspruch zur Behauptung steht, 

dass jede unendliche 0/1 Folge in der Tabelle ist. 

Theorem 5.68 (Abzählbarkeit von Teilmengen) 

Ist A abzählbar und B ⊆ A, so ist auch B abzählbar. 

Ist A überabzählbar und B ⊇ A, so ist auch B überabzählbar.


Beweis. Der zweite Teil folgt aus dem ersten durch aussagenlogische Umformung. 

Der Beweis des ersten Teils ist wie folgt. Angenommen A ist 

abzählbar und B ⊆ A. Dann existiert eine injektive Funktion f ∈ A → 

N. Somit ist auch g ∈ B → N mit g(x) = f(x) für alle x ∈ B injektiv 

und daher B abzählbar. 

Theorem 5.69 

R ist überabzählbar. 

Beweis. Laut Theorem 5.68 genügt es zu zeigen, dass das Intervall [0, 1) 

überabzählbar ist. Jede reelle Zahl aus diesem Intervall entspricht einer 

unendlich langen Folge von (Nachkomma-) Ziffern. Der Rest des Beweises 

kann damit gleich geführt werden wie der Beweis der Überabzählbarkeit 

von N → {0, 1}. 

Es ist somit unmöglich jeder reellen Zahl eine eindeutige natürliche Zahl 

zuzuordnen, d.h. auf eine Weise dass keine zwei unterscheidlichen reellen 

Zahlen die selbe natürliche Zahl bekommen. Ebenso wenig ist es möglich, 

jeder reellen Zahl eine eindeutige endlich lange Bitfolge zuzuordnen. Genau 

das müsste man aber tun um reelle Zahlen im Rechner darzustellen. Es ist 

noch nicht einmal möglich, alle reellen Zahlen zu benennen, d.h. jeder reellen 

Zahl einen eindeutigen Namen (z.B. endliche Folge von Buchstaben) 

zuzuordnen. All dies ist für abzählbare Mengen möglich und wird in einigen 

Programmiersprachen auch tatsächlich gemacht. So kann man z.B. in 

Maple eine beliebig große rationale Zahl eintippen, die dann intern durch 

eine endlich lange Bitfolge codiert wird. Im Maple Laufzeitsystem muss also 

eine Funktion implementiert sein, die jeder rationalen Zahl eine eindeutige 

endlich lange Bitfolge zuweist. 

Bemerkung. In manchen Büchern wird definiert, dass A abzählbar ist, 

wenn es eine bijektive Funktion f ∈ A → N gibt. Demnach wären 

endliche Mengen nicht abzählbar. Für uns Informatiker steht Abzählbarkeit 

aber für Codierbarkeit, so dass wir bei Definition 5.61 bleiben. 

Das folgende Theorem zeigt, dass die beiden Definitionen im Kern das 

Selbe ausdrücken. 

Theorem 5.70 

Eine Menge A ist abzählbar, wenn sie entweder endlich ist oder es 

eine bijektive Funktion f ∈ A → N gibt.


6 Aussagenlogik 

6.1 Boolesche Funktionen 

Wenn man sich mit Wissen beschäftigt, spielt Wahrheit eine große Rolle. 

Wahrheit ist immer an Aussagen gebunden, die entweder wahr oder falsch 

sind. Diese beiden Wahrheitswerte bilden eine Menge 

W = {0, 1} 

wobei 0 für “falsch” und 1 für “wahr” steht. 

Ähnlich wie es auf natürlichen Zahlen Funktionen gibt wie + (“plus”), 

− (“minus”), × (“mal”) , gibt es auch Funktionen auf Wahrheitswerten, die 

mit 

∧ “und”, 

∨ “oder”, 

¬ “nicht”, 

→ “wenn dann”, 

↔ “genau dann wenn” 

bezeichnet werden. Diese Funktionen heißen Boolesche Funktionen. Da es nur 

zwei Wahrheitswerte gibt, lassen sie sich einfach durch eine Tabelle definieren: 

x y x ∧ y x ∨ y x → y x ↔ y 

0 0 0 0 1 1 

0 1 0 1 1 0 

1 0 0 1 0 0 

1 1 1 1 1 1 

Tabelle 6.1: Boolesche Funktionen 

x ¬x 

0 1 

1 0 

Die ¬ Funktion ist einstellig, d.h. hat nur ein Argument, alle anderen sind 

zweistellig. Die Funktionen lassen sich leicht einprägen. Die ∧ , ∨ und ¬ 

Funktionen entsprechen ziemlich genau ihrem Namen. Wie man aus Tabelle 

6.1 entnimmt, ist 

• x ∧ y genau dann wahr, wenn x wahr ist und y wahr ist 

• x ∨ y genau dann wahr, wenn x wahr ist oder y wahr ist


• ¬x genau dann wahr, wenn x nicht wahr ist. 

Die → Funktion ist nicht ganz so intuitiv. Merken Sie sich am einfachsten 

• x → y ist immer wahr, außern wenn die Bedingung x erfüllt ist, die 

Konsequenz y aber nicht eintritt. 

Die ↔ Funktion ist wieder leichter: 

• x ↔ y ist genau dann wahr, wenn x und y gleich sind. 

Gerade die → Funktion spielt eine wichtige Rolle beim automatischen Schlussfolgern. 

Angenommen wir haben zwei Aussagen mit Wahrheitswerten x und y, 

von denen bekannt ist, dass 

x = 1 und x → y = 1. 

Durch Vergleich mit Tabelle 6.1 folgt, dass 

y = 1. 

Diese einfache Schlussfolgerungsregel heißt “Modus Ponens”. Erstaunlicherweise 

lassen sich fast alle noch so geniale logische Denkvorgänge auf solche 

einfachen, elementaren Denkschritte zurückführen. 

Beispiel 6.1 Wenn Sie Ihre Hausaufgaben gewissenhaft machen, werden 

Sie die Prüfung bestehen. (Solche unumstößlichen Wahrheiten nennt 

man auch Axiome, die daraus abgeleiteten Schlussfolgerungen sind die 

Theoreme.) Angenommen Sie stehen nun vor der Prüfung und haben 

während des Semesters Ihre Hausaufgaben immer gewissenhaft 

gemacht. Dann können Sie sich völlig entspannt an die Arbeit machen, 

denn die reine Logik garantiert Ihnen, dass Sie nicht durchfallen 

werden. 

Beispiel 6.2 An dieser Stelle gleich einen Hinweis auf den vermutlich 

beliebtesten logischen Denkfehler. Angenommen Sie haben Ihre Hausaufgaben 

nicht gemacht, mit Glück und etwas Hilfe Ihres Nebensitzers 

bestehen Sie aber trotzdem. Ist damit die Logik widerlegt? Nein, denn 

selbst wenn 

x = 0 und x → y = 1 

ist es trotzdem möglich, dass auch 

y = 1


ist. Dies ist der Fall in der zweiten Zeile in Tabelle 6.1. Was hingegen 

ausgeschlossen ist, ist 

x = 1, x → y = 1 und y = 0. 

Gehen Sie also lieber auf Nummer sicher und machen Ihre Hausaufgaben... 

6.2 Rechengesetze für Boolesche Funktionen 

Auf natürlichen Zahlen gibt es eine ganze Menge von Rechenregeln, z.B. 

x + y = y + x, x(y + z) = xy + xz, usw. 

Analog haben auch die Booleschen Funktionen einiges zu bieten, siehe Tabelle 

6.2. 

Man kann sich sehr leicht davon überzeugen, dass diese Rechenregeln stimmen. 

Da es nur zwei Wahrheitswerte gibt, kann man sämtliche Fälle in einer 

Tabelle durchprobieren. Der Beweis von 

sieht dann wie folgt aus: 

x ∧ (y ∨ z) = (x ∧ y) ∨ (x ∧ z) 

x y z x ∧ (y ∨ z) (x ∧ y) ∨ (x ∧ z) 

0 0 0 0 0 

0 0 1 0 0 

0 1 0 0 0 

0 1 1 0 0 

1 0 0 0 0 

1 0 1 1 1 

1 1 0 1 1 

1 1 1 1 1 

Die letzten beiden Spalten sind gleich, d.h. für alle möglichen Wahrheitswerte 

von x, y, z ist der Wert von x ∧ (y ∨ z) gleich dem von (x ∧ y) ∨ (x ∧ z). Das 

Distributivgesetz für natürliche Zahlen lässt sich auf diese Weise natürlich 

nicht beweisen, da man unendlich viele Fälle durchprobieren müsste. Sie 

sehen, wenn man’s mit endlichen Mengen zu tun hat, sind die Dinge schon 

sehr einfach. Die Beweise der Rechengesetze Boolescher Funktionen könnte 

sogar eine Maschine mühelos durchführen.


Für alle x, y, z ∈ {0, 1} gilt 

x ∧ y = y ∧ x Kommutativität von ∧ 

x ∨ y = y ∨ x Kommutativität von ∨ 

(x ∧ y) ∧ z = x ∧ (y ∧ z) Assoziativität von ∧ 

(x ∨ y) ∨ z = x ∨ (y ∨ z) Assoziativität von ∨ 

x ∧ (y ∨ z) = (x ∧ y) ∨ (x ∧ z) Distributivität von ∧ über ∨ 

x ∨ (y ∧ z) = (x ∨ y) ∧ (x ∨ z) Distributivität von ∨ über ∧ 

x ∧ x = x Idempotenz von ∧ 

x ∨ x = x Idempotenz von ∨ 

x ∧ (¬x) = 0 Unerfüllbarkeit 

x ∨ (¬x) = 1 Tautologie 

x ∧ 1 = x Neutrales Element von ∧ 

x ∧ 0 = 0 

x ∨ 0 = x Neutrales Element von ∨ 

x ∨ 1 = 1 

x ∧ (x ∨ y) = x 

x ∨ (x ∧ y) = x Absorption 

¬¬x = x Doppelnegation 

¬(x ∧ y) = (¬x) ∨ (¬y) 

¬(x ∨ y) = (¬x) ∧ (¬y) de Morgan’sche Regeln 

x → y = (¬x) ∨ y Ersetzen von → 

x ↔ y = (x → y) ∧ (y → x) Ersetzen von ↔ 

Tabelle 6.2: Rechenregeln für Boolesche Funktionen.


6.3 Formeln der Aussagenlogik 

Im letzten Abschnitt sind wir auf Ausdrücke wie z.B. 

x ∧ (y ∨ z) 

gestoßen. Wenn man genau hinschaut erkennt man, dass es sich hierbei um 

nichts anderes als eine Zeichenkette handelt. Diese besteht aus Variablensymbolen 

x, y, z, Klammern sowie Symbolen für Boolesche Funktionen ∧ 

und ∨. Solche Zeichenketten nennen wir aussagenlogische Formeln. Wenn 

man komplexe Formeln aufbauen möchte, braucht man hinreichend viele Variablensymbole. 

Damit uns diese nicht irgendwann ausgehen, verwenden wir 

nicht mehr x, y, z sondern gönnen uns gleich unendlich viele Variablensymbole 

x1, x2, x3, . . .. (Da Formeln endlich lang sind, werden in einer Formel aber 

immer nur endlich viele davon auftreten.) 

Definition 6.3 Aussagenlogische Formel. 

Eine aussagenlogische Formel ist eine Zeichenkette, die sich auf folgende 

Weise in endlich vielen Schritten konstruieren lässt: 

• Die Symbole 0 und 1 sind Formeln. 

• Jedes Variablensymbol x1, x2, . . . ist eine Formel. 

• Ist F eine Formel, dann auch ¬F 

• Sind F und G Formeln, dann auch 

Beispiele für Formeln sind 

während 

(F ∧ G), (F ∨ G), (F → G) und (F ↔ G). 

0 

x3 

(x5 ∧ x1) 

¬¬((x1 → x2) → x3) 

x5¬x4 

x1 → x2 

keine Formeln sind. (Im letzten Fall fehlten lediglich die Klammern.) 

Besonders geschickt an dieser Definition ist, dass sich jede Formel auf 

genau eine Weise durch einen Syntaxbaum konstruieren lässt. Um dies zu


erreichen waren die Klammern erforderlich. Ohne Klammern könnte man 

z.B. die Formel 

¬x1 → x2 

auf zwei unterschiedliche Weisen konstruieren, siehe Bild 6.1. Dies würde 

später zu Problemen führen, wenn man einer Formel wieder eine Bedeutung 

zuordnen möchte und dann nicht weiss, ob sie als 

oder 

zu interpretieren ist. 

(¬x1) → x2 (linker Syntaxbaum in Bild 6.1) 

¬(x1 → x2) (rechter Syntaxbaum in Bild 6.1) 

¬x1 

¬x1 → x2 

¬x1 → x2 

x1 → x2 

x1 x2 x1 x2 

Abbildung 6.1: Unterschiedliche Syntaxbäume für ¬x1 → x2 

Offensichtlich gilt 

x1 = ¬¬x1, 

denn die Zeichenkette auf der linken Seite hat noch nicht einmal die selbe 

Länge wie die auf der rechten Seite. Andererseits — interpretiert man x1 als 

Variable für einen Wahrheitswert und ¬ als Boolesche Funktion, dann ist 

x1 = ¬¬x1 

für jeden Wert von x1. Es ist also wichtig, zwischen Zeichenketten und deren 

mögliche Bedeutung als Boolesche Funktionen zu unterscheiden! 

6.4 Semantik der Aussagenlogik 

Nachdem nun klar ist, mit welchen Formeln (Zeichenketten) gespielt wird, 

soll diesen Zeichenketten eine Bedeutung gegeben werden. Die Bedeutung


einer Zeichenkette nennt man ihre Interpretation. Wie zu erwarten leitet 

sich diese unmittelbar aus den Booleschen Funktionen ab. Die Formel 

kann als Funktion 

 

(x3 → x1) → ¬x2 

f ∈ W 3 → W, f(x1, x2, x3) = (x3 → x1) → ¬x2 

interpretiert werden, die drei Wahrheitswerten für x1, x2, x3 einen Wahrheitswert 

nach den Rechenregeln der Booleschen Funktionen zuordnet. Genausogut 

könnte man sie jedoch auch als vierstellige Funktion 

f ∈ W 4 → W, f(x1, x2, x3, x4) = (x3 → x1) → ¬x2 

interpretieren, die eben konstant in ihrem vierten Argument ist. Um die 

Bedeutung einer Formel eindeutig zu machen und für alle Fälle gewappnet 

zu sein, greift man zu einem Trick — man interpretiert eine Formel immer 

als “unendlich-stellige” Funktion. Diese Idee wird nun etwas konkretisiert. 

Eine Zuordnung von Wahrheitswerten zu den Variablensymbolen x1, x2, x3, . . . 

nennt man Belegung. Stellen Sie sich eine Belegung b einfach als unendlich 

lange Folge von Nullen und Einsen vor, d.h. 

b = b1, b2, b3, . . . 

wobei jedes bi entweder Null oder Eins ist und dem Variablensymbol xi der 

Wahrheitswert bi zugeordnet wird. Beispiele für Belegungen sind 

0, 0, 0, 0, . . . 

1, 1, 1, 1, . . . 

0, 1, 0, 1, . . . 

und es gibt natürlich unendlich viele weitere. Sei im Folgenden B die Menge 

aller Belegungen, d.h. die Menge aller unendlich langer 0, 1-Folgen. Dann 

kann eine Formel in naheligender Weise als Funktion 

f ∈ B → {0, 1} 

interpretiert werden, die jeder Belegung einen Wahrheitswert zuordnet. 

Beispiel 6.4 Die Formel 

(x3 → ¬x2)


kann als Funktion 

interpretiert werden. So ist z.B. 

f ∈ B → {0, 1}, f(b) = b3 → ¬b2 

f(0, 0, 0, 0, . . .) = 1 

f(1, 1, 1, 1, . . .) = 0 

f(1, 0, 1, 0, . . .) = 1. 

Da in einer Formel immer nur endlich viele Variablensymbole vorkommen, 

sind auch nur endlich viele Stellen der Belegung bei der Berechnung des 

Wahrheitswerts relevant. Die Bedeutung (oder Interpretation) einer Formel 

F als Funktion wird im Folgenden mit F ′ bezeichnet. Wem die obige informelle 

Beschreibung nicht genügt, mag sich an folgender exakter Definition 

die Zähne ausbeißen: 

Definition 6.5 Interpretation. 

Sei B die Menge aller Belegungen und F eine Formel. Die Interpretation 

F ′ von F ist eine Funktion 

F ′ ∈ B → {0, 1}, 

die jeder Belegung b ∈ B wie folgt einen Wahrheitswert zuordnet: 

• Ist F = 0 bzw. F = 1, dann ist F ′ die konstante Null- bzw. 

Einsfunktion, d.h. F ′ (b) = 0 bzw. F ′ (b) = 1. 

• Ist F = xi für ein Variablensymbol, dann ist F ′ (b) = bi. 

• Ist F = ¬G für eine Formel G, dann ist F ′ (b) = ¬G ′ (b). 

• Ist 

F = (G ∧ H) 

für bestimmte Formeln G, H, dann ist 

(Analog für ∨, →, ↔.) 

F ′ (b) = G ′ (b) ∧ H ′ (b). 

Beispiel 6.6 Sei F = x1 und G = ¬¬x1. Dann gilt 

F = G.


Andererseits gilt für jede Belegung b 

F ′ (b) = G ′ (b), 

d.h. F ′ und G ′ sind identische Funktionen und somit 

F ′ = G ′ . 

Definition 6.7 Äquivalente Formeln. 

Zwei Formeln F und G heißen äquivalent, wenn F ′ = G ′ . Man 

schreibt dann F ≡ G. 

Beispiel 6.8 Anhand einer Wahrheitstabelle lässt sich leicht verifizieren, 

dass 

(x1 → x2) ≡ (¬x2 → ¬x1). 

Anwenden von Rechenregeln wie in Tabelle 6.2 bedeutet somit nichts anderes, 

als Formeln äquivalent umzuformen. Halten wir also abschließend fest: 

• Das Symbol “=” wird verwendet, um die syntaktische Gleichheit von 

Formeln auszudrücken, d.h. deren Gleichheit als Zeichenketten. 

• Das Symbol “≡” wird verwendet, um die semantische Gleichheit von 

Formeln auszudrücken, d.h. deren Gleichheit wenn man sie als Funktionen 

interpretiert. 

Wenn F = G, dann gilt auch F ≡ G, andersherum muss dies aber nicht der 

Fall sein. So ist z.B. 

aber 

x1 → x2 ≡ ¬x2 → x1 

x1 → x2 = ¬x2 → x1. 

Es ist also ganz essentiell wichtig, zwischen einer Formel als Zeichenkette und 

ihrer Interpretation als Funktion zu unterscheiden! 

6.5 Syntaktische Vereinfachungen 

Aufgrund des Assoziativgesetzes für ∧ gilt 

(F ∧ G) ∧ H ≡ F ∧ (G ∧ H)


wobei F, G, H beliebige aussagenlogische Formeln sind. Bei Ketten von mit 

∧ verknüpften Formeln ändert die Position der Klammern somit nichts an 

der Bedeutung. Wenn man sich also nur für die Semantik interessiert, kann 

man die Klammern einfach weglassen und nur 

F ∧ G ∧ H 

schreiben. Gleiches gilt natürlich auch für Ketten von ∨-verknüpften Formeln. 

Um die Notation noch etwas zu vereinfachen, werden Klammern ganz außen 

um eine Formel weggelassen. Statt 

schreiben wir also einfach 

(x1 ∨ x2) 

x1 ∨ x2. 

6.6 Konjunktive Normalform 

In Kapitel 6.4 wurde gezeigt, dass es unterschiedliche Formeln mit der selben 

Bedeutung gibt. Diesem Phänomen begegnet man immer, wenn man sich 

zwischen Syntax und Semantik bewegt. So sind z.B. die beiden Zeichenketten 

3/4 und 6/8 

syntaktisch verschieden, bedeuten jedoch das selbe wenn man sie als rationale 

Zahlen interpretiert. In der Regel sucht man dann nach der kürzesten oder 

einfachsten Zeichenkette mit der selben Semantik — im Fall von Brüchen 

findet man diese indem man so weit wie möglich kürzt. Man nennt diese 

Zeichenkette dann Normalform. 

Für aussagenlogische Formeln gibt es mehrere Normalformen, besonders 

wichtig für uns ist die konjunktive Normalform. Zunächst ein paar Beispiele 

für Formeln in konjunktiver Normalform — wir schenken uns dabei überflüssige 

Klammern. 

Folgendes fällt hierbei auf: 

(x1 ∨ x3) ∧ (x2 ∨ x1) ∧ (x4 ∨ x2) 

¬x1 ∧ (x2 ∨ x3) ∧ ¬x2 

(x1 ∨ ¬x2) ∧ ¬x3 ∧ (x2 ∨ ¬x4 ∨ ¬x1) 

• Es treten keine → und ↔ Symbole auf.


• Die Negationssymbole stehen immer direkt vor den Variablensymbolen. 

Unter einem Literal versteht man ein Variablensymbol xi oder dessen 

Negation ¬xi. 

• In der Formel sind Literale mit ∨ verknüpft. Die ∨-verknüpften Pakete 

werden dann mit ∧ zusammengefasst. 

Der Aufbau einer Formel in konjunktiver Normalform ist schematisch als 

Syntaxbaum in Bild 6.2 dargestellt. 

∧ 

· · · 

∨ ∨ 

∨ 

· · · · · · · · · 

Literale xi, ¬xi 

Abbildung 6.2: Syntaxbaum einer Formel in konjunktiver Normalform 

Theorem 6.9 (Konjunktive Normalform) 

Zu jeder Formel F gibt es eine äquivalente Formel G in konjunktiver 

Normalform. 

Wie kann man also eine gegebene Formel auf konjunktive Normalform bringen? 

Hierzu bietet sich folgendes Verfahren an: 

• Zunächst eliminiert man ↔ und → mittels der Äquivalenzen 

• Mit den Äquivalenzen 

F ↔ G ≡ (F → G) ∧ (G → F) 

F → G ≡ ¬F ∨ G 

¬(F ∨ G) ≡ ¬F ∧ ¬G 

¬(F ∧ G) ≡ ¬F ∨ ¬G 

kann man die Negationssymbole direkt an die Variablensymbolen bringen. 

Zwei direkt aufeinanderfolgende Negationssymbole können gestrichen 

werden.


• Zum Schluss wendet man die Äquivalenzen 

F ∨ (G ∧ H) ≡ (F ∨ G) ∧ (F ∨ H) 

(F ∧ G) ∨ H ≡ (F ∨ H) ∧ (G ∨ H) 

so oft an, bis die Formel in konjunktiver Normalform ist. 


¬(x1 ↔ x2) 

soll auf konjunktive Normalform transformiert werden. 

• Zunächst wird ↔ eliminert. 

¬ (x1 → x2) ∧ (x2 → x1) 

¬ (¬x1 ∨ x2) ∧ (¬x2 ∨ x1) 

• Mit Hilfe der de Morgan’schen Gesetze werden nun die Negationssymbole 

zu den Variablensymbolen gebracht. Doppelte Negationen 

werden gelöscht. 

¬ (¬x1 ∨ x2) ∨ ¬ (¬x2 ∨ x1) 

(x1 ∧ ¬x2) ∨ (x2 ∧ ¬x1) 

• Zum Schluss wird das Distributivgesetz verwendet um ∧ nach außen 

zu bringen. 

 

(x1 ∧ ¬x2) ∨ x2 ∧ (x1 ∧ ¬x2) ∨ ¬x1 

(x1 ∨ x2) ∧ (¬x2 ∨ x2) ∧ (x1 ∨ ¬x1) ∧ (¬x2 ∨ ¬x1) 

Damit hat man konjunktive Normalform erreicht. 

Da die beiden Teilformeln (¬x2 ∨ x2) und (x1 ∨ ¬x1) in jeder Belegung 

wahr sind, kann man sie aus der ∧-Verknüpfung streichen und erhält 

(x1 ∨ x2) ∧ (¬x2 ∨ ¬x1). 

Mit Hilfe einer Wertetabelle kann man leicht verifizieren, dass tatsächlich 

¬(x1 ↔ x2) ≡ (x1 ∨ x2) ∧ (¬x2 ∨ ¬x1), 

wobei die rechte Seite in konjunktiver Normalform ist. 

Manchmal kann man sich etwas Rechenaufwand sparen, wenn man die verallgemeinerten 

Distributivgesetze verwendet: 

F ∨ (G1 ∧ G2 ∧ . . . ∧ Gn) ≡ (F ∨ G1) ∧ (F ∨ G2) ∧ . . . ∧ (F ∨ Gn) 

(F1 ∧ F2 ∧ . . . ∧ Fn) ∨ G ≡ (F1 ∨ G) ∧ (F2 ∨ G) ∧ . . . ∧ (Fn ∨ G)


6.7 Tautologien 

Kein Witz — besonders interessant für uns sind die absolut trivialen Formeln, 

d.h. Formeln die für jede Belegung wahr sind. Beispiele für solche 

Trivialitäten sind 

x3 ∨ ¬x3 

1 

¬0 

0 → x2 

x5 → 1 

x1 → (x2 → x1) 

Solche Formeln nennt man Tautologien. 

Definition 6.11 Tautologie. 

Eine Formeln F heisst Tautologie, wenn 

F ≡ 1, 

d.h. F ′ (b) = 1 für jede Belegung b. 

6.8 Logische Schlussfolgerungen 

“Worin besteht das Geheimnis Ihres langen Lebens?” wurde ein 100-jähriger 

gefragt. “Ich halte mich an strenge Diätregeln: 

• Wenn ich kein Bier zu einer Mahlzeit trinke, dann habe ich immer 

Fisch. 

• Immer wenn ich Fisch und Bier zur selben Mahlzeit habe, verzichte ich 

auf Eiscreme. 

• Wenn ich Eiscreme habe oder Bier meide, dann rühre ich Fisch nicht 

an.“ 

Versuchen Sie mal, sich an diese Diät zu halten — und Sie werden feststellen, 

dass Sie zu jedem Essen Bier trinken müssen! Anders ausgedrückt: Die 

Aussage 

• Ich trinke zu jedem Essen Bier.


ist eine logische Folgerung aus den o.g. drei Aussagen: Wenn die ersten drei 

Aussagen wahr sind, dann muss auch die vierte wahr sein. 

Logische Folgerungen dieser Art können auch Maschinen ziehen wenn 

man die Aussagen formal darstellt. Man kann die Aussagen auf drei Kernaussagen 

reduzieren, die über Boolesche Funktionen miteinander verknüpft 

sind: 

• Ich trinke Bier. 

• Ich esse Fisch. 

• Ich esse Eiscreme. 

Bezeichnen wir die Wahrheitswerte dieser drei Aussagen mit den Variablen 

x1, x2 und x3. Die Diätregeln entsprechen dann folgenden Booleschen Gleichungen: 

¬x1 → x2 = 1 

(x2 ∧ x1) → ¬x3 = 1 

(x3 ∨ ¬x1) → ¬x2 = 1 

Durch diese Gleichungen werden die Wahrheitswerte von x1, x2, x3 eingeschränkt. 

Da es insgesamt nur 8 Möglichkeiten gibt, können wir alle durchprobieren 

und dann die aussuchen, in denen alle Gleichungen erfüllt sind. 

x1 x2 x3 ¬x1 → x2 (x2 ∧ x1) → ¬x3 (x3 ∨ ¬x1) → ¬x2 

0 0 0 0 1 1 

0 0 1 0 1 1 

0 1 0 1 1 0 

0 1 1 1 1 0 

1 0 0 1 1 1 

1 0 1 1 1 1 

1 1 0 1 1 1 

1 1 1 1 0 0 

Aus der Tabelle erkennt man, dass nur dann alle drei Gleichungen erfüllt 

sind, wenn x1 = 1. Ziehen wir das ganze nun auf die syntaktische Ebene, 

damit wir die Rechner ins Spiel bringen können.


Definition 6.12 Logische Folgerung. 

Eine Formel F folgt logisch aus Formeln G1, G2, . . .,Gn, wenn für 

jede Belegung b, für die 

gilt, auch 

gilt. 

G ′ 1(b) = 1, G ′ 2(b) = 1, . . ., G ′ n(b) = 1 

F ′ (b) = 1 

Formal nicht ganz exakt aber leichter zu merken: F folgt logisch aus G1, G2, . . ., Gn 

wenn F in jeder Belegung wahr ist, in der alle G1, G2, . . .,Gn wahr sind. Man 

schreibt in diesem Fall 

{G1, G2, . . .,Gn} |= F. 

Beispiel 6.13 Aus obigem Beispiel entnimmt man 

{¬x1 → x2, x2 ∧ x1) → ¬x3, (x3 ∨ ¬x1) → ¬x2} |= x1 

{¬x1 → x2, x2 ∧ x1) → ¬x3, (x3 ∨ ¬x1) → ¬x2} |= ¬(x2 ∧ x3) 

Beispiel 6.14 Eine Formel F ist genau dann eine Tautologie, wenn sie 

in jeder Belegung wahr ist. Da die Formel 1 in jeder Belegung wahr ist, 

kann man durch 

1 |= F 

ausdrücken, dass F eine Tautologie ist. Man schreibt dann auch kürzer 

|= F. 

Einen zentralen Zusammenhang zwischen Tautologien und logischem Schließen 

stellt folgendes Theorem her: 

Theorem 6.15 

F folgt logisch aus G1, G2, . . .Gn genau dann wenn 

eine Tautologie ist. 

G1 ∧ G2 ∧ . . . ∧ Gn → F


Kürzer ausgedrückt: 

genau dann wenn 

{G1, G2, . . .,Gn} |= F 

|= G1 ∧ G2 ∧ . . . ∧ Gn → F. 

Als Spezialfall dieses Theorems gilt: F folgt logisch aus G genau dann wenn 

G → F eine Tautologie ist. Diese Eigenschaft rechtfertigt, dass man das → 

Symbol als “wenn–dann” Pfeil bezeichnet.


7 Prädikatenlogik 

7.1 Syntax der Prädikatenlogik 

7.1.1 Terme, atomare Formeln, Formeln 

Die Sprache der Prädikatenlogik (oder Logik erster Ordnung) ist — wie jede 

Sprache — eine Menge von Zeichenketten. Um die Sprache zu definieren, 

muss man also zunächst festlegen aus welchen Symbolen die Zeichenketten 

bestehen. Als nächstes wird festgelegt, welche dieser Zeichenketten Elemente 

der Sprache sind und welche nicht. Die Zeichenketten, die zur Sprache 

gehören heißen wohlgeformte Formeln (oder kurz Formeln). Doch zunächst 

zu den Symbolen. 

Man hat beliebig viele Variablensymbole – genau genommen abzählbar 

unendlich viele. Weiterhin hat man endlich viele Konstantensymbole, 

Funktionssymbole und Relationssymbole. Hinzu kommen noch Symbole der 

Aussagenlogik (∧, ∨, ¬, →, ↔), Klammern, Kommas und Quantoren (∀, ∃). 

Es gibt somit nicht die Sprache der Logik. Je nach dem welche Variablensymbole, 

Konstantensymbole, Funktionssymbole und Relationssymbole 

man ins Spiel nimmt, erhält man eine andere Sprache, d.h. andere Mengen 

von Termen und Formeln. Wir nehmen also an, dass eine feste Auswahl an 

Symbolen getroffen wurde, z.B. 

• Variablensymbole: x, y, z, x1, x2, x3, . . .. 

• Konstantensymbole: c, d. 

• Funktionssymbole: f, g, h wobei f einstellig und g, h zweistellig sind. 

• Relationssymbole: P, Q wobei P einstellig und Q zweistellig ist. 

Aus den Variablen-, Konstanten-, und Funktionssymbolen kann man wie folgt 

Terme zusammenbauen. 

Definition 7.1 (Term) 

• Jedes Variablensymbol und jedes Konstantensymbol ist ein 

Term. 

• Ist f ein n-stelliges Funktionssymbol und sind t1, . . ., tn Terme, 

dann ist auch 

f(t1, . . ., tn) 

ein Term.


Terme sind also nichts anderes als Zeichenketten mit einer bestimmten Struktur. 

Beispiele für Terme sind 

x 

d 

f(z) 

f(f(z)) 

g(d, y) 

g f(z), g(d, y) . 

Definition 7.2 (Atomare Formel) 

Ist P ein n-stelliges Relationssymbol und sind t1, . . ., tn Terme, dann 

ist 

P(t1, . . .,tn) 

eine atomare Formel. 

Beispiele für atomare Formeln sind 

P(x) 

Q g(x, y), h(x, y) 

P f(f(y)) . 

Zum Schluss kommen noch die aussagelogischen Symbole und Quantoren 

dazu.


Definition 7.3 (Formel) 

• Jede atomare Formel ist eine Formel. 

• Ist F eine Formel, dann auch 

¬F. 

• Sind F und G Formeln, dann auch 

(F ∧ G), (F ∨ G), (F → G), (F ↔ G). 

• Ist F eine Formel und x ein Variablensymbol, dann ist auch 

eine Formel. 

Beispiele für Formeln sind 

∀xF 

Q(x, c) 

P(c) → ∀x ¬∀y Q(x, d) 

 

∀x P f(g(x, c)) → Q c, f(c) 

Der Aufbau der letzten Formel ist in Bild 7.1 durch einen Baum dargestellt. 

Hat man sich also für bestimmte Variablen-, Konstanten-, Funktions-, und 

Relationssymbole entschieden, ist die zugehörige Sprache der Prädikatenlogik 

die Menge der Formeln, die man aus diesen Symbolen konstruieren kann. 

7.1.2 Freie und gebundene Variablen. 

Ein Variablensymbol kommt in einer Formel entweder frei vor oder gebunden 

durch einen Quantor. 

Beispiel 7.4 Hierzu ein paar Beispiele: 

∀x Q(x, y) 

Hier ist x gebunden und y frei. 

P(x) → ∀x Q(x, d) 

Das erste Auftreten von x ist frei, das zweite gebunden. 

∀x P(x) → Q(x, y)


 

∀x P f(g(x, c)) → Q c, f(c) 

∀x P f(g(x, c)) 

P f(g(x, c)) 

f(g(x, c)) 

x 

g(x, c) 

c 

c 

Q c, f(c) 

f(c) 

c 

Formeln 

Terme 

Abbildung 7.1: Aufbau von Formeln. 

Beide Auftreten von x sind gebunden, y ist frei. 

∀x P(x) → Q(x, y) 

atomare Formeln 

Das erste Auftreten von x ist gebunden, das zweite frei. Um die “Reichweite” 

eines Quantors zu bestimmen, muss man sich klarmachen wie die 

Formel durch einen Baum aufgebaut ist. Hierüber geben die Klammern 

Aufschluss. 

∀x P(x) → ∀x Q(x, y) 

Beide Auftreten von x sind gebunden, jedoch durch unterschiedliche 

Quantoren. 

Ein Quantor ∀x bindet somit die freien Auftreten des Variablensymbols x im 

Baum unterhalb dieses Quantors, siehe Bild 7.1. 

Man sollte möglichst vermeiden, dass ein Variablensymbol in ein und 

der selben Formel sowohl frei als auch gebunden vorkommt oder durch unterschiedliche 

Quantoren gebunden wird. Solche Situationen können leicht 

behoben werden, indem man ein gebundenes Variablensymbol durch ein neues 

Variablensymbol ersetzt, d.h. ein Variablensymbol, das noch nicht in der 

Formel verwendet wird. Man spricht dann von einer gebundenen Umbenennung. 

Schließlich hat man ja unendlich viele Variablensymbole!


Definition 7.5 (Geschlossene Formel) 

Eine Formel, in der keine freien Variablensymbole vorkommen, heißt 

geschlossen. 

Man kann aus jeder Formel eine geschlossene Formel machen, wenn man an 

den Anfang der Formel einen Allquantor zu jeder in ihr auftretenden freien 

Variablen setzt. Man spricht dann vom universellen Abschluss der Formel. 

Der universelle Abschluss von 

ist somit 

7.1.3 Substitution 

P(x) → ∀z Q(y, z) 

∀x ∀y P(x) → ∀z Q(y, z) . 

Manchmal möchte man alle freien Auftreten eines Variablensymbols x in 

einer Formel F durch einen Term t ersetzen. Die entstehende Formel wird 

dann mit F[t/x] bezeichnet. So ist z.B. 

P(x)[f(y)/x] = P(f(y)) 

Q x, f(x) 

[h(x, y)/x] = Q h(x, y), f h(x, y) 

 

∀y P(y) → Q(x, y) [f(c)/y] = ∀y P(y) → Q(x, f(c)) . 

Definition 7.6 (Substitution) 

Eine Substitution ist die Ersetzung eines Variablensymbols an allen 

Stellen, in denen es frei in einer Formel vorkommt durch einen Term. 

Definition 7.7 (Frei für) 

Sind alle Auftreten von Variablensymbolen im Term t nach dessen 

Substitution für x in F frei, dann heißt t frei für x in F. 

Bei Substitutionen ist es normalerweise sehr wünschenswert, dass t frei für x 

in F ist und kann leicht erreicht werden, indem man die gebundenen Variablensymbole 

von F so umbenennt, dass sie verschieden sind von den Variablensymbolen 

in t. 

Beispiel 7.8


• Sei t = g(c, y) und F = ∀y Q(x, y). Dann ist t nicht frei für x in 

F. Es ist nämlich 

F[t/x] = ∀y Q g(c, y), y 

und das Vorkommen von y in t ist nun gebunden! 

• Benennt man das gebundene Variablensymbol y in F zunächst 

um, erhält man die Formel F ′ = ∀z Q(x, z). Nun ist t frei für x in 

F ′ und es ist 

F ′ [t/x] = ∀z Q g(c, y), z . 

Nachfolgendes Beispiel soll verdeutlichen, warum es so wichtig ist, dass ein 

Term frei für ein Variablensymbol ist, bevor man substituiert. 


F = ∃y y = x + 1 

kann interpretiert werden als Aussage über natürliche Zahlen und Addition. 

Sie drückt dann aus, dass die natürliche Zahl x einen Nachfolger 

hat. Dies ist wahr für beliebiges x ∈ N, also kann man für x auch einen 

Term einsetzen, z.B. die Konstante 42: 

F[42/x] = ∃y y = 42 + 1. 

auch dies ist wahr. Substiuiert man jedoch für x den Term y, erhält 

man 

F[y/x] = ∃y y = y + 1 

und das ist natürlich falsch. Dies liegt daran, dass der Term y nicht frei 

für x in der Formel F ist. 

7.1.4 Syntaktische Vereinfachungen. 

Die Formeln sind oft schwer zu lesen, weil sie sehr viele Klammern enthalten. 

Um die Notation zu vereinfachen, werden überflüssige Klammern weggelassen. 

Hierzu wird festgelegt, dass ∧ stärker bindet als ∨ und ∨ stärker als →. 


P(x) ∧ ∃y Q(x, y) → P(c) ∨ P(x) 

ist somit eine syntaktische Vereinfachung von 

P(x) ∧ ∃y Q(x, y) → P(c) ∨ P(x) 

.


7.2 Semantik der Prädikatenlogik 

Was könnte die Formel 

∀x Q g(x, c), x 

bedeuten? Man kann sie z.B. so interpretieren, dass sie Aussagen über Zahlen 

aus N0 macht. Das Konstantensymbol c soll die Zahl 0 bedeuten, g soll die 

Additionsfunktion sein und Q die Gleichheitsrelation. Die Formel macht dann 

die wahre Aussage, dass für alle x ∈ N0 gilt x + 0 = x. 

Allgemein muss man bei der Interpretation einer Formel festlegen, was 

die Konstanten-, Funktions-, und Relationssymbole bedeuten sollen. Naheliegenderweise 

sollen die Konstantensymbole durch eine Konstanten, die Funktionssymbole 

durch Funktionen und die Relationssymbole durch Relationen 

interpretiert werden. Um’s einfach zu machen, sollen diese sich alle auf ein 

und dieselbe Menge beziehen. 

Um die Notation etwas zu vereinfachen, bezeichnen wir die Symbole unsere 

Sprache wie folgt: 

• Konstantensymbole: c1, c2, . . . 

• Variablensymbole: x1, x2, . . . 

• Funktionssymbole: f1, f2, . . . 

• Relationssymbole P1, P2, . . .. 

Definition 7.11 (Interpretation) 

Eine Interpretation einer Sprache der Prädikatenlogik besteht aus 

einer nichtleeren Menge A, der sog. Trägermenge der Interpretation. 

Weiterhin ordnet sie 

• jedem Konstantensymbol ci ein Element c ′ i 

• jedem Variablensymbol xi ein Element x ′ i 

∈ A zu 

∈ A zu 

• jedem n-stelligen Funktionssymbol fi eine n-stellige Funktion 

fi ∈ A n → A zu 

• und jedem n-stelligen Relationssymbol Pi eine n-stellige Relation 

auf Pi ⊆ A n zu. 

Notation 7.12 

Allgemein wird die Bedeutung eines Symbols s mit s ′ bezeichnet.


Intuitiv müsste klar sein, was eine Formel bedeutet, wenn die Bedeutung der 

Symbole (d.h. eine Interpretation) gegeben ist. Trotzdem nochmal eine exakte 

Definition. Gemäß dem Aufbau von Formeln wird zunächst die Bedeutung 

von Termen definiert. 

Definition 7.13 (Bedeutung von Termen) 

Sei t ein Term und I eine Interpretation. Dann ist die Bedeutung t ′ 

von t in I definiert durch 

t ′ ⎧ 

⎨ c 

= 

⎩ 

′ i falls t = ci für ein i 

x ′ i falls t = xi für ein i 

f ′ i (t′ 1 , . . .,t′ n ) falls t = fi(t1, . . .,tn) für ein i. 

Beispiel 7.14 Sei t = f(g(x, c)), die Trägermenge von I sei N0, weiter 

sei c ′ = 5, x ′ = 3, g ′ (x, y) = x + y und f ′ (x) = x + 1. Dann ist t ′ = 9. 

Die Bedeutung eines Terms ist somit immer ein Element der Trägermenge.

V. Stahl Logik und Künstliche Intelligenz Seite 131


Definition 7.15 (Bedeutung von Formeln) 

Sei F eine Formel und I eine Interpretation mit Trägermenge A. 

Dann ist die Bedeutung F ′ von F in I wie folgt definiert: 

• Ist F eine atomare Formel, d.h. 

dann ist 

• Ist 

für eine Formel G, dann ist 

F = Pi(t1, . . ., tn) für ein i 

F ′ = P ′ 

i (t′ 1 , . . .,t′ n ). 

F = ¬G 

F ′ = ¬G ′ . 

Achtung: Während ¬ in der Formel F = ¬G nur ein Symbol 

ist, bezeichnet ¬ in F ′ = ¬G ′ eine Boolesche Funktion! 

• Ist 

F = (G → H) 

für Formeln G und H, dann ist 

F ′ = G ′ → H ′ . 

Wiederum ist → in F = (G → H) nur ein Symbol, während 

es in F ′ = G ′ → H ′ eine Boolesche Funktion bezeichnet. 

• Die Bedeutung von G ∧ H, G ∨ H, G ↔ H ist analog zum 

vorigen Fall definiert. 

• Ist 

F = ∀xiG 

für ein Variablensymbol xi und eine Formel G dann ist 

– F ′ = 1 wenn die Formel G wahr ist in jeder Interpretation 

I[x ′ i = a] mit a ∈ A beliebig und 

– F ′ = 0 sonst. 

Hierbei ist I[x ′ i = a] die selbe Interpretation wie I, außer dass 

das Variablensymbol x ′ i durch a interpretiert wird. 

• Die Bedeutung von ∃xi G ist analog zum vorigen Fall definiert.


Die Bedeutung einer Formel in einer Interpretation ist somit immer ein Wahrheitswert 

0 oder 1. 

Bemerkung. In der Regel werden wir mit geschlossenen Formeln arbeiten. 

Für die Interpretation solcher Formeln ist die Bedeutung der Variablensymbole 

irrelevant und wird daher nicht angegeben. 

Beispiel 7.16 Nachfolgend zwei Interpretationen I1, I2 für Formeln, die 

die in Kapitel 7.1.1 genannten Symbole verwenden. 

• Trägermenge von I1 sei N0. In I1 wird das Konstantensymbol c 

durch c ′ = 0 interpretiert, f ′ ist die einstellige Nachfolgerfunktion, 

g ′ ist die Addition und h ′ die Multiplikation. Weiterhin ist P ′ die 

Menge der geraden Zahlen und Q ′ die Gleichheitsrelation. 

• Trägermenge von I2 sei R. In I2 ist c ′ = √ 2, f ′ ist die Rundungsfunktion 

nach oben auf die nächstgelegene ganze Zahl, g ′ ist die 

Addition und h ′ die Subtraktion. Weiterhin ist P ′ die Menge der 

rationalen Zahlen und Q ′ die Gleichheitsrelation. 

Um auszudrücken, dass eine Formel F wahr bzgl. einer Interpretation I ist, 

schreibt man 

|=I F. 

Mit den Interpretationen von Beispiel 7.16 gilt 

|=I1 ∀x Q g(x, c), x 

|=I2 ∀x Q g(x, c), x . 

Theorem 7.17 

Ist F eine Formel und I eine Interpretation, dann gilt 

entweder |=I F oder |=I ¬F. 

Definition 7.18 (Gültige Formel) 

Eine Formel heißt gültig, wenn sie wahr in jeder Interpretation ist. 

Ein Beispiel für eine gültige Formel ist 

P(x) → P(x) .


Definition 7.19 (Unerfüllbare Formel) 

Eine Formel heißt unerfüllbar, wenn sie falsch in jeder Interpretation 

ist. 

Offensichtlich ist eine Formel F genau dann gültig, wenn ¬F unerfüllbar ist. 


∀x P(x) → ∃yP(y) 

ist gültig. Wenn die Eigenschaft P ′ für jedes Elemnt der Trägermenge 

gilt, dann existiert auch mindestens ein Element der Trägermenge, 

welches die Eigenschaft P ′ hat. Doch halt — wie sieht’s mit der Interpretation 

aus, deren Trägermenge leer ist? In der Tat wäre die Formel 

in dieser Interpretation falsch. Um solche Ausnahmefälle zu vermeiden, 

wurde in Definition 7.11 ausdrücklich gefodert, dass die Trägermenge 

einer Interpretation nicht leer sein darf. 

7.3 Rechenregeln für Formeln der Prädikatenlogik 

7.3.1 Äquivalente Formeln 

Eine Rechenregel ist ganz allgemein ausgedrückt eine syntaktische Umformung 

einer Zeichenkette, bei der die Semantik erhalten bleibt. Das Distributivgesetz 

besagt z.B., dass die beiden syntaktisch ungleichen Terme 

a(b + c) und ab + ac 

die gleiche Semantik haben, wenn man sie über den reellen Zahlen mit Addition 

und Multiplikation interpretiert. Das bedeutet, dass man im Lauf eines 

Rechenvorgangs die beiden Terme beliebig gegeneinander austauschen kann. 

Ähnliche Rechenregeln gibt es auch für Formeln der Prädikatenlogik. 

Beispiel 7.21 

Formeln 

Aus den Gesetzen von de Morgan folgt, dass die beiden 

 

 

¬ ∀x P(x) ∨ Q(c, d) und ¬∀x P(x) ∧ ¬Q(c, d) 

den selben Wahrheitswert haben, und zwar in jeder Interpretation. Sie 

haben somit die selbe Bedeutung, d.h. sind semantisch gleich.


Beispiel 7.22 Die beiden Formeln 

¬∀x P(x) und ∃x ¬P(x) 

sagen im Prinzip das Selbe aus: Wenn nicht jedes x die Eigenschaft P 

hat, dann gibt’s mindestens ein x, welches nicht die Eigenschaft P hat 

— und umgekehrt. Dabei ist völlig egal, wie man P interpretiert. In 

jeder Interpretation besitzen die beiden Formeln den selben Wahrheitswert 

und sind somit semantisch gleich. 

Analog zur Aussagenlogik heißen semantisch gleiche Formeln äquivalent. 

Definition 7.23 (Äquivalente Formeln) 

Zwei Formeln F und G heißen äquivalent wenn sie in jeder Interpretation 

den selben Wahrheitswert haben. Man schreibt dann 

F ≡ G. 

Wie im Fall der Aussagenlogik wird das Symbol = verwendet für die syntaktische 

Gleichheit von Formeln, während ≡ für die semantische Gleichheit 

steht. Wenn F = G, dann gilt auch F ≡ G, andersherum muss dies aber 

nicht der Fall sein. So ist z.B. 

aber 

7.3.2 Regeln der Aussagenlogik 

¬∀x P(x) ≡ ∃x ¬P(x) 

¬∀x P(x) = ∃x ¬P(x). 

Die Rechenregeln für Boolesche Funktionen in Tabelle 6.2 lassen sich unmittelbar 

auf die Prädikatenlogik übertragen.


Theorem 7.24 

Seien F, G, H beliebige Formeln der Prädikatenlogik. Dann gilt 

F ∧ G ≡ G ∧ F (Kommutativität von ∧) 

F ∨ G ≡ G ∨ F (Kommutativität von ∨) 

(F ∧ G) ∧ H ≡ F ∧ (G ∧ H) (Assoziativität von ∧) 

(F ∨ G) ∨ H ≡ F ∨ (G ∨ H) (Assoziativität von ∨) 

F ∧ (G ∨ H) ≡ (F ∧ G) ∨ (F ∧ H) 

(Distributivität von ∧ über ∨) 

F ∨ (G ∧ H) ≡ (F ∨ G) ∧ (F ∨ H) 

(Distributivität von ∨ über ∧) 

F ∧ F ≡ F (Idempotenz von ∧) 

F ∨ F ≡ F (Idempotenz von ∨) 

F ∧ (F ∨ G) ≡ F 

F ∨ (F ∧ G) ≡ F (Absorption) 

¬¬F ≡ F (Doppelnegation) 

¬(F ∧ G) ≡ (¬F) ∨ (¬G) 

¬(F ∨ G) ≡ (¬F) ∧ (¬G) (de Morgan’sche Regeln) 

F → G ≡ (¬F) ∨ G (Ersetzen von →) 

F ↔ G ≡ (F → G) ∧ (G → F) (Ersetzen von ↔)


7.3.3 Regeln für Quantoren 

Theorem 7.25 

Seien F und G beliebige Formeln. Dann gilt 

¬∀xF ≡ ∃x¬F (Vertauschen von ¬ und ∀) 

¬∃xF ≡ ∀x¬F (Vertauschen von ¬ und ∃) 

∀xF ∧ ∀xG ≡ ∀x(F ∧ G) (Herausziehen von ∀ aus ∧) 

∃xF ∨ ∃xG ≡ ∃x(F ∨ G) (Herausziehen von ∃ aus ∨) 

∀x∀yF ≡ ∀y∀xF (Reihenfolge von ∀) 

∃x∃yF ≡ ∃y∃xF (Reihenfolge von ∃) 

Theorem 7.26 

Seien F und G beliebige Formeln. Falls x in G nicht frei vorkommt, 

gilt 

∀xF ∧ G ≡ ∀x(F ∧ G) 

∀xF ∨ G ≡ ∀x(F ∨ G) 

∃xF ∧ G ≡ ∃x(F ∧ G) 

∃xF ∨ G ≡ ∃x(F ∨ G) (Triviale Quantifizierung) 

Wichtig: Folgende ganz ähnlich aussehende Umformungen sind im Allgemeinen 

nicht zulässig! 

Beispiel 7.27 Um zu sehen, dass 

∀xF ∨ ∀xG ≡ ∀x(F ∨ G) 

∃xF ∧ ∃xG ≡ ∃x(F ∧ G) 

∀x∃yF ≡ ∃y∀xF 

∃x∀yF ≡ ∀y∃xF 

∀xF ∨ ∀xG ≡ ∀x(F ∨ G)


folgendes Beispiel: Sei 

Dann besagt 

F = P(x) 

G = ¬P(x) 

∀x (F ∨ G), 

dass jedes Objekt die Eigenschaft P hat oder die Eigenschaft P nicht 

hat — was natürlich wahr ist. Andererseits besagt 

∀xF ∨ ∀xG, 

dass jedes Objekt die Eigenschaft P hat oder jedes Objekt die Eigenschaft 

P nicht hat. Nimmt man die Interpretation I mit Trägermenge 

N und interpretiert P als Menge der geraden natürlichen Zahlen, dann 

ist diese Formel falsch in I. 

Beispiel 7.28 Um zu sehen, dass 

∀x∃yF ≡ ∃y∀xF 

folgendes Beispiel: Sei F = P(x, y) und I die Interpretation mit Trägermenge 

N und P die Gleichheitsrelation auf N. Dann ist 

wahr, während 

falsch in I ist. 

7.3.4 Gebundene Umbenennung 

∀x∃y P(x, y) 

∃y∀x P(x, y) 

Auch die bereits früher erwähnte gebundene Umbenennung lässt sich als 

Rechengesetz verstehen, bei dem eine Formel syntaktisch verändert wird ohne 

ihre Semantik zu ändern. 

Theorem 7.29 (Gebundene Umbenennung) 

Sei F eine Formel, in der y nicht vorkommt. Sei weiterhin F[y/x] 

die Formel, die entsteht wenn man alle freien Vorkommen von x in 

F durch y ersetzt. Dann gilt Dann gilt 

∀xF ≡ ∀yF[y/x] 

∃xF ≡ ∃yF[y/x]


Beispiel 7.30 Wir haben gesehen, dass i.a. 

∀xF ∨ ∀xG ≡ ∀x(F ∨ G). 

Sei y ein Variablensymbol, das nicht in G vorkommt. Durch gebundene 

Umbenennung erhält man somit 

∀xF ∨ ∀xG ≡ ∀xF ∨ ∀yG[y/x]. 

Da x in ∀y G[y/x] nicht frei vorkommt, folgt aus Theorem 7.25 

Somit gilt 

7.3.5 Pränex Normalform 

∀xF ∨ ∀yG[y/x] ≡ ∀x∀y(F ∨ G[y/x]). 

∀xF ∨ ∀xG ≡ ∀x∀y(F ∨ G[y/x]). 

Mit den Rechenregeln aus Kapitel 7.3 ist es immer möglich, eine Formel der 

Prädikatenlogik so äquivalent umzuformen, dass alle Quantoren am Anfang 

der Formel stehen. Die Formel hat dann Pränex Normalform. 

Definition 7.31 (Pränex Normalform) 

Eine Formel heißt pränex oder in Pränex Normalform wenn sie die 

Form 

Q1x1 Q2x2 . . .Qnxn F 

hat, wobei xi Variablensymbole, Qi ∈ {∀, ∃}, n ≥ 0 und F eine 

quantorenfreie Formel ist. 

Beispiel 7.32 

¬ ∃x P(x) ∨ ∀y Q(x, y) 

≡ ¬∃x P(x) ∧ ¬∀y Q(x, y) (de Morgan) 

≡ ∀x ¬P(x) ∧ ∃y ¬Q(x, y) (Theorem 7.25) 

≡ ∀z ¬P(z) ∧ ∃y ¬Q(x, y) (Gebundene Umbenennung) 

≡ ∀z ¬P(z) ∧ ∃y ¬Q(x, y) 

(Theorem 7.26) 

≡ ∀z ∃y ¬P(z) ∧ ¬Q(x, y) 

(Theorem 7.26) 

Um eine gegeben Formel auf Pränex Normalform zu bringen, empfiehlt sich 

folgende Vorgehensweise:


• Zunächst ersetzt man → und ↔ durch ∧, ∨ und ¬, siehe Theorem 7.24. 

• Als nächstes transportiert man alle Negationen direkt zu den atomaren 

Formeln. Hierzu benötigt man das Gesetz von de Morgan und Theorem 

7.25. In Beispiel 7.32 waren dies die ersten beiden Schritte. 

• Um einen Quantor aus einer ∧ bzw. ∨ Verknüpfung herauszuholen, 

bedient man sich der Theoreme 7.25 und 7.26. Die nötige Voraussetzung 

für die Anwendbarkeit von Theorem 7.26 (x darf in G nicht frei 

vorkommen), lässt sich durch eine gebundene Umbenennung immer erreichen. 

Dies war in Beispiel 7.32 im dritten Schritt erforderlich, um 

Theorem 7.26 anwenden zu können. 

7.4 Logische Folgerungen 

Ähnlich wie im Fall der Aussagenlogik (Definition 6.12) wird nun auch für 

die Prädikatenlogik der Begriff der logischen Schlussfolgerung definiert. Sei 

im Folgenden Φ eine Menge von Formeln und F eine Formel. 

Definition 7.33 (Logische Folgerung) 

F folgt logisch aus Φ, wenn in jeder Interpretation, in der alle 

Formeln von Φ wahr sind, auch F wahr ist. Hierfür schreibt man 

Φ |= F. 

Wenn Φ nur eine einzige Formel G enthält, schreibt man einfach 

G |= F, 

d.h. man spart sich die Mengenklammern um G. 

Definition 7.34 (Modell) 

Eine Interpretation I, in der alle Formeln von Φ wahr sind, heißt 

Modell von Φ. Man schreibt dafür 


|=I Φ. 

Φ = { ∀x x = 0 → ∃y x = s(y), ∀x ∀y s(x) = s(y) → x = y }.


Dann ist die Interpretation mit Trägermenge N0, in der s ∈ N0 → N0 

durch die Nachfolgerfunktion, 0 durch die Konstante Null und = durch 

die Gleichheitsrelation auf N0 interpretiert wird, ein Modell von Φ. 

Die beiden Formeln besagen dann, dass jede Zahl außer Null einen 

Vorgänger hat und dass die Nachfolgerfunktion injektiv ist. Natürlich 

hat Φ auch noch andere Modelle. 

Ein Modell von Φ ist somit eine Möglichkeit, was die Formeln von Φ bedeuten 

könnten. Mit dem Begriff des Modells lässt sich Definition 7.33 etwas kürzer 

formulieren: 

Φ |= F wenn F in jedem Modell von Φ wahr ist. 

In Kapitel ?? werden Verfahren vorgestellt, wie man automatisch logische 

Schlussfolgerungen ziehen kann. 

Je mehr Wissen man hat, desto mehr Schlussfolgerungen kann man daraus 

ziehen. Formal lässt sich das durch folgendes Theorem ausdrücken. 

Theorem 7.36 

Seien Φ und Ψ Formelmengen mit Φ ⊆ Ψ. Sei F eine Formel mit 

Φ |= F. Dann gilt auch Ψ |= F. 

Es gibt auch Formeln, auf die man ohne jedes Vorwissen schließen kann. Dies 

sind genau die gültigen Formeln. Ist F eine gültige Formel, dann gilt 

7.4.1 Schlussfolgerungsregeln 

∅ |= F. 

Die in Kapitel 7.1.3 behandelten Substitutionen sind die Grundlage einer 

ganzen Klasse von einfachen logischen Schlussfolgerungen: Wenn eine Eigenschaft 

für alle Objekte gilt, dann trifft sie auch auf konkrete Einzelobjekte 

zu. Wenn man z.B. weiss, dass alle Menschen sterblich sind, kann man 

daraus schließen, dass auch Sokrates sterblich ist. Übersetzen wir nun diese 

triviale Erkenntnis in die Sprache der Logik. Sei F eine Formel (im Beispiel 

Sterblich(x)) und t ein Term (im Beispiel Sokrates). Dann ist in jeder Interpretation, 

in der 

∀xF 

wahr ist, auch 

F[t/x]


wahr, d.h. 

∀xF |= F[t/x]. 

Doch halt — es gibt eine unschöne Ausnahme! Sei 

F = ∃y y = x und t = y + 1. 

In der Standard Interpretation über den natürlichen Zahlen ist 

wahr, aber 

∀xF = ∀x ∃y y = x 

F[t/x] = ∃y y = y + 1 

ist falsch. Man muss daher zusätzlich fordern, dass t frei für x in F ist, siehe 

Definition 7.7. 

Theorem 7.37 Logische Schlussfolgerung durch Konkretisierung. 

Sei t frei für x in F. Dann gilt 

∀xF |= F[t/x]. 

Neben der Konkretisierung ist die bereits aus der Aussagenlogik bekannte 

Schlussfolgerungsregel Modus Ponens wichtig. 

Theorem 7.38 (Modus Ponens.) 

Seien F und G zwei Formeln der Prädikatenlogik. Dann gilt 

{F, F → G} |= G. 

Wie in Kapitel ?? gezeigt wird, kann man allein mit der Konkretisierung und 

Modus Ponens alle erforderlichen logischen Schlussfolgerungen ziehen. Man 

kann also beliebig komplexe Denkvorgänge in so feine Schritte zerlegen, dass 

jeder einzelne Schritt trivial ist. 

7.4.2 Konsistenz 

Definition 7.39 (Konsistenz) 

Eine Menge von Formeln heißt konsistent, wenn sie ein Modell hat. 

Ansonsten heißt sie inkonsistent.


Inkonsistente Mengen von Formeln sind in praktischen Anwendungen nicht 

sinnvoll. Aus einer inkonsistenten Menge von Formeln Φ kann man jede beliebige 

Formeln F logisch folgern. Dies wird klar, wenn man sich genau an 

die Definitionen hält. Es gilt Φ |= F genau dann wenn für jede Interpretation 

I, in der alle Formeln von Φ wahr sind, auch F wahr ist. Ist Φ jedoch 

inkonsistent, gibt es keine solche Interpretation I, folglich werden auch keine 

Anforderungen an F gestellt. 

Folgendes Theorem spielt für die in Kapitel ?? eine wichtige Rolle: 

Theorem 7.40 

Wenn Φ |= F, dann ist Φ ∪ {¬F } inkonsistent. 

Der Beweis ist recht einfach: 

• Angenommen Φ |= F. 

• Laut Definition 7.33 ist somit F in jeder Interpretation wahr, in der 

alle Formeln von Φ wahr sind. 

• Damit ist ¬F in jeder Interpretation falsch, in der alle Formeln von Φ 

wahr sind. 

• Folglich gibt es keine Interpretation, in der sowohl alle Formeln von Φ 

als auch ¬F wahr sind. 

• Nach Definition 7.39 ist somit Φ ∪ {¬F } inkonsistent.


A Kardinalzahlen und Kontinuumshypothese 

In Definition 2.19 wurde der Begriff der Mächtigkeit (oder Kardinalität) einer 

Menge festgelegt. Zwei Dinge sind an dieser Definition nicht so toll: Zum 

einen hat man vorausgesetzt, dass bekannt ist was die Anzahl der Elemente 

einer Menge ist, zum anderen wurde die Mächtigkeit nur für endliche Mengen 

definiert. Nachdem wir uns inzwischen mit bijektiven Funktionen und 

Äquivalenzrelationen beschäftigt haben, können wir nun nicht nur den Begriff 

der Mächtigkeit von beliebigen Mengen definieren sondern auch noch 

einen bestimmten Typ von Zahlen, die sog. Kardinalzahlen. 

Definition A.1 

Zwei Mengen A und B heißen gleich mächtig, wenn es eine bijektive 

Funktion f ∈ A → B gibt. 

Ist A eine endliche Menge und B ⊂ A, dann gibt es natürlich keine bijektive 

Funktion von A nach B und folglich sind A und B erwartungsgemäß nicht 

gleich mächtig. 

Beispiel A.2 Es gibt keine injektive Funktion in der Menge 

{1, 2, 3} → {1, 2}. 

Jede Funktion aus dieser Menge muss zwangsläufig mindestens zwei 

Elementen aus der ersten Menge ein und das selbe Element aus der 

zweiten Menge zuweisen. 

Für unendliche Mengen gilt dies nicht: Z und N sind gleich mächtig obwohl 

N ⊂ Z. Eine bijektive Funktion f ∈ Z → N wurde in Beispiel 5.64 definiert. 

Diese Eigenschaft hat Richard Dedekind benutzt um die Eigenschaft 

“unendlich” einer Menge zu definieren. Wir müssen uns ab sofort also nicht 

mehr auf unsere intuitive Vorstellung von Unendlichkeit verlassen. 


Eine Menge A heißt unendlich, wenn es eine Menge B ⊂ A und eine 

injektive Funktion f ∈ A → B gibt. 

Die Mächtigkeit (oder Kardinalität) einer Menge wird nun nicht als “Zahl” 

sondern als die Menge aller gleich mächtigen Mengen definiert.



Gleichmächtigkeit ist eine Äquivalenzrelation auf der Menge aller 

Mengen. Wir schreiben 

A ≡ B 

genau dann wenn A und B gleich mächtig sind. Die Äquivalenzklasse 

bzgl. ≡ von A wird mit 

|A| 

bezeichnet und heißt Kardinalität von A. 

Beispiel A.5 Die Mengen N, Z, Q, usw. sind alle gleich mächtig. Daher 

gilt 

|N| = {N, Z, Q, . . .}. 

Beispiel A.6 N und Z sind gleich mächtig, daher gilt 

Andererseits gilt 

|N| = |Z|. 

|∅| = |{∅}|. 

Nachdem nun die Kardinalität einer Menge definiert ist, kann man sich 

darauf stützen und definieren was Zahlen sind. Anstatt also wie bisher unter 

Verwendung einer intuitiven Vorstellung von Zahlen zu definieren was die 

Mächtigkeit einer Menge ist, machen wir’s nun umgekehrt: Unter Verwendung 

der Kardinalität wird definiert was Zahlen sind. Für endliche Mengen 

ist der Begriff der Gleichmächtigkeit eng verwandt mit Zahlen. Zwei endliche 

Mengen sind gleich mächtig wenn sie die selbe Anzahl von Elementen haben. 

Die Zahlen 0, 1, 2, . . . sind somit nichts anderes als Namen für Äquivalenzklassen 

von ≡. 


Die Symbole 0, 1, 2, . . . sind definiert durch 

0 = |∅| 

1 = |{∅}| 

2 = | {∅}, ∅ | 

.


Somit ist z.B. 3 eine Menge (was auch sonst) und zwar die Menge aller 3elementigen 

Mengen oder anders ausgedrückt, die Äquivalenzklasse von 

bzgl. der Äquivalenzrelation ≡. 

 

∅, ∅ , ∅, {∅} 

Um auch die Mächtigkeit von unendlichen Mengen durch Zahlen beschreiben 

zu können, braucht man zusätzliche Zahlen, die nicht in N0 sind. 

Sind zwei Mengen gleich mächtig, sagt man sie haben die selbe Kardinalität 

oder die selbe Kardinalzahl. 


Die Kardinalzahl von N wird mit ℵ0 bezeichnet, d.h. 

|N| = ℵ0. 

Das Symbol ℵ ist der erste Buchstabe des hebräischen Alphabets und wird 

“Alef” gesprochen. Manche Dinge sind halt so kompliziert, dass selbst griechische 

Buchstaben ihrer nicht würdig sind. Für jede abzählbare Menge A 

gilt somit 

|A| = ℵ0. 

Damit ist ℵ0 ∈ N unsere erste “unendlich große” Zahl. 

Die ganzen Ordnungsrelationen auf Kardinalzahlen sind nun leicht zu definieren: 


Existiert eine injektive Funktion in A → B aber nicht in B → A, 

dann hat B eine höhere Kardinalität als A. Man schreibt dann 

|A| < |B|. 

Wie in Kapitel 5.12 gezeigt, ist R überabzählbar. Es gibt also keine injektive 

Funktion von R nach N (aber natürlich von N nach R). Somit hat R eine 

höhere Kardinalität als N, d.h. 

|N| < |R|. 

Es gibt also noch größere Kardinalzahlen als ℵ0. Tatsächlich kann man Mengen 

mit immer größerer Kardinalität konstruieren.



Für jede Menge A ist die Kardinalität von P(A) größer als die Kardinalität 

von A. 

Beweis. Sei A eine Menge. Angenommen es gibt eine bijektive Funktion 

Für jedes a ∈ A gilt entweder 

Sei X ⊆ A definiert durch 

f ∈ A → P(A). 

a ∈ f(a) oder a ∈ f(a). 

X = {a ∈ A | a ∈ f(a)} 

Da f surjektiv ist, gibt es ein x ∈ A so dass 

Ist nun x ∈ f(x) oder x ∈ f(x)? 

f(x) = X. 

• Angenommen x ∈ f(x). Dann ist x ∈ X. 

• Angenommen x ∈ f(x). Dann ist x ∈ X. 

Da f(x) = X, führen beide Möglichkeiten zum Widerspruch. Somit 

haben A und P(A) unterschiedliche Kardinalität. Andererseits ist A 

gleich mächtig wie 

{{a} | a ∈ A} ⊆ P(A) 

so dass P(A) größere Kardinalität als A hat. 

Es gibt also unendlich viele unendlich große Kardinalzahlen! Gibt es Mengen, 

die größere Kardinalität als N, aber kleinere Kardinalität als R haben, 

d.h. gibt es Kardinalzahlen zwischen |N| und |R|? Tatsächlich kann man aus 

den allgemein akzeptierten Axiomen der Mengentheorie nach Zermelo und 

Fraenkel keine solche Menge konstruieren. Andererseits führt aber auch die 

Annahme, dass es eine solche Menge gibt, nicht zu einem Widerspruch zu 

diesen Axiomen. 

Die nächst größere Kardinalzahl nach ℵ0 wird mit ℵ1 bezeichnet. Die Kontinuumshypothese 

besagt, dass 

|R| = ℵ1.


Die Aussage kann mit den Axiomen von Zermelo und Fraenkel weder widerlegt 

(Gödel 1938) noch bewiesen (Cohen 1963) werden. 

Die arithmetischen Rechenoperationen auf Kardinalzahlen kann man 

nun wie folgt definieren: 


Die Summe zweier Kardinalzahlen x und y ist definiert durch 

x + y = |A ∪ B| 

für beliebige, disjunkte Mengen mit A ∈ x und B ∈ y. 

Beispiel A.12 Um z.B. 2 + 3 zu berechnen, wählt man zwei disjunkte 

Mengen aus 2 und 3, also z.B. 

und erhält 

{1, 2} ∈ 2 

{5, 6, 7} ∈ 3 

2 + 3 = |{1, 2, 5, 6, 7}| 

= 5 

Die Addition von Kardinalzahlen ist zwar kommutativ und assoziativ aber 

man darf nicht kürzen: Es gilt 

aber 

Weiterhin gilt z.B. für alle n ∈ N0 

|N| + |R| = |∅| + |R| 

|N| = |∅|. 

ℵ0 + n = ℵ0. 


Multiplikation und Exponentiation von Kardinalzahlen sind definiert 

durch 

|A| · |B| = |A × B| 

|A| |B| = |A B | 

So ist z.B. ℵ0 + ℵ0 = ℵ0 und ℵ0 · ℵ0 = ℵ0.


B Axiomensysteme und Theorien 

Eine Theorie ist eine Menge Φ von geschlossenen Formeln, die abgeschlossen 

bzgl. logischen Schlussfolgerungen ist. Das heißt, wenn 

dann 

{G1, . . .,Gn} ∈ Φ und {G1, . . ., Gn} |= F 

F ∈ Φ. 

Folgende Eigenschaften von Theorien sind leicht zu zeigen: 

• Eine Theorie enthält alle gültigen Formeln. 

• Sobald eine Theorie eine unerfüllbare Formel enthält, enthält sie alle 

Formeln. Man spricht dann von einer entarteten Theorie. 

Grundsätzlich gibt es zwei Ansätze, Theorien zu erzeugen. 

Modellbasierte Methode. Ausgehend von einer Interpretation I erhält 

man eine Theorie dadurch, dass man alle Formeln betrachtet, die in 

der Interpretation wahr sind, d.h. 

Φ = {F | |=I F }. 

Axiomatische Methode. Ausgehend von einer Menge ˆ Φ von Formeln erhält 

man eine Theorie dadurch, dass man alle Formeln betrachtet, die logisch 

aus ˆ Φ folgen, d.h. 

Φ = {F | ˆ Φ |= F }. 

B.1 Modellbasierte Theorien 

Eine algebraische Struktur ist ein Tupel bestehend aus einer Menge, ausgezeichneten 

Elementen dieser Menge sowie Funktionen und Relationen auf 

dieser Menge, z.B. 

(N0, 0, s, +, ×, =) 

wobei s ∈ N0 → N0 die Nachfolgerfunktion ist. Eine algebraische Struktur 

beinhaltet somit alles, was man für die Interpretation von Formeln braucht. 

Ein paar Beispiele von Formeln, die in dieser Interpretation wahr sind: 

∀x ∀y ¬(x = y) → ¬(s(x) = s(y)) 

∀x ∃y ∃z x + z = y 

∀x ∃y ∃z x = y + z


Die Menge aller geschlossenen Formeln, die in dieser Interpretation wahr 

sind, heißt modellbasierte Theorie der algebraischen Struktur. Es ist leicht 

zu zeigen, dass modellbasierte Theorien tatsächlich Theorien sind, d.h. abgeschlossen 

sind unter logischer Schlussfolgerung. 

Modellbasierte Theorien haben eine nette Eigenschaft: sie sind immer 

vollständig. Ist Φ eine modellbasierte Theorie und F eine geschlossene Formel, 

dann ist entweder F ∈ Φ oder ¬F ∈ Φ. Dies folgt direkt aus Theorem 

7.17. 

Schön wär’s, wenn man ein Programm hätte, das einem von jeder Formel 

entscheiden könnte, ob sie in der modellbasierten Theorie von (N0, 0, s, +, ×, = 

) ist oder nicht — dann könnte man nämlich ungelöste Probleme wie z.B. 

die Goldbachsche Vermutung maschinell lösen lassen! Leider ist dies aber 

unmöglich... 

B.2 Axiomatische Theorien 

Sei ˆ Φ eine Menge von Formeln. Mit ˆ Φ |= wird die Menge aller Formeln 

bezeichnet, die logisch aus ˆ Φ folgen. Diese Menge nennt man axiomatische 

Theorie von ˆ Φ. 

Beispiel B.1 Insbesondere ist z.B. ∅ |=, d.h. die axiomatische Theorie 

der leeren Menge, die Menge aller gültigen Formeln. 

Offensichtlich ist die axiomatische Theorie von ˆ Φ eine Theorie, d.h. abgeschlossen 

unter logischer Schlussfolgerung. 

Ist Φ eine Theorie so dass 

Φ = ˆ Φ |= 

dann heißt ˆ Φ Axiomensystem von Φ. Von einem Axiomensystem wird immer 

gefordert, dass es entscheidbar ist. Existiert eine (endliche) Menge ˆ Φ mit 

Φ = ˆ Φ |= 

dann heißt Φ (endlich) axiomatisierbar. 

Beispiel B.2 Ein Beispiel ist die axiomatische Theorie der Gruppen. 

Die verwendete Sprache enthält ein zweistelliges Funktionssymbol ◦, 

ein Konstantensymbol e sowie ein zweistelliges Relationssymbol =, das


durch Gleichheit interpretiert wird. Das Axiomensystem ˆ Φ besteht aus 

drei Formeln: 

∀x ∀y ∀z (x ◦ y) ◦ z = x ◦ (y ◦ z) 

∀x x ◦ e = x 

∀x∃y x ◦ y = e. 

Die axiomatische Theorie von ˆ Φ enthält genau die Formeln, die in jeder 

Gruppe wahr sind. 

Die axiomatische Theorie der leeren Menge ist die Menge aller gültigen Formeln. 

Die Menge aller gültigen Formeln ist somit endlich axiomatisierbar. 

Es stellen sich nun folgende Fragen. 

• Welche axiomatischen Theorien sind entscheidbar? Die Menge aller 

gültigen Formeln ist zwar endlich axiomatisierbar aber nicht entscheidbar. 

• Welche modellbasierten Theorien sind axiomatisierbar, welche sogar 

entscheidbar? So ist z.B. die modellbasierte Theorie Φ von (N0, +, ×) 

weder axiomatisierbar noch entscheidbar. Jeder Versuch eines Axiomensystems 

ˆ Φ für diese Theorie (z.B. die Peano Arithmetik) führt somit 

auf eine unvollständige Theorie, d.h. 

|= ˆ Φ ⊂ Φ. 

Dies ist der berühmte Gödelsche Unvollständigkkeitssatz. Andererseits 

hat Tarski später bewiesen, dass die Theorie von (R, +, ×) entscheidbar 

ist. 

Besonders angenehm sind vollständige und axiomatisierbare Theorien. Diese 

sind nämlich immer entscheidbar. Für eine geschlossene Formel kann man 

nämlich ausgehend von den Axiomen systematisch alle Theoreme erzeugen 

und ist aufgrund der Vollständigkeit sicher, dass man irgendwann entweder 

F oder ¬F erhält.


C Zermelo-Fraenkel Set Theory 

Wie in Kapitel 2.4 gezeigt, führt die ursprüngliche Definition des Mengenbegriffs 

zu Widersprüchen. Schuld daran ist die uneingeschränkte Anwendung 

des Comprehension Principles, dass zu jeder Eigenschaft E(x) eine Menge 

existiert, die aus genau den Objekten x besteht, für die E(x) wahr ist. Aus 

der Eigenschaft 

E(x): x ist eine Menge, die nicht Element von sich selbst ist 

konnte somit die Menge 

R = {x | x ist Menge ∧ x ∈ x} 

konstruiert werden. Durch ein Widerspruchsargument kann man zeigen, dass 

weder R ∈ R noch R ∈ R wahr ist. Es ist jedoch unmöglich, dass eine 

Aussage und ihre Negation gleichzeitig falsch sind. 

Man muss also bei der Definition des Begriffs Menge etwas vorsichtiger 

sein. Anstatt wie Cantor anschaulich zu beschreiben was eine Menge ist, formuliert 

man die Spielregeln nach denen Mengen konstruiert werden dürfen. 

Die Kunst besteht darin, mit möglichst wenigen, einfachen Regeln auszukommen. 

Hierfür bietet sich die Sprache der Logik an. Man spricht dann von den 

Axiomen der Mengenlehre. Jede wahre Aussage über Mengen muss somit logisch 

aus den Axiomen folgen. Der Vorteil bei dieser Vorgehensweise ist, dass 

man keine intuitiven Begriffe verwenden muss wie in der Cantor’schen Definition. 

Dies ist aber auch genau der Nachteil, weil die so definierten Mengen 

intuitiv nur noch sehr schwer vorstellbar sind. 

Es gibt unterschiedliche Axiomatisierungen der Mengenlehre. Am verbreitetsten 

sind die Axiome von Zermelo und Fraenkel (ZF). 1 Manchmal 

nimmt man noch ein zusätzliches Axiom dazu, das Axiom of choice. Das 

erweiterte System nennt man ZFC. 

Nachfolgende werden die Axiome von ZFC wiedergegeben. Man weiß 

nicht, ob diese Axiome konsistent sind — im Prinzip kann’s also passieren 

dass wieder ein Russel kommt und einen Widerspruch aus ihnen herleitet. Die 

meisten Mathematiker glauben aber, dass die Axiome widerspruchsfrei sind. 

Mehr als hoffen kann man dies auch nicht, denn aus dem zweiten Gödelschen 

Unvollständigkeitssatz folgt, dass man deren Widerspruchsfreiheit gar nicht 

beweisen kann, jedenfalls nicht mit der Maschinerie der Mengenlehre. 

1 Die Axiome sind das Ergebnis der Arbeit von Thoralf Skolem aus dem Jahr 1922. Sie 

basieren auf der Arbeit von Adolf Fraenkel aus dem selben Jahr und einem Axiomensystem 

von Ernst Zermelo aus dem Jahr 1908.


In der Zermelo-Fraenkel Mengentheorie sind alle Objekte Mengen. Die in 

den Axiomen vorkommenden Variablen beziehen sich also immer auf Mengen. 

Die Tatsache, dass manche Variablen groß und andere klein geschrieben sind, 

dient also nur der Lesbarkeit und hat keine Bedeutung. 

• Axiom of empty set. Dieses Axiom drückt aus, dass es eine leere 

Menge ∅ gibt, d.h. eine Menge, die keine Elemente hat. Die Formel ist 

∃A ∀x ¬(x ∈ A). 

• Axiom of extensionality. Dieses Axiom besagt, dass zwei Mengen 

genau dann gleich sind, wenn sie die selben Elemente haben. Anders 

ausgedrückt bedeutet dies, dass eine Menge eindeutig durch ihre Elemente 

bestimmt ist und es keine zwei unterschiedlichen Mengen mit 

den selben Elementen geben kann. Die Formel ist 

∀A ∀B A = B ↔ (∀x x ∈ A ↔ x ∈ B). 

Aus dem Axiom of extensionality folgt u.a., dass es nur eine einzige 

leere Menge gibt. 

• Axiom of pairing. Dieses Axiom besagt, dass es zu je zwei Objekten 

x und y immer eine Menge A = {x, y} gibt, die genau x und y als 

Element enthält. Die Formel ist 

∀x ∀y ∃A ∀z z ∈ A ↔ (z = x ∨ z = y). 

Zusammen mit dem Axiom of union kann man die Verallgemeinerung 

herleiten, dass es zu n Objekten x1, x2, . . .,xn immer eine Menge A = 

{x1, x2, . . .,xn} gibt: 

∀x1 ∀x2 . . . ∀xn ∃A ∀y y ∈ A ↔ (y = x1 ∨ y = x2 ∨ . . . ∨ y = xn). 

• Axiom of union. Salopp ausgedrückt besagt dieses Axiom, dass man 

Mengen flachbügeln kann. Enthält eine Menge A ihrerseits Mengen, 

dann gibt es eine Menge B, die genau die Elemente der Elemente von 

A enthält. Hat man z.B. die Menge 

{1, 2}, {4}, {2, 5} , 

dann kann folgt aus dem Axiom of union, dass auch 

{1, 2, 4, 5}


eine Menge ist. Die Formel ist 

∀A ∃B ∀x x ∈ B ↔ (∃a x ∈ a ∧ a ∈ A). 

Zusammen mit dem Axiom of pairing kann man hieraus herleiten, dass 

zu je zwei Mengen ihre Vereinigungsmenge existiert. 

• Axiom of power set. Dieses Axiom besagt, dass zu jeder Menge A 

ihre Potenzmenge P(A) existiert. Unter Verwendung des Potenzmengenoperators 

würde man dies so formulieren: 

∀A ∃B B = P(A). 

Den Potenzmengenoperator hat man natürlich an dieser Stelle noch 

nicht zur Verfügung – das Axiom soll ja gerade ausdrücken dass er 

existiert. Man muss also die Definition von P(A) als Menge aller Teilmengen 

C von A einsetzen: 

∀A ∃B ∀C C ∈ B ↔ C ⊆ A. 

Auch das Teilmengensymbol in C ⊆ A lässt sich noch wie folgt eliminieren: 

∀A ∃B ∀C C ∈ B ↔ (∀x x ∈ C → x ∈ A). 

• Axiom of infinity. In der ZFC Mengentheorie werden Zahlen 0, 1, 2, . . . 

wie folgt durch Mengen definiert: 

0 = ∅ 

1 = 0 ∪ {0} 

= ∅ ∪ {∅} 

= {∅} 

= {0} 

2 = 1 ∪ {1} 

= {0} ∪ {1} 

= {0, 1} 

3 = 2 ∪ {2} 

= {0, 1, 2} 

.


(Im Gegensatz zu den Kardinalzahlen werden auf diese Weise nur endlich 

große Zahlen definiert.) Allgemein ist also 

n + 1 = n ∪ {n} = {0, 1, 2, . . ., n}. 

Mit den bisherigen Axiomen kann man somit beliebige endliche Teilmengen 

von N0 konstruieren, nicht aber z.B. die Menge N0 selbst. Das 

Axiom of infinity erlaubt die Konstrukton von N0 auf induktive Weise: 

Es besagt, dass es eine Menge A gibt, die 0 enthält und für jedes 

Element x auch sein Nachfolger x ∪ {x}. Die Formel ist 

∃A ∅ ∈ A ∧ ∀x x ∈ A → (x ∪ {x}) ∈ A 

• Axiom schema of replacement. Mit diesen Axiomen wird ausgedrückt, 

dass wenn f eine Funktion und A eine Menge ist, dann auch 

{f(x) | x ∈ A} 

eine Menge ist. Ein erster Versuch, dies formal auszudrücken ist 

∀A ∃B B = {f(x) | x ∈ A}. 

Der nächste Schritt ist, den Ausdruck mit den Mengenklammern zu eliminieren, 

da man ja das Comprehension Principle nicht zur Verfügung 

hat: 

∀A ∃B ∀y y ∈ B ↔ (∃x x ∈ A ∧ y = f(x)). 

Eine Funktion ist nichts anderes als eine Formel R(x, y) mit freien 

Variablen x und y und der Eigenschaft 

∀x ∃!y R(x, y). 

Man erhält damit das Axiom 

 

∀x ∃!y R(x, y) → ∀A ∃B ∀y y ∈ B ↔ ∃x x ∈ A ∧ R(x, y) 

. 

Dieses Axiom muss für jede Formel R(x, y) mit freien Variablen x, y 

aufgenommen werden. Es handelt sich also nicht um ein einzelnes Axiom 

sondern um ein ganzes Axiomenschema. 

• Axiom of regularity. Dieses Axiom besagt, dass jede nichtleere Menge 

A ein Element x hat, so dass A und x disjunkt sind. Die Formel 

ist 

∀A A = ∅ → ∃x (x ∈ A ∧ x ∩ A = ∅).


Setzt man die Definition von ∩ ein, erhält man 

∀A A = ∅ → ∃x x ∈ A ∧ ¬(∃y y ∈ x ∧ y ∈ A) . 

Aus diesem Axiom folgt u.a., dass keine Menge sich selbst als Element 

enthalten kann. 

Beweis. Angenommen a ist eine Menge, die sich selbst enthält, d.h. 

a ∈ a. 

Aus dem Axiom of pairing folgt, dass dann auch 

A = {a, a} = {a} 

eine Menge ist. Diese Menge hat nur ein einziges Element, nämlich 

a und nach dem Axiom of regularity muss a und A disjunkt sein. 

Da aber 

a ∈ a und a ∈ A, 

haben sie das gemeinsame Element a und sind somit nicht disjunkt. 

Damit ist die Russelsche Antinome ausgeschlossen. Es gibt auch keine 

Menge aller Mengen mehr. 

Aus dem Axiom of regularity folgt außerdem, dass es keine unendliche 

Kette Ai von Mengen gibt mit 

. . . ∈ A3 ∈ A2 ∈ A1. 

Daher wird das Axiom auch Axiom of foundation genannt. 

Beweis. Angenommen es gibt eine unendliche Kette . . . ∈ A3 ∈ A2 ∈ 

A1. Sei f eine Funktion, die jeder natürlichen Zahl n die Menge 

An zuweist. Aus dem Axiom of replacement folgt, dass 

B = {f(n) | n ∈ N} 

eine Menge ist. Aus dem Axiom of regularity folgt, dass es ein 

k ∈ N geben muss, so dass B ∩ f(k) = ∅. Laut Konstruktion ist 

jedoch f(k + 1) ∈ f(k) und f(k + 1) ∈ B, also ist B ∩ f(k) = ∅. 

Zusammen mit dem Axiom of choice (s.u.) kann man auch die Umkehrung 

zeigen: Wenn das Axiom of regularity nicht gilt, dann gibt es auch 

eine unendliche Element-von Kette.


Beweis. Sei A ein Gegenbeispiel zum Axiom of regularity, d.h. A ist 

eine Menge und für jedes Element x ∈ A ist x ∩ A = ∅. Sei g 

eine Auswahlfunktion für A, d.h. g(B) ∈ B für jede nichtleere 

Teilmenge B ⊆ A. Die Funktion f wird nun auf N definiert durch 

f(1) = g(A) 

f(n + 1) = g f(n) ∩ A . 

Damit ist f(n) ∈ A für alle n ∈ N. Aus unseren Annahmen über A 

folgt dass f(n) ∩A = ∅ und damit ist f(n+1) definiert. Aufgrund 

der Eigenschaft von g ist 

und damit 

f(n + 1) ∈ f(n) ∩ A 

f(n + 1) ∈ f(n). 

Damit hat man eine unendliche Kette 

. . . ∈ f(3) ∈ f(2) ∈ f(1). 

• Axiom of choice. Lange Zeit war nicht klar, ob das Axiom of choice 

überhaupt gebraucht wird, oder ob es bereits aus den anderen Axiomen 

folgt. In der Tat klingt das Axiom of choice so selbstverständlich, dass 

es für viele überraschend war als Gödel und Cohen seine Unabhängigkeit 

von den anderen Axiomen bewiesen. Das Axiom of choice sagt, 

dass wenn man eine Menge von Mengen hat, man aus jeder Menge ein 

Element auswählen kann. Etwas formeller wird dies wie folgt formuliert: 

Für jede Menge A existiert eine Funktion f, so dass f(x) ∈ x 

für alle x ∈ A. 

Da man in der Logik erster Stufe nicht über Funktionen quantifizieren 

darf, wird folgende, äquivalente Formulierung benutzt: 

Zu jeder Menge A von disjunkten nichtleeren Mengen B existiert 

eine Menge X, die genau eine Element von jeder Menge 

B enthält. 

Die Formel hierzu ist 

∀A (∀B ∈ A B = ∅) ∧ (∀B ∈ A ∀C ∈ A B = C → B ∩ C = ∅) 

→ ∃X (∀x ∈ X ∃B ∈ A x ∈ B) ∧ (∀B ∈ A ∃!x ∈ X x ∈ B)


Natürlich kann man in der Formel die relativierten Quantoren und den 

∃! Quantor duch normale Quantoren ersetzen. Das Axiom of choice 

besagt, dass es zu jeder Menge eine Auswahlfunktion gibt, es gibt aber 

keine Hinweis darauf wie diese Funktion definiert ist. 

Dass eine solche Auswahlfunktion durchaus trickreich sein kann, 

erkennt man wenn man die Menge A = P(R) anschaut. Die naheliegende 

Option, dass man aus jeder Teilmenge von R z.B. das kleinste 

Element auswählt funktioniert nicht, da es Teilmengen von R gibt, die 

kein kleinstes Element haben, z.B. 

{x | x ∈ R ∧ x > 0}. 

Das Axiom of choice ist bei vielen Mathematikern unbeliebt, weil seine 

Verwendung zu nicht konstruktiven Beweisen führt. Solche Beweise garantieren 

zwar die Existenz bestimmter Objekte, verraten jedoch nicht 

wie diese definiert sind oder konstruiert werden können. Obwohl sie logisch 

unanfechtbar sind, haben sie eben nicht die selbe Überzeugungskraft 

wie konstruktive Beweise. Leider kommt man in außerordentlich 

vielen Bereichen der Mathematik nicht ohne das Axiom of choice aus. 

Beispiele sind Beweise folgender Theoreme: 

– Die Vereinigungsmenge von abzählbar vielen abzählbaren Mengen 

ist abzählbar. 

– Es gibt eine injektive Funktion von N in jede unendliche Menge. 

– Wenn A unendlich ist, dann haben A und A ×A gleiche Kardinalität. 

– Je zwei Mengen haben entweder gleiche Kardinalität oder eine hat 

kleinere Kardinalität als die andere. 

– Jeder Vektorraum hat eine Basis. 

Aus den ZFC Axiomen kann man das Comprehension Principle in einer abgeschwächten 

Form ableiten, das sog. Separation Principle: Ist A eine Menge 

und F(x) eine Formel mit freier Variablen x, dann existiert eine Menge 

{x | x ∈ A ∧ F(x)}. 

Ausgehend von einer Menge A kann man nun versuchen eine Russelartige 

Menge RA zu konstruieren durch 

RA = {x | x ∈ A ∧ x ∈ x}.


• Angenommen RA ∈ RA. Dann ist RA ∈ A und RA ∈ RA. Dies ist ein 

Widerspruch. 

• Angenommen RA ∈ RA. Dann ist RA ∈ A oder RA ∈ RA. Folglich ist 

RA ∈ A. Ein Widerspruch lässt sich hieraus jedoch nicht ableiten. 

In der Tat folgt bereits aus dem Axiom of regularity, dass es keine Menge 

gibt, die sich selbst enthält. 

C.1 Zorn’s Lemma 

Das Axiom of choice ist äquivalent zu Zorn’s Lemma. Hierzu muss zunächst 

der Begriff einer Kette, einer geschlossenen Menge und eines maximalen Elements 

erklärt werden. Eine Kette in einer Menge A ist eine (endliche oder 

unendliche) Folge a1, a2, . . . von Mengen mit ai ⊆ A und ai ⊆ ai+1 für alle i. 

Eine Menge A heißt geschlossen, wenn für jede ihrer Ketten a1, a2, . . . auch 

a1 ∪ a2 ∪ . . . ∈ A 

ist. Ein Element x ∈ A heißt maximales Element von A, wenn x ⊆ a für alle 

a ∈ A. 

Theorem C.1 (Zorn’s Lemma) 

Jede geschlossene Menge hat ein maximales Element. 

Beweis. Siehe [22]. 

C.2 Wohlordnungsprinzip 

Auch das Wohlordnungsprinzip ist äquivalent zum Axiom of choice: 

Theorem C.2 (Wohlordnungsprinzip.) 

Zu jeder Menge A gibt es eine Relation R, so dass R Wohlordnung 

auf A ist. 

Das Wohlordnungsprinzip ist deshalb so wichtig, weil man damit das Prinzip 

der Induktion auf beliebige Mengen erweitern kann. Das Wohlordnungsprinzip 

ist eigentlich sehr überraschend – so gibt es z.B. auch eine Wohlordnung 

auf der Menge 

{x | x ∈ R ∧ x > 0 ∧ x < 1}


obwohl diese Menge weder ein größtes noch ein kleinstes Element hat. Dass 

Axiom of choice, Zorn’s Lemma und Wohlordnungsprinzip zwar logisch äquivalent 

aber dennoch so unterschiedlich intuitiv sind, hat zu folgendem Witz 

geführt: 

The Axiom of choice is obviously true, the well-ordering principle 

is obviously false, and who can tell about Zorn’s Lemma? 

Jerry Bona


D Neuman-Bernays-Gödel Set Theory 

Eine andere Lösung um die Mengenlehre von Widersprüchen zu befreien, 

wurde in den 1920er Jahren von John von Neuman vorgeschlagen und später 

von Paul Bernays und Kurt Gödel weiterentwickelt. Wie ZFC besteht auch 

sie aus Axiomen, die als NGB bezeichnet werden. Im Gegensatz zu ZFC sind 

es sogar nur endlich viele Axiome. 

Was Cantor intuitiv als Zusammenfassung von Objekten bezeichnet hat, 

heißt in NBG Klasse. 2 Der Begriff Menge wird für spezielle Klassen verwendet, 

die ihrerseits Elemente von Klassen sind. Die Aussage “A ist eine Menge” 

bedeutet somit, dass es eine Klasse B gibt mit A ∈ B. Klassen, die keine 

Mengen sind heißen echte Klassen. Somit ist jede Menge eine Klasse, aber 

nicht jede Klasse ist eine Menge. 

Das Comprehension Principle, das besagt dass zu jeder Eigenschaft E 

eine Menge 


existiert, wird nun eingeschränkt indem man verlangt, dass es sich bei den 

Objekten x um Mengen handeln muss. Es gibt also nur noch die Klasse 

nicht aber die Klasse 

{x | x ist Menge und x erfüllt E}, 

{x | x ist Klasse und x erfüllt E}. 

Auf diese Weise kann man natürlich wieder eine Russel’sche Klasse 

R = {x | x ist Menge und x ∈ x } 

konstruieren. Aus der ursprünglichen Russel’schen Antinomie folgt, dass R 

keine Menge sondern eine echte Klasse ist. Es gilt somit R ∈ R. 

Ein anderes Beispiel einer echten Klasse ist die Klasse aller Mengen 

M = {x | x ist Menge }. 

Aus den übrigen Axiomen von NBG folgt, dass 

R = M, 

d.h. es gibt keine Menge, die sich selbst enthält. Nach NBG gibt es somit 

die (echte) Klasse aller Mengen. ZFC hat nichts dergleichen zu bieten, insbesondere 

gibt es dort keine Menge aller Mengen. Was ihre Konsistenz angeht, 

stehen und fallen NBG und ZFC jedoch gemeinsam: Sollte es gelingen die 

Widersprüchlichkeit eines der beiden Systeme zu zeigen, würde daraus auch 

die Widersprüchlichkeit des anderen folgen. 

2 Hier kommt auch der Begriff Klasse in objektorientierten Programmiersprachen her.

E Literaturverzeichnis 

Literatur 

[1] Peter B. Andrews. An introduction to mathematical logic and type theory: 

to truth through proof. Kluwer Academic Publishers, 2002. 

[2] Christoph Beierle and Gabriele Kern-Isberner. Methoden wissensbasierter 

Systeme. Vieweg, 2006. 

[3] Bruno Buchberger and Franz Lichtenberger. Mathematik für Informatiker 

1. Springer, 1981. 

[4] Peter J. Cameron. Sets, Logic and Categories. Springer, 2002. 

[5] Gregory J. Chaitin. Conversations with a Mathematician. Springer, 

2003. 

[6] Chin-Liang Chang and Richard Char-Tung Lee. Symbolic logic and mechanical 

theorem proving. Academic Press, 1973. 

[7] J.N. Crossley, C.J. Ash, C.J. Brickhill, J.C. Stillwell, and N.H. Williams. 

What is Mathematical Logic? Dover Publications, 1990. 

[8] Gottlob Frege. Begriffsschrift, eine der arithmetischen nachgebildete 

formelsprache des reinen denkens. Halle, 1879. 

[9] Michael R. Genesereth and Nils J. Nilsson. Logische Grundlagen der 

Künstlichen Intelligenz. Vieweg, 1989. 

[10] Henry Hamburger and Dana Richards. Logic and language models for 

computer science. Prentice Hall, 2002. 

[11] John Haugeland. Artificial Intelligence: The Very Idea. MIT Press, 

1985. 

[12] John Haugeland. Künstliche Intelligenz - Programmierte Vernunft? 

McGraw-Hill, 1987. 

[13] J. P. E. Hodgson. Knowledge representation and language in AI. Ellis 

Horwood Limited, 1991. 

[14] Douglas R. Hofstadter. Gödel, Escher, Bach: Ein endlos geflochtenes 

Band. Klett-Cotta, 1985. 

162

[15] D. L. Johson. Elements of Logic via Numbers and Sets. Springer, 2001. 

[16] Uwe Lämmel and Jürgen Cleve. Künstliche Intelligenz. Fachbuchverlag 

Leipzig, 2001. 

[17] George F. Luger. Künstliche Intelligenz. Addison-Wesley, 2001. 

[18] David Poole, Alan Mackworth, and Randy Goebel. Computational intelligence, 

a logical approach. Oxford University Press, 1998. 

[19] Stuart Russell and Peter Norvig. Artificial Intelligence. Prentice Hall, 

1995. 

[20] Uwe Schöning. Logik für Informatiker. Spektrum, 2000. 

[21] A. M. Turing. Computing machinery and intelligence. Journal of the 

Mind Association, LIX(236):433–460, 1950. 

[22] B.L. van der Waerden. Algebra. Springer, 1991. 

[23] Whitehead and Russel. Principia Mathematica. Cambridge University 

Press, 1925. 

163

Logik und Künstliche Intelligenz - Hochschule Heilbronn

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?