Kurzer roter Faden zu Lineare Algebra I& II

Kurzer roter Faden zu Lineare Algebra I& II 

1 Grundbegriffe 

Kein Ersatz für die Vorlesung oder ein gründliches Buch 

1.1 Axiomatische Methode 

F. Knüppel ∗ 

Wahr im mathematischen Sinn sind Aussagen, die sich aus Axiomen (d.h. Aussagen, 

die ausdrücklich als wahr vorausgesetzt werden) nur unter Benutzung logischer Gesetze 

(logischer Axiome) folgern (= zeigen, beweisen, herleiten) lassen. Axiome und Definitio- 

nen präzisieren die mathematische Formulierung einer intuitiven Vorstellung von einem 

Objekt. 

Grundsätzlich wird die Wahrheit einer mathematischen Aussage nicht durch Experimente 

wie in der Physik überprüft, sondern durch logisches Schließen. 

Vorteile des Zurückgehens auf (möglichst wenige) Axiome sind Ökonomie, Durchsichtig- 

keit und Objektivität. 

Die Forderung, alle Voraussetzungen genau hinzuschreiben und beim Folgern nur diese 

Voraussetzungen zu benutzen (selbst zusätzliche Annahmen, die viele Menschen als 

selbstverständlich zutreffend ansehen, dürfen nicht stillschweigend verwendet werden!) ist 

heute der übliche Standard. Das war zum Beispiel in der Geometrie nicht immer üblich. 

Deshalb gilt David Hilberts Buch ’Grundlagen der Geometrie’ (erschienen im Jahr 1900; 

erstmals wird in diesem Werk eine lückenlose axiomatische Beschreibung der ’euklidischen 

Ebene’ aus geometrischen Begriffen geliefert) als Meilenstein: hier wird die Forderung, 

nur vereinbarte Axiome zu benutzen, konsequent angewendet. 

Wir können in der Vorlesung nicht alle Aussagen (Sätze, Theoreme) aus wenigen grund- 

legenden Axiomen herleiten. Zum Beispiel setzen wir Kenntnis der ganzrationalen Zahlen 

∗ Bitte lassen Sie mich Fehler und Verbesserungsvorschläge wissen. Frau Jana Fürchtenicht und Herrn 

Justus Berger verdanke ich viele Hinweise auf Ungereimtheiten, die bereits verbessert sind. 

1

1 GRUNDBEGRIFFE 2 

und auch einiger Sätze über die reellen Zahlen als bekannt voraus. In der Praxis vergißt 

man oft recht schnell die axiomatische Begründung eines mathematischen Gegenstands 

und benutzt hauptsächlich Eigenschaften, die nicht so grundlegend wie die Axiome sind, 

sondern durch oft sehr raffinierte Überlegungen aus den Axiomen bewiesen werden. Wir 

vertrauen also darauf, dass kompetente Leute diese Eigenschaften wirklich lückenlos aus 

den Definitionen hergeleitet haben. 

Jetzt folgt eine naive Gebrauchsanweisung für den Umgang mit Aussagen und Mengen, die 

jeder Mathematiker benutzt. Man soll das Folgende also verstehen und dann vergessen, 

aber immer richtig benutzen. Eine fundierte Grundlegung der Mengenlehre ist in einer 

Anfängervorlesung nicht angebracht. Wir benutzen nur zweckmäßige übliche Schreibweisen 

und Begriffe. 

1.2 Aussagen 

Wir brauchen keinen exakten Aufbau der Aussagenlogik. Eine Aussage ist für uns ein 

undefinierter Grundbegriff. 

Weiter setzen wir voraus: Eine Aussage hat genau einen der ’Wahrheitswerte’ wahr, 

falsch (tertium non datur, eine dritte Möglichkeit gibt es nicht). Diese Annahme verbietet 

insbesondere Aussagen, welche wahr und falsch sind (widersprüchliche Aussagen). 

Beispiele 

(1) Jede Zahl a ∈ N (Menge der natürlichen Zahlen 1, 2, 3... ) mit a ≤ 5 ist eine Primzahl. 

(2) Eine Bewegung der euklidischen Ebene, die zwei verschiedene Punkte fest läßt, ist 

eine Geradenspiegelung oder die Identität. 

(3) Jede gerade natürliche Zahl a mit a ≥ 6 ist Summe von zwei ungeraden Primzahlen. 

Aussage (1) ist falsch, (2) ist wahr; ob Aussage (3) wahr oder falsch ist, ist nicht bekannt 

(Goldbachsche Vermutung). Zum Beispiel gilt 6 = 3 + 3; 8 = 5 + 3; 10 = 5 + 5; 12 = 7 + 5. 

Keine Aussagen sind: ( 27+9 ); ( Ist es sieben Uhr? ); ( a ist nicht rational ); ( Der 

Barbier von Sevilla frisiert genau die Einwohner Sevillas, die sich nicht selbst frisieren ). 

Schreiben Sie solche Texte nie in Bearbeitungen der Übungsaufgaben! 

Bemerkung: In mathematischen Texten ist mit ’oder’ immer nicht ausschließendes ’oder’ 

gemeint; ansonsten muß man ’entweder oder’ sagen.


1.2.1 Konstruktion weiterer Aussagen aus vorhandenen 

Seien A, B Aussagen. Wir bilden (zunächst rein formal) zwei neue Aussagen: 

A oder B; Symbol: A ∨ B . Die Aussage A ∨ B ist wahr, wenn mindestens eine der 

Aussagen A, B wahr ist; sonst fasch. 

Die Aussage: nicht A; Symbol: ¬A. Wenn A wahr ist, so ist ¬A falsch. Wenn A falsch 

ist, so ist ¬A wahr. 

Die folgenden Konstruktionen neuer Aussagen aus vorhandenen stützen sich auf (oder) 

und (nicht). 

A und B; Symbol: A ∧ B 

(A und B) definieren wir als die Aussage: nicht[(nicht A) oder (nicht B)]. 

D.h. (A und B) ist nur eine Abkürzung für diese Aussage. Symbol: A ∧ B := 

¬ ((¬A) ∨ (¬B)) Die Aussage: (B oder ¬A) kürzt man ab durch: A impliziert B. man 

sagt dafür auch: Aus A folgt B. Weitere Redeweisen: A ist hinreichend für B; B ist 

notwendig für A. Symbol: A ⇒ B. 

Für die Aussage [(A ⇒ B) und (B ⇒ A)] schreibt man A ⇔ B und sagt: A ist äquivalent 

(gleichwertig) zu B. Auch: A ist notwendig und hinreichend zu B. Auch: A gilt dann und 

nur dann, wenn B gilt. 

Da die oben eingeführten Aussagen ”und” sowie ”⇒” sich nur auf ”nicht” und ”oder” 

stützen, ist der Wahrheitswert (d.h. wahr oder falsch) dieser Aussagen durch die Wahr- 

heitswerte von A und B festgelegt. 

Wahre Sätze, die sich allein aus diesen logischen Regeln beweisen lassen, heißen Tautolo- 

gien. 

1.2.2 Satz (Prinzip der Fallunterscheidung) 

Seien A, B, C Aussagen. Die Aussagen (A oder B), (A ⇒ C), (B ⇒ C) seien wahr. Dann 

ist C wahr. 

1.2.3 Prinzip des Widerspruchsbeweis 

Sei A eine Aussage. Wenn aus der Voraussetzung (A ist falsch) folgt, daß es eine Aussage 

B gibt, die wahr und falsch ist (ein ”Widerspruch”), so ist A wahr. 

(¬A ⇒ (B ∧ ¬B)) ⇒ A 

Denn wenn man die Aussage A ist falsch zu den wahren Aussagen hinzufügt, und in


dieser Mathematik eine Aussage B vorkommt, die wahr und falsch ist, wird das Tertium 

non datur in dieser Mathematik verletzt. Also darf (A ist falsch) nicht unter den wahren 

Aussagen vorkommen. 

1.2.4 Redeweisen 

Anstelle von ”Aussage A ist wahr” sagt man oft ”A gilt”, oder ”A ist erfüllt”. Statt ”Ich 

zeige, daß A ⇒ B wahr ist” sagt man zum Beispiel ”Ich zeige A ⇒ B”. 

Eine wahre Aussage bezeichnen wir als Satz (oder Theorem oder Lemma). Um ernsthafte 

mathematische Sätze zu beweisen, braucht man natürlich Voraussetzungen, d.h. Aussagen, 

die als wahr vorausgesetzt werden. 

1.2.5 Beispiele für Widerspruchsbeweise. 

Satz 1 Es gibt unendlich viele Primzahlen. 

Beweis. Die Aussage ’Es gibt unendlich viele Primzahlen’ bezeichnen wir mit A. Wir wollen 

zeigen, daß A wahr ist. 

Annahme: A ist falsch. 

Dann gibt es nur endlich viele Primzahlen, dies seien 2, 3, 5, . . . , p (p die größte Primzahl). 

Setze q := 2 · 3 · 5 · · · · · p + 1. Wegen q = 1 gibt es eine Primzahl c, die q teilt. Da c unter 

den Primzahlen 2, 3, . . . , p vorkommt, teilt c das Produkt 2 · 3 · 5 · · · · · p. Folglich teilt c 

auch q − 2 · 2 · 3 · 5 · · · · · p = 1. Diese Aussage ist falsch. 

Also ist A wahr. 

(Wir haben den Satz verwendet: Es gibt keine Primzahl, die 1 teilt.) 

Satz 2 Die Zahl √ 2 ist nicht rational: Q enthält keine Zahl a mit der Eigenschaft a 2 = 2. 

Beweis. Annahme: Es gibt a ∈ Q mit a 2 = 2. Dann kann man a als Bruch schreiben, 

a = m 

n mit m, n ∈ Z und m, n teilerfremd. Es folgt m2 = 2 · n 2 . Also ist 2 ein Teiler 

von m · m; und da 2 eine Primzahl ist, auch ein Teiler von m. Folglich gibt es c ∈ Z mit 

m = 2c. Es folgt 2c · 2c = 2n 2 , also 2c 2 = n 2 . Also ist 2 ein Teiler von n 2 , und damit auch 

von n. Folglich sind m und n nicht teilerfremd, ein Widerspruch. (Denn die Aussage ( m 

ist teilerfremd zu n ) ist wahr und falsch.) 

1.2.6 Ergänzende Bemerkungen 

für Logik-Interessierte (gehört nicht zur Vorlesung). 

Man braucht nicht vorauszusetzen, dass jede Aussage wahr oder falsch ist; man muß auch 

nicht verbieten, dass eine Aussage wahr und falsch ist. Eine Aussage, die wahr und falsch


ist, heißt widersprüchlich, und wir setzen in dieser Vorlesung ausdrücklich voraus, dass 

keine widersprüchlichen Aussagen vorkommen. Das ist keineswegs unproblematisch; denn 

möglicherweise treten ja zwangsläufig widersprüchliche Aussagen in unserem logischen 

System auf. Wir skizzieren kurz einen logischen Aufbau, in welchem ’Tertium non datur’ 

nicht vorausgesetzt wird. 

Wahre Aussagen gewinnt man nach den folgenden logischen Regeln, die als Axiome der 

Logik stets als wahr vorausgesetzt werden: 

(W1) Axiome sind wahr. 

(W2) Seien A und B Aussagen. Wenn die Aussage (A ⇒ B) wahr ist und die Aussage A 

wahr ist, so ist die Aussage B wahr. 

(W3) Eine Aussage ist falsch, wenn die Negation wahr ist. 

Die folgenden Aussagen nimmt man als logische Axiome. 

Seien A, B, C beliebige Aussagen. 

(AL1) Die Aussage [(A oder A) ⇒ A] ist wahr. 

(AL2) Die Aussage [A ⇒ (A oder B)] ist wahr. 

(AL3) Die Aussage [(A oder B) ⇒ (B oder A)] ist wahr. 

(AL4) Die Relation [(A ⇒ B) ⇒ ((A oder C) ⇒ (B oder C))] ist wahr. 

Man kann nun beweisen: Wenn eine Aussage existiert, die wahr und falsch ist, dann ist jede 

Aussage wahr und falsch (d.h. die Existenz einer einzigen widersprüchlichen Aussage be- 

wirkt, dass alle Aussagen widersprüchlich sind). Insofern ist die Vermutung gerechtfertigt, 

dass keine widersprüchlichen Aussagen vorkommen. 

1.3 Mengen 

1.3.1 

Für uns sind Mengen (”mathematische Objekte”) undefinierte Grundbegriffe. Auch 

Gleichheit von Mengen (geschrieben ”=”) und ’Element sein von’ (geschrieben: ”∈”) sind 

undefinierte Grundbegriffe. Für Mengen U und V sollen (U = V ) und auch (U ∈ V ) Aus- 

sagen sein. 

Redeweise für (U ∈ V ): U ist Element von V ; U ist in V enthalten. 

Verneinung: U /∈ V . 

Man beachte, daß ”Element” kein eigenständiger Begriff ist, sondern nur in der Form 

Element einer Menge vorkommt; ein Element einer Menge ist auch eine Menge.


1.3.2 

Folgende Axiome werden vorausgesetzt. 

Gleichheitsaxiom Für alle Mengen U, V, W gilt: 

U = U; 

(U = V ) ⇔ (V = U); 

(U = V ) und (V = W ) ⇒ (U = W ). 

Außerdem sollen für zwei gleiche Mengen dieselben Aussagen wahr sein. 

Ausdehnungsaxiom Für alle Mengen U, V gilt: U = V ⇔ Für jede Menge W gilt: 

Die letzte Eigenschaft sagt: 

(W ∈ U) ⇔ (W ∈ V ) 

Mengen U, V sind genau dann gleich, wenn sie die gleichen Elemente haben. Diese Ei- 

genschaft ist keineswegs selbstverständlich; z.B. betrachte man Menschen anstelle von 

Mengen, und U ∈ V bedeute: U ist Vorfahre von V . Dann gilt zwar: (U = V ) ⇒ 

[(W ∈ U) ⇔ (W ∈ V )], aber die Umkehrung: (U = V ) ⇐ [(W ∈ U) ⇔ (W ∈ V )] ist falsch 

(verschiedene Menschen können die gleichen Vorfahren haben). 

1.3.3 Teilmengen 

Für Mengen U, V schreibt man U ⊆ V , wenn für jede Menge x gilt: 

x ∈ U ⇒ x ∈ V 

Sprechweise: U ist eine Teilmenge von V ; auch: U ist in V enthalten. Das Teilmenge- 

Zeichen ⊆ heißt Inklusion. Nach dem Ausdehnungsaxiom sind Mengen U, V genau dann 

gleich, wenn (U ⊆ V und V ⊆ U) gilt. 

1.3.4 Axiom der Teilmengenbildung durch eine Eigenschaft 

Sei V eine Menge. Für jedes x ∈ V sei A (x) eine Aussage (die von x abhängt). Dann gibt 

es eine Menge U mit der Eigenschaft: Für jede Menge x gilt: 

Die Menge U ist eindeutig bestimmt. 

x ∈ U ⇔ (x ∈ V und A (x) ist wahr) 

Bezeichnung: U = {x ∈ V | A(x)}; U = {x | x ∈ V und A(x)}; U = 

{x | x ∈ V und A(x) gilt}. 

Insbesondere ist V = {x | x ∈ V } für jede Menge V.


Bemerkung Das obige Axiom verlangt nicht, daß zu jeder Aussage A(x), die von eine 

Menge x abhängt, eine Menge U existiert mit x ∈ U ⇔ A(x). Diese Forderung würde 

die berühmten Antinomien (paradoxen Aussagen) nach sich ziehen, die um 1900 entdeckt 

wurden. 

Z.B. betrachte man für eine beliebige Menge x die Aussage A(x) : x ∈ x. Angenommen, 

es gibt eine Menge U mit U = {x | x /∈ x}. Es muß U ∈ U oder U /∈ U gelten. Im ersten 

Fall folgt U ∈ U und U /∈ U; im zweiten auch U ∈ U und U /∈ U. Also ergibt sich in 

beiden Fällen ein Widerspruch zum ’Tertium non datur’. 

1.3.5 Komplementbildung 

Für Mengen U und V heißt V \U := {v | v ∈ V und v /∈ U} das Komplement von U 

bezüglich V ; man schreibt auch: CV U. 

1.3.6 Leere Menge ∅ 

Sei U eine Menge. Dann ist ∅ := U\U die leere Menge von U. Es gibt kein x mit x ∈ ∅. 

Deshalb hängt ∅ nicht von der Wahl der Menge U ab. ∅ ist die einzige Menge, die kein 

Element hat. 

1.3.7 Bilden endlicher Mengen 

Sei n eine natürliche Zahl und seien a1, . . . , an Mengen. Dann gibt es eine Menge M, die 

genau die Elemente a1, . . . , an enthält. Bezeichnung: M = {a1, . . . , an}. (Die Existenz der 

natürlichen Zahlen wird hier vorausgesetzt.) 

1.3.8 Potenzmenge 

Sei U eine Menge. Dann existiert genau eine Menge P (U) mit der Eigenschaft: x ∈ 

P (U) ⇔ x ⊆ U d.h. die Elemente von P (U) sind genau die Teilmengen von U. Also 

P(U) = {x | x ⊆ U}. 

Insbesondere gilt ∅ ∈ P (U) und U ∈ P (U). 

(Die Existenz von P (U) ist aus dem Bisherigen nicht beweisbar und muß als Axiom 

gefordert werden.) 

1.3.9 Vereinigung 

Sei C eine Menge. Dann heißt 

C := {x | es gibt U ∈ C mit x ∈ U}


die Vereinigungsmenge von C (oder über C). 

(Die Existenz solcher Mengen ist nicht beweisbar und muß als Axiom gefordert werden.) 

Bemerkung Die oben verwendete Schreibweise ist nicht sehr populär. Man schreibt auch 

 

{X | X ∈ C} oder X. Wenn C = {A1, . . . , An} ist, schreibt man auch 

X∈C 

 

Ai oder 

i 

· · · An. Es gilt ∅ = ∅ und {U} = U. 

A1 

Beispiel Für n ∈ N setze Jn := x ∈ R | 0 ≤ x < 1 

 

n . Setze C := {Jn|n ∈ N}. Dann gilt 

 

C = {x ∈ IR| 0 ≤ x < 1}. 

1.3.10 Durchschnitt 

Sei C eine Menge und C = ∅. Dann heißt 

C := {x | für jedes U ∈ C gilt x ∈ U} 

der Durchschnitt von (über) C. (Die Existenz von C ist beweisbar). 

Man verwendet die analogen Schreibweisen wie für . Insbesondere schreibt man, wenn 

C = {U, V } ist, U ∩ V für C. 

Wenn U ∩ V = ∅ ist, sagt man: U ist disjunkt zu V . 

1.4 Quantoren 

Sei V eine Menge. Für jedes v ∈ V sei A (v) eine Aussage. 

Beispiel V := N. A (n) : 23 ist ein Teiler von n. 

Wir bilden zwei neue Aussagen: 

B : Es gibt w ∈ V derart, daß A (w) wahr ist. In Zeichen: ∃w ∈ V : A (w) ist wahr. 

C : Für alle w ∈ V ist A (w) wahr. In Zeichen: ∀w ∈ V : A (w) ist wahr. 

Aussage C ist äquivalent zu: ¬ (∃w ∈ V : A (w) ist falsch). 

”Es gibt” (∃) heißt Existenzquantor, ”Für alle” (∀) heißt Allquantor. Die oben ange- 

gebenen Zeichen verwendet man kaum in mathematischen Texten, sondern folgende 

Redeweisen: 

Für (mindestens) ein w ∈ V gilt A (w); auch: es gibt w ∈ V derart, daß A (w) gilt; auch: 

für ein passendes w ∈ V gilt A (w). 

Für alle w ∈ V gilt A (w); auch: Für jedes w ∈ V gilt A (w); auch: A (w) gilt für beliebiges 

w ∈ V . 

Statt ”A (w) ist wahr” sagt man auch ”w erfüllt die Eigenschaft A”.


Welche Redewendung man verwendet, ist ziemlich egal. Es muß eindeutig ersichtlich sein, 

was gemeint ist. 

1.5 Relationen und Abbildungen 

Definition 3 (Paar) Zu Mengen x, y setze 

(x, y) := {{x} , {x, y}} 

Eine Menge U heißt ein Paar, wenn es Mengen x, y gibt mit U = (x, y). 

Lemma 4 Paare (x, y) , (u, v) sind genau dann gleich, wenn x = u und y = v gilt (Kom- 

ponentengleichheit). 

Beweis. ⇒: Sei (x, y) = (u, v). Also M := {{x}, {x, y}} = {{u}, {u, v}}. 

1. Fall: x = y. Dann gilt {x, y} = {u} (sonst wäre x = u = y). Also gilt {x, y} = {u, v}. 

Es gilt {x, y} = {x} (sonst wäre x = y). Es folgt {x} = {u} und damit x = u. Mit 

{x, y} = {u, v} und y = u folgt y = v. 

2. Fall: x = y. Dann ist M = {{x}}, also {x} = {u} = {u, v} und deshalb x = u = v. 

⇐ ist klar. 

Bemerkung Man kann vergessen, wie man Mengen x, y gemäß obiger Definition mathe- 

matisch einwandfrei zu Paaren verheiratet. Wichtig ist zu wissen: (x, y) = (u, v) ⇔ x = u 

und y = v. 

Definition 5 (Erweiterung des Begriffs Paar) Für Mengen x, y, z definieren wir das 

Tripel (x, y, z) := ((x, y) , z) durch zweimalige Paarbildung. 

Entsprechend Quadrupel (x, y, z, w) := ((x, y, z) , w) , und so fortfahrend n-Tupel 

(x1, ..., xn) von n Mengen x1, . . . , xn (dabei kann durchaus i = j und xi = xj vorkom- 

men). 

Zwei n-Tupel (x1, . . . , xn) und (y1, . . . , yn) sind genau dann gleich, wenn xi = yi für i = 

1, . . . , n gilt. 

1.5.1 Kartesisches Produkt 

Seien U, V Mengen. Man setzt 

U × V := {(u, v) | u ∈ U, v ∈ V }


und nennt U × V das kartesisches Produkt von U, V . 

Wie bei der Paarbildung definiert man rekursiv das kartesische Produkt von Mengen 

U1,...,Un (wobei n ∈ N≥3 sei): 

U1 × · · · × Un := (U1 × · · · × Un−1) × Un = {(u1, . . . , un) | u1 ∈ U1, . . . , un ∈ Un}. Wenn 

U := U1 = · · · = Un ist, schreibt man U n := U × · · · × U. 

René Descartes, 1596-1650, war ein französischer Philosoph und Naturwissenschaftler in 

kritischer Distanz zur Kirche. 

1.5.2 Relationen 

Definition 6 (Relation, Äquivalenzrelation, Ordnungsrelation) Eine Relation ist 

eine Menge, deren Elemente Paare sind. 

Seien U und V Mengen. Eine Relation zwischen U und V ist eine Teilmenge R ⊆ U × V . 

Wenn (u, v) ∈ R ist, sagt man: u ist in Relation R zu v. Oft schreibt man dafür u R v. 

Eine Relation auf einer Menge M ist eine Teilmenge des karthesischen Produkts M × M 

(d.h. Spezialfall M = U = V ). 

Eine Äquivalenzrelation auf einer Menge M ist eine Relation A ⊆ M × M mit folgenden 

Eigenschaften: 

(R) (Reflexivität) Für jedes m ∈ M gilt: (m, m) ∈ A. 

(S) (Symmetrie) Für alle m, n ∈ M gilt: (m, n) ∈ A ⇔ (n, m) ∈ A. 

(T) (Transitivität) Für alle m, n, p ∈ M gilt: (m, n) ∈ A und (n, p) ∈ A ⇒ (m, p) ∈ A. 

Wenn man anstelle der Symmetrie Antisymmetrie verlangt, nennt man die Relation eine 

Ordnungsrelation: 

(AS) Für alle m, n ∈ A gilt: Aus (m, n) ∈ A und (n, m) ∈ A folgt m = n. 

Wenn eine Äquivalenzrelation A ⊆ M × M vorliegt, schreibt man oft a ∼ b anstelle von 

(a, b) ∈ A. Das Transitivitätsaxiom in dieser Schreibweise: Für alle m, n, p ∈ M gilt: 

m ∼ n und n ∼ p ⇒ m ∼ p. 

Wenn eine Ordnungsrelation A ⊆ M vorliegt, schreibt man oft a ≤ b anstelle von 

(a, b) ∈ A. 

Beim Vorliegen einer Ordnungsrelation ≤ auf einer Menge M kann es Elemente a, b ∈ M 

geben, für die weder a ≤ b noch b ≤ a gilt. 

Wenn für alle a, b ∈ M gilt: a ≤ b oder b ≤ a (” je zwei Elemente sind vergleichbar”), 

spricht man von einer vollständigen Ordnung(srelation).


Beispiel Sei C irgendeine Menge. Setze M := P(C) (Potenzmenge von C) und 

A := {(U, V ) | U, V ∈ M und U ⊆ V }. 

Dann ist A eine Ordnungsrelation. Redeweise: Die durch die Inklusion auf der Potenz- 

menge von C gegebene Ordnungsrelation. 

Weiteres über Relationen folgt später. 

1.6 Abbildungen 

Definition 7 Eine Abbildung ϕ ist eine Relation mit der folgenden Eigenschaft: 

(A) Für alle (a, b) , (c, d) ∈ ϕ gilt: a = c ⇒ b = d (”Rechtseindeutigkeit von ϕ”). 

Bezeichnungen Sei ϕ eine Abbildung. 

Man nennt X := {a | es gibt b mit (a, b) ∈ ϕ} den Definitionsbereich von ϕ; auch die 

Definitionsmenge, auch den Argumentbereich. 

Man nennt B := {b | es gibt a mit mit (a, b) ∈ ϕ} den Bildbereich von ϕ ; auch Bild- 

menge. 

Jede Menge Y mit B ⊆ Y heißt eine Zielmenge von ϕ. Insbesondere ist die Bildmenge B 

eine Zielmenge. 

Wir sagen: ϕ ist eine Abbildung von X nach Y , geschrieben: ϕ : X → Y , wenn gilt: X 

ist der Definitionsbereich und Y eine Zielmenge von ϕ. 

Sei ϕ : X → Y eine Abbildung und x ∈ X. Das nach (A) eindeutig bestimmte y ∈ Y 

mit der Eigenschaft (x, y) ∈ ϕ heißt das Bild(-element) von x ; auch der Wert von ϕ an 

der Stelle x. 

Bezeichnung: ϕ (x) oder xϕ (man schreibt Abbildungsnamen links oder rechts an das 

Argument). Man schreibt auch ϕ : x ↦→ xϕ (man beachte den kleinen senkrechten Strich 

am Pfeil) oder ϕ : x ↦→ y wenn xϕ = y ist. 

Statt Abbildung sagt man auch Funktion. 

Mit Y X bezeichnet man die Menge aller Abbildungen X → Y . 

Indexschreibweise Statt xϕ schreibt man manchmal ϕx oder yx. Insbesondere ist das 

üblich, wenn die Argumentmenge eine Teilmenge von N0 ist. 

Bemerkung Aus der Definition folgt unmittelbar: Abbildungen ϕ und ψ sind genau dann 

gleich, wenn ihre Definitionsbereiche gleich sind, und wenn für jedes x ∈ Definitionsbereich 

gilt: xϕ = xψ.


Weitere Bezeichnungen 

Sei ϕ : X → Y eine Abbildung. Sei A ⊆ X. Dann heißt ϕ(A) := {aϕ | a ∈ A} das Bild 

von A unter ϕ. 

Insbesondere ist ϕ (X) die (gesamte) Bildmenge von ϕ. 

Sei C ⊆ Y . Man nennt 

die Urbildmenge von C (unter ϕ). 

ϕ −1 (C) := {x ∈ X | ϕ (x) ∈ C} 

Eine Abbildung ϕ heißt konstant, wenn für alle a, b ∈ X gilt aϕ = bϕ. 

Begriff: Restriktion einer Abbildung Sei ϕ : X → Y eine Abbildung und A ⊆ X. 

Dann kann man eine neue Abbildung bilden: ˆϕ := {(a, y) | a ∈ A und (a, y) ∈ ϕ}. 

Man nennt ˆϕ die Restriktion (auch: Einschränkung) von ϕ auf A. 

Schreibweise: ϕ|A := ˆϕ. 

ϕ|A ist also eine Abbildung mit Definitionsbereich A, und Y ist eine Zielmenge von ϕ|A. 

1.6.1 Nacheinanderausführung von Abbildungen 

Seien ϕ, ψ Abbildungen mit Bildbereich (ϕ) ⊆ Definitionsmenge (ψ). 

Dann ist 

ψ ◦ ϕ = {(a, b) | es gibt c mit (a, c) ∈ ϕ und (c, b) ∈ ψ} 

eine Abbildung (mit Definitionsmenge (ψ ◦ ϕ) = Definitionsmenge (ϕ)). Je nachdem, ob 

man Abbildungen rechts (links) an das Argument schreibt, schreibt man ϕψ (ψ ◦ ϕ). Also 

xϕψ, ψ ◦ ϕ(x) für x ∈ Definitionsberech (ϕ) ist. 

Man nennt ϕψ = ψ ◦ ϕ die Nacheinanderausführung (auch Hintereinanderausführung) 

von ϕ und ψ (gelesen ”ψ nach ϕ”, weil erst ϕ und danach ψ angewendet wird). 

Also xϕψ oder ψ ◦ ϕ (x). 

Die Aussage (a, c) ∈ ϕ und (c, b) ∈ ψ besagt also: 

a ϕ 

↦→ c, und c ψ 

↦→ b; deshalb a ψ◦ϕ 

↦→ b. 

Anders geschrieben: 

aϕ = c und cψ = b; deshalb aϕψ = b. 

Man beachte, dass die Nacheinanderausführung von Abbildungen nur dann definiert ist, 

wenn der Bildbereich der zuerst auszuführenden Abbildung im Definitionsbereich der zwei- 

ten liegt (Man kann eine allgemeinere Definition der Nacheinanderausführung von Abbil-


dungen unter Verzicht auf diese Voraussetzung geben, aber das wollen wir nicht). Der 

Definitionsbereich der zweiten Abbildung ist dann ein Zielbereich der ersten. 

Lemma 8 Die Hintereinanderausführung von Abbildungen ist assoziativ: Seien ϕ : X → 

Y und ψ : Y → Z und π : Z → T Abbildungen. Dann gilt (ϕψ)π = ϕ(ψπ). 

Beweis. Die linke Seite ist {(x, x(ϕψ)π) | x ∈ X} = {(x, ((xϕ)ψ))π) | x ∈ X}. Das ist 

auch die rechte Seite. 

Man kann also beim Hintereinanderausführen von Abbildungen Klammern weglassen. 

1.6.2 Beispiele 

1. ϕ = {(1, 2), (2, 2), (3, 3), (4, 2)} 

X = Definitionsbereich = {1, 2, 3, 4} 

Bildbereich = {2, 3} = ϕ (X) ; 

Zielmenge: Jede Menge Y mit Y ⊇ {2, 3}; 

Andere Schreibweisen: ϕ : X → Y 

1 ↦→ 2 

2 ↦→ 2 

3 ↦→ 3 

4 ↦→ 2 

oder ϕ = 

1 2 3 4 

2 2 3 2 

 

2. σ : IR 2 → R 2 , x = (x1, x2) ↦→ −x := (−x1, −x2) (Spiegelung am Punkt (0, 0)). 

Also σ = {(x, −x) | x ∈ R 2 } = {((x1, x2), (−x1, −x2)) | x1, x2 ∈ R} 

3. ρ : R 2 → R 2 , x = (x1, x2) ↦→ (x1, 0) . Es gilt 

ρ −1 ({(1, 0)}) = {(1, x2) | x2 ∈ R}. Es gilt ρ◦ρ = ρ (solche Abbildung nennt man 

idempotent). 

1.6.3 Injektivität, Surjektivität, Bijektivität, Permutation 

Begriffe Sei ϕ : X → Y eine Abbildung. 

Die Abbildung ϕ heißt injektiv (auch: eineindeutig), wenn gilt: Für alle a, b ∈ X mit 

a = b folgt aϕ = bϕ.


Andere Formulierung: Für alle a, b ∈ X gilt: aϕ = bϕ ⇒ a = b. 

Die Abbildung ϕ heißt surjektiv auf (nach) Y , wenn gilt: Zu jedem y ∈ Y gibt es ein 

x ∈ X mit xϕ = y. 

Andere Formulierungen: ϕ −1 ({y}) = ∅ für jedes y ∈ Y ; auch: Y = ϕ (X) (Bildmenge von 

ϕ). 

Man nennt ϕ bijektiv nach (auf) Y , wenn ϕ injektiv und surjektiv (nach Y ) ist. 

Eine bijektive Abbildung ϕ : X → X nennt man eine Permutation auf X. 


1. X := N, ϕ : N→N, nϕ := n + 3 für jedes n ∈ N (andere Schreibweise: ϕ : n ↦→ n + 3). 

Die Abbildung ϕ ist injektiv. 

Sei nämlich n, m ∈ N und nϕ = mϕ Dann gilt n + 3 = m + 3. Es folgt m = n. 

2. Setze ϕ : IR→IR, x ↦→ x 2 . 

Nicht injektiv, denn es ist (−1)ϕ = 1 = 1ϕ und −1 = 1. 

3. Setze ϕ : IR>0 → IR, x ↦→ x 2 . Die Abbildung ist injektiv. 

Beispiel einer Permutation 

Chiffriertes Wort: 

Klartext: 

G 

1 

A 

2 

R 

3 

U 

4 

J 

5 

A 

6 

J A G U A R . Aus dem Klartext entsteht die Chiffre durch die Abbildung 

ϕ : {1, 2, . . . , 6} → {1, 2, 3, 4, 5, 6} (angewendet auf die Buchstabenpositionen) ϕ : 1 ↦→ 

5, 2 ↦→ 6, 3 ↦→ 1, 4 ↦→ 4, 5 ↦→ 2, 6 ↦→ 3 . Denn der an erster Stelle stehende Buchstabe 

des Klartextes wird an die fünfte Position gerückt; der zweite an die sechste; der dritte an 

die erste..... in Relationenschreibweise: ϕ = {(1, 5) , (2, 6) , (3, 1) , (4, 4) , (5, 2) , (6, 3)} 

Die Abbildung ist injektiv und auch surjektiv auf X := {1, 2, . . . , 6}. D.h. ϕ ist eine 

Permutation {1, 2, . . . , 6}. 

Oft verwendete Schreibweise: ϕ = 

1 2 3 4 5 6 

5 6 1 4 2 3 

Begriff Für jede Menge X nennt man id (auch idX, 1X) die ”identische Abbildung auf 

X”; das ist die Abbildung idX : X → X, x ↦→ x für jedes x ∈ X. 

Beobachtung 9 Sei ϕ : X → Y gegeben. Dann gilt idX ϕ = ϕ und ϕ idY = ϕ. D.h. die 

identische Abbildung verhält sich bei Nacheinanderausführung neutral.


Lemma 10 Sei ϕ : X → Y eine Abbildung und sei X = ∅. Folgende Aussagen sind 

äquivalent: 

(i) ϕ ist injektiv. 

(ii) Es gibt eine Abbildung π : Y → X mit ϕπ = idX (d.h. xϕψ = x für jedes x ∈ X). 

Beweis. (i) ⇒ (ii). Wähle ein Element c ∈ X. Sei y ∈ Y . Es gibt höchstens ein x ∈ X mit 

xϕ = y (da ϕ injektiv ist). Falls es so ein x gibt, setze yπ := x; sonst yπ := c. Dadurch 

haben wir eine Abbildung π : Y → X festgelegt. Für jedes x ∈ X haben wir xϕπ = x. 

Also gilt ϕπ = idX. 

Beweis von (ii) ⇒ (i). Seien a, b ∈ X und aϕ = bϕ. Dann folgt a = a idX = aϕπ = bϕπ = 

b idX = b, also a = b. 

Lemma 11 Sei ϕ : X → Y eine Abbildung. Die Aussagen (i) und (ii) sind äquivalent: 

(i) ϕ ist surjektiv (auf Y ). 

(ii) Es gibt eine Abbildung ψ : Y → X mit ψϕ = idY 

Beweis von (ii) ⇒ (i). Sei ψ eine Abbildung wie in (ii). Sei y ∈ Y . Es gilt (yψ)ϕ = y idY = y. 

Zu (i) ⇒ (ii). ϕ ist nach Voraussetzung surjektiv. Wir definieren eine Abbildung 

ψ : Y → X wie folgt. Für jedes y ∈ Y argumentieren wir: da ϕ surjektiv ist, gilt 

ϕ −1 ({y}) = ∅; man wähle ein x ∈ ϕ −1 ({y}) und setze yψ := x. Es gilt xϕ = y, also 

yψϕ = xϕ = y. Da dies nun auf jedes y ∈ Y zutrifft, hat man ψϕ = idY . 

Bemerkung. Im obigen Beweis wurde eine Abbildung konstruiert, indem aus jeder Menge 

ϕ −1 ({y}) (y ∈ Y ) ein Element x ’gewählt’ wird. Das ist nicht ganz unproblematisch (die 

Menge Y ist ja im allgemeinen keine endliche Menge). Die Erlaubnis zu diesem Vorgehen 

nennt man das ’Auswahlaxiom’ . Dies ist in exakter Formulierung folgende Aussage: Sei 

X eine Menge nicht-leerer Mengen. Dann existiert eine Abbildung η : X → X mit der 

Eigenschaft Xη ∈ X für jedes X ∈ X. D.h. das ’Auswählen’ bewerkstelligt in exakter 

Formulierung die Abbildung η. 

Die überwiegende Mehrheit der Mathematiker meint, das Auswahlaxiom verwenden zu 

dürfen. Man braucht es ziemlich oft. 

Beispiel 

Sei ϕ : IR → R≥0, x ↦→ x 2 . Dann ist ϕ surjektiv. Die Abbildung ψ aus dem vorheri- 

gen Satz Teil (ii) ist nicht immer eindeutig bestimmt. Zum Beispiel kann man nehmen: 

ψ : IR≥0 → IR, y ↦→ √ y. 

Aber man kann auch nehmen: ψ : IR≥0 → IR, y ↦→ 

√y für y ∈ IR≥0 und y ∈ N 

− √ y für y ∈ N


Satz 12 Sei ϕ : X → Y eine Abbildung. Dann sind äquivalent: 

(i) ϕ ist bijektiv (auf Y ). 

(ii) Es gibt eine Abbildung π : Y → X mit ϕπ = idX und eine Abbildung ψ : Y → X 

mit ψϕ = idY . 

Zusatz Wenn (i) zutrifft, gilt: Die Abbildungen π und ψ von (ii) sind eindeutig durch die 

Bijektion ϕ festgelegt, und es gilt π = ψ 

Beweis. Die Äquivalenz von (i) mit (ii) folgt sofort aus den beiden vorangehenden Lem- 

mata. Zum Zusatz. Sei π eine Abbildung wie in (ii) und sei ω : Y → X eine Abbildung, 

welche auch ϕω = idX erfüllt. Zu zeigen ist π = ω. Das bedeutet: für jedes y ∈ Y gilt 

yπ = yω. Sei also y ∈ Y . Da ϕ surjektiv ist, existiert ein x ∈ X mit xϕ = y; ein solches x 

werde gewählt. Dann gilt x = x idX = xϕπ = yπ, und ebenso x = yω. Es folgt yπ = yω. 

Nun ist die Eindeutigkeit von ψ in (ii) zu zeigen. Sei ω : Y → X mit ωϕ = idY . Zu 

zeigen: ψ = ω. Sei also y ∈ Y . Dann gilt yψϕ = y = yωϕ. Da ϕ injektiv ist, folgt yψ = yω. 

Zuletzt zeigen wir π = ψ. 

Sei y ∈ Y . Dann gilt yπ = y(ψϕ)π = yψ(ϕπ) = yψ. 

Definition 13 (Umkehrabbildung) Sei ϕ : X → Y eine bijektive Abbildung. Dann 

heißt die (nach dem vorigem Satz eindeutig bestimmte) Abbildung π : Y → X mit der 

Eigenschaft ϕπ = idX die Umkehrabbildung von ϕ. Sie wird mit ϕ −1 bezeichnet. 

Die Umkehrabbildung ϕ −1 : Y → X der Bijektion ϕ in der Definition erfüllt also 

ϕϕ −1 = idX. Nach dem vorigen Satz gilt auch ϕ −1 ϕ = idY , und diese Eigenschaft kenn- 

zeichnet die Umkehrabbildung ebenso wie die in der Definition verwendete Eigenschaft. 

Bemerkung Die Umkehrabbildung einer Bijektion ϕ : X → Y darf nicht verwechselt 

werden mit der Urbildmenge ϕ −1 (B) = {x ∈ X | xϕ ∈ B} einer Teilmenge B ⊆ Y . 

Für eine Bijektion ϕ : X → Y gilt {yϕ −1 } = ϕ −1 ({y}) für jedes y ∈ Y (links die 

Umkehrabbildung, rechts Urbildmenge von ϕ). Insofern sind die Bezeichnungen ziemlich 

kompatibel. 

Die Umkehrabbildung einer Bijektion ϕ nennt man auch die inverse Abbildung von ϕ . 

Bemerkung Die Umkehrabbildung ϕ −1 : Y → X einer Bijektion ϕ : X → Y ist 

bijektiv; es gilt (ϕ −1 ) −1 = ϕ. 

Beobachtung 14 Seien ϕ : X → Y und ψ : Y → Z Abbildungen. 

(a) Wenn ϕ und ψ injektiv sind, so ist ϕψ injektiv.


(b) Wenn ϕ und ψ surjektiv sind, so ist ϕψ surjektiv. 

(c) Wenn ϕ und ψ bijektiv sind, ist ϕψ bijektiv. Es gilt dann für die Umkehrabbildung: 

(ϕψ) −1 = ψ −1 ϕ −1 . 

1.6.5 Mächtigkeit von Mengen, Abzählbarkeit, Endlichkeit 

Definition 15 (gleichmächtig, abzählbar, endlich) Mengen U, V nennt man 

gleichmächtig, wenn es eine Bijektion U → V gibt. 

Eine Menge U heißt abzählbar, wenn es eine injektive Abbildung U → N gibt. 

Eine Menge U heißt endlich, wenn es n ∈ N gibt und eine Bijektion U → {1, . . . , n}. 

Man sagt dann: U hat genau n Elemente und setzt setzt |U| := n. Außerdem betrachten 

wir ∅ als endliche Menge mit |∅| := 0. 

Regeln, welche direkt aus der Definition von ’gleichmächtig’ folgen. 

Seien U, V, W Mengen. Wenn U gleichmächtig zu V ist, schreiben wir U ∼ V . Dann gilt: 

1. U ∼ U; 2. U ∼ V ⇒ V ∼ U; 3. U ∼ V und V ∼ W ⇒ U ∼ W . Diese drei Aussagen 

sind uns bei der Definition einer Äquivalenzrelation begegnet (Reflexivität, Symmetrie, 

Transitivität). 

Bemerkung Für eine endliche Menge U ist die Definition von |U| einwandfrei: Wenn 

ϕ : U → {1, . . . , n} eine Bijektion ist und auch ψ : U → {1, . . . , m}, so ist 

ϕ −1 ψ : {1, . . . , n} → {1, . . . , m} eine Bijektion und es folgt ’bekanntlich’ n = m 

(eigentlich muß man auch dies aus Eigenschaften der natürlichen Zahlen beweisen). 

Man nennt dann n = |U| die Mächtigkeit der endlichen Menge U, auch die Anzahl der 

Elemente von U. 

Die folgende Beobachtung kann man lückenlos beweisen, aber man braucht dazu ein wenig 

Kenntnis der natürlichen Zahlen, insbesondere das Prinzip der vollständigen Induktion. 

Dies haben wir noch nicht zur Verfügung. Deshalb notieren wir die folgende Beobachtung 

ohne Beweis. 

Beobachtung 16 a) Wenn U eine endliche Menge ist und ϕ : U → Z eine Abbildung, 

so ist ϕ(U) endlich. 

Wenn U ⊆ V ist und V eine endliche Menge, dann auch U. 

b) Seien U, V endliche Mengen. Dann gilt: 

U gleichmächtig zu V ⇔ |U| = |V |.


Wenn man zusätzlich U ⊆ V voraussetzt, ist |U| = |V | äquivalent zu U = V. 

c) Wenn U eine endliche Menge ist und u ∈ U, so gilt |U \{u}| = |U|−1. Es ist |{u}| = 1. 

Satz 17 (und Definition) Sei ψ : U → N injektiv. Dann ist U endlich, oder es gibt eine 

Bijektion U → N. Im letzen Fall nenne U abzählbar unendlich. 

Beweis. Mit ≤ bezeichnen wir die Anordnung der natürlichen Zahlen (zum Beispiel 3 ≤ 5). 

Wir definieren 

ϕ : U → N, u ↦→ |{v ∈ U | vψ ≤ uψ}| 

Dann ist ϕ wohldefiniert, d.h. {v ∈ U | vψ ≤ uψ} ist endlich; denn wegen der Injektivität 

von ψ enthält diese Menge höchstens uψ Elemente. 


Beweis von (i). Seien u, u ′ ∈ U und u = u ′ . Dann gilt uψ = u ′ ψ, also etwa uψ 

kleiner). Deshalb gilt {v ∈ U | vψ ≤ uψ} ⊆ {v ∈ U | vψ ≤ u ′ ψ}, und die Inklusion ist echt 

(d.h. es gilt nicht =), weil u ′ in der rechten aber nicht in der linken Menge enthalten ist. 

Es folgt 

uϕ = |{v ∈ U | vψ ≤ uψ}| < |{v ∈ U | vψ ≤ u ′ ψ}| = u ′ ϕ . 

(ii) ϕ ist surjektiv oder U ist endlich. 

Beweis. Angenommen, U ist nicht endlich. Zu zeigen ist (+) ϕ(U) = N. 

Zunächst behaupten wir: 

(*) 1 ∈ ϕ(U). 

Beweis (*). Wähle u ∈ U so, dass uψ die kleinste aller natürlichen Zahlen in ψ(U) ist. 

Dann gilt uϕ = 1. 

Nun behaupten wir: 

(**) Für alle n ∈ N gilt: n ∈ ϕ(U) ⇒ n + 1 ∈ ϕ(U). 

Beweis (**). Sei n ∈ ϕ(U). Also n = uϕ für ein passendes u ∈ U. Da U nicht endlich und 

ψ injektiv ist, existiert ein u ′ ∈ U mit uψ 

a ∈ N mit uψ < a 

Damit ist (**) gezeigt. 

Aus (*) und (**) folgt die Aussage (+). 

1.6.6 Beispiel 

Z und N sind gleichmächtig. Denn die Abbildung 

 

2z + 2 für z ≥ 0 

ϕ : Z → N, z ↦→ 

− (2z + 1) für z < 0 

ist bijektiv


Satz 18 N × N ist abzählbar, d.h. es gibt eine bijektive Abbildung ϕ : N × N → N. 

Beweis mit dem ’Abzählverfahren von Kantor’ . Idee: 

1 2 4 7 ... r ... 

3 5 8 

6 9 

10 usw. 

. 

. 

s 

. 

. 

In der i-ten Diagonalen sind i Zahlen. Die ’Position’ (r, s) ∈ N × N (r=Zeilennummer, 

s =Spaltennummer) liegt in der Diagonalen Nummer r + s − 1, und in den vorangehenden 

Diagonalen stehen 

1 + 2 + ... + (r + s − 2) = 1 

(r + s − 1)(r + s − 2) 

2 

Zahlen. Wenn wir diagonal laufend bis zur Stelle (r, s) zählen, sind wir also bei 1 

2 (r + 

s − 1)(r + s − 2) + s angekommen. Aufgrund dieser Idee definieren wir nun die gesuchte 

Abbildung 

ϕ : N × N → N, (r, s) ↦→ 1 

(r + s − 1)(r + s − 2) + s 

2 

Nun kann man direkt nachrechnen, dass ϕ bijektiv ist. Das macht zwar noch ein bißchen 

Mühe (und wird nicht vorgeführt), aber entscheidend ist doch die beschriebene Idee, 

welche zu einer passenden Definition von ϕ führt. 

Korollar 19 Die Menge der rationalen Zahlen Q ist abzählbar. 

Beweis. Sei eine bijektive Abbildung ϕ : N × N → N gemäß dem vorigen Satz 

gewählt. Definiere π : Q>0 → N × N, a 

b 

↦→ (a, b), wobei a, b ∈ N teilerfremde natürli- 

che Zahlen seien. Dann ist π injektiv, und damit ist auch ω := πϕ : Q>0 → N 

injektiv. Nach 17 gibt es eine Bijektion µ : Q>0 → N. Wir definieren: ν : Q → N, 

q ↦→ 2(qµ) falls q > 0, q ↦→ 2((−q)µ)+1 falls q < 0 und 0 ↦→ 1. Diese Abbildung ist bijektiv. 

Satz 20 Sei X eine Menge. Die Menge X und ihre Potenzmenge P(X) sind nicht 

gleichmächtig.


Beweis. Wenn X = ∅ ist, gilt P(X) = {∅}; in diesem Fall stimmt also die Behauptung, 

und wir können X = ∅ voraussetzen. 

Endliche Mengen A, B sind genau dann gleichmächtig, wenn |A| = |B| gilt. Wenn X end- 

lich ist, |X| = n, so ist bekanntlich |P(X)| = 2 n = n (warum? - Einen ganz wasserdichten 

Beweis können wir noch nicht liefern; siehe dazu ’vollständige Induktion’). Deshalb ist in 

diesem Fall P(X) nicht gleichmächtig zu X. 

Wir wollen aber den Satz für beliebige Mengen X = ∅ beweisen! 

Angenommen, ϕ : X → P(X) ist bijektiv. Setze A := {x ∈ X | x /∈ xϕ}. Dann ist 

A ∈ P(X), und da ϕ surjektiv ist, existiert ein z ∈ X mir zϕ = A. Wenn z /∈ zϕ ist, folgt 

z ∈ A = zϕ. Wenn z ∈ zϕ ist, folgt z ∈ zϕ = A, also z /∈ zϕ. Also folgt in beiden Fällen 

ein Widerspruch. 

Satz 21 Seien U und V gleichmächtige endliche Mengen und ϕ : U → V eine Abbildung. 

Folgende Aussagen sind äquivalent. 


(ii) ϕ ist surjektiv (nach V ). 

(iii) ϕ ist bijektiv (nach V ). 

Beweis. Da U und V gleichmächtig sind und U endlich, gilt n := |U| = |V | (vgl. 16). Es 

gelte (i). Dann sind U und ϕ(U) gleichmächtig, denn ϕ : U → ϕ(U) ist bijektiv. Deshalb 

gilt (siehe 16) |ϕ(U)| = n = |V |; wegen 16 also ϕ(U) = V , d.h. ϕ ist eine surjektive 

Abbildung nach V . Wir haben (i) ⇒ (ii) und (i) ⇒ (iii) bewiesen. 

Aus nicht(i) folgt nicht(ii) (also gilt: Aus (ii) folgt (i)): Angenommen, ϕ ist nicht injektiv. 

Dann gibt es a, b ∈ U mit a = b und aϕ = bϕ, und man hat ϕ(U \ {a}) = ϕ(U) = V , also 

|ϕ(U \ {a})| = n. Nach 16, b) gilt |V | = |ϕ(U)| = |ϕ(U \ {a})| ≤ |U \ {a}| < |U| (letztes 

< nach 16, c)). Es folgt V = ϕ(U), also ist ϕ nicht surjektiv nach V . 

Bemerkung Schon am Beispiel U = V = N kann man sehen, dass die Voraussetzung der 

Endlichkeit im vorigen Satz nicht überflüssig ist. 

Satz 22 Seien a, b ∈ R und a < b. Das durch a, b bestimmte abgeschlossene reelle Intervall 

ist [a, b] := {x ∈ R | a ≤ x ≤ b} (≤ bezeichnet die aus der Schule bekannte Anordnung der 

reellen Zahlen). Wir behaupten: Es gibt keine injektive Abbildung ϕ : I → N. 

Insbesondere ist keine Teilmenge von R, die ein abgeschlossenes Intervall [a, b] mit a < b 

enthält, abzählbar. 

Beweis. Es genügt, die Aussage für das spezielle Intervall [0, 1] zu beweisen. Denn wenn 

ϕ : I → N injektiv ist, so gilt das auch für die Abbildung ψ : [0, 1] → N,


xψ := (x(b − a) + a)ϕ (warum?). 

Beweis der Aussage unter der Annahme a = 0 und b = 1. 

Wir benutzen die Dezimaldarstellung x = 0, z1, z2.... einer reellen Zahl ∈ [0, 1], wobei keine 

unendliche Folge 999.... vorkomme. Wir schreiben also zum Beispiel für 0, 2649999999.... 

die Darstellung 0, 26500000..... Bei dieser Konvention ist die Dezimaldarstellung einer re- 

ellen Zahl eindeutig, d.h. zu verschiedenen Dezimaldarstellungen gehören verschiedene 

Zahlen. 

Angenommen, ϕ : [0, 1] → N ist eine injektive Abbildung. Dann ist auch die Restriktion 

ϕ| [0,1[ von ϕ auf das halboffene Intervall [0, 1[ := {x ∈ R | 0 ≤ x < 1} injektiv. Die Menge 

[0, 1) ist nicht endlich (sie enthält zum Beispiel alle Zahlen 2 −n , n ∈ N). Nach Satz 17 

gibt es eine Bijektion ψ : N → [0, 1), n ↦→ an = 0, zn,1zn,2..... (Dezimaldarstellung der 

Zahl nψ; also zn,j ∈ {0, ..., 9} und mit der oben beschriebenen Konvention). Wir setzen 

nun zn := 1 falls zn,n = 1 ist und zn := 0 falls zn,n = 1 ist. Sei a := 0, z1z2...... Dann steht 

rechts die Dezimaldarstellung einer reellen Zahl a, in der keine unendliche Folge 999... 

vorkommt. An der n-ten Stelle unterscheiden sich a und an, für jedes n ∈ N. Deshalb ist 

a = an = nψ für jedes n ∈ N. Also a /∈ ψ(N), wohl aber a ∈ [0, 1[ . Die Abbildung ψ ist 

also nicht surjektiv auf die Menge [0, 1[ , im Widerspruch zur Annahme. 

1.6.7 Der Gleichmächtigkeitssatz von Schröder und Bernstein 

Diesen Satz brauchen wir nicht, aber er ist so schön und einfach zu beweisen, dass wir ihn 

trotzdem erwähnen. 

Satz 23 (Satz von Schröder und Bernstein) Seien A, B Mengen. Wenn es eine in- 

jektive Abbildung A → B und auch eine injektive Abbildung B → A gibt, so ist A 

gleichmächtig zu B. 

Der Beweis beruht auf folgendem 

Lemma 24 Seien A, B Mengen mit B ⊆ A. Sei α : A → B eine injektive Abbildung. 

Dann gibt es eine Bijektion β : A → B (d.h. A ist gleichmächtig zu B). 

Beweis. Setze S0 := A \ B (= {a ∈ A | a /∈ B}). Dann gilt A = B ∪ S0 und B ∩S0 = ∅. Für 

jedes n ∈ N bezeichne α n := α...α die n-malige Nacheinanderausführung der Abbildung 

α. Man setze Sn := α n (S0); d.h. S1 = α(S0); S2 = α 2 (S0) = α(S1) und so fort. 

Setze S := {Sn | n ∈ N0}, also S = {y | es gibt n ∈ N0 mit y ∈ Sn }. 

Wir definieren β : A → B durch: 

xβ := xα falls x ∈ S; xβ := x falls x ∈ A \ S. 

(*) β : A → B ist bijektiv.


Beweis von (*). Es ist B wirklich (wie schon voreilig hingeschrieben) eine Zielmenge von 

β, denn für jedes x ∈ A gilt xα ∈ B; und wenn x ∈ A \ S ist, folgt insbesondere x ∈ S0, 

also x ∈ B. 

Behauptung: Die Abbildung β ist injektiv. 

Zum Beweis seien x, z ∈ A mit x = z vorgegeben. Falls x, z ∈ S ist, folgt 

xβ = xα = zα = zβ (=, da α injektiv ist). Falls x, z ∈ A \ S ist, folgt xβ = x = z = zβ. 

Falls x ∈ S und z ∈ A \ S ist, folgt xβ ∈ α(S) ⊆ S und zβ = z ∈ A \ S, also xβ = zβ. 

Behauptung: Die Abbildung β : A → B ist surjektiv auf B. 

Zum Beweis sei y ∈ B vorgegeben. Falls y /∈ S ist, folgt y = yβ. 

Nun liege der Fall y ∈ S vor. Dann existiert ein n ∈ N0 mit y ∈ Sn. Wegen y ∈ B folgt 

y /∈ S0, also n = 0. Nach Definition von Sn existiert ein x ∈ Sn−1 mit xα = y. Es folgt 

x ∈ S und dann xβ = xα = y. 

Beweis des Satzes von Schröder und Bernstein 

Die im Satz genannten Voraussetzungen mögen vorliegen. Dann gibt injektive Abbildungen 

ϕ : A → B und ψ : B → A. Die Abbildung ϕψ : A → ψ(B) ist dann injektiv. Nach dem 

Lemma ist also A gleichmächtig zu ψ(B) ⊆ A. Da ψ : B → ψ(B) bijektiv ist, ist ψ(B) 

gleichmächtig zu B. Nach der Transitivitätsregel für ’gleichmächtig’ folgt: A gleichmächtig 

zu B. 

1.7 Weiteres zu Relationen 

Wir haben schon den Begriff Relation eingeführt, um damit Abbildungen als spezielle 

Relationen zu definieren. Weitere spezielle Sorten von Relationen sind die auch schon 

eingeführten Äquivalenzrelationen und Ordnungsrelationen. 

Eine Relation R zwischen den Mengen U und V ist laut Definition eine Teilmenge 

R ⊆ U × V . 


1. U = V = N, R := {(u, v) ∈ N × N | u ≤ v}. D.h. u R v bedeutet u ≤ v (dabei bezeichne 

≤ die gewöhnliche Anordnung auf N, z. B. 3 ≤ 5). 

2. U = V := Menge aller Dreiecke in der euklidischen Ebene. R := {(u, v) ∈ U × U | u 

läßt sich durch eine Bewegung (=abstandstreue Abbildung) der euklidischen Ebene auf v 

abbilden; d.h. u kongruent zu v }. 

3. U := Menge der Punkte, V := Menge der Geraden der euklidischen Ebene. 

R := {(u, v) ∈ U × V | u inzidiert (=liegt auf) v } (Inzidenz).


4. U = V = Z, teilt:= {(u, v) ∈ Z × Z | u teilt v }. 

5. Für jede Menge A ist die Inklusion eine Relation auf der Potenzmenge P(A). Also 

R = {(M, N) ∈ P(A) | M ⊆ N }. 

6. Sei n ∈ N. Setze U := {u ∈ N | u teilt n }. Dann ist R := {(u, v) ∈ U × U | es 

gibt w ∈ N mit uw = v } eine Relation auf U (Man nennt U mit der Relation R den 

Teilerverband von n). 

7. U := Z. Sei m ∈ Z. Setze ≡:= {(u, v) ∈ Z × Z | m teilt v − u in Z }. Für u, v ∈ Z 

bedeutet also u ≡ v, dass v − u ein ganzzahliges Vielfaches von m ist. Man sagt dafür: u 

ist zu v kongruent modulo m. 

8. Sei ϕ : U → V eine Abbildung. Dann ist R := {(a, b) ∈ U | aϕ = bϕ } eine Relation 

auf U, genannt die Bildgleichheit unter ϕ. 

9. Für jede Menge A ist die Disjunkheit eine Relation auf der Potenzmenge P(A). Also 

R = {(M, N) ∈ P(A) | M ∩ N = ∅ }. 

Unter den Relationen haben wir besonders wichtige Sorten hervorgehoben: Abbildungen, 

Äquivalenzrelationen, Ordnungsrelationen. 

Definition 25 Eine Partition C einer Menge U ist eine Menge von Teilmengen von U 

(d.h. eine Teilmenge der Potenzmege von U) mit den Eigenschaften: (1) C = U, und 

(2) C ∩ C ′ = ∅ für alle C, C ′ ∈ C mit C = C ′ . 

Anders formuliert: Zu jedem u ∈ U existiert genau ein C ∈ C mit der Eigenschaft u ∈ C. 

Begriff Gegeben sei eine Äquivalenzrelation ∼ auf der Menge U. 

Für beliebiges u ∈ U setze [u] := [u]∼ := {w ∈ U | u ∼ w}. Man nennt [u] eine 

Äquivalenzklasse, genauer: die u enthaltende Äquivalenzklasse . Denn wegen u ∼ u gilt ja 

u ∈ [u]. 

Ein Element von [u] (d.h. ein zu u in Relation stehendes Element) heißt ein Vertreter 

der Äquivalenzklasse. Eine Teilmenge von U, die zu jeder Äquivalenzklasse genau einen 

Vertreter enthält, heißt ein Vetretersystem. 

Beispiel Auf Z betrachte die Äquivalenzrelation ≡ := kongruent modulo 7. D.h. u ≡ v 

bedeutet, dass v − u von 7 geteilt wird (in Z). Dann ist [3] = {3 + n7 | n ∈ Z}. Die Menge 

{0, 1, 2, 11, 10, 5, 20} ist ein Vertretersystem. Naheliegender wäre es, das Vertretersystem 

{0, 1, 2, 3, 4, 5, 6} hinzuschreiben. 

Beobachtung 26 Sei U eine Menge. a) Gegeben sei eine Äquivalenzrelation ≡ auf U.


Dann ist die Menge der Äquivalenzklassen, also die Menge C := {[u]∼ | u ∈ U}, eine 

Partition von U. 

b) Gegeben sei eine Partition C von U. Wir definieren die Relation ∼ auf U durch: 

u ∼ v ⇔ es gibt C ∈ C mit u, v ∈ C. Dann ist ∼ eine Äquivalenzrelation. 

Man kann die Aussagen a) und b) präziser so zusammenfassen: 

Sei U eine Menge. Sei ϕ die Abbildung von der Menge aller Äquivalenzrelationen auf U 

auf die Menge aller Partitionen auf U, welche definiert ist durch: 

∼ ↦→ {[u]∼ | u ∈ U} . 

Dann ist ϕ bijektiv. 

Statt mit Äquivalenzrelationen kann man also genausogut mit Partitionen argumentieren. 

Die Beweise ergeben sich geradeaus aus den Definitionen. 

1.7.2 Ordnungsrelationen, das Lemma von Zorn 

Auf der Menge U sei eine Ordnungsrelation ≤ gegeben. Man sagt, U, ≤ ist eine geordnete 

Menge. 

Definition 27 a) a ∈ U heißt ein minimales Element, wenn für alle u ∈ U gilt: u ≤ 

a ⇒ u = a. 

b) a ∈ U heißt ein kleinstes Element, wenn für alle u ∈ U gilt a ≤ u. 

Analog defininiert man ’maximales Element’ und ’größtes Element’. 

c) Eine Kette C (in U) ist eine Teilmenge von U, die (mit der auf U eingeschränkten 

Ordnungsrelation) vollständig geordnet ist (d.h. für alle a, b ∈ C gilt: a ≤ b oder b ≤ a). 

d) Sei T ⊆ U und s ∈ U. Wenn t ≤ s für jedes t ∈ T zutrifft, nennt man s eine obere 

Schranke von T . Analog ’untere Schranke’. 

Bemerkung Jedes kleinste Element ist minimal. Es gibt höchstens ein kleinstes Element. 

Satz 28 Sei U, ≤ eine endliche geordnete Menge. Dann enthält U mindestens ein maxi- 

males und ein minimales Eleemnt. 

Beweis. Da U endlich ist, ist auch die Potenzmenge von U endlich; insbesondere gibt es in 

U nur endlich viele Ketten. Unter diesen Ketten wähle eine, die möglichst viele Elemente 

enthält, C = {c1, ..., cn} (ci = cj für i = j). Je zwei Elemente von C sind vergleichbar; 

deshalb können wir die Elemente von C so numerieren, dass c1 ≤ c2 ≤ ... ≤ cn gilt. 

Behauptung: c1 ist ein minimales Element. Falls dies nämlich nicht zuträfe, so gäbe es


ein c0 ∈ U mit c0 ≤ c1 und c0 = c1. Daraus folgt c0 = c2, ..., cn, und wir hätten eine Kette 

{c0, ..., cn} mit n + 1 Elementen, im Widerspruch zur Wahl von C. 

Kommentar zum vorigen Satz und folgenden Lemma Wenn U, ≤ eine unendliche 

geordnete Menge ist, braucht es in U, ≤ kein maximales oder minimales Element zu geben 

(Beispiele?). Das folgende oft verwendete ’Zornsche Lemma’ sichert auch in diesem Fall 

unter der Zusatzvoraussetzung (s) die Existenz (mindestens) eines maximalen Elements. 

Die Voraussetzung (s) ist offenbar erfüllt, wenn U, ≤ endlich ist; deshalb ist der vorige 

Satz nur ein Spezialfall des Zornschen Lemmas. 

Geschichte: Das Zornsche Lemma taucht auf in Artikeln von Felix Hausdorff (1909, 1914) 

und wurde um 1935 durch Arbeiten von Max August Zorn (1906-1993) bekannt. 

Wir werden das Lemma später brauchen, um die Existenz einer Basis für einen beliebigen 

Vektorraum zu beweisen. 

Der Beweis des Zornschen Lemmas benutzt das ’Auswahlaxiom’. Umgekehrt: Wenn man 

das Zornsche Lemma als Axiom voraussetzt, kann man daraus das Auswahlaxiom bewei- 

sen. 

Wir beweisen das Zornsche Lemma hier nicht, da wir möglichst schnell bodenständige 

Sachverhalte vorstellen müssen. Für Interessierte: Artikel zum Zornschen Lemma auf mei- 

ner Internet-Seite. 

Lemma 29 (Zornsches Lemma) Sei U, ≤ eine geordnete Menge. 

Voraussetzung: (s) Zu jeder Kette C in U, ≤ gibt es eine obere Schranke s ∈ U (d.h. c ≤ s 

für alle c ∈ C). 

Behauptung: U enthält mindestens ein maximales Element. 

Korollar 30 Sei V eine Menge und X ⊆ P(V ) eine Teilmenge der Potenzmenge von V . 

Voraussetzung: Sei C eine Kette in der geordneten Menge X, ⊆. Dann gilt C ∈ X. 

Dann hat X, ⊆ (mindestens) ein maximales Element. 

Beweis. Die Voraussetzung im Korollar sichert nämlich, dass jede Kette C in der 

betrachteten geordneten Menge (mindestens) eine obere Schranke hat, nämlich C ∈ X. 

Die Voraussetzung (s) des Zornschen Lemmas ist also erfüllt. 

1.7.3 Zerlegung einer Abbildung in eine kanonische und eine injektive Abbil- 

dung 

Sei V eine Menge und ∼ eine Äquivalenzrelation auf V . Für v ∈ V bezeichnet [v] die 

Äquivalenzklasse, in welcher v liegt. Dann ist [ ] : V → P(V ), v ↦→ [v], eine Abbildung.


Man nennt sie die kanonische Abbildung zur Äquivalenzrelation ∼. 

Wichtigster Spezialfall 

Sei ϕ : V → X eine Abbildung. 

Auf V ist dann ’bildgleich unter ϕ ’ eine Äquivalenzrelation. Sei η : V → W ′ die 

kanonische Abbildung auf die Menge W ′ der Äquivalenzklassen (d.h. η ordnet jedem 

v ∈ V die Klasse der mit v unter ϕ bildgleichen Elemente zu); und sei ω : W ′ → W , 

[v] ↦→ vϕ (die Abbildung ω ist wohldefiniert, weil alle Elemente in [v] das gleiche 

ϕ-Bildelement vϕ haben). 

Dann gilt offenbar: ω ist injektiv, und ϕ = ηω. Wir haben also ϕ als Hintereinander- 

ausführung der kanonischen Abbildung η und der injektiven Abbildung ω geschrieben. 

Beispiel Die Wäscherei Frisch & Sauber erhält Wäschestücke 1, ..., n, welche mit 

unterschiedlichen Temperaturen 1ϕ, ..., nϕ ∈ {30 0 , 40 0 , 50 0 , 60 0 } gewaschen werden sollen. 

Dazu legt Frau Sauber alle 30 0 -Wäschestücke auf einen Haufen (wenn 1ϕ = 30 ist, so 

ist der Haufen die Äquivalenzklasse [1]),.... Schließlich ist auch der 60 0 -Haufen fertig. 

Damit hat sie die kanonische Abbildung η in die Praxis umgesetzt. Nun folgt noch 

die Abbildung ω, welche jedem Haufen die zuständige Temperatur zuordnet. Diese 

Abbildung ist eher uninteressant; die wirkliche Arbeit leistet Frau Sauber beim Sortieren 

in Äquivalenzklassen; danach muß Herr Frisch nur noch für jede Äquivalenzklasse die 

richtige Temperatur einstellen. 

1.8 Vollständige Induktion 

Voraussetzung Gegeben ist n0 ∈ Z. Für jedes n ∈ Z mit n ≥ n0 liege eine Aussage A(n) 

vor. 

Problem Wir vermuten, dass A(n) für alle n ∈ Z mit n ≥ n0 wahr ist. Wie können wir 

das beweisen? 

Idee Sei etwa n0 = 0. Wir wollen zum Beispiel zeigen, dass A(3). gilt. Das könnten wir 

durch Beweis der folgenden vier Aussagen erreichen: 

(*) A(0) gilt; A(0) ⇒ A(1) gilt; A(1) ⇒ A(2) gilt; A(2) ⇒ A(3) gilt. 

Denn aus der ersten und der zweiten Aussage folgt: A(1) stimmt; zusammen mit der 

dritten folgt: A(2) ist wahr; schließlich mit der vierten: A(3) trifft zu. 

Umfassender als Aussage zwei bis vier ist:


IS (Induktionsschritt) Für alle n ∈ Z mit n ≥ n0 gilt: A(n) ⇒ A(n + 1). 

Wenn A(n0) gilt und (IS), so gilt A(n) für alle Zahlen n ∈ Z mit n ≥ n0: 

Satz 31 (Prinzip der vollständigen Induktion) Die oben genannte Voraussetzung 

liege vor. Seien A(n0) und (IS) (siehe oben) wahr. Dann ist A(n) für alle Zahlen n ∈ Z 

mit n ≥ n0 wahr. 

Beweis. Wir benutzen (ohne es zu beweisen) das folgende 

Lemma Sei M ⊆ Z und n0 ∈ M und n0 ≤ m für alle m ∈ M. 

Es gelte (+) Für alle n ∈ Z gilt: n ∈ M ⇒ n + 1 ∈ M. 

Dann ist M = {n ∈ Z | n ≥ n0}. 

Für die Anwendung setzen wir M := {n ∈ Z | n ≥ n0 und A(n) ist wahr }. Dann ist 

n0 ∈ M wegen (A(n0)), und wegen (IS) trifft (+) auf M zu. Also ist M = {n ∈ Z | n ≥ n0} 

(Lemma), d.h. es gilt die Behauptung. 

Ergänzung (allgemeinere Formulierung). In 31 kann Voraussetzung (IS) ersetzt werden 

durch: 

(IS’) Für alle n ∈ Z mit n ≥ n0 gilt: [Wenn für jedes m ∈ Z mit n0 ≤ m < n die Aussage 

A(m) zutrifft, so folgt A(n)]. 

Beispiel Wir behaupten: n 2 ≥ 2n + 4 gilt für alle natürlichen Zahlen n ≥ 4. Beweis durch 

vollständige Induktion. 

Zunächst ist A(n0) für n0 := 4 offenbar richtig (16 ≥ 12). Nun beweisen wir Aussage (IS). 

Sei also n ∈ Z mit n ≥ n0 gegeben und A(n) wahr (Induktionsvoraussetzung). Wir müssen 

daraus A(n + 1) beweisen. 

Nun ist (n + 1) 2 = n 2 + 2n + 1 ≥ (wegen A(n)) 2n + 4 + 2n + 1 ≥ 2(n + 1) + 2n + 3 ≥ 

2(n + 1) + 4 (Letzteres wegen n ≥ 1). Wir haben A(n) gefolgert. 

Die Voraussetzungen im Satz 31 sind also erfüllt. Nach diesem Satz ist A(n) für alle A(n) 

mit n ≥ 4 wahr.

2 LINEARE GLEICHUNGSSYSTEME 28 

2 Lineare Gleichungssysteme 

Nachdem wir etliche noch recht leblose Begriffe und Definitionen behandelt haben, 

studieren wir nun etwas ganz Praktisches. 

2.1 Voraussetzungen 

Gegeben sei ein Körper K (zum Beispiel R oder C oder Q; genaueres später). 

Seien m, n ∈ N0 und aij ∈ K für alle Paare i, j mit i ∈ {1, ..., m} und j ∈ {1, ..., n}; sei 

bi ∈ K für i ∈ {1, ..., m}. 

Problem: Finde alle n-Tupel (x1, ..., xn) mit xi ∈ K und 

(∗) 

a11x1 + ... + a1nxn = b1 

..... .... 

..... .... 

am1x1 + ... + amnxn = bm 

Man nennt (*) ein lineares Gleichungssystem mit m Gleichungen und n Unbekannten. 

(x1, ..., xn) ∈ K n heißt eine Lösung von (*), wenn (*) erfüllt ist. Die Menge, welche 

aus allen Lösungen von (*) besteht, heißt Lösungsmenge von (*). Falls bi = 0 für alle 

i ∈ {1, ..., m} gilt, heißt das lineare Gleichungssystem homogen. 

2.2 Lösungsverfahren 

Wir ordnen dem linearen Gleichungssystem eine Matrix zu: 

⎛ 

⎞ 

a11 ... a1n | b1 

⎜ ... 

⎜ 

⎝ 

... 

am1 ... amn | bm 

Dadurch spart man das Hinschreiben der ’Unbekannten’ xi. Man nennt 

(∗∗) 

⎟ 

⎠ 

a11x1 + ... + a1nxn = 0 

..... .... 

..... .... 

am1x1 + ... + amnxn = 0


das zu (*) gehörende homogene Gleichungssystem. 

Satz Sei u = (u1, ..., un) eine Lösung von (*) und sei Y die Lösungsmenge von (**). Setze 

u + Y := {u + y = (u1 + y1, ..., un + yn) | y = (y1, ..., yn) ∈ Y }. 

Behauptung: u + Y ist die Lösungsmenge von (*). 

Beweis. 

(i) u + Y ⊆ Lösungsmenge (∗) 

Beweis (i). Sei y ∈ Y . Dann gilt ai1u1 + ... + ainun = bi und ai1y1 + ... + ainyn = 0 für alle 

i ∈ {1, ..., m}, also ai1(u1 + y1) + ... + ain(un + yn) = bi für alle i ∈ {1, ..., m}. 

(ii) u + Y ⊇ Lösungsmenge (∗). 

Beweis (ii). Sei z ∈Lösungsmenge (*). Dann y := z − u ∈ Y , also z = u + y ∈ u + Y . 

Aus (i) und (ii) folgt, dass die Mengen u + Y und die Lösungsmenge (*) gleich sind. 

Beobachtung Ein lineares Gleichungssystem ist besonders leicht lösbar, wenn die Matrix 

zu (*) folgende Form hat (reduzierte Treppenmatrix, Klammern weggelassen): 

(T) 

j1 j2 j3 jr 

0 ....0 1 ∗....∗ 0 ∗....∗ 0 ∗....∗ 0 ... | b1 

0 ...... .. ......0 1 ∗....∗ 0 ∗....∗ 0 ... | b2 

0 ...... .. ....... .. ....0 1 ∗....∗ 0 ... | b3 

0.. .. .. .. .. .. .. .....0 1 ∗... | br 

0.. .. .. .. .. .. .. .. .. ...0 | br+1 

0.. .. .. .. .. .. .. .. .. ...0 | 0 

0.. .. .. .. .. .. .. .. .. ...0 | 0 

D.h. aij = 0 für j < ji und ai ji = 1 für jedes i ∈ {1, ..., r} und ji < ji+1 für 

i ∈ {1, ..., r − 1}. Außerdem sind in der Spalte ji außer ai ji 

und es gilt br+1 = 0 oder br+1 = 1. 

: 

: 

= 1 alle Einträge gleich 0, 

Falls br+1 = 0, hat das lineare Gleichungssystem offenbar keine Lösung, die Lösungsmenge 

ist ∅. 

Warum kann man für ein lineares Gleichungssystem der Gestalt (T) leicht die Lösungs- 

menge bestimmen? Wir überlegen das an einem


Beispiel 

(T) 

0 1 7 0 0 0 | 3 

0 0 0 1 0 0 | 9 

0 0 0 0 1 6 | 2 

0 0 0 0 0 0 | 0 

Also j1 = 2, j2 = 4, j3 = 5, r = 3. Das zugehörige homogene lineare Gleichungssystem hat 

die Matrix (die letzte nur aus Nullen bestehende Spalte wird weggelassen) 

(Th) 

0 1 7 0 0 0 

0 0 0 1 0 0 

0 0 0 0 1 6 

0 0 0 0 0 0 

Jede beliebige Lösung des homogenen Gleichungssystem erhält man wie folgt. 

Die letzte Zeile (entsprechend der untersten Gleichung des Systems) braucht man nicht 

zu berücksichtigen: jedes Element des K n = K 6 ist eine Lösung. 

Die Lösungsmenge des homogenen Systems besteht aus den n-Tupeln (y1, ..., yn), welche 

jede der Gleichungen 1, ..., r erfüllen. Alle solche Tupel bekommen wir wie folgt. Der Ein- 

trag yj ist beliebig wählbar, falls j = j1, ..., jr ist. Dann ergibt sich yjr aus Gleichung 

Nummer r; yjr−1 

aus Gleichung r − 1;.....; yj1 aus Gleichung Nummer 1. 

In unserem Fall: r = 3, j1 = 2, j2 = 4, j3 = 5; also: y1, y3, y6 sind beliebig wählbar. Dann 

y5 = −6y6; y4 = 0; y2 = −7y3. 

Ergebnis: Die Lösungsmenge von Th ist 

Y = {(y1, −7y3, y3, 0, −6y6, y6) | y1, y3, y6 ∈ K} = 

{ y1(1, 0, ..., 0) + y3(0, −7, 1, 0, 0, 0) + y6(0, 0, 0, 0, −6, 1) | y1, y3, y6 ∈ K } = 

K(1, 0, ..., 0) + K(0, −7, 1, 0, 0, 0) + K(0, 0, 0, 0, −6, 1) 

Eine spezielle Lösung des Gleichungssystems zu (T) können wir sofort ablesen: 

u = (0, 3, 0, 9, 2, 0). Nach dem vorigen Satz kennen wir damit die Lösungsmenge Z von T : 

Z = u + Y = (0, 3, 0, 9, 2, 0) + K(1, 0, ..., 0) + K(0, −7, 1, 0, 0, 0) + K(0, 0, 0, 0, −6, 1). 

Aus dieser Beschreibung sollte klar sein, wie man allgemein die Lösungsmenge eines 

linearen Gleichungssystems mit reduzierter Treppenmatrix bestimmt.


2.3 Gauss-Verfahren 

Wie führt man das Lösen eines beliebigen linearen Gleichungssystems (*) auf das Lösen 

eines Gleichungssystems mit reduzierter Treppenmatrix zurück? 

Das Gauss-Verfahren für lineare Gleichungssysteme löst dieses Problem. 

Gegeben: (*). 

Eine gegebene m×k Matrix kann man durch ’elementare Zeilenumformungen’ in eine neue 

Matrix umwandeln. Als elementare Zeilenumformungen bezeichnet man die folgenden 

Umformungen. 

(E) Vertauschen von zwei Zeilen. 

(E’) Multiplizieren einer Zeile mit einem Faktor λ ∈ K \ {0}. 

(E”) Ersetzen der i-ten Zeile durch: i-te Zeile +λ · (j-te Zeile), wobei λ ∈ K ist und 

i, j ∈ {1, ..., m}, i = j. 

Satz Aus (*) entstehe durch eine elementare Zeilenumformung (der zugehörigen Matrix) 

ein neues Gleichungssystem (*’). Dann haben (*) und (*’) die gleichen Lösungsmengen. 

Wenn wir (*) lösen wollen, können wir also elementare Zeilenumformungen anwenden, 

um ein möglichst leicht zu lösendes Gleichungssystem herzustellen. Dieses hat nach dem 

Satz die gleiche Lösungsmenge wie (*). 

Satz vom Gauss-Verfahren. Jede Matrix läßt sich durch passende elementare Zeilenum- 

formungen in eine reduzierte Treppenmatrix umwandeln. 

Konstruktiver Beweis dieser Behauptung. 

Falls alle Matrixeinträge 0 sind, fertig. Sonst: 

(S) Suche Spalte mit kleinstem Index j1, in der ein Eintrag ai j1 = 0 ist. 

Durch (E) erreiche a1 j1 = 0; durch (E’) a1 j1 = 1. Durch (E”) erreiche ai j1 

i = 2, ..., m. 

= 0 für alle 

Nun wende (S) an auf die ’Restmatrix’ (aij) mit i > 1 und j > j1 (falls diese Einträge = 0


hat, sonst fertig). Man erhält zuletzt eine Matrix der Form 

j1 j2 j3 jr 

0 ....0 1 ∗....∗ ∗ ∗....∗ ∗ ∗....∗ ∗ ... | ∗ 

0 ...... .. ......0 1 ∗....∗ ∗ ∗....∗ ∗ ... | ∗ 

0 ...... .. ....... .. ....0 1 ∗....∗ ∗ ... | ∗ 

0.. .. .. .. .. .. .. .....0 1 ∗... | ∗ 

0.. .. .. .. .. .. .. .. .. ...0 | ∗ 

0.. .. .. .. .. .. .. .. .. ...0 | 0 

0.. .. .. .. .. .. .. .. .. ...0 | 0 

Also eine Treppenmatrix mit Einsen vorn an den Stufen. Anwenden von (E”) liefert eine 

’reduzierte Treppenmatrix’, d.h. in den Spalten, die zu den Vorderkanten der Stufen 

gehören, sind außer einer 1 nur Nullen. 

Zusammenfassung Aufgabe: Finde die Lösungsmenge eines linearen Gleichungssystems 

(*). Mit dem im vorigen Beweis beschriebenen Algorithmus erhält man ein Gleichungs- 

system (T) mit reduzierter Treppenmatrix. Dieses hat die gleiche Lösungsmenge wie (*). 

Die Lösungsmenge von (T) kann man (wie oben erklärt) leicht ohne Rechnung angeben. 

Vorschau und Kritik Ein kritischer Leser spürt die zwar praktische und numerisch ef- 

fektive aber doch etwas behelfsmäßige Abhandlung linearer Gleichungssysteme in diesem 

Kapitel. Eleganz und Weitblick fehlen mangels passender Begriffe, die das Problem struk- 

turieren. Deshalb kommen wir später auf dieses Kapitel zurück im Rahmen des Themas 

’Lineare Abbildungen’. 

: 

:

3 WICHTIGE ALGEBRAISCHE STRUKTUREN 33 

3 Wichtige algebraische Strukturen 

Definition 32 (Verknüpfung) Sei G eine Menge. Eine Verknüpfung auf G ist eine Ab- 

bildung ϕ : G × G → G . 

Eine Verknüpfung auf einer Menge G ordnet also jedem Paar von Elementen aus G ein 

Element von G zu. 

Schreibweise g · h oder g ◦ h oder gh statt ϕ ((a, b)). 

Wenn ϕ kommutativ ist, d.h. ϕ ((a, b)) = ϕ ((b, a)) für alle a, b ∈ G, schreibt man oft a + b 

statt ϕ ((a, b)). 

Algebra kann man als Lehre von Strukturen mit Verknüpfungen ansehen. 


1. (N, ggT) 

2. (N, kgV) 

3. (Z, +) 

4. (Z, ·) 

5. Für jede Menge X X (Menge aller Abbildungen X → X), ist ◦ (Nacheinander- 

ausführung von Abbildungen) eine Verknüpfung. 

6. Menge aller Permutationen auf einer beliebigen Menge X mit ◦ 

7. Für jede Menge X ist (P(X), ∪) eine Verknüpfung d.h. ϕ ((A, B)) = A ∪ B 

Definition 33 (Halbgruppe) Sei G eine Menge und · : G × G → G eine Verknüpfung 

auf G. Man nennt (G, ·) eine Halbgruppe, wenn · assoziativ ist, d.h. wenn gilt: 

(a · b) · c = a · (b · c) ∀a, b, c ∈ G. 

Das bedeutet, es kommt nicht darauf an, in welcher Reihenfolge · ausgeführt wird, und 

deshalb kann man die Klammern weglassen. 

Definition 34 (neutrales Element) Sei (G, ·) eine Halbgruppe und e ∈ G. Nenne e 

neutrales Element, wenn für alle a ∈ G gilt a · e = a = e · a . 

Satz 35 In einer Halbgruppe existiert höchstens ein neutrales Element.


Wir können also ’das neutrale Element’ sagen, wenn es überhaupt eines gibt. 

Beweis. Angenommen, e und e ′ sind neutrale Elemente der Halbgruppe G, ·. Dann gilt 

e · e ′ = e und auch e · e ′ = e ′ . Also e = e ′ . 

Schreibweisen Statt (G, ·) auch G, ·, oder nur G. Bei · ist 1 , bei + ist 0 als Bezeichnung 

für ein neutrales Element üblich. 


1. (N, +) ist eine Halbgruppe ohne neutrales Element (aber (Z, +) hat das neutrales Ele- 

ment 0). 

2a). Sei X beliebige Menge. Dann ist X X (die Menge aller Abbildungen X → X) mit 

◦ eine Halbgruppe mit neutralem Element idX (denn α ◦ idX = α für alle Abbildungen 

α : X → X). 

2b). Sei X endlich, G := {α | α : X → X nicht bijektiv }. Dann ist (G, ◦) eine 

Halbgruppe, die kein neutrales Element hat (da idX /∈ G). 

Definition 36 (Gruppe) Man nennt (G, ·) eine Gruppe, wenn gilt: (G, ·) ist eine Halb- 

gruppe mit einem neutralen Element e, und wenn gilt (Existenz eines Rechtsinversen): 

Zu jedem a ∈ G existiert ein b ∈ G mit ab = e. 

Lemma 37 (Eindeutigkeit des inversen Elements) Sei G, · eine Gruppe und e das 

neutrale Element. Sei a ∈ G. Dann existiert genau ein b ∈ G mit ab = e. Für dieses 

Element gilt auch ba = e. 

Bezeichnung Man nennt b das inverse Element zu a; Schreibweise: a −1 bei Verknüpfung 

·; −a bei Verknüpfung +. 

Beweis des Satzes. (i) Für alle a, b ∈ G gilt: ab = e ⇒ ba = e. 

Beweis (i). Es gibt c ∈ G mit bc=e. Nun folgt: e = bc = bec = babc = bae = ba. 

(ii) Für alle a, b, b ′ ∈ G gilt: ab = e = ab ′ ⇒ b = b ′ . 

Beweis (ii). b = be = bab ′ = (wegen (i)) eb ′ = b ′ . 

Lemma 38 (Rechenregeln in einer Gruppe) Sei (G, ·) eine Gruppe und e das neu- 

trale Element. 

(i) (Links- und Rechtskürzungsregel) Für alle a, b, c ∈ G gilt: ab = ac ⇒ b = c; und


ba = ca ⇒ b = c. 

(ii) Es gibt zu gegebenen a, b ∈ G genau ein x ∈ G mit ax = b (nämlich x = a −1 b); analog 

für ya = b). 

(iii) Für alle a, b ∈ G gilt: (ab) −1 = b −1 a −1 . 

Schreibweise/Lemma Sei (G, ·) Gruppe, e neutrales Element. Für a ∈ G und n ∈ N0 

setze a n := a · · · · · a (n-mal) und a 0 = e. Für n ∈ Z mit n < 0 setze a n := a −1 · · · · · a −1 

(−n-mal). 

Für alle n, m ∈ Z und a ∈ G gilt bei dieser Festsetzung: a n+m = a n · a m . 

Insbesondere a · a −1 = e = a −1 · a, d.h. a kommutiert mit seinem Inversen. 

3.0.3 Beispiele für Gruppen 

1. (Z, +) 

2. (Q, +) , (Q\ {0} , ·) 

3. (R, +) , (R\ {0} , ·) 

4. Sei X beliebige Menge. ℘X := Menge der Permutation auf X mit ◦ (Nacheinander- 

ausführung) (℘X, ◦) ist Gruppe (”symmetrische Gruppe auf X”) 

5. Die Menge der Bewegungen (abstandserhaltende Bijektionen R 2 → R 2 der euklidi- 

schen Ebene), mit ◦. 

Definition 39 (Untergruppe) Sei G, · eine Gruppe mit neutralem Element e. Eine 

Gruppe (U, ∗) heißt Untergruppe von G, wenn gilt: (1) U ⊆ G, (2) e ∈ U, (3) ·|U×U = ∗; 

d.h. die Verkn¨pfung ∗ ist die Restriktion der Verknüpfung · von G. 

Konvention ∗ und · werden nicht unterschieden. 

Lemma 40 (Untergruppenkriterium) Sei (G, ·) eine Gruppe und U ⊆ G. Genau 

dann ist U eine Untergruppe, wenn gilt: U = ∅, und für alle a, b ∈ U ist ab ∈ U und 

a −1 ∈ U. 


1. U := {2n | n ∈ Z} ist Untergruppe von (Z, +) 

2. (Q\ {0} , ·) ist Untergruppe von (R\ {0} , ·)


Beobachtung 41 (Schnitt einer Menge von Untergruppen) Sei (G, ·) eine Grup- 

pe und sei C eine Menge von Unterguppen von (G, ·) mit C = ∅. Dann ist 

eine Untergruppe von (G, ·) . 

C := {g ∈ G | g ∈ U für alle U ∈ C} 

Korollar 42 Sei (G, ·) eine Gruppe und X ⊆ G. Wir setzen 

C := {U | U Untergruppe von G mit X ⊆ U} . 

Dann ist C eine Untergruppe von (G, ·) mit X ⊆ C. 

Für alle Untergruppen U ′ von G mit X ⊆ U ′ folgt C ⊆ U ′ . Das bedeutet: C ist 

bezüglich ⊆ die kleinste Untergruppe von (G, ·) die X umfaßt). 

Bezeichnung Die Untergruppe C im vorigen Korollar heißt die von X erzeugte Unter- 

gruppe (in G). Sie wird mit 〈X〉 bezeichnet. 


1. G := (Z, +) 

Für jedes m ∈ Z ist mZ := {mx | x ∈ Z} eine Untergruppe von (Z, +) 

2. ρ := Spiegelung an x-Geraden der euklidischen Ebene 

σ := Spiegelung an y-Geraden der euklidischen Ebene 

G := Gruppe der Permutationen auf der Menge R 2 . 

X := {ρ, σ}. 

Dann ist 〈X〉 = {id, ρ, σ, ρσ} die von X in G erzeugte Untergruppe (ρσ ist die 

Spiegelung am 0-Punkt). 

Lemma 43 (Regeln für das Erzeugnis) Seien G eine Gruppe und X, Y ⊆ G. Dann 

gilt: 

(a) 〈〈X〉〉 = 〈X〉 

(b) Für jede Untergruppe U von G gilt: X ⊆ U ⇔ 〈X〉 ⊆ U 

(c) X ⊆ Y ⇒ 〈X〉 ⊆ 〈Y 〉 

Die Definition des Gruppenerzeugnis ist recht abstrakt; man muß den Durchschnitt bil- 

den über eine im allgemeinen unendliche Menge von Untergruppen. Eine konstruktive 

Beschreibung liefert der folgende Satz.


Satz 44 (Beschreibung des Gruppen-Erzeugnis) Sei (G, ·) eine Gruppe und X ⊆ 

G. Es ist 

〈X〉 = {x ε1 

1 

· · · · · xεm 

m | m ∈ N0, xi ∈ X, εi ∈ {1, −1}} . 

D.h. die Elemente von 〈X〉 sind genau Produkte (beliebiger Länge ∈ N0 ) mit Faktoren x 

oder x −1 (x ∈ X). 

Dabei wird festgesetzt: Das Produkt der Länge 0 (das einzige, welches im Fall X = ∅ 

auftritt) ist gleich 1 (neutrales Element von G). 


Sei Ω := Menge aller Geradenspiegelungen in der euklidischen Ebene Für jedes ρ ∈ Ω gilt 

ρ 2 = id, d.h. ρ −1 = ρ. Nach dem vorherigem Satz gilt 〈Ω〉 = {ρ1 ◦ ... ◦ ρm | m ∈ N0, ρi ∈ 

Ω}. Man kann zeigen, dass 〈Ω〉 die Gruppe aller Bewegungen ist (Bewegungsgruppe): 

Jede Bewegung kann man als Produkt von Geradenspiegelungen schreiben. Genauer gilt: 

〈Ω〉 = {ρ1 ◦ · · · ◦ ρm | m ∈ N0, ρi ∈ Ω} = {ρ1 ◦ · · · ◦ ρm | m ∈ N≤3, ρi ∈ Ω}. Jede Bewegung 

ist also ein Produkt von 2 oder 3 Geradenspiegelungen (jede Geradenspiegelung ist auch 

ein Produkt von 3 passenden Geradenspiegelungen). 

3.0.7 Permutationen auf einer endlichen Menge 

Definition 45 Sei n ∈ N. Mit Sn bezeichnet man die symmetrische Gruppe auf n Ele- 

menten , das ist die Gruppe aller Permutationen auf {1, . . . , n}. ⎧ 

⎪⎨ k falls k = i, j 

Für alle (i, j) ∈ N≤n × N≤n mit i = j sei τi,j : N≤n → N≤n, k ↦→ j falls k = i 

⎪⎩ 

i falls k = j 

Man nennt τi,j die Transposition, welche i und j vertauscht. 

Wir sehen τ 2 ij = τij ◦ τij = id . 

Für die Menge T aller Transpositionen in Sn gilt: 

Satz 46 〈T 〉 = Sn. 

〈T 〉 = {τ (1) · · · · · τ (m) | m ∈ N0, τ (i) ∈ T } 

Der Satz sagt, dass man jede Permutation (auf einer endlichen Menge) als Nacheinan- 

derausführung von Transpositionen schreiben kann. Es gilt sogar die Verschärfung: jede 

Permutation kann man als Produkt von Transpositionen der Form τi,i+1 schreiben. 

Anschaulich bedeutet dies: Wenn man Bücher im Regal der Größe nach anordnen will 

(was natürlich ziemlich blöd ist), kann man dies erreichen durch mehrfaches geeignetes


Vertauschen benachbarter Bücher. 

3.0.8 Zyklische Gruppen 

Sei (G, ·) eine Gruppe und a ∈ G. Dann ist 

〈a〉 := 〈{a}〉 = {a k | k ∈ Z} 

die von der einelementigen Menge {a} erzeugte Untergruppe. Eine Gruppe, die von nur 

einem Element erzeugt wird (präzise: von einer einelementigen Menge), nennt man eine 

zyklische Gruppe. 

Wenn es ein n ∈ N mit a n = 1 gibt, so folgt: 

a i · a n−i = 1 für alle i ∈ Z, also 〈a〉 = 1, a, a 2 , . . . , a n−1 . 


1. Sei a die Drehung (der euklidischen Ebene) mit 0 als Zentrum zum Winkel 2π 

n 

(n ∈ N). Dann ist 〈a〉 = {id, a, a 2 , ..., a n−1 }, und die aufgeführten Elemente sind paarweise 

verschieden. 

2. In S4 sei a := 

1 2 3 4 

2 3 4 1 

3. In (Z, +) ist 〈2〉 = {2k | k ∈ Z} = 2Z. 

3.0.10 Nebenklassen in einer Gruppe 

 

; dann a 4 = a ◦ a ◦ a ◦ a = id : 〈a〉 = id, a, a 2 , a 3 . 

Sei (G, ·) eine Gruppe und U eine Untergruppe. Definiere eine Relation ∼ auf G durch: 

g1 ∼ g2 ⇔ g −1 

1 g2 ∈ U 

Dann ist ∼ eine Äquivalenzrelation. Die Äquivalenzklassen sind die Mengen 

gU := {gu | u ∈ U}, 

wobei g ∈ G ist. Man nennt gU eine Linksnebenklasse nach U. Offenbar ist g = g · 1 ∈ gU: 

d.h. gU ist die g enthaltende Äquivalenzklasse der Äquivalenzrelation ∼.



1. Sei G := (Z, +) , q ∈ N, U := qZ. g1 ∼ g2 heißt −g1 + g2 ∈ qZ, d.h. q teilt g1 − g2 (in Z). 

Die Linksnebenklassen sind 

g + qZ = {g, g + q, g − q, g + 2q, g − 2q, . . . } 

2. Man stelle sich die reelle affine Ebene vor. 

Sei (G, +) := R 2 , + . Für a = (a1, a2) ∈ R 2 \ {(0, 0)} ist Ua := R·a := {(λa1, λa2) | λ ∈ R} 

eine Untergruppe von (R 2 , +) (die Gerade durch 0 und a). Linksnebenklassen nach Ra in 

der Gruppe R 2 sind die Mengen b + Ra (mit b ∈ R 2 ). 

Anschaulich ist das die zu Ra parallele Gerade durch den Punkt b. 

Jeder Punkt b ∈ R 2 liegt in genau einer Nebenklasse (Parallelen) zu Ra, nämlich b + Ra. 

Für alle b, c ∈ R 2 gilt: 

b + Ra = c + Ra ⇔ b − c ∈ Ra 

Um die Idee zu präziseren, definiert man: Die affine Ebene (zu R 2 ) ist das Tripel (P, L, I), 

wobei P := R 2 Punktmenge heißt; L := {b + Ra | a ∈ R 2 , a = (0, 0), b ∈ R 2 } nennt man 

die Geradenmenge; die Relation I := {(a, Γ) | a ∈ P, Γ ∈ L und a ∈ Γ} ⊆ P × L nennt 

man Inzidenz. 

Allgemeinere affine Räume definieren wir später. 

Satz 47 (Satz von Lagrange) Sei G, · eine endliche Gruppe und U eine Untergruppe. 

a) Je zwei Linksnebenklassen nach U enthalten genau |U| Elemente. 

b) Mit G : U (in der Literatur auch |G : U|) bezeichnen wir die Anzahl der Linksne- 

benklassen von U (nach G). Dann gilt |G| = |U| · (G : U). Insbesondere ist die Ordnung 

(=Mächtigkeit) einer Untergruppe U ein Teiler der Ordnung der Gruppe. 

Korollar 48 Eine endliche Gruppe G, · von Primzahlordnung hat keine Untergruppen 

außer G und {1}. 

Korollar 49 Eine endliche Gruppe G, · von Primzahlordnung ist eine zyklische Gruppe. 


1. Untergruppe {id, ρ, ρ 2 } von S3 = id, τ12, τ23, τ31, ρ, ρ 2 mit ρ = 

1 2 3 

2. G := Menge der Bewegungen, die ein Einheitsquadrat auf sich abbilden 

2 3 1


(-1, 1) (1, 

1) 

(-1, -1) 

σ4 

(1, 

-1) 

σ3 σ2 

 

1 2 

4 3 

 

 

❅ ❅ 

❅❅❅❅❅ 

Mit σ1, ..., σ4 bezeichnen wir die Spiegelung an der so in der Skizze markierten 

Geraden. 

Es ist G = id, σ1, σ2, σ3, σ4, ρ, ρ 2 , ρ 3 (dabei bezeichne ρ := σ1σ2 = σ2σ3 = σ3σ4 

die Drehung um 90 ◦ ). Die Teilmenge U := id, ρ, ρ 2 , ρ 3 ist eine Untergruppe von G. 

Linksnebenklassen nach U : 

id · U = U; ρU = U (da ρ ∈ U); 

σ1U = {σ1id = σ1, σ1ρ = σ1σ1σ2 = σ2, σ1ρ 2 = σ1(σ1σ2)(σ2σ3) = σ3, σ1ρ 3 = 

σ1(σ1σ2)(σ2σ3)(σ3σ4) = σ4} = {σ1, σ2, σ3, σ4}. 

Nach dem Satz von Lagrange ist G : U = 2. Da wir schon zwei Linksnebenklassen 

gefunden haben (U und {σ1, σ2, σ3, σ4}) haben wir alle. Es gilt σ1U = σ2U = σ3U = 

σ4U. 

3. Sei q ∈ N0. Dann bezeichnet Z/qZ := die Menge aller (Links-)Nebenklassen von 

(Z, +) nach der Untergruppe qZ. Wir setzen (für n ∈ Z) ¯n := n + qZ. Das ist die 

Äquivalenzklasse, die n ∈ Z enthält, also ¯n = {n, n + q, n − q, n + 2q, n − 2q, . . . }. 

Es gilt 

Z/qZ = ¯0, ¯1, . . . , q − 1 falls q = 0, sonst Z/qZ= { ¯n| n ∈ Z} [für q = 0 ist qZ= {0}, 

also ¯n = n + qZ = n + {0} = {n}]. 

Für alle a, b, c, d ∈ Z gilt ā = ¯ b und ¯c = ¯ d ⇒ ā + ¯c = ¯ b + ¯ d. 

Deshalb ist auf Z/qZ die Verknüpfung: ā+¯c := a + c wohldefiniert. Es gilt: (Z/qZ, +) 

ist eine Gruppe. Sie ist zyklisch und hat die Ordnung q; denn Z/qZ = 〈¯1〉 . 

Wenn q = 0 ist, gilt Z/qZ = ¯0, ¯1, ¯2, . . . , q − 1 

Analog kann man · auf Z/qZ definieren: ā · ¯ b = a · b. Eine Struktur wie (Z/qZ, +, ·) 

nennt man einen Ring (genaue Definition folgt). 

σ1


3.0.13 Beispiel: Standuntergruppe, Transitivitätsgebiet 

Sei G eine Untergruppe der symmetrischen Gruppe Sn (n eine natürliche Zahl). Sn ist 

endlich; genauer: |Sn| = n!. Sei p ∈ {1, ..., n} . Man setze U := Gp := {ϕ ∈ G | pϕ = p}. 

Man nennt U die Standuntergruppe von p, auch den Stabilisator von p. Für alle Elemente 

ϕ, ψ ∈ G gilt: 

pϕ = pψ ⇔ ϕψ −1 ∈ U ⇔ ψϕ −1 ∈ U ⇔ ϕ ∈ Uψ ⇔ ψ ∈ Uϕ ⇔ Uϕ = Uψ 

d.h. ϕ und ψ liegen in der gleichen Linksnebenklasse von U in G. Man nennt pG := 

{pπ | π ∈ G} das Transitivitätsgebiet von p unter G. Das Transitivitätsgebiet von p unter 

G hat nach der obigen Äquivalenz genausoviele Elemente, wie es Linksnebenklassen von U 

in G gibt. Diese Anzahl ist |G|/|U|. Ergebnis: |G| = |Gp|·|pG|. D.h. die Ordnung von G ist 

das Produkt der Ordnung der Standuntergruppe von p multipliziert mit der Mächtigkeit 

des Orbits von p. 

3.1 Ringe und Körper 

Definition 50 (Ring) Ein Ring ist ein Tripel (R, +, ·) derart, dass (R, +) eine abelsche 

(= kommutative) Gruppe ist und (R, ·) eine Halbgruppe und die Distributivgesetze gelten: 

a (b + c) = ab + ac, und 

(b + c) a = ba + ca 

für alle a, b, c ∈ R. Das Tripel (R, +, ·) heißt kommutativer Ring, wenn (R, ·) kommu- 

tativ ist. 

Wir betrachten nur Ringe, in denen (R, ·) ein neutrales Element 1 hat. Es darf 1 = 0 sein; 

dann folgt R = {0}. Auch dann hat man einen Ring mit Einselement. 

Fortsetzung der Definition Man nennt T einen Teilring des Ringes (R, +, ·), wenn 

T ⊆ R ist, und T mit den Restriktionen von + und · auf T × T ein Ring ist, und 1 ∈ T 

gilt. 

Ein Schiefkörper ist ein Ring (R, +, ·) , für den (R\ {0} , ·) eine Gruppe ist (d.h. zu jedem 

a ∈ R\ {0} ex. b ∈ R mit ab = 1). 

Einen Schiefkörper, der bezüglich · kommutativ ist, nennt man Körper. In einem kom- 

mutativen Ring nennt man a ∈ R heißt invertierbar , auch eine Einheit, wenn es b ∈ R 

gibt, mit ab = 1. 

In einem kommutativen Ring nennt man a ∈ R einen Nullteiler, wenn es ein b ∈ R\ {0} 

gibt mit ab = 0.



1. (Z, +, ·) ist ein kommutativer Ring, kein Körper. Einziger Nullteiler ist 0. Die Menge 

der Einheiten ist {1, −1}. 

2. (Q, +, ·) und (R, +, ·) sind Körper . 

3. Der Ring M der 2 × 2−Matrizen über R 

M := 

a11 a12 

a12 a22 

aij ∈ IR 

Genau genommen, ist M die Menge der Abbildungen {1, 2} × {1, 2} → IR, (i, j) ↦→ 

aij. Man definiert + auf M durch 

 

a11 . . . b11 . . . a11 + b11 

+ 

:= 

. . . . . . . . . . . . 

a12 + b12 

 

 

a21 + b21 a22 + b22 

Damit ist (M, +) eine abelsche Gruppe wie IR4 , + mit neutralem Element 

 

0 0 

. 

0 0 

Man definiert · auf M durch 

 

a11 a12 b11 b12 a11b11 + a12b21 a11b12 + a12b22 

· 

:= 

a21 a22 

b21 b22 

a21b11 + a22b21 a21b12 + a22b22 

Nun kann man nachrechnen, dass (M, +, ·) ein 

 

nicht-kommutativer 

 

Ring ist. Es gibt 

1 0 

ein neutrales Element bzgl. ·, nämlich 1 = . Es gibt Nullteiler = 0 = 

0 1 

 

0 0 

. Zum Beispiel gilt 

0 0 

1 0 

0 0 

 

· 

0 0 

1 0 

 

= 

0 0 

Bemerkung Anstelle von R in der vorigen Konstruktion kann man einen beliebigen 

Körper nehmen. 

0 0 

3.1.2 Elementare Konstruktion der komplexen Zahlen 

Setze C := R 2 . Auf C definiere man + und · durch 

(α, β) + (γ, δ) := (α + γ, β + δ) 

(α, β) · (γ, δ) := (αγ − βδ, αδ + βγ)


(auf der rechten Seite ist + und · von R zu nehmen.) Man rechnet nach, dass C ein Körper 

ist, genannt der Körper der komplexen Zahlen. Es ist 1 := (1, 0) das neutrale Element 

bezüglich · und 0 := (0, 0) das neutrale Element bezüglich +. Für i := (0, 1) gilt i 2 = −1. 

Jede reelle Zahl α ∈ R kann man auf (α, 0) ∈ C abbilden. Diese Abbildung R → C ist 

injektiv und mit den Verknüpfungen verträglich: (α, 0)·(β, 0) = (αβ, 0) und (α, 0)+(β, 0) = 

(α + β, 0) (links Verkn¨pfung in C, rechts in R). Deshalb kann man die reelle Zahl α ∈ R 

zu (α, 0) umtaufen (’identifizieren’) und hat dann R als Unterkörper in C. 

Man nennt (α, 0) den Realteil von (α, β) ∈ C und (β, 0) den Imaginärteil von (α, β). Es 

gilt (α, β) = (α, 0)(1, 0) + (β, 0)(0, 1) = (α, 0)1 + (β, 0)i = α1 + βi mit der oben genannten 

Identifikation. 

3.1.3 Einheiten in Z/qZ 

Sei q ∈ Z \ {0}. Es ist Z/qZ ein Ring. 

Wann ist ā = a + qZ in Z/qZ eine Einheit? 

Das bedeutet, es gibt b ∈ Z mit ā ¯ b = 1 (= 1 + qZ). Äquivalent dazu ist ab ∈ 1 + qZ. D.h. 

es gibt ein z ∈ Z mit ab = 1 + qz, d.h. ab + (−z) q = 1. 

Ergebnis: ā ist Einheit in Zq genau dann, wenn es ein y ∈ Z gibt mit ab + yq = 1. 

Falls ggT (q, a) = 1 ist, gibt es bekanntlich b, y ∈ Z mit ab + yq = 1. Dann ist also ā eine 

Einheit. 

Umgekehrt gilt: Wenn ā Einheit ist, so folgt ggT (a, q) = 1. 

Denn wenn ā Einheit ist, existiert b, y ∈ Z mit ab + yq = 1. Wenn p ein gemeinsamer 

Teiler von a und q ist, folgt p teilt 1, also p = 1 oder −1. 

Resultat: 

Die Menge der Einheiten in Zq ist {ā| a ∈ N0, 0 ≤ a ≤ q − 1, ggT (a, q) = 1}. 

Folgerung Sei q ∈ N Primzahl. Dann gilt ggT (a, q) = 1 für alle 1, 2, . . . , q − 1. Nach 

dem obigen Ergebnis ist jedes ā ∈ Zq\ {0} eine Einheit. Also ist Zq ein Körper. 

Korollar 51 Zu jeder Primzahl q ∈ N existiert ein endlicher Körper K mit |K| = q, 

nämlich Z/qZ , +, ·. 

3.1.4 Polynomring über einem Körper 

Sei K ein Körper. 

In der Schule verbindet man mit einem Polynom anx n + an−1x n−1 + . . . + a0 (wobei 

ai ∈ K ist) eine Abbildung. Wie kann man anx n +an−1x n−1 +. . .+a0 makellos definieren? 

Eine Abbildung p : N0 → A (A eine beliebige Menge) nennt man eine Folge und schreibt


oft ai für ip. 

Definition 52 (Polynome) Ein Polynom (über dem Körper K) ist eine Folge N0 → K, 

für die {n ∈ N0 | an = 0} endlich ist. Die Menge der Polynome über K bezeichnet man 

mit K[x] (auch K[y] oder ähnlich). 

Formal geschrieben ist also K[x] = {p ∈ K N0 | {n ∈ N0 | np = 0} ist endlich}. 

Manchmal nennt man Folgen (mit Folgegliedern in K), bei denen nur endlich viele 

Folgeglieder = 0 sind, auch abbrechende Folgen. Ein Polynom ∈ K[x] ist also eine 

abbrechende Folge mit Gliedern ∈ K. Für jedes Polynom (ai) existiert ein n ∈ N mit 

am = 0 für alle m > n. Man kann eine solche Folge mit dem n-Tupel (a0, a1, ...., an) 

identifizieren. 

Das konstante Polynom mit 0 als einzigem Element (d.h. die Folge 0,0,0,....) heißt 

Nullpolynom. Für ein Polynom (ai), welches nicht das Nullpolynom ist, nennt man das 

minimale n ∈ N0 mit an = 0 aber am = 0 für alle m > n den Grad des Polynoms . Für 

das Nullpolynom wird kein Grad definiert. 

Wir definieren Verknüpfungen + und · auf K[x]. Für p, q ∈ K [x] setze p + q ∈ K [x] fest 

durch 

p + q : N0 → K, i ↦→ p (i) + q (i) 

D.h. wenn p = (a0, a1, . . .) und q = (b0, b1, . . .) ist, gilt p + q = (a0 + b0, a1 + b1, . . .). Für 

p, q ∈ K [x] setze p · q ∈ K [x] fest durch 

p · q : N0 → K, i ↦→ 

i 

p (k) · q (i − k) . 

Diese Multiplikation bezeichnet man als die Cauchy-Multiplikation. Es gilt: 

(K [x] , +, ·) ist ein kommutativer Ring, der Polynomring K[x], +, · über K. Der Körper 

K steckt als Teilring in K [x]: jedes c ∈ K identifiziere mit dem Polynom (c, 0, 0, 0, . . .). 

(d.h. p (0) = c und p (i) = 0 für alle i ∈ N). Bezeichnung: konstantes Polynom c. 

Das 0-Element des Polynomrings ist die Folge 0, 0, 0, ....; das Einselement die Folge 

1, 0, 0, ..... 

Setze x := (0, 1, 0, 0, . . .) , d.h. x definieren wir als Polynom p mit 

Mit dieser Definition gilt: 

p (i) := 

k=0 

0 falls i ∈ N0\ {1} 

1 falls i = 1


p = (a0, . . . , am, 0, . . .) ∈ K [x] ist gleich a0 +a1x+. . .+amx m (dabei ist ai := (ai, 0, . . .) ∈ 

K [x] gemeint) 

Hierzu: Es ist x n = (0, . . . , 0, 1, 0, . . . , 0) (1 an der n-ten Stelle). 

Folgerung Im Polynomring K [x] sind + und · bereits festgelegt durch + und · auf der 

Menge {x, a = (a, 0, . . .) | a ∈ K} und die Distributivgesetze. 

Deshalb ist die Darstellung a0 + a1x + . . . amx m für (a0, . . . , am, 0, . . .) so beliebt und 

praktisch. 

3.1.5 Polynomfunktionen 

Sei p = a0 + a1x + . . . + amx m ∈ K[x]. Die Abbildung 

ˆp : K → K, α ↦→ a0 + a1α + a2α 2 + . . . + amα m 

(wobei die ai als Elemente ∈ K zu verstehen sind) heißt Polynomfunktion zu p. 

Man schreibt p (α) statt umständlich ˆp (α) . 

Wenn α ∈ K fest ist, nennt man die Abbildung K[x] → K, p ↦→ p(α) den Einsetzhomo- 

morphismus (beim Einsetzen von α). 

Satz 53 (Satz vom Einsetzhomomorphismus) Für alle Polynome p, q ∈ K[x] und 

α ∈ K gilt: (p + q)(α) = p(α) + q(α) sowie (p · q)(α) = p(α) · q(α). In Worten: Erst im 

Polynomring addieren und dann (in die Summe) α einsetzen ist das Gleiche, wie erst in 

beide Polynome einsetzen und dann (in K, +) addieren. Analoges gilt für ·. 

Das Polynom p und die zugehörige Polynomfunktion ˆp muß man unterscheiden. Es kann 

nämlich vorkommen (siehe folgendes Beispiel): ˆp = ˆq, aber p = q. 

Zur Beruhigung sei gesagt: Im Fall K = IR) hat ˆp = ˆq stets zur Folge p = q. 

Warum? Ein Polynom η = 0 hat höchstens Gradη Nullstellen (siehe nachfolgendes Ko- 

rollar). Wenn p, q ∈ K[x] sind und ˆp = ˆq gilt, folgt (*) (p − q)(α) = 0 für alle α ∈ K; 

d.h. jedes α ∈ K ist eine Nullstelle der Polynomfunktion zum Polynom η = p − q. Wenn 

K = R ist, folgt aus (*) also p − q = 0 (Nullpolynom), d.h. p = q. 

Das Argument gilt offenbar nicht nur für R, sondern auch für jeden Körper K mit unend- 

licher Mächtigkeit. 

Beispiel K := Z/3Z ist ein 3-elementiger Körper (man bezeichnet ihn auch als GF3; GF 

steht für Galois-field). Für die Polynome p := x 3 +x 2 −x+1 ∈ K[x] und q := x 2 +1 ∈ K[x] 

sind die entsprechenden Polynomfunktionen gleich, ˆp = ˆq, aber es ist p = q.


Satz 54 (Gradsatz) Seien p, q ∈ K[x] \ {0}. Dann gilt Grad(pq) = Grad(p) + Grad(q). 

Insbesondere gibt es im Polynomring K[x] keine Nullteiler = 0. In K[x] sind genau die 

Polynome vom Grad 0 invertierbar (in der Halbgruppe K[x], ·). 

Satz 55 (Teilen mit Rest im Polynomring) Seien p, q ∈ K [x] , q = 0. Dann existie- 

ren m, r ∈ K [x] mit: p = q · m + r und [ r = 0 oder Grad(r) < Grad(q)]. 

Satz 56 (Abspaltungssatz) Sei p ∈ K [x] \ {0} und α ∈ K eine Wurzel (Nullstelle) von 

p d.h. p(α) = 0. Dann existiert q ∈ K [x] mit p = (x − α) · q. 

Beweis. Durch Teilen mit Rest erhalten wir p = q · (x − α) + r für passendes q ∈ K[x] 

und ein ’Restpolynom’ r ∈ K[x] mit r = 0 oder Grad(r) = 0. Nach dem Satz vom 

Einsetzhomomorphismus gilt 0 = p(α) = r(α), also r = 0. Es folgt p = q · (x − α). 

Korollar 57 Ein Polynom p ∈ K [x] \ {0} hat höchstens Grad(p) Nullstellen. 

3.1.6 Einheitengruppe 

Sei R ein Ring (mit 1). Wenn a ∈ R ein Linksinverses b (d.h. b · a = 1) hat und ein Recht- 

sinverses c (d.h. a · c = 1)) so folgt b = c (denn bac = b, also c = b; siehe ’Halbgruppen’). 

Die Menge 

U := {a ∈ R | a hat Links- und Rechtsinverses} 

ist mit der Verknüpfung · eine Gruppe, genannt die Einheitengruppe von R. 

Beispiele 

1. Einheitengruppe in Z ist U = {1, −1}. 

2. Einheitengruppe in K (K ein Schiefkörper) ist U = K\{0}. 

3. In einem Polynomring K [x] (K Körper) ist die Einheitengruppe 

U = {p ∈ K [x] \{0}|Grad p = 0}. 

4. Im Ring R 

 

der 2 × 2-Matrizen (über einem beliebigen Körper K) ist A = 

a11 a12 

a21 a22 

a11a22 − a12a21 = 0 ist. 

genau dann Einheit, wenn die sogenannte Determinante det(A) := 

5. In Z/qZ (mit q ∈ Z \ {0} haben wir die Einheitengruppe schon berechnet: U = 

{a | a ∈ Z und a teilerfremd zu q }. Dabei wird a := a + qZ gesetzt.


3.1.7 Der Quaternionenschiefkörper 

Bisher haben wir keinen Schiefkörper kennengelernt, der nicht schon ein Körper ist. Wir 

konstruieren jetzt einen ’echten’ Schiefkörper. Setze K := R und H := K × K 3 . Auf K 3 

bezeichne ∗ das gewöhnliche Skalarprodukt ∗ : K 3 × K 3 → K und × das Vektorprodukt 

× : K 3 ×K 3 → K 3 (wie aus der Schule bekannt). Auf H definieren wir nun Verknüpfungen 

+ und · durch 

(λ, v) + (µ, w) := (λ + µ, v + w) 

(λ, v) · (µ, w) := (λµ − v ∗ w, λw + µv + v × w) 

Damit ist H, +, · ein Schiefkörper, wie man fleißig nachrechnet. Er ist nicht kommutativ, 

denn zum Beispiel gilt (0, v) · (0, w) = (−v ∗ w, v × w) und v × w = −(w × v). 

Literaturhinweis: Ebbinghaus, Hermes, Hirzebruch et alii: Zahlen. Springer, Reihe Grund- 

wissen, 1983. 

3.2 Quotientenkörper 

Definition 58 Ein kommutativer Ring mit 1 = 0, der außer 0 keine Nullteiler hat, heißt 

Integritätsring (auch Integritätsbereich). 

Kann man zu jedem kommutativen Ring R einen Körper K konstruieren, darart dass R 

Unterring von K ist? Kurz gesagt: Kann man jeden kommutativen Ring in einen Körper 

einbetten? Gewiß nimmt immer. Denn in einem Körper ist 0 der einzige Nullteiler. 

Wenn die Konstruktion möglich ist, muß also R ein Integritätsring sein. In diesem Fall 

ist die Konstruktion tatsächlich möglich, und es gibt einen kleinsten R als Unterring 

enthaltenden Körper, den sogenannten Quotientenkörper. 

Im Fall R = Z ist der Quotientenkörper der Körper Q der rationalen Zahlen, der 

’Bruchzahlen’. 

Die folgende Konstruktion des Quotientenkörpers Q(R) eines Integritätsbereichs R 

beinhaltet also die Konstruktion von Q aus Z als Spezialfall. 

Konstruktion des Quotientenkörpers 

Sei R, +, · ein Integritätsring (kommutativer Ring mit 1-Element und der Eigenschaft: 

ab = 0 ⇒ a = 0 oder b = 0). 

Auf R × R \ {0} definiere man eine Relation ∼ durch: 

(1) (a, b) ∼ (a ′ , b ′ ) ⇔ ab ′ = a ′ b. 

Dann gilt: ∼ ist eine Äquivalenzrelation.


(2) Die (a, b) enthaltende Äquivalenzklasse bezeichnet man mit a 

b 

Äquivalenzklassen Brüche. Zwei Brüche a 

b 

gilt. 

Sei Q(R) die Menge der Brüche, Q(R) := { a 

b 

und nennt diese 

und a′ 

b ′ sind also genau dann gleich, wenn (1) 

| a, b ∈ R, b = 0}. 

(3) Seien (a, b) ∼ (a ′ , b ′ ) und (c, d) ∼ (c ′ , d ′ ). Dann gilt (ad + cb, bd) ∼ (a ′ d ′ + c ′ b ′ , b ′ d ′ ) 

und (ac, bd) ∼ (a ′ c ′ , b ′ d ′ ). 

Wegen (3) sind die folgenden Verknüpfungen + und · auf Q(R) wohldefiniert (d.h. hängen 

nur von den Brüchen a 

b , nicht vom Repräsentanten (a, b), ab): 

(4) a c ad+cb 

b + d := bd 

und a 

b 

c ac · d := bd . 

Man verifiziert nun: (5) Q(R) ist ein Körper (mit 0 

1 

bezüglich + und ·. Das zu a 

b 

= 0 

1 

(6) Die Abbildung ϕ : R → Q(R), a ↦→ a 

1 

(aϕ) + (bϕ) = (a + b)ϕ sowie (aϕ) · (bϕ) = (a · b)ϕ. 

und 1 

1 

inverse Element (bezüglich ·) ist b 

a . 

ist injektiv, und es gilt 

Man sagt: ϕ ist ein Ringisomorphismus von R auf ϕ(R). 

als neutralen Elementen 

Wegen (6) kann man R, +, · als Unterring von Q(R) ansehen: man muß nur die Elemente 

von R umtaufen, statt a ∈ R schreiben a 

1 . 

Der Quotientenkörper von K[x] (d.h. der Körper, welcher aus den Brüchen mit Polyno- 

men im Zähler und Nenner besteht), heißt der rationale Funktionenkörper K(x) über K 

(Tradition, - obwohl diese Brüche keine Funktionen sind!).

4 VEKTORRÄUME 49 

4 Vektorräume 

In diesem Kapitel sei K ein beliebiger Schiefkörper. 

Beispiel Sei n ∈ N. Die Menge K n (n-faches kartesisches Produkt) ist mit der Ver- 

knüpfung (a1, . . . , an) + (b1, . . . , bn) := (a1 + b1, . . . , an + bn) eine abelsche Gruppe. Wir 

definieren eine Abbildung 

· : K × K n → K n , (λ, a) ↦→ (λa1, . . . , λan) 

und nennen diese Skalarmultiplikation (nicht verwechseln mit Skalarprodukt). Statt 

(K n , +, ·) schreibt man kurz K n . 

K n ist ein Vektorraum im Sinn der folgenden Definition. Insbesondere ist 

K 1 := {(a) | a ∈ K} ein K-Vektorraum. Statt dem 1-Tupel (a) schreibt man 

a. 

Definition 59 Man nennt V, +, · einen K-(Links-)Vektorraum (auch Vektorraum über 

dem Schiefkörper K), wenn gilt : 

(V1) V, + ist eine abelsche Gruppe, und 

(V2) · ist eine Abbildung K × V → V derart, daß für alle λ, µ ∈ K und a, b ∈ V gilt: 

1 · a = a und λ · (µ · a) = (λ · µ) · a und λ (a + b) = λa + λb und (λ + µ) a = λa + µa. 

Statt V, +, · schreibt man meistens nur V . Die in (V2) vorkommende Abbildung · heißt 

Skalarmultiplikation (Skalar = Element von K). 

Folgerungen aus der Definition 

1. 0a=0 für alle a ∈ V (die Null links ist 0 ∈ K, rechts 0 ∈ V ). 

2. λ0 = 0 für alle λ ∈ K (hier 0 ∈ V ). 

3. −a = (−1)a für alle a ∈ V . 


1. K n (siehe oben). 

2. V := {ϕ | ϕ Abbildung [0, 1] → R} mit K := R. Definiere + auf V durch 

ϕ + ψ : [0, 1] → R, x ↦→ xϕ + xψ.


Definiere als Skalarmultiplikation R × V → V, (λ, ϕ) → λϕ : [0, 1] → R, x ↦→ 

(xϕ)λ. 

3. Sei a = (a1, a2, a3) ∈ R 3 und a ⊥ := {v = (v1, v2, v3) ∈ R 3 | a1v1 + a2v2 + a3v3 = 0}. 

Es ist a ⊥ ein Untervektorraum von R 3 . 

4. Die Lösungsmenge eines linearen homogenen Gleichungssystems über einem Körper 

K mit n Unbekannten ist ein Untervektorraum des K n . Ein Spezialfall ist das vorige 

Beispiel a ⊥ (Lösungsmenge eines linearen homogenen Gleichungssystems mit nur 

einer Gleichung). 

5. U := {ϕ | ϕ : [0, 1] → R und ϕ stetig} mit + und · wie oben ist auch ein Vektorraum; 

ein ’Untervektorraum’ von V des vorigen Beispiels. 

6. R ist ein Vektorraum über dem Körper Q (R mit + als Vektoraddition; · restringiert 

auf Q × R). 

7. Menge aller Polynomfunktionen R→R (mit + und · wie in 2.) (statt R kann man 

einen beliebigen Körper nehmen). 

8. Sei R ein Ring und K ein Teilring von R, der ein Schiefkörper ist. Die 1 von K 

sei auch neutral bezüglich der Multiplikation in R. Dann ist R ein K-Vektorraum 

(wobei die Skalarmultiplikation die Restriktion der Verknüpfung · von R auf die 

Menge K × R sei). 

Spezialfall: R = K[x] als K-Vektorraum. 

9. (Abbildungsräume) Sei X eine Menge und W ein K-Vektorraum. Die Menge 

V := W X aller Abbildungen von X in W mit der im zweiten Beispiel genannten 

Vektoraddition und Skalarmultiplikation ist ein K-Vektorraum. Das zweite Beispiel 

ist ein Spezialfall dieser Situation. 

Definition 60 (Untervektorraum) Sei V ein K-Vektorraum. Nenne U einen Unter- 

vektorraum von V , wenn gilt: U, + ist eine Untergruppe von V, +, und für alle λ ∈ K und 

u ∈ U gilt λu ∈ U. 

Ein Untervektorraum ist selber wieder ein Vektorraum. Stets sind {0} und V Untervek- 

torräume von V . 

4.0.2 Untervektorraum-Kriterium 

Sei V K−Vektorraum und U ⊆ V . Dann gilt: U ist Untervektorraum von V genau dann, 

wenn gilt: (1) U = ∅, und (2) Wenn a, b ∈ U ist folgt a + b ∈ U, und (3) Für alle λ ∈ K


und a ∈ U folgt λa ∈ U. 

Satz 61 Sei V ein K−Vektorraum, und C eine Menge von Untervektorräumen von V 

(mit C = ∅). Dann ist C (anders geschrieben: 

U ) ein Untervektorraum von V . 

In Worten: Der Durchschnitt über eine beliebige (nichtleere) Menge von Untervektorräum- 

U∈C 

en (eines festen Vektorraums) ist wiederum ein Untervektorraum. 

Definition 62 (und Satz zum Vektorraum-Erzeugnis) Sei V ein K−Vektorraum 

und X ⊆ V . 

Setze C := {U | Uist Untervektorraum von V mit X ⊆ U}. 

Dann ist (nach vorigem Satz) 〈X〉 := C, ein Untervektorraum von V . Man nennt 〈X〉 

das (Vektorraum-)Erzeugnis von X; auch den Aufspann von X; den von X erzeugten 

Untervektorraum. 

Es gilt X ⊆ 〈X〉 und: 

Für alle Untervektorräume W von V mit X ⊆ W folgt 〈X〉 ⊆ W . 

Das bedeutet, 〈X〉 ist der kleinste Untervektorraum von V , der X enthält (’kleinste’ 

bezüglich ⊆ als Ordnungsrelation). 

Redeweise Sei U ein Untervektorraum von V und X ⊆ V . Wenn dann 〈X〉 = U zutrifft, 

sagt man: U wird von X erzeugt. Wenn es eine endliche Teilmenge X gibt mit 〈X〉 = U, 

nennt man U endlich erzeugbar. 


Sei V := R 2 , X := ∅. Dann ist 〈X〉 = {(0, 0)}. 

Wenn X := {(1, 1)} ist, gilt 〈X〉 = R (1, 1) := {λ (1, 1)| λ ∈ R} = {(λ, λ)| λ ∈ R}. Denn 

R (1, 1) ist Untervektorraum mit X ⊆ R (1, 1), also 〈X〉 ⊆ R (1, 1) ; und wegen (1, 1) ∈ 

X ⊆ 〈X〉 und da 〈X〉 Untervektorraum, folgt R (1, 1) ⊆ 〈X〉. 

Allgemeiner: 

Wenn X = {x} ist, so gilt 〈X〉 = Rx. Noch allgemeiner: Wenn V ein K−Vektorraum ist 

und x ∈ V , so gilt 〈{x}〉 = Kx. 

Noch allgemeiner: X = {a, b} . 

Dann ist 〈X〉 = {λa + µb | λ, µ ∈ R }. 

Satz 63 Seien V ein K−Vektorraum und X, Y ⊆ V. Dann gilt: 

(a) Aus X ⊆ Y folgt 〈X〉 ⊆ 〈Y 〉.


(b) Für jeden Untervektorraum U von V gilt: X ⊆ U ⇒ 〈X〉 ⊆ U. 

(c) 〈〈X〉〉 = 〈X〉. 

Spezialfall von b) Wenn X Untervektorraum von V ist, gilt 〈X〉 = X. 

Die Definition von 〈X〉 als Durchschnitt über alle X enthaltenden Untervektorräume ist 

ziemlich unanschaulich; denn im allgemeinen gibt es unendlich viele solche Untervek- 

torräume. Wir wünschen eine konstruktive Beschreibung von 〈X〉. 

4.0.4 Erzeugnis einer endlichen Menge 

Aus didaktischen Erwägungen betrachten wir zunächst den Fall: 

X ist endliche Teilmenge des K-Vektorraums V , X = {x1, ..., xn}. 

Jeder Vektor der Form λ1x1 + ... + λnxn, wobei die λi ∈ K sind, heißt eine Linearkom- 

bination von X (auch: Linearkombination von Vektoren aus X, Linearkombination von 

x1, ..., xn). 

Es kann λ1x1 + ... + λnxn = µ1x1 + ... + µnxn zutreffen, obwohl die Zahlentupel (λ1, ..., λn) 

und (µ1, ..., µn) verschieden sind. 

Die Menge aller Linearkombinationen von X, also {λ1x1 + ... + λnxn | λi ∈ K}, ist ein 

Untervektorraum von V , der X enthält (offensichtlich). 

Deshalb ist 〈X〉 ⊆ {λ1x1 + ... + λnxn | λi ∈ K} (folgt allein aus der Definition von 〈X〉). 

Andererseits ist 〈X〉 ein X enthaltender Untervektorraum, und deshalb ist jede Linear- 

kombination λ1x1 + ... + λnxn von X in 〈X〉 enthalten. 

Ergebnis 〈X〉 = {λ1x1 + ... + λnxn | λi ∈ K}. 

In Worten: Das Erzeugnis 〈X〉 von X ist die Menge aller Linearkombinationen von X. 

4.0.5 Linearkombinationen 

Weiterhin sei ein K-Vektorraum V gegeben. 

Wir wollen die Betrachtung im vorigen Absatz verallgemeinern, um auch unendliche Men- 

gen X einzubeziehen. 

Wenn X unendlich ist und zu jedem x ∈ X ein Körperelement λx vorliegt, ist im allgemeinen 

 

x∈X λxx nicht erklärt; denn unendlich viele Summanden λxx können = 0 sein. Aber 

wenn {x ∈ X | λx = 0} eine endliche Menge ist, macht 

x∈X λxx Sinn (die Summanden 

0x, d.h. diejenigen zu λx = 0, ignoriere man). Deshalb definieren wir


Definition 64 Sei X ⊆ V . Wir nennen eine Abbildung X → K, x ↦→ λx, eine Koordinatenabbildung, 

wenn {x ∈ X | λx = 0} endlich ist, und nennen 

x∈X λxx die 

zu der Koordinatenabbildung gehörende Linearkombination (auch: Linearkombination mit 

den Koordinaten λx). 

Die Menge { 

x∈X λxx | X → K, x ↦→ λx ist eine Koordinatenabbildung }, d.h. die Menge 

aller Linearkombinationen von X, wird in der Literatur oft als {λ1x1 + ... + λmxm | m ∈ 

N0, λi ∈ K und xi ∈ X} geschrieben. 

Offenbar ist diese Menge ein X enthaltender Untervektorraum von V . 

Deshalb liefert das gleiche Argument wie im vorigen Abschnitt den 

Satz 65 Für jede Teilmenge X ⊆ V gilt 

〈X〉 = { 

x∈X λxx | X → K, x ↦→ λx ist eine Koordinatenabbildung }. 

Andere Formulierung: 〈X〉 = {λ1x1 + ... + λmxm | m ∈ N0, λi ∈ K und xi ∈ X}. 


Sei V = R 2 , v1 = (2, 1), v2 = (1, 1) ∈ R 2 und λv1 

Linearkombination ist (11, 8). Für X := {v1, v2} gilt 〈X〉 = R 2 . 

 

✟ ✟✟✟✟✟✟✟✟✟✟✟✟✟✟✟✟✟✟✟✟✟✟✟✟✟✟ 

 

(0, 1) 

✉ 

✉ 

✉ 

✉ ✉ 

 

✉ 

✉ 

0, 5v2 

0, 1v1 

v2 v2 

✉ 

(1, 0) 

Rv2 

0, 1v1 + 0, 5v2 

= 3 und λv2 = 5. Die zugehörige 

v1 v1 

Rv1



Sei K ein Körper. Der Polynomring K[x] ist ein K-Vektorraum (wenn man die Multipli- 

kation auf K × K[x] einschränkt). Sei X = {1, x, x 2 , ...} die Menge der ’Monome’. Dann 

gilt für das Vektorraumerzeugnis 〈X〉 = K[x]. 

Satz 66 (Lineare Unabhängigkeit) Sei V ein K−Vektorraum und X ⊆ V. Folgende 

Aussagen sind äquivalent: 

(i) Für jedes z ∈ X gilt 〈X\ {z}〉 = 〈X〉 

(d.h. aus X darf kein Element gestrichen werden, ohne daß der Aufspann echt kleiner 

wird). 

(ii) Für jede Koordinatenabbildung X → K, x ↦→ λx gilt: 

 

λxx = 0 ⇒ λx = 0 für alle x ∈ X 

x∈X 

(d.h. wenn eine Linearkombination in Elementen von X gleich dem Nullvektor ist, so 

müssen alle Koeffizienten λx gleich 0 sein). 

(iii) Für alle Koordinatenabbildungen x ↦→ λx und x ↦→ µx gilt: 

 

λxx = 

µxx ⇒ λx = µx für alle x ∈ X. 

x∈X 

x∈X 

(Prinzip des Koeffizientenvergleichs). 

Beweis. (i) ⇒ (ii). Wir zeigen die gleichwertige Aussage: nicht (ii) ⇒ nicht (i). 

Wegen (nicht (ii)) gibt es eine Koordinatenabbildung x ↦→ λx mit 

x∈X λxx = 0 und 

λz = 0 für (mindestens) ein z ∈ X. Setze Y := X \ {z}. Wir behaupten: 〈Y 〉 = 〈X〉 (und 

damit nicht (i)). 

Beweis hiervon. Für jedes x ∈ Y setze µx := −λ −1 

z · λx. Dann gilt z = 

x∈Y µxx. Also 

gilt z ∈ 〈Y 〉 (siehe 65). Also ist Y ∪ {z} ⊆ 〈Y 〉 und damit 〈Y ∪ {z}〉 ⊆ 〈Y 〉 (siehe 63). Da 

auch 〈Y ∪ {z}〉 ⊇ 〈Y 〉 gilt, folgt 〈X〉 = 〈Y ∪ {z}〉 = 〈Y 〉. 

Beweis von: (nicht (i)) ⇒ (nicht (ii)). Wegen nicht (i) gibt es z ∈ X mit 〈X \ {z}〉 = 

〈X〉. Setze Y := X \ {z}. Wegen z ∈ 〈X〉 = 〈Y 〉 kann man schreiben z = 

x∈Y µxx 

(für eine passende Koordinatenabbildung Y → K, x ↦→ µx). Setze µz := −1. Dann gilt 

 

x∈X µxx = 0, und da µz = −1 = 0 ist, gilt nicht (ii)). 

Beweis von (iii) ⇒ (ii). Man setze µx = 0 für alle x ∈ X und wende (iii) an. 

Beweis von (ii) ⇒ (iii). Aus den in (iii) vorliegenden Voraussetzungen folgt 

x∈X (λx − 

µx)x = 0. Nach (ii) folgt λx − µx = 0, also λx = µx für alle x ∈ X. 

Definition 67 (linear unabhängig, linear abhängig, Basis) Sei V ein K- 

Vektorraum.


a) Sei X ⊆ V . Man nennt X linear unabhängig, wenn Aussage (i) aus 66 zutrifft; 

sonst nenne X linear abhängig. 

b) Sei X ⊆ V. Nenne X eine Basis von V , wenn gilt: X ist linear unabhängig und 

〈X〉 = V . 

c) Ein m-Tupel (x1, . . . , xm) von Vektoren ∈ V heißt linear unabhängig, wenn gilt: 

x1, . . . , xm sind paarweise verschieden, d.h. für alle i = j ist xi = xj, und die Menge 

{x1, . . . , xm} ist linear unabhängig (wie in a) definiert). 

Das m-Tupel (x1, . . . , xm) heißt eine eine Basis von V , wenn gilt: (x1, . . . , xm) ist linear 

unabhängig und 〈{x1, . . . , xm}〉 = V . 

Bemerkungen 

Es gibt Vektorräume V , die keine endliche Menge X ⊆ V mit 〈X〉 = V erlauben; zum 

Beispiel der Polynomring K [x] als K−Vektorraum. 

Insbesondere gestattet V dann keine endliche Menge X ⊆ V , die eine Basis von V ist. 

Folglich existiert dann kein m-Tupel (x1, . . . , xm), welches eine Basis von V ist. 

Die leere Menge ∅ ist linear unabhängig, und 〈∅〉 = {0}. 

Man beachte, dass der Begriff ’linear unabhängig’ zum einen für Mengen X ⊆ V , zum 

anderen für m-Tupel (x1, . . . , xm) (mit xi ∈ V ) definiert wurde. 


Sei K ein Schiefkörper und n ∈ N. Setze ei := (0, . . . , 0, 1, 0, . . . , 0) ∈ K n ( 1 an i-ter 

Stelle). Dann ist X := {e1, . . . , en} eine Basis von K n . Man nennt sie die Standardbasis 

des K n . 

Für den Polynomring K[x] über einem Körper K (angesehen als K-Vektorraum) ist die 

Menge {1, x, x 2 , ...} der Monome eine Basis. 

Satz 68 Seien V ein K-Vektorraum und (x1, . . . , xm) ein m-Tupel von Vektoren aus V . 

Dann sind (i) und (ii) äquivalent. 

(i) Das m-Tupel (x1, . . . , xm) ist linear unabhängig. 

(ii) Für alle λ1, . . . , λm ∈ K gilt: 

Aus λ1x1 + · · · + λmxm = 0 folgt λ1 = · · · = λm = 0 . 

Beweis. (i) ⇒ (ii). Sei λ1x1 + ... + λmxm = 0. Wegen (i) sind x1, ..., xm paarweise 

verschieden, und nach 66 (ii) folgt λ1 = ... = λm = 0. 

(ii) ⇒ (i). Wären x1, ..., xm nicht paarweise verschieden, so hätte man etwa x1 = x2 und 

dann x1 − x2 + 0x3 + ... + 0xm = 0, im Widerspruch zur Voraussetzung (ii). Also sind die


xi paarweise verschieden, und 66 (ii) liefert (i). 

Spezialfall Seien a, b ∈ V \ {0}. Dann sind folgende Aussagen äquivalent. (a, b) ist linear 

abhängig; es gibt λ ∈ K mit a = λb ; es gilt Ka = Kb. 

 

a 

b 

 

 

(0, 0) 

Satz 69 Seien V ein K−Vektorraum und X, Y ⊆ V. Dann gilt: 

(i) Falls 0 ∈ X ist, so ist X linear abhängig. 

(ii) Wenn X ⊆ Y und Y linear unabhängig ist, dann ist auch X linear unabhängig. 

(iii) Wenn X ⊆ Y ist und X linear abhängig, so ist auch Y linear abhängig . 

Das folgt unmittelbar aus 66. 

Satz 70 Seien V ein K−Vektorraum und X eine Basis von V . Dann gibt es zu jedem 

v ∈ V genau eine Koordinatenabbildung X → K, x ↦→ λx, mit v = 

λxx. 

Im Fall einer endlichen Basis sagt der Satz: Sei (a1, . . . , an) eine Basis. Zu jedem v ∈ V 

existieren eindeutig bestimmte Koordinaten λ1, . . . , λm ∈ K mit v = λ1a1 + . . . λnan. 

In Worten: jeder Vektor läßt sich in eindeutiger Weise (d.h. mit eindeutig bestimmten 

Koordinaten λi ∈ K) als Linearkombination in a1, . . . , an schreiben. 

Der Beweis des Satzes folgt sofort aus 66 und 65. 

Satz 71 (Charakterisierungssatz für Basen) Sei V K−Vektorraum und X ⊆ V. Fol- 

gende Eigenschaften sind äquivalent: 

a) X ist eine Basis von V . 

b) X ist in der Menge aller linear unabhängigen Teilmengen von V maximal (bezüglich 

⊆); d.h.: X ist linear unabhängig, und für jede linear unabhängige Menge Y ⊆ V mit 

X ⊆ Y folgt X = Y . 

c) X ist in der Menge aller Teilmengen von V , die V aufspannen, minimal, d.h. es gilt 

〈X〉 = V , und für alle Y ⊆ V mit 〈Y 〉 = V und Y ⊆ X folgt Y = X. 

x∈X


Beweis. a) ⇒ b). Sei Y ⊆ V linear unabhängig und X ⊆ Y ⊆ V . Angenommen, Y = X. 

Wähle z ∈ Y \ X. Dann gilt X ⊆ Y \ {z} ⊆ Y , also V = 〈X〉 ⊆ 〈Y \ {z}〉 ⊆ 〈Y 〉 ⊆ V , 

deshalb 〈Y \ {z}〉 = V = 〈Y 〉. Widerspruch (zu: Y ist linear unabhängig). 

b) ⇒ c). Wir zeigen zunächst: (*) 〈X〉 = V . 

Sei also v ∈ V . Wenn v ∈ X ist, folgt v ∈ X ⊆ 〈X〉, fertig. 

Sei nun v ∈ X. Dann ist X echte Teilmenge von X ∪ {v}. Deshalb (Maximaleigenschaft 

von X in b)) ist X ∪ {v} linear abhängig. Wegen 66 existieren Koordinaten λv, λx mit: 

λvv + 

x∈X λxx = 0 und mindestens eine der Koordinaten ist = 0. Wäre λv = 0, so wäre 

eins der λx ungleich 0 und 

x∈X λxx = 0, im Widerspruch zur linearen Unabhängigkeit 

von X (siehe 66). Also ist λv = 0, und für µx := λ−1 v λx folgt v = 

x∈X µxx ∈ 〈X〉. Damit 

ist (*) bewiesen. 

Nun sei Y ⊆ X mit 〈Y 〉 = V gegeben. Zu zeigen ist Y = X. 

Angenommen, Y = X. Wähle z ∈ X \ Y . Dann gilt Y ⊆ X \ {z} und deshalb V = 〈Y 〉 ⊆ 

〈X \ {z}〉 ⊆ V . Also ist 〈X \ {z}〉 = V = 〈X〉, im Widerspruch zur Voraussetzung, dass 

X linear unabhängig ist. 

c) ⇒ a). Zu zeigen ist die lineare Unabhängigkeit von X. 

Angenommen, X ist linear abhängig. Dann gibt es z ∈ X mit 〈X \ {z}〉 = 〈X〉. Das 

bedeutet, X \ {z} ist eine V erzeugende Menge, die echt in X liegt. Ein Widerspruch zu 

c). 

Korollar 72 Seien X und Y Basen des K-Vektorraums V mit X ⊆ Y . Dann gilt X = Y . 

4.0.9 Charakterisierung von Basen mit Zusatzeigenschaften 

Weiterhin sei K ein Schiefkörper. 

Satz 73 (Konstruktion von Basen) Sei V ein K-Vektorraum. Seien X, Y ⊆ V und 

X ⊆ Y und X linear unabhängig und 〈Y 〉 = V . 

Wir setzen B := {T | X ⊆ T ⊆ Y und T ist linear unabhängig }. 

Behauptung: Jedes maximale Element Z der geordneten Menge B, ⊆ ist eine Basis. 

Beweis. Sei Z ein maximales Element der geordneten Menge B, ⊆. Das bedeutet: Es gilt 

X ⊆ Z ⊆ Y und Z ist linear unabhängig; und falls Z ′ auch diese Eigenschaften hat und 

Z ⊆ Z ′ gilt, so folgt Z = Z ′ . 

Angenommen, Z ist keine Basis von V . Dann gilt 〈Z〉 = V = 〈Y 〉. Es folgt Y ⊆ 〈Z〉 (sonst 

wäre V = 〈Y 〉 ⊆ 〈〈Z〉〉 = 〈Z〉, also V = 〈Z〉). Wähle y ∈ Y \ 〈Z〉 und setze Z ′ := Z ∪ {y}. 

(i) Z ′ ist linear unabhängig. 

Beweis (i). Wir beweisen Aussage (ii) in 66 für Z ′ .


Sei also 

z∈Z µzz + µyy = 0. Wenn µy = 0 wäre, so folgte y ∈ 〈Z〉, Widerspruch zur 

Wahl von y. Also ist µy = 0. Da Z linear unabhängig ist, folgt µz = 0 für alle z ∈ Z. 

Damit ist (i) bewiesen. 

Wegen (i) und X ⊆ Z ′ ⊆ Y folgt Z ′ ∈ B. Außerdem gilt Z ⊆ Z ′ und Z = Z ′ . Also ist Z 

kein maximales Element in B. 

Die Spezialfälle Y = V (noch spezieller: Y = V und X = {0}) liefern folgende Korollare. 

Korollar 74 Sei V ein K-Vektorraum. 

Sei X ⊆ V linear unabhängig. Wir setzen 

B := {T | X ⊆ T ⊆ V und T ist linear unabhängig }. 

Dann ist jedes maximale Element Z der geordneten Menge B, ⊆ eine Basis. 


Wir setzen B := {T | T ⊆ V und T ist linear unabhängig }. 

Dann ist jedes maximale Element Z der geordneten Menge B, ⊆ eine Basis. 

4.0.10 Existenz von Basen 

Wir haben Teilmengen eines Vektorraums, welche eine Basis sind, charakterisiert als maxi- 

male linear unabhängige Teilmengen des Vektorraums. Aber das sichert nicht die Existenz 

(mindestens) einer Basis. Es wäre ja möglich, dass (jedenfalls in manchen Vektorräum- 

en) keine einzige Teilmenge mit dieser Maximal-Eigenschaft existiert. Wir werden nun 

beweisen, dass diese Möglichkeit nie zutrifft. 

Satz 76 (Allgemeiner Existenzsatz für Basen) Sei V ein K-Vektorraum. Seien 

X, Y ⊆ V mit X ⊆ Y und X linear unabhängig und 〈Y 〉 = V . 

Dann existiert eine Basis Z von V mit X ⊆ Z ⊆ Y . 

Vor dem Beweis studieren wir ein 

Beispiel. 

Sei V = R 3 und X = {(1, 1, 0)} und Y = { (1, 1, 0), (1, 0, 1), (0, 1, 2), (7, 8, 3), (3, 3, 0) }. 

Dann gilt X ⊆ Y ⊆ V ; X ist linear unabhängig; und man überprüft leicht 〈Y 〉 = V . 

Somit erfüllen V, X, Y die Voraussetzungen in 73 und 76. 

In 73 definierten wir B := {T | X ⊆ T ⊆ Y und T ist linear unabhängig }. 

Das ist im betrachteten Fall die 7-elementige Menge 

B := { {(1, 1, 0)}, {(1, 1, 0), (1, 0, 1)}, {(1, 1, 0), (0, 1, 2)}, {(1, 1, 0), (7, 8, 3)}, 

{(1, 1, 0), (1, 0, 1), (0, 1, 2)}, {(1, 1, 0), (1, 0, 1), (7, 8, 3)}, {(1, 1, 0), (0, 1, 2), (7, 8, 3)} }. 

In dieser Menge ist jedes bezüglich ⊆ maximale Element eine Basis von V (nach 73).


Offenbar hat B genau drei maximale Elemente, nämlich X1 = {(1, 1, 0), (1, 0, 1), (0, 1, 2)} 

und X2 = {(1, 1, 0), (1, 0, 1), (7, 8, 3)} und X3 = {(1, 1, 0), (0, 1, 2), (7, 8, 3)}. Denn diese 

drei sind nicht echt in einem anderen Element von B enthalten (es gibt kein Element von 

B, welches 4-elementig ist). 

Satz 73 liefert uns also drei Basen X1, X2, X3. 

Beweis des vorigen Satzes 

Wir benutzen 73 und definieren B wie dort. Zu zeigen ist: B enthält ein maximales 

Element. 

Wenn B eine endliche Menge ist (das ist insbesondere der Fall, wenn Y eine endliche 

Menge ist wie im Beispiel), liefert 28 die Existenz eines maximalen Elements. 

Damit man nicht in 28 nachschlagen muß, wiederholen wir die Schlußweise in unserer 

Situation: Man betrachte alle Ketten Z1 ⊂ .... ⊂ Zm (echte Inklusion) mit m ∈ N0 und 

Zi ∈ B. Man wähle eine Kette maximaler Länge m (das ist möglich, da es nur endlich 

viele Ketten gibt, die Kettenlängen also nach oben beschränkt sind). Wenn Z1 ⊂ .... ⊂ Zm 

eine Kette maximaler Länge ist, so ist Zm offenbar ein maximales Element in B, ⊆. 

Wenn B nicht endlich ist, braucht man das Zornsche Lemma 29, um die Existenz eines 

maximalen Elements in B nachzuweisen. 

Die Voraussetzung (s) im Zornschen Lemma sagt in unserem Fall: 

(s) Zu jeder Kette C in B, ⊆ gibt es eine obere Schranke S ∈ B. 

Wir beweisen nun Aussage (s). 

Sei also C eine Kette in B, ⊆. 

Setze S := C. 

Dann gilt jedenfalls 

(1) Z ⊆ S für jedes Z ∈ C. 

Für jedes Z ∈ C ⊆ B gilt X ⊆ Z ⊆ Y ; deshalb gilt 

(2) X ⊆ S ⊆ Y . 

Wir behaupten 

(3) S ist eine linear unabhängige Menge. 

Beweis von (3). Wir zeigen Eigenschaft (ii) von 66 für S. 

Sei also 

s∈S µss = 0 für eine Koordinatenabbildung S → K, s ↦→ µs. 

Dann ist µs = 0 nur für endlich viele s ∈ S, sagen wir für s1, ..., sn. Wir haben also 

(*) µ1s1 + ... + µnsn = 0. Nach Definition von S gibt es zu jedem si ein Ci ∈ C mit 

si ∈ Ci. Nun gilt (da C, ⊆ eine Kette ist) Ci ⊆ Cj oder Cj ⊆ Ci für jedes Indexpaar 

i, j ∈ {1, ..., n}. Deshalb existiert ein C ∈ C mit Ci ⊆ C für jedes i ∈ {1, ..., n}. Dann


gilt si ∈ C für jedes i ∈ {1, ..., n}. Da C linear unabhängig ist, erzwingt (*): µi = 0 für alle i. 

Wir haben bewiesen: S ∈ B (wegen (2) und (3)); und S ist eine obere Schranke von C 

(siehe (1)). 

Also liegt in der geordneten Menge B, ⊆ die Voraussetzung (s) des Zornschen Lemmas 

vor. Dieses Lemma sichert nun Existenz eines maximalen Elements B in B, ⊆. Nach 73 

ist B eine Basis von V . 

Korollar 77 Jeder Vektorraum hat eine Basis. 

Beweis. Wende den vorigen Satz an für X := ∅ und Y = V . 


a) Sei X ⊆ V linear unabhängig. Dann gibt es eine Basis Z von V mit X ⊆ Z. 

b) Sei Y ⊆ V und 〈Y 〉 = V . Dann gibt es eine Basis Z von V mit Z ⊆ Y . 

4.0.11 Dimension 

Weiterhin sei V ein K-Vektorraum. 

Im vorigen Abschnitt haben wir bewiesen, dass V eine Basis hat. Deshalb können wir 

in Vektorräumen rechnen: Wir wählen eine Basis X von V und schreiben jeden Vektor 

v ∈ V als v = 

x∈X λxx. Die Koordinaten λx sind durch v eindeutig bestimmt (siehe 66, 

(iii)). Statt mit v können wir mit den Koordinaten λx rechnen. Zum Beispiel entspricht 

der Vektoraddition das Addieren der Koordinaten: wenn w = 

x∈X µxx ist, gilt v + w = 

 

x∈X (λx + µx)x. 

Das Hauptergebnis in diesem Abschnitt ist der 

Satz 79 (Hauptsatz zum Dimensionsbegriff) Je zwei Basen X und Y von V sind 

gleichmächtig, d.h. es gibt eine bijektive Abbildung X → Y . 

Insbesondere gilt: 

Wenn es eine endliche Menge Z mit 〈Z〉 = V gibt (man sagt: V ist endlich erzeugbar), so 

gibt es eine natürliche Zahl n ∈ N0 mit der Eigenschaft: jede Basis hat genau n Elemente. 

Wir tun erst einmal so, als ob wir diesen Satz schon bewiesen hätten und setzten fest 

Definition 80 Falls V endlich erzeugbar ist, nennen wir die Zahl n im vorigen Satz die 

Dimension von V . 

Falls V nicht endlich erzeugbar ist (dann gibt es insbesondere keine endliche Basis) sagen 

wir: V ist unendlich-dimensional.


Wir haben für V = K n die ’Standardbasis’ kennengelernt. Sie hat n Elemente. Nach dem 

Satz hat jede Basis von V (genau) n Elemente. 

Korollar 81 Sei n = dimV ∈ N0. 

Wenn X ⊆ V linear unabhängig ist und |X| = n, so ist X eine Basis von V . 

Wenn 〈X〉 = V und |X| = n zutrifft, so ist X eine Basis von V . 

Beweis. Sei X linear unabhängig Und |X| = n. Nach 78 gibt es eine Basis Z von V mit 

X ⊆ Z. 

Wegen 79 gilt |Z| = n. Es folgt X = Z. 

Nun wollen wir uns um den Beweis des Satzes 79 kümmern. 

Lemma 82 Sei X eine Basis von V und w = 

x∈X λxx ein Vektor mit Koordinaten λx. 

Sei z ∈ X mit λz = 0. 

Dann ist (X \ {z}) ∪ {w} eine Basis von V . 

Das Lemma sagt: wir können den Basisvektor z durch w austauschen, d.h. aus X den 

Vektor z streichen und dafür w hinzufügen. 

Beweis. Setze T := X \ {z}. Wegen w = 

x∈X λxx haben wir λzz = w − 

x∈T λxx, 

also (wegen λz = 0) z ∈ 〈T ∪ {w}〉. Folglich X = T ∪ {z} ⊆ 〈T ∪ {w}〉 und damit 

V = 〈X〉 = 〈T ∪ {w}〉. 

Nun ist noch zu zeigen: T ∪ {w} ist linear unabhängig. 

Sei also 

x∈T µxx + µww = 0. Es folgt 

0 = 

µxx + µw ( 

λxx + λzz) = [ 

(µx + µwλx)x] + µwλzz 

x∈T 

x∈T 

Da X = T ∪ {z} linear unabhängig ist, folgt µw = 0 und damit 

x∈T µxx = 0. Da T (als 

Teilmenge von X) linear unabhängig ist, folgt µx = 0 für alle x ∈ T . 

Satz 83 (Austauschsatz von Steinitz für Vektorräume mit endlicher Basis) 

x∈T 

Sei V endlich erzeugbar und X eine endliche Basis von V . 

Sei Y ⊆ V linear unabhängig. Dann ist Y endlich und |Y | ≤ |X|. Es gibt X ′ ⊆ X derart, 

dass Y ∪ X ′ eine Basis von V ist.


Unter den Endlichkeitsvoraussetzungen sagt der Satz: Man kann eine gegebene linear 

unabhängige Menge Y durch Hinzunahme einer passenden Teilmenge X ′ einer vorgegeben 

Basis X zu einer Basis machen. 

Beweis. Setze n := |X|. 

Zunächst beweisen wir die letzte Aussage unter der Zusatzannahme: 

(*) Y ist endliche Menge und m := |Y | ≤ n. 

Man hat also Y = {y1, ..., ym}. 

Für jedes i ∈ {0, ..., m} untersuchen wir die Aussage: 

A(i): Es gibt xi+1, ..., xn ∈ X derart, dass {y1, ..., yi, xi+1, ..., xn} eine Basis von V ist. 

Offenbar ist A(0) wahr, denn X ist eine Basis von V . 

Nun nehmen wir an, i ∈ {1, ..., m − 1} und die Aussagen A(1), ..., A(i) seien bereits als 

wahr erkannt worden. Wir wollen A(i + 1) folgern. 

Wegen A(i) gibt es xi+1, ..., xn ∈ X derart, dass X ′ := {y1, ..., yi, xi+1, ..., xn} eine Basis 

von V ist. 

Insbesondere kann man dann yi+1 = µ1y1 + ... + µiyi + µi+1xi+1 + ... + µnxn schreiben 

(µj ∈ K passend). 

Wäre µi+1 = ... = µn = 0, so hätte man yi+1 − µ1y1... − µiyi = 0, im Widerspruch zur 

linearen Unabhängigkeit von Y . Also dürfen wir annehmen µi+1 = 0. Das vorige Lemma 

sagt: X ′′ := X ′ \ {xi+1} ∪ {yi+1} ist eine Basis von V . Also trifft A(i + 1) zu. 

So hangeln wir uns hinauf bis zur Aussage A(m). Diese lautet: 

(+) Es gibt X ′ ⊆ X derart, dass Y ∪ X ′ eine Basis von V ist, die ≤ n Elemente hat. 

Nun betrachten wir den allgemeinen Fall: Y ⊆ V ist eine linear unabhängige Menge (die 

nicht notwendig (*) erfüllt). 

Angenommen, Y erfüllt nicht die im Satz aufgestellten Behauptungen. 

Dann erfüllt Y nicht (*) (denn unter der Zusatzannahme (*) haben wir den Satz bereits 

bewiesen). Dann enthält Y mindestens n + 1 verschiedene Elemente, man kann also 

Y ′ ⊆ Y mit |Y ′ | = n und Y ′ = Y wählen. 

Dann ist Y ′ eine linear unabhängige Menge, welche die Zusatzvoraussetzung erfüllt. Nach 

dem schon Bewiesenen ist Y ′ Teilmenge einer Basis von V , die höchstens n Elemente hat. 

Da |Y ′ | = n ist, muß Y ′ gleich dieser Basis sein. Also ist Y ′ eine Basis und Y ′ ⊂ Y (echt). 

Dies ist unmöglich, da Y linear unabhängig ist. 

Korollar 84 Sei V ein endlich erzeugbarer Vektorraum. Dann ist jede Basis endlich, und 

je zwei Basen haben gleichviel Elemente.


Sei n diese Anzahl. Dann hat jede linear unabhängige Teilmenge von V hat höchstens n 

Elemente. 

Beweis. Wegen 78 existiert eine endliche Basis von V . Sei X eine solche, die möglichst 

wenig Elemente hat, n = |X|. Nun sei Z irgendeine andere Basis von V . Wegen 83 gilt 

|Z| ≤ n. Andererseits gilt |Z| ≥ n. 

Die letzte Behauptung folgt unmittelbar aus 83. 

Für endlich erzeugbare Vektorräume haben wir den Hauptsatz 79 bewiesen. Der Beweis 

für nicht endlich erzeugbare Vektorräume steht noch aus. Dieser Fall kommt in den mir 

bekannten Lehrbüchern nicht vor. Genauer gesagt: Ich kenne kein Buch, in dem der 

Beweis wirklich ausgeführt wird. Zum Beispiel Serge Lang in ’Algebra’, Seite 87: ’We shall 

leave the general case of an infinite basis as an exercise to the reader.’ Nichtsdestoweniger 

gebe ich für interessierte Studenten einen 

Beweis des Satzes 79 für den Fall, dass V nicht endlich erzeugbar ist. 

Wir benutzen dafür einen rein mengentheoretischen Satz (der das Auswahlaxiom voraus- 

setzt). 

Satz Sei Y eine unendliche Menge und Ω eine Menge, deren Elemente endliche Teilmen- 

gen von Y sind, und die ∪Ω = Y erfüllt. Dann gibt es eine Bijektion Ω → Y . 

Nun sei V ein nicht endlich erzeugbarer K-Vektorraum und seien X und Y Basen von V . 

Wir wollen eine Bijektion X → Y gewinnen. 

X und Y sind unendliche Mengen. Sei Γ die Menge aller endlichen Teilmengen von X 

und Σ die Menge aller endlichen Teilmengen von Y . 

(*) Die Abbildung ′ : Γ → Σ, M ↦→ M ′ := Y ∩ 〈M〉 ist wohldefiniert. 

Für die Bildmenge Ω := Γ ′ gilt ∪Ω = Y . 

Beweis von (*). Zur Wohldefiniertheit. Sei M ∈ Γ. Die Menge M ′ := Y ∩ 〈M〉 ist (als 

Teilmenge der linear unabhängigen Menge Y ) linear unabhängig und im endlich erzeugten 

Untervektorraum 〈M〉 enthalten; nach 84 also eine endliche Menge, d.h. M ′ ∈ Σ. 

Sei nun y ∈ Y . Da y Linearkombination von endlich vielen Vektoren aus X ist, gibt es ein 

M ∈ Γ mit y ∈ 〈M〉, also gilt y ∈ M ′ ∈ Ω.


Der oben zitierte mengentheoretische Satz liefert (+): Ω und Y sind gleichmächtig (d.h. 

es gibt eine Bijektion Ω → Y ). 

Der gleiche Satz liefert unmittelbar: (++) X und Γ sind gleichmächtig. 

Aus (++) und (*) und (+) folgt: Es gibt eine surjektive Abbildung von X auf Y . 

Daraus folgt (siehe Kapitel 1, 10 und 11): Es gibt eine injektive Abbildung Y → X. Analog 

beweist man (X, Y vertauschen): Es gibt eine injektive Abbildung X → Y . 

Der Satz von Schröder und Bernstein 23 liefert eine Bijektion X → Y . 

4.0.12 

Wenn V ein endlich erzeugbarer K-Vektorraum ist, so ist seine Dimension endlich. 

Satz 85 Sei n := dimV ∈ N0. 

a) Jeder Untervektorraum U von V hat endliche Dimension dimU ≤ n. 

b) Es gilt für jeden Untervektorraum U: dimU = dimV ⇔ U = V . 

c) dimV = max{ |Z| | Z ⊆ V ist linear unabhängig } = 

min{ |Z| | Z ⊆ V, Z endlich und 〈Z〉 = V }. 

Beweis. Zu a). Sei U ein Untervektorraum. Dieser hat eine Basis Y . Der Austauschsatz 

von Steinitz 83 erzwingt |Y | ≤ n. 

Zu b), ⇒. Sei dimU = dimV . Wähle eine Basis X von U. 78, a) liefert eine Basis Z von 

V mit X ⊆ Z. Dann ist dimV = dimU = |X| ≤ |Z| = dimV , also |X| = |Z| und damit 

X = Z. Also U = 〈X〉 = 〈Z〉 = V . 

c) folgt aus 79 und den Korollaren zu 73.

5 UNTERVEKTORRÄUME, DIREKTE SUMMEN, RANG EINER MATRIX 65 

5 Untervektorräume, direkte Summen, Rang einer Matrix 

Im folgenden sei V ein K−Vektorraum (K ein Schiefkörper). 

5.0.13 Summe von Untervektorräumen 

Wenn U1, U2 Untervektorräume von V sind, so ist auch U1 ∩ U2 ein Untervektorraum. 

Aber U1 ∪ U2 ist im allgemeinen kein Untervektorraum, d.h. U1 ∪ U2 = 〈U1 ∪ U2〉. 

Stets ist U1 +U2 := {u1 +u2 | ui ∈ Ui} ein Untervektorraum, und deshalb gilt 〈U1 ∪ U2〉 = 

U1 + U2. Allgemein: 

Beobachtung 86 (Summe von Untervektorräumen) Seien U1, . . . , Uk Untervek- 

torräume von V . Dann gilt 〈U1 ∪ ... ∪ Uk〉 = U1 + ... + Uk. 

In der obigen Situation können wir also jedes v ∈ 〈U1∪...∪Uk〉 schreiben als v = u1+...+uk 

(wobei ui ∈ Ui ist). Im allgemeinen sind die ui dabei durch v nicht eindeutig bestimmt. 

Lemma 87 (von der direkten Summe) Seien U1, . . . , Uk Untervektorräume von V . 

Dann sind (i) und (ii) äquivalent. 

(i) (Eindeutigkeit der Summen-Darstellung) Aus u1 + · · · + uk = u ′ 1 + · · · + u′ k folgt 

u1 = u ′ 1 , . . . , uk = u ′ k , für alle ui, u ′ i 

∈ Ui. 

(ii) Für alle i ∈ {1, . . . , k} gilt: Ui ∩ (U1 + · · · + Ui−1 + Ui+1 + · · · + Uk) = {0} 

Speziell für k = 2 lautet (i): u1 + u2 = u ′ 1 + u′ 2 ⇒ u1 = u ′ 1 und u2 = u ′ 2 . 

Und (ii) sagt: U1 ∩ U2 = {0}. 

Beispiel im R 3 U1 = 〈(1, 0, 0) , (0, 1, 0)〉 , U2 = 〈(1, 1, 1)〉. Es gilt die Bedingung (ii), 

d.h. U1∩U2 = {0}. Es ist dim (U1 + U2) = 3, also U1+U2 = R 3 . Man schreibt U1⊕U2 = R 3 

und sagt: R 3 ist direkte Summe von U1 und U2. 

Definition 88 (direkte Summe) Seien U1, . . . , Uk Untervektorräume von V . Wenn (i) 

oder (ii) des vorigen Lemmas gilt, schreibt man U1 ⊕ · · · ⊕ Uk = U1 + · · · + Uk (= 

〈U1 ∪ · · · ∪ Uk〉) und sagt: U1 + · · · + Uk ist direkte Summe von U1, . . . , Uk. 

Man nennt einen Untervektorraum W (von V ) ein (Vektorraum-)Komplement des 

Untervektorraums U (von V ) wenn V = U ⊕ W gilt. 

Lemma 89 (vom Vektorraumkomplement) Jeder Untervektorraum U von V hat ein 

Komplement. 

Beweis. Man wähle eine Basis X von U. Nach 76 gibt es eine Basis B von V mit X ⊆ B. 

Setze Z := B \ X und W := 〈Z〉. Offenbar gilt U ∩ W = {0} und U + W = 〈U ∪ W 〉 = 

〈X ∪ Z〉 = 〈B〉 = V .


5.1 Dimensionsformel 

Satz 90 (Dimensionsformel) Sei dimV endlich. 

a) Falls V = U ⊕ W ist, gilt dimV = dimU + dimW . 

b) Für alle Untervektorräume U, W von V gilt 

dimU + dimW = dim (U + W ) + dim (U ∩ W ) . 

Wir bemerken: a) ist der Spezialfall von b) für U ∩ W = {0}. 

Beweis. Zu a). Wenn wir irgendeine Basis X von U und eine Basis Z von W nehmen, so 

ist X ∪ Z eine Basis von V . 

Zu b). 89 verschafft uns Untervektorräume U ′ , W ′ mit U = U ′ ⊕ (U ∩ W ) und W = 

W ′ ⊕ (U ∩ W ). Wegen a) (mit U anstelle von V ) gilt dimU = dimU ′ + dim(U ∩ W ) und 

ebenso dimW = dimW ′ + dim(U ∩ W ). Also U + W = U ′ ⊕ (U ∩ W ) ⊕ W ′ und deshalb 

nach a) dim(U + W ) = dimU ′ + dim(U ∩ W ) + dimW ′ = dimU + dimW ′ . Das zeigt b). 

5.1.1 Die äußere direkte Summe 

Man kann zwei Vektorräume V und W über dem gleichen Schiefkörper zu einem größeren 

Vektorraum verbinden. Dieser größere Vektorraum wird bei diesem Prozeß (fast) direkte 

Summe der beiden ursprünglichen Vektorräume. Man betrachte nämlich das karthesische 

Produkt V × W (d.h. die Menge aller Paare (v, w) mit v ∈ V und w ∈ W ). Dies wird 

ein Vektorraum durch (v, w) + (v ′ , w ′ ) := (v + v ′ , w + w ′ ) und λ(v, w) := (λv, λw). Setze 

ˆV := {(v, 0) | v ∈ V } und ˆ W := {(0, w) | w ∈ W }. Offenbar gilt V × W = ˆ V ⊕ ˆ W . 

Definition 91 Man nennt den oben konstruierten Vektorraum V × W die äußere direkte 

Summe von V und W . 

5.1.2 Vektorraum-Isomorphismen 

Als Isomorphismus zwischen zwei gleichartigen Strukturen (zwei Vektorräumen, zwei 

Gruppen, zwei Ringen, zwei affinen Ebenen,....) bezeichnet man eine strukturtreue Bi- 

jektion. 

Definition 92 Seien V und W K-Vektorräume (für beide der gleiche Schiefkörper K). 

Eine Abbildung ϕ : V → W heißt (Vektorraum-)Isomorphismus, wenn ϕ bijektiv ist und 

ϕ linear ist, d.h. es gilt 

(a + b)ϕ = aϕ + bϕ und (λa)ϕ = λ(aϕ) 

für alle a, b ∈ V und λ ∈ K. 

Wenn V = W ist, spricht man von einem Vektorraum-Automorphismus.


Wenn man einen Vektorraumisomorphismus ϕ : V → W hat, sind beide Vektorräume 

fast gleich, man kann v ∈ V mit vϕ ’identifizieren’. 

Beobachtung 93 Es gilt 〈v1, ..., vk〉ϕ = 〈v1ϕ, ..., vkϕ〉 für alle v1, ..., vk ∈ V . Man hat 

dimU = dim(Uϕ) für jeden Untervektorraum U von V . 

5.1.3 Isomorphismus auf K n 

Sei V ein n-dimensionaler Vektorraum ( n ∈ N0 ). 

Sei X = (x1, . . . , xn) eine Basis von V . 

Die Abbildung ιX : V → K n , v = λ1x1 + · · · + λnxn ↦→ (λ1, . . . , λn) ∈ K n nennen wir 

die Koordinatenabbildung von V bezüglich der Basis X. Sie ist ein Isomorphismus von V 

auf K n . 

Statt in V zu rechnen kann man in K n rechnen: λ1x1 + ... + λnxn ∈ V wird mit 

(λ1, ...., λn) ∈ K n ’identifiziert’. 

5.1.4 Rang einer Matrix 

Definition 94 Seien m, n ∈ N. Eine m × n-Matrix A = (aij) (mit Einträgen aus K) ist 

eine Abbildung a : {1, ..., m} × {1, ..., n} → K, (i, j) ↦→ aij. 

Sei A = (aij) eine m × n-Matrix. Die Zeilen a1 := (a11, ..., a1n), ..., am := (am1, ..., amn) 

können wir als Vektoren ∈ Kn ansehen. Analog kann man die Spalten ã1, ..., an ˜ als 

Vektoren ∈ K m ansehen. 

Definition 95 Den Zeilenrang von A definiere als dim〈a1, ..., am〉 (Aufspann in K n ). Als 

Spaltenrang von A definiere dim〈ã1, ..., an〉 ˜ (Aufspann in Km ). 

Beobachtung 96 Sei A eine Matrix. Die Matrix B entstehe aus A durch elementare 

Zeilenumformung. Für den Aufspann der Zeilen gilt dann 〈a1, ..., am〉 = 〈b1, ..., bm〉. Ins- 

besondere gilt ZeilenrangA = ZeilenrangB. 

Denn man hat zum Beispiel 〈a1 + λa2, a2, ..., am〉 = 〈a1, ..., am〉 für jedes λ ∈ K. 

Spaltenrang einer reduzierten Treppenmatrix 

Wir betrachten nun eine reduzierte Treppenmatrix A (siehe Kapitel über lineare Glei-


chungssysteme), zum Beispiel 

⎛ 

⎞ 

⎜ 

⎝ 

0 

0 

0 

1 

0 

0 

7 

0 

0 

0 

1 

0 

0 

0 

1 

0 

0 

6 

3 

9 

2 

⎟ 

⎠ 

0 0 0 0 0 0 0 

Hier ist m = 4 und n = 7. Die Spaltenindizes j1, ..., jr der Stufen sind im Beispiel 

j1 = 2, j2 = 4, j3 = 5, und die ersten 3 Zeilen sind von 0 ∈ K n verschieden. Offenbar 

bilden die Spalten zu den Spaltenindizes j1, ..., jr ein linear unabhängiges r-Tupel (diese 

Spalten sind die Standardbasisvektoren e1, ..., er des K m ), und sie bilden eine Basis des 

Spaltenaufspanns: 

〈 aj1 ˜ , ..., ˜ ajr〉 = 〈ã1, ..., am〉. ˜ 

Deshalb gilt: SpaltenrangA = r. 

Da der Aufspann der Zeilen gleich dem Aufspann der Zeilen a1,...,ar ist (die übrigen 

Zeilen sind 0-Zeilen), und (a1, ..., ar) offenbar linear unabhängig ist, folgt Zeilenrang = r. 

Insbesondere gilt: ZeilenrangA = SpaltenrangA. 

Satz 97 Sei K ein Körper. Für jede Matrix A (über K) gilt 

ZeilenrangA = SpaltenrangA. 

Beweis. Wie oben bemerkt wurde, bleibt bei elementaren Zeilenumformungen der 

Zeilenrang gleich. Wir behaupten: 

(i) Bei elementaren Zeilenumformungen bleibt auch der Spaltenrang gleich. 

Beweis (i). Wir betrachen die Abbildung ϕ : K m → K m 

⎛ 

⎜ . 

⎜ 

⎝ 

. 

α1 

αm 

⎞ 

⎟ 

⎠ 

↦→ 

⎛ 

⎜ . 

⎜ 

⎝ 

. 

α1 + α2 

Offenbar ist diese Abbildung ein Vektorraum-Automorphismus. 

Wenn man die elementare Zeilenumformung a1 ↦→ a1 + a2 ausführt, wird aus der Spalte 

ãj die Spalte ãjϕ. Die Spalten der durch die elementare Zeilenumformung entstandenen 

neuen Matrix sind also ã1ϕ, ..., anϕ. ˜ 

Nach Beobachtung 93 gilt 〈ã1ϕ, ..., anϕ〉 ˜ = 〈ã1, ..., an〉ϕ. ˜ Die Dimension dieses Aufspanns 

ist der Spaltenrang der neuen Matrix. Nach 93 hat 〈ã1, ..., an〉 ˜ die gleiche Dimension. 

αm 

⎞ 

⎟ 

⎠


Letzteres ist der Spaltenrang der alten Matrix. 

Ergebnis: Unter der betrachteten elementaren Zeilenumformung bleibt der Spaltenrang 

der Matrix erhalten. 

Ganz ähnlich argumentiert man für die beiden anderen Arten elementarer Zeilenumfor- 

mungen (Vertauschen zweier Zeilen, Multiplizieren einer Zeile mit einem Faktor. Bei der 

letztgenannten Operation braucht man die Kommutativität von K). 

Damit ist (i) bewiesen. 

Wir unterwerfen die Matrix A einer Hintereinanderausführung elementarer Zeilenum- 

formungen, bis eine reduzierte Treppenmatrix entsteht (Gauss-Algorithmus, Kapitel 

über lineare Gleichungssysteme). Dabei bleiben nach dem oben Gesagten und (i) sowohl 

Zeilenrang als auch Spaltenrang erhalten. 

Für eine reduzierte Treppenmatrix T haben wir hergeleitet: ZeilenrangT = SpaltenrangT . 

Also gilt ZeilenrangA = SpaltenrangA für die gegebene Matrix A. 

Definition 98 Für eine Matrix A über einem Körper setzen wir RangA := ZeilenrangA = 

SpaltenrangA 

Oben haben wir erkannt: Der Rang einer reduzierten Treppenmatrix ist gleich der Anzahl 

r der Zeilen = 0. 

5.1.5 Basis des Lösungsraums eines linearen homogenen Gleichungssystens 

Sei K ein Körper. Wir betrachten ein homogenes lineares Gleichungssystem 

a11x1 + ... + a1nxn = 0 

..... .... 

..... .... 

am1x1 + ... + amnxn = 0 

mit aij ∈ K. Wir gewinnen aus der Matrix (aij) (1 ≤ i ≤ m; 1 ≤ j ≤ n) eine reduzierte 

Treppenmatrix. Dann können wir (siehe Kapitel über Lineare Gleichungssysteme) die 

Lösungsmenge Y angeben. Y ist ein Untervektorraum des K n . 

Sei r die Anzahl der von 0 verschiedenen Zeilen der Treppenmatrix (also ihr Rang) 

und seien j1, ..., jr die Spaltenindizes der Stufen. Dann kann man yj ∈ K für 

j ∈ {1, ..., n} \ {j1, ..., jr} beliebig wählen und yj1 , ..., yjr aus der Treppenmatrix


passend bestimmen; so erhält man alle Lösungen y = (y1, ..., yn) ∈ Y . 

(L) Besonders einfache Lösungen wj = (wj1, ..., wjn) ∈ Y für j ∈ {1, ..., n} \ {j1, ..., jr} 

erhält man wie folgt: 

Setze wjj := 1; wjq := 0 falls q ∈ {1, ..., n} \ {j1, ..., jr} ist; berechne wjj1 , ..., wjjr aus der 

Treppenmatrix. 

Für die Beispiel-Treppenmatrix oben erhält man {1, ..., n} \ {j1, ..., jr} = {1, 3, 6, 7} und 

w1 = (1, 0, 0, 0, 0, 0, 0) 

w3 = (0, −7, 1, 0, 0, 0, 0) 

w6 = (0, 0, 0, 0, −6, 1, 0) 

w7 = (0, −3, 0, −9, −2, 0, 1). 

Dann gilt (da Y ein Untervektorraum ist) 〈w1, w3, w6, w7〉 ⊆ Y . 

Jede Lösung y = (y1, ..., y7) kann man schreiben als y = y1w1 + y3w3 + y6w6 + y7w7. 

Deshalb gilt Y ⊆ 〈w1, ..., w7〉. 

Also ist Y = 〈w1, w3, w6, w7〉. 

Offenbar ist die Menge {w1, w3, w6, w7} linear unabhängig. 

Ergebnis: (w1, w3, w6, w7) ist eine Basis des Lösungsraum Y . 

Wegen |{1, ..., n} \ {j1, ..., jr}| = n − r gilt dimY = n − r. 

Die am Beispiel erklärten Argumente zeigen 

Satz 99 Sei K ein Körper und ein homogenes lineares Gleichungssystem wie oben gege- 

ben. Sei r der Rang der zugehörigen Matrix. 

Aus A entstehe eine reduzierte Treppenmatrix mit Stufenindizes j1, ..., jr. 

Das n − r-Tupel der in (L) definierten Vektoren wj (zu j ∈ {1, ..., n} \ {j1, ..., jr}) ist eine 

Basis des Lösungsraums Y . Insbesondere gilt dimY = n − r. 

5.1.6 Kriterium zur Lösbarkeit eines linearen Gleichungssystems 

Wir untersuchen ein beliebiges lineares Gleichungssystem 

(∗) 

a11x1 + ... + a1nxn = b1 

..... .... 

..... .... 

am1x1 + ... + amnxn = bm


Die zugehörige Matrix 

⎛ 

a11 ... a1n | b1 

⎜ ... 

⎜ 

⎝ 

... 

am1 ... amn | bm 

⎞ 

⎟ 

⎠ 

= (A | b) 

können wir durch elementare Zeilenumformungen in eine reduzierte Treppenmatrix 

T = (A ′ |b ′ ) verwandeln. Nehmen wir an, diese Matrix hat nicht nur Einträge = 0. 

Es gibt zwei Alternativen: 

(0) Die unterste Zeile = 0 von T hat die Form (0......01). In diesem Fall hat (siehe Kapitel 

über Lineare Gleichungssysteme) das lineare Gleichungssystem keine Lösung. 

(l) Die unterste Zeile = 0 von T hat die Form (0.....1 ∗ ..∗) (mit 1 nicht an letzter Stelle 

n + 1). In diesem Fall hat das lineare Gleichungssystem mindestens eine Lösung. 

Im Fall (0) gilt Rang(A|b) = Rang(A ′ |b ′ ) = RangA ′ + 1 = RangA + 1. 

Im Fall (l) gilt Rang(A|b) = Rang(A ′ |b ′ ) = RangA ′ = RangA. 

Wir haben eingesehen: 

Satz 100 Folgende Aussagen sind äquivalent. 

(i) Das lineare Gleichungssystem (*) hat mindestens eine Lösung. 

(ii) Rang(A|b) = RangA .

6 HOMOMORPHISMEN, LINEARE ABBILDUNGEN, AFFINE RÄUME 72 

6 Homomorphismen, lineare Abbildungen, affine Räume 

Ein Homomorphismus ist eine Abbildung einer ’Struktur’ auf eine weitere Struktur der 

gleichen Sorte (zum Beispiel Gruppe → Gruppe, Ring → Ring, Vektorraum → Vektor- 

raum) derart, dass die Struktur erhalten bleibt. 

Definition 101 (Gruppen-Homomorphismus) 1. Seien G, · und G ′ , · Gruppen. Ein 

(Gruppen-)Homomorphismus von G nach G ′ ist eine Abbildung ϕ : G → G ′ mit der 

Eigenschaft (a · b)ϕ = (aϕ) · (bϕ) für alle a, b ∈ G. 

Man definiert dann Kernϕ := {a ∈ G | aϕ = 1}. 

2. Seien R, +, · und R ′ , +, · Ringe. Ein (Ring-)Homomorphismus von R in R ′ ist eine 

Abbildung ϕ : R → R ′ mit (a + b)ϕ = aϕ + bϕ und (a · b)ϕ = (aϕ) · (bϕ) für alle a, b ∈ R. 

Man setzt Kernϕ := {a ∈ R | aϕ = 0}. 

3. Ein Homomorphismus ϕ heißt Endomorphismus, wenn Definitionsmenge = Zielmenge 

ist; Monomorphismus, wenn ϕ injektiv ist; Epimorphismus, wenn ϕ surjektiv ist; Isomor- 

phismus, wenn ϕ bijektiv ist; Automorphismus, wenn ϕ Endomorphismus und Isomorphis- 

mus ist. 

Stets bildet die Menge aller Automorphismen einer Struktur (mit der Hintereinander- 

ausführung von Abbildungen als Verknüpfung) eine Gruppe, die Automorphismengruppe 

der Struktur. 

Für Vektorräume ist nicht ohne weiteres klar, was ’strukturerhaltend’ für die Skalarmul- 

tiplikation bedeuten soll. Wir behandeln hier nur lineare Abbildungen. 

Definition 102 (Lineare Abbildung) Seien V und V ′ Vektorräume über dem gleichen 

Schiefkörper K. Eine Abbildung ϕ : V → V ′ heißt linear, wenn gilt (a + b)ϕ = aϕ + bϕ 

und (λv)ϕ = λ(vϕ) für alle a, b ∈ V und λ ∈ K. 

Man setzt Kernϕ := {a ∈ V | aϕ = 0}. 

Hom(V, V ′ ) bezeichne die Menge aller linearen Abbildungen V → V ′ . GL(V ) (general 

linear group) bezeichnet die Gruppe der linearen Bijektionen V → V (mit der Hinterein- 

anderausführung von Abbildungen als Verknüpfung). 

6.0.7 Beispiele von Gruppenhomomorphismen 

1. Sei (G, ·) eine abelsche Gruppe, n ∈ Z. Die Abbildung 

ϕ : G → G, g ↦→ g n


ist ein Gruppenhomomorphismus. Es gilt Kernϕ = {g ∈ G | gϕ = 1} = {g ∈ G | g n = 

1}. 

2. Sei (G, ·) eine Gruppe und c ∈ G. Dann ist 

ϕ : G → G, g ↦→ c −1 gc 

ein Automorphismus von G (eine Permutation, die ein Homomorphismus ist). Man 

nennt ihn den von c bewirkten inneren Automorphismus; auch: die Konjugation 

oder das Konjugieren mit c. von G. 

3. Die Abbildung 

exp : R, + → R>0, ·, α ↦→ exp (α) = e α 

ist bekanntlich ein Gruppenisomorphismus. 

4. Sei X ⊆ Y und G eine Untergruppe der Gruppe S(Y ) aller Permutationen auf Y 

mit der Eigenschaft α(X) = X für alle α ∈ G (man sagt: X ist invariant unter 

G). Die Abbildung G → S(X), α ↦→ α|X (=Restriktion von α auf X) ist ein 

Gruppenhomomorphismus. 

Beispiel: Die Gruppe der Drehungen um den Nullpunkt im R 2 lässt den Einheitskreis 

X invariant. 

5. Sei m ∈ Z. Die Abbildung Z, + → Z/mZ, +, n ↦→ ¯n := n + mZ (d.h. n wird 

auf die n enthaltende Nebenklasse nach der Untergruppe mZ abgebildet) ist ein 

Gruppenhomomorphismus. Diese Abbildung ist sogar ein Ringhomomorphismus vom 

Ring Z, +, · auf den Ring Z/mZ, +, ·. Es gilt nämlich a + b = a + b, und a · b = a · b. 

6. Sei G = a, a 2 , . . . , a n eine zyklische Gruppe mit |G| = n (also a n = 1 und a i = 1 

für 1 ≤ i < n). Dann gilt für jedes i ∈ Z 

(*) a i = 1 ⇔ i ∈ nZ. 

Die Abbildung Z, + → G, ·, j ↦→ a j , ist ein Gruppenepimorphismus. Man hat 

Kern = {j | a j = 1} = nZ. 

Die Abbildung Z/nZ, + → G, ·, i + nZ ↦→ a i , ist wohldefiniert (denn i + nZ = 

j + nZ ⇔ i − j ∈ nZ, und in diesem Fall gilt a i−j = 1, also a i = a j ) und ein 

Gruppenisomorhismus. 

Damit haben wir das Ergebnis: Jede endliche zyklische Gruppe der Ordnung n ist 

isomorph zur Gruppe Z/nZ, +.


6.0.8 Beispiele für Ringhomomorphismen 

1. Sei K ein Körper und α ∈ K. Die Abbildung 

K [x] → K, a0 + a1x + · · · + amx m ↦→ a0 + a1α + · · · + amα m 

ist ein Ringhomomorphismus (sogar Epi-) (denn (p + q) (α) = p (α) + q (α) und 

(pq) (α) = p (α) · q (α)). Man nennt ihn den ’Einsetzhomomorphismus’ (beim Einset- 

zen von α). 

Es gilt Kern = {p ∈ K[x] | p(α) = 0} = (x − α) · K[x] = {(x − α) · q | q ∈ K[x]}. 

(Diese Teilmenge von K[x] nennt man das von dem Polynom x − α in K [x] erzeugte 

Hauptideal.) 

2. Die Abbildung ¯ : C → C, α + βi ↦→ α − βi, wobei α, β ∈ R sind, ist ein 

Körperautomorphismus, d.h. eine Permutation von C mit a + b = a+b und ab = a·b. 

Man nennt diesen Körperautomorphismus das ’Konjugieren’ in C (das hat aber trotz 

gleicher Bezeichnung nichts zu tun mit dem Konjugieren in einer Gruppe wie in 

Beispiel 2. zu Gruppenhomomorphismen). 

6.1 Der affine Raum zu einem Vektorraum 

Sei V ein K-Vektorraum (K ein Schiefkörper, dimV nicht notwendig endlich). 

Wir ordnen V einen affinen Raum wie folgt zu. Zunächst beweist man durch einfache 

Rechnung 

Lemma 103 Seien U, W Untervektorräume und a, b ∈ V . Dann ist (i) zu (ii) äquivalent. 

(i) Es gilt a + U ⊆ b + W . 

(ii) U ⊆ W und a − b ∈ W . 

Insbesondere gilt: a + U = b + W ⇔ a − b ∈ U = W . 

Ein k-dimensionaler affiner Teilraum (k ∈ N0) ist eine Nebenklasse a + U in der Gruppe 

V, +, wobei U ein k-dimensionaler Untervektorraum ist (k = ∞ zugelassen) und a ∈ V . 

Außerdem ist es zweckmäßig, die leere Menge ∅ als affinen Teilraum anzusehen. 

Die 0-dimensionalen affinen Teilräume sind also die Elemente a ∈ V (eigentlich 

{a} = a + {0}); man nennt sie (affine) Punkte. 

Die 1-dimensionalen Teilräume, also diejenigen der Form a + Kb (mit a, b ∈ V und b = 0), 

nennt man affine Geraden; die 2-dimensionalen affine Ebenen. 

Ein affiner Teilraum a + U ist genau dann ein Untervektorraum, wenn 0 ∈ a + U gilt 

(siehe Lemma).


Affine Teilräume sind uns bereits begegnet: Jede Lösungsmenge eines linearen Gleichungs- 

systems mit n Unbekannten ist ein affiner Teilraum des K n . 

Die Relation ⊆ zwischen affinen Teilräumen nennt man Inzidenz. 

Affine Teilräume a + U und b + W heißen parallel, wenn U ⊆ W oder W ⊆ U gilt. 

a + U ist also der zu U = 0 + U parallele affine Teilraum durch den Punkt a. 

Es gilt: 

(A1) (Existenz und Eindeutigkeit der Verbindungsgeraden) Zu Punkten a, b ∈ V mit 

a = b existiert genau eine (affine) Gerade, die mit a und b inzidiert; nämlich a + K(b − a). 

(A2) (Parallelenaxiom) Zu einer Geraden a + U und jedem Punkt b ∈ V existiert genau 

eine zu a + U parallele Gerade, die mit b inzidiert; nämlich b + U. 

Das Quadrupel aus der Punktmenge V , der Menge der affinen Geraden, der Inzidenzre- 

lation zwischen Punkten und Geraden und der Parallelrelation zwischen Geraden nennt 

man den affinen Raum zum (über) dem Vektorraum V . 

Allein aus diesen vier Begriffen lassen sich alle affinen Teilräume gewinnen; denn es gilt: 

Eine Teilmenge M ⊆ V ist genau dann ein affiner Teilraum, wenn (A1) und (A2) gelten: 

(A1) Falls a, b ∈ M und a = b ist, so folgt für die Verbindungsgerade a + K(b − a) ⊆ M. 

(A2) Falls die Gerade a + U Teilmenge von M ist und b ∈ M, so gilt für die Parallele von 

a + U durch b auch b + U ⊆ M. 

Satz 104 Sei ϕ ∈ GL(V ) (d.h. ϕ ist eine lineare Bijektion V → V ). Dann bewirkt ϕ eine 

dimensions-, inzidenz- und parallel-treue Bijektion der Menge der affinen Teilräume von 

V . 

ϕ induziert also einen Automorphismus des affinen Raums (zu V ). 

Wir bemerken, dass auch jede Translation τc : V → V, v ↦→ v + c (wobei c ∈ V sei) 

die für ϕ im Satz genannten Eigenschaften hat. Deshalb liegt jede Abbildung ϕτc (mit 

ϕ ∈ GL(V )) in der Automorphismengruppe des affinen Raums. 

Im allgemeinen gibt es Automorphismen des affinen Raums, welche nicht die Form ϕτc 

haben (zum Beispiel im Fall K = C). Jedoch im Fall K = R hat jeder Automorphismus 

des affinen Raums die Form ϕτc. 

Statt Automorphismus des affinen Raums sagt man auch Kollineation.


Wenn dimV = 2 ist, sagt man ’affine Ebene’ statt affiner Raum. 

6.2 Lineare Abbildungen 

6.2.1 Beispiele linearer Abbildungen 

Wir werden lineare Abbildungen gründlich studieren, beginnen aber trotzdem mit einigen 

einfachen Beispielen. Im folgenden sei V ein K-Vektorraum (K ein Schiefkörper). 

1. Sei V ein Vektorraum und V = U W. 

a) Die Abbildung ϕ : V → U, v = u + w ↦→ u ist wohldefiniert und linear. 

Es gilt Kern = {u + w | u = 0} = W . Man nennt ϕ die Projektion auf U 

bezüglich der Zerlegung V = U W . Es gilt ϕ 2 = ϕ. 

b) Die Abbildung σ : V → V , v = u + w ↦→ u − w ist eine lineare Bijektion. Es 

gilt σ 2 = 1V (identische Abbildung auf V ). 

Man nennt σ die Schrägspiegelung mit Achse U längs W 

2. Sei c ∈ V. Die Abbildung τc : V → V , v ↦→ v + c ist nicht linear. Man nennt τc die 

Translation (zum Vektor c). 

3. Sei K kommutativ und λ ∈ K. Dann ist ϕ : V → V , v ↦→ λv linear und im Fall 

λ = 0 bijektiv. Man nennt ϕ die Streckung (auch Homothetie) mit Zentrum 0 zum 

(Streckungs-)Faktor λ. 

4. Sei (e1, . . . , en) eine Basis von V Dann ist 

V → K n , λ1e1 + · · · + λnen ↦→ (λ1, . . . , λn) linear und sogar ein Isomorphismus. 

5. In einer Übungsaufgabe wurde die Gruppe der Drehungen (um den Nullpunkt) der 

euklidischen Ebene vorgestellt. Jede solche Drehung ist eine lineare Bijektion, d.h. 

∈ GL(V ). 

6.2.2 Elementare Sätze über lineare Abbildungen 

Im folgenden seien K ein Schiefkörper und V, W K-Vektorräume. 

Hom (V, W ) bezeichne die Menge der linearen Abbildung V → W . 

GL (V ) ist die Gruppe der linearen Bijektionen V → V . 

Für ϕ ∈ Hom (V, W ) setzt man Kernϕ := {v ∈ V | vϕ = 0}.


Beobachtung 105 Sei ϕ ∈ Hom(V, W ). 

a) Sei X ⊆ V . Dann gilt 〈Xϕ〉 = 〈X〉ϕ. 

b) Wenn U ein Untervektorraum von V ist, so ist Uϕ (:= {uϕ | u ∈ U} ) ein Untervek- 

torraum von W . Insbesondere ist die Bildmenge V ϕ ein Untervektorraum von W . Es gilt: 

dim(Uϕ) ≤ dimU. 

Insbesondere ist 0ϕ = 0. 

Kernϕ ist ein Untervektorraum von V . 

c) Für jedes v ∈ V ist die Urbildmenge ϕ −1 ({vϕ}) = v + Kernϕ. D.h. die Menge der mit 

v bildgleichen Elemente ist v + Kernϕ. 

Insbesondere gilt: ϕ ist genau dann injektiv (ein ’Monomorphismus’), wenn Kernϕ = {0} 

gilt. 

d) Wenn (v1, ..., vk) ein linear abhängiges Tupel von Vektoren aus V ist, so ist (v1ϕ, ..., vkϕ) 

ein linear abhängiges Tupel von Vektoren aus W . 

Die Beweise folgen fast unmittelbar aus den Definitionen. 

Bemerkung. In d) darf man Tupel nicht durch Mengen erstzen. 

Beispiel: Im R 2 = R(1, 0)⊕R(0, 1) sei ϕ die Projektion auf R(1, 0) bezüglich der Zerlegung. 

Setze v1 := (1, 1), v2 := (1, 2), v3 := (1, 3). Dann ist {v1, v2, v3} als 3-elementige Menge 

in einem 2-dimensionalen Vektorraum linear abhängig; aber {v1ϕ, v2ϕ, v3ϕ} = {(1, 0)} ist 

linear unabhängig. 

Satz 106 (Dimensionssatz für lineare Abbildungen) Sei ϕ ∈ Hom(V, W ). Dann 

gilt 

In Worten: Für eine lineare Abbildung gilt: 

dim(V ϕ) + dim(Kernϕ) = dimV 

Dimension(Bildraum) + Dimension(Kern) = Dimension(Definitionsraum). 

Beweis. Nach 89 findet man einen Untervektorraum U mit V = U ⊕ (Kernϕ). Die 

Restriktion ϕ|U ist eine lineare Abbildung mit Kern(ϕ|U) = {0} und deshalb injektiv; 

siehe 105. Man hat (1) Uϕ = V ϕ; denn wenn v ∈ V vorliegt, gilt v = u + z für passendes 

u ∈ U und z ∈ Kernϕ; deshalb vϕ = uϕ ∈ Uϕ. Die Abbildung ϕ|U : U → Uϕ 

ist also ein (Vektorraum-)Isomorphismus, und deshalb gilt dim(Uϕ) = dimU. Es folgt 

dim(V ϕ) + dim(Kernϕ) = ( wegen (1) )dim(Uϕ) + dim(Kernϕ) = dimU + dim(Kernϕ) = 

dimV (das letzte = wegen V = U ⊕ Kernϕ).


Korollar 107 Sei ϕ ∈ Hom(V, W ) und n := dimV = dimW < ∞. Folgende Aussagen 

sind äquivalent. 

(i) Kernϕ = {0}. 

(ii) ϕ ist injektiv. 

(iii) ϕ ist surjektiv. 

(iv) ϕ ist bijektiv. 

Beweis. Die Äquivalenz von (i) und (ii) wurde in 105, c) gezeigt. Die Dimensionsformel 

sagt: dim(V ϕ) + dim(Kernϕ) = n. Deshalb ist (i) zu (iii) äquivalent. Also sind die 

Aussagen (i), (ii), (iii) äquivalent. Daraus folgt unmittelbat die Äquivalenz zu (iv). 

Bemerkung In 107 ist die Voraussetzung dimV < ∞ wesentlich. 

Beispiel 1. Sei V := R N der R-Vektorraum der reellen Folgen und ϕ : V → V , 

(a1, a2, ...) ↦→ (0, a1, a2, ....). Dann ist ϕ eine injektive lineare Abbildung aber nicht 

surjektiv. 

Beispiel 2. Sei V = R[x] der Ring der reellen Polynome, angesehen als reeller Vektorraum 

Sei ϕ : amx m + ... + a0 ↦→ ammx m−1 + ... + a1 die Abbildung, welche jedem Polynom 

seine ’formale Ableitung’ zuodnet. Diese Abbildung ist linear und surjektiv, jedoch nicht 

injektiv. 

Der Anschaulichkeit halber formulieren wir die folgende Beobachtung nur für endlich- 

dimensionale Vektorräume. 

Beobachtung 108 (Ur-Erlebnis für lineare Abbildungen) a) Sei ϕ : V → W 

linear und sei (b1, ...., bm) eine Basis von V . Setze wi := biϕ. Dann gilt für jeden Vektor 

v = λ1b1 + ... + λmbm ∈ V 

(∗) vϕ = λ1w1 + ... + λmwm 

Insbesondere ist die lineare Abbildung ϕ eindeutig bestimmt, wenn die Bildelemente biϕ 

einer einzigen Basis von V festgelegt sind. 

b) Sei (b1, ..., bm) eine Basis von V und seien w1, ..., wm ∈ W beliebige Vektoren. Man 

definiere ϕ : V → W durch (*). Dann ist ϕ eine lineare Abbildung. 

Spezialfall 

der vorigen Beobachtung (V = W = R 1 = R, n = 1). Die Basen von R 1 sind genau die 

1-Tupel (z) mit z ∈ R \ {0}.


Jede lineare Abbildung ϕ : R → R hat die Form λ → λα (mit α ∈ R). Es gilt dann 

α = (zϕ) · z −1 für jedes z ∈ R \ {0}, insbesondere α = 1ϕ. Folglich xϕ = (zϕ) · z −1 · x für 

alle x, z ∈ R mit z = 0. 

Das schematische Anwenden dieser Beobachtung nennt man ’Dreisatz’. 

6.3 Lineare Abbildungen und Matrizen 

Sei B = (b1, ..., bm) eine Basis des K-Vektorraums V und C = (c1, ..., cn) eine Basis des 

K-Vektorraums W . 

Wir ordnen einer beliebigen linearen Abbildung ϕ : V → W eine Matrix (bezüglich der 

Basen B, C) zu durch die Vorschrift: 

(M) biϕ = ai1c1 + ... + aincn = 

Das bedeutet: Wir schreiben den Bildvektor biϕ als Linearkombination in der Basis C; 

die Koordinaten von biϕ bilden die i-te Zeile der Matrix (aij). 

j 

aijcj 

Da wir das für b1...bm durchführen, erhalten wir eine m × n-Matrix. 

Bemerkung Die Vorschrift (M) befolgen wir bei der Konvention: Abbildungen werden 

rechts an das Argument geschrieben (also vϕ). 

In der Analysis und Physik ist es eher üblich, Abbildungen links an das Argument zu 

schreiben (also ϕ(v)). In diesem Fall verwenden wir statt (M) die Vorschrift 

(M ′ ) ϕ(bj) = a ′ 1jc1 + ... + a ′ njcn = 

Dann ist (a ′ ij ) eine n × m-Matrix. Die Koordinaten des Vektors ϕ(bj) (bezüglich der Basis 

C) stehen in der j-ten Spalte der Matrix (a ′ ij ). 

Wie hängen die Matrizen (a ′ ij ) und (aij) zusammen? 

Es gilt offenbar: aij = a ′ ji für alle i ∈ {1, ..., m} und j ∈ {1, ..., n}. 

Man sagt: (a ′ ij ) ist die zu (aij) transponierte Matrix. 

Den Grund für die unterschiedlichen Matrizendefinitionen (M) und (M’) in Abhängigkeit 

von der Schreibweise der Abbildungen erklären wir bald. 

Wir schreiben nun konsequent Abbildungen rechts an das Argument, verwenden also (M). 

Wichtiger Spezialfall V = W und B = C (d.h. wir brauchen nur eine Basis). Dann 

i 

a ′ ijci


lautet (M): 

Beispiel 

biϕ = ai1b1 + ... + ainbn = 

j 

aijbj 

V = R 2 , (b1, b2) die Standardbasis b1 = (1, 0) und b2 = (0, 1). 

Die Drehung δ : R 2 → R 2 (um 0 zum Winkelwert α ∈ R) haben wir kennengelernt; es ist 

die lineare Abbildung mit 

b1δ = (cos α, sin α) = cos α b1 + sin α b2 und b2δ = (− sin α, cos α) 

Die Matrix dazu entsprechend der Vorschrift (M) ist also 

cos α sin α 

− sin α cos α 

Bezeichnung Die Menge der m × n-Matrizen mit Einträgen aus dem Schiefkörper K 

bezeichnen wir mit K m×n . 

Satz 109 Wie oben sei B = (b1, ..., bm) eine Basis des K-Vektorraums V und C = 

(c1, ..., cn) eine Basis des K-Vektorraums W . 

Die durch die Vorschrift (M) (ebenso (M’)) definierte Abbildung Hom(V, W ) → K m×n ist 

bijektiv. 

Beweis. Zur Injektivität. 

Seien ϕ und ψ lineare Abbildungen von V nach W , denen durch (M) die gleiche Matrix 

(aij) ∈ K m×n zugeordnet wird. 

Dann folgt biϕ = biψ für alle i ∈ {1, ..., m}. Wegen 108 a) folgt daraus vϕ = vψ für alle 

v ∈ V , also ϕ = ψ. 

Zur Surjektivität. 

Gegeben sei eine Matrix (aij) ∈ K m×n . 

Wir setzen wi := ai1c1 + ... + aincn = 

j aijcj für i ∈ {1, ..., m}. 

Nach 108 b) ist die Abbildung ϕ : V → W , die jeden Vektor v = λ1b1 + ... + λmbm ∈ V 

auf vϕ := λ1w1 + ... + λmwm abbildet, eine lineare Abbildung. Man hat (+) 

biϕ = ai1c1 + ... + aincn für i ∈ {1, ..., m}. Das bedeutet, der Abbildung ϕ wird 

durch Vorschrift (M) die Matrix (aij) zugeordnet. 

Kurz gesagt ist die Aussage des vorigen Satzes: Nach Wahl einer Basis von V und einer 

Basis von W gehört zu jeder linearen Abbildung V → W genau eine m × n-Matrix (durch 

Vorschrift (M) festgelegt); und wenn eine m × n-Matrix gegeben ist, dann gehört zu


ihr genau eine lineare Abbildung V → W (nämlich diejenige mit der Eigenschaft (+) 

biϕ = ai1c1 + ... + aincn). 

Bezeichnung Eine 1 × n-Matrix nennt man manchmal einen Zeilenvektor; eine m × 1- 

Matrix einen Spaltenvektor. Natürlich ist es wichtig, 1 × n-Matrizen und m × 1-Matrizen 

zu unterscheiden. 

6.3.1 Verknüpfungen von Matrizen 

Im folgenden sei K ein Schiefkörper. Wir betrachten nur Matrizen und Vektorräume über 

K. Für (aij), (gij) ∈ K m×n setze (aij)+(gij) := (aij+gij) (d.h. Einträge an entsprechender 

Stelle werden addiert). Mit dieser Addition ist K m×n eine Gruppe (neutrales Element ist 

die m × n-Matrix, deren Einträge alle 0 sind). 

Nun seien (aij) ∈ K m×n und (gkl) ∈ K n×q (die erste Matrix hat also genausoviele Spalten 

wie die zweite Matrix Zeilen hat). Wir definieren eine Produktmatrix (hst) := (aij)·(gkl) ∈ 

K m×q durch hst := n 

j=1 asj ·gjt für s ∈ {1, . . . , m} und t ∈ {1, . . . , q}. Anders gesagt: hst 

ist das gewöhnliche Skalarprodukt der Zeile Nummer s von (aij) mit der Spalte Nummer 

t von (gkl). 

Beobachtung 110 Matrizenmultiplikation (soweit definiert) ist assoziativ, aber im all- 

gemeinen nicht kommutativ. 

Berechnung der Koordinaten des Bildvektors mit Matrizenmultiplikation 

Sei (b1, . . . , bm) eine Basis von V und (c1, . . . , cn) eine Basis von W . Sei ϕ : V → W 

linear und sei (aij) die Matrix von ϕ bezüglich der genannten Basen (Vorschrift (M)). 

Wenn v = λ1b1 + . . . λnbn ∈ V ist und vϕ = µ1c1 + . . . + µncn der Bildvektor, so gilt: 

vϕ = 

λ1(b1ϕ) + ... + λm(bmϕ) = 

λ1(a11c1 + ... + a1ncn) + ... + λm(am1c1 + ... + amncn) = 

(λ1a11 + ... + λmam1)c1 + ... + (λ1a1n + ... + λmamn)cn. 

Wegen 66 (iii) folgt µj = λ1a1j + ... + λmamj für jedes j ∈ {1, ..., n}. 

Dies ist der j-te Eintrag der 1 × n-Matrix (λ1...λm)(aij). 

Ergebnis: Man erhält die Koordinaten des Bildvektors vϕ, indem man die Koordinaten 

von v als 1 × m -Matrix (Zeilenvektor) links an die Matrix (aij) heranmultipliziert: 

(λ1...λm)(aij) = (µ1...µn)


Spezialfall V = K n , W = K m und (b1, . . . , bn) sowie (c1, . . . , cm) seien die Standardbasis. 

Wir identifizieren (λ1, ..., λm) ∈ K m mit der 1 × m-Matrix (λ1...λm) (analog in K n ). Dann 

ist (λ1 . . . λn)ϕ = (µ1 . . . µm), wobei (µ1 . . . µm) = (λ1....λn)(aij) ist. 

Beobachtung 111 Seien ϕ, ψ ∈ Hom(V, W ). Wir definieren ϕ + ψ : V → W , v ↦→ 

vϕ + vψ. 

Dann gilt ϕ + ψ ∈ Hom(V, w). 

Wenn zu ϕ die Matrix (aij) und zu ψ die Matrix (bij) gehört, so gehört zu ϕ + ψ die 

Matrix (aij) + (bij). 

Satz 112 (Matrix der Nacheinanderausführung linearer Abbildungen) Seien 

V, W, Z Vektorräume. Seien (b1, . . . , bm) eine Basis von V , (c1, . . . , cn) eine Basis von 

W , (d1, . . . , dq) eine Basis von Z. 

Seien 

ϕ : V → W linear mit Matrix (aij) (bezüglich (b1, . . . , bm) und (c1, . . . , cn) ), 

ψ : W → Z linear mit Matrix (grs) (bezüglich (c1, . . . , cn) und (d1, . . . , dq)). 

Dann ist ϕψ : V → Z linear, und zu ϕψ gehört die Matrix (aij)(grs) (bezüglich der Basen 

(b1, . . . , bn) und (d1, . . . , dq)). 

Kurz gefaßt sagt der Satz: Der Nacheinanderausführung linearer Abbildungen entspricht 

die Multiplikation der entsprechenden Matrizen. 

Beweis. Linearität von ϕψ ist klar. 

Setze (his) := (aij)(grs) (Produktmatrix). 

Dann gilt his = 

j aijgjs. 

Nun gilt biϕ = 

j aijcj und dann 

biϕψ = 

j aij(cjψ) = 

j 

 

s (j 

aijgjs)ds . 

Das heißt, die s-te Koordinate von biϕψ ist 

j aijgjs, also his. 

aij( 

s gjsds) = 

6.3.2 Lineare Gleichungssysteme und lineare Abbildungen 

Gegeben sei ein lineares Gleichungssystem über einem Körper K: 

(∗) 

a11x1 + ... + a1nxn = b1 

..... .... 

..... .... 

am1x1 + ... + amnxn = bm


Mit ã1, ..., an ˜ bezeichnen wir die Spalten der Matrix (aij); mit b die Spalte, deren Einträge 

die bi sind. Wir sehen nun die Spalten ãi und b als Vektoren des K m an. Wir definieren 

die Abbildung 

ϕ : K n → K m , (x1, ..., xn) ↦→ x1 · ã1 + ... + xn · ˜ 

an 

Die Abbildung ϕ ist linear, und für jedes x ∈ K n ist die Aussage xϕ = b genau dann 

erfüllt, wenn x eine Lösung von (*) ist. Das bedeutet: Die Lösungsmenge X des linearen 

Gleichungssystems ist die Urbildmenge von {b}: 

X = ϕ −1 ({b}). 

Insbesondere gilt: Das lineare Gleichungssystem (*) hat mindestens eine Lösung genau 

dann, wenn b ∈ K n ϕ (der Bildmenge von ϕ) ist. 

Sei ei = (0, ..., 0, 1, 0, ..., 0) (mit 1 an der i-ten Stelle) und Y := {e1, ..., en} die Standardba- 

sis des Kn . Dann gilt 〈Y 〉 = Kn . Da ϕ linear ist, folgt Knϕ = 〈Y 〉ϕ = 〈Y ϕ〉 = 〈ã1, ..., an〉, ˜ 

denn man hat eiϕ = ãi. 

Außerdem ist Kern(ϕ) = {x ∈ K n | xϕ = 0} = Lösungsmenge des zu (*) gehörenden 

homogenen Gleichungssystems. 

Wir fassen die Überlegungen zusammen: 

Satz 113 (Lineare Gl.systeme und lineare Abbildungen) Gegeben sei ein lineares 

Gleichungssystem (*) und es sei ϕ die oben definierte Abbildung. X bezeichne die Lösungs- 

menge. 

a) Folgende Aussagen sind äquivalent. X = ∅ (d.h. (*) hat mindestens eine Lösung); 

b ∈ 〈ã1, ..., an〉 ˜ ; dim〈ã1, ..., an〉 ˜ = 〈ã1, ..., an, ˜ b〉. 

b) Kernϕ ist die Lösungsmenge des zugehörigen homogenen Gleichungssystems. 

Sei z ∈ X. Dann gilt: ϕ −1 ({b}) = X = z + Kernϕ. 

c) dim Kern(ϕ) = n − dim Bild(ϕ) = n − dim〈ã1, ..., an〉. ˜ 

Aussage c) folgt aus 106. 

6.3.3 Der Ring der n × n-Matrizen 

Sei K ein Schiefkörper und n ∈ N. Die n × n-Einheitsmatrix E ist 

⎛ 

⎞ 

1 

⎜ 0 

E := ⎜ 

⎝ 

.. 

0 

1 

.. 

... 

0 

.. 

0 

⎟ 

... 

⎟ 

.. ⎟ 

⎠ 

0 ... 0 1


Auf K n×n haben wir eine assoziative Multiplikation erklärt, und E ist offenbar ein (rechts- 

und links-) neutrales Element bezüglich dieser Multiplikation. Deshalb ist K n×n eine Halb- 

gruppe mit (genau einem) neutralem Element E. 

Außerdem wurde die Addition + auf K n×n definiert. Offenbar ist K n×n , + eine Gruppe 

(das neutrale Element bezüglich + ist die n × n-Matrix, deren Einträge sämtlich 0 sind). 

Man überzeugt sich durch Nachrechnen von der Gültigkeit der Distributivgesetze und hat 

damit 

Satz 114 K n×n , +, · ist ein Ring. 

Deshalb schreibt man in diesem Zusammenhang gerne 1 oder 1V für idV . 

Nun sei ein n-dimensionaler K-Vektorraum V gegeben. Wir wählen eine Basis (b1, ..., bn) 

von V . Jeder Matrix A = (aij) ∈ K n×n ordnen wir die lineare Abbildung ϕA zu, welche 

durch die Eigenschaft biϕA = ai1b1 + ... + ainbn für alle i ∈ {1, ..., n} festgelegt ist. Nach 

109 ist die Abbildung ι : K n×n → Hom(V, V ), A ↦→ ϕA bijektiv. 

Aus 112 folgt ϕAϕB = ϕAB für alle A, B ∈ K n×n . Außerdem haben wir gesehen ϕA+ϕB = 

ϕA+B. Die Abbildung ι : K n×n → Hom(V, V ), A ↦→ ϕA, erfüllt also Aι + Bι = (A + B)ι 

sowie Aι · Bι = (A · B)ι. Eine Bijektion von einem Ring auf einen anderen Ring mit diesen 

Eigenschaften nennt man einen Ringisomorphismus. Wir fassen zusammen: 

Satz 115 Die oben definierte Abbildung 

K n×n → Hom(V, V ), A ↦→ ϕA 

ist ein Isomorphismus des Rings der n × n-Matrizen über K auf den Ring Hom(V, V ) der 

Endomorphismen von V . D.h. die Abbildung ist bijektiv, und es gilt ϕAϕB = ϕAB für alle 

A, B ∈ K n×n sowie ϕA + ϕB = ϕA+B. 

Sei A ∈ K n×n . Wenn es B ∈ K n×n mit A · B = E gibt, folgt aus dem vorigen Satz 

ϕA · ϕB = ϕA·B = ϕE = idV , und deshalb ist ϕA injektiv. Wegen 107 ist ϕA dann bereits 

bijektiv ( ϕA ∈ GL(V ) ), und es folgt (siehe 12) ϕB · ϕA = idV , also ϕB·A = ϕE und damit 

B · A = E. Wir haben die erste Behauptung des folgenden Satzes gezeigt: 

Satz 116 Seien A, B ∈ K n×n . Wenn AB = E gilt, folgt BA = E, und B mit der 

Eigenschaft AB = E ist eindeutig. 

Zur Eindeutigkeitsaussage: Wenn AB = E = AC ist, folgt nach dem schon Gezeigten 

BA = E und dann B = EB = BAB = BAC = EC = C.


Definition 117 Man nennt A ∈ K n×n invertierbar (auch: regulär), wenn es B ∈ K n×n 

gibt mit AB = E. Man schreibt dann A −1 := B. Die Menge der invertierbaren Matrizen 

bezeichnen wir mit GLn(K). Nicht reguläre Matrizen in K n×n nennt man auch singulär. 

Wir fassen zusammen. 

Satz 118 GLn(K), · ist eine Gruppe. Die Abbildung GLn(K) → GL(V ), A ↦→ ϕA ist ein 

Gruppenisomorphismus, d.h. eine Bijektion mit der Eigenschaft ϕA·B = ϕA · ϕB. 

Satz 119 Sei A ∈ K n×n . Folgende Aussagen sind äquivalent. 

(i) ϕA ist injektiv. 

(ii) ϕA ist surjektiv. 

(iii) ϕA ist bijektiv. 

(iv) Kernϕ = {0} . 

(v) A ist regulär (invertierbar), d.h. es gibt B ∈ K n×n mit AB = E. 

(vi) (b1ϕA, ..., bnϕA) ist eine Basis von V . 

(vii) RangA = n. 

Beweis. Die Äquivalenz von (i),...,(iv) wurde in 107 bewiesen. 

Nach dem vorigen Satz gilt für jede Matrix A ∈ K n×n : Es ist A ∈ GLn(K) genau dann, 

wenn ϕA ∈ GL(V ) zutrifft. Also sind (i),...,(v) äquivalent. 

Es gilt V ϕA = 〈b1, ..., bn〉ϕA = 〈b1ϕA, ..., bnϕA〉. Deshalb folgt aus (vi) die Aussage (ii). 

Aus (ii) folgt 〈b1ϕA, ..., bnϕA〉 = V . Da die V aufspannende Menge {b1ϕA, ..., bnϕA} eine 

Basis von V enthält und jede Basis aus n Elementen besteht, ist (b1ϕA, ..., bnϕA) eine 

Basis von V ; also gilt (vi). 

Die Aussage (v) ist unabhängig von der Wahl des n-dimensionalen K-Vektorraums V und 

der gewählten Basis (b1, ..., bn). Wir dürfen also V = K n und die Standardbasis nehmen. 

Dann sind b1ϕA = a1, ...., bnϕA = an die Zeilen der Matrix A. Diese bilden genau dann 

eine Basis des K n , wenn RangA = n ist. Also ist (vi) äquivalent zu (vii). 

Bemerkung Eine 2 × 2-Matrix über einem Körper ist genau dann invertierbar, wenn 

a11a22 − a12a21 = 0 ist. Wir werden das im Kapitel über Determinanten verallgemeinern. 

6.3.4 Änderung der Abbildungsmatrix bei Basiswechsel 

Wenn V ein endlich-dimensionaler K-Vektorraum mit gegebener Basis B und W ein 

endlich-dimensionaler K-Vektorraum mit gegebener Basis C ist, haben wir jeder linearen 

Abbildung ϕ : V → W genau eine Matrix A bezüglich der Basen B, C zugeordnet 

(Vorschrift (M)).


Wenn man andere Basen B ′ , C ′ zugrundelegt, ergibt sich i.a. zur gleichen linearen 

Abbildung eine andere Matrix A ′ . 

Man kann ausrechnen, wie A und A ′ miteinander zusammenhängen. Wir beschränken 

uns hier auf den wichtigsten Fall V = W und B = C und B ′ = C ′ . 

Voraussetzung Seien V ein K-Vektorraum und B = (b1, ..., bn) sowie (b ′ 1 , ..., b′ n) Basen 

von V . 

Sei C = (cij) die Matrix bezüglich der Basis B zur linearen Abbildung V → V mit bi ↦→ b ′ i . 

Also 

b ′ i = ci1b1 + ... + cinbn 

für i ∈ {1, ..., n}. Manche Leute nennen C die Übergangsmatrix von B zu B ′ . 

Satz 120 (Änderung der Abbildungsmatrix) Seien V ein K-Vektorraum und B = 

(b1, ..., bn) sowie (b ′ 1 , ..., b′ n) Basen von V . 

Sei ϕ ∈ Hom(V, V ) und A die Matrix von ϕ bezüglich der Basis B; A ′ die Matrix von ϕ 

bezüglich der Basis B ′ . Dann gilt A ′ = CAC −1 . 

Beweis. Die Matrix C ist regulär, da sie zu einer surjektiven linearen Abbildung V → V 

gehört (siehe 119). Nach Definition der Matrizen A und A ′ gilt 

Es folgt für alle i ∈ {1, ..., n} 

 

( 

cijajs)bs = 

s 

j 

biϕ = 

aijbj und b ′ iϕ = 

j 

j 

cij( 

 

a ′ ijb ′ j = 

j 

j 

s 

j 

a ′ ijb ′ j 

ajsbs) = 

cij(bjϕ) = ( 

cijbj)ϕ = b ′ iϕ = 

a ′ ij( 

s 

j 

cjsbs) = 

( 

a ′ ijcjs)bs 

Daraus liefert Koordinatenvergleich 

j cijajs = 

j a′ ij cjs für alle i, s ∈ {1, ..., n}. Die linke 

Seite dieser Identität ist der i, s-Eintrag der Matrix CA; die rechte Seite der i, s-Eintrag 

der Matrix A ′ C. Wir haben also CA = A ′ C. Es folgt A ′ = CAC −1 . 

Definition 121 Man nennt Matrizen A, A ′ ∈ K n×n ähnlich, wenn es eine invertierbare 

Matrix D ∈ GLn(K) gibt mit A ′ = D −1 AD. 

Man nennt lineare Abbildungen ϕ, ϕ ′ ∈ Hom(V, V ) ähnlich, wenn es ψ ∈ GL(V ) gibt mit 

ϕ ′ = ψ −1 ϕψ. 

Wir haben oben bewiesen, dass die Matrizen der gleichen linearen Abbildung ϕ : V → V 

bezüglich verschiedener Basen zueinander ähnlich sind. 

s 

j 

j


6.3.5 Hom(V, W ) als Vektorraum; der Dualraum eines Vektorraums 

Seien V und W Vektorräume über einem Schiefkörper K. 

Im Fall V = W haben wir die Hintereinanderausführung von Abbildungen als Multipli- 

kation benutzt, um Hom(V, W ) zu einem Ring zu machen. Nun ist aber V = W erlaubt. 

Die Menge W V aller Abbildungen von V in W ist (mit passend definierten Verknüpfun- 

gen) ein K-Vektorraum. 

Ist Hom(V, W ) ein Untervektorraum dieses Vektorraums? 

Im allgemeinen nicht: Zwar ist idV ∈ Hom(V, W ), aber für λ ∈ K ist die Abbildung 

λ · idV nicht immer ∈ Hom(V, W ); denn dazu muß für jedes µ ∈ K und v ∈ V gelten 

(µv)(λ · idV ) = µ (v(λ · idV )), also λµv = µλv. Dies trifft zu, wenn λµ = µλ ist. Deshalb: 

Voraussetzung im folgenden K ist ein Körper. 

Dann gilt 

Beobachtung 122 Hom(V, W ) ist ein K-Vektorraum (ein Untervektorraum des K- 

Vektorraums W V ). 

Nun seien m, n ∈ N. Wir können K m×n zu einem K-Vektorraum machen: die Addition 

zweier Matrizen haben wir oben bereits definiert; und λA sei die Matrix, die man aus A 

gewinnt, indem man jeden Eintrag mit λ multipliziert. Man hat dann 

⎛ 

⎞ ⎛ 

⎞ 

⎜ 

λA = ⎜ 

⎝ 

λa11 

.. 

.. 

.. 

.. 

.. 

.. 

.. 

.. 

λa1n λ 

⎟ ⎜ 

.. 

⎟ ⎜ 

⎟ ⎜ 0 

⎟ = ⎜ 

.. ⎟ ⎜ 

⎠ ⎝ 

.. 

0 

λ 

.. 

.. 

0 

.. 

0 

⎟ 

.. 

⎟ A 

.. ⎟ 

⎠ 

λam1 .. .. λamn 0 .. 0 λ 

Wenn dimV = m und dimW = n ist, kann man eine Basis B = (b1, ..., bm) von V und 

eine Basis C = (c1, ..., cn) von W wählen und jeder Matrix A ∈ K m×n die entsprechende 

lineare Abbildung ϕA ∈ Hom(V, W ) bezüglich B, C zuordnen. Dann gilt: 

Die Abbildung K m×n → Hom(V, W ), A ↦→ ϕA ist ein Vektorraum-Isomorphismus. 

Welche Dimension hat der Vektorraum Hom(V, W ) (und damit auch K m×n )? 

Für i ∈ {1, ..., m} und j ∈ {1, ..., n} sei die Matrix A(i, j) ∈ K m×n diejenige mit 1 an der 

Stelle (i, j) und 0 überall sonst. Dann ist die A(i, j) ∈ K m×n entsprechende Abbildung 

ϕi,j ∈ Hom(V, W ) diejenige mit bi ↦→ cj und bk ↦→ 0 für k ∈ {1, ..., m} \ {i}. 

Die Matrizen Ai,j (hintereinandergeschrieben als mn-Tupel) bilden offenbar eine Basis des 

K-Vektorraums K m×n ; die Abbildungen ϕi,j (hintereinandergeschrieben als mn-Tupel)


bilden eine Basis des K-Vektorraums Hom(V, W ). 

Der Dualraum von V 

Definition 123 Wenn W = K 1 (K als 1-dimensionaler K-Vektorraum angesehen) ist, 

nennt man V ∗ := Hom(V, K), d.h. den Vektorraum der linearen Abbildung V → K, den 

Dualraum von V . 

Wir betrachten nun den Dualraum, nehmen also W = K an. Wir wählen c1 = 1 als 

K-Basis von K = K 1 (eigentlich müßte man das 1-Tupel (1) hinschreiben). 

Die oben angegebene Basis des Vektorraums Hom(V, K) ist dann (ϕ1, ..., ϕm) (der zweite 

Index j entfällt, da nur j = 1 vorkommt), wobei biϕi = 1 ist und bkϕi = 0 für k = i. 

Man setzt b ∗ i := ϕi und nennt (b ∗ 1 , ..., b∗ m) die zu (b1, ..., bm) duale Basis des Vektorraums 

V ∗ . 

Es gilt (λ1b1 + ... + λmbm)b∗ i = λi und deshalb allgemeiner (λ1b1 + ... + λmbm)(µ1b∗ 1 + ... + 

µmb ∗ m) = λ1µ1 + ... + λmµm. 

Wenn ϕ ∈ V ∗ \ {0} ist, gilt (nach der Dimensionsformel für lineare Abbildungen) 

dim Kern(ϕ) = m − 1, d.h. Kern(ϕ) ist eine Hyperebene des Untervektorraums V .

7 SYMMETRISCHE GRUPPE, DETERMINANTEN, VOLUMEN 89 

7 Symmetrische Gruppe, Determinanten, Volumen 

7.1 Zur symmetrischen Gruppe 

Sei n ∈ N. Die symmetrische Gruppe G := Sn ist die Gruppe aller Permutationen auf 

der Menge {1, ..., n} (Gruppenverknüpfung ist die Hintereinanderausführung von Abbil- 

dungen, 1-Element die identische Abbildung auf {1, ..., n}). Sie hat genau n! := 1 · 2 · ... · n 

Elemente. 

Definition 124 (Transposition) Für jedes Paar (i, j) mit i, j ∈ {1, ..., n} und i = j 

definiere τi,j ∈ G durch: iτi,j = j und jτi,j = i und kτi,j = k für k ∈ {1, ..., n} \ {i, j}. 

Abbildungen der Form τi,j nennt man Transpositionen. 

Offenbar gilt τi,j = τj,i und τ 2 i,j 

= id. 

Wir wollen den folgenden Satz beweisen. 

Satz 125 Jedes Element π ∈ G ist ein Produkt von Transpositionen (das Produkt von 0 

Faktoren ist das 1-Element von G). Ein Produkt einer geraden Anzahl von Transpositionen 

kann man nicht als Produkt einer ungeraden Anzahl von Transpositionen schreiben. 

Insbesondere die letzte Aussage ist keineswegs trivial. Wir beweisen den Satz schrittweise 

und benutzen Hilfsbegriffe. Im folgenden sei π ∈ G fest gewählt. 

Ein ’Fehlstand’ von π ist ein Paar (i, j) mit i, j ∈ {1, ..., n} und i < j und iπ > jπ. 

Mit η(π) bezeichne ich die Anzahl der Fehlstände von π, also 

Die ’Signatur’ von π ist 

η(π) := |{(i, j) | i, j ∈ {1, ..., n} und i < j und iπ > jπ }| 

sgn(π) := 

i 0 falls η(π) gerade ist, und sgn(π) < 0 falls η(π) ungerade ist. Falls 

π eine Transposition ist, ist η(π) ungerade. 

Lemma 126 Es gilt sgn(π) = (−1) η(π) .


Beweis. Aufgrund der letzten Aussage vor dem Lemma genügt es zu zeigen: sgn(π) ∈ 

{1, −1}. 

[sgn(π)] 2 = ( 

|iπ − jπ| 2 ) / ( 

|i − j| 2 ) = 

i


Falls π ein Produkt einer ungeraden Anzahl von Transpositionen ist, gilt sgn(π) = −1. 

Man kann ein Element π ∈ G nicht gleichzeitig als Produkt einer geraden und auch Produkt 

einer ungeraden Anzahl von Transpositionen schreiben. 

Jedes Element π ∈ G ist ein Produkt von Transpositionen. 

Beweis der letzten Aussage mit vollständiger Induktion über n (von G = Sn). 

Falls n = 1 hat man G = {1} und ist fertig (1 = Produkt von 0 Transpositionen). 

Sei nun n > 1. Wir wählen k maximal derart, dass die Ziffern 1, 1π, ..., 1π k−1 paarweise 

verschieden sind. Dann gilt 1π k = 1 und A := {1π j | j ∈ N0} = {1, 1π, ..., 1π k−1 }. 

Man nennt A das Transitivitätsgebiet (Orbit) der 1 unter der von π erzeugten zyklischen 

Gruppe. Setze B := {1, ..., n} \ A. Es folgt Aπ = A und auch Bπ = B. 

1. Fall: A = {1, ..., n}. 

Dann ist offenbar π = (1, 1π)(1, 1π 2 ) · ... · (1, 1π k−1 ) (wobei wir (i, j) := τi,j geschrieben 

haben). 

2. Fall A = {1, ..., n}. Per Induktionsannahme ist die Restriktion π|A = ϕ1 · ... · ϕs für 

passende Transpositionen auf A. Jedes ϕi setze man zu einer Transposition ˆϕi auf {1, ..., n} 

fort (durch die Festsetzung b ˆϕi := b für alle b ∈ B). Analog ist π|B = ψ1·...·ψt für passende 

Transpositionen auf B. Jedes ψi setze man zu einer Transposition ˆ ψi auf {1, ..., n} fort 

(durch die Festsetzung a ˆϕi := a für alle a ∈ A). Dann gilt π = ˆϕ1..... ˆϕs ˆ ψ1..... ˆ ψt. 

7.1.1 Bemerkungen, alternierende Gruppe 

In der Gruppe G := Sn bezeichnet An die Menge der Elemente mit Signatur 1; d.h. die 

Menge der Produkte einer geraden Anzahl von Transpositionen. Da sgn ein Gruppen- 

homomorphismus ist (Satz im vorigen Abschnitt), ist An eine Untergruppe von G. Man 

nennt sie die alternierende Gruppe. 

Wenn σ ∈ G \ An ist, also ein Produkt einer ungeraden Anzahl von Transpositionen, so 

folgt σAn = {σρ | ρ ∈ An} = G \ An. 

Wir setzen nun voraus: n ≥ 2 (wegen G = A1). Dann gilt G = An. 

Die Untergruppe An hat genau 2 Nebenklassen in G, nämlich 1An und σAn. Es gilt 

G = An ∪ σAn (disjunkt). 

Die An ist sogar ein Normalteiler in G, d.h. es gilt π −1 Anπ = An für jedes π ∈ G. 

Da je zwei Nebenklassen gleichviele Elemente enthalten, gilt |An| = 1 

2 n!. 

Ohne Beweis sei mitgeteilt: Für n ≥ 5 ist die alternierende Gruppe An einfach, d.h. 

außer den ’trivialen’ Normalteilern An und {1} hat sie keinen Normalteiler. Das ist dazu 

äquivalent, dass jeder Homomorphismus der Gruppe An in eine andere Gruppe injektiv 

ist oder 1-elementige Bildmenge hat.


Für n ≥ 5 enthält die Permutationsgruppe Sn nur folgende Normalteiler: Sn, An, {1}. 

Für n = 4 ist N := {1, (1, 2)(3, 4), (1, 3)(2, 4), (1, 4)(2, 3)} (die Menge der Produkte von 

2 Transpositionen) ein Normalteiler der Sn und auch der An. 

In der Algebra-Vorlesung lernt man, dass es keine ’Formel’ zur Berechnung von Nullstellen 

von Polynomen vom Grad ≥ 5 gibt (analog der aus der Schule bekannten Formel für 

Polynome vom Grad 2). Dieses ziemlich tiefsinnige Resultat hängt zusammen mit den 

oben genannten Fakten. 

7.2 Volumen, Determinante 

In diesem Abschnitt seien K ein Körper (also kommutativ), n ∈ N und V ein n- 

dimensionaler K-Vektorraum. 

Vorbetrachtung Zunächst sei n = 2. Wir ordnen jedem Paar v1, v2 von Vektoren vi ein 

’Parallelogramm’ (0, v1, v2, v1 + v2) zu. 

✡ ✡✡✡✡ 

v2 

0 

✡ ✡✡✡✡ 

v1 + v2 

v1 

Jedem solchen Parallelogramm soll ein Volumen vol(v1, v2) (Flächeninhalt) zugewiesen 

werden. Die ’Volumenfunktion’ vol : V × V → K soll intuitive Vorstellungen der 

Volumenmessung spiegeln. 

Im Fall des R 2 erwarten wir, dass |vol(v1, v2)| übereinstimmt mit dem in der Schule 

definierten Volumen (Länge der Grundseite mal Länge der Höhe). In einem beliebigen 

Körper K stehen Anordung und Absolutbetrag nicht zur Verfügung. 

Wir fordern in einem 2-dimensionalen K-Vektorraum: 

(1) Für alle v1, v2 ∈ V und λ ∈ K gilt vol (λv1, v2) = λvol (v1, v2) . 

(1’) Für alle v1, v ′ 1 , v2 ∈ V gilt vol (v1 + v ′ 1 , v2) = vol (v1, v2) + vol (v ′ 1 , v2) . 

✡ ✡ 

✡ ✡✡ 

v2 

0 

✡ ✡ 

✡ ✡✡ 

✡ ✡ 

✡ ✡✡ 

v1 + v2 λv1 + v2 

v1 λv1


(2) Wenn v1 = v2 ist, folgt vol (v1, v2) = 0 . 

✑ 

✘ 

❏❏ 

✑✑ ❏ 

v2✘✘✘✘✘✘✘✘✘✘ ✑v1 + v2 ❏ 

❏❏ 

❏❏ 

❏ 

❏ 

❏ ✑ 

✘ 

v1 ✘✘✘✘ + v 

❏ 

❏ ✑✑ 

❏✘✘✘✘✘✘ 

❏✑ 

0 

v1 

′ v 

1 

′ 1 + v1 + v2 

(3) Es gibt mindestens ein Paar (v1, v2) mit vol(v1, v2) = 0. 

Nun betrachten wir wieder den allgemeinen Fall (n beliebig). 

Definition 129 Ein Volumen (eine Volumenfunktion) auf V ist eine Abbildung 

vol : V × ... × V (n − mal) → K mit den Eigenschaften: 

(vol1) Für alle i ∈ {1, . . . , n} und v1, . . . , vi−1, vi+1, . . . , vn ∈ V ist die Abbildung 

voli : V → K, v ↦→ vol (v1, . . . , vi−1, v, vi+1, . . . , vn) linear. 

(vol2) Wenn in (v1, . . . , vn) gleiche Vektoren vorkommen (etwa v1 = v2), folgt 

vol (v1, . . . , vn) = 0 

(vol3) vol (V × · · · × V ) = {0} 

Bemerkung. Eine Abbildung mit den Eigenschaften (vol1) und (vol2) nennt man eine al- 

ternierende Multilinearform (die Bezeichnung alternierend wird durch 130, b) klar). Das 

gewöhnliche Skalarprodukt auf K n hat den Definitionsbereich K n × K n und erfüllt (vol1), 

es ist linear in beiden Komponenten; man sagt dazu, es ist eine ’Bilinearform’. Das gewöhn- 

liche Skalarprodukt ist aber nicht alternierend d.h. erfüllt nicht (vol2). 

Lemma 130 Sei vol ein Volumen auf V. Dann gilt: 

a) Für alle v1, . . . , vn ∈ V und i = j und λ ∈ K gilt: 

vol (v1, . . . , vi−1, vi + λvj, vi+1, . . . , vn) = vol (v1, . . . , vi−1, vi, vi+1, . . . , vn) . 

b) Für jede Permutation π ∈ Sn und v1, . . . , vn ∈ V gilt: 

vol (v1, . . . , vn) = sgn (π) · vol (v1π, . . . , vnπ) . 

c) Sei (aij) ∈ K n×n und wi := 

vol (w1, . . . , wn) = [ 

π∈Sn 

j 

aijvj. Dann folgt: 

sgn (π) · a1,1π · a2,2π · · · · · an,nπ] · vol (v1, . . . , vn) 

d) Wenn (v1, ..., vn) linear unabhängig ist (und damit eine Basis von V ), so ist 

vol(v1, ..., vn) = 0. 

Wenn (v1, ..., vn) linear abhängig ist, folgt vol(v1, ..., vn) = 0.


Beweis. Zu a). Wegen der Linearität in der i-ten Komponente gilt 

vol (v1, . . . , vi−1, vi + λvj, vi+1, . . . , vn) = vol (v1, . . . , vi−1, vi, vi+1, . . . , vn) + 

(v1, . . . , vi−1, λvj, vi+1, . . . , vn) = vol (v1, . . . , vi−1, vi, vi+1, . . . , vn) + λ · 

vol (v1, . . . , vi−1, vj, vi+1, . . . , vn). Der letzte Summand ist 0, weil vj an der Stelle i 

und auch der Stelle j vorkommt. 

Zu b). Da jede Permutation Produkt von Transpositionen ist und wegen der Signaturregel 

127 genügt es, die Aussage für eine Transposition zu beweisen. Betrachten wir etwa die 

Transposition, welche 1 mit 2 vertauscht. Es gilt wegen der Linearität in der ersten und 

zweiten Komponente und Regel (vol2): 

0 = vol(v1 + v2, v1 + v2, v3, ..., vn) = vol(v1, v1 + v2, v3, ..., vn) + vol(v2, v1 + 

v2, v3, ..., vn) = vol(v1, v2, v3, ..., vn) + vol(v2, v1, v3, ..., vn), also vol(v1, v2, v3, ..., vn) = 

−vol(v2, v1, v3, ..., vn). 

Zu c). Wegen der Linearität in jeder Komponente gilt 

vol (w1, . . . , wn) = a1,j1 · ... · an,jn · vol(vj1 , ..., vjn). Dabei ist über alle n-Tupel 

(j1, ..., jn) ∈ {1, ..., n} × ... × {1, ..., n} zu summieren. 

Falls zwei Einträge in einem solchen n-Tupel gleich sind, etwa j1 = j2, so ist vj1 

= vj2 

und deshalb vol(vj1 , ..., vjn) = 0, also der zugehörige Summand gleich 0. Wir brauchen 

also nur über die n-Tupel (j1, ..., jn) ∈ {1, ..., n} × ... × {1, ..., n} zu summieren mit 

paarweise verschiedenen Einträgen. Da die Abbildung Sn → Menge dieser n-Tupel, 

π ↦→ (1π, ..., nπ), bijektiv ist, summieren wir über Sn und erhalten mit b): 

vol (w1, . . . , wn) = 

π∈Sn a1,1π · ... · an,nπ · vol(v1π, ..., vnπ) = 

[ 

π∈Sn sgn(π) · a1,1π · · · · · an,nπ] · vol(v1, ..., vn). 

Zu d). Sei (v1, ..., vn) linear unabhängig, also eine Basis von V . Wenn vol(v1, ..., vn) = 0 

wäre, folgte aus c) vol(V × ... × V ) = {0}, im Widerspruch zu (vol3). 

Nun sei (v1, ..., vn) linear abhängig. Wir wollen herzuleiten vol(v1, ..., vn) = 0. 

Sei λ1v1 + ...λnvn = 0 und etwa λ1 = 0. Es folgt 0 = vol(0, v2, ..., vn) = 

vol(λ1v1 + ...λnvn, v2, ..., vn) = λ1vol(v1, v2, ..., vn) + ... + λnvol(vn, v2, ..., vn). Wegen 

(vol2) sind alle Summanden bis auf den ersten 0. Es folgt vol(v1, v2, ..., vn) = 0. 

Satz 131 Sei vol1 und auch vol2 ein Volumen auf V . Dann gibt es α ∈ K\ {0} mit 

vol1 = α · vol2. 

Beweis. Wir wählen eine Basis (v1, ..., vn) von V und setzen α := 

vol1(v1, ..., vn)/vol2(v1, ..., vn) (was wegen d) im vorigen Lemma erlaubt ist). Aus c) 

des vorigen Lemmas folgt die Behauptung.


Bemerkung In 130 c) haben wir eine ’Volumen-Formel’ für eine jede Volumenfunktion vol 

bewiesen. Die Formel liefert: Wenn (v1, ..., vn) eine Basis von V ist, so kann man allein aus 

der einen Zahl vol(v1, ..., vn) mit der ’Formel’ 130 c) bereits die Funktion vol problemlos 

berechnen. 

Dabei wurde immer vorausgesetzt, dass vol eine vorgegebene Volumenfunktion ist. Aber 

gibt es überhaupt Funktionen vol mit den geforderten Eigenschaften? 

Um die Existenz von Funktionen vol zu zeigen, verwenden wir die ’Formel’: 

Satz 132 Existenz: Sei (v1, . . . , vn) eine Basis von V und α ∈ K\ {0} . 

Wir definieren: 

(∗) vol : V × · · · × V → K, (w1, . . . , wn) ↦→ α · 

Dabei sei (aij) ∈ Kn×n durch wi = 

aijvj bestimmt. 

j 

π∈Sn 

Dann ist vol ein Volumen mit der Eigenschaft vol (v1, . . . , vn) = α. 

sgnπ · a1,1π · · · · · an,nπ 

Eindeutigkeit: Zu jedem Volumen vol und jeder Basis (v1, . . . , vn) existiert ein α ∈ K\ {0} 

derart, daß vol gleich der in (*) definierten Funktion ist. 

Beweis. Die Eindeutigkeitsaussage haben wir bereits in 130 c) bewiesen. 

Um die Existenzaussage zu zeigen, müssen wir nachrechnen, dass die angegebene Funk- 

tion die Forderungen (vol1), (vol2), (vol3) erfüllt. Eigenschaft (vol1) (Linearität in jeder 

Komponente) ist leicht direkt nachzurechnen. 

Eigenschaft (vol3) folgt aus vol(v1, ..., vn) = α = 0. 

Bleibt (vol2). Dazu muß man ein bißchen tüfteln. Wir setzen voraus w1 = w2 und wollen 

beweisen: vol(w1, ..., wn) = 0. Die Matrix (aij) ist durch wi = 

aijvj bestimmt. Wegen 

w1 = w2 sind die ersten beiden Zeilen der Matrix gleich. Sei τ ∈ G := Sn die Transpositi- 

on, welche 1 mit 2 vertauscht, G + := {π ∈ Sn | 1π < 2π} und G − := {π ∈ Sn | 1π > 2π}. 

Dann gilt G = G + ∪ G − (disjunkt), und die Abbildung G + → G − , π ↦→ τπ ist bijektiv. 

Deshalb gilt 

α · 

π∈G + 

α · 

π∈G + 

vol(w1, ..., wn) = α · 

sgnπ · a1,1π · · · · · an,nπ = 

π∈G 

sgnπ · a1,1π · · · · · an,nπ + α · 

π∈G − 

sgnπ · a1,1π · · · · · an,nπ + α · 

π∈G + 

j 

sgnπ · a1,1π · · · · · an,nπ = 

sgn(τπ) · a1,1τπ · · · · · an,nτπ 

Für π ∈ G + gilt sgnπ · a1,1π · · · · · an,nπ + sgn(τπ) · a1,1τπ · · · · · an,nτπ = 

sgnπ · (a1,1πa2,2π − a1,2πa2,1π)(a3,3π · ... · an,nπ).


Wegen a1,1π = a2,1π und a1,2π = a2,2π ist dieser Term gleich 0 und deshalb die obige 

Summe gleich 0. 

Bemerkung Sei V = K n . Dann liegt es nahe, ’Standardvolumen’ diejenige (nach dem 

vorigen Satz 132 eindeutig bestimmte) Volumenfunktion vol : K n ×...K n → K zu nennen, 

welche vol(e1, ..., en) = 1 für die Standardabsis (e1, ..., en) erf ¨ llt. 

Für beliebige n Vektoren a1 = (a11, ..., a1n), ..., an = (an1, ..., ann) gilt dann nach 132 

vol(a1, ..., an) = 

π∈Sn 

sgnπ · a1,1π · · · · · an,nπ 

Im Spezialfall K = R ist dann |vol(a1, ..., an)| das ’gewöhnliche’ Volumen des durch 

a1, ..., an bestimmten Parallelepipeds (mit den Eckpunkten 

j ɛjaj, wobei ɛj ∈ {0, 1} 

erlaubt ist, man also 2 n Eckpunkte hat sofern (a1, ..., an) linear unabhängig ist). 

Für n = 2 gilt |vol(a1, a2)| = |a11a22 − a12a21|. Im Fall n = 3 hat man |vol(a1, a2, a3)| = 

|a11(a22a33 − a23a32) − a12(a21a33 − a23a31) + a13(a21a32 − a22a31)|. 

7.2.1 Konstruktion der Determinante 

Lemma 133 Sei ϕ ∈ Hom (V, V ). Sei (v1, . . . , vn) eine Basis von V und vol eine Volu- 

menfunktion von V. Dann ist 

det ϕ := vol (v1ϕ, . . . , vnϕ) 

vol (v1, . . . , vn) 

(d.h. die durch ϕ bewirkte Volumenverzerrung) unabhängig von der gewählten Volumen- 

funktion vol und von der Basis (v1, . . . , vn) . 

Beweis. Seien vol1 und vol2 Volumenfunktionen und sei (v1, ..., vn) eine Basis von V . Wegen 

131 gibt es α ∈ K \ {0} mit vol2 = α · vol1. Deshalb gilt 

vol1(v1ϕ, . . . , vnϕ) 

vol1 (v1, . . . , vn) = vol2 (v1ϕ, . . . , vnϕ) 

vol2 (v1, . . . , vn) 

Wir können also im folgenden irgendeine beliebige Volumenfunktion vol heranziehen. 

Nun betrachten wir zwei Basen (v1, ..., vn) und (v ′ 1 , ..., v′ n) von V . Zu zeigen ist 

vol (v1ϕ, . . . , vnϕ) 

vol (v1, . . . , vn) = vol (v′ 1ϕ, . . . , v′ nϕ) 

vol (v ′ 1 , . . . , v′ n) 

Beide Seiten sind 0, wenn ϕ kein Isomorphismus ist (dann ist (v1ϕ, . . . , vnϕ) und auch 

(v ′ 1 ϕ, . . . , v′ nϕ) linear abhängig; man wende 130 d) an). Sei also ϕ ∈ GL(V ) vorausgesetzt. 

Dann ist offenbar die Abbildung vol ′ : V ×...×V → K, (w1, ..., wn) ↦→ vol(w1ϕ, ..., wnϕ)


ein Volumen auf V (für Eigenschaft (vol3) braucht man ϕ ∈ GL(V )). Nach 131 gilt 

vol ′ = α · vol für ein passendes α ∈ K \ {0}. Insbesondere ist 

vol (v1ϕ, . . . , vnϕ) 

vol (v1, . . . , vn) = vol′ (v1, . . . , vn) 

vol (v1, . . . , vn) = α = vol′ (v ′ 1 , . . . , v′ n) 

vol (v ′ 1 , . . . , v′ n) = vol (v′ 1ϕ, . . . , v′ nϕ) 

vol (v ′ 1 , . . . , v′ n) 

Definition 134 Man nennt die im Lemma definierte Zahl det ϕ die Determinante der 

linearen Abbildung ϕ ∈ Hom(V, V ). 

Als unmittelbare Folgerung aus 130 d) notieren wir 

Satz 135 Sei ϕ ∈ Hom(V, V ). Es gilt detϕ = 0 genau dann, wenn ϕ ∈ GL(V ) ist. 

7.2.2 Berechnung der Determinante 

Sei ϕ ∈ Hom (V, V ) . 

Wähle eine Basis (v1, . . . , vn) und sei (aij) ∈ K n×n die Matrix von ϕ bezüglich der Basis. 

Wir definieren eine Volumenfunktion auf V durch 

vol : V × · · · × V → K, (w1, . . . , wn) ↦→ 

wobei wi = ai1v1 + ... + ainvn ist. (siehe 132). 

Dann ist vol (v1, . . . , vn) = 1 und speziell 

det ϕ = vol (v1ϕ, . . . , vnϕ) = 

π∈Sn 

π∈Sn 

sgnπ · a1,1π · · · · · an,nπ 

sgn (π) · a1,1π · · · · · an,nπ 

wobei (aij) die Matrix von ϕ bezüglich der Basis (v1, . . . , vn) ist. 

Definition 136 Oben haben wir die Determinante einer linearen Abbildung ϕ : V → V 

definiert. 

Für eine n × n−Matrix definieren wir 

det (aij) := 

π∈Sn 

sgn (π) · a1,1π · · · · · an,nπ 

D.h. det (aij) ist die Determinante einer linearen Abbildung ϕ, die bezüglich irgendeiner 

Basis zur Matrix (aij) gehört. 

Bemerkung Wenn eine lineare Abbildung ϕ : V → V gegeben ist, hängt die Matrix 

(aij) zu ϕ von der Wahl der Basis (v1, . . . , vn) ab; aber det ϕ = det(aij) ist unabhängig 

von der gewählten Basis!



Sei n = 3. 

Dann ist Sn = {id, (1, 2) , (1, 3) , (2, 3) , (1, 2, 3) 

 

, (3, 2, 1)} , 

 

in Zykelschreibweise, 

 

1 2 3 

d.h. 3, 2, 1 steht für die Permutation 

. 

3 1 2 

det (aij) := det ϕ 

= 

sgnπ · a1,1π · a2,2π · a3,3π 

π∈S3 

= a11a22a33 − a12a21a33 − a13a22a31 − a11a23a32 + a12a23a31 + a13a21a32 

Dabei bezeichnet ϕ ∈ Hom (V, V ) eine lineare Abbildung mit Matrix (aij) bezüglich ir- 

gendeiner Basis. 

Satz 137 (Determinantenmultiplikationssatz) Seien ϕ, ψ ∈ Hom(V, V ). Dann gilt 

det(ϕ · ψ) = det ϕ · det ψ 

Beweis. Wenn ϕ oder ψ nicht injektiv ist, so sind wegen 135 beide Seiten gleich 0. Wir 

können also ϕ, ψ ∈ GL(V ) annehmen. Man wähle eine Basis (v1, ..., vn) von V und eine 

Volumenfuntion vol. Dann gilt 

vol(v1ϕψ, ..., vnϕψ) 

vol(v1ϕ, ..., vnϕ) 

det(ϕψ) = vol(v1ϕψ, ..., vnϕψ) 

vol(v1, ..., vn) 

· vol(v1ϕ, ..., vnϕ) 

vol(v1, ..., vn) 

Korollar 138 (und Definition) Die Abbildung 

δ : GL(V ) → K \ {0}, ·, ϕ ↦→ det ϕ 

= 

= det ψ · det ϕ 

ist ein Gruppenepimorphismus (=surjektiver Gruppenhomomorphismus). 

Man nennt SL(V ) := Kern(δ) := {ϕ ∈ GL(V ) | det ϕ = 1} die spezielle lineare Gruppe. 

7.2.4 Rechnen mit Determinanten 

Weiterhin sei K ein kommutativer Körper. 

Satz 139 Sei A ∈ K n×n . Es gilt det A = det(A t ) (A t bezeichne die zu A transponierte 

Matrix).


Beweis. Sei A = (aij). Man setze a ′ ij := aji. Für jede Permutation π ∈ Sn gilt 

Also gilt 

det A = 

π∈Sn 

sgn(π) · a1,1π · ... · an,nπ = sgn(π −1 ) · a 1π −1 ,1 · ... · a nπ −1 ,n = 

sgn(π −1 ) · a ′ 1,1π −1 · ... · a ′ n,nπ −1 

sgn(π −1 ) · a ′ 1,1π −1 · ... · a ′ n,nπ −1 = 

π∈Sn 

sgn(π) · a ′ 1,1π · ... · a ′ n,n = det(A t ) 

Beobachtung 140 (Transponierregel) Seien A ∈ K m×n und B ∈ K n×k . Dann gilt 

(AB) t = B t · A t . 

Satz 141 Seien A ∈ K n×n und λ ∈ K. 

a) Man multipliziere eine Zeile (eine Spalte) von A mit λ. Die entstandene Matrix heiße 

B ( C ). Dann gilt λ · det A = det B = det C. 

b) Die Matrix B (Matrix C) entstehe aus A durch Vertauschen zweier Zeilen (zweier 

Spalten). Dann gilt det B = det C = − det A. 

c) Seien i, j ∈ {1, ..., n} und i = j. B entstehe aus A durch Addieren des λ-fachen der 

j-ten Zeile zur i-ten Zeile ( C entstehe aus A durch Addieren des λ-fachen der j-ten 

Spalte zur i-ten Spalte). Dann gilt det B = det C = det A. 

Beweis. Die Aussagen für die Zeilen folgen aus den entsprechenden in 130 und der Defini- 

tion der Determinante. Die Aussagen für die Spalten folgen wegen des vorigen Satzes aus 

denjenigen für die Zeilen. 

Satz 142 (Determinante von Blockmatrizen) Sei A ∈ K m+n × m+n , B ∈ K m×m 

und C ∈ K n×n . Mit 0 bezeichnen wir die m × n -Matrix, deren Einträge alle 0 sind; ∗ 

bezeichne irgendeine n × m-Matrix. Sei 

Dann gilt det A = det B · det C. 

A = 

B 0 

∗ C 

Beweis. Das folgt sofort aus der Definition 136. 

Durch wiederholtes Anwenden der vorigen Regel erhält man


Korollar 143 (Block-Matrix-Regel) Seien B1, ..., Bk quadratische Matrizen (über K) 

und ∗ beliebige Matrizen. Für 

⎛ 

B1 

⎜ ∗ 

⎜ 

A = ⎜ .. 

⎜ 

⎝ ∗ 

0 

B2 

.. 

.. 

.. 

0 

.. 

∗ 

.. 

.. 

.. 

Bk−1 

0 

0 

.. 

0 

⎞ 

⎟ 

⎠ 

∗ .. .. ∗ Bk 

gilt dann det A = det B1 · ... · det Bk. 

Speziell wenn alle Bi 1 × 1-Matrizen sind, folgt 

Korollar 144 Sei A = (aij) eine untere n × n Dreiecksmatrix, d.h. aij = 0 falls j > i. 

Dann gilt det A = 

i aii (Produkt der Diagonaleinträge). 

Durch Transponieren der Matrix A (an der Diagonalen spiegeln) erhält man aus den 

vorigen beiden Beobachtungen entsprechende Aussagen. 

7.2.5 Determinantenentwicklungssatz 

Für numerische Zwecke ist die Definition der Determinante unpraktisch. Man benutzt 

zur Berechnung der Determinante den ’Determinantenentwicklungssatz’, den wir nun 

herleiten. 

Bezeichnungen, Vorbereitungen Sei A ∈ K n×n . Für jedes Paar i, j ∈ {1, ..., n} 

bezeichne Ai,j ∈ K n×n folgende Matrix: Man ersetze in A alle Einträge der i-ten Zeile 

und j-ten Spalte durch 0 mit einer Ausnahme: aij wird durch 1 ersetzt. 

Es bezeichne Bi,j ∈ K n−1 × n−1 die aus A durch Streichen der i-ten Zeile und der j-ten 

Spalte entstehende Matrix. Dann gilt (aufgrund der vorigen Block-Matrix-Regel und der 

Änderung der Determinante beim Vertauschen von Zeilen): det Ai,j = (−1) i+j · det Bi,j. 

Außerdem ist dies auch die Determinante der Matrix, die man aus A durch Ersetzen der 

i-ten Zeile durch ej = (0, ..., 0, 1, 0, ..., 0) erhält (1 an j-ter Position). 

Mithilfe der neuen Matrizen Ai,j bildet man eine neue n × n Matrix 

Vorschrift: Setze αj,i := det Ai,j (Indizes rechts und links verdreht!) und 

Ã nach folgender 

Ã := (αi,j). 

Satz 145 Wir benutzen die obigen Bezeichnungen; E bezeichne die n × n-Einheitsmatrix. 

a) AÃ = (det A) · E.


b) det Ã = (det A)n−1 

c) Falls det A = 0 ist, gilt 

A −1 = 1 

det Ã 

Ã 

d) (Determinantenentwicklungssatz, Entwickeln nach der i-ten Zeile) 

Es gilt detA = 

Sei i ∈ {1, ..., n}. 

 

j aijαji = 

j (−1)i+j · aij · det Bi,j. 

Beweis. Die Abbildung K n × ..., ×K n → K, (c1, ..., cn) ↦→ det C (wobei C die Matrix mit 

den Zeilen c1, ..., cn sei) ist nach oben Gesagtem eine Volumenfunktion auf K n . 

Nach einer Beobachtung oben gilt αj,i = det(a1, ..., ai−1, ej, ai+1, ..., an) (Determinante 

zur Matrix mit mit den Zeilen a1 (1-te Zeile von A),..., an (n-te Zeile von A), wobei die 

i-te Zeile durch ej ersetzt wurde). Wir berechnen damit und mit Determinantenregeln 

(Multilinearität einer Volumenfunktion) 

 

akjαji = 

akj · det(a1, ..., ai−1, ej, ai+1, ..., an) = 

j 

j 

 

det(a1, ..., ai−1, akj · ej, ai+1, ..., an) = 

j 

det(a1, ..., ai−1, 

akj · ej, ai+1, ..., an) = 

j 

det(a1, ..., ai−1, ak, ai+1, ..., an) 

Dies ist gleich det A im Fall i = k, sonst gleich 0 (denn dann gibt es gleiche Zeilen mit 

unterschiedlichen Indizes). Damit haben wir a) bewiesen. 

Die Aussagen d) und b) folgen unmittelbar aus a). 

Aussage b) folgt aus a) und dem Determinantenmultiplikationssatz. 

7.2.6 Cramersche Regel 

Die hat kaum praktische Bedeutung. Sei A = (aij) ∈ K n×n und b = (b1...bn) t eine n × 1 - 

Matrix. Falls A invertierbar ist, hat das lineare Gleichungssystem Ax = b genau eine 

Lösung, nämlich z = (z1...zn) t = A −1 b. 

Nach Aussage c) des vorigen Satz gilt 

zi = 1 

det A 

 

αijbj = 

j 

1 

det A 

 

(−1) i+j (det Bji) · bj 

Dabei ist Bji die durch Streichen der j-ten Zeile und i-ten Spalte aus A entstehende 

Matrix. 

j

8 ÄQUIVALENZRELATIONEN UND PARTITIONEN 102 

8 Äquivalenzrelationen und Partitionen 

Wir erinnern uns: eine Relation zwischen Mengen U, V ist eine Teilmenge von U × V . 

Eine besonders wichtige spezielle Sorte von Relationen zwischen U, V sind die Abbildungen 

U → V , die wir ausführlich behandelten. 

Eine weitere oft vorkommende Sorte sind die Äquivalenzrelationen auf einer Menge M 

(hier ist M := U = V . Wir wiederholen die Definitionen. 

Definition 146 (Relation, Äquivalenzrelation, Ordnungsrelation) Eine Relation 

ist eine Menge, deren Elemente Paare sind. 

Seien U und V Mengen. Eine Relation zwischen U und V ist eine Teilmenge R ⊆ U × V . 

Wenn (u, v) ∈ R ist, sagt man: u ist in Relation R zu v. Oft schreibt man dafür u R v. 

Eine Relation auf einer Menge M ist eine Teilmenge des karthesischen Produkts M × M 

(d.h. Spezialfall M = U = V ). 

Eine Äquivalenzrelation auf einer Menge M ist eine Relation R ⊆ M × M mit folgenden 

Eigenschaften: 

(R) (Reflexivität) Für jedes m ∈ M gilt: (m, m) ∈ R. 

(S) (Symmetrie) Für alle m, n ∈ M gilt: Aus (m, n) ∈ R folgt (n, m) ∈ R. 

(T) (Transitivität) Für alle m, n, p ∈ M gilt: (m, n) ∈ R und (n, p) ∈ R ⇒ (m, p) ∈ R. 

Wenn man anstelle der Symmetrie Antisymmetrie verlangt, nennt man die Relation eine 

Ordnungsrelation: 

(AS) Für alle m, n ∈ R gilt: Aus (m, n) ∈ R und (n, m) ∈ R folgt m = n. 

Wenn eine Ordnungsrelation R ⊆ M vorliegt, schreibt man oft a ≤ b anstelle von 

(a, b) ∈ R. 

Beim Vorliegen einer Ordnungsrelation ≤ auf einer Menge M kann es Elemente a, b ∈ M 

geben, für die weder a ≤ b noch b ≤ a gilt. 

Wenn für alle a, b ∈ M gilt: a ≤ b oder b ≤ a (” je zwei Elemente sind vergleichbar”), 

spricht man von einer vollständigen Ordnung(srelation). 

Wenn eine Äquivalenzrelation R ⊆ M × M vorliegt, schreibt man meistens a ∼ b anstelle 

von (a, b) ∈ R. In dieser Schreibweise lauten die obengenannten Forderungen: 

(R) (Reflexivität) Für jedes m ∈ M gilt m ∼ m. 

(S) (Symmetrie) Für alle m, n ∈ M gilt: m ∼ n ⇔ n ∼ m. 

(T) (Transitivität) Für alle m, n, p ∈ M gilt: m ∼ n und n ∼ p ⇒ m ∼ p.



1. Sei ϕ : M → N eine Abbildung (M, N beliebige Mengen. Auf M definieren wir eine 

Relation durch A : {(a, b) ∈ M × M | aϕ = bϕ}. In der Schreibweise ∼ also: Für beliebige 

a, b ∈ M bedeute a ∼ b, dass aϕ = bϕ ist. 

Dann ist ∼ eine Äquivalenzrelation, genannt die Bildgleichheit (unter ϕ). 

Zum Beispiel kann ϕ die Abbildung sein, welche jedem Auto seine Farbe zuordnet. Zwei 

Autos a, b sind genau dann äquivalent (d.h. es gilt a ∼ b, wenn ∼ die Relation ’bildgleich’ 

ist), wenn a die gleiche Farbe wie B hat. 

Oder ϕ ist die Abbildung, welche jedem Säugetier seine Mutter zuordnet. Die daraus 

hergeleitete Äquivalenzrelation ist ’gleiche Mutter haben’. 

2. Sei M eine Menge und G eine Untergruppe der Gruppe S(M) aller Permutationen auf 

M. Definiere die Relation ∼ auf M durch: a ∼ b ⇔ es gibt ϕ ∈ G mit aϕ = b. 

Dann ist ∼ eine Äquivalenzrelation auf M. 

3. Wir setzen M := {(u, v) ∈ Z × Z | v = 0}. Nun definieren wir eine etwas raffinierte 

Relation ∼ auf M wie folgt 

(u, v) ∼ (r, s) ⇔ us = rv 

Zum Beispiel gilt (7, 2) ∼ (21, 6). Man rechnet leicht nach, dass ∼ eine Äquivalenzrelation 

ist. 

4. Sei G, · eine Gruppe (nicht notwendig kommutativ) und U eine Untergruppe von G. 

Auf G definieren wir eine Relation ∼ durch die Festsetzung: a ∼ b ⇔ a −1 b ∈ U. 

Dann ist ∼ eine Äquivalenzrelation auf G. 

Definition 147 Sei M eine Menge. Eine Partition (auch: Klasseneinteilung) von M ist 

eine Menge K, deren Elemente Teilmengen von M sind, derart dass gilt: 

K = M, und: A ∩ B = ∅ oder A = B für alle A, B ∈ K. 

Anders formuliert: eine Partition von K ist eine Menge von Teilmengen von M derart, 

dass jedes Element von M in genau einem A ∈ K liegt: Zu jedem m ∈ M existiert genau 

ein A ∈ K mit der Eigenschaft m ∈ A. 

Lemma 148 Sei M eine Menge und K eine Partition von M. Definiere eine Relation ∼ 

auf M durch 

(+) a ∼ b gelte genau dann, wenn es A ∈ K gibt mit a, b ∈ A 

Dann ist ∼ eine Äquivalenzrelation.


Beweis. Sei a ∈ M. Da K eine Partition von M ist, gibt es A ∈ K mit a ∈ A. Es folgt 

a ∼ a. 

Seien a, b ∈ M mit a ∼ b. Dann gibt es A ∈ K mit a, b ∈ A. Es folgt b, a ∈ A ∈ K, also 

b ∼ a. 

Seien a, b, c ∈ M mit a ∼ b und b ∼ c. Dann existieren A, B ∈ K mit a, b ∈ A und b, c ∈ B. 

Wegen b ∈ A ∩ B und da K eine Partition ist, folgt A = B. Deshalb gilt a, c ∈ A und 

damit a ∼ c. 

Das vorige Lemma zeigt, dass man aus jeder Partition einer Menge M durch die Festset- 

zung (+) eine Äquivalenzrelation erhält. Umgekehrt gewinnt man aus jeder Äquivalenz- 

relation ∼ auf einer Menge M wie folgt eine Partition. 

Lemma 149 (und Definitionen) Sei ∼ eine Äquivalenzrelation auf der Menge M. 

Für a ∈ M nennt man ã := {b ∈ M | a ∼ b} die Äquivalenzklasse von a. 

Für alle a, b ∈ M gilt dann: a ∼ b ⇔ ã = ˜ b. 

Jedes Element b ∈ ã nennt man einen Repräsentanten der Äquivalenzklasse ã. 

Eine Teilmenge von M, die aus jeder Äquivalenzklasse genau ein Element enthält, nennt 

man ein Repräsentantensystem von ∼. 

Die Menge K := {ã | a ∈ M} der Äquivalenzklassen ist eine Partition von M. 

Beweis. Um die erste Behauptung zu zeigen, seien a, b ∈ M gegeben. Sei a ∼ b. Wenn 

c ∈ ã vorliegt, folgt a ∼ c. Nun ist (Symmetrie) b ∼ a und a ∼ c, also (Transitivität) b ∼ c, 

d.h. c ∈ ˜ b. Wir zeigten ã ⊆ ˜ b. Analog folgt ˜ b ⊆ ã, und wir haben ã = ˜ b. 

Nun wollen wir zeigen, dass die Menge K der Äquivalenzklassen eine Partition von M ist. 

Jedes a ∈ M erfüllt a ∈ ã ∈ K; also ist ∪K = M. 

Falls a ∈ ˜ b ∩ ˜c ist, folgt b ∼ a und c ∼ a. Die erste Behauptung zeigt ˜ b = ã = ˜c. 

Im Beispiel 1. nennt man die Äquivalenzklassen auch Klassen bildgleicher Elemente. 

In 2. sind die Äquivalenzklassen genau die Transitivitätsgebiete. 

In 3. setzt man a 

b := (a, b) für (a, b) ∈ M und nennt a 

b 

den durch Zähler a und Nenner b 

bestimmten Bruch. Ein Bruch ist also eine Äquivalenzklasse unter der in 3. definierten 

Äquivalenzrelation. Indem man auf der Menge Q aller Brüche + und · passend definiert, 

erhält man den Körper der rationalen Zahlen. 

In 4. sind die Äquivalenzklassen die Linksnebenklassen nach U in der Gruppe G.


8.1 Quotientenkörper 

Die in 3. beschriebene Konstruktion der rationalen Zahlen aus den ganzrationalen Zahlen 

wird im folgenden Satz verallgemeinert. Dabei taucht in c) der Begriff ’wohldefiniert’ auf, 

der (in der aktuellen Bedeutung) im Anschluß an den Satz erklärt wird. 

Satz 150 Sei R ein Integritätsring (kommutativer Ring mit 1, der keine Nullteiler = 0 

hat). 

a) Setze M := {(u, v) ∈ R × R | v = 0}. Definiere auf M eine Relation durch 

(u, v) ∼ (r, s) ⇔ us = rv 

Dann ist ∼ eine Äquivalenzrelation auf R × R. 

Man bezeichne mit u 

v 

Mit Q := { u 

v 

:= 

(u, v) die Äquivalenzklasse von (u, v). 

| u, v ∈ R, v = 0} bezeichnen wir die Menge aller Äquivalenzklassen. 

b) Die Abbildung R → Q, r ↦→ r 

1 

ist injektiv. 

c) Die folgende Addition und Mutiplikation auf Q ist wohldefiniert: 

u r us + rv 

+ := 

v s vs 

u r ur 

· := 

v s vs 

Mit diesen Verknüpfungen ist Q, +, · ein Körper. 

d) Der Körper Q, +, · enthält R, +, · als Unterkörper (wenn man r ∈ R mit r 

1 identifiziert, 

siehe b)). 

Alle Aussagen sind durch einfaches Hinschreiben zu überprüfen. Wir erklären c). 

Sei α = u 

v 

= u′ 

v ′ ∈ Q und β = r 

s 

(’wohldefiniert’ ist), muß gelten: 

(+) 

= r′ 

s ′ ∈ Q. Damit die Definition von + in c) Sinn macht 

us + rv 

vs 

= u′ s ′ + r ′ v ′ 

v ′ s ′ 

d.h. das dem Paar α, β ∈ Q zugewiesene Verknüpfungsergnis α + β darf wirklich nur von 

den Äquivalenzklassen α, β abhängen, nicht von den gewählten Repräsentanten (u, v) 

beziehungsweise (r, s). 

Man rechnet (+) leicht nach. 

Den im Satz konstruierten Körper Q, +, · nennt man den Quotientenkörper des 

Integritätsrings R. 

Man kann also jeden Integritätsring als Unterring eines passenden Körpers (nämlich des 

Quotientenkörpers) ansehen. Insbesondere liefert der Satz eine Konstruktion des Körpers


Q der rationalen Zahlen aus dem Ring Z der ganzrationalen Zahlen 1 . 

Den Quotientenkörper eines Polynomrings K[x] über einem Körper K nennt man den 

rationalen Funktionenkörper (über K) und bezeichnet ihn mit K(x), obwohl seine 

Elemente keine Funktionen sind, sondern die Brüche p 

q 

8.2 Ringe, Ideale, kanonischer Homomorphismus 

wobei p, q ∈ K[x] ist und q = 0. 

Definition 151 Sei R ein kommutativen Ring R. Eine Teilmenge J ⊆ R heißt ein Ideal 

von R wenn gilt: 

(J1) J ist eine Untergruppe der Gruppe R, + ; und 

(J2) Für alle r ∈ R und a ∈ J gilt ra ∈ J. 

Beobachtung In jedem kommutativen Ring R ist mR für jedes m ∈ R ein Ideal. Ideale 

dieser Form heißen Hauptideale. 

Zum Beispiel ist 5Z ein Hauptideal von Z. 

Beobachtung Sei R ein kommutativer Ring mit 1. 

Wir nannten ein Element a ∈ R eine Einheit, wenn es in der Halbgruppe R, · invertierbar 

ist, d.h. ein mit a −1 bezeichnetes Element in R existiert, welches aa −1 = 1 erfüllt. 

Wenn J ein Ideal ist, welches eine Einheit a enthält, so folgt J = R. 

Denn jedes r ∈ R erfüllt r = r · 1 = (ra −1 )a ∈ J nach (J2). 

Insbesondere hat ein Körper K nur zwei Ideale, nämlich {0} und K. 

Satz 152 Im Ring Z der ganzrationalen Zahlen und auch im Polynomring K[x] (K ein 

beliebiger Körper) ist jedes Ideal ein Hauptideal. 

Satz 153 (vom Faktorring; Definitionen) Sei R ein kommutativer Ring und J ein 

Ideal von R. 

Durch die Festsetzung 

(+) a ∼ b ⇔ b − a ∈ J 

(Letzteres ist offenbar auch zu a − b ∈ J äquivalent) erhält man eine Äquivalenzrelation 

∼ auf R, die mit + und · verträglich ist, d.h. es gilt: 

Wenn a ∼ a ′ und b ∼ b ′ ist, so folgt a+b ∼ a ′ +b ′ sowie a·b ∼ a ′ ·b ′ , für alle a, a ′ , b, b ′ ∈ R. 

1 Die Konstruktion des Körpers R der reellen Zahlen aus dem Körper Q ist ungleich mühsamer. Obwohl 

R so grundlegend für die Analysis ist, wird deshalb die Konstruktion von R zurückgestellt; man diskutiert 

in den Anfängervorlesungen nur wesentliche Eigenschaften von R, ohne die Existenz zu beweisen.


Mit R/J, auch mit R, bezeichnen wir die Menge aller Äquivalenzklassen. Die a ∈ R 

enthaltende Äquivalenzklasse ist a = a + J. 

Durch die Festsetzung a + b := a + b sowie a · b := a · b wird R/J ein kommutativer Ring, 

genannt der Faktorring von R nach J (auch Restklassenring) . 

Die Abbildung ¯ : R, +, · → R/J, +, ·, a ↦→ a ist ein Ring-Homomorphismus. Man 

nennt ihn den kanonischen Homomorphismus auf den Faktorring. 

Beispiele für die Situation im vorigen Satz haben wir schon kennengelernt: R = Z; jedes 

Ideal hat die Form mZ für ein m ∈ Z. Wir dürfen annehmen m ≥ 0. Falls m = 0, gilt 

Z = Z/mZ = {0, 1, , ..., m − 1} und |Z/mZ| = m. 

Erhält man in einem kommutativen Ring alle mit + und · verträglichen Äquivalenzrela- 

tionen durch die im vorigen Satz durchgeführte Konstruktion (also aus einem Ideal)? Die 

Antwort ’ja’ liefert der folgende Satz. 

Satz 154 Sei R ein kommutativer Ring und ∼ eine Äquivalenzrelation auf R, die mit + 

und · verträglich ist (siehe (+) im vorigen Satz). 

Dann ist J := {c ∈ R | 0 ∼ c } (die 0 enthaltende Äquivalenzklasse) ein Ideal, und es gilt 

(+) a ∼ b ⇔ b − a ∈ J ⇔ a − b ∈ J 

für alle a, b ∈ R. Deshalb ist a + J die a enthaltende Äquivalenzklasse von ∼. 

Insbesondere ist eine mit + und · verträgliche Äquivalenzklasse bereits vollständig 

festgelegt, wenn man die Äquivalenzklasse 0 kennt. 

Durch die vorigen Sätze haben wir einen Überblick über alle mit + und · verträglichen 

Äqivalenzrelationen auf dem Ring Z; es sind genau die Kongruenzrelationen (modulo einer 

beliebigen Zahl m ∈ Z). Das Analoge gilt für den Ring K[x] (K ein beliebiger Körper). 

Beobachtung 155 Sei R ein kommutativer Ring, S ein Ring, und ϕ : R → S ein 

(Ring-)Homomorphismus, d.h. 

aϕ + bϕ = (a + b)ϕ und (aϕ) · (bϕ) = (a · b)ϕ für alle a, b ∈ R. 

Dann ist die Bildmenge Rϕ ein kommutativer Unterring von S. 

Satz 156 (Homomorphiesatz für Ringe) Sei R ein kommutativer Ring, S ein Ring, 

und ϕ : R → S ein (Ring-)Homomorphismus. Wir setzen J := Kern(ϕ) := {r ∈ R | rϕ = 

0}. Dann ist J ein Ideal von R und es gilt für alle a, b ∈ R 

(∗) aϕ = bϕ ⇔ (b − a)ϕ = 0 ⇔ b − a ∈ J ⇔ b ∈ a := a + J ⇔ a = b


Die Äquivalenzrelation ’bildgleich unter ϕ ’ ist also gleich der Relation b − a ∈ J (und 

damit auch gleich der Relation ’bildgleich unter dem kanonischen Homomorphismus ¯’). 

Die Abbildung ¯ : R → R/J, a ↦→ a nannten wir den kanonische Homomorphismus auf 

den Faktorring R/J. 

Dann ist die Abbildung ω : R/J → Rϕ, a ↦→ aϕ wohldefiniert und ein Isomorphismus 

(=bijektiver Homomorphismus) des Faktorringes R/J auf den Ring Rϕ. Es gilt ϕ = ¯ · ω 

(Nacheinanderausführung des kanonischen Homomorphismus ¯ und ω). 

Beweis. Man hat 0ϕ + 0ϕ = (0 + 0)ϕ = 0ϕ und deshalb 0ϕ = 0. 

Für alle a ∈ R gilt aϕ + (−a)ϕ = (a − a)ϕ = 0, also −(aϕ) = (−a)ϕ. 

Für a, b ∈ J und r ∈ R gilt aϕ = 0, also (−a)ϕ = −(aϕ) = 0 und damit −a ∈ J; und 

(a + b)ϕ = aϕ + bϕ = 0 + 0 = 0, also a + b ∈ J; außerdem 0ϕ = 0 und deshalb 0 ∈ J. 

Also ist J eine Untergruppe von R, +. Weiter ist (ra)ϕ = (rϕ) · (aϕ) = (rϕ) · 0 = 0, also 

ra ∈ J. Wir zeigten: J ist ein Ideal, und damit ist der Faktorring R/J erklärt. 

Die Aussage (*) ist klar. 

Für a, b ∈ R gilt also aϕ = bϕ genau dann, wenn a = b ist. D.h. a ist die Klasse der mit 

a unter ϕ bildgleicher Elemente. Deshalb ist die Abbildung ω : R/J → Rϕ, a ↦→ aϕ 

wohldefiniert und bijektiv. 

ω ist ein (Ring-)Homomorphismus: (a + b)ω = (a + b)ω = (a + b)ϕ = aϕ + bϕ = aω + aω 

und (a · b)ω = (a · b)ω = (a · b)ϕ = (aϕ) · (bϕ) = (aω) · (bω) Der Beweis ist beendet. 

Erinnerung: Der Grad eines Polynoms p0 + p1x + p2x 2 + ... = 0 ist das größte n ∈ N0 mit 

an = 0; das Nullpolynom bekommt keinen Grad. Es gilt Grad(pq) = Grad(p) + Grad(q) 

für alle von 0 verschiedenen Polynome. 

Beispiele 

1. Der Faktorring K[x]/p · K[x] (dabei seien K ein Körper und p ∈ K[x] \ {0}). 

Im Fall Z/m · Z (m ∈ Z \ {0}) haben wir ein besonders einfaches Repräsentantensystem 

der Elemente von Z/m · Z, also der Klassen a + mZ gefunden: {0, 1, 2, ..., |m| − 1}. 

Analoges erstreben wir für K[x]/p · K[x]. 

Setze k := Grad(p). Behauptung: P := {q ∈ K[x] | Grad(q) < k oder q = 0} ist ein 

Repräsentantensystem von K[x]/p · K[x]. 

Beweis. (i) Seien q, r ∈ P und q = r. Wir behaupten, dass q und r in verschiedenen 

Klassen liegen. 

In der Tat: wäre dies nicht wahr, so wäre q + pK[x] = r + pK[x], d.h. q in Relation zu r, 

d.h. r − q ∈ pK[x]. Alle Polynome in pK[x] außer dem Nullpolynom haben einen Grad 

≥ k. Da aber r − q = 0 ist und Grad(r − q) < k, liegt ein Widerspruch vor.


(ii) Jede Klasse m + pK[x] enhält ein Polynom aus P . 

Zum Beweis schreiben wir m = s · p + r, wobei s, r ∈ K[x] sind und r = 0 oder 

Grad(r) < k. Dann gilt m ∈ r + p · K[x], also gilt r ∈ P und m, r ∈ r + pK[x], d.h. m und 

r liegen in der gleichen Klasse. 

1a Wir spezialisieren 1., indem wir K = R und p = x 2 + 1 ∈ R[x] wählen. Dieses Polynom 

ist in R[x] irreduzibel, d.h. vom Grad ≥ 1 und man kann es nicht als Produkt zweier 

Polynome ∈ R[x] von echt kleinerem Grad schreiben. 

Nach 1. ist P = {a0 + a1x | a0, a1 ∈ R} ein Repräsentantensystem von K[x]/pK[x]. Wir 

setzen für q ∈ K[x] zur Abkürzung q := q + pK[x] = die q enthaltende Klasse, also 

¯ : K[x] → K[x]/pK[x] der kanonische Homomorphismus. 

Nun gilt (a0, a1, b0, b1 ∈ R) 

(a0 + a1x) + (b0 + b1x) = (a0 + b0) + (a1 + b1)x, und 

(a0 + a1x) · (b0 + b1x) = a0b0 + (a0b1 + a1b0)x + a1b1x 2 = (a0b0 − a1b1) + (a0b1 + a1b0)x, 

denn x 2 + 1 = 0, also x 2 = −1. 

Wir erkennen, dass in diesem Fall R[x]/(x 2 + 1)R[x] der Körper C der komplexen Zahlen 

ist! (dabei ist die reelle Zahl a0 mit a0 ∈ R[x]/(x 2 + 1)R[x] zu identifizieren). Es gilt 

x 2 = −1. 

1b Wenn wir K = R und p = x 2 wählen, ist p nicht irreduzibel (denn x 2 = x · x) und 

K[x]/pK[x] kein Körper, denn 

(a0 + a1x) + (b0 + b1x) = (a0 + b0) + (a1 + b1)x, aber 

(a0 + a1x) · (b0 + b1x) = (a0b0) + (a0b1 + a1b0)x + a1b1x 2 = a0b0 + (a0b1 + a1b0)x, denn 

x 2 = 0; wir haben Nullteiler = 0 in K[x]/x 2 K[x] (Ring der Dualzahlen). 

1c Sei K = Z/3Z = GF3 der Körper mit 3 Elementen. Man setze p := x 2 + 1. Das 

Polynom x 2 +1 ist in K[x] irreduzibel (sonst hätte es eine Nullstelle in K). Der Faktorring 

K[x]/(x 2 + 1)K[x] hat 9 Elemente, denn nach 1. ist P = {a0 + a1x | a0, a1 ∈ K} ein 

Repräsentantensystem. Dieser Ring ist ein Körper (wird in Algebra in allgemeinerem 

Rahmen gezeigt). Wir haben also einen Körper mit 9 Elementen konstruiert. 

Vorschau Später lernen wir den 

Satz Wenn K ein Körper ist und p ∈ K[x] ein irreduzibles Polynom, so ist K[x]/pK[x] 

ein Körper (Kronecker-Konstruktion). 1a und 1c ordnen sich hier ein. 

Der Sachverhalt ist analog der Aussage: Falls m ∈ Z irreduzibel ist (das ist hier das 

Gleiche wie Primelement), so ist Z/mZ ein Körper.


2. Wir illustrieren nun den Homomorphiesatz an einem nicht ganz trivialen 

Beispiel Sei K, ein Körper, V := K2 und α : V → V die durch die Matrix 

 

0 1 

1 0 

(bezüglich einer Basis) definierte lineare Abbildung. 

Nun sei ϕ : R := K[x] → S := Hom(V, V ) der ’Einsetzhomomorphismus’ vom Polynom- 

ring in den Ring der linearen Abbildungen auf V , also p = p0+p1x+p2x 2 +.... ↦→ p(α) := 

p0 · 1V + p1α + p2α 2 + .... (Es ist 1V = idV das 1-Element im Ring Hom(V, V )). 

Was ist der Kern J := Kern(ϕ) = {q ∈ K[x] | q(α) = 0} ? 

Es gilt α 2 − 1V = 0 (= 0-Element des Ringes Hom(V, V ), d.h. die konstante Abbildung 

mit einzigem Bildwert 0 ∈ V ). 

Deshalb gilt (1) x 2 − 1 ∈ J. 

Wir behaupten: Es gilt (2) (x 2 −1)·K[x] = J d.h. der Kern J des Einsetzhomomorphismus 

ϕ ist das von x 2 − 1 im Polynomring K[x] erzeugte Hauptideal. 

Warum? J ist ein Ideal = 0, und aus den Übungen wissen wir: 

J = q · K[x], wobei q das normierte Polynom = 0 kleinsten Grades in J ist. Dieses ist 

gleich x 2 − 1; denn sonst wäre es von der Form x − c (c ∈ K) oder gleich 1, und dann wäre 

α = c · 1V oder V = {0}, was offenbar nicht zutrifft. Also stimmt (2). 

Nach dem Homomorphiesatz ist die Abbildung ω : K[x]/(x 2 − 1) · K[x] → K[α] := 

K[x]ϕ, q + (x 2 − 1) · K[x] ↦→ qϕ = q(α) ein Ringisomorphismus. 

Wir haben in 1. bewiesen: 

Die Polynome vom Grad ≤ 1 zusammen mit dem 0-Polynom bilden nach 1. ein Repräsen- 

tantensystem der Äquivalenzrelation ’bildgleich unter ϕ ’. In jeder Klasse (d.h. Element 

von K[x]/(x 2 − 1) · K[x] liegt genau ein solches Polynom. 

Insbesondere gilt K[α] = K[x]ϕ = {a0 · 1V + a1α | ai ∈ K}.

9 EIGENWERTE, CHARAKTERISTISCHE GLEICHUNG, DIAGONALISIERBARKEIT111 

9 Eigenwerte, charakteristische Gleichung, Diagonalisier- 

barkeit 

Im folgenden sei V ein Vektorraum über einem Körper K. 

Beispiel Sei K = R und V = R2 und ϕ : V → V die lineare Abbildung zu 

 

1 −1 

A = 

2 4 

bezüglich der Standardbasis. Dann gilt (2, 1)ϕ = (4, 2) = 2 · (2, 1) und (1, 1)ϕ = (3, 3) = 

3 · (1, 1), Bezüglich der Basis ((2, 1), (1, 1)) hat ϕ also die ’Diagonal-Matrix’ 

 

2 0 

B = 

0 3 

Beispiel Populationsmatrix G0, G1, ....., Gn seien Generationen (einer Bevölkerung, 

z.B. jedes Jahr eine neue Generation). 

Sei v = (v0, v1, ..., vn) ∈ R n+1 der Bevölkerungsvektor (zu einem bestimmtem Zeitpunkt 

dieses Jahres): vi = Anzahl der Mitglieder in Generation Gi. 

Sei bi die Geburtenrate der i−ten Generation: d.h. wenn G3 100 Mitglieder hat und 

b3 = 1, 6 ist, hat G3 bis zum nächsten Jahr 100 · 1, 6 Mitglieder der Generation G0 produ- 

ziert. 

ai := Überlebensrate von Gi−1 zu Gi, d.h. wenn a3 = 0, 2 ist und G2 100 Mitglieder hat, 

kommen nächstes Jahr davon 100 · 0, 2 in Generation G2 (und 100 · 0, 8 sind gestorben). 

Wie berechnet man den Bevölkerungsvektor w = (w0, w1, ..., wn) für das nächste Jahr? 

Man hat wi = vi−1ai für i ∈ {1, .., n} und w0 = v1b1 + ... + vnbn (vorausgesetzt, G0 ist 

noch nicht produktiv). Also w = vA (wenn wir Vektoren des R n+1 mit 1 × n + 1-Matrizen 

identifizieren), wobei 

⎛ 

⎜ 

A = ⎜ 

⎝ 

0 a1 0 0 0 0 

b1 0 a2 0 0 0 

b2 0 0 a3 0 0 

.. .. .. .. .. .. 

.. .. .. .. .. an 

bn .. .. .. 0 0 

ist. Wir betrachten also die lineare Abbildung ϕ : R n+1 → R n+1 , v ↦→ vϕ := vA. Falls 

der Bevölkerungsvektor in diesem Jahr v ist, so ist er im nächsten Jahr vϕ. 

Wann bleiben die Verhältnisse zwischen den Mitgliederzahlen der Generationen konstant, 

d.h. die ’Bevölkerungspyramide’ behält die gleiche Form (falls im nächsten Jahr zum 

⎞ 

⎟ 

⎠


Beispiel 3-mal soviel in G3 sind wie in diesem Jahr, dann auch 3-mal soviel in den anderen 

Gi)? 

Das bedeutet: es gibt λ ∈ R mit vϕ = λv, also v ist ’Eigenvektor’ zum Eigenwert λ der 

linearen Abbildung ϕ. 

Wir untersuchen das speziell im Fall G0 :=Generation der Eier, G1 :=Generation der 

Larven, G2 :=Generation der Schmetterlinge. 

Dann ist b1 = 0 und man hat 

A = 

⎛ 

⎜ ⎜ 

⎝ 

0 a1 0 

0 0 a2 

b2 0 0 

Dann ist µ := a1a2b2 ein Eigenwert von ϕ 3 und jeder Vektor v ∈ R 3 ist ein Eigenvektor zu 

µ derAbbildung ϕ 3 . Oh Wunder der Natur: Nach drei Generationen hat man stets wieder 

das gleiche Verhältnis von Eieranzahl zu Larvenanzahl zu Schmetterlingsanzahl. 

Definition 157 Sei ϕ ∈ Hom(V, V ). Nenne λ ∈ K einen Eigenwert von ϕ, wenn es 

v ∈ V \ {0} gibt mit vϕ = λv Ein Vektor v ∈ V \ {0} heißt ein Eigenvektor (von ϕ zum 

Eigenwert λ), wenn es λ ∈ K gibt mit vϕ = λv. 

Die Menge der Eigenwerte von ϕ heißt das Spektrum von ϕ. 

Für λ ∈ K nenne Vλ := Kern(ϕ−λ1V ) den Eigenraum zu λ. Insbesondere: Kern(ϕ) = V0. 

Man nennt ϕ diagonalisierbar, wenn es Eigenwerte λ1, ..., λm ∈ K gibt mit V = Vλ1 ⊕ 

.... ⊕ Vλm . 

Beobachtung 158 (Voraussetzungen wie in der Definition) 

(a) Ein Eigenraum ist stets ein Untervektorraum. 

Für λ ∈ K ist der zugehörige Eigenraum Vλ genau dann = {0}, wenn λ ein Eigenwert ist. 

(b) Für jedes λ ∈ K gilt Vλϕ ⊆ Vλ, man sagt: Vλ ist invariant unter ϕ. Falls λ = 0 ist, 

gilt Vλϕ = Vλ. Falls λ = 0 gilt Vλϕ = {0}. 

(c) ϕ ist genau dann injektiv, wenn V0 = Kern(ϕ) = {0} ist, d.h. wenn 0 ∈ K kein 

Eigenwert von ϕ ist. 

Beispiel Sei V := C ∞ (R) der Vektorraum der beliebig oft differenzierbaren Abbildungen 

R → R (dies ist bekanntlich ein Untervektorraum des R-Vektorraums aller Abbildungen 

R → R). Die Abbildung ϕ : V → V , f ↦→ f ′ , welche jedem f ∈ V ihre Ableitungs- 

funktion zuordnet, ist linear (Analysis I). Jedes λ ∈ R ist ein Eigenwert von ϕ; denn zu 

gegebenem λ ∈ R betrachte man die Abbildung f ∈ V mit tf := exp(λt) (exp = reelle 

Exponentialfunktion). Dann gilt fϕ = λf. 

⎞ 

⎟ 

⎠


Im folgenden nehmen wir zur Vereinfachung an n := dimV < ∞. 

Beobachtung 159 Unter einer Diagonalmatrix versteht man eine n × n-Matrix, deren 

Einträge außerhalb der Diagonalen 0 sind. 

Sei ϕ diagonalisierbar (gemäß der obigen Definition). Sei (vi,1, ..., vi,ki ) eine Basis von 

Vλi (also dimVλi = ki). Wenn ich diese Basen aneinanderhänge, erhalte ich eine Basis 

von V : 

(v1,1, ..., v1,k1 , ....., vm,1, ..., vm,km ). Bezüglich dieser Basis ist die Matrix von ϕ die Dia- 

gonalmatrix 

diag(λ1, ..., λ1, λ2, ..., λ2, ...., λm, ..., λm) 

(das sind die Einträge in der Diagonalen; außerhalb der Diagonalen sind alle Einträge 0). 

Umgekehrt: Wenn es eine Basis von V gibt, bezüglich welcher die Matrix von ϕ ∈ 

Hom(V, V ) eine Diagonalmatrix ist, so ist ϕ diagonalisierbar im Sinn der obigen Defi- 

nition. Die Menge der Diagonaleinträge ist dann das Spektrum der linearen Abbildung 

ϕ. 

Lemma 160 Sei ϕ ∈ Hom(V, V ) und seien λ1, ..., λm (m ∈ N) paarweise verschieden. 

Dann gilt Vλ1 + ... + Vλm = Vλ1 ⊕ ... ⊕ Vλm 

Beweis. Seien zi ∈ Vλi und (*) z1 + ... + zm = 0. Zu zeigen ist: zi = 0 für alle i ∈ {1, ..., m}. 

Beweis mit vollständiger Induktion über m. Für m = 1 ist nichts zu zeigen. Sei also 

m ≥ 2. Aus (*) folgt 0 = 0ϕ = λ1z1 + ... + λmzm, also (λ1 − λ2)z2 + ... + (λ1 − λm)zm = 0. 

Induktionsvoraussetzung liefert Vλ2 

+ ... + Vλm = Vλ2 ⊕ ... ⊕ Vλm und deshalb 

(λ1 − λ2)z2 = ... = (λ1 − λm)zm = 0, wegen λ1 = λ2, ..., λm also z2 = ... = zm = 0 und 

dann auch z1 = 0. 

Korollar 161 Sei n = dimV < ∞ und ϕ ∈ Hom(V, V ). Dann hat ϕ höchstens n Eigen- 

werte. Wenn λ1, ..., λn verschiedene Eigenwerte von ϕ sind, gilt V = Vλ1 ⊕ ... ⊕ Vλn , und 

jedes Vλi ist 1-dimensional. Wählt man vi ∈ Vλi \ {0}, so ist (v1, ..., vn) eine Basis von V , 

und die Matrix von ϕ hat die Form diag(λ1, ..., λn). 

Satz 162 Seien ϕ ∈ Hom(V, V ) und λ ∈ K. Dann ist λ ein Eigenwert zu ϕ genau dann, 

wenn gilt 

det(λ · 1V − ϕ) = 0 

Beweis. Folgende Aussagen sind äquivalent. λ ist Eigenwert von ϕ; es gibt v ∈ V \ {0} 

mit vϕ = λv; es gibt v ∈ V \ {0} mit v(λ · 1V − ϕ) = 0; Kern(λ · 1V − ϕ) = {0} ;


det(λ · 1V − ϕ) = 0. 

Bemerkung Man kann die Bedingung det(λ · 1v − ϕ) = 0 (bei gegebenem ϕ) als 

Forderung in Form einer ’Gleichung’ an λ ansehen, d.h. det(λ · 1v − ϕ) = 0 soll gelten. 

Diese ’charakteristische Gleichung’ hat die Form λ n + an−1λ n−1 + ... + a0 = 0, wobei die 

ai ∈ K durch ϕ gegeben sind. Hieran erkennen wir wieder, dass ϕ höchstens n Eigenwerte 

hat, denn eine Polynomfunktion zu einem Polynom vom Grad ≤ n hat höchstens n 

Nullstellen. 

Beobachtung 163 (Konstruktion des charakteristischen Polynoms) Sei 

ϕ ∈ Hom(V, V ) und eine beliebige Basis von V gewählt. Sei A die Matrix von ϕ 

bezüglich dieser Basis. Dann gilt 

⎛ 

⎜ 

det(λ · 1V − ϕ) = det(λE − A) = det ⎜ 

⎝ 

für jedes λ ∈ K. 

λ − a11 −a12 ... −a1n 

−a21 λ − a22 ... −a2n 

... ... ... ... 

−an1 ... −an,n−1 λ − ann 

Nach dem Satz ist λ ∈ K genau dann ein Eigenwert von ϕ, wenn det(λ · E − A) = 0 gilt. 

Wir betrachten K als Unterkörper des Körpers K(x) (Körper der rationalen Funktionen, 

Quotientenkörper von K[x]). In diesem ist 

⎛ 

⎜ 

det(xE − A) = det ⎜ 

⎝ 

x − a11 −a12 ... −a1n 

−a21 x − a22 ... −a2n 

... ... ... ... 

−an1 ... −an,n−1 x − ann 

wohldefiniert (man hat xE − A ∈ K(x) n×n ), und ein normiertes Polynom in K[x] vom 

Grad n. Man nennt char(A) := det(xE − A) das charakteristische Polynom der 

Matrix A ∈ K n×n . Falls n = 0 setzen wir char(A) := 1. 

Behauptung Ist B die Matrix von ϕ bezüglich einer weiteren Basis von V , so gilt 

det(xE − A) = det(xE − B). Das charakteristische Polynom hängt also nur von ϕ ab, und 

wir können char(ϕ) := char(A) als das charakteristische Polynom von ϕ bezeichnen. 

Beweis. Wir haben früher ermittelt: es gibt eine invertierbare Matrix C ∈ K n×n mit 

B = C −1 AC. Durch Rechnen im Ring K(x) n×n erhalten wir char(B) = det(xE − B) = 

⎞ 

⎟ 

⎠ 

⎞ 

⎟ 

⎠


det(xC −1 EC − C −1 AC) = det(C −1 (xE − A)C) = det(C −1 ) · det(xE − A) · det(C) = 

(det(C)) −1 · det(xE − A) · det(C) = det(xE − A) = char(A). 

Fast unmittelbar aus der Definition 136 der Determinante und unseren vorigen Ergebnissen 

folgt 

Satz 164 Für eine lineare Abbildung ϕ ∈ Hom(V, V ) gilt: char(ϕ) = a0 + a1x + ... + x n 

ist ein normiertes Polynom vom Grad n := dimV . Es gilt (−1) n a0 = det(ϕ) und −an−1 = 

Summe der Diagonalelemente einer Matrix zu ϕ, genannt die Spur von ϕ. 

Das Spektrum von ϕ ist die Nullstellenmenge von char(ϕ) (in K). 

Satz 165 Seien ϕ ∈ Hom(V, V ) und ω ∈ GL(V ). Dann gilt char(ω −1 ϕω) = char(ϕ). 

Beweis. Wir wählen eine Basis von V . Mit A bezeichnen wir die Matrix von ϕ 

(bez, dieser Basis). Sei B die Matrix von ω −1 ϕω und C die Matrix von ω (bez. der 

gewählten Basis). Dann ist B = C −1 AC und char(ω −1 ϕω) = char(B) = det(xE − B) = 

det(xC −1 EC−C −1 AC) = .... (wie im vorigen Beweis) det(xE−A) = char(A) = char(ϕ). 

Wir steuern nun auf einen sehr erstaunlichen Satz zu, nämlich dass für jedes ϕ ∈ 

Hom(V, V ) gilt: char(ϕ) liegt im Kern des Einsetzhomomorphismus K[x] → Hom(V, V ), 

q ↦→ q(ϕ). D.h. ” ϕ genügt seiner eigenen charakteristischen Gleichung “. 

Satz 166 (Satz von Cayley und Hamilton) Sei ϕ ∈ Hom(V, V ). Für char(ϕ) = a0 + 

a1x + ... + x n gilt a0 · 1V + a1ϕ + ... + ϕ n = 0 Hom(V,V ). 

Insbesondere gilt für jedes ϕ ∈ Hom(V, V ): Der Kern des Einsetzhomomorphismus 

K[x] → Hom(V, V ), p ↦→ p(ϕ) ist niemals das 0-Ideal! 

Der Beweis erfordert einige (auch später benötigte) Hilfsmittel. 

Definition 167 (Modul, zyklischer Modul, Begleitmatrix) Sei ϕ ∈ Hom(V, V ). 

a) Ein ϕ-Modul ist ein Untervektorraum U von V mit der Eigenschaft Uϕ ⊆ U ( man 

sagt: U ist invariant unter ϕ). 

b) Sei v ∈ V . Man nennt 〈v〉ϕ := 〈{vϕ i | i ∈ N0}〉 den von v erzeugten ϕ-zyklischen Modul. 

Ein Untervektorraum, der für ein passendes v ∈ V diese Form hat, heißt ϕ-zyklisch. 

Man sagt ϕ ist eine zyklische Abbildung, wenn V ein ϕ-zyklischer Modul ist.


c) Eine Begleitmatrix ist eine Matrix B der Form 

⎛ 

⎜ 

B = ⎜ 

⎝ 

0 1 0 .. 0 

0 0 1 .. 0 

.. .. .. .. .. 

0 .. .. 0 1 

−a0 −a1 .. .. −an−1 

⎞ 

⎟ ∈ K 

⎟ 

⎠ 

n×n 

Beobachtung Voraussetzung wie in der Definition. Wenn U ein ϕ-Modul ist, so ist ϕ|U ∈ 

Hom(U, U). 

Lemma 168 Voraussetzungen wie in der Definition. Sei v ∈ V \ {0} und U := 〈v〉ϕ der 

von v erzeugte ϕ-zyklische Modul. 

(i) U ist ein ϕ-Modul. 

(ii) Setze n := dimU. Dann ist (v, vϕ, vϕ 2 , ..., vϕ n−1 ) eine Basis von U. 

Die Matrix von ϕ|U ∈ Hom(U, U) bezüglich dieser Basis ist eine Begleitmatrix (wie oben). 

Es gilt char(ϕ|U) = a0 + a1x + .... + x n . 

Beweis. Zu (i). Uϕ = (〈{vϕ i | i ∈ N0}〉)ϕ = 〈{vϕ i ϕ | i ∈ N0}〉 ⊆ 〈{vϕ i | i ∈ N0}〉 = U. 

Zu (ii). Ein linear unabhängiges Vektortupel von Vektoren aus V enthält höchstens dimV 

(also endlich viele) Vektoren. Deshalb gibt es ein maximales n ∈ N mit der Eigenschaft: 

(v, vϕ, ..., vϕ n−1 ) ist linear unabhängig. 

Dann gilt W := 〈v, vϕ, ..., vϕ n−1 〉 ⊆ U, und (v, vϕ, ..., vϕ n−1 ) ist eine Basis von W . 

Da (v, vϕ, ..., vϕ n−1 , vϕ n ) linear abhängig ist (Wahl von n), gilt vϕ n ∈ 〈v, vϕ, ..., vϕ n−1 〉 = 

W , also 

(*) vϕ n = −a0v − a1vϕ... − an−1vϕ n−1 ∈ W 

für geeignete ai ∈ K. 

Es folgt W ϕ = 〈v, vϕ, ..., vϕ n−1 〉ϕ = 〈vϕ, vϕ 2 , ..., vϕ n−1 , vϕ n 〉 ⊆ W , und damit W ϕ i ⊆ W 

für alle i ∈ N0. Insbesondere gilt vϕ i ∈ W für alle i ∈ N0 und deshalb U ⊆ W . Wir 

haben U = W eingesehen, und dass (v, vϕ, ..., vϕ n−1 ) eine Basis von U ist. Offenbar ist 

die Matrix von ϕ|U bezüglich dieser Basis die obige Begleitmatrix, wobei die ai durch (*) 

bestimmt sind. 

Die Aussage char(B) = a0 + a1x + .... + x n für die Begleitmatrix B folgern wir durch 

Induktion über n: Falls n = 1 ist B eine 1 × 1-Matrix mit Eintrag −a0 und x + a0 das 

charakteristische Polynom. Nun sei n ≥ 2. Wir entwickeln die Determinante von xE − B 

nach der ersten Spalte: char(B) = det(xE −B) = x·det(xE ′ −B ′ )+a0(−1) 1+n ·det(−E ′ ), 

wobei B ′ aus B durch Streichen der 1. Zeile und 1. Spalte entsteht, und E ′ die 

(n − 1) × (n − 1)-Einheitsmatrix ist. Induktionsvoraussetzung angewendet auf B ′ liefert


det(xE ′ − B ′ ) = a1 + a2x + ... + x n−1 . Es gilt (−1) 1+n · det(−E ′ ) = 1 und deshalb 

char(B) = a0 + a1x + .... + x n . 

Beweis des Satz 166 von Cayley und Hamilton 

Hilfssatz Die Aussage des Satz von Cayley Hamilton gilt, wenn ϕ eine zyklische 

Abbildung ist. 

Beweis. Wir dürfen V = 0 annehmen. V ist ein ϕ-zyklischer Modul, also V = 〈v〉ϕ für 

ein v ∈ V . Nach 168 (ii) ist die Matrix von ϕ deshalb eine Begleitmatrix B wie 167. 

Nach 168 gilt q := char(ϕ) = a0 + a1x + .... + x n . In Aufgabe Lin. Alg. I 54 c) wurde 

a01V + a1ϕ + .... + ϕ n = 0 bewiesen. Also gilt q(ϕ) = 0. 

Nun zum eigentlichen Beweis. 

Gegeben ist eine lineare Abbildung ϕ ∈ Hom(V, V ) mit q := char(ϕ) = a0 + a1x + ... + x n , 

wobei n = dimV ist. Setze ω := a0 · 1V + a1ϕ + ... + ϕ n . Zu zeigen ist ω = 0 Hom(V,V ), das 

heißt vω = 0 für jedes v ∈ V . 

Sei also v ∈ V . Wir dürfen v = 0 annehmen. 

Setze U := 〈v〉ϕ (der von v erzeugte zyklische ϕ-Modul). 

Wir wählen eine Basis (u1, ..., uk) von U und ergänzen diese zu einer Basis 

(u1, ..., uk, w1, ..., wm) von V . Bezüglich dieser Basis hat die Matrix A von ϕ (wegen 

Uϕ ⊆ U) die Form 

A = 

B 0 

D C 

wobei B ∈ K k×k die Matrix von ϕ|U ist und C ∈ K m×m und D ∈ K m×k und 0 die 

k × m-0-Matrix. 

Nun gilt q = det(xE − A) und 

xE − A = 

 

xE ′ − B 0 

−D xE ′′ − C 

wobei E ′ die k × k-Einheitsmatrix ist und E ′′ die m × m-Einheitsmatrix. 

Die Determinantenregel für aus Blockmatrizen zusammengesetzte Matrizen zeigt 

q = det(xE − A) = det(xE ′ − B) · det(xE ′′ − C) = p · s mit p := char(ϕ|U) und 

s := det(xE ′′ − C). 

Der Hilfssatz sagt p(ϕ|U) = 0 Hom(U,U), und deshalb gilt insbesondere vp(ϕ) = vp(ϕ|U) = 

0 ∈ V . Es folgt vq(ϕ) = vp(ϕ) · s(ϕ) = 0s(ϕ) = 0. Der Beweis ist beendet.


Beobachtung 169 ( und Definition) Sei ϕ ∈ Hom(V, V ). Dann ist J := {q ∈ 

K[x] | q(ϕ) = 0} der Kern des Einsetzhomomorphismus K[x] → Hom(V, V ) (Einsetzen 

von ϕ). J ist ein Ideal des Polynomringes K[x]. Nach 166 gilt char(ϕ) ∈ J. Insbesondere 

gilt J = {0}. Deshalb existiert ein normiertes Polynom p minimalen Grades in J, und 

dieses ist eindeutig bestimmt. Es erfüllt J = p · K[x]. Man nennt p das Minimalpolynom 

von ϕ, Bezeichnung mip(ϕ) := p. 

Nach dem Gesagten gilt mip(ϕ) | char(ϕ), d.h. char(ϕ) = mip(ϕ) · q für ein passendes 

q ∈ K[x]. 

Aus einer Matrix von ϕ können wir char(ϕ) berechnen. 

Die Berechnung von mip(ϕ) ist i.a. nicht so einfach, aber doch in endliche vielen Schritten 

durchzuführen, denn nach der Beobachtung kommen dafür nur die Teiler von char(ϕ) 

infrage. Allerdings ist es nicht immer leicht alle diese Teiler zu finden. 

Satz 170 Sei ϕ ∈ Hom(V, V ) eine zyklische Abbildung. Dann gilt char(ϕ) = mip(ϕ). 

In einer passenden Basis gehört zu der zyklischen Abbildung ϕ eine Begleitmatrix wie in 

167 c). Dann ist also 

char(ϕ) = a0 + a1x + .... + x n = mip(ϕ). 

Definition 171 Sei ϕ ∈ Hom(V, V ). Ein ϕ-Modul U ⊆ V heißt unzerlegbar, wenn 

U = {0} ist und für alle ϕ-Moduln T, Z gilt: 

Aus U = T ⊕ Z folgt T = {0} oder Z = {0}. 

Das bedeutet, man kann U nur auf ’triviale Weise’ in ϕ-Moduln zerlegen. 

Beobachtung 172 Sei V = {0} und ϕ ∈ Hom(V, V ). Dann existiert eine Zerlegung 

wobei die Vi unzerlegbare ϕ-Moduln sind. 

V = V1 ⊕ ... ⊕ Vk 

Beweis induktiv über dimV , mit dem trivialen Anfang dimV = 1. Falls V unzerlegbarer 

ϕ-Modul ist, sind wir fertig. Andernfalls gibt es eine echte Zerlegung V = U ⊕ W (U, W 

ϕ-Moduln = {0}). Die Induktionsvoraussetzung liefert Zerlegungen U = V1 ⊕ ... ⊕ Vs und 

W = Vs+1 ⊕ ... ⊕ Vk in unzerlegbare ϕ-Moduln. Es gilt dann V = V1 ⊕ .... ⊕ Vk.


Die eingeführten Begriffe kommen zum Tragen, wenn wir die ’Theorie einer linearen Ab- 

bildung’ im letzten Kapitel studieren. Der vorige Satz weist den Weg: wir müssen die 

Struktur der unzerlegbaren ϕ-Moduln studieren. Wir werden beweisen: Ein ϕ-Modul U 

ist genau dann unzerlegbar, wenn er ϕ-zyklisch ist und mip(ϕ|U) = p t gilt, wobei p ∈ K[x] 

ein irreduzibles Polynom ist und t ∈ N.

10 BILINEARFORMEN 120 

10 Bilinearformen 

Im folgenden sei V ein Vektorraum über einem Körper K. 

Wir brauchen einen Hilfssatz. 

Lemma 173 Seien V, W K-Vektorräume und ϕ, ψ ∈ Hom(V, W ) mit der Eigenschaft 

vϕ ∈ 〈vψ〉 

für alle v ∈ V . Dann existiert λ ∈ K mit ϕ = λ · ψ. 

Beweis, zur Vereinfachung unter der Voraussetzung dimV < ∞. 

Setze U := Kern(ψ). Offenbar gilt U = Kern(ψ) ⊆ Kern(ϕ). Falls Kern(ϕ) = V ist kann 

man also λ := 0 setzen und ist fertig. Für jedes a ∈ V ist aϕ ∈ 〈aψ〉; also aϕ = λa · aψ 

für ein λa ∈ K (wobei man im Fall a ∈ U die Zahl λa ∈ K beliebig wählen kann; sonst ist 

λa durch a eindeutig bestimmt). 

(i) Seien a, b ∈ V und (aψ, bψ) linear unabhängig. Dann gilt λa = λb. 

Beweis (i). λa(aψ) + λb(bψ) = aϕ + bϕ = (a + b)ϕ = λa+b · (a + b)ψ = λa+baψ + λa+bbψ. 

Koeffizientenvergleich ((aψ, bψ) ist linear unabhängig vorausgesetzt!) liefert 

λa = λa+b = λb. 

Nun wähle einen Untervektorraum Z von V mit (+) V = U ⊕Z und eine Basis (z1, ..., zm) 

von Z. Für i = j ist dann (ziψ, zjψ) linear unabhängig ( sonst etwa ziψ = µzjψ 

für ein µ ∈ K und dann zi − µzj ∈ Z ∩ U = {0}, Widerspruch). Nach (i) folgt 

λ := λz1 = ... = λzm und damit zϕ = λ · zψ für jedes z ∈ Z (mit dem gleichen λ !). 

Außerdem gilt uϕ = 0 = uψ = λuψ für jedes u ∈ U. Mit (+) folgt vϕ = λvψ für alle v ∈ V . 

Korollar 174 (und Definition) Sei ϕ ∈ Hom(V, V ) mit vϕ ∈ 〈v〉 für jedes v ∈ V (d.h. 

jedes v ∈ V ist Eigenvektor zu einem passenden Eigenwert). Dann gibt es λ ∈ V mit 

ϕ = λ · 1V (Abbildungen dieser Form heißen Homothetien). 

Beweis. Wende das vorige Lemma an im Spezialfall W = V und ψ = 1V . 

Ab jetzt setzen wir voraus dimV < ∞. V ∗ bezeichnet den Dualraum von V , also 

V ∗ = Hom(V, K), der Vektorraum der linearen Abbildungen des K-Vektorraums V in 

den K-Vektorraum K = K 1 . 

Korollar 175 Seien ϕ, ψ ∈ V ∗ und es gelte Kern(ψ) ⊆ Kern(ϕ). Dann gilt ϕ = λψ für 

ein λ ∈ K.


Beweis. Wende das vorige Lemma an für W := K. Sei v ∈ V . Falls v ∈ Kern(ψ) gilt 

〈vψ〉 = K und deshalb vϕ ∈ K ⊆ 〈vψ〉. Falls v ∈ Kern(ψ) hat man vϕ = 0 und dann 

auch vϕ = 0 ∈ {0} = 〈vψ〉. Also gilt vϕ ∈ 〈vψ〉 für alle v ∈ V . Das Lemma liefert λ ∈ K 

mit ϕ = λ · ψ. 

V sei ein K-Vektorraum, K ein Körper. Wir setzen dimV < ∞ voraus. 

Zur Abstandsmessung wird in der Analysis oft das gewöhnliche Skalarprodukt des R n 

benutzt. 

Zur Definition der Determinante haben wir Volumenfunktionen studiert. 

Skalarprodukt wie auch Volumenfunktionen sind Multilinearformen. Wir verallgemeinern 

das Skalarprodukt, indem wir Bilinearformen definieren. 

Definition 176 Man nennt f : V × V → K eine Bilinearform, wenn für alle a, b, c ∈ V 

und λ ∈ K gilt 

(1) f(a + b, c) = f(a, c) + f(b, c), f(a, b + c) = f(a, b) + f(a, c) 

(2) f(λa, b) = λf(a, b) = f(a, λb) 

Wenn (e1, ..., en) eine Basis von V ist, nennt man (f(ei, ej)) ∈ K n×n die Gramsche 

Matrix zu f bezüglich der Basis. 

Ein Vektor a ∈ V heißt anisotrop, wenn f(a, a) = 0 ist; isotrop, wenn f(a, a) = 0 gilt. 

Man nennt f orthosymmetrisch, wenn gilt: f(a, b) = 0 ⇔ f(b, a) = 0 für alle a, b ∈ V . 

Man nennt f symmetrisch, wenn gilt: f(a, b) = f(b, a) für alle a, b ∈ V . 

Man nennt f antisymmetrisch (symplektisch), wenn gilt f(a, a) = 0 und f(a, b) = −f(b, a), 

für alle a, b ∈ V (falls in K gilt 2 = 0, ist die Forderung f(a, a) = 0 redundant). 

Für eine orthosymmetrische Bilinearform f und A ⊆ V setzen wir A ⊥ := {v ∈ 

V | f(a, v) = 0 für alle a ∈ A }. 

Wir wollen beweisen, dass jede orthosymmetrische Bilinearform bereits symmetrisch oder 

symplektisch ist. 

Beobachtung 177 Sei f eine Bilinearform. Für jedes a ∈ V setze af : V → K, 

v ↦→ f(a, v) und fa : V → K, v ↦→ f(v, a). Dann gilt af, fa ∈ V ∗ (Dualraum von 

V ). Für die Abbildungen ϕ : V → V ∗ , a ↦→ af und ψ : V → V ∗ , a ↦→ fa gilt 

ϕ, ψ ∈ Hom(V, V ∗ ).


Satz 178 Sei f : V × V → K eine orthosymmetrische Bilinearform. Dann ist f sym- 

metrisch oder symplektisch. 

Beweis. Seien ϕ und ψ die in der Beobachtung definierten Abbildungen. 

Sei a ∈ V . Ich behaupte: (+) aϕ ∈ 〈aψ〉. 

Hierzu. Man hat aϕ =a f und aψ = fa. 

Es gilt (Orthosymmetrie) Kern(af) = {v ∈ V | f(a, v) = 0} = {v ∈ V | f(v, a) = 0} = 

Kern(fa). Das vorige Korollar liefert µ ∈ K mit af = µ · fa, also (+). 

Aus (+) folgern wir mit 173, dass ϕ = λ · ψ für ein passendes λ ∈ K gilt. Das bedeutet 

af = λ · fa für jedes a ∈ V , also f(a, v) = λ · f(v, a) für alle a, v ∈ V . 

Falls es ein a ∈ V mit f(a, a) = 0 gibt, folgt λ = 1 und f ist symmetrisch. Andernfalls 

gilt f(a, a) = 0 für alle a ∈ V und dann aufgrund der folgenden Beobachtung auch 

f(a, b) = −f(b, a) für alle a, b ∈ V . 

Beobachtung 179 Sei f : V × V → K eine Bilinearform. Es gilt 

f(a + b, a + b) = f(a, a) + f(b, b) + f(a, b) + f(b, a) für alle a, b ∈ V . 

Beobachtung 180 Sei f : V × V → K eine Bilinearform, (e1, ..., en) eine Basis von V 

und F := (f(ei, ej)) die Gramsche Matrix von f bezüglich der Basis. 

Seien v = v1e1 + ... + vnen, w = w1e1 + ... + wnen ∈ V (wobei vi, wi ∈ K sind). Sei 

ˆv := (v1 v2 ... vn) ∈ K 1×n (1 × n-Matrix), ebenso ˆw. Dann gilt 

(∗) f(v, w) = ˆv F ˆw t 

Beweis. Man hat aufgrund der Bilinearität f(v, w) = 

(i,j) viwj · f(ei, ej) = 

 

j (i 

vif(ei, ej))wj. Es ist 

i vif(ei, ej) der j-te Eintrag der 1 × n-Matrix ˆvF . 

Durch die Gramsche Matrix bezüglich einer Basis ist die Bilinearform also eindeutig 

bestimmt, und man kann für beliebige Vektoren v, w leicht f(v, w) berechnen. 

Zusatz Die Bilinearform f ist genau dann symmetrisch, wenn F symmetrisch ist (d.h. 

F = F t ); f ist genau dann symplektisch, wenn F t = −F ist und alle Diagonalelemnte 

von F gleich 0 sind. 

Ergänzung Sei F ∈ K n×n und (e1, ..., en) eine Basis von V . Definiere f : V × V → K 

durch (*) in 180 (wobei wie dort v = v1e1 + ... + vnen, w = w1e1 + ... + wnen ∈ 

V ˆv := (v1 v2 ... vn) ∈ K 1×n ist). Dann ist f eine Bilinearform mit Gramscher Matrix 

F bezüglich der Basis (e1, ..., en). 

Wir können also zu jeder n × n Matrix und Basis (e1, ..., en) eine Bilinearform definieren.


Lemma 181 (Basiswechsel) Sei f : V × V → K eine Bilinearform. 

Sei (e1, ..., en) eine Basis von V und F := (f(ei, ej)) die Gramsche Matrix von f bezüglich 

dieser Basis. 

Sei (e ′ 1 , ..., e′ n) eine Basis von V und F ′ := (f(e ′ i , e′ j )) die Gramsche Matrix von f bezüglich 

dieser Basis. 

Sei C = (cij) die Matrix bezüglich der Basis (e1, ..., en) zur linearen Abbildung V → V mit 

ei ↦→ e ′ i 

(Übergangsmatrix), also 

Dann gilt F ′ = CF C t . 

e ′ i = ci1e1 + ... + cinen 

Beweis. Der i, j-Eintrag von F ′ ist f(ci1e1 + ... + cinen, cj1e1 + ... + cjnen). Das ist 

 

(k,s) cikf(ek, es)cjs = 

s (k 

cikf(ek, es))cjs. Nun ist 

k cikf(ek, es) der i, s-Eintrag 

der Matrix D := CF . Der i, j-Eintrag von F ′ ist also 

s discjs. Das ist der i, j-Eintrag 

von D · Ct = CF Ct . Also F ′ = CF Ct . 

Schreibweise Für einen Vektorraum V mit orthosymmetrischer Bilinearform und M ⊆ V 

setze M ⊥ := {v ∈ V | f(v, m) = 0 für jedes m ∈ M}. 

Stets ist M ⊥ ein Untervektorraum von V (auch wenn M kein Untervektorraum von V ist. 

Es gilt M ⊥ = 〈M〉 ⊥ . 

Lemma 182 Sei Sei f : V × V → K eine orthosymmetrische Bilinearform. 

Sei (e1, ..., en) eine Basis von V und F := (f((ei, ej)) die Gramsche Matrix von f bezüglich 

dieser Basis. 

Dann gilt dim(V ⊥ ) = n − Rang(F ). Insbesondere: V ⊥ = {0} trifft genau dann zu, wenn 

F vollen Rang n hat. 

Beweis. Für jedes a ∈ V sind folgende Aussagen äquivalent. 

(i) a ∈ V ⊥ 

(ii) f(ei, a) = 0 für alle i ∈ {1, ..., n}. 

Aussage (ii) bedeutet, dass der Koordinatenzeilenvektor â von a eine Lösung des linearen 

homogenen Gleichungssystems 

⎛ 

⎜ 

F · ⎜ 

⎝ 

x1 

. 

. 

xn 

⎞ ⎛ ⎞ 

0 

⎟ ⎜ ⎟ 

⎟ ⎜ 

⎟ ⎜ . 

⎟ 

⎟ = ⎜ ⎟ 

⎟ ⎜ 

⎠ ⎝ 

. ⎟ 

⎠ 

0 

ist. Die Dimension des Lösungsraums ist n − Rang(F ).


Definition 183 Sei f eine orthosymmetrische Bilinearform auf V . 

Ein Untervektorraum U von V heißt regulär (auch: nicht ausgeartet), wenn für sein Ra- 

dikal rad(U) := U ∩ U ⊥ gilt: rad(U) = {0}. 

Die Form f heißt regulär, wenn für rad(V ) = V ∩ V ⊥ = V ⊥ gilt rad(V ) = {0}. 

Satz 184 (Abspalten des Radikals) Sei f eine orthosymmetrische Bilinearform. Sei 

U ein Untervektorraum mit V = rad(V ) ⊕ U. Dann ist U ein regulärer Untervektorraum. 

Beweis. Sei u ∈ U ∩ U ⊥ . Jedes v ∈ V kann man schreiben als v = a + b, wobei a ∈ rad(V ) 

und b ∈ U ist. Dann gilt f(u, v) = f(u, a + b) = f(u, a) + f(u, b) = 0. Also folgt u ∈ 

U ∩ rad(V ) = {0}. 

Satz 185 Die orthosymmetrische Bilinearform f : V × V → K sei regulär und n := 

dim(V ) ∈ N. Sei U ein Untervektorraum. Dann ist dim(U) + dim(U ⊥ ) = n. 

Beweis. Wir wählen eine Basis (v1, ..., vk) von U und ergänzen diese zu einer Ba- 

sis (v1, ..., vk, vk+1, ..., vn) von V . Sei F := (f(vi, vj)) die zugehörige Gramsche Matrix 

(i, j ∈ {1, ..., n}). Sie ist nach 182 eine reguläre Matrix, d.h. ihr Rang ist n. 

Sei nun A die Matrix, welche nur aus den Zeilen 1, ..., k von F besteht. Sie hat den Rang 

k, da ihre Zeilen linear unabhängig sind. 

Für einen beliebigen Vektor v = λ1v1 + ...λnvn ∈ V gilt: 

(+) v ∈ U ⊥ ⇔ f(v, v1) = ... = f(v, vk) = 0. 

Die rechte Seite ist äquivalent zu 

A · λ t = 0 

wobei λ = (λ1...λn) ∈ K 1×n (1 × n-Matrix) ist. 

Anders gesagt: λ ist Lösung des durch A gegebenen linearen homogenen Gleichungssystem. 

Der Lösungsraum und damit U ⊥ hat die Dimension n − Rang(A) = n − k = n − dim(U). 

Korollar 186 Die orthosymmetrische Bilinearform f : V × V → K sei regulär und 

n := dim(V ) ∈ N. Sei U regulärer Untervektorraum. Dann gilt V = U ⊕ U ⊥ . 

Beweis. Nach dem vorigen Satz gilt nämlich dimU +dim(U ⊥ ) = n und nach Voraussetzung 

ist U ∩ U ⊥ = {0}. 

Schreibweise Wenn f eine orthosymmetrische Bilinearform auf V ist und U, W Unter- 

vektorräume sind mit U + W = U ⊕ W und U ⊥ W (soll heißen U ⊆ W ⊥ ), so schreiben 

wir dafür U○⊥ W .


Beobachtung 187 Sei f eine orthosymmetrische Bilinearform und V = U1○⊥ ...○⊥ Uk. 

Falls jedes Ui regulär ist, so ist V regulär. 

Falls V regulär ist, so ist jedes Ui regulär. 

Satz 188 (Struktur regulärer symplektischer Räume) Jeder 2-dimensionale re- 

guläre symplektische Vektorraum U hat eine Basis (a, b) mit f(a, b) = 1 = −f(b, a) und 

f(a, a) = 0 = f(b, b). 

Sei f eine reguläre symplektische Form auf dem endlichdimensionalen Vektorraum V . 

Dann gilt V = U1○⊥ ...○⊥ Uk für passende 2-dimensionale Untervektorräme. Insbesonde- 

re ist dimV gerade. 

Beweis. Wir beweisen die erste Behauptung. Wähle a ∈ U \ {0}. Da U regulär ist, gibt es 

b ∈ U mit f(a, b) = 0. Setze λ := f(a, b) −1 und ersetze b durch λb. Dann gilt f(a, b) = 1. 

Außerdem ist a, b) linear unabhängig, denn sonst wäre f(a, b) = 0. 

Nun zur ersten Behauptung. Induktion über n := dimV , mit trivialem Anfang n = 0. 

Sei jetzt n > 1. Wähle a ∈ V \ {0}. Wie eben finden wir b ∈ V mit f(a, b) = 1. Der 

Untervektorraum U1 := 〈a, b〉 ist regulär (denn die Gramsche Matrix bezüglich der 

Basis (a, b) ist regulär). Nach 186 gilt V = U1○⊥ U ⊥ 1 . Wegen 187 ist U ⊥ 1 regulär. Die 

Induktionsvoraussetzung liefert reguläre 2-dimensionale Untervektorräume U2, ..., Uk mit 

U ⊥ = U2○⊥ ...○⊥ Uk. Es folgt V = U1○⊥ ...○⊥ Uk. 

Korollar 189 Jeder reguläre endlichdimensionale symplektische Vektorraum hat eine Ba- 

sis, bezüglich der die Gramsche Matrix F = diag(S, ...., S) ist für 

 

0 1 

S := 

−1 0 

Im Gegensatz zu symplektischen Bilinearformen sind symmetrische Bilinearformen 

vielfältiger. 

Voraussetzung: Im folgenden sei f eine (nicht notwendig reguläre) symme- 

trische Bilinearform auf dem endlichdimensionalen K-Vektorraum V (K ein 

Körper). Außerdem gelte 2 = 1 + 1 = 0 in K. 

Beobachtung 190 (Formwertformel) Wir nennen q(v) := f(v, v) den Formwert von 

v ∈ V . Durch die Formwerte f(v, v) ist f festgelegt: 

2 · f(v, w) = q(v + w) − q(v) − q(w)


für alle v, w ∈ V . 

Definition 191 Man nennt (e1, ..., en) eine Orthogonalbasis von V , wenn das Tupel eine 

Basis von V ist und f(ei, ej) = 0 für alle i = j gilt. Wenn außerdem f(ei, ei) = 1 für alle 

i ∈ {1, ..., n} gilt, spricht man von einer Orthonormalbasis. 

Satz 192 Es gibt eine Orthogonalbasis. 

Beweis. Induktiv über dimV ≥ 1. 

Zunächst nehmen wir zusätzlich an: f ist regulär. 

Falls dimV = 1, V = 〈e〉, ist das 1-Tupel (e) eine Orthogonalbasis. Sei also n := dimV ≥ 2. 

Es gibt e1 ∈ V mit q(e1) = 0 (sonst wäre nach 190 f die ’Nullform’, d.h. f(v, w) = 0 

für alle v, w ∈ V und dann V = rad(V )). Dann ist U := 〈e1〉 ein regulärer Untervektor- 

raum und nach 186 V = U○⊥ U ⊥ . Wegen 187 ist U ⊥ ein regulärer Untervektorraum. 

Anwenden der Induktionsvoraussetzung auf U ⊥ (ausgerüstet mit f| U ⊥ ×U ⊥) liefert eine 

Orthogonalbasis (e2, ..., en) von U ⊥ . Dann ist (e1, e2, ..., en) eine Orthogonalbasis von V . 

Nun lassen wir die Voraussetzung ’ f regulär’ fallen. Wähle einen Untervektorraum W 

mit V = rad(V ) ⊕ W . Dann ist W (mit f|W ×W ) ein regulärer Untervektorraum (184) 

und nach dem schon Bewiesenen hat W eine Orthogonalbasis (e1, ..., ek). Man nehme eine 

beliebige Basis (ek+1, ..., en) von rad(V ). Dann ist (e1, ..., en) eine Orthogonalbasis von V . 

Anmerkung Die Gramsche Matrix der eben konstruierten Basis hat die Form 

diag(λ1, ..., λk, 0, 0, .., 0) mit λi ∈ K \ {0}. 

Falls f regulär ist, gilt k = dim(V ). 

Bemerkung Sei f regulär. Es gibt nicht immer eine Orthonormalbasis. Zum Beispiel 

wenn V = Q 2 ist und f bezüglich der Standardbasis durch die Gramsche Matrix diag(1, 2) 

gegeben ist, hat Q 2 keine Orthonormalbasis. (Jedoch, wenn man Q durch R ersetzt, gibt 

es eine Orthonormalbasis). 

Beobachtung 193 a) Sei V ein R-Vektorraum (und f nicht notwendig anisotrop). 

Dann hat V eine Orthogonalbasis mit f(ei, ei) ∈ {1, −1, 0}. Man findet also eine Basis 

mit Gramscher Matrix diag(1, ..., 1, −1, ..., −1, 0, ..., 0). 

Falls f sogar positiv definit ist, das bedeute q(v) > 0 für alle v ∈ V \ {0}, nennt man f 

ein Skalarprodukt. Dann hat V eine Orthonormalbasis. 

b) Wenn V ein C-Vektorraum ist, gibt es eine Orthogonalbasis mit f(ei, ei) ∈ {1, 0} für 

alle i.


Beweis. Man wähle gemäß 192 eine Orthogonalbasis (e1, ..., en). Ersetze nun ei durch 

( q(ei)) −1 · ei falls q(ei) > 0 und durch ( −q(ei)) −1 · ei falls q(ei) < 0 ist. 

Man findet also eine Basis mit Gramscher Matrix diag(1, ..., 1, −1, ..., −1, 0, ..., 0). 

Bezeichnung Wir nennen V, f anisotrop, wenn q(v) = 0 für alle v ∈ V \ {0} gilt. Dann 

ist insbesondere f regulär. 

Der Beweis zur Existenz einer Orthogonalbasis ist nicht konstruktiv. Im Fall einer aniso- 

tropen Form kann man jedoch eine Orthogonalbasis algorithmisch konstruieren: 

Beobachtung 194 (Orthogonalisierungsverfahren von E. Schmidt) Sei f aniso- 

trop und (v1, ..., vn) eine Basis von V . Der folgende Algorithmus liefert eine Orthogo- 

nalbasis (e1, ..., en) von V mit der Eigenschaft 

für k ∈ {1, ..., n}. 

Anfang e1 := v1 

〈{v1, ..., vk}〉 = 〈{e1, ..., ek}〉 

k + 1-ter Schritt Seien e1, ..., ek schon konstruiert und k < n. 

Setze ek+1 := vk+1 − k 

i=1 f(vk+1, ei) · q(ei) −1 ei. 

Die Behauptung ist offensichtlich. 

Zusatz Falls K = R ist und f positiv definit ist, kann man das Orthogonalisierungs- 

verfahren leicht erweitern, um eine Orthonormalbasis zu konstruieren: Man ersetze nach 

jedem Schritt den konstruierten Vektor ei durch ( q(ei)) −1 · ei. Die in der Anweisung 

des k + 1-ten Schritts erscheinenden Faktoren q(ei) sind dann 1. 

Beispiele 

1. Legendre-Polynome Sei W der Vektorraum aller stetiger Funktionen ϕ : [−1, 1] 

(reelles Intervall) → R, mit dem Skalarprodukt (positiv definite symmetrische Bilinearform) 

f(ϕ, ψ) := 1 

−1 t(ϕ · ψ)dt. 

W ist kein endlichdimensionaler Vektorraum. 

Seien ϕ0, ϕ1, ... ∈ W die ’Monomfunktionen’ tϕk := t k für k ∈ N0. Dann ist (ϕ0, ..., ϕk) 

für jedes k ∈ N0 ein linear unabhängiges k + 1-Tupel. 

Wir betrachten den 4-dimensionalen Untervektorraum V := 〈ϕ0, ..., ϕ3〉. 

Nach dem Orthogonalisierungsverfahren von E. Schmidt erhält man eine Orthonormalba- 

sis (ω0, ω1, ω2, ω3), wobei gilt 

ωo : t ↦→ 1 

√ 2 , ω1 : t ↦→ 

3 

2 t, ω2 : t ↦→ 

5 

2 (3 

2 t2 − 1 

2 ), ω3 : t ↦→ 

7 

2 (5 

2 t3 − 3 

2 t)


Das kann man statt für k = 4 für jedes k ∈ N treiben und erhält so das Orthonormalsy- 

stem der Legendre-Polynome (vgl. Courant-Hilbert: Methoden der Mathemat. Physik I, 

§8. Auch das folgende Orthonormalsystem wird dort beschrieben.) 

2. Trigonometrische Funktionen Sei W der Vektorraum aller stetigen Funktionen 

ϕ : [−π, π] (reelles Intervall) → R, mit dem Skalarprodukt (positiv definiter symmetrischer 

Bilinearform) f(ϕ, ψ) := π 

−π t(ϕ · ψ)dt. 

W ist kein endlichdimensionaler Vektorraum. 

Definiere ϕ0, ϕ1, ... ∈ W und ψ1, ψ2, ... durch 

ϕ0 

 

1 

: t ↦→ 

2π , ϕk : t ↦→ 1 

√ cos(kt), 

π 

ψk : t ↦→ 1 

√ sin(kt) 

π 

für k ∈ N. Diese Funktionen nennt man die normierten trigonometrischen Funktionen 

(vom Grad k). 

Für jedes m ∈ N0 ist (ϕ0, ϕ1, ψ1, ϕ2, ψ2, ..., ϕm, ψm) eine Orthonormalbasis des von den 

Vektoren des 2m + 1-Tupels erzeugten Untervektorraums von W . 

Beobachtung 195 Sei f anisotrop, n = dimV und seien (v1, ..., vn) Vektoren = 0 mit 

f(vi, vj) = 0 für alle i = j. Dann ist (v1, ..., vn) eine Orthogonalbasis von V . 

Beobachtung 196 (Allgemeiner Satz des Pythagoras) Für alle v, w ∈ V sind fol- 

gende Aussagen äquivalent. 

(i) q(v − w) = q(v) + q(w) 

(ii) f(v, w) = 0. 

Das folgt sofort aus der Formwertformel 190. 

Bemerkung 197 (Begriffe im affinen Raum) 

Zu einem Vektorraum V (über einem Schiefkörper und von beliebiger Dimension) definiert 

man den ’affinen Raum’ zu V . 

Wir brauchen hier nicht die exakte Definition (mehrere äquivalente Definitionen sind 

möglich) von ’affiner Raum zu V ’. 

Ein affiner Teilraum ist eine Menge der Form a + U, wobei a ∈ V ist und U ein 

Untervektorraum von V (a + U ist eine Nebenklasse nach der Untergruppe U der Gruppe 

V, +). 

Für affine Teilräume a + U, b + W gilt: a + U = b + W ⇔ a − b ∈ U = W . 

Falls U = {0} ist, gilt a + U = {a}, wofür man nur a schreibt. Dann nennt man a einen


Punkt des affinen Raums. Die Punktmenge des affinen Raums zu V ist also V . 

Wenn dimU = 1 ist, nennt man a + U eine affine Gerade: bei dimU = 2 eine affine Ebene. 

Nenne affine Teilräume a + U, b + W parallel, wenn U = W gilt. 

Nun ist V zusätzlich mit einer symmetrischen Bilinearform f : V × V → K versehen 

(und K ein Körper). 

Dann kann man für affine Teilräume a + U, b + W definieren: a + U ist senkrecht zu 

b + W , wenn U ⊥ W gilt, d.h. wenn f(u, w) = 0 für alle u ∈ U und w ∈ W gilt. 

Nun sei K = R und f ein Skalarprodukt (d.h. f positiv definit). Dann ist die Abbildung 

|..| : V × V → R≥0, v ↦→ |v| := f(v, v) eine ’Normfunktion’, d.h. es gilt |λv| = |λ| · |v| 

für alle λ ∈ R und v ∈ V (dabei bezeichnet |λ| den Absolutbetrag der reellen Zahl λ). 

Für a, b ∈ V nenne d(a, b) := |a − b| den (durch f gegebenen) Abstand von a zu b. 

Mit dieser Abstandsfunktion d ist V ein metrischer Raum (im Sinne der Analysis: d ist 

symmetrisch und erfüllt die Dreiecksungleichung; und d(a, b) = 0 gilt genau dann, wenn 

a = b zutrifft). 

Im folgenden sei V ein endlichdimensionaler K-Vektorraum (K ein Körper) 

und f : V × V → K eine reguläre symmetrische Bilinearform. 

Lemma 198 (Fußpunktlemma) Sei U ein regulärer Untervektorraum von V und b ∈ 

V . Dann gibt es genau ein u ∈ U mit b − u ∈ U ⊥ . Wir nennen u den Lotfußpunkt von b 

auf U. 

Falls b ∈ U ist, existiert genau eine affine Gerade durch b, die zum affinen Teilraum U 

senkrecht ist und U schneidet (’Lotgerade’ von b auf U); nämlich die Gerade b + 〈b − u〉. 

Beweis. Da f und U regulär sind, gilt nach 186 V = U○⊥ U ⊥ . Deshalb gibt es u ∈ U und 

z ∈ U ⊥ mit b = u + z, und es folgt z = b − u ∈ U ⊥ . Dabei ist u (wegen ○⊥ ) eindeutig. 

Wenn b ∈ V \ U ist, so hat die (affine) Gerade b + 〈b − u〉 die genannten Eigenschaften. 

Nun sei Γ eine Gerade mit den genannten Eigenschaften. Nach Voraussetzung gibt es 

u ′ ∈ Γ ∩ U. Es folgt Γ = b + 〈b − u ′ 〉. Nach Voraussetzung ist der affine Teilraum U zu Γ 

senkrecht. Das bedeutet, b − u ′ ∈ U ⊥ . Also gilt b = (b − u) + u = (b − u ′ ) + u ′ ∈ U ⊥ ⊕ U. 

Es folgt u ′ = u. 

Bemerkung 199 (Praktische Berechnung des Fußpunkts)


Seien U ein regulärer Untervektorraum von V und b ∈ V . Sei (e1, ..., ek) eine Orthogonal- 

basis von U. Dann ist 

der Fußpunkt von b auf U. 

u = α1e1 + ... + αkek mit αi := f(b, ei) · q(ei) −1 

Spezialfall: Wenn U = 〈a〉 1-dimensional ist, hat man u = f(b, a) · q(a) −1 · a. 

Lemma 200 (Optimierungslemma) Sei K = R und f positiv definit. Mit d bezeichnen 

wir die durch f definierte Abstandsfunktion (siehe 197). 

Sei U ein Untervektorraum = {0} von V und b ∈ V und u der Lotfußpunkt von b auf U. 

Dann gilt 

d(b, u) < d(b, w) 

für alle w ∈ U \ {u}. In Worten: Der Lotfußpunkt liegt näher an b als alle anderen Punkte 

von U. 

Beweis. Sei w ∈ U \{u}. Wegen w−u ∈ U ist f(b−u, w−u) = 0. Der Satz von Pythagoras 

196 liefert q(b−w) = q((b−u)−(w−u)) = q(b−u)+q(w−u) > q(b−u), weil q(w−u) > 0 ist. 

Anwendungen des Optimierungslemmas 

1. Approximation durch Polynome 

Sei b : [−1, 1] → R eine stetige Abbildung. 

Problem Finde u ∈ R[x] mit Grad(u) ≤ 3 derart, dass die quadratische Abweichung 

der Polynomfunktion (von u) zu b möglichst klein ist: 

1 

−1 

t(b − u) 2 dt 

soll möglichst klein sein, wobei zur Konkurrenz alle Polynome u vom Grad ≤ 3 zugelassen 

sind. 

Lösung Sei V, f der Vektorraum der stetigen Abbildungen [−1, 1] → R mit dem Skalarprodukt 

f(ϕ, ψ) := 1 

−1 t(ϕ · ψ)dt. 

Das zugehörige Abstandsquadrat von c, d ∈ V ist ’die quadratische Abweichung im Mittel’ 

f(c − d, c − d) := 1 

−1 t(c − d)2 dt. Nun ist U := {r | r ist Polynomfunktion vom Grad ≤ 

3} ein Untervektorraum. Oben haben wir eine Orthonormalbasis (ω0, ω1, ..., ω3) (die 

Legendre-Polynome) von U berechnet.


Setze V ′ := U + 〈b〉 (der von U ∪ {b} in V erzeugte Untervektorraum). Dann ist V ′ end- 

lichdimensional (da von 5 Elementen erzeugt). In V ′ wenden wir das Optimierungslemma 

an: der Fußpunkt u von b auf U ist die (einzige) Lösung unseres Problems. 

Nach 199 gilt u = α0ω0 + ... + α3ω3, wobei 

gilt (man beachte q(ωi) = 1). 

αi = f(b, ωi) = 

1 

−1 

t(b · ω)dt 

2. Approximation durch trigonometrische Funktionen 

Da die trigonometrischen Funktionen periodisch sind, approximiert man gerne periodische 

Funktionen durch Summen von trigonometrischen Funktionen. 

Wir verfahren wie in 1., jedoch sei V, f der Vektorraum der stetigen Abbildungen 

[−π, π] → R mi dem Skalarprodukt f(ϕ, ψ) := π 

−π t(ϕ · ψ)dt. 

Sei b : [−π, π] → R eine stetige Abbildung. 

Problem Sei m ∈ N0. Finde eine ’harmonische Summe’ u vom Grad m, d.h. eine 

Abbildung der Form 

u : [−π, π] → R, t ↦→ a0 + a1 · cos(t) + b1 · sin(t) + ... + am · cos(mt) + bm · sin(mt) 

(wobei ai, bi ∈ R erlaubt ist) derart, dass die quadratische Abweichung von u zu b im 

Mittel möglichst klein ist. 

Lösung U := {r | r ist eine harmonische Summe vom Grad ≤ m} ist ein Untervek- 

torraum von V . Oben haben wir eine Orthonormalbasis (ϕ0, ϕ1, ψ1..., ϕm, ψm) (bestehend 

aus den trigonometrischen Funktionen vom Grad ≤ m) von U berechnet. 

Setze V ′ := U + 〈b〉 (der von U ∪ {b} in V erzeugte Untervektorraum). Dann ist V ′ end- 

lichdimensional. In V ′ wenden wir das Optimierungslemma an: der Fußpunkt u von b auf 

U ist die (einzige) Lösung unseres Problems. 

Nach 199 gilt u = α0ϕ0 + α1ϕ1 + β1ψ1 + ... + αmϕm + βmψm, wobei 

gilt. 

Man erhält 

αi = f(b, ϕi) = 

a0 = a0 · 1 = α0 · 

π 

−π 

t(b · ϕi)dt, und βi = f(b, ψi) = 

 

1 

2π = 

 

1 

2π · 

π 

−π 

π 

 

1 

1 

· b(t) dt = 

2π 2π 

−π 

t(b · ψi)dt 

π 

−π 

b(t) dt


und analog für k ∈ N 

π 

ak = 1 

√ αk = 

π 1 

π −π 

bk = 1 

√ βk = 

π 1 

π 

π −π 

b(t) · cos(kt) dt 

b(t) · sin(kt) dt 

Bemerkung Das ’Fußpunktlemma’ und das ’Optimierungslemma’ wurden für endlich- 

dimensionale Vektorräume bewiesen. Man kann die Lemmata verallgemeinern auf eine 

wichtige Klasse auch unendlichdimensionaler R -Vektorräume; nämlich Vektorräme, die 

eine positiv definite symmetrische Bilinearform tragen derart, dass sie bezüglich der 

Abstandsfunktion vollständig sind (Hilbert-Räume). Wenn U ein abgeschlossener Unter- 

vektorraum eines Hilbert-Raums V ist, gilt die entscheidende Eigenschaft V = U ⊕ U ⊥ . 

In 1. und 2. erhält man eine Reihe (eine Potenzreihe bzw. die Fourierreihe zu b), da man 

die Approximation für beliebigen Grad m ausführen kann. Das Konvergenzverhalten der 

Reihe wird in der Analysis untersucht. Statt des Vektorraums der stetigen Funktionen 

kann man umfassendere Vektorräume zulassen. Das bedingt aber technische Erörterungen, 

die wir hier vermeiden wollen. 

Im folgenden sei V ein endlichdimensionaler Vektorraum über einem Körper 

K mit 2 = 0 und f : V × V → K eine symmetrische Bilinearform. 

Bemerkung 201 (Quadratklassen) 

K \ {0}, · ist eine kommutative Gruppe (Einheitengruppe von K), und die Menge der 

Quadrate = 0, also (K \ {0}) 2 := {λ 2 | λ ∈ K \ {0}}, ist eine Untergruppe. 

Jede Nebenklasse nach dieser Untergruppe nennt man eine Quadratklasse. Die α ∈ K \{0} 

enthaltende Quadratklasse ist also α · (K \ {0}) 2 = (K \ {0}) 2 · α = {αλ 2 | λ ∈ K \ {0}}. 

Die Menge aller Quadratklassen ist eine Klasseneinteilung (Partition) von K \ {0}. 

Genau dann liegen α, β ∈ K \ {0} in der gleichen Klasse, wenn β = α · λ 2 für ein 

λ ∈ K \ {0} gilt. 

Zusätzlich wird {0} als eine Quadratklasse angesehen. 

Lemma 202 (und Definition der Diskriminante) Wenn U ein Untervektorraum 

von V ist und wenn F und F ′ die Gramschen Matrizen von f|U×U bezüglich zweier Basen 

sind, so liegen detF und detF ′ in der gleichen Quadratklasse.


Man kann deshalb definieren: die Quadratklasse dU := (detF ) · (K \ {0}) 2 ) heißt die 

Diskriminante von U. 

Das folgt sofort aus 181, angewendet auf U und f|U×U anstelle von V und f. 

Offenbar gilt dU = 0 genau dann, wenn U nicht regulär ist (d.h. rad(U) = {0}). 

Satz 203 (Kennzeichnung hyperbolischer Ebenen) Sei U ein 2-dimensionaler re- 

gulärer Untervektorraum von V . Folgende Aussagen sind äquivalent. 

(i) U hat eine Orthogonalbasis (e1, e2) mit f(e1, e1) = 1 und f(e2, e2) = −1. 

(ii) U hat eine Basis (a, b) mit f(a, a) = 0 = f(b, b) und f(a, b) = 1. 

(iii) Es gibt einen isotropen Vektor a ∈ U \ {0}. 

(iv) Die Diskriminante von U ist dU = (−1) · (K \ {0}) 2 . 

Beweis. 

(ii) ⇒ (i): Setze e1 := a + 1 

2 b und e2 := a − 1 

2 b. 

(i) ⇒ (iv): offensichtlich. 

(iv) ⇒ (iii): Nach 192 hat U eine Orthogonalbasis (e1, e2). Wegen f(e1, e1) · f(e2, e2) ∈ 

dU = (−1) · (K \ {0}) 2 gilt f(e1, e1) · f(e2, e2) = −λ 2 für ein λ ∈ K \ {0}. Setze 

µ := λ/f(e2, e2). Für a := e1 + µe2 ist dann a ∈ U und a isotrop. 

(iii) ⇒ (ii): Sei a ∈ U \ {0} isotrop. Da U regulär ist, gilt a ∈ rad(U). Das heißt, 

es gibt c ∈ U mit f(a, c) = 0. Dann ist b := µa + c isotrop für µ := − f(c,c) 

2f(a,c) und 

f(a, b) = f(a, c) = 0. Ersetze b durch 1 

f(a,b) b. Dann sind a ∈ U und b ∈ U isotrop und 

f(a, b) = 1. 

Definition 204 Eine hyperbolische Ebene ist ein regulärer 2-dimensionaler Untervektor- 

raum mit den im vorigen Satz genannten äquivalenten Eigenschaften. 

Nenne einen Untervektorraum U von V anisotrop, wenn f(u, u) = 0 für alle u ∈ U \ {0} 

gilt. 

Ein Untervektorraum U heißt totalisotrop, wenn U ⊆ U ⊥ gilt, d.h. f|U×U ist die Nullform. 

Satz 205 (Zerlegungssatz von Witt, Definition des Witt-Index) Sei V regulär. 

Es gibt eine orthogonale Zerlegung 

(∗) V = U○⊥ H1○⊥ ...○⊥ Hk 

wobei die Hi hyperbolische Ebenen sind und U ein anisotroper Untervektorraum. 

Die Anzahl k der vorkommenden hyperbolischen Ebenen ist in jeder ’Witt-Zerlegung’


(d.h. Zerlegung der Form (*)) gleich. Man nennt k den Witt-Index. 

Jeder totalisotrope Untervektorraum W von V liegt in einem k-dimensionalen totalisotro- 

pen Untervektorraum. Es gibt keinen k +1-dimensionalen totalisotropen Untervektorraum. 

Insbesondere gilt dim(W ) ≤ 1 

2dim(V ) für jeden totalisotropen Untervektorraum W . 

Beweis. 

(a) Existenz einer Witt-Zerlegung. 

Beweis durch Induktion über dimV , mit trivialem Anfang V = {0}. Sei V = {0}. Falls V 

keinen isotropen Vektor = 0 enthält, setze U := V , k = 0. 

Nun gebe es a ∈ V \ {0} mit f(a, a) = 0. Nach Üb.aufgabe 29 existiert ein re- 

gulärer 2-dimensionaler Untervektorraum H1 mit a ∈ H1. H1 ist eine hyperbo- 

lische Ebene (Eigenschaft (iii) oben). Es gilt V = H1○⊥ H ⊥ 1 , und H⊥ 1 ist re- 

gulär. Anwenden der Ind.voraussetzung auf H ⊥ 1 liefert hyperbolische Ebenen und 

einen anisotropen Untervektorraum U mit H ⊥ 1 = U○⊥ H2○⊥ ...○⊥ Hk. Es folgt 

V = H1○⊥ U○⊥ H2○⊥ ...○⊥ Hk = V = U○⊥ H1○⊥ ...○⊥ Hk. 

(b) Es liege eine Witt-Zerlegung (*) vor. Behauptung: Es gibt einen k-dimensionalen 

totalisotropen Untervektorraum, der maximal ist. 

Zum Beweis wählen wir für jedes Hi eine Basis (ai, bi) gemäß (ii) in 203. Offenbar ist 

〈a1, ..., ak〉 ein k-dimensionaler totalisotroper Untervektorraum (auch 〈b1, ..., bk〉). 

Behauptung: Er ist maximal. 

Sonst gäbe es ein v ∈ V derart, dass (a1, ..., ak, v) linear unabhängig und 〈a1, ..., ak, v〉 

totalisotrop ist. Wir schreiben v = u + h1 + ... + hk, wobei u ∈ U und hi ∈ Hi gilt. 

Wegen v ∈ a ⊥ 1 = U○⊥ 〈a1〉○⊥ H2○⊥ ...○⊥ Hk folgt h1 ∈ 〈a1〉; ebenso hi ∈ 〈ai〉 für alle 

i ∈ 〈1, ..., k}. Deshalb und wegen f(v, v) = 0 folgt f(u, u) = 0, also (da U anisotrop ist) 

u = 0. Damit haben wir den Widerspruch v ∈ 〈a1, ..., ak〉. 

(c) Sei (a1, ..., ak) linear unabhängig und 〈a1, ..., ak〉 totalisotrop. Behauptung: Es 

gibt Vektoren b1, ..., bk ∈ V derart dass 〈ai, bi〉 hyperbolische Ebenen sind und 

〈a1, b1〉 + ... + 〈ak, bk〉 = 〈a1, b1〉○⊥ ...○⊥ 〈ak, bk〉 gilt. 

Beweis induktiv über k. Es gilt a ⊥ 2 ∩ ... ∩ a⊥ k = 〈a2, ...., ak〉 ⊥ ⊆ a ⊥ 1 

. Denn aus 

〈a2, ...., ak〉 ⊥ ⊆ a ⊥ 1 folgt durch Anwenden der Operation ⊥ auf beide Seiten (und den 

Regeln (Z ⊥ ) ⊥ = Z für jeden Untervektorraum Z sowie: Z1 ⊆ Z2 ⇒ Z ⊥ 1 ⊇ Z⊥ 2 

) der 

Widerspruch 〈a2, ...., ak〉 ⊇ 〈a1〉. Wir können also b1 ∈ 〈a2, ...., ak〉 ⊥ mit b1 ∈ a ⊥ 1 wählen. 

H := 〈a1, b1〉 ist eine hyperbolische Ebene (denn die Determinante der Gramschen Matrix 

bezüglich der Basis (a1, b1) ist −f(a1, b1) 2 ∈ −1 · (K \ {0}) 2 ; wende (iv) in 203 an).


Nun ist 〈a2, ..., ak〉 ein totalisotroper Untervektorraum des regulären Untervektorraums 

H ⊥ . Per Induktionsannahme finden wir Vektoren b2, ..., bk ∈ H ⊥ derart, dass gilt 〈ai, bi〉 

hyperbolische Ebenen sind und 〈a2, b2〉 + ... + 〈ak, bk〉 = 〈a2, b2〉○⊥ ...○⊥ 〈ak, bk〉 gilt. Es 

folgt 〈a1, b1〉 + ... + 〈ak, bk〉 = 〈a1, b1〉○⊥ ...○⊥ 〈ak, bk〉. 

(d) Sei W ein maximaler (bezüglich ⊆) totalisotroper Untervektorraum von V und 

(a1, ..., ak) eine Basis von W . Dann gibt es eine Witt-Zerlegung (*) (mit k = dimW ) und 

ai ∈ Hi für alle i ∈ {1, ..., k}. 

Beweis. Zunächst gibt es nach c) hyperbolische Ebenen Hi mit H1 + ... + Hk = 

H1○⊥ ...○⊥ Hk und ai ∈ Hi. Setze U := (H1 + ... + Hk) ⊥ . Dann hat man 

V = H1○⊥ ....○⊥ Hk○⊥ U, denn H1○⊥ ...○⊥ Hk ist regulär. Wir behaupten: U ist 

ansiotrop. 

Angenommen, es gibt u ∈ U \ {0} mit f(u, u) = 0. Dann ist 〈a1, ..., ak, u〉 totalisotrop 

und W ist in diesem Untervektorraum (wegen u ∈ W ⊆ H1 + ... + Hk) echt enthalten. 

Das widerspricht der Annahme, dass W ein maximaler totalisotroper Untervektorraum ist. 

(e) Je zwei Witt-Zerlegungen (*) haben die gleiche Anzahl k von hyperbolischen Ebenen. 

Den Beweis zu (e) lassen wir weg. 

Satz 206 (Trägheitssatz von Sylvester) Sei V = {0} ein endlichdimensionaler R- 

Vektorraum und f : V × V → R eine reguläre symmetrische Bilinearform. 

Für eine Orthogonalbasis (e1, ..., en) sei s+ := |{i ∈ {1, ..., n} | q(ei) > 0}| (positive 

Signatur der Orthogonalbasis, mit q(v) := f(v, v)) und s− := |{i ∈ {1, ..., n} | q(ei) < 0}| 

(negative Signatur der Orthogonalbasis). 

Behauptung: s+ und s− sind unabhängig von der gewählten Orthogonalbasis. Es ist k := 

min{s+, s−} der Witt-Index von V, f. 

Beweis. Wir wählen die Reihenfolge der e1 so, dass q(e1) > 0, q(e2) < 0, ...., q(e2k−1) > 

0, q(e2k) < 0 gilt und außerdem: 

(+) q(e2k+1), ..., q(en) > 0 oder (-) q(e2k+1), ..., q(en) < 0. 

Dann sind H1 := 〈e1, e2〉, ..., Hk := 〈e2k−1, e2k〉 paarweise senkrechte hyperbolische 

Ebenen (denn dHi = (−1)(R \ {0}) 2 ) und U := 〈e2k+1, ..., en〉 ist anisotrop. Also ist 

V = H1○⊥ ...○⊥ Hk○⊥ U eine Witt-Zerlegung von V und k der Witt-Index. Insbesondere 

ist k unabhängig von der gewählten Orthogonalbasis. 

Im Fall (+) und k < 1 

2dimV enthält V offenbar einen Untervektorraum S mit 

dimS > 1 

2dimV , auf dem f positiv definit ist (nämlich der von allen ei mit q(ei) > 0 

aufgespannte Untervektorraum). Im Fall (-) und k < 1 

2dimV enthält V offenbar einen


Untervektorraum T mit dimT > 1 

2dimV , auf dem f negativ definit ist (nämlich der von 

allen ei mit q(ei) < 0 aufgespannte Untervektorraum). Beide Fälle können nicht simultan 

vorkommen, denn sonst wäre S ∩ T = {0} und f auf S ∩ T sowohl positiv als negativ 

definit. Also tritt (falls k < 1 

2dimV ) bei jeder Orthogonalbasis der Fall (+) auf, oder bei 

jeder Orthogonalbasis der Fall (-). Im ersten Fall hat man k + (n − 2k) = n − k ’positive’ 

Vektoren in jeder Orthogonalbasis; im zweiten Fall n − k ’negative’ Vektoren in jeder 

Orthogonalbasis. 

Wir erinnern daran, dass man in der Situation des vorigen Satz für jeden Vektor e einer 

Orthogonalbasis durch Multiplikation mit einem Faktor erreichen kann q(e) = 1 oder −1. 

Orthogonale Gruppen 

Lemma 207 (Kennzeichnung orthogonaler Abbildungen) Sei f regulär und ϕ : 

V → V eine lineare Abbildung. Für v ∈ V setze q(v) := f(v, v). 

Folgende Aussagen sind äquivalent. 

(i) q(aϕ − bϕ) = q(a − b) für alle a, b ∈ V 

(ii) q(vϕ) = q(v) für alle v ∈ V 

(iii) f(aϕ, bϕ) = f(a, b) für alle a, b ∈ V 

(iv) Es gibt eine Basis e1, ..., en von V mit f(eiϕ, ejϕ) = f(ei, ej) für alle i, j. 

(v) Es gibt eine Basis e1, ..., en von V mit F = AF A t , wobei A die Matrix zu ϕ und F die 

Gramsche Matrix (bezüglich (e1, ..., en)) bezeichnet. 

(vi) Für jede Basis e1, ..., en von V gilt F = AF A t , wobei A die Matrix zu ϕ und F die 

Gramsche Matrix (bezüglich der Basis) bezeichnet. 

Zusatz Wenn ϕ eine (und dann alle) der genannten Eigenschaften hat, folgt ϕ ∈ GL(V ); 

genauer: det(ϕ) = 1 oder −1. 

Beweis. (i) ⇔ (ii) ist klar. 

(iii) ⇒ (ii) durch Spezialisierung. 

(iii) ⇒ (iv): durch Spezialisierung. 

(iv) ⇒ (iii): Schreibe a = λ1e1 + ... + λnen und b = µ1e1 + ... + µnen (mit λi, µi ∈ K) und 

benutze die Linearität von ϕ und f. 

(ii) ⇒ (iii): Benutze 190: 

2f(aϕ, bϕ) = q((a + b)ϕ) − q(aϕ) − q(bϕ) = q(a + b) − q(a) − q(b) = 2f(a, b) 

(iv) ⇔ (v): 

Sei A die Matrix zur linearen Abbildung ϕ bezüglich einer Basis e1, ..., en von V ; sei F die


Gramsche Matrix von f bezüglich dieser Basis. Also 

F = (f(ei, ej)) und eiϕ = 

j aijej. Wie in 181 berechnet man (f(eiϕ, ejϕ)) = AF A t . 

Deshalb ist (iv) zu (v) äquivalent (A t bezeichnet die zu A transponierte Matrix). 

Aus (iii) folgt (vi) (wie (iv)⇒(v)). Aus (vi) folgt (v). 

Der Determinantenmultiplikationssatz und det(A) = det(A t ) liefern aus (v) außerdem 

det(F ) = det(F )(det(A)) 2 . 

Da f regulär ist, gilt det(F ) = 0. Folglich ist detA = 1 oder −1. 

Damit haben wir auch den Zusatz bewiesen. 

Definition 208 Sei f regulär. Man nennt 

O(V, f) := {ϕ ∈ GL(V, f) | f(ϕ(a), ϕ(b)) = f(a, b) für alle a, b ∈ V } 

die orthogonale Gruppe zu V, f und ihre Elemente orthogonale Abbildungen. 

Die Untergruppe SO(V, f) := {ϕ ∈ O(V, f) | det(ϕ) = 1 } heißt spezielle orthogonale 

Gruppe. 

Beobachtung 209 Sei f regulär, V = {0}. Die spezielle orthogonale Gruppe SO(V, f) 

ist eine Untergruppe vom in O(V, f) mit genau zwei Nebenklassen: die eine ist SO(V, f), 

die andere besteht aus den orthogonalen Abbildungen mit Determinante -1. 

Die (in den Übungen eingeführten) Symmetrien haben Determinante -1. 

Erinnerung (Wir konservieren die Annahme 2 = 0 in K.) 

Für eine lineare Abbildung ϕ : V → V nennen wir B(ϕ) := V (ϕ − 1) die Bahn und 

F(ϕ) := Kern(ϕ − 1) (Eigenraum zum Eigenwert 1) den Fixraum von ϕ. 

B(ϕ) und F(ϕ) sind ϕ-Moduln. 

Stets gilt dimF(ϕ) + dimB(ϕ) = dim(V ). 

Genau dann ist ϕ 2 = 1 (man sagt: ϕ ist eine Involution), wenn B(ϕ) = N(ϕ) := Kern(ϕ+1) 

zutrifft, d.h. die Bahn ist der Negativraum von ϕ. In diesem Fall gilt V = F(ϕ) ⊕ B(ϕ). 

Wenn ϕ ∈ GL(V ) und dimB(ϕ) = 1 ist, nennt man ϕ eine einfache Abbildung. 

Lemma 210 (über orthogonale Involutionen) a) Wenn V = U ⊕ W gilt, ist die li- 

neare Abbildung ρ := −1U ⊕ 1W involutorisch, d.h. ρ 2 = 1V . 

Jede involutorische Abbildung ρ ∈ GL(V ) hat diese Form (mit passender Zerlegung 

V = U ⊕ W ). 

b) Sei f regulär. Sei U ein regulärer Untervektorraum. Dann gilt V = U○⊥ U ⊥ , und die 

lineare Abbildung ρ mit ρ|U = −1U und ρ| U ⊥ = 1 U ⊥ ist eine involutorische orthogonale 

Abbildung. 

Jede involutorische orthogonale Abbildung hat diese Form.


Wenn in b) U = {0} ist, hat man ρ = 1V ; für U = V hat man ρ = −1V . 

Wenn dim U = 1 ist, also U =< a > für einen ansiotropen Vektor a, dann ist σa := σ 〈a〉 := 

ρ die Symmetrie längs < a > (längs a), auch die Spiegelung an der Hyperebene a ⊥ des 

Vektorraums V genannt. 

Satz 211 Sei f regulär und ϕ ∈ O(V, f). Dann gilt B(ϕ) ⊥ = F(ϕ). 

Lemma 212 (einfache orthogonale Abbildungen) Sei f regulär. Die einfachen or- 

thogonalen Abbildungen sind genau die Symmetrien. 

Beweis. Die Symmetrie σ erfüllt B(σ) =< a > und ist deshalb eine einfache 

Abbildung. 

Umgekehrt sei σ eine einfache orthogonale Abbildung. Dann ist B(σ) =< a > und 

a = v(σ − 1) für ein v ∈ V und a = 0. 

Es folgt v ∈ F(σ) = B(σ) ⊥ = a ⊥ (siehe oben) und deshalb 

0 = 2f(a, v) = 2f(v(σ − 1), v) = 2f(vσ, v) − 2f(v, v) = 2f(vσ, v) − f(v, v) − f(vσ, vσ) = 

−f(a, a). 

Also ist a anisotrop und man hat V =< a > ○⊥ a ⊥ =< a > ○⊥ F(σ). 

Wegen aσ ∈ (B(σ))σ ⊆ B(σ) =< a > gilt aσ = λa für ein λ ∈ K. Mit q(aσ) = q(a) = 0 

folgt λ = 1 oder −1. Bei λ = 1 wäre σ = 1V . Also gilt λ = −1 und damit σ = −1 ⊕1 a ⊥. 

Satz 213 Sei f regulär. Die orthogonale Gruppe O(V, f) wird von der Menge ihrer 

Symmetrien erzeugt. 

Genauer gilt (der Satz von Peter Scherk): 

Sei ϕ ∈ O(V, f) und k := dimB(ϕ) die Bahndimension von ϕ. 

Dann existieren Symmetrien σ1, ..., σk mit ϕ = σ1 · ... · σk; und ϕ ist nicht Produkt von 

weniger als k Symmetrien. 

Ausnahme: Wenn B(ϕ) = {0} totalsiotrop ist, braucht man k + 2 Symmetrien. 

Insbesondere ist jede orthogonale Abbildung Produkt von höchstes n = dim(V ) Symmetrien 

(es gilt dimU ≤ 1 

2n für totalsiotrope Untervektorräume). 

Die orthogonalen Abbildungen mit Determinante 1 sind Produkte einer geraden Anzahl 

von Symmetrien; die orthogonalen Abbildungen mit Determinante -1 sind Produkte einer 

ungeraden Anzahl von Spiegelungen. 

Beweis unter der Zusatzannahme: f ist anisotrop. (Dann kann der Fall totalisotroper 

Bahn nicht vorkommen).


Vorbemerkung. Aus dem 

’Bahnenlemma’ B(πϕ) ⊆ B(π) + B(ϕ) (Übungsaufgabe) 

folgt: Eine lineare Abbildung mit Bahndimension k kann man nicht als Produkt von 

weniger als k einfachen Abbildungen schreiben. 

(denn wenn ϕ = σ1 · ... · σs ist, liefert das ’Bahnenlemma’ B(ϕ) ⊆ B(σ1) + ... + B(σs); also 

bei dimB(σi) = 1 die Abschätzung dimB(ϕ) ≤ s.) 

Induktion über dimB(ϕ). 

Sei also ϕ ∈ O(V, f) und k := dimB(ϕ). 

Falls k = 0 gilt ϕ = 1V und man hat nichts zu zeigen. 

Sei k ≥ 1. Wähle v ∈ V \F(ϕ) und setze a := v(ϕ−1). Dann ist a = 0 und (Voraussetzung) 

a anisotrop. Deshalb ist die Symmetrie σa wohldefiniert. 

Setze ψ := ϕσa. Man hat f(a, vϕ + v) = 0 und deshalb 

(2v)ψ = (2v)ϕσa = (a + (vϕ + v))σa = −a + (vϕ + v) = 2v, also v ∈ F(ψ). 

Wegen B(σa) =< a > ⊆ B(ϕ) folgt nach 211 und ⊥-Anwenden: F(σa) ⊇ F(ϕ). 

Deshalb folgt F(ψ) ⊇ (F(ϕ) ∩ F(σa))⊕ < v >= F(ϕ)⊕ < v > ⊃ F(ϕ) (echte Inklusion). 

Deshalb ist dimB(ψ) < dimB(ϕ) = k. 

Per Induktionsannahme ist ψ ein Produkt von höchstens k − 1 Symmetrien und deshalb 

ϕ = ψσa ein Produkt von höchstens k Symmetrien. 

Nach der Vorbemerkung kann ϕ nicht ein Produkt von weniger als k Symmetrien sein. 

Deshalb ist ϕ ein Produkt von genau k Symmetrien.

11 KLASSIFIKATION LINEARER ABBILDUNGEN, NORMALFORMEN 140 

11 Klassifikation linearer Abbildungen, Normalformen 

Gegeben sei ein endlichdimensionaler Vektorraum V = {0} über einem Körper K. 

Ziel ist (grob gesagt) die sinnvolle Einteilung aller linearen Abbildungen ϕ : V → V in 

Klassen derart, dass jede Klasse genau einen besonders einfachen Vertreter (’Normalform’) 

enthält. 

Wie schon bei Eigenwerten und Diagonalisierbarkeit spielt der Polynomring K[x] dabei 

eine wichtige Rolle. Wir brauchen noch die Begriffe irreduzibles Element und Primelement 

und wollen V als K[x]-Modul betrachten. 

Sei R ein (kommutativer) Integritätsbereich mit 1-Element = 0. 

Wir haben die Relation ’teilt’, | , definiert. 

Für a, b ∈ R nennt man a assoziiert zu b, wenn a|b und b|a gilt. 

Das ist genau dann der Fall, wenn es eine Einheit e ∈ R gibt mit a = be. 

Wir wissen, dass sich assoziierte Elemente a, b ∈ R in Hinblick auf das Teilen nicht 

unterscheiden: 

Wenn a, a ′ , b, b ′ ∈ R sind und a assoziiert a ′ sowie b assoziiert b ′ ist, so gilt: a|b ist 

äquivalent zu a ′ |b ′ . 

Für jedes a ∈ R gilt: jede Einheit von R und jedes zu a assoziierte Element teilt a. Diese 

Teiler nennt man die trivialen Teiler von a. 

Definition 214 (i) Man nennt p ∈ R ein irreduzibles (unzerlegbares) Element, wenn p 

keine Einheit ist und p = 0 und gilt: 

p hat nur die ’trivialen Teiler’, d.h. aus a ∈ R und a|p folgt: a ist eine Einheit, oder a ist 

assoziiert zu p. 

Anders formuliert: Wenn p = ab ist, so folgt: a oder b ist eine Einheit. 

(p) Man nennt p ∈ R ein Primelement (prim), wenn p keine Einheit ist und p = 0 und 

gilt: 

Aus p|ab folgt p|a oder p|b, für alle a, b ∈ R. 

(M) Ein R-(Rechts-)Modul ist eine abelsche Gruppe M, + zusammen mit einer Abbildung 

· (Skalarmultiplikation) : M × R → M derart, dass gilt: 

v(p + q) = vp + vq und v(pq) = (vp)q und v · 1 = v für alle p, q ∈ R und v ∈ M. 

Die Definition eines R-Moduls ist also wörtlich wie die Definition eines Vektorraums, nur 

dass hier statt eines Schiefkörpers ein Integritätsbereich (allgemeiner: ein Ring) steht. 

Wir haben stets Links-Vektorräume betrachtet; für unseren Zweck ist es jedoch sinnvoll,


Rechts-Moduln zu definieren. 

Standard-Beispiel eines Moduls (für unsere Zwecke). Gegeben sei ϕ ∈ Hom(V, V ). Wir 

machen den K-Vektorraum V zu einem K[x]-Modul durch die Festsetzung: v · p := vp(ϕ). 

D.h. die Skalarmultiplikation mit dem Polynom p wird ausgeführt, indem auf v die 

lineare Abbildung p(ϕ) = p0 · 1V + p1ϕ + ... + pnϕ n angewendet wird (dabei sei 

p = p0 + ... + pnx n ∈ K[x]). 

Dieses Beispiel zeigt schon, dass nicht alle von Vektorräumen vertraute Regeln gelten. 

Zum Beispiel kann vp = 0 ∈ V zutreffen, obwohl v= 0 und p = 0 ist (Wenn p = char(ϕ) 

ist, hat man nach dem Satz von Cayley-Hamilton sogar vp = 0 für jedes v ∈ V ! ). Das 

liegt daran, dass p in K[x] keine Einheit zu sein braucht. Es kann auch passieren, dass 

p, q ∈ K[x] verschieden sind, aber vp = vq für jedes v ∈ V gilt (nämlich wenn p − q in 

dem von mip(ϕ) erzeugten Hauptideal liegt). 

Für v ∈ V und ist v · K[x] := {vq | q ∈ K[x]} = {q0v + q1(vϕ) + ... + qn(vϕ n ) | n ∈ 

N0, qi ∈ K} = 〈v〉ϕ der von v erzeugte zyklische ϕ-Modul. 

Beobachtung 215 Gegeben sei ein R-Modul V wie in 214. Als Untermodul bezeichnet 

man eine Untergruppe von V, + mit ur ∈ U für alle u ∈ U und r ∈ R. 

Nun seien V, ϕ wie im Standard-Beispiel. 

Wir haben U einen ϕ-Modul genannt, wenn U ein Untervektorraum von V ist mit Uϕ ⊆ U. 

Offenbar gilt: 

Die ϕ-Moduln von V sind genau die Untermodule des K[x]-Moduls V . 

Man hat 〈v〉ϕ = v · K[x] für zyklische ϕ-Moduln. 

Bemerkung In einem R-Modul V kann ein Untermodul U vorkommen, der keinen 

Untermodul W zuläßt mit V = U ⊕ W (wobei ⊕ hier wie in einem Vektorraum heißen 

soll: V = U + W und: Aus u + w = 0 folgt u = 0 = w für alle u ∈ U, w ∈ W ). 

Satz 216 a) In einem Integritätsbereich R gilt: wenn p ∈ R Primelement ist, so ist p 

irreduzibel. 

b) (Eindeutigkeit von Primfaktoren) In einem Integritätsbereich R seien p1, ..., pk und 

q1, ..., qs Primelemente. Es gelte (*) p1 · ... · pk = q1 · ... · qs. Dann folgt k = s, und (nach 

passender Umnumerierung der qi): pi assoziiert qi für alle i ∈ {1, ..., k}. 

c) In einem Hauptidealring R gilt: Die Primelemente sind genau die irreduziblen Elemen- 

te.


d) (Existenz der Primfaktorzerlegung) In einem Hauptidealring R gilt: Zu jeder Nichtein- 

heit r ∈ R \ {0} gibt es k ∈ N und irreduzible Elemente q1, ..., qk ∈ R mit r = q1 · ... · qk. 

Beweis. Zu a). Sei p ∈ R Primelement und p = ab. Wir behaupten, dass a und b triviale 

Teiler von p sind. Es gilt a|p und b|p und p|ab, also (Definition Primelement) p|a oder 

p|b; und damit p assoziiert zu a oder p assoziiert zu b. Im ersten Fall gilt ab = p = ae für 

eine Einheit e, also a(b − e) = 0 und damit wegen a = 0 (denn p = 0) b = e Einheit. Im 

zweiten Fall folgt analog: a ist Einheit. 

Zu b). Induktion über min{k, s}. 

Sei min{k, s} = k = 1. Aus (*) folgt p1|q1 · ... · qs. Mit der Definition von ’prim’ folgt p1|qi 

für ein i. Nach Umnumerierung dürfen wir annehmen p1|q1. Da q1 irreduzibel ist (also 

nur triviale Teiler hat) und p1 keine Einheit, ist deshalb p1 assoziiert zu q1, also ep1 = q1 

für eine Einheit e. Also 1 = eq2 · .... · qs, also s = 1 (sonst wäre q2 eine Einheit), und wir 

sind fertig. 

Nun sei min{k, s} = k > 1. 

Es folgt p1|p1 · ... · pk = q1 · ... · qs, und wie oben folgt ep1 = q1 für eine Einheit e (nach 

passender Umnumerierung der qi). Da R ein Integritätsbereich ist, gilt die ’Kürzungsregel’ 

(aus ab = ac und a = 0 folgt b = c) und wir erhalten p2 · ... · pk = (eq2)q3 · ... · qs. 

Per Induktionsannahme dürfen wir annehmen (nach passender Umnumerierung) pi 

assoziiert qi für i = 2, ..., k und k = s. 

Zu c). Sei p ∈ R irreduzibel. Zu zeigen ist: p prim. 

Zunächst behaupten wir: 

(c1) pR ist ein maximales Ideal von R, d.h. pR = R und für jedes Ideal J von R mit 

pR ⊆ J folgt pR = J oder R = J. 

Warum? pR = R, denn sonst wäre p eine Einheit (man hätte pr = 1 für ein r ∈ R). Nun 

sei J ein Ideal mit pR ⊆ J. Man kann J = aR schreiben. Es gilt p = ab für ein b ∈ R. Da 

p irreduzibel ist, ist a zu p assoziiert (und damit J = aR = pR) oder a ist Einheit und 

dann J = aR = R. Damit ist (c1) bewiesen. 

Angenommen, p|ab und p |a. Zu zeigen ist p|b. 

Es gilt aR ⊆ pR und deshalb ist aR + pR ein Ideal, welches pR echt umfaßt. Wegen (c1) 

folgt 1 ∈ R = aR + pR. Deshalb gilt b ∈ abR + pbR ⊆ pR + pR = pR, also p|b. 

Zu d). Der Beweis für einen beliebigen Hauptidealring ist etwas raffiniert (man braucht 

das Zornsche Lemma, um in einem Hauptidealring zu beweisen: jede nichtleere Menge 

von Idealen hat mindestens ein maximales Element) und wird in Algebra I vorgeführt. 

Der Beweis für Z oder K[x] dagegen ist einfach, weil man Induktion über den Betrag |r| 

bzw. den Grad des Polynoms r verwenden kann. Wir machen es für K[x] vor. 

Angenommen, die Behauptung ist falsch. Dann existiert ein Polynom r = 0 vom Grad


≥ 1 (da keine Einheit), welches nicht Produkt irreduzibler Polynome ist. Wir wählen ein 

solches r von minimalem Grad. Da r nicht irreduzibel ist (sonst wäre r Produkt irred. 

Polynome), finden wir Polynome a, b ∈ K[x] mit r = ab, a, b keine Einheiten und nicht 

zu r assoziiert. Also 1 ≤ Grad(a), Grad(b) < Grad(r). Nach Wahl von r ist a Produkt 

irreduzibler Polynome, und das gilt auch für b. Damit ist auch r Produkt irreduzibler 

Polynome, Widerspruch. 

Korollar 217 (Existenz und Eindeutigkeit der Primfaktorzerlegung) In einem 

Hauptidealring R gilt: Jede Nichteinheit a ∈ R\{0} kann man schreiben als a = p1 ·....·pk, 

wobei die pi Primelemente sind. 

Wenn p1 · .... · pk = a = q1 · ... · qs für Primelemente qi gilt, folgt k = s und man kann die qi 

so umnumerieren (d.h. Indizes permutieren), dass pi assoziiert qi ist für alle i ∈ {1, ..., k}. 

Im folgenden sei ϕ ∈ Hom(V, V ). Wir fassen V als K[x]-Modul auf. Ein Unter- 

modul U von V ist also ein Untervektorraum von V mit Uϕ ⊆ U. 

Lemma 218 (von der Primärzerlegung) Sei mip(ϕ) = q1 · ... · qk, wobei die qi ∈ K[x] 

paarweise teilerfremd sind und vom Grad ≥ 1. Dann gilt V = Kern(q1(ϕ)) ⊕ ........ ⊕ 

Kern(qk(ϕ)), und die Summanden sind ϕ-Moduln = {0} (siehe Aufgabe 18). 

Insbesondere: 

Wenn mip(ϕ) = p m1 

1 · ... · p mk 

k 

und die Summanden sind = {0}. 

für mi ∈ N und irreduzible Polynome pi ∈ K[x] gilt, folgt 

(P) V = Kern(p1(ϕ) m1 ) ⊕ ........ ⊕ Kern(pk(ϕ) mk ) 

Man nennt (P) die Primärzerlegung von V (in ϕ-Moduln). 

Satz 219 Sei V = {0} ein unzerlegbarer Modul (d.h. wenn V = W ⊕ T für Moduln W 

und T ist, so folgt W = {0} oder T = {0}). Dann ist V zyklisch und mip(ϕ) = p m für ein 

Primpolynom p ∈ K[x] und ein m ∈ N. 

Beweis. 

Die Primärzerlegung V = Kern(p1(ϕ) m1 ) ⊕ ........ ⊕ Kern(pk(ϕ) mk) hat nur einen Sum- 

mand. Deshalb ist k = 1 und für p = p1, m = m1 gilt mip(ϕ) = p m . Also gilt folgende 

Voraussetzung: V ist ein unzerlegbarer Modul mit Minimalpolynom p m , wobei p ∈ K[x] 

normiert und irreduzibel ist und m ∈ N.


Behauptung: V ist zyklischer Modul. 

Beweis der Behauptung. 

Es gibt a ∈ V mit ap m−1 = 0. 

Der von a erzeugte Modul 〈a〉ϕ = aK[x] hat dann das Minimalpolynom p m (d.h. die 

Restriktion von ϕ auf 〈a〉ϕ hat das Minimalpolynom p m ) . 

Man wähle unter den Moduln U von V mit U ∩ 〈a〉ϕ = {0} (jedenfalls ist U = {0} ein 

solcher) einen maximalen (bezüglich ⊆); diesen nenne ab jetzt U. Wir werden zeigen 

(+) V = U ⊕ 〈a〉ϕ. 

Aus (+) folgt (wegen der Unzerlegbarkeit von V ) U = {0}, also die Behauptung. 

Ansonsten brauchen wir die Unzerlegbarkeit von V nicht. 

Beweis von (+). Zu zeigen ist V ⊆ U + 〈a〉ϕ. Sei also v ∈ V . 

S := {q ∈ K[x] | vq ∈ U ⊕ 〈a〉ϕ} ist offenbar ein Ideal von K[x] (man braucht nur, dass 

U ⊕ 〈a〉ϕ ein Untermodul von V ist), und p m = mip(ϕ) ∈ S; also S = {0}. Deshalb 

gilt S = g · K[x], wobei g das normierte Polynom minimalen Grades in S ist. Wegen 

p m ∈ S folgt g = p k für ein k ∈ {0, ..., m} (denn alle normierten Teiler von p m haben 

wegen der Existenz und Eindeutigkeit der Primfaktorzerlegung in K[x] diese Form). Also 

S = p k · K[x]. 

Nach Definition von S gibt es c ∈ 〈a〉ϕ und u ∈ U mit vp k = u + c. 

(i) Es gibt b ∈ 〈a〉ϕ mit bp k = c. 

Beweis (i). Wegen up m−k + cp m−k = vp m = 0 und U ∩ 〈a〉ϕ = {0} folgt cp m−k = 0, d.h. 

(1) c ∈ Kern(p m−k (ϕ)) ∩ 〈a〉ϕ. 

In Übungsaufgabe 38 b) wurde berechnet: (2) Kern(p m−k (ϕ)) ∩ 〈a〉ϕ = 〈a〉ϕp k . Aus (1) 

und (2) folgt (i). 

Wegen (i) haben wir 

vp k = u + bp k , wobei (3) b ∈ 〈a〉ϕ ist. 

Setzt man (4) y := v − b, so gilt also 

(ii) yp k = u ∈ U 

Wir behaupten 

(iii) (U + 〈y〉ϕ) ∩ 〈a〉ϕ = {0}. 

Beweis von (iii). Angenommen, u ′ ∈ U und r ∈ K[x] und u ′ + yr ∈ (U + 〈y〉ϕ) ∩ 〈a〉ϕ. Zu 

zeigen ist u ′ + yr = 0. 

Indem wir (4) einsetzen, folgt u ′ + vr − br = u ′ + yr ∈ 〈a〉ϕ, mit (3) also (5) u ′ + vr ∈ 〈a〉ϕ. 

Das bedeutet r ∈ S = p k · K[x], also p k |r. Zusammen mit (ii) folgt yr ∈ U. Also (mit 

(5)) u ′ + yr ∈ U ∩ 〈a〉ϕ = {0} und (iii) ist bewiesen. 

Wegen (iii) und der Wahl von U folgt y ∈ U und damit (siehe (4)) v = y + b ∈ U + 〈a〉ϕ.


Mein Beweis oben ist kürzer als die entsprechenden in der mir bekannten Literatur. Ebenfalls einen 

direkten Beweis, ohne Hilfssätze aus der Modultheorie, präsentiert Kowalsky in: Lineare Algebra, 

de Gruyter, 9. Auflage, Seite 258, 35.3. In diesem ’Beweis’ ist aber ein leicht zu findender Fehler. 

Satz 220 Sei V = 〈v〉ϕ ein zyklischer Modul und mip(ϕ) = p m für ein irreduzibles nor- 

miertes Polynom p und m ∈ N. Dann ist V ein unzerlegbarer Modul. 

Beweis. Sei n = dim(V ) und k := Grad(p). Da für einen zyklischen Modul charakteristi- 

sches Polynom und Minimalpolynom gleich sind, folgt n = Grad(p m ) = k · m. 

Eine Basis von V ist 

Y := (y0, ....., yn−1) := 

(v, vϕ, ..., vϕ k−1 , 

vp(ϕ), vp(ϕ)ϕ, ..., vp(ϕ)ϕ k−1 , 

(leichte Überlegung, Aufgabe 38 a)). 

Daraus folgt für alle j ∈ {0, ..., m} 

..................................................... 

vp(ϕ) m−1 , vp(ϕ) m−1 ϕ, ..., vp(ϕ) m−1 ϕ k−1 ) 

(1) Kern(p(ϕ) j ) = V (p(ϕ) m−j ) = 〈vp(ϕ) m−j , vp(ϕ) m−j ϕ, ..., vp(ϕ) m−j ϕ k−1 , 

............................................................ 

Man hat V ⊃ V p ⊃ ... ⊃ V p m−1 ⊃ V p m = {0}, 

vp(ϕ) m−1 , vp(ϕ) m−1 ϕ, ..., vp(ϕ) m−1 ϕ k−1 〉 . 

Behauptung: Die Moduln dieser Kette sind die einzigen Untermoduln des K[x]-Moduls 

V . 

Beweis. Sei U irgendein Untermodul von V , U = {0}. Dann ist mip(ϕ|U) ein Teiler 

des Minimalpolynoms p m von ϕ; also mip(ϕ|U) = p j für ein j ∈ {1, ..., m}. Man hat 

also (2) U ⊆ Kern(p(ϕ) j ). Es gibt u ∈ U mit up j−1 = 0. Für den zyklischen Modul 

Z := 〈u〉ϕ = u · K[x] gilt dann mip(ϕ|Z) = p j und deshalb (charakteristisches und Mini- 

malpolynom sind für einen zyklischen Modul gleich) (3) dim(Z) = Grad(p j ) = k·j. Wegen 

u ∈ U gilt (4) Z ⊆ U ⊆ Kern(p(ϕ) j ) (Letzteres nach (2)). Die Dimension von Kern(p(ϕ) j ) 

ist wegen (1) gleich k · j. Zusammen mit (3) und (4) folgt Z = U = Kern(p(ϕ) j ). 

Aus der Behauptung folgt sofort, dass die Menge aller Untermoduln von V eine Kette 

(bezüglich ⊆) bildet. Deshalb ist V ein unzerlegbarer Modul. 

Wir fassen die vorigen beiden Sätze zusammen. 

Satz 221 (Charakterisierung der unzerlegbaren Untermoduln von V ) Die un-


zerlegbaren Untermoduln von V sind genau die zyklischen Untermoduln Z = 〈v〉ϕ, deren 

Minimalpolynome Potenzen von irreduziblen Polynomen sind. 

Wir können V in unzerlegbare Untermoduln = {0} zerlegen: wenn V selber unzerlegbarer 

Modul ist, sind wir fertig. 

Sonst gibt es echte Untermoduln U, W = {0} mit V = U ⊕ W . Dann gilt 

dimU, dimW < dimV . Per Induktion sind U und W direkte Summen von unzerlegbaren 

Untermoduln, und das gilt damit auch für V . Wenn wir den Induktionsschluß konstruktiv 

ausführen wollen, zerlegen wir U und auch W weiter in echte Untermoduln (wie vorhin 

V ) und fahren fort, bis weitere Zerlegungen unmöglich sind. Da die (Vektorraum-) Dimen- 

sionen der vorkommenden Untermoduln dabei mindestens um 1 bei jedem Schritt kleiner 

werden, sind wir nach höchstens n Schritten fertig. 

Zusammen mit dem vorigen Satz folgt 

Korollar 222 (Hauptsatz von der Zerlegung in unzerlegbare ϕ-Moduln) Es 

gibt k ∈ N und unzerlegbare Untermoduln U1, ..., Uk mit V = U1 ⊕ ... ⊕ Uk. 

Jedes Ui ist zyklisch und hat ein Minimalpolynom mip(ϕ|Ui ) = pmi 

i , wobei pi ein 

Primfaktor von mip(ϕ) ist und mi ∈ N derart, dass p mi 

i ein Teiler von mip(ϕ) ist. 

Eine Zerlegung von V in unzerlegbare Untermoduln wie im Korollar nennt man auch 

Weierstraß-Zerlegung. 

Die folgenden ’Normalformen’ beruhen auf einer solchen Zerlegung und sind durch das 

Tupel der Minimalpolynome (p m1 

1 

, ..., pmk 

k ) eindeutig festgelegt. 

In jedem der zyklischen Moduln Ui können wir eine Basis wählen, derart dass die Ma- 

trix zu ϕ|Ui bezüglich dieser Basis die Begleitmatrix Bi zum Minimalpolynom p mi 

i ist. 

Die zu ϕ gehörende Matrix (bezüglich der durch Aneinanderhängen der genannten Basen 

entstehenden Basis von V ) ist dann 

⎛ 

Man nennt diese Matrix die 

Weierstraß-Normalform 

⎜ 

B = ⎜ 

⎝ 

B1 

B2 

von ϕ (in Matrixdarstellung). Man kann zeigen, dass sie bis auf die Reihenfolge der Bi 

. 

. 

Bk 

⎞ 

⎟ 

⎠


durch ϕ eindeutig festgelegt ist. 

Wenn man eine Zerlegung V = U ⊕ W in Untermoduln = {0} hat, gilt mip(ϕ) = 

kgV { mip(ϕ|U), mip(ϕ|W ) }. Wenden wir das an auf die Zerlegung im vorigen Hauptsatz, 

so folgt 

mip(ϕ) = kgV { mip(ϕ|U1), ..., mip(ϕ|Uk) } 

Das Produkt einer endlichen Menge von Polynomen und das kgV dieser Menge haben die 

gleichen (normierten) Primfaktoren. 

Es folgt: Die normierten Primfaktoren p von mip(ϕ) sind genau die normierten Primpoly- 

nome, die in mindestens einem mip(ϕ|Ui) vorkommen. Das sind auch genau die normierten 

Primpolynome, welche in char(ϕ) vorkommen; denn char(ϕ) = char(ϕ|U1 )·...·char(ϕ|Uk ) = 

mip(ϕ|U1 ) · ... · mip(ϕ|Uk ). Ergebnis: 

Korollar 223 Die normierten Primfaktoren von mip(ϕ) und char(ϕ) stimmen überein. 

Insbesondere sind die Nullstellenmengen (in K) von mip(ϕ) und char(ϕ) gleich. 

Bemerkung 224 (Praktische Bestimmung der Weierstraß-Normalform) 

Hilfreich ist oft die früher gemachte 

Beobachtung 225 Wenn V = U1 ⊕ ... ⊕ Us eine Zerlegung in ϕ-Moduln ist, so gilt 

char(ϕ) = char(ϕ1) · ... · char(ϕs), und 

mip(ϕ) = kgV {mip(ϕ1), ..., mip(ϕs)} 

(wobei ϕi := ϕ|Ui 

gesetzt wurde). 

Für gegebenes ϕ ∈ Hom(V, V ) berechnen wir zunächst char(ϕ). 

Dies Polynom zerlegen wir in Primfaktoren 

char(ϕ) = p n1 

1 

· ... · pnk 

k mit pi = pj und ni ∈ N für i = j. 

Nach dem vorigen Korollar gilt dann 

mip(ϕ) = p m1 

1 · ... · p mk 

k , wobei 1 ≤ mi ≤ ni ist. 

Man hat Kern(p mi 

i 

der Eigenschaft vp mi 

i 

Die Primärzerlegung ist 

(ϕ)) = Kern(pni 

i (ϕ)). Die Zahl mi ist die kleinste natürliche Zahl mit 

(ϕ) = 0 für alle v ∈ Kern(pni 

i (ϕ)). 

(P) V = Kern(p1(ϕ) m1 ) ⊕ ........ ⊕ Kern(pk(ϕ) mk ) 

Wir müssen uns also nur noch um die Summanden der Primärzerlegung kümmern, 

machen deshalb nun die


Voraussetzung mip(ϕ) = p m , wobei p ein irreduzibles Polynom ist und m ∈ N. 

Der Beweis von 219 zeigt: 

Lemma 226 Unter der genannten Voraussetzung gibt es a ∈ V mit ap m−1 (ϕ) = 0. Wenn 

a diese Eigenschaft hat, und U unter den ϕ-Moduln (in V ) mit 〈a〉ϕ ∩ U = {0} maximal 

(bezüglich ⊆) ist, so gilt V = 〈a〉ϕ ⊕ U. 

(Die Voraussezung V ist unzerlegbarer Modul in 219 wurde nur benutzt, um aus 

V = 〈a〉ϕ ⊕ U zu folgern U = {0}, also V = 〈a〉ϕ .) 

Deshalb bestimmen wir zunächst ein a ∈ V mit ap m−1 (ϕ) = 0. 

Falls V = 〈a〉ϕ ist, sind wir fertig (denn 〈a〉ϕ ist nach dem Kennzeichnungssatz für 

unzerlegbare ϕ-Moduln unzerlegbar). 

Andernfalls gibt es nach dem Lemma b ∈ V \ {0} mit 〈a〉ϕ ∩ 〈b〉ϕ = {0} (Warum? Das 

Lemma liefert einen ϕ-Modul mit V = 〈a〉ϕ ⊕ U. Dann ist U = {0}; man kann b ∈ U \ {0} 

wählen und hat 〈b〉ϕ ⊆ U, da U ein ϕ-Modul ist). Wir wählen einen solchen mit maximal 

möglicher Dimension. 

So fahren wir fort: Wähle eine zyklischen ϕ-Modul 〈c〉ϕ, dessen Schnitt mit 

〈a〉ϕ + 〈b〉ϕ = 〈a〉ϕ ⊕ 〈b〉ϕ nur {0} ist, und dessen Dimension möglichst groß ist. 

Aufgrund des Lemmas ist das Fortfahren immer möglich, bis wir eine Zerlegung 

V = 〈a〉ϕ ⊕ 〈b〉ϕ ⊕ 〈c〉ϕ ⊕ .... in endlich viele zyklische ϕ-Moduln mit Minimalpolynomen 

p ma , p mb, p mc ,.... erreichen , wobei ma ≥ mb ≥ mc ≥ .... ≥ 1 ist. 

In jedem der Summanden können wir eine Basis wählen, bezüglich der die Restriktion 

von ϕ die Begleitmatrix zu p ma , zu p mb, zu p mc ,.... ist. 

Beispiel 

Bezüglich der Standardbasis des R 5 sei ϕ durch 

⎛ 

−3 

⎜ 1 

⎜ 

A := ⎜ −1 

⎜ 

⎝ 4 

−1 

1 

0 

1 

4 

−1 

2 

−4 

−3 

1 

0 

5 

⎞ 

−1 

⎟ 

0 ⎟ 

0 ⎟ 

1 

⎟ 

⎠ 

−2 0 2 −2 1 

gegeben. Ich habe MAPLE benutzt, um das Folgende zu berechnen. 

char(ϕ) = x 5 − 6x 4 + 14x 3 − 16x 2 + 9x − 2 

Primfaktorzerlegung: 

char(ϕ) = (x − 2) · (x − 1) 4


Da mip(ϕ) ein normierter Teiler von char(ϕ) ist und in mip(ϕ) alle Primteiler von char(ϕ) 

vorkommen (Korollar oben), gibt es die Möglichkeiten mip(ϕ) = (x − 2)(x − 1) i , i ∈ 

{1, ..., 4}. Einsetzen von A in die 4 möglichen Polynome zeigt 

mip(ϕ) = (x − 2) · (x − 1) 3 . 

Die Primärzerlegung ist also 

V = Kern(ϕ − 2) ⊕ Kern((ϕ − 1) 3 ) . 

Es ist U1 := Kern(ϕ − 2) der Eigenraum zum Eigenwert 2. Er kann nur 1-dimensional 

sein, weil x − 2 in char(ϕ) nur mit Vielfachheit 1 vorkommt. Ein Eigenvektor ist a := 

(1, 0, −1, 1, 0); also U1 = 〈a〉ϕ. 

Kern((ϕ − 1) 3 ) muß einen zyklischen Modul U2 = 〈b〉ϕ mit Minimalpolynom (x − 1) 3 

enthalten, insbesondere dimU2 = 3. 

Da U1 ⊕ U2 bereits 4-dimensional ist, muß eine Zerlegung in unzerlegbare ϕ-Moduln die 

Form haben 

V = U1 ⊕ U2 ⊕ U3 

mit dimU3 = 1, also U3 = 〈c〉ϕ mit Minimalpolynom x − 1, d.h. c ein Eigenvektor zum 

Eigenwert 1. 

Die Weierstraß-Zerlegung ist also (bis auf Reihenfolge von U1, U2, U3) 

⎛ 

⎞ 

2 

⎜ 

⎟ 

⎜ 0 1 0 ⎟ 

⎜ 

⎟ 

AW = ⎜ 0 0 1 ⎟ 

⎜ 

⎟ 

⎜ 

⎝ 1 −3 3 

⎟ 

⎠ 

1 

Bezüglich einer passenden Basis gehört zu ϕ also die Matrix AW . Anders gesagt: Es gibt 

eine invertierbare Matrix C ∈ K 5×5 mit AF = C −1 AC. 

Die Jordansche Normalform 

Wir starten mit einer Zerlegung V = U1 ⊕ ... ⊕ Us in unzerlegbare ϕ-Moduln Ui. Jedes Ui 

ist zyklisch und hat Minimalpolynom p mi 

i , wobei pi ∈ K[x] irreduzibel ist und mi ∈ N. 

U := U1 hat eine Basis der Form (u, uϕ, ..., uϕ d ) mit d + 1 = dimU = Grad(p m ) 

(p := p1, m := m1). 

Bezüglich dieser Basis ist die Matrix zu ϕ|U gleich der Begleitmatrix zum Polynom 

p m . Wenn wir eine solche Basis für jedes Ui wählen, erhalten wir als Matrix zu ϕ die 

Weierstraß-Normalform.


Nun ist auch (mit k := Grad(p)) 

Y := (y0, ....., yn−1) := 

(u, uϕ, ..., uϕ k−1 , 

up(ϕ), up(ϕ)ϕ, ..., up(ϕ)ϕ k−1 , 

..................................................... 

up(ϕ) m−1 , up(ϕ) m−1 ϕ, ..., up(ϕ) m−1 ϕ k−1 ) 

eine Basis von U (vgl. Aufgabe 38 a)). Bezüglich dieser Basis ist die Matrix von ϕ|U gleich 

⎛ 

B 

⎜ 

BJ = ⎜ . 

⎜ 

⎝ 

N 

B 

. 

N 

. . 

B 

. 

N 

B 

⎞ 

⎟ 

⎠ 

Dabei ist B ∈ K k×k die Begleitmatrix zum Polynom p und N ∈ K k×k die Matrix, die 

links unten den Eintrag nk,1 = 1 hat und sonst nur 0. 

Wenn man für jedes Ui so verfährt, erhält man als Matrix AJ zu ϕ die (allgemeine) 

Jordan-Normalform. In der Diagonalen von AJ stehen also Matrizen der Form BJ, 

wobei B Begleitmatrizen zu normierten Primteilern p von mip(ϕ) sind. 

Im Fall K = C hat jedes normierte Primpolynom die Form p = x − λ. Dann ist B die 

1 × 1-Matrix mit Eintrag λ und 

⎛ 

λ 

⎜ 

BJ := ⎜ . 

⎜ 

⎝ . 

1 

λ 

. 

. 

1 

. 

. 

. 

. 

⎞ 

⎟ 

. ⎟ 

1 

⎟ 

⎠ 

. . . λ 

Die Jordansche Normalform, zusammengesetzt aus Matrizen BJ auf der Diaginalen, hat 

dann also in der Diagonalen Eigenwerte λi von ϕ und in der Nebendiagonalen Einträge 1 

oder 0. 

(Oft werden nur der Spezialfall K = C und diese spezielle Jordan-Normalform in einer 

Anfängervorlesung vorgestellt). 

Wir berechnen die Jordansche Normalform für das obengenannte Beispiel. Da ist das BJ


für U2 (also mit Minimalpolynom (x − 1) 3 gleich 

⎛ ⎞ 

1 

⎜ 

BJ := ⎜ 

⎝ 0 

1 

1 

0 

⎟ 

1 ⎟ 

⎠ 

0 0 1 

Die Matrix von ϕ in Jordan-Normalform ist also 

⎛ 

2 

⎜ 1 1 0 

⎜ 

AJ = ⎜ 0 1 1 

⎜ 

⎝ 0 0 1 

Die Frobenius Normalform (rational normal form) 

Es gibt eine Zerlegung V = W1 ⊕ .... ⊕ Wt derart, dass die Wi zyklische ϕ-Moduln = {0} 

sind (aber nicht notwendig unzerlegbar) und für die Minimalpolynome qi := mip(ϕ|Wi ) 

gilt qt|qt−1 , ..., q2|q1. Man nennt q1, ..., qk die Invariantenteiler von ϕ (sie sind eindeutig 

bestimmt; genau genommen sind dies nur die von 1 verschiedenen sogenannten Invarian- 

tenteiler). Wenn man für jedes Wi eine passende Basis wählt, gehört zu jedem ϕWi die 

Begleitmatrix Fi mit Minimalpolynom qi. Damit erhält man für ϕ die Matrix 

⎛ 

⎞ 

⎜ 

AF = ⎜ 

⎝ 

F1 

wobei das Minimalpolynom der Begleitmatrix Fi gleich qi ist und qt|qt−1 , ..., q2|q1 gilt. 

F2 

Man nennt eine solche Matrix Frobenius Normalform (englisch rational normal form) von 

ϕ. 

Wir wollen zeigen, dass diese Normalform stets existiert. 

Das wird am einfachsten an einem Beispiel klar. Zunächst bemerken wir (Übungsaufgabe): 

Lemma 227 Seien ϕ ∈ Hom(V, V ) und u, v ∈ V \{0}. Sei p ∈ K[x] das Minimalpolynom 

des zyklischen ϕ-Moduls 〈u〉ϕ; sei q ∈ K[x] das Minimalpolynom des zyklischen ϕ-Moduls 

〈v〉ϕ. 

Falls p teilerfremd q (in K[x]) ist, so ist 〈u〉ϕ + 〈v〉ϕ = 〈u〉ϕ ⊕ 〈v〉ϕ ein ϕ-zyklischer 

Modul mit Minimalpolynom p · q, nämlich gleich 〈u + v〉ϕ . 

. 

. 

1 

Ft 

⎞ 

⎟ 

⎠ 

⎟ 

⎠


Betrachten wir nun ein Beispiel mit K = R. Sei V = U1 ⊕ U2 ⊕ U3 ⊕ U4 ⊕ U5 ⊕ U6 eine 

Zerlegung in unzerlegbare ϕ-Moduln, und die Minimalpolynome auf den Ui seien 

r1 = (x − 2) 5 , r2 = (x − 2) 5 , r3 = (x − 2) 3 , r4 = (x 2 + 3) 2 , r5 = x 2 + 3, r6 = x − 5. 

Setze W1 := U1 ⊕ U4 ⊕ U6. 

Aufgrund des Lemmas (zweimal anwenden) ist W1 zyklischer ϕ-Modul mit Minimalpoly- 

nom q1 = (x − 2) 5 (x 2 + 3) 2 (x − 5). 

Setze W2 := U2 ⊕ U5. Dann ist W2 zyklisch mit Minimalpolynom q2 = (x − 2) 5 (x 2 + 3). 

Schließlch setze W3 := U3, q3 = (x − 2) 3 . 

Man hat q3|q2 und q2|q1 und V = W1 ⊕ W2 ⊕ W3. 

Beobachtung 228 Es gilt: V ist zyklischer ϕ-Modul genau dann, wenn mip(ϕ) = char(ϕ) 

gilt. 

Beweis. ⇒ kennen wir schon. Sei also mip(ϕ) = char(ϕ) vorausgesetzt. Wir betrachten 

eine Zerlegung entsprechend der Frobenius-Normalform: V = W1 ⊕ .... ⊕ Wt derart, dass 

die Wi zyklische ϕ-Moduln = {0} sind (aber nicht notwendig unzerlegbar) und für die 

Minimalpolynome (Invariantenteiler) qi := mip(ϕ|Wi ) gilt qt|qt−1 , ..., q2|q1. 

Offenbar ist q1 = mip(ϕ). Man hat 

q1 · ... · qt = char(ϕ|W1 ) · ... · char(ϕ|Wt) = char(ϕ) = mip(ϕ) = kgV{q1, ..., qt} = q1. Da die 

qi alle Grad ≥ 1 haben, folgt t = 1 und V = W1 ist ϕ-zyklisch. 

Eindeutigkeitsaussagen 

1. Sind zu gegebenem ϕ die Weiserstraß-, die Jordan- und die Frobenius-Normalformen 

eindeutig bestimmt? Das vermuten wir, denn sonst wäre die Redeweise irreführend (wobei 

bei den ersten beiden Normalformen natürlich die Reihenfolge der Blöcke in den Matrizen 

nicht eindeutig ist). 

2. Welche linearen Abbildungen ϕ, ψ : V → V liefern die gleichen Normalformen? 

Wir wollen hier Frage 2. behandeln und das ’ja’ zu 1. glauben: 

Satz 229 Zu jeder linearen Abbildung ϕ ∈ Hom(V, V ) (mit dimV ∈ N und K Körper) 

existiert genau eine Weierstraß-Normalform, eine Jordan-Normalform, eine Frobenius- 

Normalform; d.h. Matrizen der genannten Formen, derart dass zu ϕ bezüglich passender 

Basen diese Matrizen gehören. 

Dabei werden bei der Weierstraß-Normalform zwei Matrizen diag(B1, ..., Bk) (wobei die 

Bi Begleitmatrizen zu Polynomen p mi 

i sind, mi ∈ N) als gleiche Normalformen angesehen,


wenn sie auseinander nur durch Permutation der Bi entstehen. 

In der Jordannormalform hat man Matrizen diag(BJ1, ..., BJk), wobei 

⎛ 

⎞ 

⎜ 

BJi = ⎜ 

⎝ 

Bi Ni 

Bi Ni 

. . . . . 

Bi Ni 

ist für Begleitmatrizen Bi zu Primpolynomen pi und Ni die quadratische Matrix 

mit Grad(pi) Zeilen und Eintrag 1 links unten, sonst 0. Hier werden Matrizen 

diag(BJ1, ..., BJk), die durch Permutation der BJi auseinander hervorgehen, als gleiche 

Normalformen angesehen. 

Definition 230 Seien ϕ, ψ ∈ Hom(V, V ). Nenne ϕ ähnlich zu ψ, wenn es ω ∈ GL(V ) 

gibt mit ω −1 ϕω = ψ. 

Seien A, B ∈ K n×n . Nenne A ähnlich zu B, wenn es C ∈ GLn(K) (Gruppe der invertier- 

baren n × n-Matrizen) gibt mit C −1 AC = B. 

Offenbar ist die Relation ’ähnlich’ (similar) eine Äquivalenzrelation auf Hom(V, V ) 

beziehungsweise K n×n . Man hat also eine Einteilung in Ähnlichkeitsklassen. 

Bemerkung zur Bezeichnung. In einer Gruppe G, · seien ϕ, ψ ∈ G. Man nennt ϕ kon- 

jugiert zu ψ, wenn es ω ∈ G mit ψ = ω −1 ϕω gibt. Da Hom(V, V ) (bei V = {0}) keine 

Gruppe ist, benutzt man hier nicht das Wort konjugiert sondern die Extra-Bezeichnung 

’ähnlich’. 

Satz 231 (Hauptsatz zur Ähnlichkeitsrelation) Seien ϕ, ψ ∈ Hom(V, V ). Sei A die 

Matrix von ϕ bezüglich einer Basis (e1, ..., en) von V und B die Matrix von ψ bezüglich 

einer Basis (e ′ 1 , ..., e′ n) von V . Folgende Aussagen sind äquivalent. 

(i) ϕ ähnlich ψ 

(ii) A ähnlich B 

(iii) ψ hat (wie ϕ) die Matrix A bezüglich einer passenden Basis. 

(iv) ϕ und ψ haben gleiche Weierstraß-Normalform. 

(v) ϕ und ψ haben gleiche Jordan-Normalform. 

(vi) ϕ und ψ haben gleiche Frobenius-Normalformen. 

Beweis. Zunächst die Äquivalenz von (i), (ii), (iii). 

(i) ⇒ (ii). Es gibt ω ∈ GL(V ) mit ψ = ω −1 ϕω. Sei D die Matrix von ω bezüglich 

Bi 

⎟ 

⎠


(e1, ..., en) und B ′ die Matrix von ψ bezüglich (e1, ..., en). Dann gilt B ′ = D−1AD. Wenn 

Z die übergangsmatrix von (e1, ..., en) zu (e ′ 1 , ..., e′ n) bezeichnet ( e ′ 

i = j zijej), so gilt 

B ′ = ZBZ −1 . 

Wir haben also ZBZ −1 = D −1 AD, also B = (DZ) −1 A(DZ). 

(ii) ⇒ (iii). Es gibt eine invertierbare Matrix T mit A = T BT −1 . Definiere die Basis 

(e ′′ 

1 , ..., e′′ n) durch e ′′ 

i 

Basis. 

= 

j tije ′ j . Dann hat ψ die Matrix T BT −1 = A bezüglich dieser 

(iii) ⇒ (i). ψ möge die Matrix A bezüglich der Basis (e ′′ 

1 , ..., e′′ n) haben. Wenn S die 

Übergangsmatrix von (e ′′ 

1 , ..., e′′ n) zu (e1, ..., en) ist, hat ψ bezüglich (e1, ..., en) die Matrix 

SAS −1 . Wenn ω die lineare Abbildung zu S −1 bezüglich (e1, ..., en) bezeichnet, so gilt 

also ω −1 ϕω = ψ. 

Wenn ϕ und ψ die gleiche Weierstraß-Normalform A haben, so hat ϕ die Matrix A 

bezüglich einer passenden Basis (a1, ..., an) und ψ die Matrix A bezüglich einer passenden 

Basis (b1, ..., bn). Wegen (iii) ⇒ (i) ist dann ϕ ähnlich ψ. Das gleiche Argument gilt für 

die anderen Normalformen. 

Es genügt also (i) ⇒ ((iv) und (v) und (vi)) zu beweisen. 

Sei also ψ = ω −1 ϕω für ein ω ∈ GL(V ). 

Wir wählen eine Zerlegung V = U1 ⊕ ... ⊕ Uk in unzerlegbare ϕ-Moduln Ui. Diese sind 

dann ϕ-zyklisch und haben Minimalpolynome mip(ϕ|Ui ) = pmi 

i , wobei pi ∈ K[x] normiert 

und irreduzibel sind und mi ∈ N. 

Durch das Tupel (p m1 

1 

von ϕ festgelegt. 

, ..., pmk 

k ) sind die Weierstraß-, Jordan- und Frobenius-Normalform 

Wegen ω ∈ GL(V ) ist V = V ω = U1ω ⊕ ... ⊕ Ukω eine direkte Zerlegung in Untervek- 

torräume. 

Jedes Uiω ist ein ψ-Modul, denn Uiωψ = Uiϕω ⊆ Uiω. 

Sei nun i ∈ {1, ..., k}, U := Ui = 〈u〉ϕ. 

Dann gilt 

Uω = 〈{uϕ i | i ∈ N0}〉ω = 〈{uϕ i ω | i ∈ N0}〉 = 〈{uωω −1 ϕ i ω | i ∈ N0}〉 = 

〈{uω(ω −1 ϕω) i | i ∈ N0}〉 = 〈{(uω)ψ i | i ∈ N0}〉 = 〈uω〉ψ. 

Also ist Uiω zyklischer ψ-Modul, Uiω = 〈uiω〉ψ. 

Wir behaupten (*) mip(ψ|Uiω) = p mi 

i = mip(ϕ|Ui ). 

Hierzu (vgl. Übung 41). Sei i ∈ {1, ..., k}. Für jedes q ∈ K[x] sind die folgenden Aussagen 

äquivalent:


q(ψ|Uiω) = 0; (uω)q(ψ) = 0 für jedes u ∈ Ui; (uω)q(ω −1 ϕω) = 0 für jedes 

u ∈ Ui; (uω)ω −1 q(ϕ)ω = 0 für jedes u ∈ Ui; uq(ϕ)ω = 0 für jedes u ∈ Ui; (da 

Kern(ω) = {0}) uq(ϕ) = 0 für jedes u ∈ Ui; q(ϕ|Ui ) = 0. 

Das normierte Polynom q ∈ K[x] kleinsten Grades mit der Eigenschaft q(ψ|Uiω) = 0 ist 

also gleich dem normierten Polynom q kleinsten Grades mit q(ϕ|Ui ) = 0. Genau das ist 

Aussage (*). 

Ergebnis: V = U1ω ⊕ ... ⊕ Ukω ist eine Zerlegung von V in unzerlegbare ψ-Moduln mit 

Minimalpolynomen mip(ψ|Uiω) = p mi 

i . Deshalb hat ψ die gleiche Weierstraß (Jordan -, 

Frobenius- )-Normalform wie ϕ.

12 BEWEGUNGEN, ADJUNGIERTE ABBILDUNG, SPEKTRALSATZ 156 

12 Bewegungen, adjungierte Abbildung, Spektralsatz 

Bewegungen Sei V ein endlichdimensionaler Vektorraum über einem Körper K, 2 = 0. 

Sei f : V × V → K eine reguläre symmetrische Bilinearform. 

Lemma 232 Sei ψ : V → V eine Abbildung (nicht notwendig linear) mit 

(d) q(aψ − bψ) = q(a − b) 

für alle a, b ∈ V (wobei q(v) := f(v, v) abgekürzt wurde). Außerdem gelte 0ψ = 0. Dann 

ist ψ ∈ O(V, f). 

Insbesondere ist also ψ eine bijektive lineare Abbildung. 

Beweis. Aus (d) im Spezialfall b = 0 folgt (1) q(aψ) = q(a) für alle a ∈ V ; deshalb mit 

(d) (2) f(aψ, bψ) = f(a, b) für alle a, b ∈ V . 

Wir wählen eine Orthogonalbasis (e1, ..., en) von V . 

Seien α, β ∈ K und a, b ∈ V . 

Es gilt f((αa + βb)ψ − α(aψ) − β(bψ), eiψ) = f((αa + βb)ψ, eiψ) − αf(aψ, eiψ) − 

βf(bψ, eiψ) = f(αa + βb, ei) − αf(a, ei) − βf(b, ei) = 0 (beim vorletzten =-Zeichen wurde 

(2) benutzt). 

Also gilt (αa+βb)ψ −α(aψ)−β(bψ) ∈ (e1ψ) ⊥ ∩...∩(enψ) ⊥ . Wegen (2) ist f(eiψ, ejψ) = 0 

für i = j und f(eiψ, eiψ) = 0. Deshalb ist (e1ψ, ...enψ) eine (Orthogonal-)Basis von V , 

also (e1ψ) ⊥ ∩ ... ∩ (enψ) ⊥ = V ⊥ = {0}. Folglich ist (αa + βb)ψ = α(aψ) + β(bψ). Damit 

ist die Linearität von ψ erwiesen. Mit (2) folgt ψ ∈ O(V, f). 

Definition 233 Sei ϕ : V → V eine Abbildung (nicht notwendig linear). Wir nennen ϕ 

eine Bewegung (motion), wenn (d) (Distanztreue) des Lemmas gilt. Teilmengen M, N ⊆ V 

nennt man (bewegungs-)kongruent, wenn es eine Bewegung ϕ mit Mϕ = N gibt. Analog 

für Tupel von Vektoren. 

Bemerkung Offenbar ist jede orthogonale Abbildung ψ ∈ O(V, f) und auch jede Trans- 

lation τc : V → V, v ↦→ v + c (mit c ∈ V ) eine Bewegung, also auch jede Nacheinander- 

ausführung ψτc. Wir behaupten, dass dies alle Bewegungen sind: 

Satz 234 (Kennzeichnung der Bewegungen) Sei ϕ : V → V eine Bewegung. Dann 

gibt es ψ ∈ O(V, f) und eine Translation τc mit ϕ = ψτc. Das Paar ψ, τc ist durch ϕ ein- 

deutig bestimmt. Die Menge der Bewegungen ist eine Untergruppe der Permutationsgruppe 

der Menge V (die Bewegungsgruppe).


Beweis. Sei ϕ eine Bewegung. Setze c := 0ϕ und ψ := ϕτ−c. Dann gilt 0ψ = 0. Da 

ϕ und τc distanztreu sind, gilt das auch für ψ. Das Lemma zeigt ψ ∈ O(V, f). Es gilt 

ϕ = ψ · τc. Für die Eindeutigkeitsaussage ist nur O(V, f) ∩ T = {1V } zu zeigen (T := 

Translationsgruppe). Hierzu: Wenn τc ∈ O(V, f) ist, folgt 0 = 0τc = c, also c = 0 und 

τc = 1V . 

Wir haben damit auch gezeigt, dass jede Bewegung bijektiv ist. 

Da Nacheinanderausführung distanztreuer Abbildungen offenbar distanztreu ist, ebenso 

die Umkehrabbildung einer distanztreuen Abbildung, außerdem 1V distanztreu ist, bilden 

die Bewegungen eine Gruppe. 

Bemerkung 

Für eine Translation τc und ψ ∈ GL(V ) gilt ψ −1 τcψ = τcψ. Dies gilt insbesondere für 

ψ ∈ O(V, f). Deshalb ist die Bewegungsgruppe gleich B(V, f) = O(V, f) · T = T · O(V, f). 

(1) O(V, f) ist eine Untergruppe von B(V, f). 

(2) T ist eine Untergruppe von B(V, f) mit der Eigenschaft ϕ −1 T ϕ = T für jedes 

ϕ ∈ B(V, f); man sagt: T ist ein Normalteiler der Gruppe B(V, f). 

(3) Es gilt B(V, f) = O(V, f) · T und O(V, f) ∩ T = {1}. 

Die Aussagen (1), (2) und (3) fasst man zusammen in der Redensart: 

B(V, f) ist semidirektes Produkt der Untergruppe O(V, f) mit dem Normalteiler T . 

Winkelmaß für Halbgeraden 

Der Einfachheit halber betrachten wir V = R n mit einem positiv definitem Skalarprodukt 

f : V × V → R und n ≥ 2. 

Mit . bezeichen wir die zugehörige Norm v := f(v, v). 

Für a, b ∈ V mit b = 0 nennt man a + R≥0b die durch b bestimmte Halbgerade (auch 

Strahl) mit Aufpunkt a. 

Nun sei ein Paar von Halbgeraden mit gleichem Aufpunkt a gegeben, Γ = a + R≥0b und 

Ω = a + R≥0c. 

Die Zahl 

w(b, c) := 

f(b, c) 

b · c 

hängt nur von dem Paar (Γ, Ω) ab: wenn wir b durch λb und c durch µc ersetzen (wobei 

λ, µ ∈ R>0 sei), gilt w(b, c) = w(λb, µc). Wir können also w(Γ, Ω) := w(b, c) setzen und 

außerdem im folgenden annehmen 

b = 1 = c .


Dann ist w(b, c) = f(b, c). Bekanntlich gilt −1 ≤ w(Γ, Ω) ≤ 1; weiterhin: −1 = w(Γ, Ω) 

genau dann, wenn c = −b ist; und 1 = w(Γ, Ω) genau dann, wenn c = b ist (Ungleichung 

von Cauchy-Schwarz, Analysis I). Deshalb gibt es genau ein α ∈ [0, π] mit cos α = w(Γ, Ω) 

( cos ist auf dem Intervall [0, π] stetig und echt monoton fallend von 1 auf −1). Man nennt 

α die durch das Halbstrahlenpaar bestimmte Winkelgrösse. Sie ist also (auch wenn b, c 

nicht Länge 1 haben) gegeben durch 

Geometrische Interpretation 

cos α = 

f(b, c) 

b · c 

Wir nehmen an a = 0, da die oben eingeführten Zahlen unabhängig von a sind. Sei α die 

Winkelgröße zum Halbgeradenpaar wie oben. 

Wir setzen wieder b = 1 = c voraus. 

Ergänze b zu einer Orthonormalbasis (b, e) mit c ∈ 〈b, e〉, also c = λb + µe für passende 

λ, µ ∈ R mit µ ∈ R≥0 (eventuell e durch −e ersetzen). 

Dann ist λb der Lotfußpunkt von c auf 〈b〉, also λ = f(b, c) = cos α (und µe = c−f(b, c)b). 

Wegen c = 1 gilt µ = 1 − (cos α) 2 = sin α, da für 0 ≤ α ≤ π gilt sin α ≥ 0. Wir 

haben also also c = (cos α)b + (sin α)e. 

Schließlich ist α die Länge des Kreisbogens zwischen b und c. Denn die Abbildung 

γ : [0, α] → R 2 , t ↦→ (cos t)b + (sin t)e ist eine Parametrisierung des Kreisbogens mit 

Anfangspunkt γ(0) = b und Endpunkt γ(α) = c, und die Länge der dadurch gegebenen 

Kurve ist 

Adjungierte Abbildung 

L := 

α 

0 

γ ′ (t) dt = 

α 

0 

1dt = α 

Sei V ein endlichdimensionaler Vektorraum über einem Körper K, 2 = 0. Sei f : V ×V → 

K eine reguläre symmetrische Bilinearform. 

Beobachtung 235 Gegeben seien ϕ, ψ ∈ Hom(V, V ). Dann ist 

ϕf : V × V → K, ϕf(v, w) := f(vϕ, w) 

eine (nicht notwendig symmetrische) Bilinearform. Ebenso ist 

fψ : V × V → K, fψ(v, w) := f(v, wψ) 

eine (nicht notwendig symmetrische) Bilinearform. 

Falls ϕf =η f ist, folgt ϕ = η. 

Analog: Falls fψ = fη ist, folgt ψ = η.


Zusatz Sei (e1, ..., en) eine Basis von V , F = (f(ei, ej)) die Gramsche Matrix von f und 

A die Matrix von ϕ, B die Matrix von ψ bezüglich der Basis, so gilt: 

AF ist die Gramsche Matrix von ϕf, 

F B t ist die Matrix von fψ 

bezüglich der Basis. 

Beweis. Es gilt eiϕ = 

k aikek, also ϕf(ei, ej) = f(eiϕ, ej) = f( 

k aikek, ej) = 

 

k aikf(ek, ej) = i, j-Eintrag der Matrix A · (f(er, es)). 

Beobachtung 236 Zu jedem ϕ ∈ Hom(V, V ) existiert genau ein ψ ∈ Hom(V, V ) mit der 

Eigenschaft ϕf = fψ, d.h. f(vϕ, w) = f(v, wψ) für alle v, w ∈ V . 

Beweis. Sei wie im Zusatz eine Basis zugrunde gelegt, also F , ϕ, A gegeben; und sei 

ψ ∈ Hom(V, V ) beliebig mit Matrix B. Die Bedingung ϕf = fψ lautet in Matrizensprache 

(siehe Zusatz): AF = F B t , also (beachte, dass f regulär und deshalb F invertierbar ist, 

außerdem F = F t ) B = F A t F −1 . 

Korollar 237 Die Abbildung Hom(V, V ) → Menge der Bilinearformen auf V , ϕ ↦→ϕ f 

ist bijektiv. 

Das gleiche gilt für die Abbildung Hom(V, V ) → Menge der Bilinearformen auf V , ψ ↦→ fψ 

Beweis. Die Injektivität wurde in der ersten Beobachtung festgestellt. 

Für die Surjektivität benutzen wir die Bezeichnungen wie im Zusatz. Wenn g : V ×V → K 

eine beliebige Bilinearform ist mit Gramscher Matrix G setzen wir A := GF −1 und 

erreichen nach dem Zusatz für die entsprechende Abbildung ϕ das Gewünschte ϕf = g. 

Definition 238 Die in der vorigen Beobachtung eindeutig bestimmte Abbildung ψ bezeich- 

net man mit ϕ ∗ . Sie heißt die zu ϕ adjungierte Abbildung (bezüglich f). 

Sie ist also festgelegt durch die Eigenschaft f(vϕ, w) = f(v, wϕ ∗ ) für alle v, w ∈ V . 

Falls ϕ = ϕ ∗ ist, nennt man ϕ selbstadjungiert. 

Wenn A die Matrix von ϕ und F die Gramsche Matrix von f (bezüglich einer festen 

Basis von V ) sind, so ist also A ∗ = F A t F −1 die Matrix der zu ϕ adjungierten Abbildung. 

Bemerkungen Die Bilinearform ϕf ist genau dann symmetrisch, wenn ϕ selbstadjungiert 

ist.


Nach dem Korollar haben wir also eine Bijektion der Menge der (bezüglich f) selbstadjun- 

gierten Abbildungen ϕ ∈ Hom(V, V ) auf die Menge aller symmetrischen Bilinearformen 

auf V , nämlich ϕ ↦→ϕ f. 

Es ist also egal, ob man (bezüglich f) selbstadjungierte Abbildungen ϕ ∈ Hom(V, V ) 

studiert oder symmetrische Bilinearformen V × V → K. 

Für die lineare Abbildung ϕ gilt genau dann ϕ ∈ O(V, f), wenn ϕ ∗ = ϕ −1 zutrifft. 

Beobachtung 239 Sei (e1, ..., en) eine Basis von V , F die Gramsche Matrix bezüglich 

der Basis, ϕ ∈ Hom(V, V ) und A die Matrix von ϕ bezüglich der Basis. Folgende Aussagen 

sind äquivalent. 

(i) ϕ ist selbstadjungiert, d.h. ϕ ∗ = ϕ. 

(ii) A = F A t F −1 

Falls zusätzlich vorausgesetzt wird: (e1, ..., en) ist eine f-Orthonormalbasis (also F = E 

Einheitsmatrix), so ist ein weiteres Äquivalent: 

(iii) A = A t , d.h. A ist symmetrisch. 

Das folgt unmittelbar daraus, dass A ∗ = F A t F −1 die Matrix der adjungierten Abbildunge 

ϕ ∗ ist, wie oben vermerkt wurde. 

Satz 240 Sei ϕ selbstadjungiert (bezüglich f) und seien u, w Eigenvektoren zu verschie- 

denen Eigenwerten von ϕ. Dann gilt f(u, w) = 0. 

Beweis. µf(u, w) = f(u, µw) = f(u, wϕ) = f(u, wϕ ∗ ) = f(uϕ, w) = f(λu, w) = λf(u, w). 

Im folgenden wird der Spezialfall eines R-Vektorraums V mit positiv definitem 

Skalarprodukt f untersucht. In diesem Fall kann man nämlich beweisen, dass jede 

f-selbstadjungierte Abbildung mindestens einen Eigenwert hat und daraus interessante 

Folgerungen ziehen (Spektralsatz). 

Motivation, Beispiel 

Sei V := R 2 , f das gewöhnliche Skalarprodukt auf R 2 und A = (aij) ∈ R 2×2 symmetrisch, 

ϕ die durch A bezüglich der Standardbasis gegebene selbstadjungierte Abbildung. Dann 

gilt für (x = (x1, x2), y = (y1, y2) ∈ R 2 

ϕf(x, y) = a11x1y1 + a12(x2y1 + x1y2) + a22x2y2, d.h. ϕf ist die symmetrische Bilinearform 

mit Gramscher Matrix A bezüglich der Standardbasis. 

 

q(x1, x2) :=ϕ f(x, x) = (x1 x2)A 

x1 

x2 

= a11x 2 1 + a22x 2 2 + 2a12x1x2


für (x1, x2) ∈ R 2 (q(x) ist der Formwert von x ∈ R 2 unter ϕf). Setze S := {x ∈ R 2 | q(x) = 

1} = {x ∈ R 2 | a11x 2 1 + a22x 2 2 + 2a12x1x2 = 1 }. 

S ist eine ’Kurve zweiter Ordnung’ (Ellipse, Parabel, Hyperbel, jenachdem ob detA > 

0, = 0, < 0 ist; siehe Übungsaufgabe zu Kegelschnitten). 

S ist symmetrisch zu 0 ∈ V , d.h. wenn x ∈ S ist, folgt −x ∈ S. 

Jedes x ∈ V können wir schreiben als x = µy, wobei y = 1 ist (d.h. y auf dem 

f-Einheitskreis S 1 ) und µ = x . Dann gilt: 

x ∈ S ⇔ q(µy) = 1 ⇔ µ 2 q(y) = 1 ⇔ f(x, x) = 1 

q(y) 

Skizzieren wir den Fall, dass S eine Ellipse aber kein Kreis ist. Dann sehen wir anschaulich: 

es gibt 2 Punkte ˆx und ˜x, für welche f(x, x) = x 2 einen Extremwert annimmt (entspre- 

chend: q(ˆy), q(˜y) nimmt für y ∈ S 1 einen Extremwert an). Es gilt f(ˆx, ˜x) = 0 = f(ˆy, ˜y). 

Wir wollen diese anschauliche Beobachtung präzisieren und verallgemeinern. 

Satz 241 Sei V ein n-dimensionaler R-Vektorraum mit positiv-definitem Skalarprodukt 

f. 

S n−1 := {v ∈ V | f(v, v) = 1} bezeichnet die f-Einheitssphäre. 

Sei (e1, ..., en) eine f-Orthonormalbasis und A ∈ R n×n symmetrisch. 

Sei ϕ ∈ Hom(V, V ) die durch A und (e1, ..., en) gegebene Abbildung (nach 239 ist ϕ selbst- 

adjungiert). 

Setze q(v) :=ϕ f(v, v) = f(vϕ, v) = 

i,j aijvivj (wobei v = v1e1 + ... + vnen ∈ V ist). 

Dann hat q| S n−1 (mindestens) eine Extremstelle ˆy, und jede solche Extremstelle ist Eigen- 

vektor von ϕ zum Eigenwert q(ˆy), d.h. 

ˆyϕ = q(ˆy) · ˆy 

Zusatz Im Fall q(ˆy) > 0 gilt für ˆx := ± 1 √ ˆy dann q(ˆx) = 1 und f(ˆx, ˆx) = 

q(ˆy) 1 

q(ˆy) (also: 

ˆx liegt auf der ’Hyperfläche’ {x ∈ V | q(x) = 1}). 

Wenn ˆy, ˜y Eigenvektoren von ϕ zu verschiedenen Eigenwerten sind, gilt f(ˆy, ˜y) = 0 (siehe 

240). 

Illustration 

Vor dem Beweis illustrieren wir das im Fall n = 2, f gewöhnliches Standardskalarprodukt 

von V = R 2 . 

Dann ist char(A) = x2 − (a11 + a22)x + a11a22 − a2 12 . Die Eigenwerte sind 

ˆλ = 1 

2 (a11 + a22) + 1 

 

(a11 − a22) 

2 

2 + 4a2 12 

˜λ = 1 

2 (a11 + a22) − 1 

 

(a11 − a22) 

2 

2 + 4a2 12


wobei ˆ λ = ˜ λ möglich ist. 

Falls ˆ λ > 0 ist, setze ˆx := ± 1 √ ˆy. Dann liegt ˆx ∈ S := {x ∈ V | q(x) = 1} 

q(ˆy) 

und im Eigenraum zum Eigenwert ˆ λ von ϕ. Es gilt f(ˆx, ˆx) = 1 

q(ˆy) = 1/ˆ λ. Analog bei 

˜λ > 0: f(˜x, ˜x) = 1 

q(˜y) = 1/˜ λ. 

Die euklidischen Abstände von ˆx bzw. ˜x (sofern existent) zum Punkt 0 ∈ V (die ’Haupt- 

achsenlängen’) sind also 

1 

ˆλ 

falls die Terme unter der Wurzel > 0 sind. 

und 

1 

˜λ 

Im Fall einer Ellipse (also detA > 0) ist ˆ λ, ˜ λ > 0, oder ˆ λ, ˜ λ < 0 (im letzten Fall die 

Ellipse die leere Menge). 

Im Fall einer Parabel (also detA = 0) ist ˆ λ = 0 oder ˜ λ = 0. 

Im Fall einer Hyperbel (also detA < 0) ist ˆ λ > 0 und ˆ λ < 0 (oder umgekehrt). 

Besonders einfach kann man die Eigenwerte hinschreiben, wenn a12 = 0 ist. Dann ergibt 

sich ˆ λ = a11 und ˜ λ = a22. 

Beweis des Satzes 

Die Abbildung q : V → R ist überall beliebig oft differenzierbar. Die Restriktion q| S n−1 

auf die f-Einheitssphäre ist stetig auf einem Kompaktum, nimmt dort also einen Minimal- 

und Maximalwert an. Sei ˆy ∈ S n−1 eine Extremstelle, sagen wir eine Minimumstelle. 

Um den Satz über lokale Extrema differenzierbarer Funktionen nutzen zu können, definie- 

ren wir 

η : V \ {0} → R, x ↦→ q( 1 

x) = 

x 

1 

f(x, x) q(x) 

Dann gilt xη ≥ q(ˆy) = ˆyη für alle x ∈ V n \ {0}; ˆy ist also eine Minimumstelle von η. Da 

der Definitionsbereich von η eine offene Teilmenge von V ist und η überall (beliebig oft) 

differenzierbar ist, gilt für die partiellen Ableitungen 

Nun ist 

(∗) 

xη = 

∂η 

(ˆy) = 0 für alle i ∈ {1, ..., n} 

∂xi 

1 

q(x) = 

f(x, x) 

für x = x1e1 + ...xnen ∈ V \ {0}, also 

1 

x 2 1 + ... + x2 n 

(x 2 1 + ... + x 2 n) · (xη) = 

i,j 

 

i,j 

aijxixj 

aijxixj


Wir bilden die partielle Ableitung nach xi an der Stelle ˆy und beachten (*) und die 

Produktregel: 

2ˆyi · (ˆyη) = 2 · 

aij ˆyj 

wobei ˆy = ˆy1e1 + ... + ˆynen ist. Zusammen mit ˆyη = q(ˆy) folgt q(ˆy) · ˆy = ˆyϕ. Das bedeutet, 

ˆy ist Eigenvektor von ϕ zum Eigenwert q(ˆy). 

Bemerkung Wenn man nur einsehen will, dass eine symmetrische reelle Matrix A 

mindestens einen (reellen) Eigenwert hat (ohne die Zusatzinformation im vorigen Satz), 

kann man wie folgt argumentieren: 

Satz Sei A = A t ∈ R n×n , n ∈ N. Dann ist char(A) = det(xE − A) ein Produkt normierter 

reeller Polynome vom Grad 1 . Insbesondere hat char(A) eine reelle Nullstelle. 

Beweis. In C[x] gilt: char(A) = det(xE − A) ist ein Produkt von Polynomen der Form 

x − λ (mit λ ∈ C). Für ein beliebiges solches λ ∈ C beweisen wir nun λ ∈ R. 

Sei ψ : C n → C n , v ↦→ vA. Da λ Nullstelle von char(ψ) ist, gibt es v ∈ C n \ {0} mit 

vA = λv. Es folgt (*) vA¯v t = λ · v¯v t (wobei ¯.. das komplex Konjugieren bezeichnet). 

Für die komplexe Zahl vA¯v t , welche auch als Matrix ∈ C 1×1 anzusehen ist, gilt: vA¯v t = 

¯vAv t = (¯vAv t ) t = vAv t (wobei das komplex Konjugieren von Matrizen als Anwenden von 

¯.. auf jeden Eintrag zu verstehen ist und Ā = A benutzt wird). Die Zahl vAvt ist also fix 

unter komplex Konjugieren und deshalb reell. Außerdem gilt v¯v t ∈ R>0. Aus (*) folgt also 

λ ∈ R. 

Satz 242 (Spektralsatz, Formulierung für selbstadjungierte Abbildungen) 

Sei V ein n-dimensionaler R-Vektorraum (n ∈ N) mit positiv-definitem Skalarprodukt 

f : V × V → R. 

Sei ϕ ∈ Hom(V, V ) eine (bezüglich f) selbstadjungierte Abbildung. 

Dann existiert eine f-Orthonormalbasis (e1, ..., en) von V derart, dass jedes ei ein 

ϕ-Eigenvektor ist. 

Insbesondere ist ϕ diagonalisierbar. 

Satz 243 (Spektralsatz, Formulierung für symmetrische Bilinearformen) Sei 

V ein n-dimensionaler R-Vektorraum (n ∈ N) mit positiv-definitem Skalarprodukt 

f : V × V → R. 

Sei g : V × V → R eine symmetrische Bilinearform. 

Dann existiert eine f-Orthonormalbasis (e1, ..., en) von V , welche auch eine g- 

Orthogonalbasis ist. 

j


Satz 244 (Spektralsatz, Formulierung für Matrizen) Sei n ∈ N und A ∈ R n×n 

eine symmetrische Matrix (d.h. A t = A). Dann existiert eine Matrix C ∈ R n×n mit 

C t = C −1 (d.h. die lineare Abbildung zu C bezüglich der Standardbasis des R n ist eine 

orthogonale Abbildung bezüglich des gewöhnlichen Skalarprodukts) und CAC t ist Diago- 

nalmatrix. 

Insbesondere ist jede symmetrische reelle Matrix ähnlich zu einer Diagonalmatrix. 

Beweis der ersten Version Wähle zunächst eine beliebige f-Orthonormalbasis von 

V . Sei A die Matrix von ϕ bezüglich dieser Basis. Da ϕ selbstadjungiert ist, ist nach oben 

Gesagtem A symmetrisch. 

Gemäß vorigem Satz hat ϕ (mindestens) einen Eigenvektor e1 ∈ V \ {0}, e1ϕ = λe1. 

Wir dürfen annehmen f(e1, e1) = 1. 

Falls dimV = 1, sind wir fertig. Sei also dimV ≥ 2. 

Setze W := e⊥ 1 (f-Senkrechtraum in V ). 

Für jedes w ∈ W gilt (da ϕ selbstadjungiert ist) f(e1, wϕ) = f(e1ϕ, w) = λ · f(e1, w) = 0, 

also wϕ ∈ W . D.h. W ist ein ϕ-Modul (invariant unter ϕ). 

Nun betrachte W, f|W ×W , ϕ|W . Dieses Tripel erfüllt die gleichen Voraussetzungen wie 

V, f, ϕ und es gilt dimW = n − 1. Per Induktion können wir also annehmen: W hat eine 

f|W ×W -Orthonormalbasis (e2, ..., en), welche aus Eigenvektoren von ϕ|W besteht. 

Nun ist (e1, e2, ..., en) eine f-Orthonormalbasis von V und jedes ei ist ein ϕ-Eigenvektor. 

Beweis der zweiten Version Wie oben bewiesen wurde, existiert eine f- 

selbstadjungierte Abbildung ϕ ∈ Hom(V, V ) mit g(v, w) = f(vϕ, w) für alle v, w ∈ V . 

Die erste Version des Spektralsatz liefert eine f-Orthonormalbasis (e1, ..., en) aus ϕ- 

Eigenvektoren zu Eigenwerten λi. 

Wir behaupten: (e1, ..., en) ist eine g-Orthogonalbasis. 

Es gilt nämlich g(ei, ej) = f(eiϕ, ej) = λif(ei, ej) = 0 falls i = j. 

Beweis der dritten Version Betrachte V := R n , f sei das Standardskalarprodukt 

von V , g die symmetrische Bilinearform auf V mit Gramscher Matrix A bezüglich der 

Standardbasis (s1, ..., sn). Die zweite Version liefert eine f-Orthonormalbasis (e1, ..., en), 

bezüglich welcher die Gramsche Matrix von g die Form 

⎛ 

⎞ 

⎜ 

G = ⎜ 

⎝ 

λ1 

λ2 

. . . . 

λn 

⎟ 

⎠


hat. Sei C die Matrix mit ei = 

j cijsj (d.h. zur linearen Abb. mit si ↦→ ei bezüglich 

(s1, ..., sn)). 

Die Gramsche Matrix von f bezüglich (s1, ..., sn) ist die Einheitsmatrix E. Die Gramsche 

Matrix von f bezüglich (e1, ..., en) ist auch die Einheitsmatrix E. Nach der Änderungs- 

formel für Gramsche Matrizen gilt E = CEC t = CC t , also C t = C −1 . 

Die Gramsche Matrix von g bezüglich (s1, ..., sn) ist A. Die Gramsche Matrix von 

g bezüglich (e1, ..., en) ist G. Nach der Änderungsformel für Gramsche Matrizen gilt 

G = CAC t . 

Folgerung (Hauptachsentransformation) Sei A ∈ R n×n eine symmetrische Matrix. 

Dann ist S := {x ∈ R n | xAx t = 1} eine symmetrisch zum Nullpunkt liegende ’quadrati- 

sche Hyperfläche’ (bei n = 2 ein Kegelschnitt). 

Sei C ∈ R n×n eine Matrix wie in der 3. Version des Spektralsatz. Dann ist CAC t = 

diag(λ1, ..., λn) für passende λi und 

ψ : R n → R n , x ↦→ xC −1 

(wegen C t = C −1 ) eine orthogonale Abbildung bezüglich gewöhnlichem Skalarprodukt 

des R n . 

Man hat Sψ := {xψ | x ∈ R n , xAx t = 1}. 

Nun ist die Bedingung xAx t = 1 äquivalent zu (xC −1 )(CAC t )(xC −1 )t = 1. Also 

Sψ := {xC −1 | x ∈ R n , (xC −1 )(CAC t )(xC −1 )t = 1} = {y ∈ R n | yCAC t yt = 1} = {y ∈ 

R n | λ1y 2 1 + ... + λny 2 n = 1}. 

Ergebnis: Es existieren eine orthogonale Abbildung ψ ∈ O(R n ) (bezüglich gewöhnlichem 

Skalarprodukt ) und Zahlen λ1, ..., λn ∈ R derart, dass Sψ = {y ∈ R n | λ1y 2 1 + ... + λny 2 n = 

1} ist (Hauptachsengestalt). 

Verallgemeinerung Wir betrachten eine nicht notwendig zum Nullpunkt symmetrische 

quadratische Hyperfläche, welche durch eine symmetrische Matrix A ∈ R (n+1)×(n+1) gege- 

ben ist: S ′ := {x = (x1, ..., xn) ∈ R n | (x, 1)A(x, 1) t = 0}. An+1,n+1 sei die durch Streichen 

der n + 1-ten Zeile und Spalte entstandene Matrix. 

Satz 245 (von der Hauptachentransformation) Zu jeder ’quadratischen Hyper- 

fläche’ S ′ := {x = (x1, ..., xn) ∈ R n | (x, 1)A(x, 1) t = 0} mit detAn+1,n+1 = 0 exi- 

stieren eine Bewegung ϕ des R n und Zahlen λ1, ..., λn ∈ R derart, dass S ′ ϕ = {y ∈ 

R n | λ1y 2 1 + ... + λny 2 n = 1} ist. 

Verbindung zu Optimierungsaufgaben der Analysis


In Analysis II lernt man den 

Satz Sei D ⊆ R n offen, ϕ ∈ C 2 (D, R) und a ∈ D ein kritischer Punkt von ϕ und A die 

Hesse-Matrix von ϕ an der Stelle a. 

Sei g die durch die Gramsche Matrix A bezüglich der Standardbasis des R n gegebene 

symmetrische Bilinearform. Dann gilt: 

a) Falls g positiv definit, hat ϕ ein lokales Minimum in a. 

a’) Falls g negativ definit, hat ϕ ein lokales Maximum in a. 

b) Falls g in a ein lokales Minimum hat, ist f positiv semidefinit. 

b’) Falls g in a ein lokales Maxiimum hat, ist f negativ semidefinit. 

c) Falls g positive und negative Formwerte zuläßt (indefinit ist), ist a kein lokales 

Extremum von ϕ. 

Um den Satz anwenden zu können, muß man also berechnen, ob die durch A bezüglich 

der Standardbasis des R n gegebene symmetrische Bilinearform g positiv definit, oder .... 

ist. 

Nach dem Spektralsatz (Version 3) hat g in einer passenden Basis die Gramsche Matrix 

diag(λ1, ..., λn) = CAC t . Offenbar ist g genau dann positiv definit, wenn λi > 0 für jedes 

i ist. Die Zahlen λi ∈ R sind (wegen C t = C −1 , also A ähnlich zu CAC t ) genau die 

Eigenwerte von A. Denn zueinander ähnliche Matrizen haben gleiches Spektrum. 

Ergebnis: g ist genau dann positiv definit, wenn alle Eigenwerte λi von A positiv sind. 

g ist genau dann negativ definit, wenn alle Eigenwerte λi von A negativ sind. 

g ist genau dann indefinit (d.h. hat positive und negative Formwerte), wenn A positive 

und negative Eigenwerte hat.

Index 

Ähnlichkeit, 86, 153 

Äquivalenzklasse, 23, 104 

Übergangsmatrix, 86 

Abbildung, 9, 11 

einfache, 137 

identisch, 14 

invers, 16 

kanonische, 25 

Nacheinanderausführung, 12 

zyklische, 115 

Abspaltunssatz, 46 

Abstandsfunktion, 129 

Addition 

Matrizen, 81 

Addition von Matrizen, 81 

adjungierte Abbildung, 158 

Aequivalenzrelation, 10, 102 

affine Ebene, 75 

affiner Raum, 74 

alternierende Gruppe, 91 

Antisymmetrie, 10, 102 

Argumentbereich, 11 

assoziiert, 140 

Aufspann, 51 

Ausdehnungsaxiom, 6 

Aussage, 1, 2 

aquivalent, 3 

impliziert, 3 

nicht, 3 

oder, 3 

und, 3 

Auswahlaxiom, 15 

Automorphismus 

innere, 73 

167 

Axiome, 1 

Basis, 56 

Begleitmatrix, 115 

Bewegungsgruppe, 156 

Bijektivitat, 14 

Bild, 12 

Bildbereich, 11 

Bildelement, 11 

Bildmenge, 11 

Bilinearfor 

anisotrope, 127 

Bilinearform, 121 

orthosymmetrische, 121 

symmetrische, 121 

symplektische, 121 

Cauchy-Multiplikation, 44 

Cayley Hamilton 

Satz von, 115 

Cramersche Regel, 101 

Definitionsbereich, 11 

Definitionsmenge, 11 

Determinante, 46, 97 

Berechnung, 97 

Determinantenentwicklungssatz, 100 

Dimension, 60 

Dimensionsformel, 66 

Direkte Summe, 65 

direkte Summe 

außere, 66 

Diskriminante, 132 

Distanztreue, 156 

Dreiecksungleichung, 129 

Dualraum, 88

INDEX 168 

Ebene 

affine, 75 

hyperbolische, 133 

Eigenraum, 112 

Eigenvektor, 112 

Eigenwert, 112 

eineindeutig, 13 

Einheit, 41 

Einheitengruppe, 46 

Einheitsmatrix, 83 

Einheitsquadrat, 39 

Element, 5 

neutral, 33 

Rechtssinvers, 34 

endlich erzeugbar, 51 

Endomorphismenring, 84 

erzeugbar 

endlich, 60 

Erzeugnis, 36 

Elemente, 37 

Vektorraum-, 51 

Euklid, 4 

Existenz eines Rechtsinversen, 34 

Faktorring, 106 

Fallunterscheidung, 3 

Fehlstand, 89 

Formwert, 125 

Formwertformel, 125 

Frobenius-Normalform, 151 

Funktion, 11 

Galois-field, 45 

Gauss-Verfahren, 31 

General linear group, 72 

Gleichheitsaxiom, 6 

Gleichungssystem 

homogen, 28 

lineares, 28 

Grad, 44 

Gradsatz, 45 

Gruppe, 33, 34 

Homomorpismus, 72 

Kern, 72 

Rechenregeln, 34 

symmetrisch, 37 

zyklisch, 38 

Halbgruppe, 33 

Hauptachentransformation, 165 

Hauptideal, 74 

Homomorphismus, 72 

hyperbolische Ebene, 133 

Ideal, 106 

Induktion 

vollständige, 26 

Injektivitat, 13 

Inklusion, 6 

Invariantenteiler, 151 

Invertierbar, 41 

irreduzibel, 140, 143 

Isomorphismus, 67 

Jordan-Normalform, 149 

Kantor, Abzählverfahren, 19 

Kartesisches Produkt, 9 

Kern, 72 

Kern einer linearen Abb., 76 

Kette, 24 

Klasseneinteilung, 103 

kleinstes Element, 24 

Koeffizientenvergleich, 54 

Kollineation, 75

INDEX 169 

kommutativ, 33 

kommutativer Ring, 41 

Komplement, 7 

Vektorraum, 65 

Komplementbildung, 7 

Konjugieren, 73 

konstant, 12 

Konstruktion der komplexen Zahlen, 42 

Koordinatenabbildung, 52 

Lagrange, 39 

linear unabhängig, 55 

Lineare Abbildung, 72 

lineare Abbildungen 

ähnliche, 86 

lineare Gruppe 

spezielle, 98 

Linearkombination, 52 

Linksnebenklasse, 38 

Lotfußpunkt, 129 

Matrix, 28 

invertierbare, 84 

Rang einer, 67 

reguläre, 84 

singuläre, 84 

transponierte, 79 

Matrizen 

ähnliche, 86 

Multiplikation, 81 

Menge, 5 

abzählbar, 17 

abzählbar unendlich, 18 

Basis, 55 

bilden endlicher, 7 

disjunkt, 8 

Durchschnitt, 8 

Element, 5 

endlich, 17 

Gleichheit, 5 

gleichmächtig, 17 

leere, 7 

linear abhängige, 55 

Vereinigung, 7 

minimales Element, 24 

Modul, 115, 140 

Multiplikation von Matrizen, 81 

Nebenklasse, 38 

Normalteiler, 91 

Normfunktion, 129 

Nullpolynom, 44 

Nullteiler, 41 

Orbit, 41 

Ordnungsrelation, 10, 102 

orthogonale Abbildungen, 136 

Orthogonalisierungsverfahren, 127 

orthosymmetrisch, 121 

Paar, 9 

Partition, 23, 103 

Permutation, 14 

Polynom 

charakteristisches, 114 

Polynomfunktion, 45 

Polynomring, 43 

Potenzmenge, 7 

Primärzerlegung, 143 

Primelement, 140 

Primfaktorzerlegung, 143 

Quadratklasse, 132 

Quantor, 8 

Allquantor, 8

INDEX 170 

Existenzquantor, 8 

Rang, 67 

Raum 

affiner, 74 

Reflexivitat, 10, 102 

Repräsentant, 104 

Repräsentantensystem, 104 

Restklassenring, 106 

Restriktion, 12 

Ring, 40, 41 

Satz 

Homomorpismus, 72 

Kern, 72 

mit Eins, 41 

Elemente des Erzeugnis, 37 

Euklid, 4 

Prinzip der Fallunterscheidung, 3 

Schnitt einer Menge von Untergruppen, 

36 

Satz von Lagrange, 39 

Schiefkörper, 41 

Schröder und Bernstein 

Satz von, 21 

Schranke, obere, 24 

selbstadjungiert, 159 

Signatur, 89 

Skalarmultiplikation, 49 

Spaltenrang, 67 

Spektralsatz, 163 

Spektrum, 112 

spezielle lineare Gruppe, 98 

Stabilisator, 41 

Standardbasis, 55 

Standuntergruppe, 41 

Summe 

direkte, 65 

Surjektivitat, 14 

Sylvesterscher Trägheitssatz, 135 

Tautologie, 3 

Teilen mit Rest, 46 

Teiler 

triviale, 140 

Teilmenge, 6 

Teilmengenbildung, 6 

Teilring, 41 

Trägheitssatz von Sylvester, 135 

Transitivitätsgebiet, 41 

Transposition, 37, 89 

Treppenmatrix, 29 

reduzierte, 29 

m-Tupel 

Basis, 55 

Umkehrabbildung, 16 

Untergruppe, 35 

Untergruppenkriterium, 35 

Untervektorraum, 50 

Erzeugter, 51 

Untervektorraumkriterium, 50 

Vektorraum, 49 

Links-, 49 

Unter-, 50 

Verknüpfung, 33 

Vertreter, 23 

Volumen, 93 

Volumenverzerrung, 96 

Weierstraß-Normalform, 146, 147 

Widerspruchsbeweis, 3 

Witt’scher Zerlegungssatz, 133 

Zeilenrang, 67

INDEX 171 

Zeilenumformungen 

elementare, 31 

Zerlegungssatz von Witt, 133 

Zielmenge, 11 

Zykelschreibweise, 98 

Zyklische Gruppe, 38

Kurzer roter Faden zu Lineare Algebra I& II

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?