Vorlesungsskript (pdf): Analysis II

Analysis II 

Prof. Dr. D. Müller 

SoSe 2010

Inhaltsverzeichnis 

1 Integration 5 

1.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 

1.2 Das Riemannsche Integral einer Treppenfunktion . . . . . . . . . . . 6 

1.3 Erweiterung des Integrals . . . . . . . . . . . . . . . . . . . . . . . . . 12 

1.4 Integration und Differentiation . . . . . . . . . . . . . . . . . . . . . . 21 

1.5 Integration rationaler Funktionen . . . . . . . . . . . . . . . . . . . . 28 

1.5.1 Partialbruchzerlegung . . . . . . . . . . . . . . . . . . . . . . 28 

1.5.2 Stammfunktionen rationaler Funktionen . . . . . . . . . . . . 31 

1.5.3 Integration von R(cos x, sin x). . . . . . . . . . . . . . . . . . . 32 

1.6 Taylor-Approximation . . . . . . . . . . . . . . . . . . . . . . . . . . 33 

1.7 Das uneigentliche Riemannsche Integral . . . . . . . . . . . . . . . . . 38 

1.8 Rektifizierbare Kurven . . . . . . . . . . . . . . . . . . . . . . . . . . 40 

2 Normierte Vektorräume 42 

2.1 Grundlegende Begriffe . . . . . . . . . . . . . . . . . . . . . . . . . . 42 

2.2 p-Normen auf K n und die Banachräume l p . . . . . . . . . . . . . . . 43 

2.2.1 Die p-Norm auf dem K n . . . . . . . . . . . . . . . . . . . . . 44 

2.2.2 Die Räume l p (A) . . . . . . . . . . . . . . . . . . . . . . . . . 46 

3 Metrische Räume 50 

3.1 Definitionen und Beispiele . . . . . . . . . . . . . . . . . . . . . . . . 50 

3.2 Die Topologie eines metrischen Raumes . . . . . . . . . . . . . . . . . 53 

3.3 Konvergenz in metrischen Räumen . . . . . . . . . . . . . . . . . . . 58 

3.4 Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 

3.5 Konvergenz von Funktionenfolgen . . . . . . . . . . . . . . . . . . . . 66 

3.6 Die Vervollständigung eines metrischen Raumes* . . . . . . . . . . . 66 

4 Stetige lineare Abbildungen zwischen normierten Vektorräumen 70 

5 Kompaktheit 75 

5.1 Kompakte metrische Räume . . . . . . . . . . . . . . . . . . . . . . . 75 

5.2 Äquivalenz der Normen auf dem R n . . . . . . . . . . . . . . . . . . . 81 

6 Zusammenhang 82 

2

7 Differentialrechnung in mehreren Veränderlichen 84 

7.1 Partielle Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 

7.2 Totale Differenzierbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . 88 

7.3 Der Fall E = R n , F = R m . . . . . . . . . . . . . . . . . . . . . . . . 93 

7.4 Rechenregeln für die Ableitung . . . . . . . . . . . . . . . . . . . . . 97 

7.5 Der verallgemeinerte Mittelwertsatz . . . . . . . . . . . . . . . . . . . 101 

7.6 Ableitungen höherer Ordnung und Taylorapproximation . . . . . . . 103 

7.7 Die Hesse-Form . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 

7.7.1 Schmiegequadriken . . . . . . . . . . . . . . . . . . . . . . . . 110 

7.8 Lokale Extrema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 

8 Der Banachsche Fixpunktsatz 114 

9 Der Satz über implizite Funktionen 116 

9.1 Einleitende Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . 116 

9.2 Satz über implizite Funktion und Satz über Umkehrfunktionen . . . . 118 

Anhang A: Totale Ableitungen höherer Ordnung 126 

Anhang B: Die Gruppe der invertierbaren Elemente einer Banach- 

Algebra 131 

3

Literatur 

[F] O. Forster, Analysis 2. Vieweg Studium 

[B] C. Blatter, Analysis II, Heidelberger Taschenbuch 151 

[AE] A. Amann, J. Escher, Analysis II, Birkhäuser 1998 

[K] K. Königsberger, Analysis 2, Springer-Lehrbuch 1992 

[C] R. Courant, Vorlesungen über Differential- und Integralrechnung 

Bd. 1, Springer 1971 

[Br] Th. Bröcker, Analysis II, BI Wissenschaftsverlag 1992 

[R] W. Rudin, Analysis, Eddison-Wesley 1968 

[L] S. Lang, Real and Functional Analysis, Springer Graduate Texts in 

Math., 1993 

[D] J. Dieudonné, Foundations of modern analysis, Academic Press 

1960 

[HS] E. Hewitt, K. Stromberg, Real and Abstract Analysis, Springer 

1969 

4

Kapitel 1 

Integration 

1.1 Motivation 

Eines der Probleme, welches zur Einführung des Begriffes des Integrals geführt hat, 

ist die Berechnung des Flächeninhalts eines krummlinig berandeten Flächenstückes 

der Ebene. Durch Zerlegung in endliche viele Teilstücke läßt sich dieses i.a. auf 

folgendes Problem zurückführen: 

Es sei I = [a, b] ein kompaktes Intervall und f : I → R + 0 eine geeignete“, z.B. 

” 

stetige Funktion. Wie läßt sich der Flächeninhalt der Fläche 

A := {(x, y) ∈ R 2 : a ≤ x ≤ b, 0 ≤ y ≤ f(x)} 

zwischen dem Graphen von f und der x-Achse bestimmen? 

In der obigen Form ist die Frage genau genommen noch nicht einmal richtig formuliert. 

Sie suggeriert nämlich, daß ein solcher ” 

Flächeninhalt“ existieren muß – dies 

entspricht zwar unserer Intuition, verschleiert aber die Tatsache, daß die ” 

Berechnung“ 

des Flächeninhalts zunächst einmal eine sinnvolle Definition voraussetzt. Die 

obige Frage sollte also genauer die nach der Definition des Flächeninhalts einschließen. 

Folgender Weg zur Lösung dieses Problems liegt nahe: Man ” 

approximiere“ die 

Fläche A durch Flächen A n , welche sich aus endlich vielen achsenparallelen Rechtecken, 

deren untere Kanten auf der x-Achse liegen, zusammensetzen, berechne auf 

die offenkundige Art und Weise den Flächeninhalt |A n | von A n , und bestimme den 

Grenzwert der Folge der |A n | für n → ∞, wobei für n → ∞ die ” 

Güte der Approximation“ 

immer besser werden sollte. Den Grenzwert |A| = lim n→∞ |A n |, vorausgesetzt 

er existiert, wird man dann als den Flächeninhalt von A bezeichnen. 

5

λ 1 

A n 

λ 0 

a = a 0 a 1 a 2 a 3 a 4 a 5 a 6 b = a 7 

Natürlich muß hier noch zusätzlich festgelegt werden, was wir unter einer Approximation 

von A durch A n sowie ihrer Güte verstehen wollen. 

Die Berechnung der Flächeninhalte der A n ist dagegen unstrittig. Ordnen wir 

nämlich die Rechtecke, aus denen A n sich zusammensetzt, von links nach rechts, 

so bilden ihre unteren Kanten eine Zerlegung des Intervalls [a, b] in Intervalle 

[a 0 , a 1 ], [a 1 , a 2 ], . . .,[a m−1 , a m ], 

mit a 0 = a, a m = b (welche strenggenommen noch von n abhängt). Besitzt das 

Rechteck mit Basis [a j , a j+1 ] die Höhe λ j , so wird man den Flächeninhalt von A n 

als 

(1.1) |A n | := 

m−1 

∑ 

j=0 

λ j (a j+1 − a j ) 

definieren. Definiert man die Funktion f n : I → R durch 

⎧ 

λ j , falls x ∈]a j , a j+1 [, 

⎪⎨ 

max{λ j−1 , λ j } falls x = a j , 1 ≤ j ≤ m − 1, 

f n (x) := 

λ 0 falls x = a, 

⎪⎩ 

λ m−1 falls x = b, 

so ist übrigens 

A n = {(x, y) ∈ R 2 : a ≤ x ≤ b, 0 ≤ y ≤ f n (x)}. 

Man bezeichnet |A n | daher auch als das ” 

Integral der Treppenfunktion“ f n . 

1.2 Das Riemannsche Integral einer Treppenfunktion 

Es sei daran erinnert, daß für eine gegebene Teilmenge A ⊂ R mit 1 A ∈ R R die 

charakteristische Funktion 

{ 

1, falls x ∈ A, 

1 A (x) := 

0, falls x ∈ R \ A, 

6

ezeichnet wird. 

Definitionen. Eine Funktion f ∈ C R heiße Treppenfunktion, wenn es endlich 

viele, beschränkte Intervalle I 1 , . . .,I n gibt sowie komplexe Zahlen λ 1 , . . ., λ n ∈ C, 

so daß 

n∑ 

f = λ k 1 Ik 

k=1 

ist. Es bezeichne T die Menge aller Treppenfunktionen auf R. Offenbar bildet die 

Menge C R aller komplexwertigen Funktionen auf R einen Vektorraum über dem 

Körper der komplexen Zahlen, und T ⊂ C R einen linearen Teilraum, und zwar gerade 

denjenigen, welcher von der Menge aller charakteristischen Funktionen endlicher 

Intervalle aufgespannt wird. 

T bildet wie auch C R sogar eine kommutative Algebra, da mit f und g auch 

die Funktionen f + g, λf für alle λ ∈ C sowie fg zu T gehören, und neben den 

Vektorraumaxiomen auch noch folgende Rechenregeln gelten für alle f, g, h ∈ T und 

λ ∈ C : 

(i) (λf)g = f(λg) = λ(fg); 

(ii) f(g + h) = fg + fh; 

(iii) fg = gf. 

Ferner liegt mit f auch die durch 

|f|(x) := |f(x)|, x ∈ R, 

definierte Funktion |f| in T . Da auch jede einpunktige Menge ein Intervall ist, enthält 

T auch die Menge 

N := {f : R → C : f(x) ≠ 0 für höchstens endlich viele x ∈ R}. 

N ist ein Ideal in T , d.h. N ist eine Unteralgebra von T mit der zusätzlichen 

Eigenschaft, daß aus f ∈ T und g ∈ N stets fg ∈ N folgt (N ist sogar ein Ideal in 

C R ). Wir schreiben 

f ≡ g, falls f − g ∈ N, 

und nennen f und g kongruent (modulo N), falls f ≡ g. Offensichtlich ist durch 

≡“ eine Äquivalenzrelation auf T definiert. 

” 

Lemma 1.1 Zu jedem f ∈ T existieren endlich viele Punkte x 0 < x 1 < · · · < x m 

in R sowie Zahlen µ 0 , . . .,µ m−1 , so daß 

m−1 

∑ 

f ≡ µ j 1 ]xj ,x j+1 [ . 

j=0 

7

Beweis. Es sei f = ∑ n 

k=1 λ k1 Ik , und es bezeichne a k ≤ b k die Endpunkte des Intervalls 

I k , d.h. ]a k , b k [⊂ I k ⊂ [a k , b k ]. Wir ordnen die Menge E aller dieser Endpunkte 

a k und b k der Größe nach: E = {x 0 , . . .,x m }, wobei x j < x j+1 sei, falls m ≥ 1 und 

0 ≤ j ≤ m − 1. 

Ist nun etwa a k = x pk , b k = x qk mit p k ≤ q k , so ist offenbar 

1 Ik ≡ 

q k −1 

∑ 

j=p k 

1 ]xj ,x j+1 [ . 

Berücksichtigen wir, daß aus g i ≡ h i für i = 1, . . ., n stets ∑ n 

i=1 α ig i ≡ ∑ n 

i=1 α ih i 

folgt (wieso?), so ergibt sich aus der letzten Kongruenz und Vertauschung der Reihenfolge 

der Summation in k und j: 

mit 

f ≡ 

= 

n∑ 

k=1 

m−1 

∑ 

j=0 

µ j := 

( qk−1 

∑ 

λ k 

j=p k 

1 ]xj ,x j+1 [ 

µ j 1 ]xj ,x j+1 [ , 

∑ 

{k: p k ≤j≤q k −1} 

Lemma 1.2 Es sei f = ∑ n 

k=1 λ k1 Ik ∈ T . Ist f ≡ 0, so ist 

n∑ 

λ k (b k − a k ) = 0, 

k=1 

λ k . 

wobei a k ≤ b k die Endpunkte des Intervalls I k seien. 

) 

Q.E.D. 

Beweis. Wir wählen x 0 < x 1 < · · · < x m gemäß dem Beweis des vorherigen Lemmas, 

so daß 

f ≡ 

m−1 

∑ 

j=0 

µ j 1 ]xj ,x j+1 [ 

ist, mit µ j := ∑ {k:p k ≤j≤q k −1} λ k. 

Da f ≡ 0 ist, ist µ j = 0 für j = 0, . . .,m − 1, d.h. 

∑ 

λ k = 0, j = 0, . . .,m − 1. 

{k: p k ≤j≤q k −1} 

Ferner ist 

b k − a k = 

q k −1 

∑ 

j=p k 

(x j+1 − x j ). 

8

Somit folgt 

n∑ 

λ k (b k − a k ) = 

k=1 

= 

n∑ 

k=1 

⎛ 

m−1 

∑ 

(x j+1 − x j ) ⎝ 

j=0 

( 

qk −1 

∑ 

λ k 

j=p k 

(x j+1 − x j ) 

∑ 

{k: p k ≤j≤q k −1} 

) 

λ k 

⎞ 

⎠ = 0. 

Q.E.D. 

Bezeichnen wir mit |I| := (b − a) die Länge des endlichen Intervalls I mit den 

Endpunkten a ≤ b, so erhalten wir als Konsequenz 

Korollar 1.3 Sind f = ∑ n 

k=1 λ k1 Ik und g = ∑ m 

i=1 µ i1 Ji zwei Treppenfunktionen, 

und ist f ≡ g, so ist 

n∑ m∑ 

λ k |I k | = µ i |J i |. 

k=1 

Beweis. Sei h := f − g = ∑ n 

k=1 λ k1 Ik + ∑ m 

i=1 (−µ i1 Ji ). Da h ≡ 0 ist, gilt nach 

Lemma 1.2 : 

n∑ m∑ 

λ k |I k | + (−µ i )|J i | = 0 . 

k=1 

Hieraus folgt die behauptete Identität. 

i=1 

i=1 

Q.E.D. 

Wir können nun definieren: Ist f = ∑ n 

k=1 λ k1 Ik ∈ T , so sei das Integral ∫ f(x) dx 

die durch 

∫ 

n∑ 

f(x) dx := λ k |I k | 

definierte komplexe Zahl. 

Das Korollar 1.3 garantiert, daß ∫ f(x) dx wohldefiniert ist, d.h. nicht von der Darstellung 

f = ∑ n 

k=1 λ k1 Ik abhängt. Es zeigt darüberhinaus: 

∫ 

f(x) dx hängt nur von der Kongruenzklasse von f (mod N) ab. Anders formuliert: 

Das Integral von f ändert sich nicht, wenn man f an endlich vielen Stellen abändert. 

k=1 

Insbesondere sehen wir: Ist f ≡ ∑ m−1 

j=0 µ j1 ]xj ,x j+1 [, mit x 0 < x 1 < · · · < x m , so ist 

(1.2) 

in Übereinstimmung mit (1.1). 

∫ 

f(x) dx = 

m−1 

∑ 

j=0 

9 

µ j (x j+1 − x j ),

Wir werden statt ∫ f(x) dx oft kürzer ∫ f dx oder auch nur ∫ f schreiben. 

Die Abbildung f ↦→ ∫ f ist offenbar eine Linearform auf dem komplexen Vektorraum 

T – dies folgt unmittelbar aus unserer Definition von ∫ f. 

Ist f eine komplexwertige Treppenfunktion, so sind ihr Realteil Re f und ihr Imaginärteil 

Im f ebenfalls Treppenfunktionen. Aus f = (Ref) + i(Im f) folgt mittels 

der Linearität des Integrals: 

∫ ∫ ∫ 

(1.3) f dx = (Re f) dx + i (Im f) dx, f ∈ T . 

Aus (1.2) liest man ferner leicht die folgenden Eigenschaften des Integrals ab: 

(i) Ist f ∈ T reellwertig, so ist ∫ f dx ∈ R. 

(ii) Ist f ∈ T reellwertig, und ist f(x) ≥ 0 für alle x ∈ R, so ist ∫ f dx ≥ 0. 

(iii) Das Integral erfüllt die folgende Dreiecksungleichung“: 

” ∫ 

∫ 

∣ f(x) dx∣ ≤ |f(x)| dx für alle f ∈ T . 

Mittels der Linearität des Integrals läßt sich (ii) übrigens wie folgt verallgemeinern: 

(ii ′ ) Sind f, g ∈ T reellwertig, und ist f ≥ g (d.h. f(x) ≥ g(x) für alle x ∈ R), so 

ist 

∫ ∫ 

f dx ≥ g dx . 

Aus f ≥ g folgt nämlich (f − g) ≥ 0, also nach (ii) 

∫ ∫ ∫ 

0 ≤ (f − g) dx = f dx − 

g dx . 

Definitionen. Ist [a, b] ein kompaktes Intervall, und ist f ∈ T , so ist auch 1 [a,b] f ∈ 

T , und wir definieren das Integral von f von a nach b durch 

∫ b ∫ 

f(x) dx := 1 [a,b] f dx. 

a 

Für eine beliebige, nichtleere Menge X bezeichne B(X) die Menge aller beschränkten 

Funktionen f : X〉 C. Offenbar bildet B(X) einen linearen Teilraum des Raumes C X . 

Für f ∈ B(X) ist dann 

wohldefiniert, und es gilt insbesondere 

‖f‖ u := sup{|f(x)| : x ∈ X} ∈ R + 0 

(1.4) |f(x)| ≤ ‖f‖ u für alle x ∈ X. 

10

Lemma 1.4 Für alle f ∈ T gilt 

∫ b 

∣ f(x) dx 

∣ ≤ ‖f‖ u (b − a). 

Beweis. Nach (iii) ist 

∣ 

∫ b 

a 

a 

∫ 

f(x) dx∣ = ∣ 

∫ 

1 [a,b] f dx∣ ≤ 1 [a,b] |f| dx. 

Ferner ist |f| ≤ ‖f‖ u 1, also nach (ii ′ ) 

∫ ∫ 

1 [a,b] |f| dx ≤ 1 [a,b] ‖f‖ u dx = ‖f‖ u (b − a). 

Q.E.D. 

Bemerkungen 1.5 a) Für ‖ · ‖ u weist man folgende Eigenschaften für alle f, g ∈ 

B(X) und λ ∈ C nach (Übung), welche denen des Absolutbetrags einer reellen oder 

komplexen Zahl ähneln: 

(a) ‖f‖ u = 0 ⇔ f = 0; 

(b) ‖λf‖ u = |λ| ‖f‖ u ; 

(c) ‖f + g‖ u ≤ ‖f‖ u + ‖g‖ u ; 

(d) ‖f‖ u = ‖f‖ u ; 

(e) ‖fg‖ u ≤ ‖f‖ u ‖g‖ u . 

Z.B. folgt aus (1.4) 

|f(x) + g(x)| ≤ |f(x)| + |g(x)| ≤ ‖f‖ u + ‖g‖ u , 

und somit aufgrund der Definition des Supremums ‖f + g‖ u ≤ ‖f‖ u + ‖g‖ u . Die 

übrigen Eigenschaften folgen ähnlich leicht. 

b) Die Eigenschaften (a) bis (c) bedeuten, daß ‖ · ‖ u eine sogenannte Norm auf 

dem Vektorraum B(X) ist – auf diesen Begriff werden wir in Kapitel 2 ausführlicher 

eingehen. ‖f‖ u bezeichnet man als die Supremumsnorm von f. 

c) Mit Hilfe dieser Supremumsnorm läßt sich die gleichmäßige Konvergenz einer 

Funktionenfolge (f n ) n in B(X) gegen eine Funktion f ∈ B(X) ähnlich beschreiben 

wie die Konvergenz einer Zahlenfolge mit Hilfe des Absolutbetrages: 

(f n ) n konvergiert dann und nur dann gleichmäßig gegen f , wenn gilt: 

(1.5) lim 

n→∞ 

‖f − f n ‖ u = 0. 

11

Für jedes ε > 0 gilt nämlich offenbar 

|f n (x) − f(x)| ≤ ε für alle x ∈ X 

genau dann, wenn 

‖f n − f‖ u ≤ ε. 

1.3 Erweiterung des Integrals 

Wir wollen nun das Integral auf eine größere Klasse von Funktionen erweitern. Dazu 

beobachten wir folgende Konsequenz aus Lemma 1.4: 

Lemma 1.6 Es seien a, b ∈ R mit a ≤ b. Ist f ∈ C R der gleichmäßige Limes einer 

Folge von Treppenfunktionen (f n ) n∈N , so bildet die Folge der Integrale ( ∫ b 

f a n dx) 

∫ n∈N 

b 

eine Cauchy-Folge in C. Insbesondere existiert der Grenzwert I = lim n→∞ f a n dx. 

Dieser hängt nur ab von f, nicht jedoch von der approximierenden Folge (f n ) n∈N . 

Beweis. Sei nun ε > 0, und es gelte (1.5). Dann gibt es ein n 0 ∈ N, so daß gilt: 

‖f − f n ‖ u < ε/2 für alle n ≥ n 0 . 

Für n, m ≥ n 0 erhält man somit mittels Bemerkung 1.5 

(1.6) 

‖f n − f m ‖ u 

= ‖(f − f n ) − (f − f m )‖ u 

≤ ‖f − f n ‖ u + ‖f − f m ‖ u < ε 2 + ε 2 = ε. 

Die Folge (f n ) n bildet also eine gleichmäßige Cauchy-Folge“. Für n, m ≥ n ” 0 folgt 

zusammen mit Lemma 1.4 : 

∣ 

∫ b 

a 

f n dx − 

∫ b 

a 

f m dx∣ = 

≤ 

∣ 

∫ b 

a 

(f n − f m ) dx∣ 

(b − a)‖f n − f m ‖ u < (b − a)ε. 

Dies zeigt, daß die Folge ( ∫ b 

a f n dx) n∈N eine Cauchy-Folge in C bildet. Sei 

I := lim 

n→∞ 

∫ b 

a 

f n dx. 

Sei ferner (g n ) n eine weitere Folge in T , welche gleichmäßig gegen f konvergiert, und 

∫ b 

sei J = lim g 

n→∞ a n dx. 

12

Wegen 

ist dann offenbar 

‖f n − g n ‖ u = ‖(f n − f) + (f − g n )‖ u 

≤ 

‖f n − f‖ u + ‖f − g n ‖ u 

lim ‖f n − g n ‖ u = 0. 

n→∞ 

Wieder mittels Lemma 1.4 folgt hieraus: 

∫ b 

lim 

∣ (f n − g n ) dx 

∣ = 0, 

n→∞ 

a 

∫ b 

und somit I = lim f ∫ b 

n→∞ a n dx = lim g 

n→∞ a n dx = J. 

Q.E.D. 

Definitionen. Eine Funktion f : R → C, die sich als Limes einer gleichmäßig 

konvergenten Folge (f n ) n aus T darstellen läßt, wird als Regelfunktion bezeichnet. 

Es sei R die Menge aller solcher Regelfunktionen. Sind (f n ) n bzw. (g n ) n Folgen in 

T , welche gleichmäßig gegen f bzw. g aus R konvergieren, so weist man mittels 

Bemerkung 1.5 ganz analog wie für konvergente Zahlenfolgen nach, daß die Folge 

(f n + g n ) n gleichmäßig gegen f + g, die Folge (f n g n ) n gleichmäßig gegen fg und die 

Folge (αf n ) n gleichmäßig gegen αf konvergiert, für jedes α ∈ C. Dies zeigt, daß mit 

f und g aus R sowie α ∈ C auch f + g, αf und fg in R liegen, d.h. daß auch R 

eine Algebra ist. Ähnlich zeigt man, daß mit f ∈ R auch |f|, Re f und Im f in R 

liegen. 

Aufgrund von Lemma 1.6 können wir nun definieren: 

Sei f ∈ R, und sei (f n ) n eine Folge in T , welche gleichmäßig gegen f konvergiert. 

Seien a, b ∈ R mit a ≤ b. Die Zahl 

∫ b 

a 

f(x) dx = lim 

n→∞ 

∫ b 

a 

f n (x) dx 

heißt das Riemannsche Integral der Funktion f über das Intervall [a, b] 

(oder ” 

von a bis b“). 

Satz 1.7 (Eigenschaften des Integrals) (i) Für feste a ≤ b ist die Abbildung 

f ↦→ ∫ b 

f(x) dx komplex linear von R nach C, d.h. es gilt 

a 

∫ b 

(αf + βg) dx = α 

∫ b 

f dx + β 

∫ b 

a 

a 

a 

für alle f, g ∈ R, α, β ∈ C. 

g dx 

(Linearität) 

13

(ii) Ist f ∈ R reellwertig, so ist ∫ b 

f dx ∈ R. 

a 

Ist zusätzlich f ≥ 0, so ist ∫ b 

f dx ≥ 0. D.h., aus f, g ∈ R, f ≤ g, folgt 

a 

Ferner gilt 

∫ b 

a 

f dx ≤ 

∫ b 

a 

g dx. 

∫ b 

1 dx = b − a. (Normierung) 

a 

(iii) Es gilt die Dreiecksungleichung“ 

” ∫ b 

∫ b 

∣ f dx 

∣ ≤ |f| dx, f ∈ R . 

(iv) Sind a, b, c ∈ R mit a ≤ b ≤ c, so gilt für f ∈ R: 

(1.7) 

Beweis. 

∫ c 

a 

f dx = 

∫ b 

a 

a 

f dx + 

∫ c 

b 

a 

f dx. 

(Monotonie) 

(Bereichsadditivität) 

(i) Sind (f n ) n bzw. (g n ) n Folgen in T , welche gleichmäßig gegen f bzw. g konvergieren, 

so folgt mittels Bemerkung 1.5: 

Somit ist 

lim ‖(αf + βg) − (αf n + βg n )‖ u = 0. 

n→∞ 

∫ b 

a 

(αf + βg) dx = lim 

= lim 

n→∞ 

(α 

= α lim 

= α 

∫ b 

a 

∫ b 

n→∞ 

a 

∫ b 

a 

f dx + β 

n→∞ 

∫ b 

f n dx + β 

(αf n + βg n ) dx 

a 

∫ b 

a 

f n dx + β lim 

∫ b 

a 

g n dx) 

n→∞ 

∫ b 

g dx . 

a 

g n dx 

(ii) Ist f ∈ R reellwertig, und ist f der gleichmäßige Limes der Folge (f n ) n aus T , 

so konvergiert wegen ‖f − Re(f n )‖ u := ‖Re(f − f n )‖ u ≤ ‖f − f n ‖ u auch die 

Folge (Ref n ) n aus T gleichmäßig gegen f, d.h. man kann o.B.d.A. annehmen, 

daß die Folge (f n ) n aus reellwertigen Funktionen besteht. Damit ist 

∫ b 

a 

f dx = lim 

n→∞ 

∫ b 

a 

f n dx ∈ R. 

Ist zusätzlich f ≥ 0, so kann man, indem man f n durch max{0, f n } ersetzt, 

zusätzlich f n ≥ 0 für alle n annehmen, so daß ∫ b 

f dx ≥ 0 folgt. 

a 

14

(iii) Ist f der gleichmäßige Limes der Folge (f n ) n aus T , so konvergiert die Folge 

(|f n |) n gleichmäßig gegen |f|. Es folgt: 

∣ 

∫ b 

a 

≤ 

∣ ∫ b 

∣ ∫ b 

∣∣ ∣∣ f dx∣ = lim f n dx∣ = lim f n dx∣ 

n→∞ n→∞ 

∫ b 

lim |f n | dx = lim 

n→∞ 

a 

a 

n→∞ 

∫ b 

da die Dreiecksungleichung ja für f n ∈ T gilt. 

a 

a 

|f n | dx = 

∫ b 

a 

|f| dx, 

(iv) Sei wieder f der gleichmäßige Limes der Folge (f n ) n aus T . Für jedes n ∈ N 

gilt: 

1 [a,c] f n =1 [a,b] f n +1 [b,c] f n −1 {b} f n (b), 

also 

∫ c 

a 

f n dx = 

∫ b 

a 

f n dx + 

∫ c 

b 

f n dx. 

Durch Grenzübergang für n → ∞ folgt die Identität (1.7). 

Bemerkung 1.8 Für f ∈ R und a > b setzen wir gelegentlich auch 

∫ b 

a 

f dx := − 

∫ a 

b 

f dx. 

Q.E.D. 

Man prüft leicht nach, daß die Gleichung (1.7) dann für beliebige a, b, c ∈ R gültig 

ist. 

Welche Funktionen sind in R enthalten? 

Definitionen. Wir sagen eine Funktion f : R → C verschwinde im Unendlichen, 

falls für jedes ε > 0 die Menge {x ∈ R : |f| ≥ ε} beschränkt ist. Hiermit 

äquivalent ist: 

Zu jedem ε > 0 existiert ein C ≥ 0 mit |f(x)| < ε für alle x ∈ R mit |x| ≥ C, d.h. 

lim |f(x)| = 0. 

|x|→∞ 

f heiße stückweise stetig, wenn es eine streng monoton wachsende ” 

Folge“(x k ) k∈Z 

von Punkten x k ∈ R gibt mit 

x k → −∞ für k → −∞ 

und x k → +∞ für k → +∞, 

sowie Funktionen F k ∈ C( [x k , x k+1 ]), k ∈ Z, so daß 

f ∣ = F ∣ 

]xk ,x k+1 [ k 

gilt für alle k ∈ Z. 

15 

∣ 

]xk ,x k+1 [

Satz 1.9 R enthält alle stückweise stetigen im Unendlichen verschwindenden Funktionen 

auf R. 

Der Schlüssel zum Beweis dieses Satzes liegt in der folgenden Definition und dem 

anschließenden Satz. 

Definition. Es sei A ⊂ R (oder auch A ⊂ C). Die Funktion f : A → C heiße 

gleichmäßig stetig, wenn es zu jedem ε > 0 ein δ = δ(ε) > 0 gibt, so daß gilt: 

(1.8) |f(x) − f(y)| < ε für alle x, y ∈ A mit |x − y| < δ . 

Offenbar ist eine gleichmäßig stetige Funktion f : A → C stetig auf A; die Umkehrung 

hiervon ist jedoch falsch. 

Beispiel. Die Funktion f(x) = sin 1 ist stetig auf x R+ , jedoch nicht gleichmäßig 

stetig. Für x n := 1 , y 2πn n := 1 , n ∈ N, n ≥ 1, gilt nämlich: 

2πn+ π 2 

und 

|f(x n ) − f(y n )| = |0 − 1| = 1, 

|x n − y n | = 

π/2 

(2πn)(2πn + π 2 ) → 0 

für n → ∞. Zu ε = 1 kann es hier also kein δ > 0 mit der Eigenschaft (1.8) geben. 

Theorem 1.10 Ist I ⊂ R ein kompaktes Intervall, so ist jede stetige Funktion 

f : I → C gleichmäßig stetig. 

Beweis (durch Widerspruch). 

Wir nehmen an, daß f ∈ C(I) nicht gleichmäßig stetig ist. Dann gibt es ein ε > 0, 

sowie zu jedem δ := 1 n (n ∈ N, n ≥ 1) ein Paar x n, y n in I mit |x n − y n | < 1 n und 

|f(x n ) − f(y n )| ≥ ε. Dies impliziert insbesondere, daß lim n→∞ |x n − y n | = 0 ist. 

Da I ein kompaktes Intervall ist, gibt es nach dem Satz von Bolzano-Weierstraß eine 

Teilfolge (x nk ) k der Folge (x n ) n , welche gegen ein ξ ∈ I konvergiert. Durch Übergang 

zu dieser Teilfolge können wir o.B.d.A. annehmen, daß die Folge (x n ) n bereits gegen 

ξ konvergiert. Wegen lim n→∞ |x n − y n | = 0 ist dann auch lim n→∞ y n = ξ. 

Da f im Punkte ξ stetig ist, folgt damit: 

f(ξ) = lim 

n→∞ 

f(x n ) = lim 

n→∞ 

f(y n ), 

also 

0 = lim 

n→∞ 

|f(x n ) − f(y n )|. 

Dies steht im Widerspruch zu |f(x n ) − f(y n )| ≥ ε, ∀n ≥ 1. 

Q.E.D. 

16

Beweis von Satz 1.9. 

Es sei f : R → C stückweise stetig und verschwinde im Unendlichen. Sei (x k ) k∈Z 

eine Familie von Punkten x k ∈ R mit x ±k → ±∞ für k → ∞, x k < x k+1 für alle 

k ∈ Z, und F k ∈ C([x k , x k+1 ]) mit f ∣ = F ∣ 

]xk ,x k+1 [ k . ]xk ,x k+1 [ 

Sei ε > 0. Dazu gibt es ein C > 0, so daß 

|f(x)| ≤ ε für alle x mit |x| ≥ C. 

In dem beschränkten Intervall [−C, C] liegen nur endlich viele der Punkte x k , sagen 

wir x p , x p+1 , . . .,x p+l . Wir setzen 

ξ 0 := −C, ξ 1 := x p , . . .,ξ l+1 := x p+l , ξ l+2 := C. 

Indem wir C ggf. leicht vergrößern dürfen wir o.B.d.A. annehmen, daß 

−C = ξ 0 < ξ 1 < · · · < ξ l+2 = C. 

Da die Funktion F k nach Theorem 1.10 gleichmäßig stetig ist auf dem Intervall 

[x k , x k+1 ], ist für j = 0, . . ., l + 1 die Funktion f ∣ ]ξj ,ξ j+1 

gleichmäßig stetig auf dem 

[ 

Intervall I j :=]ξ j , ξ j+1 [. Ferner ist [−C, C] = l+1 ⋃ 

I j ∪ {ξ 0 , . . .,ξ l+2 }. 

j=0 

Für festes j gibt es also zu ε > 0 ein δ j > 0, so daß gilt: 

|f(x) − f(y)| < ε für alle x, y ∈ I j mit |x − y| < δ j . 

Es sei o.B.d.A. N j := ξ j+1−ξ j 

δ j 

∈ N. Wir setzen nun 

a i := ξ j + iδ j , i = 0, . . .,N j . 

Das Intervall I j zerfällt dann in die Teilintervalle 

]a 0 , a 1 ], ]a 1 , a 2 ], . . .,]a Nj −1, a Nj [, 

welche alle die Länge δ j haben. 

Wir wählen zu jedem i = 0, . . ., N j − 1 einen Punkt b i in dem zugehörigen Teilintervall 

aus, und setzen 

ϕ j := 

N j −1 

∑ 

i=0 

f(b i )1 ]ai ,a i+1 [ + 

N j −1 

∑ 

i=1 

f(a i )1 {ai } . 

Dann ist ‖(f − ϕ j ) ∣ ∣ 

Ij 

‖ u ≤ ε, denn ist x ∈ I j , so existiert ein i mit x ∈]a i , a i+1 [, oder 

x = a i . Im ersten Falle ist |f(x) − ϕ j (x)| = |f(x) − f(b i )| < ε, da |x − b i | < δ j ist, 

und im zweiten Falle ist 

|f(x) − ϕ j (x)| = |f(a i ) − f(a i )| = 0 < ε . 

17

Setzen wir schließlich 

∑l+1 

∑l+2 

ϕ := ϕ j + f(ξ j )1 {ξj } , 

j=0 j=0 

so ist ϕ ∈ T , und es gilt offenbar 

‖f − ϕ‖ u ≤ ε . 

Insbesondere erhalten wir auf diese Weise zu jedem ε = 1/n, n ∈ N, n ≥ 1, ein ϕ n 

in T mit ‖f − ϕ n ‖ u ≤ 1/n . Damit ist f ∈ R. 

Q.E.D. 

Es sei [a, b] ein kompaktes Intervall. Eine Funktion f : [a, b] → C heiße auf [a, b] 

integrierbar, falls die durch 

{ 

f(x), falls x ∈ [a, b], 

˜f(x) := 

0, falls x /∈ [a, b], 

definierte Funktion ˜f, die sogenannte triviale Fortsetzung von f, in R liegt. Die 

komplexe Zahl 

∫ b 

a 

f(x) dx := 

heißt das Riemannsche Integral von f. 

∫ b 

a 

˜f(x) dx 

Satz 1.9 zeigt, daß jede (stückweise) stetige Funktion auf [a, b] integrierbar ist. Genauer 

zeigt der Beweis sogar folgendes: 

Sind x 0 = a < x 1 < · · · < x n = b Punkte in [a, b], welche eine Zerlegung des 

Intervalls [a, b] in die Teilintervalle I j := [x j , x j+1 ] der Länge ∆ j := x j+1 −x j liefern, 

und sind b j ∈ I j , j = 0, . . .,n − 1, beliebige Stützstellen im Intervall I j , so läßt 

sich zu diesen Daten die Riemann-Summe zu f der Gestalt 

∑n−1 

∑n−1 

f(b j )(x j+1 − x j ) = f(b j )∆ j , 

j=0 

bilden. Zu jedem ε > 0 gibt es dann ein δ > 0, so daß für jede Riemann-Summe mit 

Feinheit max ∆ j < δ gilt: 

j=0,...,n−1 

j=0 

(1.9) 

∣ 

∫ b 

∑n−1 

∣ ∣∣ 

f(x) dx − f(b j )∆ j < ε. 

a 

j=0 

Das Integral ∫ b 

f(x) dx ist also der Grenzwert jeder Folge von Riemann-Summen zu 

a 

f, deren Feinheiten gegen Null streben! 

18

Dagegen ist die Dirichlet-Funktion ϕ := 1 Q : R → R, nicht integierbar über [0, 1] 

(Übung). 

Wann kann man aus der Konvergenz einer Folge (f n ) n integrierbarer Funktionen f n 

gegen eine Funktion f schließen, daß auch die Grenzfunktion f integrierbar ist, und 

daß die Integrale der f n gegen das Integral von f streben? 

Das Beispiel der Dirichlet-Funktion zeigt bereits, daß hierfür die punktweise Konvergenz 

der f n gegen f nicht ausreicht. 

Ist nämlich (x n ) n∈N eine Abzählung der Punkte in Q ∩ [0, 1], und setzen wir 

ϕ n := 

n∑ 

1 {xj } , 

j=0 

so ist offenbar ϕ der punktweise Limes der Folge der (ϕ n ) n , welche alle in T liegen, 

also integrierbar sind auf [0, 1] (übrigens ist 

∫ 1 

0 

ϕ n dx = 0 für alle n ∈ N). 

Satz 1.11 Ist (f n ) n eine Folge integrierbarer Funktionen auf [a, b], und konvergiert 

diese gleichmäßig gegen f : [a, b] → C, so ist auch f integrierbar auf [a, b], und es 

gilt 

lim 

n→∞ 

∫ b 

a 

f n dx = 

∫ b 

a 

f dx. 

Beweis. Seien ˜f n und ˜f die oben definierten Fortsetzungen der f n und f auf ganz 

R. Dann liegen die ˜f n in R und konvergieren gleichmäßig gegen ˜f. Ist nun h n ∈ T 

mit ‖ ˜f n − h n ‖ u < 1 , so folgt aus 

n 

‖ ˜f − h n ‖ u ≤ ‖ ˜f − ˜f n ‖ u + ‖ ˜f n − h n ‖ u 

< ‖ ˜f − ˜f n ‖ u + 1 n 

auch lim ‖ ˜f − h n ‖ u = 0, also ˜f ∈ R. 

n→∞ 

Aus 

∫ b 

∫ b 

∣ f dx − f n dx 

∣ = 

a 

a 

≤ 

∣ 

∫ b 

a 

( ˜f − ˜f n ) dx 

∣ 

(b − a)‖ ˜f − ˜f n ‖ u 

∫ b 

folgt schließlich lim f 

n→∞ a n dx = ∫ b 

f dx . a 

Q.E.D. 

19

∑ 

Korollar 1.12 Besitzt die Potenzreihe f(x) = ∞ a k x k den Konvergenzradius R > 

0, und ist a ≤ b mit |a|, |b| < R, so ist 

k=0 

∫ b 

a 

f(x) dx = 

∞∑ 

∫ b 

a k x k dx. 

k=0 

a 

Beweis. Setze f n (x) := ∑ n 

k=0 a kx k . Nach dem Beweis von Satz 9.14 (Analysis I) 

konvergiert dann die Folge der Polynome f n auf dem Intervall [a, b] gleichmäßig 

gegen die (stetige) Funktion f, so daß die Aussage unmittelbar aus Satz 1.11 folgt. 

Q.E.D. 

Um das Integral einer Funktion, welche durch eine Potenzreihe dargestellt ist, zu 

berechnen, genügt es also im Prinzip, die Integrale ∫ b 

a xk dx, k ∈ N, zu kennen. Diese 

lassen sich in der Tat mit ein wenig Fleiß mittels Approximation durch Treppenfunktionen 

berechnen. Einfacher ist es jedoch, hierzu den von Newton und Leibniz 

entdeckten engen Zusammenhang zwischen Differentiation und Integration auszunutzen, 

welcher im nächsten Abschnitt besprochen wird. 

Bemerkung 1.13 Wir haben hier folgende Definition der Integrierbarkeit verwendet: 

f ∈ C [a,b] ist integrierbar, wenn f der gleichmäßige Grenzwert einer Folge von 

Treppenfunktionen f n auf dem Intervall [a, b] ist. Eine schwächere Form der Approximation 

durch Treppenfunktionen ist die folgende: 

f : [a, b] → C heiße Riemannsch integrierbar auf [a, b], wenn es zwei Folgen 

(f n ) n und (ψ n ) n von Treppenfunktion auf [a, b] gibt, so daß gilt: 

|f − f n | ≤ ψ n und 

∫ b 

a 

ψ n dx → 0 für n → ∞ 

(offenbar muß ψ n ≥ 0 sein). 

Konvergiert die Folge (f n ) n aus T gleichmäßig auf [a, b] gegen f, so kann man offenbar 

ψ n := ‖f − f n ‖ u 1 [a,b] wählen. 

Man kann zeigen, daß sich für alle Riemannsch integrierbaren Funktionen auf [a, b] 

ein Integral definieren läßt, welches ähnliche Eigenschaften wie die des von uns 

betrachteten Integrals besitzt, und daß insbesondere die beiden Integrale für stückweise 

stetige Funktionen gleich sind. Allerdings ist die Dirichlet-Funktion auch im 

Riemannschen Sinne nicht integrierbar. 

20

1.4 Integration und Differentiation 

Definition. Es sei f ∈ C(I) eine stetige Funktion auf dem Intervall I = [a, b]. Eine 

differenzierbare Funktion F auf I heiße Stammfunktion von f, wenn gilt 

f = F ′ auf I. 

Theorem 1.14 (Newton-Leibniz) Sei f ∈ C([a, b]). Dann ist 

F(x) := 

eine Stammfunktion von f. 

∫ x 

a 

f(t) dt, 

x ∈ [a, b], 

Beweis. Sind x und x + h in I = [a, b], so gilt: 

F(x + h) − F(x) − f(x)h 

= 

= 

∫ x+h 

a 

∫ x+h 

da ∫ x+h 

f(t) dt = ∫ x 

f(t) dt+∫ x+h 

a 

a x 

ist für festes x und h ≠ 0 

F(x + h) − F(x) 

h 

x 

f(t)dt − 

∫ x 

a 

(f(t) − f(x)) dt , 

f(t)dt − f(x)h 

f(t) dt ist, und da f(x)h = ∫ x+h 

f(x) dt ist. Somit 

x 

− f(x) = 1 h 

∫ x+h 

x 

(f(t) − f(x)) dt =: r(h). 

Wir müssen zeigen, daß lim h→0 r(h) = 0 ist. Sei dazu ε > 0 gegeben. Da f in x stetig 

ist, existiert ein δ > 0, so daß |f(t) − f(x)| < ε ist für alle t ∈ [a, b] mit |t − x| < δ. 

Für |h| < δ gilt somit für alle t ∈ [a, b], welche zwischen x und x + h liegen: 

|f(t) − f(x)| < ε. 

Somit folgt für |h| < δ : 

|r(h)| ≤ 1 

|h| 

∣ 

∫ x+h 

x 

|f(t) − f(x)| dt 

∣ ≤ |h|ε 

|h| 

= ε . 

Q.E.D. 

Bemerkung 1.15 Sind F und G zwei Stammfunktionen von f auf [a, b], so ist 

(F − G) ′ = F ′ − G ′ = f − f = 0, d.h. F − G ist eine konstante Funktion (vgl. Satz 

10.11 (ii), Analysis I). 

Zwei Stammfunktionen von f unterscheiden sich also nur um eine additive Konstante. 

Umgekehrt ist mit F auch F + c für jede Konstante c ∈ C eine Stammfunktion 

von f. 

21

Satz 1.16 (Hauptsatz der Differential- und Integralrechnung) Ist F eine 

Stammfunktion der stetigen Funktion f auf [a, b], so gilt für alle x, y ∈ [a, b]: 

∫ y 

x 

f(t) dt = F(y) − F(x) . 

Beweis. Wir definieren für x ∈ [a, b] 

G(x) := 

∫ x 

a 

f(t) dt . 

Dann existiert nach Theorem 1.14 und Bemerkung 1.15 eine Konstante c ∈ C, so 

daß gilt 

Somit ist 

F(x) = G(x) + c , x ∈ [a, b] . 

F(y) − F(x) = G(y) − G(x) = 

= 

∫ y 

a 

∫ y 

x 

f(t) dt − 

f(t) dt . 

∫ x 

a 

f(t) dt 

Q.E.D. 

Bezeichnung: Man setzt 

∣ 

F(t) 

∣ y x 

:= F(y) − F(x) . 

Die Formel in Satz 1.16 schreibt sich dann als 

∫ y 

x 

∣ 

f(t)dt = F(t) 

∣ y x 

. 

Die folgende Tabelle läßt sich durch Differentiation der angegebenen Funktionen F 

leicht überprüfen. 

22

Tabelle einiger Stammfunktionen 

f 

F (bis auf additive Konstante) 

x k , x ≠ 0 

x k+1 

k+1 , k ≠ −1 

x −1 , x ≠ 0 log |x| 

x α , x > 0 

x α+1 

α+1 , α ≠ −1 

e x 

e x 

e ix 

1 i eix 

sin x 

cos x 

sinh x 

cosh x 

− cosx 

sin x 

cosh x 

sinh x 

√ 1 

1−x 2, |x| < 1 arcsin x 

1 

√ 

1+x 2 

arsinh x 

√ 1 

x 

, |x| > 1 arcosh x 

2 −1 

1 

arctan x 

1+x 2 

1 

cosh 2 x 

tanh x 

1 

, x ≠ 0 − coth x 

sinh 2 x 

1 

, |x| < π tan x 

cos 2 x 2 

1 

, 0 < x < π − cot x 

sin 2 x 

Beispielsweise erhält man nun für beliebiges n ∈ N: 

oder auch 

∫ a 

0 

∫ b 

a 

x n dx = xn+1 ∣ 

n + 1 

1 

∣ ∣∣ 

x dx = log x b 

a 

∣ a 0 

= an+1 − 0 n+1 

n + 1 

= an+1 

n + 1 , 

( b 

= log b − log a = log , 

a) 

für 0 < a < b. 

Weitere Regeln, welche für gewisse Klassen von Funktionen eine ” 

explizite“ Integration 

ermöglichen, lassen sich mittels Satz 1.16 aus entsprechenden Regeln für die 

Differentiation herleiten: 

23

Satz 1.17 (Partielle Integration) Seien f ∈ C([a, b]), g ∈ C 1 ([a, b]), und sei F 

eine Stammfunktion von f. Dann ist 

∫ b 

a 

f(x)g(x) dx = F(x)g(x) ∣ b − 

a 

∫ b 

a 

F(x)g ′ (x) dx. 

Beweis. Sei h = Fg. Dann ist h ∈ C 1 ([a, b]), und es gilt nach der Produktregel 

h ′ = F ′ g + Fg ′ = fg + Fg ′ . 

Damit folgt 

F(x)g(x) ∣ b = 

a 

∫ b 

h ′ (x) dx = 

∫ b 

fg dx + 

∫ b 

a 

a 

a 

Fg ′ dx. 

Q.E.D. 

Beispiele. a) Für 0 < a 

∫ b 

log xdx = 

∫ b 

a 

a 

1·log xdx = x log x∣ b a− 

∫ b 

a 

x· 1 ∣ ∣∣ 

x dx = x log x b 

−x∣ b = x(log x−1) ∣ b 

a a a. 

b) Für n ∈ N, n ≥ 2, gilt: 

∫ π/2 

0 

sin n xdx = 

∫ π/2 

0 

sin x sin n−1 xdx 

= (− cos x) sin n−1 ∣ 

x 

= 

woraus man sofort 

(1.10) 

erhält. Wegen 

∫ π/2 

0 

= (n − 1) 

∫ π/2 

0 

∫ π/2 

0 

∣ π/2 

0 

− 

∫ π/2 

(cos 2 x) (n − 1) sin n−2 xdx = (n − 1) 

∫ π/2 

0 

sin n−2 xdx − (n − 1) 

sin n xdx = n − 1 

n 

sin xdx = 1, 

0 

∫ π/2 

folgert man hieraus per Induktion nach n, daß 

0 

∫ π/2 

0 

(− cosx) (n − 1) sin n−2 x cosxdx 

∫ π/2 

0 

sin n−2 xdx 

sin 0 xdx = π/2 

∫ π/2 

0 

sin n xdx, 

(1 − sin 2 x) sin n−2 xdx, 

(1.11) 

∫ π/2 

0 

sin 2m+1 xdx = 

2m 

2m + 1 · 2m − 2 

2m − 1 · · · 2 

3 , 

24

(1.12) 

∫ π/2 

0 

sin 2m xdx = 2m − 1 

2m · 2m − 3 

2m − 2 · · · 1 

2 · π 

2 . 

Per Division ergibt sich aus diesen Formeln 

(1.13) 

2 

π 

∫ π/2 

sin 2m xdx 

0 

∫ π/2 

sin 2m+1 xdx = 1 2 · 3 

2 · 3 

4 · 5 

4 · 5 

6 · 7 

6 · · · 2m − 1 

2m · 2m + 1 

2m 

0 

Setze nun s n := ∫ π/2 

sin n xdx. Auf dem Intervall 0 < x < π , wo 0 < sin x < 1 gilt, 

0 2 

ist offenbar 

0 < sin 2m+1 x ≤ sin 2m x ≤ sin 2m−1 x. 

Daraus folgt wegen der Monotonie des Integrals 

0 < s 2m+1 ≤ s 2m ≤ s 2m−1 . 

Teilt man hier jeden Term durch s 2m+1 , so folgt 

1 ≤ s 2m 

s 2m+1 

≤ s 2m−1 

s 2m+1 

= 1 + 1 

2m , 

wobei wir bei der letzten Identität Formel (1.10) benutzt haben. Hieraus erhalten 

wir sofort 

∫ π/2 

sin 2m xdx 

0 

lim ∫ 

m→∞ π/2 

sin 2m+1 dx = 1, 

0 

und zusammen mit (1.13) folgt 

2 

π = lim 1 

m→∞ 2 · 3 

2 · 3 

4 · 5 

4 · 5 

6 · 7 

6 · · · 2m − 1 

2m · 2m + 1 

2m 

(vergleiche das Beispiel zu Satz 5.3, Analysis I). Gehen wir zu den Kehrwerten über, 

so erhalten wir die Wallissche Produktdarstellung von π : 

(1.14) 

π 

2 = lim 2 

m→∞ 1 · 2 

3 · 4 

3 · 4 

5 · 6 

5 · 6 

7 · · · 2m 

2m − 1 · 2m 

2m + 1 . 

Satz 1.18 (Substitutionsregel) Sei I ein kompaktes Intervall und f ∈ C(I). Sei 

ferner ϕ : [a, b] → R eine stetig differenzierbare Funktion mit ϕ([a, b]) ⊂ I. Dann 

gilt 

∫ b 

a 

f(ϕ(t))ϕ ′ (t) dt = 

25 

∫ ϕ(b) 

ϕ(a) 

f(x) dx.

Beweis. Sei F eine Stammfunktion von f auf I. Dann ist F ◦ ϕ ∈ C 1 ([a, b]), und es 

ist nach der Kettenregel 

Somit ist nach Satz 1.16 

∫ b 

a 

(F ◦ ϕ) ′ (t) = F ′ (ϕ(t))ϕ ′ (t) = f(ϕ(t))ϕ ′ (t). 

f(ϕ(t))ϕ ′ (t) dt = F ◦ ϕ(t) ∣ b = F(ϕ(b)) − F(ϕ(a)). 

a 

Beispiele. a) Berechne ∫ π/2 

0 

e − sin x cosxdx. 

Q.E.D. 

Die Substitution y = sin x =: ϕ(x) liefert wegen ϕ ′ (x) = cos x (was man gerne auch 

in der suggestiven Kurzform 

cosxdx = dy 

schreibt) 

∫ π/2 

0 

e − sinx cosxdx = 

∫ sin(π/2) 

sin(0) 

e −y dy 

∣ 

= −e −y ∣∣ 

1 

= 1 − e −1 . 

0 

b) Bestimme ∫ x 

√ 

0 1 − t2 dt, 0 ≤ x < 1. 

Die Substitution t = sin y, 0 < t < π/2, mit dt = cosy dy, liefert 

∫ x 

0 

√ 

1 − t2 dt = 

∫ 

arcsinx 

0 

√ 

1 − sin 2 y cosy dy = 

∫ 

arcsin x 

0 

cos 2 y dy. 

Ferner erhält man mittels partieller Integration 

∫ s 

0 

woraus 

cos 2 y dy 

∫ s 

= sin y cos y∣ s + 

0 

∫ s 

= 1 ∫ s 

2 sin(2s) + s − cos 2 y dy, 

0 

0 

0 

sin 2 y dy = sin s coss + 

∫ s 

cos 2 y dy = 1 2 (1 2 sin(2s) + s) = 1 (sin s cos+s) 

2 

0 

(1 − cos 2 y) dy 

folgt. Für s := arcsin x mit 0 ≤ x < 1 ist aber 0 ≤ s < π/2, also coss > 0, so daß 

sin s = x, cos s = 

√ 

1 − sin 2 s = √ 1 − x 2 . 

26

Damit erhalten wir insgesamt 

∫ x 

0 

√ 

1 − t2 dt = 1 2 (x√ 1 − x 2 + arcsin x). 

Man überprüfe durch Differentiation nach x, daß die rechte Seite dieser Identität in 

der Tat eine Stammfunktion zu √ 1 − x 2 ist! 

c) Bestimme das unbestimmte Integral ∫ arctan xdx 

(unter dem unbestimmten Integral “ ∫ f(x) dx von f versteht man dabei eine 

” 

beliebige Stammfunktion von f; das unbestimmte Integral ist also im Grunde nur 

bis auf eine additive Konstante wohldefiniert!). 

Mit der Produktregel erhalten wir zunächst 

∫ 

∫ 

arctanxdx = x arctanx − 

∫ 

x arctan ′ (x) dx = x arctan x − 

x 

1 + x 2 dx. 

Die Substitution y = x 2 liefert ferner 

∫ ∫ 

x 

1 + x dx = 1 

1 

2 2 

1 + y dy = 1 log(1 + y) + c = 1 log(1 + 2 2 x2 ) + c, 

so daß 

∫ 

arctanxdx = x arctan x − 1 2 log(1 + x2 ) + c, 

wobei c eine beliebige Konstante ist (man prüfe dies durch Ableiten nach!). 

Satz 1.19 (Differentiation von Grenzfunktionen) Sei f : [a, b] → C eine 

Funktion auf dem Intervall [a, b], a < b. Ist f der punktweise Limes einer Folge 

von Funktionen (f n ) n in C 1 ([a, b]), und konvergiert die Folge der Ableitungen (f ′ n ) n 

gleichmäßig gegen eine Funktion g ∈ C([a, b]), so ist f bereits stetig differenzierbar 

auf [a, b], und es gilt: 

f ′ (x) = g(x) = lim f n ′ (x) für alle x ∈ [a, b]. 

n→∞ 

Beweis. Wir setzen G(x) := ∫ x 

g(t)dt, x ∈ [a, b]. Nach Satz 1.11 ist dann 

a 

G(x) = lim 

für alle x ∈ [a, b], also nach Satz 1.16 

n→∞ 

∫ x 

a 

f ′ n(t) dt 

G(x) = lim 

n→∞ 

(f n (x) − f n (a)) = f(x) − f(a). 

Da G nach Satz 1.14 in C 1 ([a, b]) liegt, gilt dies auch für f = G + f(a), und es ist 

f ′ = G ′ = g. 

Q.E.D. 

27

1.5 Integration rationaler Funktionen 

1.5.1 Partialbruchzerlegung 

Die folgenden Aussagen über rationale Funktionen gehören eher in den Bereich der 

Algebra und sollen daher nur kurz skizziert werden. 

Sei R = p mit Polynomen p und q eine rationale Funktion auf C. Bezeichnen wir 

q 

mit GradP den Grad eines Polynoms P, und setzen wir o.B.d.A. Gradq ≥ 1 voraus, 

so erhält man mittels Polynomdivision mit Rest leicht folgende Aussage: 

Es existieren eindeutige Polynome v und r, so daß 

(1.15) p = vq + r und Gradr < Grad q. 

Damit ist 

(1.16) R = p q = v + r , mit Gradr < Gradq. 

q 

Satz 1.20 (Zerlegung in Linearfaktoren) Sei P ein Polynom vom Grad n ≥ 1 

auf C. Dann gibt es komplexe Zahlen a ≠ 0 und α 1 , . . .,α n , so daß 

P(z) = a(z − α 1 ) · · ·(z − α n ), z ∈ C. 

Beweis. Nach dem Fundamentalsatz der Algebra besitzt P eine Nullstelle α n ∈ C. 

Wenden wir (1.15) an auf p = P und q(z) := (z − α n ), so folgt: 

P(z) = v(z)(z − α n ) + c, 

wobei c eine komplexe Konstante ist. Wegen P(α n ) = 0 ergibt sich c = 0, d.h. 

P(z) = v(z)(z − α n ). Da Gradv = GradP − 1, folgt die Behauptung nun per 

Induktion nach dem Grad des Polynoms. 

Q.E.D. 

Wenden wir diesen Satz auf q in (1.16) an, und fassen wir alle Linearfaktoren (z−α j ) 

von q mit gleichem α j zusammen, so sehen wir: 

Es gibt paarweise verschiedene komplexe Zahlen λ 1 . . .λ m sowie n 1 , . . .n m ∈ N × , so 

daß n 1 + · · · + n m = Gradq und 

(1.17) q(z) = (z − λ 1 ) n1 · · ·(z − λ m ) nm . 

Die Zahl n j bezeichnet man dann auch als die Vielfachheit der Nullstelle λ j des 

Polynoms q, und die Polynome (z − λ j ) auch als die Primfaktoren von q. 

Da die Polynome 

q k (z) := ∏ j≠k(z − λ j ) n j 

, k = 1, . . .,m, 

28

teilerfremd “ im Ring C[x] aller komplexen Polynome sind, d.h., da die einzigen 

” 

Teilerpolynome von q 1 , . . .,q m die nicht-trivialen konstanten Polynome sind, und da 

dieser Ring ein Hauptidealring“ist, kann man mit Methoden der Algebra zeigen, 

” 

daß Polynome u 1 , . . .,u m existieren, so daß 

(1.18) 1 = u 1 (z) ∏ j≠1 

(z − λ j ) n j 

+ · · · + u m (z) ∏ j≠m(z − λ j ) n j 

. 

Der Beweis gehört eher in die Algebra, soll aber dennoch hier kurz skizziert werden: 

Betrachte die Teilmenge 

J := {v 1 q 1 + . . . v m q m : v 1 , . . .,v m ∈ C[x]} 

des Rings C[x]. Dann sieht man rasch, daß J ein Ideal in C[x] ist, d.h. mit Q, L ∈ J 

und P ∈ C[x] liegen stets auch Q+L sowie PQ in J. Wähle nun ein Polynom Q ≠ 0 

minimalen Grades in J. Ist dann L ∈ J ein beliebiges Polynom in J, so erhält man 

durch Polynomdivision mit Rest 

L = UQ + R, 

mit Polynomen U und R, wobei GradR < GradQ. Offenbar liegt mit Q und L 

jedoch auch R = L + (−U)Q in J, und da der Grad von Q minimal in J gewählt 

wurde, muß somit R = 0 sein, d.h., das Polynom Q teilt jedes Polynom aus J. 

Insbesondere teilt es die Polynome q 1 , . . .,q m , und da diese teilerfremd sind, muß 

notwendig Q eine nichttriviale Konstante a ∈ C \ {0} sein. Da diese in J liegt, folgt 

sofort (1.18). 

Multipliziert man nun (1.18) mit r , so erhält man unter Ausnutzung von (1.17) 

q 

r(z) 

q(z) = 

p 1(z) 

(z − λ 1 ) + · · · + p m(z) 

n 1 

(z − λ m ) , 

nm 

mit gewissen Polynomen p 1 , . . .,p m . 

Teilt man schließlich p j (z) durch das Polynom (z − λ j ) mit Rest, und wiederholt 

diesen Vorgang genügend oft, so erhält man schließlich 

p j (z) 

(z − λ j ) n j = v j(z) + 

n j 

∑ 

k=1 

a jk 

(z − λ j ) k, 

für gewisse Polynome v j und Koeffizienten a jk ∈ C. Zusammen mit (1.16) erhalten 

wir 

Satz 1.21 (Partialbruchzerlegung) Sei R = p q 

Dann besitzt R eine Darstellung 

eine rationale Funktion auf C. 

(1.19) R(z) = P(z) + h 1 (z) + . . .h m (z), 

29

mit einer Polynomfunktion P und Hauptteilen h j der Form 

(1.20) h j (z) = 

n j 

∑ 

k=1 

a jk 

(z − λ j ) k. 

Dabei sind die λ j die paarweise verschiedenen Nullstellen und n j deren Vielfachheiten 

des Nennerpolynoms q, falls wir voraussetzen, daß die Polynome p und q 

keine gemeinsamen Linearfaktoren haben. 

Setzen wir o.B.d.A. voraus, daß a j nj ≠ 0, so nennt man λ j einen Pol der Ordnung 

n j von R. Man kann übrigens zeigen, daß die obige Zerlegung eindeutig ist. 

Für die konkrete Durchführung einer Partialbruchzerlegung ist die folgende offenkundige 

Beobachtung nützlich, welche es gestattet, den Koeffizienten a j nj für den 

Term mit höchstem Exponenten n j im Haupteil h j zu bestimmen: 

(1.21) a j nj = lim 

z→λj 

R(z)(z − λ j ) n j 

. 

Anhand zweier Beispiele möchte ich noch zeigen, wir man eine solche Partialbruchzerlegung 

konkret herstellen kann. 

Beispiele 1.22 (a) Sei 

R(z) := z + 1 

z(z − 1) 2. 

Da der Grad des Zählerpolynoms bereits kleiner als der Grad des Nennerpolynoms 

ist, besitzt die Partialbruchzerlegung die Gestalt 

(1.22) R(z) = a z + b 1 

(z − 1) + b 2 

(z − 1) 2. 

a und b 2 berechnen wir nach (1.21): 

Wegen R(z)z = z+1 ist a = lim R(z)z = 1, und wegen R(z)(z − 1) 2 = z+1 

(z−1) 2 z→0 z 

b 2 = lim R(z)(z − 1) 2 = 2. 

z→1 

Um b 1 zu bestimmen, betrachten wir die Differenz 

R 1 (z) := R(z) − 

( 

b 

) 

2 

az + = b 1 

(z − 1) 2 (z − 1) . 

ist 

Beachte, daß die rechte Seite gerade die Partialbruchzerlegung der neuen rationalen 

Funktion R 1 ist. Da a = 1, b 2 = 2 bekannt sind, ergibt eine einfache Rechnung 

R 1 (z) = −z2 + z 

z(z − 1) 2 = −1 

z − 1 . 

30

Hieraus ergibt sich sofort b 1 = −1, also insgesamt 

z + 1 

z(z − 1) = 1 2 z − 1 

(z − 1) + 2 

(z − 1) 2. 

Alternativ kann man b 1 auch aus (1.21), angewandt auf R 1 , gewinnen. Diese Bemerkung 

ist vor allem für den Fall von Polen höherer Ordnung von Bedeutung, da 

sich mit unserem Vorgehen ein Rekursionsschema zur Berechnung der Koeffizienten 

der Partialbruchzerlegung ergibt (damit erhalten wir dann auch die behauptete 

Eindeutigkeit der Partialbruchzerlegung). 

(b) Sei 

R(z) := 

1 

(z − 2) 2 + 1 . 

Wegen (z −2) 2 +1 = (z −(2+i))(z −(2 −i)) besitzt die Partialbruchzerlegung von 

R die Gestalt 

a 

R(z) = 

z − (2 + i) + b 

z − (2 − i) . 

Mit (1.21) erhält man sofort a = 1 und b = − 1 , also insgesamt 

2i 2i 

1 

(z − 2) 2 + 1 = − i/2 

z − (2 + i) + i/2 

z − (2 − i) . 

1.5.2 Stammfunktionen rationaler Funktionen 

Sei R = p eine reellwertige rationale Funktion auf R, d.h. p und q sind reelle Polynomfunktionen. 

Betrachte die 

q 

Partialbruchzerlegung 

(1.23) R(x) = v(x) + h 1 (x) + . . . h m (x) 

mit einer Polynomfunktion v und Hauptteilen h j der Form 

(1.24) h j (x) = 

n j 

∑ 

k=1 

a jk 

(x − λ j ) k 

von R, welche uns jetzt nur für reelles x ∈ R interessiert. Die Nullstellen λ j des 

Nennerpolynoms q können dabei reell oder auch komplex sein (vgl. obige Beispiele). 

Da jedoch R(x) = R(x) für alle x ∈ R gilt, tritt wegen der Eindeutigkeit der 

Partialbruchzerlegung mit jedem Term 

a jk 

(x−λ j ) k 

auch der konjugiert komplexe Term 

a jk 

(x−λ j ) k in der Partialbruchzerlegung auf. Diese Beobachtung ist vor allem für k = 1 

nützlich, denn ist λ = α + iβ, mit α, β ∈ R, so gilt 

Wir sehen damit: 

a 

(x − λ) + a (a + a)x − (aλ + aλ) 

= . 

(x − λ) (x − α) 2 + β 2 

Mittels Partialbruchzerlegung können wir die reelle rationale Funktion R zerlegen in 

eine Summe rationaler Funktionen folgenden Typs: 

31

(a) Eine Polynomfunktion. 

(b) Funktionen der Gestalt 

(c) Funktionen der Gestalt 

a 

mit n ≥ 2. 

(x − λ) 

n 

ax + b 

(x − α) 2 + β2, mit a, b, α, β ∈ R, wobei β ≠ 0. 

Polynomfunktionen lassen sich leicht integrieren, und die Funktionen vom Typ (b) 

besitzen z.B. 

a 

(1 − n)(x − λ) n−1 

als Stammfunktion (Übung). Die Funktionen vom Typ (c) schließlich lassen sich 

x − α 

kombinieren aus Funktionen der Gestalt 

(x − α) 2 + β2, welche offenbar die Funktion 

1 

2 log[(x − α)2 + β 2 ] 

als Stammfunktion besitzt (hierauf wird man durch die Substitution y = (x−α) 2 +β 2 

geführt), und Funktionen des Typs 

g(x) := 

1 

(x − α) 2 + β 2. 

Die Substitution y = (t−a) 

β 

liefert hier z.B. 

∫ x 

0 

1 

(t − α) 2 + β dt = 1 ∫ (x−a) 

β 

2 β −a/β 

1 

y 2 + 1 dy, 

so daß offenbar eine Stammfunktion G zu g gegeben ist durch 

G(x) := 1 β arctan(x − a 

β ). 

Damit ist die Frage nach der Integration rationaler Funktionen im Prinzip 

vollständig gelöst. 

1.5.3 Integration von R(cosx, sinx). 

Sei R(x, y) eine rationale Funktion in den reellen Variablen x, y, und betrachte die 

Funktion f(x) := R(cos x, sin x). Z.B. könnte dies die Funktion f(x) := sinx cos2 x+5 

sin 2 x+7cos 4 x 

sein. 

Wenden wir die Substitution t := tan( x ) an, d.h. x = 2 arctant, so ist in unserer 

2 

formalen Schreibweise dx = 2 dt, und eine einfache Rechnung zeigt, daß cosx = 

1+t 2 

32

1−t 2 

ist und sin x = 2t , so daß das unbestimmte Integral ∫ R(cosx, sin x) dx in das 

1+t 2 1+t 2 

unbestimmte Integral ∫ ( 1 − t 

2 

2t 

) 2 

R 

1 + t 2, 1 + t 2 1 + t dt 2 

übergeht. Unter dem Integralzeichen steht nun eine rationale Funktion in der Variablen 

t, so daß das Integral mit Hilfe der Methoden des vorherigen Abschnitts 

prinzipiell berechnet werden kann. Ersetzt man im Ergebnis dieser Berechnung dann 

wieder t durch tan( x ), so erhält man eine Stammfunktion zu f. 

2 

Damit ist die Frage nach der Integration von Funktionen obiger Gestalt 

R(cosx, sin x) im Prinzip ebenfalls vollständig gelöst. 

Die Integrationen weiterer Klassen von Funktionen kann mittels geeigneter Substitutionen 

ebenfalls auf die Integration rationaler Funktionen zurückgeführt werden. 

Hierzu siehe z.B. [C], Kapitel IV. 

Bemerkungen. Während man die Ableitung einer Funktion, die sich aus den behandelten 

” 

elementaren“ Funktionen zusammensetzt, mit den bekannten Regeln 

direkt berechnen kann, lassen sich neben den ” 

Grundintegralen“ gewisse Klassen 

von Funktionen noch ” 

elementar integrieren“ in dem Sinne, daß sich explizite 

analytische Ausdrücke in den betrachteten elementaren Funktionen wie 

x α , e x , sin x, cosx, log, arctan etc. für Stammfunktionen angeben lassen. Beispielsweise 

gilt dies für alle rationalen Funktionen, wie wir gesehen haben. Allerdings gelingt 

dies oftmals nur noch mittels geschickter Ansätze und trickreicher Substitutionen: 

Die Differentiation gehört zum Handwerk, die Integration zur Kunst“. 

” 

Viele Integrale widersetzen sich jedoch allen Tricks. Zum Beispiel kann man beweisen, 

daß sich die elliptischen Integrale“ 

” 

und 

F k (x) := 

E k (x) := 

∫ x 

0 

∫ x 

0 

1 

√ dt, (0 ≤ x < ∞) 

1 − k2 sin 2 t 

√ 

1 − k 2 sin 2 tdt, (0 ≤ x < ∞) 

nicht elementar integrieren lassen (hier sei 0 < k < 1). Die elliptischen Integrale 

treten zum Beispiel bei der Berechnung der Bogenlänge einer Ellipse auf. 

1.6 Taylor-Approximation 

Ist P(x) = ∑ n 

k=0 a kx k eine polynomiale Abbildung, so ist offenbar 

d.h. 

(1.25) P(x) = 

a k = P (k) (0)/k! , 

n∑ 

k=0 

33 

P (k) (0) 

x k . 

k!

P ist also schon durch die Ableitungen (bis zur Ordnung n) im Punkte 0 bestimmt. 

Sei nun I ein nicht nur aus einem Punkt bestehendes Intervall. Ist f ∈ C n (I), und ist 

a ein Punkt aus I, so definieren wir (1.25) verallgemeinernd das Taylor-Polynom 

der Ordnung n in a von f als 

T n,a (f)(x) := 

n∑ 

k=0 

f (k) (a) 

(x − a) k . 

k! 

Wir wollen untersuchen, inwieweit dieses Polynom die gegebene Funktion f zumindest 

in der Nähe des Punktes a approximiert. 

Satz 1.23 (Taylor-Formel) Sei f ∈ C n+1 (I). Dann ist für alle x ∈ I 

f(x) = T n,a (f)(x) + R n (x) , 

wobei 

ist. 

R n (x) = 1 n! 

∫ x 

a 

(x − t) n f (n+1) (t) dt 

Beweis durch Induktion nach n. 

Für n = 0 gilt nach dem Hauptsatz der Differential- und Integralrechnung 

f(x) = f(a) + 

∫ x 

a 

f ′ (t) dt = T 0,a (f)(x) + R 0 (x) . 

Wir nehmen an, daß die Formel für R n für ein gegebenes n ≥ 0 gültig ist. Dann 

folgt für f ∈ C n+2 (I) mittels partieller Integration 

∫ x 

R n (x) = 1 (x − t) n f (n+1) (t) dt 

n! a 

= 1 −1 

∫ 

n! n + 1 (x − t)n+1 f (n+1) (t) ∣ x 1 x 

+ (x − t) n+1 f (n+2) (t) dt 

t=a n!(n + 1) a 

∫ 

1 

= 

(n + 1)! f(n+1) (a)(x − a) n+1 1 x 

+ (x − t) n+1 f (n+2) (t) dt. 

(n + 1)! 

Hieraus folgt die Behauptung. 

a 

Q.E.D. 

Korollar 1.24 (Taylor-Approximation) Sei f ∈ C n+1 (I), und sei 

|f (n+1) (x)| ≤ M für alle x ∈ I. 

Dann gilt mit c k := f(k) (a) 

, k = 0, . . ., n : 

k! 

34

(1.26) f(x) = c 0 + c 1 (x − a) + c 2 (x − a) 2 + · · · + c n (x − a) n + R n (x) , 

wobei 

|x − a|n+1 

(1.27) |R n (x)| ≤ M 

(n + 1)! 

Beweis. Ist |f (n+1) | auf I durch M ≥ 0 beschränkt, so erhält man für R n (x) folgende 

Abschätzung (sei o.B.d.A. x > a): 

|R n (x)| ≤ 1 n! 

∫ x 

a 

(x − t) n (x − a)n+1 

M dt = M 

(n + 1)! 

. 

. 

Q.E.D. 

Ist beispielsweise f ein Polynom vom Grade n, so ist f (n+1) = 0, d.h. man kann 

M = 0 wählen und erhält R n = 0. In diesem Falle ist also 

f(x) = 

n∑ 

k=0 

f (k) (a) 

(x − a) k , 

k! 

und zwar für jeden Punkt a ∈ R. Im allgemeinen Fall liefert (1.26), (1.27) eine Approximation 

von f durch ein Polynom vom Grade ≤ n, wobei der Fehler, welcher bei 

dieser Approximation auftritt, durch (1.27) kontrolliert wird und von der Ordnung 

O(|x − a| n+1 ) ist. Dieser ist offenbar um so geringer, je näher sich x bei a befindet; 

ferner wird sich i.a. die Güte der Approximation verbessern, je größer n gewählt 

werden kann. 

Für n = 4, M = 1 und |x−a| ≤ 1/2 beträgt der Fehler z.B. höchstens 2−5 

5! 

< 0, 00027. 

Für reellwertige Funktionen läßt sich das Restglied R n auch wie folgt darstellen: 

Satz 1.25 (Lagrangesche Form des Restglieds) Sei f ∈ C n+1 (I, R), und sei 

a ∈ I. Dann existiert zu jedem x ∈ I ein ξ zwischen a und x, so daß gilt: 

(1.28) f(x) = 

n∑ 

k=0 

f (k) (a) 

(x − a) k + f(n+1) (ξ) 

k! (n + 1)! (x − a)n+1 . 

Insbesondere gilt 

(1.29) f(x) = 

∑n+1 

k=0 

f (k) (a) 

(x − a) k + o(|x − a| n+1 ) . 

k! 

35

Bemerkung 1.26 Ist f ∈ C 2 (I, R), und ist ξ ∈ I ein kritischer Punkt von f, d.h. 

ist f ′ (ξ) = 0, und gilt ferner f ′′ (ξ) > 0, so folgert man mit (1.29) leicht, daß f in ξ 

ein lokales Mimimum besitzt (Übung). 

Für den Beweis benutzen wir 

Satz 1.27 (Mittelwertsatz für Integrale) Seien f, w ∈ C(I, R) stetige reellwertige 

Funktionen auf dem Intervall I = [a, b]. Ist w ≥ 0 auf I, so gibt es einen Punkt 

ξ ∈ I, so daß gilt: 

Beweis. Sei 

∫ b 

a 

f(x) w(x) dx = f(ξ) 

c := 

∫ b 

a 

∫ b 

a 

w(y) dy ∈ R + 0 . 

Nach dem Satz vom Maximum gibt es ξ 1 , ξ 2 ∈ I mit 

Es folgt 

also nach Integration über I 

w(x) dx. 

f(ξ 1 ) ≤ f(x) ≤ f(ξ 2 ) für alle x ∈ I. 

f(ξ 1 ) w(x) ≤ f(x) w(x) ≤ f(ξ 2 ) w(x) für alle x ∈ I, 

cf(ξ 1 ) ≤ 

∫ b 

a 

f(x) w(x) dx ≤ cf(ξ 2 ). 

Wenden wir den Zwischenwertsatz auf die stetige Funktion cf an, so gibt es also ein 

ξ ∈ I mit cf(ξ) = ∫ b 

f(x) w(x) dx. 

a 

Q.E.D. 

Beweis von Satz 1.25. Wenden wir obigen Mittelwertsatz auf das Integral 

R n (x) = 1 n! 

∫ x 

a 

(x − t) n f (n+1) (t) dt 

an, mit w(t) := (x − t) n (x ist hier festgehalten!), so finden wir ein ξ ∈ [a, b] mit 

R n (x) = f (n+1) (ξ) 1 n! 

womit (1.28) bewiesen ist. 

Setzen wir 

∫ x 

a 

(x − t) n dt = f(n+1) (ξ) 

(n + 1)! (x − a)n+1 , 

r(x) := f(n+1) (ξ) 

(n + 1)! − f(n+1) (a) 

(n + 1)! , 

36

so gilt damit 

f(x) = 

∑n+1 

k=0 

f (k) (a) 

(x − a) k + r(x)(x − a) n+1 . 

k! 

Da ξ zwischen a und x liegt, gilt dabei aufgrund der Stetigkeit von f (n+1) im Punkte 

a offenbar lim 

x→a 

r(x) = 0. Damit ist auch (1.29) nachgewiesen. 

Q.E.D. 

Ist f ∈ C ∞ (I) unendlich oft differenzierbar, und ist a ∈ I, so heißt die Potenzreihe 

in (x − a) 

∞∑ f (k) (a) 

T a (f)(x) := (x − a) k 

k! 

die Taylorreihe von f in a. 

k=0 

37

WARNUNGEN: 

i) Der Konvergenzradius von T a (f) kann durchaus 0 sein. 

ii) Falls die Taylorreihe von f konvergiert, so konvergiert sie nicht notwendig 

gegen f. 

Beispiel 1.28 Betrachte die Funktion ϕ : R → R, 

{ 

e −1/x , x > 0, 

ϕ(x) := 

0, x ≤ 0. 

Man kann zeigen, daß ϕ unendlich oft differenzierbar ist, auch in der 0, so dass 

insbesondere ϕ (k) (0) = 0 für alle k ∈ N. Die Taylorreihe von ϕ in a = 0 stellt somit 

die triviale Funktion f = 0 dar, welche offenkundig verschieden von ϕ ist (Übung)! 

1.7 Das uneigentliche Riemannsche Integral 

Sei I ein halboffenes Intervall der Form I = [a, b[ mit −∞ < a 

f : I → C eine Funktion auf I. 

Ist β ∈ [a, b[, und ist die Einschränkung f| [a,β] von f auf [a, β] integrierbar, so sagen 

wir, daß f auf [a, β] integrierbar ist und schreiben schreiben 

∫ β 

a 

f(x) dx := 

∫ β 

a 

f| [a,β] (x) dx . 

Definition. Die Funktion f : I → C heiße auf I im uneigentlichen Sinne integrierbar 

oder uneigentlich integrierbar, falls f auf jedem kompakten Teilintervall 

[a, β] mit β ∈ [a, b[ integrierbar ist und der Grenzwert 

∫ β 

lim f(x) dx 

β→b 

a 

existiert. Dieser Grenzwert heißt das uneigentliche Riemannsche Integral von 

f über das Intervall [a, b[ und wird mit 

∫ b 

a 

f(x) dx 

bezeichnet. Eine analoge Definition gilt für links-halboffene Intervalle ]a, b] mit 

−∞ ≤ a 

38

integrierbar, wenn für ein c ∈]a, b[ die Einschränkungen von f auf die Intervalle 

]a, c] und [c, b[ uneigentlich integrierbar sind. Das Integral ist in diesem Falle durch 

definiert. 

∫ b 

f dx := 

∫ c 

f dx + 

∫ b 

a 

a c 

f dx 

Bemerkungen: a) Es ist klar, daß im letzten Falle die Definition unabhängig von 

der Wahl von c ∈]a, b[ ist. 

b) Sind a, b ∈ R und ist f auf [a, b] integrierbar, so ist f auch auf jedem anderen 

Intervall I mit den Endpunkten a und b uneigentlich integrierbar, und die Integrale 

stimmen überein. 

Wir bezeichnen für s ∈ R mit p s die auf ]0, ∞[ durch p s (x) := x s definierte stetige 

Funktion. 

Satz 1.29 (i) p s ist genau dann auf dem Intervall ]0, 1] uneigentlich integrierbar, 

wenn s > −1 ist. Dann gilt: 

∫ 1 

0 

x s dx = 1 

s + 1 . 

(ii) p s ist genau dann auf dem Intervall [1, ∞[ uneigentlich integrierbar, wenn s < −1 

ist. Dann gilt 

∫ ∞ 

x s dx = −1 

s + 1 . 

Beweis. Dies folgt sofort aus den für 0 < a 

∫ b 

a 

∫ b 

a 

1 

x s dx = 1 

s + 1 (bs+1 − a s+1 ), s ≠ 1 

x −1 dx = log b a . 

Z.B. ist danach für 0 < α < 1 und s > −1 

∫ 1 

α 

x s dx = 1 

s + 1 (1 − αs+1 ), 

woraus wegen s + 1 > 0 folgt, daß der Grenzwert für α → 0 existiert und gegeben 

ist durch ∫ 1 ∫ 1 

0 xs dx = lim 

α→0 α xs dx = 1 . s+1 

Für s < −1 zeigt dieselbe Formel, daß der Grenzwert nicht existiert, da der Exponent 

s+1 negativ ist. Ähnlich folgt für s = −1 aus ∫ 1 

α x−1 dx = log 1 , daß der Grenzwert 

α 

ebenfalls nicht existiert. 

Analog beweist man die Aussagen in (ii). 

Q.E.D. 

39

1.8 Rektifizierbare Kurven 

Definition. Eine stetige Abbildung γ von einem kompakten Intervall [a, b] nach C 

heißt eine Kurve oder ein Weg in C. Ist γ(a) = γ(b), so heißt γ eine geschlossene 

Kurve. Die Bildmenge γ([a, b]) bezeichnet man als die Spur der Kurve. 

Achtung: Eine Kurve ist also eine Abbildung, während ihre Spur das ist, was 

man sich anschaulich eher unter einer Kurve vorstellt. Verschieden Kurven können 

insbesondere dieselbe Spur besitzen. 

γ(x n) 

γ(x 1) 

γ(x 2) 

γ(x 0) 

γ(x 3) 

Abb. 1.1: Bogenlänge 

Ist P = {x 0 , . . ., x n } eine Partition von [a, b], d.h. sind die x j Punkte in [a, b] mit 

a = x 0 < x 1 < · · · < x n = b, 

so ordnen wir dieser die Zahl 

L(P, γ) := 

n∑ 

|γ(x j ) − γ(x j−1 )| 

j=1 

zu. Da |γ(x j )−γ(x j−1 )| der Abstand zwischen den Punkten γ(x j−1 ) und γ(x j ) ist, ist 

L(P, γ) offenbar die Länge des Polygonzuges mit den Ecken γ(x 0 ), γ(x 1 ), . . .γ(x n ), 

in dieser Reihenfolge. Wählen wir die Partition immer feiner, so nähert sich dieser 

Polygonzug anschaulich der Spur von γ immer mehr. Somit ist es sinnvoll, die Länge 

von γ als 

L(γ) := sup L(γ, P) 

P 

zu definieren, wobei das Supremum über alle Partitionen von [a, b] gebildet wird. Ist 

L(γ) < ∞, so sagt man, γ sei rektifizierbar. 

Sei nun γ eine stetig differenzierbare Kurve. In diesem Fall gilt nach dem Hauptsatz 

der Differential- und Integralrechnung 

γ(x j ) − γ(x j−1 ) = 

40 

∫ xj 

x j−1 

γ ′ (t) dt,

also insbesondere |γ(x j ) −γ(x j−1 )| ≤ ∫ x j 

x j−1 

|γ ′ (t)| dt. Hieraus folgt durch Summation 

für jede Partition P von [a, b] 

L(P, γ) ≤ 

so daß γ rektifizierbar ist. Genauer gilt 

∫ b 

a 

|γ ′ (t)| dt < ∞, 

Satz 1.30 Ist die Kurve γ : [a, b] → C stetig differenzierbar, so ist sie rektifizierbar, 

und es gilt 

L(γ) = 

∫ b 

a 

|γ ′ (t)| dt. 

Ich möchte dies hier nur für den (nicht sonderliche interessanten) Fall beweisen, 

daß γ rellwertig ist, da man hier leicht mit Hilfe des Mittelwertsatzes für Integrale 

argumentieren kann. Danach ist nämlich für jede Partition P wie zuvor offenbar 

|γ(x j ) − γ(x j−1 )| = |γ ′ (ξ j ) 

∫ xj 

für geeignete Punkte ξ j ∈ [x j−1 , x j ], so daß 

x j−1 

dt| = |γ ′ (ξ j )|(x j−1 − x j ), 

L(P, γ) = 

n∑ 

|γ ′ (ξ j )|(x j−1 − x j ). 

j=1 

Die Riemannsumme auf der rechten Seite konvergiert aber offenbar gegen das Integral 

∫ b 

a |γ′ (t)| dt, falls die Feinheit der Partition gegen Null stebt. 

Für einen Beweis im allgemeinen Fall sei z.B. auf Rudins Buch [R], S. 159, verwiesen. 

Beispiel: Bogenlänge auf dem Kreis: Es bezeichne wieder cis : [0, 2π] → C 

die Funktion t ↦→ e it . In der Analysis I hatten wir gesehen, daß cis das halboffene 

Intervall [0, 2π[ bijektiv auf den Einheitskreis S 1 abbildet. Wegen cis(0) = cis(2π) ist 

cis : [0, 2π] → C somit eine geschlossene Kurve, und ihre Spur ist der Einheitskreis. 

Ferner ist cis ′ (t) = ie it , also |cis ′ (t)| = 1 für alle t. 

Ist nun 0 ≤ α ≤ 2π, so beschreibt das Integral ∫ α 

0 |cis′ (t)| dt die Länge des Kreisbogens 

mit Anfangspunkt cis(0) = 1 und Endpunkt cis(α) = e iα , welche sich nach 

Satz 1.30 berechnet zu 

∫ α 

0 

|cis ′ (t)| dt = 

∫ α 

0 

1 dt = α. 

Dies bedeutet, daß der Parameter α tatsächlich der Winkel, gemessen im Bogenmaß, 

zwischen dem Punkt e iα auf dem Einheitskreis und dem Punkt 1 auf der reellen 

Achse ist. Dies rundet unser geometrisches Bild von der Abbildung t ↦→ e it , welche 

wir ja bereits in der Analysis I betrachtet hatten, ab. 

41

Kapitel 2 

Normierte Vektorräume 

2.1 Grundlegende Begriffe 

Definitionen. Sei E ein Vektorraum über K = R oder K = C (im folgenden kurz 

Vektorraum“genannt). Unter einer Norm auf E versteht man eine Abbildung 

” 

‖ · ‖ : E → R 

mit folgenden Eigenschaften: Für alle x, y ∈ E und λ ∈ K gilt 

(a) ‖x‖ ≥ 0; 

(b) ‖x‖ = 0 ⇔ x = 0; 

(c) ‖λx‖ = |λ| ‖x‖; 

(d) ‖x + y‖ ≤ ‖x‖ + ‖y‖. 

(Dreiecksungleichung) 

Diese Eigenschaften ähneln denen des Absolutbetrags | · | einer reellen oder komplexen 

Zahl, und in der Tat ist dieser eine Norm auf E = R bzw. E = C. Ein 

weiteres Beispiel ist die Supremumsnorm ‖ · ‖ u auf dem Vektorraum E = B(X) aller 

beschränkten Funktionen auf einer nichtleeren Menge X (siehe Bemerkungen 1.5). 

Ein normierter Vektorraum ist ein Paar (E, ‖ · ‖), bestehend aus einem Vektorraum 

E und einer Norm ‖ · ‖ auf E. Ist aus dem Kontext klar, um welche Norm es 

sich handelt, so schreibt man meist nur E anstelle des Paares (E, ‖ · ‖). 

Eine Folge (x j ) j in E heiße konvergent mit Grenzwert x ∈ E (in Zeichen : x j → x 

oder x = lim 

j→∞ 

x j ), wenn es zu jedem ε > 0 ein j 0 = j 0 (ε) ∈ N gibt so, daß gilt: 

‖x − x j ‖ < ε für alle j ≥ j 0 . 

Sie heiße Cauchy-Folge, wenn es zu jedem ε > 0 ein j 0 = j 0 (ε) ∈ N gibt so, daß 

gilt: 

‖x j − x k ‖ < ε für alle j, k ≥ j 0 . 

42

E heiße vollständig, wenn jede Cauchy-Folge in E einen Grenzwert in E besitzt. 

Vollständige normierte Vektorräume heißen auch Banachräume. 

Beispiel. In der Analysis I (vergl. Satz 5.15 sowie die Bemerkung nach Satz 7.3) 

wurde gezeigt, daß (K, | · |) ein vollständiger 1-dimensionaler Vektorraum über K, 

K = R oder K = C, ist. 

Die Vollständigkeit eines normierten Vektorraums ist eine fundamentale Eigenschaft. 

Man kann beweisen, daß jeder normierte Vektorraum eine ” 

Vervollständigung“ besitzt, 

ähnlich wie sich R durch Vervollständigung aus Q gewinnen läßt. 

Ist (x n ) n∈N eine Folge in E, so versteht man unter der unendlichen Reihe ∞ ∑ 

zunächst die Folge (s n ) n∈N der Partialsummen 

x k 

k=0 

s n := 

n∑ 

x k = x 0 + · · · + x n , n ∈ N, 

k=0 

k=0 

in E. Konvergiert diese gegen einen Grenzwert s ∈ E, so bezeichnet man diesen 

∑ 

ebenfalls mit ∞ x k , ganz ähnlich wie für Zahlenreihen. Analog zum Begriff der ab- 

∑ 

soluten Konvergenz bezeichnet man die Reihe ∞ x k in E als normal konvergent, 

∑ 

falls die Reihe ∞ ∑ 

‖x k ‖ konvergiert, d.h. falls ∞ ‖x k ‖ < ∞. Es gelten dann die 

k=0 

folgenden Analoga zu den entsprechenden Sätzen 5.17 und 8.1 aus der Analysis I: 

Satz 2.1 (Cauchy-Kriterium für Reihen) Sei E ein Banachraum. Dann ist eine 

Reihe ∑ k x k in E genau dann konvergent, wenn es zu jedem ε > 0 ein n(ε) ∈ N 

gibt, so daß ∥ ∥ ∥∥∥∥ ∑ m ∥∥∥∥ 

x k < ε für alle m ≥ n ≥ n(ε). 

k=n 

Satz 2.2 Sei E ein Banachraum. Eine normal konvergente Reihe in E konvergiert 

auch im gewöhnlichen Sinn. 

Diese Sätze können fast wortgleich wie die analogen Sätze über Zahlenreihen bewiesen 

werden; man muß nur den Betrag |·| einer Zahl durch die Norm ‖·‖ auf E ersetzen 

und den Begriff der absoluten Konvergenz durch den der normalen Konvergenz. 

k=0 

k=0 

2.2 p-Normen auf K n und die Banachräume l p 

Sei wieder K = R oder K = C. Wir wollen nun eine wichtige Klasse von Normen 

auf dem K n einführen. 

43

2.2.1 Die p-Norm auf dem K n 

Ist x = (x 1 , . . .,x n ) ein Vektor im K n , so setzen wir 

falls 1 ≤ p < ∞, und 

Wir bemerken, daß 

‖x‖ p := (|x 1 | p + · · · + |x n | p ) 1/p , 

‖x‖ ∞ := max 

j=1,...,n |x j|. 

‖x‖ ∞ = lim 

p→∞ 

‖x‖ p , 

was die Notation ‖ · ‖ ∞ rechtfertigt (Übung). Wir werden zeigen, daß für jedes p 

mit 1 ≤ p ≤ ∞ durch ‖ · ‖ p eine Norm auf dem n-dimensionalen K-Vektorraum 

K n gegeben ist. Hierzu erweist es sich als nützlich, zu einer etwas allgemeineren 

Situation überzugehen. 

Sei dazu A eine beliebige Menge der Mächtigkeit n ∈ N × . Die Menge K A aller 

Funktionen f : A → K, versehen mit der üblichen Addition sowie Multiplikation mit 

Skalaren aus dem Körper K, bildet dann einen n-dimensionalen K-Vektorraum. Ist 

nämlich A = {a 1 , . . ., a n } eine Abzählung der Menge A, so ist durch die Abbildung 

Φ : f ↦→ (f(a 1 ), . . .,f(a n )) 

ein linearer Isomorphismus Φ : K A → K n definiert, wie man sofort sieht. Setzen wir 

für f ∈ K A ‖f‖ p := 

( ) 1/p 

∑ 

|f(a)| p = 

a∈A 

|f(a j )| p ) 1/p 

, 

( n∑ 

j=1 

falls 1 ≤ p < ∞, und 

so gilt offenbar zudem 

‖f‖ ∞ := max 

a∈A |f(a)|, 

‖f‖ p = ‖Φ(f)‖ p für alle f ∈ K A . 

Damit wird klar, daß es genügt zu zeigen, daß durch ‖ · ‖ p eine Norm auf dem 

Vektorraum K A definiert ist. Hierzu beobachten wir zuerst, daß sich die Höldersche 

Ungleichung aus Satz 10.22 (Analysis I) umschreiben läßt als 

( 

n∑ 

n∑ 

) 1/p ( n∑ 

) 1/q 

|f(a j )g(a j )| ≤ |f(a j )| p |g(a j )| q , 

j=1 

j=1 

j=1 

falls 1 < p, q mit 1 p + 1 q 

= 1, d.h. als 

(2.1) ‖fg‖ 1 ≤ ‖f‖ p ‖g‖ q , f, g ∈ K A . 

44

Diese Ungleichung bleibt, wie man leicht nachprüft, auch noch gültig für p = 1 und 

q = ∞ sowie p = ∞ und q = 1. Somit gilt diese Höldersche Ungleichung (2.1) 

wann immer p, q ∈ [1, ∞] konjugierte Exponenten sind, d.h. falls gilt 

1 

p + 1 q = 1. 

Dabei sei in diesem Zusammenhang 1 := 0 gesetzt. Beachte, daß für 1 

∞ 

der konjugierte Exponent zu p gegeben ist durch 

q = 

p 

p − 1 . 

Satz 2.3 (Minkowskische Ungleichung) Sei A eine endliche Menge, und sei 

1 ≤ p ≤ ∞. Sind f, g ∈ K A , so gilt 

(2.2) ‖f + g‖ p ≤ ‖f‖ p + ‖g‖ p . 

Insbesondere gilt damit auch 

‖x + y‖ p ≤ ‖x‖ p + ‖y‖ p für alle x, y ∈ K n . 

Beweis. Für p = 1 und p = ∞ ist die Ungleichung klar. Sei also 1 

gilt 

∑ 

|(f + g)(a)| p ≤ ∑ |f(a)| |(f + g)(a)| p−1 + ∑ |g(a)| |(f + g)(a)| p−1 . 

a∈A 

a∈A 

a∈A 

Wendet man auf diese beiden Summen jeweils die Höldersche Ungleichung an, so 

folgt wegen q(p − 1) = p offenbar 

∑ 

|(f + g)(a)| p ≤ ‖f‖ p (‖f + g‖ p ) p/q + ‖g‖ p (‖f + g‖ p ) p/q . 

a∈A 

Mit p/q = p − 1 folgt hieraus 

also 

und damit die behauptete Ungleichung. 

‖f + g‖ p p ≤ (‖f‖ p + ‖g‖ p )‖f + g|| p−1 

p , 

‖f + g‖ p ≤ ‖f‖ p + ‖g‖ p , 

Q.E.D. 

Korollar 2.4 Für 1 ≤ p ≤ ∞ ist durch ‖ · ‖ p eine Norm auf dem K-Vektorraum 

K A (bzw. auf dem K n ) gegeben. 

Beweis. Sind f ∈ K A und λ ∈ K, so gilt offenbar ‖λf‖ p = |λ| ‖f‖ p . Ferner zeigt 

die Minkowskische Ungleichung, daß die Dreiecksungleichung für ‖ · ‖ p erfüllt ist. 

Um nachzuweisen, daß ‖ · ‖ p eine Norm ist, bleibt nur noch zu zeigen, daß ‖f‖ p = 0 

äquivalent zu f = 0 ist. Dies folgt aber unmittelbar aus der Definition. Q.E.D. 

45

2.2.2 Die Räume l p (A) 

Ist A eine endliche Menge, so bezeichnet man den Vektorraum K A , versehen mit der 

p-Norm ‖ · ‖ p , mit l p (A). 

Diese Definition läßt sich sogar auf den Fall unendlicher Menge A und damit auf 

den Fall unendlich-dimensionaler Räume ausdehnen, wie wir nun zeigen werden. 

Definitionen. Sei 1 ≤ p ≤ ∞, und sei A eine unendliche Menge. Ist E ⊂ A eine 

endliche Teilmenge, so setzen wir für jede Funktion f : A → K 

sowie 

‖f‖ E,p := ‖f| E ‖ p , 

‖f‖ p := sup{‖f‖ E,p : E ⊂ A, E endlich}. 

Beachte: Es kann durchaus ‖f‖ p = ∞ sein, falls A unendlich ist. 

Wir werden uns hauptsächlich für den Fall abzählbarer Mengen A interessieren, 

insbesondere A = N und A = Z. 

Definitionen. f ∈ K A heiße p-summierbar, falls ‖f‖ p < ∞. Mit l p (A) bezeichnen 

wir die Menge aller p-summierbaren Abbildungen f : A → K. l ∞ (A) besteht offenbar 

aus der Menge B(A) aller beschränkten Abbildungen von A nach K, und es ist 

‖f‖ ∞ = sup |f(a)| = ‖f‖ u . 

a∈A 

Lemma 2.5 

(i) Ist 1 ≤ p < ∞, und ist f ∈ l p (A), so ist 

( { 1/p ∑ 

‖f‖ p = sup |f(a)| p : E ⊂ A, E endlich}) 

. 

a∈E 

(ii) Ist A abzählbar unendlich, und ist die Folge (a j ) j∈N eine bijektive Abzählung 

von A (d.h. die Abbildung N ∋ j ↦→ a j ∈ A ist bijektiv), so gilt 

⎧( 

) 1/p 

∞∑ ⎪⎨ |f(a j )| p , 1 ≤ p < ∞, 

‖f‖ p = j=0 

⎪⎩ sup |f(a j )| , p = ∞. 

j∈N 

Beweis. (i) Für E ⊂ A, |E| < ∞, und f ∈ l p (A) sei r E 

:= ∑ |f(a)| p . Da die 

a∈E 

Abbildung r ↦→ r 1/p und ihre Umkehrfunktion r ↦→ r p monoton wachsend auf [0, ∞[ 

sind, folgt: 

‖f‖ p = sup{r 1/p 

E 

: E ⊂ A, |E| < ∞} 

= (sup{r E , E ⊂ A, |E| < ∞}) 1/p , 

46

womit (i) bewiesen ist. 

(ii) Übungsaufgabe. 

Q.E.D. 

Satz 2.6 (Höldersche Ungleichung) Seien p, q ∈ [1, ∞] konjugierte Exponenten, 

und seien f ∈ l p (A), g ∈ l q (A). Dann liegt die Funktion fg in l 1 (A), und es 

gilt 

(2.3) ‖fg‖ 1 ≤ ‖f‖ p ‖g‖ q 

Beweis. Ist E ⊂ A endlich, so gilt mit (2.1) 

‖fg‖ E,1 ≤ ‖f‖ E,p ‖g‖ E,q ≤ ‖f‖ p ‖g‖ q . 

Bildet man hier das Supremum über alle endlichen Teilmengen E von A, so folgt 

(2.3). Q.E.D. 

Satz 2.7 (Minkowskische Ungleichung) Sei 1 ≤ p ≤ ∞. Sind f, g ∈ l p (A), so 

ist auch f + g ∈ l p (A), und es gilt: 

(2.4) ‖f + g‖ p ≤ ‖f‖ p + ‖g‖ p . 

Beweis. Ist E ⊂ A endlich, so gilt mit Satz 2.3 

‖f + g‖ E,p ≤ ‖f‖ E,p + ‖g‖ E,p ≤ ‖f‖ p + ‖g‖ p . 

Dies zeigt, daß mit f, g ∈ l p (A) auch f + g in l p (A) liegt, und bildet man wieder 

das Supremum über alle endlichen Teilmengen E von A, so folgt (2.4). Q.E.D. 

Da offenbar ‖λf‖ p = |λ|‖f‖ p ist für alle f ∈ l p (A) und λ ∈ K, so ist damit offenbar 

l p (A) ein K-Vektorraum, und ganz ähnlich wie in Korollar 2.4 folgert man, daß ‖·‖ p 

auch im Falle unendlicher Mengen A eine Norm auf l p (A) ist, d.h. 

(l p (A), ‖ · ‖ p ) bildet einen normierten Vektorraum über K. 

Theorem 2.8 Für jede endliche oder auch unendliche Menge A und 1 ≤ p ≤ ∞ 

ist der normierte Raum (l p (A), ‖ · ‖ p ) vollständig. 

Beweis. Sei (f j ) j eine Cauchy-Folge in l p (A). Wir müssen zeigen, daß (f j ) j bzgl. 

der p-Norm einer Grenzfunktion f ∈ l p (A) entgegenstrebt. 

Da für jede endliche Teilmenge E ⊂ A und g ∈ l p (A) stets ‖g| E ‖ p ≤ ‖g‖ p ist, so ist 

insbesondere für jedes a ∈ A mit der Menge E := {a} 

|f j (a) − f k (a)| = ‖(f j − f k )| {a} ‖ p ≤ ‖f j − f k ‖ p , 

47

d.h. (f j (a)) j ist eine Cauchy-Folge in K. Wegen der Vollständigkeit von K besitzt 

diese einen eindeutigen Grenzwert in K, welchen wir mit f(a) bezeichnen: 

(2.5) lim 

j→∞ 

f j (a) =: f(a) für jedes a ∈ A. 

Wir zeigen, daß die hierdurch definierte Abbildung f : A → K p-summierbar ist, 

und daß ‖f j − f‖ p → 0 für j → ∞. 

Sei ε > 0, und wähle j 0 so groß, daß 

‖f j − f k ‖ p < ε ∀ j, k ≥ j 0 . 

Für jede endliche Teilmenge E von A folgt dann für j, k ≥ j 0 , falls p < ∞ : 

( ∑ 

a∈E 

|f j (a) − f k (a)| p ) 1/p 

≤ ‖f j − f k ‖ p < ε. 

Läßt man hierin k gegen Unendlich streben, so folgt mittels der Grenzwertsätze für 

Zahlenfolgen und (2.5) für j ≥ j 0 : 

( ∑ 

a∈E 

|f j (a) − f(a)| p ) 1/p 

≤ ε, 

also ‖f j − f‖ E,p ≤ ε. Wie man leicht sieht, gilt dies ebenfalls für p = ∞. Da j 0 nicht 

von E abhängt, folgt durch Supremumsbildung über alle endlichen Mengen E: 

‖f j − f‖ p ≤ ε, falls j ≥ j 0 . 

Damit haben wir gezeigt, daß ‖f j − f‖ p → 0 für j → ∞. . 

Wähle schließlich für ε = 1 ein j so, daß ‖f j −f‖ p ≤ 1. Für jede endliche Teilmenge 

E von A gilt dann 

‖f‖ E,p ≤ ‖f − f j ‖ E,p + ‖f j ‖ E,p ≤ ‖f j − f‖ p + ‖f j ‖ p ≤ 1 + ‖f j ‖ p , 

folglich 

‖f‖ p ≤ 1 + ‖f j ‖ p < ∞. 

Somit ist f p-summierbar. 

Als unmittelbare Konsequenz erhalten wir 

Q.E.D. 

Korollar 2.9 K n , versehen mit der p-Norm, ist ein vollständiger normierter Vektorraum 

über K. 

Bemerkung 2.10 Ist A unendlich, so ist l p (A) ein unendlich-dimensionaler Vektorraum. 

48

Beweis. Für a ∈ A sei δ a die charakteristische Funktion der Menge {a}, d.h. 

{ 

1, falls b = a, 

δ a (b) := 

0, sonst. 

Z.B. bilden für K n ≃ l p ({1, . . ., n}) die Vektoren δ 1 , . . .,δ n gerade die kanonische 

Basis des K n . Die Funktionen δ a , a ∈ A, sind linear unabhängig in l p (A), denn: 

Ist 0 = ∑ a∈A 

λ a δ a eine endliche Linearkombination, so folgt für jedes b ∈ A: 

0 = ∑ a∈A 

λ a δ a (b) = λ b . 


Q.E.D. 

Achtung: Ist A unendlich, so bilden die δ a , a ∈ A, keine Basis von l p (A) im Sinne 

der linearen Algebra. Z.B. liegt für A = N × die Funktion (d.h. Folge) f : N × → 

R, f(j) := 1/j, in l 2 (N × ), diese kann aber nicht als eine endliche Linearkombination 

der Funktionen δ k , k ∈ N × , dargestellt werden. 

Konvention. Wenn nicht ausdrücklich anders gesagt, werden wir in Zukunft den 

R n bzw. C n stets mit der Euklidischen Norm, d.h. der 2-Norm 

‖x‖ = ‖x‖ 2 = 

( n∑ 

j=1 

|x j | 2 ) 1/2 

versehen. 

49

Kapitel 3 

Metrische Räume 

3.1 Definitionen und Beispiele 

Wir wollen uns nun der Analysis auf mehrdimensionalen Räumen zuwenden. Dazu 

werden wir zunächst den Begriff des (Euklidischen) Abstands zweier reeller oder 

komplexer Zahlen, welcher für die Konvergenztheorie reeller oder komplexer Zahlenfolgen 

von fundamentaler Bedeutung war, verallgemeinern. 

Definition. Sei X eine nichtleere Menge. Eine Metrik auf X ist eine Abbildung 

mit folgenden Eigenschaften: 

(i) d(x, y) ≥ 0 für alle x, y ∈ X. 

d : X × X → R 

(ii) d(x, y) = 0 genau dann, wenn x = y . 

(iii) d(x, y) = d(y, x) für alle x, y ∈ X. 

(iv) d(x, z) ≤ d(x, y) + d(y, z) für alle x, y, z ∈ X. 

(Symmetrie) 

(Dreiecksungleichung) 

Ein metrischer Raum ist ein Paar X = (X, d) bestehend aus einer nichtleeren 

Menge X und einer Metrik d auf X. Man nennt d(x, y) den Abstand oder die Distanz 

der Punkte x und y bzgl. der Metrik d. Sind Mißverständnisse ausgeschlossen, 

so werden wir gelegentlich auch die Menge X des metrischen Raumes X = (X, d) 

als metrischen Raum bezeichnen. 

Beispiele 3.1 a) Die Menge R der reellen Zahlen und die Menge C der komplexen 

Zahlen werden zu metrischen Räumen, wenn man als Abstand definiert 

d(x, y) := |x − y| 

für x, y ∈ R (bzw. x, y ∈ C). 

50

) Ist allgemeiner (E, ‖ · ‖) ein normierter Vektorraum über K = R oder K = C, 

so ist durch 

d(x, y) := ‖x − y‖, x, y ∈ E, 

eine Metrik auf E definiert. Dies folgt unmittelbar aus den Definitionen von 

Norm und Metrik. Z.B. folgt die Dreiecksungleichung für die Metrik d aus der 

für die Norm: 

d(x, z) = ‖x −z‖ = ‖(x −y)+(y −z)‖ ≤ ‖x −y‖+‖y −z‖ = d(x, y)+d(y, z). 

Diese Metrik d ist stets gemeint, wenn wir (E, ‖ · ‖) als metrischen Raum 

betrachten. 

Als Standardmetrik auf dem K n werden wir, wenn nicht anders gesagt, die 

Euklidische Metrik d(x, y) := ‖x − y‖ 2 wählen. 

c) Ist (X, d) ein metrischer Raum und ist Y eine nichtleere Teilmenge von X, 

so wird Y zu einem metrischen Raum, wenn man als Metrik d Y auf Y die 

Einschränkung d Y := d| Y ×Y von d auf Y × Y wählt. Man bezeichnet den 

metrischen Raum (Y, d Y ) dann auch als metrischen Teilraum von (X, d). 

d) Auf jeder nichtleeren Menge X kann man die sogenannte diskrete Metrik 

einführen durch 

{ 

0, falls x = y, 

d(x, y) := 

1, falls x ≠ y. 

Die für die Analysis wichtigsten metrischen Räume sind die normierten Vektorräume 

sowie Teilmengen solcher Vektorräume. 

Definition. Zwei Metriken d 1 und d 2 auf einer Menge X heißen äquivalent (in 

Zeichen: d 1 ∼ d 2 ) , wenn es Konstanten 0 < c 1 ≤ c 2 gibt so, daß 

(3.1) c 1 d 1 (x, y) ≤ d 2 (x, y) ≤ c 2 d 1 (x, y) ∀x, y ∈ X. 

Analog sagt man, zwei Normen ‖ · ‖ 1 und ‖ · ‖ 2 auf einem K-Vektorraum E seien 

äquivalent (in Zeichen: ‖ · ‖ 1 ∼ ‖ · ‖ 2 ) , wenn es Konstanten 0 < c 1 ≤ c 2 gibt so, 

daß 

(3.2) c 1 ‖x‖ 1 ≤ ‖x‖ 2 ≤ c 2 ‖x‖ 1 ∀x ∈ E. 

Bezeichnet d j (x, y) := ‖x − y‖ j , j = 1, 2, dann die jeweilige zugehörige Metrik, so 

gilt offenbar: 

Lemma 3.2 Die Metriken d 1 und d 2 sind genau dann äquivalent, wenn die zugehörigen 

Normen ‖ · ‖ 1 und ‖ · ‖ 2 äquivalent sind. 

51

Man sieht übrigens leicht, daß durch den Begriff der Äquivalenz von Normen bzw. 

Metriken jeweils Äquivalenzrelationen auf der Menge aller Normen auf einem Vektorraum 

E bzw. Metriken auf einer Menge X definiert werden. 

Satz 3.3 Seien (X 1 , d 1 ) und (X 2 , d 2 ) zwei metrische Räume. Für 1 ≤ p ≤ ∞ ist 

dann durch 

( 

)∥ ∥∥p 

d p ((x 1 , x 2 ), (y 1 , y 2 )) := ∥ d 1 (x 1 , y 1 ), d 2 (x 2 , y 2 ) 

⎧( 

) 

⎨ 

1/p, 

d 

= 1 (x 1 , y 1 ) p + d 2 (x 2 , y 2 ) p falls 1 ≤ p < ∞ 

⎩ 

max{d 1 (x 1 , y 1 ), d 2 (x 2 , y 2 )}, falls p = ∞ 

eine Metrik auf dem kartesischen Produkt X 1 × X 2 definiert. Ferner sind je zwei 

dieser Metriken äquivalent. 

Beweis. Seien x = (x 1 , x 2 ), y = (y 1 , y 2 ) ∈ X 1 × X 2 . Offenbar ist d p (x, y) ≥ 0, und 

d p (x, y) = 0 genau dann, wenn ‖(d 1 (x 1 , y 1 ), d 2 (x 2 , y 2 ))‖ p = 0. Dies ist äquivalent zu 

d 1 (x 1 , y 1 ) = d 2 (x 2 , y 2 ) = 0, folglich zu x 1 = y 1 und x 2 = y 2 , d.h. zu x = y. Ist ferner 

z = (z 1 , z 2 ) ∈ X 1 × X 2 , so gilt 

d j (x j , y j ) ≤ d j (x j , z j ) + d j (z j , y j ), j = 1, 2, 

woraus aufgrund der Definition der p-Norm auf R 2 folgt: 

‖(d 1 (x 1 , y 1 ), d 2 (x 2 , y 2 ))‖ p 

≤ ‖(d 1 (x 1 , z 1 ) + d 1 (z 1 , y 1 ), d 2 (x 2 , z 2 ) + d 2 (z 2 , y 2 ))‖ p 

Damit ergibt sich die Dreiecksungleichung 

= ‖(d 1 (x 1 , z 1 ), d 2 (x 2 , z 2 )) + (d 1 (z 1 , y 1 ), d 2 (z 2 , y 2 ))‖ p 

≤ ‖(d 1 (x 1 , z 1 ), d 2 (x 2 , z 2 ))‖ p + ‖(d 1 (z 1 , y 1 ), d 2 (z 2 , y 2 ))‖ p 

d p (x, y) ≤ d p (x, z) + d p (z, y). 

Schließlich sind, wie man leicht zeigt, je zwei p-Normen auf dem R 2 äquivalent 

(Übung), womit die Äquivalenz der Metriken d p auf X 1 × X 2 folgt. 

Q.E.D. 

Beispiel 3.4 X 1 = R k , X 2 = R l , jeweils versehen mit der p-Norm. Für x = 

(x 1 , x 2 ), y = (y 1 , y 2 ) ∈ R k × R l ist dann für 1 ≤ p < ∞ 

und 

d p (x, y) = (‖x 1 − y 1 ‖ p p + ‖x 2 − y 2 ‖ p p) 1/p = ‖x − y‖ p , 

d ∞ (x, y) = max{‖x 1 − y 1 ‖ ∞ , ‖x 2 − y 2 ‖ ∞ } = ‖x − y‖ ∞ , 

falls man den R k × R l mit R k+l identifiziert. 

Falls nicht ausdrücklich anders gesagt, werden wir der Einfachheit halber den Produktraum 

X 1 × X 2 zweier metrischer Räume (X 1 , d 1 ) und (X 2 , d 2 ) stets mit der 

Metrik d = d ∞ versehen, d.h. 

(3.3) 

d((x 1 , x 2 ), (y 1 , y 2 )) := max{d 1 (x 1 , y 1 ), d 2 (x 2 , y 2 )}. 

52

3.2 Die Topologie eines metrischen Raumes 

Definition. Sei (X, d) ein metrischer Raum. Sind a ∈ X sowie r > 0, so heißt 

B r (a) := {x ∈ X : d(x, a) < r} 

die offene Kugel mit Mittelpunkt a und Radius r. Gelegentlich nennt man B ε (a) 

auch die ε-Umgebung von a. 

Definition. Eine Teilmenge U ⊂ X heiße Umgebung des Punktes x ∈ X, falls 

ein ε > 0 existiert, so daß gilt: 

B ε (x) ⊂ U. 

Beachte: Betrachten wir die Teilmenge Y ⊂ X von X als metrischen Teilraum von 

X und bezeichnen die Kugeln in Y mit Br Y (a), d.h. 

so gilt offenbar 

B Y r (a) := {y ∈ Y : d Y (y, a) < r}, a ∈ Y, 

(3.4) B Y r (a) = B r(a) ∩ Y. 

Satz 3.5 (i) Ist U eine Umgebung von x und ist W ⊃ U, so ist auch W eine 

Umgebung von x. 

(ii) Sind U 1 und U 2 Umgebungen von x, so ist auch U 1 ∩ U 2 eine Umgebung von x. 

Beweis. (i) Per definitionem existiert ein ε > 0 mit B ε (x) ⊂ U ⊂ W. 

(ii) Seien ε 1 , ε 2 ∈ R + so, daß B ε1 (x) ⊂ U 1 und B ε2 (x) ⊂ U 2 ist. Für ε := min{ε 1 , ε 2 } 

gilt dann: B ε (x) ⊂ U 1 ∩ U 2 . 

Q.E.D. 

Satz 3.6 Sei (X, d) ein metrischer Raum. Dann gilt das Hausdorffsche Trennungsaxiom: 

Zu je zwei verschiedenen Punkten x, y ∈ X gibt es Umgebungen U von x und V von 

y, die disjunkt sind. 

Beweis. Sei ε := 1 2 d(x, y). Dann ist ε > 0, und U := B ε(x) und V := B ε (y) sind 

Umgebungen von x bzw. y. Ferner ist U ∩ V = ∅, denn für jedes z ∈ U ∩ V würde 

gelten: 

2ε = d(x, y) ≤ d(x, z) + d(z, y) < ε + ε = 2ε, 

was zu einem Widerspruch führt. 

Q.E.D. 

Definition. Eine Teilmenge U eines metrischen Raumes X heiße offen, wenn sie 

Umgebung jedes ihrer Punkte ist, d.h. wenn gilt: 

∀x ∈ U ∃ε > 0 : B ε (x) ⊂ U. 

53

Beispiele 3.7 

offen: 

(i) Für jeden Punkt a ∈ X und jedes r > 0 ist die Kugel B r (a) 

Ist nämlich x ∈ B r (a), so ist ε := r − d(x, a) > 0. Für y ∈ B ε (x) folgt damit: 

d.h. es ist B ε (x) ⊂ B r (a). 

d(y, a) ≤ d(y, x) + d(x, a) < ε + d(x, a) = r , 

(ii) ” 

Offene Intervalle“ der Form ]a, b[ mit −∞ ≤ a 

des metrischen Raumes (R, d) (vgl. Beispiel 3.1): 

Ist nämlich x ∈]a, b[, und sind a und b endlich, so ist für 

ε := min{|a −x|, |b −x|} offenbar B ε (x) ⊂]a, b[; der allgemeine Fall kann leicht 

auf den obigen zurückgeführt werden. 

Dagegen sind Intervalle der Form [a, b[, ]a, b] und [a, b] nicht offen; z.B. liegt 

für kein ε > 0 die Kugel B ε (a) ganz in [a, b[. 

Bezeichnung. Ist X = (X, d) ein metrischer Raum, so bezeichnen wir mit 

die Menge aller offenen Mengen in X. 

T(X) := {U ⊂ X : U ist offen } 

Satz 3.8 T := T(X) besitzt die folgenden Eigenschaften: 

a) ∅, X ∈ T. 

b) Sind U, V ∈ T, so ist auch U ∩ V ∈ T. 

c) Sind U ι , ι ∈ I, in T, so ist auch ⋃ ι∈I U ι ∈ T. 

Beweis. a) Ist trivial. 

b) Sei x ∈ U ∩ V . Dann sind U und V Umgebungen von x, somit nach Satz 3.5(ii) 

auch U ∩ V . Damit ist U ∩ V offen. 

c) Sei x ∈ ⋃ U ι . Dann gibt es ein ι 0 mit x ∈ U ι0 . Wieder mit Satz 3.5 ist ⋃ U ι als 

ι∈I 

Obermenge von U ι0 eine Umgebung von x. 

ι∈I 

Q.E.D. 

Definition. Ist X eine nichtleere Menge, so bezeichnet man ein Mengensystem 

T ⊂ P(X) mit den Eigenschaften a) – c) aus Satz 3.8 als Topologie auf X. Das 

Paar (X, T) wird dann als topologischer Raum, und die Mengen U ∈ T als die 

offenen Mengen des topologischen Raumes (X, T) bezeichnet. 

54

Ist d eine Metrik auf X, so heißt T((X, d)) die durch d auf X induzierte Topologie. 

Diese werden wir stets auf X verwenden. 

Nach Satz 3.8 ist übrigens der Durchschnitt endlich vieler offener Mengen stets offen. 

Für unendliche Durchschnitte ist dies i.a. nicht so. Z.B. ist 

∞⋂ 

[0, 1[= ] − 1 n , 1[ . 

n=1 

Satz 3.9 Zwei äquivalente Metriken d 1 und d 2 auf X erzeugen dieselbe Topologie, 

d.h. T(X, d 1 ) = T(X, d 2 ). 

Beweis. Seien 0 < c 1 ≤ c 2 so, daß 

c 1 d 1 (x, y) ≤ d 2 (x, y) ≤ c 2 d 1 (x, y) ∀x, y ∈ X. 

Bezeichnen wir mit B j r (a) := {x ∈ X, d j(x, a) < r}, j = 1, 2, die Kugeln bzgl. der 

beiden Metriken d 1 und d 2 , so folgt für jedes r > 0, a ∈ X 

so daß für jedes ε > 0 gilt: 

B 1 r (a) ⊂ B2 c 2 r (a), 

B 1 ε/c 2 

(a) ⊂ B 2 ε (a), 

Hieraus folgt unmittelbar die Behauptung. 

B2 r (a) ⊂ B1 1/c 1 r (a), 

B2 c 1 ε (a) ⊂ B1 ε (a). 

Q.E.D. 

Definition. Eine Teilmenge A eines metrischen Raumes (X, d) (oder allgemeiner 

eines topologischen Raumes) heiße abgeschlossen, wenn ihr Komplement A c := 

X \ A offen ist. 

Beispiele 3.10 (i) Abgeschlossene Intervalle “der Gestalt [a, b] sind abgeschlossene 

Teilmengen von R, denn R \ [a, b] =] − ∞, a[ ∪ ]b, +∞[ ist ” 

offen. 

Ebenso sind Intervalle der Form [a, +∞[ und ] − ∞, a] abgeschlossen. 

(ii) Die ” 

abgeschlossenen Kugeln“ 

B r (a) := {x ∈ X : d(x, a) ≤ r}, a ∈ X, r ≥ 0, 

eines metrischen Raumes X sind stets abgeschlossen. 

Ist nämlich y ∈ X \ B r (a), so ist 

Für z ∈ B ε (y) ist dann 

ε := d(y, a) − r > 0 . 

d(z, a) ≥ d(y, a) − d(z, y) > d(y, a) − ε = r . 

Somit ist B ε (y) ⊂ X \ B r (a), d.h. X \ B r (a) ist offen. 

55

(iii) Die Mengen ∅ und X sind stets abgeschlossen. 

(iv) Beliebige Durchschnitte und endliche Vereinigungen abgeschlossener Mengen 

sind abgeschlossen. 

(v) Ist die nichtleere Menge X mit der diskreten Metrik versehen, so sind alle 

Teilmengen von X offen (Übung). Folglich sind alle Teilmengen von X ebenso 

abgeschlossen. Eine Menge kann somit durchaus gleichzeitig offen und abgeschlossen 

sein! 

Satz 3.11 (Relativtopologie) Sei (X, d) ein metrischer Raum, und sei Y ⊂ X 

eine Teilmenge von X, welche wir mittels der eingeschränkten Metrik d Y (vgl. Beispiel 

3.1 c)) als metrischen Teilraum von X betrachten. d Y induziert eine Topologie 

auf Y, die sogenannte Relativtopologie von Y bzgl. X. Die offenen (bzw. abgeschlossenen) 

Teilmengen von Y lassen sich dann wie folgt charakterisieren: 

Eine Teilmenge N ⊂ Y ist genau dann offen (bzw. abgeschlossen) in Y , wenn es 

eine offene (bzw. abgeschlossene) Teilmenge M von X gibt mit N = M ∩ Y . 

Beweis. Wir zeigen die Aussage über die Offenheit von Teilmengen von Y . Die 

analoge Aussage über die Abgeschlossenheit folgt dann durch Komplementbildung. 

Ist M ⊂ X offen in X, und ist y ∈ N := M ∩ Y , so gibt es ein ε > 0 so, daß 

B ε (y) ⊂ M. Folglich ist nach (3.4) Bε Y (y) = B ε(y) ∩Y ⊂ N. Dies zeigt, daß N offen 

in Y ist. 

Ist umgekehrt N offen in 

⋃ 

Y , so gibt es zu jedem a ∈ Y ein ε(a) > 0 so, daß 

Bε(a) Y (a) ⊂ N. Sei M := B ε(a) (a). Dann ist M offen in X, und nach (3.4) ist 

a∈N 

M ∩ Y = ⋃ (a) = N. 

Q.E.D. 

Bε(a) Y 

a∈N 

Definitionen. Seien (X, d) ein metrischer Raum und Y eine Teilmenge von X. Ein 

Punkt x ∈ X heiße Randpunkt von Y , wenn in jeder Umgebung von x sowohl ein 

Punkt von Y als auch ein Punkt des Komplements X \ Y liegt. Die Menge aller 

Randpunkte von Y nennt man den Rand von Y und bezeichnet ihn mit ∂Y . 

Ein Punkt x ∈ X heiße Berührungspunkt von Y, wenn in jeder Umgebung von x 

mindestens ein Punkt aus Y liegt. Die Menge aller Berührungspunkte von Y nennt 

man die abgeschlossene Hülle oder auch den Abschluß von Y und bezeichnet 

sie mit Y . 

Ein Punkt y ∈ Y heiße innerer Punkt von Y, wenn Y eine Umgebung von y ist. 

Die Menge aller inneren Punkte von Y nennt man das (offene) Innere von Y und 

bezeichnet sie mit Y 0 . 

56

Beispiele 3.12 (a) Wir haben gesehen, daß für r > 0 die Mengen B r (a) = {x ∈ 

X : d(x, a) < r} und X \ B r (a) = {x ∈ X : d(x, a) > r} offen sind. Hieraus 

folgt 

∂B r (a) ⊂ {x ∈ X : d(x, a) = r}. 

Für X = R n kann man sogar zeigen (Übung): 

∂{x ∈ R n : ‖x‖ 2 < r} = {x ∈ R n : ‖x‖ 2 = r} . 

Es gibt jedoch auch metrische Räume, in denen die entsprechende Identität 

falsch ist (Übung)! 

(b) ∂Q = ∂(R \ Q) = R. 

Satz 3.13 Seien X ein metrischer Raum und Y ⊂ X. Dann gilt: 

(a) ∂Y = ∂(X \ Y ). 

(b) Y \ ∂Y ist offen, und es gilt Y \ ∂Y = Y 0 . 

(c) Y ∪ ∂Y ist abgeschlossen, und es gilt Y ∪ ∂Y = Y . 

(d) Es gilt ∂Y = Y \ Y 0 ; insbesondere ist ∂Y abgeschlossen. 

Beweis. (a) ist klar aufgrund der Definition des Randes. 

(b) Offenbar kann ein innerer Punkt von Y kein Randpunkt von Y sein, so daß 

Y 0 ⊂ Y \ ∂Y. 

Um die umgekehrte Inklusion zu zeigen beobachten wir, daß ein Punkt x ∈ X nicht 

in ∂Y liegt dann und nur dann, wenn es eine offene ε-Umgebung U von x gibt, 

welche entweder ganz in Y oder ganz in X \ Y liegt. 

Sei nun x ∈ Y \ ∂Y , und sei U eine solche offene Umgebung von x. Da x in Y liegt, 

muß dann U ganz in Y liegen, und da U offen ist, sind alle Punkte aus U innere 

Punkte von Y. Damit gilt U ⊂ Y 0 ⊂ Y \ ∂Y. 

Dies zeigt sowohl, daß Y \ ∂Y offen ist, als auch, daß Y \ ∂Y ⊂ Y 0 , womit (a) 

bewiesen ist. 

(c) Offenbar ist jeder Punkt aus Y und auch jeder Randpunkt von Y ein Berührungspunkt 

von Y, d.h. Y ∪ ∂Y ⊂ Y . 

Um die umgekehrte Inklusion zu zeigen betrachten wir zunächst das Komplement 

(Y ∪ ∂Y ) c von Y ∪ ∂Y in X. Es gilt mit (a) 

(Y ∪ ∂Y ) c = Y c ∩ (∂Y ) c = Y c \ ∂Y = Y c \ ∂Y c , 

so daß die Menge (Y ∪ ∂Y ) c nach (b) offen ist. Folglich ist Y ∪ ∂Y abgeschlossen. 

Ist x ∈ (Y ∪ ∂Y ) c ⊂ Y c , so kann wegen der Offenheit von (Y ∪ ∂Y ) c insbesondere x 

kein Berührungspunkt von Y sein, d.h. es ist (Y ∪ ∂Y ) c ⊂ (Y ) c , bzw. Y ⊂ Y ∪ ∂Y. 

Die umgekehrte Inklusion hatten wir bereits gezeigt, so daß also Y = Y ∪ ∂Y gilt. 

57

(d) Mit (b) und (c) folgt 

∂Y = (Y ∪ ∂Y ) \ (Y \ ∂Y ) = Y \ Y 0 = Y ∩ (Y 0 ) c . 

Somit ist insbesondere ∂Y als Durchschnitt zweier abgeschlossener Mengen abgeschlossen. 

Damit ist auch (d) bewiesen. 

Q.E.D. 

Bemerkung: Man kann beweisen (Übung), daß Y die kleinste abgeschlossen Teilmenge 

A von X ist mit Y ⊂ A, d.h. es gilt 

⋂ 

Y = 

C. 

Y ⊂C, C abgeschlossen 

Definitionen. Es seien A, B ⊂ X. A heiße dicht in B, falls A ∩ B = B ist. Beispielsweise 

ist Q = R, d.h. Q ist dicht in R. 

Der Abstand zweier nichtleerer Teilmengen A und B von X ist definiert durch 

d(A, B) := inf{d(a, b) : a ∈ A, b ∈ B}. 

Der Abstand des Punktes x ∈ X zu A ist definiert durch 

d(x, A) := d({x}, A) = inf{d(x, a) : a ∈ A}. 

3.3 Konvergenz in metrischen Räumen 

Sei X = (X, d) ein metrischer Raum. 

Definition. Eine Folge (x n ) n∈N von Punkten aus X heiße konvergent gegen a ∈ X, 

in Zeichen: 

lim 

n→∞ x n = a, 

wenn gilt: Zu jeder Umgebung U von a existiert ein N ∈ N so, daß x n ∈ U ist für 

alle n ≥ N. 

Da in jeder Umgebung eine ε-Umgebung enthalten ist, ist dies gleichbedeutend mit 

der Aussage: Zu jedem ε > 0 gibt es ein N = n(ε) ∈ N, so daß d(x n , a) < ε ist für 

alle n ≥ N, bzw. zu 

(3.5) 

lim d(x n, a) = 0 . 

n→∞ 

Man sieht sofort mit Hilfe des Hausdorffschen Trennungsaxioms (Satz 3.6), daß 

eine konvergente Folge genau einen Grenzwert besitzt. Ferner führen nach Satz 3.9 

äquivalente Metriken zum selben Konvergenzbegriff. 

58

Satz 3.14 Sei (x k ) k∈N eine Folge von Punkten im R n . Ferner sei x k = 

(x k1 , . . .x kn ), k ∈ N. Dann konvergiert die Folge (x k ) k gegen a = (a 1 , . . .,a n ) ∈ R n 

dann und nur dann, wenn für jedes j = 1, . . .,n gilt: 

lim x kj = a j . 

k→∞ 

Beweis. Aufgrund der Definition der l p - Normen sieht man leicht, daß 

max 

j=1,...,n |x kj − a j | ≤ d(x k , a) = ‖x k − a‖ 2 ≤ √ n max 

j=1,...,n |x kj − a j | . 

Somit ist lim d(x k , a) = 0 genau dann, wenn max |x kj − a j | → 0 für k → ∞, d.h. 

k→∞ j=1,...,n 

wenn 

|x kj − a j | → 0 für k → ∞, für jedes j = 1, . . .,n . 

Q.E.D. 

Mit Hilfe der Konvergenz von Folgen kann man die abgeschlossenen Mengen folgendermaßen 

charakterisieren. 

Satz 3.15 (Folgenkriterium für Abgeschlossenheit) Sei (X, d) ein metrischer 

Raum. Eine Teilmenge A ⊂ X ist genau dann abgeschlossen, wenn für jede Folge 

(x k ) k von Punkten x k ∈ A gilt: 

Konvergiert (x k ) k gegen einen Punkt x ∈ X, so ist x ∈ A . 

Beweis. Sei A abgeschlossen. Ist dann (x k ) k eine Folge in A mit x = lim x k , so wäre, 

falls x in A c läge, A c eine offene Umgebung von x. Folglich gäbe es ein N ∈ N mit 

x N ∈ A c , im Widerspruch zu unserer Annahme. Also ist notwendig x ∈ A. 

Zur Umkehrung: Das Folgenkriterium sei erfüllt. Wir wollen zeigen, daß dann A = A 

ist, woraus die Abgeschlossenheit von A folgt. 

Sei dazu x ∈ A. Dann ist x ein Berührungspunkt von A und wir finden insbesondere 

zu jedem k ∈ N, k ≥ 1, einen Punkt x k ∈ A in der Umgebung B 1/k (x) von x. Wegen 

d(x k , x) < 1 ist dann x = lim x k k, folglich x ∈ A. Dies zeigt, daß A ⊂ A ist, und die 

k→∞ 

Inklusion A ⊂ A ist klar. 

Q.E.D. 

Bemerkung 3.16 Der Beweis lehrt zusätzlich, daß A ⊂ X abgeschlossen ist genau 

dann, wenn A = A ist. 

Definition. Die Folge (x k ) k von Punkten aus X heiße Cauchy-Folge, wenn gilt: 

Zu jedem ε > 0 gibt es ein N ∈ N, so daß d(x n , x m ) < ε ist für alle n, m ≥ N. 

Bemerkung 3.17 Jede konvergente Folge ist eine Cauchy-Folge (Beweis?). 

59

Definition. Ein metrischer Raum heiße vollständig, wenn in ihm jede Cauchy- 

Folge konvergiert. 

Satz 3.18 Sei (X, d) ein vollständiger metrischer Raum. Eine Teilmenge Y von X 

ist abgeschlossen in X genau dann, wenn sie als metrischer Teilraum von (X, d) 

vollständig ist. 

Beweis. Sei Y abgeschlossen. Ist (y n ) n eine Cauchy-Folge in Y , so konvergiert sie 

wegen der Vollständigkeit von X gegen ein x ∈ X, d.h. es ist lim y n = x. Damit ist 

n→∞ 

aber nach Satz 3.15 x ∈ Y . Y ist also vollständig. 

Ist umgekehrt Y vollständig, und ist (y n ) n eine Folge in Y , welche gegen x ∈ X 

konvergiert, so ist sie auch eine Cauchy-Folge in Y und damit konvergent in Y . 

Wegen der Eindeutigkeit des Limes ist dann x ∈ Y , d.h. Y ist abgeschlossen. 

Beispiel 3.19 Die Banachräume C k (I). 

Q.E.D. 

Sei I = [a, b] ⊂ R ein kompaktes Intervall positiver Länge, und sei k ∈ N. Wir 

versehen den Raum C k (I) mit der Norm 

‖f‖ C k := max 

j=0,...,k ‖f(j) ‖ ∞ 

(daß dies in der Tat eine Norm ist folgt unmittelbar aus der Tatsache, daß ‖ · ‖ ∞ = 

‖ · ‖ u eine Norm auf dem Raum C 0 (I) = C(I) ist). 

Betrachte zunächst den Fall k = 0. Man zeigt leicht, daß C(I) eine abgeschlossene 

Teilmenge des Banachraumes (l ∞ (I), ‖ · ‖ ∞ ) ist. Ist nämlich (f j ) j eine Folge in 

C(I), welche in l ∞ (I) gegen eine Grenzfunktion f ∈ l ∞ (I) konvergiert, so ist f als 

gleichmäßiger Limes einer Folge stetiger Funktionen selbst stetig (Satz 9.13, Analysis 

I), d.h. f ∈ C(I). Somit ist C(I) nach Satz 3.18 vollständig, also ein Banachraum. 

Mittels Satz 1.19 und der Vollständigkeit von C(I) kann man dann leicht per Induktion 

nach k zeigen, daß (C k (I), ‖ · ‖ C k) ein Banachraum ist für jedes k ∈ N 

(Übung). 

Definitionen. Der Durchmesser einer Teilmenge A eines metrischen Raumes 

(X, d) ist definiert als 

diam(A) := sup{d(x, y) : x, y ∈ A} . 

Die Menge A heiße beschränkt, falls diam(A) < ∞ ist. Offenbar ist A genau dann 

beschränkt, wenn ein a ∈ X und ein r ∈ R + existieren so, daß A ⊂ B r (a) ist. Es 

gilt z.B. 

diam B r (a) ≤ 2r . 

60

3.4 Stetigkeit 

Es seien (X, d) und (Y, ̺) metrische Räume, sowie a ∈ X. 

Satz 3.20 Die folgenden Bedingungen sind für eine Abbildung f : X → Y äquivalent: 

(i) Für jede Folge (x n ) n in X mit lim x n = a gilt: lim f(x n ) = f(a), d.h. 

lim f(x n) = f( lim x n ) 

n→∞ n→∞ 

(ii) Zu jedem ε > 0 existiert ein δ = δ(ε) > 0, so daß 

̺(f(x), f(a)) < ε ist für alle x ∈ X mit d(x, a) < δ 

(Folgen − Stetigkeit). 

(ε − δ− Kriterium). 

(iii) Für jede Umgebung V von f(a) in Y ist U := f −1 (V ) eine Umgebung von a 

in X. 

Beweis. Wir beobachten zunächst, daß (ii) gleichbedeutend ist mit 

(ii ′ ) Zu jedem ε > 0 gibt es ein δ = δ(ε) > 0 mit 

) 

f(B δ (a)) ⊂ B ε (f(a)), d.h. mit B δ (a) ⊂ f 

(B −1 ε (f(a)) . 

Die Äquivalenz von (ii ′ ) und (iii) folgt nun sofort aus der Definition des Umgebungsbegriffs. 

Es bleibt die Äquivalenz von (i) und (ii ′ ) zu zeigen: 

Gilt (ii ′ ) nicht, so gibt es ein ε > 0 so, daß für jedes δ = 1/n, n ∈ N × , ein x n ∈ 

B 1/n (a) existiert mit f(x n ) ∉ B ε (f(a)). Dann ist a = lim x n , während die Folge 

n→∞ 

(f(x n )) n nicht gegen f(a) konvergiert. Somit ist f nicht Folgen-stetig. 

Gilt dagegen (ii ′ ), und ist (x n ) n eine Folge in X mit a = lim x n , so wähle zu gegebenem 

ε > 0 ein δ > 0 gemäß (ii ′ ) mit f(B δ (a)) ⊂ B ε (f(a)). Dann gibt es ein 

N ∈ N so, daß x n ∈ B δ (a) für alle n ≥ N, folglich f(x n ) ∈ B ε (f(a)). Somit ist 

lim 

n→∞ f(x n) = f(a). 

Q.E.D. 

Definitionen. Die Funktion f : X → Y heiße im Punkte a ∈ X stetig, wenn 

sie den Bedingungen von Satz 3.20 genügt. f heiße stetig, wenn f in jedem Punkt 

a ∈ X stetig ist. 

Ist A ⊂ X, so bezeichnet man x ∈ X als Häufungspunkt der Menge A, wenn 

jede Umgebung von x in X mindestens einen Punkt a ≠ x aus A enthält (man 

vergleiche dies mit dem Begriff des Berührungspunktes!). 

61

Seien f : A → Y eine Abbildung und x ∈ X ein Häufungspunkt von A. 

Dann bezeichnet man b ∈ Y als den Grenzwert der Abbildung f : A → Y für 

a → x, in Zeichen: 

b = lim 

a→x 

f(a) , 

wenn es zu jedem ε > 0 ein δ > 0 gibt derart, daß ̺(f(a), b) < ε ist für alle 

a ∈ A \ {x} mit d(a, x) < δ. 

Beispiel. Die Menge der Häufungspunkte der Menge A =]0, 1[∪{2} in R ist gegeben 

durch [0, 1]. 

Satz 3.21 Es seien (X, d), (Y, ̺), (Z, γ) metrische Räume, sowie f : X → Y und 

g : Y → Z Abbildungen. Ist f stetig in a ∈ X und g stetig in b := f(a) ∈ Y , so ist 

g ◦ f : X → Z stetig in a. 

Beweis. Es sei W eine Umgebung von g(b) in Z. Dann ist V = g −1 (W) eine Umgebung 

von b in Y, folglich U = f −1 (V ) eine Umgebung von a in X, jeweils wegen 

der Stetigkeit von g in b bzw. von f in a. Schließlich ist (g ◦ f) −1 (W) = U. 

Q.E.D. 

Definition. Sind (X, d), (Y, ̺) metrische Räume, so bezeichnen wir mit C(X, Y ) die 

Menge aller stetigen Funktionen von X nach Y . 

Satz 3.22 Eine Abbildung f : X → Y ist genau dann stetig, wenn für jede offene 

(abgeschlossene) Teilmenge M von Y ihr Urbild f −1 (M) offen (abgeschlossen) ist 

in X. 

Beweis. Sei f ∈ C(X, Y ). Ist U ⊂ Y offen, und ist a ∈ f −1 (U), so ist U eine Umgebung 

von f(a) ist. Wegen der Stetigkeit von f in a ist somit f −1 (U) eine Umgebung 

von a. Dies zeigt, daß f −1 (U) offen ist. Weiter ist f −1 (U c ) = (f −1 (U)) c . Dies zeigt, 

daß auch das Urbild einer abgeschlossenen Teilmenge von Y stets abgeschlossen ist. 

Sei umgekehrt f ∈ Y X so, daß das Urbild einer offenen Menge unter f stets offen 

ist. Seien ferner a ∈ X, ε > 0. Dann ist V = f −1 (B ε (f(a))) eine offene Menge mit 

a ∈ V , also eine Umgebung von a. Damit ist f nach Satz 3.20 stetig in a. Es folgt 

f ∈ C(X, Y ). 

Q.E.D. 

Beispiele 3.23 a) Seien (X, d) und (Y 1 , d 1 ), (Y 2 , d 2 ) metrische Räume, sowie 

f 1 : X → Y 1 , f 2 : X → Y 2 Abbildungen. Die Abbildung 

f = (f 1 , f 2 ) : X → Y 1 × Y 2 

ist genau dann stetig in x ∈ X, wenn beide Abbildungen f 1 und f 2 stetig sind 

in x. 

62

Beweis. Eine Folge (y k ) k = ((y k1 , y k2 )) k in Y 1 × Y 2 konvergiert genau dann 

gegen y = (y 1 , y 2 ) in Y 1 ×Y 2 , wenn lim y k1 = y 1 und lim y k2 = y 2 (vergl. dazu 

k→∞ k→∞ 

(3.3), sowie den Beweis von Satz 3.14). 

Ist nun (x k ) k eine Folge in X mit lim x k = x ∈ X, so gilt somit: Die Folge 

k→∞ 

f(x k ) konvergiert genau dann gegen f(x) in Y 1 ×Y 2 , wenn lim f 1 (x k ) = f 1 (x) 

k→∞ 

und lim f 2 (x k ) = f 2 (x). Hieraus folgt die Behauptung. Q.E.D. 

k→∞ 

b) Durch Iteration erhält man insbesondere: 

Eine Abbildung 

f = (f 1 , . . .,f n ) : X → K n 

ist genau dann stetig, wenn alle Komponenten f j : X → K, j = 1, . . ., n, 

stetig sind. 

c) Folgende Abbildungen sind stetig: 

(i) add: K × K → K, (x, y) ↦→ x + y, 

(ii) mult: K × K → K, 

(iii) quot: K × K × → K, 

(x, y) ↦→ xy, 

(x, y) ↦→ x y , wobei K× = K \ {0} sei. 

Beweis. Sei ((x k , y k )) k eine Folge in K 2 mit 

lim (x k, y k ) = (x, y) . 

k→∞ 

Nach Satz 3.14 gilt dann lim x k = x, lim y k = y. 

k→∞ k→∞ 

Daraus folgt 

lim (x k + y k ) = x + y, lim (x k y k ) = xy . 

k→∞ k→∞ 

Ist zusätzlich y k ≠ 0 für alle k sowie y ≠ 0, so ist auch 

lim x ky −1 

k 

= xy −1 . 

k→∞ 

Q.E.D. 

Korollar 3.24 Sei (X, d) ein metrischer Raum, und seien f, g : X → K stetige 

Funktionen. Dann sind auch die Funktionen 

f + g : X → K, 

fg : X → K 

stetig. Ist ferner g(x) ≠ 0 für alle x ∈ X, so ist auch 

stetig. 

f 

g : X → K 

63

Beweis. Nach a) ist die Abbildung 

(f, g) : X → K × K 

stetig. Ferner ist 

f + g = add ◦ (f, g), fg = mult ◦ (f, g), 

Die Behauptung folgt somit aus Satz 3.21 und c). 

f 

g 

= quot ◦ (f, g) . 

Q.E.D. 

d) Ein Monom auf dem K n vom Grad r ∈ N ist eine Funktion von K n nach K 

der Gestalt 

(x 1 , . . .,x n ) ↦→ x k 1 

1 x k 2 

2 . . .x kn 

n , 

wobei k 1 , . . .,k n ∈ N mit k 1 + · · · + k n = r sind. Eine Polynomfunktion 

F : K n → K vom Grad ≤ r ist eine Linearkombination von Monomen vom 

Grad ≤ r, 

∑ 

F(x 1 , . . .,x n ) = c k1 ...k n 

x k 1 

1 · · ·xkn n , 

k 1 +···+k n≤r 

mit c k1 ...k n 

∈ K. Gibt es einen Koeffizienten c l1 ...l n 

≠ 0 mit l 1 + · · · + l n = r, 

so heißt F vom Grad r. 

Da die Koordinatenprojektionen 

p j : (x 1 , . . .,x n ) ↦→ x j 

für j = 1, . . .,n stetig sind, folgt durch wiederholte Anwendung von Korollar 

3.24, daß alle Polynomfunktionen auf dem K n stetig sind. 

Definition. Seien (X, d), (Y, ̺) metrische Räume. Eine Abbildung f : X → Y 

heiße gleichmäßig stetig, wenn es zu jedem ε > 0 ein δ > 0 gibt, so daß für alle 

x 1 , x 2 ∈ X gilt: 

(3.6) 

Ist d(x 1 , x 2 ) < δ, so ist ̺(f(x 1 ), f(x 2 )) < ε. 

f : X → Y heißt Lipschitz-stetig, falls eine Konstante L ≥ 0 existiert mit 

̺(f(x 1 ), f(x 2 )) ≤ Ld(x 1 , x 2 ) für alle x 1 , x 2 ∈ X. Eine solche Abbildung ist offenbar 

gleichmäßig stetig. 

Satz 3.25 Sei X 0 dicht in X, und sei f : X 0 → Y gleichmäßig stetig. Ist Y 

vollständig, so gibt es genau eine stetige Abbildung 

˜f : X → Y mit ˜f|X0 = f. 

Man bezeichnet ˜f als die stetige Fortsetzung von f auf X. Diese ist ebenfalls 

gleichmäßig stetig. 

64

Beweis. Sei x ∈ X. Dann existiert eine Folge (x j ) j in X 0 mit x = lim x j . Somit ist 

(x j ) j eine Cauchy-Folge in X. Wegen der gleichmäßigen Stetigkeit von f ist dann 

die Folge (f(x j )) j eine Cauchy-Folge in Y : 

Ist nämlich ε > 0, so wähle δ > 0 wie in (3.6). Zu δ wähle k 0 ∈ N so, daß d(x j , x k ) < δ 

ist für alle j, k ≥ k 0 . Für diese j, k ist dann ̺(f(x j ), f(x k )) < ε. 

Wegen der Vollständigkeit von Y strebt somit f(x j ) einem Grenzwert in Y zu, den 

wir mit ˜f(x) bezeichnen: ˜f(x) := lim f(xj ). 

Dieser Grenzwert hängt nicht von der gewählten Folge (x j ) j ab, so daß ˜f als Funktion 

auf X wohldefiniert ist: 

Ist nämlich (y j ) j eine weitere Folge in X 0 mit x = lim y j , und ist ε > 0, so wähle δ > 0 

gemäß (3.6). Ist k 0 ∈ N so gewählt, daß d(x j , y j ) ≤ d(x j , x)+d(y j , x) < δ/2+δ/2 = δ 

gilt für alle j ≥ k 0 , so folgt 

̺(f(x j ), f(y j )) < ε ∀j ≥ k 0 . 

Somit ist lim ̺(f(x j ), f(y j )) = 0, woraus limf(x j ) = lim f(y j ) folgt. 

Die Funktion ˜f besitzt alle gewünschten Eigenschaften: Ist x ∈ X 0 , so gilt für die 

konstante Folge (x j ) j mit x j := x in X 0 : x = lim x j , also ˜f(x) = lim f(x j ) = f(x), 

d.h. ˜f ist eine Fortsetzung von f. Ferner ist ˜f gleichmäßig stetig: 

Ist ε > 0, so wähle wieder δ > 0 wie in (3.6). Sind x, y ∈ X mit d(x, y) < δ/3, so 

seien (x j ) j und (y j ) j Folgen in X 0 mit x = lim x j und y = lim y j . Dann ist für jedes 

j offenbar 

also 

̺( ˜f(x), ˜f(y)) ≤ ̺( ˜f(x), f(x j )) + ̺(f(x j ), f(y j )) + ̺(f(y j ), ˜f(y)), 

̺( ˜f(x), ˜f(y)) ≤ lim 

j 

̺(f(x j ), f(y j )). 

Wähle k 0 ∈ N so, daß gilt: d(x, x j ) < δ/3 und d(y, y j ) < δ/3 für j ≥ k 0 . 

Für j ≥ k 0 ist dann 

also ̺(f(x j ), f(y j )) < ε. Somit folgt 

d(x j , y j ) ≤ d(x j , x) + d(x, y) + d(y, y j ) < δ, 

̺( ˜f(x), ˜f(y)) ≤ ε. 

Da für jede stetige Fortsetzung g von f auf X gelten muß: g(x) = lim f(x j ), falls 

(x j ) j eine Folge in X 0 ist mit x = lim x j , ist die Eindeutigkeit von ˜f klar. 

Q.E.D. 

Bemerkung. Ist x ∈ X 0 , so ist ˜f(x) = f(x). Ist x ∈ X \ X 0 , so ist x ein Häufungspunkt 

von X 0 , und der Beweis zeigt, daß ˜f(x) = lim 

y→x 

f(y). 

Beispiel. f(x) = sin 1 x 

fortsetzen. 

ist stetig auf ]0, ∞[, läßt sich jedoch nicht stetig auf [0, ∞[ 

65

3.5 Konvergenz von Funktionenfolgen 

Definition. Es seien (X, d), (Y, ̺) metrische Räume. Eine Funktionenfolge (f n ) n in 

Y X konvergiere punktweise (oder einfach) gegen f ∈ Y X , falls lim f n (x) = f(x) 

n→∞ 

ist für alle x ∈ X. Sie konvergiere gleichmäßig gegen f, wenn es zu jedem ε > 0 

ein N = N(ε) ∈ N gibt mit 

̺(f(x), f n (x)) < ε für alle n ≥ N und alle x ∈ X . 

Satz 3.26 Es sei (f n ) n eine Funktionenfolge in C(X, Y ), welche gleichmäßig gegen 

f : X → Y konvergiert. Dann ist auch f ∈ C(X, Y ). 

Beweis. (Analog wie im Falle X = Y = R). Sei dazu ε > 0. Wegen der gleichmäßigen 

Konvergenz existiert ein N ∈ N so, daß 

̺(f(x), f N (x)) < ε 3 

ist für alle x ∈ X . 

Sei a ∈ X. Da f N in a stetig ist, gibt es ein δ > 0 mit 

̺(f N (x), f N (a)) < ε 3 

für alle x ∈ X mit d(x, a) < δ . 

Dann gilt für alle x ∈ X mit d(x, a) < δ: 

̺(f(x), f(a)) ≤ 

̺(f(x), f N (x)) + ̺(f N (x), f N (a)) + ̺(f N (a), f(a)) 

< ε 3 + ε 3 + ε 3 = ε . Q.E.D. 

3.6 Die Vervollständigung eines metrischen 

Raumes* 

In Anwendungen trifft man des öfteren metrische Räume an, welche nicht vollständig 

sind. Ein solches Beispiel kennen wir bereits: Die Menge Q der rationalen Zahlen, 

versehen mit der Metrik d(x, y) = |x − y|, x, y ∈ Q, ist nicht vollständig. Der 

Wunsch, Q zu ” 

vervollständigen“, führt letzendlich dann zur Menge R der reellen 

Zahlen, mit R = Q. 

Ganz ähnlich läßt sich jeder beliebige metrische Raum vervollständigen. 

Definition. Es seien (X 1 , d 1 ) und (X 2 , d 2 ) zwei metrische Räume. Eine Abbildung 

ϕ : X 1 → X 2 heiße abstandstreu oder isometrisch oder auch Isometrie von X 1 

nach X 2 , wenn gilt: 

66

d 2 (ϕ(x), ϕ(y)) = d 1 (x, y) für alle x, y ∈ X 1 . 

Offenbar ist eine Isometrie stets injektiv. 

Definition. Es sei X = (X, d) ein metrischer Raum. Ein vollständiger metrischer 

Raum Y = (Y, ̺) heiße Vervollständigung von X, wenn es eine Isometrie ϕ : X → 

Y gibt mit ϕ(X) = Y , d.h. wenn ϕ(X) dicht in Y ist. 

Bemerkung 3.27 Ist (Y, ̺) eine solche Vervollständigung von (X, d), so bildet ϕ 

den metrischen Raum X bijektiv und isometrisch auf den Teilraum ˜X = ϕ(X) 

von Y ab. Wir können daher die Räume (X, d) und ( ˜X, ̺ ˜X) 

als metrische Räume 

identifizieren“, d.h. o.B.d.A. annehmen, daß X bereits ein Teilraum von Y ist. 

” 

Dann ist Y der Abschluß von X (in Y ), d.h. Y = X. 

Satz 3.28 Es seien Y 1 = (Y 1 , ̺1) und Y 2 = (Y 2 , ̺2) zwei Vervollständigungen des 

metrischen Raumes X = (X, d). Dann gibt es eine bijektive Isometrie von Y 1 auf Y 2 . 

Beweis. Seien ϕ j : X → Y j Isometrien mit ϕ j (X) = Y j , j = 1, 2. Setze Z j := 

ϕ j (X) ⊂ Y j , und betrachte die Abbildung 

ϕ := ϕ 2 ◦ ϕ −1 

1 : Z 1 → Z 2 ⊂ Y 2 . 

Als Komposition zweier Isometrien ist ϕ eine Isometrie, und folglich als solche 

gleichmäßig stetig. Es bezeichne ˜ϕ : Y 1 → Y 2 ihre stetige Fortsetzung nach Satz 

3.25. Dann ist auch ˜ϕ isometrisch. Dies folgt sofort aus der folgenden Tatsache: 

Ist (X, d) ein metrischer Raum, so ist die Metrik d : X ×X → R stetig als Funktion 

auf dem Produktraum X × X (Übung). 

Ganz analog besitzt die Isometrie 

ψ := ϕ 1 ◦ ϕ −1 

2 : Z 2 → Y 1 

eine Fortsetzung zu einer Isometrie ˜ψ : Y 2 → Y 1 . 

Dann ist jedoch ˜ψ ◦ ˜ϕ : Y 1 → Y 1 eine Isometrie mit 

˜ψ ◦ ˜ϕ| Z1 = ϕ 1 ◦ ϕ −1 

2 ◦ ϕ 2 ◦ ϕ −1 

1 = id | Z1 , 

und da ˜ψ ◦ ˜ϕ stetig ist und Z 1 dicht in Y 1 liegt, folgt: ˜ψ ◦ ˜ϕ = id . Analog folgt auch 

˜ϕ ◦ ˜ψ = id , d.h. ˜ϕ ist eine bijektive Isometrie von Y 1 auf Y 2 , mit Umkehrabbildung 

˜ψ. 

Q.E.D. 

Dieser Satz zeigt, daß es bis auf Isometrie nur höchstens eine Vervollständigung eines 

metrischen Raumes gibt. 

67

Theorem 3.29 Jeder metrische Raum besitzt eine Vervollständigung. 

Bemerkung. Ist (X, d) ein metrischer Raum, so bezeichnet man oft mit (X, d) ” 

die“ 

Vervollständigung von X, und nimmt o.B.d.A. gemäß Bemerkung 3.27 an, daß X 

der Abschluß von X ist. 

Beweis von Theorem 3.29. 

Es sei (X, d) ein metrischer Raum. Dann bezeichne Z die Menge aller Cauchy-Folgen 

in X. 

Sind nun ξ = (x n ) n∈N und η = (y n ) n∈N zwei Elemente von Z, so liest man aus der 

Ungleichung 

|d(x n , y n ) − d(x m , y m )| ≤ d(x n , x m ) + d(y m , y n ) 

leicht ab, daß die Folge (d(x n , y n )) n∈N eine Cauchy-Folge in R bildet. Wir setzen 

̺′(ξ, 

η) := lim 

n→∞ 

d(x n , y n ) . 

Man prüft nun leicht die folgenden Eigenschaften von ̺′ nach: 

(i) ̺′(ξ, η) ≥ 0 für alle ξ, η ∈ Z. 

(ii ′ ) ̺′(ξ, ξ) = 0 für alle ξ ∈ Z. 

(iii) ̺′(ξ, η) = ̺′(η, ξ) für alle ξ, η ∈ Z. 

(iv) ̺′(ξ, γ) ≤ ̺′(ξ, η) + ̺′(η, γ) für alle ξ, η, γ ∈ Z. 

Ferner ist ̺′(ξ, η) = ̺′((x n ) n , (y n ) n ) = 0 genau dann, wenn lim 

n→∞ 

d(x n , y n ) = 0 ist. ̺′ 

erfüllt also die Eigenschaften einer Metrik auf Z, bis auf die Eigenschaft (ii). 

Wir führen daher auf Z die folgende Relation ein: 

ξ ∼ η, falls ̺′(ξ, 

η) = 0 ist. 

Aus (i), (ii ′ ), (iii) und (iv) ersieht man leicht, daß hierdurch eine Äquivalenzrelation 

auf Z definiert wird, und wir setzen 

Y := Z/ ∼ . 

Sind x, y ∈ Y zwei Äquivalenzklassen, und sind ξ ∈ x, η ∈ y zwei Repräsentanten 

aus Z, so setzen wir 

̺(x, y) := ̺′(ξ, 

η) . 

Wiederum aus (i) – (iv) ersieht man, daß ̺ wohldefiniert ist. Sind nämlich beispielsweise 

ξ, ξ ′ ∈ x, η ∈ y, so ist 

̺′(ξ, 

η) ≤ ̺′(ξ, 

ξ ′ ) + ̺′(ξ ′ , η) = ̺′(ξ ′ , η) , 

68

und ebenso ist ̺′(ξ ′ , η) ≤ ̺′(ξ, η), so daß ̺′(ξ, η) = ̺′(ξ ′ , η) ist. 

Aus der Definition von ̺ ergibt sich sofort, daß ̺ ebenfalls die Eigenschaften (i), 

(ii ′ ), (iii) und (iv) erfüllt. Zusätzlich gilt jedoch noch 

(ii) ̺(x, y) = 0 genau dann, wenn x = y, d.h. ̺ ist eine Metrik auf Y . 

Ist nämlich ̺(x, y) = 0, und sind ξ ∈ x, η ∈ y, so ist ̺′(ξ, η) = 0, d.h. ξ ∼ η und 

somit x = [ξ] = [η] = y . 

Weiter wird durch 

ϕ : X → Y, x ↦→ [(x) n ], 

eine Isometrie von X in Y definiert, denn es ist für x, y ∈ X 

̺([(x) n ], [(y) n ]) = ̺′((x) 

n , (y) n ) = lim 

n→∞ 

d(x, y) = d(x, y) ; 

hier ist für x ∈ X mit (x) n die konstante Folge (x n ) n mit x n = x für alle n gemeint. 

Behauptung: ϕ(X) = Y . 

Ist nämlich x ∈ Y , so sei ξ = (x n ) n ∈ x . Dann ist 

̺(x, ϕ(x n )) = ̺′((x 

k ) k , (x n ) k ) = lim 

k→∞ 

d(x k , x n ) . 

Sei ε > 0. Da (x k ) k eine Cauchy-Folge ist, gibt es ein N ∈ N, so daß d(x k , x n ) < ε 

ist für alle k, n ≥ N. Insbesondere ist für n ≥ N 

̺(x, ϕ(x n )) = lim 

k→∞ 

d(x k , x n ) ≤ ε . 

Folglich ist lim n→∞̺(x, ϕ(x n )) = 0. Dies zeigt, daß jeder Punkt x von Y ein Berührungspunkt 

von ϕ(X) ist. 

Schließlich müssen wir noch die Vollständigkeit von Y nachweisen. Sei dazu (y n ) n 

eine Cauchy-Folge in Y . Da ϕ(X) dicht in Y ist, gibt es eine Folge (x n ) n in X mit 

ρ(y n , ϕ(x n )) < 1/(n + 1) . 

Hieraus folgt leicht, daß auch die Folge (ϕ(x n )) n eine Cauchy-Folge in Y ist. Da 

jedoch 

̺(ϕ(x n ), ϕ(x m )) = d(x n , x m ) 

ist, ist die Folge ξ = (x n ) n somit eine Cauchy-Folge in X. Es sei y := [ξ] ∈ Y . Dann 

ist nach dem Beweis der vorangegangenen Behauptung 

y = lim 

n→∞ 

ϕ(x n ) n in Y . 

Ferner ist offenbar lim n→∞ ρ(y n , ϕ(x n )) = 0, und somit auch 

Die Folge (y n ) n konvergiert also in Y . 

y = lim 

n→∞ 

y n in Y . 

Q.E.D. 

69

Kapitel 4 

Stetige lineare Abbildungen 

zwischen normierten 

Vektorräumen 

Satz 4.1 Seien (V, ‖ · ‖ V ) und (W, ‖ · ‖ W ) normierte Vektorräume über K, sowie 

v ∈ V . Für eine lineare Abbildung T : V → W sind die folgenden Bedingungen 

äquivalent: 

(a) T ist stetig in 0 ∈ V . 

(b) T ist stetig in v. 

(c) T ist global stetig. 

(d) T ist eine beschränkte lineare Abbildung, d.h. es gibt eine Konstante C ≥ 0 

mit 

‖T(x)‖ W ≤ C‖x‖ V für alle x ∈ V. 

Beweis. (a) ⇐⇒ (b): 

Da ‖T(x) − T(v)‖ W = ‖T(x − v)‖ W = ‖T(x − v) − T(0)‖ W ist für alle x, v ∈ V , 

folgt die Äquivalenz von (a) und (b) sofort aus dem ε − δ-Kriterium in Satz 3.20. 

Die Äquivalenz von (a),(b) mit (c) ist offensichtlich, da ja v ∈ V beliebig ist . 

(a) ⇒ (d): Ist T stetig in 0, so gibt es zu ε = 1 ein δ > 0 so, daß 

‖T(z)‖ W < 1 für alle z ∈ V mit ‖z‖ V < δ . 

Ist nun x ∈ V \ {0} beliebig, so setzen wir z := 

folglich 

δ 

2‖x‖ V 

x. Dann ist ‖z‖ V = δ < δ, 2 

‖T(x)‖ W = ‖T( 2‖x‖ V 

z)‖ W = 2‖x‖ V 

‖T(z)‖ W < 2 δ δ δ ‖x‖ V . 

Somit gilt die Abschätzung in (d) mit C := 2/δ. 

70

(d) ⇒ (c): Aus der Abschätzung in (d) folgt: 

‖T(x) − T(v)‖ W ≤ C‖x − v‖ V , ∀x, v ∈ V, 

woraus sogar Lipschitz- Stetigkeit von T folgt. 

Q.E.D. 

Bemerkung 4.2 Um die Schreibweise zu erleichtern, werden wir in Zukunft die 

Norm ‖ · ‖ V auf einem normierten Vektorraum in der Regel einfach mit ‖ · ‖ bezeichnen, 

auch wenn es sich mitunter um Normen auf verschiedenen normierten 

Vektorräumen handeln wird, die wir so mit demselben Symbol belegen werden. 

Beispiele 4.3 

(a) Sei V = C([a, b]), versehen mit der Supremumsnorm 

‖f‖ ∞ = sup{|f(x)| : x ∈ [a, b]} . 

Sei I : C([a, b]) → C die durch das Integral definierte lineare Abbildung 

I(f) := 

∫ b 

a 

f(x) dx, f ∈ C([a, b]) . 

Dann ist I stetig, denn es gilt die Abschätzung 

|I(f)| ≤ (b − a)‖f‖ ∞ . 

(b) Sei W der lineare Teilraum C 1 ([0, 1]) von C([0, 1]), versehen mit der Supremumsnorm, 

und sei 

D : C 1 ([0, 1]) → C([0, 1]) 

die durch die Differentiation D(f) := f ′ gegebene lineare Abbildung. D ist 

nicht stetig: 

Für die Funktionen f n ∈ C 1 ([0, 1]), f n (x) = x n , n ∈ N, gilt nämlich: ‖f n ‖ ∞ = 

1, ‖D(f n )‖ ∞ = n. Es gibt daher keine Konstante C ∈ R + 0 mit ‖D(f n )‖ ∞ ≤ 

C‖f n ‖ ∞ für alle n ∈ N. 

Definition. Es sei T : V → W eine stetige lineare Abbildung zwischen normierten 

Vektorräumen. Nach Satz 4.1 ist T beschränkt, so daß 

endlich ist. Es gilt dann offenbar 

‖T ‖ = ‖T ‖ op := sup{‖T(x)‖ : x ∈ V, ‖x‖ ≤ 1} 

(4.1) ‖T(x)‖ ≤ ‖T ‖ · ‖x‖ für alle x ∈ V , 

71

( 

da für x ≠ 0 die Abschätzung ‖T 

x 

‖x‖ 

) 

‖ ≤ ‖T ‖ zutrifft. 

Ferner ist ‖T ‖ offenbar die kleinste Konstante C, für welche die Abschätzung in Teil 

(d) von Satz 4.1 gilt. 

Z.B. ist ‖I‖ = 1, wobei I den identischen Operator x ↦→ x bezeichne. 

Wir bezeichnen eine stetige lineare Abbildung T : V → W auch als beschränkten 

linearen Operator, und schreiben anstelle von T(x) oftmals auch kurz Tx. 

L(V, W) bezeichne die Menge aller beschränkten linearen Operatoren T : V → W. 

Sind T, S ∈ L(V, W), λ ∈ K, x ∈ V , so gilt nach (4.1): 

‖(T + S)(x)‖ 

‖(λT)(x)‖ 

= ‖Tx + Sx‖ ≤ ‖Tx‖ + ‖Sx‖ 

≤ ‖T ‖ ‖x‖ + ‖S‖ ‖x‖ 

= (‖T ‖ + ‖S‖)‖x‖, 

= ‖λTx‖ = |λ| ‖Tx‖, 

woraus folgt: λT, T + S ∈ L(V, W), und 

‖λT ‖ 

= |λ| ‖T ‖, 

‖T + S‖ ≤ ‖T ‖ + ‖S‖. 

Ferner ist offenbar ‖T ‖ = 0 genau dann, wenn Tx = 0 ∀x ∈ V , d.h. wenn T = 0. 

Dies zeigt, daß L(V, W) einen K-Vektorraum bildet, und daß ‖ · ‖ = ‖ · ‖ op eine 

Norm auf L(V, W) ist, die sogenannte Operatornorm. Diese werden wir stets auf 

L(V, W) verwenden. 

Beispiel 4.4 V = R n , W = R m . 

Bezeichnen e 1 , . . .,e n und f 1 , . . .,f m die kanonischen Basen des R n bzw. R m , und 

∑ 

ist T ∈ L(R n , R m ), so gilt für x = n x k e k ∈ R n : 

k=1 

Tx = 

n∑ 

x k Te k , 

k=1 

wobei Te k sich eindeutig darstellen läßt als 

(4.2) Te k = 

m∑ 

a jk f j , a jk ∈ R. 

j=1 

Somit ist 

(4.3) Tx = 

m∑ 

j=1 

( n∑ 

k=1 

a jk x k 

) 

f j . 

72

Daher identifiziert man in der linearen Algebra bekanntlich T ∈ L(R n , R m ) mit der 

m × n-Matrix A := (a jk ) j=1,...,m, und die Anwendung von T auf x läßt sich durch 

k=1,...,n 

Matrixmultiplikation von A mit dem Spaltenvektor t x darstellen, d.h. 

⎛ ⎞ 

x 1 

(4.4) 

t (Tx) = A ·tx, t ⎜ ⎟ 

x = ⎝ . ⎠ . 

x n 

Konvention: Wann immer wir eine lineare Abbildung T : R n → R m durch eine 

Matrix bezüglich der kanonischen Basen dieser Räume beschreiben, werden wir daher 

die Vektoren als Spaltenvektoren betrachten, und T durch Linksmultiplikation 

mit einer m × n-Matrix A darstellen: 

⎛ ⎞ 

x 1 

⎜ ⎟ 

(4.5) T(x) = A · x, x = ⎝ . ⎠. 

x n 

⎛ ⎞ 

a 1k 

⎜ ⎟ 

Schreiben wir die Matrix A in der Form A = (A 1 , . . .,A n ), wobei A k := ⎝ . ⎠ den 

a mk 

k-ten Spaltenvektor der Matrix A bezeichne, so gilt also 

⎛ ⎞ 

n∑ 

x 1 

⎜ ⎟ 

(4.6) T(x) = A · x = x k A k , falls x = ⎝ . ⎠ . 

k=1 

x n 

Bemerkung. Ist V = W, und sind S, T ∈ L(V, V ), so ist auch S ◦ T ∈ L(V, V ), 

und man sieht leicht: 

(4.7) ‖S ◦ T ‖ ≤ ‖S‖ ‖T ‖ . 

L(V, V ) bildet bzgl. der Addition und Komposition beschränkter linearer Operatoren 

somit sogar eine normierte Algebra (d.h. eine Algebra (A, +, ·) über K, K = R 

oder K = C, versehen mit einer Norm ‖·‖, so daß (A, ‖·‖) ein normierter Vektorraum 

ist, und so daß für alle a, b ∈ A gilt: ‖a · b‖ ≤ ‖a‖ ‖b‖. Besitzt A ein Einselement I, 

so verlangt man zusätzlich ‖I‖ = 1). 

Ist W vollständig, so ist auch L(V, W) vollständig. Insbesondere ist L(V, V ) eine 

Banach-Algebra, d.h. eine vollständig normierte Algebra, falls V ein Banach- 

Raum ist. 

Satz 4.5 Ist V = K n , so ist jede lineare Abbildung T : K n → W stetig. 

73

Beweis. Es bezeichne e k = (0, . . .,0, 1, 0, . . ., 0) den k-ten Basisvektor der kanonischen 

Basis des K n . Setze w k := T(e k ) ∈ W, k = 1, . . .,n. Für x = (x 1 , . . .,x n ) = 

∑ n 

k=1 x ke k ∈ K n gilt dann (man vergleiche dies mit (4.6)): 

Tx = 

n∑ 

x k w k , 

k=1 

also 

‖Tx‖ 

≤ 

n∑ 

‖x k w k ‖ = 

n∑ 

‖w k ‖ |x k | ≤ 

‖w k ‖ 2 ) 1/2 

‖x‖ 2 . 

( n∑ 

k=1 

k=1 

k=1 

Es folgt 

‖Tx‖ ≤ C‖x‖ 2 , mit C := 

( n∑ 

k=1 

‖w k ‖ 2 ) 1/2 

. 

Somit ist T beschränkt und folglich stetig. 

Q.E.D. 

74

Kapitel 5 

Kompaktheit 

5.1 Kompakte metrische Räume 

Definition. Der metrische Raum (X, d) heiße Folgen-kompakt, wenn jede Folge 

(x n ) n in X (mindestens) eine konvergente Teilfolge besitzt. 

Eine Teilmenge Y ⊂ X heiße Folgen-kompakt, wenn Y als metrischer Teilraum 

von X Folgen-kompakt ist. 

Der Satz von Bolzano-Weierstraß aus der Analysis I läßt sich nun auch folgendermaßen 

formulieren: 

Jedes “kompakte“ Intervall [a, b] mit a, b ∈ R, a ≤ b, ist Folgen-kompakt. 

Satz 5.1 Sind (X 1 , d 1 ), (X 2 , d 2 ) zwei metrische Räume, und sind K 1 ⊂ X 1 und 

K 2 ⊂ X 2 Folgen-kompakte Teilmengen, so ist auch die Menge K 1 × K 2 Folgenkompakt 

in (X 1 × X 2 , d), wobei d die Metrik (3.3) auf X 1 × X 2 bezeichne. 

Beweis. Ist ((x n , y n )) n eine Folge in K 1 ×K 2 , so gibt es zunächst wegen der Folgen- 

Kompaktheit von K 1 eine aufsteigende Indexfolge (n j ) j so, daß die Teilfolge (x nj ) j 

von (x n ) n in K 1 konvergiert. Aus der Teilfolge (y nj ) j von (y n ) n in K 2 läßt sich dann 

wiederum eine in K 2 konvergente Teilfolge (y njk ) k auswählen. Setzen wir m k := n jk , 

so finden wir damit insgesamt eine aufsteigende Indexfolge (m k ) k derart, daß die 

Teilfolge (x mk ) k von (x n ) n in K 1 und die Teilfolge (y mk ) k von (y n ) n in K 2 konvergiert. 

Hieraus folgert man, daß die Teilfolge ((x mk , y mk )) k von ((x n , y n )) n in K 1 ×K 2 

konvergiert. 

Q.E.D. 

Beispiel. Durch wiederholte Anwendung dieser Beobachtung erkennt man, daß jeder 

abgeschlossene Quader [a 1 , b 1 ] × · · · × [a n , b n ] im R n Folgen- kompakt ist. 

Definitionen. Sei Y ⊂ X. Eine Familie (U ι ) ι∈I von Teilmengen von X heiße Überdeckung 

von Y , wenn gilt 

Y ⊂ ⋃ ι∈I 

U ι . 

75

Sie heiße offene Überdeckung von Y , wenn zusätzlich alle U ι offen sind. 

Gibt es zu jedem ε > 0 eine endliche Überdeckung von Y aus Kugeln B ε (a j ), j = 

1, . . .m, welche allesamt den Radius ε haben, d.h. 

U = 

m⋃ 

B ε (a j ), 

so heißt die Menge Y total beschränkt oder auch präkompakt. 

j=1 

Schließlich heiße der metrische Raum X separabel, wenn er eine abzählbare dichte 

Teilmenge enthält. 

Satz 5.2 Sei X = (X, d) ein Folgen-kompakter metrischer Raum. Dann gilt: 

(i) X ist vollständig. 

(ii) X ist beschränkt. 

(iii) X ist total beschränkt. 

(iv) X ist separabel. 

Beweis. 

(i) Sei (x n ) n eine Cauchy-Folge in X. Da X Folgen-kompakt ist, existiert eine 

konvergente Teilfolge (x nk ) k . Ist x = lim x nk , so konvergiert auch die gesamte 

k→∞ 

Folge (x n ) n gegen x, denn: 

Ist ε > 0, so existieren ein N ∈ N sowie k 0 ∈ N so, daß d(x n , x m ) < ε/2 für 

alle m, n ≥ N, und d(x, x nk ) < ε/2 für alle k ≥ k 0 . Wähle k ≥ k 0 so groß, daß 

n k ≥ N. Für n ≥ N folgt dann d(x, x n ) ≤ d(x, x nk )+d(x nk , x n ) < ε/2+ε/2 = 

ε. 

(ii) Wäre X unbeschränkt, so gäbe es zwei Folgen (x n ) n und (y n ) n in X mit 

d(x n , y n ) → ∞ . 

Andererseits gibt es wegen der Folgen-Kompaktheit von X eine aufsteigende 

Folge (n k ) k in N so, daß beide Teilfolgen (x nk ) k und (y nk ) k in X konvergieren. 

Dies steht im Widerspruch zu 

d(x nk , y nk ) → ∞ für k → ∞ . 

76

(iii) Sei ε > 0 gegeben. Wir wählen einen Punkt a 0 ∈ X. Ist B ε (a 0 ) c ≠ ∅, so 

wählen wir a 1 ∈ B ε (a 0 ) c . Ist weiter (B ε (a 0 ) ∪ B ε (a 1 )) c ≠ ∅, so wählen wir 

a 2 ∈ (B ε (a 0 ) ∪ B ε (a 1 )) c , und fahren entsprechend fort. Dieses Verfahren muß 

abbrechen, denn andernfalls erhielten wir damit eine Folge (a n ) n in X, bei der 

der Abstand je zweier Folgenglieder stets größer als ε > 0 wäre, und welche 

somit keine konvergente Teilfolge besäße. Es muß also ein k ∈ N geben mit 

X = B ε (a 0 ) ∪ · · · ∪ B ε (a k ) . 

(iv) Wir wählen zu jedem ε = 1 n , n ∈ N× , eine endliche Überdeckung 

(B 1/n (a nj )) j=1,...,kn von X gemäß (iii), und setzen A := {a nj , n ∈ N × , j = 

1, . . ., k n }. Dann ist A abzählbar, und es ist A = X. 

Ist nämlich x ∈ X, so gibt es zu jedem n ∈ N × ein j n mit x ∈ B 1/n (a njn ). 

Folglich ist x = lim a njn . 

n→∞ Q.E.D. 

Eine keineswegs naheliegende, äquivalente Charakterisierung der Folgen- 

Kompaktheit wird durch folgende Definition gegeben: 

Definition. Eine Teilmenge K von (X, d) heiße kompakt, wenn es zu jeder offenen 

Überdeckung (U ι ) ι∈I von K endlich viele Indizes ι 1 , . . .,ι k ∈ I gibt mit 

K ⊂ U ι1 ∪ · · · ∪ U ιk , 

d.h. wenn jede offene Überdeckung von K eine endliche Teilüberdeckung enthält. 

Theorem 5.3 Ein metrischer Raum (X, d) ist kompakt genau dann, wenn er 

Folgen-kompakt ist. 

Beweis. Wir beweisen beide zu zeigenden Implikationen durch Widerspruch. 

Sei zunächst X kompakt, und sei (x n ) n eine Folge in X. Angenommen, keine Teilfolge 

von (x n ) n konvergiert gegen einen Punkt von X. Dann besitzt jeder Punkt x ∈ X 

eine offene Umgebung U x , in der nur endlich viele Glieder der Folge liegen. Es gilt 

offenbar X = ⋃ U x . Da X kompakt ist, gibt es endlich viele Punkte x 1 , . . .,x m ∈ X 

mit X = m ⋃ 

k=1 

x∈X 

nicht möglich ist. 

U xk . Dann lägen aber in ganz X nur endlich viele Folgenglieder, was 

Wir nehmen nun umgekehrt an, daß X Folgen-kompakt ist. Sei (U ι ) ι∈I eine offene 

Überdeckung von X. Angenommen, diese besitzt keine endliche Teilüberdeckung. 

Nach Satz 5.2 können wir für jedes n ∈ N × endlich viele Kugeln mit Radius 1/n 

wählen, welche X überdecken. 

77

Unsere Voraussetzung impliziert dann, daß mindestens eine dieser Kugeln mit Radius 

1/n nicht durch endlich viele der Mengen U ι überdeckt wird, sagen wir die Kugel 

B n = B 1/n (z n ). 

Da X Folgen-kompakt ist, besitzt die Folge (z n ) n eine konvergente Teilfolge (z nj ) j , 

welche gegen ein z ∈ X konvergiert. Wähle den Index ι 0 ∈ I so, daß z ∈ U ι0 . Da U ι0 

offen ist, gibt es eine Kugel B = B ε (z), ε > 0, welche in U ι0 enthalten ist. Wähle N 

so groß, daß 2 N < ε. Dann existiert ein n = n j > N so, daß 

gilt. Für jedes x ∈ B n gilt dann: 

d(z n , z) < 1/N 

d(x, z) ≤ d(x, z n ) + d(z n , z) < 1 n + 1 N < 2 N < ε, 

d.h. es ist B n ⊂ B ⊂ U ι0 . Dies widerspricht der Wahl von B n (da danach B n sogar 

durch eine der Mengen U ι überdeckt wird). Dieser Widerspruch zeigt, daß X doch 

durch endlich viele der Mengen U ι überdeckt werden kann. 

Q.E.D. 

Satz 5.4 Sei (X, d) ein metrischer Raum, und sei A ⊂ X eine Teilmenge. 

(i) A ist kompakt in X genau dann, wenn A als metrischer Teilraum von (X, d) 

kompakt ist. 

(ii) Ist A kompakt, so ist A abgeschlossen in X. 

(iii) Ist (X, d) kompakt, so ist A kompakt genau dann, wenn A abgeschlossen ist in 

X. 

Beweis. 

(i) Dies folgt sofort aus der Definition der Kompaktheit und der Tatsache, daß 

V ⊂ A offen im metrischen Teilraum A ist genau dann, wenn es eine offene 

Teilmenge U von X gibt mit V = A ∩ U (vergl. Satz 3.11). 

(ii) Ist A kompakt, so ist A Folgen-kompakt. Ist somit (a n ) n eine Folge in A, welche 

gegen ein x ∈ X konvergiert, so besitzt diese eine in A konvergente Teilfolge. 

Folglich ist x ∈ A, und damit A abgeschlossen. 

(iii) Sei (X, d) kompakt, und sei A abgeschlossen in X. Ist dann (U ι ) ι∈I eine offene 

Überdeckung von A, so ist durch die Mengen U ι , ι ∈ I, und A c eine offene 

Überdeckung von X gegeben. Da X kompakt ist, gibt es folglich ι 1 , . . .,ι k ∈ I 

mit 

A c ∪ U ι1 ∪ · · · ∪ U ιk ⊃ A . 

78

Hieraus folgt U ι1 ∪ · · · ∪ U ιk ⊃ A. Somit ist A kompakt. 

Die Umkehrung ist nach (ii) klar. 

Q.E.D. 

Wir haben gesehen, daß jede kompakte Teilmenge von X abgeschlossen und beschränkt 

ist. Die Umkehrung hiervon gilt i.a. jedoch nicht. 

Beispiel 5.5 Wir betrachten N mit der diskreten Metrik 

{ 

0, falls x = y, 

d(x, y) = 

1, falls x ≠ y. 

Dann ist (N, d) abgeschlossen und beschränkt, die Folge (n) n∈N beispielsweise enthält 

jedoch keine konvergente Teilfolge (eine solche müßte ab einem gewissen Index konstant 

sein). 

Im R n gilt jedoch das 

Theorem 5.6 (Satz von Heine-Borel) Eine Teilmenge A ⊂ R n ist genau dann 

kompakt, wenn sie abgeschlossen und beschränkt ist. 

Beweis. Es bleibt nur noch eine Richtung zu zeigen. 

Sei also A abgeschlossen und beschränkt. Wir zeigen, daß A kompakt ist. Da A 

beschränkt ist, können wir ein R > 0 so wählen, daß für jedes a = (a 1 , . . ., a n ) ∈ A 

gilt: 

max 

j=1,...,n |a j| ≤ R , 

d.h. A liegt im Würfel W := [−R, R] n . Dieser ist aber nach dem Satz 5.1 folgenden 

Beispiel Folgen-kompakt, also kompakt. Somit ist A eine abgeschlossene Teilmenge 

einer kompakten Menge, folglich nach Satz 5.4 (iii) kompakt. 

Q.E.D. 

Wir können nun einige Sätze, welche wir für stetige Funktionen auf kompakten 

Intervallen bewiesen hatten, erheblich verallgemeinern. 

Theorem 5.7 Es seien X, Y metrische Räume und f ∈ C(X, Y ). Ist K ⊂ X 

kompakt, so ist auch f(K) ⊂ Y kompakt. 

Beweis. Sei (U ι ) ι∈I eine offene Überdeckung von f(K). Nach Satz 3.22 sind die 

Mengen V ι := f −1 (U ι ) offen in X, und es gilt: K ⊂ ⋃ V ι . Da K kompakt ist, gibt 

es endlich viele Indizes ι 1 , . . .,ι m mit K ⊂ m ⋃ 

k=1 

ι∈I 

V ιk . Hieraus folgt f(K) ⊂ ⋃ m 

k=1 U ι k 

. 

Q.E.D. 

79

Satz 5.8 Seien X ein kompakter metrischer Raum und f ∈ C(X, R). Dann ist 

die Funktion f beschränkt und nimmt ihr Maximum und Minimum an, d.h. es gibt 

Punkte p, q ∈ X mit 

f(p) = sup{f(x) : x ∈ X}, f(q) = inf{f(x) : x ∈ X} . 

Beweis. Nach Theorem 5.7 ist K := f(X) ⊂ R kompakt, also abgeschlossen und 

beschränkt. Sei α = sup(K). Dann ist α ∈ R, und es existiert eine Folge (a n ) n in K 

mit α = lim a n . Folglich ist α ∈ K. Dies beweist die Behauptung über das Maximum 

von f, und diejenige über das Minimum wird analog bewiesen. 

Q.E.D. 

Satz 5.9 Seien (X, d), (Y, ̺) metrische Räume. Ist X kompakt, so ist jede stetige 

Funktion f ∈ C(X, Y ) gleichmäßig stetig. 

Beweis. Sei ε > 0. Da f stetig ist, gibt es zu jedem z ∈ X ein δ(z) > 0 so, daß gilt: 

Da X kompakt ist, und da X = ⋃ 

̺(f(x), f(z)) < ε 2 für alle x ∈ B δ(z)(z) . 

z∈X 

X = 

B δ(z)/2 (z), gibt es Punkte z 1 , . . .,z k ∈ X mit 

k⋃ 

B δ(zj )/2(z j ) . 

j=1 

Sei δ := 1 2 min{δ(z 1), . . .,δ(z k )}. Seien nun x, y zwei beliebige Punkte in X mit 

d(x, y) < δ. Zu x gibt es ein j ∈ {1, . . ., k} mit x ∈ B δ(zj )/2(z j ). Mittels der Dreiecksungleichung 

folgt dann: y ∈ B δ(zj )(z j ). Somit erhalten wir 

̺(f(x), f(z j )) < ε 2 und ̺(f(y), f(z j)) < ε 2 , 

also 

̺(f(x), f(y)) < ε . 

Q.E.D. 

80

5.2 Äquivalenz der Normen auf dem R n 

Wir haben bereits in den Übungen gesehen, daß alle p-Normen auf dem R n äquivalent 

sind, und somit auch dieselbe Topologie und denselben Konvergenzbegriff 

induzieren. Allgemeiner gilt sogar 

Satz 5.10 Je zwei Normen auf dem R n sind äquivalent. 

Beweis. Sei ‖·‖ eine beliebige, feste Norm auf dem R n . Wir zeigen, daß ‖·‖ ∼ ‖·‖ ∞ 

ist, woraus die Behauptung folgt. 

Es bezeichne e 1 , . . ., e n die kanonische Basis des R n . Für x = (x 1 , . . .,x n ) = 

∑ n 

j=1 x je j ∈ R n folgt: 

(5.1) ‖x‖ ≤ 

n∑ 

‖x j e j ‖ = 

j=1 

n∑ 

|x j | ‖e j ‖ ≤ c 2 ‖x‖ ∞ , 

j=1 

∑ 

mit c 2 := n ‖e j ‖. 

j=1 

Aus (5.1) folgt insbesondere, daß die Abbildung ‖ · ‖ : (R n , ‖ · ‖ ∞ ) → R stetig ist, da 

| ‖x‖ − ‖y‖ | ≤ ‖x − y‖ ≤ c 2 ‖x − y‖ ∞ . 

Es bezeichne nun S := {x ∈ R n : ‖x‖ ∞ = 1} die ” 

Einheitssphäre“ bzgl. der Maximumsnorm 

(welche geometrisch eine Würfelfläche ist). S ist abgeschlossen und 

beschränkt, und somit kompakt. 

Nach Satz 5.8 nimmt die Abbildung ‖ · ‖ daher auf S ihr Minimum an, d.h. es gibt 

ein y 0 ∈ S mit 

‖y 0 ‖ ≤ ‖y‖ für alle y ∈ S . 

Es ist aber c 1 := ‖y 0 ‖ > 0, da andernfalls y 0 = 0 wäre und somit y ∉ S . Für 

beliebiges x ∈ R n , x ≠ 0, folgt: 

‖x‖ = 

( ) x ∣∣∣ ∣ ∣∣ ∣∣ ∣∣ ∣∣ x 

∣∣ ∣∣ ∣∣ 

∣∣ ‖x‖ ∞ = ‖x‖∞ 

‖x‖ ∞ 

‖x‖ ∞ 

≥ ‖x‖ ∞ c 1 . 

Zusammen mit (5.1) folgt daher (für beliebiges x ∈ R n ): 

c 1 ‖x‖ ∞ ≤ ‖x‖ ≤ c 2 ‖x‖ ∞ . 

Q.E.D. 

81

Kapitel 6 

Zusammenhang 

Definition. Ein metrischer Raum (X, d) heiße zusammenhängend, wenn es kein 

Paar nichtleerer offener Mengen A und B in X gibt mit X = A ∪B und A ∩B = ∅. 

Eine Teilmenge von X heiße zusammenhängend, wenn sie als metrischer Teilraum 

von X zusammenhängend ist. 

Satz 6.1 Sei M ⊂ X. Folgende Aussagen sind äquivalent: 

(i) M ist zusammenhängend. 

(ii) ∅ und M sind die einzigen Teilmengen von M, welche in der Relativtopologie 

von M sowohl offen als auch abgeschlossen sind. 

Beweis. Sei o.B.d.A. M = X. Ist X zusammenhängend, und ist ∅ ≠ A ⊂ X offen 

und abgeschlossen, so gilt dasselbe für B = A c . Ferner ist A ∪ B = X, A ∩ B = ∅. 

Somit muß B = ∅ sein, d.h. A = X. 

Gilt umgekehrt (ii), und sind A, B offen in X mit A ∪ B = X, A ∩ B = ∅, so ist 

wegen A = B c die Menge A sowohl offen als auch abgeschlossen. Ist A ≠ ∅, so muß 

nach (ii) folglich A = X sein, d.h. B = ∅. 

Q.E.D. 

Theorem 6.2 Sei M eine zusammenhängende Teilmenge des metrischen Raumes 

(X, d), und sei f eine stetige Abbildung von X in den metrischen Raum (Y, ̺). Dann 

ist das Bild f(M) zusammenhängend. 

Beweis. Indem wir Y durch f(M) ersetzen, dürfen wir o.B.d.A. annehmen, daß f 

surjektiv ist. 

Falls dann Y nicht zusammenhängend ist, so gibt es nichtleere offene Teilmengen 

A, B in Y mit Y = A ∪ B und A ∩ B = ∅. Dann ist 

X = f −1 (Y ) = f −1 (A) ∪ f −1 (B), 

f −1 (A) ∩ f −1 (B) = f −1 (A ∩ B) = f −1 (∅) = ∅, 

wobei die Mengen f −1 (A) und f −1 (B) nichtleer und, nach Satz 3.22, offen sind. 

Somit ist X nicht zusammenhängend. 

Q.E.D. 

82

Satz 6.3 Eine nichtleere Teilmenge M von R ist zusammenhängend dann und nur 

dann, wenn sie ein Intervall ist. 

Beweis. Per ” 

Kontraposition“: 

Wir nehmen zunächst an, daß M kein Intervall ist. Dann gibt es Punkte a < x < b 

mit a, b ∈ M und x ∉ M. Die Mengen A := M∩] − ∞, x[ und B := M∩]x, ∞[ sind 

dann offen in M, nichtleer, und es ist A ∪ B = M, A ∩ B = ∅. Somit ist M nicht 

zusammenhängend. 

Sei nun umgekehrt M ⊂ R nicht zusammenhängend. Dann gibt es nichtleere, in M 

offene Teilmengen A, B von M mit M = A ∪ B und A ∩ B = ∅. Wähle Punkte 

a ∈ A, b ∈ B. Es sei o.B.d.A. a < b. Wir zeigen, daß dann [a, b] ⊄ M, so daß M 

kein Intervall ist. Angenommen, es wäre [a, b] ⊂ M. Sei dann 

c := sup A ∩ [a, b]. 

Dann ist c ∈ [a, b] ⊂ M, und, da A abgeschlosssen in M ist, ist auch c ∈ A. Da b ∈ B 

ist, folgt: c ∈ A ∩ [a, b[. Aufgrund der Offenheit von A in M gibt es andererseits ein 

ε > 0 so, daß c + ε ∈ A ∩ [a, b[, was der Definition von c widerspricht. 

Q.E.D. 

Korollar 6.4 (Verallgemeinerter Zwischenwertsatz) Sei (X, d) ein zusammenhängender 

metrischer Raum, und sei f ∈ C(X, R). Sind dann a, b ∈ X, und 

ist f(a) ≤ f(b), so gibt es zu jedem y ∈ [f(a), f(b)] ein x ∈ X mit f(x) = y. 

Beweis. Da f(X) zusammenhängend in R ist, ist f(X) ein Intervall. Somit ist 

[f(a), f(b)] ⊂ f(X). 

Q.E.D. 

Definition. Sei A eine Teilmenge des metrischen Raumes (X, d). Zur Erinnerung; 

Ein Weg in A ist eine stetige Abbildung γ : [a, b] → A. γ verbinde die Punkte x 

und y aus A, falls γ(a) = x und γ(b) = y. 

Die Menge A heiße wegzusammenhängend, falls je zwei Punkte aus A durch einen 

Weg in A verbunden werden können. 

Satz 6.5 Jede wegzusammenhängende Teilmenge A von X ist zusammenhängend. 

Beweis. Sei o.B.d.A. A = X. Ist X nicht zusammenhängend, so gibt es nichtleere 

offene Teilmengen U 1 , U 2 von X mit U 1 ∪U 2 = X und U 1 ∩U 2 = ∅. Seien x 1 ∈ U 1 und 

x 2 ∈ U 2 . Wäre nun X wegzusammenhängend, so gäbe es einen Weg γ : [a, b] → X 

mit γ(a) = x 1 und γ(b) = x 2 . Setze V j = γ −1 (U j ) ⊂ [a, b], j = 1, 2. Dann ist 

a ∈ V 1 , b ∈ V 2 . Ferner ist V j offen in [a, b], und V 1 ∪ V 2 = [a, b], V 1 ∩ V 2 = ∅. Folglich 

wäre das Intervall [a, b] nicht zusammenhängend, im Widerspruch zu Satz 6.3. 

Q.E.D. 

Bemerkungen. a) In vielen Fällen ist der Wegzusammenhang einer Menge erheblich 

leichter nachzuweisen als ihr Zusammenhang. 

b) Die Umkehrung von Satz 6.5 gilt jedoch nicht: es gibt z.B. zusammenhängende 

Teilmengen in R 2 , welche nicht wegzusammenhängend sind. 

83

Kapitel 7 

Differentialrechnung in mehreren 

Veränderlichen 

7.1 Partielle Ableitungen 

Es sei (F, ‖ · ‖) ein normierter reeller Vektorraum. Für ξ ∈ F und t ∈ R, t ≠ 0, 

wollen wir anstelle von 1 t ξ auch ξ t schreiben. 

Definition. Es sei I ⊂ R offen. Eine Abbildung f : I → F heiße im Punkte t 0 ∈ I 

differenzierbar, wenn der Grenzwert 

f(t) − f(t 0 ) 

lim 

t→t 0 t − t 0 

= lim 

h→0 

f(t 0 + h) − f(t 0 ) 

h 

in F existiert, d.h. wenn es ein a ∈ F gibt mit 

∥ ∥∥∥ f(t) − f(t 0 ) 

lim 

− a 

t→t 0 t − t 0 

∥ = 0 . 

Wie im Falle einer reell- oder komplexwertigen Funktion (d.h. F = R oder F = C) 

sieht man leicht, daß der Grenzwert eindeutig ist. Wir bezeichnen ihn mit df (t dt 0) 

(gelegentlich auch mit f(t ˙ 0 )). Der Vektor df (t f(t)−f(t 

dt 0) = lim 0 ) 

t→t0 t−t 0 

∈ F heißt die 

(Newton-) Ableitung von f in t 0 . 

Geometrische Interpretation. Im “Regelfall“ wird das Bild der Abbildung f ∈ 

F I eine Kurve im Raum F beschreiben, und der Vektor a = df (t dt 0) liegt anschaulich 

tangential zur Spur f(I) der Kurve f im Punkte f(t 0 ). 

84

= f(t 0 + h) − f(t 0 ) 

h 

. 

Man sieht ebenfalls wieder leicht ein, daß f ∈ F I im Punkte t 0 differenzierbar ist 

und die Ableitung a = df 

dt (t 0) besitzt genau dann, wenn die affin lineare Abbildung 

g : t ↦→ f(t 0 ) + (t − t 0 )a 

von R in F tangential an f im Punkte t 0 ist, d.h. wenn 

ist (für t in einer Umgebung von t 0 ) mit 

d.h. 

f(t) = f(t 0 ) + (t − t 0 )a + ϕ(t − t 0 ) 

ϕ(t − t 0 ) 

lim 

t→t 0 |t − t 0 | 

= 0 , 

ϕ(t − t 0 ) = o(|t − t 0 |). 

Falls a ≠ 0 ist, so bezeichnet man das Bild g(R) von g als die Tangente an die 

parametrisierte Kurve f in t 0 . Offenbar ist g(R) diejenige Gerade im Vektorraum 

F, welche parallel zum eindimensionalen Unterraum R f(t ˙ 0 ) durch den Punkt f(t 0 ) 

verläuft. 

Im Falle F = R n schreiben wir f : I → R n als f = (f 1 , . . .,f n ). Dann ist nach 

Satz 3.14 f in t 0 ∈ I differenzierbar genau dann, wenn alle Komponentenfunktionen 

f 1 , . . .,f n in t 0 differenzierbar sind, und es gilt dann: 

(7.1) 

df 

dt (t 0) = ( df 1 

dt (t 0), . . ., df n 

dt (t 0)) . 

Beispiele: a) Sei f : R → R 3 gegeben durch f(t) := (t, sin t, te t ). Dann ist 

df 

dt (t) = (1, cost, (1 + t)et ). 

85

) Sei f(t) = (t, f 2 (t)). Dann ist df 

dt (t 0) = (1, f ′ 2 (t 0)): 

Es seien nun E und F zwei normierte reelle Vektorräume. 

Definition. Es sei f : U → F eine Abbildung der offenen Teilmenge U von E in 

F. Ferner sei e ∈ E ein Vektor. Nehmen wir an, daß e ≠ 0 ist, so definiert e eine 

” Richtung“ im Vektorraum E. f heiße dann im Punkte x 0 ∈ U in Richtung von e 

oder partiell nach e differenzierbar, wenn die Abbildung t ↦→ f(x 0 +te) in t = 0 

differenzierbar ist. Der Grenzwert 

a = lim 

t→0 

f(x 0 + te) − f(x 0 ) 

t 

ist die partielle Ableitung von f nach e im Punkte x 0 . Wir schreiben dafür 

a = ∂f 

∂e (x 0). 

Bemerkung. Da die Abbildung t ↦→ x 0 + te von R in E stetig ist, ist I := {t ∈ R : 

x 0 + te ∈ U} eine offene Umgebung von 0 in R, so daß die Definition Sinn macht. 

Beispiel: Sei f : R 2 → R gegeben durch f(x, y) := x 2 + e xy , und sei e := (2, 3). 

Dann ist z.B. f((1, 0)+ te) = f((1, 0) + (2t, 3t)) = f(1 + 2t, 3t) = (1 + 2t) 2 + e 3t+6t2 , 

also 

∂f 

∂e (1, 0) = (4(1 + 2t) + (3 + 12t)e3t+6t2 ) ∣ ∣ 

t=0 

= 7. 

Der Fall E = R n : 

Hier bezeichne e 1 , . . ., e n die kanonische Basis des R n , d.h. es sei e i der i-te Einheitsvektor 

} i-te{{ Stelle} 

e i = (0, . . ., 0, 1, 0, . . ., 0) . 

Dann schreibt man für ∂f 

∂e i 

auch ∂f 

∂x i 

oder D i f und bezeichnet ∂f 

∂x i 

(x) als die partielle 

Ableitung von f nach der i-ten Koordinate im Punkte x. Es ist also 

∂f 

∂x i 

(x 1 , . . ., x n ) 

∈ F 

= lim 

h→0 

f(x 1 , . . .,x i−1 , x i + h, x i+1 , . . .,x n ) − f(x 1 , . . .,x i , . . ., x n ) 

h 

86

d.h. wir können bei festgehaltenen Koordinaten x 1 , . . .,x i−1 , x i+1 , . . .,x n die partielle 

Ableitung ∂f 

∂x i 

(x) als ” 

gewöhnliche“ Ableitung der Abbildung 

im Punkte x i ∈ R auffassen. 

f (i) : t ↦→ f(x 1 , . . ., x i−1 , t, x i+1 , . . .,x n ) 

Definition. Sei U ⊂ R n offen. Eine Abbildung f : U → F heiße partiell differenzierbar, 

falls ∂f 

∂x i 

(x) für alle x ∈ U und i = 1, . . ., n existiert. f heiße stetig 

partiell differenzierbar, falls zusätzlich alle partiellen Ableitungen ∂f 

∂x i 

: U → F, 

i = 1, . . .,n, stetig sind. 

Beispiel 7.1 Sei r : R n → R gegeben durch 

√ 

r(x) := ‖x‖ 2 = x 2 1 + · · · + x 2 n . 

r ist in R n \ {0} partiell differenzierbar, und es gilt 

∂r 

∂x i 

(x) = x i 

‖x‖ 2 

, für x = (x 1 , . . .,x n ) ≠ 0 . 

Halten wir nämlich x 1 , . . ., x i−1 , x i+1 , . . .,x n fest, so ist die Abbildung 

t ↦→ √ x 2 1 + · · · + t2 + · · · + x 2 n für alle t differenzierbar, falls nicht alle x j mit j ≠ i 

null sind, und andernfalls für t ≠ 0, und die Ableitung nach t für t = x i ist 

∂r 

∂x i 

(x) = 1 2 (x2 1 + · · · + x 2 i + · · · + x 2 n) −1 2 · 2xi = x i 

‖x‖ 2 

. 

Partielle Ableitungen höherer Ordnung einer Abbildung f : U → F, U ⊂ R n offen, 

definiert man rekursiv: 

Definition. f : U → F heiße (k + 1)-mal partiell differenzierbar, wenn f 

k-mal partiell ( ( differenzierbar )) ) ist und alle partiellen Ableitungen k-ter Ordnung 

∂ ∂ ∂ 

∂x ik 

(· · · 

∂x i2 ∂x i1 

f · · · : U → F (mit i 1 , . . .,i k ∈ {1, . . .,n}), partiell differenzierbar 

sind. 

87

Die Funktion f : U → F heiße k-mal stetig partiell differenzierbar, wenn sie 

k-mal partiell differenzierbar ist und alle partiellen Ableitungen der Ordnung ≤ k 

stetig auf U sind. 

Sind i 1 , . . .,i k ∈ {1, . . .,n}, so schreibt man für 

∂ 

(· · ·( ∂ ( ∂ f)) · · ·) 

∂x ik ∂x i2 ∂x i1 

auch 

∂ k 

∂x ik . . .∂x i1 

f . 

C k (U, F) bezeichne den Vektorraum aller k-mal stetig partiell differenzierbaren 

Funktionen f : U → F. 

Beispiel. Für die Funktion r : R n → R aus Beispiel 7.1 ist für x ≠ 0 und i ≠ j 

( ) 

∂ 2 r ∂ 1 −1 

(x) = x i (x) = x i 

∂x j ∂x i ∂x j r r(x) 2 

∂r 

(x) = − x ix j 

, 

∂x j ‖x‖ 3 2 

und für i = j 

∂ 2 r 

∂x 2 i 

:= 

= 

∂ 2 r 

∂x i ∂x i 

= 1 

‖x‖ 2 

+ x i 

∂ 

1 

‖x‖ 2 

− 

x2 i 

‖x‖ 3 2 

∂x i 

( 1 

r 

= ‖x‖2 2 − x2 i 

‖x‖ 3 2 

. 

) 

(x) 

Offenbar ist hier 

∂ 2 r 

∂x j ∂x i 

= ∂2 r 

∂x i ∂x j 

. Gilt dies wohl allgemein? 

7.2 Totale Differenzierbarkeit 

Es seien nun E und F zwei normierte reelle Vektorräume, sowie U eine offene Teilmenge 

von E und x 0 ∈ U. 

Ist die Abbildung f : U → F in Richtung des Vektors e ∈ E \ {0} differenzierbar, 

so gilt: 

(7.2) 

f(x 0 + te) = f(x 0 ) + t ∂f 

∂e (x 0) + ϕ(t) 

für t nahe 0, mit ϕ(t) = o(|t|). Dies bedeutet, daß sich f entlang der affinen Geraden 

{x 0 +te : t ∈ R} durch x 0 in Richtung von e “immer besser“ durch die affin-lineare 

Abbildung x 0 + te ↦→ f(x 0 ) + t ∂f 

∂e (x 0) approximieren läßt, je kleiner |t| wird. 

Analog definieren wir: 

Definition. Die Abbildung f : U → F heiße im Punkte x 0 ∈ U (total) differenzierbar, 

falls es eine stetige lineare Abbildung A ∈ L(E, F) gibt so, daß für alle 

x ∈ U gilt: 

(7.3) f(x) = f(x 0 ) + A(x − x 0 ) + ϕ(x − x 0 ) 

88

wobei ϕ eine Funktion auf der Nullumgebung −x 0 + U ist mit 

(7.4) 

ϕ(x − x 0 ) = o(‖x − x 0 ‖), d.h. lim 

x→x0 

ϕ(x − x 0 ) 

‖x − x 0 ‖ = 0. 

Äquivalent dazu ist: 

(7.5) 

f(x 0 + ξ) = f(x 0 ) + Aξ + ϕ(ξ) 

für alle ξ in einer Umgebung der Null, wobei ϕ eine auf einer Umgebung der Null 

definierte Funktion ist mit 

(7.6) ϕ(ξ) = o(‖ξ‖), d.h. lim 

ξ→0 

ϕ(ξ) 

‖ξ‖ = 0 . 

f besitzt dann also nahe x 0 eine“gute“ Approximation durch die stetige, affin-lineare 

Abbildung g : E → F, 

g(x) := f(x 0 ) + A(x − x 0 ), x ∈ E, 

deren Graphen wir auch als den affinen Tangentialraum an den Graphen von f 

im Punkte (x 0 , f(x 0 )) bezeichnen. 

Die lineare Abbildung A ∈ L(E, F) heißt dann die Ableitung von f im Punkte 

x 0 und wird mit Df(x 0 ) bezeichnet. 

Die Ableitung im Punkte x 0 ist eindeutig: Sind nämlich A, B ∈ L(E, F) mit 

f(x 0 + ξ) = f(x 0 ) + Aξ + ϕ(ξ) 

= f(x 0 ) + Bξ + ˜ϕ(ξ) 

und 

ϕ(ξ) 

lim 

ξ→0 ‖ξ‖ = lim 

ξ→0 

˜ϕ(ξ) 

‖ξ‖ = 0, 

89

so ist (A − B)ξ = ψ(ξ) := ˜ϕ(ξ) − ϕ(ξ) für alle ξ in einer Nullumgebung, mit 

= 0. Für beliebiges η ∈ E \ {0} folgt dann aber wegen der Linearität von 

lim 

ξ→0 

ψ(ξ) 

‖ξ‖ 

A − B 

also 

Somit ist A − B = 0. 

(A − B)η = ψ(tη) 

t 

für genügend kleines t ∈ R , 

ψ(tη) ψ(tη) 

(A − B)η = lim = ‖η‖ lim 

t→0 t t→0 ‖tη‖ sign(t) = 0 . 

Bemerkung. Die Differenzierbarkeit in einem festen Punkt x 0 ist offenbar eine 

lokale Eigenschaft einer Funktion, d.h. stimmen die Funktionen f und g auf einer 

Umgebung von x 0 überein, so ist f in x 0 differenzierbar genau dann, wenn g in x 0 

differenzierbar ist, und es gilt dann: Df(x 0 ) = Dg(x 0 ). 

Satz 7.2 (Beziehung zwischen partieller und totaler Ableitung) Die Abbildung 

f : U → F sei im Punkte x 0 ∈ U ⊂ E total differenzierbar. Dann ist f in 

Richtung jedes Vektors e ≠ 0 aus E im Punkte x 0 partiell differenzierbar, und es 

gilt: 

∂f 

∂e (x 0) = Df(x 0 )e . 

Ferner ist f im Punkte x 0 stetig. 

Beweis. Sei A = Df(x 0 ) ∈ L(E, F). Nach (7.5) ist dann 

f(x 0 + te) = f(x 0 ) + A(te) + ϕ(te) = f(x 0 ) + t(Ae) + ψ(t) , 

ψ(t) 

mit ψ(t) := ϕ(te). Mit (7.6) folgert man aber wie zuvor, daß lim = 0. Somit ist 

t→0 t 

f partiell nach e im Punkte x 0 differenzierbar, und ∂f (x ∂e 0) = Ae = Df(x 0 )e. 

Die Stetigkeit von f in x 0 folgt ebenfalls sofort aus (7.5) und (7.6), denn da A 

stetig und linear ist, ist lim ξ→0 A(ξ) = A(0) = 0, und (7.6) impliziert offenbar 

lim ξ→0 ϕ(ξ) = 0, so daß 

lim 

ξ→0 f(x 0 + ξ) = f(x 0 ). 

Q.E.D. 

Die totale Differenzierbarkeit von f im Punkte x 0 ist eine erheblich stärkere Eigenschaft 

als ihre partielle Differenzierbarkeit in x 0 . Selbst die Existenz sämtlicher 

Richtungsableitungen von f in x 0 genügt im allgemeinen nicht für ihre totale Differenzierbarkeit 

in x 0 , wie folgendes Beispiel zeigt: 

90

Beispiel 7.3 Sei 

f : R 2 → R, f(x, y) = 

x3 

für (x, y) ≠ 0, f(0) = 0. 

x 2 + y2 Sei e θ = (cosθ, sin θ) mit θ ∈ [0, 2π[ ein Einheitsvektor im R 2 . Dann ist 

f(0 + te θ ) = t cos 3 θ, t ∈ R, 

d.h. f ist linear entlang jeder Geraden durch den Ursprung. Damit ist f partiell 

nach e differenzierbar in 0, mit 

Insbesondere ist 

∂f 

∂e θ 

(0) = cos 3 θ. 

∂f ∂f 

(0) = 1, 

∂x 

(0) = 0. 

∂y 

Wäre nun f in 0 total differenzierbar mit Ableitung A ∈ L(R 2 , R), so wäre für (x, y) 

nahe 0 

f(x, y) = a 1 x + a 2 y + o(‖(x, y)‖), 

falls A · (x, y) = a 1 x + a 2 y, mit a 1 , a 2 ∈ R. Insbesondere wäre nach Satz 7.2 

∂f 

∂e θ 

(0) = A · e θ = a 1 cosθ + a 2 sin θ. 

Für θ = 0 und θ = π 2 

erhielten wir 

also a 1 = 1, a 2 = 0, und somit 

∂f 

∂x (0) = a 1, 

∂f 

∂y (0) = a 2, 

∂f 

∂e θ 

(0) = cosθ. 

Für θ ≠ 0 steht dies im Widerspruch zu ∂f 

∂e θ 

(0) = cos 3 θ. 

Bemerkungen 7.4 a) Ist f : U → F im Punkte x 0 ∈ U stetig, und gibt es eine 

lineare Abbildung A : E → F (welche nicht als stetig vorausgesetzt werde), so daß 

(7.4), (7.5) gilt, so ist A automatisch stetig. 

Es ist nämlich 

Aξ = f(x 0 + ξ) − f(x 0 ) − ϕ(ξ) , 

und wegen der Stetigkeit von f in x 0 und (7.5) ist 

lim Aξ = 0 . 

ξ→0 

91

1 

0.5 

0 

-0.5 

-1 

1 

0.5 

0 

x 

-0.5 

-1 

1 

0.5 

0 

y 

-0.5 

-1 

Damit ist A stetig in 0, folglich global stetig. 

b) Sei T : E → F eine lineare Abbildung, und x 0 ∈ E. Nach Satz 7.2 und Bemerkung 

a) ist T genau dann differenzierbar in x 0 , wenn T stetig ist. In diesem Fall ist 

wegen 

T(x 0 + ξ) = Tx 0 + Tξ 

offenbar DT(x 0 ) = T für alle x 0 ∈ E. 

c) Ist I ⊂ R eine offene Teilmenge, und ist f : I → F eine Abbildung, so haben 

wir für f sowohl den Begriff der Newton“-Ableitung df (t ” dt 0) ∈ F im Punkte t 0 ∈ I 

definiert, wie auch den der totalen Ableitung Df(t 0 ) ∈ L(R, F). 

Beide Begriffe lassen sich in Einklang bringen, wenn wir den Raum L(R, F) wie 

folgt mit F identifizieren: 

Für η ∈ F definieren wir die lineare Abbildung T η ∈ L(R, F) mittels 

T η (t) := tη, t ∈ R. 

Da es zu jedem T ∈ L(R, F) genau ein η ∈ F mit T = T η , nämlich η = T(1) gibt, 

wird durch die Abbildung η ↦→ T η ein Isomorphismus von F auf L(R, F) definiert. 

Identifizieren wir F mit L(R, F) auf diese Weise, so ist offenbar d dt f(t 0) = Df(t 0 ). 

Genauer bedeutet dies: 

Df(t 0 ) = T d 

dt f(t 0) . 

d) In Analogie zum eindimensionalen Fall werden ab jetzt die totale Ableitung Df 

einer Funktion f : U → F, U ⊂ E, oft auch wieder mit f ′ bezeichnen. 

Definition. Ist U ⊂ E offen, und ist f : U → F in jedem Punkt von U differenzierbar, 

so heiße f (total) differenzierbar (in U). Ist zusätzlich die Ableitung 

f ′ : U → L(E, F), x ↦→ f ′ (x) = Df(x 0 ) 

92

eine stetige Funktion auf U, so heiße f stetig differenzierbar. Dabei sei der Raum 

L(E, F) stets mit der Operatornorm versehen (vgl. Kapitel 4). 

7.3 Der Fall E = R n , F = R m 

Die lineare Abbildung A ∈ L(R n , R m ) kann hier bzgl. der kanonischen Basen des R n 

bzw. R m durch eine m × n-Matrix (a ij ) i=1,...,m beschrieben werden. Fassen wir die 

j=1,...,n 

Elemente des R n bzw. R m unserer Konvention folgend als Spaltenvektoren auf, so 

wird die Abbildung einfach durch Matrizen-Multiplikation von links gegeben (vergl. 

(4.4)), 

⎛ 

⎞ ⎛ ⎞ 

a 11 a 12 . . . a 1n ξ 1 

⎜ 

⎟ ⎜ ⎟ 

A(ξ) = ⎝ . 

⎠ · ⎝ . ⎠ . 

a m1 a m2 . . . a mn ξ n 

Im folgenden identifizieren wir die lineare Abbildung A ∈ L(R n , R m ) mit der sie 

beschreibenden Matrix. 

⎛ ⎞ ⎛ ⎞ 

f 1 

ϕ 1 

⎜ ⎟ ⎜ ⎟ 

Sind f = ⎝ . ⎠ , bzw. ϕ = ⎝ . ⎠ die Komponentendarstellungen von f bzw. ϕ, 

f m ϕ m 

so schreibt sich die Gleichung (7.2) ausführlich als 

(7.7) 

n∑ 

f i (x 0 + ξ) = f i (x 0 ) + a ij ξ j + ϕ i (ξ), i = 1, . . .,m . 

j=1 

Hieran erkennt man auch, daß die Abbildung f genau dann im Punkte x 0 differenzierbar 

ist, wenn alle Komponentenfunktionen f i in x 0 differenzierbar sind. 

Satz 7.5 Seien U ⊂ R n offen und f : U → R m eine Abbildung, die im Punkte 

x 0 ∈ U differenzierbar ist. Identifizieren wir die Ableitung f ′ (x 0 ) ∈ L(R n , R m ) mit 

der m × n-Matrix A = (a ij ), so gilt: 

a ij = ∂f i 

∂x j 

(x 0 ) . 

Bezeichnung. Man bezeichnet die Matrix 

( ) ∂fi 

J f (x 0 ) := (x 0 ) 

∂x j 

i=1,...,m, 

j=1,...,n 

auch als die Jacobi-Matrix (oder auch Funktional-Matrix) von f im Punkte x 0 . 

93 

,

Es gilt also: 

(7.8) f ′ (x 0 ξ) = J f (x 0 ) · ξ, ξ ∈ R n . 

Beweis. Nach (7.7) gilt für k = 1, . . .,n: 

ϕ 

mit lim i (te k ) 

t→0 |t| 

f i (x 0 + te k ) = f i (x 0 ) + ta ik + ϕ i (te k ), i = 1, . . .,m , 

= 0. Hieraus folgt sofort 

∂f i 

∂x k 

(x 0 ) = ∂f i 

∂e k 

(x 0 ) = a ik . 

Q.E.D. 

Beispiel 7.6 Sei f : R 3 → R 2 gegeben durch 

( ) xy − z 

f(x, y, z) := . 

y cosx 

Dann ist 

J f (x, y, z) = 

( y x −1 

−y sin x cosx 0 

) 

. 

Wie läßt sich nun die Differenzierbarkeit einer Funktion f : U → R m nachweisen? 

Beispiel 7.3 lehrt, daß die Existenz aller partiellen Ableitungen von f im Punkte 

x 0 i.a. nicht ausreicht, um auf die Differenzierbarkeit von f in x 0 zu schließen. 

Verlangen wir jedoch zusätzlich, daß die partiellen Ableitungen in einer Umgebung 

von x 0 existieren und in x 0 stetig sind, so ist f in der Tat in x 0 differenzierbar. 

Theorem 7.7 (Hinreichende Bedingung für totale Differenzierbarkeit) 

Sei U ⊂ R n offen, und sei f : U → R m eine in U partiell differenzierbare Funktion. 

Sind alle partiellen Ableitungen ∂f i 

∂x j 

, i = 1, . . .,m, j = 1, . . ., n, stetig im Punkt x 0 , 

so ist f in x 0 total differenzierbar. 

Beweis. Da f = t (f 1 . . .f m ) in x 0 differenzierbar ist genau dann, wenn dies für alle 

Komponentenfunktionen f i zutrifft, genügt es, den Fall m = 1 zu betrachten. 

Wir wählen ε > 0 so, daß B ε (x 0 ) ⊂ U ist. Für ξ = t (ξ 1 . . .,ξ n ) ∈ R n mit ‖ξ‖ < ε 

definieren wir Punkte 

z (i) := x 0 + 

i∑ 

ξ k e k , i = 0, . . .,n . 

k=1 

94

Dann ist z (0) = x 0 , z (n) = x 0 + ξ. Da sich z (i−1) und z (i) nur in der i-ten Koordinate 

unterscheiden, gibt es nach dem Mittelwertsatz für differenzierbare Funktionen einer 

Veränderlichen ein θ i ∈ [0, 1] mit 

f(z (i) ) − f(z (i−1) ) = f(z (i−1) + ξ i e i ) − f(z (i−1) ) = ∂f 

∂x i 

(y (i) )ξ i , 

mit y (i) := z (i−1) + θ i ξ i e i . Es folgt 

also 

mit 

f(x 0 + ξ) − f(x 0 ) = 

ϕ(ξ) := 

n∑ 

(f(z (i) ) − f(z (i−1) )) = 

i=1 

f(x 0 + ξ) = f(x 0 ) + 

n∑ 

i=1 

n∑ 

i=1 

n∑ 

i=1 

∂f 

∂x i 

(x 0 )ξ i + ϕ(ξ) 

( ∂f 

(z (i−1) + θ i ξ i e i ) − ∂f ) 

(x 0 ) ξ i . 

∂x i ∂x i 

∂f 

∂x i 

(y (i) )ξ i , 

Da mit ξ → 0 die Punkte z (i−1) +θ i ξ i e i gegen x 0 streben, folgt aufgrund der Stetigkeit 

von ∂f 

∂x i 

in x 0 : 

( ∂f 

lim (z (i−1) + θ i ξ i e i ) − ∂f ) 

(x 0 ) = 0. 

ξ→0 ∂x i ∂x i 

Folglich ist lim 

ξ→0 

ϕ(ξ) 

‖ξ‖ = 0 . Q.E.D. 

Bemerkung 7.8 Ist E = R n , F = R m , so gelten nach den Sätzen 7.2 und 7.7 

folgende Implikationen (vgl. auch die entsprechende Übung): 

f ist stetig partiell differenzierbar ⇐⇒ f ist stetig differenzierbar 

⇒ f ist differenzierbar 

⇒ f ist stetig. 

Die Umkehrungen der einseitigen Implikationen gelten i.a. nicht. 

Definition. Sei U ⊂ R n offen. Ist f : U → R partiell differenzierbar, so heißt der 

Zeilenvektor 

( ∂f 

gradf(x) := (x), . . ., ∂f ) 

(x) 

∂x 1 ∂x n 

der Gradient von f im Punkte x ∈ U. Man schreibt dafür auch 

∇f(x) 

(sprich: “Nabla f“). 

95

Ist f in x (total) differenzierbar, so ist ∇f(x) offenbar gerade die Jacobi-Matrix 

J f (x) von f in x. Wir schreiben daher dafür gelegentlich auch f ′ (x). 

Ist f in U differenzierbar, so ist die Abbildung 

v := ∇f : U → R n , x ↦→ v(x) := ∇f(x), 

ein Vektorfeld auf U, d.h. eine Abbildung, welche jedem Punkt x ∈ U einen Vektor 

v(x) ∈ R n zuordnet. 

∑ 

Es bezeichne 〈x, y〉 = n x j y j = x · ty das Euklidische Skalarprodukt auf dem R n , 

sowie 

j=1 

S n−1 := {e ∈ R n : ‖e‖ 2 = 1} 

die Einheitssphäre im R n . Ist f differenzierbar, und ist e ∈ R n ein Einheitsvektor, 

d.h. ist e ∈ S n−1 , so gilt offenbar 

(7.9) 

∂f 

(x) = 〈∇f(x), e〉 . 

∂e 

Satz 7.9 (Geometrische Kennzeichnung des Gradienten) Sei U ⊂ R n eine 

nichtleere, offene Teilmenge des R n , sei f : U → R differenzierbar und sei x ∈ U so, 

daß ∇f(x) ≠ 0. Bezeichnen wir mit γ := 

∇f(x) 

‖∇f(x)‖ 2 

den Einheitsvektor in Richtung 

des Gradienten von f in x, so gilt 

(7.10) 

∂f 

{ ∂f 

} 

∂γ (x) = max ∂e (x) : e ∈ Sn−1 . 

Der Gradient ∇f(x 0 ) zeigt somit in Richtung des stärksten Anstiegs der Funktion 

f, wenn man sich von x 0 fortbewegt! 

Beweis. Aufgrund der Cauchy-Schwarzschen Ungleichung aus der Linearen Algebra 

(bzw. der Hölderschen Ungleichung) gilt für e ∈ S n−1 mit (7.9) 

Ferner ist 

∂f 

∂e (x) ≤ ‖∇f(x)‖ 2‖e‖ 2 = ‖∇f(x)‖ 2 . 

∂f 

(x) = 〈∇f(x), γ〉 = ‖∇f(x)‖−1 2 

∂γ 〈∇f(x), ∇f(x)〉 = ‖∇f(x)‖ 2. 


Q.E.D. 

96

7.4 Rechenregeln für die Ableitung 

Satz 7.10 (Kettenregel) Es seien E, F und G drei normierte reelle Vektorräume, 

U eine offene Umgebung von x 0 ∈ E und f : U → F eine Abbildung, V eine offene 

Umgebung von y 0 = f(x 0 ) in F sowie g : V → G. 

Ist f differenzierbar in x 0 , und ist g differenzierbar in y 0 , so ist die Abbildung h = 

g ◦f : U → G (welche in einer Umgebung von x 0 definiert ist) differenzierbar in x 0 , 

und es gilt: 

h ′ (x 0 ) = g ′ (f(x 0 )) ◦ f ′ (x 0 ) . 

Man beachte, daß g ′ (f(x 0 )) ∈ L(F, G) und f ′ (x 0 ) ∈ L(E, F), so daß g ′ (f(x 0 )) ◦ 

f ′ (x 0 ) ∈ L(E, G). 

Beweis. Nach Voraussetzung ist 

f(x 0 + ξ) = f(x 0 ) + Aξ + ϕ(ξ), 

g(y 0 + η) = g(y 0 ) + Bη + ψ(η), 

mit A := f ′ (x 0 ) ∈ L(E, F), B := g ′ (y 0 ) ∈ L(F, G), wobei 

ϕ(ξ) ψ(η) 

lim = 0, lim 

ξ→0 ‖ξ‖ η→0 ‖η‖ = 0 . 

Setzt man speziell η := f(x 0 + ξ) − f(x 0 ) = Aξ + ϕ(ξ), so ergibt sich 

(g ◦ f)(x 0 + ξ) = g(f(x 0 ) + η) = g(y 0 + η) 

= g(f(x 0 )) + B(Aξ + ϕ(ξ)) + ψ(Aξ + ϕ(ξ)) 

= (g ◦ f)(x 0 ) + (B ◦ A)ξ + χ(ξ), 

mit 

Da B stetig ist, ist 

χ(ξ) := Bϕ(ξ) + ψ(Aξ + ϕ(ξ)) . 

( ) 

Bϕ(ξ) ϕ(ξ) 

lim 

ξ→0 ‖ξ‖ 

= lim B = B(0) = 0 . 

ξ→0 ‖ξ‖ 

ϕ(ξ) 

Ferner können wir wegen lim 

ξ→0 

‖ξ‖ 

weiter ψ(η) = ‖η‖ψ 1 (η) mit lim 

η→0 

ψ 1 (η) = 0 ist, folgt: 

= 0 o.B.d.A. annehmen, daß ‖ϕ(ξ)‖ ≤ ‖ξ‖ ist. Da 

‖ψ(Aξ + ϕ(ξ))‖ ≤ (‖A‖ + 1)‖ξ‖ ‖ψ 1 (Aξ + ϕ(ξ))‖, 

also 

ψ(Aξ + ϕ(ξ)) 

lim = 0 . 

ξ→0 ‖ξ‖ 

97

χ(ξ) 

Somit ist lim = 0, d.h. g ◦ f ist differenzierbar in x 

ξ→0 

‖ξ‖ 0, und (g ◦ f) ′ (x 0 ) = B ◦ A = 

g ′ (y 0 ) ◦ f ′ (x 0 ). 

Q.E.D. 

Der Fall E = R m , F = R n , G = R p . In diesem Fall läßt sich die Kettenregel wie 

folgt schreiben: 

(7.11) J g◦f (x) = J g (f(x)) · J j (x), 

d.h. mit y := f(x) gilt 

(7.12) 

∂h l 

∂x j 

(x) = 

n∑ 

k=1 

∂g l 

∂y k 

(y) ∂f k 

∂x j 

(x), l = 1, . . ., p, j = 1, . . .,m , 

Beispiel. Polarkoordinaten im R 2 . 

Sei Φ :]0, ∞[×R → R 2 gegeben durch 

Φ(r, θ) := 

( ) 

r cosθ 

, 

r sin θ 

d.h. (x, y) = (r cosθ, r sin θ). Φ ist differenzierbar, mit Jacobi-Matrix 

( ∂x 

) ( ) 

∂x 

J Φ (r, θ) = 

∂r ∂θ cosθ −r sin θ 

= 

. 

sin θ r cosθ 

∂y 

∂r 

∂y 

∂θ 

Ist f : R 2 → R differenzierbar, und stellt g := f ◦ Φ die Funktion f in Polarkoordinaten 

dar (wobei man dann meist nur θ ∈]0, 2π[ wählt, um Injektivität von Φ zu 

gewährleisten), so gilt nach der Kettenregel 

( 

mit J f (x, y) = 

∂f 

∂x 

J g (r, θ) = J f (Φ(r, θ)) · J Φ (r, θ), 

(x, y), 

∂f 

∂y (x, y) ). Es folgt 

∂g ∂f 

(r, θ) = 

∂r ∂x 

∂g ∂f 

(r, θ) = 

∂θ ∂x 

falls (x, y) := (r cosθ, r sin θ). 

∂f 

(x, y)∂x(r, θ) + 

∂r ∂y 

(x, y)∂y(r, θ) 

∂r 

= cosθ ∂f ∂f 

(x, y) + sin θ (x, y), 

∂x ∂y 

∂f 

(x, y)∂x(r, θ) + 

∂θ ∂y 

(x, y)∂y(r, θ) 

∂θ 

= −r sin θ ∂f (x, y) + r cos θ∂f (x, y), 

∂x ∂y 

98

Satz 7.11 Es seien E, F und G normierte reelle Vektorräume und U ⊂ E offen. 

Ferner seien f, g : U → F Abbildungen, welche im Punkte x 0 ∈ U differenzierbar 

sind. 

(i) Dann sind auch die Abbildungen f +g und αf (α ∈ R) in x 0 differenzierbar, und 

es gilt: 

(7.13) 

(f + g) ′ (x 0 ) = f ′ (x 0 ) + g ′ (x 0 ) , 

(αf) ′ (x 0 ) = αf ′ (x 0 ) . 

(ii) Ist auf F zusätzlich ein Produkt ” · “ mit Werten in G definiert, d.h. eine 

Abbildung (a, b) ↦→ a·b von F ×F in G, welche linear in a und in b ist, d.h. bilinear, 

und gibt es eine Konstante C ≥ 0, so daß für alle a, b ∈ F gilt: 

so gilt die Produktregel: 

‖a · b‖ ≤ C‖a‖ ‖b‖ , 

Die Abbildung f · g : U → G, x ↦→ f(x) · g(x), ist in x 0 differenzierbar, und es gilt 

für alle ξ ∈ E: 

(7.14) (f · g) ′ (x 0 )ξ = f(x 0 ) · (g ′ (x 0 )ξ) + (f ′ (x 0 )ξ) · g(x 0 ) . 

Beweis. (i) läßt sich leicht direkt mittels der Definition der Ableitung zeigen. Wir 

wollen hier jedoch einmal (i) (für die Summe von f und g) und (ii) mit Hilfe der 

Kettenregel beweisen: 

Dazu betrachten wir F ×F als normierten Raum, versehen mit der Norm ‖(a, b)‖ ∞ = 

max(‖a‖, ‖b‖), (a, b) ∈ F × F. Die Abbildung (f, g) : U → F × F, x ↦→ (f(x), g(x)), 

ist dann differenzierbar in x 0 . Nach Voraussetzung ist nämlich 

ϕ(ξ) 

mit lim 

ξ→0 

‖ξ‖ 

= lim ψ(ξ) 

ξ→0 

‖ξ‖ 

f(x 0 + ξ) = f(x 0 ) + f ′ (x 0 )ξ + ϕ(ξ), 

g(x 0 + ξ) = g(x 0 ) + g ′ (x 0 )ξ + ψ(ξ) , 

= 0. Somit ist 

(f, g)(x 0 + ξ) = (f, g)(x 0 ) + (f ′ (x 0 ), g ′ (x 0 ))ξ + (ϕ(ξ), ψ(ξ)) , 

falls wir die stetige lineare Abbildung (f ′ (x 0 ), g ′ (x 0 )) ∈ L(E, F ×F) definieren durch 

(f ′ (x 0 ), g ′ (x 0 ))ξ := (f ′ (x 0 )ξ, g ′ (x 0 )ξ), ξ ∈ E. 

Offenbar ist lim 

ξ→0 

‖(ϕ(ξ), ψ(ξ))‖ ∞ /‖ξ‖ = 0. Wir sehen damit insbesondere, daß 

(7.15) 

(f, g) ′ (x 0 ) = (f ′ (x 0 ), g ′ (x 0 )) . 

99

Wir bezeichnen nun mit add : F ×F → F und mult : F ×F → G die Abbildungen 

(a, b) ↦→ a + b und (a, b) ↦→ a · b. Es ist für (a 0 , b 0 ), (ξ, η) ∈ F × F 

add ((a 0 , b 0 ) + (ξ, η)) = add (a 0 , b 0 ) + ξ + η 

mult ((a 0 , b 0 ) + (ξ, η)) = (a 0 + ξ) · (b 0 + η) 

= mult (a 0 , b 0 ) + a 0 · η + ξ · b 0 + ξ · η , 

wobei ‖ξ · η‖ ≤ C‖ξ‖ ‖η‖ ≤ C‖(ξ, η)‖ 2 ∞ . Insbesondere ist lim 

(ξ,η)→0 

ξ·η 

‖(ξ,η)‖ ∞ 

= 0. 

Wir sehen also, daß die Abbildungen add und mult auf F × F differenzierbar sind, 

und daß 

(7.16) 

(7.17) 

add ′ (a 0 , b 0 )(ξ, η) = add (ξ, η) = ξ + η , 

mult ′ (a 0 , b 0 )(ξ, η) = a 0 · η + ξ · b 0 

ist für alle (a 0 , b 0 ), (ξ, η) ∈ F × F. 

Da f + g = add ◦(f, g), f ·g = mult ◦ (f, g) ist, folgt aus (7.15) - (7.17) mittels der 

Kettenregel: 

(f + g) ′ (x 0 )ξ = (add ) ′ (f(x 0 ), g(x 0 ))(f ′ (x 0 )ξ, g ′ (x 0 )ξ) 

= f ′ (x 0 )ξ + g ′ (x 0 )ξ = (f ′ (x 0 ) + g ′ (x 0 ))ξ, 

(f · g) ′ (x 0 )ξ = (mult ) ′ (f(x 0 ), g(x 0 ))(f ′ (x 0 )ξ, g ′ (x 0 )ξ) 

= f(x 0 ) · (g ′ (x 0 )ξ) + (f ′ (x 0 )ξ) · g(x 0 ) . 

Bemerkung. Setzen wir für beliebiges ξ ∈ E 

∂f 

∂ξ (x) := d ∣ f(x + tξ), 

dt t=0 

Q.E.D. 

so ist nach der Kettenregel 

∂f 

∂ξ (x) = f ′ (x)ξ 

(dies liefert übrigens einen alternativen Beweis zu Satz 7.2). Damit läßt sich die 

Produktregel (7.14) besonders schön durch folgende Regel für Richtungsableitungen 

darstellen: Für alle ξ ∈ E gilt 

(7.18) 

∂(f · g) 

∂ξ 

(x) = f(x) · ∂g ∂f 

(x) + (x) · g(x). 

∂ξ ∂ξ 

100

7.5 Der verallgemeinerte Mittelwertsatz 

Wir werden später folgende höherdimensionale Variante des Mittelwertsatzes benötigen. 

Satz 7.12 (Schrankensatz) Es seien I ⊂ R offen und f : I → F eine stetig 

differenzierbare Funktion mit Werten im Banachraum F. Liegt das Intervall [a, b] 

in I, und ist 

‖f ′ (t)‖ ≤ m 

für alle t ∈ [a, b], so ist 

‖f(b) − f(a)‖ ≤ m(b − a) . 

Beweis. Ist F = R (oder F = C), so können wir wie folgt argumentieren: 

Da f ′ stetig ist, ist f ′ über dem Intervall [a, b] integrierbar, und nach dem Hauptsatz 

der Differential- und Integralrechnung ist 

(7.19) 

f(b) − f(a) = 

∫ b 

a 

f ′ (t)dt . 

Hieraus folgt aufgrund der Dreiecksungleichung für Integrale: 

(7.20) 

|f(b) − f(a)| ≤ 

∫ b 

|f ′ (t)|dt ≤ 

∫ b 

a 

a 

m dt = m(b − a) . 

Dieses Argument läßt sich auf den Fall eines beliebigen Banachraumes F übertragen. 

Dazu sei angemerkt, daß sich die in Kapitel 1 beschriebene Integrationstheorie 

beinahe wortwörtlich auf den Fall von Funktionen mit Werten in F anwenden läßt: 

Wir benötigen dazu allerdings nur die folgenden Eigenschaften: 

Eine Funktion f : [a, b] → F heiße dazu Treppenfunktion, wenn es eine Zerlegung 

a = x 0 < x 1 < . . .x m = b des Intervalls [a, b] gibt sowie Vektoren ξ 1 , . . .,ξ m ∈ F so, 

daß f(x) = ξ i für alle x ∈]x i−1 , x i [. 

Das Integral einer solchen Treppenfunktion ist der Vektor ∫ ∑ 

f(x) dx := m (x i − 

x i−1 )ξ i ∈ F. Ist f : [a, b] → F der gleichmäßige Limes einer Folge von Treppenfunktionen 

f n : [a, b] → F, so weist man analog wie für R-wertige Regelfunktionen nach, 

daß die Folge der Integrale 

∫ b 

a 

f n dx eine Cauchy-Folge in F bildet. Diese konvergiert 

aufgrund der Vollständigkeit von F gegen einen Vektor ξ = lim 

man schreibt ξ =: 

∫ b 

a 

n→∞ 

b 

i=1 

∫ 

f n dx ∈ F, und 

f(x) dx. Die Klasse der F-wertigen Regelfunktionen wird nun 

101 

a

analog wie im Falle F = R definiert, und man weist die gleichen Regeln für den Umgang 

mit solchen F-wertigen integrierbaren Funktionen nach wie für den Fall F = R 

– man muß dazu in den entsprechenden Beweisen lediglich den Absolutbetrag | · | 

durch die Norm ‖ · ‖ auf F ersetzen. Insbesondere sieht man mittels Satz 5.9, daß 

wieder jede stetige Funktion f : [a, b] → F auf [a, b] integrierbar ist, und daß auch in 

dieser Situation der Hauptsatz der Differential- und Integralrechnung gültig bleibt. 

Damit bleibt auch für einen allgemeinen Banachraum (7.19) gültig, und mittels der 

Dreiecksungleichung für F-wertige Integrale folgt in Analogie zu (7.20) 

‖f(b) − f(a)‖ ≤ 

∫ b 

‖f ′ (t)‖dt ≤ 

∫ b 

a 

a 

mdt = m(b − a) . 

Q.E.D. 

Bemerkungen 7.13 (i) Die Vollständigkeit des normierten Raumes F in Satz 7.12 

ist für die Gültigkeit des Satzes nicht wirklich erforderlich. Bezeichnet nämlich F 

die Vervollständigung von F aus Kapitel 3.6, so zeigt man leicht, daß F die Struktur 

eines Banachraumes besitzt, welcher F als dichten linearen Teilraum enthält. Satz 

7.12 läßt sich damit auf Funktionen f : I → F anwenden, also insbesondere auch 

auf Funktionen f : I → F ⊂ F. 

(ii) Man kann ferner zeigen, daß in Satz 7.12 die Differenzierbarkeit von f genügt 

(siehe z.B. [AE]). 

Wir betrachten nun wieder normierte Vektorräume E und F. 

Satz 7.14 Es sei U ⊂ E eine offene, zusammenhängende und nichtleere Teilmenge 

von E. Ist f : U → F differenzierbar, so ist f ′ = 0 genau dann, wenn f konstant 

ist. 

Beweis. Ist f konstant, so ist wegen f(x 0 + ξ) = f(x 0 ) + 0 · ξ trivialerweise f ′ = 0. 

Sei nun umgekehrt f ′ = 0. Dann ist f offenbar sogar stetig differenzierbar. Wir 

wählen p ∈ U fest und setzen η := f(p) und 

A := {x ∈ U : f(x) = η} = f −1 ({η}). 

Da {η} abgeschlossen in F und f stetig ist, ist A abgeschlossen in U. Ferner ist 

wegen p ∈ A die Menge A nichtleer. 

Um zu zeigen, daß A = U ist, d.h. f(x) = η für alle x ∈ U, genügt es nach Satz 

6.1(ii) zu zeigen, daß A auch offen in U ist. 

Sei dazu x 0 ∈ A. Dann gibt es ein ε > 0 mit B 2ε (x 0 ) ⊂ U. Sei y ∈ B ε (x 0 ), und 

z = y −x 0 . Dann ist für |t| < 2 der Punkt x 0 +tz in B 2ε (x 0 ). Für t ∈ I :=] −2, 2[ ist 

102

dann durch ϕ(t) := f(x 0 + tz) eine stetig differenzierbare Funktion auf I gegeben, 

und nach der Kettenregel ist 

ϕ ′ (t) = f ′ (x 0 + tz)z = 0 für t ∈ I . 

Mit Hilfe des Mittelwertsatzes 7.12 folgt hieraus: 

ϕ(a) = ϕ(b) für alle a, b ∈ I mit a ≤ b . 

Insbesondere ist f(y) = ϕ(1) = ϕ(0) = f(x 0 ) = η, und damit B ε (x 0 ) ⊂ A. Folglich 

ist A offen in U. 

Q.E.D. 

Bemerkung. Ist U in Satz 7.14 nicht zusammenhängend (und dim F > 0), so folgt 

aus f ′ = 0 keineswegs, daß f konstant ist. Dann läßt sich U nämlich schreiben als 

U = U 1 ∪U 2 , mit nichtleeren, disjunkten, offenen Teilmengen U 1 und U 2 , und wählen 

wir η 1 , η 2 ∈ F mit η 1 ≠ η 2 , so ist die durch 

{ 

η 1 , falls x ∈ U 1 , 

f(x) := 

η 2 , falls x ∈ U 2 , 

auf U definierte Funktion differenzierbar, nicht konstant, und f ′ = 0. 

7.6 Partielle Ableitungen höherer Ordnung 

und die Taylorapproximation 

Wir betrachten in diesem Paragraphen Funktionen f : U → R m , wobei U eine offene 

Teilmenge des R n sei. Für eine allgemeinere Diskussion höherer (totaler) Ableitungen 

von Funktionen zwischen beliebigen normierten Vektorräumen sowie der Taylorschen 

Formel in diesem allgemeinen Rahmen sei auf Anhang A verwiesen. 

Am Ende von Paragraph 7.1 hatten wir die Frage gestellt, ob stets 

∂ 2 f 

∂x i ∂x j 

= ∂2 f 

∂x j ∂x i 

gilt. Dies ist, wie wir in den Übungen sehen werden, i.a. falsch. Der folgende Satz 

zeigt jedoch, daß die obige Identität dann gilt, wenn eine der partiellen Ableitungen 

∂ 2 f ∂ 

∂x i ∂x j 

oder 

2 f 

∂x j ∂x i 

stetig ist. 

Zur Vereinfachung der Notation schreiben wir zukünftig auch kurz 

∂ ik ...i k 

f := ∂ ( ( )) 

∂ ∂ 

. . . f , 

∂x i1 ∂x ik−1 ∂x ik 

z.B. 

∂ i f = ∂f 

∂x i 

, ∂ ij f = ∂2 f 

∂x i ∂x j 

. 

103

Theorem 7.15 (von H.A. Schwarz) Die Funktion f : U → R m besitze auf U die 

partiellen Ableitungen ∂ i f, ∂ j f und ∂ ji f. Ferner sei ∂ ji f im Punkte a ∈ U stetig. 

Dann existiert auch ∂ ij f(a), und es gilt 

∂ ij f(a) = ∂ ji f(a). 

Der Beweis beruht auf einem 2-dimensionalen Analogon des Mittelwertsatzes einer 

Veränderlichen. 

Lemma 7.16 Sei r > 0, und bezeichne Q das offene Quadrat Q =] − r, r[ 2 ⊂ R 2 . 

Die Funktion ϕ : Q → R besitze die partiellen Ableitungen ∂ 1 ϕ und ∂ 21 ϕ. Dann gibt 

es für jedes (x, y) ∈ Q mit x ≠ 0, y ≠ 0 einen Punkt (ξ, η) ∈ Q mit 

(7.21) ϕ(x, y) − ϕ(x, 0) − ϕ(0, y) + ϕ(0, 0) = ∂ 21 ϕ(ξ, η)xy. 

Beweis. Sei u(x) := ϕ(x, y) −ϕ(x, 0). Zweimalige Anwendung des Mittelwertsatzes 

aus der Analysis I liefert dann ein ξ zwischen 0 und x und ein η zwischen 0 und y 

so, daß die linke Seite von (7.21) geschrieben werden kann als 

Beweis von Satz 7.15 

u(x) − u(0) = xu ′ (ξ) 

= x(∂ 1 ϕ(ξ, y) − ∂ 1 ϕ(ξ, 0)) 

= xy ∂ 21 ϕ(ξ, η). 

Q.E.D. 

Es genügt, ihn für den Fall m = 1 zu beweisen, d.h. für reellwertiges f. Für genügend 

kleines r > 0 ist dann die Funktion 

ϕ(x, y) := f(a + xe i + ye j ) 

auf dem Quadrat Q =] − r, r[ 2 wohldefiniert. Ferner existieren laut Voraussetzung 

an f die partiellen Ableitungen ∂ 1 ϕ, ∂ 2 ϕ und ∂ 21 ϕ auf Q, und ∂ 21 ϕ ist im Punkte 

(0, 0) stetig. Wir müssen zeigen, daß ∂ 12 ϕ in (0, 0) existiert, und daß gilt: 

∂ 12 ϕ(0, 0) = ∂ 21 ϕ(0, 0). 

Sei dazu ε > 0 gegeben. Da ∂ 21 ϕ in (0, 0) stetig ist, existiert eine Umgebung V von 

(0, 0) in Q so, daß für alle (x ′ , y ′ ) ∈ V 

|∂ 21 ϕ(x ′ , y ′ ) − ∂ 21 ϕ(0, 0)| < ε. 

Sei o.B.d.A. V von der Gestalt V =] − δ, δ[ 2 , mit 0 < δ < r. Nach (7.21) gilt dann 

für jedes (x, y) ∈ V mit x ≠ 0, y ≠ 0 

ϕ(x, y) − ϕ(x, 0) − ϕ(0, y) + ϕ(0, 0) 

∣ 

− ∂ 21 ϕ(0, 0) 

xy 

∣ < ε. 

104

Wegen 

ϕ(x, y) − ϕ(x, 0) 

lim 

= ∂ 2 ϕ(x, 0) 

y→0 y 

folgt hieraus ∣ ∣∣∣ ∂ 2 ϕ(x, 0) − ∂ 2 ϕ(0, 0) 

− ∂ 21 ϕ(0, 0) 

x 

∣ ≤ ε 

für alle x ≠ 0 mit |x| < δ. 

∂ 

Dies zeigt, daß lim 2 ϕ(x,0)−∂ 2 ϕ(0,0) 

x→0 x 

= ∂ 12 ϕ(0, 0) existiert und gleich ∂ 21 ϕ(0, 0) ist. 

Q.E.D. 

Durch mehrmalige Anwendung des Satzes von Schwarz sieht man, daß bei einer 

C k -Funktion f die Reihenfolge der partiellen Ableitungen 

∂ ∂ 

∂x ik 

. . . 

∂x i1 

f keine Rolle 

spielt. 

Korollar 7.17 Sei f ∈ C k (U, R m ), und seien i 1 , . . .,i k ∈ {1, . . .,n}. Dann gilt für 

jede Permutation π der Indizes 1, . . .,k 

∂ i1 ...i k 

f = ∂ iπ(1) ...i π(k) 

f. 

Wir können nun die Taylorformel für Funktionen einer Veränderlichen leicht auf den 

höherdimensionalen Fall übertragen. 

Sei dazu f ∈ C p+1 (U, R), und seien a, x Punkte in U, deren Verbindungsstrecke 

[a, x] := {(1 − t)a + tx : t ∈ [0, 1]} 

in U liegt. 

Wir betrachten die Hilfsfunktion F : [0, 1] → R mit 

F(t) := f(a + th), h := x − a. 

Dann ist F ∈ C p+1 ([0, 1], R), denn es gelten folgende Formeln für die Ableitungen 

von F, wie man sofort durch wiederholte Anwendung der Kettenregel sieht: 

(7.22) 

F ′ (t) = 

F ′′ (t) = 

. 

F (k) (t) = 

n∑ 

∂ i f(a + th)h i , 

i=1 

n∑ 

i=1 j=1 

n∑ 

∂ j ∂ i f(a + th)h i h j , 

n∑ n∑ 

· · · ∂ i1 . . .∂ ik f(a + th)h i1 . . .h ik . 

i 1 =1 i k =1 

105

Zur Vereinfachung der Schreibweise führen wir folgende Bezeichnungen ein: 

Für einen beliebigen Punkt x ∈ U und Vektor ξ = (ξ 1 , . . .,ξ n ) ∈ R n setzen wir 

n∑ n∑ 

(7.23) f (k) (x)ξ k := · · · ∂ i1 . . .∂ ik f(x)ξ i1 . . .ξ ik . 

i 1 =1 

f (k) (x)ξ k ist ein homogenes Polynom vom Grad k. Speziell ist für k = 1 

n∑ 

f (1) (x)ξ 1 = ∂ i f(x)ξ i = f ′ (x)ξ. 

Mit diesen Bezeichnungen gilt dann 

i k =1 

(7.24) F (k) (t) = f (k) (a + th)h k . 

i=1 

Wir definieren nun das Taylorpolynom p-ter Ordnung von f in a durch 

p∑ 1 

(7.25) T p,a f(x) := 

k! f(k) (a)(x − a) k . 

k=0 

Bemerkungen 7.18 (a) Sei U ⊂ R n offen, und sei f ∈ C k (U, R). Für einen 

∑ 

Multiindex α ∈ N n definiert man seine Länge |α| := n α j sowie α! := 

α 1 ! · · ·α n !. Ist ξ ∈ R n , so setzt man ferner ξ α := ξ α 1 

( ) 1 · · ·ξn αn . Schließlich sei 

α1 

) 

∂ α ∂ 

:= 

∂x 1 

· · ·( 

∂ αn. 

∂x n 

Dann gilt (Übung!) 

j=1 

(7.26) 

1 

k! f(k) (x)ξ k = 

∑ 

{α∈N n :|α|=k} 

∂ α f(x) 

ξ α . 

α! 

(b) Nimmt f Werte im R m an, so können wir f (k) (x)ξ k analog definieren durch 

n∑ n∑ 

f (k) (x)ξ k := · · · ξ i1 · · ·ξ ik ∂ i1 . . .∂ ik f(x) 

i 1 =1 

i k =1 

= (f (k) 

1 (x)ξ k , . . .,f (k) 

n (x)ξk ), 

und wir definieren das Taylorpolynom analog durch (7.25). 

Theorem 7.19 (Taylorformel) Sei f ∈ C p+1 (U, R m ), und seien a, x Punkte in 

U, deren Verbindungsstrecke in U liegt. Dann gilt: 

(7.27) f(x) = T p,a f(x) + R p,a (x), 

wobei das Restglied durch das Integral 

(7.28) R p,a (x) = 1 p! 

gegeben ist. 

∫ 1 

0 

(1 − t) p f (p+1) (a + t(x − a))(x − a) p+1 dt 

106

Beweis. Wir dürfen nach Bemerkung 7.18 o.B.d.A. m = 1 annehmen. Nach der 

1-dimensionalen Taylorformel ist nun 

F(1) = 

p∑ 

k=0 

F (k) (0) 

k! 

+ R p , 

mit 

Nun ist nach (7.24) 

sowie 

R p = 1 p! 

∫ 1 

0 

R p = 1 p! 

F (k) (0) 

k! 

∫ 1 

0 

(1 − t) p F (p+1) (t)dt. 

= 1 k! f(k) (a)(x − a) k 

(1 − t) p f (p+1) (a + t(x − a))(x − a) p+1 dt. 

Ferner ist F(1) = f(x). Damit ergibt sich die Behauptung. 

Q.E.D. 

Bemerkung 7.20 Ist f in Theorem 7.19 reellwertig, so läßt sich das Restglied auch 

darstellen in der Form 

(7.29) R p,a (x) = 

mit einem geeigneten ξ ∈ [a, x]. 

1 

(p + 1)! f(p+1) (ξ)(x − a) p+1 , 

In diesem Fall gibt es nämlich ein θ ∈ [0, 1] so, daß 

R p = 

1 

(p + 1)! F (p+1) (θ). 

Die Identität (7.29) folgt, indem man ξ := a + θ(x − a) wählt. 

Korollar 7.21 (Taylor-Approximation) Ist f ∈ C p (U, R m ) und ist a ∈ U, so 

gilt 

(7.30) f(x) = T p,a f(x) + o(‖x − a‖ p ) für x → a, 

d.h. es ist 

‖f(x) − T p,a f(x)‖ 

lim 

= 0. 

x→a ‖x − a‖ p 

107

Beweis. Es sei o.B.d.A. m = 1. Nach Theorem 7.19 ist 

f(x) = T p−1,a f(x) + R p−1,a (x) 

= T p,a f(x) + ϕ(x), 

wobei 

ϕ(x) = R p−1,a (x) − 1 p! f(p) (a)(x − a) p . 

Nach Bemerkung 7.20 gibt es ferner ein ξ ∈ [a, x] mit 

ϕ(x) = 1 p! [fp (ξ)(x − a) p − f (p) (a)(x − a) p ]. 

Wir müssen zeigen, daß ϕ(x) = o(‖x − a‖ p ) ist. Zu ε > 0 wähle dazu eine Kugel 

B δ (a) ⊂ U so, daß für alle y ∈ B δ (a) gilt: 

Q(y) := 1 p! 

n∑ n∑ 

· · · |∂ i1 . . .∂ ip f(y) − ∂ i1 . . .∂ ip f(a)| < ε. 

i 1 =1 i p=1 

Beachtet man noch, daß 

|(x i1 − a i1 ) . . .(x ip − a ip )| ≤ ‖x − a‖ p ∞ ≤ ‖x − a‖p 

ist, so folgt für x ∈ B δ (a): 

‖ϕ(x)‖ ≤ 1 n∑ n∑ 

· · · |∂ i1 . . . ∂ ip f(ξ) − ∂ i1 . . .∂ ip f(a)| · |(x i1 − a i1 ) . . .(x ip − a ip )| 

p! 

i 1 =1 i p=1 

≤ Q(ξ)‖x − a‖ p ≤ ε‖x − a‖ p , 

also ‖ϕ(x)‖ 

‖x−a‖ p ≤ ε für alle x ≠ a mit ‖x − a‖ < δ. 

Q.E.D. 

Das Taylorpolynom 1. Ordnung 

f(a) + f ′ (a)(x − a) 

liefert die in der Definition der totalen Ableitung beschriebene ” 

lineare Approximation“ 

der Funktion f nahe dem Punkt a. Für beliebiges p stellt T p,a f ein Polynom 

vom Grade ≤ p dar, welches f in der Nähe von a nach (7.30) derart approximiert, 

daß der Fehler f(x) − T p,a f(x) für x → a schneller als ‖x − a‖ p gegen Null strebt. 

108

7.7 Die Hesse-Form 

Definition. Sei U ⊂ R n offen, und sei f ∈ C 2 (U, R). Für a ∈ U heißt die durch 

f (2) (a)x 2 = 

n∑ 

∂ ij f(a)x i x j , x ∈ R n , 

i,j=1 

definierte quadratische Form auf dem R n die Hesse-Form von f in a, und die 

symmetrische n × n-Matrix 

⎛ 

⎞ 

∂ 11 f(a) . . . ∂ 1n f(a) 

f ′′ ⎜ 

⎟ 

(a) = H f (a) := ⎝ . . ⎠ 

∂ n1 f(a) . . . ∂ nn f(a) 

die Hesse-Matrix. Wir nennen diese Matrix auch die zweite Ableitung von f 

in a. 

Betrachten wir hier die Vektoren des R n wieder als Spaltenvektoren, so gilt also 

f (2) (a)x 2 = t x · H f (a) · x = 〈 x, f ′′ (a)x〉 , 

falls 〈x, y〉 = ∑ n 

j=1 x jy j wieder das Euklidische Skalarprodukt auf dem R n bezeichnet. 

Für das Taylorpolynom 2. Ordnung der Funktion f im Punkte a erhält man 

nun die Darstellung 

(7.31) T 2,a f(x) = f(a) + f ′ (a)(x − a) + 1 t (x − a) · f ′′ (a) · (x − a), 

2 

wobei hier f ′ (a) als Kurzschreibweise für den Gradienten ∇f(a) steht. 

Beispiel. f(x, y) = x y auf R + × R. 

Da f(x, y) = e y log x ist, ist 

∂f 

∂x = yxy−1 , 

∂ 2 f 

∂x 2 = y(y − 1)x y−2 , 

∂ 2 f 

∂y 2 = x y (log x) 2 . 

∂f 

∂y = xy log x, 

∂ 2 

∂x∂y f = 

Für a = (1, 1) ergibt sich f ′ (1, 1) = (1, 0), 

f ′′ (1, 1) = 

∂2 

∂y∂x f = xy−1 (1 + y log x), 

( ) 

0 1 

. 

1 0 

Damit ist das Taylorpolynom 2. Ordnung von f in (1,1) gegeben durch 

T 2,(1,1) f(x, y) = 1 + (x − 1) + (x − 1)(y − 1). 

109

7.7.1 Schmiegequadriken 

Ist die Hesse-Matrix f ′′ (a) nicht die Nullmatrix, so ist der Graph des Taylorpolynoms 

T 2,a f von f eine sogenannte Quadrik im R n+1 . Wegen 

f(x) − T 2,a f(x) = o(‖x − a‖ 2 ) 

wird diese auch als die Schmiegequadrik an den Graphen von f im Punkte 

(a, f(a)) bezeichnet. Diese hat im Punkte (a, f(a)) dieselbe Tangentialhyperebene 

wie der Graph von f, und auch dieselbe Krümmung; letzteres wird in der Differentialgeometrie 

präzisiert. 

In der Linearen Algebra wird gezeigt, daß man im Fall n = 2 jede Schmiegequadrik 

durch eine affine Koordinatentransformation in eine der folgenden Normalformen 

bringen kann: 

(E) z = ±(x 2 + y 2 ) 

(H) z = x 2 − y 2 

(P) z = ±x 2 

(elliptisches Paraboloid) 

(hyperbolisches Paraboloid) 

(parabolischer Zylinder) 

2 

1 

0.5 

0.25 

1.5 

0.2 

0 

1 

0.15 

-0.5 

0.1 

0.5 

-1 

-1 

0.05 

-1 

-1 

-0.5 

-0.5 

0 

-1 

-0.5 

0 

y 

0.5 

1 

1 

0.5 

0 

x 

-0.5 

y 

0 

0.5 

1 

1 

0.5 

0 

x 

-0.5 

-1 

0 

0.4 

0.2 

0 

x 

-0.2 

-0.4 

1 

0 

y 

0.5 

Allgemeiner heißt eine quadratische Form 

Q : R n → R, 

Q(x) = t xAx, 

und die sie repräsentierende symmetrische Matrix A, bekanntlich 

positiv definit, falls Q(x) > 0 ist für alle x ≠ 0 (in Zeichen: Q > 0), 

negativ definit, falls Q(x) < 0 ist für alle x ≠ 0, (in Zeichen: Q < 0), 

positiv semidefinit, falls Q(x) ≥ 0 ist für alle x ≠ 0, (in Zeichen: Q ≥ 0), 

negativ semidefinit, falls Q(x) ≤ 0 ist für alle x ≠ 0, (in Zeichen: Q > 0), 

(in Zei- 

indefinit, falls Q sowohl positive als auch negative Werte annimmt 

chen: Q ≷ 0). 

110

Da sich die symmetrische Matrix A mittels einer orthogonalen Koordinatentransformation 

diagonalisieren läßt, sind diese Eigenschaften äquivalent zu den folgenden 

Eigenschaften der Eigenwerte (EW) von A : 

Q > 0 ⇐⇒ alle EW sind > 0, 

Q < 0 ⇐⇒ alle EW sind < 0, 

Q ≥ 0 ⇐⇒ alle EW sind ≥ 0, 

Q ≤ 0 ⇐⇒ alle EW sind ≤ 0, 

Q ≷ 0 ⇐⇒ A hat EW > 0 und < 0. 

7.8 Lokale Extrema 

Sei f : X → R, wobei X ⊂ R n sei. f besitze in a ∈ X ein lokales Maximum 

bzw. Minimum, falls es in X eine Umgebung V von a gibt, so daß f(x) ≤ f(a) 

bzw. f(x) ≥ f(a) für alle x ∈ V. Kann V so gewählt werden, daß sogar f(x) < f(a) 

bzw. f(x) > f(a) für alle x ∈ V \ {a} gilt, so heißt a Stelle eines isolierten lokalen 

Maximums bzw. Minimums von f. 

Satz 7.22 (Notwendiges Kriterium) Sei U ⊂ R n offen. Hat f : U → R in 

a ∈ U ein lokales Extremum, d.h. ein lokales Maximum oder Minimum, und ist f 

in a partiell differenzierbar, so gilt 

(7.32) ∂ 1 f(a) = · · · = ∂ n f(a) = 0. 

Für eine in a differenzierbare Funktion f besagt (7.32), daß f ′ (a) = 0 ist. 

Beweis. Die durch g(t) := f(a + te k ) in einem genügend kleinen Intervall um 0 

erklärte Funktion g hat in t = 0 ein lokales Extremum. Somit ist 0 = g ′ (0) = 

Df(a)e k = ∂ k f(a) für k = 1, . . ., n. 

Q.E.D. 

Punkte a mit f ′ (a) = 0 bezeichnet man auch als kritische oder stationäre Punkte 

von f. 

Satz 7.23 (Hinreichendes Kriterium) Seien U ⊂ R n offen und sei f : U → R 

eine C 2 -Funktion. Ist a ∈ U ein kritischer Punkt von f, d.h. ist f ′ (a) = 0, so gilt: 

f ′′ (a) > 0 =⇒ f hat in a ein isoliertes lokales Minimum; 

f ′′ (a) < 0 =⇒ f hat in a ein isoliertes lokales Maximum; 

f ′′ (a) ≷ 0 =⇒ f hat in a kein lokales Extremum. 

111

Beweis. Sei zunächst f ′′ (a) > 0. Wegen f ′ (a) = 0 folgt dann für alle genügend 

kleinen Vektoren ξ ∈ R n mittels Taylor-Approximation (vgl. Satz 7.21) 

wobei 

f(a + ξ) = f(a) + 1 t ξf ′′ (a)ξ + R(ξ), 

2 

R(ξ) 

lim 

ξ→0 ‖ξ‖ = 0. 2 

Die stetige Funktion ξ ↦→ t ξf ′′ (a)ξ nimmt wegen f ′′ (a) > 0 auf der kompakten 

Einheitssphäre S := {ξ : ‖ξ‖ = 1} ein strikt positives Minimum m > 0 an. Schreibt 

man einen beliebigen Vektor als ξ = ‖ξ‖e, mit einem Einheitsvektor e ∈ S, so folgt 

damit für alle ξ 

t ξf ′′ (a)ξ ≥ m‖ξ‖ 2 . 

Wähle nun ε > 0 so klein, daß B ε (a) ⊂ U, und so daß für ‖ξ‖ < ε stets 

gilt. Für alle a + ξ ∈ B ε (a) folgt dann 

|R(ξ)| ≤ m 4 ‖ξ‖2 

f(a + ξ) ≥ f(a) + m 2 ‖ξ‖2 − m 4 ‖ξ‖2 = f(a) + m 4 ‖ξ‖2 . 

Dies zeigt, daß f in der Kugel B ε (a) genau im Punkte a ein Minimum annimmt. 

Im Fall f ′′ (a) > 0 ist damit die Behauptung bewiesen, und der Fall f ′′ (a) < 0 wird 

durch den Übergang zu −f auf den vorherigen Fall zurückgeführt. 

Ist schließlich f ′′ (a) indefinit, so gibt es Vektoren v und w mit t vf ′′ (a)v > 0 bzw. 

t wf ′′ (a)w < 0. Betrachten wir dann die Funktionen 

g v (t) := f(a + tv) 

g w (t) := f(a + tw), 

die auf einem genügend kleinen Intervall um 0 ∈ R definiert sind, so ist nach der 

Kettenregel g v ′′(0) 

= t vf ′′ (a)v > 0 und g w ′′(0) = t wf ′′ (a)w < 0, wobei t = 0 jeweils 

ein kritischer Punkt ist. Somit hat g v in 0 ein isoliertes lokales Mimimum, g w ein 

isoliertes lokales Maximum, und f daher in a kein lokales Extremum. Q.E.D. 

Beispiel. Die Funktion f(x, y) := y 2 (x−1)+x 2 (x+1) auf R 2 soll auf lokale Extrema 

untersucht werden. Es ist 

f ′ (x, y) = (y 2 + 3x 2 + 2x, 2(x − 1)y). 

Die Bedingung f ′ (x, y) = (0, 0) ergibt als stationäre Punkte P 1 := (0, 0) und P 2 := 

(− 2 , 0). Die zweite Ableitung von f ist gegeben durch die Hesse-Matrix 

3 

( ) 

6x + 2 2y 

f ′′ (x, y) = 

. 

2y 2(x − 1) 

112

( ) 

2 0 

Somit ist f ′′ (P 1 ) = indefinit, so daß in P 

0 −2 

1 kein lokales Extremum vorliegt 

( ) 

−2 0 

(sondern ein sogenannter Sattelpunkt), und f ′′ (P 2 ) = 

0 − 10 , so daß in P 2 ein 

3 

lokales Maximum vorliegt. 

113

Kapitel 8 

Der Banachsche Fixpunktsatz 

In vielen Situationen in der Mathematik steht man vor dem Problem, die Existenz 

eines gewissen Objektes, wie z.B. die Lösung eine Gleichung, nachzuweisen, ohne dieses 

” 

explizit“ berechnen zu können. Hier helfen oftmals sogenannte Fixpunktsätze 

weiter. Einer der bedeutendsten Sätze dieser Art ist der Kontraktionssatz von Banach. 

Definition. Es sei (M, d) ein metrischer Raum. Eine Abbildung S : M → M heiße 

kontrahierend oder eine Kontraktion, wenn es eine Zahl θ ∈ [0, 1[ gibt mit 

d(S(x), S(y)) ≤ θ d(x, y) für alle x, y ∈ M . 

Ein Punkt x ∈ M heiße Fixpunkt von S, wenn gilt S(x) = x. 

Man beachte, daß jede Kontraktion Lipschitz-stetig ist. 

Theorem 8.1 (Banachscher Fixpunktsatz) Sei S eine Kontraktion des vollständigen 

metrischen Raumes (M, d). Dann besitzt S einen eindeutigen Fixpunkt 

x. 

Ist x 0 ein beliebiger Punkt in M, und definieren wir die Folge (x n ) n rekursiv durch 

x n := S(x n−1 ), n = 1, 2, . . ., so ist lim 

n→∞ 

x n = x, und es gilt 

(8.1) d(x, x n ) ≤ θ 

1 − θ d(x n−1, x n ) ≤ θn 

1 − θ d(x 0, x 1 ) . 

Beweis. Wir zeigen zuerst, daß S höchstens einen Fixpunkt besitzt. Sind nämlich 

x 1 und x 2 zwei Fixpunkte von S, so gilt: 

d(x 1 , x 2 ) = d(S(x 1 ), S(x 2 )) ≤ θd(x 1 , x 2 ), 

mit 0 ≤ θ < 1. Es folgt d(x 1 , x 2 ) = 0, also x 1 = x 2 . 

Um die Existenz eines Fixpunktes nachzuweisen, wählen wir einen beliebigen Punkt 

x 0 in M, und definieren rekursiv die Folge (x n ) n wie im Theorem. Dann gilt für 

k > 1 

d(x k , x k+1 ) = d(S(x k−1 ), S(x k )) ≤ θd(x k−1 , x k ) , 

114

woraus per Iteration folgt: 

d(x k+j , x k+j+1 ) ≤ θ j+1 d(x k−1 , x k ), j ≥ 0 . 

Für p > n ≥ 1 folgt hieraus mittels der Dreiecksungleichung 

(8.2) 

d(x n , x p ) ≤ 

p−n−1 

∑ 

j=0 

Sei ε > 0. Da 0 ≤ θ < 1, gibt es ein n 0 ∈ N mit 

≤ 

d(x n+j , x n+j+1 ) ≤ 

p−n−1 

∑ 

j=0 

θ 

1 − θ d(x n−1, x n ) ≤ θn 

1 − θ d(x 0, x 1 ) . 

θ n 

1 − θ d(x 0, x 1 ) < ε für alle n ≥ n 0 . 

θ j+1 d(x n−1 , x n ) 

Somit ist (x n ) n eine Cauchy-Folge im vollständigen metrischen Raum M und konvergiert 

folglich gegen einen Punkt x ∈ M. Da S als Kontraktion stetig ist, ist 

S(x) = lim 

n→∞ 

S(x n ) = lim 

n→∞ 

x n+1 = x , 

d.h. x ist ein Fixpunkt von S. Die Stetigkeit der Metrik als Abbildung von M × M 

nach R impliziert schließlich 

d(x n , x) = lim 

p→∞ 

d(x n , x p ), 

so daß sich die gewünschten Abschätzungen in Theorem 8.1 unmittelbar aus (8.2) 

ergeben. 

Q.E.D. 

Bemerkung 8.2 Setzen wir S 1 := S, und S n := S ◦ S n−1 für n > 1, um die Iterierten 

von S zu beschreiben, so läßt sich die Folge (x n ) n in Theorem 8.1 schreiben 

als (S n (x 0 )) n . Der Banachsche Fixpunktsatz liefert nicht nur die Existenz eines Fixpunktes 

sowie dessen Eindeutigkeit, sondern sogar ein iteratives Verfahren, um diesen 

aufzufinden. Ferner wird eine Formel zur Abschätzung des Fehlers d(x, S n (x 0 )) 

geliefert, den man begeht, wenn man anstelle des Fixpunktes x den Punkt S n (x 0 ) 

aus dem n-ten Iterationsschritt wählt. 

115

Kapitel 9 

Der Satz über implizite 

Funktionen 

9.1 Einleitende Beispiele 

Ein Problem, auf welches man in der Mathematik, aber auch in vielen Anwendungen 

des öfteren stößt, ist das der ” 

Auflösung“ eines Systems von Gleichungen nach 

gewissen ” 

Unbekannten“ y 1 , . . .,y m . 

Typischerweise handelt es sich um Gleichungen der Form 

(9.1) 

F 1 (x 1 , . . .,x k , y 1 , . . ., y m ) = 0 

. 

F n (x 1 , . . .,x k , y 1 , . . ., y m ) = 0 

in den Variablen x 1 , . . .,x k , y 1 , . . .,y m (welche auf einer Teilmenge des R k × R m 

definiert sind), welche man für gegebene Werte von x 1 , . . .,x k nach y 1 , . . .,y m 

“auflösen“ möchte. Im Idealfall hofft man dabei, daß es zu festem x 1 , . . .,x k nur 

genau eine Lösung y 1 = y 1 (x 1 , . . .,x k ), . . .,y m = y m (x 1 , . . .,x k ) gibt, wodurch dann 

Funktionen 

g i : (x 1 , . . ., x k ) ↦→ y i (x 1 , . . .,x k ), i = 1, . . .,m, 

mit 

F j (x 1 , . . .,x k , g 1 (x 1 , . . .,x k ), . . .,g m (x 1 , . . ., x k )) = 0, 

j = 1, . . .,n, 

definiert werden. 

Beispiele 9.1 a) Die Gleichung x 2 + y 2 = r 2 auf R × R definiert den Kreis mit 

Radius r ≥ 0 und Mittelpunkt (0, 0). Diese läßt sich umschreiben in 

F(x, y) := r 2 − (x 2 + y 2 ) = 0. 

116

Löst man nach y auf, so erhält man 

y = ± √ r 2 − x 2 , falls |x| ≤ r . 

Für |x| > r erhält man dagegen keine reelle Lösung y. Setzt man g + (x) := 

√ 

r2 − x 2 , g − (x) := − √ r 2 − x 2 , |x| ≤ r, so erhält man hier sogar zwei stetige 

Funktionen g + und g − auf I = [−r, r] mit 

F(x, g + (x)) = 0 und F(x, g − (x)) = 0, x ∈ I . 

Insbesondere gibt es z.B. nur genau eine stetige Lösungsfunktion g mit F(x, g(x)) = 

0 für x ∈ I und (0, g(0)) = (0, r), nämlich g + . 

Für r = 0 schrumpft das Lösungsintervall I übrigens zusammen auf die einpunktige 

Menge I = {0} so, daß wir hier auf keiner noch so kleinen Umgebung der 0 eine 

Lösungsfunktion g finden können. 

b) Sind die Funktionen F 1 , . . .,F n in (9.1) linear, so läßt sich (9.1) kürzer schreiben 

als 

(9.2) B · x + A · y = 0 , 

⎛ ⎞ ⎛ ⎞ 

x 1 y 1 

⎜ ⎟ ⎜ ⎟ 

mit x = ⎝ . ⎠ , y = ⎝ . ⎠, wobei A = (a ij ) i=1,...,n und B = (b il ) i=1,...,n 

j=1,...,m 

l=1,...,k 

x k y m 

n × m-bzw. n × k-Matrizen sind. (9.2) ist äquivalent zu 

gewisse 

(9.3) 

A · y = −B · x . 

Hinreichend für die Auflösbarkeit dieser Gleichung nach y ist dann die Invertierbarkeit 

der durch die Matrix A definierten linearen Abbildung. Dazu muß insbesondere 

n = m sein. Ist dann A invertierbar, so ist (9.3) äquivalent zu 

y = −A −1 · B · x . 

Dieses Beispiel unterstreicht das heuristische Prinzip, wonach man i.a. gerade n 

Gleichungen benötigt, um nach n Variablen y 1 , . . .,y n 

” aufzulösen“. 

117

Wir setzen daher ab jetzt stets n = m voraus. 

c) Für x, y ∈ R sei 

F(x, y) := y + e y − x. 

Mit Hilfe des Zwischenwertsatzes (genauer Satz 9.10, Anal. I) sieht man leicht, daß 

es eine eindeutige, stetige Funktion g : R → R mit F(x, g(x)) = 0 gibt. Offenbar ist 

nämlich g die Umkehrfunktion der stetigen, streng isotonen Funktion h : y ↦→ y+e y , 

welche nach Satz 9.11 (Anal. I) ebenfalls stetig ist. 

Leider läßt sich g nicht “explizit“ angeben, d.h. als Ausdruck in wohlbekannten 

Funktionen. Wir werden sehen, daß sich trotzdem wichtige Eigenschaften der durch 

F(x, g(x)) = 0 ” 

implizit“ definierten Funktion g, wie z.B. Stetigkeit, Differenzierbarkeit 

etc., aus entsprechenden Eigenschaften der Funktion F herleiten lassen. 

Wir kehren nun zum Gleichungssystem (9.1) zurück und beobachten zunächst, daß 

sich dieses für n = m in die Form 

(9.4) 

F(x, y) = 0 

bringen läßt, wenn wir setzen: 

x := (x 1 , . . .,x k ) ∈ R k , 

y := (y 1 , . . .,y n ) ∈ R n , 

F := (F 1 , . . ., F n ). 

9.2 Satz über implizite Funktion und Satz über 

Umkehrfunktionen 

Wir wollen sogar folgende, allgemeinere Situation betrachten: 

Es seien X, Y und Z normierte Vektorräume (welche in (9.4) den Räumen R k , R n 

und R n entsprechen), sowie (a, b) ∈ X × Y . X × Y werde mit der Norm ‖(x, y)‖ := 

‖(x, y)‖ ∞ = max(‖x‖ X , ‖y‖ Y ), (x, y) ∈ X × Y , versehen. 

Definition. Sind U eine Teilmenge von X × Y mit (a, b) ∈ U sowie F : U → Z 

eine Abbildung, und ist {x ∈ X : (x, b) ∈ U} eine Umgebung von a in X, so heiße 

F in (a, b) partiell nach der 1. Variablen differenzierbar, falls die Abbildung 

F(·, b) : x ↦→ F(x, b) im Punkte a differenzierbar ist. Man schreibt dann für diese 

partielle Ableitung 

D 1 F(a, b) := (F(·, b)) ′ (a), 

oder auch F ′ x(a, b). 

Analog wird die partielle Ableitung D 2 F(a, b) = F ′ y (a, b) := (F(a, ·))′ (b) definiert. 

Ist F im Punkte (a, b) total differenzierbar, so ist offenbar für alle (ξ, η) ∈ X × Y 

118

(9.5) 

DF(a, b)(ξ, η) = DF(a, b)(ξ, 0) + DF(a, b)(0, η) 

= D 1 F(a, b)ξ + D 2 F(a, b)η . 

Definition. Ein beschränkter linearer Operator T ∈ L(Y, Z) heiße regulär, falls es 

einen beschränkten linearen Operator T −1 ∈ L(Z, Y ) gibt mit T ◦ T −1 = I Z , T −1 ◦ 

T = I Y , wobei I Z bzw. I Y den identischen Operator auf Z bzw. Y bezeichne. 

Bemerkung. In vielen Anwendungen ist Y = Z = R n . Dann ist T ∈ L(R n , R n ) 

regulär dann und nur dann, wenn T invertierbar ist, d.h. wenn det T ≠ 0. 

Satz 9.2 (Differenzierbarkeit der auflösenden Funktion) Sei (a, b) ∈ X ×Y , 

und seien U 1 eine offene Umgebung von a in X und U 2 eine offene Umgebung von b 

in Y . Ferner sei F : U 1 × U 2 → Z eine Abbildung mit F(a, b) = 0, welche im Punkt 

(a, b) differenzierbar ist. Weiter sei g : U 1 → U 2 eine stetige Abbildung mit g(a) = b 

sowie 

F(x, g(x)) = 0 für alle x ∈ U 1 . 

Ist dann die partielle Ableitung F y ′ (a, b) ∈ L(Y, Z) regulär, so ist g im Punkte a 

differenzierbar, und es gilt: 

(9.6) 

g ′ (a) = −(F y ′ (a, b))−1 ◦ F x ′ (a, b) . 

Beweis. Sei o.B.d.A. (a, b) = (0, 0), und somit insbesondere g(0) = 0 (ansonsten 

betrachte man die Hilfsfunktion ˜F(x, y) := F(a + x, b + y)). Wir setzen 

A := F x ′(0, 0) ∈ L(X, Z), B := F y ′ (0, 0) ∈ L(Y, Z). Da F in (0, 0) differenzierbar 

ist, ist 

F(x, y) = Ax + By + ϕ(x, y) , 

wobei ϕ : U 1 × U 2 → Z eine Funktion ist mit 

ϕ(x, y) = o(‖(x, y)‖) . 

Nach Voraussetzung ist F(x, g(x)) = 0 für alle x ∈ U 1 , und damit 0 = Ax+Bg(x)+ 

ϕ(x, g(x)), also 

(9.7) g(x) = −B −1 Ax − B −1 ϕ(x, g(x)) für alle x ∈ U 1 , 

mit B −1 ∈ L(Z, Y ) . 

Sei ε > 0. Da ϕ(x, y) = o(‖(x, y)‖) ist, gibt es ein δ > 0 so, daß 

‖ϕ(x, y)‖ ≤ ε‖(x, y)‖ ≤ ε(‖x‖ + ‖y‖) 

119

ist für alle (x, y) mit ‖(x, y)‖ < δ. Ferner gibt es wegen der Stetigkeit von g in 0 ein 

δ 1 < δ so, daß gilt: 

‖g(x)‖ < δ für alle x mit ‖x‖ < δ 1 . 

Damit ist für ‖x‖ < δ 1 offenbar ‖(x, g(x))‖ < δ, also 

und damit 

‖ϕ(x, g(x))‖ ≤ ε(‖x‖ + ‖g(x)‖) 

(9.8) 

‖B −1 ϕ(x, g(x))‖ ≤ ‖B −1 ‖ε(‖x‖ + ‖g(x)‖) . 

Für ε := 1 

2‖B −1 ‖ 

Somit gibt es ein δ 0 > 0 mit 

erhalten wir nach (9.7) insbesondere 

‖g(x)‖ ≤ ‖B −1 A‖ ‖x‖ + 1 2 ‖x‖ + 1 2 ‖g(x)‖ . 

(9.9) 

‖g(x)‖ ≤ K ‖x‖ , für ‖x‖ < δ 0 , 

mit K := 2‖B −1 A‖ + 1. 

Wir setzen nun ψ(x) := −B −1 ϕ(x, g(x)). Damit ist nach (9.7) 

g(x) = −B −1 Ax + ψ(x) , 

und der Satz ist bewiesen, wenn gezeigt wird, daß ψ(x) = o(‖x‖) ist, d.h. daß 

ψ(x) 

lim 

x→0 ‖x‖ = 0 . 

Aus (9.8) und (9.9) folgt jedoch, daß es zu jedem ε ′ > 0 ein δ ′ > 0 mit δ ′ < δ 0 gibt 

so, daß ‖ψ(x)‖ ≤ ε ′ ‖x‖ gilt für alle x mit ‖x‖ < δ ′ . 

Q.E.D. 

Bemerkungen 9.3 (i) Man überlege sich einmal, daß für die Abbildung F in Beispiel 

9.1 a) die Bedingung F y ′ ∂F 

(a, b) = (a, b) ≠ 0 (für a, b mit ∂y a2 + b 2 = r 2 ) 

hinreichend und notwendig dafür ist, daß es auf einer Umgebung von a eine stetige 

Funktion g gibt mit g(a) = b und F(x, g(x)) = 0, und daß in Beispiel b) die 

Regularität von F y(a, ′ b) äquivalent zur Regularität der Matrix A ist. 

(ii) Für die in Beispiel 9.1 c) implizit definierte Funktion erhalten wir aus Satz 9.2: 

g ist differenzierbar auf ganz R, und es gilt: 

∂F 

g ′ (x, g(x)) 

∂x 

(x) = − 

∂F 

(x, g(x)) = 1 

1 + e . g(x) ∂y 

120

Da die rechte Seite differenzierbar ist, ist damit g sogar zweimal differenzierbar, und 

per Induktion erkennt man, daß g sogar beliebig oft differenzierbar ist. 

(iii) Formel (9.6) ergibt sich sofort mit der Kettenregel aus f(x) := F(x, g(x)) ≡ 0, 

falls man bereits weiß, daß g differenzierbar ist: Es ist dann nämlich 

0 = f ′ (x) = F ′ x (x, g(x)) + F ′ y (x, g(x)) ◦ g′ (x), 

woraus (9.6) durch Auflösen nach g ′ (x) folgt. 

Theorem 9.4 (Satz über implizite Funktionen) Es seien X, Y und Z Banachräume, 

U 1 ⊂ X und U 2 ⊂ Y offene Mengen, sowie F : U 1 × U 2 → Z eine 

stetig differenzierbare Abbildung. Sei (a, b) ∈ U 1 × U 2 mit F(a, b) = 0, und sei 

F y ′ (a, b) ∈ L(Y, Z) regulär. 

Dann gibt es offene Umgebungen V 1 ⊂ U 1 von a und V 2 ⊂ U 2 von b derart, daß es 

zu jedem x ∈ V 1 genau ein y ∈ V 2 gibt mit F(x, y) = 0. Bezeichnen wir dieses y mit 

g(x), so ist die dadurch definierte Funktion g : V 1 → V 2 stetig, und es gilt: 

F(x, g(x)) = 0 für alle x ∈ V 1 . 

Beweis. Der Beweis soll in zwei Schritten erfolgen. 

1. Schritt: Reduktion auf ein Fixpunktproblem 

Es sei o.B.d.A. (a, b) = (0, 0). Wir setzen B := F y ′ (0, 0) ∈ L(Y, Z), und definieren 

die Abbildung G : U 1 × U 2 → Y durch 

Offenbar gilt dann: 

G(x, y) := y − B −1 ◦ F(x, y) . 

(9.10) 

F(x, y) = 0 genau dann, wenn G(x, y) = y . 

Ferner ist nach der Kettenregel 

G ′ y (x, y) = I − B−1 ◦ F y ′ (x, y) , 

also G ′ y (0, 0) = I − B−1 ◦ B = 0. Für G gilt also 

G ′ y(0, 0) = 0, 

G(0, 0) = 0. 

Da G ′ y stetig ist, können wir somit Nullumgebungen W 1 ⊂ U 1 und W 2 ⊂ U 2 so 

wählen, daß gilt: 

(9.11) 

‖G ′ y(x, y)‖ ≤ 1 2 

für alle (x, y) ⊂ W 1 × W 2 . 

121

Wir wählen R > 0 so, daß V 2 := B R (0) ⊂ W 2 ist. 

Da G stetig ist mit G(0, 0) = 0, gibt es ferner ein r > 0 so, daß V 1 := B r (0) ⊂ W 1 

ist und 

(9.12) 

sup 

x∈V 1 

‖G(x, 0)‖ ≤ R 4 . 

Aus (9.11) und (9.12) folgern wir mit Hilfe des Schrankensatzes, daß für alle x ∈ V 1 

und y 1 , y 2 , y ∈ V 2 gilt: 

(9.13) 

‖G(x, y 1 ) − G(x, y 2 )‖ ≤ 1 2 ‖y 1 − y 2 ‖ 

und 

(9.14) 

‖G(x, y)‖ ≤ 3 4 R . 

In der Tat, setzen wir für y 1 , y 2 ∈ V 2 = B R (0) und x ∈ V 1 

ϕ(t) := G(x, (1 − t)y 1 + ty 2 ) , 

so ist ϕ(t) in einer offenen Umgebung des Intervalls [0, 1] definiert (da 

‖(1 − t)y 1 + ty 2 ‖ ≤ (1 − t)‖y 1 ‖ + |t| ‖y 2 ‖ < |1 − t|R + |t|R = (|1 − t| + |t|)R) und es 

ist nach der Kettenregel 

ϕ ′ (t) = G ′ y(x, (1 − t)y 1 + ty 2 )(y 2 − y 1 ) , 

also nach (9.11) 

‖ϕ ′ (t)‖ ≤ 1 2 ‖y 2 − y 1 ‖ für t ∈ [0, 1] . 

Da ϕ(0) = G(x, y 1 ), ϕ(1) = G(x, y 2 ), so folgt (9.13) mit Satz 7.12. 

Mit (9.12) und (9.13) folgert man für y ∈ V 2 und x ∈ V 1 : 

‖G(x, y)‖ ≤ ‖G(x, y) − G(x, 0)‖ + ‖G(x, 0)‖ 

≤ 1 2 ‖y‖ + R 4 ≤ R 2 + R 4 = 3 4 R . 

Aus (9.13) folgt übrigens sofort, daß es zu gegebenem x ∈ V 1 höchstens ein y ∈ V 2 

geben kann mit F(x, y) = 0 : 

Sind nämlich y 1 , y 2 ∈ V 2 so, daß F(x, y 1 ) = F(x, y 2 ) = 0, so ist G(x, y 1 ) = y 1 und 

G(x, y 2 ) = y 2 , also nach (9.13) ‖y 1 − y 2 ‖ ≤ 1 2 ‖y 1 − y 2 ‖. Hieraus folgt y 1 = y 2 . 

2. Schritt: Konstruktion eines Fixpunktes 

Wir versuchen nun, eine stetige Funktion g auf V 1 zu konstruieren mit g(0) = 0 und 

F(x, g(x)) = 0, oder, dazu äquivalent, 

(9.15) 

g(0) = 0 und G(x, g(x)) = g(x) für alle x ∈ V 1 . 

122

Zusammen mit der obigen Beobachtung hätten wir dann Theorem 9.4 bewiesen. 

Wir wollen uns dazu einen geeigneten metrischen Raum F von stetigen Funktionen 

f : V 1 → V 2 mit f(0) = 0 verschaffen, welcher unter der Abbildung 

f ↦→ S(f), 

S(f)(x) := G(x, f(x)), 

invariant bleibt, d.h. S(f) ∈ F für alle f ∈ F. Die Bedingung G(x, g(x)) = g(x) 

bedeutet dann gerade, daß g ein Fixpunkt von S ist, d.h. daß 

S(g) = g 

ist. 

Es bezeichne C b (V 1 , Y ) den Raum aller stetigen, beschränkten Abbildungen f : V 1 → 

Y , versehen mit der Supremumsnorm 

‖f‖ ∞ := sup{‖f(x)‖ : x ∈ V 1 } . 

Lemma 9.5 (C b (V 1 , Y ), ‖ · ‖ ∞ ) ist vollständig. 

Beweis. Sei (f n ) n eine Cauchy-Folge in C b (V 1 , Y ). Für jedes x ∈ V 1 ist dann die Folge 

(f n (x)) n eine Cauchy-Folge in Y . Aufgrund der Vollständigkeit von Y konvergiert 

sie gegen einen Punkt f(x) ∈ Y . Wir zeigen, daß die dadurch definierte Funktion 

f : V 1 → Y in C b (V 1 , Y ) liegt und der Grenzwert der Folge (f n ) n ist. 

Sei ε > 0. Dann existiert ein n 0 ∈ N so, daß ‖f n − f m ‖ ∞ ≤ ε ist für n 0 ≤ n ≤ m. 

Für n ≥ n 0 ist damit für alle x ∈ V 1 

‖f n (x) − f(x)‖ = lim 

m→∞ ‖f n(x) − f m (x)‖ ≤ ε . 

Dies zeigt, daß f der gleichmäßige Limes der Folge (f n ) n ist. Damit ist f offenbar 

beschränkt, und nach Satz 3.26 auch stetig. 

Wir setzen nun 

F := {f ∈ C b (V 1 , Y ) : ‖f‖ ∞ ≤ 3 R und f(0) = 0} . 

4 

Q.E.D. 

Offenbar ist F eine abgeschlossene Teilmenge von C b (V 1 , Y ) und somit als metrischer 

Teilraum (welcher die Metrik 

d(f, g) := ‖f − g‖ ∞ = sup 

x∈V 1 

‖f(x) − g(x)‖ 

trägt), vollständig. Ist f ∈ F, so ist aufgrund der Stetigkeit von G auch die Funktion 

S(f) : V 1 → Y stetig, und wegen G(0, 0) = 0 ist auch S(f)(0) = G(0, f(0)) = 0. 

Ferner ist nach (9.14) ‖S(f)‖ ∞ ≤ 3 R. Somit gilt in der Tat 

4 

(9.16) 

S(F) ⊂ F . 

123

Sind f 1 , f 2 ∈ F, so folgt zusätzlich aus (9.13): für alle x ∈ V 1 ist 

‖S(f 1 )(x) − S(f 2 )(x)‖ 

= ‖G(x, f 1 (x)) − G(x, f 2 (x))‖ 

≤ 1 2 ‖f 1(x) − f 2 (x)‖, 

und folglich 

(9.17) 

d(S(f 1 ), S(f 2 )) ≤ 1 2 d(f 1, f 2 ), für alle f 1 , f 2 ∈ F . 

Die Abbildung S ist somit kontrahierend. 

Folglich gibt es nach dem Banachschen Fixpunktsatz (genau) eine Funktion g ∈ 

F ⊂ C b (V 1 , Y ) mit S(g) = g, d.h. welche (9.15) erfüllt. 

Q.E.D. 

Im Beweis des Satzes über implizite Funktion könnte man übrigens das Iterationsverfahren 

mit der Funktion f 0 := 0 starten. Als Ergänzung zu Theorem 9.4 erwähnen 

wir noch 

Lemma 9.6 Unter den Voraussetzungen von Theorem 9.4 gibt es ein ε > 0 so, daß 

F ′ y (x, y) regulär ist für alle (x, y) ∈ B ε(a) × B ε (b) ⊂ U 1 × U 2 . 

Ferner ist die Abbildung (x, y) ↦→ (F ′ y(x, y)) −1 ∈ L(Z, Y ) stetig auf B ε (a) × B ε (b). 

Beweis. Wir führen hier nur den Beweis im Falle endlich dimensionaler Räume 

X, Y und Z. Dann folgt die Aussage leicht aus der Stetigkeit der Funktion 

δ(x, y) := det(F y ′ (x, y)) . 

Da δ(a, b) ≠ 0 ist, gilt damit auch δ(x, y) ≠ 0 für alle (x, y) ∈ U 1 × U 2 , welche nahe 

genug bei (a, b) liegen. 

Der Beweis im allgemeinen Fall wird in Anhang B nachgeliefert. 

Q.E.D. 

Korollar 9.7 Unter den Voraussetzungen des Satzes über implizite Funktionen 

können die Umgebungen V 1 und V 2 in Theorem 9.4 so klein gewählt werden, daß 

die auflösende Funktion g : V 1 → V 2 sogar stetig differenzierbar ist. 

Beweis. Mittels Lemma 9.6 folgert man aus Satz 9.2 sofort, daß die Funktion g aus 

Theorem 9.4 in einer Umgebung des Punktes a differenzierbar ist. Formel (9.6) zeigt 

dann, daß g sogar stetig differenzierbar ist. 

Q.E.D. 

Aus dem Satz über implizite Funktionen erhält man nun leicht auch folgendes fundamentales 

Resultat: 

124

Theorem 9.8 (Satz über Umkehrfunktionen) Es seien X und Y Banachräume, 

a ein Punkt aus X und U eine offene Umgebung von a in X. Sei ferner 

f : U → Y eine stetig differenzierbare Funktion derart, daß f ′ (a) ∈ L(X, Y ) regulär 

ist. 

Dann gibt es eine offene Umgebung V 1 von a in U sowie eine offene Umgebung 

V 2 von b := f(a) in Y so, daß f die Menge V 1 bijektiv auf V 2 abbildet und die 

Umkehrabbildung 

g := (f| V1 ) −1 : V 2 → V 1 

stetig differenzierbar ist. Es gilt dann ferner 

g ′ (b) = (f ′ (a)) −1 . 

Beweis. Um g zu finden, müssen wir die Gleichung f(x) − y = 0 nach x auflösen. 

Wir definieren daher die Abbildung F : U × Y → Y durch 

F(x, y) := f(x) − y . 

Offenbar ist F stetig differenzierbar, und F(a, b) = 0. Ferner ist 

F ′ x (a, b) = f ′ (a) ∈ L(X, Y ) 

regulär. Wir dürfen somit den Satz über implizite Funktionen auf F anwenden. 

Danach gibt es eine offene Umgebung V 2 von b in Y sowie eine offene Umgebung V 1 

′ 

von a in U derart, daß es zu jedem y ∈ V 2 genau ein x ∈ V 1 ′ gibt mit F(x, y) = 0, und 

daß die dadurch definierte Funktion y ↦→ x = g(y) auf V 2 stetig ist. Nach Korollar 

9.7 darf man überdies annehmen, daß g : V 2 → V 1 ′ stetig differenzierbar ist. 

Für unsere Funktion f bedeutet dies insbesondere: Zu jedem y ∈ V 2 gibt es genau 

ein x ∈ V 1, ′ nämlich x = g(y), mit f(x) = y. 

Somit gilt 

V 1 := g(V 2 ) = {x ∈ V 1 ′ : f(x) ∈ V 2} = V 1 ′ ∩ f −1 (V 2 ), 

und f : V 1 → V 2 ist bijektiv mit Umkehrabbildung g : V 2 → V 1 . Da f stetig ist, ist 

zudem V 1 offen. 

Schließlich folgt aus g ◦ f(x) = x für x ∈ V 1 mit Hilfe der Kettenregel: 

d.h. insbesondere 

g ′ (f(x)) ◦ f ′ (x) = I , 

g ′ (b) = (f ′ (a)) −1 . 

Q.E.D. 

Definition. Eine bijektive stetig differenzierbare Abbildung f : U → V einer offenen 

Teilmenge U ⊂ X auf eine offene Teilmenge V ⊂ Y heiße ein C 1 - Diffeomorphismus, 

wenn die Umkehrabbildung f −1 : V → U ebenfalls stetig differenzierbar ist. 

In Theorem 9.8 ist damit die eingeschränkte Abbildung f| V1 : V 1 → V 2 ein C 1 - 

Diffeomorphismus. 

125

Anhang A: Totale Ableitungen 

höherer Ordnung 

Es seien wieder E und F zwei normierte Vektorräume über R, sowie U ⊂ E eine 

offene Teilmenge von E und f : U → F eine Abbildung. 

Ist f differenzierbar, so ist Df : U → L(E, F) eine Abbildung mit Werten im 

normierten Vektorraum L(E, F). Ist diese im Punkte x 0 ∈ U differenzierbar, so 

heiße f zweimal im Punkte x 0 differenzierbar, und die Ableitung D(Df)(x 0 ) 

wird mit D 2 f(x 0 ) oder f ′′ (x 0 ) bezeichnet. Dies ist ein Element von L(E, L(E, F)). 

Definition. Sei L 0 (E, F) = F und L n (E, F) := L(E, L n−1 (E, F)) für n ≥ 1. Eine 

Abbildung f : U → F heiße n-mal (total) differenzierbar auf U (n ≥ 1), wenn 

es für k = 0, 1, . . ., n − 1 differenzierbare Funktionen f (k) : U → L k (E, F) gibt, so 

daß gilt: 

f (k+1) = D(f (k) ), k = 0, . . .,n − 2, und f (0) = f. 

Die Abbildung f (n) := D(f (n−1) ) : E → L n (E, F) heißt die n-te Ableitung von f, 

und wird auch mit D n f bezeichnet. 

Die Abbildung f heiße im Punkte x 0 ∈ U n-mal differenzierbar, wenn es 

eine Umgebung V von x 0 in U gibt, auf der sie (n − 1)-mal differenzierbar, ist und 

zusätzlich die (n − 1)− te Ableitung f (n−1) in x 0 differenzierbar ist. 

Die Abbildung f heiße n-mal stetig differenzierbar, wenn die n-te Ableitung 

f (n) stetig auf U ist. Die Menge aller n-mal stetig differenzierbaren Abbildungen von 

U in F wird mit C n (U, F) bezeichnet. Offenbar bildet C n (U, F) einen Vektorraum 

über R. 

Definition. Eine bilineare Abbildung B : E × E → F heiße beschränkt, wenn es 

eine Konstante C > 0 gibt so, daß gilt: 

(1) 

‖B(x, y)‖ ≤ C‖x‖ ‖y‖ für alle x, y ∈ E . 

Die Norm ‖B‖ von B wird definiert durch 

‖B‖ := 

sup ‖B(x, y)‖ . 

‖x‖≤1,‖y‖≤1 

Ganz ähnlich wie für beschränkte lineare Abbildungen von E nach F zeigt man, daß 

eine bilineare Abbildung B stetig ist genau dann, wenn sie beschränkt ist, und daß 

‖B‖ die kleinste Konstante C ist, für die (1) gilt. 

126

Mit M 2 (E, F) bezeichnen wir die Menge aller beschränkten bilinearen Abbildungen 

von E × E in F. Offenbar bildet M 2 (E, F) einen R-Vektorraum. 

Ist Φ ∈ L 2 (E, F) = L(E, L(E, F)), so setzen wir 

˜Φ(x, y) := Φ(x)(y) ∈ F, x, y ∈ E . 

Offenbar ist dann ˜Φ linear in x und in y, d.h. bilinear. Ferner gilt 

‖˜Φ(x, y)‖ ≤ ‖Φ(x)‖ op ‖y‖ ≤ ‖Φ‖ op ‖x‖ ‖y‖, 

d.h. ˜Φ ist beschränkt. Somit ist ˜Φ ∈ M 2 (E, F), und es gilt: ‖˜Φ‖ ≤ ‖Φ‖ op . Umgekehrt 

gilt für x, y ∈ E 

‖Φ(x)(y)‖ = ‖˜Φ(x, y)‖ ≤ ‖˜Φ‖ ‖x‖ ‖y‖, 

woraus folgt: ‖Φ‖ op ≤ ‖Φ‖. 

Offenbar ist die Abbildung ι : Φ ↦→ ˜Φ auch linear, so daß 

ι : L 2 (E, F) → M 2 (E, F) 

eine lineare Isometrie ist. ι ist auch surjektiv, denn ist B ∈ M 2 (E, F), und setzen 

wir 

Φ(x)(y) := B(x, y), x, y ∈ E , 

so wird hierdurch ein Element Φ ∈ L(E, (E; F)) definiert mit ˜Φ = B. 

Wir erkennen also insgesamt, daß sich der normierte Raum L 2 (E, F) mittels ι 

mit dem Raum M 2 (E, F) identifizieren läßt, was wir im folgenden stets tun wollen. 

Insbesondere werden wir die zweite Ableitung f ′′ (x 0 ) von f in x 0 als eine beschränkte 

bilineare Abbildung von E × E in F betrachten, d.h. wir schreiben für 

(f ′′ (x 0 )(ξ))(η), ξ, η ∈ E, auch kurz f ′′ (x 0 )(ξ, η). 

Allgemeiner werden wir L n (E, F) mit dem Raum M n (E, F) aller beschränkten 

n-linearen Abbildungen von E n = E × · · · × E nach F identifizieren vermöge der 

Definition 

˜Φ(x 1 , x 2 , . . ., x n ) = (· · ·((Φ(x 1 ))(x 2 )) . . .(x n )) , 

d.h. wir werden die n-te Ableitung f (n) (x 0 ) von f in x 0 als eine beschränkte, 

n-lineare Abbildung von E n nach F betrachten (dabei heiße die n-lineare 

Abbildung B : E n → F beschränkt, wenn es eine Konstante C ≥ 0 gibt mit 

für alle x 1 , . . .,x n ∈ E). 

‖B(x 1 , . . .,x n )‖ ≤ C ‖x 1 ‖ · · · ‖x n ‖ 

Definition. B ∈ L 2 (E, F) ( ∼ = M 2 (E, F)) heiße symmetrisch, wenn gilt: 

B(x, y) = B(y, x) für alle x, y ∈ E . 

127

Satz 1 Sei F vollständig. Ist f : U → F zweimal stetig differenzierbar, und ist 

x 0 ∈ U, so ist f ′′ (x 0 ) eine symmetrische bilineare Abbildung. 

Beweis. Wie im Beweis des Mittelwertsatzes wollen wir den Hauptsatz der 

Differential- und Integralrechnung (für F-wertige Funktionen) verwenden. 

Sei o.B.d.A. x 0 = 0, und sei r > 0 so, daß B 2r (0) ⊂ U. Wir fixieren ξ, η ∈ B r (0). 

Dann ist ξ + tη ∈ U für alle t in einer Umgebung des Intervalls [0, 1] in R, und für 

die Abbildung g(t) = f(ξ + tη) gilt nach der Kettenregel: 

Nach dem Hauptsatz gilt folglich: 

Ebenso ist 

also 

g ′ (t) = f ′ (ξ + tη)(η), t ∈ [0, 1] . 

f(ξ + η) − f(ξ) = g(1) − g(0) = 

f(η) − f(0) = 

f(ξ + η) − f(ξ) − f(η) + f(0) = 

∫ 1 

0 

∫ 1 

0 

∫ 1 

0 

f ′ (tη)(η)dt, 

f ′ (ξ + tη)(η)dt . 

(f ′ (ξ + tη) − f ′ (tη))(η)dt . 

Für jedes z = tη betrachten wir nun die Abbildung h : s ↦→ f ′ (sξ + z)(η) von [0, 1] 

in F. h ist dann stetig differenzierbar, und aus der Kettenregel ergibt sich: 

Aus dem Hauptsatz folgt also 

d.h. 

h ′ (s) = (f ′′ (sξ + z)(ξ))(η) = f ′′ (sξ + tη)(ξ, η) . 

f ′ (ξ + tη) − f ′ (tη) = h(1) − h(0) = 

∫ 1 

0 

f ′′ (sξ + tη)(ξ, η)ds , 

(2) 

f(ξ + η) − 

= 

f(ξ) − f(η) + f(0) 

∫ 1 

(∫ 1 

) 

f ′′ (sξ + tη)(ξ, η)ds dt . 

0 0 

Berücksichtigen wir, daß die linke Seite in ξ und η symmetrisch ist, so erhalten 

wir 

∫ 1 

(∫ 1 

) ∫ 1 

(∫ 1 

) 

f ′′ (sξ + tη)(ξ, η)ds dt = f ′′ (sξ + tη)(η, ξ)dt ds . 

0 

0 

128 

0 

0

Dieselbe Formel bleibt auch für εξ und εη gültig, falls 0 < ε ≤ 1 ist, und mit der 

Bilinearität von f ′′ (sεξ + tεη) folgt: 

∫ 1 

0 

(∫ 1 

0 

) 

f ′′ (ε(sξ + tη))(ξ, η)ds dt = 

∫ 1 

0 

(∫ 1 

0 

) 

f ′′ (ε(sξ + tη))(η, ξ)dt ds 

für 0 < ε ≤ 1. 

Da f ′′ stetig ist, existiert eine Folge (ε n ) n≥1 in ]0, 1[ mit ‖f ′′ (x) − f ′′ (0)‖ ≤ 1 n für 

alle x mit ‖x‖ < ε n 2r. Es folgt insbesondere: 

‖f ′′ (ε n (sξ + tη))(ξ, η) − f ′′ (0)(ξ, η)‖ ≤ 1 ‖ξ‖ ‖η‖, 

n 

gleichmäßig in s, t ∈ [0, 1]. Infolgedessen ist 

∫ 1 

(∫ 1 

) 

f ′′ (0)(ξ, η) = f ′′ (0)(ξ, η)ds dt 

0 0 

∫ 1 

(∫ 1 

) 

= lim f ′′ (ε n (sξ + tη) (ξ, η)ds)dt 

n→∞ 

0 0 

∫ 1 

(∫ 1 

) 

= lim f ′′ (ε n (sξ + tη) (η, ξ)dt)ds 

n→∞ 

0 0 

∫ 1 

(∫ 1 

) 

= f ′′ (0)(η, ξ)dt ds 

0 

0 

= f ′′ (0)(η, ξ) . 

Mit Hilfe der Bilinearität von f ′′ (0) folgt hieraus: 

f ′′ (0)(ξ, η) = f ′′ (0)(η, ξ) für alle ξ, η ∈ E . 

Q.E.D. 

Bemerkung. Die Vollständigkeit von F wurde von uns aus technischen Gründen 

vorausgesetzt, ist jedoch nicht notwendig für die Gültigkeit des Satzes. 

Den Begriff der Richtungsableitung verallgemeinernd definieren wir nun für f ∈ 

C 1 (U, F) und beliebiges ξ ∈ E die Funktion D ξ f : U → F durch 

Nach der Kettenregel ist 

D ξ f(x) := f ′ (x)ξ, x ∈ U . 

D ξ f(x) = d dt (f(x + tξ)) | t=0= lim (f(x + tξ) − f(x)) . 

t 

t→0 

1 

129

Satz 2 (i) Für n > 1 ist D ξ eine lineare Abbildung von C n (U, F) nach C n−1 (U, F). 

(ii) Ist f ∈ C n (U, F), und sind ξ 1 , . . .,ξ n ∈ E, so ist für alle x ∈ U 

(iii) Für ξ, η ∈ E und f ∈ C 2 (U, F) ist 

f (n) (x)(ξ 1 , . . .,ξ n ) = (D ξ1 D ξ2 · · ·D ξn f)(x) . 

D ξ D η f = D η D ξ f . 

Beweis. (i) Ist f ∈ C n (U, F), so ist f ′ ∈ C n−1 (U, L(E, F)). Ferner ist für festes 

ξ ∈ E die Abbildung σ : L(E, F) → F, A ↦→ Aξ, stetig, und als lineare Abbildung 

somit sogar unendlich oft differenzierbar. Folglich ist D ξ f = σ ◦ f ′ ∈ C n−1 (U, F). 

(ii) Für n = 1 stimmt die Behauptung mit der Definition von D ξ überein. Wir 

nehmen an, daß sie für (n − 1)-te Ableitungen gilt. Dann ist insbesondere 

(D ξ2 . . .D ξn f)(x) = f (n−1) (ξ 2 , . . ., ξ n ) . 

Es ist f (n−1) ∈ C 1 (U, L n−1 (E, F)). Für feste ξ 2 , . . .,ξ n ist durch 

̺ : L n−1 (E, F) → F, B ↦→ B(ξ 2 , . . .,ξ n ) , 

eine stetige lineare Abbildung definiert, welche folglich beliebig oft differenzierbar 

ist. Nach der Kettenregel ist somit (D ξ2 . . .D ξn )f = ̺ ◦ f (n−1) stetig differenzierbar 

und 

(D ξ1 . . .D ξn )f(x) = ̺′(f (n−1) (x)) ◦ f (n) (x)(ξ 1 ) = ̺(f (n) (x)(ξ 1 )) 

= f (n) (x)(ξ 1 , ξ 2 , . . ., ξ n ) , 

da ̺′(B) = ̺ ist gemäß Bemerkung 7.4 b). 

(iii) folgt aus Satz 1 und (ii). 

Q.E.D. 

Bemerkungen. a) Aus Satz 2 folgt insbesondere, daß f (n) (x) für f ∈ C n (U, F) und 

alle x ∈ U eine symmetrische n-lineare Abbildung ist. 

b) Ein Vergleich von Formel (7.22) mit Satz 2 zeigt, daß für E = R n der Ausdruck 

f (k) (x)ξ k in (7.22) nichts anderes ist als 

(3) f (k) (x)ξ k = f (k) (x)(ξ, . . .,ξ) = (D ξ D ξ . . . D ξ f)(x), ξ ∈ R n , 

wobei auf der rechten Seite f (k) (x) die k-te totale Ableitung von f bezeichne und 

k− Faktoren ξ vertreten seien. 

Insbesondere läßt sich hier das Taylorpolynom der Ordnung p von f in a ∈ E 

auch schreiben als 

(4) T p,a f(x) := 

p∑ 

k=0 

1 

k! f(k) (a)(x − a, . . .,x − a). 

Dieser Ausdruck läßt sich allgemeiner auch für Abbildungen f ∈ C p (U, F) definieren, 

wobei U eine offene Teilmenge eines beliebigen normierten Raumes E und 

F ein beliebiger Banachraum seien, und mit ganz ähnlichem Beweis läßt sich die 

Taylorformel in Theorem 7.18 dann auch für f ∈ C p (U, F) zeigen. 

130

Anhang B: Die Gruppe der 

invertierbaren Elemente einer 

Banach-Algebra 

Es bezeichne (A, +, · , ‖·‖) eine Banach-Algebra über K, K = R oder K = C, welche 

ein Einselement e besitze. 

Definition. Ein Element a ∈ A heiße regulär oder invertierbar, wenn es ein 

Element b ∈ A gibt mit ab = ba = e. 

Dieses Inverse b ist eindeutig und wird mit a −1 bezeichnet. Man sieht leicht, 

daß die Menge A × aller invertierbaren Elemente von A eine multiplikative Gruppe 

bildet. 

Lemma 1 Sei a ∈ A mit ‖e − a‖ < 1. Dann ist a invertierbar, und es gilt: 

a −1 = 

∞∑ 

(e − a) k , mit ‖a −1 ‖ ≤ 

k=0 

1 

1 − ‖e − a‖ . 

Beweis. Wir setzen x := e − a, so daß gilt: a = e − x. Um a −1 zu definieren, 

∑ 

betrachten wir die geometrische Reihe ∞ x k . Diese konvergiert für ‖x‖ < 1 normal 

(vergl. Kapitel 2) , d.h. es gilt 

k=0 

∞∑ 

‖x k ‖ < ∞ , 

∑ 

denn es ist ‖x k ‖ ≤ ‖x‖ k , und die Reihe ∞ ‖x‖ k ist konvergent. 

k=0 

k=0 

Nach Satz 2.2 ist die Reihe somit insbesondere konvergent in A. Sei b ∈ A ihr 

∑ 

Wert, d.h. b = ∞ x k ∈ A. Aus der Norm-Ungleichung ‖y · z‖ ≤ ‖y‖ ‖z‖, y, z ∈ A, 

k=0 

leitet man ab, daß die Links- sowie die Rechtsmultiplikation y ↦→ by bzw. y ↦→ yb 

131

mit b stetige Abbildungen sind. Daher ist 

ba = 

= 

∞∑ 

∞∑ 

(x k a) = x k (e − x) 

k=0 

∞∑ 

x k − 

k=0 k=0 

k=0 

∞∑ 

x k+1 = e , 

und ähnlich zeigt man: ab = e. 

Somit ist b = a −1 . Schließlich ist 

∞∑ 

‖b‖ ≤ 

k=0 

‖x‖ k = 

1 

1 − ‖x‖ = 1 

1 − ‖e − a‖ . Q.E.D. 

Korollar 2 Die Gruppe A × der invertierbaren Elemente von A ist offen in A. 

Beweis. Sei y ∈ A × , und sei r := 1 

‖y −1 ‖ . Dann ist r > 0, und wir zeigen: B r(y) ⊂ A × . 

Sei dazu a ∈ A mit ‖a − y‖ < r. Dann ist 

‖e − y −1 a‖ = ‖y −1 (y − a)‖ ≤ ‖y −1 ‖ ‖y − a‖ < 1 r r = 1 , 

so daß nach Lemma 1 y −1 a ∈ A × ist. Da auch y ∈ A × ist, folgt: a = y(y −1 a) ∈ A × . 

Beweis von Lemma 9.6. 

Q.E.D. 

Seien also X, Y und Z Banachräume, U 1 ⊂ X und U 2 ⊂ Y offen, F : U 1 × U 2 → Z 

stetig differenzierbar und F y ′(a, b) regulär, mit (a, b) ∈ U 1 × U 2 . Wir setzen A := 

F y ′ (a, b) ∈ L(Y, Z), und behaupten: 

Ist B ∈ L(Y, Z), und ist ‖A − B‖ < 1 , so ist auch B regulär. 

‖A −1 ‖ 

Dies wird ähnlich wie Korollar 2 gezeigt. Nach Kapitel 4 ist nämlich L(Y, Y ) eine 

Banach-Algebra, mit Einselement I. Ferner ist nach Voraussetzung 

(1) ‖I − A −1 ◦ B‖ = ‖A −1 ◦ (A − B)‖ ≤ ‖A −1 ‖ ‖A − B‖ < 1 , 

und damit A −1 ◦ B ∈ L(Y, Y ) invertierbar. Ist T das Inverse zu A −1 ◦ B, so ist also 

T ◦ A −1 ∈ L(Z, Y ) ein Inverses zu B, wobei nach Lemma 1 

‖B −1 ‖ 

= ‖T ◦ A −1 ‖ ≤ ‖T ‖ ‖A −1 ‖ 

1 

≤ 

1 − ‖I − A −1 ◦ B‖ ‖A−1 ‖ . 

132

Setzen wir ̺ := 1 

2‖A −1 ‖ , so erhalten wir mit (1) für B ∈ B̺(A) ⊂ L(Y, Z): 

also 

B ist regulär, und 

‖B −1 ‖ ≤ 

1 

1 − ‖I − A −1 ◦ B‖ ‖A−1 ‖ ≤ 1 

1 − 1 ‖A −1 ‖, 

2 

(2) 

‖B −1 − A −1 ‖ 

= ‖B −1 ◦ (A − B) ◦ A −1 ‖ 

≤ 

‖B −1 ‖ ‖A −1 ‖ ‖A − B‖ 

≤ 2‖A −1 ‖ ‖A −1 ‖ ‖A − B‖ 

= 1 ‖A − B‖ . 

2̺2 

Da F ′ y stetig ist, ist (F ′ y) −1 (B̺(A)) offen in U 1 ×U 2 . Somit existiert ein ε > 0 derart, 

daß 

F ′ y (B ε(a) × B ε (b)) ⊂ B̺(A) 

ist. 

Damit ist F ′ y (x, y) regulär für (x, y) ∈ B ε(a) × B ε (b), und nach (2) gilt: 

‖(F y ′ (x, y))−1 − (F y ′ (a, b)−1 ‖ ≤ 1 ‖F y ′ (x, y) − F y ′ (a, b)‖ , 

2̺2 

so daß (F ′ y) −1 stetig in (a, b) ist. Ersetzt man schließlich (a, b) durch einen beliebigen 

Punkt (x ′ , y ′ ) ∈ B ε (a) × B ε (b), so folgt mit dem soeben Bewiesenen, daß F auch 

stetig in (x ′ , y ′ ) ist. 

Q.E.D. 

133

Vorlesungsskript (pdf): Analysis II

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?