Wahrscheinlichkeitstheorie - Abteilung fÃ¼r Mathematische Stochastik

Wahrscheinlichkeitstheorie 

Prof. Dr. H. R. Lerche 

Mathematisches Institut 

Abteilung für Mathematische Stochastik 

Universität Freiburg 

Wintersemester 2012/13 

Bitte um Mitteilung von Fehlern an: lerche@stochastik.uni-freiburg.de 

Stand: 11. Februar 2013

Inhaltsverzeichnis 

1 Der Satz von Borel 1 

2 Mengensysteme 7 

3 Additive und σ-additive Mengenfunktionen 13 

4 Fortsetzung von Maßen 19 

5 Meßbare Abbildungen und Funktionen 35 

6 Das Lebesgue-Integral 43 

7 Produktmaße 53 

8 Unabhängigkeit und 0-1-Gesetze 61 

9 Zufallsvariable, Erwartungswert und Unabhängigkeit 67 

10 Das Gesetz der Großen Zahlen 77 

11 Unendliche Produkträume 87 

12 Der Zentrale Grenzwertsatz 95 

13 Das Gesetz vom iterierten Logarithmus 103 

14 Bedingte Erwartungen und Wahrscheinlichkeiten (Teil I) 109 

I

II 

INHALTSVERZEICHNIS 

15 Maßtheoretische Überlegungen – 

der Satz von Radon-Nikodym 117 

16 Bedingte Erwartungen (Teil II) 127 

17 Martingale 137 

A Grundbegriffe der Topologie, der Satz von Tychonov 159 

Literatur 163

Kapitel 1 

Der Satz von Borel 

Folgendes Resultat ist wohlbekannt als Spezialfall des Schwachen Gesetzes 

der Großen Zahlen. 

X 1 ,X 2 ,...,X n seien Ergebnisse von n unabhängigen Würfen mit einer 

⎧ 

⎨1 mit Wahrscheinlichkeit 1 

fairen Münze X i = 

, 2 

⎩0 mit Wahrscheinlichkeit 1. 

2 

Sei (ε 1 ,...,ε n ) eine 0-1-Folge der Länge n. P (X 1 = ε 1 ,...,X n = ε n ) = 1 

( ∣∣∣ n∑ 

) 

1 

Es gilt für alle ε > 0: lim P X 

n→∞ n i − 1 ∣ 

2∣> ε = 0. 

i=1 

Dieses Resultat ist heute ca. 300 Jahre alt. Jüngeren Datums sind weiterführende 

Fragen: 

1. Gibt es eine Wahrscheinlichkeit für den unendlich langen Münzenwurf? 

( ) 

n∑ 

2. Wenn ja, gilt dann P X i = 1 = 1? 

2 

1 

lim 

n→∞ n 

Nun zur Antwort der beiden Fragen, jedoch noch ohne viel Maßtheorie. 

Die Gleichverteilung auf (0,1] 

i=1 

Ein Intervall ist gegeben durch I = (a,b], d.h. es ist links offen und rechts 

⋃ 

abgeschlossen. Sei A = n (a i ,b i ] disjunkte Vereinigung von Intervallen mit 

i=1 

A ⊂ (0,1]. Wir sagen, A ist vom Typ (∗). 

1 

2 n .

2 KAPITEL 1. DER SATZ VON BOREL 

∑ 

Wir definieren P (A) := n (b i −a i ). P heißt Gleichverteilung auf Ω. 

i=1 

Es gilt für P : Sind A,B ⊂ Ω mit A∩B = ∅ und sind A und B vom Typ 

(∗), dann ist A∪B vom Typ (∗) und es gilt P (A∪B) = P (A)+P (B). 

Definition 1.1: A ⊂ Ω heißt Nullmenge von P, falls gilt: 

Zu jedem ε > 0 existiert eine endliche oder abzählbar unendliche Folge von 

Intervallen I 1 ,I 2 ,... mit A ⊂ 

j≥1I ⋃ 

j und mit ∑ P (I j ) ≤ ε. 

j≥1 

Ist A Nullmenge, so definiert man P (A) = 0. 

Bemerkungen: 

1) Die rationalen Zahlen bilden eine Nullmenge bezüglich der Gleichverteilung. 

Denn sei r 1 ,r 2 ,r 3 ,... eine Abzählung 

( 

der rationalen 

) 

Zahlen. 

Sei ε > 0 und sei δ = ε und I 

1+ε j = r j − δj,r 2 j + δj . Dann ist 

2 

∞∑ ∑ 

P (I j ) ≤ ∞ δ j = δ = ε. 1−δ 

j=1 

j=1 

2) Mit diesem Argument sieht man auch, dass jede abzählbare Menge 

von Zahlen eine Nullmenge ist. 

Dyadische Darstellung von (0,1] 

∑ 

Sei ω ∈ (0,1]. Dann ist ω = ∞ d n (ω)2 −n = .d 1 (ω)d 2 (ω)d 3 (ω)... mit 

d n (ω) = 0 oder 1. 

n=1 

{ 

} 

n∑ 

1 

Satz 1.2 (Borel 1905): Sei M = ω ∈ (0,1] ∣ lim d 

n→∞ n i (ω) = 1 . 

2 

i=1 

Dann gilt P (M c ) = 0. 

Bemerkung: 

1. In der Zahlentheorie heißen die Zahlen, die der Menge M angehören, 

normale Zahlen. Der Satz sagt, fast alle Zahlen sind normal. 

2. Andererseits ist dies das Gesetz der Großen Zahlen für den unendlich 

langen Münzenwurf. 

∑ 

Die dyadische Darstellung von ω = ∞ d n (ω)2 −n ist im Allgemeinen nicht 

n=1 

eindeutig. Um Eindeutigkeit zu erreichen, macht man folgende Festlegung:

Ist ω = k·2 −n mit k,n ∈ N und k ungerade, so hat ω die beiden Darstellungen: 

ω = d 1 ...d n−1 1000... (d n = 1) 

= d 1 ...d n−1 0111... (d n = 0). 

Wir wählen stets die zweite Darstellung. 

1 ✻ d 1 1 ✻ 

3 

1 

2 

1 

✲ 

ω 

Wir haben dann die Folgerungen: 

a) P ({ω|d i (ω) = ε i , i = 1,...,n}) = 1 

2 n 

1 

4 

1 

2 

3 

1 

4 

b) P ({ω|d k (ω) = 1}) = 1 für jedes k ≥ 1 

2 

∏ 

c) P ({ω|d i (ω) = ε i , i = 1,...,n}) = n P ({ω|d i (ω) = ε i }) 

{ ∑ 

d) P( 

ω∣ n d i (ω) = k} ) = 

i=1 

i=1 

( n 

k) 

2 −n , 

d.h. die ∑ d i ist binomialverteilt nach b ( n, 2) 1 . 

i 

( { n∑ 

e) lim P ω∣∣ 1 d 

n→∞ n i (ω)− 1 ∣ 

2∣≥ ε} ) = 0 für alle ε > 0. 

i=1 

Beweis: Zu a): Wegen der Festlegung ( der Darstellung gilt 

∑ n 

ε 

{ω|d i (ω) = ε i , i = 1,...,n} = i 

∑ 

, n ε i 

+ 

]. 

1 

2 i 2 i 2 n i=1 i=1 

1 

Die Länge des rechten Intervalls ist aber 

2 n . 

d 2 

✲ 

ω 

Summation liefert b). c) folgt aus a) und b). d) folgt aus c) und e) aus d). 

Vorbereitend zum Beweis von Satz 1.2 brauchen wir folgende Abschätzung: 

Lemma 1.3: Sei ε > 0, dann ist 

Beweis: Für λ > 0 gilt 

∑ 

k≥n( 1 2 +ε) ( n 

k 

)2 −n ≤ ∑ 

∑ 

k≥n( 1 2 +ε) ( n 

k 

k≥n( 1 2 +ε) e λ(k−n(1 2 +ε))( n 

k 

) 

2 −n ≤ e −ε2·n . 

) 

2 −n

4 KAPITEL 1. DER SATZ VON BOREL 

= e −λnε ∑ 

k≥n( 1 2 +ε) ( n 

k 

= e −λnε ( 1 

2 eλ 2 + 

1 

2 e−λ 2 

= e −λnε e λ2 

4 

) ( ) k ( n−k 

1 1 

2 eλ 2 2) 

2 e−λ 

wegen der Binomischen Formel und der Reihendarstellung der e-Funktion. 

Man erhält dann 

∑ 

k≥n( 1 2 +ε) ( n 

k 

) n 

) n )2 −n ≤ e 

(e −λnε λ2 λ 

4 = e 2 n 

4 −λnε . 

Da diese Abschätzung für alle λ > 0 gilt, suchen wir dasjenige λ 0 > 0, für 

das die rechte Seite minimal wird. Dies ist für λ 0 = 2ε der Fall. Einsetzen 

liefert die rechte Seite von Lemma 1.3. 

Nun zum Beweis von Satz 1.2: Wählen wir ε = n −1 4 in Lemma 1.3, so 

erhalten wir 

({ 

P ω 

∣∣ 1 n 

{ 

∣ 

Sei A n = ω∣ 

n∑ 

d i (ω)− 1 }) 

∣ 

∣≥ n −1 4 ≤ 2 ∑ 

2 

i=1 

∣ 1 n 

i=1 

n∑ 

d i (ω)− 1 ∣ 

2∣≥ n −1 4 

} 

. 

Dann gilt ∑ P (A n ) ≤ 2 ∑ 

n≥1 n≥1e −√n < ∞. 

Nun ist andererseits M c ⊂ ∞ ⋃ 

Deswegen ist 

∞∑ 

n=m 

genug gewählt ist. 

n=m 

k≥ n 2 +n3 4 

A n für alle m ∈ N. 

( n 

k) 

2 −n ≤ 2e −√n . 

P (A n ) < ε zu jedem vorgegebenen ε > 0, sofern m groß 

Es bleibt zu zeigen, dass die Mengen A n disjunkte Vereinigungen von Intervallen 

sind. Dazu überlegt man, dass sich n ( ) ∑ 

di (ω)− 1 2 schreiben lässt 

i=1 

□

als 

j=1 

l∑ 

c j 1 (xj−1 ,x j ] mit Koeffizienten c j , so dass 2c j ∈ Z gilt und Zerlegungspunkten 

x k = k 

2 n , k ∈ N. Dann folgt unmittelbar, dass die Menge A n 

endliche Vereinigung von disjunkten Intervallen ist. 

5

6 KAPITEL 1. DER SATZ VON BOREL

Kapitel 2 

Mengensysteme 

Ω sei nichtleere Menge. P(Ω) bezeichne die Potenzmenge von Ω. 

Definition 2.1: A ⊂ P(Ω) heißt σ-Algebra, falls gilt: 

a) Ω ∈ A 

b) A ∈ A ⇒ A c ∈ A 

c) A n ∈ A, n = 1,2, ... ⇒ ∞ ⋃ 

Das Paar (Ω,A) heißt Meßraum. 

n=1 

A n ∈ A 

Bemerkung: {Ω,∅} ist die kleinste, P(Ω) die größte σ-Algebra. 

Lemma 2.2: Sei (Ω, A) Meßraum. Dann gilt: 

1) ∅ ∈ A 

2) A,B ∈ A ⇒ A∪B ∈ A, A\B ∈ A, 

A∩B ∈ A, A△B ∈ A 

⋂ 

3) A n ∈ A, n ∈ N ⇒ ∞ A n ∈ A 

n=1 

Beweis: 

zu 1): Ω ∈ A ⇒ Ω c = ∅ ∈ A 

zu 2): A 1 = A, A 2 = B, A n = ∅ für n ≥ 3 ⇒ ∀n ≥ 1 : A n ∈ A 

⇒ A∪B = ⋃ A n ∈ A 

n≥1 

A,B ∈ A ⇒ A c ,B c ∈ A ⇒ A c ∪B c = (A∩B) c ∈ A 

⇒ A∩B = [(A∩B) c ] c ∈ A 

7

8 KAPITEL 2. MENGENSYSTEME 

A\B = A∩B c ∈ A (ebenso B \A ∈ A) 

⇒ A△B = (A\B)∪(B \A) ∈ A 

zu 3): A n ∈ A für n ≥ 1 ⇒ A c n ∈ A für n ≥ 1 ⇒ 

( ∞ 

) 

⋃ c 

⋂ 

⇒ A c n = ∞ A n ∈ A 

n=1 n=1 

∞ ⋃ 

n=1 

A c n ∈ A 

Lemma 2.3: Sei T Indexmenge. Seien A t ⊂ P(Ω) σ-Algebren für t ∈ T. 

⋂ 

Dann gilt: A t ist σ-Algebra. 

t∈T 

Beweis: Die Eigenschaften a)-c) von Definition 2.1 gelten für alle t ∈ T, 

also auch für den Durchschnitt. 

Definition 2.4: Sei E ⊂ P(Ω).Dannheißt σ(E) := ⋂ 

die von E erzeugte σ-Algebra. 

Beispiele für σ-Algebren: 

1) Ω = N, E = {{i}|i ∈ N} ⇒ σ(E) = P(N) 

E⊂A 

A (A σ-Algebra) 

Denn: Sei A ⊂ N und A σ-Algebra mit E ⊂ A. 

Dannist {i} ∈ A für i ∈ A. ⇒ A = ⋃ {i} ∈ A ⇒ A ∈ σ(E) 

i∈A 

2) A ⊂ Ω, E = {A} ⇒ σ(E) = {Ω, ∅, A, A c } 

3) Ω 1 Menge, (Ω 2 , A 2 ) Meßraum, f : Ω 1 → Ω 2 Funktion. 

Sei E := {f −1 (A)|A ∈ A 2 } ⇒ σ(E) = E = f −1 (A 2 ) 

Nachweis von Beispiel 3): Es gilt: E ist σ-Algebra auf Ω 1 , denn: 

a) f −1 (Ω 2 ) = Ω 1 ∈ E 

b) (f −1 (A)) c = {ω ∈ Ω 1 |f (ω) ∈ A} c = {ω ∈ Ω 1 |f (ω) ∈ A c } 

= f −1 (A c ) ∈ E 

d.h. Abgeschlossenheit unter Komplementen 

c) B n ∈ E für n ≥ 1 ⇒ B n = f −1 (A n ) mit A n ∈ A 2 ∀n ≥ 1 

⇒ 

⋃ B n = ⋃ { ∣ } 

∣∣f ⋃ 

f −1 (A n ) = ω ∈ Ω 1 (ω) ∈ A n 

n≥1 

n≥1 

( ) ⋃ 

= f −1 A n ∈ E 

n≥1 

n≥1

9 

Definition 2.5: Sei R ⊂ P(Ω). R heißt Ring über Ω, wenn gilt: 

a) ∅ ∈ R 

b) A,B ∈ R ⇒ A\B ∈ R 

c) A,B ∈ R ⇒ A∪B ∈ R 

Ein Ring heißt Algebra, falls Ω ∈ R. 

Bemerkungen: 

1) Falls R Ring, so gilt: A,B ∈ R ⇒ A∩B = A\(A\B) ∈ R. 

2) Lemma 2.3 gilt für Ringe und Algebren entsprechend. 

3) Jede σ-Algebra ist ein Ring und eine Algebra. 

Beispiele für Ringe, Algebren und σ-Algebren: 

1) F = {A|A ⊂ Ω, #A endlich} ist Ring. 

Ist #Ω endlich, so ist F Algebra. 

2) Sei S 

{ 

= {(a,b]|0 ≤ a ≤ b ≤ 1}. Sei 

} 

∣ ⋃ 

R = A ⊂ (0,1] ∣A = n (a i ,b i ], (a i ,b i ] ∈ S paarweise disjunkt . 

i=1 

R ist Ring und Algebra. 

3) DieBorelsche σ-Algebraauf (0,1],genannt B(0,1],istdievon S erzeugte 

σ-Algebra, d.h. B(0,1] = σ(S). Es gilt auch σ(R) = σ(S). 

Definition 2.6: Sei Ω = R k , O k = { U |U ⊂ R k , U offen } . Die σ-Algebra 

B ( R k) = σ(O k ) heißt Borelsche σ-Algebra auf R k . 

Seien a = (a 1 ,...,a k ) und b = (b 1 ,...,b k ) aus R k . 

a ≤ b 

Def. 

⇐⇒ a i ≤ b i für i = 1,...,k 

Sei nun a ≤ b. Man definiert 

(a,b] := { x ∈ R k | a < x ≤ b } 

(a,b) := { x ∈ R k |a < x 

[a,b] := { x ∈ R k |a ≤ x ≤ b }


Beispiel (k = 2): 

✻ 

b 2 

. . . . . . . . . 

b 

a 2 

a 

. . . . . . . . . 

. 

Seien weiter C k = { A|A ⊂ R k , A abgeschlossen } , 

I k = { (a,b]|a,b ∈ R k , a ≤ b } . 

. 

. 

. 

. 

. 

a 1 b 1 

. 

. 

. 

✲ 

Lemma 2.7: B ( R k) = σ(C k ) = σ(I k ) 

Beweis: Erste Gleichung zuerst ! 

A ∈ C k ⇒ A c ∈ O k ⇒ A c ∈ B ( R k) ⇒ A = (A c ) c ∈ B ( R k) 

⇒ C k ⊂ B ( R k) und σ(C k ) ⊂ B ( R k) 

Umgekehrt sei A ∈ O k ⇒ A c ∈ C k , A c ∈ σ(C k ) ⇒ A ∈ σ(C k ). 

Somit O k ⊂ σ(C k ) und schließlich B ( R k) = σ(O k ) ⊂ σ(C k ). 

Zur zweiten Gleichung ! 

a 

∞⋂ 

k=1 

( 

a,b+ 1 ) 

n 

⇒ (a,b] ∈ B ( R k) 

Sei A ∈ O k . Dann existieren a n 

n=1 

(a n ,b n ]. 

Folglich ist A ∈ σ(I k ) und damit O k ⊂ σ(I k ) und weiter B ( R k) ⊂ σ(I k ). 

(a 1 ,b 1 ] 

. 

. 

A

11 

Definition 2.8: S ⊂ P(Ω) heißt Semiring (oder Halbring), falls gilt: 

a) ∅ ∈ S 

b) A,B ∈ S ⇒ A∩B ∈ S 

c) A,B ∈ S ⇒ Es existieren disjunkte Mengen C 1 ,...,C n ∈ S 

⋃ 

mit A\B = n C i . 

i=1 

Beispiel: I k = { (a,b]|a,b ∈ R k} ist Semiring. 

✻ 

✻ 

A∩B B A\B 

❅❅❘ 

· 

· 

✲ 

zu b) 

A 

✲ 

zu c) 

B 

✲ 

Satz 2.9: Sei S ein Semiring über Ω. Der von S erzeugte Ring ist 

{ 

} 

n⋃ ∣ ∣∣Ai 

R(S) = A = A i ∈ S, i = 1,...,n; n ∈ N, paarweise disjunkt 

i=1 

Beispiel: Der von I k erzeugte Ring ist 

{ 

} 

n⋃ ∣ ∣∣Ij 

F k = F = I j ∈ I k , j = 1,...,n; n ∈ N, paarweise disjunkt 

j=1 

genannt: der Ring der k-dimensionalen Figuren. 

Ein mögliches F ∈ F k ! 

Beweis: Bezeichne ˜R die rechte Seite in der Aussage von Satz 2.9. Dann 

ist S ⊂ ˜R ⊂ R(S). Zeige ˜R ist Ring.


Seien A,B ∈ ˜R ⋃ 

mit A = m ⋃ 

A k und B = n B l , A k disjunkt und aus S, 

k=1 

ebenso die B l . Dann ist 

n⋃ 

A\B = A\ B l = 

l=1 

( ) 

m⋃ n⋃ m⋃ ⋃ 

A k \ B l = 

l=1 k=1 l=1 k=1 j 

mit C kj paarweise disjunkt und aus S. Dies folgt aus Lemma 2.10. Damit 

ist A\B ∈ ˜R. 

Nun zur Vereinigungsstabilität: 

Seien A,B ∈ ˜R. Dann ist A ∪ B = A ∪ (B \A) und damit eine disjunkte 

⋃ 

Vereinigung. A = n A k mit A k paarweise disjunkt und aus S und B \A = 

⋃ 

k=1 

D m mit D m paarweise disjunkt und aus S aufgrund des ersten Beweisteils. 

m 

Damit ist A∪B = ⋃ A k ∪ ⋃ D m und damit aus ˜R. 

k m 

Es bleibt Lemma 2.10 zu zeigen. 

C kj 

Lemma 2.10: Sei S ein Semiring über Ω. Seien A,B 1 ,...,B n ∈ S. Dann 

⋃ 

existieren paarweise disjunkte C 1 ,...,C m aus S mit A\ n ⋃ 

B i = m C j . 

Beweis: Mit vollständiger Induktion nach n: 

Der Fall n = 1 folgt aus der Definition des Semirings. 

Der Induktionsschluss von n auf n+1: 

( ) 

n+1 

⋃ n⋃ 

nach Ind.vor. 

A\ B i = A\ B i \B n+1 = 

i=1 

i=1 

i=1 

m⋃ 

C j \B n+1 

j=1 

j=1 

mit C j ∈ S und paarweise disjunkt. 

⇒ A\ 

n+1 

⋃ 

i=1 

B i = 

m⋃ 

(C j \B n+1 ) = 

j=1 

⎛ 

n(j) m⋃ ⋃ 

⎝ 

j=1 

i=1 

¯C ji 

⎞ 

⎠, 

wobei ¯Cji alle paarweise disjunkt sind und aus S. Dies folgt, da C j und 

B n+1 aus S sind.

Kapitel 3 

Additive und σ-additive 

Mengenfunktionen 

C sei ein System von Teilmengen von Ω mit ∅ ∈ C. 

Definition 3.1: 

a) Eine Mengenfunktion µ : C → [0,∞] heißt endlich-additiv, falls 

gilt: i) µ(∅) = 0 

( n 

) 

⋃ ∑ 

ii) µ A i = n µ(A i ) fürpaarweisedisjunkte A i ∈ C 

i=1 i=1 

⋃ 

für i = 1,...,n und n A i ∈ C. 

b) Eine Mengenfunktion µ : C → [0,∞] heißt σ-additiv, falls gilt: 

i=1 

i) µ(∅) 

( 

= 0 

∞ 

) 

⋃ ∑ 

ii) µ A i = ∞ µ(A i ) für paarweise disjunkte A i ∈ C für 

i=1 i=1 

⋃ 

i = 1,...,n und ∞ A i ∈ C. 

i=1 

⋃ 

Bemerkung: Die Annahmen n A i ∈ C bzw. 

i=1 

∞⋃ 

A i ∈ C sind nötig, damit 

µ auf diesen Mengen definiert ist. Ist S z.B. ein Semiring, so sind Vereinigungen 

nicht notwendig in S. 

13 

i=1

14 KAPITEL 3. MENGENFUNKTIONEN 


a) Sei R Ring oder Algebra. µ : R → [0,∞] heißt Inhalt, falls µ 

endlich-additivist,bzw. σ-additiver Inhalt(oderauchPrämaß), 

falls µ σ-additiv ist. 

b) Sei A σ-Algebra. µ : A → [0,∞] heißt Maß, falls µ σ-additiv 

ist. µ heißt Wahrscheinlichkeitsmaß, falls µ(Ω) = 1 ist. 

Definition 3.3: Ein Maß µ auf einer σ-Algebra A heißt endlich, falls 

µ(Ω) < ∞ ist. Ein Maß µ heißt σ-endlich, falls eine Folge von Mengen 

A i ∈ A, i = 1,2,... existiert mit µ(A i ) < ∞ für alle i ≥ 1 und ⋃ A i = Ω. 

Ohne Beweis halten wir Folgendes fest: 

Satz 3.4: Sei µ Inhalt auf einem Ring R. Für A,B ∈ R gilt: 

1) µ(A∪B)+µ(A∩B) = µ(A)+µ(B) 

2) A ⊂ B ⇒ µ(A) ≤ µ(B) 

3) Ist µ(A) < ∞ und A ⊂ B, so gilt µ(B \A) = µ(B)−µ(A). 

Satz 3.5: Sei R Ring. 

1) Für einen Inhalt auf R gilt: 

i≥1 

( n 

) 

⋃ 

µ A i ≤ 

i=1 

n∑ 

µ(A i ) für A i ∈ R, i = 1,...,n. 

i=1 

2) Für einen σ-additiven Inhalt auf R gilt: 

µ(A 0 ) ≤ 

∞∑ 

∞⋃ 

µ(A i ) für A 0 ,A 1 ,A 2 ,... ∈ R mit A 0 ⊂ A i . 

i=1 

i=1 

Beweis von 2): 

Sei B i = A i \ i−1 ⋃ 

⋃ 

A j . Dann ist B i ⊂ A i und ∞ ⋃ 

A i = ∞ B i . Die B i liegen 

j=1 

in R und sind paarweise disjunkt. Es folgt wegen σ-Additivität: 

( 

µ(A 0 ) = µ A 0 ∩ ⋃ ) 

B i = ∑ µ(A 0 ∩B i ) 

i i≥1 

i=1 

i=1

15 

≤ ∑ i≥1 

µ(A 0 ∩A i ) ≤ ∑ i≥1 

µ(A i ) 

Satz 3.6: Für einen endlichen Inhalt (d.h. µ(Ω) < ∞) auf einem Ring R 

sind folgende Aussagen äquivalent: 

1) µ ist σ-additiv. 

2) Für jede Folge A n (n ≥ 1) mit A( n ∈ R und A n ⊂ A n+1 sowie 

⋃ 

⋃ 

A n ∈ R gilt: lim µ(A n ) = µ A n 

). 

n≥1 

n→∞ n≥1 

3) Für jede Folge A n (n ≥ 1) mit A( n ∈ R und A n ⊃ A n+1 sowie 

⋂ 

⋂ 

A n ∈ R gilt: lim µ(A n ) = µ A n 

). 

n≥1 

n→∞ n≥1 

4) Die Folge sei wie in 3) mit zusätzlich ⋂ A n = ∅, so gilt: 

lim µ(A n) = 0. 

n→∞ 

Bemerkung: Ist µ nicht endlich, so müssen 3) und 4) nicht gelten, auch 

n≥1 

wenn 1) und 2) gelten. Sei z.B. A n = [n,∞), µ(A n ) = ∞. 

Dann ist ⋂ A n = ∅, aber lim µ(A n ) = ∞. 

n→∞ 

n≥1 

Beweis: (Siehe auch Stochastik-Skriptum) 

Zeige zuerst 1) ⇒ 2): A n , n ≥ 1 wie in 2) angenommen. 

⋃ 

(A n+1 \A n ), n ≥ 1 sindpaarweisedisjunktmit ∞ ⋃ 

A n = A 1 ∪ ∞ (A n+1 \A n ) 

n=1 

disjunkter Vereinigung. Dann folgt aus 1): 

( ∞ 

) 

⋃ 

∞∑ 

µ A n = µ(A 1 )+ µ(A n+1 \A n ) 

n=1 

n=1 

= µ(A 1 )+ lim 

m→∞ 

m∑ 

µ(A n+1 \A n ) 

n=1 

= µ(A 1 )+ lim 

m→∞ µ(A m \A 1 ) 

= lim 

m→∞ µ(A m). 

2) ⇒ 3) folgt durch ” 

Komplementbildung“: Setze B n = A 1 \A n . 

3) ⇒ 4) ist trivial. 

Esbleibt 4) ⇒ 1)zuzeigen. Seien A 1 ,A 2 ,... aus R undpaarweisedisjunkt 

n=1


sowie ∞ ⋃ 

Da 

i=1 

∞⋃ 

i=n+1 

( 

⋃ ∞ 

A i ∈ R. Dann ist µ 

i=1 

) ( 

⋃ n 

A i = µ 

( 

i=1 

⋃ ∞ 

A i ց ∅ für n → ∞, folgt lim 

n→∞ 

µ 

∞∑ 

µ(A i ) = lim 

i=1 

n∑ 

n→∞ 

i=1 

( 

µ 

n→∞ 

= lim 

µ(A i ) = lim 

n→∞ 

µ 

( 

⋃ ∞ 

A i 

)+µ A i 

). 

i=n+1 

) 

A i = 0. Damit folgt 

i=n+1 

( 

⋃ ∞ ( 

⋃ ∞ 

A i 

)−µ 

i=1 

( ∞ 

) 

⋃ 

= µ A i . 

i=1 

( 

⋃ n 

) 

A i 

i=n+1 

i=1 

A i 

) ) 

Lemma 3.7: Seien (a k ,b k ], k = 1,2,... nichtleere disjunkte Intervalle mit 

∞⋃ 

∞∑ 

(a k ,b k ] ⊂ (a,b]. Dann ist (G(b k )−G(a k )) ≤ G(b)−G(a) für G 

k=1 

monoton wachsend. 

k=1 

Bezeichnung: G : R → R heißt rechtsstetig in x, falls G(x) = G(x+) 

ist mit G(x+) = lim G(y). ( y ց x :⇔ y → x, y > x ) 

y ց x 

Lemma 3.8: Sei G monoton wachsend und rechtsstetig auf R. Seien 

∞⋃ 

(a k ,b k ], k = 1,2,... Intervalle mit (a k ,b k ] ⊃ (a,b]. 

k=1 

∑ 

Dann ist G(b)−G(a) ≤ ∞ (G(b k )−G(a k )). 

Beweis: 

k=1 

Wir zeigen zunächst die Aussage für endliche Überdeckungen mit vollständiger 

Induktion. Für n = 1 ist die Aussage trivialerweise richtig. 

Angenommen sie ist richtig für n − 1 Intervalle und (a,b] ⊂ n ⋃ 

k=1 

(a k ,b k ]. 

O.B.d.A. Sei a n 

Aussage gilt trivialerweise. Ist a < a n , so gilt 

(a,a n ]∪(a n ,b] ⊂ (a,a n ]∪(a n ,b n ] ⊂ 

n⋃ 

(a k ,b k ]. 

k=1

Bilde nun die Differenz mit (a n ,b n ] auf beiden Seiten. Dann folgt 

(a,a n ] ⊂ n−1 ⋃ 

(a k ,b k ] und nach Induktionsvoraussetzung ist 

k=1 

∑n−1 

G(a n )−G(a) ≤ (G(b k )−G(a k )) 

und weiter 

G(b)−G(a) ≤ G(a n )−G(a)+G(b n )−G(a n ) 

n∑ 

≤ (G(b k )−G(a k )). 

k=1 

k=1 

⋃ 

Sei nun (a,b] ⊂ n (a k ,b k ]. Sei ε > 0. Wegen der Rechtsstetigkeit von G 

k=1 

gibt es δ k > 0, so daß G(b k + δ k ) < G(b k ) + ε gibt und ein δ > 0 mit 

2 k 

G(a+δ) ≤ G(a)+ε. Das kompakte Intervall [a+δ,b]wir überdeckt durch 

n⋃ 

n⋃ 

(a k ,b k +δ k ) ⊂ (a k ,b k +δ k ] 

k=1 k=1 

Es folgt 

G(b)−G(a)−ε ≤ G(b)−G(a+δ) 

n∑ 

≤ (G(b k +δ k )−G(a k )) 

≤ 

≤ 

Da ε beliebig ist, folgt 

k=1 

n∑ (G(b k )−G(a k )+ ε ) 

2 k 

k=1 

∞∑ 

(G(b k )−G(a k ))+ε. 

k=1 

17 

G(b)−G(a) ≤ 

∞∑ 

(G(b k )−G(a k )). 

k=1 

□ 

Sei S = {(a,b] |a,b ∈ R} mit der Konvention (a,b] = ∅, falls a ≥ b. S


ist Semiring. Sei G : R → R monoton wachsend und rechtsstetig auf R. 

Definiere µ G ((a,b]) := G(b)−G(a). Dann liefern Lemmata 3.7 und 3.8, daß 

µ G σ-additiv auf S ist. µ G läßt sich aber eindeutig auf R(S), dem von 

⋃ 

S erzeugten Ring, fortsetzen. Denn sei A ∈ R(S), so gilt A = n I j mit 

∑ 

I j = (a j ,b j ] ∈ S. Setze ¯µ G (A) := n µ G (I j ). 

j=1 

Satz 3.9: Sei G monoton wachsende und rechtsstetige Funktion auf R. µ G 

ist σ-additiv auf S und besitzt eine eindeutige Fortsetzung ¯µ G zu einem 

σ-additiven Inhalt auf R(S). 

Beweis: Kombiniere die Lemmata 3.7 und 3.8 mit Aufgabe 7. 

Beispiel: G(x) = x liefert µ G = λ, das ”Längenmaß” auf R. 

j=1 

Bemerkung 3.10: Ist µ σ-additiver Inhalt auf R(S), so wird durch 

{ µ((0,x]) für x ≥ 0 

F (x) := 

−µ((x,0]) für x < 0 

eine monoton wachsende (auf R) rechtsstetige Funktion definiert. 

Für F gilt µ F = µ. 

DENN: Monotonie ist trivial. 

Rechtsstetigkeit: Sei a > 0, b n > a. Dann gilt 

F (b n )−F (a) = µ((0,b n ])−µ((0,a]) = µ((a,b n ]) → 0 für b n → a. 

Sei a < 0 und a 

F (b n )−F (a) = −[µ((b n ,0])−µ((a,0])] = µ((a,0])−µ((b n ,0]) 

= µ((a,b n ]) → 0 für b n → a. 

Bemerkung 3.11: Satz 3.9 und Bemerkung 3.10 besagen, dass σ-additive 

Inhalte auf R(S) und monoton wachsende, rechtsstetige Funktionen auf R 

in eineindeutiger Beziehung stehen.

Kapitel 4 

Fortsetzung von Maßen 

µ sei ein σ-additiver Inhalt auf einem Ring R. 

Wie konstruiert man ein Maß ˜µ auf σ(R), so dass ˜µ| R = µ ist? 

Dabei ist σ(R) die von R erzeugte σ-Algebra. 

Zunächst definiert man, ausgehend von µ auf R, ein äußeres Maß. 

Definition 4.1: Ein äußeres Maß µ ∗ ist eine Abbildung 

µ ∗ : P(Ω) → [0,∞] mit den Eigenschaften 

a) µ ∗ (∅) = 0 

b) A ⊂ B ⊂ Ω ⇒ µ ∗ (A) ≤ µ ∗ (B) 

c) A n , n ≥ 1, A n ⊂ Ω ⇒ µ ∗ ( ∞ ⋃ 

n=1 

) 

∑ 

A n ≤ ∞ µ ∗ (A n ) 

Bemerkung: Aus b) und c) folgt die zu diesen äquivalente Bedingung: 

Gilt A ⊂ 

∞⋃ 

A i , so ist µ ∗ (A) ≤ 

i=1 

n=1 

∞∑ 

µ ∗ (A i ). 

1. Schritt: Wir definieren zu µ { auf R ein äußeres Maß wie folgt: 

∑ ∞ } 

Für A ⊂ Ω sei µ ∗ ∣ ⋃ 

(A) := inf µ(E i ) ∣E i ∈ R, A ⊂ ∞ E i 

i=1 

i=1 

oder = ∞, falls das Infimum von ∅ gebildet wird. 

Wir werden zeigen: µ ∗ | R = µ. 

2. Schritt:Wirdefiniereneineσ-AlgebraA ∗ ⊂ P(Ω),aufderdieEinschränkung 

von µ ∗ σ-additiv ist! 

19 

i=1

20 KAPITEL 4. FORTSETZUNG VON MASSEN 

Definition 4.2: Sei µ ∗ äußeres Maß auf der Menge Ω. Eine Menge A ⊂ Ω 

heißt µ ∗ -Zerleger, wenn für jede Menge M ⊂ Ω gilt 

µ ∗ (M) ≥ µ ∗ (M ∩A)+µ ∗ (M ∩A c ). 

Man kann zeigen, das System A ∗ aller µ ∗ -Zerleger von Ω ist eine σ-Algebra 

und µ ∗ ist ein Maß auf A ∗ . 

Weiterhin gilt σ(R) ⊂ A ∗ , da R ⊂ A ∗ . Daher ist ˜µ = µ ∗ | σ(R) ein Maß auf 

σ(R), das µ von R fortsetzt. 

Bemerkung: ”Endliche Überdeckungen” reichen in der Definition von µ ∗ 

nicht, wie folgendes Beispiel zeigt. Definiere für A ∈ P(Ω) 

{ n∑ 

} 

µ + ∣ 

n⋃ 

(A) = inf µ(E i ) ∣E i ∈ R, A ⊂ E i 

i=1 

i=1 

= inf{µ(B) |B ∈ R, A ⊂ B}, 

da R stabil gegen endliche Vereinigungen ist. µ + ist aber im Allgemeinen 

kein äußeres Maß. Wählt man nämlich für µ + den σ-additiven Inhalt λ 

auf dem von den halboffenen Intervallen erzeugten Ring und setzt man A = 

Q∩(0,1], so gilt µ + (A) = 1. Jedoch ist µ + ({q}) = 0 für q ∈ Q. 

⇒ 0 = ∑ 

µ + ({q}) < µ + (Q∩[0,1]) = 1 

q∈Q∩[0,1] 

Damit ist die Eigenschaft c) des äußeren Maßes nicht erfüllt. 

Lemma 4.3: µ sei σ-additiver Inhalt auf dem Ring R. Dann ist µ ∗ äußeres 

Maß. 

Beweis: Lediglich c) in Definition 4.1 ist von Interesse. 

Seien A i ⊂ Ω, i = 1,2,... mit µ ∗ (A i ) < ∞ für alle i. Sei ε > 0 beliebig. 

Es existieren E ij ∈ R mit ⋃ E ij ⊃ A i und ∑ µ(E ij ) ≤ µ ∗ (A i ) + ε · 2 −i . 

j 

j 

⋃ 

Weiter ist 

i=1A ∞ i ⊂ ⋃ E ij . 

i,j 

( ) ⋃ 

µ ∗ A i ≤ ∑ µ(E ij ) ≤ ∑ ∞∑ 

µ ∗ (A i )+ ε·2 −i 

i≥1 i,j i≥1 i=1 

= ∑ µ ∗ (A i )+ε ⇒ c) 

i≥1

Lemma 4.4: Die Einschränkung des äußeren Maßes µ ∗ auf R stimmt mit 

µ überein. 

Beweis: Es gilt µ ∗ (A) ≤ µ(A), denn A überdeckt sich selbst und wird 

damit bei der Infimumsbildung berücksichtigt. 

Zum Beweis der umgekehrten Ungleichung seien E i ∈ R mit A ⊂ ∞ ⋃ 

i=1 

21 

E i , mit 

∑ 

A ∈ R.NachSatz3.5,Teil2giltµ(A) ≤ ∞ µ(E i )unddamitµ(A) ≤ µ ∗ (A). 

Satz 4.5: Sei A ∗ das System der µ ∗ -Zerleger. Dann ist A ∗ σ-Algebra. 

Auf A ∗ ist dann µ ∗ ein Maß. Außerdem enthält A ∗ alle µ ∗ -Nullmengen, 

das sind Mengen A mit µ ∗ (A) = 0. 

Beweis: 

1) Zeige: A ∗ ist σ-Algebra. 

a) Ω ∈ A ∗ , da für M ⊂ Ω gilt µ ∗ (M ∩Ω)+µ ∗ (M \Ω) = µ ∗ (M) 

b) A c ∈ A ∗ , falls A ∈ A ∗ , denn die Aussage ist symmetrisch in A und 

i=1 

A c : µ ∗ (M ∩A c )+µ ∗ (M ∩A) ≤ µ ∗ (M) 

c) A,B ∈ A ∗ , dann ist A ∪ B ∈ A ∗ . Sei wieder M ⊂ Ω. Wegen 

Monotonie und Subadditivität folgt 

µ ∗ (M ∩(A∪B))+µ ∗ (M \(A∪B)) 

Damit ist A ∗ Algebra. 

≤ µ ∗ (M ∩A)+µ ∗ ((M \A)∩B)+µ ∗ ((M \A)\B) 

≤ µ ∗ (M ∩A)+µ ∗ (M \A), da B ∈ A ∗ 

≤ µ ∗ (M), da A ∈ A ∗ .


d) Sei A i , i ≥ 1 disjunkte Folge in A ∗ . Dann gilt für M ⊂ Ω 

µ ∗ (M ∩ 

) 

k⋃ 

A i ≥ 

i=1 

≥ µ ∗ ((M ∩ 

) ) 

k⋃ 

A i ∩A k +µ 

((M ∗ ∩ 

i=1 

= µ ∗ (M ∩A k )+µ ∗ (M ∩ 

. 

≥ 

k∑ 

µ ∗ (M ∩A i ). 

i=1 

k−1 

⋃ 

i=1 

A i 

) 

) ) 

k⋃ 

A i \A k 

⋃ 

Sei A = ∞ ⋃ 

A i und B n = n A i , so ist B n ∈ A ∗ und es gilt wegen 

i=1 

i=1 

Monotonie von µ ∗ und dem gerade Gezeigten für alle n ≥ 1 

Damit folgt weiter 

i=1 

µ ∗ (M) ≥ µ ∗ (M ∩B n )+µ ∗ (M \B n ) 

n∑ 

= µ ∗ (M ∩A i )+µ ∗ (M \B n ) 

≥ 

µ ∗ (M) ≥ 

i=1 

n∑ 

µ ∗ (M ∩A i )+µ ∗ (M \A). 

i=1 

∞∑ 

µ ∗ (M ∩A i )+µ ∗ (M \A) 

i=1 

≥ µ ∗ (M ∩A)+µ ∗ (M \A). 

Die letzte Ungleichung folgt, da µ ∗ äußeres Maß ist. 

Damit ist A ∈ A ∗ . 

Ist nun A i , i ≥ 1 eine beliebige Folge aus A ∗ , so definiert man 

C i = A i \(A 1 ∪...∪A i−1 ) für i ≥ 1. Es gilt C i ∈ A ∗ und ⋃ C i ∈ 

A ∗ , da die C i paarweise disjunkt sind. Aber 

i≥1 

∞⋃ ⋃ 

A i = ∞ C i ∈ A ∗ . 

i=1 

i=1

23 

2) Zeige: µ ∗ ist σ-additiv auf A ∗ . 

⋃ 

Sei A i , i ≥ 1 disjunkte Folge aus A ∗ . Sei M ⊂ Ω und sei A = ∞ A i . 

Dann gilt nach 1) 

∞∑ 

µ ∗ (M) ≥ µ ∗ (M ∩A i )+µ ∗ (M ∩A c ) 

i=1 

≥ µ ∗ (M ∩A)+µ ∗ (M ∩A c ). 

Wähle nun M = ⋃ 

∑ 

A i = A. Dann ist µ ∗ (A) ≥ ∞ µ ∗ (A i ) ≥ µ ∗ (A) 

i≥1 

i=1 

( ) ⋃ ∑ 

und damit µ ∗ A i = ∞ µ ∗ (A i ). 

i≥1 

i=1 

3) Zeige: Nullmengeneigenschaft 

Sei A ⊂ Ω mit µ ∗ (A) = 0. Sei M ⊂ Ω. 

Dann ist M ∩A ⊂ A und wegen Monotonie µ ∗ (M ∩A) = 0. Damit gilt 

µ ∗ (M) ≥ µ ∗ (M ∩A c )+0 = µ ∗ (M ∩A c )+µ ∗ (M ∩A). 

i=1 

Damit ist A Zerleger und liegt in A ∗ . 

□ 

Wir können nun den Maßfortsetzungssatz formulieren. 

Satz 4.6 (Maßfortsetzungssatz): Sei µ σ-additiverInhaltaufdemRing 

R. Dann gibt es ein Maß ˜µ auf σ(R), der von R erzeugten σ-Algebra, das 

auf R mit µ übereinstimmt (d.h. ˜µ| R = µ). 

Beweis: Sei µ ∗ das von µ und R herrührende äußere Maß. Wir zeigen, 

dass R ⊂ A ∗ . Dann gilt σ(R) ⊂ A ∗ . Definiere ˜µ := µ ∗ | σ(R) . Dann ist ˜µ 

Maß auf σ(R), da µ ∗ Maß auf A ∗ ist nach Satz 4.5. 

Sei A ∈ R und M ⊂ Ω. Wir zeigen die Zerlegungseigenschaft für A. 

Sei M ⊂ Ω und sei µ ∗ (M) < ∞. Sei B n , n ≥ 1 eine Folge in R mit 

⋃ 

B n ⊃ M und µ ∗ (B n ) < ∞. Nun gilt für alle n ≥ 1 

n≥1 

µ(B n ) = µ(B n ∩A)+µ(B n ∩A c ).


Dann folgt 

∞∑ ∑ 

µ(B n ) = ∞ ∑ 

µ(B n ∩A)+ ∞ µ(B n ∩A c ). 

n=1 

Nun gilt: M ∩A ⊂ ∞ ⋃ 

n=1 

n=1 

n=1 

(B n ∩A), M ∩A c ⊂ ∞ ⋃ 

n=1 

Dabei sind B n ∩A und B n ∩A c in R. Damit folgt 

(B n ∩A c ). 

∞∑ 

µ(B n ) ≥ µ ∗ (M ∩A)+µ ∗ (M ∩A c ). 

n=1 

Schließlich folgt µ ∗ (M) ≥ µ ∗ (M ∩A)+µ ∗ (M ∩A c ). 

Damit ist A ∈ A ∗ und R ⊂ A ∗ . 

Bemerkung:ImAllgemeinenstimmen diebeiden σ-Algebra σ(R) und A ∗ 

nicht überein. Siehe dazu auch Satz 4.13. 

Zur Eindeutigkeit der Fortsetzung: 

Zunächst ein Beispiel dafür, dass zwei Maße µ 1 und µ 2 auf einem Ring R 

übereinstimmen, aber nicht auf σ(R). 

Seien Ω = Q, die Menge { der rationalen Zahlen, A = P (Ω) = σ(R) mit dem 

⋃ n } 

∣ 

Ring R und R = (a i ,b i ]∩Q∣a i 

i=1 { 

i·#A falls A endlich, 

µ i (A) := 

∞ falls A unendlich. 

Dann gilt µ 2 (A) = 2µ 1 (A). Aber µ i (A) = ∞ auf R. 

Damit gilt µ 1 = µ 2 auf R und µ 1 ≠ µ 2 auf A = σ(R), da alle endlichen 

Mengen in A liegen. 

□ 

Definition 4.7: Sei E ⊂ P(Ω).EineMengenfunktion µ : E → [0,∞] heißt 

σ-endlichauf E,fallsA n ∈ E, n ≥ 1existierenmit A n ⊂ A n+1 , µ(A n ) < ∞ 

für n ≥ 1 und ⋃ A n = Ω. 

n≥1 

Nun sind im vorangegangenen Beispiel die µ i nicht σ-endlich auf R und 

etwas pathologisch. Anders ist es, wenn das Maß σ-endlich ist. 

Satz 4.8 (Eindeutigkeitssatz): Sei µ ein σ-endlicher, σ-additiver Inhalt 

auf einem Ring R. Dann ist die Fortsetzung von µ zu einem Maß auf σ(R)

25 

eindeutig. 

Wesentlich dabei ist die Durchschnittsstabilität von R. 

Definition 4.9: Ein Mengensystem E heißt durchschnittsstabil, falls 

für A,B ∈ E gilt, dass auch A∩B ∈ E ist. 

Satz 4.10: Seien µ i , i = 1,2 Maße auf einer σ-Algebra A über Ω. Sei E 

ein durchschnittsstabiles Erzeugendensystem von A. Es gelte µ 1 = µ 2 auf 

E und µ sei σ-endlich auf E. Dann ist µ 1 = µ 2 auf A. 

Den Beweis dieses Satzes führt man mit Dynkin-Systemen. 

Definition 4.11: Ein Mengensystem D ⊂ P(Ω) heißt Dynkin-System, 

falls gilt: a) Ω ∈ D, 

b) A,B ∈ D mit A ⊂ B ⇒ B \A ∈ D, 

c) für jede disjunkte Folge (A n ) n≥1 

mit A n ∈ D: 

⋃ 

n≥1 

A n ∈ D 

Lemma 4.12: 

1) Jedes durchschnittsstabile Dynkin-System D ist eine σ-Algebra. 

2) Ist E durchschnittsstabiles Erzeugendensystem, so ist σ(E) = D(E), 

d.h. die von E erzeugte σ-Algebra ist gleich dem von E erzeugten 

Dynkin-System. 

Beweis: 

Zu 1): Zeige: D enthält endliche Vereinigungen. 

Nach Voraussetzung ist A∩B ∈ D, falls A,B ∈ D. Dann ist B\A∩B ∈ D 

und es gilt A∩(B \A∩B) = ∅. Folglich ist A∪B = A∪(B \A∩B) ∈ D. 

Nun zu abzählbaren Vereinigungen: 

A i ∈ D für i = 1,...,k. Dann ist A 1 ∪ A 2 ∪ ... ∪ A k ∈ D und damit 

B i = A i \ ((A 1 ∪A 2 ∪...∪A i−1 )∩A i ) ∈ D. Die B i , i ≥ 1 sind paarweise 

disjunkt und in D und es gilt ⋃ B i = ⋃ A i . 

Zu 2): σ(E) ist Dynkin-System ⇒ D(E) ⊂ σ(E). 

i≥1 

i≥1


Wegen 1) genügt es zu zeigen, dass D(E) durchschnittsstabil ist. 

Für A ⊂ Ω sei D A = {B ⊂ Ω|B ∩A ∈ D(E)}. Es gilt: D A ist Dynkin- 

System. Gilt D(E) ⊂ D A für alle A ∈ D(E), so folgt, D(E) ist durchschnittsstabil. 

a) Dynkin-System: 

B ⊂ B ′ , B,B ′ ∈ D A 

⇒ (B ′ \B)∩A = B ′ ∩A\B ∩A ∈ D(E) 

⇒ B ′ \B ∈ D A 

B i , i ≥ 1, B i ∈ D A und paarweise disjunkt ⇒ B i ∩A ∈ D(E) 

⇒ D(E) ∋ ⋃ i 

(B i ∩A) = ⋃ i 

B i ∩A 

⇒ ⋃ i 

B i ∈ D A 

b) Zeige: E ⊂ D A für A ∈ D(E). 

Sei E ∈ E. Da E durchschnittsstabil ist, gilt E ⊂ D E und damit 

D(E) ⊂ D E . D.h. für A ∈ D(E) gilt A ∈ D E , d.h. A∩E ∈ D(E). 

Dies bedeutet E ∈ D A . Damit gilt E ⊂ D A und damit D(E) ⊂ D A . 

Teil1)liefertnundenRest. 

□ 

Nun lässt sich Satz 4.10 beweisen. Dies sind aber die Übungen 9 und 10 

Man zeigt, D E = {A ∈ A|µ 1 (A∩E) = µ 2 (A∩E)} ist Dynkin-System und 

D E ⊃ D(E) = σ(E) = A für E ∈ E. 

Der nächste Satz besagt, dass sich σ(R) und A ∗ lediglich um Nullmengen 

unterscheiden. Tatsächlich gibt es aber von den Nullmengen sehr viele, sodass 

sich die Mächtigkeiten von σ(R) und A ∗ beträchtlich unterscheiden. 

Wer dies genauer erkunden will, sei auf ”Hewitt-Stromberg: Real and Abstract 

Analysis” (S. 132-134) verwiesen. 

Zu einem Ring R seien nun 

{ 

∣ 

R σ := A∣A = 

i≥1A ⋃ } 

i , A i ∈ R , 

R σδ := 

{ 

B 

∣ 

∣B = ⋂ } 

B i , B i ∈ R σ . 

i≥1

27 

Satz 4.13: Sei µ σ-endlicher, σ-additiver Inhalt auf R und µ ∗ das äußere 

Maß zu µ. Dann gilt B ∈ A ∗ genau dann, wenn es ein A ∈ R σδ und eine 

Menge N mit µ ∗ (N) = 0 gibt, sodass B = A\N gilt. 

Beweis: Für A ∈ R σδ gilt, dass A ∈ σ(R) ⊂ A ∗ . Außerdem ist N mit 

µ ∗ (N) = 0 in A ∗ . Damit folgt A\N = A∩N c ∈ A ∗ . 

Umgekehrt sei B ∈ A ∗ . Seien Ω i , i ≥ 1 disjunkt mit Ω i ∈ R und µ(Ω i ) < ∞ 

⋃ 

sowie Ω = ∞ Ω i . Seien B i = B ∩Ω i . Seien A n i ∈ R σ mit A n i ⊃ B i und 

i=1 

Seien A n = ⋃ 

A n i 

i≥1 

µ ∗ (A n i) ≤ µ ∗ (B i )+(n2 i ) −1 . 

⇒ B ⊂ A n und A n \B ⊂ ⋃ (A n i \B i) 

Dann folgt µ ∗ (A n \B) ≤ 

i≥1µ ∑ ∗ (A n i \B i) ≤ 1. 

n 

Da A n ∈ R σ , folgt A = ⋂ A n ∈ R σδ ⇒ A ⊃ B. 

n≥1 

Aber N := A\B ⊂ A n \B für alle n ≥ 1. 

⇒ µ ∗ (N) ≤ limµ ∗ (A n \B) = 0 

□ 

n 

Bemerkung: Nach Satz 4.6 enthält A ∗ alle µ ∗ -Nullmengen. Damit ist der 

Maßraum (Ω,A ∗ ,µ ∗ ) vollständig in folgendem Sinn: 

Ein Maßraum (Ω,A,µ) heißt vollständig, wenn jede Teilmenge einer µ- 

Nullmenge zu A gehört. 

Lebesgue-Stieltjes-Maße 

Wir wissen bereits aus Kapitel 3, dass σ-additive Inhalte und monotone, 

rechtsstetige Funktionen von R nach R in eineindeutiger Beziehung zueinander 

stehen. 

Sprechweise: Eine monotone, rechtsstetige Funktion von R nach R heißt 

maßerzeugend. 

Satz 4.14: Sei G maßerzeugend. Dann gibt es genau ein σ-endliches Maß 

µ auf (R,B), für das 

(∗) µ((a,b]) = G(b)−G(a) für a 

B bezeichne die Borelsche σ-Algebra auf R. 

Beweis: Zu G maßerzeugend definiere µ((a,b]) = G(b)−G(a). 

i≥1


µ ist auf I = {(a,b] |a < b, a,b ∈ R} definiert und σ-additiv nach Lemma 

3.7 und 3.8. Nach Satz 3.9 besitzt µ eine eindeutige Fortsetzung auf R(I) 

und wegen Satz 4.6 eine Maßfortsetzung auf B = σ(I). µ ist σ-endlich auf 

I, da µ((−n,n]) = G(n)−G(−n) < ∞ ist und ⋃ (−n,n] = R. Damit ist 

µ nach Satz 4.8 eindeutig bestimmt. 

n≥1 

□ 

Definition 4.15: F maßerzeugendmit lim F (x) = 0und lim F (x) = 1 

x→−∞ x→∞ 

heißt Verteilungsfunktion. 

Korollar 4.16 (Korrespondenzsatz): Zu jeder Verteilungsfunktion F 

gibt es genau ein Wahrscheinlichkeitsmaß P auf (R,B) mit 

(+) P ((−∞,x]) = F (x) für alle x ∈ R. 

Umgekehrt wird zu jedem Maß P auf (R,B) durch (+) eine Verteilungsfunktion 

zugeordnet. 

Beweis: Sei F Verteilungsfunktion und P ((a,b]) := F (b) −F (a). Wegen 

Satz 4.14 existiert genau ein Wahrscheinlichkeitsmaß P mit Eigenschaft (∗). 

Wegen σ-Stetigkeit gilt 

P ((−∞,b]) = lim 

a→−∞ P ((a,b]) 

= F (b)− lim 

a→−∞ F (a) 

= F (b) und damit (+). 

Wir folgern nun die Existenz des Lebesgue-Maßes auf R k . 

□ 

Satz 4.17: Es gibt genau ein Maß λ k auf ( R k ,B ( R k)) , wobei B ( R k) die 

Borelsche σ-Algebra auf R k ist, mit der Eigenschaft 

(∗) λ k ((a,b]) := 

k∏ 

(b i −a i ), 

i=1

29 

wobei a = (a 1 ,...,a k ), b = (b 1 ,...,b k ). λ k heißt Lebesgue-Maß. Auch 

definieren wir 

λ k ([a,b]) := lim 

ε→0 

λ((a−ε,b]). 

Beweis: Mittels (∗) wird auf I k = { (a,b] |a,b ∈ R k , a 

additive Mengenfunktion erklärt, die sich eindeutig auf den von I k erzeugten 

Ring fortsetzen lässt. I k ist durchschnittsstabil und erzeugt B ( R k) . Außerdem 

ist λ k σ-endlich auf I k . Damit gibt es nach Satz 4.6 und Satz 4.8 eine 

eindeutige Fortsetzung von λ k zu einem Maß auf σ(I k ). Diesist aber B ( R k) . 

Warum ist λ k σ-additiv auf I k ? 

Dies liegt daran, dass gilt λ k ([a+ε n ,b]) ր λ k ((a,b]) für alle a,b ∈ R k und 

ε n , n ≥ 1 Nullfolge im R k . 

DieDetailsdazufolgenspäterimallgemeinerenRahmenunterdemStichwort 

“Innere Regularität”. 

Satz 4.18 (Eigenschaften von λ k ): 

1) Sei B ∈ B ( R k) und sei a ∈ R k . Dann ist B + a ∈ B ( R k) mit 

B +a = {b+a | b ∈ B} . 

2) λ k ist translationsinvariant. Das heißt, λ k (B) = λ k (B +a) für alle 

a ∈ R k und B ∈ B ( R k) . 

3) λ k ist das einzige translationsinvariante Maß auf B ( R k) mit 

λ k ((0,1]) = 1. Dabei bedeutet ′′ 0 ′′ = (0,0,...,0) und ′′ 1 ′′ = 

(1,1,...,1). 

Beweis: 

Zu 1): Sei D a = { B ∈ B ( R k) |B +a ∈ B ( R k)} . 

I k ⊂ D a , denn (b,c] + a = (a+b,a+c]. D a ist außerdem σ-Algebra:


a) Ω = R k ∈ D a , 

b) A ∈ D a ⇒ A c ∈ D a , 

denn A ∈ D a ⇒ A+a ∈ B ( R k) ⇒ (A+a) c ∈ B ( R k) 

da x ∈ (A+a) c 

⇔ x ∉ A+a ⇔ x−a ∉ A 

⇔ x−a ∈ A c ⇔ x ∈ A c +a 

Damit ist (A+a) c = A c +a, woraus A c ∈ D a folgt. 

c) A n ∈ D a , n ≥ 1 ⇒ A n +a ∈ B ( R k) für alle n ≥ 1. 

⇒ ⋃ (A n +a) ∈ B ( R k) 

n≥1 ( ) ⋃ 

Dies bedeutet A n +a ∈ B ( R k) 

n≥1 

⇒ ⋃ A n ∈ D a ⇒ D a ⊃ B ( R k) . 

n≥1 

Zu 2): Sei a ∈ R k . 

Seien µ 1 (B) = λ k (B), µ 2 (B) = λ k (B +a) für B ∈ B ( R k) . 

µ 1 und µ 2 sind Maße auf B ( R k) mit µ 1 | Ik = µ 2 | Ik , da 

λ k ((b+a,c+a]) = 

k∏ 

(c i −b i ) = λ k ((b,c]). 

i=1 

I k ist durchschnittsstabiles σ-endliches Erzeugendensystem. Nach Satz 4.10 

folgt Eindeutigkeit, d.h. µ 1 = µ 2 . 

Zu 3): Zeige, ist µ translationsinvariant auf R k mit α := µ((0,1]) < ∞, so 

ist µ = αλ k . Die Beweisidee dazu lautet: 

Sei: W n = (0,a n ] mit 0 = (0,...,0) und a n = ( 1, 1,..., 1 ). Dann gilt 

n n n 

µ(W n ) = α n k . 

Denn W läßt sich aus n k Würfeln der Form (r,r + a n ] darstellen, wobei 

r = (̺1,...,̺k) ∈ R k ist mit ̺i ∈ {0, 1 n−1 

,..., } := G n n n. Das heißt 

W = ⋃ 

(r,r +a n ]. 

r∈G n 

Aber wegen Translationsinvarianz gilt µ((r,r + a n ]) = µ(W n ). Damit folgt 

α = n k µ(W n ) und weiter ist µ(W n ) = α n k . 

Ähnlich zeigt man, daß µ((a,b]) = αλ k ((a,b]) gilt für a,b ∈ (0,1] n ∩ Q n . 

Wegen Translationsinvarianz kann man a = 0 annehmen. Dann gilt b =

( m 1 

n ,..., m k 

n ) mit geeigneten n,m i ∈ N. Mit einem ähnlichen Argument wie 

oben erhält man 

und damit 

m 1 ·m 2···m k µ(W n ) = µ((0,b]) 

µ((0,b]) = α m 1 

n 

··· 

mk 

n = αλk ((0,b]). 

Da aber auch die rationalen Intervalle die Borelsche σ-Algebra B k erzeugen, 

folgt die Behauptung mit dem Eindeutigkeitssatz. 

Bemerkung: Sei λ k∗ äußeres Maß zu λ k und sei L ( R k) = B ∗ , das Mengensystem 

der λ k∗ -Zerleger. Die Elemente von L ( R k) heißen Lebesguemeßbare 

Mengen. 

Nach Satz 4.13 und Übung 8 gibt es genau ein Maß ̂λ k auf ( R k ,L ( R k)) 

∏ 

mit ̂λk ((a,b]) = k (b i −a i ). 

i=1 

Dies ist die Vervollständigung von ( R k ,B ( R k) ,λ k) im Sinne von Übung 8. 

Es gilt B ∗ = ̂B, wobei ̂B die Vervollständigung von B bezeichnet. Dies folgt 

so: B ∗ ⊃ ̂B, da B ∗ nach Satz 4.5 alle λ k∗ -Nullmengen enthält. Nach Satz 

4.13 gilt für B ∈ B ∗ : B = A \N mit A ∈ B und N λ k∗ -Nullmenge. A 

und N sind in ̂B und damit auch B. 

Wahrscheinlichkeitsmaße auf R k 

Sei P ein Wahrscheinlichkeitsmaß auf ( R k ,B ( R k)) . 

Für x ∈ R k sei F (x) := P ((−∞,x]). F heißt Verteilungsfunktion von P. 

Sie hat folgende Eigenschaften: 

1) F (x) ≤ F (y) für x ≤ y 

2) F ist rechtsstetig 

3) lim 

x 1 ∧x 2 ∧...∧x k →∞ F (x 1,...,x k ) = 1 

4) lim 

x i →−∞ F (x 1,...,x i ,...,x k ) = 0 für ein i mit 1 ≤ i ≤ k 

Eigenschaft 2) folgt aus der σ-Stetigkeit von P: b n > b und b n → b. 

Dann folgt lim 

n→∞ 

F (b n ) = lim 

n→∞ 

P ((−∞,b n ]) = P ((−∞,b]) = F (b). 

31 

□


Wir überlegen nun, wie sich P ((a,b]) als Funktion von F ergibt. 

Für k = 2 mit a 

P ((a,b]) = F (b 1 ,b 2 )−F (b 1 ,a 2 )−F (a 1 ,b 2 )+F (a 1 ,a 2 ). 

Nun zu allgemeinem k: 

Sei A := (a,b] mit a = (a 1 ,...,a k ) und b = (b 1 ,...,b k ).Der k-dimensionale 

Quader hat 2 k Ecken z = (z 1 ,...,z k ), wobei z i = a i oder = b i ist für 

i = 1,...,k. Für z Ecke sei 

{ 

+1, falls #{i|z i = a i } gerade, 

sgn A (z) := 

−1, falls #{i|z i = a i } ungerade. 

Lemma 4.19: Sei △ A F := ∑ 

für jedes A = (a,b]. 

z,z Ecke 

sgn A (z)F (z). Danngilt P (A) = △ A F 

Beweis: Sei S x = (−∞,x] für x ∈ R k . 

A = (a,b] = S (b1 ,...,b k ) \ { } 

S (a1 ,b 2 ,...,b k ) ∪...∪S (b1 ,...,b k−1 ,a k ) 

Sei A i := S (b1 ,...,b i−1 ,a i ,b i+1 ,...,b k ). Dann gilt: 

P ( ( 

) k 

) 

⋃ 

S (a1 ,b 2 ,...,b k ) ∪...∪S (b1 ,...,b k−1 ,a k ) = P A i 

= 

i=1 

k∑ ∑ 

i=1 

J i 

(−1) i−1 P (A j1 ∩...∩A ji ) 

J i = {j 1 ,...,j i } durchläuft die i-elementigen Teilmengen von {1,...,k}. 

Nun ist A j1 ∩...∩A ji = S 

(b1 ,...,a j1 ,...,a ji ,...,b k) 

. Daher ist 

( ) 

P (A j1 ∩...∩A ji ) = P S ( b 1 ,...,a j1 ,...,a ji ,...,b k) 

= F ((b 1 ,...,a j1 ,...,a ji ,...,b k )) 

und sgn A ((b 1 ,...,a j1 ,...,a ji ,...,b k )) = (−1) i . Es folgt: 

( k 

) 

⋃ 

P A i = (−1) ∑ sgn A (z)F (z) 

i=1 z≠b

33 

und damit 

( k 

) 

⋃ 

P ((a,b]) = P ((−∞,b])−P A i 

i=1 

= F (b)+ ∑ sgn A (z)F (z) 

z≠b 

= ∑ 

z,zEcke 

sgn A (z)F (z) 

Definition 4.20: Eine k-dimensionale Verteilungsfunktion ist eine 

Funktion F : R k → [0,1] mit den Eigenschaften 1)-4) und mit ∆ (a,b] F ≥ 0 

für alle a ≤ b. 

Beispiele: 

∏ 

1) F (x 1 ,...,x k ) = k F i (x i ), 

i=1 

falls F i Verteilungsfunktionen auf R sind für i = 1,2,...,k. 

∫x 1 ∫x k 

2) F (x 1 ,...,x k ) = ... f (y 1 ,...,y k ) dy 1 ...dy k , 

−∞ −∞ 

sofern ∫ R k f (y) dy = 1 ist und f ≥ 0 auf R k . 

Satz 4.21: Zu jeder k-dimensionalen Verteilungsfunktion F gibt es genau 

ein Wahrscheinlichkeitsmaß auf ( R k ,B k) mit P ((−∞,b]) = F (b) für 

b ∈ R k und umgekehrt.

34 KAPITEL 4. FORTSETZUNG VON MASSEN

Kapitel 5 

Meßbare Abbildungen und 

Funktionen 

Dieses Kapitel behandelt meßbare Funktionen. Diese hängen eng mit den 

später einzuführenden Zufallsvariablen und deren Verteilungen zusammen. 

UmaufallgemeineGrundräumeΩdieseGrößensinnvolldefinierenzukönnen, 

bedarf es der Meßbarkeitseigenschaft. 

(Ω,A) heißt meßbarer Raum oder Meßraum, falls A σ-Algebra über 

Ω ist. 

Definition 5.1: Seien (Ω,A) und (Ω ′ ,A ′ ) meßbare Räume. Eine Abbildung 

f : Ω → Ω ′ heißt (A,A ′ )-meßbar, wenn f −1 (A ′ ) ∈ A ist für alle A ′ ∈ A ′ . 

Zur Nachprüfung der Meßbarkeit kann man sich auf Erzeugendensysteme 

von A ′ beschränken. 

Satz 5.2: Ist E ′ ein Erzeugendensystem von A ′ , so ist f genau dann meßbar, 

wenn f −1 (E ′ ) ∈ A für alle E ′ ∈ E ′ ist. 

Beweis:SeiÃ := {A ′ ⊂ Ω ′ |f −1 (A ′ ) ∈ A}.Ã isteine σ-AlgebramitE ′ ⊂ Ã. 

Da A ′ = σ(E ′ ) ist, folgt A ′ ⊂ Ã; und damit f−1 (A ′ ) ∈ A für A ′ ∈ A ′ . 

Beispiel: B n bezeichne die Borelsche σ-Algebra über R n . Jede stetige Abbildung 

f : R k → R m ist ( B k ,B m) -meßbar. Denn wegen der Stetigkeit von 

35

36 KAPITEL 5. MESSBARE ABBILDUNGEN UND FUNKTIONEN 

f ist das Urbild jeder offenen Menge im R m offen im R k . 

Die ( B k ,B m) -meßbaren Funktionen heißen Borel-Funktionen. 

Satz 5.3: Die Komposition f ◦g von meßbaren Abbildungen f und g ist 

meßbar. 

Beweis: (f ◦g) −1 (A) = g −1 (f −1 (A)) 

Satz 5.4: (Ω,A) und (Ω ′ ,A ′ ) seien meßbare Räume. f : Ω → Ω ′ sei eine 

(A,A ′ )-meßbare Abbildung und µ sei Maß auf (Ω,A). 

Dann ist µ ′ (A ′ ) := µ(f −1 (A ′ )) ein Maß auf (Ω ′ ,A ′ ). 

Es heißt Bildmaß von µ unter f. 

Beweis: Da f meßbar ist, ist f −1 (A ′ ) ∈ A für A ′ ∈ A ′ und damit ist die 

Definition sinnvoll. Die σ-Additivität von µ ′ folgt unmittelbar aus der von µ. 

Definition 5.5: Eine Funktion f : (Ω,A) → (R,B), die (A,B)-meßbar 

ist, heißt A-meßbare Funktion. 

Bemerkung: Eine Funktion f ist A-meßbar, falls {ω|f (ω) ≤ α} ∈ A 

für α ∈ R ist. Denn das Mengensystem {(−∞,α] |α ∈ R} erzeugt die σ- 

Algebra B und f −1 (−∞,α] = {ω|f (ω) ≤ α}. 

Beispiele: 

1) Für A ∈ A ist 1 A A-meßbar. 

2) Ω = (0,1], A = B (0,1] . Sei ω = ∞ ∑ 

i=1 

d i (ω)·2 −i für ω ∈ Ω diedyadische 

Entwicklung. Dannist f i (ω) := d i (ω) (A,B)-meßbar.DieAbbildung 

f = (f 1 ,...,f n ) ist (A,B n )-meßbar. 

Satz 5.6: Sei f = (f 1 ,...,f k ) : Ω → R k eine ( A,B k) -meßbare Funktion 

und g : R k → R eine Borel-Funktion. Dann ist g ◦ f eine A-meßbare 

Funktion. 

Dies folgt direkt aus Satz 5.3.

Satz 5.7: 

1) Sei f eine A-meßbareFunktion. Dannsind f α für α > 0, max(f,0), 

min(f,0) und |f| A-meßbare Funktionen. 

2) Es seien f 1 ,f 2 ,...,f k A-meßbar. Dann sind f 1 +f 2 +...+f k , 

max(f 1 ,f 2 ,...,f k ), min(f 1 ,f 2 ,...,f k ) A-meßbar. 

37 

k∏ 

f i , 

Beweis: 

1) Die Funktionen von x ϕ(x) = x α , ψ(x) = max(x,0) und so weiter 

sind stetig und damit Borel-Funktionen. Damit lässt sich Satz 5.6 

anwenden. 

2) Auch die Funktionen ψ(x 1 ,...,x k ) = x 1 +...+x k , 

∏ 

ϕ(x 1 ,...,x k ) = k x i , 

i=1 

η(x 1 ,...,x k ) = max(x 1 ,...,x k ) 

u.s.w. sind Borel-Funktionen. Wieder lässt sich Satz 5.6 anwenden. 

Es ist nützlich den Wertebereich von meßbaren Funktionen auf [−∞,∞] zu 

erweitern, z.B. um 1/f meßbar zu haben, falls f = 0 ist. 

Seien R := R∪{−∞}∪{∞}, 

B := {B,B ∪{∞},B ∪{−∞},B ∪{−∞,∞} |B ∈ B}. 

B heißt Borelsche σ-Algebra über R. 

i=1 

Definition 5.8: Sei (Ω,A) Meßraum. f : Ω → R heißt numerische 

Funktion, falls {ω|f (ω) ∈ B} ∈ A für jedes B ∈ B gilt. 

Lemma 5.9: Sei f : Ω → R numerisch. Dann gilt: 

f ist ( A,B ) -meßbar genau dann, wenn eine der folgenden Aussagen gilt: 

1) {f ≥ α} ∈ A für alle α ∈ R 

2) {f > α} ∈ A für alle α ∈ R 

3) {f ≤ α} ∈ A für alle α ∈ R 

4) {f < α} ∈ A für alle α ∈ R 

Beweis: Zeige nur die erste Äquivalenz.


Sei E 1 = {[α,∞] |α ∈ R}. 

E 1 ⊂ B, da [α,∞] = [α,∞)∪{∞} ∈ B. Damit ist σ(E 1 ) ⊂ B. 

Nun zur Umkehrung: Sei α ≤ β, dann gilt [α,∞]\[β,∞] = [α,β) ∈ σ(E 1 ). 

∞⋂ [ 

Dann ist α,β + 

1 

n) 

= [α,β] ∈ σ(E1 ) und 

n=1 

∞⋃ [ 

weiter α+ 

1 

,β] = (α,β] ∈ σ(E 

n 1 ). ⇒ σ(E 1 ) ⊃ B(R 1 ) 

n=1 

⋂ 

Schließlich sind ∞ [n,∞] = {∞} ∈ σ(E 1 ) und ebenso {−∞} ∈ σ(E 1 ). 

n=1 

Damit folgt B ⊂ σ(E 1 ) ⇒ B = σ(E 1 ). 

Mit Satz 5.2 folgt die Behauptung. 

Bemerkung: Wegen 1) gilt {f = ∞} ∈ A und wegen 3) {f = −∞} ∈ A. 

Satz 5.10: Seien f,f 1 ,f 2 ,... numerische Funktionen auf (Ω,A). Es gilt: 

1) supf n , inf f n, limf n , limf n sind numerische Funktionen. 

n n n n 

{ 

} 

∣ 

2) ω∣limf n (ω) existiert ∈ A 

{ 

n 

} 

∣ 

3) ω∣limf n (ω) = f (ω) ∈ A 

n 

Beweis:

Zu 1) 

{ 

{ 

sup 

n 

} 

f n ≤ α 

inf 

n f n < α 

= ⋂ {f n ≤ α} ∈ A 

} n≥1 

= ⋃ {f n < α} ∈ A 

n≥1 

limf n = inf sup f k ist meßbar. Entsprechendes gilt für limf n . 

n n n 

k≥n 

Zu 2) Seien f und g numerisch. Dann ist {ω|f (ω) = g(ω)} ∈ A. 

Denn: {ω|f (ω) < g(ω)} = ⋃ {ω|f (ω) < r,g(ω) ≥ r} 

r∈Q 

Die rechte Seite liegt aber in A und damit 

{f ≠ g} = {f < g}∪{f > g} ∈ A 

sowie {f = g} = {f ≠ g} c ∈ A. 

39 

Zu 3) 

Nun 

{ 

ist wegen 1) 

} { 

} 

∣ 

∣ 

ω∣limf n (ω) existiert = ω∣limf n = limf n auch in A. 

{ 

n 

} n n 

} { } 

∣ 

ω∣limf n (ω) = f (ω) = 

{limf n = limf n ∩ limf n = f 

n n n n 

Nun kommen wir zu einer wesentlichen Teilklasse von meßbaren Funktionen. 

Definition 5.11: Eine A-meßbare Funktion f heißt einfach, falls 

∑ 

f (ω) = k α i 1 Ai (ω) mit α i ∈ R und A i ∈ A mit A i ∩A j = ∅ für i ≠ j 

mit ⋃ i 

i=1 

A i = Ω. 

Satz 5.12: Zu jeder A-meßbaren Funktion f gibt es eine Folge f 1 ,f 2 ,... 

von einfachen Funktionen mit |f n | ≤ |f| und f n (ω) → f (ω) für alle ω ∈ Ω 

und n → ∞. 

Wenn f ≥ 0 ist, so gilt f n (ω) ր f (ω) für n → ∞ und alle ω ∈ Ω. 

Ist f beschränkt, so gilt sup|f n (ω)−f (ω)| → 0. 

n 

Beweis:


1) Sei zunächst f ≥ 0. Sei f n (ω) = n·2n ∑ 

k=1 

k−1 

2 n 1 { 

k−1 

2 n ≤f< k 

2 n}(ω)+n·1 {f≥n}. 

f n ist einfach und f n ≤ f, da f n = k−1 

2 n auf { k−1 

2 n ≤ f < k 

2 n } 

und 

f n ր f. 

2) Sei nun f beliebig. 

Seien f + = max(f,0) und f − = max(−f,0) = −min(f,0). Dann 

sind f + und f − meßbar, f + ≥ 0, f − ≥ 0 und f = f + −f − . 

Nun wende man 1) auf f + und f − an. Dann gibt es h n → f + und 

g n → f − und mit h n −g n → f + −f − . Nun gilt weiter 

∣ ( f + −f −) −(h n −g n ) ∣ ∣ ≤ 

∣ ∣f + −h n 

∣ ∣+ 

∣ ∣f − −g n 

∣ ∣. 

Ist f beschränkt durch N, so gilt |f + −h n | ≤ 2 −n für alle n > N 

und |f − −g n | ≤ 2 −n ebenso, woraus die letzte Behauptung folgt. 

Sei T eine meßbare Funktion auf (Ω,A). Sei A T die von T erzeugte σ- 

Algebra.Dieseist A T = T −1 (B).Dannist ϕ(T) eine A T -meßbareFunktion, 

falls ϕ Borel-Funktion ist; denn (ϕ(T)) −1 (B) = T −1 (ϕ −1 (B)) ∈ A T für 

B Borelsch. 

Interessanterweise sind alle A T -meßbaren Funktionen so darstellbar. 

Satz 5.13: Sei g eine A T -meßbare Funktion. Dann gibt es eine Borel- 

Funktion ϕ, so dass g = ϕ(T) ist. 

Beweis: Sei zunächst g = 1 A mit A ∈ A T . Dann gibt es nach Definition eine 

Menge B ∈ B so daß A = {ω | T(ω) ∈ B} gilt. Das heißt g = 1 A = 1 B (T). 

∑ 

Sei nun g einfach, dann ist g = n α i 1 Ai mit A i ∈ A T und A i ∩A j = ∅ für 

i=1 

⋃ 

i ≠ j und n ∑ 

A i = Ω. Da 1 Ai = 1 Bi (T) ist, folgt g = n ∑ 

α i 1 Bi (T) mit n α i 1 Bi 

i=1 

als Borelfunktion. Nun sei g beliebig und A T -meßbar. Nach Satz 5.12 gibt es 

eine Folge von A T -meßbaren einfachen Funktionen g n mit lim 

n 

g n = g. Nun 

gilt g n = ϕ n (T) mit passender Borelfunktion ϕ n . Folglich existiert lim 

n 

ϕ n (T). 

Sei nun ϕ = limsup 

n 

ϕ n . Dann gilt ϕ(T) = limsupϕ n (T) = limϕ n (T) = g. 

n n 

Beispiel: Sei T : R → S mit S = {(x,y) | x 2 + y 2 = 1} und T(u) = 

i=1 

i=1

41 

(cosu,sinu). Sei B die Borelsche σ-Algebra auf S. Dann ist f(t) = cos(2t) 

T −1 (B)-meßbar.Dennmitϕ(x,y) = x 2 −y 2 folgtf(t) = ϕ(T(t)),dacos(2t) = 

(cost) 2 −(sint) 2 gilt.

42 KAPITEL 5. MESSBARE ABBILDUNGEN UND FUNKTIONEN

Kapitel 6 

Das Lebesgue-Integral 

(Ω,A,µ) sei ein Maßraum, µ ein σ-endliches Maß. 

Definition 6.1: f sei eine einfache Funktion mit f = k ∑ 

i=1 

α i 1 Ai . 

∫ k∑ f dµ := α i µ(A i ) heißt das Integral von f bezüglich µ, sofern es 

i=1 

sinnvoll erklärt ist. Man schreibt auch ∫ f (ω) µ(dω) oder ∫ f (ω) dµ(ω). 

Bemerkungen: 

1. Die Definition hängt nicht von der Darstellung von f ab. 

∫ 

2. 1A dµ = µ(A) 

3. Für B ∈ A ist ∫ ∑ 

f ·1 B dµ = n α i µ(A i ∩B). 

i=1 

{ 

−1 für x < 0, 

4. Sei µ = λ das Lebesgue-Maß auf R. Für f = 

+1 für x ≥ 0 

das Integral nicht sinnvoll erklärt. 

ist 

Definition 6.2: Sei f nichtnegativ und A-meßbar. 

∫ {∫ 

} 

∣ 

f dµ := sup gdµ ∣0 ≤ g ≤ f, g einfach 

Lemma 6.3: Sei f nichtnegativ und meßbar. Seien f n , n ≥ 1 einfach mit 

f n ↑ f. Sei g ≤ f einfach. Dann gilt lim 

n→∞ 

∫ 

fn dµ ≥ ∫ gdµ. 

Beweis: Sei zunächst µ(Ω) < ∞. Sei ε > 0 beliebig und sei ε ′ = ε 

µ(Ω) . Sei 

43

44 KAPITEL 6. DAS LEBESGUE-INTEGRAL 

A n = {ω|f n (ω) ≥ g(ω)−ε ′ }. 

Dann gilt A n ↑ Ω und f n 1 An ≥ (g −ε ′ )1 An . Es folgt 

∫ ∫ ∫ 

f n dµ ≥ (g −ε ′ )1 An dµ ≥ g ·1 An dµ−ε ′ µ(A n ) 

∫ ∫ 

≥ gdµ− g ·1 A c n 

dµ−ε ′ µ(A n ) 

∫ 

≥ gdµ−max 

ω∈Ω |g(ω)|·µ(Ac n )−ε′ µ(Ω) 

∫ 

≥ gdµ−2ε , da µ(A c n) → 0. 

Damit folgt lim 

n→∞ 

∫ 


Sei nun µ(Ω) = ∞. Da µ σ-endlich ist, existieren A m ∈ A mit µ(A m ) < ∞ 

und A m ↑ Ω. Wegen dem gerade Gezeigten gilt für alle m 

∫ ∫ ∫ 

lim f n dµ ≥ lim f n 1 Am dµ ≥ g1 Am dµ. 

n→∞ n→∞ 

∫ ∑ g1Am dµ = k ∑ 

α i µ(A m ∩B i ), wenn g = k α i 1 Bi ist. 

i=1 

Nun gilt weiter 

i=1 

k∑ ∑ 

α i µ(A m ∩B i ) ր k α i µ(B i ) = ∫ gdµ. 

i=1 

Insgesamt folgt lim 

n→∞ 

∫ 


Folgerung: Sei f ≥ 0 meßbar. Seien f n , n ≥ 1 einfache Funktionen mit 

∫ ∫ 

f n ↑ f. Dann gilt: f dµ = lim fn dµ. 

n→∞ 

Denn: Sei g ≤ f einfach. Dann ist nach Lemma 6.3 lim 

n→∞ 

∫ 

fn dµ ≥ ∫ gdµ 

und damit lim 

n→∞ 

∫ 

fn dµ ≥ ∫ f dµ. 

Da die f n ≤ f und f n einfach sind, werden sie bei der Supremumsbildung 

mitberücksichtigt und damit ist ∫ f n dµ ≤ ∫ f dµ für alle n ≥ 1 und damit 

∫ 

fn dµ ≤ ∫ f dµ. 

lim 

n→∞ 

Definition 6.4: Sei f eine A-meßbare Funktion mit f = f + − f − und 

min (∫ f + dµ, ∫ f − dµ ) < ∞. Definiere ∫ f dµ := ∫ f + dµ− ∫ f − dµ. 

f heißt µ-integrierbar, falls max (∫ f + dµ, ∫ f − dµ ) < ∞ ist. 

Bemerkung: µ-Integrierbarkeit lässt sich auch durch ∫ |f| dµ < ∞ ausdrücken. 

i=1

45 

Satz 6.5: Seien f und g µ-integrierbare Funktionen. Dann gilt: 

∫ ∫ 

1) α·f dµ = α f dµ 

∫ ∫ ∫ 

2) (f +g) dµ = f dµ+ gdµ 

3) f ≤ g ⇒ ∫ f dµ ≤ ∫ gdµ 

4) ∣ ∫ f dµ ∣ ∫ ≤ |f| dµ 

Beweis: 

2): 1. Schritt: Seien f und g meßbar und nichtnegativ. Dann existieren 

∫ 

einfache Funktionen f n ↑ f und g n ↑ g mit lim fn dµ = ∫ f dµ 

∫ n→∞ 

und lim gn dµ = ∫ gdµ. Dann folgt: 

n→∞ 

∫ 

∫ 

f dµ+ 

∫ 

gdµ = lim 

n→∞ 

(∫ 

= lim 

n→∞ 

f n dµ+ lim g n dµ 

∫ ) 

f n dµ+ g n dµ 

n→∞ 

∫ 

= lim (f n +g n ) dµ 

∫ 

= (f +g) dµ 

n→∞ 

∫ 

Die letzte Gleichung folgt aus der Folgerung von Lemma 6.3. 

2. Schritt: f +g = f + +g + −(f − +g − ) 

∫ 

⇒ (f +g) + ≤ f + +g + ⇒ (f +g) + dµ < ∞ 

∫ 

und (f +g) − ≤ f − +g − ⇒ (f +g) − dµ < ∞


Da (f +g) + −(f +g) − = f + +g + −(f − +g − ) folgt mit der Aussage 

des 1. Schritts 

∫ ∫ 

(f +g) + dµ+ 

∫ 

f − dµ+ 

g − dµ = 

= 

∫ ((f 

+g) + +f − +g −) dµ 

∫ ((f 

= +g) − +f + +g +) dµ 

∫ ∫ ∫ 

= (f +g) − dµ+ f + dµ+ 

g + dµ 

und damit 

∫ ∫ 

(f +g) + dµ− (f +g) − dµ = 

∫ ∫ ∫ ∫ 

= f + dµ+ g + dµ− f − dµ− g − dµ 

∫ ∫ 

= f dµ+ gdµ, woraus 2) folgt. 

3): Sei 0 ≤ f ≤ g. ⇒ ∫ f dµ ≤ ∫ gdµ aufgrund der Definition 

des Integrals. Seien f, g beliebig. Dann ist f + ≤ g + und g − ≤ f − . 

Daraus folgt ∫ f + dµ ≤ ∫ g + dµ und ∫ g − dµ ≤ ∫ f − dµ. 

4): 

∫ 

∣∫ 

∫ 

∣∣∣ ∣ f dµ 

∣ = f + dµ− f − dµ 

∣ 

∫ 

∣∫ 

∣∣∣ 

≤ 

∣ f + dµ 

∣ + f − dµ 

∣ 

∫ ∫ ∫ 

= f + dµ+ f − dµ = |f| dµ 

Wir kommen nun zu einer grundlegenden Definition, der Fast-sicheren 

Eigenschaft. Wir fassen die Definition etwas allgemeiner für spätere Zwecke.

Definition 6.6: Ein Ereignis E ⊂ Ω gilt µ-fast sicher, falls eine meßbare 

Menge A ⊂ E existiert mit E c ⊂ A c und µ(A c ) = 0. 

Diese Definition { gestattet einem das Lebesgue-Integral von Funktionen wie 

1, falls x rational 

f (x) = 

zu berechnen. 

0, falls x irrational 

Satz 6.7: Seien f und g meßbar. 

1) Ist f = 0 fast sicher. ⇒ ∫ f dµ = 0 

2) Ist f = g fast sicher und ∫ |f|dµ < ∞, so ist ∫ |g|dµ < ∞ und 

∫ 

f dµ = 

∫ 

gdµ. 

3) Ist f ≥ 0 und ∫ f dµ = 0, so folgt f = 0 fast sicher. 

Bemerkung: Für ”fast sicher” schreiben wir manchmal auch kurz ”f.s.”. 

Beweis: 

∑ 

Zu 1): Sei f zunächst einfach, d.h. f = k α i 1 Ai . Ist α i ≠ 0, so folgt 

µ(A i ) = 0 und damit ∫ f dµ = 0. 

Sei nun f ≥ 0. Sei 0 ≤ g ≤ f und g einfach. Dann ist g = 0 

µ-fast sicher und damit ∫ gdµ = 0. Aufgrund der Definition von 

∫ 

f dµ folgt 

∫ 

f dµ = 0. 

Ist f meßbar, so folgt aus f = 0 auch |f| = 0 fast sicher und 

damit 0 ≤ ∣ ∣ ∫ f dµ ∣ ∣ ≤ 

∫ 

|f|dµ = 0, wegen dem gerade Gezeigten. 

Zu 2): Wende 1) auf f −g an. 

Zu 3): Sei A = {ω|f (ω) > 0} und sei A n = { ω|f (ω) ≥ 1 n} 

. Dann 

gilt A n ↑ A. Damit folgt 0 ≤ ∫ f 1 An dµ ≤ ∫ f dµ = 0, wegen 

Satz 6.5, Aussage 3). Aber 0 = ∫ f 1 An dµ ≥ 1 n µ(A n). Damit ist 

i=1 

µ(A n ) = 0 und µ(A) = lim 

n→∞ 

µ(A n ) = 0. 

Satz 6.8: Sind f und g integrierbare Funktionen. Dann gilt: 

f ≤ g µ-fast sicher gilt genau dann, wenn ∫ f 1 A dµ ≤ ∫ g1 A dµ für alle 

A ∈ A. 

Beweis: Siehe Übung Nr. 15. 

47


NunfolgenKonvergenzsätze. DiesezeigendieVorzügedesLebesgue-Integrals 

besonders. Der erst ist der Satz über monotone Konvergenz. 

Satz 6.9 (Beppo Levi): Seien f, g, f n , n ≥ 1 meßbare Funktionen mit 

f n ≥ g für alle n und f n ↑ f sowie ∫ gdµ > −∞. Dann gilt: 

∫ ∫ 

f n dµ = f dµ 

lim 

n→∞ 

Beweis: O.B.d.A. sei g = 0, ansonsten betrachtet man f n −g. 

Für jedes k ∈ N sei f (n) 

k 

; n ≥ 1 eine Folge von einfachen Funktionen mit 

f (n) 

k 

↑ f k für n → ∞. Sei f (n) := max 

1≤k≤n f(n) k 

. Dann ist f (n) einfach und 

f (n−1) ≤ f (n) ≤ f n , denn f (n) 

k 

≤ f k ≤ f n für alle k ≥ 1. 

Sei h := lim f (n) . Dann ist f (n) 

n→∞ 

k 

≤ f (n) ≤ f n und f k ≤ h ≤ f für alle 

k ≥ 1. Damit folgt f = h und f (n) ↑ f. Die Folgerung von Lemma 6.3 

liefert: 

∫ 

∫ 

f dµ = 

∫ 

hdµ = lim 

n→∞ 

∫ 

f (n) dµ ≤ lim 

n→∞ 

Andererseits ist natürlich lim 

n→∞ 

∫ 

fn dµ ≤ ∫ f dµ. 

f n dµ. 

Korollar 6.10: Sei g n , n ≥ 1 eine Folge nichtnegativer meßbarer Funktionen. 

Dann gilt: 

∫ ( 

∑ ∞ 

g i 

)dµ = 

i=1 

∞∑ 

∫ 

i=1 

g i dµ . 

∑ 

Beweis: Setze f k = k ∑ 

g i und f = ∞ g i . Dann gilt f k ↑ f und die Aussage 

folgt mit Satz 6.9. 

i=1 

i=1 

Bezeichung: Wir schreiben von nun an ∫ f dµ := ∫ f ·1 A dµ. 

A 

Folgerung: Sei f ≥ 0 und sei γ(A) = ∫ f dµ. Dann ist γ Maß. 

A 

Denn: Seien A i ≥ 1 disjunkt, dann ist 

( ∞ 

) 

⋃ 

∫ ∫ ( ∞∑ 

) 

γ A i = f ·1 ∞⋃ dµ = f · 1 Ai dµ 6.10 

= 

A i 

i=1 

i=1 

i=1 

∞∑ 

∫ 

i=1 

f ·1 Ai dµ = 

∞∑ 

γ(A i ) 

i=1

49 

Satz 6.11 (Fatous Lemma): Seien g, f n , n ≥ 1 meßbar. 

a) Falls f n ≥ g ist für alle n ≥ 1 und ∫ gdµ > −∞ ist, so ist 

∫ ∫ 

limf n dµ ≤ lim f n dµ. 

n n 

b) Falls f n ≤ g ist für alle n ≥ 1 und ∫ gdµ < ∞ ist, so ist 

∫ ∫ 

lim f n dµ ≤ lim f ndµ. 

n→∞ n→∞ 

c) Falls |f n | ≤ g für alle n ≥ 1 ist und ∫ gdµ < ∞ ist, so ist 

∫ ∫ ∫ ∫ 

limf n dµ ≤ lim f n dµ ≤ lim f n dµ ≤ lim f 

n n n→∞ 

ndµ. 

n→∞ 

Beweis: Sei h n = inf f m. Dann ist limf n = lim inf f m = lim h n und 

m≥n n n→∞ m≥n n→∞ 

h n ≥ g für alle n ≥ 1. Damit folgt mit dem Satz von B. Levi: 

∫ ∫ ∫ 

limf n dµ = lim h 

n 

ndµ = lim h n dµ 

n→∞ n→∞ 

∫ ∫ 

= lim h n dµ ≤ lim f n dµ. 

n n 

Damit ist a) gezeigt, b) geht entsprechend und c) folgt aus a) und b). 

Satz 6.12 (Satz von der majorisierten Konvergenz): 

Seien g, f, f n ; n ≥ 1 meßbar und |f n | ≤ g für alle n ≥ 1 und ∫ gdµ < ∞. 

Außerdem gelte f n → f fast sicher. Dann gilt: 

∫ 

a) fn dµ → ∫ f dµ 

∫ 

b) |f|dµ < ∞ 

∫ 

c) |fn −f| dµ → 0 für n → ∞ 

Beweis: Wegen lim 

n 

f n = lim 

n 

f n = f fast sicher, folgt mit Satz 6.11 c), dass 

∫ 

f dµ = limn 

∫ 

fn dµ. 

Ebenso folgt aus der Voraussetzung, dass |f| ≤ g µ-fast sicher ist, woraus


b) folgt. 

Schließlich ist |f n −f| ≤ |f n |+|f| ≤ 2g für alle n ≥ 1 und |f n −f| → 0 

fast sicher. Mit Teil a) folgt Aussage c). 

Wir wenden uns nun dem Zusammenhang von Riemann- und Lebesgue- 

Integral auf R zu. Wir schreiben das Riemann-Integral als f (x) dx und 

∫ 

a 

das Lebesgue-Integral als f dλ, wobei λ das Lebesgue-Maß auf R sei. 

[a,b] 

B ∗ bezeichne die Vervollständigung von B bezüglich λ. 

∫ b 

Satz 6.13: Sei f : [a,b] → R ”Riemann-integrierbar” und |f| ≤ B. Dann 

∫ b 

ist f Lebesgue-integrierbar und es gilt f (x) dx = ∫ 

f dλ. 

Beweis: Sei f Riemann-integrierbar. Dann existieren Unter- und Obersummen 

u n (x) = n b n i 1 (a n i−1 

∑ 

i=1 

,an i] (x) und o ∑ 

n(x) = n c n i 1 (x), wobei 

(a n i−1 

i=1 

,an i] 

a = a n 0 < an 1 < ... < an n = b, mit u n ≤ f ≤ o n und u n ↑ und o n ↓, 

∫ ∫ ∫ b 

sodass lim u n (x) dx = lim o n (x) dx = f (x) dx ist. 

Aber 

∫ b 

a 

n→∞ 

b 

a 

u n (x) dx = ∫ 

[a,b] 

n→∞ 

b 

a 

u n dλ und 

∫ b 

a 

a 

a 

o n (x) dx = ∫ 

[a,b] 

[a,b] 

o n dλ. 

Sei d n = o n −u n . Dann konvergiert d n ↓ d ≥ 0 und lim 

d n ≥ 0. Wende nun Lemma von Fatou an: 

∫ ∫ ∫ 

0 = lim d n dλ ≥ limd n dλ = 

n→∞ n 

[a,b] 

[a,b] 

[a,b] 

n→∞ 

∫ 

[a,b] 

ddλ ≥ 0. 

d n dλ = 0 mit 

Daraus folgt d = 0 λ-fast sicher. Damit folgt f = lim u n λ-fast sicher. 

n→∞ 

lim u n ist B-meßbar, da die u n B-meßbar sind. Damit ist f B ∗ -meßbar. 

n→∞ ∫ 

Wegen monotoner Konvergenz gilt: lim u n dλ = ∫ 

f dλ. 

n→∞ 

[a,b] [a,b] 

∫ ∫ b 

Aber die linke Seite ist gleich lim u n (x) dx = f (x) dx. 

n→∞ 

b 

Bemerkung: Die Umkehrung gilt nicht. 

a 

a 

□

f : [0,1] → [0,1] mit f (x) = 

{ 

1 für x ∈ Q∩[0,1], 

0 für x ∉ Q∩[0,1]. 

f ist Lebesgue-integrierbar, da f = 0 λ-fastsicher gilt und damit ∫ f dλ = 0 

ist. Aber das Riemann-Integral existiert nicht, da die Untersummen gleich 0 

sind und die Obersummen gleich 1. 

51 

L p -Räume 

Sei (Ω,A,µ) Maßraum und 1 ≤ p < ∞. 

Sei L p (Ω,A,µ) := { f |f messbar und ∫ |f| p dµ < ∞ } . 

Sei ‖f‖ p := (∫ |f| p dµ ) 1/p . Für diese ”Seminorm” gilt die folgende Ungleichung. 

Satz 6.14 (Hölder-Ungleichung): Seien 1 < p,q < ∞ mit 1 p + 1 q = 1. 

Seien f ∈ L p und g ∈ L q . Dann gilt f ·g ∈ L 1 und ‖f ·g‖ 1 ≤ ‖f‖ p ·‖g‖ q . 

Beweis: Es gilt für x ≥ 0, y ≥ 0 und p und q wie oben die Youngsche 

Ungleichung: x·y ≤ xp + yq 

. p q 

Da log(x) konkav ist, denn log ′′ (x) = − 1 < 0, folgt 

x 2 

log( 1 p˜x+ 1 qỹ 

) 

≥ 1 p log(˜x)+ 1 q log(ỹ) ⇒ ˜x p + ỹ 

q ≥ ˜x1/p ·ỹ 1/q . 

Mit ˜x = x p und ỹ = y q erhält man die Youngsche Ungleichung. 

Zeige nun f ·g ∈ L 1 . 

Ist ‖f‖ p = 0 oder ‖g‖ q = 0, so ist f oder g fast sicher gleich null und 

damit f ·g = 0 µ-fast sicher. Damit ist ‖f ·g‖ 1 = ∫ |f ·g|dµ = 0. 

Nun können wir annehmen, dass ‖f‖ p > 0 und ‖g‖ q > 0 sind. 

Seien ˜f = f 

‖f‖ p 

und ˜g = g 

‖g‖ q 

, dann sind ‖˜f‖ p = ‖˜g‖ q = 1. 

Wegen der Youngschen Ungleichung folgt |˜f · ˜g| ≤ |˜f| p 

+ |˜g|q 

p q 

|˜f · ˜g| ∈ L 1 (µ). Aber 

Damit folgt 

‖˜f · ˜g‖ 1 ≤ 1 p ‖˜f‖ p p + 1 q ‖˜g‖q q = 1 p + 1 q = 1 . 

‖f ·g‖ 1 = ‖f‖ p ‖g‖ q ‖˜f · ˜g‖ 1 ≤ ‖f‖ p ‖g‖ q 

und damit


Bemerkung: Für p = q = 2 folgt die Cauchy-Schwarz-Ungleichung: 

□ 

‖f ·g‖ 1 ≤ ‖f‖ 2 ·‖g‖ 2 

Spezialfall: Hölder-Ungleichung im R n 

Ω = {1,...,n}, µ({i}) = 1 für 1 ≤ i ≤ n f (i) = a i , g(i) = b i . Dann gilt 

( 

n∑ n∑ 

) 1/p ( n∑ 

) 1/q 

|a i ·b i | ≤ |a i | p |b i | q , falls 1 

i=1 i=1 

i=1 

Speziell p = q = 2 liefert die Cauchy-Schwarz-Ungleichung. 

Satz 6.15: Sei (Ω,A,µ) Maßraum mit µ(Ω) < ∞. Sei 1 ≤ p < q < ∞. 

Dann gilt L q (µ) ⊂ L p (µ) und ‖f‖ p ≤ ‖f‖ q (µ(Ω)) 1/p−1/q . 

Ist µ Wahrscheinlichkeitsmaß, so ist die Norm monoton wachsend. 

Beweis: Sei r = q p > 1 und s der konjugierte Exponent, für den 1 r + 1 s = 1 

gilt. Es ist 1 = 1− p = q−p . Dann gilt 

s q q 

∫ 

(∫ 

1 Ω ·|f| p dµ ≤ 

(∫ 

= 

) 1/r (∫ 

(|f| p ) r dµ 

) 1/s 

1 s Ωdµ 

|f| q dµ) p/q 

(µ(Ω)) (q−p)/q . 

Daraus folgt: 

‖f‖ p ≤ ‖f‖ q ·µ(Ω) q−p 

p·q 

. 

□ 

Satz 6.16 (Tschebychev-Ungleichung): 

Sei f ∈ L p (µ) mit 1 0: 

µ({|f| ≥ a}) ≤ ‖f‖p p 

a p . 

Beweis folgt aus Integration von |f| p ≥ a p 1 {|f|≥a} .

Kapitel 7 

Produktmaße 

Seien (Ω i , A i , µ i ), i = 1,2 Maßräume. 

Sei Ω = Ω 1 ×Ω 2 = {(x,y)|x ∈ Ω 1 , y ∈ Ω 2 }. 

Wir konstruieren ein Produktmaß µ 1 ⊗µ 2 auf Ω. Dazu muss zunächst eine 

passende σ-Algebra erklärt werden. 

Ein ”Rechteck” ist gegeben durch A 1 ×A 2 = {(x,y)|x ∈ A 1 , y ∈ A 2 }. 

Sei S = {A 1 ×A 2 |A i ∈ A i , i = 1,2} das Mengensystem aller meßbaren 

Rechtecke. S ist bekanntlich ein Semiring. 

Auf S erklären wir µ(A 1 ×A 2 ) = µ 1 (A 1 )·µ(A 2 ). 

Satz 7.1: µ ist σ-additiv auf S. 

Beweis: Seien A × B ∈ S und A n × B n ∈ S. A n × B n sind paarweise 

⋃ 

disjunkt und A×B = ∞ (A n ×B n ). Es gilt: 

n=1 

1 A×B (x,y) = 1 A (x)·1 B (y) = ∑ n≥11 An (x)·1 Bn (y). 

Integration bezüglich µ 2 liefert: 

1 A (x)µ 2 (B) = 

∫ 

1 A (x)1 B (y)µ 2 (dy) 

= 

∫ ∑ 

1 An (x)1 Bn (y)µ 2 (dy) 

n≥1 

B.Levi 

= ∑ ∫ 

n≥1 

1 An (x)1 Bn (y)µ 2 (dy) 

53

54 KAPITEL 7. PRODUKTMASSE 

= ∑ ∫ 

An (x) 

n≥11 

= ∑ n≥11 An (x)µ 2 (B n ). 

1 Bn (y)µ 2 (dy) 

Integration bezüglich µ 1 liefert: 

µ(A×B) = µ 1 (A)·µ 2 (B) 

∫ ∑ 

= 1 An (x)µ 1 (dx)·µ 2 (B n ) 

n≥1 

B.Levi 

= ∑ (∫ ) 

1 An (x)µ 1 (dx) µ 2 (B n ) 

n≥1 

= ∑ n≥1µ 1 (A n )µ 2 (B n ) 

= ∑ n≥1µ(A n ×B n ). 

□ 

Sei R dervon S erzeugteRing.DieseristsogareineAlgebra,da Ω ∈ R gilt. 

Es ist das System der endlichen disjunkten Vereinigungen von Rechtecken. 

Sei A 1 ⊗A 2 die von R erzeugte σ-Algebra über Ω = Ω 1 ×Ω 2 . 

A 1 ⊗A 2 heißt Produkt-σ-Algebra. 

µ besitzt aufgrund des Fortsetzungssatzes 4.6 und des Eindeutigkeitssatzes 

4.8 eine eindeutige Fortsetzung von S auf A 1 ⊗ A 2 sofern µ σ-endlich ist. 

Wir nennen sie µ 1 ⊗µ 2 , das Produktmaß von µ 1 und µ 2 . 

Nun zur Integration: Vorbereitend brauchen wir den Begriff der ”monotonen 

Klasse”. 

Definition 7.2: Ein System M ⊂ P(Ω) heißt monotone Klasse, falls 

gilt: 1) M n ∈ M für n ≥ 1 und M n ↓ M ⇒ M ∈ M 

2) M n ∈ M für n ≥ 1 und M n ↑ M ⇒ M ∈ M 

Bemerkung: Jede σ-Algebra ist monotone Klasse.

55 

Lemma 7.3: Sei E ⊂ P(Ω). Ist E Algebra, so ist M(E) = σ(E), d.h. die 

kleinste monotone Klasse, die E umfasst, stimmt mit der von E erzeugten 

σ-Algebra überein. 

Beweis: siehe Übungen ! 

Definition 7.4: Für E ⊂ Ω 1 ×Ω 2 und x ∈ Ω 1 , y ∈ Ω 2 seien 

E x := {y ∈ Ω 2 | (x,y) ∈ E} bzw. E y := {x ∈ Ω 1 | (x,y) ∈ E} . 

E x heißt x-Schnitt von E, entsprechend heißt E y y-Schnitt von E. 

Lemma 7.5: Sei E ∈ A 1 ⊗ A 2 . Für jedes x ∈ Ω 1 ist E x ∈ A 2 und für 

jedes y ∈ Ω 2 ist E y ∈ A 1 . D.h. die Schnittmengen von meßbaren Mengen 

sind meßbar. 

Beweis: Sei C = {E ⊂ Ω 1 ×Ω 

( 2 |E x ∈ 

) 

A 2 , E y ∈ A 1 für x ∈ Ω 1 , y ∈ Ω 2 }. 

⋃ 

Dann ist (E c ) x 

= (E x ) c und E i = ⋃ (E i ) x 

und es gilt S ⊂ C und 

i≥1 x i≥1 

R ⊂ C für E, E i ⊂ Ω 1 ×Ω 2 , x ∈ Ω 1 . 

Folglich ist C eine σ-Algebra mit R ⊂ C. Damit ist A 1 ⊗A 2 ⊂ C. 

Satz 7.6: Seien (Ω i ,A i ,µ i ) σ-endliche Maßräume. Für eine meßbare Menge 

E ⊂ Ω 1 ×Ω 2 sind die Funktionen 

1) x ↦→ µ 2 (E x ) A 1 -meßbar bzw. y ↦→ µ 1 (E y ) A 2 -meßbar und 

∫ 

2) µ2 (E x )µ 1 (dx) = ∫ µ 1 (E y )µ 2 (dy). 

Beweis: Seien µ i , i ≥ 1 zunächst endlich. Sei M das System aller Teilmengen 

E ∈ A 1 ⊗ A 2 mit x ↦→ µ 2 (E x ), y ↦→ µ 1 (E y ) sind meßbar und 

∫ 

µ2 (E x )µ 1 (dx) = ∫ µ 1 (E y )µ 2 (dy). 

Wir zeigen: a) M ist monotone Klasse, 

b) R ⊂ M. 

Dann ist nach Lemma 7.3 M(R) ⊂ A 1 ⊗A 2 , woraus die Behauptung folgt.


a) Seien E n ∈ M, n ≥ 1 mit E n ↑ E. Für x ∈ Ω 1 gilt (E n ) x 

↑ E x . 

Daher ist 

⎛( ) ⎞ ( ⋃ ⋃ 

µ 2 (E x ) = µ 2 

⎝ n 

⎠ = µ 2 

n≥1E 

n≥1 

Daher ist x ↦→ µ 2 (E x ) A 1 -meßbar. 

x 

(E n ) x 

) 

= lim 

n→∞ 

µ 2 ((E n ) x 

) 

Außerdem ist wegen monotoner Konvergenz (Satz von B. Levi) 

∫ ∫ 

µ 2 (E x )µ 1 (dx) = limµ 2 ((E n ) 

n 

x 

)µ 1 (dx) 

∫ 

= lim µ 2 ((E n ) 

n 

x 

)µ 1 (dx) 

∫ ( 

= lim µ 1 (E n ) 

n 

y 

)µ 2 (dy) 

∫ 

= µ 1 (E y )µ 2 (dy) . 

Für E n ↓ E gelten ähnliche Argumente. Damit folgt a). 

b) Sei E = A×B mit A ∈ A 1 und B ∈ A 2 . 

Es ist µ 2 (E x ) = µ 2 (B)1 A (x) und µ 1 (E y ) = µ 1 (A)1 B (y). Dann 

folgt: 

∫ 

∫ 

µ 2 (E x )µ 1 (dx) = µ 2 (B)µ 1 (A) = 

Somit ist E ∈ M und S ⊂ M. 

µ 1 (E y )µ 2 (dy). 

DiebesagtenEigenschaften übertragensich aufendlich disjunkte Vereinigungen 

von Elementen aus S. Damit gilt R ⊂ M. 

Bei σ-Endlichkeit von µ 1 und µ 2 approximiert man durch A 1 n × A2 n mit 

A i n ↑ Ω i und µ i (A i n) < ∞ für alle n ≥ 1. 

□

Satz 7.7 (Schnittformel): Seien (Ω i ,A i ,µ i ) i = 1,2 σ-endliche Maßräume. 

Dann gibt es genau ein σ-endliches Maß µ 1 ⊗µ 2 auf A 1 ⊗A 2 mit 

µ 1 ⊗µ 2 (A×B) = µ 1 (A)·µ 2 (B) für alle A ∈ A 1 , B ∈ A 2 . 

Für E ∈ A 1 ⊗A 2 gilt: 

∫ 

µ 1 ⊗µ 2 (E) = 

∫ 

µ 2 (E x )µ 1 (dx) = 

µ 1 (E y )µ 2 (dy). 

Beweis:DieExistenzundEindeutigkeit desProduktmaßeshabenwirbereits 

oben festgestellt. Wie zeigen nun die Formel. 

Seien µ := µ 1 ⊗ µ 2 und ˜µ gegeben durch ˜µ(E) = ∫ µ 2 (E x )µ 1 (dx) = 

∫ 

µ1 (E y )µ 2 (dy). 

µ und ˜µ sind Maße auf A 1 ⊗A 2 und µ = ˜µ auf S. Letzteres folgt, da für 

E = A×B mit A ∈ A 1 , B ∈ A 2 gilt E x = B für x ∈ A und damit 

∫ 

µ(A×B) = µ 1 (A)µ 2 (B) = µ 2 (B)1 A (x)µ 1 (dx) = ˜µ(A×B). 

S ist aber durchschnittsstabiles Erzeugendensystem von A 1 ⊗ A 2 . Wegen 

Eindeutigkeitssatz 4.8 folgt die Aussage. 

57 

Korollar 7.8: Für E ∈ A 1 ⊗A 2 gilt: 

µ 1 ⊗µ 2 (E) = 0 gilt genau dann, wenn µ 2 (E x ) = 0 für µ 1 -fast alle x. 

Bemerkung: λ k sei das Lebesgue-Maß auf ( R k ,B k) . 

Dann gilt λ m+n = λ m ⊗λ n . 

Korollar 7.9 (Cavalieri-Prinzip): Sei R 3 = {(x 1 ,x 2 ,y)|x 1 ,x 2 ,y ∈ R}. 

Seien K, W ⊂ R 3 . Sei λ 3 (K) > 0. Gelte mit θ > 0 λ 2 (K y ) = θλ 2 (W y ) für 

alle y. Sei außerdem Y = {y|λ 2 (K y ) ≠ 0} = {y|λ 2 (W y ) ≠ 0}. 

Dann ist λ 3 (K) = θλ 3 (W). 

Beweis: Anwendung von Satz 7.7: 

∫ ∫ 

λ 3 (K) = 1 K dλ 3 = λ 2 (K y ) dλ 1 (y) 

R 3 R 

∫ ∫ 

= λ 2 (K y ) dλ 1 (y) = θλ 2 (W y ) dλ 1 (y) = θλ 3 (W) 

Y 

Y


Wir berechnen mit Hilfe der Schnittformel das Volumen der n-dimensionalen 

Einheitskugel B 1 (0) = {z ∈ R n ||z| ≤ 1} (siehe dazu Kuwert: Analysis III- 

Skriptum): 

α n = λ n (B 1 (0)) 

= 

∫ 1 

−1 

= α n−1 · 

∣ 

λ 

({x n−1 ∈ R n−1 ∣∣|x| √ }) 

≤ 1−y 

2 

dy 

∫ 1 

∫ 

( π 

1−y 

2 )n−1 

2 

dy = α n−1 · 

sin n ϑdϑ 

−1 

0 

} {{ } 

A n 

. ✻ 

Dabei setzt man: sinϑ = √ 1−y 2 

√ 

1−y 

2 

. 

cosϑ = y. 

Also hat man: α n = α n−1 ·A n . 

y 

✲ 

A n lässt sich durch partielle Integration mit Rekursion berechnen. 

A n = n−1 

n A n−2 für n ≥ 2 und mit A 0 = π und A 1 = 2. Es folgt: 

A 2k = π 

k∏ 

j=1 

2j −1 

2j 

und A 2k+1 = 2 

k∏ 

j=1 

2j 

2j +1 . 

Es folgt weiter: 

A 2k+1 A 2k = 2π 

2k +1 

und A 2k A 2k−1 = π k . 

Damit gilt: 

α 2k = (A 2k A 2k−1 )···(A 2 A 1 )α 0 = πk 

k! , 

α 2k+1 = (A 2k+1 A 2k )···(A 3 A 2 )α 1 = 

( 

k + 

1 

2 

π k 

)( 

k − 

1 

2 

)···( ) . 1− 

1 

2

Satz 7.10: Seien (Ω i ,A i ,µ i ), i = 1,2 σ-endliche Maßräume. Sei f eine 

reellwertige Funktion auf Ω 1 ×Ω 2 . 

a) f sei nichtnegativ und A 1 ⊗ A 2 -meßbar. Dann sind die Funktionen 

x ↦→ ∫ f (x,y)µ 2 (dy) A 1 -meßbar und y ↦→ ∫ f (x,y)µ 1 (dx) A 2 - 

meßbar und es gilt 

∫ ∫ (∫ 

(∗) f d(µ 1 ⊗µ 2 ) = 

∫ (∫ 

= 

) 

f (x,y) µ 2 (dy) µ 1 (dx) 

) 

f (x,y) µ 1 (dx) µ 2 (dy). 

59 

b) Sei f µ 1 ⊗ µ 2 -integrierbar. Dann ist ∫ f (x,y) µ 2 (dy) integrierbar 

Beweis: 

für µ 1 -fast alle x und ∫ f (x,y) µ 1 (dx) ist integrierbar für µ 2 -fast 

alle y und es gilt (∗). 

a) Der Beweis der Meßbarkeit geht ähnlich wie der von Satz 7.6. Für 

f = 1 E mit E ∈ A 1 ⊗ A 2 ist (∗) bereits in Satz 7.7 bewiesen. 

Folglich gilt (∗) auch für einfache Funktionen. Mit monotoner Konvergenz 

folgt a), da jede nichtnegative A 1 ⊗ A 2 -meßbare Funktion 

aufsteigender Limes von einfachen Funktionen ist. 

b) Ist f µ 1 ⊗µ 2 -integrierbar, so sind es auch f + und f − . Folglich ist 

∫ 

f + (x,y) µ 1 (dx) < ∞ für µ 2 -fast alle y. Entsprechendes gilt für 

f − . Folglich gilt für µ 2 -fast alle y ∫ |f (x,y)|µ 1 (dx) < ∞. 

Wegen Linearität ist für µ 2 -fast alle y das folgende Integral erklärt: 

∫ ∫ ∫ 

f (x,y) µ 1 (dx) = f + (x,y) µ 1 (dx)− f − (x,y) µ 1 (dx) .


Integration bezüglich µ 2 ergibt wegen Teil a) 

∫ (∫ ) ∫ 

f + (x,y) µ 1 (dx) µ 2 (dy) = f + d(µ 1 ⊗µ 2 ) < ∞ 

∫ (∫ ) ∫ 

f − (x,y) µ 2 (dy) µ 1 (dx) = f − d(µ 1 ⊗µ 2 ) < ∞ 

Daher ist ∫ ∫ f (x,y) µ 1 (dx) µ 2 (dy) erklärt. Es gilt weiter: 

∫ (∫ ) 

f (x,y) µ 1 (dx) µ 2 (dy) 

∫ (∫ ∫ ) 

= f + (x,y) µ 1 (dx)− f − (x,y) µ 1 (dx) µ 2 (dy) 

∫ ∫ 

= f + d(µ 1 ⊗µ 2 )− f − d(µ 1 ⊗µ 2 ) 

∫ 

= f d(µ 1 ⊗µ 2 ). 

□ 

Bemerkung: Die Integrierbarkeitsbedingung kann nicht fallen gelassen werden. 

Seien µ i , i = 1,2 Zählmaße auf N und g(n,n) := 1, g(n,n+1) = −1 

für alle n ≥ 1 und g(m,n) = 0 für n ≠ m und n ≠ m+1. Dann ist 

∫ ∫ 

g(m,n) µ 1 (dm) µ 2 (dn) = 1+(−1+1)+... = 1 

∫ ∫ 

g(m,n) µ 2 (dn) µ 1 (dm) = (1−1)+(1−1)+... = 0 

Aber ∫ g ± d(µ 1 ⊗µ 2 ) = ∞. 

Folglich gilt (∗) nicht !

Kapitel 8 

Unabhängigkeit und 

0-1-Gesetze 

(Ω,A,P) sei ein Wahrscheinlichkeitsraum, d.h. dies ist ein Maßraum mit 

Wahrscheinlichkeitsmaß P. 


1) Eine Menge von Ereignissen {A i , i ∈ I} mit A i ∈ A heißt unabhängig, 

wenn für jede Teilmenge {i 1 ,..., i n } ⊂ I gilt: 

n∏ 

(∗) P (A i1 ∩...∩A in ) = P (A iν ) . 

ν=1 

2) Eine Familie von Teilmengensystemen {C i ; i ∈ I} mit C i ⊂ A 

heißt unabhängig, wenn für jede nichtleere endliche Teilmenge 

{i 1 ,..., i n } ⊂ I und für jede Wahl A iν ∈ C iν mit ν = 1,..., n, 

die Gleichung (∗) gilt. 

Bemerkung: Sei {A 1 ,..., A n } unabhängig. Sei C i = {∅, A i , A c i, Ω} für 

i = 1,..., n. Dann ist {C i , i = 1,..., n} unabhängig. 

Insbesondere ist {A c 1,..., A c n} unabhängig 1 . 

1 Siehe dazu auch ”Einführung in die Stochastik, Teil 1”. 

61

62 KAPITEL 8. UNABHÄNGIGKEIT UND 0-1-GESETZE 

Satz 8.2: Sei {C i ; i ∈ I} eine Familie von Teilmengensystemen von A mit 

folgenden Eigenschaften: a) C i ist durchschnittsstabil; 

Dann ist {σ(C i ); i ∈ I} unabhängig. 

b) {C i ; i ∈ I} ist unabhängig. 

Beweis: Da (∗) lediglich für endliche Teilmengensysteme zu zeigen ist, nehmen 

wir I endlich und einfachheitshalber I = {1,..., n} an. Sei 

{ 

( 

D 1 = D 1 ∈ A 

∣ P D 1 ∩ ⋂ ) 

C i = P (D 1 ) ∏ } 

(C i ) ∀ C i ∈ C i , i ≠ 1 

i≠1 i≠1P 

Dann gilt D 1 ⊃ C 1 nach Voraussetzung und D 1 ist Dynkin-System. Dies 

folgt so: 

1) Ω ∈ D 1 trivialerweise. 

2) Seien E, F ∈ D 1 mit F ⊂ E 

( 

P (E \F)∩ ⋂ ) ( 

C i = P E ∩ ⋂ ( 

C i 

)−P F ∩ ⋂ ) 

C i 

i≠1 

i≠1 i≠1 

= (P (E)−P (F)) ∏ i≠1P (C i ) 

= P (E \F) ∏ i≠1P (C i ). 

3) 

Damit ist E \F ∈ D 1 . 

⋃ 

A j ∈ D 1 für disjunkte A i folgt ähnlich: 

j≥1 

P 

( (⋃ ) 

j ∩ 

j≥1A ⋂ ) ( ⋃ 

C i = P A j ∩ 

i≠1 j≥1( 

⋂ ) ) 

C i 

i≠1 

= ∑ ( 

P A j ∩ ⋂ ) 

C i 

j≥1 i≠1 

= ∑ j≥1 

P (A j ) ∏ i≠1P (C i ) 

( ) ⋃ ∏ 

= P A j (C i ) 

j≥1 i≠1P

Da C 1 durchschnittsstabil ist, gilt D 1 ⊃ σ(C 1 ). Es folgt {σ(C 1 ), C 2 ,..., C n } 

ist unabhängig. Sei 

{ 

( 

D 2 = D 2 ∈ A 

∣ P D 1 ∩D 2 ∩ ⋂ i≥3 

C i 

) 

= P (D 1 )P (D 2 ) ∏ i≥3P (C i ) 

für D 1 ∈ σ(C 1 ), C i ∈ C i 

}. 

D 2 ist auch Dynkin-System (Argument wie für D 1 ). Da C 2 durchschnittsstabil 

ist, gilt σ(C 2 ) ⊂ D 2 . Daraus folgt, {σ(C 1 ), σ(C 2 ), C 3 ,..., C n } ist 

unabhängig. Wiederholen dieser Argumentation liefert die Aussage. 

63 

□ 

Korollar 8.3: Sei {C i ; i ∈ I} eine Familie von durchschnittsstabilen unabhängigen 

Mengensystemen. ( ) Seien I 1 , I 2 ⊂ I mit I 1 ∩I 2 = ∅ und I 1 ∪I 2 = I. 

⋃ 

Seien A Ij := σ C i für j = 1,2. Dann ist {A I1 , A I2 } unabhängig. 

i∈I j 

Beweis: Seien für j = 1,2 

{ } 

⋂ ∣ ∣∣K 

C Ij := E i ⊂ Ij endlich, E i ∈ C i für i ∈ K . 

i∈K 

C Ij ist durchschnittsstabil für j = 1,2 und A Ij = σ ( ) 

C Ij . Seien Kj ⊂ I j 

endlich für j = 1,2 und E i ∈ C i für alle i. Dann gilt: 

( ⋂ 

P E i ∩ ⋂ ) ( ) ⋂ 

E j = P E i = ∏ 

P (E i ) 

i∈K 1 j∈K 2 i∈K 1 ∪K 2 i∈K 1 ∪K 2 

= ∏ 

P (E i ) ∏ 

P (E j ) 

i∈K 1 j∈K 2 

( ) ( ) ⋂ ⋂ 

= P E i P E j . 

i∈K 1 j∈K 2 

Damit ist { C Ij , j = 1,2 } unabhängig. Nach Satz 8.2 folgt die Behauptung. 

□ 

Definition 8.4: Sei (A n ; n ≥ 1) eine Folge von σ-Algebren mit A n ⊂ A. 

T = ⋂ ( ∞ 

) 

⋃ 

σ A m heißt σ-Algebra der terminalen Ereignisse der 

n≥1 m=n 

Folge (A n ; n ≥ 1).


Satz 8.5 (0-1-Gesetz von Kolmogorov): Sei (A n ; n ≥ 1) eine Folge 

von unabhängigen σ-Algebren mit A n ⊂ A. Für A ∈ T gilt P (A) = 0 

oder P (A) = 1. 

Beweis: Sei A ∈ T und D A = {D ∈ A|P (A∩D) = P (A)P (D)}. Zeige 

A ∈ D A . Dann ist P (A) = P (A) 2 und damit folgt die Aussage von Satz 8.5. 

D A ist Dynkin-System. Der Beweis geht so ähnlich wie der von Satz 8.2. 

Für n ≥ 1 sei F n := σ(A 1 ∪...∪A n ) und F 0 := ⋃ F n . Dann sind F n 

n≥1 

( ) ⋃ 

und σ A m unabhängig wegen Korollar 8.3. 

m≥n+1 

( ) ⋃ 

Da A ∈ T folgt A ∈ σ A m für alle n ≥ 1. Folglich ist F n ⊂ D A 

m≥n+1 

für alle n ≥ 1 und damit F 0 ⊂ D A . 

F 0 ist durchschnittsstabil. Damit folgt σ(F 0 ) = D(F 0 ) ⊂ D A , da F 0 ⊂ D A . 

⋃ 

Aber A n ⊂ F 0 für alle n ≥ 1 und damit A m ⊂ F 0 und somit 

m≥n 

( ) ⋃ 

σ A m ⊂ σ(F 0 ) für alle n ⇒ T ⊂ σ(F 0 ) ⊂ D A . □ 

m≥n 

Eine Folgerung ist das 0-1-Gesetz von Borel. 

Für eine Folge von Mengen (A n ; n ≥ 1) sei limsupA n = ⋂ 

n 

⋃ 

n≥1 m≥n 

A m . 

Korollar ( 8.6: Für jede unabhängige Folge von Ereignissen (A n ; n ≥ 1) 

gilt P limsupA n 

)= 0 oder = 1. 

n 

Beweis: Sei A n := σ(A n ) = {∅, A n , A c n , Ω}. Nach der Bemerkung nach 

Definition 8.1 ist (A n ; n ≥ 1) unabhängig. Sei n ≥ 1. Für alle k ≥ n ist 

( 

∞⋃ ⋃ ∞ 

A m ∈ σ A m 

).Damitist limsupA n = ⋂ ( ⋃ 

m=k m=n 

n 

( ) 

k≥1 

⋃ 

ein Element von σ A m 

m≥n 

Satz 8.5 liefert die Aussage. 

) 

A m = ⋂ 

m≥k k≥n 

( ⋃ 

) 

A m 

m≥k 

für alle n ≥ 1. Damit ist limsupA n ∈ T. 

n 

□

65 

Lemma 8.7: Für unabhängige Ereignisse A 1 ,..., A n gilt 

( n 

) 

⋃ n∏ 

( n∑ 

) 

P A i = 1− (1−P (A i )) ≥ 1−exp − P (A i ) . 

i=1 

i=1 

Beweis: 

( n 

) (( 

⋃ 

n 

) c ) ( 

⋃ ⋂ n 

P A i = 1−P A i = 1−P 

i=1 

= 1− 

≥ 1− 

i=1 

i=1 

A c i 

n∏ n 

P (A c i ) = 1− ∏ 

(1−P (A i )) 

i=1 

i=1 

) 

i=1 

n∏ 

exp(−P (A i )) , da e −x ≥ 1−x für 0 < x < 1 

i=1 

( 

= 1−exp − 

n∑ 

i=1 

) 

P (A i ) 

□ 

Satz 8.8 (Borel-Cantelli-Lemma): 

Sei (A n ; n ≥ 1) eine Folge von Ereignissen. Dann gilt: 

( ) 

∑ 

a) P (A n ) < ∞ ⇒ P limsupA n = 0 

n 

n≥1 

b) Ist (A n ; n ≥ 1) unabhängig, so gilt: 

∑ 

( ) 

P (A n ) = ∞ ⇒ P limsupA n = 1. 

n 

Beweis: 

n≥1 

⋃ 

a) Sei A = limsupA n . Dann ist A ⊂ ∞ A m für alle n ≥ 1. 

n 

m=n 

( ∞ 

) 

⋃ ∞∑ 

⇒ P (A) ≤ P A m ≤ P (A m ) 

⇒ P (A) = 0 

m=n m=n 

n→∞ 

−→ 0


( ∞ 

) ( 

⋃ 

n+p 

) ⋃ 

b) P (A) = lim ↓ P A m = lim ↓ lim ↑ P A m n n p 

m=n ( 

m=n 

( n+p 

∑ 

≥ lim ↓ lim ↑ 1−exp − P (A m )) ) = 1 □ 

n p 

m=n

Kapitel 9 

Zufallsvariable, Erwartungswert 

und Unabhängigkeit 

(Ω,A,P) sei Wahrscheinlichkeitsraum. 


Sei X eine A-meßbare Funktion X : Ω → R. X heißt Zufallsvariable. 

Das Wahrscheinlichkeitsmaß auf (R, B) P X (B) := P (X −1 (B)) für B ∈ B 

heißt Verteilung von X. 

Ist X = (X 1 ,..., X n ) einVektorvonZufallsvariablen,dannheißt P X (B) := 

P (X −1 (B)) mit B ∈ B n Verteilung von X. P X ist ein Wahrscheinlichkeitsmaß 

auf (R n , B n ) und wird auch die gemeinsame Verteilung von 

(X 1 ,..., X n ) genannt.DieVerteilungen P X i 

, i = 1,..., n heißendieRandverteilungen 

von X. F X (α) = P X ((−∞, α]) mit α ∈ R n heißt Verteilungsfunktion. 

Bemerkung: F X ist die maßerzeugende Funktion von P X . 

Beispiel: Siehe Kapitel 1. 

Sei Ω = (0,1], A = B(0,1] und 

{ 

0, falls k ·2 −n < ω ≤ (k +1)·2 −n 

X n (ω) = 

1, falls (k +1)·2 −n < ω ≤ (k +2)·2 −n 

mit k gerade und 0 ≤ k ≤ 2 n −2. 

X 1 (ω) ist dann gleich null für 0 < ω ≤ 1 2 und gleich 1 für 1 2 < ω ≤ 1. 

67

68 KAPITEL 9. ZUFALLSVARIABLE, ERWARTUNGSWERT, ... 

X 2 (ω) ist dann gleich 0 für 0 < ω ≤ 1 und 1 < ω ≤ 3 4 2 4 

weiter. Es gilt P Xn ({0}) = P ({X n = 0}) = 1 . 2 

und sonst 1 und so 

Definition 9.2: Sei X Zufallsvariable und P-integrierbar. Dann heißt 

E(X) = ∫ X dP Erwartungswert von X. 

Sei 1 ≤ p < ∞, dann heißt X p-fach integrierbar, falls E(|X| p ) < ∞. 

E(X p ) heißt p-tes Moment. 

Ist X ∈ L 2 (Ω, A, P), so heißt Var(X) = E ( (X −E(X)) 2) die Varianz 

von X und σ(X) = √ Var(X) die Standardabweichung von X. 

Eigenschaften der Varianz: 

1) Var(X +β) = Var(X) für β ∈ R 

2) Var(αX) = α 2 Var(X) für α ∈ R 

3) Var(X) = E(X 2 )−E 2 (X) 

4) Var(X) = 0 ⇔ P (X = E(X)) = 1 

Satz 9.3 (Transformationssatz): Sei f : R n → R meßbar und so, dass 

Ef (|X|) < ∞, wobei X Zufallsvektor ist. Dann gilt 

∫ 

E(f (X)) = f (x) P X (dx). 

R n 

Beweis: siehe Aufgabe 20. 


Eine Familie {X i ; i ∈ I} von Zufallsvariablen heißt unabhängig, falls die 

Familie der von den X i erzeugten σ-Algebren {σ(X i ); i ∈ I} unabhängig 

ist. Dabei ist σ(X i ) = X −1 

i (B). 

Bemerkung: Äquivalent zudieser Definitionist:Fürjedenichtleere endliche 

Teilmenge {i 1 ,..., i n } ⊂ I und jede Auswahl von Mengen B ν ∈ B, für 

∏ 

ν = 1,...,n gilt P (X i1 ∈ B 1 ,...,X in ∈ B n ) = n P (X iν ∈ B ν ). 

ν=1

69 

Satz 9.5: Die Familie {X i ; i ∈ I} von Zufallsvariablen ist unabhängig genau 

dann, wenn für J ⊂ I und α j ∈ R für j ∈ J gilt 

( ) ⋂ 

P {X j ≤ α j } = ∏ ({X j ≤ α j }) . 

j∈J 

j∈JP 

Beweis:Sei E = {(−∞,α] |α ∈ R} undsei Xi −1 (E) = {{X i ≤ α}; α ∈ R}. 

X −1 

i (E) erzeugt X −1 

i (B) = σ(X i ). Wende nun Satz 8.2 mit C i = X −1 

i (E), 

i ∈ I an. 

□ 

Satz 9.6: Sei X = (X 1 ,...,X n ) ein Vektor von Zufallsvariablen. Dann 

⊗ 

gilt: {X 1 ,...,X n } ist unabhängig genau dann, wenn P X = n P X i 

. 

Beweis: Sei zunächst {X 1 ,...,X n } unabhängig. Dann gilt für B i ∈ B mit 

i = 1,..., n 

P X (B 1 ×...×B n ) = P ( X −1 (B 1 ×...×B n ) ) 

= P ({X i ∈ B i , i = 1,..., n}) 

n∏ 

n∏ 

= P ({X i ∈ B i }) = P X i 

(B i ). 

i=1 

i=1 

⊗ 

Nun sei P X = n P X i 

. Dann gilt nach Definition 

i=1 

i=1 

P X (B 1 ×...×B n ) = 

n∏ 

P X i 

(B i ). 

i=1 

Dann folgt 

P 

( n 

⋂ 

i=1 

X −1 

i (B i ) 

) 

= P X (B 1 ×...×B n ) 

= 

n∏ 

P X i 

(B i ) = 

i=1 

n∏ 

i=1 

P ( X −1 

i (B i ) ) 

und damit die Unabhängigkeit. 

□


Satz 9.7: Sei {X i ; i ∈ N} unabhängige Folge von Zufallsvariablen. Sei 

T = ⋂ ( ⋃ 

σ A m 

), wobei A i = σ(X i ). 

n≥1 m≥n 

Für A ∈ T ist entweder P (A) = 0 oder = 1. 

Beispiele: 

1) Ã 1 = {X n ∈ A n unendlich oft} = limsup{X n ∈ A n } 

n 

{ ∞ 

} 

∑ 

2) Ã 2 = X i konvergiert 

i=1 

{ } 

n∑ 

1 

3) Ã 3 = lim X 

n n i = 1 2 

i=1 

Lemma 9.8: Sei {X i , i ∈ I} unabhängig.Seien f i : R → R meßbar.Dann 

ist {f i ◦X i ; i ∈ I} unabhängig. 

Beweis: Sei A i ∈ B. Dann gilt (f i ◦X i ) −1 ( 

(A i ) = X −1 

i f 

−1 

i (A i ) ) . Dann 

ist (f i ◦X i ) −1 (A i ) ∈ X −1 

i (B) für alle i. Da die σ-Algebren X −1 

i (B) unabhängig 

sind, folgt die Behauptung. 

□ 

Satz 9.9: Sei {X 1 ,..., X n } unabhängig. Dann gilt: 

( n 

) 

∏ ∏ 

a) Sind X i ≥ 0 für i = 1,...,n, so ist E X i = n E(X i ). 

i=1 i=1 

( n 

) 

∏ 

b) Ist E(|X i |) < ∞ für i = 1,...,n, so ist E |X i | < ∞ und 

( i=1 

n 

) 

∏ ∏ 

E X i = n E(X i ). 

i=1 i=1 

Beweis: 

∑ 

a) Seien X = n ∑ 

α i 1 Ai und Y = m β j 1 Bj einfach und unabhängig. 

i=1 

j=1

71 

Schreibe A i = {X = α i } und B j = {Y = β j }. Dann folgt: 

( ∑ ∑ 

) 

E(X ·Y) = E α i β j 1 Ai 1 Bj 

i j 

= ∑ ∑ 

α i β j E ( ) 

1 Ai 1 Bj 

i j 

= ∑ ∑ 

α i β j P (A i ∩B j ) 

i j 

= ∑ ∑ 

α i β j P (A i )P (B j ) 

i j 

( ∑ 

)( ∑ 

) 

= α i P (A i ) β j P (B j ) = E(X)·E(Y). 

i j 

Man hat dabei die Unabhängigkeit von X und Y verwendet: 

P (A i ∩B j ) = P ({X = α i , Y = β j }) 

= P ({X = α i })P ({Y = β j }) = P (A i )P (B j ). 

Seien nun X ≥ 0 und Y ≥ 0. Dann existieren Folgen nichtnegativer 

einfacher Funktionen mit X n ↑ X und Y n ↑ Y und X n und Y n 

unabhängig. Solche Folgen sind 

Dann gilt: 

∑n·2 n 

X n = 1 { 

k−1 

k=1 

n·2 n 

∑ 

Y n = 1 { 

k−1 

k=1 

2 n


b) Seien X und Y Zufallsvariablen mit E(|X|) < ∞ und E(|Y|) < ∞. 

Dann folgt: 

E(|X ·Y|) = E(|X|·|Y|) = E(|X|)·E(|Y|) < ∞. 

Somit ist E(|X ·Y|) < ∞. 

Da X und Y unabhängig sind, sind dies auch X + , X − und Y + , 

Y − aufgrund von Lemma 9.8. Da X = X + −X − und Y = Y + −Y − 

folgt: 

E(X ·Y) = E ( X + Y + +X − Y − −X + Y − −X − Y +) 

= E ( X +) E ( Y +) +E ( X −) E ( Y −) 

−E ( X +) E ( Y −) −E ( X −) E ( Y +) 

= E ( X +) E(Y)−E ( X −) E(Y) = E(X)E(Y). 

□ 

Bemerkung:Sind f i , i = 1,...,n meßbarundist {X 1 ,...,X n } unabhängig 

mit E(|f i (X i )|) < ∞, so gilt: 

( n∏ 

) 

n∏ 

E f i (X i ) = E(f i (X i )). 

i=1 i=1 

Dies folgt unmittelbar aus Satz 9.9, wenn man die Aussage auf f (X i ) anwendet. 


Seien X und Y Zufallsvariablen 

(( )( 

mit E(X 2 ) 

)) 

< ∞ und E(Y 2 ) < ∞. 

Kov(X, Y) := E X −E(X) Y −E(Y) heißt Kovarianz von X 

und Y. ρ(X, Y) = Kov(X,Y) 

σ(X)σ(Y) 

mit σ(X) = √ Var(X) und σ(Y) entsprechend 

heißt Korrelationskoeffizient von X und Y. 

Bemerkungen: 

1) |Kov(X, Y)| ≤ σ(X)σ(Y) aufgrund der Cauchy-Schwarz-Ungl. 

2) −1 ≤ ρ(X, Y) ≤ 1

3) Die Klassen fast sicher gleicher Zufallsvariablen X mit E(X 2 ) < ∞ 

bilden den Raum L 2 (P). Durch 〈X, Y〉 = E(X ·Y) wird ein Skalarprodukt 

auf L 2 (P) erklärt. Dann gilt 

〈〉 

X −E(X) 

ρ(X,Y) = cosα = 

‖X −E(X)‖ , Y −E(Y) 

. 

‖Y −E(Y)‖ 

ρ ist damit ein Maß der linearen Abhängigkeit von X −E(X) und 

Y −E(Y). Ist ρ = 0, so sind X und Y linear unabhängig. 

4) Sind X und Y unabhängig, so folgt ρ = 0 und damit die lineare 

Unabhängigkeit. Das ist eine Konsequenz von Satz 9.9. 

5) Die Umkehrung gilt im Allgemeinen nicht, siehe Übung 21. Doch für 

die Normalverteilung gilt sie, wie der folgende Satz zeigt. 

73 

Satz 9.11: Seien X und Y Zufallsvariablen mit Dichte der gemeinsamen 

Verteilung 

f (x,y) = 

( ( 

1 1 (x−µX ) 2 

exp − 

2π(detΣ) 1 2 2(1−ρ 2 ) σX 

2 

−2ρ (x−µ X)(y −µ Y ) 

σ X σ Y 

+ (y −µ Y) 2 

σ 2 Y 

wobei Σ die Kovarianzmatrix ist, d.h. 

( ) 

σX 2 Σ = 

σ XY 

mit σ 

σ XY σY 

2 xy = Kov(X,Y). 

)) 

, 

Dann gilt: ρ = 0 gilt genau dann, wenn X und Y unabhängig sind. 

( ) 

σX 2 Beweis: ρ = 0 bedeutet Σ = 

0 und damit f (x,y) = f 

0 σY 

2 X (x)f Y (y) 

mit 

( ) 

1 

f X (x) = √ exp − (x−µ X) 2 

, 

2πσ 

2 

X 

f Y (y) = 

2σ 2 X 

( ) 

1 

√ exp − (y −µ Y) 2 

2πσ 

2 

Y 

2σY 

2 

Dies sind die Dichten der Randverteilungen von X und Y. Wegen Satz 9.6 

folgt die Unabhängigkeit von X und Y. 

, 

□


Definition 9.12: Seien X, X n ; n ≥ 1 Zufallsvariablen auf (Ω,A,P). 

a) X n 

( 

; n ≥ 1 konvergiert 

) 

fast sicher gegen X, falls gilt: 

P lim X n = X = 1. 

n→∞ 

Schreibweise: X n → X P-fast sicher 

b) X n ; n ≥ 1 konvergiert stochastisch gegen X, falls für alle ε > 0 

gilt: lim 

n→∞ 

P (|X n −X| > ε) = 0. 

Schreibweise: X n P → X 

c) Sei 1 ≤ p < ∞. X n konvergiert im p-ten Mittel gegen X, falls 

lim E(|X n −X| p ) = 0. 

n→∞ 

Satz 9.13: Seien X, X n ; n ≥ 1 Zufallsvariablen auf (Ω,A,P). Äquivalent 

sind folgende Aussagen: 

1) X n → X P-fast sicher 

( ∞ 

) 

⋃ 

2) lim P {|X m −X| ≥ ε} 

n→∞ m=n 

= 0 für alle ε > 0 

3) sup |X m −X| → P 0 für n → ∞ 

m≥n 

{ 

} 

Beweis: Sei A = ω∣ lim X n (ω) = X(ω) . Dieses Ereignis lässt sich auch 

n→∞ 

schreiben als A = ⋂ ⋃ ⋂ { } 

|Xm −X| ≤ 1 k . Dann bedeutet ”Xn → X 

k≥1n≥1 

m≥n 

fast sicher”, dass P (A) = 1 bzw. P (A c ) = 0 ist. Nun hat man folgende 

Kette von Äquivalenzen, aus denen die Behauptung folgt. 

( ⋃ ⋂ ⋃ 

{ 

0 = P (A c ) = P |X m −X| > 1 } ) 

k 

k≥1n≥1 

m≥n 

( ⋂ ⋃ 

{ 

⇔ 0 = P |X m −X| > 

k} ) 1 ∀k 

n≥1 m≥n 

( ⋃ 

m≥n{ 

⇔ 0 = lim 

n→∞ 

P 

⇔ 0 = lim 

n→∞ 

P 

|X m −X| > 1 k} ) ∀k 

( { 

sup |X m −X| > 1 }) 

m≥n k 

∀k 

□

75 

Korollar 9.14: X n → X fast sicher ⇒ X n P → X. 

Beweis: ”X n → X fast sicher” ist äquivalent zu sup|X m −X| → P 0, woraus 

m≥n 

|X n −X| P → 0 folgt. 

Bemerkung: Die Umkehrung gilt im Allgemeinen nicht. 

Beispiel: Sei Ω = (0, 1], A = B∩(0, 1] und P = λ| (0,1] . 

Sei A n = ( k 

2 l , k+1 

2 l ] 

mit l ≥ 1 und mit 0 ≤ k < 2 l , wobei n = 2 l +k−1 gilt. 

Sei X n = 1 An . Dann gilt: 1) X n P → 0, 

2) lim 

n→∞ 

X n = 1, lim 

n 

X n = 0 P-fast sicher. 

Aussage 1) folgt aus P (|X n | > ε) = P (A n ) ≤ 2 −l . 

Satz 9.15: Seien X, X n ; n ≥ 1 Zufallsvariablen. Dann gilt: 

∞∑ 

a) P (|X n −X| > ε) < ∞ ∀ε > 0 ⇒ X n → X P-fast sicher 

n=1 

b) Ist {X n ; n ≥ 1} unabhängig und gilt X n → 0 P-fast sicher. 

⇒ 

n≥1P ∑ (|X n | > ε) < ∞ 

Beweis: ( ∞ 

) 

⋃ ∑ 

a) P {|X m −X| > ε} ≤ ∞ 

m=n 

m=n 

Wegen Satz 9.13 folgt Aussage a). 

P ({|X m −X| > ε}) n→∞ 

−→ 0 

b) Sei A n = {|X n | > ε}. Dann sind nach Lemma ( 9.8 {A n ; n) ≥ 1} unabhängig. 

Da X n → 0 P-fast sicher, folgt P limsupA n = 0. Mit 

n 

dem Borel-Cantelli-Lemma (Satz 8.8) folgt 

∑ 

(|X n | ≥ ε) = 

n≥1P ∑ P (A n ) < ∞. 

n≥1 

□ 

Satz 9.16: Gelte X P n → X. Dann existiert eine Teilfolge n i ; i ≥ 1 mit 

X ni → X P-fast sicher. 

Beweis: Setze Y n := X n − X. Für alle ε > 0 gilt P (|Y n | ≥ ε) → 0 für 

n → ∞. Dann gibt es eine Teilfolge n i ; i ≥ 1 mit P (|Y ni | ≥ 2 −i ) ≤ 2 −i ,


woraus 

i≥1P ∑ (|Y ni | ≥ 2 −i ) < ∞ folgt. 

Für ε ≥ 2 −i 0 

gilt 

∞∑ 

∞∑ 

P (|Y ni | ≥ ε) ≤ i 0 + P ( |Y ni | ≥ 2 −i) < ∞. 

i=1 

i=i 0 +1 

Mit Satz 9.15 folgt die Aussage. 

□ 

Es soll noch ein Satz zur L p -Konvergenz von Zufallsvariablen angegeben werden. 

Satz 9.17: Seien X n , n ≥ 1, X und Y Zufallsvariablen. Sei 1 

Konvergiere X n → X fast-sicher. Sei außerdem |X n | ≤ Y für alle n mit 

EY p < ∞, so gilt E|X n −X| p → 0 für n → ∞. 

Beweis: Es gilt nach Satz 6.11 für jedes A ∈ A 

∫ ∫ ∫ ∫ 

0 ≤ |X| p dP = lim|X n | p dP ≤ lim |X n |dP ≤ 

n n 

A 

A 

A 

A 

Y dP < ∞. 

Damit ist auch ∫ |X|dP < ∞. Weiter gilt für jedes ε > 0 

∫ 

E|X n −X| p ≤ ε p P(|X n −X| < ε)+ |X n −X|dP 

{|X 

∫ 

n−X|≥ε} 

∫ 

≤ ε p + |X n | p dP + |X| p dP 

{|X n−X|≥ε} {|X 

∫ 

n−X|≥ε} 

≤ ε p +2 Y dP 

{|X 

∫ n−X|≥ε} 

≤ ε p +2 Y dP 

{ sup |X m−X|≥ε} 

m≥n 

{ } 

Die Mengen sup|X m −X| ≥ ε gehen aber absteigend gegen eine Menge 

m≥n 

mit Maß 0. Da ν(A) = ∫ Y dP ein endliches Maß ist, wird deswegen das 

A 

Integral auf der rechten Seite beliebig klein. 

□

Kapitel 10 

Das Gesetz der Großen Zahlen 

Der Wahrscheinlichkeitsraum sei (Ω,A,P), auf dem die Zufallsvariablen 

X 1 ,X 2 ,... definiert seien. 

Satz 10.1: Seien X 1 ,X 2 ,... unabhängig, identisch verteilt mit E(|X 1 |) < 

∑ 

∞ und S n = n X i . Dann gilt: 

i=1 

( 

P 

lim 

n→∞ 

) 

S n 

n = E(X 1) = 1. 

Das Gesetz der Großen Zahlen (Satz 10.1) ist grundlegend für viele Folgerungen 

und Anwendungen. Exemplarisch stellen wir die folgende aus der 

Statistik dar: 

Sei X n = Sn . Nach dem Gesetz der Großen Zahlen gilt: 

n 

X n → E(X 1 ) fast sicher. 

Seien P und Q Maße mit E P (X 1 ) ≠ E Q (X 1 ). Dann existieren Mengen 

A P , A Q ∈ T, T = ⋂ σ(X n ,X n+1 ,...), mit P (A P ) = 1, P (A Q ) = 0 und 

n≥1 

Q(A Q ) = 1, Q(A P ) = 0. 

Der Beweis{ 

ist einfach: } { } 

Setze A P = lim X n = E P (X 1 ) und A Q = lim X n = E Q (X 1 ) . Nach 

n→∞ n→∞ 

dem Gesetz der Großen Zahlen gilt die Aussage. 

77

78 KAPITEL 10. DAS GESETZ DER GROSSEN ZAHLEN 

Nun zur Umkehrung des Gesetzes der Großen Zahlen. 

Satz 10.2: X 1 ,X 2 ,... seien unabhängige, identisch verteilte Zufallsvaria- 

S 

blen mit lim n 

n→∞ n 

= c fast sicher. Dann folgt E(|X 1 |) < ∞. 

Beweis: Sei 

X n 

n = S n 

n − S n−1 

n = S n 

n − n−1 

n 

S n−1 

n−1 . 

Es ist aus dieser Schreibweise offensichtlich, dass Xn → 0 fast sicher. Daraus 

folgt direkt P (|X n | > n u.o.) = 0. Das Borel-Cantelli-Lemma (Satz 

n 

∞∑ 

8.8) liefert, da {X n ; n ≥ 1} unabhängig ist, dass P (|X n | > n) < ∞ 

gilt, was wiederum, da die X i , i ≥ 1 alle identisch verteilt sind, bedeutet, 

∞∑ 

dass P (|X 1 | > n) < ∞. Dies impliziert wegen dem folgenden Lemma 

n=1 

E(|X 1 |) < ∞. 

n=1 

□ 

Lemma 10.3: Sei Y nichtnegative Zufallsvariable. Dann gilt: 

∞∑ 

P (Y > i) ≤ E(Y) ≤ 

i=1 

∞∑ 

P (Y > i). 

i=0 

Beweis: 

∞∑ 

P (Y > i) ≤ 

i=1 

= 

= 

∞∑ 

∫ i 

i=1 

i−1 

∫ i 

∞∑ 

i=1 

i−1 

∞∑ 

P (Y > x) dx = 

∫ i 

i=1 

i−1 

∞∑ 

P (Y > x) dx ≤ P (Y > i−1) 

i=1 

∞∑ 

P (Y > i)+P (Y > 0) = 

i=1 

i=0 

(1−F (x)) dx = E(Y) 

∞∑ 

P (Y > i). 

Beweis von Satz 10.1: Die Folgen X + i = max(X i , 0); i ≥ 1 sind unabhängig 

nach Satz 9.8 und ebenso X − i = −min(X i , 0); i ≥ 1. Folglich 

□

79 

genügt es zu zeigen: a) 

1 

n 

b) 

1 

n 

n∑ 

X i + → E ( ) 

X 1 

+ fast sicher, 

i=1 

n∑ 

X − i → E ( ) 

X1 

− fast sicher. 

i=1 

Setzt man a) und b) zusammen, erhät man 1 n 

n∑ 

X i → E(X 1 ). 

Deswegen können wie o.B.d.A. annehmen: X i ≥ 0. Wir definieren nun: 

i=1 

Y i = X i ·1 {Xi ≤i}, T n := 

n∑ 

Y i . 

i=1 

Sei 1 < α < 2 und k(n) := [α n ], wobei [x] die größte ganze Zahl ≤ x 

bedeutet. Dann gilt: 

(+) 

∑ 

P ({∣ ∣ Tk(n) −E ( )∣ }) 

T k(n) ∣ > εk(n) < ∞. 

n≥1 

T 

Daraus folgt recht direkt: 

k(n) 

→ E(X k(n) 1) fast sicher. 

S 

Es folgt dann weiter: 

k(n) 


S 

Nun folgt schließlich für α → 1: nn 

→ E(X 1 ) fast sicher. 

Dies ist der Beweisgang ! 

Um (+) zu beweisen, stellt man zunächst fest, dass gilt: 

1 ≤ k(n) ≤ α n < k(n+1) ≤ 2k(n) und folglich 

1 

k(n) 2 ≤ 4 

α 2n. 

Zu ε > 0 existierenKonstanten c 1 ,c 2 ,c 3 ,...,dienurvon ε und α abhängen, 

sodass gilt: 

Σ := ∑ P ({∣ ∣ Tk(n) −E ( )∣ }) 

T k(n) ∣ > εk(n) 

n≥1 

∑ Var ( ) 

T k(n) 

≤ c 1 

k(n) 2 mit c 1 = 1 ε 2 

n≥1 

= c 1 

∑ 

k(n) 

1 

k(n) 2 n≥1 i=1 

∑ 

Var(Y i ) 

( 

∑ ∑ 

= c 1 Var(Y i ) 

i≥1 

n:n≥n i 

1 

k(n) 2 ) 

= c 1 

∑ 

i≥1 

Var(Y i )· c2(α) 

i 2 .


Dabei ist n i = min{n | k(n) ≥ i}. Hier hat man außerdem für die Ungleichung 

die Tschebychev-Ungleichung (Satz 6.16) verwendet. 

Dies folgt so: 

∑ 1 

n:n≥n i 

k(n) 2 ≤ 4∑ 1 

α 2n1 {α n ≥i}. 

n≥1 

Sei n 0 das kleinste n mit α n ≥ i, dann folgt weiter: 

∑ 1 

n:n≥n i 

k(n) 2 ≤ 4 1 (1+ 1 α 2n 0 

α + 1 ) 

2 α +... 1 

≤ 4 

4 i 2( ) ≤ c 2(α) 

. 

1− 1 i 2 α 2 

Nun schätzen wir weiter ab: 

∑ 1 ) 

Σ ≤ c 3 

i 2E( Yi 

2 

i≥1 

⎛ ⎞ 

∑ 1 ∑i−1 

∫k+1 

= c 3 

⎝ x 2 F (dx) ⎠ 

i 2 i≥1 k=0 

k 

⎛( ) k+1 

⎞ 

∑ ∑ 

∫ 

= c 3 

⎝ 

1 

x 2 F (dx) ⎠. 

i 2 k≥0 i>k 

Nun ist : 

und 

Damit folgt weiter: 

Σ ≤ 2c 3 

∑ 

k≥0 

1 

k +1 

i>k 

k 

∑ 

∫∞ 

1 

i < 1 

2 x dx = 1 2 k ≤ 2 , falls k ≥ 1, 

k +1 

∑ 

i>0 

∫ 

k+1 

k 

k 

1 

i 2 = 1+∑ i>1 

∑ 

∫ 

x 2 F (dx) ≤ c 4 

1 

i < 2 = 2 , falls k = 0. 

2 k +1 

k≥0 

k+1 

k 

xF (dx) = c 4 E(X 1 ) < ∞. 

Also gilt für alle ε > 0: 

∑ 

P ({∣ ∣ Tk(n) −E ( )∣ }) 

T k(n) ∣ > εk(n) < ∞. 

n≥1 

( 

1 

Aus Satz 9.15 folgt nun: Tk(n) −E ( )) 

T 

k(n) k(n) → 0 fast sicher. 

Für n → ∞ gilt außerdem: E(Y n ) = E ( ( 

X n 1 {Xn≤n}) 

= E X1 1 {X1 ≤n}) 

.

Aber die rechte Seite konvergiert aufsteigend gegen E(X 1 ). 

Es folgt mit einem einfachen Mittelungsargument, dass E(T k(n)) 

k(n) 

→ E(X 1 ) 

und damit T k(n) 

k(n) → E(X 1) fast sicher. 

Nun wollen wir zeigen, dass S k(n) 

k(n) → E(X 1) gilt. Es ist wegen Lemma 10.3 

∞∑ 

P (X j ≠ Y j ) = 

j=1 

∞∑ 

P (X j > j) ≤ E(X 1 ) < ∞. 

j=1 

Daher gilt fast sicher, dass X j (ω) = Y j (ω) für alle hinreichend großen j, 

sagen wir j ≥ m(ω), ist. Dies gilt wegen Borel-Cantelli (Satz 8.8). 

Für n → ∞ gilt S m(ω) 

→ 0 und T m(ω) 

→ 0, woraus T k(n)−S k(n) 

k(n) k(n) k(n) 

sicher folgt und daraus schließlich S k(n) 


Zeige nun Konvergenz der ganzen Folge: 

n→∞ 

−→ α. Daher gilt für n hinreichend groß 1 ≤ k(n+1) 

Es gilt k(n+1) 

k(n) 

Für k(n) < j ≤ k(n+1) ist 

Daher ist 

E(X 1 ) 

α 2 

81 

→ 0 fast 

< α 2 . 

k(n) 

j 

≤ k(n+1) < α 2 und 1 < 1 < α2 . 

k(n) k(n) j k(n) k(n+1) 

S j 

≤ lim 

j→∞ j ≤ lim S j 

j→∞ j ≤ α2 ·E(X 1 ). 

Dies gilt für alle α > 1. Nun lässt man α ց 1 gehen und erhält schließlich 

die Behauptung. 

Es bleibt die Frage, warum die Voraussetzung des Satzes gilt, d.h. warum 

abzählbar viele unabhängige Zufallsvariablen auf einem Wahrscheinlichkeitsraum 

existieren. Der folgende Satz gibt darüber Auskunft. 

□ 

Satz 10.4: Sei (F i ; i ≥ 1) eine FolgevonVerteilungsfunktionen. Danngibt 

es einen Wahrscheinlichkeitsraum (Ω,A,P) und eine Familie von Zufallsvariablen, 

die auf diesem Raum definiert sind, (X i , i ≥ 1) genannt, mit den 

Eigenschaften: a) (X i ; i ≥ 1) sind unabhängig, 

b) F Xi = F i für alle i ≥ 1. 

Dabei sind die F Xi die Verteilungsfunktionen der Verteilungen der X i . 

Der Beweis erfolgt im nächsten Kapitel.


Anwendungen und Beispiele: 

1. Irrfahrt auf R 

∑ 

Seien (X i ; i ≥ 1) unabhängig und identisch verteilt und sei S n = n X i , 

S 0 = 0 mit E(X 1 ) ≠ 0. Das Starke Gesetz der Großen Zahlen besagt: 

S n 

n → E(X 1) fast sicher. 

Dies ist äquivalent zu ”S n ∼ nE(X 1 ) fast sicher” oder zu: 

Für ε > 0 beliebig gilt (1−ε)nE(X 1 ) ≤ S n ≤ (1+ε)nE(X 1 ) für alle 

hinreichend großen n fast sicher. 

D.h. dass S n → ∞ oder S n → −∞ fast sicher gilt. 

Außerdem läuft dabei S n ; n ≥ 1 in dem Kegel 

{(nx; n ≥ 1) | (1−ε)E(X 1 ) ≤ x ≤ (1+ε)E(X 1 )} 

für alle hinreichend großen n fast sicher. 

Für E(X 1 ) = 0 gilt −εn ≤ S n ≤ εn für alle hinreichend großen n fast 

sicher. 

Tatsächlich gilt lim 

n→∞ 

S n = ∞ und lim 

n→∞ 

S n = −∞ fast sicher. 

2. Berechnung von Integralen mit Simulationen 

Sei µ ein Wahrscheinlichkeitsmaß und f eine meßbare Funktion auf [0,1] 

mit 0 ≤ f ≤ 1. Die Aufgabe lautet: Berechne ∫ f dµ ! 

Sei G = {(x,y) |0 ≤ y ≤ f (x)} ⊂ [0,1] 2 . Dann gilt nach Aufgabe 17, daß 

µ⊗λ(G) = ∫ fdλ, wobei λ das Lebesgue-Maß auf [0,1] ist. 

Seien U 1 ,U 2 ,... unabhängig, identisch verteilt mit Werten in [0,1] 2 und 

verteilt nach P = µ⊗λ. Sei U i = (X i , Y i ). Dann gilt 

P (U i ≤ (α, β)) = µ⊗λ({X i ≤ α, Y i ≤ β}) = µ((−∞, α])·λ((0, β]). 

Sei Î n = 1 n #{i|U i ∈ G} = 1 n 

n∑ 

1 G (U i ). Dann gilt 

i=1 

∫ 

Î n → E1 G (U 1 )P U 1 

(G) = f dµ fast sicher. 

i=1

83 

Das heißt, man wirft unabhängig nach P verteilte Punkte in das Gebiet 

[0,1] 2 und zählt, wieviele davon in G landen. Der relative Anteil Î n ist ein 

asymptotisch korrekter Schätzer des Integrals. 

n∑ 

Beweis: Sei Z i = 1 G (U i ). Î n = 1 Z 

n i → E(Z 1 ) fast sicher. Aber 

i=1 

E(Z 1 ) = E(1 G (U 1 )) = P (U 1 ∈ G) 

∫ 

= (µ⊗λ)({(x,y) |0 ≤ y ≤ f (x)}) = f dµ. 

Letzte Gleichung folgt mit Aufgabe 17. 

□ 

3. Das Glivenko-Cantelli-Lemma 

Eine Verteilungsfunktion lässt sich ausden Datenschätzen. Seien X 1 ,X 2 ,... 

i=1 

unabhängig, identisch verteilt mit Verteilungsfunktion F, d.h. P (X i ≤ α) = 

n∑ 

F (α) für α ∈ R. Sei ̂Fn (t) = 1 1 

n {Xi ≤t}. Dann sind 1 {Xi ≤t}, i ≥ 1 unabhängig, 

identisch verteilt und es gilt nach dem Starken Gesetz der Großen 

Zahlen ̂F n (t) → E ( 1 {X1 ≤t}) 

. 

Aber E ( 1 {X1 ≤t}) 

= P (X1 ≤ t) = F (t) und damit gilt: ̂Fn (t) → F (t) fast 

sicher für jedes t. 

Es gilt weiter, da F (t) in t monoton ist, dass sup 

t 

sicher. 

∣ 

∣̂F n (t)−F (t) ∣ → 0 fast 

Weiterhin gilt, dass auch für glatte Funktionale t t(̂F n )→ t(F) fast sicher 

gilt. Z.B. gilt ̂σ n 2 → σ 2 fast sicher, denn: 

̂σ n 2 = 1 n∑ 

(x i −x n ) 2 = 1 n∑ 

∫ 

x 2 i −x 2 n = 

n n 

Nun gilt: 

i=1 

∫ 

∫ 

Damit folgt die Aussage. 

i=1 

4. Die Waldsche Identität 

(∫ 

x 2 ̂Fn (dx)− 

∫ 

x 2 ̂Fn (dx) −→ x 2 F (dx) = E ( X 2) 

∫ 

x ̂F n (dx) −→ xF (dx). 

und 

) 2 

x ̂F n (dx) 

Seien X 1 ,X 2 ,... unabhängig, identisch verteilt mit E(|X 1 |) < ∞. Eine


Zufallsvariable N mit Werten in N∪{0} heißt Stoppzeit, falls {N = n} ∈ 

σ(X 1 ,..., X n ) ist für n ≥ 1. Zum Beispiel ist N = min{n ≥ 1|S n ≥ b} 

∑ 

eine Stoppzeit, falls S n = n X i ist. 

i=1 

Die Waldsche Identität lautet: 

Falls E(N) < ∞ ist, gilt E(X 1 +...+X N ) = E(X 1 )·E(N). 

∑ 

Erläuterung zu N X i : 

i=1 

Zu ω ∈ Ω wähle N (ω) Variablen X 1 (ω),X 2 (ω),...,X N(ω) (ω) und addiere 

diese ! 

Beweis: Seien N 1 ,N 2 ,... unabhängig, identisch verteilt wie N. 

Sei S 1 = X 1 +...+X N1 

S 2 = X N1 +1 +...+X N1 +N 2 

. 

S 1 ,S 2 ,... sind unabhängig, identisch verteilt und verteilt wie X 1 +...+X N . 

(ohne Beweis) Dann folgt 

S 1 +...+S k 

k 

= X 1 +...+X N1 +...+X Nk 

N 1 +...+N k 

· N1 +...+N k 

. 

k 

Da E(N) < ∞ ist, folgt N 1+...+N k 

k 

→ E(N) und weiter 

N 1 +...+N k → ∞ fast sicher. 

Es folgt, der erste Term auf der rechten Seite konvergiert gegen E(X 1 ) und 

damit konvergiert die rechte Seite. Damit konvergiert die linke Seite gegen 

E(S 1 ). Daraus folgt E(S 1 ) = E(X 1 )·E(N). 

Eine Anwendung der Waldschen Identität ist folgende: 

Seien (X i ; i ≥ 1) unabhängig, identisch verteilt mit P (X i = 1) = p und 

P (X i = −1) = 1−p und mit E(X i ) = 2p−1 > 0. 

Sei N b = min{n ≥ 1|S n ≥ b} mit b ∈ N. 

Dann gilt E(N b ) < ∞ und E(N b ) = b 

2p−1 . 

Letztes folgt aus der Waldschen Identität: 

b = E(S Nb ) = E(X 1 )·E(N b ) .

85 

Dass E(N b ) < ∞ ist, lässt sich ähnlich wie oben die Waldsche Identität 

beweisen: Konvergenz der rechten Seite liefert die der linken etc.

86 KAPITEL 10. DAS GESETZ DER GROSSEN ZAHLEN

Kapitel 11 

Unendliche Produkträume 

Ziel dieses Kapitels ist es zu zeigen, dass die Voraussetzungen des Gesetzes 

der GroßenZahlenerfüllt sind. Genauer bedeutet dies, Satz10.4zubeweisen. 

Dazu konstruieren wir unendliche Produkträume. 

Wir gehen von einer Folge von Maßräumen (Ω i ,A i ,µ i ), i ≥ 1 aus, wobei 

∏ 

µ i (Ω i ) = 1 für alle i ist. Sei Ω := ∞ Ω i = { } 

(ω i ) i≥1 

|ω i ∈ Ω i . 

i=1 

A = ∏ A i × ∏ Ω i mit E ⊂ N endlich heißt Rechteck. 

i∈E 

i∈N\E 

Sind A i ∈ A i , i ∈ E, so heißt A meßbares Rechteck. 

Sei S die Menge aller meßbaren Rechtecke. S ist ein Semiring mit Ω ∈ S. 

⊗ 

Sei A = ∞ A i , die von S erzeugte σ-Algebra über Ω. 

i=1 

Wichtig sind für alle folgenden Konstruktionen Mengensysteme kompakter 

Mengen. 

Definition 11.1: Ein Mengensystem C, das durchschnittsstabil ist, heißt 

⋂ 

kompakte Klasse, falls für jede Folge (C n ; n ≥ 1) aus C mit C n = ∅ 

⋂ 

n≥1 

ein n 0 ∈ N existiert mit C n = ∅. 

n≤n 0 

87

88 KAPITEL 11. UNENDLICHE PRODUKTRÄUME 

Satz 11.2: J sei abzählbar unendlich. Für jedes i ∈ J existiere eine kompakte 

Klasse C i ⊂ A i mit 

(IR) 

µ i (A) = sup{µ i (C)|C ∈ C i ,C ⊂ A}. 

( ∞ 

) 

∏ ∞⊗ 

Dann gibt es genau ein Wahrscheinlichkeitsmaß µ auf Ω i , A i 

i=1 i=1 

µ(A) = ∏ µ i (A i ), wobei A = ∏ A i × ∏ 

Ω i ist. 

i∈E 

i∈E 

i∈N\E 

mit 

Wichtig für alles Folgende ist das harmlos klingende nächste Lemma. Doch 

hier steckt der ”Teufel” in abstrakten Details. 

Lemma 11.3: C sei kompakt. Dann ist auch die Klasse C ′ aller endlichen 

Vereinigungen von Elementen aus C kompakt. 

Beweis: Sei D n ∈ C ′ mit ⋂ 

n≤p 

D n lässt sich schreiben als D n = Mn ⋃ 

D n ≠ ∅ für alle p. Zeige ⋂ 

n≥1 

D n ≠ ∅. 

Cn m mit Cn m ∈ C. Seien 

m=1 

J = 

n≥1{1,2,...,M ∏ { 

n } und J p = (m n ) ∈ J ∣ ⋂ Cn 

mn 

n≤p 

Dann ist J p ≠ ∅, denn ∅ ≠ ⋂ D n = ⋂ ( 

Mn 

) 

⋃ 

⊂ ⋃ ⋂ 

Denn sei x ∈ ⋂ 

n≤p 

Es folgt x ∈ ⋂ 

n≤p 

n≤p 

n≤p 

Cn 

m 

m=1 

D n . Dann ist x ∈ C m′ n 

n für jedes n ≤ p. 

C m′ n 

n . 

≠ ∅ & C mn 

n 

(m n)∈J n≤p 

C mn 

n . 

} 

∈ C . 

Nun ist J kompakt in der diskreten Topologie aufgrund des Satzes von Tychonov 

(”Produkte von kompakten Räumen sind kompakt in der Produkttopologie”). 

Die J p ; p ≥ 1 sind eine Folge von absteigenden abgeschlossenen nichtleeren 

⋂ 

Mengen ⊂ J. Folglich ist J p ≠ ∅. Beachte J p ≠ ∅ ∀p ! Somit gibt es 

p≥1 

eine Folge (m ∗ n) n≥1 

in ⋂ J p . 

p≥1 

⋂ 

Es folgt D n ⊃ ⋂ ≠ ∅, denn ⋂ ≠ ∅ für alle p und C ist 

kompakt. 

n≥1 

n≥1 

C m∗ n 

n 

n≤p 

C m∗ n 

n

Satz 11.4: 

1) Sei R Ring über Ω und sei C eine kompakte Unterklasse von R. 

Jeder endliche Inhalt µ mit der Eigenschaft 

(IR) µ(A) = sup{µ(C)|C ⊂ A, C ∈ C} 

für A ∈ R ist σ-additiv. 

2) Ist S Semiring und C ⊂ S und gilt (IR) auf S, so ist µ σ-additiv 

auf R(S). 

Beweis: 

1) Zeige σ-Stetigkeit in ∅. Dies genügt nach Satz 3.6. 

Sei A n ;n ≥ 1 eine Folge in R mit A n ↓ ∅, d.h. A n+1 ⊂ A n und 

⋂ 

A n = ∅. Sei ε > 0 beliebig. Sei C n ∈ C mit C n ⊂ A n und 

n≥1 

µ(A n ) ≤ µ(C n )+ε·2 −n . Es ist ⋂ C n ⊂ ⋂ A n = ∅. 

n≥1 n≥1 

⋂ 

Wegen Kompaktheit gibt es eine Zahl n 0 mit C n = ∅. 

n≤n 0 

Es folgt A n0 = ⋂ A n ⊂ ⋃ (A n \C n ), denn sei x ∈ ⋂ A n . Dann 

n≤n 0 n≤n 0 n≤n 0 

existiert ein n ′ ≤ n 0 mit x ∈ Cn c ′, da ⋂ 

C n = ∅. Daher ist x ∈ 

n≤n 0 

A n ′ \C n ′. Es folgt: 

µ(A n0 ) ≤ ∑ n≤n 0 

µ(A n \C n ) ≤ ∑ n≤n 0 

(µ(A n )−µ(C n )) 

89 

≤ ∑ n≥1ε·2 −n = ε 

und somit µ(A n ) ≤ ε für alle n ≥ n 0 . 

2) Die Klasse C ′ der endlichen Vereinigungen von Elementen aus C ist 

wegen Lemma 11.3 kompakt und enthalten in R(S). 

Zeige (IR) auf R(S). 

Sei A ∈ R. Dann ist A = n ⋃ 

i=1 

S i mit S i ∈ S. Dann gibt es C i ∈ C mit 

C i ⊂ S i und µ(S i ) ≤ µ(C i )+ ε für i = 1,...,n nachVoraussetzung. 

n ( 

n⋃ 

⋃ n 

Dann folgt C i ⊂ A und µ(A) ≤ µ C i 

)+ε. 

i=1 

i=1 

Da C ′ kompakt ist, lässt sich nun Teil 1) anwenden.


Nun kommen wir zum Beweis von Satz 11.2: Sei 

{ ∏ 

C = C i × ∏ ∣ } 

∣∣∣ 

Ω i C i ∈ C i , E ⊂ N endlich . 

i∈E 

i∈N\E 

Wir zeigen: 1) C ist kompakte Klasse, 

2) Für S gilt (IR) mit C. 

Wegen Satz 11.4 ist dann µ σ-additiv auf S und damit auf R(S), was 

⊗ 

aufgrunddes Fortsetzungssatzes die σ-Additivität auf A = ∞ A i impliziert. 

i=1 

{ 

Zeige 1): Sei D = C × 

i≠jΩ ∏ ∣ } 

∣∣C 

i ∈ Cj , j ∈ N . 

Behauptung: D ist kompakte Klasse. 

Denn: Der Durchschnitt einer abzählbaren Folge 

{C n × ∏ } 

Ω i ; n ≥ 1 hat 

i≠i n 

die Gestalt 

∏ 

(+) B j × ∏ 

mit B j = ⋂ 

C n , 

j∈T 

j∈N\T 

Ω i 

n|i n=j 

d.h. B j ∈ C j , da für C n gilt, dass i n = j ist. 

Ist nun der Durchschnitt ⋂ ( 

C n × ∏ ) 

Ω i = ∅, so folgt, dass zumindest eine 

n≥1 i≠i n 

Menge B j0 , j 0 ∈ T leer sein muss: B j0 = ⋂ C n = ∅. 

n|i n=j 0 

Aber alle C n liegen in C j0 . Wegen 

( 

der Kompaktheit von C j0 existiert ein k 

k⋂ 

k⋂ 

mit C ni = ∅. Damit folgt C ni × ∏ ) 

Ω i = ∅. Damit ist D kompakt. 

i=1 

i=1 i≠j 

{ 

0 

∏ 

Nun zu C = C i × ∏ ∣ } 

∣∣Ci 

Ω i ∈ C i , E ⊂ N endlich ! 

i∈E i∈N\E 

Der Durchschnitt einer abzählbaren Folge aus C hat auch die Gestalt (+). 

Deswegen lässt sich dasobigeArgument für C entsprechend wiederholen und 

zeigen, dass C auch kompakt ist. 

Zeige 2): Für S gilt (IR) mit C. 

∏ 

Sei A = n ∏ 

A ij × Ω i . 

j=1 

i∈N\{i 1 ,...,i n} 

( ) 

Zu ε > 0 sei 

( 

C j ∈ C ij mit C j ⊂ A ij und µ ij Aij ≤ µij (C j )+ ε. 

n 

⋂ 

Sei C = n C j × ∏ ) 

∏ 

Ω i = n ∏ 

C j × Ω i . 

j=1 i≠i j j=1 

i∈N\{i 1 ,...,i n}

91 

Dann ist C ∈ C und C ⊂ A. 

Nun ist - man mache eine Skizze - A\C ⊂ n ⋃ 

Daher gilt: 

j=1 

{ (Aij 

\C j 

) 

× 

∏ 

i≠i j 

Ω i 

} 

. 

µ(A)−µ(C) = µ(A\C) 

n∑ 

( (Aij ) ∏ 

) n∑ ( ) 

≤ µ \C j × Ω i = µ ij Aij \C j 

j=1 

i≠i j j=1 

n∑ ( ( ) 

= µij Aij −µij (C j ) ) ≤ ε. 

j=1 

Daraus folgt (IR) für C. 

□ 

Lemma 11.5: Sei µ ein endliches Maß auf (R, B). Dann gilt für jede Borelmenge 

A: a) µ(A) = inf{µ(U)|A ⊂ U, U offen}, 

b) µ(A) = sup{µ(C)|C ⊂ A, C abgeschlossen}, 

c) µ(A) = sup{µ(K)|K ⊂ A, K kompakt}. 

Beweis: Sei R die Menge aller Borelmengen, für die die Approximationseigenschaften 

a) und b) gelten. 

1) R enthält die offenen Mengen von R. 

a) ist trivial; 

b) Sei V offen. Dann gilt V = ⋃ 

Setze F n = ⋃ 

j≤n 

gilt µ(F n ) ↑ µ(V). 

2) R ist σ-Algebra. 

Vorbereitend: A ∈ R ⇔ 

n≥1 

C n mit C n abgeschlossen. 

C j . F n ist abgeschlossen und F n ↑ V. Damit 

Für jedes ε > 0 existiert eine offene 

Menge U und eine abgeschlossene Menge C mit C ⊂ A ⊂ U und 

µ(U \C) < ε.


i) R ist abgeschlossen gegen Komplemente 

Sei A ∈ R mit C ⊂ A ⊂ U, C abgeschlossen, U offen mit 

µ(U \C) < ε. ⇒ U c ⊂ A c ⊂ C c und 

µ(C c \U c ) = µ(C c )−µ(U c ) 

= µ(Ω)−µ(C)−µ(Ω)+µ(U) 

= µ(U)−µ(C) = µ(U \C) < ε. 

ii) R ist abgeschlossen gegen abzählbare Vereinigungen 

Seien A i ∈ R mit C i ⊂ A i ⊂ U i mit C i abgeschlossen bzw. 

U i offen und mit µ(U i \C i ) ≤ ε·2 −(i+1) . 

Seien U = ⋃ U i , A = ⋃ A i und C = ⋃ C i . U ist offen, C 

i≥1 

i≥1 

ist nicht notwendig abgeschlossen. Doch C ⊂ A ⊂ U und 

( ⋃ 

) 

µ(U \C) ≤ µ (U i \C i ) ≤ ∑ (µ(U i )−µ(C i )) < ε 2 . 

i≥1 i≥1 

i≥1 

⋃ 

Sei nun C n = n C i , C n ↑ C und C n ist abgeschlossen. 

i=1 

Somit ist µ ( C n 

) 

ր µ(C). 

⇒ ∃n 0 mit µ ( C \C n0 

) 

< 

ε 

2 

⇒ C n0 ⊂ A ⊂ U und C n0 ist abgeschlossen und U ist offen. 

Außerdem gilt µ(U −C n0 ) < ε. 

Nun zu c): Nach dem vorangegangenen Beweis existiert ein C ⊂ A mit 

µ(C) > µ(A) − ε mit C abgeschlossen. Dann ist K n = C ∩ {x||x| ≤ n} 

kompakt mit K n ↑ C und µ(K n ) ↑ µ(C). Ist n hinreichend groß, so gilt 

µ(K n ) > µ(A)−ε. 

□

Nun zum Beweis von Satz 10.4: Seien Ω i = R und A i = B. Sei µ i = P i , 

wobei P i das Wahrscheinlichkeitsmaß zur Verteilungsfunktion F i ist. Dann 

∏ 

ist Ω = ∞ ⊗ 

Ω i = R N . Außerdem ist A = ∞ A i = B N . 

i=1 

Nun gilt (IR) auf Ω i wegen Lemma 11.5. Nach Satz 11.2 folgt nun, dass 

⊗ 

µ = ∞ P i existiert und die Eigenschaft hat µ(A) = ∏ P i (A i ), wobei 

i=1 

i∈E 

A = ∏ A i × ∏ Ω i ist. 

i∈E 

i∈N\E 

Sei X i : Ω → R mit X i (x 1 ,x 2 ,...) = x i . Dann ist X i meßbar für jedes i 

i=1 

und 

⎛ 

µ({X i1 ∈ A i1 ,...,X in ∈ A in }) = µ ⎝ ∏ 

= 

j∈{i 1 ,...,i n} 

n∏ ( ) 

P ij Aij . 

j=1 

A j × 

∏ 

j∈N\{i 1 ,...,i n} 

Ω i 

⎞ 

⎠ 

93

94 KAPITEL 11. UNENDLICHE PRODUKTRÄUME

Kapitel 12 

Der Zentrale Grenzwertsatz 

In der Grundvorlesung wurde bereits der um 1780 erstmals bewiesene Satz 

von de Moivre-Laplace gezeigt: 

Seien X 1 ,X 2 ,... unabhängige Bernoulli-Variablen mit 

P (X i = 1) = p, P (X i = 0) = 1−p, p ∈ [0,1]. 

∑ 

Sei S n = n X i für n ∈ N. Dann gilt für b ∈ [−∞,∞] mit Sn ∗ = √ 

Sn−np 

np(1−p) 

i=1 

Dabei ist Φ(b) = 

∫ b 

−∞ 

lim P 

n→∞ (S∗ n ≤ b) = Φ(b) . 

( ) 

√1 

2π 

exp 

− x2 

2 

dx. 

Definition 12.1: Eine Zufallsvariable X heißt normalverteilt mit Erwartungswert 

µ und Varianz σ 2 , falls 

∫ α ( ) ( ) 

1 

P (X ≤ α) = √ exp − (x−µ)2 α−µ 

dx = Φ 

2πσ 

2 2σ 2 σ 

für α ∈ R gilt. 

−∞ 

Man sagt X ist nach N (µ, σ 2 ) verteilt. 

Die Faltungseigenschaft der Normalverteilung 

Seien X 1 ,X 2 ,...,X n unabhängig und identisch nach N(µ,σ 2 ) verteilt. Dann 

ist S n = X 1 + ··· + X n nach N(nµ,nσ 2 ) verteilt und folglich S ∗ n = Sn−nµ √ nσ 

nach N(0,1) verteilt (siehe auch Stochastik I, S. 90). 

95

96 KAPITEL 12. DER ZENTRALE GRENZWERTSATZ 

Satz 12.2 (Zentraler Grenzwertsatz): X 1 , X 2 ,... seien unabhängig 

und identisch verteilt mit E(X 1 ) = µ und Var(X 1 ) = σ 2 < ∞. Dann 

gilt für alle b ∈ R 

( 

lim P Sn −nµ 

√ 

n→∞ nσ 

2 

) 

≤ b = Φ(b) . 

Bemerkung:DerSatzvondeMoivre-LaplaceisteinSpezialfallvonSatz12.2. 

Den Beweis liefert das folgende ”Invarianzprinzip” zusammen mit dem Satz 

von de Moivre-Laplace oder der Faltungseigenschaft der Normalverteilung. 

Definition 12.3: Seien F, F n ; n ≥ 1 Verteilungsfunktionen. 

F n → F bedeutet F n (x) → F (x) für alle x ∈ C(F). Dabei bezeichnet 

C(F) die Menge der Stetigkeitspunkte von F. 

Sei nun X Zufallsvariable, dann bezeichnet L(X) die Verteilung von X. 

Falls L(X n ) Verteilungsfunktion F n und L(X) Verteilungsfunktion F hat, 

so bedeutet L(X n ) → L(X), dass F n → F gilt. 

Satz 12.4: Wenn es eine Folge X 1 , X 2 ,... von unabhängigen, identisch 

verteilten Zufallsvariablen gibt mit E(X 1 ) = 0 und Var(X 1 ) = 1, sodass 

für n → ∞ L 

( ∑ n X i 

i=1 

√ n 

)→ L(X) gilt, dann gilt für jede Folge X ′ 1 , X′ 2 ,... 

von unabhängigen, identisch verteilten Zufallsvariablen mit E(X ′ 1 ) = 0 und 

Var(X ′ 1) = 1, dass L 

( ∑ n X i 

′ 

i=1 

√ n 

)→ L(X) für n → ∞ ist. 

Für die Bezeichnungen siehe die folgende Definition. 

Lemma 12.5: Seien F, F n ; n ≥ 1 Verteilungsfunktionen auf R. 

Seien 

{ 

P, P n ; n ≥ 1 die zugehörigen Maße. Sei 

E = f |f : R → R beschränkt,2mal stetig diffbar mit sup 

x 

Wenn ∫ f dP n → ∫ f dP für f ∈ E, so gilt F n → F. 

} 

|f ′′ (x)| < ∞ . 

Beweis: Seien a,b ∈ C(F). Sei fa,b ε ∈ E mit fε a,b (x) = 1 für x ∈ [a,b] 

und fa,b ε (x) = 0 für x ∉ [a−ε,b+ε]. Sei δ > 0 vorgegeben und ε > 0 so

97 

gewählt, dass F (b+ε) − F (b) < δ 4 und F (a) − F (a−ε) < δ 4 

folgt: 

gilt. Dann 

F n (b)−F n (a)−(F (b)−F (a)) ≤ 

( 

≤ F n (b)−F n (a)− F (b+ε)−F (a−ε)− δ ) 

2 

≤ P n ((a,b])−P ((a−ε,b+ε])+ δ 

∫ ∫ 2 

≤ fa,b ε dP n − fa,b ε dP + δ 2 ≤ δ 

für hinreichend große n und a,b ∈ C(F). 

Ganz ähnlich folgt F (b)−F (a)−(F n (b)−F n (a)) ≤ δ für alle a,b ∈ C(F). 

Dann folgt F n (b) → F (b) für b ∈ C(F). 

Lemma 12.6: Gilt F n → F, so gilt ∫ f dP n → ∫ f dP für alle f beschränkt 

und stetig. 

Beweis: Sei z 0 > 0. Weiter unten wird z 0 noch genauer festgelegt. 

Sei P l eine Partition von I = [−z 0 ,z 0 ] bestehend aus I j = (a j ,b j ], j = 

1,..., l mit a j ,b j ∈ C(F). 

∑ 

Seien f + 

l 

(x) = l ( ) ∑ 

maxf (x) 1 Ij (x) und f − 

l 

(x) = l 

j=1 x∈I j j=1 

Dann gilt f − 

l 

(x) ≤ f (x) ≤ f + 

l 

(x) und 

∫ 

I 

f − 

l 

dP = 

l∑ ( 

j=1 

minf (x) 

x∈I j 

( 

) 

(F (b j )−F (a j )) 

minf (x) 

x∈I j 

l∑ ( ) 

= lim minf (x) (F n (b j )−F n (a j )) 

n→∞ x∈I j 

j=1 

∫ 

= lim 

n→∞ 

I 

f − 

l 

dP n . 

Entsprechendes gilt für f + 

l 

. 

Da f − 

l 

ր f und f + 

l 

ց f, folgt lim 

∫ 

I 

∫ 

f − 

l 

dP = lim 

n→∞ 

I 

n→∞ 

∫ 

I 

f dP n = ∫ I 

∫ 

f − 

l 

dP n ≤ lim 

n→∞ 

I 

f dP n 

f dP, denn 

) 

1 Ij (x).


∫ 

≤ lim 

n→∞ 

I 

∫ 

f dP n ≤ lim 

n→∞ 

I 

∫ 

f + 

l 

dP n = 

I 

f + 

l 

dP . 

Sei nun M = sup|f (x)|. Sei ε > 0 vorgegeben. Dann existiert ein z 0 > 0, 

x 

sodass 1 − F (z 0 ) < ε und F (−z 8M 0) < ε und |F 8M n(z 0 )−F (z 0 )| < ε 

8M 

sowie |F n (−z 0 )−F (−z 0 )| < ε für hinreichend große n gelten. Dann ist 

8M 

∣ ∫ ∫ 

∣∣∣∣∣ ∫ ∫ 

∣ f dP n − f dP 

∣ ≤ f dP n − f dP 

∣ 

I I 

∫ ∫ 

+ |f| dP n + |f| dP 

≤ 

∫ 

∣ 

I 

{|z|≥z 0 } 

∫ 

f dP n − 

I 

{|z|≥z 0 } 

f dP 

∣ + ε 2 ≤ ε 

für n hinreichend groß. 

Lemma 12.7: Sei (Ω,A,P) ein Wahrscheinlichkeitsraum mit unabhängigen, 

identisch verteilten Zufallsvariablen X 1 ,X 2 ,... mit Verteilungsfunktion 

F und sei (Ω ′ ,A ′ ,P ′ ) ein Wahrscheinlichkeitsraum mit unabhängigen, 

identisch verteilten Zufallsvariablen X 1 ′,X′ 2 ,... mit Verteilungsfunktion G. 

Dann existiert ein Wahrscheinlichkeitsraum (˜Ω,Ã, ˜P) mit unabhängigen, 

identisch verteilten Zufallsvariablen ˜X 1 , ˜X 2 ,... mit Verteilungsfunktion F 

und unabhängigen, identisch 

{ 

verteilten Zufallsvariablen ˜X 1 ′, ˜X 2 ′ ,... mit Verteilungsfunktion 

G, sodass ˜X1 , ˜X 

{ 

2 ,...} 

∪ ˜X′ 1 , ˜X 

} 

2 ′,... unabhängig ist. 

Beweis: Bilde das Produkt (Ω×Ω ′ ,A⊗A ′ ,P ⊗P ′ ) und definiere 

˜X i (ω,ω ′ ) = X i (ω) und ˜X ′ i(ω,ω ′ ) = X ′ i(ω ′ ) für ω ∈ Ω und ω ′ ∈ Ω ′ . 

Dieser Raum und die Zufallsvariablen haben die gewünschten Eigenschaften. 

Nun zum Beweis von Satz 12.4: 

Seien Z n = 1 √ n 

(X 1 +...+X n ) und Z ′ n = 1 √ n 

(X ′ 1 +...+X ′ n). Es gelte 

L(Z n ) → L(X). 

Mit Lemma 12.6 gilt ∫ f dP n → ∫ f dP und somit E(f (Z n )) → E(f (X))

99 

für f ∈ E. Nach Lemma 12.5 genügt zu zeigen: 

E(f (Z n ′ )) → E(f (X)) für f ∈ E . 

Nach Lemma 12.7 können wir annehmen, dass {X 1 ,X 2 ,...}∪{X ′ 1 ,X′ 2 ,...} 

unabhängig ist. Wir zeigen nun, dass E(f 

( 

(Z n ))−E(f (Z 

( n ′ )) → 0 gilt. 

f (Z n )−f (Z n ′) = V 1+...+V n mit V k = f U k + √ X k 

n 

)−f U k + √ X′ k 

n 

), wobei 

U k = 1 √ n 

( 

X1 +...+X k−1 +X ′ k+1 +...+X′ n) 

ist. Wir entwickeln nun die 

V k mit der Taylor-Formel: 

V k = f 

( 

U k + X k 

√ n 

)−f 

( ) 

U k + X′ k 

√ n 

= √ 1 (X k −X ′ 

n 

k)f ′ (U k )+ 1 

2n 

( (f ′′ 

+ X2 k 

2n 

− X′2 k 

2n 

mit 0 ≤ θ, θ ′ ≤ 1 und zufällig. 

( ) 

X 

2 

k −X k 

′2 f ′′ (U k ) 

) 

U k + θX k 

√ 

)−f ′′ (U k ) n 

( ) 

(f ′′ U k + θ′ X k 

′ √ 

)−f ′′ (U k ) n 

Nun zeigen wir, dass in der Taylor-Entwicklung die beiden ersten Terme Erwartungswert 

0 haben. 

A. Es ist E((X k −X ′ k )f′ (U k )) = 0, denn 

E((X k −X ′ k )f′ (U k )) = E(X k −X ′ k )E(f′ (U k )) 

= (E(X k )−E(X ′ k ))E(f′ (U k )) = 0 

wegen Unabhängigkeit und da E(X k ) = E(X ′ k ) = 0 gilt. 

Man beachte auch, dass E(|f ′ (U k )|) < ∞ ist, denn 

|f ′ (x)| ≤ c 0 +c 1 |x|, da sup|f ′′ (x)| < ∞ gilt, denn f ∈ E. 

x


B. Es ist E(( 

X 2 

k 

− X′2 k 

2n 2n 

(( X 

2 

E k 

2n − X′2 k 

2n 

) ) 

f ′′ (U k ) = 0, denn 

) ) ( X 

f ′′ 2 

(U k ) = E k 

= 1 

2n 

= 0 

) 

E(f ′′ (U k )) 

2n − X′2 k 

2n 

( ( ) ( )) 

E X 

2 

k −E X 

′2 

k E(f ′′ (U k )) 

wegen Unabhängigkeit und da E(X 2 k ) = E(X′2 k ) = 1 gilt. 

Setzt man δ(h) = sup |f ′′ (y)−f ′′ (x)|, so folgt mit A und B: 

|x−y|≤h 

|E(V k )| ≤ E 

( X 

2 

k 

2n δ ( |Xk | 

√ n 

))+E 

= 1 

2n (E(h n(X k ))+E(h n (X k ′ ))) 

( 

mit h n (x) := x 2 δ |x| 

√ n 

). Somit folgt: 

( ( )) X 

′2 

k |X 

′ 

2n δ k | 

√ n 

|E(f (Z n ))−E(f (Z ′ n))| ≤ |E(V 1 )|+...+|E(V n )| 

≤ 1 2 (E(h n(X 1 ))+E(h n (X ′ 1 ))) , 

da alle X k identisch verteilt sind und auch alle X ′ k . 

Nun gilt für alle x ∈ R h n (x) n→∞ 

−→ 0, da δ(h) → 0 für h → 0 wegen der 

Stetigkeit von f ′′ . Es folgt h n (X 1 ) → 0 P-fast sicher. 

Da sup|f ′′ (x)| ≤ M ist, folgt supδ(h) ≤ 2M und h n (X 1 ) ≤ 2M ·X1 2. 

x 

h 

Nun lässt sich der Satz von der majorisierten Konvergenz anwenden und es 

folgt E(h n (X 1 )) → 0. Ebenso folgt E(h n (X 1 ′ )) → 0. 

Dies ergibt |E(f (Z n ))−E(f (Z n ′ ))| → 0. 

Nun noch einige Folgerungen: 

1) Die asymptotische Verteilung von X n : 

n∑ 

Sei X n = 1 X 

n i ,wobei X i unabhängig,identischverteiltseienund E(X1 2) < 

i=1 

∞. Dann gilt mit µ = E(X 1 ) und σ 2 = Var(X 1 ) 

( √n ( 

Xn −µ ) ) 

L 

σ 

−→ N (0, 1) .

101 

Dies folgt, da 

√ n(X n−µ) 

σ 

= √ Sn−E(Sn) , wobei S ∑ 

n = n 

Var(Sn) 

i=1 

X i gilt. 

2) Das δ-Prinzip: 

Seien X i , i ≥ 1 wie in 1). Sei g : R → R zweimal stetig differenzierbar mit 

sup|g ′′ (x)| < ∞. Dann gilt: 

x 

Beweis: 

L (√ n ( g ( X n 

) 

−g(µ) 

)) 

−→ N 

( 

0, g ′ (µ) 2 σ 2) . 

g ( X n 

) 

−g(µ) = 

( 

Xn −µ ) g ′ (µ)+ 1 2 

wobei 0 ≤ δ ≤ 1 und zufällig ist. Nun gilt wegen 1) 

( 

Xn −µ ) 2 

g 

′′ ( µ+δ ( X n −µ )) , 

L (√ n ( X n −µ ) g ′ (µ) ) −→ N ( 0, g ′ (µ) 2 σ 2) . 

Für den zweiten Term in der Taylor-Entwicklung gilt: 

√ nE 

( (Xn 

−µ ) 2∣ ∣g ′′ ( µ+δ ( X n −µ ))∣ ∣ ) ≤ M √ nE( (Xn 

−µ ) 2 ) 

= Mσ2 √ n 

. 

Somit gilt √ n ( X n −µ ) 2 

g 

′′ ( µ+δ ( X n −µ )) P → 0. 

Um die Aussage zu folgern, braucht man noch das folgende Lemma. 

Lemma 12.8: Sei (Z n ; n ≥ 1) eine Folge von Zufallsvariablen mit 

L(Z n ) → N (0,σ 2 ). Sei (ε n ; n ≥ 1) eine weitere Folge von Zufallsvariablen 

mit ε n → 0 P-stochastisch. Dann gilt auch für n → ∞ 

L(Z n +ε n ) −→ N ( 0,σ 2) . 

Beweis: Wegen Lemma 12.5 genügt es zu zeigen, dass 

E(f (Z n +ε n )) → E(f (Z)) mit Z nach N (0,1) verteilt für f ∈ E. 

Da L(Z n ) → L(Z) gilt, folgt E(f (Z n )) → E(f (Z)). Folglich genügt es zu 

zeigen, dass für n → ∞ E(f (Z n +ε n ))−E(f (Z n )) → 0 gilt. 

f ist nun gleichmäßig stetig, falls f ∈ E. D.h. für alle ε > 0 existiert δ > 0


mit |f (x)−f (y)| ≤ ε für |x−y| ≤ δ. 

Sei M = max|f (x)|. Wähle n 0 so, dass P (|ε n | > δ) ≤ ε für n ≥ n 

x 

2M 0. 

Dann folgt 

|E(f (Z n +ε n ))−E(f (Z n ))| ≤ 

≤ ∣ ( ( E f (Zn +ε n )1 {|εn|≤δ}) 

−E f (Zn )1 {|εn|≤δ})∣ 

∣ 

+E (∣ ∣ f (Zn +ε n )1 {|εn|>δ} 

∣ ) +E (∣ ∣ f (Zn )1 {|εn|>δ} 

∣ ) 

≤ ε·P (|ε n | ≤ δ)+2M ·P (|ε n | > δ) 

≤ 2ε für n ≥ n 0 .

Kapitel 13 

Das Gesetz vom iterierten 

Logarithmus 

In diesem Kapitel wird es um fast sichere Aussagen zu Irrfahrten mit Erwartungswert 

0 gehe. Ein grundlegendes Resultat ist das Chung-Fuchs Theorem. 

Satz 13.1: Seien X 1 ,X 2 ,... unabhängig und identisch verteilt mit EX 1 = 

∑ 

0 und mit P(X 1 = 0) < 1. Sei S n = n X i . Dann gilt P-fast sicher 

i=1 

limS n = ∞, limS n = −∞. 

n n 

Beweis: Sei q := P(S n < 0 für alle n ≥ 1). Sei A n := {S k < S n für k ≠ n}. 

Dann gilt 

P(A n ) = P(S n −S k > 0, ∀k < n und S k −S n < 0,∀k > n) 

= P(S n −S k > 0, ∀k < n)·P(S m < 0 für alle m ≥ 1) 

= P(S n −S k > 0, ∀k < n)·q 

Das zweite Gleichheitszeichen läßt sich erst streng mit den in Kapitel 14 

einzuführenden bedingten Wahrscheinlichkeiten erklären. 

Sei T = min{n ≥ 1 | S n ≤ 0} und ∞, falls die Menge leer ist. Dann gilt 

weiter 

P(S n −S k > 0,∀k < n) = P(S i > 0 für alle 1 ≤ i ≤ n−1) = P(T ≥ n). 

103

104 KAPITEL 13. ITERIERTE LOGARITHMUS 

Damit ist P(A n ) = qP(T ≥ n). Da aber die Ereignisse A n disjunkt sind, ist 

∑ 

P(A n ) ≤ 1. Damit gilt 

n≥1 

q ·ET = q ∑ n≥1P(A n ) ≤ 1. 

Ist nun q > 0, so folgt ET < ∞. Die Waldsche Identität (siehe Kapitel 10) 

liefert ES T = 0. Da S T ≤ 0 nach Definition von T ist, gilt P(S T = 0) = 1. 

Dies steht aber im Widerspruch zu P(S T < 0) ≥ P(X 1 < 0) > 0. Folglich ist 

q = 0. 

Nun sei T 0 = S 0 = 0 und T n = min{k > T n−1 | S k ≥ S Tn−1 }. Insbesondere 

ist T 1 = min{k > 0 | S k ≥ 0}. Dann ist P(T 1 < ∞) = 1, da q = 0 ist. 

Aber {T i − T i−1 ; i ≥ 1} ist unabhängig und identisch verteilt. Damit ist 

P(T n < ∞) = 1. Ebenso ist {S Ti − S Ti−1 ; i ≥ 1} unabhängig identisch 

verteilt, nichtnegativ und nicht identisch null (siehe Übungen). Damit ist 

E(S Ti −S Ti−1 ) = ES T1 > 0. 

Nach dem Gesetz der Großen Zahlen gilt dann fast sicher 

1 

n S T n 

= 1 n 

n∑ 

(S Ti −S Ti−1 ) → ES T1 , 

i=1 

so daß S Tn ∼ nEST 1 folgt. Damit gilt 

P(lim 

n 

S Tn = ∞) = 1 

und damit P(lim 

n 

S n = ∞) = 1. 

Ähnlich erhält man die Aussagen für limS n . 

n 

□ 

Nun kommen wir zum Gesetz vom iterierten Logarithmus. 

Satz 13.2: Seien X 1 ,X 2 ... unabhängig identisch verteilte Zufallsvariablen 

∑ 

mit EX 1 = 0 und VarX 1 = 1. Sei S n = n X i . Dann gilt fast sicher 

i=1 

lim 

n 

S n 

S n 

√ = 1 und lim √ = −1. 

2nloglogn n 2nloglogn

105 

Wir wollen kurz die erste Aussage erläutern. Sie setzt sich im Grund aus zwei 

Aussagen zusammen und so verläuft auch der Beweis. Hier bedeutet “logn” 

natürliche Logarithmus und wir schreiben log 2 n für loglogn . 

Sei ψ(n) = √ 2nloglogn. Die erste Aussage bedeutet: 

a 1 ) P(S n ≥ (1+ε)ψ(n) unendlich oft) = 0 für alle ε > 0. 

a 2 ) P(S n ≥ (1−ε)ψ(n) unendlich oft) = 1 für alle ε > 0. 

Wir werden die erst Aussage von Satz 13.2 lediglich für normalverteilte Zufallsvariablebeweisen. 

Diezweite Aussageüber limS n folgtdannunmittelbar 

n 

wegen der Symmetrie der Normalverteilung. Diese liegt auch dem folgenden 

Lemma zugrunde. 

Lemma 13.3 Seien X 1 ,X 2 ,...,X n unabhängige N(0,1)-verteilte Zufallsvariablen. 

Für a > 0 gilt dann 

( ) 

P max S k ≥ a ≤ 2P(S n ≥ a). 

1≤k≤n 

{ } 

Beweis: Für a > 0 seien A = max S k ≥ a und 

1≤k≤n 

A k = {S i < a für i ≤ k −1, S k ≥ a} sowie B = {S n ≥ a}. 

Dann kann man wegen Unabhängigkeit und Symmetrie der Verteilung wie 

folgt nach unten abschätzen: 

P(B ∩A k ) ≥ P({S n ≥ S k }∩A k ) 

= P(X k+1 +···+X n ≥ 0)P(A k ) 

≥ 1 2 P(A k). 

Es folgt dann weiter 

P(B) = 

n∑ 

P(B ∩A k ) ≥ 1 2 

k=1 

n∑ 

P(A k ) = 1 2 P(A). 

k=1 

□


Wir sehen jetzt: ϕ(x) = √ 1 

2π 

e −x2 /2 und Φ(x) = ∫ x 

ϕ(y)dy. Dies sind die 

−∞ 

Dichte und Verteilungsfunktion der Standardnormalverteilung. 

Lemma 13.4: Für u → ∞ gilt 

1−Φ(u) ∼ 1 u ϕ(u). 

Beweis: Mit Hilfe von partieller Integration gilt 

∫ ∞ 

Nun gilt aber für u → ∞ 

u 

1 

x 2 ϕ(x)dx = 1 u ϕ(u)−(1−Φ(u)). 

∫ ∞ 

u∫ ∞ 

u 

1 

x 2 ϕ(x)dx 

ϕ(x)dx 

und damit weiter wegen der Gleichung oben 

Beweis von Satz 13.2: 

→ 0 

1 

u ϕ(u) 

(1−Φ(u)) → 1. 

Sei ψ(n) = √ 2nloglogn. Sei ε > 0. Zeige als erstes a 1 ): 

oder äquivalent 

P(S n < (1+ε)ψ(n) schließlich) = 1 

P(S n ≥ (1+ε)ψ(n) unendlich oft) = 0 

Sei 1 < α < 1 + ε und b m := [α m ], wobei [x] die größte ganze Zahl ≤ x 

bezeichnet. 

{ 

} 

Sei A m := max S n ≥ (1+ε)ψ(b m +1) 

b m

107 

Dann gilt wegen der Monotonie von ψ 

( ) 

) ⋂ ⋃ 

P {S n ≥ (1+ε)ψ(n) u.o.} ≤ P 

(limA m = P A m . 

m 

k≥1 m≥k 

Wegen des Borel-Cantelli Lemmas (Satz 8.8) genügt es ∑ m 

zeigen. Wegen Lemma 13.4 gilt 

P(A m ) < ∞ zu 

P(A m ) ≤ 2P(S bm+1 ≥ (1+ε)ψ(b m +1)) 

∫ 

1 

= 2 e −x2 /2b m+1 

dx 

√ 

2πbm+1 

(1+ε)ψ(b m+1) 

und mit y 2 = x 2 /b m+1 

= 2 

√ 

bm+1 

√ 

2πbm+1 

∫ 

e −y2 /2 dx 

(1+ε)ψ(bm+1) 

√ bm+1 

und weiter mit Lemma 13.3 

∼ √ 2 

√ 

bm+1 

2π (1+ε)ψ(b m +1) e−((1+ε)ψ(bm+1))2 2b = 

Mit b m = [α m ] gilt: 

2 

√ √ 

2π(1+ε) 2 bm+1 

b m+1 

log 2 (b m +1) 

e −bm+1 b m+1 

log 2 (b m+1)(1+ε) 2 

log 2 (b m +1) b m +1 

b m+1 

≥ log 2 (α m ) αm 

α m+1 = 1 α log 2(α m ). 

Einsetzen liefert für m hinreichend groß 

P(A m ) ≤ 

= 

1 

√ e (1+ε)2 log α 2 (α 

π 

√1 

m) (1+o(1)) 

log α 2(α m )(1+ε) 2 

1 1 

√ (1+o(1)) 

π 

√1 

α (log(mlogα))(1+ε)2 (mlogα) (1+ε)2 

α 

≤ Konst. 

1 

m 1+ε


Damit folgt ∑ P(A m ) < ∞ und damit a 1 ). 

m 

Wir kommen nun zum Beweis von a 2 ). Sei ε > 0 vorgegeben. Nun gilt das 

gerade Bewiesene auch für −X i und −S n , so daß gilt 

P(S n ≥ −(1+ε)ψ(n) schließlich) = 1. 

“schließlich” bedeutet hier “für alle hinreichend große n”. Sei nun b m := m!. 

Sei A m := {S bm − S bm−1 > (1 − ε)ψ(b m )}. Nun kann man zeigen, daß 

P(limA m ) = 1 gilt, d.h. daß A m unendlich oft mit Wahrscheinlichkeiten 

m 

1 eintritt, und man kann weiter folgern: 

Mit Wahrscheinlichkeit 1 gilt unendlich oft 

S bm ≥ (S bm −S bm−1 )+S bm−1 

≥ (1−ε)ψ(b m )−(1+ε)ψ(b m−1 ) 

[ 

= ψ(b m ) 1−ε−(1+ε) ψ(b ] 

m−1) 

ψ(b m ) 

≥ ψ(b m )(1−2ε), 

√ 

denn ψ(b m−1) 1 

ψ(b m) 

≤ für m ≥ m (1+ε)2 /ε 2 . 

Es bleibt die Limsup-Aussage zu zeigen. 

Mit Lemma 13.3 erhält man 

P(A m ) ∼ 

∼ 

1 

√ e − 

2π(1−ε) 2 ψ(bm)2 

b m−b m−1 

bm 

bm−b m−1 

log 2 b m(1−ε) 2 

1 

√ 

4π(1−ε)2 logm m−(1−ε)(1+o(1)) . 

Daraus folgt ∑ m 

P(A m ) = ∞. 

b 

Die letzte Äquivalenz benutzt, daß m 

b m−b m−1 

→ 1 und log 2 b m ∼ logm für 

m → ∞ gelten. Da {A n , n ≥ 1} unabhängig ist, liefert das Borel-Cantelli 

Lemma (Satz 8.8) die Limsup-Aussage. 

□

Kapitel 14 

Bedingte Erwartungen und 

Wahrscheinlichkeiten (Teil I) 

Wie man leicht (durch Differentiation) verifiziert, gilt für reellwertige Zufallsvariablen 

X die Gleichung 

EX = argmin 

a∈R E(X −a)2 . 

DerBegriffderbedingtenErwartungerweitertdieseApproximationaufFunktionen, 

die bezüglich einer Unter-σ-Algebra des zugrundeliegenden Wahrscheinlichkeitsraumes 

messbar sind. 

14.1 Einführung 

Um die nachfolgende Definition zu motivieren, stellen wir einige Betrachtungen 

voran. Sei (Ω,A,P) ein Wahrscheinlichkeitsraum. Wir definieren für 

A,B ∈ A mit P(B) > 0 die elementare bedingte Wahrscheinlichkeit durch 

P(A | B) := P(A∩B) . 

P(B) 

Sei D := {D i ,i ∈ N} eine Partition von Ω mit D i ∈ A für alle i ∈ N. Sei X 

eine A-messbare Zufallsvariable mit E|X| < ∞ und 

E(X | D i ) := 1 

P(D i ) E(X1 D i 

). 

109

110 KAPITEL 14. BEDINGTE ERWARTUNGEN UND ... 

Wir definieren 

und 

P(A | D)(ω) := 

E(X | D)(ω) := 

∞∑ 

P(A | D i )1 Di (ω) 

i=1 

∞∑ 

E(X | D i )1 Di (ω), 

i=1 

wobei ω ∈ Ω ist. Außerdem sei σ(D) := { ⋃ i∈J D i : J ⊂ N} die von D 

erzeugte σ-Algebra. 

Folgerung: : Für alle A ∈ σ(D) gilt ∫ A E(X | D)dP = ∫ A XdP. 

Beweis: Sei A = ⋃ i≥0 D j i 

∈ σ(D). Dann folgt: 

∫ ∫ 

E(X | D)dP = 1 A E(X | D)dP 

A 

∫ 

∑ 

= 1 ⋃ i≥0 D j i 

E(X | D l )1 Dl dP 

l≥1 

∫ ∑ ∑ 

= 1 Dji E(X | D l )1 Dl dP 

i≥0 

l≥1 

∫ ∑ 

= E(X | D ji )1 Dji dP (die D i sind disjunkt) 

i≥0 

∫ ∑ 

= 

i≥0 

E(X1 Dji ) 1 D ji 

P(D ji ) dP 

= ∑ i≥0 

E(X1 Dji ) (wegen majorisierte Konvergenz) 

= EX1 A (wegen majorisierte Konvergenz) 

∫ 

= XdP 

A 

□ 

Bemerkungen: Mit A = Ω gilt insbesondere E(E(X | D)) = EX.

14.2. BEDINGTEWAHRSCHEINLICHKEITEN UNDERWARTUNGEN111 

14.1.1 Ein Beispiel für bedingte Wahrscheinlichkeiten 

bei Maß 0 

Sei Y eine gleichverteilte Zufallsvariable auf [0,1], das heißt P Y = λ [0,1] , 

und sei y ∈ [0,1]. Falls Y = y ist, macht man n unabhängige Bernoulli- 

Experimente mit Erfolgswahrscheinlichkeit y. Sei ν die Anzahl der Erfolge in 

n Versuchen. 

Wir stellen uns nun die Frage, was P(ν = k | Y = y) ist. Da P(Y = y) = 0 

ist für alle y ∈ [0,1], ist diese bedingte Wahrscheinlichkeit nicht im üblichen 

Sinne definiert. Intuitiv ist aber klar, dass P(ν = k | Y = y) = ( n 

k) 

y k (1− 

y) n−k sein sollte. 

Man wird also P(ν = k | Y) so definieren, dass mit B ∈ B [0,1] gilt: 

∫ n 

) 

P({ν = k}∩{Y ∈ B}) = y 

B( k (1−y) n−k P Y (dy). 

k 

Wir erhalten damit 

∫ n 

) 

P({ν = k}∩{Y ∈ B}) = y 

B( k (1−y) n−k dP Y (y) 

k 

∫ 

=: P(ν = k | Y = y)dP Y (y) 

∫B 

= P(ν = k | Y)dP 

für alle B ∈ B [0,1] . 

Y −1 (B) 

14.2 Bedingte Wahrscheinlichkeiten und Erwartungen 

Sei nun Y eine Zufallsvariable auf einem Wahrscheinlichkeitsraum (Ω,A,P). 

Sei σ(Y) die von Y erzeugte σ-Algebra. Der letzte Abschnitt führt uns zu 

folgender Definition. 

Definition 14.1: SeiA ∈ AundZ A eineσ(Y)-messbareZufallsvariableauf 

Ω. Z A heißt bedingte Wahrscheinlichkeit von A gegeben Y, falls P(A∩{Y ∈


B}) = ∫ Z Y −1 (B) A dP ist für alle B ∈ B. 

Wir können die Gleichung auch weiter in der Form schreiben: 

∫ ∫ 

1 A dP = Z A dP . 

Y −1 (B) Y −1 (B) 

Bemerkung: Jede σ(Y)-messbare Zufallsvariable Z läßt sich schreiben als 

Z = ϕ ◦ Y, wobei ϕ eine Borel-messbare Funktion ist. Insbesondere gilt 

Z A = ϕ A ◦Y mit einer Borel-messbaren Funktion ϕ A . Dann ist 

∫ 

P(A∩{Y ∈ B}) = ϕ A (y)P Y (dy). 

B 

Sei F eine Unter-σ-Algebra von A, und sei P F := P | F die Einschränkung 

von P auf F. In Analogie zu Definition 14.1 definieren wir die bedingte Erwartung 

gegeben F. 

Definition 14.2: Sei X eine A-messbare, nichtnegative oder integrierbare 

Zufallsvariable. Eine F-messbare Zufallsvariable Z heißt bedingte Erwartung 

von X gegeben F, falls gilt: 

∫ ∫ 

X dP = ZdP F für alle A ∈ F (Radon-Nikodym Gleichung). 

A 

A 

Die Klasse aller F-messbaren Zufallsvariablen mit dieser Eigenschaft wird 

mit E(X | F) bezeichnet. 

Bemerkung: 

1) Die Existenz von Z wird im nächsten Kapitel bewiesen. 

2) Die Zufallsvariable Z ist P F -fast sicher eindeutig bestimmt (siehe Kapitel 

15). Man nennt Z eine Version der bedingten Erwartung E(X | 

F). E(X | F) ist eine Äquivalenzklasse bezüglich der Relation ” 

P F -fast 

sichere Gleichheit“. 

3) Wir werden im Folgenden nicht immer zwischen der Klasse E(X | F) 

und ihren Repräsentanten unterscheiden, wie dies zum Beispiel auch bei 

L P -Räumen üblich ist.


4) Ist D ∈ A, so setzen wir P(D | F) = E(1 D | F). 

Beispiele 14.3: 

1) Sei F = {∅,Ω}. Dann ist E(X | F) = EX. 

Beweis: E(X | F) = EX ist F-messbar, denn für alle B ∈ B ist 

{ 

E(X | F) −1 ∅ falls EX /∈ B 

(B) = 

Ω falls EX ∈ B. 

Für alle A ∈ F gilt nun ∫ E(X | F)dP = ∫ EXdP, da 

A A 

∫ { 

0 falls A = ∅ 

EXdP = 

EX falls A = Ω . 

A 

□ 

2) Sei F := σ(Y). Dann ist E(X | Y) := E(X | σ(Y)) σ(Y)-messbar. Es 

existiert also eine Borel-messbare Funktion ϕ X 

mit E(X | Y) = ϕ X 

◦Y. Die 

Radon-Nikodym-Gleichung schreibt sich dann wie folgt: 

∫ ∫ 

ϕ X 

(Y)dP σ(Y) = XdP für alle A ∈ σ(Y). 

A 

A 

3) Seien X und Y A-messbare Zufallsvariablen. Die gemeinsame Verteilung 

von (X,Y) habe die λ 2 -Dichte f(x,y). Für A,B ∈ B gilt dann 

∫ ∫ (∫ ) 

P(X ∈ A,Y ∈ B) = f(x,y) dx dy = f(x,y)dy dx. 

A×B 

∫ 

Für A ∈ B ist P(X ∈ A) = 

∫ 

P(X ∈ A) = P(X ∈ A,Y ∈ R) = 

∫ 

= 

Analog erhält man für B ∈ B, dass 

∫ 

P(Y ∈ B) = 

A 

A 

f 1 (x)dx mit f 1 (x) = ∫ f(x,y)dy, denn 

B 

A×R 

A 

f 2 (y)dy 

B 

f(x,y)dxdy 

(∫ ) 

f(x,y)dy dx.


ist mit f 2 (y) = ∫ f(x,y)dx. Für eine Version ϕ A (Y) von P(X ∈ A | Y) gilt 

nach Definition für alle A,B ∈ B: 

∫ 

P(X ∈ A,Y ∈ B) = ϕ A (Y) dP σ(Y) 

Y −1 (B) 

∫ 

= ϕ A (y) dP Y (y) 

∫B 

= ϕ A (y)f 2 (y)dy. 

B 

Andererseits ist 

∫ 

P(X ∈ A,Y ∈ B) = 

∫ 

= 

∫ 

= 

A×B 

B 

B 

f(x,y)dxdy 

(∫ ) 

f(x,y)dx dy 

A 

(∫ 

f(x,y)dx ) 

A 

f 2 (y)dy. 

f 2 (y) 

Damit ist 

und weiter 

ϕ A (y) = 

∫ 

∫ 

P(X ∈ A | Y) = 

A f(x,y)dx 

f 2 (y) 

A 

f(x,Y)dx 

f 2 (Y) 

P Y -f.s. 

P σ(Y) -f.s. 

sowie 

∫ 

P(X ∈ A | Y = y) = 

A 

f(x,y)dx 

f 2 (y) 

P Y -f.s.. 

Ebenso erhält man 

∫ 

E(X | Y) = 

∫ xf(x,Y)dx 

xP(dx | Y) = . 

f 2 (Y) 

Dies ist nun die strenge Begründung der Formel (Seite 89) in Kapitel 7 von 

Stochastik I.


Im Folgenden betrachten wir zwei Anwendungen von Beispiel 14.3 3) 

1. Anwendung 

Seien X und Y reelle Zufallsvariablen und P (X,Y) die Gleichverteilung im 

Inneren des Einheitskreises, das heißt P (X,Y) = 1 

λ 2 (K 1 ) λ2 | K1 ∩B 2 mit 

Sei B ⊂ K 1 messbar, dann ist 

∫ 

P ((X,Y) ∈ B) = 

K 1 := { (x,y) ∈ R 2 : x 2 +y 2 ≤ 1 } . 

Damit ist nach Beispiel 14.3 3) für A ∈ B: 

∫ 

P (X ∈ A | Y = y) = 

B 

1 

λ 2 (K 1 ) dx dy = 1 ∫ 

dx dy. 

π B 

A 

f(x,y)dx 

f 2 (y) 

mit f 2 (y) = ∫ K 1 

f(x,y)dx und f(x,y) = 1 1 λ 2 (K 1 ) K 1 

(x,y) = 1 1 π K 1 

(x,y). 

Sei A y := A∩{x ∈ R : x 2 +y 2 ≤ 1}. Dann folgt 

∫ 

A 

P(X ∈ A | Y = y) = 

f(x,y)dx 

f 2 (y) 

= 

∫ 

1 A K 1 

(x,y)dx 

∫ √ = 

1−y 

√ 

2 

dx 1−y 2 

− 

∫ 

A y 

dx 

2 √ 1−y = λ(A y) 

2 2 √ 1−y 2. 

2. Anwendung 

X und Y seien gemeinsam normalverteilt, das heißt, P (X,Y) hat die Dichte 

( 

1 

f(x,y) = exp − 1 ( ) ( )) 

x−µ1 

Σ −1 x−µ1 

2π(detΣ) 1 2 2 y −µ 2 y −µ 2 

mit der Kovarianzmatrix Σ = ( σ1 2 σ 12 

) 

σ 12 σ2 

2 

Man rechnet leicht nach, dass Σ −1 = 1 

detΣ 

detΣ = σ1 2σ2 2 −σ2 12 > 0 gilt . Dabei sind 

( σ 2 

2 −σ 12 

−σ 12 σ 2 1) 

ist und


∫ 

σ1 2 := 

∫ 

σ2 2 := ∫ 

σ 12 := 

∫ 

µ 1 := 

∫ 

µ 2 := 

(x−µ 1 ) 2 f(x,y)dx dy 

(y −µ 2 ) 2 f(x,y)dx dy 

(x−µ 1 )(y −µ 2 )f(x,y)dx dy 

xf(x,y)dx dy 

yf(x,y)dx dy 

̺ := σ 12 

σ 1 σ 2 

. 

Wir bestimmen nun die Dichte von P(X ∈ · | Y). 

Behauptung: P(X ∈ · | Y = y) hat die Dichte 

( ( 

σ 2 

f(x | y) = 

(2πdetΣ) exp − σ2 2 

x−µ 1/2 1 − σ ) ) 2 

12 

(y −µ 

2detΣ σ2 

2 2 ) , 

das heißt P(X ∈ · | Y) ist gleich der Normalverteilung 

( 

N µ 1 + σ 12 

(Y −µ 

σ2 

2 2 ), detΣ ) 

. 

σ2 

2 

Beweis: Nach Beispiel 14.3 3) ist f(x | y) = f(x,y) 

∫ 

f 2 (y) = 

Daraus ergibt sich 

f(x | y) = 

= 

= 

R 

f(x,y)dx = 

( 

σ 2 

(2πdetΣ) exp − 

1/2 

( 

σ 2 

(2πdetΣ) exp 1/2 

( 

σ 2 

(2πdetΣ) exp − σ2 2 

1/2 2detΣ 

f 2 (y) 

mit 

( 

1 

(2πσ exp − (y −µ ) 

2) 2 

. 

2 2)1/2 2σ2 

2 

( 

1 x−µ1 

−̺y −µ ) ) 2 

2 

2(1−̺2) σ 1 σ 2 

( 

1 

− x−µ 

2σ1(1−̺2) 

2 1 − σ ) ) 2 

12 

(y −µ 

σ2 

2 2 ) 

( 

x−µ 1 − σ ) ) 2 

12 

(y −µ 

σ2 

2 2 ) . 

□

Kapitel 15 

Maßtheoretische Überlegungen – 

der Satz von Radon-Nikodym 

Dem aufmerksamen Leser ist sicher aufgefallen, dass bis jetzt nicht klar ist, 

ob die in Definition 14.2 definierte Klasse E(X | F) existiert und falls dies 

der Fall ist, ob sie eindeutig bestimmt ist. Dieses keineswegs triviale Problem 

wollen wir nun mit Hilfe eines Satzes aus der Maßtheorie lösen. 

15.1 Der Satz von Radon-Nikodym 

Sei (Ω,A) ein Messraum und µ, ν σ−endliche Maße auf diesem. 

Definition 15.1: ν heißt absolut stetig bezüglich µ (Bezeichnung : ν ≪ µ), 

falls für jedes A ∈ A mit µ(A) = 0 gilt, dass ν(A) = 0 ist. 

Beispiel 15.2: Sei f A-messbar, nichtnegativ und µ−integrierbar. Dann ist 

∫ 

ν(A) := f dµ, A ∈ A, 

A 

absolut stetig bezüglich µ. 

Denn:SeiA ∈ Amitµ(A) = 0.Dannfolgt 1 A = 0µ-f.s.Deshalbistf1 A = 0 

µ-f.s. Damit gilt 

0 = ∫ fdµ = ν(A). A 

□ 

117

118 KAPITEL 15. MASSTHEORETISCHE ÜBERLEGUNGEN 

Lemma 15.3: Seien σ und τ endliche Maße auf einem Messraum (Ω,A) 

mit σ(Ω) < τ(Ω). Dann existiert eine Menge Ω ′ ∈ A mit 

1) σ(Ω ′ ) < τ(Ω ′ ), 

2) σ(A) ≤ τ(A) für alle A ∈ Ω ′ ∩A. 

Beweis: Setze δ := τ −σ. Dann gilt für alle A ∈ A, dass −σ(Ω) ≤ δ(A) ≤ 

τ(Ω) ist. Also ist δ beschränkt. Wir definieren nun induktiv Mengen (A n ) n≥0 

und (Ω n ) n≥0 . Sei A 0 := ∅ und Ω 0 := Ω. Seien die Mengen A 0 ,...,A n sowie 

Ω 0 ,...,Ω n bereits konstruiert. 

Wir setzen α n := inf A∈Ωn∩Aδ(A) für n ∈ N 0 . Ist α n ≥ 0, so sei A n+1 = ∅ 

und Ω n+1 := Ω n . Ist α n < 0, so wählen wir ein A n+1 ∈ Ω n ∩ A aus, so 

dass δ(A n+1 ) ≤ 1 2 α n ist (dieses A n+1 existiert nach Definition des Infimums). 

Setze dann Ω n+1 := Ω n \A n+1 . Damit sind die Folgen (A n ) n≥0 und (Ω n ) n≥0 

definiert, wobei die Mengen (A n ) n≥0 paarweise disjunkt sind und für alle 

n ∈ N 0 δ(A n ) ≤ 0 und ∑ n≥0 |δ(A n)| < ∞ ist. Die letzte Eigenschaft sieht 

man folgendermaßen: Es ist 

∑ 

|δ(A n )| = ∑ |τ(A n )−σ(A n )| 

n≥0 n≥0 

≤ ∑ |τ(A n )|+ ∑ |σ(A n )| 

n≥0 n≥0 

( ⋃ ( ⋃ ) 

= τ A n 

)+σ A n 

n≥0 

n≥0 

≤ τ(Ω)+σ(Ω) < ∞. 

Damitist(δ(A n )) n≥0 eineNullfolge.Deshalbistwegenδ(A n+1 ) ≤ 1 2 α n ≤ 0für 

alle n ∈ N 0 auch (α n ) n∈N eine Nullfolge. Nach Definition ist die Folge(Ω n ) n≥0 

fallend. Wir definieren Ω ′ := ⋂ n≥0 Ω n und erhalten mit dem Stetigkeitssatz 

für Maße 

( ⋂ 

δ(Ω ′ ) = τ 

n≥0 

( ⋂ 

Ω n 

)−σ 

n≥0 

Ω n 

) 

= lim τ(Ω n )− lim σ(Ω n ) 

n→∞ n→∞ 

= lim (τ(Ω n )−σ(Ω n )) 

n→∞ 

= lim δ(Ω n ). 

n→∞

15.1. DER SATZ VON RADON-NIKODYM 119 

Sei 

⎧ 

⎪⎨ δ(Ω n ) für α n > 0 

δ(Ω n+1 ) = 

⎪⎩ δ(Ω n )−δ(A n+1 ) für α n < 0. 

Dann ist δ(Ω n+1 ) ≥ δ(Ω n ) für alle n ∈ N , also δ(Ω n+1 ) ≥ δ(Ω 0 ) = δ(Ω) > 0 

(δ(Ω) ist nach Voraussetzung größer als 0). Wir erhalten deshalb δ(Ω ′ ) = 

lim n→∞ δ(Ω n ) ≥ δ(Ω 0 ) > 0. Außerdem gilt für A ∈ Ω ′ ∩A, dass A ∈ Ω n ∩A 

ist für alle n ≥ 0. Also ist für alle n ≥ 0 und für alle A ∈ Ω ′ ∩ A nach 

Definition des Infimums δ(A) ≥ α n . Folglich ist δ(A) ≥ lim n→∞ α n = 0 und 

damit τ(A) ≥ σ(A). 

□ 

Mit dem Lemma können wir nun den folgenden Satz beweisen. 

Satz 15.4 (Radon-Nikodym): Sei µ σ-endlich und ν endliches Maß auf 

(Ω,A). Dann ist ν genau dann absolut stetig bezüglich µ, wenn eine nichtnegative, 

A-messbare, µ-integrierbare Funktion f existiert, so dass ν(A) = 

∫ 

fdµ für alle A ∈ A. Die Funktion f ist dann µ-fast sicher eindeutig be- 

A 

stimmt. 

Beweis: Die eine Richtung folgt mit Beispiel 15.2. 

Für die umgekehrte Richtung sei G eine Klasse nichtnegativer A-meßbarer 

Funktionen mit ∫ gdµ≤ν(A) füralle A ∈ Aund alleg ∈ G. Dannist G ≠ ∅, 

A 

denn g ≡ 0 liegt in G. Außerdem ist mit g,h ∈ G auch max{g,h} ∈ G. Denn 

für A ∈ A gilt 

∫ ∫ ∫ 

max{g,h}dµ = gdµ+ hdµ 

A 

A∩{g≥h} A∩{g


denn γ ≥ lim n→∞ 

∫ 

gn dµ ≥ lim n→∞ 

∫ 

g 

′ 

n dµ = γ. Wir setzen f := sup n∈N g n 

und erhalten mit dem Satz von der monotonen Konvergenz 

∫ ∫ ∫ 

γ = lim g n dµ = lim g 

n→∞ 

ndµ = fdµ. 

n→∞ 

Außerdem ist f ∈ G, denn für A ∈ A gilt: 

∫ 

fdµ = lim g n dµ ≤ lim ν(A) = ν(A). 

A n→∞ 

∫A n→∞ 

Bis jetzt haben wir noch nicht ausgenutzt, dass ν absolut stetig bezüglich µ 

ist. Für A ∈ A sei τ(A) := ν(A)− ∫ fdµ. Dann ist τ ein endliches Maß und 

A 

wegen ν ≪ µ ist τ ≪ µ. 

Wir müssen nun zeigen, dass τ ≡ 0 ist. Dazu nehmen wir an, dass τ(Ω) > 0 

ist und führen diese Aussage zu einem Widerspruch. 

Wegen τ ≪ µ erhalten wir aus τ(Ω) > 0, dass µ(Ω) > 0 ist. Außerdem gilt 

für A ∈ A mit τ(A) > 0, dass µ(A) > 0 ist. Wir definieren β := 1 τ(Ω) 

2µ(Ω) . 

Mit Lemma 15.3 folgt die Existenz einer Menge Ω ′ mit τ(Ω ′ ) > βµ(Ω ′ ) und 

τ(A) ≥ βµ(A) für alle A ∈ Ω ′ ∩A. 

Sei f 0 := f +β1 Ω ′. Dann ist f 0 A-meßbar und in G enthalten, denn für alle 

A ∈ A ist 

∫ 

A 

∫ 

f 0 dµ = 

∫ 

≤ 

A 

A 

fdµ+βµ(A∩Ω ′ ) 

fdµ+τ(A∩Ω ′ ) ≤ 

∫ 

A 

fdµ+τ(A) = ν(A) 

Wir haben τ(Ω ′ ) > βµ(Ω ′ ) ≥ 0. Also folgt wegen τ ≪ µ, dass µ(Ω ′ ) > 0 ist. 

Damit erhalten wir 

∫ ∫ 

f 0 dµ = 

fdµ+βµ(Ω ′ ) = γ +βµ(Ω ′ ) > γ, 

was im Widerspruch zur Wahl von γ steht. Deshalb ist τ ≡ 0 und damit 

ν(A) = ∫ fdµ für alle A ∈ A. 

A 

Wir zeigen nun noch die Eindeutigkeit. Dazu seien f und g nichtnegative, 

A-meßbare Funktionen mit 

(∗) 

∫ 

A 

∫ 

fdµ = ν(A) = 

A 

gdµ

15.1. DER SATZ VON RADON-NIKODYM 121 

für alle A ∈ A. Wir nehmen an, dass µ(f > g) > 0 ist und führen diese 

Aussage zu einem Widerspruch. 

Nach Annahme existiert also ein n 0 ∈ N, so dass µ(f > g + 1 ) > 0 für alle 

n 

n ≥ n 0 ist. Nun ist 

∫ 

{f>g+ 1 n } (f −g)dµ ≥ 1 n µ(f > g + 1 n ) > 0, 

was ein Widerspruch zu (∗) ist. Analog führt man die Aussage µ(f < g) > 0 

zum Widerspruch. Damit ist µ(f ≠ g) = 0. 

□ 

Bemerkung: Die Bedingung ν ≪ µ ist notwendig für die Existenz einer 

nichtnegativen, A-meßbaren Funktion f mit ∫ fdµ = ν(A) für A ∈ A. 

A 

Sie ist aber nicht hinreichend. Um dies zu sehen, sei Ω eine überabzählbare 

Menge. Dann ist A := {A ⊂ Ω : A oder A c ist abzählbar} eine σ-Algebra 

auf Ω. Wir definieren auf (Ω,A) wie folgt zwei Maße : 

Für A ∈ A sei 

{ 

0 : falls A abzählbar 

ν(A) := 

∞ : sonst 

und µ(A) := 

{ 

|A| : falls A endlich 

∞ : sonst 

Offensichtlich istµ(A)genaudannNull,wennA = ∅ist.Deshalbistν absolut 

stetig bezüglich µ. 

Wir nehmen nun an, dass eine nichtnegative A-meßbare Funktion f existiert 

mit 

∫ 

ν(A) = 

A 

fdµ für alle A ∈ A. 

Dann folgt 

∫ 

0 = ν({x}) = fdµ = f(x)µ({x}) = f(x) 

{x} 

für alle x ∈ Ω. Damit ist f ≡ 0, also ν ≡ 0, was ein Widerspruch zur 

Definition von ν ist.


15.2 Existenz und Eindeutigkeit der bedingten 

Erwartung 

Der Satz von Radon-Nikodym liefert uns die Existenz und Eindeutigkeit der 

bedingten Erwartung. 

Satz 15.5 (Existenz und Eindeutigkeit der bedingten Erwartung): 

Sei (Ω,A,P) ein Wahrscheinlichkeitsraum und sei X eine A-meßbare, nichtnegative 

oder P-integrierbare Funktion sowie F ⊂ A eine Unter-σ-Algebra. 

Dann gilt: 

1) E(X | F) existiert. 

2) Je zwei Versionen von E(X | F) sind P F -fast sicher gleich. 

Beweis: Wir nehmen zuerst an, dass X nichtnegativ ist. Wir definieren µ := 

P| F und ν := XP| F , das heißt 

∫ 

ν(B) = 

B 

XdP 

für alle B ∈ F. Damit ist ν auf F ein absolut stetiges Maß bezüglich µ. Mit 

Satz 15.4 folgt ∫ die Existenz einer nichtnegativen, F-meßbaren Funktion Y 

mit ν(A) = Ydµ für alle A ∈ F. Also ist 

A 

∫ 

A 

∫ 

YdP| F = 

A 

∫ 

Ydµ = ν(A) = 

A 

XdP 

für A ∈ F. Die Funktion Y erfüllt somit die Bedingungen aus Definition 

14.2 und ist deshalb eine Version von E(X | F). Außerdem ist Y als Radon- 

Nikodym Ableitung P F -fast sicher eindeutig bestimmt. 

Sei X nun P-integrierbar. Sei Y 1 eine Version von E(X + | F) und Y 2 eine 

Version von E(X − | F) (deren Existenz folgt mit 1)). Dann ist ∫ Y 1 dP F = 

∫ 

X + dP F < ∞,alsoist Y 1 P F -fastsicher endlich. Ebenso ist Y 2 P F -fastsicher 

endlich. Damit ist Y := Y 1 −Y 2 bis auf eine P F -Nullmenge wohl definiert und

15.3. DIE LEBESGUE-ZERLEGUNG 123 

es gilt für alle B ∈ F 

∫ ∫ 

YdP F = 

B 

∫ 

= 

B 

B 

∫ 

Y 1 dP F − 

∫ 

X + dP − 

B 

B 

Y 2 dP F 

∫ 

X − dP = 

B 

XdP 

Y erfüllt somit die Voraussetzungen von Definition14.2. Es folgtdie Existenz 

von E(X | F). Wir haben nun noch die Eindeutigkeit zu zeigen. Sei Z eine 

andere Lösung von ∫ B ZdP = ∫ B XdP für alle B ∈ F. Dann ist ∫ B ZdP = 

∫ 

B YdP für alle B ∈ F und deshalb Z = Y P F-fast sicher. 

□ 

15.3 Die Lebesgue-Zerlegung 

Für endliche Maße, die nicht notwendig absolut stetig sind, gilt der folgende 

Zerlegungssatz. 

Satz 15.6 (Lebesgue-Zerlegung): Seien µ und ν endliche Maße auf dem 

Messraum (Ω,A). Dann existiert eine messbare Funktion g ≥ 0 und eine 

µ-Nullmenge N ∈ A mit 

∫ 

ν(A) = gdµ+ν(A∩N) 

A 

für alle A ∈ A. Dabei ist g µ-fast sicher eindeutig bestimmt und 1 N µ+ν-fast 

sicher. 

Definition 15.7: Die endlichen Maße µ und ν heißen singulär zueinander, 

falls eine Menge M existiert mit µ(M) = 0 und ν(M c ) = 0. 

In der Lebesgue-Zerlegung heißt der erste Term der absolut stetige Anteil 

und der zweite Term der singuläre Anteil. 

Wir werden nun Satz 15.6 beweisen. 

Beweis:WirzeigenzuerstdieExistenzderZerlegung.Daν ≪ ν+µ,existiert


nach dem Satz von Radon-Nikodym eine messbare Abbildung h : Ω −→ [0,1] 

mit ν(A) = ∫ hd(ν + µ) für alle A ∈ A. Um die Eigenschaft h ∈ [0,1] 

A 

einzusehen, sei ˜ν := ν +µ. Dann ist ν(A) ≤ ˜ν(A) für alle A ∈ A. Damit ist 

˜ν({h > 1}) = 0, denn für alle ε > 0 gilt 

∫ 

˜ν(h ≥ 1+ε) ≥ ν(h ≥ 1+ε) = 

{h≥1+ε} 

hd˜ν ≥ (1+ε)˜ν(h ≥ 1+ε). 

Wir erhalten ˜ν(h ≥ 1+ε) = 0 für alle ε > 0. Dann gilt weiter 

∫ ∫ 

(1−h)dν = hdµ für alle A ∈ A 

A 

oder kurz: (1−h)ν = hµ. Wir setzen nun N := {h = 1}. Dann ist 

∫ ∫ 

µ(N) = hdµ = (1−h)dν = 0. 

N 

Auf N c 1 

h 

ist wohldefiniert und wir erhalten mit g = 

1−h 1−h 

∫ 

∫ ∫ 

ν(A∩N c 1 

) = (1−h) 

A∩N 1−h dν = gdµ = 

c A∩N c 

Damit ist ν(A)−ν(A∩N) = ∫ A gdµ. 

A 

N 

A 

gdµ. 

Wir zeigen nun die Eindeutigkeit der Zerlegung. Ist ν(A) = ∫ A g′ dµ+ν(A∩ 

N ′ ) mit µ(N ′ ) = 0, so ist für alle A ∈ A 

∫ ∫ 

∫ ∫ 

g ′ dµ = g ′ dµ = ν(A∩(N ∩N ′ ) c ) = gdµ = 

A A∩(N∩N ′ ) c A∩(N∩N ′ ) c 

Damit folgt g = g ′ µ-fast sicher. Wegen µ(N) = 0 ist 

∫ 

ν(N ∩N ′c ) = g ′ dµ = 0. 

N 

A 

gdµ. 

Ebenso ist ν(N c ∩N ′ ) = 0. Wir erhalten ν(N △N ′ ) = 0, das heißt 1 N = 1 N ′ 

ν-fast sicher. 

Bemerkung: Aus der Lebesgue-Zerlegung lässt sich der Satz von Radon- 

Nikodym ableiten. Denn ist ν(A) = ∫ gdµ+ν(A∩N) mit µ(N) = 0 und ist 

A 

ν absolut stetig bezüglich µ, so gilt ν(A∩N) = 0 für alle A ∈ A, das heißt 

∫ 

ν(A) = gdµ. 

A 

□

15.3. DIE LEBESGUE-ZERLEGUNG 125 

Wegen der Eindeutigkeit der Radon-Nikodym Zerlegung gilt g = f mit f 

wie in Satz 15.4, das heißt f = h oder h = f µ-fast sicher mit h wie im 

1−h 1+f 

Beweis der Lebesgue-Zerlegung. Symbolisch schreibt man 

dν 

dν 

d(ν +µ) = dµ 

1+ dν 

dµ 

µ-fast sicher. 

Bemerkung: Seien ν, µ und η endliche Maße mit ν ≪ µ ≪ η. Dann gilt 

dν 

dη = dν 

dµ · dµ 

dη 

η-fast sicher.

126 KAPITEL 15. MASSTHEORETISCHE ÜBERLEGUNGEN

Kapitel 16 

Bedingte Erwartungen (Teil II) 

16.1 Eigenschaften bedingter Erwartungen 

Satz 16.1: Sei (Ω,A,P) ein Wahrscheinlichkeitsraum. Seien X, Y nichtnegative 

oder P-integrierbare, A-messbare Zufallsvariablen sowie F, F 1 ,F 2 ⊂ 

A Unter-σ-Algebren. Dann gilt: 

1) E(X +Y | F) = E(X | F)+E(Y | F) P-f.s. 

2) Für alle c ∈ R gilt E(cX | F) = cE(X | F) P-f.s. 

3) Ist X P-fast sicher nichtnegativ, so ist auch E(X | F) P-fast sicher nichtnegativ. 

4) E(|X| | F) ≥ |E(X | F)| P-f.s. 

5) E(E(X | F)) = EX P-f.s. 

6) E(X | A) = X P-f.s. 

7) Ist F 1 ⊂ F 2 , dann folgt E(E(X | F 2 ) | F 1 ) = E(X | F 1 ) P-f.s. 

8) Ist XY P-integrierbar und X F-messbar, dann ist 

E(XY |F) = XE(Y | F). 

127

128 KAPITEL 16. BEDINGTE ERWARTUNGEN (TEIL II) 

9) Sei Y P-integrierbar und (X n ) n∈N eine Folge A-messbarer Zufallsvariablen 

mit X n ≥ Y für alle n ∈ N, die P-fast sicher aufsteigend gegen X 

konvergiert. Dann gilt 

lim E(X n | F) = E(X | F) P-fast sicher. 

n→∞ 

10) Sei Y P-integrierbar und (X n ) eine Folge A-messbarer Zufallsvariablen 

mit X n ≥ Y für alle n ∈ N, dann ist 

( ) 

E liminf X n | F ≤ liminf E(X n | F). 

n→∞ n→∞ 

Ist Y ≥ X n für alle n ∈ N, so ist 

limsup 

n→∞ 

E(X n | F) ≤ E(limsupX n | F). 

n→∞ 

11) Sei Y P-integrierbar und (X n ) n∈N eine Folge A-messbarer Zufallsvariablen, 

die P-fast sicher konvergiert. Sei |X n | ≤ Y für alle n ∈ N. Dann 

ist 

( ) 

E lim X n | F 

n→∞ 

= lim 

n→∞ 

E(X n | F). 

Beweis: Die Eigenschaften 1) bis 6) folgen sofort aus der (den bedingten 

Erwartungswert definierenden) Radon-Nikodym-Gleichung. 

Zu 7): Es sei F 1 ⊂ F 2 und B ∈ F 1 . Dann ist für B ∈ F 1 

∫ 

∫ 

E(E(X | F 2 ) | F 1 )dP = E(X | F 2 )dP 

B 

∫B 

= XdP (da F 1 ⊂ F 2 ist) 

∫B 

= E(X | F 1 )dP 

Somit ist E(E(X | F 2 ) | F 1 ) = E(X | F 1 ) P-f.s. 

Zu 8): Sei o.B.d.A. Y ≥ 0. Sei B ∈ F und Z := X1 B . Dann ist Z F-meßbar 

und es folgt 

∫ ∫ 

E(XY | F)dP F = 

B 

∫ 

= 

∫ 

= 

B 

B 

B 

∫ ∫ 

XYdP = ZYdP = Zd(YP) 

∫ 

Zd(YP) F = ZE(Y | F)dP F 

XE(Y | F)dP F .

16.1. EIGENSCHAFTEN BEDINGTER ERWARTUNGEN 129 

Zu 9): Aus der Isotonie der X n folgt die Isotonie der E(X n | F). Wegen 

X n ≥ Y für alle n ∈ N ist E(X n | F) ≥ E(Y | F) für alle n ∈ N. Damit folgt 

mit dem Satz von der monotonen Konvergenz, dass für alle B ∈ F gilt 

∫ ∫ ∫ 

E(X | F)dP = X dP = lim X ndP = lim X n dP 

B 

B B 

n→∞ n→∞ 

∫ 

∫B 

= lim E(X n | F)dP = lim 

n→∞ 

∫B 

E(X n | F)dP. 

n→∞ 

Die Eigenschaften 10) und 11) folgen analog zu 9). 

B 

Lemma 16.2 Seien X und Y unabhängige, A-messbare Zufallsvariablen. 

Dann folgt: 

1) E(X | Y) := E(X | σ(Y)) = EX P σ(Y ) -f.s. 

2) E(X | Y = y) = EX für P Y -fast alle y ∈ R. 

3) Ist A ⊂ R 2 Borelsch, so gilt E(1 A (X,Y) | Y = y) = E1 A (X,y) 

für P Y -fast alle y ∈ R. 

Beweis: 

Zu 1): Aus der stochastischen Unabhängigkeit von X und Y folgt, dass X 

und 1 B für alle B ∈ σ(Y) unabhängig sind. Außerdem ist EX trivialerweise 

σ(Y)-meßbar. 

Damit folgt für alle B ∈ σ(Y) 

∫ ∫ ∫ 

E(X | Y)dP σ(Y ) = XdP = 1 B XdP 

B 

∫B 

∫ 

= 1 B dP XdP 

∫ ∫ 

= EX dP σ(Y) = EXdP σ(Y) . 

B B 

Also ist E(X | Y) = EX P σ(Y) -f.s. 

Zu2):SeiϕeineB-messbareFunktion,sodassϕ◦Y eineVersionvonE(X|Y)


ist. Dann ist ϕ(y) eine Version von E(X | Y = y). 

Sei B ∈ σ(Y) und sei A ∈ B mit B = Y −1 (A). Dann gilt wegen 1): 

∫ ∫ ∫ ∫ 

EXdP σ(Y) = XdP = ϕ◦YdP σ(Y ) = ϕ(y)dP Y (y). 

B 

B B 

A 

Zu 3): Sei B ∈ σ(Y) und sei C ∈ B mit B = Y −1 (C). Dann folgt 

∫ ∫ 

1 A (X,Y)dP = E(1 A (X,Y) | Y)dP σ(Y) 

B 

∫B 

= E(1 A (X,y) | Y = y)dP Y (y). 

Andererseits folgt mit dem Satz von Fubini 

∫ ∫ 

1 A (X,Y)dP = 1 A (x,y)dP (X,Y) (x,y) 

B 

R×C 

∫ (∫ ) 

= 1 A (x,y)dP X (x) dP Y (y) 

C R 

∫ 

= E1 A (X,y)dP Y (y). 

C 

C 

Damit ist ∫ E(1 C A(X,y) | Y = y)dP Y (y) = ∫ E1 C A(X,y)dP Y (y) für alle 

B ∈ B. 

□ 

Bemerkung 16.3: 

Die Aussage 1) von Lemma 16.2 gilt allgemeiner. Anstelle von σ(Y) kann 

jede σ-Algebra F stehen, die von σ(X) unabhängig ist. Noch weitergehend 

gilt: Sind G und F σ-Algebren und ist σ(σ(X),G) von F unabhängig, so ist 

E(X | σ(G,F)) = E(X | G). 

Bemerkung: 

Im Falle quadratintegrierbarer Zufallsvariablen lässt sich die bedingte Erwartung 

anschaulich deuten: Ist L 2 (Ω,A,P) (bzw. L 2 (Ω,F,P)) der Raum 

der quadratintegrierbaren, A-messbaren (bzw. F-messbaren mit F ⊂ A)

16.2. BUFFONS NADELPROBLEM 131 

Zufallsvariablen und L 2 (Ω,A,P) (bzw. L 2 (Ω,F,P)) der zugehörende Raum 

der Äquivalenzklassen bezüglich der Relation ∼ mit f ∼ g genau dann, wenn 

f = g P-f.s. Dann ist E(·|F) die Orthogonalprojektion von L 2 (Ω,A,P) auf 

den abgeschlossenen, linearen Teilraum L 2 (Ω,F,P). Einfacher ausgedrückt 

heißt das: Für eine quadratintegrierbare Zufallsvariable X ist E(X|F ) die 

beste Approximation für X durch eine F-messbare Zufallsvariable bezüglich 

des quadratischen Fehlermaßes E(X −Y ) 2 . 

16.2 Buffons Nadelproblem 

In diesem Abschnitt werden wir mit Hilfe von Bernoulli-Experimenten π 

berechnen. Dazu lassen wir auf eine Ebene, in der vertikale Geraden vom 

Abstand 1 verlaufen, wiederholt eine Nadel der Länge 1 fallen und wir notieren 

jeweils, ob die Nadel eine Vertikale getroffen hat oder nicht. Diesen 

Vorgang beschreiben wir formal mit Hilfe einer Folge unabhängiger, identisch 

verteilter Bernoulli-Variablen (Z i ) i∈N mit 

{ 

1, falls die Nadel eine Linie trifft 

Z i := 

0, sonst 

Mit X bezeichnen wir die Länge des Lotes vom Mittelpunkt der Nadel zur 

linken Vertikalen und Θ sei der Winkel, den die Nadel mit der Verlängerung 

des Lotes bildet. Wir wollen annehmen, dass unser Modell folgenden 

Voraussetzungen genügt: 

1) X ist eine auf dem Intervall [0,1] gleichverteilte Zufallsvariable. 

2) Θ ist eine auf dem Intervall [ −π, 

π ] gleichverteilte Zufallsvariable. 

2 2 

3) X und Θ sind stochastisch unabhängig. 

Da wir bei der Nadel nicht zwischen Anfangs- und Endpunkt unterscheiden, 

wird ihre Lage durch Θ ∈ [ −π , π ] vollständig beschrieben. 

2 2 

Im Folgenden werden wir zeigen, dass P(Z i = 1) = 2/π ist, sodass wir mit 

dem starken Gesetz der großen Zahlen lim 

n→∞ 

1 

n 

∑ n 

i=1 Z i = 2/π P-f.s. erhalten


und damit 

π ∼ 2n/ 

n∑ 

Z i . 

i=1 

Wir können also π näherungsweise bestimmen, indem wir die relative Häufigkeit 

des Ereignisses ” 

Nadel trifft Linie“ ermitteln. 

Zur Bestimmung von P(Z i = 1) unterscheiden wir zwei Fälle: 

1.Fall: Der Mittelpunkt der Nadel liegt zwischen zwei Vertikalen, von denen 

die linke getroffen wird. Dann gilt X ≤ 1 2 cosΘ. 

2.Fall: Die rechte Vertikale wird getroffen. Dann folgt 1−X ≤ 1 2 cosΘ. 

Wegen A := {Z i = 1} 

= {(x,θ) : 0 < x < 1, |θ| ≤ π, x ∈ [0, 1 cosθ]∪[1− 1 cosθ,1]} gilt: 

2 2 2 

P(Z i = 1) = E[ 1 A (X,Θ)] = E[E( 1 A (X,Θ)|Θ)] 

∫ 

= E( 1 A (X,Θ)|Θ)dP 

= 

= 1 π 

= 1 π 

= 1 π 

= 1 π 

∫ π 

2 

= 2 π . 

−π 

2 

∫ π 

2 

−π 

2 

∫ π 

2 

−π 

2 

∫ π 

2 

−π 

2 

∫ π 

2 

E( 1 A (X,Θ)|Θ = θ)dP Θ (θ) 

−π 

2 

E( 1 A (X,Θ)|Θ = θ)dθ 

E[ 1 A (X,θ)]dθ 

P(X ∈ [0, 1 2 cosθ]∪[1− 1 2 cosθ,1])dθ 

cosθdθ 

16.3 Reguläre bedingte Verteilungen 

Nun wollen wir uns der Frage zuwenden, unter welchen Bedingungen die 

bedingteWahrscheinlichkeit P(A|F)einMaßinAist.Wiewirsehenwerden,

16.3. REGULÄRE BEDINGTE VERTEILUNGEN 133 

ist die Antwort auf diese Frage eng mit dem Begriff des stochastischen Kerns 

verbunden. 

Definition 16.4: Seien (Ω,A), (˜Ω,Ã) Messräume. Eine Abbildung Q : 

Ω × Ã −→ [0,1] heißt stochastischer Kern (oder Markovkern) von (Ω,A) 

nach (˜Ω,Ã), falls folgende Eigenschaften gelten: 

a) Q(ω, ·) : Ã −→ [0,1] ist für jedes ω ∈ Ω ein Maß auf Ã. 

b) Für alle A ∈ Ã ist die Abbildung ω ↦→ Q(ω,A) A-messbar. 

MitDefinition16.4könnenwirdenBegriffderregulärenbedingtenVerteilung 

einführen. 

Definition 16.5: Sei B die Borelsche σ-Algebra über R und sei (Ω,A) 

ein Messraum sowie F ⊂ A eine Unter σ-Algebra. Sei X eine A-messbare 

Zufallsvariable. Ein stochastischer Kern Q : Ω × B −→ [0,1] heißt reguläre 

bedingte Verteilung von X gegeben F, falls 

a) Q(ω,B) = P(X ∈ B|F)(ω) P-fast sicher für alle ω ∈ Ω und alle B ∈ B 

gilt, 

b) die Abbildung ω −→ Q(ω,B) F-messbar ist für alle B ∈ B. 

Wir wollen unsere Ausgangsfrage folgendermaßen umformulieren: 

Existiert für eine Zufallsvariable X : (Ω,A) −→ (R,B) eine reguläre bedingte 

Verteilung? 

Der folgende Satz beantwortet diese Frage positiv. 

Satz 16.6: Zu jeder Zufallsvariablen X : (Ω,A) −→ (R,B) existiert eine 

reguläre bedingte Verteilung Q. 

Beweis: Für r ∈ Q und ω ∈ Ω sei F r (ω) eine Version von P(X ≤ r | F)(ω).


Außerdem sei {r i : i ∈ N} eine Abzählung von Q. 

Wir werden zuerst zeigen, dass die Abbildung r ↦→ F r (ω) für P F -fast alle 

ω ∈ Ω eine Verteilungsfunktion auf Q ist. Anschließend werden wir diese auf 

ganz R fortsetzen. 

1. Schritt: r ↦→ F r (ω) ist für P F -fast alle ω ∈ Ω eine Verteilungsfunktion 

auf Q. 

a) Monotonie: Ist r i < r j , so gilt P(X ≤ r i | F) ≤ P(X ≤ r j | F) P F -fast 

sicher. Also ist F ri ≤ F rj P F -fast sicher. Man beachte, dass die Ausnahmenullmenge 

von der Wahl von r i und r j abhängt. Wir setzen deshalb 

A ij := {ω ∈ Ω : F ri (ω) > F rj (ω)}. Dann ist P F (A ij ) = 0. Somit ist auch 

A := ⋃ r i 0}∪{ω ∈ Ω : lim n→∞ F n (ω) ≠ 1} eine 

P F -Nullmenge. 

Damithabenwirgezeigt,dassdieAbbildungr ↦→ F r (ω)füralleω ∉ A∪B∪C 

eine Verteilungsfunktion auf Q ist. 

2. Schritt: Die Fortsetzung von r ↦→ F r (ω) auf ganz R. 

Für x ∈ R und r ∈ Q definieren wir 

⎧ 

⎨limF r (ω), ω ∉ A∪B ∪C 

F(ω,x) := r↓x 

⎩G(x), 

sonst 

wobei G eine fest gewählte Verteilungsfunktion ist. Wir zeigen nun:

16.3. REGULÄRE BEDINGTE VERTEILUNGEN 135 

i) Die Abbildung x ↦→ F(ω,x) ist für alle ω ∈ Ω eine Verteilungsfunktion. 

ii) Für alle x ∈ R gilt F(·,x) = P(X ≤ x | F) P F -fast sicher. 

Zu i): Monotonie und Normiertheit folgen direkt aus der Definition von F. 

Rechtssetige Stetigkeit: Sei (x n ) n∈N eine Folge in R mit x n ↓ x ∈ R und sei 

(r n ) n∈N eine Folge in Q mit x n ≤ r n ≤ x n +1/n. Dann gilt r n ↓ x und wir 

erhalten für ω ∉ A∪B ∪C 

Zu ii): Für B ∈ F gilt: 

F(ω,x) = lim 

r↓x 

F r (ω) = lim 

xn↓x F(ω,x n). 

P({X ≤ x}∩B) = limP({X ≤ r}∩B) = lim 

r↓x 

∫ 

= F(ω,x)dP(ω). 

B 

r↓x 

∫B 

F r (ω)dP F (ω) 

Aus der so erhaltenen Verteilungsfunktion lässt sich nun leicht eine reguläre 

bedingte Verteilung konstruieren: Für ω ∈ Ω sei Q(ω, ·) das zu F(ω, ·) 

gehörige Wahrscheinlichkeitsmaß. Wir setzen D := {A ∈ B : Q(·,A) = 

P(X ∈ A | F)}. Dann ist D eine Monotone Klasse, die alle Intervalle der 

Form (a,b] mit a,b ∈ R enthält. Es gilt deshalb D = B. 

□ 

Folgerung 16.7: Seien X, Y reelle Zufallsvariablen auf dem Wahrscheinlichkeitsraum 

(Ω,A,P). Dann existieren reguläre bedingte Verteilungen Q X 

und Q Y , sodass für alle B,C ∈ B gilt, dass 

∫ ∫ 

P(X ∈ B,Y ∈ C) = Q X (y,B)dP Y (y) = Q Y (x,C)dP X (x). 

C 

B 

Beweis: Setzen wir F := σ(Y ), so existiert nach Satz 16.6 eine reguläre 

bedingte Verteilung Q von X unter F. Da diese bei festem B ∈ B σ(Y )- 

messbar ist, existiert ein stochastischer Kern Q X von (R,B) nach (R,B) mit 

Q X (Y(ω),B) = Q(ω,B) = P(X ∈ B | σ(Y))(ω) P-fast sicher. Deshalb 

folgt die Aussage aus der Definition der bedingten Erwartung sowie einer


Anwendung der Transformationsformel: 

∫ 

P(X ∈ B,Y ∈ C) = P(X ∈ B | σ(Y))dP σ(Y) 

{Y∈C} 

∫ 

= Q(Y(ω),B)dP σ(Y) 

{Y∈C} 

∫ 

= Q X (y,B)dP Y (y) 

Bemerkung: 

1) Sei F ⊂ Aeine Unter σ-Algebra. Sei f ≥ 0oder integrierbar undexistiere 

eine reguläre bedingte Verteilung Q von (Ω,A) nach (Ω,F). Dann ist 

∫ 

E(f | F)(ω) = f(y)Q(ω,dy) P-fast sicher. 

2) EineregulärebedingteVerteilung existiert allgemeiner alsinSatz16.6angegeben. 

Unter der Annahme, dass das Bild von X ein polnischer Raum 

ist, das heißt metrisch, separabel und vollständig, versehen mit der Borelschen 

σ-Algebra, existiert eine reguläre bedingte Verteilung. Man sieht 

dies durch leichte Verallgemeinerung des Beweises von Satz 16.6.

Kapitel 17 

Martingale 

ImFolgendenbetrachten wir Martingale,SubmartingaleundSupermartingale. 

Das sind spezielle Folgen von Zufallsvariablen, die man als faire, günstige 

bzw. ungünstige Spiele interpretieren kann. 

17.1 Definitionen und Eigenschaften 

Wir werden unseren Betrachtungen einen Wahrscheinlichkeitsraum (Ω,F,P) 

und ein Intervall I von Z ∪ {−∞,∞} zugrundelegen. Wird nichts anderes 

gesagt, so sind alle auftretenden Folgen von Zufallsvariablen auf (Ω,F,P) 

definiert und auftretende σ-Algebren sind Unter-σ-Algebren von F. 

Definition 17.1: Sei(X n ) n∈I einFolgevonZufallsvariablenundsei(F n ) n∈I 

eine Folge von Unter-σ-Algebren von F. 

1) (F n ) n∈I heißt Filtrierung, falls die F n aufsteigend sind, d.h. F n ⊂ F n+1 

für alle n ∈ I. 

2) (X n ) n∈I heißt adaptiert bezüglich (F n ) n∈I , falls X n F n -messbar ist für alle 

n ∈ I. 

Definition 17.2: Sei (F n ) n∈I eine Filtrierung und sei (X n ) n∈I eine Folge 

(F n ) n∈I -adaptierter Zufallsvariablen. 

137

138 KAPITEL 17. MARTINGALE 

1) (X n ,F n ) n∈I heißt Submartingal, falls EX n + für alle n ∈ I endlich ist und 

für alle m,n ∈ I mit m < n gilt, dass X m ≤ E(X n |F m ). 

2) (X n ,F n ) n∈I heißt Supermartingal, falls EXn − für alle n ∈ I endlich ist 

und (−X n ,F n ) n∈I ein Submartingal ist, also für alle m,n ∈ I mit m < n 

gilt, dass X m ≥ E(X n |F m ). 

3) Die Folge (X n ,F n ) n∈I heißt Martingal, falls sie sowohl ein Sub- als auch 

ein Supermartingal ist. 

Wennklarist,welcheFiltrationzugrundeliegt,schreibenwiranstatt(X n ,F n ) n∈I 

auch oft nur (X n ) n∈I oder noch kürzer einfach X. 

Bemerkung: 

1) Es gilt genau dann E(X n |F m ) = X m (bzw. ≤, bzw. ≥) für alle m < n, 

wenn ∫ X A ndP = ∫ X A mdP (bzw. ≤, bzw. ≥) für alle m < n und alle 

A ∈ F m . 

2) Enthält I weder −∞ noch +∞, so gilt E(X n |F m ) = X m (bzw. ≤, bzw. 

≥) für alle m < n, genau dann wenn E(X n+1 |F n ) = X n für alle n ∈ N. 

Beweis: 

Zu 2): Für m < n gilt 

E(X n |F m ) = E(E(X n |F n−1 )|F m ) = E(X n−1 |F m ) = ··· = E(X m |F m ) 

= X m . 

DieAussagenmit≤und≥folgenanalog. 

17.2 Beispiele für Martingale 

17.2.1 Summen unabhängiger Zufallsvariablen 

Sei (Y i ) i∈N eine Folge unabhängiger Zufallsvariablen mit E|Y k | < ∞ und 

EY k = 0 für alle k ≥ 1. Sei X 0 := 0, X n := ∑ n 

i=1 Y i, F 0 := {∅,Ω} und

17.2. BEISPIELE FÜR MARTINGALE 139 

F n := σ(Y 1 ,...,Y n ) für n ≥ 1. Dann ist (X n ,F n ) n≥0 ein Martingal. 

Beweise: 

E(X n |F n−1 ) = E(X n−1 |F n−1 )+E(Y n |F n−1 ) = X n−1 +EY n 

= X n−1 . 

□ 

Man sieht, dass (X n ,F n ) n≥0 im Falle EY k > 0 ein Submartingal ist, während 

sich für EY k < 0 ein Supermartingal ergibt. 

17.2.2 Produkte unabhängiger Zufallsvariablen 

Sei(Z i ) i∈N einFolgenichtnegativer,unabhängigerZufallsvariablenmitEZ k = 

1 für alle k ∈ N. Sei Z 0 := 1, F 0 := {∅,Ω} und X n = ∏ n 

k=1 Z k sowie X 0 := 1. 

Außerdem sei F n := σ(Z 1 ,...,Z n ). Dann ist (X n ,F n ) n≥0 ein Martingal. 

Beweis: Für alle n ∈ N gilt 

E(X n |F n−1 ) = E(X n−1 Z n |F n−1 ) = X n−1 E(Z n |F n−1 ) = X n−1 EZ n 

= X n−1 . 

□ 

Wie man sieht, ergibt sich für EZ k < 1 ein Supermartingal. 

17.2.3 Vonintegrierbaren Zufallsvariablen erzeugte Martingale 

Sei Y eine Zufallsvariable mit E|Y | < ∞ und sei (F n ) n≥0 eine Filtrierung 

sowie X n := E(Y |F n ). Dann ist (X n ,F n ) n≥0 ein Martingal. 

Beweis: Für alle n ∈ N gilt 

E(X n |F n−1 ) = E(E(Y |F n )|F n−1 ) = E(Y |F n−1 ) = X n−1 . 

□


17.2.4 Stochastische Exponentiale 

Sei (Y i ) i∈N eine Folge unabhängiger, identisch verteilter Zufallsvariablen. Es 

existiere ein λ > 0, sodass φ(λ) := Ee λY 1 

endlich ist. Sei 

X n := eλ(Y 1+···+Y n) 

φ(λ) n = 

n∏ 

i=1 

e λY i 

φ(λ) . 

Sei F 0 = {∅,Ω}, F n := σ(Y 1 ,...,Y n ) für n ≥ 1 und X 0 := 1. Dann ist 

(X n ,F n ) n≥0 als Spezialfall von 2) ein Martingal. 

17.2.5 Dichteprozesse 

Sei (F n ) n∈N eine Filtrierung und seien Q 1 und Q 2 Wahrscheinlichkeitsmaße 

auf F. Seien Q 1 n := Q1 |F n und Q 2 n := Q2 |F n mit der Eigenschaft Q 1 n ≪ Q2 n 

und sei X n := dQ 1 n/dQ 2 n die Radon-Nikodym Ableitung von Q 1 n bezüglich 

Q 2 n , d.h., für alle A ∈ F n gilt Q 1 n (A) = ∫ A X ndQ 2 n . Dann ist (X n,F n ) n≥1 ein 

Martingal bezüglich Q 2 . 

Beweis: Für alle m,n ≥ 1 mit m < n und für alle A ∈ F m gilt: 

∫ ∫ 

∫ 

X m dQ 2 = X m dQ 2 m = Q 1 m(A) = Q 1 (A) = X n dQ 2 . 

A A 

A 

□ 

17.2.6 Harmonische Funktionen von Markov-Ketten 

Sei (X n ) n≥0 eine transiente Markov-Kette mit Übergangsmatrix Q und diskretem 

Zustandsraum E. Sei h : E → R eine Funktion, die die Mittelwerteigenschaft 

hat, das heißt 

∑ 

Q(x,y)h(y) = h(x) für alle x ∈ E. 

y∈E 

Sei F n = σ(X 0 ,X 1 ,...,X n ). Dann ist (h(X n ),F n ) n≥0 ein Martingal. Denn 

E(h(X n+1 ) | F n ) = E(h(X n+1 ) | X n ) = ∑ n ,y)h(y) = h(X n ). 

y∈EQ(X

17.3. WEITERE EIGENSCHAFTEN 141 

17.2.7 Ein rückläufiges Martingal 

Das folgende Beispiel werden wir später nutzen, um das starke Gesetz der 

großen Zahlen zu beweisen. Sei (Y i ) i∈N eine Folge unabhängiger, identisch 

verteilter Zufallsvariablen mit E|Y 1 | < ∞. Sei S n := ∑ n 

i=1 Y i, X −n := S n /n 

und F −n := σ(S m : m ≥ n). Dann gilt E(Y 1 |F −n ) = S n /n. 

Beweis: Fürallen ≥ 1undallek ∈ {1,...,n}giltE(Y 1 |F −n ) = E(Y k |F −n ). 

Dies sieht man wie folgt: Wegen Bemerkung 16.3 gilt 

E(Y k |F −n ) = E(Y k |σ(S n )) für k ∈ {1,...,n}. 

Da die Y i identisch verteilt sind, gilt ∫ {S n∈B} Y kdP = ∫ {S n∈B} Y 1dP für alle 

B ∈ B, das heißt 

E(Y 1 |F −n ) = E(Y 1 |σ(S n )) = E(Y k |σ(S n )) = E(Y k |F −n ) für k ∈ {1,...,n}. 

Damit folgt 

nE(Y 1 |F −n ) = 

( 

n∑ 

n∑ 

) 

E(Y k |F −n ) = E k |F −n = E(S n |F −n ) = S n . 

k=1Y 

k=1 

□ 

17.3 Weitere Eigenschaften 

Als nächstes zeigen wir die Jensensche Ungleichung für bedingte Erwartungen. 

Lemma 17.3: Sei φ : R −→ R eine konvexe Funktion und X eine Zufallsvariable 

mit Eφ(X) < ∞. Dann gilt 

φ(E(X|G)) ≤ E(φ(X)|G) P-fast sicher. 

Beweis: Mit Hilfe der Jensenschen Ungleichung für Erwartungen folgt 

φ(EX) ≤ Eφ(X), also EX < ∞. Wegen der Konvexität von φ existiert 

zu x 0 ∈ R ein λ ∈ R mit φ(x) ≥ φ(x 0 ) + λ(x − x 0 ) für alle x ∈ R. Sei h


eine Version von E(X|G). Dann ist φ(X) ≥ φ(h)+λ h (X−h), wobei λ h eine 

G-messbare Abbildung ist. Bildet man nun E(· |G), so ist 

E(φ(X)|G) ≥ E(φ(h)|G)+E(λ h (X−h)|G) = φ(h)+λ h (E(X|G)−h) = φ(h), 

da der zweite Term gleich Null ist. 

□ 

Lemma 17.4 zeigt wie man aus gegebenen Submartingalen neue konstruieren 

kann. 

Lemma 17.4: Sei (X n ,F n ) n∈I ein Submartingal und φ eine wachsende, 

konvexe Funktion mit Eφ(X n0 ) + < ∞ für ein n 0 ∈ I. Dann ist 

(φ(X n ),F n ) n∈I,n≥n0 

ein Submartingal. 

Beweis: Wende Lemma 17.3 an. 

E(φ(X n+1 ) | F n ) ≥ φ(E(X n+1 ) | F n )) = φ(X n ) 

□ 

Bemerkung: Ist (X n ,F n ) n∈I in Lemma 17.4 ein Martingal, so reicht es aus, 

φalskonvexvorauszusetzen. 

Beispiel 17.5: Sei (X n ,F n ) n∈I ein Martingal. Dann gelten die folgenden 

Eigenschaften: 

1) (|X n |,F n ) n∈I isteinSubmartingal,denndieFunktionx ↦→ |x|istkonvex. 

2) Ist EXn 2 für alle n ∈ I endlich, so ist (X2 n ,F n) n∈I ein Submartingal, da 

die Funktion x ↦→ x 2 konvex ist. 

3) Sei (X n ,F n ) n∈I ein Submartingal. Dann ist auch (max{X n ,a},F n ) n∈I ein 

Submartingal. Insbesondere ist (X n + ,F n) n∈I ein Submartingal.

17.4. MARTINGALE ALS FAIRE SPIELE 143 

Beweis: 

Zu 3): Für alle m,n ∈ I mit m < n gilt 

E(max{X n ,a}|F m ) ≥ E(X n |F m ) ≥ X m 

und 

E(max{X n ,a}|F m ) ≥ E(a|F m ) = a. 

□ 

17.4 Martingale als faire Spiele 

Im Folgenden werden wir sehen, dass sich Martingale (Submartingale bzw. 

Supermartingale) als faire (günstige bzw. ungünstige) Spiele interpretieren 

lassen. 

Definition 17.6: Sei (X n ,F n ) n∈N ein Martingal und (V n ,F n ) n∈N vorhersehbar, 

d.h., V n ist F n−1 -messbar für jedes n ∈ N . Sei (V ·X) 0 := 0 und 

(V ·X) n := 

n∑ 

V i (X i −X i−1 ) 

i=1 

für n ∈ N. Dann heißt ((V · X) n ,F n ) n∈N0 Martingaltransformierte von X 

bezüglich V oder auch stochastisches Integral von V bzgl. X. 

Für die Martingaltransformierte gibt es eine einfache anschauliche Deutung: 

Nehmen wir an, dass das Martingal ein Spiel beschreibt und dass X n die 

Summe der gewonnenen minus der Summe der verlorenen Spiele nach n 

Wiederholungen ist, (X n − X n−1 ) ist dann der Ausgang des n-ten Spiels. 

Weiterhin sei V n der Einsatz im n-ten Spiel (Vorhersehbarkeit ist hier eine 

natürliche Annahme, da der Einsatz vor dem Zeitpunkt n gemacht werden 

muss). Dann ist (V ·X) n der Gesamtgewinn nach n Spielen. 

Lemma 17.7: Ist (V n ) n∈N durch ein k ∈ R beschränkt, das heißt |V n | ≤ 

k für alle n ∈ N, und vorhersehbar und ist (X n ,F n ) n∈N ein Martingal, so 

ist auch ((V · X) n ,F n ) n∈N ein Martingal. Ist V n zusätzlich für alle n ∈ N


nichtnegativ und ist (X n ,F n ) n∈N ein Super- bzw. Submartingal, so ist auch 

((V ·X) n ,F n ) n∈N ein Super- bzw. Submartingal. 

Beweis: Für alle n ∈ N gilt: 

E((V ·X) n |F n−1 )−(V ·X) n−1 = E((V ·X) n −(V ·X) n−1 |F n−1 ) 

= E(V n (X n −X n−1 )|F n−1 ) 

= V n E(X n −X n−1 |F n−1 ). 

Wegen 

⎧ 

⎪⎨ = 0 : falls (X n ,F n ) n∈N ein Martingal 

E(X n −X n−1 |F n−1 ) ≥ 0 : falls (X n ,F n ) n∈N ein Submartingal 

⎪⎩ 

≤ 0 : falls (X n ,F n ) n∈N ein Supermartingal 

folgtdieBehauptung. 

17.4.1 Interpretation und Beispiele für Spielsysteme 

Sei(Z n ) n∈N eineFolgevonunabhängig,identischverteiltenBernoulli-Variablen 

mit P(Z n = 1) = p und P(Z n = −1) = 1 − p =: q. Man interpretiert 

Z n = 1 als Gewinn des n-ten Spiels und entsprechend Z n = −1 als Verlust. 

Sei F n := σ(Z 1 ,...,Z n ). Darüber hinaus sei V n der Einsatz im n-ten 

Spiel, sodass wir annehmen dürfen, dass V n vorhersehbar ist, denn der Einsatz 

wird vor dem n-ten Spiel nur unter Kenntnis der ersten n − 1 Spiele 

festgelegt. Sei X n := Z 1 + ··· + Z n mit der Konvention X 0 := 0 und sei 

W n := ∑ n 

i=1 V iZ i = ∑ n 

i=1 V i(X i −X i−1 ) die Martingaltransformierte von X 

bezüglich V. Dies ist dann der Gesamtgewinn nach n Spielen. Dann gilt: 

E(W n −W n−1 |F n−1 ) = V n E(X n −X n−1 |F n−1 ) = V n E(Z n |F n−1 ) = V n EZ n . 

Ist V n strikt positiv, so folgt 

V n EZ n 

⎧ 

⎪⎨ 

⎪ ⎩ 

> 0 falls p > q, d.h. (X n ,F n ) n∈N ist Submartingal 

= 0 falls p = q, d.h. (X n ,F n ) n∈N ist Martingal 

< 0 falls p < q, d.h. (X n ,F n ) n∈N ist Supermartingal.

17.5. NICHTEXISTENZ GÜNSTIGER SPIELSYSTEME 145 

Man kann somit ein Martingal als faires Spiel, ein Submartingal als günstiges 

und ein Supermartingal als ungünstiges Spiel ansehen. 

Als Beispiel betrachten wir das Petersburger Paradoxon: Wir definieren 

V 1 := 1 und für n ≥ 2 

V n := 

{ 

2 n−1 falls Z 1 = −1,...,Z n−1 = −1 

0 sonst 

Dies heißt, man verdoppelt stets seinen Einsatz, bis zum ersten Gewinn. 

Außerdem nehmen wir an, das Spiel sei fair, d.h. 

P(Z i = +1) = P(Z i = −1) = 1/2. 

Nun überlegt man sich leicht, dass W n+1 = 1 ist, wenn n+1 der erste Zeitpunkt 

ist, zu dem man gewinnt. Wir haben also eine Spielstrategie gefunden, 

mit der wir immer gewinnen und das nach endlich vielen Spielen, wie wir 

jetzt sehen werden. Definieren wir nämlich T := min{n ≥ 1 : W n = 1}, so 

gilt 

( ) k 1 

P(T = k) = P({Z 1 = −1}∩···∩{Z k−1 = −1}∩{Z k = 1}) = . 

2 

Damit ist ET = ∑ ∞ 

k=1 kP(T = k) = ∑ ∞ 

k=1 k(1/2)k < ∞. Das heißt, im 

Mittel tritt nach endlich vielen Spielen ein Gewinn ein. Weshalb ist es aber 

trotzdem nicht ratsam, diese Strategie zu verwenden? Das Problem ist, dass 

man, um zu gewinnen, ein unendlich großes Spielkapital benötigt, denn es 

gilt: 

EV T = 

∞∑ 

V k P(T = k) = 

k=1 

∞∑ 

( k 1 

2 

2) k−1 = 

k=1 

∞∑ 

k=1 

1 

2 = ∞. 

17.5 Nichtexistenz günstiger Spielsysteme 

Bis einschließlich Beispiel 17.10 dient im Folgenden das Buch ” 

Probability 

with Martingales“ von D. Williams als Grundlage. 

Wir wollen uns nun folgendem Problem zuwenden:


Falls (X n ,F n ) n∈N ein Martingal ist und T eine Stoppzeit, unter welchen Voraussetzungen 

gilt dann EX T = EX 0 ? 

Dass Voraussetzungen nötig sind, zeigt schon das Beispiel des Petersburger 

Paradoxon, bei dem EW T = 1 ≠ 0 = EW 1 gilt. Als weiteres Beispiel 

betrachten wir die symmetrische Irrfahrt: Sei (X n ) n∈N eine Folge von unabhängig, 

identisch verteilten Bernoulli-Variablen mit P(X i = 1) = P(X i = 

∑ 

−1) = 1/2 und sei X 0 := 0. Außerdem sei S n := n X i , S 0 := 0 und 

T := min{n > 0 | S n = 1}. Dann ist ES T = 1, aber ES 0 = 0. 

i=1 

Satz 17.8: Sei (X n ,F n ) n∈N ein Martingal und T eine Stoppzeit. Dann ist 

(X T∧n −X 0 ,F n ) n∈N 

ein Martingal mit Erwartungswert 0. Insbesondere gilt EX T∧n = EX 0 für 

alle n ∈ N. 

Beweis: Sei V (T) 

n 

:= 1 {T≥n} . Dann ist V (T) 

n 

F n−1 -messbar, denn 

und 

{V (T) 

n 

= 0} = {T < n} = {T ≤ n−1} ∈ F n−1 

{V (T) 

n 

= 1} = {V (T) 

n = 0} c ∈ F n−1 . 

Nach Lemma 17.7 ist ((V (T) ·X) n ,F n ) n∈N ein Martingal. Wegen 

(V (T) ·X) n = 

n∑ 

i=1 

V (T) 

i (X i −X i−1 ) = 

n∑ 

1 {T≥i} (X i −X i−1 ) = X T∧n −X 0 

i=1 

folgt die Behauptung. 

□ 

Satz 17.9 (Die Nichtexistenz eines günstigen Spielsystems): Sei 

X ein Martingal, dessen Zuwächse |X n − X n−1 | durch ein k 1 ∈ R beschränkt 

sind und sei V einvorhersehbarer Prozess, der durch eine Konstante 

k 2 ∈ R beschränkt ist. Ferner sei T eine Stoppzeit mit ET < ∞. Dann ist 

E(V ·X) T = 0.

17.5. NICHTEXISTENZ GÜNSTIGER SPIELSYSTEME 147 

Unter den Voraussetzungen aus Satz 17.9 kann man also den Gesamtgewinn 

eines Spiels durch Ändern des Spielsystems nicht verbessern. Wir werden 

später noch eine Verallgemeinerung diese Satzes kennenlernen. 

Beweis: Nach Satz 17.8 wissen wir, dass 

(∗) E(V ·X) T∧n = E(V ·X) 0 = 0 

gilt. Außerdem ist 

∑T∧n 

|(V ·X) T∧n | = 

V k (X k −X k−1 ) 

∣ ∣ ≤ k 2 

k=1 

T∑ 

|X k −X k−1 | ≤ k 1 k 2 T. 

Da lim n→∞ (V ·X) T∧n = (V ·X) T , folgt mit dem Satz von der majorisierten 

Konvergenz, da ET < ∞ ist, dass lim n→∞ E(V ·X) T∧n = E(V ·X) T . Die Behauptungergibtsichnunmit(∗). 

Bemerkung: Satz 17.9 wird auch als Optional Stopping Theorem bezeichnet. 

Beispiel 17.10 (Die ABRACADABRA-Aufgabe): Jede Sekunde tippe 

ein Affe einen von 26 möglichen Buchstaben. Wie lange braucht der Affe im 

k=1 

Mittel bis er das Wort ” 

ABRACADABRA”’ getippt hat? 

Sei T die Zeit (in Sekunden), die der Affe benötigt. Wir werden sehen, dass 

ET = 26+26 4 +26 11 gilt. 

Für den Beweis werden wir das Optional Stopping Theorem (nach D. Williams) 

verwenden. Dazu betrachten wir das Problem als ein faires Spiel: Zu 

den Zeitpunkten n ∈ N setzt je ein Spieler einen Euro darauf, dass der Affe 

als ersten Buchstaben ein A schreibt. Wenn er gewinnt, erhält er 26 Euro 

und setzt diese im zweiten Spiel darauf, dass der Affe B tippt. Gewinnt er, 

so bekommt er 26 2 Euro ausgezahlt, usw. Verliert der Spieler, so ist das Spiel 

für ihn beendet. Das Spiel ist insgesamt beendet, wenn erstmals das Wort 

ABRACADABRA“ erscheint. 

” 

Wir kommen nun zum zugehörenden Formalismus: Für n ∈ N sei 

{ 

1{i-ter Buchstabe vom n-ten Spieler richtig getippt} , falls i ≤ 11 

Y n,i := 

1/26, falls i ≥ 12


Wir nehmen an, dassdie Y n,i unabhängigsind. Der Gewinndes n-tenSpielers 

nach l Buchstaben ist gegeben durch 

{ 

l∏ 26 l , falls die ersten l Buchstaben richtig sind 

Z n,l := (26Y n,i ) = 

0, falls einer der ersten l Buchstaben falsch ist 

i=1 

Nach Beispiel 17.2.2 ist Z n,l in l ein Martingal bezüglich σ(Y n,1 ,...,Y n,l ) mit 

EZ n,l = 1. Sei W n die Auszahlung nach der n-ten Spielrunde. Dann ist W n = 

n−1 ∑ 

Z n−l,l+1 . Die Folge (W n −n) n∈N ist bezüglich F n := σ(Y k,i : k+i ≤ n+1) 

l=0 

ein Martingal. 

Sei T := min{n ∈ N : W n ≥ 26 11 } der erste Zeitpunkt, zu dem das Wort 

” ABRACADABRA“ erscheint. Wie man sich leicht überlegt, ist Z T,1 = 26, 

Z T−3,4 = 26 4 und Z T−10,11 = 26 11 . Alle anderen Z T−i,i+1 sind identisch null. 

Es ergibt sich W T = 26+26 4 +26 11 . Darüber hinaus folgt mit dem Optional 

Stopping Theorem E(W T −T) = 0. Damit gilt 

ET = EW T = 26+26 4 +26 11 . 

17.6 Das Optional Sampling Theorem 

WirwollennundierechtstarkenVoraussetzungenvonSatz17.9abschwächen. 

Es ist klar, dass man für die Gültigkeit von EX T = EX 0 fordern muss, dass 

E|X T | < ∞ ist. Allerdings ist diese Bedingung nicht ausreichend, wie das 

Beispiel der symmetrischen Irrfahrt zeigt. Der folgende, zentrale Satz gibt 

uns eine zweite Bedingung, die zusammen mit E|X T | < ∞ hinreichend ist. 

Satz 17.11 (Optional Sampling Theorem): Sei (T i ) i∈N eine wachsende 

Folge von fast sicher endlichen Stoppzeiten, d.h. T i ≤ T i+1 für alle i ∈ N, und 

sei (X n ,F n ) n∈N ein Submartingal mit E|X n | < ∞ für alle n ∈ N. Es gelte: 

1) E|X Tk | < ∞ für alle k ∈ N. 

2) liminf 

N→∞ 

∫ 

{T k >N } |X N |dP = 0 für alle k ∈ N. 

Dann ist (X Tk ,F Tk ) k∈N ein Submartingal.

17.6. DAS OPTIONAL SAMPLING THEOREM 149 

Beweis: Für eine Stoppzeit T definieren wir: 

F T = {A ∈ F : A∩{T = k} ∈ F k für k ∈ N}. 

Dann ist X T F T -messbar. Wir setzen ˜X n := X Tn und ˜F n := F Tn . Sei A ∈ ˜F n . 

Wir müssen zeigen, dass 

(∗) 

∫ 

A 

∫ 

˜X n dP ≤ 

A 

˜X n+1 dP für alle n ∈ N gilt. 

Sei D j := A∩{T n = j} ∈ F j . Dannist A = ⋃ j∈N D j. Also ist es ausreichend, 

(∗) für D j und beliebiges j ∈ N zu zeigen, denn 

Es gilt: 

und 

∫ 

A 

∫ ∫ 

˜Xn dP = 

D j 

∫ ∫ 

˜Xn+1 dP = 

D j 

Wir zeigen nun: 

= 

= 

a) (∗∗) ≥ ∫ D j 

X j dP 

und 

˜X n dP = 

A∩{T n=j} 

D j ∩{T n+1 ≤N } 

N∑ 

∫ 

i=j 

N∑ 

∫ 

i=j 

D j ∩{T n+1 =i} 

D j ∩{T n+1 =i} 

∞∑ 

∫ 

j=1 

D j 

˜Xn dP. 

∫ 

˜X n dP = 

∫ 

˜X n+1 dP + 

∫ 

˜X n+1 dP + 

∫ 

˜X n+1 dP + 

A∩{T n=j} 

D j ∩{T n+1 >N } 

X j dP 

D j ∩{T n+1 >N } 

D j ∩{T n+1 >N } 

˜X n+1 dP 

˜X n+1 dP 

X N dP 

} {{ } 

∫ 

− 

D j ∩{T n+1 >N } 

b) (□) → 0 für eine geeignete Teilfolge. 

(∗∗) 

(X N − ˜X n+1 )dP . 

} {{ } 

(□)


Dann folgt ∫ D j 

˜Xn+1 dP ≥ ∫ D j 

X j dP, also die Behauptung. 

Zu a): Es gilt: 

(∗∗) = 

= 

= 

≥ 

N−1 

∑ 

i=j 

N−1 

∑ 

i=j 

N−1 

∑ 

i=j 

N−1 

∑ 

i=j 

∫ 

∫ 

∫ 

∫ 

D j ∩{T n+1 =i} 

D j ∩{T n+1 =i} 

D j ∩{T n+1 =i} 

D j ∩{T n+1 =i} 

∫ 

˜X n+1 dP + 

∫ 

˜X n+1 dP + 

∫ 

˜X n+1 dP + 

∫ 

˜X n+1 dP + 

D j ∩{T n+1 =N } 

D j ∩{T n+1 ≥N } 

D j ∩{T n+1 >N−1} 

D j ∩{T n+1 >N−1} 

∫ 

X N dP + 

X N dP 

X N dP 

X N−1 dP 

D j ∩{T n+1 >N } 

X N dP 

(wegen der Submartingaleigenschaft der X n ) 

≥ 

N−2 

∑ 

i=j 

∫ 

D j ∩{T n+1 =i} 

∫ 

˜X n+1 dP + 

D j ∩{T n+1 >N−2} 

(Wiederholung der ersten Schritte mit N −1 statt N) 

∫ ∫ 

≥ X j dP + X j dP 

D j ∩{T n+1 =j} D j ∩{T n+1 >j} 

∫ 

= X j dP 

D j ∩{T n+1 ≥j} 

∫ 

= X j dP (da {T n+1 ≥ j} ⊃ {T n ≥ j}). 

D j 

X N−2 dP 

Zu b): Es gilt 

∫ ∫ 

(□) = X N dP − 

D j ∩{T n+1 >N } D j ∩{T n+1 >N } 

˜X n+1 dP. 

Für den ersten Summanden ergibt sich 

∫ 

X N dP 

∣ ∣ 

∫{T ≤ |X N |dP → 0 

n+1 >N } 

D j ∩{T n+1 >N } 

nach Voraussetzung 2) für eine geeignete Teilfolge. 

Der zweite Summand konvergiert auch gegen 0: T n+1 ist eine Stoppzeit, also

17.6. DAS OPTIONAL SAMPLING THEOREM 151 

folgt {T n+1 > N } ↓ N ∅. Nach Voraussetzung 1) ist 

E| ˜X n+1 1 {Tn+1 >N }| ≤ E| ˜X n+1 | < ∞ für alle N ∈ N. 

Wir erhalten deshalb mit dem Satz von der majorisierten Konvergenz, dass 

∫ 

˜X n+1 dP 

∣ ∣ 

∫{T ≤ | ˜X n+1 |dP → 0 für N → ∞. 

n+1 >N } 

D j ∩{T n+1 >N } 

Damit ist auch b) gezeigt. 

□ 

Bemerkung: Im Beispiel der symmetrischen Irrfahrt (Seite 139) ist Voraussetzung 

2) aus Satz 17.11 verletzt. 

Beweis: Mit den Bezeichnungen aus dem Beispiel der symmetrischen Irrfahrt(sieheAbschnitt17.2.1)folgt:(S 

n ) n∈N isteinMartingal,alsoist(|S n |) n∈N 

ein Submartingal (siehe Beispiel 17.5 1)). Sei A N−1 := {S 1 = −1,S 2 ≠ 

0,...,S N−1 ≠ 0}. Dann ist A N−1 ein Element von F N−1 und es gilt A N−1 ⊂ 

{T > N }. Damit erhalten wir: 

∫ ∫ ∫ 

|S N |dP ≥ |S N |dP ≥ |S N−1 |dP 

{T>N } A N−1 A 

∫ ∫ 

N−1 

≥ |S N−1 |dP ≥ |S N−2 |dP 

A N−2 A 

∫ 

N−2 

≥ |S 1 |dP = P(S 1 = −1) 

= 1 2 . 

{S 1 =−1} 

Somit ist liminf N→∞ 

∫{T>N } |S N |dP ≥ 1/2. 

□ 

Korollar 17.12 (Optional Stopping Theorem): Sei T eine fast sicher 

endliche Stoppzeit und sei (X n ,F n ) n∈N ein Submartingal (bzw. Martingal) 

mit E|X n | < ∞ für alle n ∈ N, sodass T die Voraussetzungen 1) und 2) aus 

Satz 17.11 erfüllt. Dann gilt EX T ≥ EX 1 (bzw. EX T = EX 1 ).


Beweis: Setze T 1 := 1, T k := T für k ≥ 2 und wende das Optional Sampling 

Theorem an. 

□ 

17.7 EinigeAnwendungendesOptionalSampling 

Theorems 

Beispiel 17.13 (Ruin-Problem): Sei (X i ) i∈N eine Folge unabhängiger, 

identisch verteilter Zufallsvariablen mit P(X i = 1) = p = 1−P(X i = −1). 

Sei S n := S 0 + ∑ n 

i=1 X i, S 0 := k für ein 0 < k < N, F 0 := {∅,Ω} und 

F n := σ(X 1 ,...,X n ). Darüberhinaus bezeichnen wir mit T die Stoppzeit 

T := min{n ≥ 1 : S n ∈ {0,N}}. p k sei durch p k := P(S T = 0) definiert (p k 

ist dann die Wahrscheinlichkeit, sich bei dem durch (X i ) i∈N definierten Spiel 

” zu ruinieren“, wenn man das Kapital k einsetzt). Wir wollen p k berechnen. 

( Sn 

q 

Sei q := 1−p. Durch Y n := p) 

wird ein Martingal definiert, denn es gilt: 

( (q ) Sn+X n+1 ∣ ( ) Sn 

( Xn+1 

∣∣Fn q q 

E(Y n+1 |F n ) = E = E 

p) 

p p) 

( ) ( 

Sn 

(q ) −1 ( ) ( Sn 

q q q 

= q + p = 

p p p) 

p) 

= Y n . 

Damit erhalten wir EY n = EY 0 = 

Theorem). Wegen 

( q 

EY T = P(S T = 0)+P(S T = N) 

p 

( 

q 

p) k 

und EYT = EY 0 (Optional Stopping 

) N ( N q 

= p k +(1−p k ) 

p) 

folgt 

p k = 

( 

q 

p 

) k 

− 

( 

( 

1− 

q 

p 

) N 

q 

p 

) N 

für p ≠ q. 

Beispiel 17.14 (Waldsche Identität): Sei (ξ n ) n∈N eine Folge unabhängiger, 

identisch verteilter Zufallsvariablen mit E|ξ 1 | < ∞. Seien für n ≥ 1

17.7. EINIGEANWENDUNGENDESOPTIONALSAMPLINGTHEOREMS153 

F n := σ(ξ 1 ,...,ξ n ), T eine Stoppzeit bezüglich (F n ) n∈N mit ET < ∞ und 

S T := ∑ T 

i=1 ξ i (zufällig gestoppte Summe). Man kann sich vorstellen, dass 

(ξ n ) n∈N eine Folge von Schadensfällen (z.B. Unwetterschäden) beschreibt, 

wobei ξ n die Höhe des n-ten Schadens angibt und dass T die Anzahl dieser 

Schadensfälle (innerhalb eines Jahres) ist. Dann ist ES T der mittlere Gesamtschaden. 

Es gilt ES T = Eξ 1 ET. 

Beweis: Wir wollen Korollar 17.12 anwenden. Dazu definieren wir uns 

X n := S n − nEξ 1 als ein geeignetes Martingal. Dann ist E|X n | < ∞ für 

alle n ∈ N. Es genügt somit, die Voraussetzungen 1) und 2) aus Satz 17.11 

für T nachzuprüfen. 

Zu 1): Y n := ∑ n 

i=1 |ξ i|−nE|ξ 1 | definiert ein Martingal. Also folgt mit Satz 

17.9, dass EY T∧n = 0 und damit E ∑ T∧n 

i=1 |ξ i| = E(T ∧n)E|ξ 1 | gilt. Es ist 

∑T∧n 

E |ξ i | = E 

i=1 

und deshalb folgt: 

T∑ 

|ξ i |1 {T≤n} +E 

i=1 

ET E|ξ 1 | ≥ E(T ∧n)E|ξ 1 | ≥ E 

Damit ist 

−→ E 

n∑ 

|ξ i |1 {T>n} ≥ E 

i=1 

T∑ 

|ξ i |1 {T≤n} 

i=1 

T∑ 

|ξ i |1 {T≤n} 

T∑ 

|ξ i | für n → ∞ (Satz von der monotonen Konvergenz). 

i=1 

i=1 

E|X T | = E|S T −TEξ 1 | 

∣ T∑ ∣∣∣∣ 

≤ E 

ξ i +ET E|ξ 1 | ≤ E 

∣ 

i=1 

≤ 2ET E|ξ 1 | < ∞. 

T∑ 

|ξ i |+ET E|ξ 1 | 

i=1 

Also folgt 1). 

Zu 2): Auf {T > N} gilt 

|X N | = 

N∑ 

|ξ i −N Eξ 1 | ≤ 

i=1 

N∑ 

|ξ i |+N E|ξ 1 | ≤ 

i=1 

T∑ 

|ξ i |+T E|ξ 1 | 

i=1


Daraus folgt 

∫ ∫ 

|X N |dP ≤ 

{T>N} 

{T>N}( T∑ 

i=1 

) 

|ξ i |+T E|ξ 1 | dP → 0 für N → ∞, 

da nach 1) gilt 

Somit ist auch 2) gezeigt. 

E 

T∑ 

|ξ i |+ET E|ξ 1 | < ∞. 

i=1 

Wir erhalten nun mit Hilfe von Korollar 17.12, dass EX T = EX 1 = 0 ist 

und damit ES T −ETEξ 1 = 0. 

Beispiel (Die Stoppverteilung der Irrfahrt): Die Folge von Zufallsvariablen 

(X i ) i∈N und die σ-Algebren F n seien wie in Beispiel 17.13 definiert. 

∑ 

Sei S n := n X i und T b := min{n ∈ N : S n ≥ b} für b ∈ N. Wir setzen 

i=1 

q := 1−p. Dann gilt für alle p ∈ (0,1): 

( 

Es T b 

1− √ ) b 

1−4pqs 

1 {Tb 0ist{z Sn /φ(z) n ,F n ; 

n ∈ N} nach Beispiel 17.2.2 ein Martingal, wobei φ(z) = Ez X 1 

= pz +qz −1 

ist. Wir werden zeigen, dass das Martingal und die Stoppzeit T b die zweite 

Voraussetzung von Satz 17.11 erfüllen (die erste gilt offensichtlich für p ≥ q). 

Dazu seien s ∈ (0,1) und z so gewählt, dass φ(z) = s −1 ist. Dann gilt 

( z 

S n 

) 

E 

φ(z) 1 n {T b >n} ≤ z b s n P(T b > n) ≤ z b s n . 

Da s ∈ (0,1) ist, konvergiert die rechte Seite für n → ∞ gegen 0. Damit sind 

alle Voraussetzungen des Optional Sampling Theorems erfüllt und folglich 

gilt 

1 = E zS T b 

φ(z) T b 

= z b Es T b 

, 

□


d.h. Es T b = z −b (∗). 

Nun gilt s −1 = φ(z) = pz + qz −1 . Mit w = z −1 ergibt sich daraus 1 = 

spw −1 +sqw oder äquivalent w = sp+sqw 2 . Die einzig sinnvolle Lösung ist 

( 

z −1 1− √ ) 

1−4pqs 

= w = 

2 

. 

2qs 

Setztmandiesin(∗)ein,sofolgtdieBehauptung. 

Schließlich ergibt sich 

d 

lim 

s↑1 ds EsT b 

= ET b = b 

p−q 

für p > q. 

Dies ist auch direkt aus der Waldschen Identität (Beispiel 17.14) herleitbar, 

ebenso wie 

Var(T b ) = σ2 b 

(p−q) 3 mit σ 2 = 1−(p−q) 2 . 

Im Fall von p < q ist T b = ∞ mit positiver Wahrscheinlichkeit, so dass 

Korollar 17.12 nicht anwendbar ist. Nach Satz 17.8 hat man aber mit 

X n = z sn /φ(z) n 

1 = EX 1 = EX Tb ∧n = z b Es T b 

1 {Tb ≤n}. 

Durch den Übergang n → ∞ erhält man 

Es T b 

1 {Tb 0, 

P(max X n > b) ≤ E|X k| 

. 

1≤n≤k b


Beweis: Setze 

T 1 := 

{ 

min{j ≤ k : X j > b} 

k, falls {j ≤ k : X j > b} = ∅ 

und T 2 := k. Da T 1 und T 2 beschränkt sind, sind die Voraussetzungen aus 

Satz 17.11 trivialerweise erfüllt. Wegen {X T1 > b} ∈ F T1 und der Submartingaleigenschaft 

der Folge (X n ,F n ) 1≤n≤k erhalten wir 

P(max X n > b) = P({X T1 > b}) ≤ 1 ∫ 

T1 dP ≤ 

1≤n≤k b {X T1 >b}X 1 ∫ 

b 

= 1 ∫ 

k dP ≤ 

b {X T1 >b}X 1 ∫ 

|X k |dP 

b 

= 1 b E|X k|. 

{X T1 >b} 

X T2 dP 

Beispiel (Ein sequentieller Alarmplan): DasimFolgendenbeschriebene 

Verfahren ist eine idealisierte Version eines sequentiellen Versuchsplanes, um 

Nebenwirkungen bei medizinischen oder pharmazeutischen Behandlungen zu 

entdecken. 

Gegeben seien unabhängige identisch verteilte Zufallsvariablen (X n ) n∈N mit 

unbekannter Dichte f bezüglich eines Maßes µ. Für die Wahl von f seien die 

beidenAlternativenpundq möglich. Zielistes, einVerfahrenanzugeben, das 

aufgrund der Beobachtungen (X n ) n∈N signalisiert, dass f = q eingetreten ist. 

Dazu nehmen wir zunächst an, dass f = p vorliegt. Falls der Dichtequotient 

Y n = q(X 1)···q(X n ) 

p(X 1 )···p(X n ) 

aber zu groß wird, entscheiden wir f = q. Formal heißt dies, für a > 0 sei 

{ 

min{n ≥ 1 : Y n > a} 

T a := 

∞, falls {n ≥ 1 : Y n > a} = ∅ 

Falls T a < ∞ ist, schließt man auf f = q. 

Die Stoppzeit T a ist ein sogenanntes sequentielles Entscheidungsverfahren. 

□


Diese haben die besondere Eigenschaft, dass die Zahl der für eine Entscheidung 

notwendigen Beobachtungen nicht vorab festgelegt ist. Ob das Verfahren 

beendet wird oder nicht, wird zu jedem Zeitpunkt aufgrund der bis dahin 

gewonnenen Daten erneut entschieden. 

Wir werden nun sehen, dass sich durch die Wahl von a die Wahrscheinlichkeit 

falschen Alarms, d.h. die Wahrscheinlichkeit sich für f = q zu entscheiden, 

obwohl f = p vorliegt, beschränken lässt. Dazu sei dP := pdµ und 

F n := σ(X 1 ,...,X n ). Nach Beispiel 17.2.5 ist (Y n ) n∈N bezüglich der Filtrierung 

(F n ) n∈N ein Martingal unter dem Maß P. Deshalb folgt mit Satz 17.15 

für alle N ∈ N 

P(T a ≤ N) = P( max Y n > a) ≤ E|Y N| 

= EY N 

1≤n≤N a a 

Damit gilt für die Wahrscheinlichkeit eines falschen Alarms 

P(T a < ∞) = lim 

N→∞ P(T a ≤ N) ≤ 1 a . 

= 1 a .

158 KAPITEL 17. MARTINGALE

Anhang A 

Grundbegriffe der Topologie, 

der Satz von Tychonov 

A. Eine Familie T von Teilmengen einer Menge S heißt eine Topologie von 

S falls gilt: 

a) ∅ und S sind in T ; 

⋃ 

b) wenn T 1 ⊂ T ist, so ist A ∈ T , das heißt jede Vereinigung eines 

A∈T 1 

Teilsystems von T liegt in T; 

c) der Durchschnitt einer endlichen Zahl von Mengen von T liegt in T. 

Wenn T 1 und T 2 Topologien von S sind, dann heißt T 1 schwächer als T 2 , 

falls T 1 ⊂ T 2 gilt. 

B. Wenn A eine Familie von Teilmengen von S ist, dann heißt die kleinste 

Topologie, die A enthält, die von A erzeugte Topologie T(A). Ist T = 

T (A), so heißt A Subbasis für T. Man sieht leicht, daß A ∈ T (A), dann 

und nur dann wenn A gleich ∅ oder S ist oder A die (möglicherweise 

überzählbare) Vereinigung von endlichen Durchschnitten von Mengen in 

A ist. Wenn jede Menge in T = T(A) eine Vereinigung von Mengen in A 

ist, so heißt A eine Basis von T . 

C. Wenn eine Topologie T von S gegeben ist, so heißt S topologischer Raum 

und T die offenen Teilmengen von S. Wenn A eine Teilmenge von S ist, 

159

160 ANHANG A. GRUNDBEGRIFFE DER TOPOLOGIE 

so heißt die Vereinigung aller offenen Teilmengen in A das Innere von 

A und wird mit A ◦ bezeichnet. A ◦ ist selbst offen und A ◦ = A, falls 

A offen ist. Gilt p ∈ A ◦ , so heißt A ◦ Umgebung von p. Ein System von 

Umgebungen von p heißt Umgebungsbasis für p, falls es für jede offene 

Menge, die p enthält, eine Umgebung gibt, die eine Teilmenge der offenen 

Menge ist. 

D. Eine Teilmenge von S heißt abgeschlossen (bezüglich einer Topologie 

T ), falls ihr Komplement offen ist. Es folgt, daß ∅ und S abgeschlossen 

sind und daß der beliebige Durchschnitt von abgeschlossenen Mengen abgeschlossen 

ist und die endliche Vereinigung von abgeschlossenen Mengen 

abgeschlossen ist. 

Wenn A ⊂ S gilt, so heißt A der Abschluss von A und dies ist der 

Durchschnitt aller abgeschlossenen Mengen, die A enthalten. A ist die 

kleinste abgeschlossene Menge die A umfasst und A = A gilt genau dann, 

wenn A abgeschlossen ist. Auch gilt p ∈ A genau dann, wenn p /∈ (A c ) ◦ 

gilt, das heißt, daß jede offene Menge, die p enthält mindestens einen 

Punkt von A enthält. 

E. Ist S 0 Teilmenge eines topologischen Raumes S, so wird auf S 0 eine Topologie 

induziert, indem als offene Mengen von S 0 die Durchschnitte der 

offenen Mengen von S und S 0 nimmt. Diese Topologie heißt Relativtopologie 

auf S 0 induziert durch die Topologie auf S. 

F. Eine Funktion f, deren Definitionsbereich D und deren Bildbereich R 

topologische Räume sind, heißt stetig im Punkt p 0 ∈ D falls f −1 (U) eine 

Umgebung von p 0 ist für U eine Umgebung von f(p 0 ). Ist f stetig in 

allen Punkten von D, so heißt f stetig (auf D). Es folgt, daß f stetig ist 

genau dann, wenn für jede offene Teilmenge U von R gilt, daß f −1 (U) 

eine offene Teilmenge von D ist. Entsprechendes gilt für abgeschlossene 

Mengen. 

G. Die folgenden Bedingungen beschreiben, äquivalent die Eigenschaft der 

Kompaktheit einer Menge A ⊂ S. Sie ergeben sich untereinander durch 

Komplementbildung:

161 

(a) JedeFamilievon(relativ)offenenMengen,dieAüberdecken, enthält 

eine endliche Teilfamilie, die A überdecken. 

(b) Jede Familie von (relativ) abgeschlossenen Teilmengen von A, deren 

Durchschnitt leer ist, enthält eine endliche Teilfamilie, deren Durchschnitt 

leer ist. 

(c) Falls eine Familie von relativ abgeschlossenen Teilmengen die endliche 

Durchschnittseigenschaft hat, d.h. sie hat nichtleeren Durchschnitt, 

dann ist der Durchschnitt über alle Mengen der Familie 

nichtleer. 

Aus b) oder c) folgt, daß jede abgeschlossene Teilmenge einer kompakten 

Menge kompakt ist. 

Satz 1: Eine stetige Funktion mit kompakten Definitionsbereich hat 

einen kompakten Bildbereich. 

H. Sei eine Indexmenge J gegeben. Für jedes α ∈ J sei S α ein topologischer 

Raum. Das kartesische Produkt ∏ α∈JS α ist die Menge aller Funktionen p 

definiert auf I mit p(α) ∈ S α für jedes α ∈ J. Nach dem Auswahlaxiom 

ist ∏ α∈JS α nichtleer. 

I. Sei {f α ; α ∈ I} eine Menge von Funktionen, definiert auf einen gemeinsamen 

Definitionsbereich S mit Bildbereichen {S α ; α ∈ I}. S wird topologisiert 

indem {f −1 

α (U α ) | U α offen in S α ,α ∈ J} als Subbasis gewählt 

wird. Dies ergibt die schwächste Topologie in S, für die alle Funktionen 

f α stetig sind. Sie wird schwache Topologie, die von den Funktionen 

{f α ; α ∈ I} erzeugt wird, genannt. Falls S 1 ⊂ S ist und f α ′ die Einschränkung 

von f α auf S 1 ist, so ist die schwache Topologie in S 1 , erzeugt 

durch die Funktionen {f ′ α ; α ∈ J}, gleich der Relativtopologie auf S 1, 

die von der schwachen Topologie auf S herrührt. 

J. Im Fall von S = ∏ α∈JS α , dem kartesischen Produkt wählt man für f α die 

Projektion f α : S → S α , α ∈ J, die jedem Punkt p ∈ S die α-te Koordinate 

p α zuordnet. Die schwache Topologie auf S, die von Projektionen

162 ANHANG A. GRUNDBEGRIFFE DER TOPOLOGIE 

erzeugt wird, macht diese zu stetigen Funktionen. Für eine Teilmenge 

M ⊂ S ist die schwache Relativtopologie auf M, diejenige, die von den 

Einschränkungen der Projektionen f α auf M erzeugt wird. 

Satz 2 (Tychonov): Sind S α , α ∈ J kompakt, so ist auch ∏ α∈JS α 

kompakt in der schwachen Topologie, die von den Projektionen erzeugt 

wird.

Literatur 

Breiman, L.: Probability, Addison & Wesley, 1968 

Durrett, R.: Probability: Theory and Example, Thomson, 2005 

Georgii, H. O.: Stochastik, de Gruyter, 4. Auflage, 2009 

Klenke, A.: Wahrscheinlichkeitstheorie, Springer, 2006 

Shiryaev, A. N.: Probability, 2. ed., Springer, 1996 

Williams, D.: Probability with Martingales, Cambridge University Press, 1991 

163

Wahrscheinlichkeitstheorie - Abteilung fÃ¼r Mathematische Stochastik

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?