Stochastische Dynamik - Stochastik - Humboldt-Universität zu Berlin

Stochastische Dynamik 

Vorlesung von 

Prof. Peter Imkeller 

Humboldt Universität zu Berlin 

Sommersemester 2004 

Mitschrift von Wolfgang Siegert

Inhaltsverzeichnis 

1 Konstruktion und elementare Eigenschaften von Markov-Ketten 1 

2 Invariante Maße und asymptotisches Verhalten 8 

3 Stationäre Prozesse 16 

4 Der Birkhoffsche Ergodensatz 22 

5 Der Subadditive Ergodensatz von Kingman 25 

6 Der Satz von Furstenberg-Kesten 32 

7 Der Multiplikative Ergodensatz von Oseledets 41 

Notationen 52 

Literaturverzeichnis 52 

Index 53

1. Markov-Ketten: Konstruktion und elementare Eigenschaften 

Definition 1.1. Sei (S, S ) ein meßbarer Raum. Eine Funktion 

heißt Übergangswahrscheinlichkeit, falls gilt: 

p : S × S → [0, 1] 

(a) für jedes x ∈ S ist p(x, . ) Wahrscheinlichkeitsmaß auf (S, S ); 

(b) für jedes A ∈ S ist p( . , A) S -meßbar. 

Bemerkung 1.2. Sei p Übergangswahrscheinlichkeit auf einem meßbaren Raum (S, S ). 

i) Ist f : S → R S -B 1 -meßbar und beschränkt, so auch g := ∫ S 

f(x) p( . , dx) ; 

ii) Ist µ ein Wahrscheinlichkeitsmaß auf (S, S ), so auch ν := ∫ S 

p(x, . ) µ(dx) . 

Beweis. i) Wegen 1.1(b) gilt die Aussage für Indikatorfunktionen f = 1 A meßbarer 

Mengen, also auch (Linearität des Integrals) für Treppenfunktionen. 

Ist f ≥ 0, so existieren approximierende Treppenfunktionen 0 ≤ f n ↗ f; 

hier ist g n := ∫ f n (x) p( . , dx) meßbar (da f n Treppenfunktion) und (durch die 

Schranke von f) beschränkt; andererseits gilt (Satz über monotone Konvergenz) 

g n ↗ ∫ f(x) p( . , dx) ≡ g, sodaß g als punktweiser Limes meßbarer Funktionen 

selbst meßbar ist; g ist ebenfalls durch die Schranke von f beschränkt. 

Im allgemeinen Fall ist f = f + − f − mit f + , f − ≥ 0; aufgrund des bisherigen 

sind g ± := ∫ f ± (x) p( . , dx) meßbar und beschränkt, also auch g = g + − g − . 

ii) Für eine Folge (A n ) n∈N paarweise disjunkter A n ∈ S gilt: 

( ) 

.⋃ 

∫ ( .⋃ 

) 

∫ 

ν A n ≡ p x, An µ(dx) 1.1(a) ∑ 

= p(x, A n ) µ(dx) 

n 

S 

mon.Kvgz. 

= 

∑ 

∫ 

n 

S 

S 

n 

p(x, A n ) µ(dx) ≡ ∑ n 

ν(A n ) ; 

ferner ist 

ν(S) ≡ ∫ S 

p(x, S) µ(dx) 

1.1(a) 

= ∫ S 

µ(dx) = 1 (µ W.Maß). 

Definition 1.3. Sei S ein polnischer Raum und hierauf (p n ) n∈N eine Folge von Übergangswahrscheinlichkeiten 

sowie µ ein Wahrscheinlichkeitsmaß. Dann sei P 0 := µ und 

∫ 

P n (B 0 × · · · × B n ) := p n (x n−1 , dx n )p n−1 (x n−2 , dx n−1 ) · · · p 1 (x 0 , dx 1 ) µ(dx 0 ) 

B 0 ×···×B n 

zu n ∈ N und B i ∈ S ≡ B(S). 

Mit Bemerkung 1.2 folgt rekursiv, daß P n wohldefiniert ist auf dem Semiring 1 

R n := {B 0 × · · · × B n : B i ∈ S } . 

1 Ein Mengensystem P heißt Semiring, falls gilt (cf. Halmos [HM 74, S.22]): 

• zu E ∈ P und F ∈ P ist auch E ∩ F ∈ P, und 

• zu E ∈ P und F ∈ P mit E ⊂ F existieren endlich viele C 0, C 1, . . . , C n ∈ P, sodaß 

E = C 0 ⊂ C 1 ⊂ · · · ⊂ C n = F und C i \ C i−1 ∈ P (i = 1, . . . , n) .

2 Markovketten 

Ferner setzt sich P n fort zu einem Maß auf der von dem Ring r(R n ) erzeugten σ-Algebra 

( 

σ (r(R n )) = 

} 

S ⊗ · 

{{ 

· · ⊗ S 

} 

≡ S n+1 S poln. 

) 

= B(S n+1 ) . 

(n+1)-mal 

Beweis. P n induziert einen (endlichen) Inhalt auf dem Ring r(R n ). Nach Caratheodory 

muß zur Fortsetzung auf σ (r(R n )) gezeigt werden, daß P n σ-additiv 

auf dem Ring ist. Da P n endlicher Inhalt ist, ist die σ-Additivität äquivalent 

zur Stetigkeit von oben“, die im folgenden gezeigt wird; wegen Rekursion und 

” 

Bemerkung 1.2 genügt es dabei, den Fall n = 1 zu betrachten: 

Sei (A k ) k∈N eine Folge in r(R 1 ) mit A k ↘ ∅, so ist zu zeigen: P 1 (A k ) −−−→ k→∞ 0. 

Bezeichnet man den Schnitt durch ein A ∈ r(R 1 ) bei x ∈ S mit 

so folgt wegen A k ↘ ∅ für alle x ∈ S : 

A x := {y ∈ S : (x, y) ∈ A} , 

(A k ) x ↘ ∅ (k → ∞) . 

Aufgrund der ” 

Stetigkeit von oben“ des Maßes p 1 (x, . ) folgt daraus 

p 1 (x, (A k ) x ) k→∞ −−−→ 0 (x ∈ S) 

und somit wegen majorierter Konvergenz: 

∫ 

P 1 (A k ) = p 1 (x, (A k ) x ) µ(dx) −−−→ k→∞ 0 . 

S 

Das nächste Ziel ist nun, eine Markovkette auf S N 0 

mit Übergangswahrscheinlichkeiten 

(p n ) n∈N und Startwahrscheinlichkeit µ zu konstruieren; hierbei sei S weiterhin polnisch, 

versehen mit der Borel-σ-Algebra B(S) =: S . Dazu wird die Konsistenzbedingung von 

Kolmogorov für (P n ) n∈N0 nachgewiesen. Hierfür dienen folgende Definitionen: 

Zu F, G ⊂ N 0 mit F ⊂ G sei 

π G,F : S G −→ S F 

(x i ) i∈G ↦−→ (x i ) i∈F 

die Projektion auf die die kleinere Indexmenge und hiermit π F 

setze zu m, n ∈ N 0 mit m ≤ n 

:= π N0 ,F ; entsprechend 

π n,m : S n+1 −→ S m+1 

(x 0 , . . . , x n ) ↦−→ (x 0 , . . . , x m ) 

und zu m ∈ N 0 

π m : S N 0 

−→ S m+1 

(x i ) i∈N0 ↦−→ (x 0 , . . . , x m ) .

Konstruktion und elementare Eigenschaften 3 

Diese Projektionen sind bezüglich den jeweiligen Produkt-σ-Algebren meßbar. Der Maßeindeutigkeitssatz 

(angewandt auf ∩-stabile Erzeuger der σ-Algebren bestehend aus Zylindermengen) 

ergibt für m, n ∈ N 0 mit m ≤ n die Gleichheit 

P n ◦ π −1 

n,m = P m 

von Maßen auf S m+1 ; entsprechend gilt für endliche F, G ⊂ N 0 mit F ⊂ G auch 

P G ◦ π −1 

G,F 

= P max F ◦ π−1 {0,...,max F },F =: P F ; 

diese Konsistenzeigenschaft besagt, daß (P F ) F ⊂N0 endl. ein Promaß auf (S N 0 

, B(S) N 0 

) definiert. 

Nach dem Konsistenzsatz von Kolmogorov ist es sogar σ-additiv. Es existiert daher 

ein eindeutiges Wahrscheinlichkeitsmaß P µ auf (S N 0 

, B(S) N 0 

) mit 

P µ ◦ π −1 

n = P n (n ∈ N 0 ) . (1) 

Satz 1.4 (kanonische Markovkette). Sei S ein polnischer Raum mit Übergangswahrscheinlichkeiten 

(p n ) n∈N und Wahrscheinlichkeitsmaß µ; P µ sei das hiervon induzierte 

Wahrscheinlichkeitsmaß auf S N 0 

. Dann ist 

eine Markovkette auf 

d.h. es gilt: 

X n := π {n} ≡ π N0 ,{n} (n ∈ N 0 ) 

(Ω, F , P, (F n ) n∈N0 ) := 

i) X n ist F n -meßbar, und 

ii) für alle n ∈ N 0 und B ∈ S gilt: 

) 

(S N 0 

, S N 0 

, P µ , (σ(π n )) n∈N0 , 

P (X n+1 ∈ B | F n ) = P (X n+1 ∈ B | X n ) = p n+1 (X n , B) . 

Beweis. i) X n ist meßbar bezüglich σ(X n ) ⊂ σ(X 0 , . . . , X n ) ≡ σ(π n ) ≡ F n . 

ii) Es ist zu zeigen: 

∫ 

∫ 

1 {Xn+1 ∈B} dP µ = p n+1 (X n , B) dP µ (A ∈ F n ) 

A 

A 

(dann auch P(X n+1 ∈ B|X n ) = p n+1 (X n , B), weil meßbar bzgl. σ(X n ) ⊂ F n ) . 

Da πn 

−1 (R n ) ein ∩-stabiler Erzeuger von F n ist, genügt es, obige Gleichung für 

A = π −1 

n (B 0 × · · · × B n ) ≡ {X 0 ∈ B 0 , . . . , X n ∈ B n } 

mit B 0 , . . . , B n ∈ S nachzuweisen, nämlich: 

∫ 

1 {Xn+1 ∈B} dP µ = P µ {X 0 ∈ B 0 , . . . , X n ∈ B n , X n+1 ∈ B} 

A 

(1) 

= P n+1 (B 0 × · · · × B n × B) 

∫ 

1.3 

= 

Trafo.satz 

= 

p n+1 (x n , B) P n (dx 0 , . . . , dx n ) 

B 0 ×···×B 

∫ 

n 

p n+1 (X n , B) dP µ . 

A


Definition 1.5. Sei (S, S ) ein meßbarer Raum. Dann ist auf dem Pfadraum Ω ≡ S N 0 

die Familie θ ≡ (θ n ) n∈N0 der (kanonischen) Shifts θ n : Ω −→ Ω (n ∈ N 0 ) definiert durch 

Jedes θ n ist meßbar bezüglich F ≡ S N 0 

. 

θ n (ω) := ( m ↦→ ω(m + n) ) . 

Als nächstes wird die Markov-Eigenschaft (mit festen Zeiten) und hiermit die Starke 

Markov-Eigenschaft (mit Stoppzeiten) gezeigt. Hierbei bezeichnen E µ bzw. E x ≡ E δx 

die bezüglich P µ bzw. P δx auf Ω gebildeten Erwartungswerte bei zugrundegelegten Übergangswahrscheinlichkeiten 

(p n ) n∈N . Als Vereinfachung wird die Markov-Kette als zeitlich 

homogen vorausgesetzt: 

Definition 1.6. In der Situation von Satz 1.4 heißt die Markov-Kette X zeitlich-homogen, 

falls für alle n ∈ N gilt: p n = p 1 (=: p). 

Theorem 1.7 (Markov-Eigenschaft). In der Situation aus 1.4 sei die Markov-Kette 

X zeitlich-homogen; Y sei eine beschränkte, F -meßbare Zufallsvariable auf Ω. Dann gilt: 

E µ (Y ◦ θ n | F n ) = E Xn (Y ) ≡ E x (Y ) ∣ (n ∈ N 0 ) . 

x=Xn 

Beweis. Zunächst ist zu bemerken, daß E Xn (Y ) tatsächlich meßbar bzgl. F n ist; dies folgt 

aus der Adaptiertheit von X und der Meßbarkeit von x ↦→ E x (Y ) [letztere ist nach Definition 

und rekursiver Anwendung von 1.2 i) klar für Indikatorfunktionen Y = 1 π 

−1 

n [B 0 ×···×B n] 

zu B i ∈ S ; die allgemeine Aussage ergibt sich aus dem Monotone-Klassen-Theorem, da 

wegen des Satzes über monotone Konvergenz {Y : x ↦→ E x (Y ) meßbar} abgeschlossen 

bzgl. monotonen Operationen ist]. Es bleibt also, die behauptete Gleichheit nachzuweisen. 

Aufgrund des Monotone-Klassen-Theorems genügt es, dies für den Fall zu zeigen, daß Y 

∏ 

von der Form m g k (X k ) ist mit beschränkten, S -meßbaren ZVn g 0 , . . . , g m . 

k=0 

1) Zunächst betrachten wir die Mengen aus F n der Gestalt A := πn 

−1 [A 0 × · · · × A n ] mit 

A 0 , . . . , A n ∈ S ; hiermit gilt: 

( m 

) 

∏ 

E µ (Y ◦ θ n · 1 A ) ≡ E µ g k (X n+k ) · 1 A 

(1),1.3 

= 

k=0 

∫ ∫ 

∫ 

µ(dx 0 ) p(x 0 , dx 1 ) · · · p(x n−1 , dx n ) × 

A 0 A 1 A 

∫ 

∫ n 

× g 0 (x n+1 ) p(x n , dx n+1 ) · · · g m (x n+m ) p(x n+m−1 , dx n+m ) 

S 

S 

) ) 

g k (X k ) · 1 A 

( ( 

∏ m 

Trafo.satz 

= E µ E Xn 

k=0 

≡ E µ 

( 

EXn (Y ) · 1 A 

) 

, 

also die Behauptung für alle A ∈ F n , die von der speziellen, obigen Gestalt sind. 

2) Sei nun L := { A ∈ F n : Aussage aus 1) gilt für A } .Gemäß 1) ist πn 

−1 

(R n ) ∩-stabil ist, folgt aufgrund des Dynkin-Lemmas F n = σ(π −1 

π −1 

n 

(R n ) ⊂ L ; da 

n (R n )) ⊂ L .


Nächstes Ziel ist, die Markov-Eigenschaft auf Stoppzeiten auszudehnen. 

Definition 1.8. Sei (Ω, F , (F n ) n∈N0 ) ein filtrierter Meßraum; N : Ω → N 0 ∪ {∞} heißt 

(F n ) n∈N0 -Stoppzeit, falls {N ≤ n} ∈ F n für alle n ∈ N 0 ist. Hierzu äquivalent ist, daß 

{N = n} ∈ F n für alle n ∈ N 0 gilt. 

Zu einer (F n ) n -Stoppzeit N hat man die σ-Algebra 

F N := 

{ 

{ } } 

A ∈ F : A ∩ N (=) 

≤ n ∈ F n für alle n ∈ N 0 ; 

sie heißt N-Vergangenheit oder σ-Algebra der Ereignisse vor N. 

In der Situation aus 1.4 und 1.5 erweitert man nun formal Ω um ∆ /∈ Ω, nimmt {∆} zu 

F hinzu und setzt für eine (F n ) n∈N0 -Stoppzeit N 

{ 

θ 

θ N (ω) := N(ω) (ω) , N(ω) < ∞ 

∆ , N(ω) = ∞ . 

Für eine Zufallsvariable Y auf Ω sei Y (∆) := 0 . 

Theorem 1.9 (Starke Markov-Eigenschaft). In der Situation aus 1.4 sei die Markov- 

Kette X zeitlich-homogen; θ sei der Shift aus 1.5 und N eine (F n ) n -Stoppzeit. Ist dann 

eine Familie (Y n ) n∈N0 F -meßbarer und (gleichmäßig in (n, ω)) beschränkter Zufallsvariable 

gegeben, so gilt: 

E µ (Y N ◦ θ N | F N ) = E XN (Y N ) auf {N < ∞} ; 

Speziell gilt für eine F -meßbare beschränkte Zufallsvariable Y : 

E µ (Y ◦ θ N | F N ) = E XN (Y ) auf {N < ∞} . 

Beweis. Zunächst ist zu bemerken, daß ω ↦→ E XN(ω) (ω)(Y N(ω) ) tatsächlich F N - 

meßbar ist, da sie die Komposition der meßbaren Abbildungen ω ↦→ (ω, N(ω)) , 

(ω, n) ↦→ (X n (ω), n) und (x, n) ↦→ E x (Y n ) ist. 

Mit A ∈ F N gilt dann: 

E µ 

( 

YN ◦ θ N · 1 A∩{N


Im folgenden sei 

die erste Treffzeit von y und hiermit 

y ∈ S heißt 

{ rekurrent 

transient 

T y := inf{ n ∈ N : X n = y } (y ∈ S) , 

ρ xy := P x (T y < ∞) (x, y ∈ S) . 

} { 

ρyy = 1 

, falls 

ρ yy < 1 

auch die Markov-Kette rekurrent. Die Anzahl der Besuche in y , 

} 

ist. Ist jeder Zustand rekurrent, so heißt 

H y := 

∞∑ 

n=1 

1 {Xn=y} 

charakterisiert Rekurrenz und Transienz von y folgendermaßen: 

Theorem 1.10 (Transienz und Rekurrenz). Dei Markov-Kette X aus 1.4 sei zeitlichhomogen 

mit abzählbarem Zustandsraum S. Dann gilt für y ∈ S : 

y transient =⇒ E x (H y ) = ρ xy 

1 − ρ yy 

< ∞ (∀ x ∈ S) , 

y rekurrent ⇐⇒ E y (H y ) = ∞ . 

Beweis. Zu k ∈ N sei T k y 

die Zeit des k-ten Besuches in y. Hiermit gilt: 

P x (T k y < ∞) = ρ xy · ρ k−1 

yy (x ∈ S, k ∈ N) ; (⋆) 

für k = 1 ist dies gerade die Definition von ρ xy ; für k > 1 folgt dies induktiv: 

P x (T k y < ∞) = P x 

( 

T k−1 

y 

Hiermit folgt: 

< ∞ , T y ◦ θ T 

k−1 

y 

( 

= E x 

(1 {T 

k−1 

y


Theorem 1.11. Die Markov-Kette X aus 1.4 sei zeitlich-homogen mit abzählbarem S. Ist 

x ∈ S rekurrent und ρ xy > 0 mit einem y ∈ S, so ist auch y rekurrent und es gilt ρ yx = 1. 

Beweis. Aufgrund der Rekurrenz von x gilt: 

( 

0 = P x (T x = ∞) ≥ P x Ty < ∞ , T x ◦ θ Ty = ∞ ) 

( 

( 

) 

= E x 1 {Ty 0 vorausgesetzt war, folgt: ρ yx = 1. 

Hiermit ergibt sich noch die Rekurrenz von y: Wegen ρ xy > 0 und ρ yx = 1 

existieren k 1 , k 2 ∈ N mit 

P x (X k1 = y) > 0 und P y (X k2 = x) > 0 . 

Aufgrund der Chapman-Kolmogorov-Gleichung hat man für n ∈ N: 

P y (X n+k1 +k 2 

= y) ≥ P y (X k2 = x) P x (X n = x) P x (X k1 = y) , 

) 

also 

E y (H y ) = 

∞∑ 

n=1 

P y (X n = y) ≥ P y (X k2 = x) 

} {{ } 

>0 

E x (H x ) 

} {{ } 

1.10 

= ∞ 

P x (X k1 = y) . 

} {{ } 

>0 

Also ist auch E y (H y ) = ∞ und y rekurrent gemäß 1.10. 

Demnach ist die Menge der rekurrenten Zustände in Klassen eingeteilt: Für x, y ∈ S sei 

x ∼ y :⇐⇒ ( x = y oder (ρ xy > 0 und ρ yx > 0) ) . 

Theorem 1.12. Die Markov-Kette X aus 1.4 sei zeitlich-homogen mit abzählbarem S. 

Dann zerfällt die Menge der rekurrenten Punkte R := {x ∈ S : ρ xx = 1} in eine Familie 

(R i ) i∈I paarweise disjunkter rekurrenter Klassen, die Äquivalenzklassen von ∼. 

Beweis. Es ist zu zeigen, daß ∼ eine Äquivalenzrelation ist: Die Reflexivität 

und Symmetrie dieser Relation folgen unmittelbar aus obiger Definition, sodaß 

nur noch die Transienz von ∼ nachzuweisen ist: 

Sind also x, y, z ∈ R fixiert, so ist zu zeigen, daß mit x ∼ y und y ∼ z auch 

x ∼ z gilt. Dabei sei oE x ≠ y und x ≠ z; nach obiger Definition von ∼ gilt 

also ρ xy > 0 und ρ yz > 0. Wendet man wie in den Beweisen von 1.10 und 1.11 

die starke Markov-Eigenschaft 1.9 an, so folgt hiermit: 

ρ xz ≡ P x (T z < ∞) ≥ P x (T y < ∞ , T z ◦ θ Ty < ∞) = ρ xy ρ yz > 0 , 

woraus sich mit 1.11 ergibt (x ∈ R) : ρ zx = 1 > 0, insgesamt also x ∼ z.

2. Invariante Maße und asymptotisches Verhalten 

Es sei weiterhin folgende Situation zugrunde gelegt: Der abzählbare Raum S sei der Zustandsraum 

der kanonischen, zeitlich-homogenen Markov-Kette (X n ) n∈N0 mit Pfadraum 

(Ω, F ) := (S N 0 

, S N 0 

) und Übergangsmatrix p. 

Definition 2.1. Ein Maß µ auf S heißt stationär, wenn für alle y ∈ S gilt: 

µ(y) = ( µp ) (y) ≡ ∑ x∈S 

µ(x) p(x, y) < ∞ . 

Ein Maß µ auf S heißt invariant, wenn es ein stationäres Wahrscheinlichkeitsmaß ist. 

Beispiel 2.2 (Ehrenfest-Modell von Diffusionen). In einem System, das aus den 

Behältern A und B besteht, befinden sich insgesamt r Moleküle. X n sei die Anzahl der 

Moleküle in A zum Zeitpunkt n ∈ N 0 . Diese Größe 

nimmt also Werte in S := {0, 1, . . . , r} an. Durch 

A 

 

B 

⎧ 

 

r−k 

⎪⎨ r 

, m = k + 1 

 

p(k, m) := 

k 

 

r 

, m = k − 1 

 

 

 

⎪⎩ 

0 , sonst 

wird eine Übergangswahrscheinlichkeit auf S definiert, die proportional zur Anzahl der 

Moleküle im Behälter A ist. Zu dieser Übergangsmatrix ist die Binomialverteilung auf S, 

( r 

µ(k) := 2 

k) 

−r (k ∈ S ≡ {0, 1, . . . , r}) , 

ein invariantes Maß. 

Beweis. Da µ ein Wahrscheinlichkeitsmaß ist, ist nur nachzuweisen, daß 

µ(k) = ∑ r 

m=0 

p(m, k) µ(m) für k = 0, 1, . . . , r gilt. Bei k = 1, . . . , r − 1 ist 

∑ r 

m=0 

p(m, k) µ(m) = p(k + 1, k) µ(k + 1) + p(k − 1, k) µ(k − 1) 

[( ) ( ) ] 

r k + 1 r r − (k − 1) 

≡ 2 −r + 

k + 1 r k − 1 r 

[ 

] 

= 2 −r (r − 1)! 

k! (r − (k + 1))! + (r − 1)! 

(k − 1)! (r − k)! 

[ 

= 2 −r (r − 1)! 1 

(k − 1)! (r − k − 1))! k + 1 ] 

r − k 

= 2 −r r! 

k! (r − k)! 

≡ µ(k) . 

Bei den Fällen k = 0 und k = r ist nur ein Summand ungleich null. 

Nun wird gezeigt, wie jeder Klasse rekurrenter Zustände ein stationäres Maß zugeordnet 

ist; die Markov-Kette entkoppelt also auf diesen Klassen. Dabei wird laufend benutzt: 

P x (X n = y) = p n (x, y) (x, y ∈ S ; n ∈ N) , 

wobei p n (x, y) das n-fache Matrixprodukt bezeichnet.

Invariante Maße und asymptotisches Verhalten 9 

Theorem 2.3. Sei x rekurrent und T ≡ T x := inf{n ∈ N : X n = x} seine erste Treffzeit. 

( T −1 

) 

∑ ∞∑ 

µ(y) := E x 1 {Xn=y} = P x (X n = y , T > n) (y ∈ S) 

n=0 

n=0 

definiert dann ein stationäres Maß. 

Beweis. Zuerst wird die Gleichheit µp = µ gezeigt; anschließend wird hiermit 

nachgewiesen, daß µ(y) < ∞ für alle y ∈ S gilt. Beachte, daß µ(x) = 1. 

(a) ∑ y∈S 

µ(y) p(y, z) = µ(z) für alle z ∈ S : 

1) Falls z ≠ x ist, so folgt mit der Markov-Eigenschaft 1.7: 

∑ 

∞∑ ∑ 

Fubini 

µ(y) p(y, z) = 

P x (X n = y , T > n) · P y (X 1 = z) 

y∈S 

n=0 y∈S 

ME = ∞ ∑ 

= 

z≠x 

= 

= 

z≠x 

= 

n=0 y∈S 

∑ 

P x (X n = y , T > n , X n+1 = z) 

∞∑ 

P x (T > n , X n+1 = z) 

n=0 

∞∑ 

P x (T > n + 1 , X n+1 = z) 

n=0 

∞∑ 

P x (T > n , X n = z) 

n=1 

∞∑ 

P x (T > n , X n = z) ≡ µ(z) . 

n=0 

2) Falls z = x ist, so folgt — wiederum mit der Markov-Eigenschaft 1.7: 

∑ 

∑ 

ME 

∞ ∑ 

µ(y) p(y, x) = P x (X n = y , T > n , X n+1 = x) 

y∈S 

= 

(b) µ(y) < ∞ für alle y ∈ S : 

n=0 y∈S 

∞∑ 

n=0 

P x (T = n + 1) = ρ xx 

x rek. 

= 1 = µ(x) . 

1) Falls ρ xy > 0 : Iteriert man (a), so folgt: µ = µ p n für n ∈ N also 

1 = µ(x) (a) 

= ( µ p n) (x) = ∑ y∈S µ(y) pn (y, x) (n ∈ N) . 

Folglich muß notwendigerweise µ(y) < ∞ sein, falls p n (y, x) > 0 mit einem 

n ∈ N gilt; da p n (y, x) = P y (X n = x) ist, wird letzteres impliziert durch 

ρ yx ≡ P y (T x < ∞) > 0, was aber im betrachteten Fall ρ xy > 0 aufgrund 

der Rekurrenz von x aus 1.11 folgt (also x ∼ y). 

2) Ist ρ xy = 0 , so folgt aus der Definition von µ : µ(y) = 0 (< ∞) .

10 Invariante Maße und asymptotisches Verhalten 

Theorem 2.4 (Eindeutigkeit stationärer Maße). (X n ) n∈N0 sei irreduzibel, d.h. S 

bestehe aus einer einzigen Äquivalenzklasse rekurrenter Zustände. Dann ist das stationäre 

Maß µ aus Theorem 2.3 bis auf Multiplikation mit Konstanten eindeutig. 

Beweis. Sei a ∈ S ein rekurrenter Zustand und µ das zu a gemäß 2.3 gebildete 

stationäre Maß. Bezeichnet ν ein weiteres stationäres Maß, so ist zu zeigen: 

ν(z) = µ(z) · ν(a) (z ∈ S) . 

Aus der Stationarität von ν folgt iterativ für z ∈ S : 

ν(z) = ∑ y∈S 

ν(y) p(y, z) 

= ν(a) p(a, z) + ∑ y≠a 

ν(y) p(y, z) 

= ν(a) p(a, z) + ∑ ( ) 

∑ 

ν(x) p(x, y) 

y≠a x∈S 

p(y, z) 

= ν(a) p(a, z) + ∑ y≠a 

ν(a) p(a, y) p(y, z) + ∑ y≠a 

∑ 

ν(x) p(x, y) p(y, z) 

= ν(a) P a (X 1 = z) + ∑ ν(a) P a (X 1 ≠ a , X 2 = z) 

y≠a 

+ P ν (X 0 ≠ a , X 1 ≠ a , X 2 = z) 

= · · · = 

n∑ 

= ν(a) P a (X k ≠ a für 1 ≤ k < m , X m = z) 

m=1 

+ P ν (X 0 ≠ a , X 1 ≠ a , . . . , X n−1 ≠ a , X n = z) 

≥ ν(a) · µ(z) 

(n → ∞) nach der Definition von µ; daher folgt für n ∈ N : 

ν(a) = ∑ ν(z) p n (z, a) ≥ ν(a) ∑ µ(z) p n (z, a) = ν(a) µ(a) = ν(a) . 

z∈S 

z∈S 

x≠a 

In der davor erhaltenen Abschätzung ν(z) ≥ ν(a) µ(z) kann >“ also nur gelten, 

” 

wenn p n (z, a) = 0 für jedes n ∈ N ist. Aufgrund der Irreduzibilität existiert aber 

zu jedem z ein n ∈ N mit p n (z, a) > 0. Daher ist ν(z) = ν(a) µ(z) . □ 

Nun wird eine notwendige Bedingung für die Normierbarkeit stationärer Maße gegeben: 

Satz 2.5. Existiert ein invariantes Maß µ, so sind alle Zustände y mit µ(y) > 0 rekurrent. 

Beweis. Für n ∈ N gilt wegen der Stationarität µ = µp n , also mit Fubini 

∞∑ 

∞∑ 

µ(x) 

n=1 

µ(y) = ∑ x∈S 

n=1 

p n (x, y) 1.10 = ∑ x∈S 

µ(x) 

ρ xy 

1 − ρ yy 

≤ µ(S) 

1 − ρ yy 

. 

Nach Voraussetzung sind ∑ ∞ 

n=1 µ(y) = ∞ und µ(S) = 1 < ∞, also ρ yy = 1. □


Theorem 2.6. (X n ) n∈N0 

sei irreduzibel und µ ein invariantes Maß. Dann gilt: 

µ(x) = 

1 

E x (T x ) 

(x ∈ S) . 

Beweis. Zunächst ist zu bemerken, daß alle Elemente von S rekurrent sind: 

Denn jedes Element mit positiver µ-Masse ist gemäß 2.5 rekurrent; da aber X 

irreduzibel ist, überträgt sich diese Rekurrenz auch auf alle anderen Elemente. 

Folglich ist zu jedem fixierten x ∈ S gemäß 2.3 ein stationäres Maß µ 0 gegeben: 

µ 0 (z) ≡ ∑ n∈N 0 

P x (X n = z , T x > n) und µ 0 (x) = 1 . 

Hieraus folgt mit Fubini: 

∑ 

µ 0 (z) = 

z∈S 

∞∑ ∑ 

P x (X n = z , T x > n) = 

n=0 z∈S 

∞∑ 

n=0 

P x (T x > n) = E x (T x ) . 

Mit der Eindeutigkeitsaussage aus 2.4 heißt das für das normierte Maß µ : 

µ(y) = 

µ 0 (y) 

∑ 

z∈S µ 0(z) = 

µ 0(y) 

E x (T x ) 

(y ∈ S) , 

woraus bei y = x die Behauptung folgt, da µ 0 (x) = 1 ist. 

□ 

x ∈ S heißt positiv rekurrent, falls E x (T x ) < ∞ ist; andernfalls heißt x null-rekurrent. 

” Postitiv rekurrent“ ist stärker als rekurrent“. Positive und Null-Rekurrenz sind beide 

” 

Klasseneigenschaften. Im Ehrenfest-Modell 2.2 ist jeder Zustand positiv rekurrent. 

Korollar 2.7. (X n ) n∈N0 

sei irreduzibel. Dann sind folgende Aussagen äquivalent: 

i) Es existiert ein invariantes Maß; 

ii) Es existiert ein positiv rekurrenter Zustand; 

iii) Alle Zustände sind positiv rekurrent. 

Beweis. iii) ⇒ ii) trivial. 

ii) ⇒ i) Sei x der positiv rekurrente Zustand. Gemäß 2.3 existiert ein stationäres 

Maß µ 0 mit Gesamtmasse µ 0 (S) = ∑ z∈S µ 0(z) = E x (T x ) (Beweis von 2.6), die 

wegen der postiven Rekurrenz endlich ist. Die Normierung µ ist also invariant: 

µ(y) := 

µ 0(y) 

E x (T x ) 

≡ 

1 

E x (T x ) 

∑ 

n∈N 0 

P x (X n = y , T x > n) (y ∈ S) . 

i) ⇒ iii) Sei µ das invariante Maß. Wegen der Irreduzibilität ist µ(x) > 0 für 

alle x ∈ S (denn jeder Zustand x ist rekurrent, sodaß µ 0 (x) = 1 für das gemäß 

2.3 zugeordnete stationäre Maß µ 0 gilt; wegen 2.4 muß daher µ(x) > 0 sein). 

Aus 2.6 folgt insbesondere: E x (T x ) = 1 

µ(x) 

< ∞ für jedes x ∈ S . □ 

Als nächstes wird diskutiert, wann p n gegen das invariante Maß konvergiert.


Beispiel 2.8. Auf S := {1, 2} definiert p := 

p 2n = 

( 1 0 

0 1 

) 

und p 2n+1 = 

( 0 1 

1 0 

( 0 1 

1 0 

In diesem Fall liegt keine Konvergenz von p n (x, y) vor. 

) 

eine Übergangsmatrix. Dabei gilt: 

) 

≡ p (n ∈ N) . 

Periodizität verhindert also Konvergenz gegen das invariantes Maß. 

Definition 2.9. Zu einem rekurrenten x ∈ S sei 2 

I x := {n ∈ N 0 : p n (x, x) > 0} . 

Hiermit heißt d x := ggT(I x ) die Periode von x. 

Wegen der Chapman-Kolmogorov-Gleichung ist I x eine Halbgruppe. 

In obigem Beispiel 2.8 ist I 1 = I 2 = { gerade Zahlen} und d 1 = d 2 = 2. 

Lemma 2.10. Es seien x, y ∈ S rekurrent mit x ∼ y. Dann ist d x = d y . 

Beweis. Es wird gezeigt 3 : d y | d x . Da die folgende Argumentation symmetrisch 

in x und y ist, folgt hieraus schon die Behauptung, denn nach Vertauschen 

der Rollen ist damit auch d x | d y gezeigt. 

Ohne Einschränkung gelte x ≠ y. Aufgrund der Äquivalenz x ∼ y ist daher 

ρ xy > 0 und ρ yx > 0; insbesondere existieren m, n ∈ N mit p m (x, y) > 0 und 

p n (y, x) > 0. Aus den Chapman-Kolmogorov-Gleichungen folgt hieraus: 

p n+m (y, y) ≥ p n (y, x) p m (x, y) > 0 . 

Aus obiger Definition ergibt sich daher d y | n + m . 

Sei nun ein beliebiges k ∈ I x fixiert; wegen des eben gezeigten Zwischenschrittes 

d y | n+m ist noch einzusehen, daß auch d y | n+m+k gilt, da aus diesen beiden 

Aussagen d y | k und damit die Behauptung folgt. Mit Chapman-Kolmogorov 

und k ∈ I x erhält man aber: 

p n+k+m (y, y) ≥ p n (y, x) p k (x, x) p m (x, y) > 0 , 

und damit d y | n + k + m . 

□ 

Definition 2.11. (a) Eine Zustand x ∈ S heißt aperiodisch, falls d x = 1 gilt. 

(b) Eine irreduzible, rekurrente Markovkette heißt aperiodisch, falls jeder Zustand aperiodisch 

ist. 

Wie in obigem Beispiel angedeutet wird sich herausstellen, daß Aperiodizität ein Kriterium 

für die Konvergenz der Übergangswahrscheinlichkeiten gegen das invariante Maß 

ist. Der Beweis dieses Satzes wird vorbereitet durch folgendes Lemma: 

2 Erinnerung: p n (x, y) ≡ P x(X n = y) für x, y ∈ S und n ∈ N 0. 

3 Wie üblich ist ” 

|“ die Abkürzung für ” 

teilt“.


Lemma 2.12. Ist x aperiodisch, so existiert m 0 ∈ N mit p m (x, x) > 0 für alle m ≥ m 0 . 

Beweis. Zunächst wird gezeigt, daß es ein N ∈ N gibt mit N, N + 1 ∈ I x . 

Hierzu seien n 0 , n 0 + k ∈ I x fixiert. Ist k = 1, so ist man fertig. Ist k ≥ 2, so 

wähle man n 1 ∈ I x mit k ∤ n 1 (da d x = 1). Hierfür hat man (Division mit Rest) 

n 1 = m k + r 1 (m ∈ N 0 , 0 < r 1 < k) 

und aufgrund der Halbgruppeneigenschaft von I x 

(m + 1)(n 0 + k) ∈ I x und (m + 1)n 0 + n 1 ∈ I x . 

Für diese beiden Elemente gilt: 

∣ 

∣(m + 1)(n 0 + k) − ( ) ∣ (m + 1)n 0 + n 1 ∣ = |(m + 1)k − n1 | 

≡ |(m + 1)k − (m k + r 1 )| = k − r 1 < k . 

Ist k − r 1 = 1, so gilt die Zwischenbehauptung mit N := (m + 1)n 0 + n 1 . Ist 

k − r 1 > 1, so wiederhole man die Rekursion mit ñ 0 := (m + 1)n 0 + n 1 und 

˜k := k−r 1 , um in endlich vielen Schritten N ∈ N mit N, N +1 ∈ I x zu erhalten. 

Hieraus folgt nun das Lemma mit m 0 := N 2 , denn für m ≥ m 0 hat man 

(Division mit Rest), sodaß 

m − N 2 = k N + r (k ∈ N 0 , 0 ≤ r < N) 

m = N 2 + k N + r = (N − r + k)N + r(1 + N) ∈ I x 

wegen der Halbgruppen-Eigenschaft von I x gilt. 

□ 

Theorem 2.13 (Invariantes Maß ist Limes der Übergangswahrscheinlichkeiten). 

Die Markov-Kette (X n ) n∈N0 sei aperiodisch und besitze das invariante Maß µ . Dann gilt: 

p n (x, y) n→∞ −−−−→ µ(y) = 

1 

E y (T y ) 

(x, y ∈ S) . 

Beweis(Kopplung von Prozessen, W. Döblin). Auf S 2 ≡ S × S definiert 

q ( (x 1 , y 1 ) , (x 2 , y 2 ) ) := p(x 1 , x 2 ) p(y 1 , y 2 ) (x 1 , x 2 , y 1 , y 2 ∈ S) 

eine Übergangswahrscheinlichkeit. Es sei (X n , Y n ) n∈N0 die zu q gehörige kanonische 

Markov-Kette, also die Markov-Kette in S 2 auf 

) 

(Ω, F , P) := 

((S 2 ) N 0 

, (S 2 ) N 0 

, P ϱ , 

wobei P ϱ das zu q und einer Anfangsverteilung ϱ (auf S 2 ≡ S ⊗ S ) nach 

Kolmogorov gebildete Wahrscheinlichkeitsmaß ist. 

Mit 2.12 wird nun die Irreduzibilität von (X n , Y n ) n∈N0 gezeigt; hieraus ergibt 

sich, daß dieser gekoppelte Prozeß die Diagonale von S 2 in endlicher Zeit trifft, 

womit dann die Konvergenz hergeleitet wird:


1) (X n , Y n ) n∈N0 ist irreduzibel: Sind x 1 , x 2 , y 1 , y 2 ∈ S fixiert, so gibt es wegen 

der Irreduzibilität von X Zeitpunkte k, l ∈ N mit 

p k (x 1 , x 2 ) > 0 und p l (y 1 , y 2 ) > 0 . 

Die Aperiodizität liefert gemäß 2.12 auch ein m 0 ∈ N, sodaß für m ≥ m 0 gilt 

p m+l (x 2 , x 2 ) > 0 und p m+k (y 2 , y 2 ) > 0 . 

Also ist mit Chapman-Kolmogorov auch 

q k+l+m( (x 1 , y 1 ) , (x 2 , y 2 ) ) 

≡ p k+l+m (x 1 , x 2 ) p k+l+m (y 1 , y 2 ) 

≥ p k (x 1 , x 2 ) p m+l (x 2 , x 2 ) p l (y 1 , y 2 ) p m+k (y 2 , y 2 ) > 0 . 

Daher besteht S 2 aus einer einzigen Äquivalenzklasse. Für die Irreduzibilität ist 

noch zu zeigen, daß alle Zustände in S 2 rekurrent sind. Gemäß 2.5 ist genügt 

hierfür ein q-invariantes Maß ν mit ν(x, y) > 0 für alle (x, y) ∈ S 2 . Nun ist aber 

ν(x, y) := µ(x) µ(y) (x, y ∈ S) 

ein q-invariantes Maß auf S 2 wegen der p-Invarianz von µ : 

∑ 

ν(x 1 , x 2 ) q((x 1 , x 2 ), (y 1 , y 2 )) ≡ ∑ 

µ(x 1 ) µ(x 2 ) p(x 1 , y 1 ) p(x 2 , y 2 ) 

(x 1 ,x 2 )∈S 2 (x 1 ,x 2 ) 

= ∑ x 1 

µ(x 1 ) p(x 1 , y 1 ) ∑ x 2 

µ(x 2 ) p(x 2 , y 2 ) = µ(y 1 ) µ(y 2 ) ≡ ν(y 1 , y 2 ) 

für (y 1 , y 2 ) ∈ S 2 ; ferner ist ν(y 1 , y 2 ) ≡ µ(y 1 ) µ(y 2 ) 2.6 = 

1 

E y1 (T y1 ) 

1 

E y2 (T y2 ) 

2.7 iii) 

> 0. 

2) Bezeichnet T die erste Treffzeit mit der Diagonalen D := {(x, x) : x ∈ S} , 

T := inf{ n ∈ N : (X n , Y n ) ∈ D } , 

T (x,x) die Erstbesuchszeit in (x, x) ∈ D, so gilt zum einen T ≤ T (x,x) . Ist ϱ eine 

beliebige Anfangsverteilung auf S 2 , so ist andererseits wegen der in 1) gezeigten 

Rekurrenz jedes T (x,x) < ∞ P ϱ - f.s.; insbesondere ist auch T < ∞ P ϱ – f.s. . 

X n und Y n haben auf {T ≤ n} dieselbe Verteilung (n ∈ N), da für y ∈ S gilt: 

P ϱ (X n = y , T ≤ n) = 

= 

n∑ 

P ϱ (T = m , X n = y) 

m=1 

n∑ ∑ 

P ϱ (T = m , X m = x , X n = y) = 

m=1 x∈S


= 

n∑ ∑ ( 

P ϱ Xn = y ∣ T = m , Xm = x ) P ϱ (T = m , X m = x) 

m=1 x∈S 

ME = 

n∑ 

= 

m=1 x∈S 

∑ ( 

P ϱ Xn = y ∣ X m = x ) P ϱ (T = m , X m = x) 

n∑ ∑ ( 

P ϱ Yn = y ∣ Ym = x ) P ϱ (T = m , Y m = x) 

m=1 x∈S 

= . . . . . . . . . 

ebenso 

= P ϱ (Y n = y , T ≤ n) , 

wobei einging, daß X und Y dieselbe Übergangswahrscheinlichkeit p besitzen. 

3) Nun wird die Behauptung des Satzes nachgewiesen; hiezu zeigen wir folgende 

(stärkere) Konvergenz: 

∑ 

| p n n→∞ 

(x, y) − µ(y) | −−−−→ 0 

y∈S 

für alle x ∈ S; die Gleichheit µ(y) = 1/ E y (T y ) ist ja bereits wegen 2.6 klar. 

Ist also ein beliebiges x ∈ S gegeben, so fixieren wir hierzu das Anfangsmaß 

ϱ := δ x ⊗ µ 

auf S 2 für den gekoppelten Prozeß. Hiermit gilt für alle y ∈ S 

p n (x, y) = P ϱ (X n = y) 

= P ϱ (X n = y , T ≤ n) + P ϱ (X n = y , T > n) 

2) 

= P ϱ ( Y n = y , T ≤ n) + P ϱ (X n = y , T > n) 

wegen der in 2) gezeigten Gleichheit der Verteilungen, und 

µ(y) = P ϱ (Y n = y) ≡ P ϱ (Y n = y , T ≤ n) + P ϱ (Y n = y , T > n) 

wegen der p -Invarianz von µ ; also insgesamt 

∑ 

| p n (x, y) − µ(y) | = ∑ | P ϱ (X n = y) − P ϱ (Y n = y) | 

y∈S 

y∈S 

= ∑ y∈S 

| P ϱ (X n = y , T > n) − P ϱ (Y n = y , T > n) | 

≤ 

∑ y∈S 

[ 

Pϱ (X n = y , T > n) + P ϱ (Y n = y , T > n) ] 

= 2 P ϱ (T > n) 

n→∞ 

−−−−→ 0 , 

da T P ϱ -f.s. endlich ist, wie in 2) gesehen. 

□

3. Stationäre Prozesse 

Im folgenden betrachten wir stochastische Prozesse X = (X n ) n∈N0 auf einem fixierten 

Wahrscheinlichkeitsraum (Ω, F , P) mit Werten in einem polnischen Raum S (versehen 

mit der Borel-σ-Algebra S := B(S)). Diese Familie von F -S -meßbaren Abbildungen 

faßt man auch auf als Zufallsfolge 

X : Ω −→ S N 0 

, ω ↦→ (X n (ω)) n∈N0 , 

die F -S N 0 

-meßbar ist, mit der Produkt-σ-Algebra 

S N 0 

( ⋃ 

) 

:= σ π −1 

n∈N 0 

{n} [B n] : B n ∈ S 

( ⋃ 

) 

= σ π −1 

n∈N 

n [B] : B ∈ S n+1 ; 

0 

dabei ist das zweite Erzeugendensystem ∩-stabil, das erste hingegen nicht. Das durch 

P X ≡ P (Xn) n∈N0 

:= P ◦ X −1 

definierte Maß auf S N 0 

ist die Verteilung von X. 

Sind nur Verteilungseigenschaften relevant, so kann statt X ohne Einschränkung auch sein 

kanonischer Repräsentant (Y ) n := ( π {n} 

)n auf (SN 0 

, S N 0 

, P X ) betrachtet werden. 

Definition 3.1. Ein stochastischer Prozeß X = (X n ) n∈N0 

heißt stationär, falls gilt: 

P (Xn) n∈N0 

= P (Xn+k ) n∈N0 

(∀ k ∈ N) . 

Ein stationärer Prozeß tritt also hinsichtlich seiner Verteilung ” 

auf der Stelle“; dies wird 

im folgenden Lemma nochmals formuliert: 

Lemma 3.2. X = (X n ) n∈N0 

ist genau dann stationär, falls gilt: 

P (X0 ,...,X n) = P (Xk ,...,X k+n ) (k ∈ N , n ∈ N 0 ) . 

Beweis. ” 

⇒“ Für alle k ∈ N , n ∈ N 0 und B ∈ S n+1 gilt: 

P (X0 ,...,X n)(B) ≡ P{ (X 0 , . . . , X n ) ∈ B } 

= P{ (X m ) m∈N0 ∈ πn −1 (B) } 

stat 

= P{ (X m+k ) m∈N0 ∈ πn −1 (B) } 

= P{ (X k , . . . , X n+k ) ∈ B } ≡ P (Xk ,...,X k+n )(B) . 

” ⇐“ Nach Voraussetzung gilt gerade für alle k ∈ N , n ∈ N 0 und B ∈ S n+1 : 

( 

P (Xm) m∈N0 π 

−1 

n (B) ) ( 

= P (Xm+k ) m∈N0 π 

−1 

n (B) ) 

(vgl. obige Rechnung). Da aber { ⋃ n∈N 0 

πn 

−1 (B) : B ∈ S n+1 } ein ∩-stabiler 

Erzeuger von S N 0 

ist, folgt hieraus P (Xm) m∈N0 

= P (Xm+k ) m∈N0 

mit dem Maßeindeutigkeitssatz. 

□

Stationäre Prozesse 17 

Beispiel 3.3 (Markov-Kette mit Übergangswahrscheinlichkeit p). Sei (X n ) n∈N0 

eine Markovkette auf einem abzählberen Raum S (versehen mit S := B(S) ≡ P(S)) mit 

Übergangswahrscheinlichkeit p und invariantem Maß µ. Dann ist (X n ) n∈N0 stationär auf 

(Ω, F , P) := (S N 0 

, S N 0 

, P µ ) . 

Beweis. Zunächst gilt für alle B := B 0 × B 1 × · · · × B n ∈ S n+1 : 

(P µ ) (X1 ,...,X n+1 )(B) ≡ P µ { X 1 ∈ B 0 , X 2 ∈ B 1 , . . . , X n+1 ∈ B n } 

= P µ { X 0 ∈ S , X 1 ∈ B 0 , X 2 ∈ B 1 , . . . , X n+1 ∈ B n } 

= ∑ ∑ ∑ 

∑ 

µ(z) p(z, x 0 ) p(x 0 , x 1 ) · · · p(x n−1 , x n ) 

z∈S x 0 ∈B 0 x 1 ∈B 1 x n∈B n 

= ∑ ∑ 

∑ 

∑ 

µ(z) p(z, x 0 ) p(x 0 , x 1 ) · · · p(x n−1 , x n ) 

x 0 ∈B 0 z∈S 

x 1 ∈B 1 x n∈B n 

inv 

= ∑ ∑ 

∑ 

µ(x 0 ) p(x 0 , x 1 ) · · · p(x n−1 , x n ) 

x 0 ∈B 0 x 1 ∈B 1 x n∈B n 

= P µ { X 0 ∈ B 0 , X 1 ∈ B 1 , . . . , X n ∈ B n } 

= (P µ ) (X0 ,X 1 ,...,X n)(B) . 

Iteriert man dieses Argument k-mal, so erhält man das Kriterium für Stationarität 

aus 3.2 . 

□ 

Beispiel 3.4 (Rotation des Kreises). Sei (Ω, F , P) := ([0, 1), B[0, 1), λ ∣ ∣ 

F 

) , wobei λ 

das Lebesguemaß bezeichnet. Dann ist für jedes fixierte θ ∈ [0, 1) der Prozeß (X n ) n∈N0 , 

X n : Ω −→ S := Ω , X n (ω) := ω + n · θ (mod 1) , n ∈ N 0 , 

eine stationäre Markov-Kette auf (S N 0 

, S N 0 

, P λ ) bzgl. der Übergangswahrscheinlichkeit 

{ 

1 , falls y = x + θ (mod 1) 

p : S × S −→ [0, 1] , p(x, y) := 

0 , sonst. 

Beweis. Wegen der Translationsinvarianz des Lebesguemaßes ist λ p-invariant, 

λ(dy) = 

∫ 1 

0 

λ(dz) p(z, dy) . 

Also folgt wie in 3.3 für alle B := B 0 × B 1 × · · · × B n ∈ S n+1 : 

(P λ ) (X1 ,...,X n+1 )(B) = P λ { X 0 ∈ S , X 1 ∈ B 0 , X 2 ∈ B 1 , . . . , X n+1 ∈ B n } 

∫ ∫ 

∫ 

∫ 

= λ(dz) p(z, dx 0 ) p(x 0 , dx 1 ) · · · p(x n−1 , dx n ) 

Ω B 0 B 1 B 

∫ 

∫ 

∫ n 

= λ(dz) p(z, dx 0 ) p(x 0 , dx 1 ) · · · p(x n−1 , dx n ) 

∫B 0 Ω 

B 1 B 

∫ ∫ 

∫ 

n 

inv 

= λ(dx 0 ) p(x 0 , dx 1 ) · · · p(x n−1 , dx n ) 

B 0 B 1 B n 

= (P λ ) (X0 ,X 1 ,...,X n)(B) , 

und damit die Stationarität wiederum aus 3.2 . 

□

18 Stationäre Prozesse 

Theorem 3.5. Der Prozeß (X n ) n∈N0 mit polnischem Zustandsraum (S, S ) sei stationär 

und g : S N 0 

−→ S ′ sei S N 0 

-S ′ -meßbar, wobei (S ′ , S ′ ) ebenfalls polnisch ist. Dann ist 

Y k := g (X k , X k+1 , . . . ) (k ∈ N 0 ) 

stationär (in S ′ ). 

Beweis. Wegen der Meßbarkeit von g ist für jedes k ∈ N 0 auch 

g k : S N 0 

−→ S ′ , 

x ↦→ g ◦ θ k (x) 

meßbar, wobei θ ≡ (θ k ) k∈N0 

wieder (siehe 1.5) den meßbaren Shift 

θ k : S N 0 

−→ S N 0 

, 

(x n ) n ↦→ (x n+k ) n 

bezeichnet. Sei nun B ∈ (S ′ ) N 0 

fixiert; aufgrund der Meßbarkeit aller g k ist 

A := (g 0 , g 1 , . . .) −1 ( ) 

(B) meßbar und wegen Y k = g k (Xn ) n folgt für m ∈ N: 

P (Yk ) k∈N0 

(B) ≡ P ( (Y k ) k∈N0 ∈ B ) = P ( (X n ) n∈N0 ∈ A ) 

X stat 

= P ( (X n+m ) n∈N0 ∈ A ) = P ( (Y k+m ) k∈N0 ∈ B ) 

≡ P (Yk+m ) k∈N0 

(B) , 

also gerade die Stationarität von Y . 

□ 

Beispiel 3.6 (Bernoulli-Shift). Auf (Ω, F , P) := ([0, 1), B[0, 1), λ ∣ F 

) ist (Y n ) n∈N0 , 

{ 

id Ω , n = 0 

Y n : Ω −→ Ω , Y n := 

2Y n−1 (mod 1) , n ∈ N , 

stationär. 

Beweis. Sei (X n ) n∈N0 eine Bernoulli-Folge zur Rate 1 2 

, realisiert als Produktmaß 

˜P auf ˜Ω := {0, 1} N 0 

; (X n ) n sei also eine Folge von iid-ZVen in S := {0, 1} 

mit ˜P{X n = 0} = ˜P{X n = 1} = 1 2 . Dann ist (X n) n stationär. Ferner ist 

g : ˜Ω ≡ {0, 1} N 0 

−→ Ω ≡ [0, 1) , 

(x n ) n ↦→ ∑ ∞ 

n=0 x n 2 −n−1 (mod 1) 

meßbar und ˜P◦g −1 = P (dyadische Intervalle lassen sich als Mengen der Bauart 

{X 0 = i 0 , . . . , X k = i k } mit i 0 , . . . , i k ∈ {0, 1} schreiben). Wegen 3.5 ist nun 

stationär; andererseits gilt: 

Z k := g(X k , X k+1 , . . . ) (k ∈ N 0 ) 

2 Z 0 ≡ 2 g(X 0 , X 1 , . . . ) = X 0 + ∑ ∞ 

X n 2 −n (mod 1) 

n=1 

= X 0 + ∑ ∞ 

X n+1 2 −(n+1) (mod 1) 

n=0 

= g(X 1 , X 2 , . . . ) ≡ Z 1 ; 

iterativ erhält man: 2 Z n−1 = Z n (n ∈ N) , sodaß mit Z auch Y stationär ist. 

□


Definition 3.7 (maßtreue Abbildung). Sei (Ω, F , P) ein Wahrscheinlichkeitsraum. 

Eine F -F -meßbare Abbildung ϕ : Ω → Ω heißt maßtreu, falls gilt: P ◦ ϕ −1 = P. 

Bemerkung 3.8. Sei ϕ eine maßtreu auf (Ω, F , P) und X : Ω → S eine F -S -meßbare 

Abbildung mit Werten in einem polnischen Raum (S, S ). Dann ist (X n ) n∈N0 mit 

{ 

X , n = 0 

X n := 

X ◦ ϕ n , n ∈ N 

stationär. 

Beweis. Für B ∈ S n+1 gilt: 

P (X0 ,...,X n)(B) ≡ P ( (X 0 , . . . , X n ) ∈ B ) 

sodaß die Stationarität aus 3.2 folgt. 

ϕ m.t. 

= P ( (X 0 , . . . , X n ) ◦ ϕ k ∈ B ) = P (Xk ,...,X k+n )(B) , 

Die Situation in der vorhergehenden Bemerkung gibt nicht nur ein Beispiel für eine 

stationäre Folge, sondern schon den allgemeinen Fall: 

Satz 3.9 (Standardmodell für stationäre Folgen). 

Sei (Y n ) n∈N0 stationär auf (Ω, F , P) mit Werten in einem polnischen Raum (S, S ). 

Dann existiert ein Wahrscheinlichkeitsraum (Ω ′ , F ′ , P ′ ) mit einer maßtreuen Abbildung 

ϕ : Ω ′ → Ω ′ und einer ZV X 0 : Ω ′ → S derart, daß mit X n := X 0 ◦ ϕ n (n ∈ N) gilt: 

P ′ (X n) n∈N0 

= P (Yn) n∈N0 

. 

Beweis. Es seien (Ω ′ , F ′ , P ′ ) := (S N 0 

, S N 0 

, P (Yn) n∈N0 

) und X 0 := π {0} (Projektion 

zur Zeit 0) sowie ϕ := θ 1 (Shift). Wegen der Stationarität von Y ist ϕ 

maßtreu, denn für A ′ ∈ F ′ gilt: 

P ′ ( ϕ −1 (A ′ ) ) = P ( (Y n ) n ∈ ϕ −1 (A ′ ) ) 

= P ( (Y n+1 ) n ∈ A ′) 

Y stat 

= P ( (Y n ) n ∈ A ′) = P ′ (A ′ ) . 

□ 

Die behauptete Gleichheit der Verteilungen gilt nach Definition von P ′ . 

□ 

Definition 3.10 

{ 

(invariant, ergodisch). Sei 

} 

ϕ maßtreue 

{ 

Abbildung auf (Ω, F , P). 

invariant 

ϕ 

A ∈ F heißt 

, falls 

−1 } 

(A) = A P-f.s. 

invariant im strengeren Sinn 

ϕ −1 ist. 

(A) = A 

ϕ heißt ergodisch, falls für alle A ∈ I := { invariante Mengen } gilt: P(A) ∈ {0, 1} . 

Bemerkung 3.11. i) I ist eine σ-Algebra (Unter-σ-Algebra von F ); 

ii) Zu A ∈ I existiert eine streng invariante Menge B ∈ F mit B = A P-f.s.; 

(z.B. B := lim inf n→∞ ϕ −n (A)) 

iii) Zu A ∈ I existiert ein B ∈ T := ⋂ ∞ 

n=1 σ(X n, X n+1 , . . .) mit 4 B = A P-f.s.; 

(z.B. wieder B := lim inf n→∞ ϕ −n (A), da B = ϕ −k (B) ∈ σ(X k , X k+1 , . . .)) 

4 T ist die σ-Algebra der terminalen Ereignisse;

20 Stationäre Prozesse 

Beispiel 3.12. (X n ) n∈N0 seien unabhängige Zufallselemente in einem polnischen Raum 

S (oE auf dem Folgenraum definiert), d.h.: 

P ≡ P X = ⊗ P Xn . 

n∈N 0 

Dann gilt P(A) ∈ {0, 1} für A ∈ T ; d.h. der Shift ϕ := θ 1 ist ergodisch. 

Beispiel 3.13 (Rotation des Kreises). Wie in 3.4 betrachten wir die Transformation 

ϕ : Ω −→ Ω , ϕ(ω) := ω + θ (mod 1) , 

auf dem Wahrscheinlichkeitsraum (Ω, F , P) := ([0, 1), B[0, 1), λ ∣ ∣ 

F 

) , wobei λ das Lebesguemaß 

bezeichnet. Dann ist ϕ genau dann ergodisch, wenn θ irrational ist. 

Beweis. ⇒“ Sei θ rational, also θ = m 

” n 

mit natürlichen Zahlen n ≥ m ≥ 1. 

Ferner sei B ∈ F ≡ B[0, 1) mit 0 < λ(B) < 1 n . Dann ist A := ⋃ m−1 

k=1 (B + k n ) 

invariant, aber 0 < λ(A) < 1. 

⇐“ Dies kann man mit einem Fourierreihen-Argument zeigen; siehe z.B. 

” 

Shiryaev [Sh 95, p.408] oder auch Kallenberg [KB 97, p.174/9]. 

□ 

Beispiel 3.14. Sei (X n ) n∈N0 die kanonische Markovkette auf S := {1, 2, 3, 4} mit Übergangswahrscheinlichkeit 

⎛ 

⎞ 

1 2 

3 3 

0 0 

p := 

⎜ 

⎝ 

2 

3 

1 

3 

0 0 

0 0 

1 

2 

0 0 

1 

4 

(p ist eine stochastische Matrix, da die Zeilensummen gleich 1 sind). Ein Maß µ auf S ist 

invariant, falls gilt: 

µ(j) = 

1 

2 

3 

4 

⎟ 

⎠ 

4∑ 

p(i, j)µ(i) (j = 1, 2, 3, 4) . 

i=1 

Dies wird z.B. erfüllt durch die beiden Maße 

µ 0 (1) = µ 0 (2) := 1 2 , µ 0(3) = µ 0 (4) := 0 

und 

µ 1 (1) = µ 1 (2) := 0 , µ 1 (3) := 1 3 , µ 1(4) := 2 3 . 

Dann ist aber auch jedes 

µ β := (1 − β)µ 0 + βµ 1 (0 ≤ β ≤ 1) 

invariant. Bezüglich des kanonischen Shifts ϕ := θ 1 gilt nun: 

A := {X n ∈ {1, 2}, n ∈ N 0 } ∈ I und B := {X n ∈ {3, 4}, n ∈ N 0 } ∈ I . 

Hiermit gilt weiter: P µβ (A) = 1−β und P µβ (B) = β . Folglich ist ϕ genau dann ergodisch, 

wenn β ∈ {0, 1} ist.


Theorem 3.15. (X n ) n∈N0 mit polnischem Zustandsraum (S, S ) sei ergodisch und 

g : S N 0 

−→ S ′ sei S N 0 

-S ′ -meßbar, wobei (S ′ , S ′ ) ebenfalls polnisch ist. Dann ist 

ergodisch (in S ′ ). 

Y k := g (X k , X k+1 , . . . ) (k ∈ N 0 ) 

Beweis. Ohne Einschränkung sei wieder (Ω, F , P) = (S N 0 

, S N 0 

, P (Xn) n∈N0 

) 

und X n = π {n} (Projektion zur Zeit n) sowie ϕ = θ 1 (Shift). Ebenso sei 

(Ω ′ , F ′ , P ′ ) = ((S ′ ) N 0 

, (S ′ ) N 0 

, P (Yn) n∈N0 

) und ϕ ′ = θ 1 . Ferner bezeichnen I 

bzw. I ′ die zu ϕ bzw. ϕ ′ gehörigen Systeme invarianter Mengen. 

Sei nun A ∈ I ′ fixiert; für B := (g 0 , g 1 , . . .) −1 (A) gilt dann: 

ϕ −1 (B) = (g 1 , g 2 , . . .) −1 (A) 

= (g 0 , g 1 , . . .) −1 ( (ϕ ′ ) −1 (A) ) 

= (g 0 , g 1 , . . .) −1 (A) ≡ B , 

also B ∈ I . Wegen der Ergodizität von ϕ folgt also: P ′ (A) ≡ P(B) ∈ {0, 1}. 

□ 

Beispiel 3.16 (Bernoulli-Shift). Wie in 3.6 betrachten wir iid-ZVn (X n ) n in S := {0, 1} 

mit P{X n = 0} = P{X n = 1} = 1 2 

. Ferner sei 

g : {0, 1} N 0 

−→ [0, 1) , 

(x n ) n ↦→ ∑ ∞ 

Wegen 3.12 ist nun X ergodisch, also gemäß 3.15 auch 

n=0 x n 2 −n−1 (mod 1) . 

Y k := g (X k , X k+1 , . . . ) (k ∈ N 0 ) .

4. Der Birkhoffsche Ergodensatz 

Sei (Ω, F , P) ein Wahrscheinlichkeitsraum mit einer maßtreuen Abbildung ϕ : Ω → Ω und 

einer ZV X : Ω → R. Wir untersuchen nun das asymptotische Verhalten des durch 

definierten stochastischen Prozesses. 

X k := X ◦ ϕ k (k ∈ N 0 ) 

Theorem 4.1 (Ergodensatz, Birkhoff). Sei X ∈ L 1 (P). Dann gilt P-f.s. und in L 1 (P): 

1 

n 

n−1 

∑ 

k=0 

X ◦ ϕ k 

n→∞ 

−−−−→ E(X|I ) . 

Der Beweis stützt sich auch folgende Abschätzung: 

Lemma 4.2 (Maximal-ergodisches Lemma, Hopf). In der Situation aus 4.1 seien 

S n := X 0 + · · · + X n−1 ≡ 

n−1 

∑ 

k=0 

X ◦ ϕ k 

(n ∈ N) und 

M n := max{0, S 1 , . . . , S n } (n ∈ N 0 ) . 

Dann gilt: 

E ( X 1 {Mn> 0} 

) 

≥ 0 (n ∈ N0 ) . 

Beweis. Im Fall n = 0 ist nicht zu beweisen. Zuerst zeigen wir folgendes: 

X 1 {Mn> 0} ≥ 1 {Mn> 0} (M n − M n ◦ ϕ) (n ∈ N) ; 

nach obigen Definitionen gilt S k − M n ≤ 0 für alle k ∈ {1, . . . , n} , also auch 

X ≥ X + (S k − M n ) ◦ ϕ = (X + S k ◦ ϕ) − M n ◦ ϕ ≡ S k+1 − M n ◦ ϕ 

und damit 

insbesondere ist damit gezeigt: 

X ≥ max{S 1 , . . . , S n } − M n ◦ ϕ ; 

X 1 {Mn> 0} ≥ 1 {Mn> 0} max{S 1 , . . . , S n } − 1 {Mn> 0} M n ◦ ϕ 

= 1 {Mn> 0} (M n − M n ◦ ϕ) (n ∈ N) , 

also gerade obige Zwischenbehauptung. Hiermit ergibt sich aber gerade: 

E ( ∫ 

) 

X 1 {Mn> 0} ≥ (M n − M n ◦ ϕ) dP 

{M n> 0} 

∫ 

= (M n − M n ◦ ϕ) dP = 0 , 

wobei zuletzt noch benutzt wurde, daß ϕ maßtreu ist. 

□

Der Birkhoffsche Ergodensatz 23 

Beweis des Birkhoffschen Ergodensatzes 4.1 Ohne Einschränkung sei 

E(X|I ) = 0 ; andernfalls betrachten wir ˜X := X − E(X|I ) , was wegen der 

Invarianz E(X|I ) ◦ ϕ = E(X|I ) (P-f.s.) möglich ist. 

P-fast sichere Konvergenz: Hierfür werden wir mit 

¯X := lim sup 

n→∞ 

S n 

n 

n−1 

1 ∑ 

≡ lim sup X ◦ ϕ k 

n→∞ n 

k=0 

und mit 

zeigen: 

D := { ¯X > ε } ∈ I (zu beliebigem ε > 0) 

P(D) = 0 ; 

analog zeigt man lim inf Sn 

n 

≥ 0 , indem man −X anstatt X betrachtet. 

Um also P(D) = 0 zu zeigen drücken wir D anders aus: Mit 

X ∗ := (X − ε) 1 D 

Sn ∗ := X ∗ + X ∗ ◦ ϕ + · · · + X ∗ ◦ ϕ n−1 

M ∗ n := max{0, S ∗ 1, . . . , S ∗ n} 

F n := { M ∗ n > 0 } 

hat man 

D = 

{ 

S ∗ } 

n 

sup 

n∈N n > 0 

= ⋃ n∈N 

F n . 

Wendet man das maximal-ergodische Lemma 4.2 an auf X ∗ , so folgt hiermit: 

0 ≤ E X ∗ 1 Fn ) (Lemma 4.2) 

( ) 

n→∞ 

−−−→ E X ∗ 1 ⋃ (maj. Kvgz., da X ∈ L 1 ) 

n Fn 

= E ( X ∗ 1 D ) (vorherige Char. von D) 

≡ E ( X 1 D ) − ε P(D) (Definition von X ∗ ) 

= −ε P(D) ( E(X|I ) = 0 und D ∈ I ) 

≤ 0 , 

insgesamt also gerade: P(D) = 0 . 

L 1 -Konvergenz: Hierzu wird X ” 

abgeschnitten“; mit einem festen K > 0 sei 

X ′ := X 1 {|X|≤K} und X ′′ := X − X ′ . 

Die oben gezeigte P-fast sichere Konvergenz gilt insbesondere auch für X ′ ; da 

diese Konvergenz hier aber durch K majoriert ist, folgt insgesamt für X ′ : 

1 

n 

n−1 

∑ 

k=0 

X ′ ◦ ϕ k 

n→∞ 

−−−−→ E(X ′ |I ) in L 1 (P) .

24 Der Birkhoffsche Ergodensatz 

Außerdem hat man 

( ∣ ∣∣∣∣ 

1 

E 

n 

n−1 

∑ 

k=0 

X ′′ ◦ ϕ k ∣ ∣∣∣∣ 

) 

≤ 1 n 

n−1 

∑ 

k=0 

( 

E |X ′′ | ◦ ϕ k) = E(|X ′′ |) , 

wobei benutzt wurde, daß ϕ maßtreu ist; ferner gilt nach Jensen (| . | ist konvex): 

E ( ∣ ∣ E(X ′′ |I ) ∣ ∣ ) ≤ E ( E( |X ′′ | |I ) ) = E(|X ′′ |) ; 

faßt man die beiden letzten Ungleichungen zusammen, so ergibt sich: 

( ∣ ) 

∣∣∣∣ n−1 

1 ∑ 

E X ′′ ◦ ϕ k − E(X ′′ |I ) 

≤ 2 E(|X ′′ |) . 

n 

∣ 

k=0 

Sei nun ein beliebiges ε > 0 fixiert; dann kann man K > 0 so groß wählen, daß 

2 E(|X ′′ |) < ε 2 

ist (majorierte Konvergenz, Definition von X ′′ ). Mit diesen Parametern ε und 

K kann man wegen obiger L 1 -Konvergenz bei X ′ ein n 0 ∈ N wählen, sodaß gilt: 

( ∣ ) 

∣∣∣∣ n−1 

1 ∑ 

E X ′ ◦ ϕ k − E(X ′ |I ) 

< ε (n ≥ n 0 ) . 

n 

∣ 2 

k=0 

Da nun X ≡ X ′ + X ′′ ist, ergeben die vorangehenden drei Abschätzungen: 

(∣ ) 

∣∣∣∣ n−1 

1 ∑ 

E X ◦ ϕ k − E(X|I ) 

n 

∣ 

k=0 

(∣ ) (∣ ) 

∣∣∣∣ n−1 

1 ∑ 

∣∣∣∣ n−1 

≤ E X ′ ◦ ϕ k − E(X ′ 1 ∑ 

|I ) 

+ E X ′′ ◦ ϕ k − E(X ′′ |I ) 

< ε 

n 

∣ n 

∣ 

k=0 

□ 

Beispiel 4.3 (Starkes Gesetz der großen Zahlen). (X n ) n∈N0 seien iid ZV, oE auf 

dem Folgenraum Ω := R N 0 

definiert, mit P ≡ P X = P X0 ⊗ P X0 ⊗ · · · und ergodischem 

Shift ϕ = θ 1 (siehe 3.12). Ist dann X 0 ∈ L 1 (P), so folgt aus 4.1 mit 3.9: 

1 

n 

n−1 

∑ 

k=0 

X k 

= 1 n 

n−1 

∑ 

k=0 

X 0 ◦ ϕ k 

k=0 

P-fs, L 1 (P) 

−−−−−−−→ E(X 0 |I ) = E(X 0 ) . 

Beispiel 4.4 (Rotation des Kreises, Weylscher Gleichverteilungssatz). Es sei 

ϕ : Ω −→ Ω , ϕ(ω) := ω + θ (mod 1) , 

auf (Ω, F , P) := ([0, 1), B[0, 1), λ ∣ ∣ 

F 

) wie in 3.4 und 3.13, wobei λ das Lebesguemaß bezeichnet. 

Ferner sei θ ∈ Q c . Dann folgt aus 4.1 mit 3.13 für A ∈ B[0, 1) : 

1 

n 

n−1 

∑ 

k=0 

1 A ◦ ϕ k λ-fs, L 1 (λ) 

−−−−−−−→ λ(A) .

5. Der Subadditive Ergodensatz von Kingman 

Sei (Ω, F , P) ein Wahrscheinlichkeitsraum mit einer maßtreuen Transformation ϕ : Ω → Ω. 

Im vorangehenden Abschnitt haben wir das asymptotische Verhalten von Sn 

n 

untersucht, 

wobei S n die Gestalt ∑ n−1 

k=0 X◦ϕk hat, also insbesondere der additiven Kozykel-Eigenschaft 

S n+m = S n + S m ◦ ϕ n (n, m ∈ N 0 ) 

genügt. Nun interessieren wir uns für folgende Verallgemeinerung: 

Definition 5.1 (Subadditive Folge von Zufallsvariablen). Eine Folge (Y n ) n von 

Zufallsvariablen (n ∈ N 0 oder N; Zustandsraum R ∪ {−∞}) heißt subadditiv, wenn gilt: 

Y n+m ≤ Y n + Y m ◦ ϕ n (n, m ∈ N 0 ) . 

Eine Folge (Y n ) n∈N0 heißt superadditiv, wenn (−Y n ) n∈N0 subadditiv ist, und sie heißt 

additiv, wenn sie sowohl sub- als auch superadditiv ist. 

Beispiel 5.2. Sei (X n ) n∈N0 eine Folge von iid ZV, die oE als X n = π {n} auf dem Folgenraum 

(Ω, F , P, ϕ) = (S N 0 

, S N 0 

, P (Xn) n∈N0 

, θ 1 ) definiert ist. Hierzu sei 

S n := 

n−1 

∑ 

X k . 

k=0 

Dann ist (S n ) n∈N0 additiv und (|S n |) n∈N0 subadditiv. 

Beweis. Die Additivität von (S n ) n folgt direkt, da ϕ ≡ θ 1 ist. Ferner gilt: 

∣ ∣ ∣ n+m−1 

∑ ∣∣∣∣ 

n−1 

∑ ∣∣∣∣ n+m−1 

∑ ∣∣∣∣ 

|S n+m | ≡ 

X 

∣ 

k ≤ 

X 

∣ k + 

X 

∣ 

k 

k=0 

k=0 

k=n 

∣ m−1 

∑ ∣∣∣∣ 

= |S n | + 

X 

∣ k ◦ ϕ n = |S n | + |S m | ◦ ϕ n . 

Beispiel 5.3. Auf einem Wahrscheinlichkeitsraum (Ω, F , P) mit maßtreuem ϕ sei eine 

zufällige Matrix, also eine meßbare Abbildung A : Ω → R d×d gegeben. Ferner seien 

k=0 

A n := (A ◦ ϕ n−1 )(A ◦ ϕ n−2 ) · · · A und hiermit 

Y n := log ‖ A n ‖ (n ∈ N) , 

wobei ‖ . ‖ eine Matrixnorm bezeichnet. Dann ist (Y n ) n subadditiv. 

Beweis. 

Y n+m = log ‖ (A ◦ ϕ m−1 ◦ ϕ n ) · · · (A ◦ ϕ 0 ◦ ϕ n )(A ◦ ϕ n−1 ) · · · A ‖ 

= log ‖ (A m ◦ ϕ n ) A n ‖ 

Norm 

≤ log [ ( ‖ A m ‖ ◦ ϕ n ) ‖ A n ‖ ] 

= log ( ‖ A m ‖ ◦ ϕ n ) + log ‖ A n ‖ ≡ Y m ◦ ϕ n + Y n . 

□ 

□

26 Der Subadditive Ergodensatz (Kingman) 

Ziel ist es nun, bei subadditivem (Y n ) n eine Konvergenzaussage für Yn n 

zu erhalten. 

Dies wird im subadditiven Ergodensatz 5.7 von Kingman geschehen. Hierzu dienen die 

folgenden drei Lemmata. 

Lemma 5.4 (Riesz). Seien u 1 , . . . , u n ∈ R (n ∈ N). Mit 

{ 

0 , j = 0 

s j := 

u 1 + · · · + u j , j ∈ {1, . . . , n} , 

definiere 

v j ≡ v jn := max 

k∈{j,...,n} ( s k − s j ) ≡ max { 0 , u j+1 , u j+1 + u j+2 , u j+1 + · · · + u n 

} 

für j = 0, 1, . . . , n . Dann gilt: 

n−1 

∑ 

j=0 

u j+1 1 {vjn >0} ≥ 0 . 

Beweis. 1) Zunächst gilt für alle j ∈ {0, 1, . . . , n} : 

Dies folgt direkt, da 

v j = max{ 0 , u j+1 + v j+1 } ≡ (u j+1 + v j+1 ) + . 

v j = max{ 0 , u j+1 , u j+1 + u j+2 , u j+1 + · · · + u n } und 

v j+1 = max{ 0 , u j+2 , u j+2 + u j+3 , u j+2 + · · · + u n } . 

2) Wegen 1) gilt: 

v j ≤ v j+1 + u j+1 1 {vj >0} (j ∈ {0, 1, . . . , n}) . 

Denn falls v j = 0 ist, ist dies trivial, und im Falle v j > 0 gilt: 

0 < v j 

1) 

= (u j+1 + v j+1 ) + v j>0 

= v j+1 + u j+1 . 

3) Aus 2) folgt nun die Behauptung des Lemmas, denn: 

0 ≤ v 0 = v 0 − v n = 

n−1 

∑ 

(v j − v j+1 ) ≤ 

2) 

j=0 

n−1 

∑ 

j=0 

u j+1 1 {vj >0} . 

Im Beweis des subadditiven Ergodensatzes von Kingman werden wir subadditive Folgen 

(Y n ) n vergleichen mit additiven Folgen X n = ∑ n−1 

i=0 X 0 ◦ ϕ i . Dazu dient folgende 

Hilfsüberlegung, für die das vorangehende Lemma von Riesz benötigt wird: 

□

Der Subadditive Ergodensatz (Kingman) 27 

Lemma 5.5 (Maximalungleichung). (Y n ) n∈N0 sei superadditiv auf (Ω, F , P, ϕ) und es 

gelte Y n ≥ 0 für alle n. Ferner sei X ≥ 0 eine integrierbare ZV; hierzu setze 

Dann gilt: 

V := sup 

n∈N 0 

( Y n − X n ) − Y 0 , wobei X n := 

Beweis. Es sei v jn := 

1) Zunächst gilt: 

E ( X 1 {V >0} | I ) ≤ sup 

n∈N 

max 

k∈{j,...,n} 

E( Y n | I ) 

n 

( 

Y k − Y j − k−1 ∑ 

i=j 

. 

X ◦ ϕ i ) 

n−1 

∑ 

X ◦ ϕ i . 

i=0 

für j = 0, 1, . . . , n . 

Y n 

≥ 

n−1 

∑ 

j=0 

X ◦ ϕ j 1 {vjn >0} (n ∈ N) ; 

denn mit Y j+1 ≥ Y j 

(wegen Superadditivität und Y n ≥ 0) erhält man: 

Y n ≥ Y n − Y 0 = 

≥ 

n−1 

∑ 

( Y j+1 − Y j ) 

j=0 

n−1 

∑ 

( Y j+1 − Y j ) 1 {vjn >0} 

j=0 

5.4 

≥ 

n−1 

∑ 

j=0 

X ◦ ϕ j 1 {vjn >0} , 

wobei der letzte Schritt aus 5.4 mit u j := Y j − Y j−1 − X ◦ ϕ j−1 folgt. 

2) Aus 1) folgt nun: 

E( Y n | I ) ≥ 

n∑ 

E ( X 1 {v0k >0} | I ) 

k=1 

(n ∈ N); 

denn für k ≥ j folgt aus der Superadditivität Y k − Y j ≥ Y k−j ◦ ϕ j und daher 

v jn ≥ v 0(n−j) ◦ ϕ j , also insgesamt (mit der Maßtreue von ϕ): 

E( Y n | I ) 

1) 

≥ 

≥ 

n−1 

∑ 

j=0 

n−1 

∑ 

j=0 

( 

E 

) 

X ◦ ϕ j 1 {vjn >0} ∣ I 

( [ 

] ∣ ) 

E X 1 {v0(n−j) >0} ◦ ϕ j ∣∣ I 

= 

n∑ 

E ( X 1 {v0k >0} | I ) . 

k=1 

3) Mit Fatou und {v 0k > 0} ↗ {V > 0} (k → ∞) ergibt sich daraus: 

sup 

n∈N 

E( Y n | I ) 

n 

2) 

≥ lim inf 

n→∞ 

1 

n 

n∑ 

E ( X 1 {v0k >0} | I ) ≥ E ( X 1 {V >0} | I ) . 

k=1 

□


Lemma 5.6. Ist Z eine meßbare Funktion auf (Ω, F , P, ϕ) mit Z ≥ Z◦ϕ, so gilt Z = Z◦ϕ. 

Ist insbesondere (Y n ) n∈N0 superadditiv und 

so gilt: 

Y := lim sup 

n→∞ 

Y n 

n 

, bzw. Y := lim inf 

n→∞ 

Y = Y ◦ ϕ , bzw. Y = Y ◦ ϕ . 

Y n 

n , 

Beweis. Wir zeigen zunächst die Aussage über Z und nehmen hierzu Z > Z◦ϕ 

auf einer Menge positiver Masse an, also 

für ein q ∈ Q . Dann folgt aber: 

P( Z > q > Z ◦ ϕ ) > 0 

P( Z < q ) 

ϕ m.t. 

= P( Z ◦ ϕ < q ) 

= P( Z ◦ ϕ < q ≤ Z ) + P( Z ◦ ϕ < q , Z < q ) 

Z≥Z◦ϕ 

= P( Z ◦ ϕ < q ≤ Z ) + P( Z < q ) 

} {{ } 

>0 

> P( Z < q ) , 

ein Widerspruch. 

Wegen der ebengezeigten Behauptung ist nun nur noch zu sehen: 

Y ≥ Y ◦ ϕ , bzw. Y ≥ Y ◦ ϕ ; 

aufgrund der Superadditivität von (Y n ) n hat man nun: 

Y n+1 

n + 1 

≥ 

= 

Y 1 

n + 1 + Y n ◦ ϕ 

n + 1 

Y 1 

n + 1 + 

n 

n + 1 

Y n 

n ◦ ϕ . 

□ 

Theorem 5.7 (Subadditiver Ergodensatz, Kingman). 

Auf (Ω, F , P, ϕ) sei (Y n ) n∈N eine superadditive Folge integrierbarer ZV. Dann gilt: 

Y n 

n 

P-f.s. 

−−−−−−→ 

n→∞ 

sup 

n∈N 

Dabei ist γ genau dann integrierbar, wenn sup 

n∈N 

Y n 

n 

1 

n E(Y n | I ) =: γ ≤ ∞ . 

L 1 (P) 

−−−−−−→ γ . 

n→∞ 

1 

n E(Y n) < ∞ ist. In diesem Fall gilt auch 

Ferner existiert eine Menge ˜Ω ∈ I mit ˜Ω ⊂ ϕ 

−1 ˜Ω und P(˜Ω) = 1, sodaß auch gilt: 

Y n 

n 

−−−−→ n→∞ γ auf ˜Ω .


Beweis. Um die Notation zu vereinfachen setzen wir Y 0 := 0; dann ist (Y n ) n∈N0 

weiterhin superadditiv. 

1) Wir zeigen zunächst, daß man ohne Einschränkung 

annehmen kann. Hierzu sei 

J n := H n − F n mit H n := 

Y n ≥ 0 (n ∈ N) 

n−1 

∑ 

i=0 

setzt man noch G n := Y n − F n , so schreibt sich Y n als 

Y + 

1 ◦ ϕi und F n := 

Y n ≡ Y n − F n + H n − J n ≡ G n + H n − J n . 

n−1 

∑ 

i=0 

Y 1 ◦ ϕ i ; 

Dabei sind die Folgen (H n ) n und (J n ) n additiv, so daß die vorausgesetzte Integrabilität 

mit Birkhoffs Ergodensatz 4.1 ZV γ H und γ J liefert, sodaß 

H n 

n −→ γ H und 

J n 

n −→ γ J 

P-f.s. und in L 1 (P) gilt. Die Behauptungen über Y folgen also, wenn auch 

G n 

n −→ γ G 

gezeigt ist, da dann insbesondere 

(P-f.s. und in L 1 (P)) 

Y n 

n −→ γ G + γ H − γ J 

(P-f.s. und in L 1 (P)) 

folgt. Nun sieht man aber mit induktiver Anwendung der Superadditivität, 

G n = − Y 1 − Y 1 ◦ ϕ − · · · − Y 1 ◦ ϕ n−2 − Y 1 ◦ ϕ n−1 + Y n 

≥ 

≥ 

− Y 1 − Y 1 ◦ ϕ − · · · − Y 1 ◦ ϕ n−2 + Y n−1 

− Y 1 − Y 1 ◦ ϕ − · · · + Y n−2 

≥ · · · · · · 

≥ − Y 1 − Y 1 ◦ ϕ + Y 2 ≥ 0 ; 

andererseits überträgt sich die Superadditivität von (Y n ) n auf (G n ) n . Daher sind 

die Behauptungen bzgl (Y n ) n darauf zurückgeführt, die entsprechenden Konvergenzen 

für den positiven Prozeß (G n ) n zu zeigen. 

2) Wir zeigen weiter, daß man ohne Einschränkung 

Y n ≥ n (n ∈ N) 

annehmen kann: Wegen Y n+m + n + m ≥ Y n + n + (Y m + m) ◦ ϕ n ist mit 

(Y n ) n auch (Y n + n) n superadditiv. Konvergiert nun Yn+n 

n 

−→ γ ′ , so auch 

Y nn 

−→ γ := γ ′ − 1 .


3) Yn n 

−→ γ P-f.s.: Hierzu zeigen wir Y ≤ γ und Y ≥ γ , wobei wieder 

Y := lim sup 

n→∞ 

Y n 

n 

bzw. 

Y := lim inf 

n→∞ 

Y n 

n . 

Y ≤ γ P-f.s.: Für r ∈ N >2 definieren wir 

X r := min{ r , Y − 1 r } > 0 ; 

hierbei folgt die Ungleichung, da wegen 2) Y ≥ 1 ist. Nach 5.6 gilt ferner 

X r = X r ◦ ϕ , also Xn r := n−1 ∑ 

X r ◦ ϕ i = nX r ; hiermit hat man 

i=0 

V := sup 

n∈N 0 

( Y n − X r n ) − Y 0 = sup 

n∈N 0 

( Y n − nX r ) > 0 ; 

dabei ergibt sich die zuletzt notierte Ungleichung aus der Definition von X r : 

wäre nämlich Y n ≤ nX r für alle n ∈ N 0 , so erhielte man den Widerspruch 

Y ≡ lim sup Yn nXr 

n 

≤ lim sup 

n = Xr < Y . Also folgt mit 5.5: 

X r 

= E ( X r | I ) ≤ sup 

n∈N 

Hieraus folgt durch r → ∞ aber: Y ≤ γ P-f.s. . 

E( Y n | I ) 

n 

≡ γ . 

Y ≥ γ P-f.s.: Zunächst ist (Y n ) n wegen der Superadditivität und der Positivität 

monoton wachsend; daraus schließt man: 

k Y n+k−1 

≥ 

n−1 

∑ 

(Y j+k − Y j ) (k, n ∈ N) ; 

j=0 

hiermit erhält man für jedes k ∈ N : 

Y = lim inf 

n→∞ 

= lim inf 

n→∞ 

= 1 k 

≥ 

≥ 

1 k 

1 k 

lim inf 

n→∞ 

lim inf 

n→∞ 

lim inf 

n→∞ 

Y n+k−1 

n + k − 1 

Y n+k−1 

n 

k Y n+k−1 

n 

n−1 

∑ Y j+k − Y j 

n 

j=0 

n−1 

∑ 

j=0 

Y k ◦ ϕ j 

n 

(vorangehende Bem.) 

(Superadditivität) 

also auch Y ≥ γ. 

= 1 k E( Y k | J ) (Birkhoff 4.1)


4) γ integrierbar ⇔ sup 

n∈N 

1 

n E(Y n) < ∞ : Hierzu sei Z n := Yn n 

. Aus dem Bisherigen 

folgt: Z n → γ P-f.s. und Eγ ≥ EZ n ; daher ist ” 

⇒“ gezeigt. ” 

⇐“ folgt mit 

monotoner Konvergenz. 

5) Ist γ integrierbar, so gilt : Z n ≡ Yn n → γ in L1 (P) . Wegen 0 ≤ (γ−Z n ) + ≤ γ 

gilt zum einen 

E ( (γ − Z n ) + ) → 0 ; 

andererseits gilt auch 

wegen Fatou, sodaß auch folgt: 

0 ≤ E( γ − Z n ) → 0 

E ( (γ − Z n ) − ) = −E( γ − Z n ) + E ( (γ − Z n ) + ) → 0 , 

und somit insgesamt 

E ( | γ − Z n | ) → 0 . 

6) Existenz von ˜Ω ∈ I mit ˜Ω ⊂ ϕ −1 ˜Ω , P(˜Ω) = 1 und 

Y nn 

→ γ auf ˜Ω : 

Wegen 5.6 sind Y und Y invariant. Deshalb ist auch 

˜Ω := { Y = Y } 

invariant; die restlichen Eigenschaften folgen aus dem bisher Gezeigten. 

□

6. Der Satz von Furstenberg-Kesten 

Sei (Ω, F , P) ein Wahrscheinlichkeitsraum mit einer maßtreuen Abbildung ϕ : Ω → Ω 

und A : Ω → R d×d eine zufällige Matrix. Wir untersuchen nun die Asymptotik von 

A n (ω) := ( A ◦ ϕ n−1 (ω) ) ( A ◦ ϕ n−2 (ω) ) · · · (A ◦ ϕ(ω)) ( A(ω) ) (ω ∈ Ω) . (2) 

Beispiel 6.1 (deterministische, symmetrische Matrix). Sei A ∈ R d×d symmetrisch. 

Dann existiert eine Diagonalisierung von A mit reellen (da A symmetrisch) Eigenwerten 

δ 1 ≥ · · · ≥ δ d ; es existiert also eine orthogonale Matrix O, sodaß 

A = O ∗ DO mit D := 

⎛ 

⎜ 

⎝ 

⎞ 

δ 1 0 

. .. 

⎟ 

⎠ 

0 δ d 

gilt. Hierbei gelte δ 1 > · · · > δ d , d.h. die zu δ i gehörigen Eigenräume E i seien eindimensional. 

Ferner sei x i ein Einheitsvektor in E i und 

{ 

E j ⊕ E j+1 ⊕ · · · ⊕ E d , j = 1, . . . , d 

V j = 

{0} , j = d + 1 . 

Sei hiermit x ∈ V j \ V j+1 . Dann schreibt sich x als 

x = 

d∑ 

α k x k mit α j ≠ 0 . 

k=j 

Somit gilt wegen der Linearität von A, da die x k Eigenvektoren sind: 

A n x = 

d∑ 

α k A n x k = 

k=j 

d∑ 

α k δk n x k , 

k=j 

also 

∣ ∣∣∣∣∣ 

1 

n log |An x| = 1 d∑ 

n log α k δk n x k 

k=j ∣ 

⎡ 

∣⎤ 

= 1 ⎣log δj 

n d∑ 

( ) n ∣∣∣∣∣ 

+ log 

δk 

n 

α k x k 

⎦ 

∣ δ j 

k=j 

n→∞ −−−−→ log δ j . 

Hiervon gilt auch die Umkehrung, also insgesamt: 

1 

x ∈ V j \ V j+1 ⇐⇒ lim 

n→∞ n log ‖An x‖ = log δ j (j = 1, . . . , d) . 

Wir verfolgen nun das Ziel, diese Aussage für (A n ) n analog auch für die Folge (A n ) n 

aus (2) zu zeigen.

Der Satz von Furstenberg-Kesten 33 

Definition-Bemerkung 6.2 (Singulärwertzerlegung). Jedes A ∈ R d×d besitzt eine 

Singulärwertzerlegung, d.h. es gibt orthogonale Matrizen U, V und eine Diagonalmatrix 

⎛ 

⎞ 

δ 1 0 

⎜ 

D = ⎝ 

. .. 

⎟ 

⎠ 

0 δ d 

mit δ 1 ≥ · · · ≥ δ d , sodaß gilt 

A = V DU . 

Dabei sind δ 1 , . . . , δ d die Eigenwerte von (A ∗ A) 1/2 und für die Operatornorm gilt: ‖A‖ = δ 1 . 

Beweis. A hat zunächst eine polare Zerlegung, d.h.: 

A = W (A ∗ A) 1/2 mit einer orthogonalen Matrix W . 

(Im Fall, daß A nicht-singulär ist, folgt dies mit W := A(A ∗ A) −1/2 ). Sei nun 

D := diag (δ 1 , . . . , δ d ) die Diagonalmatrix mit den Eigenwerten δ 1 ≥ · · · ≥ δ d 

von (A ∗ A) 1/2 , so schreibt sich die positiv-semidefinite Martix (A ∗ A) 1/2 als 

(A ∗ A) 1/2 = U ∗ DU 

mit einer orthogonalen Matrix U. Insgesamt gilt also mit V := W U ∗ gerade 

A = W (A ∗ A) 1/2 = W U ∗ DU = V DU . 

Bemerkung: Sind e 1 , . . . , e d die kanonischen Einheitsvektoren des R d , so ist Ue i der 

Vektor in Richtung der i-ten Hauptachse des Ellipsoids (A ∗ A) 1/2 (S d−1 ) und δ i gibt die 

Streckung in dieser Richtung an. 

Zur Konstruktion der Analoga von δ 1 , . . . , δ d in Beispiel 6.1 für die in (2) definierte Folge 

A n benötigen wir Information darüber, wie A n lineare Unterräume des R d transformiert: 

□ 

Definition 6.3 (Äußeres Produkt). Zu einem d-dimensionalen linearen Raum E sei 

L k (E ∗ ) := { k-linearen Multilinearformen auf (E ∗ ) k } (k = 1, . . . , d) . 

Hiermit definieren wir ∧ k E, das k-fache äußere Produkt von E, als 

∧ k E := { f ∈ L k (E ∗ ) : f alternierend } , 

also als die Gesamtheit aller k-linearen, alternierenden Multilinearformen auf (E ∗ ) k . 

Ein Element f ∈ ∧ k E ist also eine k-lineare Abbildung 

die alternierend ist, d.h.: 

f : E ∗ × · · · × E ∗ 

} {{ } 

k-mal 

−→ R , 

f( . . . , x i , . . . , x j , . . . ) = − f( . . . , x j , . . . , x i , . . . ) (i ≠ j) .

34 Der Satz von Furstenberg-Kesten 

Lemma 6.4 (Alternierende Abbildungen). Für ein f ∈ L k (E ∗ ) sind äquivalent: 

i) f ∈ ∧ k E 

ii) f(x 1 , . . . , x k ) = 0 , falls (x 1 , . . . , x k ) nicht paarweise verschieden 

iii) f(x 1 , . . . , x k ) = 0 , falls (x 1 , . . . , x k ) nicht paarweise linear unabhängig 

iv) f(x π(1) , . . . , x π(k) ) = sgn(π) f(x 1 , . . . , x k ) für alle π ∈ S k . 

Beweis. i)⇔iv) folgt durch die Darstellung π = τ 1 ◦ · · · ◦ τ k mit Zweierpermutationen 

τ i , also sgn(τ i ) = −1. 

i)⇒ii) Sind (x 1 , . . . , x k ) nicht paarweise verschieden, so folgt aus der Definition 

einer alternierenden Abbildung durch Vertauschen der gleichen 

Elemente: f(x 1 , . . . , x k ) = −f(x 1 , . . . , x k ) . 

ii)⇒iii) Es sei ohne Einschränkung x k = ∑ k−1 

i=1 α i x i . Dann folgt mit Linearität 

und ii): f(x 1 , . . . , x k ) = ∑ k−1 

i=1 α i f(x 1 , . . . , x k−1 , x i ) = 0 . 

iii)⇒ii) ist trivial. 

ii)⇒i) Es sei ohne Einschränkung k = 2 . Dann folgt für x 1 , x 2 ∈ E ∗ : 

0 ii) 

= f(x 1 + x 2 , x 1 + x 2 ) 

= f(x 1 , x 1 ) + f(x 1 , x 2 ) + f(x 2 , x 1 ) + f(x 2 , x 2 ) 

ii) 

= f(x 1 , x 2 ) + f(x 2 , x 1 ) , 

also f(x 1 , x 2 ) = −f(x 2 , x 1 ) . 

Definition-Bemerkung 6.5. Es seien f ∈ ∧ k E und g ∈ ∧ l E , wobei E wieder einen 

d-dimensionalen linearen Raum bezeichnet und k, l ∈ N 0 sind. Dann heißt 

f ∧ g ( x 1 , . . . , x k+l ) := 1 

k! l! 

∑ 

π∈S k+l 

sgn(π) f ( x π(1) , . . . , x π(k) 

) 

g 

( 

xπ(k+1) , . . . , x π(k+l) 

) 

das äußere Produkt von f und g und es gilt: f ∧ g ∈ ∧ k+l E . 

Beweis. Es ist f ∧ g ∈ L m (E ∗ ) mit m := k + l. Um zu sehen, daß f ∧ g auch 

alternierend ist, wird 6.4 iv) angewendet; zu beliebigen x 1 , . . . , x m ∈ E ∗ sei 

a(π) := 1 

k! l! f ( x π(1) , . . . , x π(k) 

) 

g 

( 

xπ(k+1) , . . . , x π(m) 

) 

Hiermit folgt: 

f ∧ g ( x π(1) , . . . , x π(m) ) = ∑ 

(π ∈ S m ) . 

sgn(π ′ ) a(π ′ ◦ π) 

π ′ ∈S m 

∑ 

= sgn(π) sgn(π ′ ◦ π) a(π ′ ◦ π) 

π ′ ∈S m 

∑ 

= sgn(π) sgn(σ) a(σ) 

σ∈S m 

≡ sgn(π) f ∧ g ( x 1 , . . . , x m ) . 

□ 

□


Lemma 6.6 (Assoziativität des äußeren Produktes). 

Es seien f ∈ ∧ k E , g ∈ ∧ l E und h ∈ ∧ m E mit k, l, m ∈ N 0 . Dann gilt: 

(f ∧ g) ∧ h = f ∧ (g ∧ h) . 

Beweis. Es sei n := k + l + m und T := { τ ∈ S n : τ(i) = i für i > k + l }; 

ferner sei zu beliebigen x 1 , . . . , x m ∈ E ∗ und π ∈ S m 

a(π) := f ( x π(1) , . . . , x π(k) 

) 

g 

( 

xπ(k+1) , . . . , x π(k+l) 

) 

h 

( 

xπ(k+l+1) , . . . , x π(n) 

) 

. 

Hiermit folgt durch zweimaliges Anwenden von 6.5: 

( 

(f ∧ g) ∧ h 

) 

( x1 , . . . , x n ) = 

= 

= 

= 

= 

1 

(k + l)! m! 

1 

k! l! m! 

1 

k! l! m! 

1 

k! l! m! 

∑ 

σ∈S n 

sgn(σ) 

1 

(k + l)! 

card(T) 

(k + l)! 

∑ 

∑ 

∑ 

1 

k! l! 

∑ 

sgn(τ) a(σ ◦ τ) 

τ∈T 

sgn(σ ◦ τ) a(σ ◦ τ) 

τ∈T σ∈S n 

∑ 

sgn(γ) a(γ) 

γ∈S n 

γ∈S n 

sgn(γ) a(γ) . 

Da man dieses Ergebnis aber auch erhält, wenn man (mit denselben Schritten) 

(f ∧ (g ∧ h))( x 1 , . . . , x n ) berechnet, ist die Behauptung gezeigt. □ 

Damit ist klar, daß Ausdrücke wie 

f 1 ∧ . . . ∧ f m 

mit f l ∈ ∧ k l 

E 

eindeutig bestimmt sind. Hierfür gilt: 

Lemma 6.7. Es seien f l ∈ ∧ k lE für l ∈ {1, . . . , m} . Dann gilt mit n := k 1 + · · · + k m 

f 1 ∧ . . . ∧ f m = 

∏ 

1≤l≤m 

1 

k l ! · 

∑ 

π∈S n 

sgn(π) f π , 

wobei f π mit i l := k 1 + · · · + k l−1 definiert ist als 

f π (x 1 , . . . , x n ) := f 1 

( 

xπ(1) , . . . , x π(i1 )) 

f2 

( 

xπ(i1 +1), . . . , x π(i2 )) 

· · · fm 

( 

xπ(im+1), . . . , x π(n) 

) 

. 

Beweis. Dies folgt mit vollständiger Induktion nach m. Der Fall l = 2 ist dabei 

gerade die Definition in 6.5; der Fall l = 3 ist im Beweis von 6.6 gezeigt. □


Lemma 6.8. Es sei e 1 , . . . , e d eine Basis von E ∗∗ ∼ = E und b 1 , . . . , b d sei hierzu die duale 

Basis von E ∗ . Dann gilt für alle f ∈ ∧ k E : 

f = 

∑ 

a i1 ... i k 

e i1 ∧ . . . ∧ e ik ⇐⇒ a i1 ... i k 

= f(b i1 , . . . , b ik ) für alle i 1 < · · · 

i 1


Beweis. Die rechte Seite h(u 1 , . . . , u k ; v 1 , . . . , v k ) := det ( 〈u i , v j 〉 ) 1≤i,j≤k ist 

bei festen v 1 , . . . , v k eine alternierende Multilinearform in u 1 , . . . , u k und umgekehrt, 

d.h. h( . ; v 1 , . . . , v k ) ∈ ∧ k E ∗ und h(u 1 , . . . , u k ; . ) ∈ ∧ k E ∗ . Bezeichnet 

e 1 , . . . , e d die zu b 1 , . . . , b d duale Basis von E und wendet man 6.8 zweimal an, 

so folgt also: 

h(u 1 , . . . , u k ; v 1 , . . . , v k ) 

∑ 

= h(e i1 , . . . , e ik ; v 1 , . . . , v k ) b i1 ∧ . . . ∧ b ik (u 1 , . . . , u k ) 

i 1


Definition-Bemerkung 6.12. Sei A ∈ R d×d . Dann wird wegen 6.9 durch 

∧ k A (u 1 ∧ . . . ∧ u k ) := Au 1 ∧ . . . ∧ Au k (u i ∈ R d ) 

ein linearer Operator ∧ k A : ∧ k R d 

Matrix A. Hierfür gilt: 

→ ∧ k R d definiert, das k-fache äussere Produkt der 

i) ∧ 1 A = A , 

ii) ∧ d A = det A (wegen 6.7), 

iii) ∧ k (AB) = (∧ k A)(∧ k B) , 

iv) (∧ k A) −1 = ∧ k A −1 falls A invertierbar, 

v) ∧ k (cA) = c k ∧ k A für c ∈ R , 

vi) ∧ k U orthogonal, falls U orthogonal und in diesem Fall gilt (∧ k U) ∗ = ∧ k U ∗ . 

Lemma 6.13 (Äußeres Produkt einer Matrix und Eigenwerte). Seien λ 1 , . . . , λ d 

die Eigenwerte von A ∈ R d×d . Dann hat ∧ k A die Eigenwerte 

{ λ i1 · · · λ ik : 1 ≤ i 1 < · · · 

Beweis. Sind u 1 , . . . , u d Eigenvektoren zu λ 1 , . . . , λ d und fixiert man Indizes 

1 ≤ i 1 < · · · 

∧ k A (u i1 ∧ . . . ∧ u ik ) ≡ Au i1 ∧ . . . ∧ Au ik 

= λ i1 u i1 ∧ . . . ∧ λ ik u ik 

= (λ i1 · · · λ ik ) (u i1 ∧ . . . ∧ u ik ) , 

sodaß λ i1 · · · λ ik ein Eigenwert zum Eigenvektor u i1 ∧ . . . ∧ u ik ist. Aus Dimensionsgründen 

müssen dies alle Eigenvektoren und damit alle Eigenwerte sein. □ 

Lemma 6.14 (Äußeres Produkt einer Matrix und Singulärzerlegung). 

Zu A ∈ R d×d seien δ 1 ≥ . . . ≥ δ d ≥ 0 die Singulärwerte und 

A = V DU 

eine Singulärwertzerlegung, wobei D ≡ diag(δ 1 , . . . , δ d ) ist. Dann gilt für k = 1, . . . , d: 

i) ∧ k A = (∧ k V )(∧ k D)(∧ k U) ist Singulärzerlegung von ∧ k A; 

ii) ∧ k D = diag ( δ i1 · · · δ ik : 1 ≤ i 1 < · · · 

Also ist δ 1 · · · δ k der größte bzw. δ d−k+1 · · · δ d der kleinste Singulärwert von ∧ k A. 

iii) Für die Operatornorm gilt: 

‖ ∧ k A‖ = δ 1 · · · δ k , | det A| = ‖ ∧ d A‖ = δ 1 · · · δ d und ‖ ∧ k A‖ ≤ ‖A‖ k . 

Beweis. i) und ii) folgen aus 6.12 und 6.13; iii) ergibt sich aus ii) und der 

Definition der Operatornorm ‖ · ‖ . 

□


Theorem 6.15 (Furstenberg-Kesten). Sei (Ω, F , P) ein Wahrscheinlichkeitsraum und 

hierauf A : Ω → R d×d eine zufällige Matrix, für die gilt 

Ferner sei wie in (2) 

log + ‖ A( . ) ‖ ∈ L 1 (P) . (3) 

A n := ( A ◦ ϕ n−1) ( A ◦ ϕ n−2) · · · (A ◦ ϕ) A 

mit einer ( P-)maßtreuen Abbildung ϕ : Ω → Ω . 

Dann existiert eine Menge ˜Ω ∈ F mit P(˜Ω) = 1 sowie ˜Ω ⊂ ϕ −1 (˜Ω) , und es existieren 

meßbare Funktionen 

γ (k) : Ω −→ R ∪ {−∞} (k = 1, . . . , d) 

mit γ (k)+ ∈ L 1 (P), sodaß für alle ω ∈ ˜Ω und k, m ∈ {1, . . . , d} gilt: 

Definiert man rekursiv Zufallsvariable 

durch 

mit 

γ (k) 1 

(ω) = lim 

n→∞ n log ‖ ∧k A n (ω)‖ , 

γ (k)( ϕ(ω) ) = γ (k) (ω) , 

γ (k+m) (ω) ≤ γ (k) (ω) + γ (m) (ω) . 

Λ k : Ω −→ R ∪ {−∞} (k = 1, . . . , d) 

Λ 1 + . . . + Λ k 

= γ (k) 

Λ k := −∞ auf { γ (k) = −∞ } , 

so gilt für alle ω ∈ ˜Ω und k ∈ {1, . . . , d}: 

1 

Λ k (ω) = lim 

n→∞ n log δ ( 

k An (ω) ) , 

( ) 

Λ k ϕ(ω) = Λk (ω) , 

Λ 1 (ω) ≥ Λ 2 (ω) ≥ . . . ≥ Λ d (ω) ( ≥ −∞ ) . 

Ist P ergodisch, so sind γ (k) und Λ k wegen obiger Invarianz konstant (auf ˜Ω), also 

γ (k) = E(γ (k) ) und Λ k = E(Λ k ). 

Beweis. 

1) Sei 

Y k n := log ‖ ∧ k A n ‖ (n ∈ N, k = 1, . . . , d) ; 

dann ist (Y k n ) n für jedes k = 1, . . . , d subadditiv: Im Falle k = 1 wurde dies in 

5.3 gezeigt; für k > 1 überträgt sich die dortige Rechnung sofort, da für alle 

Matrizen B, C gilt: ∧ k (BC) = (∧ k B)(∧ k C). Daher ist mit A auch jedes ∧ k A 

ein Kozykel, d.h. es gilt: 

∧ k A n+m = ∧ k A n ◦ ϕ m · ∧ k A m . 

Somit folgt also die Subadditivität von (Y k n ) n .


2) Die Existenz von ˜Ω und γ (k) mit den behaupteten Eigenschaften folgt aus 

Satz 5.7, angewandt auf (−Y k n ) n ; es bleibt lediglich zu zeigen: 

γ (k+m) ≤ γ (k) + γ (m) ; 

dies folgt aber direkt aus der charakterisierenden Eigenschaft der γ (k) und der 

Normungleichung 

‖ ∧ k+m A n ‖ ≤ ‖ ∧ k A n ‖ · ‖ ∧ m A n ‖ . 

3) Wir zeigen nun die Behauptungen bzgl. Λ k : Nach 6.14 gilt für k = 1, . . . , d: 

1 

n log ‖ ∧k A n ‖ = 1 n 

k∑ 

log δ i (A n ). 

Es ist Λ 1 ≡ γ (1) und für ω ∈ ˜Ω erhält man daraus sukzessiv: 

Λ k+1 (ω) ≡ γ k+1 (ω) − γ k (ω) = 

i=1 

1 

lim 

n→∞ n log δ k+1(A n ) , 

falls γ k (ω) > ∞ ist; bricht dieses Verfahren ab, d.h. ist γ k 0 

(ω) = −∞, so ist 

auch γ k (ω) = −∞ für alle k ≥ k 0 und damit auch Λ k = −∞ für alle k ≥ k 0 . 

Die restlichen Aussagen gelten wegen 

δ 1 (A n ) ≥ δ 2 (A n ) ≥ . . . ≥ δ d (A n ) 

und die jeweiligen Erwartungswerte existieren nach Voraussetzung. 

□

7. Der Multiplikative Ergodensatz von Oseledets 

Sei (Ω, F , P) ein Wahrscheinlichkeitsraum mit einer maßtreuen Abbildung ϕ : Ω → Ω 

und A : Ω → R d×d eine zufällige Matrix. In Übereinstimmung mit (2) definieren wir 

A n := 

{ ( 

A ◦ ϕ 

n−1 ) ( A ◦ ϕ n−2) · · · (A ◦ ϕ) A , n ∈ N , 

I , n = 0 , 

den von A erzeugten Kozykel; A n ist also Kozykel über ϕ , d.h.es gilt: 

A n+m = (A n ◦ ϕ m ) · A m (m, n ∈ N 0 ) , 

was ja bereits im Beweis des Satzes von Furstenberg-Kesten benutzt worden war. 

Wir interessieren uns nun für die Asymptotik von |A n x| zu x ∈ R d bei n → ∞. Dies 

führen wir auf den Satz von Furstenberg-Kesten zurück mit Hilfe des folgenden (deterministischen) 

Satzes 7.3. Um die darin enthaltenen Konvergenzaussagen beweisen zu können 

zeigen wir zunächst zwei Lemmata: 

Lemma 7.1. Sei Φ ∈ R d×d 

symmetrisch mit spektraler Zerlegung 

Φ = 

r∑ 

λ i P i , 

i=1 

wobei r ≤ d ist und λ i die Eigenwerte sowie P i die zugehörigen orthogonalen Projektoren 

auf die Eigenräume bezeichnen. Seien 

Φ n = 

r n ∑ 

i=1 

λ n i P n 

i 

ebenfalls symmetrische d × d-Matrizen, sodaß gilt: 

i) λ n k 

ii) ¯P n 

i 

n→∞ 

−−−−→ λ i für alle k ∈ Σ i , wobei Σ i ≠ ∅ Mengen von Indizes sind (i=1,. . . , r); 

:= ∑ 

Dann folgt: Φ n 

k∈Σ i 

P n k 

n→∞ 

−−−−→ P i für alle i = 1, . . . , r . 

n→∞ 

−−−−→ Φ . 

Beweis. Mit den Konvergenzvoraussetzungen ergibt sich: 

Φ n − Φ = 

= 

r∑ ∑ 

r∑ 

λ n k P k n − λ i P i 

i=1 k∈Σ i i=1 

[ ] 

r∑ ∑ ( 

(λ n k − λ ∑ ) 

i) Pk 

n + λ i Pk n − P n→∞ 

i −−−−→ 0 . 

i=1 k∈Σ 

} 

i k∈Σ 

{{ } } 

i 

{{ } 

→0 

→0 

□

42 Der Multiplikative Ergodensatz (Oseledets) 

Lemma 7.2. Seien P, Q orthogonale Projektoren in R 2 , sodaß gilt: 

Dann folgt: 

dim U = dim V = 1 , wobei U := Im P und V := Im Q . 

δ(U, V ) := ‖P − Q‖ = |x ∧ y| = | sin α| (x ∈ U, y ∈ V mit |x| = |y| = 1) , 

wobei α den Winkel zwischen x und y bezeichnet. Folglich ist δ eine vollständige Metrik 

auf P 1 , dem proketiven Raum aller eindimensionalen Teilräume des R 2 . 

Beweis. Die zweite Gleichung wurde schon auf S. 37 gezeigt. 

‖P − Q‖ = |x ∧ y| : Wie auf S. 37 folgt weiter: 

( 〈x, x〉〈x, y〉 

|x ∧ y| = det 

〈y, x〉〈y, y〉 

) 1/2 

= √ 1 − 〈x, y〉 

√ 

2 

= 〈x, y〉 2 + 〈x, y ⊥ 〉 2 − 〈x, y〉 2 

= | 〈x, y ⊥ 〉 | 

= ‖ (I − Q) P ‖ 

= ‖ (P − Q) P ‖ ≤ ‖ P − Q ‖ , 

wobei noch die Idempotenz orthogonaler Projektoren benutzt wurde sowie die 

Tatsache ‖AB‖ = ‖BA‖ für orthogonale Projektoren A, B. 

Andererseits folgt für w ∈ R 2 : 

also 

| (P − Q)w | 2 = | (P − QP )w − (Q − QP )w | 2 

= | (I − Q)P w − Q(I − P )w | 2 

= | (I − Q)P w | 2 + | Q(I − P )w | 2 

≤ 

Insgesamt ist also gezeigt: 

‖ (I − Q)P ‖ 2 | P w | 2 + ‖ Q(I − P ) ‖ 

2 | (I − P )w | 2 

} {{ } 

‖ (I−Q)P ‖ 

= ‖ (I − Q)P ‖ 2 , 

‖ P − Q ‖ ≤ ‖ (I − Q)P ‖ . 

‖ P − Q ‖ = ‖ (I − Q)P ‖ = |x ∧ y| . 

Wie bereits angekündigt dient der folgende deterministische Satz dazu, den Satz von 

Furstenberg-Kesten anwenden zu können. 

□

Der Multiplikative Ergodensatz (Oseledets) 43 

Satz 7.3 (Goldsheid-Margulis). Sei (A n ) n∈N eine Folge in R d×d mit den Eigenschaften: 

lim sup 

n→∞ 

1 

n log ‖A n‖ ≤ 0 (4) 

und Φ n := A n · · · A 1 

erfülle 

für jedes i = 1, . . . , d . Dann gilt: 

1 

lim 

n→∞ n log ‖ ∧i Φ n ‖ =: γ (i) ∈ R ∪ {−∞} (5) 

i) Es existiert (in der Topologie der Operatornorm) der Limes 

Ψ := 

lim ( 

n→∞ Φ∗ n Φ n ) 1/2n ≥ 0 . 

Definiert man nun sukzessiv Λ i für i = 1, . . . , d durch Λ 1 + · · · + Λ i = γ (i) 

(falls γ (i) = −∞ ist, so setze Λ i = −∞), dann sind die Eigenwerte von Ψ gerade 

e Λ 1 

, . . . , e Λ d 

und es gilt 

ii) Seien 

1 

Λ i = lim 

n→∞ n log δ i(Φ n ) (i = 1, . . . , d) . 

e λp < · · · < e λ 1 

die verschiedenen (!) Eigenwerte von Ψ (wobei λ p = −∞ sein kann), U p , . . . , U 1 

seien die zugehörigen Eigenräume mit d i := dim U i und es sei 

{ 

{0} , i = p + 1 

V i := 

U p ⊕ · · · ⊕ U i , i = 1, . . . , p . 

Dann gilt: 

V p+1 ⊂ V p ⊂ V p−1 ⊂ · · · ⊂ V 1 = R d 

und für jedes x ∈ R d \ {0} existiert der Lyapunov-Exponent 

es gilt für alle i = 1, . . . , p : 

λ(x) := 

1 

lim 

n→∞ n log |Φ nx| ; 

x ∈ V i \ V i+1 

⇐⇒ λ(x) = λ i 

bzw. äquivalent hierzu: 

V i = { x ∈ R d : λ(x) ≤ λ i } .


Beweis. Im Fall d = 1 ist nichts zu zeigen, da dann Φ n ∈ R ist und die Aussagen 

direkt aus den Voraussetzungen folgen. 

Zur Vereinfachung wollen wir uns nun auf den Fall d = 2 beschränken; der 

allgemeine Fall läßt sich ähnlich beweisen, erfordert allerdings mehr Arbeit 

(siehe hierzu Arnold [AR 98] S.S.144-152). 

1 

Λ i = lim 

n→∞ n log δ i(Φ n ) für i = 1, 2 

Dies folgt aus (5) mit 6.14 iii): 

Λ 1 ≡ γ 1 (5) 1 

= lim 

n→∞ n log ‖Φ n‖ 6.14 1 

= lim 

n→∞ n log δ 1(Φ n ) ; 

falls nun Λ 1 = −∞ ist, also γ 1 = −∞, so ist wegen (5) auch γ 2 = −∞ = Λ 2 ; 

andererseits hat man in diesem Fall; 

Ist Λ 1 > −∞, so folgt: 

1 

n log δ 2(Φ n ) ≤ 1 n log δ 1(Φ n ) −→ −∞. 

Λ 2 ≡ γ 2 1 

− Λ 1 = lim 

n→∞ n log ‖ ∧2 Φ n ‖ 

} {{ } 

δ 1 (Φ n)δ 2 (Φ n) 

1 

= lim 

n→∞ n log δ 2(Φ n ) . 

1 

− lim 

n→∞ n log δ 1(Φ n ) 

Konvergenz der Operatoren und Lyapunov-Exponenten 

Sei nun 

Φ n = V n D n O n 

die Singulärzerlegung von Φ n , mit 

( ) 

δ1 (Φ 

D n = 

n ) 0 

0 δ 2 (Φ n ) 

. 

hiermit ergibt sich: 

(Φ ∗ n Φ n ) 1/2n = (O ∗ nD 2 nO n ) 1/2n = O ∗ nD 1/n 

n O n ; 

diese Matrix hat als Eigenwerte δ 1 (Φ n ) 1/n und δ 2 (Φ n ) 1/n , die gemäß dem oben 

gezeigten gegen e Λ 1 

und e Λ 2 

konvergieren; man hat also folgende Konvergenz: 

( 

) 

Dn 

1/n δ 1/n 

( ) 

≡ 

1 (Φ n ) 0 n→∞ e 

Λ 1 

0 

0 δ 1/n −−−−→ 

2 (Φ n ) 

0 e Λ . 

2 

Die Schwierigkeit besteht nun darin, daß die Konvergenz von O n im Allgemeinen 

nicht gewährleistet ist; es genügt jedoch, daß die jeweiligen Eigenräume 

konvergieren, wozu 7.1 gezeigt worden ist.


1. FALL: Λ 1 = Λ 2 =: λ 1 : Wie eben gesehen gilt also D 1/n 

n 

(Φ ∗ nΦ n ) 1/2n n→∞ 

−−−−→ e λ 1 

I 

→ e λ 1 

I und 7.1 liefert 

mit ¯P n 1 := P n 1 + P n 2 . Ferner gilt dann sofort: V 1 ≡ U 1 = R 2 , p = 1 und d 1 = 2 . 

Daher ist nur noch zu zeigen, daß für alle x ∈ R 2 \ {0} gilt: 

λ(x) ≡ 

1 

lim 

n→∞ n log ‖Φ nx‖ = λ 1 . 

Hierfür sei zunächst λ 1 > −∞; dann folgt aus der bereits bewiesenen Charakterisierung 

von Λ 1 , daß für jedes ɛ > 0 ein c ɛ ∈ (0, ∞) existiert, mit 

1 

c ɛ 

e n(λ 1−ɛ) ≤ δ i (Φ n ) ≤ c ɛ e n(λ 1+ɛ) , i = 1, 2. 

Setzt man noch x n := O n x, so folgt 

|Φx| = |V n D n O n x| = |D n x n | = ( δ 1 (Φ n ) 2 (x 1 n) 2 + δ 2 (Φ n ) 2 (x 2 n) 2) 1/2 

mit x i n den beiden Komponenten von x n ; insgesamt ist also 

|x| 

c ɛ 

e n(λ 1−ɛ) ≤ |Φ n x| ≤ |x|c ɛ e n(λ 1+ɛ) , 

weshalb folgt, daß λ(x) = λ 1 ist. 

Ist λ = −∞, so kann man ebenso für jedes r < 0 ein c r ∈ (0, ∞) finden mit 

Wie oben folgt dann: 

0 ≤ δ i (Φ n ) ≤ c r e nr , i = 1, 2 . 

0 ≤ |Φ n x| ≤ |x|c r e nr , 

woraus wie oben folgt: λ(x) = λ 1 . Somit ist der Satz im Fall Λ 1 = Λ 2 bewiesen. 

2. FALL: λ 1 ≡ Λ 1 > Λ 2 ≡ λ 2 : Hier gilt also 

D 1/n 

n 

≡ 

( 

δ 1/n 

1 (Φ n ) 0 

0 δ 1/n 

2 (Φ n ) 

) 

( 

n→∞ e 

λ 1 

0 

−−−−→ 

0 e λ 2 

Um hier die Existenz von Ψ zu beweisen, müssen wir zeigen, daß die Orthoprojektionen 

P n 1 , P n 2 auf die Eigenräume U n 1 , U n 2 von (Φ∗ nΦ n ) 1/2n gegen Orthoprojektionen 

P 1 , P 2 konvergieren, denn dann folgt wegen 7.1 gerade: 

(Φ ∗ n Φ n ) 1/2n n→∞ 

−−−−→ e λ 1 

P 1 + e λ 2 

P 2 =: Ψ . 

Dies wird mittels eines Cauchy-Argumentes im folgenden Lemma gezeigt. 

Hierfür bemerken wir, daß die Eigenvektoren von (Φ ∗ nΦ n ) 1/2n = OnD ∗ n 

1/n O n 

gerade gegeben sind durch u n i := One ∗ i (i = 1, 2), wobei (e 1 , e 2 ) die Standardbasis 

des R 2 bezeichnet. Insbesondere ist Ui n = span (u n i ) , i = 1, 2. 

) 

.


Lemma 7.4. In obiger Situation ( ” 

2. Fall“ im Beweis von Satz 7.3) gilt: 

lim sup 

n→∞ 

1 

n log δ( Ui n , Ui 

n+1 ) 

≤ λ2 − λ 1 < 0 (i = 1, 2). 

Insbesondere ist (Ui n) n∈N (i = 1, 2) eine Cauchy-Folge im projektiven Raum P 1 , konvergiert 

also gegen ein U i ∈ P 1 . Hierüber behaupten wir ferner, daß diese Konvergenz mit 

exponentieller Geschwindigkeit“ stattfindet: 

” 

lim sup 

n→∞ 

1 

n log δ( U n i , U i 

) 

≤ λ2 − λ 1 (i = 1, 2). 

Beweis von 7.4. Ohne Einschränkung sei hierbei i = 2, da U 1 (n) orthogonal 

zu U 2 (n) ist, aber die Metrik δ auf P 1 invariant gegen orthogonale Transformationen 

ist. 

Wegen der Orthogonalität aller (u n+1 

1 , u n+1 

2 ) kann man u n 2 darstellen als 

u n 2 = α n u n+1 

1 + β n u n+1 

2 (n ∈ N) . 

1) δ ( U2 n, U 2 

n+1 ) 

= |αn | , denn: 

δ ( U2 n , U2 

n+1 ) 7.2 

= |u n 2 ∧ u n+1 

2 | ≡ |(α n u n+1 

1 + β n u n+1 

2 ) ∧ u n+1 

2 | 

= |α n | |u n+1 

1 ∧ u n+1 

2 | 

= |α n | , 

wobei die Orthonormalität von u n 1 und un 2 

2) δ ( U n 2 , U n+1 

2 

benutzt wurde. 

) 

≤ ‖An+1 ‖ δ 2(Φ n) 

δ 1 (Φ n+1 ) 

, denn: Zunächst ist 

|Φ n+1 u n 2 | ≡ |α n Φ n+1 u n+1 

1 + β n Φ n+1 u n+1 

2 | 

≡ |α n V n+1 D n+1 O n+1 On+1e ∗ 1 + β n V n+1 D n+1 O n+1 On+1e ∗ 2 | 

andererseits ist 

insgesamt also 

= |α n δ 1 (Φ n+1 ) V n+1 e 1 + β n δ 2 (Φ n+1 ) V n+1 e 2 | 

orth. 

≥ |α n δ 1 (Φ n+1 ) V n+1 e 1 | 

= |α n | δ 1 (Φ n+1 ) ; 

|Φ n+1 u n 2 | ≡ |A n+1 Φ n u n 2 | ≤ ‖A n+1 ‖ |Φ n u n 2 | = ‖A n+1 ‖ δ 2 (Φ n ) , 

δ ( U2 n , U2 

n+1 ) 1) 

= |α n | ≤ |Φ n+1u n 2 | 

δ 1 (Φ n+1 ) ≤ ‖A n+1‖ δ 2(Φ n ) 

δ 1 (Φ n+1 ) .


3) Erste Behauptung des Lemmas: Mit dem eben gezeigten folgt: 

lim sup 

n→∞ 

1 

n log δ( U2 n , U2 

n+1 ) 1 

≤ lim sup 

n→∞ 

+ lim sup 

n→∞ 

− lim inf 

n→∞ 

≤ 0 + λ 2 − λ 1 , 

n log ‖A n+1‖ 

1 

n log δ 2(Φ n ) 

1 

n log δ 1(Φ n+1 ) 

wobei die erste Voraussetzung von Satz 7.3 und die bereits bewiesene Konvergenzaussage 

benutzt wurden. 

4) (U n 2 ) n konvergiert in P 1 gegen ein U 2 : Da δ eine vollständige Metrik ist, 

ist zu zeigen, daß (U n 2 ) n eine δ-Cauchy-Folge ist. Sei hierzu ε < λ 1 − λ 2 ; gemäß 

dem eben gezeigten kann man ein n 0 ∈ N wählen, daß 

1 

n log δ( U2 n , U2 

n+1 ) 

< λ2 − λ 1 + ε (< 0) (∀ n ≥ n 0 ) 

ist. Dann folgt aber für n 0 ≤ m ≤ n : 

δ ( n−1 

U2 n , U2 

n+1 ) ∑ 

≤ δ ( U2 k , U k+1 ) 

2 

k=m 

n−1 

∑ 

≤ e k(λ 2−λ 1 +ε) 

≤ 

k=m 

∞∑ 

k=m 

e k(λ 2−λ 1 +ε) 

= em(λ 2−λ 1 +ε) 

1 − e λ 2−λ 1 +ε 

m→∞ 

−−−−→ 0 , 

wobei die Summenformel für geometrische Reihen einging. 

5) Zweite Behauptung des Lemmas: Mit der eben benutzten Argumentation 

folgt auch: 

δ ( U n 2 , U 2 

) 

≤ e 

n(λ 2 −λ 1 +ε) 1 

1 − e λ 2−λ 1 +ε 

und daher 

lim sup 

n→∞ 

nun folgt die Behauptung mit ε → 0. 

1 

n log δ( U n 2 , U 2 

) 

≤ λ2 − λ 1 + ε ; 

□ 

Lem. 

7.4


Fortsetzung des Beweises von 7.3. Als Orthoprojektionen P 1 , P 2 wählen 

wir nun natürlich die Projektionen auf die gemäß 7.4 existierenden Räume 

U 1 , U 2 . Wegen 7.2 und 7.4 folgt die Konvergenz 

Insgesamt folgt also 

P n 

i 

n→∞ 

−−−−→ P i (i = 1, 2) . 

(Φ ∗ n Φ n ) 1/2n n→∞ 

−−−−→ e λ 1 

P 1 + e λ 2 

P 2 =: Ψ 

Es ist also nur noch die Behauptung über die Lyapunov-Exponenten nachzuweisen; 

hierbei ist V 2 = U 2 ⊂ R 2 = V 1 , sodaß nun noch zu zeigen ist: 

1 

x ∈ V 2 \ {0} =⇒ lim 

n→∞ 

x ∈ R 2 \ V 2 =⇒ lim 

n→∞ 

n log ‖Φ nx‖ = λ 2 

1 

n log ‖Φ nx‖ = λ 1 ; 

wobei jeweils oE |x| = 1 angenommen werden kann. 

x ∈ V 2 \ {0} ⇒ lim 1 n log |Φ nx| = λ 2 : Wir stellen x dar als 

und 

x = α n u n 1 + β n u n 2 , 

also wiederum 

und daher 

Φ n x = α n Φ n u n 1 + β n Φ n u n 2 = α n δ 1 (Φ n ) V n e 1 + β n δ 2 (Φ n ) V n e 2 , 

|β n | δ 2 (Φ n ) ≤ [ αn 2 δ 1 (Φ n ) 2 + βn 2 δ 2 (Φ n ) 2] 1/2 

= |Φn x| ; 

wie im Beweisteil 1) von 7.4 folgt aus 7.2: δ ( U2 n, U 2 

n+1 ) 

= |αn | , da x ∈ V 2 = U 2 

ist; also folgt wegen 7.4 auch: 

lim sup 

n→∞ 

1 

n log |α 1 

n| = lim sup 

n→∞ n log δ( U2 n ) 

, U 2 ≤ λ2 − λ 1 < 0 ; 

daher folgt: 

und somit insgesamt: 

β 2 n = 1 − α 2 n 

n→∞ 

−−−→ 1 . 

1 

λ 2 = lim 

n→∞ n log ( |β n| δ 2 (Φ n ) ) 

≤ 

= 1 2 

lim inf 

n→∞ 

lim sup 

n→∞ 

1 

n log |Φ nx| ≤ lim sup 

n→∞ 

1 

n log |Φ nx| 

1 

n log [ α 2 n δ 1 (Φ n ) 2 + β 2 n δ 2 (Φ n ) 2] 

1 

n log α2 n δ 1 (Φ n ) 2 , lim sup 

n→∞ 

≤ 1 {lim 

2 max sup 

n→∞ 

≤ max { (λ 2 − λ 1 ) + λ 1 , 0 + λ 2 } 

= λ 2 . 

} 

1 

n log β2 n δ 2 (Φ n ) 2


x ∈ R 2 \ V 2 ⇒ lim 1 n log |Φ nx| = λ 1 : Hier stellen wir x dar als 

x = αu + βv 

mit Einheitsvektoren u ∈ U 1 und v ∈ U 2 = V 2 ; diese schreiben wir als 

v = α n u n 1 + β n u n 2 bzw. u = γ n u n 1 + δ n u n 2 . 

Auch hier folgt aus 7.4 notwendig: α n → 0, δ n → 0 und somit |β n | → 1, |γ n | → 1 

(im projektiven Raum gilt ja wegen 7.4: u n 1 → u und un 2 → v). 

Damit gilt wie oben: 

|α| |γ n | δ 1 (Φ n ) ≤ [ (αγ n + βα n ) 2 δ 1 (Φ n ) 2 + (αδ n + ββ n ) 2 δ 2 (Φ n ) 2] 1/2 

= |Φ n x| ; 

beachtet man noch, daß aufgrund der Lage von x immer α = 〈x, u〉 ̸= 0 ist, so 

folgt insgesamt wiederum: 

1 

λ 1 = lim 

n→∞ n log ( |α| |γ n| δ 1 (Φ n ) ) 

≤ 

lim inf 

n→∞ 

= 1 2 

≤ λ 1 . 

lim sup 

n→∞ 

1 

n log |Φ nx| ≤ lim sup 

n→∞ 

1 

n log |Φ nx| 

1 

n log [ (αγ n + βα n ) 2 δ 1 (Φ n ) 2 + (αδ n + ββ n ) 2 δ 2 (Φ n ) 2] 

Somit sind alle Aussagen von 7.3 bewiesen. 

□ 

Um den Satz von Goldsheid-Margulis anwenden zu können, bleibt noch, die erste Voraussetzung 

im speziellen Fall stationärer zufälliger Matrizen nachzuprüfen: 

Lemma 7.5. Sei X : Ω → R ∪ {−∞} eine ZV mit X + ∈ L 1 (Ω, F , P). Dann ist 

{ 

} 

1 

Ω 1 := lim sup 

n→∞ n X ◦ ϕn−1 ≤ 0 

invariant und es ist P(Ω 1 ) = 1 . 

Beweis. Die Invarianz folgt aus der Definition von Ω 1 . Ferner trägt Ω 1 volles 

Maß hat, denn: 

∞∑ 

n=1 

{ } 

1 

P 

n X ◦ ϕn−1 > ε 

ϕ m.t. 

= 

also nach Borel-Cantelli: P(Ω 1 ) = 1 . 

≤ 

∞∑ 

P {X > εn} = 

n=1 

1 

ε E(X+ ) < ∞ , 

∞∑ 

P { X + > εn } 

Um den Hauptsatz zu erhalten wird 7.5 angewandt auf X := log ‖A‖ . Somit folgt: 

n=1 

□


Theorem 7.6 (Multiplikativer Ergodensatz, Oseledets). Sei A : Ω → R d×d eine 

zufällige Matrix auf (Ω, F , P, ϕ) und 

A n := 

{ ( 

A ◦ ϕ 

n−1 ) ( A ◦ ϕ n−2) · · · (A ◦ ϕ) A , n ∈ N , 

I , n = 0 , 

der hiervon erzeugte Kozykel auf R d . Es gelte 

log + ‖ A ‖ ∈ L 1 (Ω, F , P) . 

Dann existiert ˜Ω ∈ F mit ˜Ω ⊂ ϕ −1 (˜Ω) und P(˜Ω) = 1 , sodaß für jedes ω ∈ ˜Ω gilt: 

i) Es existiert 

ii) Sind 

Ψ(ω) := 

( 

lim A 

∗ 

n→∞ n (ω) A n (ω) ) 1/2n ≥ 0 

e λ p(ω)(ω) < · · · < e λ 1(ω) 

die verschiedenen Eigenwerte von Ψ(ω) (wobei λ p(ω) (ω) = −∞ sein kann), und 

U p(ω) (ω), . . . , U 1 (ω) die zugehörigen Eigenräume mit d i (ω) := dim U i (ω) , so gilt: 

( 

λi ◦ ϕ ) (ω) = λ i (ω) , 

( 

di ◦ ϕ ) (ω) = d i (ω) , und 1 ≤ i ≤ p i (ω) = ( p i ◦ ϕ ) (ω) . 

iii) Definiert man 

Dann gilt also 

V i (ω) := 

{ 

{0} , i = p(ω) + 1 

U p(ω) (ω) ⊕ · · · ⊕ U i (ω) , i = 1, . . . , p(ω) . 

V p(ω)+1 (ω) ⊂ V p(ω) (ω) ⊂ V p(ω)−1 (ω) ⊂ · · · ⊂ V 1 (ω) = R d 

und für jedes x ∈ R d \ {0} existiert 

es gilt für alle i = 1, . . . , p(ω) : 

bzw. äquivalent hierzu: 

λ(ω, x) := 

1 

lim 

n→∞ n log |A n(ω)x| ; 

x ∈ V i (ω) \ V i+1 (ω) ⇐⇒ λ(ω, x) = λ i (ω) 

V i (ω) = { x ∈ R d : λ(ω, x) ≤ λ i (ω) } . 

iv) Ist ϕ ergodisch, so sind p, λ i und d i auf ˜Ω konstant P-f.s..


Beweis. Aufgrund der Integrabilitätsvoraussetzung ist 7.5 anwendbar mit 

X := log ‖A‖ und liefert die invariante Menge 

{ 

} 

1 

˜Ω 1 := ω ∈ Ω : lim sup 

n→∞ n log ‖A(ϕn−1 ω)‖ ≤ 0 

vollen Masses. Wir wenden nun das deterministische MET 7.3 an auf 

A ω n := A(ϕ n−1 ω) und Φ ω n ≡ A ω n · · · A ω 1 

Kozykel 

= A n (ω) , 

wobei (4) nach Definition auf ˜Ω1 erfüllt ist und (5) wegen des Satzes von 

Furstenberg-Kesten 6.15 auf einer vorwärts invarianten Menge ˜Ω 2 vollen Maßes 

gilt; folglich ist 7.3 anwendbar für jedes ω ∈ ˜Ω 1 ∩ ˜Ω 2 =: ˜Ω, einer vorwärts invarianten 

Menge vollen Maßes, und liefert mit 6.15 die obigen Behauptungen □ 

Definition 7.7. Die Funktionen λ i aus dem Satz von Oseledets heißen die Lyapunov- 

Exponenten des linearen Kozykels (A n ) n∈N0 . 

Die Lyapunov-Exponenten sind also die Analoga zu den Eigenwerte einer Matrix, siehe 

6.1. Die Räume V i (für i = 1, . . . , p) sind allerdings nicht die Analoga der Eigenräume 

im Deterministischen. Dazu muß man die Theorie erweitern auf Zeitskala Z , siehe Arnold 

[AR 98] Theorem 3.4.11. .

Notationen 

R + {t ∈ R : t ≥ 0} 

N 0 N ∪ {0} 

s ± 

(±s) ∨ 0; Positiv- bzw. Negativteil einer reellen Zahl 

oder Funktion s 

≡ 

Gleichheit nach Definition 

| | Norm 

‖ ‖ 

Operatornorm 

M ∪ . N 

disjunkte Vereinigung von M und N 

B(X) 

Borel-σ-Algebra auf dem topologischen Raum X 

B n B(R n ) 

δ 1 (A) ≥ · · · ≥ δ d (A) 

∫ 

Singulärwerte von A ∈ R d×d 

E(f) 

f dP; Erwartungswert einer Funktion f nach dem 

Wahrscheinlichkeitsmaß P 

E(f|F ) 

bedingte Erwartung der ZV f unter F 

I 

σ-Algebra der meßbaren, invarianten Mengen 

σ(M ) 

von einer Familie M von Mengen bzw. Funktionen 

erzeugte σ-Algebra 

ZV 

oE 

Zufallsvariable 

ohne Einschränkung 

Literaturverzeichnis 

[AR 98] 

[G-M 89] 

L. Arnold. Random Dynamical Systems. Springer-Verlag, Berlin Heidelberg, 

1998. 

I.Y. Goldsheid & G.A. Margulis. Lyapunov Indices of a product of 

random matrices. Russian Mathematical Surveys, 44:11-71, 1989. 

[HM 74] P. Halmos. Measure Theory. Springer-Verlag, New York, 1974. 

[KB 97] 

[KI 68] 

[M-T 93] 

[OS 68] 

[Sh 95] 

O. Kallenberg. Foundations of Modern Probability. Springer-Verlag, 

New York, 1997. 

J.F.C. Kingman. The ergodic theory of subadditive stochastic processes. 

J. Royal Statist. Soc. Ser. B, 30:499-510, 1968. 

S. Meyn & R. Tweedie. Markov chains and stochastic stability . Springer, 

London, 1993. 

V.I. Oseledets. A multiplicative ergodic theorem. Lyapunov characteristic 

numbers for dynamical systems. Trans. Moscow Math. Soc., 19:197- 

231, 1968. 

A.N. Shiryaev. Probability. (second edition) GTM 95 Springer-Verlag, 

Berlin Heidelberg NewYork, 1995.

Index 

additive Kozykel-Eigenschaft 25 

äußeres Produkt 33 

Bernoulli-Shift 18, 21 

Ehrenfest-Modell von Diffusionen 8 

Ergodensatz (Birkhoff) 

22, 29, 30 

ergodisch 19 

Furstenberg-Kesten, Satz von 

39, 51 

invariant 

Maß 8 

Menge 19 

stationär 

Maß 8 

Prozeß 16 

Stoppzeit 5 

subadditive Folge von Zufallsvariablen 25 

subadditiver Ergodensatz (Kingman) 

28, 40 

transient 6 

Übergangswahrscheinlichkeit 1 

Weylscher Gleichverteilungssatz 24 

zufälliges dynamisches System: 

siehe: Kozykel 

Kingman, Satz von 

siehe: subadditiver Ergodensatz 

Konsistenzsatz von Kolmogorov 3 

Kozykel 39, 41 

additiver 25 

erzeugter 41 

Lyapunov-Exponent 51 

Lyapunov-Exponent 51 

Markovkette 3 

Markoveigenschaft 4 

starke 5 

maßtreue Abbildung 19 

Maximal-ergodisches Lemma (Hopf) 

22, 23 

Maximalungleichung 27, 30 

multiplikativer Ergodensatz (Oseledets) 

50 

deterministischer 43, 51 

rekurrent 6 

Riesz-Lemma 26, 27 

Rotation des Kreises 17, 20, 24 

Semiring 1 

Shift auf dem Pfadraum 4 

Singulärwertzerlegung 33 

starkes Gesetz der großen Zahlen 24

Stochastische Dynamik - Stochastik - Humboldt-Universität zu Berlin

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?