Zerlegungssätze

KAPITEL 6 

Zerlegungssätze 

In diesem letzten Abschnitt geht es um strukturelle Aspekte: Existenz, Charakterisierungen 

und Darstellungssätze. 

6.1. Symmetrie und Invarianz 

Ein bedeutsamer Schritt in der Geschichte der Geometrie war die Idee, ein 

Objekt durch seine Invarianzen zu beschreiben. Dies hatte Auswirkungen auf die 

gesamte moderne Mathematik und führt beispielsweise über die Frage, welche Symmetrien 

ein platonischer Körper hat, auf die Theorie endlicher Gruppen. Auch in 

der Stochastik spielen Symmetrie und Invarianz in verschiedenen Teilbereichen eine 

wichtige Rolle, beispielsweise in der mathematischen Statistik, insbesondere aber 

auch in der Ergodentheorie. 

Wir gehen von einem zunächst ganz allgemeinen messbaren Raum (⌦, A) aus 

und setzen 

WM(⌦, A) := P : P Wahrscheinlichkeitsmaß auf (⌦, A) . 

Weiter sei S eine Familie von messbaren Selbstabbildungen von ⌦, 

Inv(⌦, A, S) := P 2 WM(⌦, A) : P T = P für alle T 2 S 

bezeichne die Menge der unter allen T 2 S invarianten Wahrscheinlichkeitsmaße. 

O↵ensichtlich ändert sich diese Menge nicht, wenn man die identische Abbildung 

Id ⌦ zu S hinzunimmt. Ist P unter den Abbildungen T und S invariant, so auch 

unter S T ; man kann also annehmen, dass S eine Halbgruppe mit Einselement ist. 

Bei einem MDS sind wir von einer einzelnen Abbildung T ausgegangen, haben aber 

wiederholt die Invarianz unter Potenzen T k von T verwendet, also S = {T k : k 2 

N 0 }.MitS = {Id ⌦ } wird Inv(⌦, A, S) zuWM(⌦, A), und o↵ensichtlich hat man 

bei der Menge der invarianten Wahrscheinlichkeitsmaße eine Antitonie im letzten 

Argument S. 

Im Sinn der einleitenden Bemerkung stellen sich die Fragen, ob zu gegebenem 

Maßraum und gegebener Halbgruppe die Menge Inv(⌦, A, S) nichtleerist 

(Existenz), ob sie möglicherweise aus genau einem Element besteht (dies führt auf 

Charakterisierungen von Wahrscheinlichkeitsmaßen), oder generell, welche Struktur 

diese Menge hat. 

Beispiel 6.1. (a) Es seien ⌃ eine endliche Menge, A = P(⌃) und S die 

Menge aller bijektiven Selbstabbildungen (Permutationen) von ⌃. Dann besteht 

Inv(⌦, A, S) aus nur einem Wahrscheinlichkeitsmaß, der (diskreten) Gleichverteilung 

unif(⌃) auf ⌃. 

(b) Es seien ⌦ = [0, 1), A = B [0,1) und S die Menge aller Verschiebungen 

T a :[0, 1) ! [0, 1), x 7! x + a mod 1, 

77

78 6. ZERLEGUNGSSÄTZE 

a 2 [0, 1); wie in (a) ist S hier sogar eine Gruppe. Bereits aus den Grundvorlesungen 

zur Stochastik ist bekannt, dass Inv(⌦, A, S) wieder aus nur einem Element besteht, 

der Gleichverteilung unif(0, 1) auf dem Einheitsintervall. 

(c) Es seien ⌦ = N, A = P(N) undT (n) =n +1 für alle n 2 ⌦. Ein invariantes 

Wahrscheinlichkeitsmaß müsste allen Einpunktmengen dieselbe Wahrscheinlichkeit 

zuordnen. Bekanntlich geht dies nicht – es gibt keine gleichverteilten natürlichen 

Zahlen. Immerhin hat man mit dem Zählmaß P n2N n ein unendliches invariantes 

Maß. / 

Ausgangspunkt für strukturelle Überlegungen ist die einfache Beobachtung, 

dass Inv(⌦, A, S) eine konvexe Menge ist: Sind P und Q Wahrscheinlichkeitsmaße 

auf (⌦, A), so ist für jedes ↵ 2 [0, 1] auch die Mischung ↵P +(1 ↵)Q ein 

Wahrscheinlichkeitsmaß auf (⌦, A), d.h. WM(⌦, A) selbst ist konvex, und mit 

↵P +(1 ↵)Q T (A) = ↵P +(1 ↵)Q T 1 (A) 

= ↵P T 1 (A) +(1 ↵)Q T 1 (A) 

= ↵P (A)+(1 ↵)Q(A) 

= ↵P +(1 ↵)Q (A) für alle T 2 S, A2A, 

erhält man dies auch für die Teilmenge der unter S invarianten Wahrscheinlichkeitsmaße. 

Allgemein bezeichnet man ein Element x einer konvexen Menge M als 

Extremalpunkt dieser Menge, wenn es nicht als Konvexkombination zweier anderer 

Elemente von M dargestellt werden kann, wenn also aus x = ↵y +(1 ↵)z folgt, 

dass ↵ 2{0, 1} oder x = y = z gilt. Weiter nennt man M einen Simplex, wenn 

jedes x 2 M auf eindeutige Weise als Konvexkombination von Extremalpunkten 

von M dargestellt werden kann. 

Bei endlicher Grundmenge ⌃ lässt sich der Raum der Wahrscheinlichkeitsmaße 

mit der Menge der Wahrscheinlichkeitsvektoren q 2 R ⌃ +, P x2⌃ 

q(x) = 1, identifizieren. 

Diese ist o↵ensichtlich ein Simplex, wobei die Extremalpunkte die q’s sind, 

die zu den Einpunktmaßen x , x 2 ⌃, gehören. Mit d := #⌃ 1 spricht man dann 

auch vom d-dimensionalen Wahrscheinlichkeitssimplex; siehe auch Aufgabe 5.1 (b). 

In einem d-dimensionalen euklidischen Raum ist jeder Simplex die konvexe Hülle 

von höchstens d +1 Punkten. Ein einfaches Beispiel für eine kompakte, konvexe 

Menge, die kein Simplex ist, liefert die Einheitsvollkugel: Die Menge der Extremalpunkte 

ist die Einheitssphäre (der topologische Rand), jedes Element lässt sich 

als Konvexkombination von Extremalpunkten schreiben, aber diese Darstellung ist 

nicht für alle Punkte eindeutig. 

Bei überabzählbar vielen Extremalpunkten wird aus der Konvexkombination 

ein Integral. Hierzu benötigen wir auf der Grundmenge eine messbare Struktur: 

Auf WM(⌦, A) seiA WM die von den Abbildungen P 7! P (A), A 2A, erzeugte 

-Algebra. Jedes Wahrscheinlichkeitsmaß µ auf WM(⌦, A), A WM definiert dann 

durch 

Z 

P µ (A) := Q(A) µ(dQ) für alle A 2A 

ein Wahrscheinlichkeitsmaß auf (⌦, A). Wir setzen im folgenden voraus, dass A alle 

Einpunktmengen {x}, x 2 ⌦, enthält. Wie in der endlichen Situation besteht die 

Menge der Extremalpunkte aus den Einpunktmaßen, und als eindeutiges mischendes 

Maß µ zu einem Wahrscheinlichkeitsmaß P , also Lösung von P = P µ , ergibt

6.2. DIE ERGODISCHE ZERLEGUNG 79 

sich 

µ { x : x 2 A} = P (A). 

Insbesondere ist also WM(⌦, A) ein Simplex, und man kann das P darstellende 

Mischungsmaß als Bild von P unter der (messbaren) Abbildung x 7! x von ⌦ nach 

WM(⌦, A) interpretieren. 

6.2. Die ergodische Zerlegung 

Wir betrachten nun nicht alle Zutaten eines MDS als vorgegeben, sondern gehen 

von einem messbaren Raum (⌦, A) und einer messbaren Selbstabbildung T :⌦! ⌦ 

aus. Wir schreiben kurz Inv(T ) anstelle von Inv ⌦, A, {T k : k 2 N 0 } . 

Satz 6.2. Ein Wahrscheinlichkeitsmaß P auf (⌦, A) ist genau dann Extremalpunkt 

der konvexen Menge Inv(T ), wenn das System (⌦, A,P,T) ergodisch ist. 

Beweis. Angenommen, P ist invariant, aber nicht ergodisch. Dann existiert 

ein B 2Amit 0


Im Falle >0erhält man mit der Definition von B für die beiden Seiten der obigen 

Gleichheit der Integrale die Schranken 

Z 

Z 

fdP < , 

fdP , 

B\T 1 (B) c B c \T 1 (B) 

also einen Widerspruch. Aus = 0 folgt nun P B 4 T 1 (B) = 0, also die Quasiinvarianz 

von B. Da wir Ergodizität vorausgesetzt haben, folgt hieraus wiederum 

P (B) 2{0, 1} mit Satz 1.7. Für eine Wahrscheinlichkeitsdichte f bzgl. P ist 

P (f

6.2. DIE ERGODISCHE ZERLEGUNG 81 

Definition 6.4. Ein messbarer Raum (⌦, A) ist vom Borel-Typ, wenneseinen 

kompakten metrischen Raum (S, d) gibt mit 

⌦ 2B S , A = {B \ ⌦: B 2B S }. 

Hierbei bezeichnet B S die 

Spur von B S auf ⌦. 

-Algebra der Borel-Mengen von (S, d); A ist also die 

Diese Klasse enthält alle ‘handelsüblichen’ Räume. Bei solchen Räumen existieren 

auch reguläre Versionen von (nicht-elementaren) bedingten Wahrscheinlichkeiten. 

Wir erinnern an einen wichtigen Begri↵ aus der allgemeinen Stochastik: Sind 

(⌦, A) und(⌦ 0 , A 0 ) messbare Räume, so nennt man eine Abbildung Q :⌦⇥A 0 ! R 

eine Übergangswahrscheinlichkeit (oder einen Kern) von (⌦, A) nach (⌦ 0 , A 0 ), wenn 

gilt: 

- Für jedes A 0 2A 0 ist ! 7! Q(!, A 0 ) messbar bzgl. A. 

- Für jedes ! 2 ⌦istA 0 7! Q(!, A 0 ) ein Wahrscheinlichkeitsmaß auf (⌦ 0 , A 0 ). 

Mit der üblichen Identifikation von Wahrscheinlichkeitsmaßen und Wahrscheinlichkeitsmassenfunktionen 

entsprechen die in Abschnitt 4.3 eingeführten Übergangsmatrizen 

zu Markov-Ketten den Kernen von (⌃, P(⌃)) nach (⌃, P(⌃)). 

Es sei nun (⌦, A,P) ein Wahrscheinlichkeitsraum und F eine Unter- -Algebra 

von A; wirschreibenP F die Einschränkung von P auf F. Man nennt einen Kern 

Q von (⌦, F) nach (⌦, A) reguläre Version der bedingten Wahrscheinlichkeit von 

P unter F, wenn gilt: 

- Q(!, [!] F )=1für alle ! 2 ⌦. 

- P (A) = R Q(!, A) P F (d!) für alle A 2A. 

Mit einem solchen Q erhält man durch ! 7! R X(! 0 ) Q(!, d! 0 ) eine Version des 

bedingten Erwartungswertes E[X|F] von X unter F. 

Wir betrachten nun Beispiel 6.3 im Licht dieser neuen Begri↵e. O↵ensichtlich 

ist [!] I die Zerlegungsmenge B 2Z,die! enthält. Weiter ist 

(!, A) 7! unif([!] I ) (A) 

eine reguläre Version der bedingten Wahrscheinlichkeit von P unter I, undfür 

jedes ! 2 ⌦istQ(!, · )einunterT invariantes und darüberhinaus ergodisches 

Maß. Schließlich ergibt sich jedes invariante Maß als Mischung dieser ergodischen 

Maße, wobei die Mischung die Einschränkung von P auf I benutzt, und man kann 

die Integration von WM(⌦, A) auf (⌦, I) verlagern. 

Insgesamt sollten diese Überlegungen das folgende Resultat motivieren und 

verständlich machen. 

Satz 6.5. Es sei (⌦, A,P,T) ein MDS auf einem messbaren Raum (⌦, A) vom 

Borel-Typ, I bezeichne die -Algebra der invarianten Mengen. Dann existiert eine 

reguläre Version Q der bedingten Wahrscheinlichkeit von P unter I mit den 

folgenden Eigenschaften: 

(1) Für alle ! 2 ⌦ ist ⌦, A,Q(!, ·),T ein ergodisches MDS. 

(2) Es gilt 

Z 

P (A) = Q(!, A) P I (d!) für alle A 2A.


6.3. Austauschbare stochastische Prozzesse 

In diesem Abschnitt gehen wir aus von einem messbaren Raum (S, F) vom 

Borel-Typ und setzen ⌦ = S N0 , A = F ⌦N0 ; auch (⌦, A) ist dann von diesem 

Typ. Zunächst sei wieder T der Links-Shift. Dies ist die Basis der kanonischen 

Konstruktion für einen stochastischen Prozess X =(X n ) n2N0 mit Zustandsraum 

(S, F); siehe Abschnitt 4.1. Jedes Wahrscheinlichkeitsmaß Q auf (S, F) führt mit 

P = Q ⌦N0 auf ein ergodisches MDS (⌦, A,P,T), den Bernoulli-Shift zu Q. 

Aus den Überlegungen des letzten Abschnitts folgt, dass jede Mischung von ergodischen 

Maßen auf ein invariantes Maß führt, und dass sogar, unter bestimmten 

technischen Bedingungen an den zugrundeliegenden messbaren Raum, alle invarianten 

Maße so erhalten werden können. Solche Mischungen lassen sich als zweistufige 

Experimente interpretieren: Zunächst wird P e zufällig und mit Verteilung µ aus 

der Menge der Extremalpunkte von Inv(⌦, A,T) ausgewählt, dann wird das Experiment 

zu P e ausgeführt. Wir betrachten einen interessanten Spezialfall etwas 

näher. 

Beispiel 6.6. Es sei S = {0, 1}, F = P({0, 1}) undP ✓ =Bin(1,✓), 0 apple ✓ apple 1. 

Mit µ = L(P ✓ )beiunif(0, 1)-verteiltem ✓ erhält man für alle n 2 N, i 0 ,...,i n 1 2 

{0, 1} mit k := i 0 + ···+ i n 1 

Z 

P (X 0 = i 0 ,...,X n 1 = i n 1 ) = P ✓ (X 0 = i 0 ,...,X n 1 = i n 1 )unif(0, 1)(d✓) 

= 

Z 1 

0 

✓ k (1 ✓) n k d✓ = 

1 

n +1 

Eine weitere einfache Rechnung zeigt, dass für alle n 2 N, i 0 ,...,i n 2{0, 1}, und 

wieder mit k := i 0 + ···+ i n 1 

8 

k +1 

>< 

n +2 , i n =1, 

P (X n = i n |X 0 = i 0 ,...,X n 1 = i n 1 ) = 

n k +1 

>: , i n =0, 

n +2 

gilt. Wir werden so auf die Pólya-Urne geführt: Zu Beginn enthält diese eine weiße 

und eine schwarze Kugel; zu jedem Zeitpunkt n 2 N 0 wird eine der dann insgesamt 

n + 2 Kugeln zufällig und gleichverteilt ausgewählt, entnommen, und zusammen 

mit einer weiteren Kugel derselben Farbe zurückgelegt. Dabei zeigt X n an, welche 

Farbe zum Zeitpunkt n gezogen wurde, beispielsweise mit X n =1für schwarz und 

X n =0für weiß. In der oben erwähnten Interpretation als zweistufiges Experiment 

würde man zunächst ✓ gemäß unif(0, 1) wählen, und dann den Münzwurf (unendlich 

oft) mit einer Münze durchführen, bei der die Wahrscheinlichkeit für ‘Kopf’ 

(X n = 1) den Wert ✓ hat. / 

Die Pólya-Urne liefert einen stationären, nicht-ergodischen stochastischen Prozess, 

bei dem die ergodische Zerlegung eine bemerkenswert einfache und explizite 

Form hat. Dies beruht wesentlich darauf, dass die Symmetrien dieses Objekts erheblich 

über die Halbgruppe der Verschiebungen hinausgehen. Wir schreiben G für 

die Menge aller bijektiven Abbildungen ⇡ : N 0 ! N 0 ,für die 

# i 2 I : ⇡(i) 6= i < 1 

1 

n 

k 

.

AUFGABEN 83 

gilt (nur endlich viele Argumente werden verändert). O↵ensichlich ist G eine unendliche 

(nicht-abelsche) Gruppe. Zu jedem ⇡ 2 G bezeichne T ⇡ : S N0 ! S N0 die 

Abbildung, die die Komponenten gemäß ⇡ permutiert, also (x n ) n2N0 auf (x ⇡(n) ) n2N0 

abbildet. Wir setzen S 1 = {T ⇡ : ⇡ 2 G}. 

Definition 6.7. Ein stochastischer Prozess X =(X n ) n2N0 mit Zustandsraum 

(S, F) heißt austauschbar (exchangeable), wenn die Verteilung von X als Wahrscheinlichkeitsmaß 

auf (S N0 , F ⌦N0 ) unter allen T 2 S 1 invariant ist. 

Man überprüft leicht, dass diese Eigenschaft die Stationarität von X im Sinne 

von Definition 4.1 impliziert, und dass der Prozess aus Beispiel 6.6 austauschbar ist; 

siehe auch Aufgabe 6.3. Unser Ziel in diesem Abschnitt ist ein Zerlegungssatz für 

Inv(S N0 , F ⌦N0 , S 1 ). Wir schreiben noch E für die -Algebra der austauschbaren 

Mengen, also der A 2F ⌦N0 mit der Eigenschaft, dass T 1 (A) =A gilt für alle 

T 2 S 1 . 

Satz 6.8. (de Finetti) Es sei X =(X n ) n2N0 ein austauschbarer stochastischer 

Prozess mit Zustandsraum (S, F), E bezeichne die -Algebra der austauschbaren 

Mengen. Dann existiert eine reguläre Version Q der bedingten Wahrscheinlichkeit 

von P unter E mit den folgenden Eigenschaften: 

(1) Für P -fast alle ! 2 ⌦ ist Q(!, ·) von der Form ⌫ ⌦N0 mit einem Wahrscheinlichkeitsmaß 

⌫ = ⌫([!] E ) auf (S, F). 

(2) Es gilt 

Z 

P (A) = Q(!, A) P E (d!) für alle A 2A. 

Unter dieser im Vergleich zur Stationarität stärkeren Symmetrieeigenschaft 

erhält man also eine Zerlegung, bei der die Einzelmaße zu unabhängigen Wiederholungen 

gehören. 

Aufgaben 

Aufgabe 6.1. Es seien (⌦, A) ein messbarer Raum und T :⌦! ⌦ eine messbare 

Abbildung. Die Wahrscheinlichkeitsmaße P 1 und P 2 seien beide ergodisch hierauf, 

und es gelte P 1 6= P 2.ZeigenSie,dassdieseMaßedannsingulär sind, also für 

i =1, 2 P i-Nullmengen N i existieren mit P 2(N 1)=P 1(N 2)=1. 

Aufgabe 6.2. (a) Es sei E⇢P(⌦) ein Mengensystem über ⌦ 6= ;. Mansagt,dass 

E die Punkte ! 1,! 2 2 ⌦ nicht trennt, wenn für alle E 2Eentweder {! 1,! 2}⇢E 

oder {! 1,! 2}⇢E c gilt. Zeigen Sie: Wenn E die Punkte ! 1 und ! 2 nicht trennt, 

so gilt dies auch für (E). 

(b) Zeigen Sie, dass im Falle F = 

[!] F = 

(E) 

\ 

E2E,!2E 

für die auf S. 80 definierten Atome gilt. 

E \ 

\ 

E2E,!/2E 

(c) Es sei A eine -Algebra über ⌦ mit einem abzählbarem Erzeugendensystem. 

Zeigen Sie, dass dann [!] A 2Agilt für alle ! 2 ⌦. 

Aufgabe 6.3. Es sei X =(X n) n2N0 ein stochastischer Prozess mit Zustandsraum 

(S, F). 

(a) Zeigen Sie, dass X genau dann austauschbar ist, wenn für alle n 2 N und 

alle Permutationen ⇡ von {0,...,n 1} die Zufallsvektoren (X 0,...,X n 1) und 

(X ⇡(0) ,...,X ⇡(n 1) ) dieselbe Verteilung haben. 

E c


(b) Zeigen Sie, dass der Prozess X aus Beispiel 6.6 austauschbar ist. 

(c) Es sei X austauschbar. Zeigen Sie, dass X dann auch stationär ist.

Literatur 

[1] Billingsley, P. Ergodic Theory and Information. Wiley, New York 1965. 

[2] Breiman, L. Probabililty. Addison-Wesley, Reading 1968. 

[3] Cornfeldt, I.P., Fomin, S.V. und Sinai, Ya.G. Ergodic Theory. Springer, New 

York 1982. 

[4] Denker, M. Einführung in die Analysis dynamischer Systeme. Springer, 

Berlin 2005. 

[5] Einsiedler, M. und Ward, Th. Ergodic Theory with a view towards Number 

Theory. Springer, London 2011. 

[6] Kallenberg, O. Foundations of Modern Probability. Springer, New York 1997. 

[7] Klenke, A. Wahrscheinlichkeitstheorie. Springer, Berlin 2006. 

[8] Walters, P. An Introduction to Ergodic Theory Springer, New York 1982. 

Stationäre Prozesse und Ergodentheorie tauchen als Einzelkapitel in den Lehrbüchern 

[2,6,7] (und in einigen anderen) auf, wobei [6] die größte Spannweite hat, 

aber auch sehr dicht geschrieben ist. 

Die Bücher [1,3,8] beschäftigen sich speziell mit Ergodentheorie, wobei unterschiedliche 

Schwerpunkte gesetzt werden, beispielsweise Isomorphie in [8]. Es gibt 

in diesem Bereich seit Jahrzehnten immer wieder Phasen mit bemerkenswerten 

Fortschritten; [5] dokumentiert aktuelle, viel beachtete Entwicklungen. In [4] wird 

das im vorliegenden Skript behandelte Material in einen größeren Zusammenhang 

gestellt. 

85

Zerlegungssätze

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?