13.07.2015 Aufrufe

Maß- und Wahrscheinlichkeitstheorie Teil 1

Maß- und Wahrscheinlichkeitstheorie Teil 1

Maß- und Wahrscheinlichkeitstheorie Teil 1

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

1<strong>Maß</strong>- <strong>und</strong> <strong>Wahrscheinlichkeitstheorie</strong><strong>Teil</strong> 1Karl GrillInstitut für Statistik <strong>und</strong> <strong>Wahrscheinlichkeitstheorie</strong>c○2012 Karl GrillUnter Creative Commons Attribution Sharealike Lizenz


Inhaltsverzeichnis1 Einleitung 32 Mengensysteme 53 <strong>Maß</strong>funktionen 123.1 Definition <strong>und</strong> Eigenschaften von <strong>Maß</strong>funktionen . . . . . . . . . 123.2 Der Fortsetzungssatz . . . . . . . . . . . . . . . . . . . . . . . . . 204 Lebesgue-Stieltjes <strong>Maß</strong>e 274.1 Eindimensionale Lebesgue-Stieltjes <strong>Maß</strong>e . . . . . . . . . . . . . . 274.2 Mehrdimensionale Lebesgue-Stieltjes <strong>Maß</strong>e . . . . . . . . . . . . 325 Messbare Funktionen 345.1 Reellwertige Funktionen . . . . . . . . . . . . . . . . . . . . . . . 355.2 Wahrscheinlichkeitsräume . . . . . . . . . . . . . . . . . . . . . . 385.3 <strong>Maß</strong>e <strong>und</strong> messbare Funktionen . . . . . . . . . . . . . . . . . . . 385.4 Konvergenz von messbaren Funktionen . . . . . . . . . . . . . . . 396 Das Integral 426.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 426.2 Grenzwertsätze . . . . . . . . . . . . . . . . . . . . . . . . . . . . 456.3 Riemann-Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . 476.4 Erwartungswerte . . . . . . . . . . . . . . . . . . . . . . . . . . . 507 Signierte <strong>Maß</strong>e 597.1 Signierte <strong>Maß</strong>e auf R . . . . . . . . . . . . . . . . . . . . . . . . . 638 Der Satz von Radon-Nikodym 648.1 In den reellen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . 689 Integralungleichungen <strong>und</strong> L p -Räume 692


Kapitel 1EinleitungFor he, by Geometrick scale,Could take the Size of Pots of AleSamuel ButlerAngesichts der Jahreszeit (Oktober) ist es wohl natürlich, daß man beimWort“<strong>Maß</strong>”zuerstandie<strong>Maß</strong>denkt.BeinähererBetrachtungstelltsichheraus,dass man damit nicht allzu weit vom Thema abkommt — schließlich kommtbeides von “messen”. Außerdem sind wir nicht in schlechter Gesellschaft —kein geringerer als Hilbert hat ja gesagt, dass man genausogut mit Tischen,Stühlen <strong>und</strong> Bierkrügen Mathematik treiben kann.Für uns Mathematiker ist die <strong>Maß</strong> (zumindest auf dem entsprechenden Abstraktionsniveau)einfach eine Punktmenge im Raum R 3 . Das <strong>Maß</strong>, im Alltageher Inhalt oder Volumen genannt, einer solchen Menge ist eine Zahl, dievernünftigerweise zumindest die folgenden Eigenschaften haben sollte:1. Nichtnegativität,2. Additivität: das <strong>Maß</strong> der Vereinigung zweier disjunkter Mengen ist dieSumme der <strong>Maß</strong>e der einzelnen Mengen,3. Bewegungsinvarianz: das <strong>Maß</strong> einer Menge ändert sich nicht, wenn mansie dreht oder verschiebt.Diese Forderungen sind in der elementaren Geometrie recht erfolgreich, <strong>und</strong> wirwerden sie als Ausgangspunkt für die Entwicklung der weiteren Theorie nehmen.Dabei finden wir zwei Schwierigkeiten: einerseits ist manchen “interessanten”Mengen mit diesen einfachen Regeln nicht eindeutig ein <strong>Maß</strong> zuzuordnen,andererseits (wenn man an das Auswahlaxiom glaubt) ist es unmöglich, allen<strong>Teil</strong>mengen des Raumes ein <strong>Maß</strong> zuzuordnen, denn es gilt der Satz von Banach<strong>und</strong> Tarski: Man kann eine Kugel in endlich viele disjunkte <strong>Teil</strong>mengen zerlegen,aus denen sich zwei Kopien der ursprünglichen Kugel zusammensetzen lassen.3


KAPITEL 1. EINLEITUNG 4Damit kann der Inhalt einer Kugel (wenn alle Mengen zum Messen zugelassensind) nur 0 sein, <strong>und</strong> das ist nicht, was wir wollen.Um also den Inhalt vernünftig zu definieren, müssen wir bei den Mengen,für die der Inhalt bestimmt werden kann, wählerisch sein. Wir werden den Inhaltalso nur auf einer <strong>Teil</strong>menge der Potenzmenge definieren. Auf die Bewegungsinvarianzwerden wir verzichten, damit wir nicht nur ein bestimmtes <strong>Maß</strong>bekommen, dafür wollen wir aber die Additivität erweitern <strong>und</strong> verlangen, dassdas <strong>Maß</strong> einer Vereinigung von abzählbar vielen Mengen gleich der Summe der<strong>Maß</strong>e der einzelnen Mengen ist.<strong>Maß</strong>e sind also Funktionen, die einzelnen Mengen (nichtnegative) Zahlenzuordnen. Beispiele sind natürlich die klassischen Inhalte aus der Analysis —Länge, Fläche, Volumen <strong>und</strong> ihre höherdimensionalen Verallgemeinerungen (allerdingswerden wir uns die Details des Beweises, dass es sich hier um <strong>Maß</strong>ehandelt, noch ein wenig aufheben), aber auch die Kardinalität (wobei wir unsdie Feinheiten der überabzählbaren Kardinalzahlen ersparen <strong>und</strong> unendlichenMengen das <strong>Maß</strong> ∞ zuordnen). Eine weitere wichtige Klasse von <strong>Maß</strong>en kommtausderWahrscheinlichkeitsrechnung:betrachtenwiretwadaszweitliebsteSpielzeugdes Probabilisten, den Würfel. Die möglichen Ausgänge (“Elementarereignisse”)sind die Zahlen von 1 bis 6, von denen man meistens annimmt, dasssie alle mit der gleichen Wahrscheinlichkeit angenommen werden. Ereignissewie “die Augenzahl ist gerade” kann man als Menge von Elementarereignissen,bei deren Auftreten dieses Ereignis eintritt, schreiben (in unserem Beispiel also{2,4,6}). Diesen Ereignissen werden nichtnegative Zahlen, ihre Wahrscheinlichkeiten,zugordnet. Wieder ist die Wahrscheinlichkeit der Vereinigung von zweidisjunkten Ereignissen die Summe der einzelnen Wahrscheinlichkeiten. Wir habenalso auch hier ein <strong>Maß</strong> mit der zusätzlichen Einschränkung, dass die Funktionswertehöchstens gleich 1 sein dürfen. Ein solches <strong>Maß</strong> heißt dann “Wahrscheinlichkeitsmaß”.


Kapitel 2Mengensysteme“Yes, indeed,” said theUnicorn,...“What can wemeasure?...We are experts in thetheory of measurement, not itspractice.”J.L. SyngeUnser erstes Interesse gilt dem Definitonsbereich unserer zukünftigen <strong>Maß</strong>funktionen.Wir haben bereits bemerkt, dass wir eine Menge von <strong>Teil</strong>mengeneiner bestimmten Menge dafür verwenden, <strong>und</strong> definieren gleich:Definition 2.1 Ω sei eine beliebige Menge. Eine <strong>Teil</strong>menge C der PotenzmengeP(Ω) heißt Mengensystem. Die Menge Ω wird auch als die Gr<strong>und</strong>menge desMengensystems bezeichnet.BeidenMengensystemen,diewirbetrachtenwollen, gibteszweiZiele:einerseitssoll eine <strong>Maß</strong>funktion für möglichst viele Mengen definiert sein, also wollen wirals Definitionsbereich ein möglichst reichhaltiges Mengensystem. Andererseitswollen wir nicht für jede einzelne Menge dieses großen Systems den Wert der<strong>Maß</strong>funktionangebenmüssen.UnserZielist,einvergleichsweiseüberschaubaresSystem zu finden, auf dem wir leicht ein <strong>Maß</strong> definieren können, <strong>und</strong> dannvon dort die Definition (möglichst eindeutig) auf ein umfangreicheres Systemfortzusetzen.Was soll also ein Mengensystem idealerweise können? Jedenfalls sollen alleeinfachen Mengenoperationen innerhalb des Systems ausführbar sein:Definition 2.2 Ein nichtleeres Mengensystem R (über der Menge Ω) heißtRing, wenn gilt: aus A,B ∈ R folgt1. A∪B ∈ R2. A\B ∈ R5


KAPITEL 2. MENGENSYSTEME 6Der Name “Ring” erklärt sich aus dem folgendenSatz 2.1 Für einen Ring R gilt:1. ∅ ∈ R,2. A,B ∈ R ⇒ A∩B ∈ R,3. A,B ∈ R ⇒ A△B ∈ R, <strong>und</strong> sogar4. Ein Ring R bildet mit der symmetrischen Differenz als Addition <strong>und</strong> demDurchschnitt als Multiplikation einen Ring (im Sinne der Algebra).Der Beweis erfolgt in den Übungen.Beispiele für Ringe:1. R = P(Ω),2. R = {A ⊆ Ω : A endlich}3. R = {∅,Ω}.Da wir für unsere <strong>Maß</strong>funktionen abzählbare Vereinigungen benötigen, habenwir nochDefinition 2.3 Ein Ring S heißt Sigmaring, wenn aus A n ∈ S für alle n ∈ Nfolgt, dass auch ⋃ n∈N A n ∈ S.Beispiele für Sigmaringe:1. R = P(Ω),2. R = {A ⊆ Ω : A höchstens abzählbar}3. R = {∅,Ω}.Von besonderer Bedeutung sind Ringe, die ihre Gr<strong>und</strong>menge enthalten:Definition 2.4 ein Ring (Sigmaring) R mit Ω ∈ R heißt Algebra (Sigmaalgebra).Für uns ist es wichtig, dass man aus jedem Mengensystem in eindeutigerWeise einen Ring (Sigmaring, Algebra, Sigmaalgebra) erhalten kann. Dazu beweisenwir zuerst:Satz 2.2 Der Durchschnitt einer beliebigen Familie von Ringen (Algebren, Sigmaringen,Sigmaalgebren) ist wieder ein Ring (...).Der Beweis ist einfach: Es sei (R i ,i ∈ I) die geforderte Familie von Ringen <strong>und</strong>R = ⋂ i∈IR iSind nun A,B ∈ R, dann gilt A,B ∈ R i für alle i ∈ I, <strong>und</strong> weil R i ein Ring ist,sind auch A\B <strong>und</strong> A∪B in R i für alle i ∈ I <strong>und</strong> somit auch im DurchschnittR.


KAPITEL 2. MENGENSYSTEME 7Satz 2.3 Zu jedem Mengensystem C gibt es einen kleinsten Ring R(C) (überderselben Gr<strong>und</strong>menge), der C umfasst. R(C) heißt der von C erzeugte Ring,<strong>und</strong> C heißt Erzeugendensystem für R(C).Wir greifen hier natürlich auf den vorhergehenden Satz zurück, <strong>und</strong> definierenR(C) als den Durchschnitt aller Ringe, die C umfassen (einen solchen Ring gibtes immer, nämlich die Potenzmenge, daher brauchen wir uns keine Sorgen zumachen, dass wir keine Mengen zum Schneiden haben), <strong>und</strong> wegen des vorigenSatzes ist dieser Durchschnitt ein Ring, umfasst C <strong>und</strong> ist aufgr<strong>und</strong> seinerDefinition in jedem anderen Ring, der C umfasst, enthalten.Ebenso wie der vorhergehende Satz gilt dieser Satz genauso für Algebren,Ringe <strong>und</strong> Sigmaringe, sowie für alle Mengensysteme, die durch die Abgeschlossenheitbezüglich gewisser Mengenoperationen definiert sind. In Hinkunft werdenwir A(C), R σ (C) bzw. A σ (C) für die von C erzeugte Algebra, Sigmaring bzw.Sigmaalgebra schreiben.Die folgenden Sätze zeigen, wie man aus jedem der Mengensysteme, die wirbis jetzt kennengelernt haben, neue Systeme vom selben Typ erhalten kann (wirformulieren <strong>und</strong> beweisen die Sätze für Ringe, aber sie gelten — mit analogenBeweisen — auch für Sigmaringe, Algebren <strong>und</strong> Sigmaalgebren):Satz 2.4 R 2 sei ein Ring über der Gr<strong>und</strong>menge Ω 2 <strong>und</strong> f : Ω 1 → Ω 2 eineAbbildung. Dann istf −1 (R) := {f −1 (A) : A ∈ R}ein Ring, <strong>und</strong> wird als Urbild von R bezüglich f bezeichnet.Zum Beweis seien A <strong>und</strong> B zwei Mengen aus f −1 (R). Dann gibt es MengenC <strong>und</strong> D aus R, sodass A = f −1 (C) <strong>und</strong> B = f −1 (D), <strong>und</strong>A∪B = f −1 (C)∪f −1 (D) = f −1 (C ∪D) ∈ f −1 (R),<strong>und</strong> ebenso folgert man A\B ∈ f −1 (R).Satz 2.5 Es sei R ein Ring über Ω <strong>und</strong> A ⊆ Ω. Dann istR∩A = {A∩B : B ∈ R},die Restriktion (oder Spur) von R auf A, ebenfalls ein Ring.Für den Beweis setzen wie im vorhergehenden Satz Ω 1 = A, Ω 2 = Ω <strong>und</strong> fgleich der Identität.Im Hinblick auf Satz ?? werden wir die komplizierteren Ringe <strong>und</strong> (ganzbesonders) Sigmaringe mit Hilfe eines geeigneten Erzeugendensystems angeben.Da es zu einem bestimmten Ring mehrere Erzeugendensysteme gibt, werden wirfür unsere Standard-Erzeugendensysteme ein wenig Struktur verlangen:Definition 2.5 Ein Mengensystem C heißt Semiring (im weitern Sinn), wenngilt:1. Falls A,B ∈ C, dann ist auch A∩B ∈ C.


KAPITEL 2. MENGENSYSTEME 82. Falls A ⊆ B ∈ C, dann gibt es endlich viele disjunkte Mengen C 1 ...C nin C, sodassn⋃B = A∪ C i .Kann man zusätzlich fordern:i=13. Für die Mengen C i aus Punkt 2 gilt für alle k ≤ n:A∪k⋃C i ∈ C,i=1dann heist C ein Semiring im engeren Sinn.Wir werden uns auf Semiringe im engeren Sinn beschränken <strong>und</strong> einfach nurvon “Semiringen” sprechen.Beispiele für Semiringe:1. T = {∅},2. T = {∅}∪{{x} : x ∈ Ω},3. Ω = R, T = {(a,b] : a ≤ b}.Der von dem Semiring in Punkt 3. erzeugte Sigmaring (der eigentlich eineSigmaalgebra ist), heißt die Sigmaalgebra der Borelmengen B <strong>und</strong> wird in dieserVorlesung eine zentrale Rolle spielen. Diese Sigmaalgebra ist ein sehr reichhaltigesSystem, sie enthält etwa alle offenen <strong>und</strong> abgeschlossenen Mengen, alleabzählbaren Durchschnitte von solchen Mengen, usw. (allerdings kann man zeigen,dass die Kardinalität von B gleich der von R ist). Diese Sigmaalgebra gibtes auch in mehr als einer Dimension:Definition 2.6 Es sei Ω = R d <strong>und</strong> T = {(a,b] : a,b ∈ R d ,a ≤ b}, wobeiwir die Ungleichung koordinatenweise verstehen, <strong>und</strong> (a,b] als den Hyperquader(a 1 ,b 1 ]×(a 2 ,b 2 ]×...×(a d ,b d ] definieren. Dann heißt die von T erzeugteSigmaalgebra B d die Sigmaalgebra der (d-dimensionalen) Borelmengen.Das System T in dieser Definition ist ein Semiring. Dies folgt aus dem folgendenallgemeinenSatz 2.6 Ω 1 <strong>und</strong> Ω 2 seien zwei Mengen, über denen jeweils ein Semiring T 1bzw. T 2 definiert seien. Dann istein Semiring über Ω 1 ×Ω 2 .T 1 ×T 2 := {A 1 ×A 2 : A 1 ∈ T 1 ,A 2 ∈ T 2 }Der Beweis wird in den Übungen geführt.Für den von einem Semiring erzeugten Ring gibt es eine relativ einfacheDarstellung, nämlich


KAPITEL 2. MENGENSYSTEME 9Satz 2.7 T sei ein Semiring. Dann gilt für den von T erzeugten Ringn⋃R(T) = { A i : A i ∈ T} =i=1n⋃{ A i : A i ∈ T, A i disjunkt}.i=1Offensichtlich sind beide Mengensysteme, die wir im obigen Satz definierthaben, in R(C) enthalten. Wir brauchen also nur noch zu zeigen, dass das zweiteSystem ein Ring ist. Es ist also für zwei Mengenn⋃A =<strong>und</strong>B =i=1A im⋃B j ,j=1wobei sowohl die A i als auch die B j disjunkt <strong>und</strong> aus dem Semiring sind, zuzeigen,dasssowohlihreVereinigungalsauchihreDifferenzwiedervonderselbenForm sind. Dabei können wir uns auf den Fall B ∈ T beschränken, weil wir jadie Vereinigung <strong>und</strong> die Differenz von A <strong>und</strong> B erhalten können, indem wir erstB 1 , dann B 2 ,...zu A hinzufügen bzw. von A abziehen. Aus der Definition desSemirings folgt, dassA i \B = A i \(A i ∩B) =mit disjunkten Mengen C ij ,j = 1...n i aus dem Semiring. Weil auch die A idisjunkt sind, istn⋃ ⋃n iA\B =i=1j=1die gesuchte Darstellung. Für die Vereinigung brauchen wir nur noch festzuhalten,dassA∪B = B ∪(A\B)ist.Für den erzeugten Sigmaring gibt es leider keine so schöne Darstellung wiefür den Ring, aber es gibt zumindest ein Resultat, dass gelegentlich die Argumentationein wenig leichter macht. Dazu definieren wir zuerst in Analogie zuden Grenzwerten von Zahlenfolgen:Definition 2.7 A 1 ,A 2 ,... sei eine nichtfallende Mengenfolge (d.h., für alle ngilt A n ⊆ A n+1 ), dann nennen wirC ijlimnA n = ⋃ n∈NA n⋃n ij=1C ij


KAPITEL 2. MENGENSYSTEME 10den Grenzwert der Folge A n . Analog soll der Grenzwert einer nichtsteigendenMengenfolge gleich dem Durchschnitt der Folge sein. Außerdem setzen wir⋃limsupA n = lim k =n nk≥nA ⋂ ⋃A kn<strong>und</strong>liminfA n = limn⋂k≥nA k = ⋃ nk≥n⋂A k .Anschaulich gesprochen ist der limes superior die Menge aller Punkte, die inunendlich vielen der Mengen A n enthalten sind, <strong>und</strong> der limes inferior ist dieMenge aller Punkte, die in fast allen A n enthalten sind.Mit diesem Rüstzeug kommen wir zuDefinition 2.8 Ein Mengensystem heißt monoton, wenn es gegenüber der Grenzwertbildungfür monotone Mengenfolgen abgeschlossen ist, also wenn für jedemonotone Mengenfolge A n aus diesem Mengensystem auch lim n A n im Mengensystementhalten ist.k≥nMan kann leicht zeigen (<strong>und</strong> tut es in den Übungen):Satz 2.8 Jeder monotone Ring ist ein Sigmaring.Es gilt aber ein noch schönerer Satz:Satz 2.9 (monotone class theorem) Der von einem Ring R erzeugte SigmaringS stimmt mit dem von diesem Ring erzeugten monotonen System Müberein.Zuerst sei bemerkt, dass die Anmerkung zu Satz ?? auch für monotoneSysteme gilt, <strong>und</strong> es also Sinn macht, vom erzeugten monotonen System zusprechen.Dann ist, weil ja jeder Sigmaring monoton ist, jedenfalls M in S enthalten,also bleibt noch die umgekehrte Inklusion zu zeigen. Dazu zeigen wir natürlich,dass M ein Sigmaring ist, <strong>und</strong> weil M ja monoton ist, können wir uns daraufbeschränken, die Ringeigenschaft von M zu beweisen. Es ist also zu beweisen,dassfürzweiMengenA<strong>und</strong>B ausMauchihreVereinigung<strong>und</strong>ihreDifferenzinMliegen.FürdiesenBeweisbemühenwirdas(invielenähnlichenFällengünstiganzuwendende) “Prinzip der guten Mengen”: wir definieren für jede Menge ausM das System der Mengen, die für A “gut” sind, also bei Vereinigung <strong>und</strong>Differenz nicht aus M herausführen:G(A) = {B ∈ M : A∪B,A\B,B \A ∈ M}.Wir haben diese Definition bewusst symmetrisch gestaltet, daher gilt:B ∈ G(A) ⇒ A ∈ G(B).


KAPITEL 2. MENGENSYSTEME 11Außerdem ist G(A) für jedes A ein monotones System, da für eine monotoneFolge B n ∈ G(A) giltA\limB n = lim(A\B n ),<strong>und</strong>A∪limB n = lim(A∪B n )(limB n )\A = lim(B n \A).,Nun beginnen wir mit einer Menge A aus dem Ring R. Für eine solche Mengeist offensichtlich jede Ringmenge in G(A) enthalten, also gilt R ⊆ G(A). DaG(A) monoton ist <strong>und</strong> R umfasst, ist G(A) = M. Für ein allgemeines A ∈ M<strong>und</strong> B ∈ R gilt, wie wir gerade gezeigt haben, A ∈ G(B), <strong>und</strong> daher B ∈ G(A),also ist auch in diesem Fall R ⊆ G(A) <strong>und</strong> schließlich G(A) = M. Wir habenalso gezeigt, dass für alle A <strong>und</strong> B in M B ∈ G(A) gilt, also dass A ∪ B <strong>und</strong>A\B in M liegen; also ist M wie behauptet ein Ring, <strong>und</strong> alles ist gut.Ähnlich wie das monotone System ist die folgende Definition von beweistechnischerBedeutung:Definition 2.9 Ein Mengensystem D über Ω heißt Dynkin-System, wenn1. Ω ∈ D,2. für disjunkte A n ∈ D,n ∈ N gilt ⋃ n A n ∈ D,3. für A,B ∈ D, A ⊆ B gile B \A ∈ D.Es gibt natürlich zu jedem Mengensystem C ein erzeugtes Dynkin-System,dass wir mit D(C) bezeichnen. Für uns wird die Bedeutung dieser Definitionhauptsächlich darin liegen, dass sie uns ein Übungsbeispiel zur Anwendung desPrinzips der guten Mengen liefert, denn es gilt:Satz 2.10 1. Ein Dynkin-Sytem, dass bezüglich der Durchschnittsbildung abgeschlossenist, ist eine Sigmaalgebra.2. Wenn C bezüglich der Durchschnittsbildung abgeschlossen ist, dann giltA σ (C) = D(C).


Kapitel 3<strong>Maß</strong>funktionenThey are giving you a numberand take away your name.Johnny Rivers, Secret Agent Man3.1 Definition <strong>und</strong> Eigenschaften von <strong>Maß</strong>funktionenMit den Mengensystemen des vorigen Kapitels sind die möglichen Definitionsbereichefür unsere <strong>Maß</strong>e festgelegt, <strong>und</strong> wir können darangehen, diese selbst zudefinieren. Dazu beginnen wir mitDefinition 3.1 C sei ein beliebiges Mengensystem <strong>und</strong> µ eine Abbildung von Cnach ¯R = R∪{−∞,∞} (eine solche Funktion werden wir in Hinkunft eine Mengenfunktionnennen). µ heißt additiv, wenn für disjunkte Mengen A 1 ,...,A n ausC mit A = ⋃ ni=1 A i ∈ C gilt, dassµ(A) =n∑µ(A i ).i=1µ⋃heißt sigmaadditiv, wenn für disjunkte Mengen A 1 ,...,A n ,... aus C mit A =n∈N A n ∈ C gilt, dassn∑µ(A) = µ(A n ).n∈NBei der obigen Definition muss man sicherstellen, dass die Summen einen Sinnhaben, dass also nicht eine unbestimmte Form ∞−∞ auftritt. bei der Sigmaadditivitätkann noch dazu der Fall auftreten, dass die Reihe auf der rechtenSeite bedingt konvergiert <strong>und</strong> durch umordnen jeden beliebigen Wert annehmenkann; auch dieser Fall muss ausgeschlossen werden. Diese Schwierigkeiten kann12


KAPITEL 3. MASSFUNKTIONEN 13man natürlich am leichtesten umgehen, indem man nur nichtnegative Funktionenbetrachtet:Definition 3.2 Eine Mengenfunktion µ auf dem Semiring C heißt <strong>Maß</strong>funktion(oder kurz “<strong>Maß</strong>”), wenn gilt:1. µ(A) ≥ 0 für alle A ∈ C <strong>und</strong>2. µ ist sigmaadditiv.Wird statt der Sigmaadditivität nur die endliche Additivität gefordert, dannheißt µ ein Inhalt.Beispiele:1. C = P(Ω), µ(A) = 0.2. C = P(Ω), x ∈ Ω beliebig,µ(A) = 1 A (x) =das Punktmass (oder Dirichlet-<strong>Maß</strong>) bei x.3. µ(A) = |A|, das Zählmaß.Wir definieren noch:{1 falls x ∈ A0 sonst,Definition 3.3 µ sei eine <strong>Maß</strong>funktion auf einem Semiring C.1. µ heißt endlich, wenn µ(A) < ∞ für jedes A ∈ C. Ist insbesondere Ω ∈ C<strong>und</strong> µ(Ω) = 1, dann heißt µ ein Wahrscheinlichkeitsmaß.2. µ heißt sigmaendlich, wenn es zu jedem A ∈ C eine Folge E n aus C gibt,sodass µ(E n ) für alle n endlich ist <strong>und</strong> A ⊆ ⋃ n E n.3. Ein endliches <strong>Maß</strong> mit µ(Ω) = 1 (dazu muss natürlich Ω ∈ C gelten) heißtWahrscheinlichkeitsmaß.Wir sind natürlich vor allem an <strong>Maß</strong>funtionen interessiert, die auf Sigmaringendefiniert sind, vor allem auch deshalb, weil dann die Vereinigung aus derDefinition der Sigmaadditivität automatisch im Mengensystem liegt. Um eine<strong>Maß</strong>funktion festzulegen, wollen wir aber lieber ein etwas weniger umfangreichesSystem benutzen, <strong>und</strong> Semiringe sind hier sehr praktisch, besonders wegen desfolgendenSatz 3.1 Eine Funktion µ auf einem Semiring T ist genau dann additiv, wennfür disjunkte A <strong>und</strong> B aus T mit A∪B ∈ T gilt, dass µ(A∪B) = µ(A)+µ(B).


KAPITEL 3. MASSFUNKTIONEN 14InBeweisdiesesSatzes(<strong>und</strong>nurhier)kommtnatürlichdieEigenschaft3.vonSemiringen (im engeren Sinn)zu Ehren. Den Beweis führen wir mit vollständigerInduktion.EsseialsodieBehauptungdesSatzesfüreinbestimmtesnwahr,<strong>und</strong>A 1 ,...,A n+1 disjunkte Mengen aus T, deren Vereinigung A = A 1 ∪...∪A n+1auch in T liegt. Wir setzen wie in der Definition des SemiringsA\A n+1 =m⋃j=1mit disjunkten C j ∈ T, <strong>und</strong> für alle k ≤ m istKlarerweise giltD k = A n+1 ∪D k−1 <strong>und</strong> C k sind disjunkt, also giltC jk⋃C j ∈ C.j=1D k = D k−1 ∪C k ,µ(D k ) = µ(D k−1 )+µ(C k ),<strong>und</strong> schließlichm∑m∑µ(A) = µ(D m ) = µ(D 0 )+ µ(C j ) = µ(A n+1 )+ µ(C j ).j=1Dasselbe Argument kann man auf die Mengen A i ∩ D k anwenden, <strong>und</strong> manerhältm∑µ(A i ) = µ(A i ∩C j ).Andererseits giltC j =j=1n⋃C j ∩A i ,i=1<strong>und</strong> aus der Induktionsvoraussetzung folgtµ(C j ) =j=1n∑µ(C j ∩A i ).Wir fassen zusammen:m∑m∑ n∑µ(A) = µ(A n+1 )+ µ(C j ) = µ(A n+1 )+ µ(A i ∩C j ) =µ(A n+1 )+n∑i=1 j=1i=1m∑µ(A i ∩C j ) = µ(A n+1 )+j=1 i=1j=1n∑n+1∑µ(A i ) = µ(A i ).i=1i=1


KAPITEL 3. MASSFUNKTIONEN 15Damit ist der Satz bewiesen, <strong>und</strong> wir sehen, dass wir mit unserer etwas komplizierterenDefinition des Semirings eine wesentliche Vereinfachung bei der Überprüfungder Additivität gewinnen.Wir beginnen nun mit einer <strong>Maß</strong>funktion auf einem Semiring <strong>und</strong> wollendaraus eine <strong>Maß</strong>funktion auf dem erzeugten Sigmaring gewinnen. Auf dem Wegzu diesem Ziel werden wir vorerst den erzeugten Ring betrachten:Satz 3.2 µ sei ein Inhalt auf dem Semiring T. Dann gilt1. µ lässt sich in eindeutiger Weise zu einem Inhalt auf dem von T erzeugtenRing R fortsetzen (wir werden diese Fortsetzung ebenfalls mit demBuchstaben µ bezeichnen).2. Falls µ ein <strong>Maß</strong> ist, dann ist auch die Fortsetzung auf den Ring ein <strong>Maß</strong>.Wir wissen, dass der von T erzeugte Ring die Menge aller disjunkten Vereinigungenvon Mengen aus dem Semiring ist. FallsA =n⋃i=1eine solche Darstellung von A ∈ R ist, dann muss geltenµ(A) =A in∑µ(A i ).i=1Dadurch ist µ auf R auch schon festgelegt, <strong>und</strong> es ist nur nachzuprüfen, dassdiese Forsetzung wohldefiniert <strong>und</strong> additiv bzw. sigmaadditiv ist.Für die Wohldefiniertheit seiA =m⋃j=1eine weitere Darstellung von A als Vereinigung von disjunkten Mengen aus T.Dann gilt wegen der Additivität von µ auf Tµ(A i ) =B jm∑µ(A i ∩B j )j=1<strong>und</strong><strong>und</strong> schließlichn∑µ(B j ) = µ(A i ∩B j ).i=1n∑ n∑ m∑µ(A i ) = µ(A i ∩B j ) =i=1 i=1 j=1


KAPITEL 3. MASSFUNKTIONEN 16m∑ n∑ m∑µ(A i ∩B j ) = µ(B j ).j=1 i=1j=1Für die Additivität brauchen wir nur festzustellen, dass, falls<strong>und</strong>zwei disjumkte Mengen sind, dannA = ⋃ A iB = ⋃ B jA∪B = ⋃ A i ∪ ⋃ B jschon eine Darstellung der Vereinigung durch disjunkte Mengen aus dem Semiringsind.Die Sigmaadditivität ist etwas schwieriger, aber inzwischen haben wir jaschon etwas Übung: zuerst stellen wir fest, dass eine abzählbare Vereinigungvon disjunkten Mengen aus dem Ring sich als abzählbare Vereinigung von Mengenaus dem Semiring schreiben lässt, indem wir jede der Mengen aus demRing durch eine endliche Vereinigung von Mengen aus dem Semiring ersetzen.Es bleibt also zu zeigen: wenn A n eine Folge von disjunkten Mengen aus demSemiring ist, deren Vereinigung B im Ring liegt, dann istµ(B) = ∑ nµ(A n ).Wir können B wieder als endliche Vereinigung von Mengen aus dem Semiringschreiben, <strong>und</strong> wegen der Sigmaadditivität von µ auf T gilt:µ(B) = ∑ µ(B j ) = ∑ ∑µ(B j ∩A n ) = ∑ ∑µ(B j ∩A n ) = ∑ µ(A n ).j j nnnBevor wir den nächsten Schritt, nämlich die Fortsetzung auf den Sigmaring,wagen, sammeln wir ein paar Eigenschaften von <strong>Maß</strong>en auf Semiringen. Fürdie Beweise können wir annehmen, dass der Definitionsbereich des <strong>Maß</strong>es einRing ist, weil wir ja wissen, dass wir das <strong>Maß</strong> immer auf den erzeugten Ringfortsetzen können.Satz 3.3 µ sei ein <strong>Maß</strong> auf dem Semiring T. Dann gilt:1. Falls A,B Mengen aus T sind mit A ⊆ B, dann giltµ(A) ≤ µ(B).2. Falls A <strong>und</strong> B n , n ∈ N Mengen aus T sind mit A ⊆ ⋃ B n , dann giltµ(A) ≤ ∑ n∈Nµ(B n ).j


KAPITEL 3. MASSFUNKTIONEN 17Der erste <strong>Teil</strong> ist einfach:Für den zweiten <strong>Teil</strong> setzen wirµ(B) = µ(A)+µ(B \A) ≥ µ(A).C n = A∩B n \ ⋃B k .k


KAPITEL 3. MASSFUNKTIONEN 18Den zweiten <strong>Teil</strong> können wir leicht aus dem ersten erhalten, wenn wir beachten,dasslimA n = A 1 \(lim(A 1 \A n )).Dieser Satz hat auch eine Umkehrung, für die wir allerdings annehmenmüssen, dass der Definitionsbereich ein Ring ist:Satz 3.5 µ sei eine nichtnegative additive Funktion auf einem Ring R. Danngilt:1. Falls für jede nichtfallende Mengenfolge A n gilt, dassdann ist µ ein <strong>Maß</strong>.µ(limA n ) = limµ(A n ),2. Falls µ endlich ist <strong>und</strong> für jede nichtsteigende Mengenfolge A n mit limA n =∅ gilt, dassµ(limA n ) = limµ(A n ),dann ist µ ein <strong>Maß</strong>.Wir müssen zeigen, dass für disjunkte Mengen A n aus R mitA = ⋃ n∈NA n ∈ Rgilt, dassµ(A) = ∑ µ(A n ).Im ersten Fall folgt das leicht aus der Tatsache, dass⋃A = limn<strong>und</strong> der Additivität von µ. Den zweiten Fall reduzieren wir (wie im Witz mitden Eiern) auf den ersten, indem wir feststellen, dass für eine nichtfallende FolgeA n die FolgeB n = (limkA k )\A neine nichtsteigende Folge mit Durchschnitt ∅ ist.Als nächstes betrachten wir die Vereinigung von zwei Mengen mit endlichem<strong>Maß</strong>, die nicht unbedingt leeren Durchschnitt haben müssen (wieder in einemRing):µ(A∪B) = µ(A∪(B \A)) = µ(A)+µ(B \A) =k≤nA kµ(A)+µ(B \(A∩B)) = µ(A)+µ(B)−µ(A∩B).Aus dieser Gleichung erhält man mittels vollständiger Induktion den folgenden


KAPITEL 3. MASSFUNKTIONEN 19Satz 3.6 (Additionstheorem) A 1 ,...,A n seien Mengen aus einem Ring miteiner <strong>Maß</strong>funktion µ, <strong>und</strong> µ(A i ) sei endlich für alle i = 1,...,n. Dann gilt:n⋃ ∑µ( A n =i=1 I⊆{1,...,n},I≠∅(−1) |I|−1 µ( ⋂ A i ) =i∈Iµ(A 1 )+...+µ(A n )−µ(A 1 ∩A 2 )−...µ(A n−1 ∩A n )+µ(A 1 ∩A 2 ∩A 3 )++−−...+(−1) n−1 µ(A 1 ∩...∩A n ).Zum Abschluss zeigen wir noch einen Satz für <strong>Maß</strong>e auf Sigmaringen, der unsspäter bei Fragen der Konvergenz immer wieder nützlich sein wird:Satz 3.7 (Lemma von Borel-Cantelli) µ sei eine <strong>Maß</strong>funktion auf dem SigmaringS. Falls die Mengen A n aus S die Beziehung∑µ(An ) < ∞erfüllen, dann giltµ(limsupA n ) = 0.Zum Beweis verwenden wir die Stetigkeit von µ:⋃µ(limsupA n ) = µ(lim A k ) = limµ( ⋃ ∑A k ) ≤ lim µ(A k ) = 0.n n nk≥nZu diesem Satz gibt es eine Umkehrung, für deren Formulierung wir uns einwenig näher mit Wahrscheinlichkeitsräumen auseinandersetzen müssen.Zuerst drehen wir ein wenig an der Notation. Um darauf hinzuweisen, dasswir es mit einem Wahrscheinlichkeitsmaß zu tun haben, verwenden wir statt µden Buchstaben P als Bezeichnung. Die Elemente des Sigmarings, auf dem Pdefiniert ist, nennen wir Ereignisse <strong>und</strong> definieren:Definition 3.4 A <strong>und</strong> B seien zwei Ereignisse mit P(B) > 0. Dann ist diebedingte Wahrscheinlichkeit von A unter (der Bedingung) Bk≥nP(A|B) = P(A∩B) .P(B)Ist die bedingte Wahrscheinlichkeit gleich der “unbedingten” P(A), dannheißt A unabhängig von B. Ausmultiplizieren der entsprechenden Gleichungergibt eine symmetrische Beziehung, in der wir auch die Bedingung P(B) > 0weglassen können:k≥nDefinition 3.5 Die Ereignisse A <strong>und</strong> B heißen unabhängig, wennP(A∩B) = P(A)P(B).Für mehr als zwei Ereignisse haben wir


KAPITEL 3. MASSFUNKTIONEN 20Definition 3.6 1. Die Ereignisse (A i ,i ∈ I) heißen (vollständig)unabhängig,wenn für alle J ⊆ I mit |J| < ∞P( ⋂ A i ) = ∏ i ).i∈J i∈JP(A2. Die Ereignisse (A i ,i ∈ I) heißen paarweise unabhängig, wenn für allei ≠ j ∈ IP(A i ∩A j ) = P(A i )P(A j ).Mit diesen Definitionen giltSatz 3.8 (Zweites Lemma von Borel-Cantelli) P sei ein Wahrscheinlichkeitsmaßauf der Sigmaalgebra S <strong>und</strong> (A n ∈ S,n ∈ N) unabhängig mit∑P(A n ) = ∞.Dann gilt P(limsup n A n ) = 1.Zum Beweis stellen wir fest, dassn1. die Familie (A i ,i ∈ I) genau dann unabhängig ist, wenn (A C i ,i ∈ I)unabhängig ist, <strong>und</strong>2. Aus der Stetigkeit von oben folgt, dass sich auch die Wahrscheinlichkeiteines abzählbaren Durchschnitts von unabhängigen Ereignissen als dasProdukt der einzelnen Wahrscheinlichkeiten schreiben lässt.Damit ergibt sichP(limsupA n ) = 1−P(liminfA C n) = 1− lim3.2 Der Fortsetzungssatzn→∞k=n∞∏(1−P(A k )) = 1−0 = 1.In diesem Abschnitt wollen wir zeigen, dass wir ein <strong>Maß</strong> auf einem Ring zueinem <strong>Maß</strong> auf dem erzeugten Sigmaring fortsetzen können. Die zentrale Ideeist eine Variation des Ausschöpfungsprinzips, das schon Archimedes verwendethat. Wir werden also eine Menge mit Mengen überdecken, deren <strong>Maß</strong> wirleicht bestimmen können, allerdings verwenden wir abzählbare Vereinigungenvon Mengen aus dem Ring:Definition 3.7 µ sei ein <strong>Maß</strong> auf dem Ring R. Für jede Menge A definierenwir das von µ erzeugte äußere <strong>Maß</strong> alsµ ∗ (A) = inf{ ∑ n∈Nµ(E n ) : E n ∈ R,A ⊆ ⋃ n∈Nµ(E n )}.Dabei setzen wir inf∅ = ∞, damit diese Definition für alle Mengen funktioniert.


KAPITEL 3. MASSFUNKTIONEN 21Das so definierte äußere <strong>Maß</strong> hat folgende Eigenschaften:Satz 3.9 1. µ ∗ (∅) = 0.2. Nichtnegativität: µ ∗ (A) ≥ 0.3. Monotonie: Falls A ⊆ B, dann gilt µ ∗ (A) ≤ µ ∗ (B).4. Sigmasubadditivität: Falls A ⊆ ⋃ n∈N B n, dann giltµ ∗ (A) ≤n∈Nµ ∑ ∗ (B n ).5. Falls A ∈ R, dann ist µ ∗ (A) = µ(A).Die ersten drei Eigenschaften sind offensichtlich; für die vierte genügt es denFall zu betrachten, dass die Reihe auf der rechten Seite endlich ist. Dann istjedes µ ∗ (B n ) endlich, <strong>und</strong> wir können für jedes ǫ > 0 Mengen E nk aus demRing finden, für die∑µ(E nk ) ≤ µ ∗ (B n )+ ǫ2 n<strong>und</strong>Dann gilt natürlichk∈NB n ⊆ ⋃ k∈NE nk .A ⊆ ⋃n,k∈NE nk<strong>und</strong> daher wegen Satz ??:µ ∗ (A) ≤n,k∈Nµ(E ∑nk ) ≤ ∑ (µ ∗ (B n )+ ǫ2 n) = ∑ µ ∗ (B n )+ǫ.n∈Nn∈NDa ǫ beliebig klein gewählt werden kann, ist die Behauptung bewiesen.Für die letzte Behauptung des Satzes stellen wir einerseits fest, dass ausSatz ?? folgt, dass für A ∈ Rµ ∗ (A) ≥ µ(A)sein muss, <strong>und</strong> andererseits erhalten wir aus der speziellen ÜberdeckungdassE 1 = A, E n = ∅, n > 1,µ ∗ (A) ≤ µ(A)ist.Manmussnichtnuräußere<strong>Maß</strong>funktionenbetrachten,dievon<strong>Maß</strong>fuktionenauf Ringen erzeugt werden. Dazu definieren wir:


KAPITEL 3. MASSFUNKTIONEN 22Definition 3.8 Jede Funktion µ ∗ die für alle A ⊆ Ω definiert ist <strong>und</strong> die Eigenschaften1. bis 4. von Satz ?? erfüllt, heist eine äußere <strong>Maß</strong>funktion.Die erzeugte äußere <strong>Maß</strong>funktion µ ∗ wird natürlich die gesuchte Fortsetzungdes <strong>Maß</strong>es µ sein. Leider ist eine äußere <strong>Maß</strong>funktion nur in Ausnahmefällen ein<strong>Maß</strong>. Die Lösung dieses Problems besteht darin, dass wir den Definitionsbereicheinschränken. Dazu definieren wir:Definition 3.9 (Messbarkeitskriterium von Caratheodory) Eine MengeA ⊆ Ω heißt messbar bezüglich der äußeren <strong>Maß</strong>funktion µ ∗ , wenn für jedesB ⊆ Ω gilt:µ ∗ (B) = µ ∗ (B ∩A)+µ ∗ (B \A).Wir sagen, dass A die Menge B messbar zerlegt.Wir bezeichnen mit M das System der messbaren Mengen <strong>und</strong> zeigen:Satz 3.10 M ist eine Sigmaalgebra, <strong>und</strong> µ ∗ ist ein <strong>Maß</strong> auf M. Falls darüberhinaus µ ∗ von dem <strong>Maß</strong> µ auf dem Ring R erzeugt wurde, dann gilt R ⊆ M.Wir stellen als erstes fest, dass wir für die Messbarkeit einer Menge A nurfeststellen müssen, dass für alle B ⊆ Ωµ ∗ (B) ≥ µ ∗ (B ∩A)+µ ∗ (B \A)gilt, weil die umgekehrte Ungleichung aus der Sigmasubadditivität folgt. Insbesonderesind alle Mengen mit µ ∗ (A) = 0 messbar. Insbesondere können wir unsauf Mengen B mit µ ∗ (B) < ∞ beschränken.Zuerst zeigen wir, dass M eine Algebra ist. Aus der Definition der Messbarkeitfolgt unmittelbar, dass für eine messbare Menge A auch ihr KomplementA C messbar ist. Wir brauchen also nur noch zu zeigen, dass etwa die Vereinigungvon zwei messbaren Mengen A 1 <strong>und</strong> A 2 wieder messbar ist. Wegen derMessbarkeit von A 1 gilt für jedes Bµ ∗ (B) = µ ∗ (B ∩A 1 )+µ ∗ (B \A 1 ),<strong>und</strong> wegen der Messbarkeit von A 2 gilt weiter<strong>und</strong>µ ∗ (B ∩A 1 ) = µ ∗ (B ∩A 1 ∩A 2 )+µ ∗ (B ∩A 1 ∩A C 2 )µ ∗ (B ∩A C 1 ) = µ ∗ (B ∩A C 1 ∩A 2 )+µ ∗ (B ∩A C 1 ∩A C 2 )(wir haben die Mengendifferenzen als Durchschnitt mit dem Komplement geschrieben,um uns Klammern zu ersparen).Wegen der Beziehungen<strong>und</strong>B ∩A C 1 ∩A C 2 = B \(A 1 ∪A 2 )(B ∩A 1 ∩A 2 )∪(B ∩A C 1 ∩A 2 )∪(B ∩A 1 ∩A C 2 ) = B ∩(A 1 ∪A 2 )


KAPITEL 3. MASSFUNKTIONEN 23erhalten wir aus der Sigmasubadditivitätµ ∗ (B ∩(A 1 ∪A 2 )) ≤ µ ∗ (B ∩A 1 ∩A 2 )+µ ∗ (B ∩A C 1 ∩A 2 )+µ ∗ (B ∩A 1 ∩A C 2 )<strong>und</strong> schließlichµ ∗ (B) = µ ∗ (B ∩A 1 )+µ ∗ (B \A 1 ) =µ ∗ (B ∩A 1 ∩A 2 )+µ ∗ (B ∩A 1 ∩A C 2 )+µ ∗ (B ∩A C 1 ∩A 2 )+µ ∗ (B ∩A C 1 ∩A C 2 ) ≥µ ∗ (B ∩(A 1 ∪A 2 ))+B \(A 1 ∪A 2 ).A 1 ∪A 2 ist also messbar.Als nächstes wollen wir zeigen, dass M eine Sigmaalgebra ist. Dazu zeigenwir die Abgeshlossenheit bezüglich einer Vereinigung von abzählbar vielen disjunktenMengen. Wir beginnen mit zwei disjunkten messbaren Mengen A 1 <strong>und</strong>A 2 <strong>und</strong> stellen als direkte Folgerung aus dem Messbarkeitskriterium fest, dassµ ∗ (B ∩(A 1 ∪A 2 ) = µ ∗ (B ∩A 1 )+µ ∗ (B ∩A 2 ).Durch vollständige Induktion erhalten wir daraus, dass für eine Folge A n vondisjunkten Mengen <strong>und</strong> jedes n > 0µ ∗ (B ∩n⋃A k ) =k=1n∑µ ∗ (B ∩A k )k=1gilt. Daraus erhalten wir unter Verwendung der Monotonie von µ ∗µ ∗ (B) = µ ∗ (B ∩n⋃A k )+µ ∗ (B \k=1n⋃ n∑Ak) ≥k=1µ ∗ (B ∩A k )+µ ∗ (B \ ⋃ A k ).k∈Nk=1Wir lassen jetzt n gegen Unendlich gehen <strong>und</strong> erhalten aus derµ ∗ (B) ≥ ∑ µ ∗ (B ∩A k )+µ ∗ (B \ ⋃ n⋃k ) ≥ µk∈Nk∈NA ∗ (B ∩ k )(B \k∈NA ⋃ A k ).k∈NEs ist also auch die Vereinigung von abzählbar vielen disjunkten messbarenMengen eine messbare Menge <strong>und</strong> somit M eine Sigmaalgebra.Wenn wir in dem obigen Beweis für B die Vereinigung der A n einsetzen,erhalten wir unmittelbar, dass auchµ ∗ ( ⋃ nA n ) = ∑ nµ ∗ (A n )gilt, also dass µ ∗ auf M ein <strong>Maß</strong> ist.Wir brauchen also nur noch zu zeigen, dass alle Mengen A aus dem RingR messbar sind, wenn µ ∗ von dem <strong>Maß</strong> µ auf R erzeugt wird. Dazu sei B einebeliebige <strong>Teil</strong>menge von Ω <strong>und</strong> E n eine Überdeckung von B durch Mengen aus


KAPITEL 3. MASSFUNKTIONEN 24dem Ring. Dann ist E n ∩ A eine Überdeckung von B ∩ A <strong>und</strong> E n \ A eineÜberdeckung von B \A <strong>und</strong> daherµ ∗ (B ∩A) ≤ ∑ nµ(E n ∩A)<strong>und</strong>µ ∗ (B \A) ≤ ∑ nµ(E n \A),<strong>und</strong> wenn wir diese beiden Ungleichungen addieren, erhalten wirµ ∗ (B ∩A)+µ ∗ (B \A) ≤ ∑ nµ(E n ).Weil diese ungleichung für alle Überdeckungen gilt, gilt sie auch, wenn wir rechtsdas Infimum über alle Überdeckungen einsetzen, <strong>und</strong> damit ist gezeigt, dass Amessbar ist.Aus diesem Satz erhalten wir unmittelbarSatz 3.11 (Fortsetzungssatz für <strong>Maß</strong>funktionen) µ sei ein <strong>Maß</strong> auf einemSemiring T. Dann kann man auf dem von T erzeugten Sigmaring ein <strong>Maß</strong>finden, dass aus T mit µ übereinstimmt.Wir haben im vorigen Abschnitt gesehen, dass µ auf den Ring fortgestzt werdenkann. Der vorige Satz zeigt, dass es eine Fortsetzung auf das System der messbarenMengen gibt, das eine Sigmaalgebra ist <strong>und</strong> den Ring umfasst, also auchden erzeugten Sigmaring. Die Einschränkung von µ ∗ auf den von T erzeugtenSigmaring ist also genau die gesuchte Fortsetzung.Es bleibt noch die Frage offen, ob diese Fortsetzung eindeutig bestimmt ist.Das ist nicht immer der Fall, wie das folgende Beispiel zeigt:Es sei Ω = R <strong>und</strong> T = {(a,b] : a ≤ b}. Der erzeugte Sigmaring ist das Systemder Borelmengen B. Wir definieren auf B zwei <strong>Maß</strong>funktionen:µ 1 (A) = |A|,{µ 2 (A) = 0 falls A = ∅,∞ sonst.µ 1 <strong>und</strong> µ 2 stimmen auf T überein, also ist die Fortsetzung der Einschränkungvon µ 1 auf T zu einer <strong>Maß</strong>funktion auf B nicht eindeutig bestimmt.Es gilt aberSatz 3.12 µ sei ein sigmaendliches <strong>Maß</strong> auf dem Ring R. Dann ist die Fortsetzungvon µ auf den von R erzeugten Sigmaring eindeutig bestimmt.Wir wollen zeigen, dass für jede Fortsetzung ˜µ von µ auf den Sigmaring ˜µ = µ ∗gilt.Da µ sigmaendlich ist, kann jede Menge A aus dem von R erzeugten Sigmaringdurch abzählbar viele Mengen E n ∈ R überdeckt werden (man kann sich


KAPITEL 3. MASSFUNKTIONEN 25leicht überzeugen, dass das System aller Mengen, für die es eine solche Überdeckunggibt, einen Sigmaring bildet, der R umfasst). Wir können annehmen,dass diese Mengen E n disjunkt sind, indem wir E n durch E n \ ⋃ k 0 eine Menge E ∈ R, sodassµ(A△E) < ǫ.∑Nach der Definition von µ ∗ gibt es eine Folge E n von Mengen aus R mitn∈N µ(E n) ≤ µ(A)+ǫ. Da diese Reihe endlich ist, können wir ein N finden,sodass ∑ n>N µ(E n) < ǫ ist. Wir setzen E = ⋃ n≤N E n. Einerseits istµ(E \A) ≤ µ( ⋃ n∈NE n \A) = µ( ⋃ n∈NE n )−µ(A) ≤ ∑ nµ(E n )−µ(A) ≤ ǫ<strong>und</strong>Insgesamt ergibt sichµ(A\E) ≤ µ( ⋃n>NE n ) ≤ ∑ n>Nµ(E n ) ≤ ǫ.µ(AδE) = µ(A\E)+µ(E \A) ≤ 2ǫ.Wenn wir durch Mengen aus dem von R erzeugten Sigmaring S approximieren,ist die Sache noch einfacher:


KAPITEL 3. MASSFUNKTIONEN 26Satz 3.14 Zu jeder messbaren Menge A mit endlichem <strong>Maß</strong> gibt es Mengen B<strong>und</strong> C aus S mit B ⊆ A ⊆ C <strong>und</strong> µ(B) = µ(C) = µ(A).Wir beginnen wieder mit der Definition des äußeren <strong>Maß</strong>es, <strong>und</strong> diesmalwählen wir zu jedem k eine Überdeckung E kn von A mit ∑ n µ(E kn) ≤ µ(A)+ 1 k .Es istleicht zu sehen, dassC = ⋂ ⋃E knk ndie gewünschte obere Approximation liefert. Für die Approximation von untensetzen wir B = C \D, wobei D eine obere Approximation für C \A ist.Aus diesem Satz folgt, dass jede endliche messbare Menge sich alsA = B ∪Nschreiben lässt, wobei B aus den Sigmaring S ist <strong>und</strong> N eine <strong>Teil</strong>menge einerMenge mit <strong>Maß</strong> 0 ist. Dasselbe gilt für sigmaendliche Mengen (die man ja inabzählbar viele Mengen mit endlichem <strong>Maß</strong> zerlegen kann). Umgekehrt ist jedesolche Menge messbar, denn N hat äußeres <strong>Maß</strong> 0, <strong>und</strong> ist messbar, <strong>und</strong> B istals Element von S messbar.Wennn<strong>und</strong>as<strong>Maß</strong>µaufRtotalsigmaendlichist(d.h.,wennΩdurchabzählbarviele Mengen aus dem Ring mit endlichem <strong>Maß</strong> überdeckt werden kann),dannistjedemessbareMengeindieserWeisedarstellbar. Wirhabendafüreineneigenen Namen:Definition 3.10 µ sei eine <strong>Maß</strong>funktion auf dem Sigmaring S. Dann heißt¯S = {B ∩N : B ∈ S,N ⊆ M ∈ S,µ(M) = 0}die Vervollständigung von S bezüglich µ.Aus den obigen Ausführungen folgt, dass jedenfalls dann, wenn Ω eine sigmaendlicheMenge ist, das System der messbaren Mengen mit der Vervollständigungvon S bezüglich µ übereinstimmt.Wir sind nun dort angelangt, wo wir hinwollten: zumindest für ein sigmaendlichesAusgangsmasß können wir ein (eindeutig bestimmtes) <strong>Maß</strong> auf dem ganzenSigmaring (der hoffentlich auch Ω enthält <strong>und</strong> somit eine Sigmaalgebra ist)erhalten, wenn wir es nur auf einem Semiring festlegen, der diesen Sigmaringerzeugt. Das bringt uns gleich zu zwei weiteren Definitionen:Definition 3.11 • Ω sei eine Menge, S eine Sigmaalgebra über Ω. Dannheißt das Paar (Ω,S) ein Messraum (oder messbarer Raum).• (Ω,S) sei ein Messraum, <strong>und</strong> zusätzlich sei auf S ein <strong>Maß</strong> µ definiert.Dann heißt das Tripel (Ω,S,µ) ein <strong>Maß</strong>raum. Ist das <strong>Maß</strong> µ endlichoder sigmaendlich bzw. ein Wahrscheinlichkeitsmaß, dann sprechen wirvon einem endlichen oder sigmaendlichen <strong>Maß</strong>raum bzw. einem Wahrscheinlichkeitsraum.


Kapitel 4Lebesgue-Stieltjes <strong>Maß</strong>e4.1 Eindimensionale Lebesgue-Stieltjes <strong>Maß</strong>eJetzt ist es an der Zeit, dass wir uns etwas eingehender mit den reellen Zahlen<strong>und</strong> allgemeiner mit endlichdimensionalen Räumen <strong>und</strong> den darauf definiertenBorelmengenbefassen.InsbesonderewerdenwirzeigendassmitderLänge(bzw.Fläche <strong>und</strong> Volumen in höheren Dimensionen) tatsächlich ein <strong>Maß</strong> auf den Borelmengengegeben ist. Fürs erste beschränken wir uns auf den eindimensionalenFall. In diesem werden die Borelmengen B vom Semiring der linkshalboffenenIntervalle T erzeugt, <strong>und</strong> wir können jedes Sigmaendliche <strong>Maß</strong> auf T in eindeutigerWeise zu einem (ebenfalls sigmaendlichen) <strong>Maß</strong> auf B fortsetzen. Allerdingssindnichtallesigmaendlichen<strong>Maß</strong>eaufBindieserWeisezuerhalten(mansetzebeispielsweise als <strong>Maß</strong> einer Menge die Anzahl der darin enthaltenen rationalenZahlen), <strong>und</strong> andererseits gibt es wieder unter den <strong>Maß</strong>en, die auf T sigmaendlichsind, recht unangenehme Zeitgenossen, also werden wir die schlimmstenAnomalien vermeiden, indem wir definieren:Definition 4.1 Ein Lebesgue-Stieltjes <strong>Maß</strong> ist ein <strong>Maß</strong> auf (R,B), das für beschränkteIntervalle endliche Werte annimmt. (Diese Definition funktioniertwortgleich auch in d Dimensionen, wenn wir die Intervalle als die entsprechenden“Hyperquader” interpretieren).Diese Definition ist natürlich äquivalent zu der Forderung, dass alle beschränktenBorelmengen endliches <strong>Maß</strong> besitzen. Insbesondere sind alle endlichen <strong>Maß</strong>eLebesgue-Stieltjes <strong>Maß</strong>e.OffensichtlichsindalleLebesgue-StieltjesmaßeaufTeingeschränktsigmaendlich(sogar endlich), <strong>und</strong> daher sind sie durch die Angabe Ihrer Werte auf Teindeutig festzulegen.Wir müssen also für jedes Intervall (a,b] den Wert des <strong>Maß</strong>es festlegen. Dasbedeutet im wesentlichen, dass wir eine Funktion der beiden Variablen a <strong>und</strong> bangeben müssen. diese Aufgabe können wir aber noch weiter vereinfachen (<strong>und</strong>werden noch dazu feststellen, dass wir damit auch die Überprüfung, ob das27


KAPITEL 4. LEBESGUE-STIELTJES MASSE 28Ergebnis ein <strong>Maß</strong> ist, leichter machen), indem wir die Tatsache ausnutzen, dassfür a < b < c sowohl(a,b]∪(b,c] = (a,c]als auch(a,b]∩(b,c] = ∅.Für ein Lebesgue-Stieltjes <strong>Maß</strong> µ muss jetzt gelten<strong>und</strong> weil µ((a,b]) endlich ist,µ((a,c]) = µ((a,b])+µ((b,c]),µ((b,c]) = µ((a,c])−µ((a,b]).Wir werden jetzt kurz zusätzlich annehmen, dass das <strong>Maß</strong> µ endlich ist (aufB!). In diesem Fall dürfen wir nämlich oben für a den Wert −∞ einsetzen, <strong>und</strong>die entsprechende Gleichung gilt dann für alle b < c. Wir setzen<strong>und</strong> erhaltenF(x) = µ((−∞,x])µ((b,c]) = F(c)−F(b).Zum Festlegen eines endlichen <strong>Maß</strong>es ist also nur noch die Funktion F voneiner reellen Variable anzugeben. Damit hat sich die Dimensionalität unseresProblems noch einmal halbiert, <strong>und</strong> wir sind endlich zufrieden, abgesehen davon,dass wir uns dasselbe für alle Lebesgue-Stieltjes <strong>Maß</strong>funktionen wünschen,weshalb wir zunächst definieren:Definition 4.2 µ sei ein (eindimensionales) Lebesgue-Stieltjes <strong>Maß</strong>. Eine reelleFunktion F heißt Verteilungsfunktion von µ, wenn für alle a < bµ((a,b]) = F(b)−F(a).Diese Definition wirft natürlich eine Reihe von Fragen auf:1. Gibt es zu einer Lebesgue-Stieltjes <strong>Maß</strong>funktion immer eine Verteilungsfunktion?2. Vorausgesetzt, die Antwort auf die vorige Frage ist “ja”, wie weit ist danndie Verteilungsfunktion eindeutig bestimmt (keine sehr wichtige Frage,zugegeben, aber nicht uninteressant, <strong>und</strong> wegen der Vollständigkeit...)?3. Kann man leicht feststellen, ob eine bestimmte Funktion eine Verteilungsfunktionist (diese Frage ist die wichtigste — schließlich wollen wir dieseVerteilungsfunktionen dazu verwenden, dass wir <strong>Maß</strong>e definieren)?4. Schließlich: Ist durch eine Verteilungsfunktion das zugehörige <strong>Maß</strong> eindeutigbestimmt?


KAPITEL 4. LEBESGUE-STIELTJES MASSE 29Die letzte Frage sollte eigentlich klar sein: durch die Definition der Verteilungsfunktion(in die andere Richtung gelesen) ist das <strong>Maß</strong> µ auf dem SemiringT bestimmt, <strong>und</strong> den Rest erledigt der Fortsetzungssatz.Um die erste Frage zu lösen, brauchen wir nur eine Verteilungsfunktion Fanzugeben, <strong>und</strong> wir setzen{µ((0,x]) falls x > 0,F(x) =−µ((x,0]) sonst,<strong>und</strong> man überzeugt sich leicht, dass dies wirklich eine Verteilungsfunktion für µist.DieEindeutigkeitsfragefürF istnichtganzsoleichtzubeantworten.AusderDefinition der Verteilungsfunktion ist nämlich zu erkennen, dass man zu F einebeliebige Konstante addieren kann <strong>und</strong> damit wieder eine Verteilungsfunktionfür dieselbe <strong>Maß</strong>funktion erhält; es gibt also zu einer <strong>Maß</strong>funktion mehr alseine Verteilungsfunktion; andererseits gilt für zwei Verteilungsfunktionen F,Gzu derselben <strong>Maß</strong>funktion<strong>und</strong> wir können die Variablen trennen:µ((x,y]) = F(y)−F(x) = G(y)−G(x),F(y)−G(y) = F(x)−G(x).Dieser Ausdruck darf also weder von x noch von y abhängen <strong>und</strong> ist daherkonstant. Zwei Verteilungsfunktionen zu derselben <strong>Maß</strong>funktion können sichalso auch nicht durch mehr als eine additive Konstante unterscheiden.Letztlich bleibt uns also die Aufgabe, zu entscheiden, ob eine Funktion eineVerteilungsfunktion ist. Dazu mßsen wir die zwei charakteristischen Eigenschafteneiner <strong>Maß</strong>funktion — Nichtnegativität <strong>und</strong> Sigmaadditivität — auf unsereVerteilungsfunktionen übertragen.Die Nichtnegativität liefert für y > xoderF(y)−F(x) = µ((x,y]) ≥ 0F(y) > F(x).F ist also monoton nichtfallend.Die Sigmaaditivität haben wir schon in Satz ?? mit Stetigkeitseigenschaftenin Verbindung gebracht. Wir wählen eine monoton nichtwachsende Folge x n mitGrenzwert x. Dann fällt die Folge der Intervalle (x,x n ] gegen die leere Menge,<strong>und</strong> daher gilt0 = µ(∅) = limµ((x,x n ]) = limn→∞ (F(x n)−F(x)).Daraus folgt natürlich, dass F(x n ) gegen F(x) konvergiert, <strong>und</strong> F ist rechtsstetig.Jede Verteilungsfunktion ist also nichtfallend <strong>und</strong> rechtsstetig. Dass auch dieUmkehrung gilt, formulieren wir in einem Satz, in dem wir auch alles festhalten,was wir bisher festgestellt haben:


KAPITEL 4. LEBESGUE-STIELTJES MASSE 30Satz 4.1 Eine reelle Funktion ist genau dann eine Verteilungsfunktion, wennsie monoton nichtfallend <strong>und</strong> rechtsstetig ist, d.h., zu jeder nichtfallenden <strong>und</strong>rechtsstetigen Funktion gibt es ein Lebesgue-Stieltjes <strong>Maß</strong> mit dieser Funktionals Verteilungsfunktion. Überdies ist ein Lebsgue-Stieltjes <strong>Maß</strong> durch eineVerteilungsfunktion eindeutig bestimmt. Andererseits gibt es zu jedem Lebesgue-Stieltjes <strong>Maß</strong> mindestens eine Verteilungsfunktion, <strong>und</strong> zwei verschiedene Verteilungsfunktionenzu demselben <strong>Maß</strong> unterscheiden sich durch eine additiveKonstante.DereinzigePunkt,dernochzuklärenist,istdieTatsache,dasseinenichtfallenderechtsseitige Funktion F durch die Formelµ((a,b]) = F(b)−F(a)tatsächlich eine <strong>Maß</strong>funktion auf T festlegt.Da F monoton ist, erhalten wir unmittelbar, dass µ nichtnegativ ist.AlsnächsteszeigenwirdieAdditivitätvonµ.DaTeinSemiringist,brauchenwir uns nur um die Vereinigung von zwei disjunkten Mengen zu kümmern. Esseien als (a,b] <strong>und</strong> (c,d] zwei nichtleere Intervalle, deren Vereinigung wieder einIntervallist(wenneinesderbeidenIntervalleleerist,istdieFragenocheinfacherzu lösen). Dann muss, wie man sich leicht überlegt, entweder b = c oder a = dgelten. Wir nehmen ohne Beschränkung der Allgemeinheit den ersten Fall an<strong>und</strong> erhaltenµ((a,d]) = F(d)−F(a) = F(d)−F(b)+F(b)−F(a) = µ((a,b])+µ((b,d]).Es gilt für µ also auch die Additivität.Nun wollen wir die Sigmaadditivität zeigen. Es sei also (a n ,b n ] eine Folgevon disjunkten Intervallen, deren Vereinigung ein Intervall (a,b] darstellt.Aus der Additivität <strong>und</strong> Nichtnegativität von µ erhalten wirN⋃µ((a,b]) ≥ µ( (a n ,b n ]) =n=1N∑µ((a n ,b n ]),n=1<strong>und</strong> durch den Grenzübergang N → ∞ erhalten wirµ((a,b]) ≥∞∑µ((a n ,b n ]).n=1Es bleibt uns also noch die umgekehrte Ungleichung. Auch diese wollen wir aufeine endliche Vereinigung zurückführen, denn dann genügt uns die einfache Additivitätvon µ, die wir schon bewiesen haben. Das Mittel dazu ist der Satz vonHeine-Borel, denn schließlich haben wir hier die Situation, dass ein Intervall vonanderen überdeckt wird. Allerdings sollte das überdeckte Intervall abgechlossensein <strong>und</strong> die überdeckenden offen, <strong>und</strong> nicht wie hier alle Intervalle halboffen.Dieses Problem ist aber leicht zu lösen: wir schneiden einfach vom Intervall(a,b] links ein kleines Stück ab (<strong>und</strong> machen es zu einem abgeschlossenen), <strong>und</strong>


KAPITEL 4. LEBESGUE-STIELTJES MASSE 31dehnen die Intervalle (a n ,b n ] nach rechts aus. Wir müssen dabei nur aufpassen,dass wir nicht zuviel wegnehmen bzw. dazugeben. Wir setzen<strong>und</strong>so, dass<strong>und</strong>ã > a˜bn > b nF(ã) < F(a)+ǫF(˜b n ) < F(b n )+ ǫ2 n.Jetzt ist (a n ,˜b n ) eine offene Überdeckung des abgeschlossenen Intervalls [ã,b].Dafür funktioniert der Satz von Heine-Borel, wir können also eine endliche<strong>Teil</strong>überdeckung finden, <strong>und</strong> weil wir an linkshalboffenen Intervallen interessiertsind, schreiben wir gleich(ã,b] ⊆ [ã,b] ⊆N⋃(a n ,˜b n ) ⊆n=1N⋃(a n ,˜b n ].Jetzt verwenden wir die Additivität <strong>und</strong> Nichtnegativität von µ <strong>und</strong> erhalten<strong>und</strong> schließlichF(b)−F(ã) ≤n=1n=1N∑∞∑(F(˜b n )−F(a n )) ≤ (F(˜b n )−F(a n ))F(b)−F(a) ≤ F(b) = F(ã)+ǫ ≤n=1n=1∞∑(F(˜b n )−F(a n ))+ǫn=1∞∑≤ (F(b n )+ ǫ∞∑2 n −F(a n))+ǫ ≤ (F(b n )−F(a n ))+2ǫ.Da ǫ beliebig war, haben wir gezeigt, dassµ((a,b]) ≤n=1∞∑µ((a n ,b n ]),n=1<strong>und</strong> die Sigmaadditivität von µ ist gezeigt.Jetzt sind wir endlich in der Lage, unsere klassischen Längenmaße unterzubringen.Dazu setzen wir für die Verteilungsfunktion F einfach F(x) = x ein.Das zugehörige Lebesgue-Stieltjes <strong>Maß</strong> (das Intervallen tatsächlich ihre Längezuordnet) bezeichnen wir mit λ <strong>und</strong> nennen es das Lebesguemaß.Die Vervollständigung der Borelmengen bezüglich des Lebesguemaßes (odermit anderen Worten, das System der λ ∗ -messbaren Mengen) nennen wir dasSystem der Lebesguemengen (oder der Lebesgue-messbaren Mengen).


KAPITEL 4. LEBESGUE-STIELTJES MASSE 324.2 Mehrdimensionale Lebesgue-Stieltjes <strong>Maß</strong>eAuch im mehrdimensionalen Fall Ω = R n , S = B n definieren wir ein Lebesgue-Stieltjes <strong>Maß</strong> als ein <strong>Maß</strong>, das f[r beschränkte Borelmengen endliche Werte ergibt.Wir wollen auch hier eine Verteilungsfunktion finden, die das <strong>Maß</strong> festlegt.Dazu gehen wir wie im eindimensionalen Fall von einem endlichen <strong>Maß</strong> µ aus<strong>und</strong> setzenF(x) = F(x 1 ,...,x n ) = µ((−∞,x]) = µ((−∞,x 1 ]×...×(−∞,x n ]).Wir betrachten zunächst den Fall n = 2 <strong>und</strong> versuchen, das <strong>Maß</strong> des Rechtecks(a 1 ,b 1 ]×(a 2 ,b 2 ]ausdenFunktionswerten vonF zubestimmen. Dasfunktioniertnatürlich so, dass man vom Funtionswert der rechten oberen Ecke erst einmaldie Werte der beiden angrenzenden Ecken abzieht. Dabei wird allerdings etwasdoppelt abgezogen, <strong>und</strong> deswegen muss man den Funktionswert für die linkeuntere Ecke wieder dazuzählen.Also:µ((a,b]) = F(b1,b2)−F(a1,b2)−F(a2,b1)+F(a1,a2).Für n > 2 Dimensionen ist es nicht ganz leicht, das Äquivalent dazu lesbaranzuschreiben, etwa:µ((a,b]) = ∑e∈0,1 n (−1) ∑ e iF(ae+b(1−e)).Dabei sind alle Operationen mit den Vektoren a, b <strong>und</strong> e komponentenweise zuverstehen.Oder man definiert Differenzoperatoren∆ (a,b)i f(x) = f(z)−f(y),wobei z i = b, y j = a <strong>und</strong> y j = z j = x j für j ≠ i.Damit istµ((a,b]) = ∆ (a,b) F = ∆ (a1,b1)1 ∆ (a2,b2)2 ...∆ (an,bn)n F.DieRechtsstetigkeitderVerteilungsfunktionbleibtgenausowieimeindimensionalenFall gültig, die Monotonie (die ja aus der Nichtnegativität des <strong>Maß</strong>esfolgt) müssen wir durch die Forderung ersetzen, dass der obige Ausdruck fürµ((a,b]) nichtnegativ sein soll.Wenn diese Forderungen erfüllt sind, dann kann man so wie im eindimensionalenFall zeigen, dass dazu auch ein Lebesgue-Stieltjes <strong>Maß</strong> existiert:Satz 4.2 Die Funktion F : R n → R ist genau dann Verteilungsfuntion einesLebesgue-Stieltjes <strong>Maß</strong>es, wenn1. F rechtstetig ist <strong>und</strong>


KAPITEL 4. LEBESGUE-STIELTJES MASSE 332. ∆ (a,b) F ≥ 0 für alle a ≤ b.Umgekehrt kann man zu jedem Lebesgue-Stieltjes <strong>Maß</strong> eine Verteilungsfunktionfinden, etwa:F(x) = sig( ∏ x i )µ((min(x,0),max(x,0)]).Die Eindeutigkeitsfrage für die Verteilungsfunktion ist nicht ganz so einfach zubeantworten. Es gilt: man kann jede weitere Verteilungsfunktion zum selben<strong>Maß</strong> µ in der Formn∑F(x)+ f i (x)i=1schreiben, wobei die Funktion f i von x i nicht abhängt.Zum Abschluss sei noch bemerkt, dass eine Verteilungsfunktion nicht monotonsein muß, <strong>und</strong> dass umgekehrt eine Funktion, die in ihren Argumentenmonoton ist, keine Verteilungsfunktion sein muss. Ein Beispiel dafür bildet dieVerteilungsfunktion des beliebtesten <strong>Maß</strong>es, des Lebesgue-<strong>Maß</strong>es:F(x) = x 1 x 2 ...x n .Andere Beispiele dazu werden in den Übungen besprochen. Allerdings werdenwie für endliche <strong>Maß</strong>e, <strong>und</strong> besonders für Wahrscheinlichkeitsmaße als “die Verteilungsfunktion”immer die FunktionF(x) = µ((−∞,x])verstehen. Diese ist klarerweise in jedem Argument monoton nichtfallend (<strong>und</strong>hat noch einige zusätzliche Eigenschaften).


Kapitel 5Messbare FunktionenPictures of Lilly made my life sobeautifulThe WhoWir haben uns bisher mit <strong>Maß</strong>en auseinandergesetzt, <strong>und</strong> dabei schon einigeserreicht (<strong>und</strong> dürfen uns dafür auf die Schulter klopfen), jetzt steuern wirauf unseren neuen Integralbegriff zu. Da wir Integrale nicht definieren können,ohne dafür Funktionen zur Verfügung zu haben, wollen wir uns nun mit denFunktionen befassen, die wir später in unser Integral stecken werden. Das Vorbilddafür sind natürlich die stetigen Funktionen. Die Definition aus der Schule(wenn die Argumente konvergieren, konvergieren auch die Bilder) hilft uns hiernicht weiter, weil in unserer abstrakten Welt (im allgemeinen) kein Platz fürtopologische Strukturen ist <strong>und</strong> wir daher nicht über Konvergenz reden können.Eine äquivalente Bedingung ist hier wesentlich hilfreicher: eine Funktion ist genaudann stetig, wenn das Urbild jeder offenen Menge offen ist. Wir habenzwar keine offenen Mengen zur Verfügung, aber wir können sie einfach durchdie Mengen ersetzen, die wir kennen:Definition 5.1 Es seien (Ω 1 ,S 1 ) <strong>und</strong> (Ω 2 ,S 2 ) zwei Messräume. Die Funktionf : Ω 1 → Ω 2 heist messbar (genauer S 1 -S 2 -messbar, wenn keine Gefahr vonVerwechslungen besteht, können wir die genaue Spezifikation weglassen), wennfür jede Menge A ∈ S 2 das Urbild f −1 (A) in S 1 liegt.Wir schreiben dafürf : (Ω 1 ,S 1 ) → (Ω 2 ,S 2 ).Ist insbesondere Ω 2 = R n <strong>und</strong> S 2 = B n , dann nennen wir f kurz S 1 -messbar.Ist zusätzlich Ω 1 = R m <strong>und</strong> Ω 1 = B m , dann heißt f Borelmessbar, <strong>und</strong> falls S 1das System der Lebesguemengen ist, dann heißt f Lebesguemessbar.Um die Messbarkeit einer Funktion festzustellen, müssen wir theoretisch allemöglichen Mengen A ∈ S 2 daraufhin überprüfen, ob ihr Urbild in S 1 liegt. Wirwürden lieber mit weniger auskommen, <strong>und</strong> dazu verhilft uns der34


KAPITEL 5. MESSBARE FUNKTIONEN 35Satz 5.1 C sei ein beliebiges Erzeugendensystem von S 2 . Dann ist f : Ω 1 → Ω 2genau dann S 1 -S 2 -messbar, wenn für jedes A ∈ C das Urbild f −1 (A) in S 1liegt.Zum Beweis betrachten wir das System D = {A ∈ S 2 : f −1 (A) ∈ S 1 }. Manüberzeugt sich leicht, dass D eine Sigmaalgebra ist, <strong>und</strong> weil D auch C enthält,enthält es auch die von C erzeugte Sigmaalgebra S 2 . Deshalb ist für alle A ∈ S 2das Urbild in S 1 , also f messbar.Wenn wir für S 2 die Borelmengen einsetzen, dann können wir in diesemSatz als Erzeugendensystem etwa die offenen Intervalle oder die abgeschlossenenIntervalle oder die einseitig unendlichen Intervalle verwenden, <strong>und</strong> können sofeststellen (wenn wir auch für S 1 die Borelmengen setzen), dass alle stetigen<strong>und</strong> auch alle monotonen Funktionen borelmessbar sind.Noch schnell ein allgemeiner Satz, bevor wir uns den reellwertigen Funktionenzuwenden:Satz 5.2 Es sei f 1 : (Ω 1 ,S 1 ) → (Ω 2 ,S 2 ) <strong>und</strong> f 2 : (Ω 2 ,S 2 ) → (Ω 3 ,S 3 ). Dannist f 2 ◦f 1 : (Ω 1 ,S 1 ) → (Ω 3 ,S 3 ).5.1 Reellwertige FunktionenWir haben vorhin schon gesehen, dass die messbaren Funktionen im engerenSinn (d.h., die, bei denen der Bildraum ein Borelscher <strong>Maß</strong>raum ist) die stetigen<strong>und</strong> auch die monotonen Funktionen einschließen. Wir wollen uns nun etwasnäher mit den Eigenschaften dieser Klasse von Funktionen beschäftigen.Als erstes wollen wir die Messbarkeit n-dimensionaler Funktionen auf deneindimensionalen Fall zurückführen:Satz 5.3 Es sei f = (f 1 ,...,f n ) : Ω → ¯R n . Dann ist f genau dann messbar,wenn f i für alle i = 1,...,n messbar ist.Einerseits folgt aus der Messbarkeit von f für jede eindimensionale BorelmengeA:f −1i (A) = f −1 (¯R i−1 ×A× ¯R n−i ∈ S,also ist auch f i messbar. Umgekehrt folgt aus der Messbarkeit aller f i dieMessbarkeit von f. Dazu zeigen wir, dass das Urbild jedes (n-dimensionalen)Intervalls messbar ist:f −1 ((a 1 ,b 1 ]×...×(a n ,b n ]) =n⋂i=1f −1i ((a i ,b i ]).Dieser Durchschnitt ist messbar, weil alle f i messbare Funktionen sind, <strong>und</strong>weil die Intervalle ein Erzeugendensysytem für die Borelmengen sind, ist derSatz bewiesen.Als nächstes stellen wir fest, dass wir auf die messbaren Funktionen dieGr<strong>und</strong>rechenarten anwenden können:


KAPITEL 5. MESSBARE FUNKTIONEN 36Satz 5.4 Es seien f,g : (Ω,S) → (¯R, ¯B). Dann sind auch f +g,f −g,fg,f/galle messbar, vorausgesetzt, dass diese Operationen überall definiert sind.Zum Beweis setzen wir f 1 = (f,g) <strong>und</strong> f 2 (x,y) = x + y. Die erste Funktionist nach dem eben bewiesenen Satz messbar, die zweite, weil sie stetig ist, <strong>und</strong>daher ist nach Satz ?? auch f 2 ◦f 1 = f +g messbar. Dieselbe Idee funktioniertnatürlich für alle anderen Fälle, wobei wir natürlich dafür sorgen müssen, dassdie Ergebnisse für alle Argumente definiert sind (d.h., dass keine unbestimmteForm ∞ − ∞ oder 0 ∗ ∞ Auftritt); wenn man sich auf reelle Funktionen beschränkt(also die Unendlichkeiten ausschließt), reduziert sich diese Forderungdarauf, dass bei der Division der Divisor nicht null sein darf.Mit derselben Argumentation kann man erkennen, dass auch Minimum <strong>und</strong>Maximum von zwei messbaren Funktionen wieder messbar sind. Es gilt aberetwas mehr:Satz 5.5 f n ,n ∈ N seien messbare Funktionen. Dann sind auch die folgendenFunktionen messbar:<strong>und</strong> auchsupf n ,infnf n,liminfn nlimnf n ,f n ,limsupf n ,nwenn dieser Grenzwert existiert (d.h., wenn die Folge f n punktweise konvergiert).Für f = sup n f n giltf −1 ((−∞,x]) = {ω ∈ Ω : supf n ≤ x} = {ω ∈ Ω : f n ≤ x,n ∈ N} = ⋂ nf −1n ((−∞,x]).Also ist das Supremum messbar, <strong>und</strong> analog beweist man die Messbarkeit desInfimums. Der Rest folgt aus den Darstellungen<strong>und</strong>limsupnliminfnf n = inf supnf n = supnf kk≥ninf f k.k≥nJetzt wollen wir uns einer Klasse von besonders einfachen messbaren Funktionenzuwenden. Auf englisch heißen sie auch so (“simple functions”), aber aufdeutsch haben wir einen eigenen Namen dafür:Definition 5.2 Eine messbare Funktion f heißt Treppenfunktion, wenn sie nurendlich viele verschiedene Werte a 1 ,...,a n annimmt. Eine solche Funktionkann man natürlich in der Formn∑f = a i 1 Aii=1


KAPITEL 5. MESSBARE FUNKTIONEN 37darstellen, wobei A 1 ,...,A n eine messbare Zerlegung von Ω ist, also A i ∈ Sdisjunkt mit ⋃ A i = Ω.Die geforderte Darstellung ist offensichtlich, wenn man einfach A i = f −1 ({a i })setzt. Umgekehrt ist jede Funktion, die man in dieser Form darstellen kann,messbar (als Urbilder können ja nur irgendwelche Vereinigungen der MengenA i auftreten, <strong>und</strong> die sind alle messbar).Was die Treppenfunktionen für uns interessant macht, ist die Tatsache, dasssich durch sie jede messbare Funktion approximieren lässt:Satz 5.6 Jede messbare Funktion f kann als punktweiser Grenzwert einer Folgevon Treppenfunktionen f n dargestellt werden. Ist zusätzlich f nichtnegativ, dannkann die Folge f n nichtfallend gewählt werden.Zum Beweis setzen wir einfach⎧⎨2 n wenn f(x) ≥ 2 n ,f n = k/2 n wenn k/2 n ≤ f(x) < (k +1)/2 n , k = −4 n ,...,4 n −1,⎩−2 n wenn f(x) < −2 n .An diesem Punkt können wir einen Satz beweisen, der eine Umkehrung vonSatz ?? ist:Satz 5.7 (Ω 1 ,S 1 ) <strong>und</strong> (Ω 2 ,S 2 ) seien zwei Messräume <strong>und</strong> h : (Ω 1 ,S 1 ) →(Ω 2 ,S 2 ) eine messbare Funktion. Die Funktion f : (Ω 1 ,S 1 ) → (R,B) lässt sichgenau dann in der Form g ◦h darstellen, wenn sie bezüglich h −1 (S 2 ) messbarist.Der Beweis dieses Satzes verläuft nach einem Schema, das immer wiederbeim Beweis von Sätzen über messbare Funktionen auftauchen wird: zuerst wirddie Behauptung für Indikatorfunktionen bewiesen, dann für Treppenfunktionen,<strong>und</strong> schließlich der allgemeine Fall (oft kommt noch ein zusätzlicher Schritt fürnichtnegative Funktionen dazu, aber das brauchen wir hier nicht).Die Notwendigkeit der Bedingung ist eine unmittelbare Folge von Satz ??,<strong>und</strong> für die Suffizienz verwenden wir die Vorgangsweise, die wir gerade beschriebenhaben:1. f = 1 A mit A ∈ h −1 (S 2 ). Dann gibt es ein B ∈ S 2 mit A = h −1 (B), <strong>und</strong>wir können g = 1 B setzen.2. f eineTreppenfunktion:f = ∑ ni=1 a i1 Ai .Wirsetzennatürlichg = ∑ ni=1 a i1 Bi ,wobei B i so wie im vorigen Punkt gewählt wird.3. Im allgemeinen Fall stellen wir f als Limes einer Folge f n von Treppenfunktionendar; g n seien die entsprechenden Funktionen mit f n = g n ◦h.Die Folge g n muss nicht konvergieren (obwohl sie mit etwas mehr Arbeitso gewählt werden kann), aber g = limsupg n existiert auf jeden Fall <strong>und</strong>leistet auch das Gewünschte.


KAPITEL 5. MESSBARE FUNKTIONEN 385.2 WahrscheinlichkeitsräumeAn diesem Punkt ist es an der Zeit, einige spezielle Bezeichnungen einzuführen,die sich auf Wahrscheinlichkeitsräume beziehen.Definition 5.3 (Ω,S,P) sei ein Wahrscheinlichkeitsraum. Die Elemente vonΩ heißen Elementarereignisse, die Elemente der Sigmaalgebra S heißen Ereignisse,die leere Menge wird als das unmögliche Ereignis bezeichnet <strong>und</strong> Ω alsdas sichere Ereignis. Eine messbare Funktion auf einem Wahrscheinlichkeitsraumheißt Zufallsvariable (meistens ist dann der Wertebereich reell).Wir werden in Hinkunft immer wieder spezielle Bezeichnungen für Wahrscheinlichkeitsräumehaben.5.3 <strong>Maß</strong>e <strong>und</strong> messbare FunktionenWir haben bislang nur Messräume betrachtet. Nun soll zusätzlich zu dieserStruktur auch ein <strong>Maß</strong> definiert sein. Unsere erste Definition betrifft die VerträglichkeiteinermessbarenFunktionmit<strong>Maß</strong>enaufdemUrbild-<strong>und</strong>Bildraum:Definition 5.4 (Ω 1 ,S 1 ,µ 1 ) <strong>und</strong> Ω 2 ,S 2 ,µ 2 ) seien zwei <strong>Maß</strong>räume. Die Funktionf : (Ω 1 ,S 1 ) → (Ω 2 ,S 2 ) heißt maßtreu, wenn für alle A ∈ S 2µ 1 (f −1 (A)) = µ 2 (A).Wenn wir jetzt nur auf dem Urbildraum ein <strong>Maß</strong> haben, können wir auf demBildraum ein <strong>Maß</strong> definieren, das f zu einer maßtreuen Abbildung macht:Definition 5.5 (Ω,S,µ) sei ein <strong>Maß</strong>raum <strong>und</strong> f : (Ω,S) → (Ω 2 ,S 2 ) einemessbare Abbildung das <strong>Maß</strong>µ f (A) = µ(f −1 (A))heißt das von f (auf S 2 ) induzierte <strong>Maß</strong>. Ist (Ω,S,P) ein Wahrscheinlichkeitsraum<strong>und</strong> X eine Zufallsvariable, dann nennen wir das von X induzierte <strong>Maß</strong>P X die Verteilung von X. Dieses induzierte <strong>Maß</strong> hat, wenn X Werte in R dannimmt, als Lebesgue-Stieltjes-<strong>Maß</strong> eine Verteilungsfunktion , die wir mit F Xbezeichnen.Diese Definition macht es uns möglich, die Unabhängigkeit von Ereignissenauf Zufallsvariable zu übertragen:Definition 5.6 Die Zufallsvariablen X 1 ,...,X n (X 1 : (Ω,S) → (Ω i ,S i )) heißenunabhängig, wenn für alle A i ∈ S iP(X i ∈ A i ,i = 1,...,n) =n∏(X i ∈ A i ).i=1


KAPITEL 5. MESSBARE FUNKTIONEN 39Für reellwertige Zufallsvariable ist das äquivalent dazu, dass sich die Verteilungsfunktionvon (X 1 ,...,X n ) als Produkt der einzelnen Verteilungsfunktionenschreiben lässt.Ein unendliches System von Zufallsvariablen heißt unabhängig, wenn jedesendliche <strong>Teil</strong>system unabhängig ist.5.4 Konvergenz von messbaren FunktionenIn diesem Abschnitt studieren wir einige Möglichkeiten, die Konvergenz einerFolge von messbaren Funktionen definieren können, <strong>und</strong> die Zusammenhänge,die zwischen diesen Konvergenzarten bestehen. Dazu beginnen wir mit einerallgemeinen Definition:Definition 5.7 (Ω,S,µ) sei ein <strong>Maß</strong>raum <strong>und</strong> P = P(ω) eine Aussage überdie Elemente ω ∈ Ω. Wir sagen, dass P fast überall gilt (bzw. fast sicher, wennµ ein Wahrscheinlichkeitsmaß ist), wenn es eine Menge A ∈ S gibt, sodassµ(A) = 0 <strong>und</strong> P für alle ω ∈ A C gilt.Mit dieser Definition können wir schon zwei Konvergenzen definieren, indemwir die entsprechenden Definitionen aus der Analysis “aufweichen”:Definition 5.8 Die Folge f n von messbaren Funktionen (die auch die Werte±∞ annehmen dürfen) heißt fast überall konvergent gegen die Funktion f, wennes eine Menge A mit µ(A) = 0 gibt, sodass f n auf dem Komplement von Apunktweise gegen f konvergiert.Die Folge f n von messbaren Funktionen heißt fast überall gleichmäßig konvergentgegen die messbare Funktion f, wenn es eine Menge A ∈ S gibt, sodassµ(A) = 0 <strong>und</strong> f n auf dem Komplement von A gleichmäßig gegen f konvergiert.Für die gleichmäßige Konvergenz fast überall gibt es eine Norm, sodass dieKonvergenzbezüglichdieserNormgenaudiegleichmäßigeKonvergenzfastüberallist. Dazu definieren wir.Definition 5.9 Das essentielle Supremum einer messbaren Funktion f ist diekleinste obere Schranke, die f fast überall übertrifft:ess sup f = inf{λ ∈ R : µ({x : f(x) > λ}) = 0}.Das essentielle Supremum des Betrags von f nennen wir die ∞-Norm:Es gilt:‖f‖ ∞ = ess sup|f|.Satz 5.8 ‖.‖ ∞ ist eine Norm, wenn Funktionen als gleich angesehen werden,die fast überall übereinstimmen, <strong>und</strong> die Konvergenz im Sinne dieser Norm istdie gleichmäßige Konvergenz µ-fast überall.


KAPITEL 5. MESSBARE FUNKTIONEN 40Der einzige <strong>Teil</strong> dieses Satzes, der (vielleicht) interessant ist, ist die Behauptung,dass die Konvergenz bezüglich der ∞-Norm die gleichmäßige Konvergenzfast überall impliziert. Wenn aber δ n = ‖f n − f‖ ∞ gegen 0 konvergiert, danngibt es zu jedem n eine Menge A n mit µ(A n ) = 0, sodass für alle x ∉ A n|f n (x) − f(x)| ≤ δ n . Die Vereinigung aller A n hat dann auch das <strong>Maß</strong> 0, <strong>und</strong>auf ihrem Komplement konvergiert f n gleichmäßig gegen f.Die∞-NormspieltalsofürdiegleichmäßigeKonvergenyfastüberalldieselbeRolle wie die gewöhnliche Supremumsnorm für die gleichmäßige Konvergenz.Wir definieren noch zwei Konvergenzarten, die in der <strong>Maß</strong>theorie von Bedeutungsind:Definition 5.10 Die Folge f n heißt µ-fast gleichmäßig konvergent, wenn es zujedem ǫ > 0 eine Menge A ǫ mit µ(A ǫ ) < ǫ existiert, sodass die Folge f n auf A Cgleichmäßig konvergiert.Die Folge f n konvergiert im <strong>Maß</strong> (bzw. in Wahrscheinlichkeit) gegen f, wennfür alle ǫ > 0limn→∞ µ({x : |f n(x)−f(x)| > ǫ}) = 0.Die Konvergenz im <strong>Maß</strong> ist ein wichtiges Konzept: vom wahrscheinlichkeitstheoretischen(bzw. statistischen) Standpunkt betrachtet ist diese Konvergenzoft genau das, was man haben möchte: wenn man etwa f n als (aus einer zufälliggewählten Stichprobe der Größe n gewonnene) Schätzwerte für f auffasst, danngarantiert die Konvergenz in Wahrscheinlichkeit, dass die Chance, einen Fehlervon einer bestimmten Größe zu erhalten, beliebig klein gemacht werden kann,wenn nur n groß genug gewählt wird.Die fast gleichmäßige Konvergenz hat eher Kuriositätswert <strong>und</strong> ist hier eigentlichnur für den nächstenSatz 5.9 (Egoroff) Wenn µ ein endliches <strong>Maß</strong> ist, dann folgt aus der Konvergenzµ-fast überall die µ-fast gleichmäßige Konvergenz.Zum Beweis dieses Satzes setzen wirA n,ǫ = {x : |f k (x)−f(x)| > ǫ für ein k ≥ n}.Da f n fast überall gegen f konvergiert, giltlimµ(A n,ǫ ) = µ( ⋂ A n,ǫ ) ≤ µ({x : f n (x) ↛ f(x)}) = 0.Wir wählen n k so, dass µ(A nk ,1/k) < 2 −k . Die MengeB k = ⋃ i>kA ni,1/ihat <strong>Maß</strong> < 2 −k , <strong>und</strong> auf ihrem Komplement konvergiert f n gleichmäßig gegenf. Damit ist die fast gleichmäßige Konvergenz bewiesen.Die Konvergenz im <strong>Maß</strong> ist für endliche <strong>Maß</strong>räume die schwächste allerKonvergenzarten. In jedem Fall (auch für unendliche <strong>Maß</strong>e) impliziert die fast


KAPITEL 5. MESSBARE FUNKTIONEN 41gleichmäsige Konvergenz die Konvergenz im <strong>Maß</strong>. Der Satz von Egoroff garantiertdann, dass in endlichen <strong>Maß</strong>räumen die Konvergenz fast überall dieKonvergenz im <strong>Maß</strong> impliziert. Mit einem kleinen Kunstgriff geht es auch in derumgekehrten Richtung. Dazu definieren wirDefinition 5.11 Die Folge f n ist eine Cauchy-Folge im <strong>Maß</strong>, wenn für alleǫ > 0limm,n→∞ µ({x : |f n −f m | > ǫ}) = 0.Wir werden beweisen:Satz 5.10 Falls f n eine Cauchy-Folge im <strong>Maß</strong> ist, dann gibt es eine <strong>Teil</strong>folgevon f n , die fast gleichmäßig konvergiert (<strong>und</strong> damit fast überall).Wir können für jedes k gibt es ein N k , sodass für n,m > N kWir setzenµ({x : |f n −f m | > 2 −k }) < 2 −k .A k = {x : |f nk −f nk+1 | > 2 −k .Die Menge B n = ⋃ k>n A k erfüllt offensichtlich, dass µ(B n ) < 2 −n , <strong>und</strong> aufdem Komplement von B n ist die Folge f nk eine Cauchyfolge bezüglich dergleichmässigen Konvergenz, <strong>und</strong> konvergiert daher gleichmäßig.Insbesondere folgt aus diesem SatzSatz 5.11 Jede Cauchy-Folge im <strong>Maß</strong> konvergiert im <strong>Maß</strong>.


Kapitel 6Das Integral6.1 DefinitionWir sind jetzt andlich in der Lage, das “neue, bessere” Integral zu definieren,das am Beginn versprochen wurde. Wir werden die Definition des Integrals ineinzelnen Schritten vornehmen. Wir beginnen mit etwas einfachem, nämlich denTreppenfunktionen. Das Integral einer Treppenfunktionn∑f = α i 1 Aidefinieren wir als∫fdµ =i=1n∑α i µ(A i ).i=1Dabeiisteinerseitszubeachten,dassdieSummenichtvonderunbestimmtenForm ∞−∞ sein darf, andererseits werden wir Produkte 0.∞ immer gleich 0setzen. Diese Definition ist (im Lichte der Eigenschaften des Riemann-Integrals)natürlich. Bevor wir zu den weniger einfachen Funktionen weitergehen, werdenwir ein paar Eigenschaften des Integrals einer Treppenfunktion:Satz 6.1 Für das Integral von Treppenfunktionen gilt:1. Falls f ≥ g, dann ∫ f ≥ ∫ g.2. ∫ (f +g) = ∫ f + ∫ g (wie üblich müssen wir verlangen, dass die Summendefiniert sind).3. ∫ cf = c ∫ f (c ∈ R konstant).4. Das sogenannte unbestimmte Integral∫ ∫f(x)dµ(x) = 1 A (x)f(x)dµ(x)Aist eine sigmaadditive Funktion (<strong>und</strong> für f ≥ 0 ein <strong>Maß</strong>).42


KAPITEL 6. DAS INTEGRAL 43FürdieweitereDefinitionverwendenwirnatürlich,dassjedemessbareFunktiondurch Treppenfunktionen approximiert werden kann. Die direkte Idee istnatürlich, das Integral einer beliebigen messbaren Funktion f als den Grenzwertder Integrale einer Folge von Treppenfunktionen zu definieren, die gegenf konvergieren. Dabei gibt es zwei Schwierigkeiten: erstens gibt es Folgen vonTreppenfunktionen, die gegen eine Funktion f konvergieren, wobei aber ihre Integralenicht konvergieren. Dieses Problem kann man lösen, indem man vorerstnur nichtnegative Funktionen f betrachtet <strong>und</strong> f von unten durch (nichtnegative)Treppenfunktionen approximiert. Das geht auch, aber in diesem Fall istdie Wohlbestimmtheit des Integrals nachzuweisen, <strong>und</strong> um uns dies zu ersparendefinieren wirDefinition 6.1 f ≥ 0 sei messbar. Dann sei∫ ∫fdµ = sup{ tdµ : 0 ≤ t ≤ f,t Treppenfunktion}.Die Eigenschaften des Integrals einer Treppenfunktion lassen sich auf diesenFall übertragen. Das geht am einfachsten, wenn wir zuerst den folgenden Satzbeweisen:Satz 6.2 (monotone Konvergenz, Beppo Levi-Theorem) Falls f n ≥ 0eine monoton nichtfallende Folge ist, dann gilt∫ ∫lim f n = limf n .Für den Beweis benötigen wir zuerst, dass auch für nichtnegative messbareFunktionen aus f ≥ g folgt, dass ∫ f ≥ ∫ g. Das ergibt sich direkt aus derDefinition.Nun wählen wir eine Treppenfunktion t mit t ≤ f <strong>und</strong> ein ǫ > 0. Wir setzenE n = {x : f n (x) ≥ (1−ǫ)t(x)}.Da f n gegen f punktwiese konvergiert, ergibt sich⋃E n = Ω<strong>und</strong>∫∫f n ≥n∫1 En f n ≥ (1−ǫ)∫1 En t = (1−ǫ) t.E nWeil das unbestimmte Integral der nichtnegativen Treppenfunktion t ein <strong>Maß</strong>ist <strong>und</strong> daher stetig von unten, ergibt sich durch den Grenzübergang n → ∞∫ ∫f n ≥ (1−ǫ) t.limn→∞ǫ kann beliebig gewählt werden, daher gilt auch∫ ∫f n ≥ t.limn→∞


KAPITEL 6. DAS INTEGRAL 44Das wiederum gilt für jede Treppenfunktion 0 ≤ t ≤ f, damit auch, wenn rechtsdas Supremum eingesetzt wird, also∫ ∫f n ≥ f.limn→∞Die umgekehrte Ungleichung ergibt sich natürlich aus ∫ f n ≤ ∫ f.Aus dem Satz von der monotonen Konvergenz ergibt sich speziell, dass dasintegral von f mit dem Grenzwert der Integrale einer beliebigen Folge von nichtnegativenTreppenfunktionen übereinstimmt, die von unten gegen f konvergieren.Wir zeigen jetztSatz 6.3 Das Integral nichtnegativer messbarer Funktionen hat folgende Eigenschaften:1. Falls f ≥ g, dann ist ∫ f ≥ ∫ g.2. ∫ (f +g) = ∫ f + ∫ g.3. Für c > 0 gilt ∫ cf = c ∫ f.4. Das unbestimmte Integral ∫ f ist ein <strong>Maß</strong>.A5. Falls µ sigmaendlich ist folgt aus ∫ A f ≥ ∫ g für alle A, dass µ-fast überallAf ≥ g gilt.Der erste Punkt wurde bereits gezeigt. Für die nächsten beiden wählen wirnichtnegative Treppenfunktionen f n <strong>und</strong> g n , die von unten gegen f bzw. g konvergieren.Dann sind f n + g n <strong>und</strong> cf n ebenfalls Treppenfunktionen, die gegenf +g bzw. cf konvergieren, <strong>und</strong> die beiden Behauptungen ergeben sich einfachdurch den Grenzübergang n → ∞ aus den entsprechenden Eigenschaften derTreppenfunktionen.Für Behauptung 4 müssen wir zeigen, dass das unbestimmte integral nichtnegativ<strong>und</strong> sigmaadditiv ist. Die Nichtnegativität ist offensichtlich, <strong>und</strong> für dieSigmaadditivität stellen wir fest, dass für eine Folge A n von disjunkten messbarenMengenf1 ⋃ N = ∑ Nf1n=1 An Angegenf1 ⋃ ∞n=1 Ansteigt, <strong>und</strong> verwenden Punkt 2 <strong>und</strong> den Satz von der monotonen Konvergenz.Für den letzten Punkt setzen wir für zwei rationale Zahlen 0 ≤ a < bn=1A ab = {x : f(x) ≤ a,g(x) ≥ b}.Falls diese Menge positives <strong>Maß</strong> hat, gibt es wegen der Sigmaendlichkeit von µeine <strong>Teil</strong>menge B davon, die endliches positives <strong>Maß</strong> hat. Für diese Menge ist∫∫g ≥ bµ(B) > aµ(B) ≥ f,BB


KAPITEL 6. DAS INTEGRAL 45im Widerspruch zur Voraussetzung. Daher ist µ(A ab ) = 0 <strong>und</strong>⋃µ({x : f(x) < g(x)}) = µ( A ab ) = 0,a,b∈Q,a −∞, dann ist∫ ∫lim f n = limf n .


KAPITEL 6. DAS INTEGRAL 46Zum Beweis braucht man nur die ursprüngliche Version des Satzes auf die Funktionenf n −g anzuwenden.Aus diesem Satz erhalten wirSatz 6.6 (Lemma von Fatou) 1. Falls f n ≥ g mit ∫ g > −∞, dann ist∫ ∫liminff n ≤ liminf f n .2. Falls f n ≤ g mit ∫ g < ∞, dann ist∫ ∫limsupf n ≥ limsupf n .3. Falls |f n | ≤ g mit ∫ g < ∞, dann ist∫ ∫ ∫liminff n ≤ liminf fn. ≤∫limsupf n ≤limsupf n .ZumBeweisvon1.stellenwirfest,dassliminff n = limg n ,wobeig n = inf k≥n f k .g n ist eine nichtfallende Folge, <strong>und</strong> es gilt g ≤ g n ≤ f n . Wir könne also auf dieFolge g n den Satz von der monotonen Konvergenz anwenden, <strong>und</strong> erhalten∫ ∫ ∫ ∫ ∫liminff n = limg n = lim g n = liminf g n ≤ liminf f n .Punkt 2. folgt aus Punkt 1., wenn wir die Folge −f n betrachten, <strong>und</strong> Punkt3. ist eine Kombination aus den ersten beiden. Wenn zusätzlich f n konvergiert,dann ergibt sichSatz 6.7 (Satz von der dominierten Konvergenz) Falls |f n | ≤ g mit ∫ g 0 eine eine integrierbare Funktion g ǫ existiert, sodass∫|f n |I |fn|>g ǫ≤ ǫ.Bemrkungen:


KAPITEL 6. DAS INTEGRAL 471. Die gleichmäßige Integrierbarkeit wird meist für endliche <strong>Maß</strong>e definiert,<strong>und</strong> mit konstanten Funktionen g ǫ (die dann meistens M ǫ heißen. UnsereDefinition ist in diesem Spezialfall natürlich dazu äquivalent.2. In diesem Sinne könnten wir g ǫ = M ǫ h verlangen, mit Konstanten M ǫ <strong>und</strong>einer integrierbaren Funktion h, die für alle ǫ dieselbe ist.3. Wegen 2(|f| − g/2) + ≤ |f|I |f|>g ≤ (|f| − g) + ist die gleichmäßige Integrierbarkeitäquivalent dazu, dass es integrierbare Funktionen g ǫ gibt,sodass ∫(|f n |−g e psilon) + ≤ ǫ.Satz 6.8 Wenn f n → f fast überall, <strong>und</strong> (f n ) gleichmäsig integriebar ist, dann∫ ∫lim fn = f.Offensichtlich bleibt ∫ |f n | beschränkt, <strong>und</strong> das Lemma von Fatou impliziert,dass auch f integrierbar ist.Wirkönnenannehmen,dassg ǫ ≥ |f|gilt(wirkönnenjag ǫ durchmax(|f|,g ǫ )ersetzen).Wir setzen h n = max(−g ǫ ,min(f n ,g ǫ )) <strong>und</strong> stellen fest, dass∫ ∫ ∫ ∫| f n − h n | ≤ |f n −h n | = (|f n |−g ǫ ) + ≤ ǫ.∫hn konvergiert aber nach dem Satz von der dominierten Konvergenz gegen∫f, also unterscheidet sich∫fn für hinreichend großes n um weniger als 2ǫ von∫fn .Anmerkung: in den beiden letzten Sätzen ergibt sich durch Anwendung desselbenSatzes auf f n −f, dass auch ∫ |f n −f| gegen null geht.6.3 Riemann-IntegraleIn diesem Abschnitt wollen wir den Zusammenhang zwischen der Integration imRiemannschen Sinn <strong>und</strong> dem Lebesgue-Integral untersuchen. Dazu haben wirSatz 6.9 Die Funktion f : [a,b] → R ist genau dann Riemann-integrierbar,wenn sie beschränkt ist, <strong>und</strong> wenn das Lebesguemaß der Menge ihrer Unstetigkeitsstellen0 ist, <strong>und</strong> es gilt∫ ba∫f(x)dx =(a,b]fdλ.Die Beschränktheit ist jedenfalls notwendig, da sonst die Obersummen (bzw.die Untersummen, wenn f nach unten unbeschränkt ist) unendlich werden.


KAPITEL 6. DAS INTEGRAL 48Wir wählen nun eine Folge von Unterteilungen t (n)0 = a < t (n)1 < ... < t (n)n =b, <strong>und</strong> setzen<strong>und</strong>∫g n (t) =h n (t) =sup f(t) (t (n)i−1 < t ≤ t(n) i ,i = 1,...n)t (n)i−1 ≤t≤t(n) iinft (n)i−1 ≤t≤t(n) if(t) (t (n)i−1 < t ≤ t(n) i ,i = 1,...n)(a,b] g ndλ <strong>und</strong> ∫ (a,b] h ndλ sind genau die Riemannschen Ober- <strong>und</strong> Untersummenzu dieser Zerlegung. Wir definieren weiter<strong>und</strong>M ǫ (x) =m ǫ (x) =sup f(t)t∈(a,b],|x−t| 0, sodass das Intervall (t−ǫ,t+ǫ) keinender Punkte t (n)i enthält, <strong>und</strong> daher istg n (t) ≥ M ǫ (t) ≥ M(t)


KAPITEL 6. DAS INTEGRAL 49<strong>und</strong>h n (t) ≤ m ǫ (t) ≤ m(t).Daraus <strong>und</strong> aus den Überlegungungen vorher ergibt sich, dass λ-fast überall<strong>und</strong>limh n (t) = m(t)limg n (t) = M(t)gilt.f ist genau dann Riemann-integrierbar, wenn die Grenzwerte der Obersummen<strong>und</strong> der Untersummen übereinstimmen. Das ist genau dann der Fall, wenn∫ ∫mdλ = Mdλ,<strong>und</strong> wegen m ≤ f ≤ M ist das gleichbedeutend mit m = f = M λ-fast überall.Die Punkte, in denen m(t) = M(t) gilt, sind aber genau die Stetigkeitspunktevon f. Darüber hinaus gilt, dass∫ ba∫f(x)dx =(a,b]∫mdλ =(a,b]fdλ,weil ja m <strong>und</strong> f fast überall übereinstimmen.Dieser Satz hat insbesondere zur Folge, dass wir das Lebesgue-Integral alsRiemann-Integral ausrechnen können, wenn f Riemann-integrierbar ist. Das gilteinstweilen nur für endliche Intervalle, aber man sieht leicht, dass es auch für unendlicheIntervall gilt, wenn das entsprechende uneigentliche Riemann-Integralabsolut konvergiert. Ist das nicht der Fall (etwa für die Funktion sin(x)/x),dann existiert das Lebesgue-Integral nicht.Wenn man die Überlegungen von vorhin weitertreibt, kommt man zum folgendenSatz 6.10 F sei eine Verteilungsfunktion, die in den Punkten a 1 < a 2 < ...


KAPITEL 6. DAS INTEGRAL 50Der Beweis geht nach dem üblichen Schimmel: für Indikatorfunktionen istdas genau die Definition des Induzierten <strong>Maß</strong>es, die Linearität des Integrals beweistden Satz für Treppenfunktionen, nichtnegative messbare Funktionen werdendurch Treppenfunktionen von unten approximiert, <strong>und</strong> allgemeine messbareFunktionen in Positiv- <strong>und</strong> Negativteil zerlegt. Dabei kann man feststellen, dass,wenn eines der beiden Integrale existiert, dann auch das andere.6.4 Erwartungswerte(Ω,S,P) sei ein Wahrscheinlichkeitsraum, X eine rellwertige Zufallsvariable.Dann nennen wir ∫E(X) = XdPden Erwartungswert von X. Wenn es nötig ist, das <strong>Maß</strong>, bezüglich dem wirintegrieren, zu spezifizieren, schreiben wir E P .Neben den bekannten Eigenschaften des Integrals (Linearität, Additivität,etc.) können wir feststellenSatz 6.12 X <strong>und</strong> Y seien unabhängig <strong>und</strong> integrierbar (oder beide nichtnegativ).Dann giltE(XY) = E(X)E(Y).Wir können uns auf den Fall beschränken, dass X <strong>und</strong> Y nichtnegativ sind,weil (XY) + = X + Y + +X − Y − gilt. Wir können X <strong>und</strong> Y durch Treppenfunktionender Form ∑ a i I X≤xi bzw. ∑ b j I Y≤yj von unten approximieren, deshalbgenügt es, den Satz für Treppenfunktionen zu beweisen.Dafür giltE(XY) = ∑ i,ja i b j P(X ≤ x i ,Y ≤ y j ) = ∑ i,ja i b j P(X ≤ x i )P(Y ≤ y j ) = E(X)E(Y).Der Erwartungswert kann als “typischer Wert” oder “Lageparameter” derVerteilung von X angesehen werden. Wenn man zusätzlich wissen will, wie gutdieser Wert die Zufallsvariable repräsentiert, kann man etwa das Mittel der(absoluten) Abstände betrachten. Da der Absolutbetrag nicht so leicht zu behandelnist, wählen wir zum Entfernen des Vorzeichens lieber das Quadrat:Definition 6.3V(X) = E((X −E(X)) 2 )heißt die Varianz von X. Die Quadratwurzel der Varianz heißt Streuung oderStandardabweichung.Wir stellen fest:Satz 6.13 (Eigenschaften der Varianz)1. V(aX +b) = a 2 V(X),


KAPITEL 6. DAS INTEGRAL 512. V(X) = E((X −a) 2 )−(EX −a) 2 (Steiner’scher Verschiebungssatz),3. V(X +Y) = V(X)+V(Y), wenn X <strong>und</strong> Y unabhängig sind.Die erste Behauptung folgt direkt aus der Linearität des Integrals, weil<strong>und</strong> daherE(aX +b) = aE(X)+baX +b−E(aX +b) = a(X −E(X)).Diese Beziehung erlaubt es uns, f’ur die beiden anderen Behäuptungen o.B.d.A.E(X) = 0 anzunehmen.Dann ist<strong>und</strong>E((X −a) 2 ) = E(X 2 −2aX +a 2 ) = E(X 2 )+a 2 = V(X)+a 2 .V(X +Y) = E((X +Y) 2 ) = E(X 2 )+2E(XY)+E(Y 2 ) =V(X)+2E(X)E(Y)+V(X) = V(X)+V(Y).Die Summenformel für die Varianzen lässt sich im allgemeinen Fall so schreiben:V(X +Y) = V(X)+V(Y)+2Cov(X,Y),wobeiC⋊(X,Y) = E((X −E(X))(Y −E(Y))) = E(XY)−E(X)E(Y)die Kovarianz von X <strong>und</strong> Y genannt wird. Wenn die Kovarianz gleich 0 ist,heißen X <strong>und</strong> Y unkorreliert.Für eine Folge X n von reellen Zufallsvariablen definieren wir die Partialsummenn∑S n = X i (S 0 = 0).i=0Wenn die Zufallsvariablen unkorreliert sind <strong>und</strong> endliche Varianzen haben, danngiltn∑V(S n ) = V(X i ).i=1Haben alle X i dieselbe Varianz σ 2 , dann istV(S n ) = nσ 2 .Für ¯X n = S n /n, das Stichprobenmittel, ergibt sich damitV( ¯X n ) = σ 2 /n.Diese Feststellung führt uns zu einigen zentralen Sätzen der <strong>Wahrscheinlichkeitstheorie</strong>,den Gesetzen der großen Zahlen. Dazu benötigen wir zuerst einigeSätze zur Abschätzung von Wahrscheinlichkeiten mit Hilfe der Varianz bzw.Erwartungswerte.Der erste Satz gilt nicht nur für Wahrscheinlichkeitsmaße:


KAPITEL 6. DAS INTEGRAL 52Satz 6.14 (Ungleichung von Markov) Falls f ≥ 0, dann gilt für jedes c > 0µ({x : f(x) ≥ c}) ≤ 1 ∫fdµ.cZum Beweis setzen wir∫ ∫ ∫fdµ = fdµ+ fdµ ≥{x:f(x)≥c} {x:f(x) 0P(|X −E(X)| ≥ c) ≤ V(X)c 2 .Zum Beweis wenden wir die Ungleichung von Markov auf die ZufallsvariableY = (X −E(X)) 2 :P(|X −E(X)| ≥ c) = P(Y > c 2 ) ≤ E(Y)c 2Diese Ungleichung gibt uns= V(X)c 2 .Satz 6.16 (schwaches Gesetz der großen Zahlen) Sind die Zufallsvariablen(X n ,n ∈ N) unabhängig <strong>und</strong> identisch verteilt mit endlicher Varianz, danngilt¯X n → E(X 1 ) in Wahrscheinlichkeit.Beweis: Die Ungleichung von Chebychev impliziert, dassP(| ¯X n −E(X 1 )| > ǫ) ≤ V(X 1)nǫ 2 → 0.Dieses Gesetz lässt einigen Spielraum für Verbesserungen: Wenn man aufder linken Seite E(X 1 ) durch das Mittel der Erwartungswerte ersetzt, brauchtman nicht mehr anzunehmen, dass alle Variablen identisch verteilt sind, die Unabhängigkeitlässt sich durch die Unkorreliertheit ersetzen, <strong>und</strong> auch die GleichheitderVarianzenlässtsichdurchdieForderungersetzen,dass∑ i≤n V(X i)/n 2 →0. Ja, man kann sogar auf die Unkorreliertheit verzichten: etwa wenn die Varianzenbeschränkt sind <strong>und</strong>lim sup Cov(X i ,X i+n ) → 0.n→∞iWir interessieren uns jetzt für die fast sichere Konvergenz. Als kleine Kuriositätzeigen wir einen Satz der ohne Unabhängigkeit auskommt.


KAPITEL 6. DAS INTEGRAL 53Satz 6.17 (Halbstarkes Gesetz;-)) . (X n ) sei eine Folge von unkorreliertenZufallsvariablen mit E(X n ) = 0 <strong>und</strong> V(X) ≤ 1 (der Einfachheit halber). DanngiltP( ¯X n → 0) = 1.<strong>und</strong>Wir stellen fest, dass wegen der Ungleichung von Chebychev die Reihen∑P(|X| > n 1/2+ǫ )nsum k P(S k 1+3ǫ > k 1+2ǫ )konvergieren. Damit gelten mit Wahrscheinlichkeit 1 die umgekehrten Ungleichungfür fast alle n bzw. k. Für(k −1) 1+3ǫ ≤ n ≤ k 1+3ǫkönnen wir abschätzen (mit n k = k 1+3ǫ )|S n | ≤ |S n( k−1)|+n∑i=n k−1 +1X i ≤ k 1+2ǫ +(n k −n k−1 )n 1/2+ǫkk ( 1+2ǫ)+(1+3ǫ)k 3ǫ k (1/2+ǫ)(1+3ǫ) .Für hinreichen kleines ǫ (etwa 0.1) dominiert der erste Term, <strong>und</strong>|S n |n ≤ 2k−ǫ .Damit geht ¯X n → 0, <strong>und</strong> wir könnten sogar noch eine Konvergenzrate angeben.Wenn man Unabhängigkeit annimmt, kann man natürlich mehr erreichen.Zuerst haben wir eine Verschärfung der Chebychev’schen Ungleichung:Satz 6.18 (Ungleichung von Kolmogorov) X 1 ,...,X n seien unabhängigeZufallsvariable mit E(X i ) = 0 <strong>und</strong> V(X i ) = σi 2 < ∞. Dann gilt für c > 0Zum Beweis setzen wirP( max0≤i≤n |S i| ≥ c) ≤ V(S n)c 2 .Y i = [|S i | ≥ c,|S j | < c,j < i].Y i ist genau dann 1, wenn S n beim Index i zum ersten Mal c erreicht (oderüberschreitet). Offensichtlich gilt ∑ Y i ≤ 1 <strong>und</strong>[max |S i ≥ c] = ∑ Y i .i≤ni≤n≤


KAPITEL 6. DAS INTEGRAL 54Wir erhaltenV(S n ) = E(S 2 n) ≥ E(S 2 n∑i ≤ nYi ).Für die Summanden der letzten Summe giltE(Y i (S n ) 2 ) = E(Y i S 2 i)+2E(Y i S i (S n −S i ))+E(Y i (S n −S i ) 2 .Im ersten Summanden können wir S 2 i mit c2 nach unten abschätzen, im zweitenist S n − S − i von den anderen beiden Faktoren unabhängig, damit ist derErwartungswert des Produkts gleich dem Produkt der Erwartungswerte <strong>und</strong>damit 0, <strong>und</strong> der letzte Summand ist nicht negativ. Damit haben wir insgesamtV(S n ) ≥ c 2 E( ∑ i≤nY i ) = c 2 P(maxi≤n |S i| ≥ c).Der erste Satz, den wir beweisen, beschäftigt sich mit der Konvergenz derSumme ohne Skalierung:Satz 6.19 (Dreireihensatz von Kolmogorov) (X n ) sei eine Folge von unabhängigenZufallsvariablen. Die Reihe∑nkonvergiert genau dann, wenn die folgenden drei Reihen konvergieren (für irgendeinǫ > 0 <strong>und</strong> damit für alle):∑P(|X n | > ǫ)nX n∑E(X n [|X n | ≤ ǫ])n∑V(X n [|X n | ≤ ǫ]).nWir beweisen zuerst, dass für eine Folge (X n ) mit Erwartungswert 0 die Reihe∑Xn konvergiert, wenn die Summe der Varianzen endlich ist. Die Ungleichungvon Kolmogorov ergibtFür m → ∞ erhalten wir<strong>und</strong> schließlichP( maxn≤i≤m |S i −S n | > ǫ) ≤P(maxn≤i |S i −S n | > ǫ) ≤∑n≤i≤m V(X i)ǫ 2 .∑n≤i V(X i)ǫ 2P(limsup|S i −S n | > ǫ) = lim P(max|Si −S n | > ǫ) ≤ limi,n→∞n→∞ n≤i n→∞∑n≤i V(X i)ǫ 2 = 0.


KAPITEL 6. DAS INTEGRAL 55Von hier aus ist es nur ein kurzer Schritt zum Beweis, dass die Konvergenzder drei Reihen hinreichend für de Konvergenz von ∑ X n ist: Aus der Konvergenzder ersten Reihe folgt durch das Borel-Cantelli Lemma, dass für fast alle n|X n | < ǫ gilt. Deshalb stimmen die Variablen X n <strong>und</strong> Y n = X n [|X n | ≤ ǫ] für fastalle n übereinstimmen. Deshalb konvergiert die Reihe ∑ X n genau dann, wenn∑Yn konvergiert. Wenn ∑ V(Y n ) konvergiert, dann konvergiert ∑ (Y n −E(Y n )),wie wir gerade bewiesen haben, <strong>und</strong> wenn auch noch ∑ E(Y n ) konvergiert, konvergiertauch ∑ Y n <strong>und</strong> damit ∑ X n .Die Notwendigkeit der Dreireihenbedingung benötigt ein paar zusätzlicheTricks. Der erste Schritt ist einfach: wenn die erste Reihe divergiert, ist nachdemzweitenLemmavonBorel-Cantellifastsicherfürunendlichvielen|X n | > ǫ,<strong>und</strong> deshalb kann die Reihe ∑ X n nicht konvergieren. Wenn ∑ X n konvergiert,muss also die erste Reihe konvergieren. Dann müssen auch die abgeschnittenenZufallsvariablen Y n eine konvergente Reihe bilden.Es bleibt also zu zeigen, dass für beschränkte Zufallsvariable die Konvergenzvon Reihe 2 <strong>und</strong> 3 notwendig für die Konvergenz der Reihe der Zufallsvariblenist. Wir zeigen dies zuerst für den Sonderfall, dass alle Y n Erwartungswert 0haben. Dann konvergiert die zweite Reihe trivialerweise, <strong>und</strong> es geht nur nochum die dritte.Wir benötigen eine Umkehrung der Ungleichung von Kolmogorov:Satz 6.20 (Ungleichung von Kolmogorov 2) (X 1 ,...,X n ) seien unabhängigmit E(X i ) = 0, V(X i ) = σ 2 i < ∞ <strong>und</strong> |X i| ≤ a < ∞. Dann gilt für c > 0<strong>und</strong>Zum Beweis setzen wirP(maxi≤n |S n| ≤ c) ≥ 1− (a+c)2V(S n ) .A i = [|S j | < c,0 ≤ j ≤ i],B i = [|S j | < c,0 ≤ j < i,|S i | ≥ c],Y i = I AiZ i = I Bi .Offenssichtlich gilt für i > 0 Y i−1 = Y i +Z i . Damit können wir schreiben:S i Y i−1 = S i Y i +S i Z i = S i−1 Y i−1 +X i Y i−1 .Wir quadrieren <strong>und</strong> nehmen Erwartungswerte. Dabei fallen auf beiden Seitendie gemischten Glieder weg, links, weil Y i Z i = 0 gilt, aud der rechten Seite, weilX i von Y i−1 S i−1 unabhängig ist. Damit erhalten wirn∑(E(SiY 2 i )+E(SiZ 2 i )) =i=1n∑(E(Si−1Y 2 i−1 )+E(XiY 2 i−1 )).i=1


KAPITEL 6. DAS INTEGRAL 56WirhebengleicheGliederaufbeidenSeitenweg<strong>und</strong>verwendendieUnabhängigkeitvon X i <strong>und</strong> Z i−1 :n∑n∑σiP(A 2 i−1 ) = E(SnY 2 n )+ E(SiZ 2 i )).i=1Auf der rechten Seite gelten die Abschätzungen SnY 2 n ≤ c 2 Y n ≤ (a+c) 2 Y n <strong>und</strong>Si 2Z i ≤ (a+c) 2 Z i . Auf der linken Seite gilt P(A i−1 ) ≥ P(A n ). Damit ergibt sichn∑n∑P(A m ) σi 2 ≤ (a+c) 2 (P(A n )+ P(B i )) = (a+c) 2 .Die Feststellungi=1i=1i=1[maxi≤n |S i| ≥ c] = A C n<strong>und</strong> elementare Umformungen geben die Aussage des Satzes.NunkehrenwirzumDreireihensatz(derjetztzumEinreihensatzgeschrumpftist) zurück. Wir nehmen an, dass die Zufallsvariablen X n Erwartungswert 0 haben,beschränkt (|X n | < c) sind <strong>und</strong> die Reihe ihrer Varianzen divergiert (alsReihe mit positiven Gliedern natürlich gegen ∞).Dann gilt nach dem vorigen Satz für jedes a > 0P(sup |S n | > a) = lim P(max|S(a+c)2n| > a) ≥ lim 1−n∈N N→∞ n≤N N→∞ V(S N ) = 1.Das Supremum der Beträge ist also mit Wahrscheinleichkeit 1 größer als jedepositiveSchranke<strong>und</strong>daherunendlich.DaherkanndieFolgederPartialsummengegen keinen endlichen Grenzwert konvergieren.Es bleibt noch der Fall zu besprechen, dass die beschränkten ZufallsvariablenX n nicht notwendig verschwindenden Erwartungswert haben. In diesem Fallgreifen wir zu einem Kunstgriff, dessen Rechtfertigung im Kapitel über Produkträumeerfolgt. Wir nehmen an, dass wir eine zweite Folge von unabhängigenZufallsvariablen (X ′ n) definieren können, die unabhngig von der ersten ist, sodassX n <strong>und</strong> X ′ n dieselbe Verteilung haben. Dann konvergiert auch ∑ X ′ n mitpositiver Wahrscheinlichkeit, wenn wir annehmen, dass das für ∑ X n gilt. DieDifferenzen Y n = X n −X ′ n sind dann ebenfalls beschränkt, E(Y n ) = 0 <strong>und</strong> ∑ Y nkonvergiert ebenfalls mit positiver Wahrscheinlichkeit. Auf Y n können wir dasErgebnis von vorhin anwenden, <strong>und</strong> stellen fest, dass ∑ V(Y n ) = 2 ∑ V(X n )endlich sein muss. Da nun aber die Summe der Varianzen von X n konvergiert,konvergiert jedenfalls die Reihe ∑ (X n −E(X n )) mit Wahrscheinichkeit 1. damitauch ∑ X n konvergiert, muss die Differenz der beiden Reihen ebenfalls konvergieren,<strong>und</strong> das ist genau ∑ E(X n ). Damit ist der Dreireihensatz bewiesen.Als (beinahe) Folgerung erhalten wirSatz 6.21 (Starkes Gesetz der großen Zahlen von Kolmogorov) X n seienunabhängige Zufallsvariable mit∑n∈NV(X n )n 2 < ∞.


KAPITEL 6. DAS INTEGRAL 57Dann giltfast sicher.1limn→∞ n∑(X k −E(X k )) = 0k≤nZum Beweis nehmen wir ohne Beschränkung der Allgemeinheit an, dassE(X n ) = 0 gilt. Weiters merken wir an, dass wir im Beweis des Dreireihensatzesgezeigt haben, dass eine Reihe von Zufallsvariablen mit Erwartungswert 0 fastsicher konvergiert, wenn die Reihe ihrer Varianzen konvergiert. Damit wissenwir, dass mit Wahrscheinlichkeit 1 die Reihe∑ X nnnkonvergent ist. Damit sind wir auch schon fast fertig, denn die Behauptungunseres Satzes folgt aus dem folgenden Hilfssatz:Satz 6.22 (Kronecker-Lemma) a n sei eine Folge von positiven Zahlen mita n ↑ ∞. Wenn ∑ x nn a nkonvergiert, dann gilt∑k≤nlimx k= 0.n→∞ a nWir setzens n =∞∑k=nx ka k.Laut Vorraussetzung konvergieren diese Reihenreste gegen 0, also gibt es zujedem ǫ > 0 ein n 0 , sodass für n ≥ n 0 |s n | < ǫ gilt. Es giltx n = a n (s n −s n+1 ).Damit erhalten wirn∑ n∑x k = a k (s k −s k+1 ) = a 1 s 1 −a n s n+1 +k=1k=1n∑s k (a k −a k−1 ).Wennwirdasdurcha n dividieren,gehendieerstenbeidenTermeaufderrechtenSeite gegen 0, <strong>und</strong> für die Summe erhalten wirn∑n∑| s k (a k = a k−1 )| ≤ |s k |(a k −a k−1 ) ≤k=2n∑0−1k=2k=2k=2|s k |(a k −a k−1 )+ǫ(a n −a n0 ).Der erste Term bleibt beschränkt, deshalb geht die obere Schranke für n → ∞gegen ǫ, wenn man sie durch a n dividiert. Da ǫ > 0 beliebig gewählt werdenkann, ergibt sich die gewünschte Konvergenz der Mittelwerte gegen 0.Für identisch verteilte Zufallsvariable können wir auf die Varianzen verzichten:


KAPITEL 6. DAS INTEGRAL 58Satz 6.23 (X n ) sei eine Folge von unabhängig identisch verteilten Zufallsvariablenmit endlichem Erwartungswert. Dann gilt fast sicher1limn→∞ n∑X k = E(X 1 ).k≤nWir setzen Y n = X n I [−n,n] (X n ). WegenE(|X 1 |) =∫ ∞0∞∑∞∑P(|X 1 | > x)dx ≥ P(|X n | > n) = P(Y n ≠ X n )n=1folgt aus dem Borel-Cantelli Lemma, dass mit Wahrscheinlichkeit 1 für fast allen X n = Y n gilt, also konvergieren die Mittelwerte der X n genau dann, wenn dieMittelwerte der Y n konvergieren, <strong>und</strong> die beiden Grenzwerte stimmen überein.Da E(Y n ) → E(X 1 ) gilt, gilt auch1 ∑lim i = 1 n E(Y i ) = E(X 1 ).n→∞ nWir müssen also nur noch zeigen, dass die Y n die Voraussetzungen des erstenGesetzes der großen Zahlen erfüllen. Es ist∑n∈NV(Y n )n 2≤ ∑ n∈N1+E(X 2 1E(Y 2 n)n 2∑n≥|X 1|+1= ∑ n∈Nn=1E(X 2 1I [−n,n] (X 1 ))n 2 = E(X 2 1∑n≥|X 1|1n 2) ≤ 11+E(X2 1|X 1 | = 1+E(|X 1|) < ∞.1n 2) ≤Damit ist das erste Gesetz der großen Zahlen auf die Y n anwendbar, <strong>und</strong>unser zweiter Satz bewiesen.


Kapitel 7Signierte <strong>Maß</strong>eIn diesem Kapitel wollen wir uns mit sigmaadditiven Funktionen beschäftigen,dienichtnotwendignichtnegativsind.AlsMotivationbetrachtenwireinIntegral∫ν(A) = fdµ.Wir haben schon früher festgestellt, dass dadurch eine sigmaadditive Funktiondefiniert ist, wenn das Integral von f existiert. Dieses Integral können wirzerlegen:∫ ∫ν(A) = f + dµ− f − dµ.AAWenn wir ν 1 (A) = ∫ A f +dµ <strong>und</strong> ν 2 (A) = ∫ A f −dµ setzen, dann haben wirdadurch eine DarstellungAν(A) = ν 1 (A)−ν 2 (A)von ν als Differenz zweier <strong>Maß</strong>e gef<strong>und</strong>en. Wenn wir noch<strong>und</strong>P = {x : f(x) ≥ 0}N = P C = {x : f(x) < 0}setzen, dann ist für jede <strong>Teil</strong>menge A von P ν(A) ≥ 0 , <strong>und</strong> für A ⊆ N istν(A) ≤ 0. Außerdem gilt ν 1 (N) = ν 2 (P) = 0.Wir definieren nunDefinition 7.1 Eine Funktion µ heißt signierte <strong>Maß</strong>funktion (oder signiertes<strong>Maß</strong>), wenn1. sie auf einem Sigmaring S definiert ist,2. ihr Wertebereich entweder (−∞,∞] oder [−∞,infty) ist (d.h., es könnennicht sowohl +∞ <strong>und</strong> −∞ als Werte auftreten)59


KAPITEL 7. SIGNIERTE MASSE 603. sie sigmaadditiv ist, also für disjunkte Mengen A n ∈ Sµ( ⋃ A n ) = ∑ µ(A n ),wobei in der rechten Reihe entweder die Summe der positiven Glieder oderdie Summe der negativen Glieder endlich sein muss (diese Bedingung <strong>und</strong>die aus Punkt 2. stellen sicher, dass bei der Addition keine unbestimmtenFormen auftreten).Die Eigenschaften, die wir oben für Integrale gef<strong>und</strong>en haben, wollen wir aufdiesen allgemeineren Fall übertragen. Dazu definieren wir:Definition 7.2 µ sei ein signiertes <strong>Maß</strong> auf (Ω,S). Eine Menge A ∈ S heißtpositiv (negativ) wenn für jede messbare <strong>Teil</strong>menge B von A µ(B) > 0 (< 0)ist. Wenn f:ur jede messbare <strong>Teil</strong>menge B von A µ(B) = 0 ist, dann heißt Aeine Nullmenge.Definition 7.3 µ sei ein signiertes <strong>Maß</strong> auf (Ω,S). Das Paar (P,N) heißteine HAHN-Zerlegung, wenn1. P,N ∈ S,2. P ∩N = ∅,3. P ∪N = Ω,4. P positiv, N negativ.Definition 7.4 Zwei <strong>Maß</strong>funktionen µ 1 <strong>und</strong> µ 2 auf demselben <strong>Maß</strong>raum (Ω,S)heißen singulär zueienander (µ 1 ⊥ µ 2 ), wenn es eine messbare Zerlegung (A,B)von Ω (d.h., A,B ∈ S, A∩B = ∅, A∪B = Ω) gibt, sodass µ 1 (A) = µ 2 (B) = 0.Definition 7.5 µ sei eine signierte <strong>Maß</strong>funktion. Eine Darstellungµ(A) = µ + (A)−µ − (A)mit zwei singulären <strong>Maß</strong>funktionen µ + <strong>und</strong> µ − heißt eine Jordan-Zerlegung vonµ.Der zentrale Satz dieses Kapitels ist derSatz 7.1 (Zerlegungssatz von HAHN) Zu jeder signierten <strong>Maß</strong>funktion gibtes mindestens eine HAHN-Zerlegung.Wir stellen als erstes fest, dass es zu jeder Menge A aus S mit µ(A) < 0 einenegative <strong>Teil</strong>menge gibt, deren <strong>Maß</strong> nicht größer ist als das von A. Dazu gehenwir vor wie ein Inuitbildhauer, wenn er ein Walross schnitzt — wir schneideneinfach alles weg, was nicht wie eine negative Menge aussieht. Genauer gesagt,


KAPITEL 7. SIGNIERTE MASSE 61wollen wir annehmen, dass µ den Wert −∞ nicht annimmt. Dann setzen wirA 1 = A, <strong>und</strong> für n ≥ 1k n = inf{k ∈ N : ∃B ⊂ A n : µ(B) ≥ 1/k},(mit der Konvention inf∅ = ∞) <strong>und</strong> wählen B n so, dass B n ⊂ A <strong>und</strong> µ(B n ) ≥1/k n , <strong>und</strong> schließlich A n+1 = A n \ B n (natürlich nur falls k n endlich ist; fallsk n = ∞, dann ist A n aber schon eine positive Menge).Wir zeigen, dassC = A\ ⋃ B n = ⋂ A neine negative Menge ist. Da µ(C) > −∞ ist, gilt∑ 1k n≤ ∑ µ(B n ) = µ(A)−µ(C) < ∞,also konvergiert diese Reihe, <strong>und</strong> insbesondere gilt k n → ∞. Dann folgt ausD ⊂ C, dass D ⊂ A n <strong>und</strong> daher µ(D) < 1k n−1, <strong>und</strong> für n → ∞ ergibt sichµ(D) ≤ 0, also ist C negativ.Als nächstes zeigen wir, dass für eine Folge A n von negativen Mengen dieVereinigungA = ⋃ A neine negative Menge ist <strong>und</strong> dass für jedes n µ(A) ≤ µ(A n ) gilt. Dazu setzenwirB n = A n \ ⋃A i .Die Mengen B n sind disjunkt, <strong>und</strong> es gilt A = ⋃ B n . Für eine Menge C ⊂ Agiltµ(C) = µ( ⋃ C ∩B n ) = ∑ µ(C ∩B n ),<strong>und</strong> weil C ∩B n ⊂ A n gilt, ist µ(C ∩B n ) ≤ 0 <strong>und</strong> daher µ(C) ≤ 0.Nun setzen wiri


KAPITEL 7. SIGNIERTE MASSE 62Nach der Definition von K muss aber auch die umgekehrte Ungleichung gelten,<strong>und</strong> daher istµ(A) = K.Wir schließen daraus, dass K endlich ist, <strong>und</strong> behaupten, dass das Komplementvon A eine positive Menge ist. Andernfalls könnten wir eine <strong>Teil</strong>menge B vonA C finden, deren <strong>Maß</strong> negativ ist, <strong>und</strong> davon wieder eine negative <strong>Teil</strong>mengeD mit µ(D) ≤ µ(B) < 0. Dann wäre aber A ∪ D eine negative Menge mitµ(A ∪ D) < µ(A) = K im Widerspruch zur Definition von K. A C ist alsopositiv, <strong>und</strong> wir haben eine Hahn-Zerlegung mit P = A C <strong>und</strong> N = A gef<strong>und</strong>en.Nach der Existenz wollen wir uns jetzt kurz mit der Eindeutigkeit der Hahn-Zerlegung befassen. Es kann durchaus mehrere solche Zerlegungen geben, abersiekönnensichnichtbesondersstarkunterscheiden:WennmannämlichetwadieDifferenz P 1 \P 2 von den positiven Mengen der beiden Zerlegungen betrachtet,dann kann man diese natürlich auch als Durchschnitt P 1 ∩N 2 schreiben. Damitist sie sowohl eine <strong>Teil</strong>menge der positiven Menge P 1 als auch der negativenMenge N 2 , muss also eine Nullmenge sein. Zwei vershciedene Hahn-Zerlegungenunterscheiden sich also nur um Nullmengen.Ganz eindeutig ist die andere Zerlegung:Satz 7.2 µ sei ein signiertes <strong>Maß</strong> auf (Ω,S). Dann gibt es zu µ genau eineJordan-Zerlegung µ = µ + −µ − .Zum Beweis der Existenz brauchen wir nur eine HAHN-Zerlegung (P,N) zubetrachten <strong>und</strong>µ + (A) = µ(P ∩A),µ − (A) = −µ(N ∩A)zu setzen. Dadurch erhalten wir offensichtlich zwei <strong>Maß</strong>funktionen, für die µ =µ + − µ − gilt. Wegen µ + (N) = µ − (P) = 0 sind die beiden Funktionen auchsingulär zueinander.Wenn nun (µ + ,µ − ) eine Jordan-Zerlegung von µ ist, dann gibt es zwei disjunkteMengen B <strong>und</strong> C aus S, sodass µ + (B) = µ − (C) = 0 <strong>und</strong> B ∪C = Ω.Für ein beliebiges A gilt wegen µ + (A∩B) = µ − (A∩C) = 0µ + (A) = µ + (A∩B)+µ + (A∩C) = µ + (A∩C) = µ + (A∩C)−µ − (A∩C) = µ(A∩C),<strong>und</strong> ebensoµ − (A) = −µ(A∩B).Daraus erhält man , dass B eine negative Menge <strong>und</strong> C eine positive Menge ist,also ist (C,B) eine Hahn-Zerlegung. Wie wir oben festgestellt haben, kann sichdiese Zerlegung nur um Nullmengen von der Zerlegung (P,N) unterscheiden,<strong>und</strong> es istµ + (A) = µ + (A∩C) = µ + (A∩P)+µ + (A∩(C\P))−µ + (A∩(P\C)) = µ + (A∩P).Es stimmt also jede Jordan-Zerlegung mit der speziellen Zerlegung überein,die wir zum Beweis der Existenz konstruiert haben, <strong>und</strong> damit ist auch dieEindeutigkeit gezeigt.


KAPITEL 7. SIGNIERTE MASSE 63Für die einzelnen Komponenten der Jordan-Zerlegung haben wir spezielleBezeichnungen: µ + heißt die positive Variation von µ, µ − die negative Variation<strong>und</strong> |µ| = µ + +µ − die Totalvariation von µ (wenn µ ein endliches signiertes<strong>Maß</strong> auf R ist, dann ist F(x) = µ((−∞,x] gleich der Differenz der Verteilungsfunktionenvon µ + <strong>und</strong> µ − , also die Differenz zweier monotoner Funktionen <strong>und</strong>daher von beschränkter Variation, <strong>und</strong> die Verteilungsfunktion von |µ| ist genaudie Totalvariation von F über (∞,x]).7.1 Signierte <strong>Maß</strong>e auf RWir wenden uns jetzt dem Spezialfall (R,B) zu. Der Einfachheit halber betrachtenwir endliche <strong>Maß</strong>e. Ein endliches signiertes <strong>Maß</strong> µ können wir nachdem Zerlegungssatz von Jordan als Differenz zweier endlicher <strong>Maß</strong>e µ + <strong>und</strong> µ −darstellen. Zu diesen <strong>Maß</strong>sen gibt es Verteilungsfunktionen F + <strong>und</strong> F − <strong>und</strong> wirhabenµ((−∞,x]) = F + (x)−F − (x),also eine Differenz von zwei monotonen Funktionen.Wir definierenDefinition 7.6 Die Totalvariation einer Funktion f auf dem Intervall [a,b] istV [a,b] (f) = sup{n∑|f(t i )−f ( t i−1 )|,n ∈ N,a = t 0 < t 1 ,... < t n = b}.i=1Ersetzt man in dieser Definition den Betrag durch den Positiv- bzw. Negativteil,dann ergibt sich die positive Variation V +[a,b](f) bzw. die negative VariationV −[a,b](f) von f.Die Funktion f heißt von beschränkter Variation auf [a,b], wenn V [a,b] (f)


Kapitel 8Der Satz vonRadon-NikodymWir wollen uns nun der Frage zuwenden, unter welchen Bedingungen eine <strong>Maß</strong>funktionν sich als unbestimmtes Integral bezüglich einer anderen <strong>Maß</strong>funktionµ darstellen lässt, also wann eine messbare Funktion f gibt, sodass∫ν(A) = fdµgilt. Eine einfache notwendige Bedingung erhalten wir, wenn wir für A eine µ-Nullmenge einsetzen. Dann ist das Integral gleich 0 <strong>und</strong> damit auch ν(A). DieseBeziehung ist so wichtig, dass wir dafür einen eigenen Namen haben:Definition 8.1 µ <strong>und</strong> ν seien zwei <strong>Maß</strong>funktionen auf demselben Messraum(Ω,S). Falls für jedes A ∈ S mit µ(A) = 0 auch ν(A) = 0 ist, dann heißt νabsolutstetig bezüglich µ (ν ≪ µ).UnserenotwendigeBedingungistalso,dassν absolutstetigbezüglichµist.Untergewissen Umständen ist diese Bedingung auch hinreichend:Satz 8.1 (Radon-Nikodym) (Ω,S,µ) sei ein sigamendlicher <strong>Maß</strong>raum, <strong>und</strong>ν ein weiteres <strong>Maß</strong> auf S. ν ist genau dann als unbestimmtes Integral∫ν(A) = fdµdarstellbar, wenn ν ≪ µ. Die Funktion f ist µ-fast überall eindeutig bestimmt<strong>und</strong> nichtnegativ, <strong>und</strong> wird die Radon-Nikodym Ableitung (Radon-Nikodym Dichte,Radon-Nikodym Derivierte) von ν nach µ,bezeichnet.AAf = dνdµ64


KAPITEL 8. DER SATZ VON RADON-NIKODYM 65Für den Beweis nehmen wir der Einfachheit halber an, dass µ endlich ist. Derallgemeine Fall lässt sich daraus erhalten, indem man Ω in abzählbar viele disjunkteMengen E n mit endlichem <strong>Maß</strong> zerlegt. Für die Einschränkung von ν<strong>und</strong> µ auf E n kann man die Radon-Nikodym Dichte f n berechnen (weil ja dieEinschränkung von µ auf E n ein endliches <strong>Maß</strong> ist), <strong>und</strong> schließlich kann manf(x) = f n (x) für x ∈ E n setzen.Wir werden unser Wissen über signierte <strong>Maß</strong>funktionen verwenden, um dieExistenz einer Radon-Nikodym Dichte zu beweisen. Dazu überlegen wir unsfolgendes: wenn wir annehmen, dass ν als Integral darstellbar ist, dann erhaltenwir für∫ν(A)−cµ(A) = (f −c)dµeine Hahn-Zerlegung, wenn wir P = {x : f(x) > c} setzen. Wir gehen denumgekehrten Weg, <strong>und</strong> werden die Funktiion f so wählen, dass sie auf derpositiven Menge einer Hahn-Zerlegung von ν − cµ ≥ c ist. Dabei haben wirnatürlich ein kleines technisches Problem, weil die Hahn-Zerlegung nur bis aufNullmengen eindeutig bestimmt ist. Wir können dieses Problem lösen, indemwirnurabzählbarvieleverschiedeneWertefürcbetrachten.Essollalsofürjedesrationale c ≥ 0 (P c ,N c ) eine Hahn-Zerlegung von ν − cµ sein. Es soll P 0 = Ωsein, <strong>und</strong> wir können annehmen, dass für c < d N c ⊆ N d gilt. Es gilt nämlichweil einerseits<strong>und</strong> andererseitsalsoAµ(N c \N d ) = 0,ν(N c \N d )−cµ(N c \N d ) ≤ 0ν(N c \N d )−dµ(N c \N d ) ≥ 0dµ(N c \N d ) ≤ ν(N c \N d ) ≤ cµ(N c \N d ),was nur für µ(N c \N d ) = 0 möglich ist.Wenn wir nun ⋃Ñ c =setzen, dann istµ(Ñc \N c ) ≤0≤d≤c,d∈Q∑0≤d≤c,d∈QN cµ(N d \N c ) = 0,<strong>und</strong>(˜P c ,Ñc)mit ˜P c = ÑC c istaucheineHahn-Zerlegungvonν−cµ,dieÑc ⊆ Ñdfür c < d erfüllt.Wir setzen jetztf(x) = sup{c ∈ Q : x ∈ P c }.Es bleibt zu zeigen, dass f tatsächlich eine Radon-Nikodym Dichte ist. Dazuwählen wir eine beliebige Menge A ∈ S <strong>und</strong> setzenν(A) = ν(A∩{x : f(x) = ∞})+ν(A∩{x : f(x) < ∞}.


KAPITEL 8. DER SATZ VON RADON-NIKODYM 66Falls µ(A∩{x : f(x) = ∞}) = 0, dann ist wegen der Absolutstetigkeit auch<strong>und</strong> auchν(A∩{x : f(x) = ∞}) = 0∫A∩{x:f(x)=∞}fdµ = 0.Im anderen Fall ist A∩{x : f(x) = ∞} eine positive Menge für jedes signierte<strong>Maß</strong> ν −cµ, also ist für jedes c > 0<strong>und</strong> aherν(A∩{x : f(x) = ∞}) ≥ cµ(A∩{x : f(x) = ∞}),∫ν(A∩{x : f(x) = ∞‖) = ∞ =Für den zweiten <strong>Teil</strong> verwenden wirA∩{x:f(x)=∞}fdµ.ν(A∩{x : f(x) < ∞}) = ∑ nν(A∩{x : ǫ(n−1) ≤ f(x) < ǫn}).Wenn f(x) ≥ (n − 1)ǫ, dann ist jedenfalls x ∈ P c für jedes c < (n − 1)ǫ, <strong>und</strong>wenn f(x) < nǫ, dann ist x ∈ N nǫ . Daraus folgt, dass(n−1)ǫµ(A∩{x : (n−1)ǫ ≤ f(x) < nǫ}) ≤ν(A∩{x : (n−1)ǫ ≤ f(x) < nǫ}) ≤ nǫµ(A∩{x : (n−1)ǫ ≤ f(x) < nǫ}),<strong>und</strong> auch∫(n−1)ǫµ(A∩{x : (n−1)ǫ ≤ f(x) < nǫ}) ≤nǫµ(A∩{x : (n−1)ǫ ≤ f(x) < nǫ}),<strong>und</strong> daher∫|ν(A∩{x : (n−1)ǫ ≤ f(x) < nǫ})−A∩{x:(n−1)ǫ≤f(x)


KAPITEL 8. DER SATZ VON RADON-NIKODYM 67<strong>und</strong> schließlichν(A∩{x : f(x) < ∞})+ν(A∩{x : f(x) = ∞}) =∫ ∫ ∫fdµ+ fdµ = fdµ.A∩{x:f(x)


KAPITEL 8. DER SATZ VON RADON-NIKODYM 688.1 In den reellen ZahlenDer zentral Satz dieses Kapitels istThere is a house in New Orleansthey call the rising suntraditionalBlack girl, black girl, don’t lie tome,tell me where did you sleep lastnight?In the pines, in the pines, wherethe sun will never shine,I would shiver the whole nightthrough.traditionalSatz 8.3 Eine monoton nichtfallende Funktion ist λ-fast überall differenzierbar,<strong>und</strong> die Ableitung ist die Radon-Nikodym Dichte des (λ-) absolutstetigen Anteils.Für andere Lebesgue-Stieltjes <strong>Maß</strong>e kann man feststellen.Satz 8.4 F <strong>und</strong> G seien zwei Verteilungsfunktionen Dann existiertdF F(x+h)−F(x−h)(x) = limdG h→0 G(x+h)−G(x−h)µ G -fast überall <strong>und</strong> ist eine Radon-Nikodym Dichte des µ G -absolutstetigen Anteilsvon µ F .Die Ableitung muss nicht symmetrisch gewählt werden, wenn G stetig ist, kanndie Ableitung analog zur gewöhnlichen Ableitung definiert werden, andernfallsmuss nur sichergestellt sein, dass der Nenner gegen µ G ({x}) konvergiert. (Hierfehlen noch Beweise)


Kapitel 9Integralungleichungen <strong>und</strong>L p -RäumeWir beginnen mit der sehr vielseitig verwendbaren Ungleichung von Jensen:Satz 9.1 µ sei ein Wahrscheinlichkeitsmaß, f sei integrierbar, <strong>und</strong> φ sei einekonvexe Funktion. Dann gilt∫ ∫φ(f)dµ ≥ φ( (f)dµ).Zum Beweis stellen wir fest, dass die Bedingung für die Konvexität von φ äquivalentzu der Forderung ist, dass es zu jedem x ein C gibt, sodass f:ur alleyφ(y) ≥ φ(x)+C(y −x).Wenn wir hier für y f(x) einsetzen, <strong>und</strong> für x m = ∫ fdµ, <strong>und</strong> integrieren,erhalten wir ∫ ∫φ(f)dµ ≥ φ(m)+C( fdµ−m),also∫∫φ(f)dµ ≥ φ(fdµ)+C(m−m),<strong>und</strong> die Ungleichung ist bewiesen.Wir nennen eine messbare Funktion f p-fach integrierbar (p reell <strong>und</strong> ≥ 1),wenn∫|f| p dµ < ∞.L p sei die Menge aller p-fach integrierbaren Funktionen. Weiters sei∫‖f‖ p = ( |f| p dµ) 1/p .Es gilt69


KAPITEL 9. INTEGRALUNGLEICHUNGEN UND L P -RÄUME 70Satz 9.2 (Ungleichung von Hölder) Wenn f ∈ L p <strong>und</strong> g ∈ L q mit 1/p +1/q = 1. Dann gilt ∫|fg|dµ ≤ ‖f‖ p ‖g‖ q .Wir verwenden die Ungleichung von Jensen mit φ(x) = |x| p , als Wahrscheinlichkeitsmaßverwenden wir∫gν(A) = | | q dµ‖g‖ q<strong>und</strong> statt f setzen wirWir erhalten<strong>und</strong> wegen p+q = pq∫(A|f||g| q−1.∫ |fg|(‖g‖ q dµ) p ≤ 1 ∫q ‖g‖ q q|f| p |g| p+q−pq dµ,|fg|dµ) p ≤ ‖g‖ pq−qq ‖f‖ p p = ‖g‖ p q‖f‖ p p,<strong>und</strong> Ziehen der p-ten Wurzel gibt das Gewünschte.Satz 9.3 (Ungleichung von Minkowski) f <strong>und</strong> g seien aus L p . Dann istauch f +g in L p <strong>und</strong>‖f +g‖ p ≤ ‖f‖ p +‖g‖ p .Wegen|f +g| p ≤ |2max(|f|,|g|)| p ≤ 2 p (|f| p +|g| p )ist f +g p-fach integrierbar. Ausserdem ist∫ ∫∫ ∫|f +g| p dµ = |f +g||f +g| p−1 dµ ≤ |f||f +g| p−1 dµ+|g||f +g| p−1 dµ.Nach der Hölderschen Ungleichung gilt (mit 1/p+1/q = 1)∫∫|f||f +g| p−1 dµ ≤ ‖f‖ p ( |f +g| q(p−1) dµ) 1/q = ‖f‖ p ‖f +g‖ p−1p .Zusammengefasst:‖f +g‖ p ≤ (‖f‖ p +‖g‖ p )‖f +g‖ p−1p .Falls ‖f +g‖ p positiv ist, können wir hier kürzen, im anderen Fall ist die Ungleichungvon Minkowski trivial erfüllt.Die Minkowski-Ungleichung ist die Dreiecksungleichung für ‖f‖ p . Die Nichtnegativität<strong>und</strong> die positive Linearität sind offensichtlich, also ist ‖f‖ p auf L peineSeminorm.Daseinzige,waszueinervollenNormfehlt,istdassaus‖f‖ p = 0


KAPITEL 9. INTEGRALUNGLEICHUNGEN UND L P -RÄUME 71auch f = 0 folgen soll (wir können nur folgern, dass µ-fast überall f = 0 ist).Dies kann man erreichen indem man fast überall übereinstimmende Funktionenidentifiziert. Es sei also ∼ die Äquivalenzrelation, die durch f ∼ g wenn f = gfast überall definiert ist, <strong>und</strong>L p = (L p )/ ∼ .Dann ist L p mit der Norm ‖f‖ p ein normierter Vektorraum. Es gilt sogarSatz 9.4 L p ist ein Banachraum, also bezüglich der Norm vollständig.Es ist zu zeigen, dass jede Cauchyfolge konvergiert. Es sei also f n eine Cauchyfolgebezüglich ‖.‖ p . Aus der Ungleichung von Markov folgt, dass f n auch eineCauchyfolge im <strong>Maß</strong> ist <strong>und</strong> daher gegen eine Funktion f im <strong>Maß</strong> konvergiert.Wir können eine <strong>Teil</strong>folge f nk auswählen, die fast überall konvergiert. Das Lemmavon Fatou impliziert∫ ∫|f| p dµ =∫liminf|f nk | p dµ ≤ liminf|f nk | p < ∞.f istalsop-fachintegrierbar.Wirwählenk 0 so,dassfürm,n ≥ n k0 ‖f n −f m ‖ p ≤ǫ gilt. Dasselbe Argument wie vorher liefert‖f nk0 −f‖ p ≤ ǫ<strong>und</strong> für n ≥ n k0‖f n −f‖ p ≤ ‖f n −f nk0 ‖ p +‖f nk0 −f‖ p ≤ 2ǫ.Also konvergiert die Folge f n im p-ten Mittel gegen f.(Hier fehlen noch die Dualräume <strong>und</strong> sonst ein bissel)

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!