11.07.2015 Views

Intégration et Probabilités

Intégration et Probabilités

Intégration et Probabilités

SHOW MORE
SHOW LESS
  • No tags were found...

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Année 2009-2010Intégration <strong>et</strong> ProbabilitésCours de MathématiquesTakéo TakahashiPremière Année FICMSemestre 2


Table des matières1 Espaces mesurés <strong>et</strong> fonctions mesurables 31.1 Tribu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31.1.1 Définition <strong>et</strong> propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31.1.2 Tribu engendrée par un ensemble de parties . . . . . . . . . . . . . . . . . . . . . . . . . 41.1.3 Tribus boréliennes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51.1.4 Tribu produit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61.2 Mesure positive . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71.2.1 Définitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71.2.2 Mesures discrètes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91.2.3 Mesure de Lebesgue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101.2.4 Mesure Produit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111.2.5 Propriétés classiques d’une mesure positive . . . . . . . . . . . . . . . . . . . . . . . . . 111.3 Applications mesurables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121.3.1 Définitions <strong>et</strong> premières conséquences . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121.3.2 Un exemple : les fonctions étagées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141.3.3 Propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141.4 Ensembles négligeables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161.5 Annexes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181.5.1 Preuve de la proposition 1.6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181.5.2 Preuve de la proposition 1.14 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191.5.3 Preuve de la proposition 1.19 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201.5.4 Preuve de la proposition 1.20 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221.5.5 Preuve du corollaire 1.26 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231.5.6 Preuve du corollaire 1.28 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242 Intégrale de Lebesgue 252.1 Définition de l’intégrale <strong>et</strong> premières propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . . 252.1.1 Intégrale d’une fonction étagée positive . . . . . . . . . . . . . . . . . . . . . . . . . . . 252.1.2 Intégrale d’une fonction mesurable positive . . . . . . . . . . . . . . . . . . . . . . . . . 272.1.3 Intégrale d’une fonction de signe quelconque . . . . . . . . . . . . . . . . . . . . . . . . . 302.1.4 Exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 312.1.5 L’essentiel de la section 2.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 312.2 Propriétés générales de l’intégrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 322.3 Théorèmes de convergence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 352.4 Théorème de Fubini . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 382.5 Intégrale de Lebesgue sur R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 402.5.1 Comparaison avec l’intégrale au sens de Riemann . . . . . . . . . . . . . . . . . . . . . . 402.5.2 Intégration <strong>et</strong> dérivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 432.5.3 L’essentiel de la section 2.5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 442.6 Annexes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 442.6.1 Preuve de la proposition 2.4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 441


Remarque 1.1 En probabilités, un espace mesurable (Ω, A) est appelé espace probabilisable.Exemple 1.1 Soit Ω un ensemble non vide.1. P(Ω) est la plus grande tribu (au sens de l’inclusion) sur Ω. Elle est appelée tribu triviale sur Ω.2. A = {∅,Ω} est la plus p<strong>et</strong>ite tribu (au sens de l’inclusion) sur Ω. Elle est appelée tribu grossière sur Ω.3. Soit A ∈ P(Ω) tel que A ≠ ∅ <strong>et</strong> A ≠ Ω. Alors A = {∅,A,Ω\A,Ω} est une tribu sur Ω.En jouant sur les points (i), (ii) <strong>et</strong> (iii) de la définition 1.1, la notion de tribu peut aussi être définie grâceà la proposition suivante.Proposition 1.2 (Caractérisation d’une tribu)Soit Ω un ensemble non vide <strong>et</strong> A ⊂ P(Ω). Alors, A est une tribu sur Ω si les trois assertions suivantessont vérifiées :(i) ∅ ∈ A,(ii) A est stable par passage au complémentaire,(iii) A est stable par intersection dénombrable, c’est-à-dire quesi (A n ) n∈Nest une suite d’éléments de A, alors ⋂ n∈NA n ∈ A.Remarque 1.2 Une tribu est bien sûr stable par réunion finie <strong>et</strong> par intersection finie.1.1.2 Tribu engendrée par un ensemble de partiesLa proposition suivante assure l’existence d’une plus p<strong>et</strong>ite tribu A sur Ω contenant un ensemble S ⊂ P(Ω),ensemble qui caractérise alors la tribu A.Proposition 1.3 (Tribu engendrée)Soient Ω un ensemble non vide <strong>et</strong> S ⊂ P(Ω) un ensemble non vide de parties de Ω. Alors il existe uneunique tribu σ(S) sur Ω contenant S <strong>et</strong> telle quesi B est une tribu sur Ω contenant S, alors σ(S) ⊂ B.La tribu σ(S) est la plus p<strong>et</strong>ite tribu (au sens de l’inclusion) sur Ω contenant S <strong>et</strong> est appelée tribuengendrée par S sur Ω.Preuve de la proposition 1.3.• Preuve de l’existence. Considérons l’ensemble T (S) = {A / A tribu sur Ω telle que S ⊂ A}. Alors,P(Ω) ∈ T (S). Ainsi, T (S) ≠ ∅ <strong>et</strong> nous pouvons alors considérerσ(S) =⋂A. (1.1)A∈T (S)En tant qu’intersection de tribus sur Ω, σ(S) est aussi une tribu sur Ω (exercice). De plus, par définition,la tribu σ(S) contient S <strong>et</strong> est incluse dans toute autre tribu B sur Ω contenant S.4


• Preuve de l’unicité. Soient A 1 <strong>et</strong> A 2 deux tribus contenant S <strong>et</strong> telles que pour i = 1,2,si B est une tribu sur Ω contenant S, alors A i ⊂ B.Alors A 1 ⊂ A 2 car A 2 est une tribu sur Ω contenant S. De même, A 2 ⊂ A 1 . Par suite, A 1 = A 2 .Exemple 1.2 Soit Ω un ensemble non vide.1. Si S = {A} avec A ∈ P(Ω), alors la tribu engendrée par S sur Ω est σ(S) = {∅,A,A c ,Ω}.2. Si Ω = [0,1] <strong>et</strong> si S = {{0}, {1}}, alors la tribu engendrée par S sur Ω estσ(S) = {∅,Ω, {0}, {1},]0,1],[0,1[,]0,1[, {0,1}}.3. Si Ω = {0,1} <strong>et</strong> si S = {{0}, {1}}, alors, la tribu engendrée par S sur Ω est σ(S) = P(Ω).La proposition suivante compare les tribus engendrées par deux ensembles S <strong>et</strong> S ′ tels que S ⊂ S ′ ⊂ P(Ω).Proposition 1.4 (Comparaison de tribus engendrées)Soit Ω un ensemble non vide. Si S ⊂ P(Ω) <strong>et</strong> S ′ ⊂ P(Ω) sont deux ensembles non vides de parties de Ωtels que S ⊂ S ′ , alors,σ(S) ⊂ σ ( S ′) ,c’est-à-dire que la tribu engendrée par S ′ sur Ω contient celle engendrée par S sur Ω.Preuve de la proposition 1.4. Soient S ⊂ P(Ω) <strong>et</strong> S ′ ⊂ P(Ω) deux ensembles non vides tels que S ⊂ S ′ . Alors,S ⊂ S ′ ⊂ σ ( S ′) .Ainsi, σ(S ′ ) est une tribu sur Ω contenant S. Par conséquent, σ(S) ⊂ σ(S ′ ) car σ(S) est la plus p<strong>et</strong>it<strong>et</strong>ribu (au sens de l’inclusion) sur Ω contenant S.La plupart des tribus que nous considèrerons (tribus boréliennes, tribus produits) seront définies à l’aide dela proposition précédente. Par ailleurs, connaître des ensembles ≪ simples ≫ engendrant une tribu donnée Apeut être très utile car il n’est pas toujours facile de décrire tous les éléments de la tribu A (voir par exemplela proposition 1.26 page 14).1.1.3 Tribus boréliennesNous définissons les tribus boréliennes sur les espaces métriques à partir des ensembles ouverts.Définition 1.5 (Tribu borélienne B(E))Soit (E,d) un espace métrique. La plus p<strong>et</strong>ite tribu sur E contenant tous les ouverts de E est appelé<strong>et</strong>ribu borélienne sur E <strong>et</strong> est notée B(E). En d’autres termes,B(E) = σ(O)avec O = {A ∈ P(E) /A ouvert de E}. Tout élément de B(E) est appelé borélien de E.5


Remarque 1.3 Une tribu étant stable par passage au complémentaire, la tribu borélienne B(E) est aussi latribu engendrée sur E par l’ensemble F des fermés de E, c’est-à-dire que B(E) = σ(F).La proposition suivante donne d’autres exemples d’ensembles S engendrant B(R). Elle se généralise endimension d 2 en considérant des pavés à la place des intervalles.Proposition 1.6 (Ensembles engendrant B(R))Notons S 1 l’ensemble des intervalles ouverts de R, S 2 l’ensemble des intervalles fermés,S 3 = { [a,b[ /(a,b) ∈ R 2 , a < b } <strong>et</strong> S 4 = {] − ∞,a] /a ∈ R}.Chacun de ces ensembles engendre la tribu borélienne sur R, c’est-à-dire queB(R) = σ(S 1 ) = σ(S 2 ) = σ(S 3 ) = σ(S 4 ).Preuve de la proposition 1.6. Voir annexe 1.5.1 page 18.Dans les chapitres suivants, nous serons amenés à considérer la tribu borélienne B ( R ) sur la droite achevéeR = [−∞,+∞]. La proposition suivante précise un ensemble l’engendrant.Proposition 1.7 (Tribu B ( R ) )La tribu borélienne B ( R ) est la tribu engendrée sur R par l’ensemble {[−∞,a] /a ∈ R}, c’est-à-dire queB ( R ) = σ({[−∞,a] /a ∈ R}).Pour terminer, nous précisons qu’il est assez difficile de construire un sous-ensemble de R d qui ne soit pasun borélien de R d mais qu’il en existe !1.1.4 Tribu produitDans c<strong>et</strong>te partie, nous considérons d espaces mesurables (Ω 1 , A 1 ), . . . ,(Ω d , A d ), avec d ∈ N ∗ ,ainsi que l’espace produit Ω = Ω 1 × · · · × Ω d . Nous définissons la tribu produit A 1 ⊗ · · · ⊗ A d des tribusA 1 ,... , A d . Tous les résultats de c<strong>et</strong>te partie sont admis.Définition 1.8 (Tribu produit A 1 ⊗ · · · ⊗ A d )1. Un rectangle (ou un pavé) de A 1 × ... × A d est un sous-ensemble de Ω 1 × · · · × Ω d du typeavec A i ∈ A i pour tout 1 i d.A 1 × A 2 × · · · × A d2. La tribu produit A 1 ⊗ · · · ⊗ A d sur Ω 1 × · · · × Ω d est la tribu engendrée sur Ω 1 × · · · × Ω d parl’ensemble des rectangles de A 1 × ... × A d , c’est-à-dire par{A 1 × A 2 × · · · × A d /A i ∈ A i , 1 i d}.6


Exemple 1.3 Si A 1 = P(Ω 1 ) <strong>et</strong> si A 2 = {∅,Ω 2 }, alors A 1 ⊗ A 2 = {A 1 × Ω 2 /A 1 ∈ A 1 }.Notation : Lorsque Ω 1 = · · · = Ω n <strong>et</strong> A 1 = · · · = A d = A, nous posons A ⊗d = A}⊗ ·{{· · ⊗ A}.d foisIntéressons-nous à présent au cas où chaque tribu A i est engendrée par un ensemble S i .Proposition 1.9 (Ensembles engendrant A 1 ⊗ · · · ⊗ A d )Si pour tout 1 i d, A i = σ(S i ) est la tribu engendrée par S i sur Ω i , alors A 1 ⊗ · · · ⊗ A d est la tribuengendrée parS = {A 1 × · · · × A d /A i ∈ S i , 1 i d}sur l’ensemble Ω 1 × · · · × Ω d .Terminons c<strong>et</strong>te partie en remarquant que la tribu borélienne sur R d est une tribu produit.Proposition 1.10 (Tribu B ( R d) )Pour tout d ∈ N ∗ , B(R) ⊗d = B(R d ).Remarque 1.4 À partir des propositions 1.9, 1.10 <strong>et</strong> 1.6, nous pouvons décrire plusieurs ensembles S engendrantla tribu borélienne B ( R d) .(Remarque 1.5 Nous avons aussi : B R d) = B ( R ) ⊗d.1.2 Mesure positive1.2.1 DéfinitionsDéfinition 1.11 (Mesure positive)Soit (Ω, A) un espace mesurable. Une application µ définie sur A est une mesure positive sur (Ω, A)si elle vérifie les trois assertions suivantes :(i) µ est à valeurs dans [0,+∞],(ii) µ(∅) = 0,(iii) µ est σ-additive, c’est-à-dire queµ( ⋃n∈NA n)= ∑ n∈Nµ(A n ), (1.2)pour toute suite (A n ) n∈Nd’éléments de A deux à deux disjoints (c’est-à-dire telle que pour toutn ∈ N, A n ∈ A <strong>et</strong> que A p ∩ A m = ∅ pour tous p,m ∈ N tels que p ≠ m).Si µ est une mesure positive sur (Ω, A), le tripl<strong>et</strong> (Ω, A,µ) est appelé espace mesuré.7


Exemple 1.4 Soient (Ω, A) un espace mesurable <strong>et</strong> a ∈ Ω. L’applicationδ a : A −→ [0,+∞]A↦−→{ 1 si a ∈ A0 si a /∈ Aest une mesure positive sur (Ω, A) <strong>et</strong> est appelée mesure de Dirac en a.Les Sections 1.2.2 <strong>et</strong> 1.2.3 présentent deux exemples de mesures : les mesures dites discrètes <strong>et</strong> la mesurede Lebesgue. La mesure de Lebesgue sur R d généralise la notion de longueur si d = 1, d’aire si d = 2 <strong>et</strong> devolume si d = 3. Les propriétés (i), (ii) <strong>et</strong> (iii) définissant la notion de mesure semblent alors naturelles si l’onse réfère aux propriétés de l’aire <strong>et</strong> du volume.Nous pouvons bien sûr donner la mesure d’une réunion finie d’ensembles deux à deux disjoints.Proposition 1.12 (Additivité d’une mesure)Soit µ une mesure positive sur l’espace mesurable (Ω, A). Alors, la mesure µ est additive sur A, c’està-direque pour tout n ∈ N ∗ <strong>et</strong> tous ensembles A 1 ,... ,A n ∈ A deux à deux disjoints,( n)⋃ n∑µ A i = µ(A i ). (1.3)i=1 i=1Preuve de la proposition 1.12. Poser A p = ∅ pour p n + 1 puis utiliser la σ-additivité de µ <strong>et</strong> µ(∅) = 0.Nous terminons c<strong>et</strong>te section par du vocabulaire <strong>et</strong> plus précisément en introduisant les mesures finies, lesmesures σ-finies <strong>et</strong> les probabilités.Définition 1.13 (Mesures σ-finies, mesures bornées <strong>et</strong> probabilités)Soit µ une mesure positive sur l’espace mesurable (Ω, A).1. La mesure positive µ est σ-finie s’il existe une suite (A n ) n∈Nd’éléments de A telle que pour toutn ∈ N, µ(A n ) < +∞ <strong>et</strong> telle queΩ = ⋃ n∈NA n .2. La mesure positive µ est bornée si µ(Ω) < +∞.3. La mesure positive µ est une probabilité sur (Ω, A) si µ(Ω) = 1.Remarque 1.6 Si µ est une probabilité sur l’espace probabilisable (Ω, A), l’espace mesuré (Ω, A,µ) est encoreappelé espace de probabilité.Remarque 1.7 Une mesure positive bornée µ sur l’espace mesurable (Ω, A) est une mesure σ-finie. En particulier,toute probabilité µ sur l’espace mesurable (Ω, A) est σ-finie.8


Exemple 1.51. Soient (Ω, A) un espace mesurable <strong>et</strong> a ∈ Ω. La masse de Dirac δ a est une probabilité sur (Ω, A).2. Supposons Ω = R <strong>et</strong> A = B(R). Alors, la mesure positive δ 0 + 2δ 1 est une mesure finie sur (Ω, A) maisn’est pas une probabilité.1.2.2 Mesures discrètesLes mesures discrètes ont une importance non négligeable en probabilités. Elles sont utiles pour modéliser desphénomènes aléatoires prenant un nombre fini ou dénombrable de valeurs. Des exemples simples de modélisationseront donnés lors de l’introduction des ≪ lois ≫ de Bernoulli, binomiales ou encore de Poisson (voir chapitre 3).Proposition 1.14 (Mesure discrète)Une mesure positive µ sur l’espace mesurable (Ω, A) est dite discrète s’il existe une suite (a n ) n∈Nd’éléments de Ω deux à deux distincts <strong>et</strong> une suite (α n ) n∈Nd’éléments de ]0,+∞] telles queµ = ∑ n∈Nα n δ an (1.4)avec pour tout a ∈ Ω, δ a la masse de Dirac en a <strong>et</strong> avec pour convention +∞ × 0 = 0.Preuve de la proposition 1.14. Il s’agit de vérifier que (1.4) définie bien une mesure positive. Voir Annexe 1.5.2page 19.Remarque 1.8 En pratique, si µ est une mesure discrète, nous pouvons munir l’espace Ω de la tribu P(Ω).Dans ce cas, avec les notations, de la proposition 1.14, pour tout n ∈ N, α n = µ({a n }).Exemple 1.6 Soit (Ω, A) un espace mesurable.1. Si a ∈ Ω, alors la masse de Dirac δ a est une mesure discrète sur (Ω, A).2. Supposons que Ω est fini ou dénombrable. Alors, l’applicationµ = ∑ δ ω ,ω∈Ωdéfinie sur P(Ω), est une mesure discrète sur (Ω, P(Ω)). Notons que pour tout A ∈ P(Ω), µ(A) est lecardinal de l’ensemble A. La mesure µ est appelée mesure de comptage sur Ω.Nous terminons c<strong>et</strong>te partie en remarquant que si l’ensemble Ω est non vide fini ou dénombrable, toutemesure positive sur (Ω, P(Ω)) est discrète.Proposition 1.15 (Mesure positive sur un ensemble au plus dénombrable)Si Ω est un ensemble non vide fini ou dénombrable <strong>et</strong> si µ est une mesure positive sur (Ω, P(Ω)), alorsla mesure µ est une mesure discrète sur (Ω, P(Ω)) <strong>et</strong>µ = ∑ ω∈Ωµ({ω})δ ω .9


Preuve de la proposition 1.15. Étant donné que µ est une mesure positive, µ({ω}) ∈ [0,+∞] pour tout ω ∈ Ω.L’ensemble Ω étant fini ou dénombrable, nous pouvons définir sur (Ω, P(Ω)) la mesure discrèteν = ∑ ω∈Ωµ({ω})δ ω .Soit A ∈ P(Ω). Si A = ∅, ν(A) = µ(A) = 0. Supposons A ≠ ∅. Les ensembles {ω}, ω ∈ A, étant deséléments de P(Ω) deux à deux disjoints <strong>et</strong> A étant fini ou dénombrable,( ) ⋃µ(A) = µ {ω} = ∑ µ({ω}) = ν(A).ω∈Aω∈AL’égalité précédente étant vérifiée pour tout A ∈ P(Ω), µ = ν.1.2.3 Mesure de LebesgueMis à part quelques cas triviaux, il est difficile de définir une mesure non discrète sur un espace mesurable(Ω, A) par une formule. La construction repose en général sur le théorème de Carathéodory (voir parexemple [1, 3]) <strong>et</strong> sur le théorème des classes monotones (voir annexe A page 93). La mesure de Lebesgue seconstruit grâce à ces deux théorèmes. La construction de c<strong>et</strong>te mesure est admise.Notations :• Si I ⊂ R est un intervalle, nous notons Long(I) sa longueur.• Si A ∈ P ( R d) <strong>et</strong> si a ∈ R d , a + A = {a + y /y ∈ A}.Proposition 1.16 (Mesure de Lebesgue sur R d )Il existe une unique mesure positive λ d sur ( R d , B ( R d)) telle que pour tous intervalles I 1 ,I 2 ,...,I d de R,λ d (I 1 × · · · × I d ) =La mesure λ d est appelée mesure de Lebesgue sur R d .d∏Long(I i ).i=1Remarque 1.9 La mesure de Lebesgue λ d est une mesure σ-finie sur ( R d , B ( R d)) .Une deuxième caractérisation de la mesure de Lebesgue sur R d est donnée par le théorème suivant.Théorème 1.17La mesure de Lebesgue sur ( R d , B ( R d)) est l’unique mesure positive λ d sur ( R d , B ( R d)) telle que<strong>et</strong> telle que λ d ([0,1] d ) = 1.(∀a ∈ R d , ∀A ∈ B R d) , λ d (a + A) = λ d (A), (1.5)Remarque 1.10 La propriété (1.5) signifie que la mesure de Lebesgue est invariante par translation.Nous n’avons pas de formule donnant λ d (A) pour A un borélien quelconque de R d . Insistons sur le fait quela mesure de Lebesgue sur R d généralise la notion de longueur si d = 1, d’aire si d = 2 <strong>et</strong> de volume si d = 3.10


1.2.4 Mesure ProduitProposition 1.18 (Mesure produit)Soient (Ω 1 , A 1 ,µ 1 ) <strong>et</strong> (Ω 2 , A 2 ,µ 2 ) deux espaces mesurés. Si µ 1 est une mesure positive σ-finie sur l’espacemesurable (Ω 1 , A 1 ) <strong>et</strong> si µ 2 est une mesure positive σ-finie sur l’espace mesurable (Ω 2 , A 2 ), alors il existeune unique mesure positive µ sur (Ω 1 × Ω 2 , A 1 ⊗ A 2 ) telle que∀A 1 ∈ A 1 , ∀A 2 ∈ A 2 , µ(A 1 × A 2 ) = µ 1 (A 1 )µ 2 (A 2 )avec pour convention 0 × +∞ = +∞ × 0 = 0 <strong>et</strong> +∞ × +∞ = +∞. C<strong>et</strong>te mesure µ, que nous notonssous la formeµ = µ 1 ⊗ µ 2 ,est appelée mesure produit sur (Ω 1 × Ω 2 , A 1 ⊗ A 2 ) <strong>et</strong> est σ-finie.Remarque 1.11 Si µ 1 <strong>et</strong> µ 2 sont deux mesures positives finies, alors la mesure produit µ 1 ⊗µ 2 est bien définie<strong>et</strong> est finie. Si de plus µ 1 <strong>et</strong> µ 2 sont deux probabilités, alors µ 1 ⊗ µ 2 est une probabilité.Remarque 1.12 La proposition 1.18 se généralise à l’espace produit Ω 1 × Ω 2 × · · · × Ω d .Exemple 1.71. Pour tout a ∈ Ω 1 <strong>et</strong> tout b ∈ Ω 2 , δ a ⊗ δ b = δ (a,b) .2. La mesure de Lebesgue λ 1 étant σ-finie, d’après les propositions 1.16 <strong>et</strong> 1.18,λ d = λ 1 ⊗ · · · ⊗ λ} {{ } 1 = λ ⊗d1 .d fois1.2.5 Propriétés classiques d’une mesure positiveLes démonstrations des propositions suivantes sont mises en annexe.Proposition 1.19Soit (Ω, A,µ) un espace mesuré.1. Alors, la mesure µ est croissante sur A (pour l’inclusion), c’est-à-dire que pour tous A,B ∈ A,2. De plus, pour tous A,B ∈ A,A ⊂ B =⇒ µ(A) µ(B).µ(A ∪ B) + µ(A ∩ B) = µ(A) + µ(B).3. Soit I un ensemble fini ou dénombrable. Si (A i ) i∈Iest une famille d’éléments de A, alorsµ( ⋃i∈IA i) ∑ i∈Iµ(A i ).4. Si µ est une probabilité, alors, pour tout A ∈ A, µ(A c ) = 1 − µ(A).Preuve de la proposition 1.19. Voir Annexe 1.5.3 de ce chapitre, page 20.11


Donnons à présent la mesure d’une réunion croissante ou décroissante d’ensembles mesurables.Proposition 1.20 (Continuité monotone)Soit (Ω, A,µ) un espace mesuré.1. Si (A n ) n∈Nest une suite croissante d’éléments de A (c’est-à-dire si A n ∈ A <strong>et</strong> A n ⊂ A n+1 pourtout n ∈ N) alors la suite (µ(A n )) n∈Nest une suite croissante <strong>et</strong>µ( ⋃n∈NA n)= limn→+∞ µ(A n).2. Si (B n ) n∈Nest une suite décroissante d’éléments de A (c’est-à-dire si B n ∈ A <strong>et</strong> B n+1 ⊂ B n pourtout n ∈ N) telle que µ(B 0 ) < +∞, alors la suite (µ(B n )) n∈Nest une suite décroissante <strong>et</strong>µ( ⋂n∈NB n)= limn→+∞ µ(B n).Preuve de la proposition 1.20. Voir Annexe 1.5.4 de ce chapitre, page 22.1.3 Applications mesurablesDans c<strong>et</strong>te partie, (Ω, A) <strong>et</strong> (Ω ′ , A ′ ) sont deux espaces mesurables. Nous précisons pour commencerquelques notations.Notations : Soit X : Ω → Ω ′ une application.• Si A ′ est un sous-ensemble de Ω ′ ,X −1( A ′) = { ω ∈ Ω / X(ω) ∈ A ′}est l’image réciproque de A par X. C<strong>et</strong> ensemble est aussi noté {X ∈ A ′ }.• Par ailleurs, au lieu d’écrire X : Ω → Ω ′ , nous écrivonsX : (Ω, A) → ( Ω ′ , A ′)pour rappeler que Ω (respectivement Ω ′ ) est muni de la tribu A (respectivement A ′ ) <strong>et</strong> que X est uneapplication définie sur Ω à valeurs dans Ω ′ .1.3.1 Définitions <strong>et</strong> premières conséquencesDéfinition 1.21 (Application mesurable)Une application X : (Ω, A) → (Ω ′ , A ′ ) est mesurable (par rapport aux tribus A <strong>et</strong> A ′ ) si∀A ′ ∈ A ′ , X −1( A ′) ∈ A.Remarque 1.13 Si (Ω, A,µ) est un espace de probabilité, une application mesurable X : (Ω, A) → (Ω ′ , A ′ )est appelée variable aléatoire (en abrégé v.a.) à valeurs dans Ω ′ .12


Exemple 1.81. Toute application constante est mesurable quelles que soient les tribus A <strong>et</strong> A ′ .2. Supposons que Ω ′ = R <strong>et</strong> que A ′ = B(R). Considérons un ensemble A ⊂ Ω. Rappelons que la fonctionindicatrice 1 A de A est définie par { 1 si ω ∈ A1 A (ω) =0 si ω /∈ A.Alors, pour tout A ′ ∈ A ′ ,1 −1 (A A′ ) ={∅ si 0 /∈ A′A si 0 ∈ A ′ .Par suite, comme ∅ ∈ A, l’application 1 A : (Ω, A) → (R, B(R)) est mesurable si <strong>et</strong> seulement si A ∈ A.Remarque 1.14 Considérons un ensemble Ω = [0,1], A = {0} <strong>et</strong> les tribus A 1 = σ(A) = {∅, {0},]0,1],Ω} <strong>et</strong>A 2 = {∅,Ω}. Si Ω est muni de la tribu A 1 , la fonction 1 {0} : (Ω, A 1 ) → (R, B(R)) est mesurable car {0} ∈ A 1 .Par contre, si Ω est muni de la tribu A 2 , la fonction 1 {0} : (Ω, A 2 ) → (R, B(R)) n’est pas mesurable car{0} /∈ A 2 . La notion de fonction mesurable dépend des tribus dont sont munis les espaces Ω <strong>et</strong> Ω ′ .L’ensemble des fonctions mesurables définies sur Ω (muni de la tribu A) à valeurs dans R d (muni de la tribuB ( R d) ) est un espace vectoriel. De plus, si d = 1, c<strong>et</strong> ensemble possède une structure d’algèbre.Proposition 1.22Soit (Ω, A) un espace mesurable.1. Soient X : (Ω, A) → ( R d , B ( R d)) <strong>et</strong> Y : (Ω, A) → ( R d , B ( R d)) des applications mesurables. Alorspour tout (a,b) ∈ R 2 , l’application(aX + bY : (Ω, A) → R d , B(R d))est mesurable. De plus, si d = 1, le produit XY : (Ω, A) → (R, B(R)) est mesurable.2. Soient (Ω 1 , A 1 ) <strong>et</strong> (Ω 2 , A 2 ) deux espaces mesurables. Si les applications X : (Ω, A) → (Ω 1 , A 1 ) <strong>et</strong>Y : (Ω 1 , A 1 ) → (Ω 2 , A 2 ) sont mesurables, alors la composéeest une application mesurable.Y ◦ X : (Ω, A) → (Ω 2 , A 2 )Remarque 1.15 La proposition 1.22 reste vraie pour des fonctions à valeurs dans R d tant que les opérationssont bien définies <strong>et</strong> en remplaçant la tribu B ( R d) (par la tribu B R d) .Pour terminer c<strong>et</strong>te section, précisons un tout p<strong>et</strong>it changement de vocabulaire dans le cas où les espacesΩ <strong>et</strong> Ω ′ sont des espaces métriques munis de leur tribu borélienne.Définition 1.23 (Application borélienne)Soient Ω <strong>et</strong> Ω ′ deux espaces métriques. Une application borélienne X : Ω → Ω ′ est une applicationX : (Ω, B(Ω)) → (Ω ′ , B(Ω ′ )) mesurable (par rapport aux tribus boréliennes B(Ω) <strong>et</strong> B(Ω ′ )).13


1.3.2 Un exemple : les fonctions étagéesNous donnons à présent un exemple important de fonctions mesurables : les fonctions étagées. L’intégralede Lebesgue sera construite pour des fonctions étagées positives puis prolongée par un argument de densité.Définition 1.24 (Fonction étagée)Soit (Ω, A) un espace mesurable. Une application X : (Ω, A) → ( R, B ( R )) est étagée siX =n∑α i 1 Aii=1avec n ∈ N ∗ , A 1 ,... ,A n ∈ A des ensembles mesurables non vides deux à deux disjoints, α i ∈ R pour touti = 1,... ,n <strong>et</strong> avec la convention +∞ × 0 = −∞ × 0 = 0.Remarque 1.16 Une fonction étagée X : (Ω, A) → ( R, B ( R )) est mesurable en tant que combinaison linéairefinie de fonctions mesurables. De plus, dans la définition 1.24, nous pouvons supposer que les ensembles A i ,1 i n, forment une partition de Ω (quitte à introduire A n+1 = ( ⋃ ni=1 A i) c <strong>et</strong> α n+1 = 0).Exemple 1.91. Toute fonction constante à valeurs dans R est une fonction étagée.2. Soit I un intervalle de R. Une fonction f : I −→ R en escalier prenant un nombre fini de valeurs est unefonction étagée sur l’espace mesurable (I, B(I)).3. La fonction 1 Q est une fonction étagée mais n’est pas une fonction en escalier.Terminons c<strong>et</strong>te section en remarquant qu’une fonction étagée est simplement une fonction mesurable quine prend qu’un nombre fini de valeurs.Proposition 1.25Soient (Ω, A) un espace mesurable <strong>et</strong> X : Ω → R une application.1. Alors la fonction X est étagée si <strong>et</strong> seulement si X : (Ω, A) → ( R, B ( R )) est une applicationmesurable qui prend un nombre fini de valeurs.2. De plus, si X est une fonction étagée prenant exactement les n valeurs distinctes α 1 ,...,α n alorsX =n∑α i 1 Ai avec A i = X −1 ({α i }).i=11.3.3 PropriétésDonnons un critère de mesurabilité très utile dans le cas où la tribu A ′ est engendrée par un ensemble S ′ .Proposition 1.26 (Critère de mesurabilité lorsque A ′ = σ(S ′ ))Soient (Ω, A) <strong>et</strong> (Ω ′ , A ′ ) deux espaces mesurables. Supposons que A ′ = σ(S ′ ) est la tribu engendrée parS ′ ⊂ P(Ω ′ ) sur Ω ′ . Alors la fonction X : (Ω, A) → (Ω ′ , A ′ ) est mesurable si <strong>et</strong> seulement si∀A ′ ∈ S ′ , X −1 (A ′ ) ∈ A.14


Preuve de la proposition 1.26. Voir annexe 1.5.5 page 23.Nous pouvons à présent donner un exemple simple de fonctions boréliennes : les fonctions continues.Corollaire 1.27Si E <strong>et</strong> F sont deux espaces métriques, alors toute application X : E −→ F continue est borélienne.Preuve du corollaire 1.27. Notons O l’ensemble des ouverts de E <strong>et</strong> O ′ l’ensemble des ouverts de F.L’application X étant continue,∀A ′ ∈ O ′ , X −1( A ′) ∈ O ⊂ B(E).Alors, d’après la proposition 1.26, l’application X est borélienne car σ(O ′ ) = B(F).Étudions la mesurabilité d’une fonction à valeurs dans un espace produit.Corollaire 1.28 (Mesurabilité d’une fonction à valeurs dans Ω 1 × · · · × Ω d )Soient (Ω, A),(Ω 1 , A 1 ),...,(Ω d , A d ) des espaces mesurables. Nous munissons l’espace Ω 1 × · · · × Ω d dela tribu produit A 1 ⊗ · · · ⊗ A d . Considérons des applicationsX (i) : Ω → Ω i ,1 i dainsi que l’application X = ( X (1) ,... ,X (d)) . Alors, l’applicationX : (Ω, A) → (Ω 1 × · · · × Ω d , A 1 ⊗ · · · ⊗ A d )est mesurable si <strong>et</strong> seulement si pour tout 1 i d, X (i) : (Ω, A) → (Ω i , A i ) est mesurable.Preuve du corollaire 1.28. Voir Annexe 1.5.6, page 24.Étudions à présent la mesurabilité d’une limite simple de fonctions mesurables.Proposition 1.29 (Limite simple de fonctions mesurables)Considérons (X n ) n∈Nune suite(d’applications mesurables définies sur Ω muni de la tribu A à valeursdans R d muni de la tribu B R d) . Si (X n ) n∈Nconverge simplement vers la fonction X, c’est-à-dire sialors la fonction X : (Ω, A) →∀ω ∈ Ω, X n (ω) −−−−→n→+∞( (R d , B R d)) est mesurable.X(ω),(Remarque 1.17 Nous pouvons remplacer R d par R d ou par I ∈ B R d) dans la proposition précédente.Remarque 1.18 En tant que limite simple de fonctions étagées (ou de fonctions en escalier), toute fonctionconstante par morceaux sur R est borélienne.15


Preuve de la proposition 1.29.• Supposons d = 1. La suite (X n ) n∈Nconvergeant simplement vers X,{ }∀t ∈ R, {X t} = lim X n tn→+∞= ⋂p∈N ∗ ⋃⋂n∈N mn{X m t + 1 }.pLes variables X k , k ∈ N, étant mesurables, pour tout m ∈ N, tout p ∈ N ∗ <strong>et</strong> tout t ∈ R,{X m t + 1 } ([= X −1 −∞,t + 1 ])∈ App[ ]car −∞,t + 1 p∈ B ( R ) . La tribu A étant stable par réunion dénombrable <strong>et</strong> intersection dénombrable,∀t ∈ R, {X t} = ⋂p∈N ∗ ⋃⋂n∈N mn{X m t + 1 }∈ A.pD’après la proposition 1.26, l’application X est mesurable car B ( R ) = σ({[−∞,t]/t ∈ R}) .• Le cas d 2 est une conséquence de la première partie de c<strong>et</strong>te preuve <strong>et</strong> du corollaire 1.28.Terminons c<strong>et</strong>te section par un exemple.Exemple 1.10 Considérons l’applicationoù [y] désigne la partie entière du réel y.f : R −→ R × Rx ↦−→ (cos(x),[x])• La fonction cos étant continue sur R, elle est borélienne d’après le corollaire 1.27.• La fonction partie entière étant constante par morceaux sur R, elle est borélienne d’après la remarque 1.18.Alors, d’après le corollaire 1.28, l’application f est borélienne car B ( R 2) = B(R) ⊗ B(R).1.4 Ensembles négligeablesJ<strong>et</strong>ons une pièce de monnaie équilibrée une infinité de fois. L’évènement ≪ la pièce tombe toujours sur face ≫est un évènement non vide de probabilité nulle ; il s’agit d’un évènement négligeable. La notion d’ensemblesnégligeables joue un rôle important en théorie de la mesure (voir par exemple le chapitre 4).Définition 1.30 (Ensemble négligeable)Soit (Ω, A,µ) un espace mesuré.1. Une partie N de Ω est dite µ-négligeable si∃A ∈ A tel que N ⊂ A <strong>et</strong> µ(A) = 0.2. Une propriété Π(ω) qui dépend de ω ∈ Ω est dite vraie µ-presque partout si l’ensemble{ω ∈ Ω /Π(ω) est fausse} est µ-négligeable.16


Remarque 1.19 Si l’espace (Ω, A,µ) est un espace de probabilité (c’est-à-dire si µ est une probabilité sur(Ω, A)), une propriété vraie µ-presque partout est dite vraie µ-presque sûrement.Remarque 1.20 Un négligeable N ∈ P(Ω) n’appartient pas nécessairement à la tribu A. Par conséquent, lamesure de N n’est pas en général définie. Mais si N ∈ A, N est µ-négligeable si <strong>et</strong> seulement si µ(N) = 0.Exemple 1.11 Soit (Ω, A,µ) un espace mesuré.1. Tout ensemble mesurable de mesure nulle est négligeable.2. Deux fonctions X <strong>et</strong> Y sont égales presque partout si {ω ∈ Ω /X(ω) ≠ Y (ω)} est négligeable.3. Une suite de fonctions (X n ) n∈N converge presque partout vers X s’il existe un ensemble négligeable Ntel que si ω /∈ N, X n (ω) converge vers X(ω).4. Une fonction X est définie presque partout sur Ω si elle est définie sur Ω\N avec N négligeable.Proposition 1.31Soit (Ω, A,µ) un espace mesuré.1. Soient N ∈ P(Ω) <strong>et</strong> N ′ ∈ P(Ω). Si N ⊂ N ′ <strong>et</strong> si N ′ est négligeable alors N est négligeable.2. Soit I un ensemble fini ou dénombrable. Si (N k ) k∈Iest une famille d’ensembles négligeables, alorsl’ensemble ⋃ N k est négligeable.k∈IIntroduisons à présent la notion d’espace mesuré compl<strong>et</strong>.Définition 1.32 (Espace mesuré compl<strong>et</strong>)Un espace mesuré (Ω, A,µ) est compl<strong>et</strong> si toute partie négligeable appartient à A.Attention : Ne pas confondre la notion d’espace mesuré compl<strong>et</strong> <strong>et</strong> la notion d’espace métriquecompl<strong>et</strong>. Ces notions ne sont pas liées.Le théorème suivant montre que l’on peut toujours supposer qu’un espace mesuré est compl<strong>et</strong>.Théorème 1.33 (Complétion d’un espace mesuré)Soit (Ω, A,µ) un espace mesuré. Notons N l’ensemble des parties µ-négligeables de (Ω, A) <strong>et</strong>A µ = {A ∪ N /A ∈ A, N ∈ N }.1. A µ est la plus p<strong>et</strong>ite tribu contenant A <strong>et</strong> N, c’est-à-dire que A µ = σ(A ∪ N).2. Il existe une unique mesure positive µ sur (Ω, A µ ) telle que∀A ∈ A, µ(A) = µ(A).3. L’espace mesuré (Ω, A µ ,µ) est compl<strong>et</strong>.4. Si µ est une probabilité sur (Ω, A), µ est une probabilité sur (Ω, A µ ).17


Remarque 1.21 Soit (Ω, A,µ) un espace mesuré. Si f : (Ω, A) → (Ω ′ , A ′ ) est mesurable par rapport auxtribus A <strong>et</strong> A ′ , alors f : (Ω, A µ ) → (Ω ′ , A ′ ) est mesurable par rapport aux tribus A µ <strong>et</strong> A ′ car A ⊂ A µ .Exemple 1.121. L’espace (Ω, P(Ω),µ) est toujours compl<strong>et</strong>.2. L’espace mesuré ( R d , B ( R d) ,λ d)n’est pas un espace compl<strong>et</strong>. La tribu complétée(L R d) = B(R d) λ dest appelée tribu de Lebesgue sur R d . Par ailleurs, l’unique mesure prolongeant la mesure de Lebesgueλ d à L ( R d) est toujours notée λ d <strong>et</strong> appelée mesure de Lebesgue sur R d .Lorsque l’on considère des espaces mesurés compl<strong>et</strong>s au sens de la définition 1.32, un des avantages est quesi l’on modifie une fonction mesurable sur un négligeable, on obtient une nouvelle fonction mesurable.Proposition 1.34Soient (Ω, A,µ) un espace mesuré compl<strong>et</strong>.1. Soit f : (Ω, A) → (Ω ′ , A ′ ) une fonction mesurable. Si g est égale µ-presque partout à f, alors lafonction g : (Ω, A) → (Ω ′ , A ′ ) est mesurable.2. Pour tout n ∈ N, considérons X n : (Ω, A) → ( R, B ( R )) une fonction mesurable. Supposons quepour µ-presque tout ω ∈ Ω, la suite (X n (ω)) n∈Nconverge vers une limite notée X(ω) dans R,c’est-à-dire qu’il existe un ensemble négligeable N tel que∀w /∈ Ω, X n (ω) −−−−→n→+∞X(ω).La fonction X n’est donc a priori définie que µ-presque partout. Tout prolongement de X sur Ω estmesurable par rapport aux tribus A <strong>et</strong> B ( R ) .1.5 Annexes1.5.1 Preuve de la proposition 1.6, voir énoncé page 6Soit O (respectivement F) l’ensemble des ouverts (respectivement fermés) de R. Alors, B(R) = σ(O) = σ(F).1. Montrons que σ(S 1 ) = B(R).• Étant donné que S 1 ⊂ O d’après la proposition 1.4 page 5,σ(S 1 ) ⊂ σ(O) = B(R). (1.6)• Soit A ∈ O. L’ouvert A s’écrit comme une réunion dénombrable d’intervalles ouverts, c’est-à-dire queA = ⋃ n∈NA navec A n ∈ S 1 pour tout n ∈ N. La tribu σ(S 1 ) étant stable par réunion dénombrable, A ∈ σ(S 1 ). Parconséquent, O ⊂ σ(S 1 ). Alors, B(R) = σ(O) ⊂ σ(S 1 ) car σ(O) est la plus p<strong>et</strong>ite tribu sur R contenant O.Vu l’inclusion (1.6), B(R) = σ(S 1 ).18


2. Montrons que σ(S 2 ) = B(R).• Étant donné que S 2 ⊂ F, d’après la proposition 1.4 page 5,σ(S 2 ) ⊂ σ(F) = B(R). (1.7)• Soit A ∈ S 1 un intervalle ouvert. Alors A c ∈ σ(S 2 ) (car A c est une réunion dénombrable d’intervallesfermés). La tribu σ(S 2 ) étant stable par passage au complémentaire, A ∈ σ(S 2 ). Par conséquent, S 1 ⊂ σ(S 2 ).Alors,σ(S 1 ) = B(R) ⊂ σ(S 2 ) (1.8)car σ(S 1 ) est la plus p<strong>et</strong>ite tribu sur R contenant S 1 .Vu les inclusions (1.7) <strong>et</strong> (1.8), B(R) = σ(S 2 ).3. Montrons que σ(S 3 ) = σ(S 4 ) = B(R).• Étant donné que S 4 ⊂ S 2 , d’après la proposition 1.4 page 5,n=1σ(S 4 ) ⊂ σ(S 2 ) = B(R). (1.9)• Soit I ∈ S 3 . Par définition de S 3 , il existe (a,b) ∈ R 2 tel que a < b <strong>et</strong> I = [a,b[. Alors,+∞ ⋃(]I = [a,b[= −∞,b − 1 ] ⋂]−∞,a − 1 ] c ).nnLa tribu σ(S 4 ) étant stable par passage au complémentaire <strong>et</strong> intersection dénombrable, I ∈ σ(S 4 ). Parconséquent, S 3 ⊂ σ(S 4 ) car pour tout c ∈ R, ] − ∞,c] ∈ S 4 ⊂ σ(S 4 ). Alors, étant donné que σ(S 3 ) est laplus p<strong>et</strong>ite tribu sur R contenant S 3 ,σ(S 3 ) ⊂ σ(S 4 ). (1.10)• Remarquons que R =]a,+∞[=+∞ ⋃n=1+∞ ⋃n=1[−n,n[. De plus, pour tout (a,b) ∈ R 2 ,[a + 1 [+∞n ,n ⋃, ] − ∞,b[=n=1[−n,b − 1 [n<strong>et</strong>, si a < b, ]a,b[=+∞ ⋃n=1[a + 1 n ,b − 1 [.nAlors, par stabilité par réunion dénombrable de σ(S 3 ) qui contient S 3 , R ∈ σ(S 3 ), ]a,+∞[∈ σ(S 3 ) <strong>et</strong>]a,b[∈ σ(S 3 ) pour tous réels a,b tels que a < b. Ainsi, S 1 ⊂ σ(S 3 ). Étant donné que σ(S 3) est une tribu surR contenant S 1 ,σ(S 1 ) = B(R) ⊂ σ(S 3 ). (1.11)Vu les inclusions (1.9), (1.10) <strong>et</strong> (1.11), B(R) = σ(S 3 ) = σ(S 4 ).1.5.2 Preuve de la proposition 1.14, voir énoncé page 9Considérons (µ n ) n∈Ndes mesures positives sur (Ω, A) <strong>et</strong> (α n ) n∈N∈]0,+∞] N . En adoptant les conventions+∞ × 0 = 0 <strong>et</strong> +∞ × +∞ = +∞, nous allons montrer que l’applicationµ = ∑ n∈Nα n µ n : A → [0,+∞]A ↦→ ∑ n∈Nα n µ n (A) (1.12)est bien définie <strong>et</strong> est une mesure positive sur (Ω, A). En particulier, nous aurons montré que ∑ n∈Nα n δ an estbien une mesure positive.19


1. Montrons que µ est bien définie à valeurs dans [0, +∞].Soit A ∈ A. Pour tout n ∈ N, étant donné que α n ∈]0,+∞] <strong>et</strong> µ n (A) ∈ [0,+∞],α n µ n (A) ∈ [0,+∞]car par convention +∞ × 0 = 0 <strong>et</strong> +∞ × +∞ = +∞. Alors, en tant que somme d’éléments de [0,+∞],µ(A) = ∑ n∈Nα n µ n (A)est bien défini <strong>et</strong> µ(A) ∈ [0,+∞].2. Montrons que µ est σ-additive.Soit (A p ) p∈Nune suite d’éléments de A deux à deux disjoints. Alors,⎛µ ⎝ ⋃ p∈N⎞+∞∑A p⎠ =n=0⎛ ⎞α n µ n⎝ ⋃ +∞∑A p⎠ =p∈N n=0∑+∞α n µ n (A p )par définition de µ <strong>et</strong> par σ-additivité des mesures µ n , n ∈ N. Remarquons que pour tout n ∈ N,∑+∞α n µ n (A p ) =p=0+∞∑p=0α n µ n (A p ).L’égalité précédente est évidente si α n < +∞. Dans le cas où α n = +∞, on vérifie aisément (laissé enexercice) que l’égalité reste vraie vu les conventions adoptées. Ainsi,⎛ ⎞ ⎛ ⎞+∞∑+∞∑µ A p⎠ = ⎝ α n µ n (A p ) ⎠.⎝ ⋃ p∈NTous les termes étant dans [0,+∞], nous pouvons échanger les deux sommes <strong>et</strong> ainsi écrire⎛ ⎞ (+∞∑ +∞)∑+∞∑µ A p⎠ = α n µ n (A p ) = µ(A p ).⎝ ⋃ p∈Np=0n=0n=0p=0p=0p=03. Étant donné que µ n (∅) = 0 pour tout n ∈ N <strong>et</strong> que par convention +∞ × 0 = 0,µ(∅) = ∑ n∈Nα n µ n (∅) = ∑ n∈Nα n × 0 = 0.Vu les points 1., 2. <strong>et</strong> 3. µ est une mesure positive sur (Ω, A).1.5.3 Preuve de la proposition 1.19, voir énoncé page 111. Montrons que µ est croissante pour l’inclusion.Soient A,B ∈ A tels que A ⊂ B. Alors,B = B\A ∪ Aavec B\A = B ∩ A c ∈ A (car A est une tribu contenant A <strong>et</strong> B). Les ensembles mesurables B\A <strong>et</strong> A étantdisjoints, par additivité de µ,µ(B) = µ(B\A) + µ(A).Alors, étant donné que µ(B\A) 0, µ(A) µ(B).20


2. Montrons l’assertion 2. de la proposition 1.19.Soient A,B ∈ A. Alors, par stabilité par réunion finie de la tribu A, A ∪ B ∈ A <strong>et</strong> donc µ(A ∪ B) est biendéfini. De même par stabilité par intersection fini de A, µ(A ∩ B) est bien défini.Remarquons que A ∪ B = A ∪ (B\A). Les ensembles A <strong>et</strong> B\A sont disjoints <strong>et</strong> appartiennent à A (carA,B ∈ A <strong>et</strong> car A est une tribu). Alors, par additivité de la mesure µ,µ(A ∪ B) = µ(A) + µ(B\A).D’où, µ(A ∪ B) + µ(A ∩ B) = µ(A) + µ(B\A) + µ(A ∩ B).De plus, les ensembles B\A ∈ A <strong>et</strong> A ∩ B ∈ A sont disjoints <strong>et</strong> (B\A) ∪ (A ∩ B) = B. Alors, par additivitéde la mesure µ,µ(B\A) + µ(A ∩ B) = µ(B).Par conséquent,µ(A ∪ B) + µ(A ∩ B) = µ(A) + µ(B\A) + µ(A ∩ B) = µ(A) + µ(B).3. Montrons l’assertion 3. de la proposition 1.19.• Supposons I infini dénombrable. Nous pouvons alors supposer I = N. Considérons alors (A n ) n∈Nune suited’éléments de A. Posons A ′ 0 = A 0 <strong>et</strong> pour tout n ∈ N ∗ ,n−1⋃A ′ n = A n \ A k =k=0n−1⋂k=0A n ∩ A c k .Alors les A ′ n, n ∈ N, sont des éléments de A (car A est stable par intersection finie <strong>et</strong> passage aucomplémentaire) deux à deux disjoints. De plus,A 0 ∪ · · · ∪ A n = A ′ 0 ∪ · · · ∪ ⋃A′ n <strong>et</strong> n =n∈NA ⋃ A ′ n .n∈NPar conséquent, par σ-additivité de la mesure µ,( ) ( )⋃ ⋃µ n = µ An∈NA ′ n = ∑n∈N n∈Nµ(A ′ n ) = limAinsi, par additivité de µ,µ( ⋃n∈NA n)k→+∞n=0k∑µ(A ′ n ).= limk→+∞ µ(A′ 0 ∪ · · · ∪ A′ k ) (1.13)car les ensembles A ′ 0 ,... ,A′ k∈ A sont deux à deux disjoints.De plus, pour tout A,B ∈ A, en appliquant l’assertion 2. de la proposition 1.19 (assertion démontrée) <strong>et</strong> enutilisant la positivité de µ, nous constatons queµ(A ∪ B) µ(A) + µ(B).En raisonnant par récurrence sur n, nous montrons alors que( k) (⋃k)⋃µ = µ A n n=0D’où, en faisant tendre k → +∞ dans (1.14) <strong>et</strong> en utilisant (1.13), nous avons :A ′ nµ( ⋃n∈NA n)n=021+∞∑n=0k∑µ(A n ). (1.14)n=0µ(A n ).


• Supposons I fini. Nous pouvons alors supposer I = {0,1,... ,p} avec p ∈ N. Considérons (A i ) i∈Iunefamille de A. Posons A n = ∅ pour tout entier n p. Alors,µ( ⋃i∈IA i)= µcar pour tout entier n p, µ(A n ) = µ(∅) = 0.( ⋃n∈NA n)+∞∑ n ) =n=0µ(A ∑ µ(A i )i∈I4. Montrons l’assertion 4. de la proposition 1.19.Supposons que µ est une probabilité sur (Ω, A) <strong>et</strong> prenons A ∈ A. Étant donné que A <strong>et</strong> Ac sont deuxéléments de A, d’après l’assertion 2. de la proposition 1.19 (assertion démontrée),Alors, comme A ∪ A c = Ω, A ∩ A c = ∅ <strong>et</strong> µ(∅) = 0,µ(A ∪ A c ) + µ(A ∩ A c ) = µ(A) + µ(A c ).µ(Ω) = µ(A) + µ(A c ).La mesure µ étant une probabilité, µ(Ω) = 1 <strong>et</strong> µ(A c ) < +∞. Par conséquent, µ(A) = 1 − µ(A c ).1.5.4 Preuve de la proposition 1.20, voir énoncé page 121. Montrons l’assertion 1. de la proposition 1.20.Soit (A n ) n∈N une suite croissante d’éléments de A. Alors, d’après l’assertion 1. de la proposition 1.19, lasuite (µ(A n )) n∈Nest une suite croissante dans [0,+∞]. Elle adm<strong>et</strong> donc une limite dans [0,+∞].Posons A ′ 0 = A 0 <strong>et</strong> pour tout n ∈ N ∗ ,A ′ n = A n \A n−1 .Pour tout n ∈ N, A ′ n ∈ A car A est une tribu qui contient les ensembles A p, p ∈ N. Par ailleurs, les ensemblesA ′ n, n ∈ N, sont deux à deux disjoints car A p ⊂ A p+1 pour tout p ∈ N. Alors, en utilisant l’additivité <strong>et</strong> laσ-additivité de µ comme dans la preuve de la proposition 1.19, nous obtenons :( ) ⋃µ A ′ n = ∑n∈N n∈Nµ ( ( k)A ′ n)= lim µ ⋃A ′ n .k→+∞n=0Par définition des ensembles A ′ p, pour tout k ∈ N,Par suite,A k =k⋃n=0( ) ( ⋃ ⋃µ n = µn∈NAn∈NA ′ nA ′ n)<strong>et</strong>⋃n∈NA n = ⋃ n∈NA ′ n.( k)= lim µ ⋃A ′ n = lim µ(A k).k→+∞ k→+∞n=02. Montrons l’assertion 2. de la proposition 1.20.Soit (B n ) n∈Nune suite décroissante d’éléments de A. Pour tout n ∈ N, posons A n = B 0 \B n . La suite(A n ) n∈Nest alors une suite croissante d’éléments de A. Remarquons que( )⋃ ⋂A n = B 0 \ nn∈NBn∈N22


avec µ(B 0 ) < +∞. Par conséquent, d’après l’assertion 2. de la proposition 1.19 page 11,( ) ( )⋃ ⋂µ n = µ(B 0 ) − µ nn∈NAn∈NBcar µ (⋂ n∈N B n) µ(B0 ) < +∞. En appliquant l’assertion 1. de la proposition 1.20 (assertion démontrée)à la suite croissante (A n ) n∈N, nous obtenons alors :( ) ( )⋂ ⋃n nn∈NBn∈NAµ(B 0 ) − µ= µ= limk→+∞ µ(A k).De plus, pour tout n ∈ N, d’après l’assertion 2. de la proposition 1.19 page 11,µ(A n ) = µ(B 0 ) − µ(B n )car µ(B n ) µ(B 0 ) < +∞ (par croissance de µ pour l’inclusion). Par conséquent,( ) ⋂nn∈NBµ(B 0 ) − µ= lim µ(A k) = µ(B 0 ) − lim µ(B k),k→+∞ k→+∞Alors,µ( ⋂n∈NB n)= limk→+∞ µ(B k)car µ(B 0 ) < +∞.1.5.5 Preuve du corollaire 1.26, voir énoncé page 14Considérons une fonction X : Ω −→ Ω ′ .• Si X : (Ω, A) → (Ω ′ , A ′ ) est mesurable, alors pour tout A ′ ∈ S ′ , X −1 (A ′ ) ∈ A car S ′ ⊂ A ′ .• Réciproquement, supposons que pour tout A ′ ∈ S ′ , X −1 (A ′ ) ∈ A. Considérons l’ensembleMontrons que T est une tribu sur Ω ′ .(i) Par définition, T ⊂ P(Ω ′ ) car A ′ ⊂ P(Ω ′ ).T = {A ′ ∈ A ′ /X −1 (A ′ ) ∈ A}.(ii) A étant une tribu sur Ω, X −1 (Ω ′ ) = Ω ∈ A. Alors, par définition de T , Ω ′ ∈ T .(iii) Soit B ∈ T . Alors, X −1 (B) ∈ A. La tribu A étant une tribu, X −1 (B c ) = X −1 (B) c ∈ A. Ainsi, pardéfinition de T , B c ∈ T . Ceci étant vrai pour tout B ∈ T , T est stable par passage au complémentaire.(iv) Soit (B n ) n∈N une famille de T . Remarquons queX −1 ( ⋃n∈NB n)= ⋃ n∈NX −1 (B n ).Pour tout n ∈ N, X −1 (B n ) ∈ A. Alors, par stabilité par réunion dénombrable de la tribu A,( ) ⋃X −1 B n = ⋃n∈N n∈NX −1 (B n ) ∈ A<strong>et</strong> donc ⋃ n∈N B n ∈ T . Ceci étant vrai pour toute famille (B n ) n∈Nde T , T est stable par réuniondénombrable.23


D’après (i), (ii), (iii) <strong>et</strong> (iv), T est une tribu sur Ω ′ . De plus,S ′ ⊂ T ⊂ A ′ .La tribu A ′ = σ(S ′ ) étant la plus p<strong>et</strong>ite tribu sur Ω ′ contenant S ′ , nous avons : A ′ ⊂ T . Alors, par définitionde T ,∀A ′ ∈ A ′ , X −1( A ′) ∈ A.L’application X : (Ω, A) → (Ω ′ , A ′ ) est donc mesurable.1.5.6 Preuve du corollaire 1.28, voir énoncé page 15Rappelons que par définition,A 1 ⊗ · · · ⊗ A d = σ({A 1 × · · · × A d /A i ∈ A i , 1 i d}).Par conséquent, d’après la proposition 1.26 page 14, X : (Ω, A) → (Ω 1 × · · · × Ω d , A 1 ⊗ · · · ⊗ A d ) estmesurable si <strong>et</strong> seulement si∀(A 1 ,... ,A d ) ∈ A 1 × · · · × A d , X −1 (A 1 × · · · × A d ) =d⋂i=1(X (i)) −1(Ai ) ∈ A.• Supposons que tous les X (i) : (Ω, A) → (Ω i , A i ), 1 i d, sont mesurables. Alors, pour tout 1 i d<strong>et</strong> pour tout A i ∈ A i ,(X (i)) −1(Ai ) ∈ A.Par conséquent, par stabilité de A par intersection finie,∀(A 1 ,...,A d ) ∈ A 1 × · · · × A d ,d⋂i=1(X (i)) −1(Ai ) ∈ A,ce qui signifie que X : (Ω, A) → (Ω 1 × · · · × Ω d , A 1 ⊗ · · · ⊗ A d ) est mesurable.• Supposons que X : (Ω, A) → (Ω 1 × · · · × Ω d , A 1 ⊗ · · · ⊗ A d ) est mesurable. Fixons 1 i d. PosonsA j = Ω j pour j ≠ i, 1 j d. Alors, pour tout A i ∈ A i ,(X (i)) −1(Ai ) = X −1 (A 1 × · · · × A d ) ∈ Acar pour j ≠ i, ( X (j)) −1(Aj ) = Ω <strong>et</strong> car X est mesurable. Ainsi, X (i) : (Ω, A) → (Ω i , A i ) est mesurable, <strong>et</strong>ce quel que soit 1 i d.24


Chapitre 2Intégrale de LebesgueDans ce chapitre, (Ω, A, µ) est un espace mesuré. Nous allons définir l’intégrale d’une fonction f ayantde ≪ bonnes propriétés ≫ sur l’ensemble Ω par rapport à µ. Lorsqu’elle est bien définie, c<strong>et</strong>te intégrale est notéeindifféremment sous l’une des formes suivantes (en fonction des livres) :∫ ∫ ∫∫µ(f), f dµ, f dµ, f(x)dµ(x) <strong>et</strong> f(x)µ(dx).ΩΩAprès avoir défini l’intégrale au sens de Lebesgue (section 2.1), nous nous intéressons à ses propriétés (sections2.2, 2.3 <strong>et</strong> 2.4) puis la comparons à l’intégrale au sens de Riemann lorsque Ω ⊂ R. La section 2.2 regroupedes propriétés générales de l’intégrale de Lebesgue. Dans la section 2.3, nous donnons des théorèmes perm<strong>et</strong>tantd’échanger limite <strong>et</strong> intégrale, c’est-à-dire d’écrire∫ ∫limn→+∞Ωf n dµ =ΩΩlim f ndµ.n→+∞Ces théorèmes ont pu être énoncés en classe préparatoire dans le cadre des fonctions continues sur R. L’intégraleintroduite par Henri Lebesgue perm<strong>et</strong> de les démontrer assez simplement dans un cadre bien plus général.La section 2.4 est quant à elle dédiée au théorème de Fubini, théorème qui perm<strong>et</strong> de ramener le calcul d’uneintégrale ≪ double ≫ sur un espace produit Ω 1 × Ω 2 aux calculs d’intégrales ≪ simples ≫. Enfin, la section 2.5est consacrée à la comparaison de l’intégrale au sens de Riemann avec celle au sens de Lebesgue.Dans tout ce chapitre, nous considérons des fonctions définies sur Ω à valeurs dans R mesurableslorsque l’espace de départ Ω est muni de la tribu A <strong>et</strong> l’espace d’arrivée R de la tribuborélienne B ( R ) . Par ailleurs, E + désigne l’ensemble des fonctions étagées sur (Ω, A) à valeurs dans[0, +∞] <strong>et</strong> nous adoptons les conventions suivantes :⎧⎪⎨⎪⎩+∞ × 0 = 0 × (+∞) = 0,(+∞) + (+∞) = +∞,(+∞) × (+∞) = +∞∀a > 0, a × (+∞) = +∞.2.1 Définition de l’intégrale <strong>et</strong> premières propriétés2.1.1 Intégrale d’une fonction étagée positiveLa fonction étagée la plus simple est une indicatrice. Commençons par donner la définition de son intégrale.Définition 2.1 (Intégrale d’une indicatrice)Soit A ∈ A. L’intégrale de la fonction 1 A par rapport à la mesure µ sur Ω est la mesure µ(A)de A, c’est-à-dire que∫1 A dµ = µ(A).Ω25(2.1)


Exemple 2.1∫1. Supposons que µ = δ a avec a ∈ Ω. Alors, pour tout A ∈ A,2. Supposons Ω = R <strong>et</strong> µ = λ 1 . Alors, pour tout a,b ∈ R tels que a < b,∫1 [a,b] dλ 1 = λ 1 ([a,b]) = b − a.RΩ1 A dδ a = 1 A (a).L’intégrale de la fonction f = 1 [a,b] peut s’interpréter comme la longueur de l’intervalle [a,b] mais aussicomme l’aire entre la courbe représentative de la fonction f = 1 [a,b] <strong>et</strong> l’axe des abscisses.Considérons maintenant une fonction f étagée à valeurs dans [0,+∞], c’est-à-dire une fonction de la formef =n∑α i 1 Ai , (2.2)i=1avec n ∈ N ∗ , α i ∈ [0,+∞] pour tout i = 1,... ,n <strong>et</strong> (A i ) 1in ∈ A n . Lorsque l’on définit une notion d’intégrale,il est classique de faire en sorte que c<strong>et</strong>te intégrale soit linéaire (comme l’est l’intégrale de Riemann). Parconséquent, il est naturel de vouloir définir l’intégrale de f par∫ n∑∫n∑f dµ = α i 1 Ai dµ = α i µ(A i ). (2.3)Ωi=1La valeur de (2.3) ne dépend pas de l’écriture (2.2), ce qui perm<strong>et</strong> d’écrire la définition suivante.Définition 2.2 (Intégrale d’une fonction étagée positive)Soit f une fonction étagée à valeurs dans [0,+∞]. ÉcrivonsΩf =n∑α i 1 Ai ,i=1avec n ∈ N ∗ , α i ∈ [0,+∞] pour tout 1 i n <strong>et</strong> (A i ) 1in ∈ A n . L’intégrale de f sur Ω parrapport à µ est alors définie (sans ambiguïté) par∫Ωfdµ =i=1n∑α i µ(A i ).i=1Exemple 2.21. Soient a ∈ Ω <strong>et</strong> f =n∑α i 1 Ai avec n ∈ N ∗ , (A i ) 1in ∈ A n <strong>et</strong> (α i ) 1in ∈ [0,+∞] n . Alors,∫ n∑n∑f dδ a = α i δ a (A i ) = α i 1 Ai (a) = f(a).i=1Ωi=1i=12. Supposons Ω = R <strong>et</strong> µ = λ 1 . Considérons la fonction en escalier f = ∑ ni=1 α i1 [ti ,t i+1 [ avec n ∈ N ∗ , α i ∈ R +<strong>et</strong> t 1 ,...,t n+1 des réels tels que t 1 · · · t n+1 . Alors,∫ n∑f dλ 1 = α i (t i+1 − t i ).R26i=1


Nous énonçons à présent deux propriétés de l’intégrale. La première nous sera utile pour définir l’intégralede fonctions mesurables positives (voir proposition 2.17 pour une version plus générale).Proposition 2.3Soient f <strong>et</strong> g deux fonctions étagées à valeurs dans [0,+∞].∫ ∫1. Si f g, alors f dµ g dµ.∫2. De plus,ΩΩΩf dµ = 0 ⇐⇒ f = 0 µ-presque partout.Preuve de la proposition 2.3. Soient f <strong>et</strong> g deux fonctions étagées à valeurs dans [0,+∞]. Il existe alors unefamille (A i ) 1in∈ A n , avec n ∈ N ∗ , d’ensembles formant une partition de Ω telle quef =n∑α i 1 Ai <strong>et</strong> g =i=1n∑β i 1 Aiavec α i ,β i ∈ [0,+∞] pour tout 1 i n. Supposons que f g. Les ensembles A i , 1 i n formantune partition de Ω, pour tout 1 i n, α i β i .1. Alors, vu les conventions adoptées, pour tout 1 i n, α i µ(A i ) β i µ(A i ) car µ(A i ) 0. Parsuite,∫ n∑n∑∫f dµ = α i µ(A i ) β i µ(A i ) = g dµ.Ω2. Étant donné que (A i ) 1inest une famille de A <strong>et</strong> est une partition de Ω,i=1f = 0 µ-presque partout ⇐⇒ ∀1 i n, α i = 0 ou µ(A i ) = 0.Alors, vu les conventions (2.1), f = 0 µ-presque partout ⇐⇒ ∀1 i n, α i µ(A i ) = 0.i=1i=1ΩÉtant donné que pour tout 1 i n, α i µ(A i ) 0,∫Ωf dµ =n∑α i µ(A i ) = 0 ⇐⇒ (∀1 i n, α i µ(A i ) = 0) ⇐⇒ f = 0 µ-presque partout.i=12.1.2 Intégrale d’une fonction mesurable positiveDans c<strong>et</strong>te partie, f : (Ω, A) → ([0,+∞], B([0,+∞])) est une fonction mesurable. Afin de définir l’intégralede f, nous approchons la fonction f par une suite de fonctions étagées.Proposition 2.4 (Approximation de f par une suite de fonctions étagées)Si f : (Ω, A) → ([0,+∞], B([0,+∞])) est une fonction mesurable à valeurs dans [0,+∞], alors il existeune suite (f n ) n∈Ncroissante de fonctions étagées définies sur (Ω, A) à valeurs dans [0,+∞] qui convergesimplement vers f, c’est-à-dire telle que∀ω ∈ Ω, f n (ω) −→n→+∞ f(ω).Preuve de la proposition 2.4. Voir annexe 2.6.1 page 44.27


Nous pouvons donc considérer une suite de fonctions étagées (f n ) n∈N à valeurs dans [0,+∞] telle que∀ω ∈ Ω, limn→+∞ f n(ω) = f(ω).Alors, d’après la proposition 2.3, la suite (∫ )f n dµΩ n∈Nest une suite croissante d’éléments de [0,+∞] donc adm<strong>et</strong> une limite dans [0,+∞]. La proposition suivantemontre que c<strong>et</strong>te limite de dépend pas du choix de la suite (f n ) n∈N, ce qui perm<strong>et</strong> de poser∫∫f dµ = lim f n dµ.n→+∞Proposition 2.5ΩSi (g n ) n∈N<strong>et</strong> (f n ) n∈Nsont des suites croissantes de fonctions étagées à valeurs dans [0,+∞] convergeant(∫ ) (∫ )simplement vers f, alors les suites f n dµ <strong>et</strong> g n dµ convergent dans [0,+∞] <strong>et</strong>Ω n∈N Ω n∈N∫∫limn→+∞ΩΩf n dµ = limn→+∞Ωg n dµ.Preuve de la proposition 2.5. Voir annexe 2.6.2 page 45. La preuve utilise l’assertion 2. de la proposition 2.3. Comme annoncé, nous pouvons à partir de la proposition 2.4 <strong>et</strong> de la proposition 2.5 définir l’intégraled’une fonction mesurable positive.Définition 2.6 (Intégrale d’une fonction mesurable positive)Soit f : (Ω, A) → ([0,+∞], B([0,+∞])) une fonction mesurable à valeurs dans [0,+∞]. Alors, d’aprèsla proposition 2.4, il existe une suite croissante (f n ) n∈Nde fonctions étagées à valeurs dans [0,+∞] quiconverge simplement vers f. L’intégrale de f sur Ω par rapport à µ est alors définie par∫∫f dµ = lim f n dµ ∈ [0,+∞].n→+∞ΩL’intégrale de f est bien définie car d’après la proposition 2.5 la limite précédente ne dépend pas du choixde (f n ) n∈N.ΩRemarque 2.1 Évidemment, si f est étagée mesurable à valeurs dans [0,+∞] alors les définitions 2.2 <strong>et</strong> 2.6de l’intégrale de f coïncident.Nous pouvons aussi interpréter l’intégrale de f à l’aide de la proposition suivante.Proposition 2.7Si f : (Ω, A) → ([0,+∞], B([0,+∞])) est une fonction mesurable à valeurs dans [0,+∞], alors∫ {∫}fdµ = sup ϕdµ / ϕ f <strong>et</strong> ϕ ∈ E +ΩΩoù E + désigne l’ensemble des fonctions étagées sur (Ω, A) à valeurs dans [0,+∞].Preuve de la proposition 2.7. Voir annexe 2.6.3 page 47.28


Nous terminons c<strong>et</strong>te section en généralisant la proposition 2.3. Les propriétés regroupées dans c<strong>et</strong>te propositionseront énoncées dans un cadre plus général lorsque nous aurons fini la construction de l’intégrale ausens de Lebesgue (voir proposition 2.17 page 34).Proposition 2.8Soient f : (Ω, A) → ([0,+∞], B([0,+∞])) <strong>et</strong> g : (Ω, A) → ([0,+∞], B([0,+∞])) deux fonctions mesurablesà valeurs dans [0,+∞].∫ ∫1. Si f g alors f dµ g dµ.∫2. De plus,ΩΩΩf dµ = 0 ⇐⇒ f = 0 µ-presque partout.Preuve de la proposition 2.8. Soient f <strong>et</strong> g deux fonctions mesurables à valeurs dans [0,+∞].D’après la proposition 2.4, il existe (f n ) n∈N<strong>et</strong> (g n ) n∈Ndeux suites croissantes de fonctions étagées àvaleurs dans [0,+∞] telles que∀ω ∈ Ω, f(ω) = limn→+∞ f n(ω) <strong>et</strong>g(ω) = limn→+∞ g n(ω).1. Supposons f g. Alors, pour tout n ∈ N, g n ∈ E + <strong>et</strong> g n g f. D’où, d’après la proposition 2.7,∫ ∫∀n ∈ N, g n dµ f dµEn faisant tendre n → +∞, nous obtenons :∫∫g dµ = limn→+∞ΩΩΩΩ∫g n dµ Ωf dµ.2. • Supposons que f est µ-presque partout nulle. Pour tout n ∈ N, étant donné que 0 f n f, f nest aussi µ-presque partout nulle. Alors, d’après la proposition 2.3,∫∀n ∈ N, f n dµ = 0.∫Et donc, par définition,• Réciproquement supposons queΩΩ∫f dµ = lim f n dµ = 0.n→+∞Ω∫f dµ = 0. Alors, pour tout n ∈ N,Ω∫∀n ∈ N, 0 Ω∫f n dµ Ωf dµ = 0∫Ωf n dµ = 0 card’après la proposition 2.7 (vu que f n ∈ E + <strong>et</strong> f n f).Alors, d’après la proposition 2.3, pour tout n ∈ N, f n est nulle µ-presque partout, c’est-à-dire queA n = {f n ≠ 0} est négligeable. D’après la proposition 1.31 page 17,A = ⋃ n∈NA nest aussi négligeable. De plus, f = limn→+∞ f n = 0 sur A c <strong>et</strong> donc f est nulle µ-presque partout.29


2.1.3 Intégrale d’une fonction de signe quelconqueNous rappelons la définition de la partie négative <strong>et</strong> de la partie positive d’une fonction à valeurs dans R.Définition 2.9 (Parties positive <strong>et</strong> négative)Si f : Ω → R est une fonction, la partie positive de f est la fonctionf +: Ω →ω ↦→[0,+∞]max (f(ω),0)<strong>et</strong> la partie négative de f est la fonctionf −: Ω → [0,+∞]ω ↦→ − min (f(ω),0).Remarque 2.2 Si f : Ω → R est une fonction, alors f = f +− f −<strong>et</strong> |f| = f ++ f −.Soit f : (Ω, A) → ( R, B ( R )) une fonction mesurable. Alors, les fonctions f +<strong>et</strong> f −sont mesurables à valeursdans [0,+∞] <strong>et</strong> donc les intégrales de f +<strong>et</strong> f −sont bien définies <strong>et</strong> sont des éléments de [0,+∞]. Étant guidéspar la linéarité souhaitée de l’intégrale, nous constatons que l’intégrale de f, lorsqu’elle existe, doit être égale àLa formule précédente n’a pas de sens sice qui nous conduit à la définition suivante.∫Ω∫Ω∫f +dµ − f −dµ.Ω∫f +dµ =Ωf −dµ = +∞,Définition 2.10 (Fonction intégrable)Une fonction f : (Ω, A) → ( R, B ( R )) est dite intégrable par rapport à µ sur Ω (ou µ-intégrableou intégrable si il n’y a pas d’ambiguïté) si f est une application mesurable telle que∫∫f +dµ < +∞ <strong>et</strong> f −dµ < +∞.ΩΩDéfinition 2.11 (Intégrale d’une fonction intégrable)Si f : (Ω, A) → ( R, B ( R )) est une fonction µ-intégrable sur Ω, l’intégrale de f sur Ω par rapportà la mesure µ est le réel ∫ ∫ ∫f dµ = f +dµ − f −dµ.ΩΩΩ30


2.1.4 ExemplesExemple 2.3 Soit Ω un ensemble non vide, A = P(Ω) <strong>et</strong> µ = δ a avec a ∈ Ω. Toute fonction f : Ω → R estmesurable car Ω est muni de la tribu P(Ω).• Soit f : Ω → [0,+∞] une fonction à valeurs dans [0,+∞]. Considérons (f n ) n∈Nune suite croissante defonctions étagées à valeurs dans [0,+∞] qui converge simplement vers f. Alors, par définition, <strong>et</strong> d’aprèsl’exemple 2.2 (voir page 26) appliqué à chaque fonction f n ,∫∫• Soit f : Ω → R une fonction. Alors,Ωf dδ a = limn→+∞f est δ a -intégrable ⇐⇒∫Par ailleurs, si f(a) ∈ R, alorsΩ∫ΩΩf n dδ a = limn→+∞ f n(a) = f(a).f +dδ a < +∞ <strong>et</strong>∫Ωf −dδ a < +∞⇐⇒ f +(a) < +∞ <strong>et</strong> f −(a) < +∞ ⇐⇒ f(a) ∈ R.∫f dδ a =Ω∫f +dδ a − f −dδ a = f +(a) − f −(a) = f(a).ΩEn conclusion, une fonction f : Ω → R est δ a -intégrable si <strong>et</strong> seulement si f(a) ∈ R. De plus, si f : Ω → R estune fonction à valeurs dans [0,+∞] ou une fonction δ a -intégrable,∫f dδ a = f(a).ΩExemple 2.4 Soit Ω un ensemble non vide muni de la tribu A = P(Ω). Considérons sur (Ω, A) la mesurepositiveµ = ∑ n∈Nα n δ anavec α n ∈]0,+∞] pour tout n ∈ N <strong>et</strong> (a n ) n∈Nune suite d’éléments de Ω deux à deux distincts.• Remarquons tout d’abord que toute fonction f : Ω → R est mesurable car Ω est muni de la tribu P(Ω).• Nous pouvons alors montrer qu’une fonction f : Ω → R est µ-intégrable si <strong>et</strong> seulement si∑α n |f(a n )| < +∞.n∈NDe plus, si f : Ω → R est une fonction à valeurs dans [0,+∞] ou une fonction µ-intégrable,∫f dµ = ∑ α n f(a n ).Ωn∈N2.1.5 L’essentiel de la section 2.1Il faut essentiellement r<strong>et</strong>enir la démarche de construction :• déterminer l’ensemble des fonctions mesurables,• définir l’intégrale d’une fonction étagée positive,• définir l’intégrale d’une fonction mesurable positive en passant à la limite,• en déduire l’ensemble des fonctions intégrables puis l’intégrale d’une fonction intégrable.31


2.2 Propriétés générales de l’intégraleCommençons par énoncer la propriété de linéarité de l’intégrale.Proposition 2.12 (Additivité/Linéarité)Soient f,g : (Ω, A) → ( R, B ( R )) deux fonctions mesurables.1. Si f <strong>et</strong> g sont à valeurs dans [0,+∞] <strong>et</strong> si a,b ∈ [0,+∞], alors∫∫ ∫(af + bg) dµ = a f dµ + b g dµ.Ω2. Si f <strong>et</strong> g sont µ-intégrables à valeurs dans R alors, pour tous réels a <strong>et</strong> b, la fonction af + bg estµ-intégrable <strong>et</strong>∫∫ ∫(af + bg)dµ = a f dµ + b g dµ.ΩΩΩΩΩNous donnons un lien entre l’intégrabilité d’une fonction mesurable f <strong>et</strong> l’intégrabilité de |f|.Proposition 2.13 (Critère d’intégrabilité)Considérons une fonction f : (Ω, A) → ( R, B ( R )) .∫1. La fonction f est µ-intégrable si <strong>et</strong> seulement si f est mesurable telle que2. Si fest mesurable, alors, f est µ-intégrable si <strong>et</strong> seulement si |f| l’est.3. Enfin, si la fonction f est µ-intégrable, alors∫∫∣ f dµ∣ |f|dµ.ΩΩΩ|f|dµ < +∞.Précisons que l’ensemble sur lequel une fonction intégrable est infinie est un ensemble négligeable.Proposition 2.14Si f : (Ω, A) → ( R, B ( R )) est une fonction µ-intégrable, alors f est finie µ-presque partout.Preuve de la proposition 2.14. Soit f : (Ω, A) → ( R, B ( R )) une fonction µ-intégrable. Alors, comme f estmesurable <strong>et</strong> comme {+∞, −∞} ∈ B ( R ) , A = {|f| = +∞} = f −1 ({+∞, −∞}) ∈ A. Par suite, lafonction g = (+∞) × 1 A est une fonction mesurable étagée positive telle que g |f|. Alors,∫ ∫g dµ |f|dµ < +∞d’après la proposition 2.7 <strong>et</strong> car f est µ-intégrable. De plus, vu nos conventions,∫ { +∞ si µ(A) > 0g dµ =0 si µ(A) = 0.ΩΩΩPar conséquent, µ(A) = µ({|f| = +∞}) = 0, c’est-à-dire que f est finie µ-presque partout.32


Comparons maintenant les intégrales de fonctions égales presque partout.Proposition 2.15Soient f,g : (Ω, A) → ( R, B ( R )) deux fonctions mesurables à valeurs dans R égales µ-presque partout.1. Si f <strong>et</strong> g sont toutes deux à valeurs dans [0,+∞], alors∫ ∫f dµ = g dµ.Ω2. La fonction f est µ-intégrable si <strong>et</strong> seulement si g l’est. De plus, si f est µ-intégrable, alors,∫ ∫f dµ = g dµ.ΩΩΩPreuve de la proposition 2.15. Posons N = {f ≠ g}. Les fonctions f <strong>et</strong> g étant mesurables égales µ-presquepartout, N ∈ A <strong>et</strong> N est µ-négligeable.1. Supposons que f <strong>et</strong> g sont toutes deux à valeurs dans [0,+∞].Par additivité de l’intégrale sur l’ensemble des fonctions mesurables positives,∫ ∫ ∫f dµ = f1 N c dµ + f1 N dµ.ΩΩComme N est µ-négligeable, la fonction mesurable positive f1 N est nulle µ-presque partout, doncd’intégrale nulle par rapport à µ d’après la proposition 2.8. Par conséquent,∫ ∫f dµ = f1 N c dµ.∫Les mêmes arguments perm<strong>et</strong>tent de montrer quePar suite,∫Ω∫f dµ =ΩΩΩ∫f1 N c dµ =ΩΩΩ∫g dµ =Ω∫g1 N c dµ =g1 N c dµ. De plus, f1 N c = g1 N c.Ωg dµ.2. Remarquons que f += g +µ-presque partout <strong>et</strong> que f −= g −µ-presque partout. L’assertion 2. estalors une simple conséquence de l’assertion 1., de la définition d’une fonction intégrable <strong>et</strong> de sonintégrale. Les détails sont laissés en exercice.La proposition précédente perm<strong>et</strong> de définir l’intégrale de n’importe quelle fonction mesurable f à valeurspositives µ-presque partout. Les fonctions f <strong>et</strong> f1 f0 étant mesurables <strong>et</strong> égales µ-presque partout, laproposition 2.15 nous conduit à définir l’intégrale de f comme étant celle de f1 f0 (qui est bien définie).Définition 2.16 (Intégrale d’une fonction mesurable positive presque partout)Soit f : (Ω, A) → ( R, B ( R )) une fonction mesurable. Supposons que f est à valeurs dans [0,+∞] µ-presque partout. Alors, l’intégrale de f sur Ω par rapport à µ est∫ ∫f dµ = f1 f0 dµ ∈ R + ∪ {+∞}.ΩΩ33


Nous pouvons énoncer une propriété analogue à la proposition 2.8.Proposition 2.17 (Croissance de l’intégrale)Soient f : (Ω, A) → ( R, B ( R )) <strong>et</strong> g : (Ω, A) → ( R, B ( R )) deux fonctions mesurables telles queg f µ-presque partout.1. Si les fonctions f <strong>et</strong> g sont ∫ toutes ∫deux à valeurs dans [0,+∞] µ-presque partout ou sont toutesdeux µ-intégrables, alors g dµ f dµ.Ω∫2. Si les fonctions f <strong>et</strong> g sont toutes deux µ-intégrables <strong>et</strong> sipartout.ΩΩ∫f dµ =Ωg dµ, alors f = g µ-presqueNous donnons une dernière propriété perm<strong>et</strong>tant de montrer qu’une fonction f est intégrable en ≪ ladominant ≫ par une fonction que l’on sait être intégrable.Proposition 2.18Soient f <strong>et</strong> g deux fonctions mesurables définies sur (Ω, A) à valeurs dans R. Si |f| g µ-presque partout<strong>et</strong> si g est µ-intégrable, alors f est µ-intégrable <strong>et</strong>∫∫ ∫∣ f dµ∣ |f|dµ g dµ.ΩEn particulier si µ est une mesure bornée <strong>et</strong> si |f| a avec a ∈ R + , alors f est µ-intégrable <strong>et</strong>∫∫∣ f dµ∣ |f|dµ aµ(Ω).ΩΩΩΩPreuve de la proposition 2.18. Il suffit d’appliquer la proposition 2.13 <strong>et</strong> la proposition 2.17.Nous terminons c<strong>et</strong>te section par quelques remarques.Remarque 2.3 Soient A ∈ A <strong>et</strong> f : (Ω, A) −→ ( R, B ( R )) une fonction mesurable. Si la fonction mesurablef1 A est à valeurs dans [0,+∞] µ-presque partout ou est µ-intégrable, l’intégrale de f sur A est∫ ∫f dµ = f1 A dµ.AΩRemarque 2.4 Soit f : (Ω, A) → (C, B(C)).1. La fonction à valeurs complexes f est dite µ-intégrable si Re(f) <strong>et</strong> Im(f) sont des fonctions µ-intégrables.2. Si f est mesurable, f est µ-intégrable si <strong>et</strong> seulement si |f| est µ-intégrable.3. Si f est µ-intégrable, l’intégrale de f sur Ω par rapport à µ est∫ ∫ ∫f dµ = Re(f)dµ + i Im(f)dµ.ΩΩ4. Les résultats de c<strong>et</strong>te section sauf la proposition 2.17 se généralisent aux fonctions à valeurs complexes.Ω34


Remarque 2.5 Soit (Ω, A µ ,µ) l’espace compl<strong>et</strong> associé à l’espace (Ω, A,µ) (voir chapitre 1, théorème 1.32).Soit f : (Ω, A) → ( R, B ( R )) une application mesurable. Alors, f est aussi mesurable par rapport aux tribusA µ <strong>et</strong> B ( R ) . De plus, f est µ-intégrable sur Ω si <strong>et</strong> seulement si f est µ-intégrable sur Ω. Par ailleurs, si f estµ-intégrable, alors∫ ∫f dµ = f dµ.ΩNous pouvons donc sans perte de généralité supposer que les espaces mesurés (Ω, A,µ) considérés sont compl<strong>et</strong>s.Ω2.3 Théorèmes de convergenceDans c<strong>et</strong>te partie, nous supposons (pour simplifier les énoncés) que l’espace (Ω, A, µ) estcompl<strong>et</strong>. C<strong>et</strong>te partie énonce trois résultats essentiels : le théorème de convergence monotone, le lemme deFatou <strong>et</strong> le théorème de convergence dominée. Commençons par étudier les suites croissantes de fonctionspositives.Théorème 2.19 (Théorème de convergence monotone ou théorème de Beppo Levi)Pour tout n ∈ N, soit f n : (Ω, A) → ( R, B ( R )) une fonction mesurable. Supposons que pour tout n ∈ N,f n ∈ [0,+∞] µ-presque partout <strong>et</strong> f n f n+1 µ-presque partout.Nous notons f la limite (définie presque partout) de la suite (f n ) n∈N. Alors,∫ ∫lim f n dµ = f dµ.n→+∞Ω ΩRemarque 2.6 Dans le théorème de Beppo Levi, la fonction f est a priori seulement définie µ-presque partout.Par convention, l’intégrale de f sur Ω désigne l’intégrale d’un de ses prolongements défini sur tout Ω. Bien sûr,la valeur de c<strong>et</strong>te intégrale ne dépend pas du choix du prolongement. En général, nous prolongeons f par 0.Preuve du théorème 2.19. Nous prolongeons f par 0, ce qui définit une fonction encore notée f mesurable carl’espace (Ω, A,µ) est compl<strong>et</strong>. De plus, par hypothèse, la suite (f n ) n∈N converge µ-presque partout versf <strong>et</strong> pour tout n ∈ N,0 f n f µ-presque partout.(∫ )Notons tout d’abord que d’après la proposition 2.17, la suite f n dµ est une suite croissante de[0,+∞] donc adm<strong>et</strong> une limite dans [0,+∞].Ω n∈N• Pour toute fonction étagée g à valeurs dans [0,+∞] telle que g f, nous pouvons montrer que∫∫g dµ lim f n dµ.n→+∞ΩIl suffit pour cela de suivre la preuve du lemme 2.31 (lemme donné en annexe, voir page 45). Alors,d’après la proposition 2.7,{∫} ∫∫sup g dµ /g étagée à valeurs dans [0,+∞], g f = f dµ lim f n dµ. (2.4)ΩΩn→+∞ΩΩ35


• Étant donné que pour tout n ∈ N, 0 f n f µ-presque partout, d’après la proposition 2.17,∫ ∫∀n ∈ N, 0 f n dµ f dµ.∫ ∫∫Par conséquent, lim f n dµ f dµ. Ainsi, d’après (2.4), limn→+∞Ω Ωn→+∞ΩΩΩ∫f n dµ =Ωf dµ.Exemple 2.5 Pour tout n ∈ N, considérons la fonction f n définie sur R par{ xf n (x) =n e −x si x ∈ [1,n + 1]0 sinon.La fonction f n est borélienne car continue par morceaux sur R. De plus, la suite (f n ) n∈Nest une suite croissante(partout) de fonctions positives qui converge λ 1 -presque partout vers la fonction f définie sur R parf(x) ={ +∞ si x > 10 sinon.En fait, (f n (x)) n∈N converge vers f(x) pour tout x ∈ R\{1} <strong>et</strong> {1} est négligeable pour la mesure de Lebesgue.Alors, d’après le théorème de convergence monotone,∫∫lim x n e −x λ 1 (dx) = f(x)λ 1 (dx) = (+∞) × λ 1 (]1,+∞[) = +∞.n→+∞[1,n]RLe lemme de Fatou énoncé ci-après est une conséquence immédiate du théorème de Beppo Levi. Nouscommençons par rappeler la notion de limite inférieure <strong>et</strong> supérieure pour une suite de fonctions.Définition 2.20 (Limites inférieure <strong>et</strong> supérieure d’une suite de fonctions)Soit (f n ) n∈Nune suite de fonctions définies sur Ω à valeurs dans R.( )1. La limite inférieure de (f n ) n∈Nest la fonction lim inf f n = sup inf f k .n→+∞ n∈N kn2. La limite supérieure de (f n ) n∈Nest la fonction lim supf n = infn→+∞ n∈N()supf k .knRemarque 2.7 Si (f n ) n∈Nest une suite de fonctions mesurables, les fonctions lim supmesurables.n→+∞f n <strong>et</strong> lim infn→+∞ f n sontProposition 2.21 (Lemme de Fatou)Pour tout n ∈ N, soit f n : (Ω, A) → ( R, B ( R )) une fonction mesurable. Si pour tout n ∈ N, f n est àvaleurs dans [0,+∞] µ-presque partout, alors∫∫lim inf f n dµ lim inf f n dµ.n→+∞ n→+∞Ω36Ω


Preuve de la proposition 2.21. Posons g n = inf kn f k pour tout n ∈ N. Alors, la suite (g n ) n∈Nest une suitecroissante de fonctions mesurables à valeurs dans [0,+∞] µ-presque partout <strong>et</strong>lim inf f n = lim g n.n→+∞ n→+∞Étant donné que pour tout k n, 0 g n f k µ-presque partout,∫ ∫∀k n, g n dµ f k dµ<strong>et</strong> donc∫Ω(∫ )g n dµ inf f k dµ supkn Ω m∈NΩinfkm(∫Ω)f k dµΩ∫= lim inf f m dµ.m→+∞ΩC<strong>et</strong>te inégalité étant vraie pour tout n ∈ N, en appliquant le théorème de Beppo Levi à la suite (g n ) n∈N,nous obtenons : ∫∫∫lim inf f n dµ = lim g n dµ lim inf f n dµ.n→+∞ n→+∞ n→+∞ΩΩΩExemple 2.6 Pour tout n ∈ N, considérons la fonction f n :]0,1[→ R définie sur ]0,1[ parf n (x) = n sin 2 ( √ xn 1/3 ).La fonction f n est borélienne car continue sur ]0,1[ <strong>et</strong> est positive. En appliquant le lemme de Fatou à la suite(f n ) n∈N , nous obtenons :∫∫+∞ = lim inf f n dλ 1 lim inf f n dλ 1 .]0,1[n→+∞ n→+∞]0,1[∫∫Par conséquent, lim inf f n dλ 1 = +∞ = lim f n dλ 1 .n→+∞]0,1[n→+∞]0,1[Nous terminons c<strong>et</strong>te section par le théorème de Lebesgue.Théorème 2.22 (Théorème de convergence dominée ou théorème de Lebesgue)Pour tout n ∈ N, soit f n : (Ω, A) → ( R, B ( R )) une fonction mesurable. Supposons(i) que (f n ) n∈N converge µ-presque partout,(ii) <strong>et</strong> que pour tout n ∈ N, |f n | g µ-presque partout avec g une fonction µ-intégrable.Notons f la limite (définie µ-presque partout) de la suite (f n ) n∈N. Alors f est µ-intégrable <strong>et</strong>∫ ∫lim f n dµ = f dµ.n→+∞Ω ΩPreuve du théorème 2.22. Soient B = {ω ∈ Ω / lim n→+∞ f n (ω) = f(ω)}. Par hypothèse, B c est un ensembleµ-négligeable. Alors, B ∈ A car l’espace (Ω, A,µ) est compl<strong>et</strong>. Considérons( )⋂A = {|f n | g} ∩ B ∩ {g < +∞}.n∈N37


Alors, A ∈ A <strong>et</strong> A c ∈ A car les fonctions f n <strong>et</strong> g sont mesurables, B ∈ A <strong>et</strong> A est une tribu. De plus,0 µ(A c ) µ(B c ) + µ({g = +∞}) ++∞∑n=0µ({|f n | > g}) = 0d’après l’assertion 3. de la proposition 1.19 page 11. Par conséquent, µ(A c ) = 0 <strong>et</strong> donc A c est un ensembleµ-négligeable. Alors, par définition de A, |f| g µ-presque partout. Par suite, d’après la proposition 2.18,la fonction f est µ-intégrable car g l’est.Pour tout n ∈ N, considérons à présent l’application mesurable g n = 2g − |f n − f|1 A . Alors,∫ ∫ ∫∫ ∫g n dµ = 2 g dµ − 1 A |f n − f|dµ = 2 g dµ − |f n − f|dµ.ΩPar ailleurs, limn→+∞ g n = 2g. Alors, d’après le lemme de Fatou,∫2 g dµ lim infΩn→+∞ΩΩ( ∫ ∫ ) ∫2 g dµ − |f n − f|dµ = 2Ω ΩΩΩΩ∫g dµ − lim sup |f n − f|dµ.n→+∞ ΩPar conséquent,∫<strong>et</strong> donc lim |f n − f|dµ = 0. Remarquons quen→+∞Ω∣∫∣∀n ∈ N,∣Ω∫f n dµ −Ω∫0 = lim sup |f n − f|dµn→+∞ Ω∣∫∣∣∣f dµ∣ =∫Alors, en faisant tendre n → +∞, nous obtenons :ΩΩ∫(f n − f) dµ∣ ∫f dµ = limn→+∞ΩΩ|f n − f|dµ,f n dµ.2.4 Théorème de FubiniL’intégrale d’une fonction f par rapport à une mesure produit µ 1 ⊗µ 2 , lorsqu’elle a un sens, se ramène ≪ engénéral ≫ au calcul d’intégrales par rapport à µ 1 <strong>et</strong> µ 2 . Étudions tout d’abord le cas des fonctions mesurablesà valeurs dans [0,+∞].Théorème 2.23 (Théorème de Fubini-Tonelli)Soient (Ω 1 , A 1 ,µ 1 ) <strong>et</strong> (Ω 2 , A 2 ,µ 2 ) deux espaces mesurés. Pour tout i ∈ {1,2}, supposons que µ i est unemesure positive σ-finie sur (Ω i , A i ). Soitf : (Ω 1 × Ω 2 , A 1 ⊗ A 2 ) → ([0,+∞], B([0,+∞]))une fonction mesurable à valeurs dans [0,+∞]. Nous considérons∫∫F 1 (ω 1 ) = f(ω 1 ,ω 2 )dµ 2 (ω 2 ) <strong>et</strong> F 2 (ω 2 ) = f(ω 1 ,ω 2 )dµ 1 (ω 1 ).Ω 2 Ω 1Alors pour i ∈ {1,2}, la fonction F i : (Ω i , A i ) → ([0,+∞], B([0,+∞])) est mesurable. De plus∫∫∫∫F 1 (ω 1 )dµ 1 (ω 1 ) = F 2 (ω 2 )dµ 2 (ω 2 ) = f(ω 1 ,ω 2 )d(µ 1 ⊗ µ 2 )(ω 1 ,ω 2 ).Ω 1 Ω 2 Ω 1 ×Ω 238


Intéressons-nous au cas des fonctions a priori non positives.Théorème 2.24 (Théorème de Fubini)Soient (Ω 1 , A 1 ,µ 1 ) <strong>et</strong> (Ω 2 , A 2 ,µ 2 ) deux espaces mesurés compl<strong>et</strong>s avec µ i , i ∈ {1,2}, une mesure positiveσ-finie sur (Ω i , A i ). Considérons une fonction mesurablef : (Ω 1 × Ω 2 , A 1 ⊗ A 2 ) → ( R, B ( R )) .∫1. Alors, f est µ 1 ⊗ µ 2 -intégrable ⇐⇒ ω 2 ↦→ |f(ω 1 ,ω 2 )|dµ 1 (ω 1 ) est µ 2 -intégrable sur Ω 2Ω∫ 1⇐⇒ ω 1 ↦→ |f(ω 1 ,ω 2 )|dµ 2 (ω 2 ) est µ 1 -intégrable sur Ω 1 .Ω 22. Supposons que f est µ 1 ⊗ µ 2 -intégrable. Alors,∫- la fonction ω 2 ↦→ f(ω 1 ,ω 2 )dµ 1 (ω 1 ) est µ 2 -intégrable,Ω 1∫- <strong>et</strong> la fonction ω 1 ↦→ f(ω 1 ,ω 2 )dµ 2 (ω 2 ) est µ 1 -intégrable.Ω 2De plus,∫Ω 1(∫)f(ω 1 ,ω 2 )dµ 2 (ω 2 ) dµ 1 (ω 1 ) =Ω 2=∫Ω 2(∫∫∫)f(ω 1 ,ω 2 )dµ 1 (ω 1 )Ω 1dµ 2 (ω 2 ) (2.5)Ω 1 ×Ω 2f(ω 1 ,ω 2 )d(µ 1 ⊗ µ 2 )(ω 1 ,ω 2 ).∫∫Remarque 2.8 Les fonctions ω 1 ↦→presque partout.f(ω 1 ,ω 2 )dµ 2 (ω 2 ) <strong>et</strong> ω 2 ↦→Ω 2f(ω 1 ,ω 2 )dµ 1 (ω 2 ) sont a priori définiesΩ 1Preuve du théorème 2.24.1. Pour établir l’assertion 1., il suffit de remarquer que f est intégrable si <strong>et</strong> seulement si |f| l’est <strong>et</strong>d’utiliser le théorème de Fubini-Tonelli pour calculer l’intégrale de |f|.2. Supposons f intégrable. Écrivons f sous la forme f = f − f . Posons+ −F 1 + (ω 1) =∫f +(ω 1 ,ω 2 )dµ 2 (ω 2 ) <strong>et</strong>Ω 2F 2 + (ω 2) =∫f +(ω 1 ,ω 2 )dµ 1 (ω 1 ).Ω 1Nous définissons Fi − en remplaçant f +par f −dans la définition de Fi + . D’après le théorème deFubini-Tonelli, Fi+ : (Ω i , A i ) → ([0,+∞], B([0,+∞])) est mesurable pour i = 1,2. Par ailleurs,∫∀ω 1 ∈ Ω 1 , 0 F 1 + (ω 1) |f(ω 1 ,ω 2 )|dµ 2 .Ω 2car 0 f + |f|. Alors, d’après l’assertion 1., F 1 + est µ 1-intégrable. De même, F 2 + est µ 2-intégrable<strong>et</strong> Fi − est µ i -intégrable pour i = 1,2. En particulier, pour tout i ∈ {1,2}, Fi+ <strong>et</strong> Fi− sont finiesµ i -presque partout. Alors, pour i ∈ {1,2} <strong>et</strong> j ∈ {1,2}\{i},∫F i = fdµ j = Fi+ − Fi− µ i -presque partout.Ω j39


Nous pouvons prolonger F i en une fonction mesurable. D’après ce qui précède, F i est µ i -intégrable.Nous obtenons alors (2.5) en appliquant le théorème de Fubini-Tonelli à f +<strong>et</strong> f −. Remarque 2.91. Pour i ∈ {1,2}, considérons (Ω i , A i ,µ i ) un espace mesuré compl<strong>et</strong> avec µ i une mesure positive σ-finie.Si f 1 : (Ω 1 , A 1 ) → ([0,+∞], B([0,+∞])) <strong>et</strong> f 2 : (Ω 2 , A 2 ) → ([0,+∞], B([0,+∞])) sont des fonctionsboréliennes,∫(∫)(∫)f 1 (ω 1 )f 2 (ω 2 )d(µ 1 ⊗ µ 2 )(ω 1 ,ω 2 ) = f 1 (ω 1 )dµ 1 (ω 1 ) f 2 (ω 2 )dµ 2 (ω 2 ) .Ω 1 ×Ω 2 Ω 1 Ω 2La formule précédente reste vraie si f 1 est µ 1 -intégrable <strong>et</strong> si f 2 est µ 2 -intégrable.2. Si Ω 1 = Ω 2 = N <strong>et</strong> si µ 1 = µ 2 est la mesure de comptage alors les théorèmes de Fubini affirment que+∞∑+∞∑u n,m =+∞∑+∞∑n=0 m=0 m=0 n=0dès que u n,m ∈ [0,+∞] pour tout n <strong>et</strong> m ou dès que+∞∑+∞∑u n,m ,|u n,m | =+∞∑n=0 m=0 m=0 n=0∞∑|u n,m | < +∞.2.5 Intégrale de Lebesgue sur R2.5.1 Comparaison avec l’intégrale au sens de RiemannAvant de rappeler la définition de l’intégrale au sens de Riemann, nous fixons quelques notations.Notations-Définitions Fixons a,b ∈ R tels que a b.• Une famille τ = (t k ) 0kn, avec n ∈ N, de réels est une subdivision de [a,b] sit 0 = a t 1 t 2 · · · t n−1 t n = b.• Le pas ω(τ) de la subdivision τ = (t k ) 0knest le réel ω(τ) = sup |t i − t i−1 |.1in• Une subdivision τ ′ = (t ′ k ) 0kn ′de [a,b] est plus fine qu’une subdivision τ = (t k ) 0knde [a,b] si{t k /0 k n} ⊂ { t ′ k /0 k n′} .• Si f : [a,b] → R est une fonction bornée sur [a,b] <strong>et</strong> si τ = (t i ) 0inest une subdivision de [a,b], alorsnous pouvons définir les réelsn−1∑σ(τ,f) =i=0avec pour convention ∑ −1i=0 α i = 0.n−1∑(t i+1 − t i ) inf f(t) <strong>et</strong> Σ(τ,f) =t i tt i+140i=0(t i+1 − t i ) supt i tt i+1f(t).


abFigure 2.1 – Illustration de σ(τ,f) <strong>et</strong> Σ(τ,f).Définition 2.25 (Intégrale au sens de Riemann sur [a, b])Soient a,b ∈ R tels que a b. Une fonction f : [a,b] −→ R est Riemann-intégrable sur [a, b] si fest bornée sur [a,b] <strong>et</strong> sisup σ(τ,f) = inf Σ(τ,f)τ∈T τ∈Toù T est l’ensemble des subdivisions de [a,b]. De plus, si f : [a,b] −→ R est Riemann-intégrable, alorsl’intégrale de Riemann de f sur [a, b] est le réelR∫ baf dx = supτ∈Tσ(τ,f) = infτ∈T Σ(τ,f).Remarque 2.10 D’après l’exemple 2.2 page 26, les intégrales de Lebesgue <strong>et</strong> de Riemann coïncident surl’ensemble des fonctions en escalier sur [a,b] prenant un nombre fini de valeurs.Dans c<strong>et</strong>te partie, nous considérons l’intégrale au sens de Lebesgue sur l’espace complété ([a,b], B([a,b]),λ 1 ) λ 1.Notation• Soit I ⊂ R un intervalle. La tribu L(I) sur I est la tribu borélienne B(I) complétée pour la mesure deLebesgue sur I. Ainsi, avec les notations du chapitre 1,L(I) = B(I) λ 1où λ 1 désigne la mesure de Lebesgue sur I. La tribu de Lebesgue L(I) sur l’intervalle I est donc la plusp<strong>et</strong>ite tribu sur I contenant la tribu borélienne B(I) <strong>et</strong> les sous-ensembles λ 1 -négligeables de I.Définition 2.26 (Fonction Lebesgue-mesurable)Soient I ⊂ R un intervalle <strong>et</strong> f : I → R une fonction. La fonction f est dite Lebesgue-mesurable sif : (I, L(I)) → ( R, B ( R )) est mesurable par rapport aux tribus L(I) <strong>et</strong> B ( R ) .Remarque 2.11 Une fonction borélienne f : I → R est Lebesgue-mesurable car B(I) ⊂ L(I).Toute fonction Riemann-intégrable sur [a,b] est aussi Lebesgue-intégrable. Pour la preuve de la propositionsuivante, nous renvoyons par exemple à [11].41


Proposition 2.27 (Riemann-intégrable sur [a, b] =⇒ Lebesgue-intégrable)Soient a,b deux réels tels que a b. Si f : [a,b] → R est une fonction Riemann-intégrable, alors f estLebesgue-intégrable sur [a,b] (c’est-à-dire Lebesgue-mesurable sur [a,b] <strong>et</strong> λ 1 -intégrable sur [a,b]) <strong>et</strong>∫[a,b]f dλ 1 = R∫ baf dx.Remarque 2.12 Une fonction Riemann-intégrable sur un intervalle compact [a,b] n’est pas a priori borélienne.Exemple 2.7 La fonction cos étant continue sur l’intervalle compact [0,1], elle est Riemann-intégrable sur[0,1]. Par conséquent, elle est aussi Lebesgue-intégrable sur [0,1] <strong>et</strong>∫[0,1]cos (x)λ 1 (dx) = R∫ 10cos (x)dx = sin(1).La proposition suivante (voir par exemple [9] pour une preuve) perm<strong>et</strong> de donner des exemples de fonctionsLebesgue-intégrables sur [a,b] non Riemann-intégrables sur [a,b]. La notion de fonction Lebesgue-intégrablesur [a,b] prolonge donc celle de fonction Riemann-intégrable sur [a,b] à une classe plus grande de fonctions.Proposition 2.28Une fonction bornée f : [a,b] → R est Riemann-intégrable si <strong>et</strong> seulement si l’ensemble de ses points dediscontinuité est λ 1 -négligeable.Exemple 2.8 La fonction 1 Q∩[0,1] est Lebesgue-intégrable mais n’est pas Riemann-intégrable.Nous étudions à présent le lien entre l’intégrabilité au sens de Riemann sur un intervalle I a priori noncompact <strong>et</strong> l’intégrabilité au sens de Lebesgue. Nous ne rappelons pas la construction de l’intégrale de Riemannsur un intervalle I non compact.Proposition 2.29 (Riemann <strong>et</strong> Lebesgue intégrabilités sur un intervalle non compact)Soit I un intervalle <strong>et</strong> f : I → R une fonction continue sauf éventuellement en un nombre fini de points.1. Alors la fonction f est borélienne.∫2. Par ailleurs, la fonction f est Riemann-intégrable sur I, c’est-à-dire telle que Rsi <strong>et</strong> seulement si elle est Lebesgue-intégrable sur I.3. Enfin, si f est intégrable sur I au sens de Lebesgue ou de Riemann,∫ ∫f dλ 1 = R f dx,III|f|dx < +∞,c’est-à-dire que l’intégrale de f au sens de Lebesgue sur I coïncide avec son intégrale au sens deRiemann sur I.42


Exemple 2.91. Considérons la fonction f : [1,+∞[→ R définie par f(x) = x −p .• La fonction f est continue sur I = [1,+∞[. Elle est donc Lebesgue-intégrable sur I si <strong>et</strong> seulement sielle est Riemann-intégrable sur I, c’est-à-dire si <strong>et</strong> seulement si p > 1.• Si p > 1, alors d’après la proposition 2.29,∫[1,+∞[1x pλ 1(dx) = R∫ +∞11x pdx = 1p − 1 .• Si p 1, la fonction f n’est pas Lebesgue-intégrable sur I <strong>et</strong> donc, comme elle est positive,∫1x pλ 1(dx) = +∞.[1,+∞[2. Considérons la fonction f :]0,+∞[→ R définie par f(x) = sin (x)/x. C<strong>et</strong>te fonction est continue surl’intervalle I =]0,+∞[ mais n’est pas Riemann-intégrable sur I (intégrale non absolument convergente).Par suite, d’après la proposition 2.29, f n’est pas Lebesgue-intégrable sur I.2.5.2 Intégration <strong>et</strong> dérivation• Soit f une fonction continue sur [a,b]. Alors la fonction∫F : x ↦→∫est C 1 sur [a,b] <strong>et</strong> F ′ = f car pour tout x,[a,x]f dλ 1 = R[a,x]∫ xaf dλ 1• Soit F une fonction C 1 sur [a,b]. Alors,∫∀x ∈ [a,b], F(x) = F(a) +car R∫ xa∫F ′ (t)dt =[a,x]f(t)dt. Que peut-on dire si f n’est pas continue ?[a,x]F ′ dλ 1 .F ′ dλ 1 par continuité de F ′ . Que peut-on dire si F n’est plus C 1 ?La théorème suivant répond en partie aux deux questions précédentes.Théorème 2.301. Soient f : [a,b] → R une fonction Lebesgue-intégrable sur [a,b] <strong>et</strong> c ∈ R. Considérons la fonctionF : [a,b] → R définie par∫F(x) = c + f(t)λ 1 (dt), x ∈ [a,b].[a,x]Alors, la fonction F : [a,b] → R est continue sur [a,b], dérivable λ 1 -presque partout sur [a,b] <strong>et</strong>F ′ = f λ 1 -presque partout.2. Soit F : [a,b] → R une fonction dérivable sur [a,b]. Si la dérivée F ′ de F est Lebesgue-intégrablesur [a,b], alors∫∀x ∈ [a,b], F(x) = F(a) + F ′ (t)λ 1 (dt).[a,x]Si la fonction F est simplement dérivable en presque tout point, alors en général l’assertion 2. n’est pasvérifiée.43


2.5.3 L’essentiel de la section 2.5Nous venons de voir que les intégrales au sens de Lebesgue <strong>et</strong> au sens de Riemann coïncident souvent. Lesrésultats essentiels sont les propositions 2.27 <strong>et</strong> 2.29.• En particulier, si f est continue sur l’intervalle I sauf éventuellement en un nombre fini de points,l’étude de l’intégrabilité au sens de Lebesgue de f sur I revient à étudier son intégrabilité au sens deRiemann. Tous les critères classiques (comparaisons, équivalents...) peuvent être utilisés.• Si f est continue sur l’intervalle I sauf éventuellement en un nombre fini de points <strong>et</strong> intégrable surI, son intégrale au sens de Lebesgue coïncide avec celle au sens de Riemann. Toutes les méthodes decalcul d’intégrales classiques (changement de variables, intégration par partie, utilisation de primitives...)peuvent être utilisés.• Dans le cas où l’intégrale au sens de Lebesgue ne peut pas s’interpréter comme une intégrale au sensde Riemann, il faut faire attention. Nous donnerons dans le chapitre 3 un théorème de changementde variables analogue à celui connu pour l’intégrale au sens de Riemann (voir théorème 3.28 page 65).Mais, nous ne pouvons pas a priori utiliser des intégrations par parties ; en eff<strong>et</strong> en général∫F ′ dλ 1 ≠ F(b) − F(a).2.6 Annexes2.6.1 Preuve de la proposition 2.4, voir énoncé page 27[a,b]Soit f : (Ω, A) → ([0,+∞], B([0,+∞])) une fonction mesurable. Pour tout n ∈ N ∗ , considérons la fonction f ndéfinie sur Ω parf n =n2∑n −1i=0i2 n1 {i/2 n n} .Nous introduisons f 0 = 0 la fonction identiquement nulle sur Ω.• Vérifions que (f n ) n∈Nest une suite de fonctions étagées à valeurs dans [0, +∞].La fonction f 0 étant constante sur Ω, elle est étagée. De plus, elle est bien à valeurs dans [0,+∞] (vu qu’elleest nulle). Fixons à présent n ∈ N ∗ . Par définition, il est clair que f n est à valeurs dans [0,+∞]. De plus,{f > n} = f −1 (]n,+∞]) ∈ Acar ]n,+∞] ∈ B([0,+∞]) <strong>et</strong> car f est mesurable. De même, pour tout 0 i n2 n − 1,{2 −n i < f 2 −n (i + 1) } = f −1( ]2 −n i,2 −n (i + 1)] ) ∈ Acar ]2 −n i,2 −n (i + 1)] ∈ B([0,+∞]) <strong>et</strong> car f est mesurable. Par suite, pour tout n ∈ N ∗ , l’applicationf n =n2∑n −1i=0i2 n1 {i/2 n n} .est une fonction étagée en tant que combinaison linéaire finie d’indicatrice de boréliens.• Nous pouvons vérifier que la suite (f n ) n∈Nest croissante (exercice).44


• Vérifions que la suite de fonctions (f n ) n∈Nconverge simplement vers f.Fixons ω ∈ Ω.1 er cas. Supposons f(ω) = +∞. Alors, pour tout n ∈ N ∗ , f n (ω) = n <strong>et</strong> donclim f n(ω) = +∞ = f(ω).n→+∞2 nd cas. Supposons que f(ω) ∈ R + . Alors, pour n assez grand, |f(ω)| < n <strong>et</strong>Alors, limn→+∞ f n(ω) = f(ω).|f(ω) − f n (ω)| 12 n .Ainsi, nous venons de montrer que pour tout ω ∈ Ω, la suite (f n (ω)) n∈Nconverge vers f(ω).2.6.2 Preuve de la proposition 2.5, voir énoncé page 28La preuve de la proposition repose sur le lemme suivant. Nous rappelons que nous ne pouvons utiliser queles résultats établis avant la section 2.1.2.Lemme 2.31Soit (h n ) n∈Nune suite croissante de fonctions étagées à valeurs dans [0,+∞]. Si g est une fonctionétagée à valeurs dans [0,+∞] telle quealors,∫Ω∫g dµ lim h n dµ.n→+∞Ω∀ω ∈ Ω,g(ω) limn→+∞ h n(ω),Preuve du lemme 2.31. Fixons t ∈]0,1[ <strong>et</strong> M ∈ R ∗ +. PosonsΩ n = {ω ∈ Ω /h n (ω) t min (g(ω),M)}pour tout n ∈ N. En utilisant la mesurabilité des fonctions h n , n ∈ N <strong>et</strong> de la fonction g, on peut vérifier queΩ n ∈ A pour tout n ∈ N. Par ailleurs, pour tout n ∈ N, Ω n ⊂ Ω n+1 car h n h n+1 .• Montrons que Ω = ⋃ n∈N Ω n. Il est clair que ⋃ n∈N Ω n ⊂ Ω. Fixons ω ∈ Ω.1er cas : g(ω) = 0. Alors, pour tout n ∈ N, h n (ω) 0 = t min (g(ω),M) <strong>et</strong> ω ∈ ⋃ n∈N Ω n.2nd cas : g(ω) ∈]0, +∞]. Alors, lim h n(ω) g(ω) min (g(ω),M) > t min (g(ω),M) car t ∈]0,1[ <strong>et</strong>n→+∞min (g(ω),M) ∈ R ∗ +. Par conséquent, il existe n 0 ∈ N tel que pour tout entier n n 0 ,En particulier, ω ∈ ⋃ n∈N Ω n.h n (ω) > t min (g(ω),M).Ainsi, par double inclusion, nous venons de montrer que Ω = ⋃ n∈N Ω n.45


• Fixons n ∈ N. Notons que par définition de Ω n ,h n h n 1 Ωn t min (g,M)1 Ωn .De plus, la fonction t min (g,M)1 Ωn est une fonction étagée à valeurs dans [0,+∞] car g n en est une <strong>et</strong> cart,M ∈ R + . Alors, d’après la proposition 2.3, la fonction h n étant elle-même étagée positive,∫ ∫∫h n dµ t min(g,M)1 Ωn dµ = t min (g,M)1 Ωn dµ.La fonction g étant étagée à valeurs dans [0,+∞],ΩΩΩg =m∑α i 1 Aii=1avec m ∈ N, (α i ) 1im∈ [0,+∞] m <strong>et</strong> (A i ) 1im∈ A m une famille d’ensembles mesurables formant unepartition de Ω. Alors,m∑min (g,M)1 An = min (α i ,M)1 Ai ∩Ω n.Les ensembles A i ∩ Ω n , 1 i m, étant dans A,∫min (g,M)1 Ωn dµ =Ωi=1m∑min (α i ,M) µ(A i ∩ Ω n ).i=1Par conséquent, pour tout n ∈ N,∫Ωh n dµ tm∑min (α i ,M) µ(A i ∩ Ω n ) (2.6)i=1• Pour tout 1 i m, la suite (A i ∩ Ω n ) n∈Nest une suite croissante de A, donc par continuité monotone(proposition 1.20 page 12) de µ,( ) ⋃i ∩ Ω nn∈NAlim µ(A i ∩ Ω n ) = µn→+∞= µ(A i ∩ Ω) = µ(A i ).(∫ )De plus, la suite h n dµ d’éléments de [0,+∞] adm<strong>et</strong> une limite dans [0,+∞] car elle est croissante.Ω n∈NAlors, en faisant tendre n → +∞ dans (2.6) (qui est vérifiée pour tout n ∈ N), nous obtenons :∫lim h n dµ tn→+∞Ωm∑min(α i ,M) µ(A i ).i=1En faisant tendre t → 1 puis M → +∞ dans l’inégalité précédente, nous obtenons :∫lim h n dµ n→+∞Ωm∑∫α i µ(A i ) =i=1Ωg dµ.Nous pouvons à présent démontrer la proposition 2.5.46


Preuve de la proposition 2.5. Nous avons déjà remarqué que les suites(∫ ) (∫ )f n dµ <strong>et</strong> g n dµΩΩn∈Nconvergent dans [0,+∞]. Par ailleurs, étant donné que la suite (g n ) n∈Nest une suite croissante de fonctionsétagées à valeurs dans [0,+∞] convergeant simplement vers f, pour tout p ∈ N,g p f = limn→+∞ f n.Alors, les fonctions g p <strong>et</strong> f n étant étagées à valeurs dans [0,+∞], d’après le lemme 2.31,∫∫∀p ∈ N, g p dµ lim f n dµn→+∞En faisant tendre p → +∞, nous constatons que∫limp→+∞De même, nous avons :∫limp→+∞∫Ainsi, vu les deux dernières inégalités, limn→+∞ΩΩΩΩg p dµ limn→+∞∫Ω∫f p dµ limn→+∞∫g n dµ = limn→+∞ΩΩΩn∈Nf n dµ.g n dµ.f n dµ.2.6.3 Preuve de la proposition 2.7, voir énoncé page 28Soit f : (Ω, A) → ([0,+∞], B([0,+∞])) une fonction mesurable. Alors, il existe une suite (f n ) n∈Ncroissante defonctions étagées positives convergeant simplement vers f. Par définition,∫∫f dµ = lim f n dµ.n→+∞• La suite (f n ) n∈Nest croissante <strong>et</strong> converge simplement vers f, doncΩΩ∀n ∈ N, f n f.Par ailleurs, f n ∈ E + pour tout n ∈ N. Alors, pour tout n ∈ N,∫ {∫}f n dµ sup ϕdµ /ϕ f <strong>et</strong> ϕ ∈ E + .ΩΩΩEn faisant tendre n → +∞, nous constatons, par définition de l’intégrale de f, que∫∫ {∫}f dµ = lim f n dµ sup ϕdµ /ϕ f <strong>et</strong> ϕ ∈ E + . (2.7)n→+∞ΩΩ• Soit ϕ ∈ E + telle que ϕ f, c’est-à-dire telle que ϕ lim f n. Alors, d’après le lemme 2.31,n→+∞∫∫ ∫ϕdµ lim f n dµ = f dµ.n→+∞Ω ΩΩC<strong>et</strong>te inégalité étant vérifiée pour toute fonction ϕ ∈ E + telle que ϕ f,{∫} ∫ ∫sup ϕdµ /ϕ f <strong>et</strong> ϕ ∈ E + lim f n dµ =Ωn→+∞∫• D’après (2.7) <strong>et</strong> (2.8),ΩΩΩf dµ. (2.8){∫}f dµ = sup ϕdµ /ϕ f <strong>et</strong> ϕ ∈ E + . Ω47


Chapitre 3Loi d’une variable aléatoireAprès avoir traduit certains résultats du chapitre 2 en termes probabilistes (voir section 3.1), nous introduisonsla notion de loi d’une variable aléatoire. Nous étudions deux cas particuliers de variables aléatoires : lesvariables aléatoires discrètes (voir section 3.3) <strong>et</strong> les variables aléatoires absolument continues (voir section 3.4).Évoquons dès à présent deux résultats importants donnés dans ce chapitre. Le premier est le théorèmedu transport qui rend inutile la description de l’espace (Ω, A, P) sur lequel se déroule l’expérience étudiée.Le second résultat important est la caractérisation de la loi d’une variable aléatoire réelle par sa fonction derépartition. La forme de la fonction de répartition perm<strong>et</strong>, en particulier, de déterminer si la variable aléatoireest discrète, de loi absolument continue ou d’un autre type.Dans tout ce chapitre, tout ensemble I ⊂ R est muni de sa tribu borélienne.3.1 EspéranceNous reformulons en termes probabilistes une partie des résultats établis, en chapitre 2, pour l’intégraleconstruite par rapport à P.Définition 3.1 (Espérance d’une variable aléatoire positive ou intégrable)Soit X : (Ω, A) → ( R, B ( R )) une variable aléatoire P-intégrable ou à valeurs dans [0,+∞] P-presquesûrement. L’espérance E(X) de X est l’intégrale de X par rapport à la probabilité P, c’est-à-dire que∫E(X) = X(ω) dP(ω).ΩExemple 3.11. Toutes les variables aléatoires réelles constantes sur Ω sont P-intégrables. De plus, si a ∈ R ∪ {+∞} <strong>et</strong> siX = a est la variable constante à a sur Ω, alors E(X) = aP(Ω) = a.2. Considérons l’espace de probabilité (Ω, A, P) = (Ω, P(Ω),δ a ). Alors toute fonction X : Ω → R est unevariable aléatoire (c’est-à-dire est mesurable) <strong>et</strong>∫E(|X|) = |X|dδ a = |X(a)|.ΩAinsi, une fonction X : Ω → R est δ a -intégrable si <strong>et</strong> seulement si X(a) ∈ R. De plus, si X(a) ∈ R∪{+∞},∫E(X) = X dδ a = X(a).Ω49


Nous énonçons les principales propriétés de l’espérance. Ces résultats ont été démontrés dans le chapitre 2.Proposition 3.2Soient X <strong>et</strong> Y deux variables aléatoires définies sur l’espace de probabilité (Ω, A, P) à valeurs dans R.1. Si la variable aléatoire X est à valeurs dans [0,+∞] P-presque sûrement, alorsE(X) ∈ [0,+∞].2. Si la variable aléatoire X est P-intégrable, alors X est finie P-presque sûrement <strong>et</strong>|E(X)| E(|X|).3. Si les variables aléatoires X <strong>et</strong> Y sont P-intégrables, alors pour tous a,b ∈ R, aX + bY est unevariable aléatoire P-intégrable <strong>et</strong>E(aX + bY ) = a E(X) + b E(Y ).4. Si les variables aléatoires X <strong>et</strong> Y sont à valeurs dans [0,+∞] P-presque sûrement, alors pour tousa,b ∈ [0,+∞],E(aX + bY ) = aE(X) + bE(Y ).5. Si la variable aléatoire X est à valeurs dans [0,+∞] P-presque sûrement, alorsE(X) = 0 ⇐⇒ X = 0 P-presque sûrement.6. Si les variables aléatoires X <strong>et</strong> Y sont toutes deux P-intégrables ou toutes deux à valeurs dans[0,+∞] P-presque sûrement, alors,X Y P-presque sûrement =⇒ E(X) E(Y ).7. Si |X| Y P-presque sûrement <strong>et</strong> si Y est P-intégrable, alors X est P-intégrable <strong>et</strong>|E(X)| E(|X|) E(Y ).En particulier, si il existe a ∈ R + tel que |X| a P-presque sûrement, alors X est P-intégrable <strong>et</strong>|E(X)| E(|X|) a.Remarque 3.1 Dans l’assertion 3., a priori, X + Y n’est bien définie que sur Ω\N avecN = {X = +∞} ∩ {Y = −∞} ∈ A<strong>et</strong> P(N) = 0 (d’après l’assertion 2.). Par conséquent, la variable X + Y se prolonge en une variable aléatoiresur Ω. L’espérance E(X + Y ) désigne l’espérance de n’importe quel prolongement (mesurable) de X + Y .Les théorèmes de convergence monotone, de convergence dominée <strong>et</strong> le lemme de Fatou peuvent bien sûrêtre réénoncés en termes probabilistes. Lorsque l’espace de probabilité (Ω, A, P) est le produit de deux espacesde probabilités, nous pouvons aussi énoncer le théorème de Fubini-Tonelli <strong>et</strong> le théorème de Fubini.50


3.2 Mesure image <strong>et</strong> loi d’une variable aléatoire3.2.1 DéfinitionsProposition 3.3 (Définition d’une mesure image)Soient (Ω, A,µ) un espace mesuré, (Ω ′ , A ′ ) un espace mesurable <strong>et</strong> X : (Ω, A) −→ (Ω ′ , A ′ ) une fonctionmesurable. Alors, l’applicationµ X: A ′ → [0,+∞]B ↦→ µ(X −1 (B))est une mesure positive sur (Ω ′ , A ′ ) <strong>et</strong> est appelée mesure image de µ par X.Preuve de la proposition 3.3. Si B ∈ A ′ , alors X −1 (B) ∈ A car X est mesurable <strong>et</strong> donc µ X(X −1 (B) ) est bienbien défini <strong>et</strong> appartient à [0,+∞]. Par ailleurs, µ X(∅) = µ(∅) = 0.• Considérons à présent (A n ) n∈Nune suite d’éléments de A ′ deux à deux disjoints. Alors,µ X( ⋃n∈NA n)= µ(X −1 ( ⋃n∈N)) ( ⋃A n = µ X −1 (A n )n∈N).Les ensembles A n ∈ A, n ∈ N, étant deux à deux disjoints, les ensembles X −1 (A n ), n ∈ N, sont aussideux à deux disjoints. De plus, X étant mesurable,pour tout n ∈ N X −1 (A n ) ∈ A car A n ∈ A ′ . Alors,( ) ⋃µ XA n = ∑ µ ( X −1 (A n ) ) = ∑ X(A n ).n∈N n∈Nn∈NµVu ce qui précède, µ Xest une mesure positive sur (Ω ′ , A ′ ).Reformulons en termes probabilistes ce qui précède.Définition 3.4 (Loi d’une variable aléatoire)Soient (Ω, A, P) un espace de probabilité, (Ω ′ , A ′ ) un espace mesurable <strong>et</strong> X : (Ω, A) −→ (Ω ′ , A ′ ) unevariable aléatoire (c’est-à-dire une fonction mesurable). Alors la mesure imageP X: A ′ −→ [0,+∞]B ↦−→ P(X −1 (B))de P par X est une probabilité sur (Ω ′ , A ′ ) appelée loi de la variable aléatoire X (sous la probabilité P).Exemple 3.2 Considérons un espace (Ω, A, P) de probabilité.1. Considérons la variable aléatoire X : Ω → Ω définie par X(ω) = ω. Alors, la loi de X est P X= P carX −1 (B) = B pour tout B ∈ A.2. Supposons que P = δ a avec a ∈ Ω <strong>et</strong> considérons X : (Ω, A) −→ (Ω ′ , A ′ ) une variable aléatoire. Alors, laloi P X: A ′ → [0,+∞] de X est définie par∀B ∈ A ′ (, P X(B) = δ a X −1 (B) ) { 1 si a ∈ X=−1 (B), c’est-à-dire si X(a) ∈ B,0 sinon.Par conséquent, la loi de X est P X= δ X(a) .51


3. Considérons A ∈ A <strong>et</strong> la loi de la variable aléatoire réelle X = 1 A . Alors,⎧P(∅) = 0 si 1 /∈ B <strong>et</strong> 0 /∈ B,P X(B) = P ( X −1 (B) ) ⎪⎨P(X = 1) = P(A) si 1 ∈ B <strong>et</strong> 0 /∈ B,=P(X = 0) = 1 − P(A) si 1 /∈ B <strong>et</strong> 0 ∈ B,⎪⎩1 si 1 ∈ B <strong>et</strong> 0 ∈ B.La loi de X est P X= (1 − p)δ 0 +pδ 1 avec p = P(A). C<strong>et</strong>te loi appelée loi de Bernoulli de paramètre p.3.2.2 Intégration par rapport à une mesure imagePrécisons le lien entre l’intégrale par rapport à une mesure image de µ <strong>et</strong> l’intégrale par rapport à µ.Théorème 3.5 (Théorème de transport)Soient (Ω, A,µ) un espace mesuré, (Ω ′ , A ′ ) un espace mesurable, X : (Ω, A) → (Ω ′ , A ′ ) une fonctionmesurable <strong>et</strong> ϕ : (Ω ′ , A ′ ) → ( R, B ( R )) une fonction mesurable. Notons µ Xla mesure image de µ par X.1. Si ϕ est à valeurs dans [0,+∞], alors,∫∫ϕ(x)µ X(dx) =Ω ′Ωϕ(X(ω))µ(dω).2. La fonction ϕ est µ X-intégrable si <strong>et</strong> seulement si ϕ ◦ X est µ-intégrable.3. Si ϕ ◦ X est µ-intégrable, alors∫∫ϕ(x)µ X(dx) =Ω ′Ωϕ(X(ω))µ(dω).Remarque 3.2 L’assertion 1. du théorème 3.5 reste vraie pour toute fonction mesurable à valeurs dans [0,+∞]µ-presque partout. De plus, si ϕ : (Ω, A) → ( R, B ( R )) est une fonction mesurable, alors,ϕ ∈ [0,+∞] µ-presque partout ⇐⇒ ϕ(X) ∈ [0,+∞] µ X-presque partout.Preuve du théorème 3.5.1. • Étape 1 : Cas des fonctions étagées positives. Par définition, pour tout B ∈ A,∫1 B (x)µ X(dx) = µ X(B) = µ ( X −1 (B) ) ∫∫= 1 X −1 (B)(ω)µ(dω) = 1 B (X(ω))µ(dω).Ω ′ ΩΩPar additivité des intégrales sur l’ensemble des fonctions étagées positives, pour toute fonctionétagée ϕ : Ω → [0,+∞], ∫∫ϕ(x)µ X(dx) = ϕ(X(ω))µ(dω)Ω ′ Ω• Étape 2 : Cas des fonctions mesurables positives. Soit ϕ : Ω → [0,+∞] une fonctionmesurable. Alors, il existe (ϕ n ) n∈Nune suite croissante de fonctions étagées sur (Ω, A) à valeursdans [0,+∞] convergeant simplement vers ϕ. Par définition de l’intégrale de ϕ par rapport à µ X<strong>et</strong>d’après l’étape 1. appliquée à chaque ϕ n ,∫∫∫Ω ′ ϕ(x)µ X(dx) = limn→+∞Ω ′ ϕ n (x)µ X(dx) = limn→+∞52Ωϕ n (X(ω))µ(dω).


De plus, (ϕ n ◦ X) n∈N est une suite croissante de fonctions étagées sur (Ω ′ , A ′ ) à valeurs dans [0,+∞]convergeant simplement vers la fonction mesurable positive ϕ ◦ X. Alors,∫∫∫ϕ(X(ω))µ(dω) = lim ϕ n (X(ω))µ(dω) = ϕ(x)µn→+∞X(dx).Ω ′Ω2. L’assertion 2. se déduit de l’assertion 1. <strong>et</strong> de la définition d’une fonction intégrable.Ω3. Supposons que ϕ : Ω → R est µ X-intégrable. Alors, par définition,∫∫∫ϕ(x)µ X(dx) = ϕ +(x)µ X(dx) − ϕ −(x)µ X(dx).Ω ′ Ω ′ Ω ′Les fonctions ϕ +<strong>et</strong> ϕ − étant mesurables à valeurs dans [0,+∞], d’après l’assertion 1.,∫∫∫∫ϕ(x)µ X(dx) = ϕ +(X(ω))µ(dω) − ϕ −(X(ω))µ(dω) = ϕ(X(ω))µ(dω).Ω ′ ΩΩΩcar (ϕ ◦ X) += ϕ +◦ X <strong>et</strong> (ϕ ◦ X) −= ϕ −◦ X.Écrivons maintenant en termes probabilistes le théorème du transport.Théorème 3.6 (Version probabiliste du théorème de transport)Soient (Ω, A, P) un espace de probabilité, (Ω ′ , A ′ ) un espace probabilisable <strong>et</strong> X : (Ω, A) → (Ω ′ , A ′ ) unevariable aléatoire. Notons P Xla loi de X. Considérons ϕ : (Ω ′ , A ′ ) → ( R, B ( R )) une fonction mesurable.1. La fonction ϕ est P X-intégrable si <strong>et</strong> seulement si ϕ(X) est P-intégrable.2. Si ϕ(X) est P-intégrable ou à valeurs P-presque sûrement dans [0,+∞], alors∫E(ϕ(X)) = ϕ(x)P X(dx).Ω ′Terminons c<strong>et</strong>te section en donnant une caractérisation de la loi de X.Proposition 3.7Soient (Ω, A, P) un espace de probabilité, (Ω ′ , A ′ ) un espace probabilisable <strong>et</strong> X,Y : (Ω, A) → (Ω ′ , A ′ )deux variables aléatoires.Alors, X <strong>et</strong> Y ont même loi si <strong>et</strong> seulement si pour toute fonction ϕ : (Ω ′ , A ′ ) → ([0,+∞], B([0,+∞]))mesurable,E(ϕ(X)) = E(ϕ(Y )). (3.1)Remarque 3.3 Les variables aléatoires X,Y : (Ω, A) → (Ω ′ , A ′ ) ont même loi si <strong>et</strong> seulement si (3.1) estvérifiée pour toute fonction ϕ : (Ω ′ , A ′ ) → ( R, B ( R )) mesurable bornée (ou mesurable positive bornée).Preuve de la proposition 3.7. Notons P Xla loi de X <strong>et</strong> P Yla loi de Y .• Supposons que P X= P Y. Considérons une fonction mesurable ϕ : (Ω ′ , A ′ ) → ([0,+∞], B([0,+∞])).Alors, d’après le théorème du transport,∫ ∫E(ϕ(X)) = ϕdP X=Ω ′ ϕdP Y= E(ϕ(Y )).Ω ′53


•• Supposons que (3.1) est vérifiée pour toute fonction mesurable ϕ : (Ω ′ , A ′ ) → ([0,+∞], B([0,+∞])).Pour tout B ∈ A ′ , la fonction ϕ = 1 B : Ω ′ → R est mesurable positive <strong>et</strong> donc, par hypothèse,P(X ∈ B) = E(1 B (X)) = E(1 B (Y )) = P(Y ∈ B).Alors, par définition de P X<strong>et</strong> P Y, P X= P Y.3.2.3 Fonction de répartitionLa notion de fonction de répartition est utile notamment pour déterminer la loi d’une variable aléatoire.Définition 3.8 (Fonction de répartition d’une variable aléatoire réelle)Soient (Ω, A, P) un espace de probabilité <strong>et</strong> X : (Ω, A, P) → (R, B(R)) une variable aléatoire réelle.Notons P Xla loi de X. La fonction de répartition de X est la fonction F X: R → [0,1] définie par∀t ∈ R, F X(t) = P(X t) = P ( X −1 (] − ∞,t]) ) = P X(] − ∞,t]).Exemple 3.3 Considérons une variable aléatoire réelle X, notons P Xsa loi <strong>et</strong> F Xsa fonction de répartition.1. Soit a ∈ R. Supposons que P X= δ a (ce qui revient à supposer que X = a presque sûrement). Alors,{ 0 si t ∈] − ∞,a[F X(t) = P X(] − ∞,t]) =1 si t ∈ [a,+∞[.aFigure 3.1 – Fonction de répartition de la variable X = a2. Supposons que X est de loi P Xdéfinie sur B(R) par P X(B) = λ 1 (B ∩ [0,1]). Alors,⎧⎨ 0 si t < 0,F X(t) = λ 1 (] − ∞,t] ∩ [0,1]) = t si 0 t < 1,⎩1 si t 1.Donnons les propriétés de la fonction de répartition d’une variable aléatoire réelle.Proposition 3.9 (Propriétés d’une fonction de répartition)Soient (Ω, A, P) un espace de probabilité <strong>et</strong> X : (Ω, A, P) → (R, B(R)) une variable aléatoire réelle.1. La fonction de répartition F Xde X est une fonction croissante, continue à droite telle quelim F X(t) = 0 <strong>et</strong> limt→−∞F X(t) = 1. (3.2)t→+∞De plus, F Xadm<strong>et</strong> une limite à gauche en tout point <strong>et</strong>∀t ∈ R, F X(t−)= limx→t −F X(x) = P X(] − ∞,t[). (3.3)54


2. Par ailleurs, pour tous réels a,b tels que a < b,⎧P X(]a,b]) = P(a < X b) = F X(b) − F X(a),( )P⎪⎨X([a,b]) = P(a X b) = F X(b) − F a− X ,( )P X([a,b[) = P(a X < b) = F b− X − FX (a),( )P X([a,+∞[) = P(X a) = 1 − F a− X ,⎪⎩P X(]a,+∞[) = P(X > a) = 1 − F X(a).3. Enfin, F Xadm<strong>et</strong> au plus un nombre fini ou dénombrable de points de discontinuité.Preuve de la proposition 3.9.• Soient t,s ∈ R tels que s t. Alors, ] − ∞,s] ⊂] − ∞,t] <strong>et</strong> donc d’après la proposition 1.19 (voirchapitre 1 page 11), c’est-à-dire par croissance de P X,F X(s) = P X(] − ∞,s]) P X(] − ∞,t]) = F X(t).L’inégalité précédente étant vraie pour tous t,s ∈ R tels que s t, la fonction F Xest croissante sur R.• La continuité à droite de F X, la propriété (3.2) <strong>et</strong> la propriété (3.3) s’obtiennent en utilisant la continuitémonotone de P X(voir page 12) ou le théorème de Beppo Levi (voir page 35).• Pour tous réels a,b tels que a < b,P X(]a,b]) = P X(] − ∞,b]∩] − ∞,a] c ) = P X(] − ∞,b]) − P X(] − ∞,a]) = F X(b) − F X(a)<strong>et</strong> P X([a,b]) = P X(] − ∞,b]∩] − ∞,a[ c ) = P X(] − ∞,b]) − P X(] − ∞,a[) = F X(b) − F X(a − ).Les autres formules données dans l’assertion 2. se démontrent de manière analogue.• La fonction F X étant croissante continue à droite, l’ensemble de ses points de discontinuité estS = ⋃{}( ) 1D n avec D n = x ∈ R / F X(x) − F x− X .nn∈N ∗Étant donné que 0 F X 1 <strong>et</strong> que F Xest croissante, pour tout n ∈ N ∗ , D n est de cardinal fini carcardD nn ∑ x∈D n(FX (x) − F X(x−)) 1. Par conséquent, S est un ensemble fini ou dénombrable. Remarque 3.4 Soit F : R → [0,1] une fonction croissante <strong>et</strong> continue à droite telle quelim F(x) = 1 <strong>et</strong> limx→+∞F(x) = 0.x→−∞Alors il existe une variable aléatoire réelle X définie sur sur ([0,1], B([0,1]),λ 1 ) de fonction de répartition F.La loi d’une variable aléatoire réelle est caractérisée par sa fonction de répartition. Il s’agit d’une simpleapplication du corollaire A.6 page 95.Proposition 3.10 (Caractérisation de la loi d’une variable aléatoire réelle)Soient X <strong>et</strong> Y deux variables aléatoires réelles définies sur l’espace de probabilité (Ω, A, P). Alors, lesvariables aléatoires X <strong>et</strong> Y ont même fonction de répartition si <strong>et</strong> seulement si elles ont même loi.55


Généralisons la notion de fonction de répartition aux variables aléatoires à valeurs dans R d .Définition 3.11Soit (Ω, A, P) un espace de probabilité. Pour tout entier 1 i d, considérons X i : (Ω, A, P) → (R, B(R))une variable aléatoire. Notons P Xla loi de X = (X 1 ,... ,X d ). La fonction de répartition de X estla fonction F X: R d → [0,1] définie par( d) (⋂d∏)∀(t 1 ,... ,t d ) ∈ R d , F X(t 1 ,... ,t d ) = P {X i t i } = P X− ∞,t i ] .i=1]i=1Remarque 3.5 La proposition 3.10 reste vraie pour des variables à valeurs dans R d .3.3 Variables aléatoires <strong>et</strong> lois discrètes3.3.1 Définitions <strong>et</strong> premières propriétésDéfinition 3.12 (Variable aléatoire discrète)Une variable aléatoire X définie sur l’espace de probabilité (Ω, A, P) est dite discrète si il existe unensemble S fini ou dénombrable tel queX ∈ S P-presque sûrement,c’est-à-dire si P-presque sûrement, X prend un nombre fini ou dénombrable de valeurs.En fait, une variable aléatoire est discrète si <strong>et</strong> seulement si sa loi est une mesure discrète.Proposition 3.13 (Lien variables aléatoires discrètes/mesures discrètes)Soit (E, E) un ensemble probabilisable. Supposons que E = B(E) ou E = P(E) <strong>et</strong> considéronsS = {x i /i ∈ I} ⊂ Eun ensemble fini ou dénombrable. Supposons x i ≠ x j pour tous i,j ∈ I tels que i ≠ j.1. Considérons (Ω, A, P) un espace de probabilité <strong>et</strong> supposons que X : (Ω, A) → (E, E) est unevariable aléatoire à valeurs P-presque sûrement dans l’ensemble S. Pour tout i ∈ I, posonsp i = P X({x i }) = P(X = x i ). (3.4)Alors pour tout i ∈ I, p i 0 <strong>et</strong> ∑ i∈Ip i = 1. De plus, la loi de X est la mesure discrète P X= ∑ i∈Ip i δ xi .2. Réciproquement, si (p i ) i∈Iest une famille de réels vérifiant∑∀i ∈ I, p i 0 <strong>et</strong> p i = 1,alors il existe un espace de probabilité (Ω, A, P) <strong>et</strong> une variable aléatoire X : (Ω, A) → (E, E) àvaleurs dans S <strong>et</strong> vérifiant (3.4) pour tout i ∈ I. De plus, la loi de la variable aléatoire X estP X= ∑ i∈Ii∈Ip i δ xi .56


Preuve de la proposition 3.13. Nous pouvons supposer que I = {1,... ,n} ou N ∗ .1. Soit X : (Ω, A) → (E, E) une variable aléatoire à valeurs P-presque sûrement dans l’ensemble S.Supposons que p i est défini par (3.4).• La mesure P X étant positive, p i 0 pour tout i ∈ I. De plus, ∑ i∈Ip i = P X (S) = 1.• Étant donné que P X (S) = P(X ∈ S) = 1, P X (Sc ) = P(X ∈ S c ) = 0. Alors,∀B ∈ E, P X(B ∩ S c ) = P(X ∈ B ∩ S c ) = 0par croissance de P X. Par suite, par additivité de P X,∀B ∈ E, P X(B) = P X(B ∩ S) + P X(B ∩ S c ) = P X(B ∩ S).Par ailleurs, pour tout B ∈ E, les ensembles B ∩ {x i }, i ∈ I, sont des éléments de la tribu E (car Econtient les singl<strong>et</strong>ons <strong>et</strong> B) deux à deux disjoints <strong>et</strong>B ∩ S = ⋃ i∈IB ∩ {x i }.Alors, par additivité (respectivement σ-additivité) de P Xsi I est fini (respectivement si I est infinidénombrable),∀B ∈ E, P X(B) = ∑ P X(B ∩ {x i }) = ∑ p i δ xi (B)i∈Ii∈Iavec p i défini par (3.4). Par suite, P X= ∑ i∈Ip i δ xi .2. Soit (p i ) i∈Iune famille de réels telle que∀i ∈ I, p i 0 <strong>et</strong> telle que ∑ i∈Ip i = 1.Posons Ω = [0,1] <strong>et</strong> supposons que P = λ 1 est la mesure de Lebesgue sur [0,1]. ConsidéronsX = x 1 1 [0,p1 ] + ∑j∈I\{1}x i 1 ]p1 +···+p i−1 ,p 1 +···+p i ]. (3.5)Notons que X est bien définie sur [0,1] car les p i sont positifs <strong>et</strong> de somme égale à 1. De plus, Xest une fonction étagée donc une variable aléatoire. Les x i étant deux à deux distincts,<strong>et</strong> pour tout i ∈ I\{1},P(X = x 1 ) = λ 1 ([0,p 1 ]) = p 1⎛⎡∑i−1P(X = x i ) = λ 1⎝⎣p j ,j=1⎡⎞i∑p j⎣⎠ = p iDe plus, X prend bien ses valeurs dans S = {x i /i ∈ I}. La variable X vérifiant les hypothèsesde l’assertion 1. <strong>et</strong> les p i , i ∈ I, étant donnés par (3.4), la loi de X est bien la mesure discrèteP X= ∑ p i δ xi .i∈Ij=1Réécrivons le théorème du transport pour une variable aléatoire discrète.57


Théorème 3.14 (Théorème du transport pour une variable aléatoire discrète)Soient (Ω, A, P) un espace de probabilité <strong>et</strong> (E, E) un ensemble probabilisable. Supposons que E = B(E)ou E = P(E) <strong>et</strong> considéronsS = {x i /i ∈ I} ⊂ Eun ensemble fini ou dénombrable. Supposons x i ≠ x j pour tous i,j ∈ I tels que i ≠ j. Considérons unevariable aléatoire discrète X : (Ω, A) → (E, E) à valeurs P-presque sûrement dans S <strong>et</strong> une fonctionmesurable ϕ : (E, E) → ( R, B ( R )) .1. Alors, ϕ(X) est intégrable si <strong>et</strong> seulement si∑|ϕ(x i )| P(X = x i ) < +∞.i∈I2. Si ϕ(X) est intégrable ou si ϕ(X) est à valeurs dans [0,+∞] presque sûrement, alorsE(ϕ(X)) = ∑ i∈Iϕ(x i ) P(X = x i ).3.3.2 Fonction de répartition d’une variable réelle discrèteDans c<strong>et</strong>te section, nous donnons la fonction de répartition d’une loi discrète. De plus, connaissant lafonction de répartition d’une variable aléatoire X, nous souhaitons savoir si X est discrète <strong>et</strong> donner sa loi.Proposition 3.15 (Variables aléatoires discrètes <strong>et</strong> fonctions de répartition)1. Considérons (Ω, A, P) un espace de probabilité. Soit X une variable aléatoire réelle discrète définiesur (Ω, A, P) <strong>et</strong> à valeurs P-presque sûrement dans l’ensembleS = {x i /i ∈ I} ⊂ Ravec I = {1,... ,n} ou I = N ∗ . Notons F Xla fonction de répartition de X <strong>et</strong> posonsp i = P(X = x i )pour tout i ∈ I. Supposons que pour tout i ∈ I tel que i + 1 ∈ I, x i < x i+1 .(a) Si S est fini, alors⎧⎪⎨ 0 si t ∈ ]−∞,x 1 [F X(t) = p 1 + · · · + p i si x i t < x i+1 avec 1 i < n⎪⎩1 si t ∈ [x n ,+∞[.(b) Si S est infini dénombrable, alors{0 si t ∈ ]−∞,x 1 [F X(t) =p 1 + · · · + p i si x i t < x i+1 avec i ∈ N ∗ .(c) La fonction F Xest constante par morceaux continue sauf éventuellement aux points x i , i ∈ I,<strong>et</strong> pour tout i ∈ I, p i = F X(x i ) − F X(x i− ) est la valeur du saut de la fonction F Xau point x i .58


••2. Soit F : R → R une fonction croissante, continue à droite, constante par morceaux <strong>et</strong> telle quelim F(t) = 0 <strong>et</strong> lim F(t) = 1.t→−∞ t→+∞Notons S = {x i /i ∈ I} l’ensemble des points de discontinuité de F, avec I = {1,... n} ou I = N ∗<strong>et</strong> avec avec x i ≠ x j pour tous i,j ∈ I tels que i ≠ j.Alors, il existe un espace de probabilité (Ω, A, P) <strong>et</strong> une variable aléatoire réelle discrète X définiesur (Ω, A, P) de fonction de répartition F <strong>et</strong> de loiP X= ∑ i∈Ip i δ xiavec pour tout i ∈ I, p i = F(x i ) − F(x i− ) la valeur du saut de F au point x i .Preuve de la proposition 3.15.1. La preuve de la première assertion est laissée en exercice.2. La fonction F étant croissante, continue à droite <strong>et</strong> constante par morceaux,F = ∑ f i 1 [xi ,x i+1 [i∈Iavec I = {1,... ,n} ou I = N ∗ , (x i ) i∈Iune famille strictement croissante de R + ∪{∞} <strong>et</strong> (f i ) i∈Iune famille strictement croissante de R ∗ +. L’ensemble des points de discontinuité de F est doncS = {x i /i ∈ I}. En appliquant l’assertion 1. à la variable aléatoire discrète X définie par (3.5),nous constatons que F est la fonction de répartition de X.Exemple 3.4 Considérons la fonction F : R → R définie par⎧⎨ 0 si x < 1F(x) = 0.25 si 1 x < 3⎩1 si x 3.1 3Figure 3.2 – Fonction F = 1 4 1 [1,3[ + 3 4 1 [3,+∞[.La fonction F vérifie bien les hypothèses de l’assertion 2. de la proposition 3.15. Elle est continue sauf en x = 1<strong>et</strong> en x = 3. De plus, son saut en x = 1 vaut 1/4 <strong>et</strong> son saut en x = 3 vaut 3/4. Par suite, F est la fonction derépartition d’une variable aléatoire X de loi P X= 1 4 δ 1 + 3 4 δ 3.3.3.3 Lois discrètes classiques.Dans c<strong>et</strong>te section, nous introduisons les lois discrètes classiques : lois de Bernoulli, binomiales, géométriques<strong>et</strong> de Poisson. Commençons par les lois de Bernoulli.Définition 3.16 (Loi de Bernoulli B(p))La loi de Bernoulli B(p) de paramètre p ∈ [0, 1] est la probabilité µ = (1 − p)δ 0 + pδ 1 .59


Interprétation : Supposons que p est la probabilité de succès d’une expérience. Notons X la variable prenantla valeur 1 si l’expérience se solde par un succès <strong>et</strong> 0 sinon. Alors, X suit la loi de Bernoulli de paramètre p.Donnons la fonction de répartition d’une variable aléatoire de loi de Bernoulli.Proposition 3.17 (Fonction de répartition)Soit X une variable aléatoire de loi de Bernoulli B(p). Alors, la fonction de répartition F Xdonnée par⎧⎨ 0 si t < 0,F X(t) = 1 − p si t ∈ [0,1[,⎩1 si t 1.de X estIntroduisons à présent les lois binomiales.Définition 3.18 (Loi binomiale B(n, p))n∑La loi binomiale B(n, p) de paramètres (n, p) ∈ N ∗ × p ∈ [0, 1] est µ = Cn k p k (1 − p) n−k δ kk=0Remarque 3.6 La loi de Bernoulli B(p) est la loi binomiale B(1,p) de paramètre (1,p).Interprétation : Soit p la probabilité de succès d’une expérience. Répétons n fois c<strong>et</strong>te expérience de manièreindépendante. Notons X i la variable aléatoire qui vaut 1 (respectivement 0) si la i ième expérience est un succès(respectivement échec). Les variables X 1 ,...,X n suivent toute la loi de Bernoulli B(p) <strong>et</strong> sont ≪ indépendantes ≫.Alors le nombre de succès X = ∑ ni=1 X i obtenus au cours des n expériences suit une loi B(n,p).Introduisons à présent les lois géométriques.Définition 3.19 (Loi géométrique G(p))La loi géométrique G(p) de paramètre p ∈]0,1[ est µ =+∞∑k=1p(1 − p) k−1 δ k .Construction d’une loi géométrique à partir d’une loi de Bernoulli : Soit (X n ) n∈N ∗ une suite devariables aléatoires ≪ indépendantes ≫ de loi de Bernoulli B(p). Pour chaque n, X n = 1 si la nème expériencese solde par un succès <strong>et</strong> 0 si elle se solde par un échec. Nous notons Y la première fois (le premier n) où unsuccès est obtenu. Alors, Y suit la loi G(p).Concluons c<strong>et</strong>te section en introduisant les lois de Poisson.Définition 3.20 (Loi de Poisson P(λ))La loi de Poisson P(λ) de paramètre λ ∈]0, +∞[ est µ =+∞∑k=0λ kk! e−λ δ k .Interprétation : Supposons que l’on prélève n unités dans une population ne comportant que deux sortesd’individus A <strong>et</strong> B en proportion p <strong>et</strong> q. Si n est grand <strong>et</strong> p voisin de 0 de sorte que np soit compris entre 1 <strong>et</strong>10, le nombre d’individus de l’espèce A dans un prélèvement est ≪ approximativement ≫ une variable aléatoirede Poisson de paramètre λ = np.60


3.4 Variables aléatoires <strong>et</strong> lois absolument continues3.4.1 Définitions <strong>et</strong> premières propriétésNous définissons tout d’abord la notion de mesure absolument continue par rapport à une autre.Définition 3.21 (Absolue continuité)Soient µ <strong>et</strong> ν deux mesures positives sur (Ω, A).1. La mesure µ est absolument continue par rapport à ν (ce que l’on note µ


Fixons n ∈ N. Étant donné que Ω n ∈ B ( R d) <strong>et</strong> que les fonctions f <strong>et</strong> g sont boréliennes,(A n = {f < g} ∩ Ω n ∈ B R d) .Les fonctions f1 An <strong>et</strong> g1 An sont alors boréliennes à valeurs dans [0,+∞]. De plus, par hypothèse∫ ∫f1 An dν = g1 An dν = µ(A n ) < +∞. (3.6)ΩΩEn particulier, les fonctions boréliennes positives f1 An <strong>et</strong> g1 An sont ν-intégrables. Par ailleurs, pardéfinition de A n , f1 An g1 An . Alors, d’après la proposition 2.17 (voir page 34), vu l’égalité (3.6),f1 An = g1 Anν-presque partout.Comme sur A n , f < g, nous avons ν(A n ) = 0. Ceci étant vrai pour tout n ∈ N, A = {f < g} = ⋃ n∈N A nest ν-négligeable, c’est-à-dire que g f ν-presque partout. De même f g ν-presque partout. Parconséquent, f = g ν-presque partout.Nous pouvons maintenant définir les variables aléatoires de loi absolument continue.Définition 3.23 (Variable absolument continue)Une variable aléatoire X à valeurs dans R d est absolument continue si sa loi est absolument continue,c’est-à-dire s’il existe une fonction f X: R d → [0,+∞] borélienne telle que(∀A ∈ B R d) ∫, P X(A) = P(X ∈ A) = f X(x)1 A (x)λ d (dx).R dLa fonction f Xest alors appelée densité de X.Nous pouvons caractériser les densités de variables aléatoires.Proposition 3.24Une fonction f : R d → R est la densité d’une variable aléatoire X définie sur un espace de probabilité(Ω, A, P) si <strong>et</strong> seulement si f est une fonction borélienne à valeurs dans [0,+∞] <strong>et</strong> telle que∫R d f(x)λ d (dx) = 1.Preuve de la proposition 3.24. Soit f : R d → R une fonction.• Si f est la densité d’une variable aléatoire X à valeurs dans R d , alors par définition f est borélienne àvaleurs dans [0,+∞] <strong>et</strong> ∫(f(x)λ d (dx) = P X ∈ R d) = 1. (3.7)R d• Réciproquement supposons que f est borélienne à valeurs dans [0,+∞] <strong>et</strong> vérifie (3.7). Supposons d = 1<strong>et</strong> considérons la fonction F : R → R définie par∫∫F(t) = f(x)λ 1 (dx) = f 1 ]−∞,t] dλ 1 .]−∞,t]62R


La fonction borélienne f étant positive, F est croissante. De plus, le théorème de convergence dominéeperm<strong>et</strong> de vérifier que F est une fonction continue sur R telle que lim t→+∞ F(t) = 1 <strong>et</strong> lim t→−∞ F(t) = 0.Alors, d’après la remarque 3.4, la fonction F est la fonction de répartition d’une variable aléatoire réelleX. En particulier,∀t ∈ R, P X(] − ∞,t]) = ν(] − ∞,t]) (3.8)∫où ν(B) = f(x) λ 1 (dx) pour B ∈ B(R). De plus, ν : B(R) → [0,+∞] est une mesure positive surB(R, B(R)) <strong>et</strong> est même une probabilité car∫ν(R) =Rf(x) λ 1 (dx) = 1.Les mesures P X<strong>et</strong> ν étant σ-finies <strong>et</strong> vérifiant (3.8), d’après le corollaire A.6 donné en annexe page 95,∫∀B ∈ B(R), P X(B) = ν(B) = f(x)λ 1 (dx).Par conséquent, la loi de X est la loi absolument continue de densité f.BExprimons l’intégrale d’une fonction par rapport à la loi d’une variable de loi absolument continue.Théorème 3.25 (Théorème du transport pour les variables de loi absolument continue)Soient X une variable aléatoire définie sur l’espace de probabilité (Ω, A, P) à valeurs dans R d de loiabsolument continue de densité f X<strong>et</strong> ϕ : R d → R une fonction borélienne.∫1. Alors, ϕ(X) est intégrable si <strong>et</strong> seulement si |ϕ(t)| f X(t) λ d (dt) < +∞.R d2. De plus, si ϕ(X) est intégrable ou si ϕ(X) est à valeurs dans [0,+∞] P-presque sûrement, alors∫E(ϕ(X)) = ϕ(t)f X(t)λ d (dt).R dPreuve du théorème 3.25. En suivant la démarche pour définir l’intégrale par rapport à µ X<strong>et</strong> en utilisant l<strong>et</strong>héorème de Beppo Levi pour l’intégrale par rapport à µ, nous constatons que∫ ∫g dP X= gf Xdλ d (3.9)R d R dpour toute fonction borélienne g : R d → [0,+∞].• D’après le théorème du transport, ϕ(X) est P-intégrable si <strong>et</strong> seulement ϕ est P X-intégrable, c’est-à-diresi <strong>et</strong> seulement si ϕf Xest λ d -intégrable car f X 0 <strong>et</strong> g = |ϕ| vérifie (3.9). L’assertion 1. du théorème estdonc démontrée.• Supposons ϕ(X) P-intégrable. Alors d’après le théorème du transport <strong>et</strong> (3.9) pour g = ϕ +<strong>et</strong> g = ϕ −,∫ ∫ ∫ ∫E(ϕ(X)) = ϕdP X(x) = ϕ +f Xdλ d − ϕ −f Xdλ d = ϕf Xdλ dR d R d R d R dcar (ϕf X) += ϕ +f X<strong>et</strong> (ϕf X) −= ϕ −f X.63


• Supposons ϕ(X) 0 P-presque sûrement. Alors, 1 ϕ


3.4.3 Changement de variablesNous nous intéressons à la loi de la variable aléatoire g(X) lorsque X est de loi absolument continue.Proposition 3.27Soient X une variable aléatoire définie sur l’espace de probabilité (Ω, A, P) <strong>et</strong> à valeurs dans R d . Supposonsque la loi est absolument continue de densité f X<strong>et</strong> considérons un ouvert U de R d tel queP(X ∈ U) = 1.Si g : U → R d une fonction injective de classe C 1 sur U <strong>et</strong> si le le jacobien de g ne s’annule pas sur U,alors g(X) est une variable aléatoire de loi absolument continue ayant pour densité la fonctionR d −→ [0,+∞]x ↦→ f X◦ g −1 (x) ∣ ∣d<strong>et</strong> J ( g −1 (x) )∣ ∣ 1 V (x)avec V = g(U) <strong>et</strong> pour tout x ∈ U, J ( g −1 (x) ) la matrice jacobienne de g −1 en x.Preuve de la proposition 3.27. Il suffit d’appliquer le théorème de changement de variables énoncé ci-après. Théorème 3.28Soient U un ouvert de R d <strong>et</strong> Φ : U → R d une application injective de classe C 1 dont la matrice jacobienne( ) ∂ΦiJ(Φ)(x) = (x)∂x j1i,jden x est inversible pour tout x ∈ U. Posons V = Φ(U). Alors∫∫g(x)λ d (dx) = g ◦ Φ(x)|d<strong>et</strong>J(Φ(x))|λ d (dx).Vpour toute fonction g : V → R λ d -intégrable ou borélienne positive.UPreuve du théorème 3.28. Voir par exemple [11].3.4.4 Lois classiques absolument continuesDans c<strong>et</strong>te section, nous introduisons des lois classiques absolument continues en donnant leur densité <strong>et</strong>précisons leur fonction de répartition si cela est possible. Commençons par les lois uniformes.Définition 3.29 (Loi uniforme sur [a, b])Une variable aléatoire réelle X suit une loi uniforme sur l’intervalle [a, b] (avec a,b ∈ R tel quea < b) si la loi de X est la loi absolument continue de densité la fonction f X: R → R définie par∀x ∈ R, f X(x) = 1b − a 1 [a,b](x).Donnons la fonction de répartition d’une loi uniforme sur un intervalle.65


Proposition 3.30 (Fonction de répartition de la loi uniforme sur [a, b])Si X est une variable aléatoire de loi uniforme sur [a,b] (avec a,b ∈ R tels que a < b), sa fonction derépartition F Xest donnée par⎧⎨ 0 si x a,x−aF X(x) =⎩b−asi a x b,1 si x b.<strong>et</strong> la variable aléatoire X−ab−asuit une loi uniforme sur [0,1].Preuve de la proposition 3.30. Le calcul de F Xse ramène au calcul d’une intégrale au sens de Riemann <strong>et</strong> estlaissé en exercice. La densité de Y = X−ab−apeut être obtenue en appliquant la proposition 3.27. Nousproposons ici une autre méthode. Alors, pour tout t ∈ R,⎧⎨ 0 si t 0,F Y(t) = P(Y t) = P(X a + (b − a)t) = t si 0 t 1,⎩1 si t 1.Alors, F Yest la fonction de répartition de la loi uniforme sur [0,1] <strong>et</strong> donc Y suit la loi uniforme sur [0,1].•abFigure 3.3 – Fonction de répartition de la loi uniforme sur [a,b]Introduisons la loi uniforme sur n’importe quel borné de mesure de Lebesgue non nulle.Définition 3.31 (Loi uniforme sur U)Soit U ⊂ R d un borné tel que λ d (U) > 0. Une variable aléatoire X suit une loi uniforme sur U si laloi de X est la loi absolument continue de densité f Xdéfinie sur R d par∀x ∈ R d , f X(x) = 1λ d (U) 1 U(x).Introduisons à présent les lois exponentielles.Définition 3.32 (Loi exponentielle E(λ))Une variable aléatoire réelle X suit la loi exponentielle E(λ) de paramètre λ ∈]0, +∞[ si la loi deX est la loi absolument continue de densité ϕ λ définie sur R par∀x ∈ R, ϕ λ (x) = e−x/λλ1 ]0,+∞[ (x).Donnons la fonction de répartition d’une loi exponentielle.66


Proposition 3.33 (Fonction de répartition de la loi E(λ))La fonction de répartition F Xd’une variable aléatoire réelle X de loi exponentielle E(λ) est donnée parF X(x) ={ 0 si x 0,1 − e −x/λ si x > 0.10.90.80.70.60.50.40.30.20.10−1 0 1 2 3 4 5 6Figure 3.4 – Fonction de répartition de la loi E(1)Corollaire 3.34Si a ∈]0,+∞[ <strong>et</strong> si X est une variable aléatoire de loi exponentielle de paramètre λ ∈]0,+∞[, alors aXsuit la loi exponentielle de paramètre aλ.Preuve du corollaire 3.34. On peut soit appliquer la proposition 3.27 soit procéder comme suit. Notons F aXla fonction de répartition de aX. Alors, par définition, pour tout t ∈ R,(F aX(t) = P X t ) { 0 si t 0,=a 1 − e −t/(aλ) si t > 0.Par suite, F aXest la fonction de répartition de la loi exponentielle E(aλ) <strong>et</strong> donc aX suit la loi E(aλ).Nous terminons c<strong>et</strong>te section en introduisant les lois gaussiennes. Ces lois sont très importantes car elles sonttrès fréquemment utilisées pour la modélisation de phénomènes aléatoires <strong>et</strong> car elles apparaissent naturellementdans certains résultats limites (voir la loi des grands nombres <strong>et</strong> le théorème central limite dans le chapitre 8).Nous commençons par définir la loi gaussienne centrée réduite.Définition 3.35 (Loi gaussienne centrée réduite)Une variable aléatoire réelle X est dite gaussienne centrée réduite, ou de loi gaussienne centréeréduite si sa loi est absolument continue de densitéf 0,1: R −→ Rx ↦−→ 1 √2πe − x2 2Nous expliquerons dans le chapitre suivant les qualificatifs ≪ centrée, réduite ≫. Introduisons à présent entoute généralité les variables aléatoires gaussiennes réelles.67


Définition 3.36 (Variable aléatoire réelle gaussienne)Une variable aléatoire réelle X est dite gaussienne ou de loi gaussienne si il existe (a,m) ∈ R × R <strong>et</strong>une variable aléatoire réelle X 0 de loi gaussienne centrée réduite tels queX = aX 0 + m presque sûrement.Comme le décrit la proposition suivante, si X est une variable aléatoire réelle gaussienne, alors soit X estpresque sûrement constante soit la loi de X est absolument continue.Proposition 3.37Si X est une variable aléatoire réelle gaussienne, alors,1. il existe m ∈ R tel que X = m presque sûrement (c’est-à-dire que X est presque sûrement constante)<strong>et</strong> dans ce cas la loi de X est δ m ,2. il existe (m,σ) ∈ R × R ∗ + telle que la loi de X est absolument continue de densitéouf m,σ 2 : R −→ Rx ↦−→ 1 √2πσe −(x−m)2 2σ 2 .Si m ∈ R <strong>et</strong> si σ ∈ R ∗ +, N ( m, σ 2) désigne la loi gaussienne de densité f m,σ 2. Par convention, si m ∈ R,N(m,0) désigne la loi δ m (une telle loi est appelée loi gaussienne dégénérée).Preuve de la proposition 3.37. Presque sûrement X = aX 0 + m avec X 0 une variable aléatoire gaussiennecentrée réduite <strong>et</strong> (a,m) ∈ R × R.• 1 er cas : Supposons a = 0. Alors, X = m presque sûrement <strong>et</strong> sa loi est δ m .• 2 nd cas : Supposons a ≠ 0. Alors, pour toute fonction g : R → R borélienne bornée,∫E(g(X)) = E(g(aX 0 + m)) = g(ay + m)f 0,1(y)dy = √ 1 ∫g(ay + m)e −y2 /2 dy2πRcar f 0,1est la densité de X 0 . Nous pouvons effectuer le changement de variable x = ay + m car a ≠ 0.Nous constatons alors que pour toute fonction g : R → R borélienne bornée,∫∫1E(g(X)) = √ g(x)e −(x−m)2 /(2a 2) dx = g(x)f (x)dx2π|a| m,σ 2RRRavec σ = |a|. Ceci signifie que la loi de X est la loi de densité f m,σ 2 .Par définition, il est clair que si une variable aléatoire réelle Y est une fonction affine d’une variable aléatoireréelle gaussienne X alors Y est aussi une variable aléatoire gaussienne.68


Proposition 3.38Soient X une variable aléatoire réelle <strong>et</strong> (m,σ) ∈ R × R + .1. Si X suit la loi N ( m,σ 2) <strong>et</strong> si (a,b) ∈ R 2 +, alors Y = aX + b suit la loi N ( am + b,a 2 σ 2) .2. Supposons σ ∈ R ∗ +. Alors, X suit la loi N ( m,σ 2) si <strong>et</strong> seulement si (X − m)/σ suit la loi N(0,1).Terminons c<strong>et</strong>te section en introduisant la fonction de répartition d’une variable aléatoire réelle gaussiennecentrée réduite.0.410.350.90.80.30.70.250.60.20.50.150.40.30.10.20.050.10−3 −2 −1 0 1 2 30−3 −2 −1 0 1 2 3Figure 3.5 – Densité <strong>et</strong> Fonction de répartition de la loi N(0,1).Notation : Φ désigne la fonction de répartition de la loi gaussienne centrée réduite, c-à-d que∀x ∈ R, Φ(x) = P(X x) = 1 √2π∫ x−∞e −t2 /2 λ 1 (dt) .La fonction Φ n’est pas connue explicitement. Les valeurs de c<strong>et</strong>te fonction sont tabulées. Par exemple,Φ(1) ≈ 0.841, Φ(2) ≈ 0.977, Φ(3) ≈ 0.999,Φ(1.64) ≈ 0.950 <strong>et</strong> Φ(1.96) ≈ 0.975Les valeurs Φ(1.64) <strong>et</strong> Φ(1.96) apparaissent lors de tests statistiques.3.5 Mélange de lois discrètes <strong>et</strong> absolument continuesDans c<strong>et</strong>te section, nous nous intéressons aux variables aléatoires qui ne sont ni discrètes ni de loi absolumentcontinue. La loi d’une variable aléatoire réelle comporte deux parties : une partie absolument continue <strong>et</strong> unepartie ≪ singulière ≫.Définition 3.39 (Mesure singulière)Une mesure positive finie µ sur (R d , B(R d )) est singulière par rapport à la mesure de Lebesgueλ d s’il existe un ensemble A de mesure de Lebesgue nulle tel que µ(A c ) = 0.Exemple 3.6 Si µ est la loi d’une variable aléatoire réelle X discrète à valeurs dans {x i /i ∈ I} avec I finiou dénombrable, alors µ est singulière par rapport à la mesure de Lebesgue. En eff<strong>et</strong>, pour A = {x i /i ∈ I},µ(A c ) = 0 par définition de µ <strong>et</strong> λ d (A) = 0 car A est fini ou dénombrable.69


Théorème 3.40 (Décomposition de la loi d’une variable aléatoire)Soit X une variable aléatoire à valeurs dans R d de loi P X. Il existe alors une fonction borélienne positive f Xdéfinie sur R d (unique à une égalité λ d -presque partout près) <strong>et</strong> une unique mesure µ s positive singulièrepar rapport à la mesure de Lebesgue telle quedP X= f Xdλ d + dµ s ,c’est-à-dire telle que pour tout A ∈ B ( ∫R d) , P X(A) = f Xdλ d + µ s (A).ANous nous intéressons plus particulièrement au cas où la partie singulière est une mesure discrète.Proposition 3.41Soient F Xla fonction de répartition d’une variable aléatoire X <strong>et</strong> (x i ) i∈I, avec I = {1,... ,n} ou I = N ∗une famille strictement croissante de réels. Si la fonction F Xest C 1 sauf peut-être en x i , i ∈ I, alorsdP X= f Xdλ d + ∑ i∈Ip i dδ xiavec pour tout i ∈ I, p i = F X(x i ) − F X(xi−)le saut de la fonction FX en x i <strong>et</strong> f X= F ′ X λ d-presquepartout.Remarque 3.8 Sous les hypothèses de la proposition précédente, en général, f Xµ s = ∑ i∈I p i δ xi n’est pas une probabilité. En fait,1 = P X(R d) (= f Xdλ d + µ s R∫R d) .dn’est pas une densité <strong>et</strong>Exemple 3.7 Considérons la fonction F : R → R définie par⎧⎨ √0 si t < 0F(t) = t si t ∈ [0,1/4[⎩1 si t ∈ [1/4,+∞[.La fonction F étant croissante continue à droite telle que lim x→+∞ F(x) = 1 <strong>et</strong> lim x→−∞ F(x) = 0, il s’agitde la fonction de répartition d’une variable aléatoire réelle X. En appliquant la proposition précédente,avec f : R → R + définie par f(t) = 12 √ t 1 ]0,1/4[(t).dP X= f dλ 1 + 1 2 dδ 1/43.6 Lois marginales d’un vecteur aléatoireLorsque X est une variable aléatoire à valeurs dans un espace produit, nous pouvons nous intéresser à laloi de ses coordonnées.Définition 3.42 (Lois marginales)Soit X = (X 1 ,... ,X d ) une variable aléatoire à valeurs dans R d . La loi de la variable aléatoire X i estappelée loi marginale de la ième composante.70


Nous commençons par étudier le cas des vecteurs aléatoires de loi absolument continue.Proposition 3.43 (Lois marginales d’un vecteur absolument continu)Si X = (X 1 ,X 2 ) est un vecteur aléatoire à valeurs dans R 2 de loi absolument continue ayant pour densitéla fonction f X, alors X 1 (respectivement X 2 ) adm<strong>et</strong> une densité f X1(respectivement f X2), avec∫∫∀x ∈ R, f X1(x) = f(x,y)λ 1 (dy) <strong>et</strong> ∀y ∈ R, f X2(y) = f(x,y)λ 1 (dx).RRPreuve de la proposition 3.43. Par symétrie il suffit de montrer que f 1 est la densité de X 1 .D’après le théorème de Fubini, l’application f 1 est mesurable (ou borélienne) <strong>et</strong> positive. De plus,∫∀A ∈ B(R), P X1(A) = P(X 1 ∈ A) = P((X 1 ,X 2 ) ∈ A × R) = 1 A (x 1 )f X(x 1 ,x 2 )λ 1 (dx 1 )λ 1 (dx 2 ).Alors, d’après le théorème de Fubini, pour tout A ∈ B(R),∫ (∫) ∫P X1(A) = 1 A (x 1 ) f X(x 1 ,x 2 )λ 1 (dx 2 ) λ 1 (dx 1 ) =RRRR1 A (x 1 )f X1(x 1 )λ 1 (dx 1 ). Remarque 3.9 La réciproque est fausse : si X 1 <strong>et</strong> X 2 sont des variables aléatoires réelles absolument continues,alors (X 1 ,X 2 ) n’est pas nécessairement un vecteur aléatoire de loi absolument continue.Intéressons-nous à présent au cas des vecteurs discr<strong>et</strong>s. Remarquons tout d’abord qu’un vecteur aléatoireX = (X 1 ,X 2 ) est discr<strong>et</strong> si <strong>et</strong> seulement si X 1 <strong>et</strong> X 2 sont des variables discrètes.Proposition 3.44 (Lois marginales d’un vecteur discr<strong>et</strong>)Soit X 1 (respectivement X 2 ) est une variable aléatoire discrète à valeurs dans {(x i ) /i ∈ I} (respectivement{y j /j ∈ J}). Nous supposons que les (x i ) i∈Isont deux à deux distincts <strong>et</strong> que les (y j ) j∈Jsontaussi deux à deux distincts. Alors (X 1 ,X 2 ) est un vecteur aléatoire discr<strong>et</strong> de loi donnée parp i,j = P(X 1 = x i ,X 2 = y j ), ∀i ∈ I, ∀j ∈ J.De plus, la variable aléatoire X 1 est discrète à valeurs dans {x i /i ∈ I} <strong>et</strong> de loi donnée parp i,· = P(X 1 = x i ) = ∑ j∈Jp i,j , ∀i ∈ I.De même, X 2 est une variable aléatoire discrète à valeurs dans {y j /j ∈ J} <strong>et</strong> de loi donnée parp·,j = P(X 2 = y j ) = ∑ i∈Ip i,j , ∀j ∈ J.Remarque 3.10 Les résultats précédents se généralisent aisément au vecteur aléatoire X = (X 1 ,...,X d ) àvaleurs dans R d , d 3. On peut ainsi donner les lois des marginales X i . Mais, on peut aussi déterminer, defaçon analogue, la loi de tout vecteur ( X i1 ,... ,X ip)à valeurs dans R p , 1 p d.71


3.7 Comment déterminer la loi d’une variable aléatoire g(X) ?Considérons une variable aléatoire X de loi connue P X<strong>et</strong> une variable aléatoire Y = g(X). Nous expliquonscomment les résultats vus dans ce chapitre peuvent être utilisés pour déterminer la loi de Y .• Regarder tout d’abord quelles peuvent être les valeurs prises par Y .• Cas où Y est une variable discrète.Adm<strong>et</strong>tons que Y prend ses valeurs presque sûrement dans un ensemble S fini ou dénombrable. Nousrappelons que la loi de Y est alorsP Y= ∑ s∈SP(Y = s)δ s .Nous devons donc calculer P(Y = s) = P(g(X) = s) pour tout s ∈ S. Il nous faut trouver B s tel que<strong>et</strong> ensuite utiliser l’expression de P X.P(Y = s) = P(g(X) = s) = P(X ∈ B s ) = P X(B s )Exemple 3.8 Supposons que Y = 1 [0,1] (X) avec X de loi exponentielle E(λ). Alors, Y est une variable aléatoirediscrète car elle est à valeurs dans S = {0,1}. De plus,∫e −x/λP(Y = 0) = P(0 X 1) = P X([0,1]) =λλ 1(dx) = 1 − e −1/λ<strong>et</strong> P(Y = 1) = 1 − P(Y = 0) = e −1/λ . La loi de Y est la loi de Bernoulli de paramètre 1/λ.[0,1]• Cas où Y = g(X) n’est pas discrète mais X est à valeurs dans R d de densité f X.1. Technique 1 : utiliser la proposition 3.27 page 65 si les hypothèses en sont vérifiées.2. Technique 2 : calculer la fonction de répartition de Y <strong>et</strong> utiliser la proposition 3.26 page 64 ou laproposition 3.41 page 70.3. Technique 3 : d’après la proposition 3.7, si nous trouvons une probabilité ν telle que pour toutefonction ϕ borélienne positive bornée,∫E(ϕ(Y )) = ϕdν.alors la loi de Y est ν. Pour trouver ν, nous pouvons remarquer que∫E(ϕ(Y )) = E(ϕ ◦ g(X)) = ϕ ◦ g(x)f X(x)dλ d (x)R d<strong>et</strong> penser à découper R d en plusieurs sous-ensembles U i sur lesquels nous pouvons effectuer unchangement de variables.Exemple 3.9 Soit X une variable aléatoire de loi uniforme sur [−1,1] c’est-à-dire de densité f X: R → Rdonnée par f X(x) = 1 2 1 [−1,1](x). Supposons que Y = |X|. À l’aide des techniques 2 <strong>et</strong> <strong>et</strong> 3, vérifier que Yest une variable aléatoire de loi absolument continue de densité f Y: R → R donnée par f Y(y) = 1 [0,1] (x),c’est-à-dire que Y est une variable aléatoire de loi uniforme sur [0,1]. Vérifier par ailleurs que la technique 1ne s’applique pas.72


Chapitre 4Espaces L p <strong>et</strong> L pDans ce chapitre (Ω, A, µ) est un espace mesuré. En particulier A est une tribu sur Ω <strong>et</strong> µ est unemesure positive sur (Ω, A). Comme dans les chapitres précédents, tout sous-ensemble de R d est muni de sa tribuborélienne, sauf mention du contraire. Nous étudions dans ce chapitre les espaces des fonctions p-intégrables<strong>et</strong> les moments de variables aléatoires. Nous donnons des inégalités classiques fort utiles en probabilités.4.1 Espaces L P (Ω, A, µ)4.1.1 Définitions <strong>et</strong> premières propriétésLa définition suivante introduit l’ensemble des fonctions p-intégrables pour p ∈ [0,+∞[. Dans le cas oùp = 0, il s’agit simplement de l’ensemble des fonctions mesurables.Définition 4.1 (Espace L P (Ω, A, µ), p ∈ [0, +∞[)1. L 0 (Ω, A,µ) est l’ensemble des fonctions f : (Ω, A) → ( R, B ( R )) mesurables.2. Soit p ∈ R ∗ + . Pour toute fonction f : (Ω, A) → ( R, B ( R )) mesurable, nous posonsAlors,L p (Ω, A,µ) =(∫ 1/p‖f‖ p= |f| dµ) p .Ω{}f ∈ L 0 (Ω, A,µ) / ‖f‖ p < +∞ .est l’ensemble des fonctions f : (Ω, A) → ( R, B ( R )) mesurables telles que f p est µ-intégrable.Remarque 4.11. L’espace L 0 (Ω, A,µ) ne dépend pas de la mesure µ.2. En particulier, L 1 (Ω, A,µ) est l’ensemble des fonctions µ-intégrables à valeurs dans R.3. Si p ∈ R ∗ + <strong>et</strong> si f ∈ L p (Ω, A,µ), alors f est finie µ-presque partout d’après la proposition 2.14 page 32.Exemple 4.11. Supposons A = P(Ω) <strong>et</strong> considérons a ∈ Ω. Alors,L 0 (Ω, P(Ω),δ a ) = { f : Ω → R fonction } .73


De plus, si f ∈ L 0 (Ω, P(Ω),δ a ), alors pour tout p ∈]0,+∞[,∫‖f‖ p p = |f| p dδ a = |f(a)| p .ΩPar conséquent, pour tout p ∈]0,+∞[, L p (Ω, P(Ω),δ a ) = { f : Ω → R fonction / |f(a)| < +∞ } .2. Supposons Ω = N <strong>et</strong> A = P(N). Munissons l’espace (N, P(N)) de la mesure de comptage µ. L’espace Ωétant muni de la tribu triviale P(Ω), toute fonction à valeurs dans R est mesurable, c’est-à-dire queL 0 (N, P(N),δ a ) = { f : N → R fonction } .L’espace des fonctions mesurables L 0 (N, P(N),µ) s’identifie aux suites à valeurs dans R.Par ailleurs pour p ∈ R ∗ + , si f ∈ L0 (N, P(N),µ),( +∞) 1/p∑‖f‖ p= |f(n)| p .n=0Remarquons que si ‖f‖ p< +∞ pour p ∈ R ∗ +, alors pour tout n ∈ N, f(n) ∈ R. Par suite, pour p ∈ R ∗ +,L p (N, P(N),δ a ) ={f : Ω → R fonction / ∑ n∈N|f(n)| p < +∞}.Notons que pour p ∈ R ∗ + , l’espace Lp (N, P(N),µ) s’identifie à l’ensemble des suites réelles de puissancepème sommable, c’est-à-dire que{}L p (N, P(N),µ) ≡ l p (N) =De plus, ici L 2 (N, P(N),µ) ≠ L 1 (N, P(N),µ) car la suitesommable.(u n ) n∈N∈ R N /+∞∑n=0|u n | p < +∞( )1n+1n’est pas sommable mais est de carrén∈N.Nous allons maintenant introduire l’ensemble L ∞ (Ω, A,µ) des fonctions mesurables bornées presque partout.Définition 4.2 (Fonction bornée presque partout)Une fonction f : Ω → R est µ-presque partout bornée si il existe un c ∈ R + tel que |f| c µ-presquepartout, c’est-à-dire si il existe c ∈ R + <strong>et</strong> N un ensemble µ-négligeable tel que∀ω ∉ N, |f(ω)| c.Remarque 4.2 Soit f ∈ L 0 (Ω, A,µ). Alors, pour tout c ∈ R,{|f| > c} ∈ A.Par suite, f est µ-presque partout bornée si <strong>et</strong> seulement si il existe c ∈ R + tel que µ({|f| > c}) = 0.C<strong>et</strong>te remarque conduit à la définition suivante de ‖f‖ ∞<strong>et</strong> de L ∞ (Ω, A,µ).74


Définition 4.3 (Espace L ∞ (Ω, A, µ))1. Soit f ∈ L 0 (Ω, A,µ). Alors, nous posons‖f‖ ∞= inf {c ∈ R + /µ(|f| > c) = 0} = inf {c ∈ R + / |f| c µ-presque partout}avec par convention inf ∅ = +∞. Par définition, f est µ-presque partout bornée si <strong>et</strong> seulement si‖f‖ ∞< +∞.2. L ∞ (Ω, A,µ) est l’ensemble des fonctions f ∈ L 0 (Ω, A,µ) µ-presque partout bornées, c’est-à-direqueL ∞ (Ω, A,µ) = { f ∈ L 0 (Ω, A,µ) / ‖f‖ ∞< +∞ } .Exemple 4.2 Supposons que Ω = R <strong>et</strong> que A = B(R). Considérons la fonction f : R → R définie parf(x) ={ +∞ si x > 10 sinon.La fonction f est alors borélienne : elle est même étagée (car constante par morceaux).1. Supposons que l’espace mesurable (Ω, A) est muni de µ = λ 1 la mesure de Lebesgue sur R. Alors, f n’estpas µ-presque partout bornée car{λ 1 ({|f| > c}) =λ 1 (R) = +∞ si c = 0λ 1 (]1,+∞[) = +∞ si c ∈ R ∗ + .2. Par contre si l’espace mesurable (Ω, A) est muni de µ = δ 0 , f est µ-presque partout nulle (car f(0) = 0)<strong>et</strong> donc f est µ-presque partout bornée (‖f‖ ∞= 0).4.1.2 Premières propriétésNous pouvons toujours dominer une fonction mesurable f par ‖f‖ ∞.Proposition 4.4 (Comparaison de f avec ‖f‖ ∞)Si f ∈ L 0 (Ω, A,µ), alors |f| ‖f‖ ∞ µ-presque partout.Remarque 4.3 Soit f ∈ L 0 (Ω, A,µ). Alors, ‖f‖ ∞est le plus p<strong>et</strong>it c ∈ R + ∪ {+∞} tel que |f| c µ-presquepartout.Preuve de la proposition 4.4. Soit f ∈ L 0 (Ω, A,µ).• Si ‖f‖ ∞= +∞, alors |f| ‖f‖ ∞partout.• Supposons ‖f‖ ∞< +∞, c’est-à-dire que f ∈ L ∞ (Ω, A,µ). Soit (α n ) n∈Nune suite décroissante de réelsconvergeant vers le réel ‖f‖ ∞. D’après la définition de ‖f‖ ∞, pour tout n ∈ N,|f| α n µ-presque partout,75


c’est-à-dire que l’ensemble N n = {|f| > α n } est µ-négligeable. L’ensemble N = ⋃ n∈N N n est alors aussiun ensemble µ-négligeable <strong>et</strong>∀ω ∉ N, ∀n ∈ N, |f(ω)| α n .Alors, en faisant tendre n → +∞, nous constatons que∀ω ∉ N, |f(ω)| ‖f‖ ∞<strong>et</strong> donc que |f| ‖f‖ ∞µ-presque partout (car N est µ-négligeable).Énonçons quelques propriétés qui sont de simples conséquences des résultats du chapitre 2.Proposition 4.5Pour tout p ∈]0,+∞] <strong>et</strong> tout f ∈ L 0 (Ω, A,µ),1. f ∈ L p (Ω, A,µ) ⇐⇒ |f| ∈ L p (Ω, A,µ)2. ‖f‖ p= 0 ⇐⇒ f = 0 µ-presque-partout.Preuve de la proposition 4.5. Il s’agit d’une simple conséquence de la définition des espaces L p (Ω, A,µ),de la proposition 2.8 page 29 <strong>et</strong> de la proposition 2.13 page 32.De plus, pour tout p ∈]0,+∞], ‖ ·, ‖ est en quelque sorte ≪ croissante ≫.Proposition 4.6Soient f,g ∈ L 0 (Ω, A,µ). Supposons que|f| |g| µ-presque partout.Alors pour tout p ∈]0,+∞],‖f‖ p ‖g‖ p.Par conséquent, si g ∈ L p (Ω, A,µ), alors f ∈ L p (Ω, A,µ).Preuve de la proposition 4.6. Supposons |f| |g| µ-presque partout.• Si p < +∞, la proposition 4.6 est une conséquence de la proposition 2.8 page 29 (car p 0).• Supposons p = +∞. Alors d’après la proposition 4.4,|g| ‖g‖ ∞µ-presque partout,c’est-à-dire que l’ensemble {|g| > ‖g ∞ ‖} est µ-négligeable. De plus, par hypothèse, l’ensemble {|f| > |g|}est aussi µ-négligeable. Par conséquent, l’ensembleN = {|g| > ‖g ∞ ‖} ∪ {|f| > |g|}est µ-négligeable. A fortiori l’ensemble {|f| > ‖g‖ ∞} ⊂ N est µ-négligeable. Alors, |f| ‖g‖ ∞µ-presquepartout <strong>et</strong> par définition ‖f‖ ∞ ‖g‖ ∞.76


Terminons c<strong>et</strong>te section en remarquant que les espaces L p , p ∈]0,+∞], sont des espaces vectoriels réels.Notons si f,g ∈ L p , avec p ∈]0,+∞], la somme f + g n’est a priori définie que presque partout mais qu’en laprolongeant par 0 (par exemple), nous obtenons une fonction mesurable.Proposition 4.7Pour tout p ∈]0,+∞], l’ensemble L p (Ω, A,µ) est un espace vectoriel réel.Preuve de la proposition 4.7.• Supposons que p ∈ R ∗ +. Soient f,g ∈ L p (Ω, A,µ), λ ∈ R <strong>et</strong> a = |λ|. Alors, quitte à la prolonger par 0,λf + g ∈ L 0 (Ω, A,µ). De plus,|λf + g| p |a|f| + |g|| p 2 p (max (a|f|, |g|)) p 2 p max(a p |f| p , |g| p ) 2 p (a p |f| p + |g| p ).)D’où, ‖λf + g‖ p p 2p( a p ‖f‖ p p + ‖g‖p p< +∞ <strong>et</strong> donc λf + g ∈ L p (Ω, A,µ). Par conséquent, L p (Ω, A,µ)est un espace vectoriel réel.• Supposons p = +∞. Soient f,g ∈ L ∞ (Ω, A,µ), λ ∈ R <strong>et</strong> a = |λ|. Alors, quitte à la prolonger par 0,λf + g ∈ L 0 (Ω, A,µ). De plus, par définition de L ∞ (Ω, A,µ),N = {|f| > ‖f‖ ∞} ∪ {|g| > ‖g‖ ∞}est la réunion de deux ensembles µ-négligeables donc est lui-même µ-négligeable. De plus,∀w /∈ N, |λf(ω) + g(ω)| a‖f‖ ∞+ ‖g‖ ∞.Par conséquent, λf + g ∈ L ∞ (Ω, A,µ). Alors, L ∞ (Ω, A,µ) est un espace vectoriel réel.4.1.3 Inégalités sur les espaces L P (Ω, A, µ)Proposition 4.8 (Inégalité de Hölder)Soient p ∈ [1,+∞] <strong>et</strong> q l’exposant conjugué de p, c’est-à-dire que q ∈ [1,+∞] est tel que 1 p + 1 q = 1.Alors, pour toutes fonctions f,g ∈ L 0 (Ω, A,µ), fg ∈ L 0 (Ω, A,µ) <strong>et</strong>‖fg‖ 1 ‖f‖ p‖g‖ q. (4.1)Remarque 4.4 Si p = 2, alors q = 2 <strong>et</strong> l’inégalité (4.1) s’écrit‖fg‖ 1 ‖f‖ 2‖g‖ 2,<strong>et</strong> est aussi appelée inégalité de Cauchy-Schwarz.Preuve de la proposition 4.8.• Il est évident que fg est mesurable.• Supposons p = 1. Alors q = +∞. D’après la proposition 4.4, |g| ‖g‖ ∞µ-presque partout. Par suite,|fg| |f|‖g‖ ∞µ-presque partout.77


Remarquons que ‖g‖ ∞∈ [0,+∞]. Alors en intégrant par rapport à µ, nous avons :∫ ∫‖fg‖ 1= |fg|dµ |f|‖g‖ ∞dµ = ‖g‖ ∞‖f‖ 1.ΩNous venons de démontrer l’inégalité de Hölder dans le cas où p = 1.• Supposons p = +∞. Alors, q = 1. Par symétrie, d’après la première partie de c<strong>et</strong>te preuve,‖fg‖ 1 ‖f‖ ∞‖g‖ 1.Ω• Soit p ∈]1,+∞[. Alors par définition q ∈]1,+∞[. Considérons la fonction ϕ : R + → R définie par∀x ∈ R + , ϕ(x) = xy − 1 p xpavec y ∈ R + fixé. Il est facile de vérifier que ϕ atteint son maximum M = 1 q yq pour x = y 1/(p−1) . Nousen déduisons que∀x 0, ∀y 0, xy xpp + yqq . (4.2)1er cas Si ‖f‖ p= 0 (respectivement ‖g‖ q= 0), d’après la proposition 4.5, f = 0 (respectivement g = 0)µ-presque partout. Dès lors, si ‖f‖ p= 0 ou si ‖g‖ p= 0, alors fg = 0 µ-presque partout <strong>et</strong>‖fg‖ 1= 0 = ‖f‖ p‖g‖ q.2ème cas Si ‖f‖ p= +∞ (respectivement ‖g‖ q= +∞ ), l’inégalité de Hölder est triviale.3ème cas Il nous reste à traiter le cas où 0 < ‖f‖ p< +∞ <strong>et</strong> 0 < ‖g‖ q< +∞. En appliquantl’inégalité (4.2) pourx = |f|‖f‖ p<strong>et</strong> y = |g|‖g‖ q,puis en intégrant par rapport à µ, nous obtenons : ‖fg‖ 1 ‖f‖ p‖g‖ q.Corollaire 4.9Soient p ∈ [1,+∞] <strong>et</strong> q l’exposant conjugué de p, c’est-à-dire que q ∈ [1,+∞] est tel que 1 p + 1 q = 1.Si f ∈ L p (Ω, A,µ) <strong>et</strong> si g ∈ L q (Ω, A,µ), alors fg ∈ L 1 (Ω, A,µ) <strong>et</strong>∫∣ fg dµ∣ ‖fg‖ 1 ‖f‖ p ‖g‖ q .ΩPreuve du corollaire 4.9. La fonction fg est mesurable <strong>et</strong> d’après l’inégalité de Hölder,‖fg‖ 1 ‖f‖ p‖g‖ q.Or par hypothèse ‖f‖ p< +∞ <strong>et</strong> ‖g‖ q< +∞. D’où ‖fg‖ 1< +∞ <strong>et</strong> donc fg ∈ L 1 (Ω, A,µ). Alors, d’aprèsla proposition 2.13, ∣∫∫ ∣∣∣ fg dµ∣ |fg|dµ = ‖fg‖ 1 ‖f‖ p‖g‖ q.ΩΩ78


Dans le cas où µ est une mesure bornée, nous pouvons déduire de l’inégalité de Hölder des inclusions entreles espaces L p (Ω, A,µ), p 1. Ces inclusions sont utiles en probabilités.Proposition 4.10 (Cas mesure bornée)Supposons que µ est une mesure positive bornée sur (Ω, A). Alors, les fonctions constantes réelles appartiennentà L p (Ω, A,µ) pour tout p ∈ [0,+∞]. Par ailleurs, pour tout 1 p p ′ +∞,L p′ (Ω, A,µ) ⊂ L p (Ω, A,µ)Attention : si µ n’est pas une mesure bornée, il n’y a a priori aucune relation d’inclusion entreles espaces L p (Ω, A, µ), p ∈ [1, +∞]. En particulier,L 2( R d , B(R d) ),λ d ⊄ L 1( R d , B(R d) ),λ d<strong>et</strong>L 1( R d , B(R d) ),λ d ⊄ L 2( R d , B(R d) ),λ d .Preuve de la proposition 4.10.• Soit a ∈ R. Considérons la fonction réelle constante f = a définie sur Ω. Alors, f est bien mesurable,c’est-à-dire que f ∈ L 0 (Ω, A,µ). De plus,(∫ 1/p∀p ∈]0,+∞[, ‖f‖ p= |a| dµ) p = |a|(µ(Ω)) 1/p < +∞Ωcar µ est bornée. Par conséquent f ∈ L p (Ω, A,µ) pour tout p ∈]0,+∞[. Enfin,‖f‖ ∞ = |a| < +∞car |f| |a| partout <strong>et</strong> µ({|f| > c}) = µ(∅) = 0 pour tout c ∈ [0,a[. Par suite, f ∈ L ∞ (Ω, A,µ).En conclusion, les fonctions constantes réelles sont dans L p (Ω, A,µ) pour tout p ∈ [0,+∞].• Soient 1 p p ′ +∞ <strong>et</strong> h ∈ L p′ (Ω, A,µ). Nous pouvons supposer p < p ′ . En eff<strong>et</strong> si p = p ′ , il estclair que L p′ (Ω, A,µ) ⊂ L p (Ω, A,µ).1 er cas : Supposons p ′ = +∞.Alors, p < +∞, ‖h‖ ∞∈ R + <strong>et</strong> |h| ‖h‖ ∞µ-presque partout. Par suite, d’après la proposition 4.6,‖h‖ p ‖‖h‖ ∞‖ p= ‖h‖ ∞(µ(Ω)) 1/p < +∞car µ est bornée. Par suite, h ∈ L p (Ω, A,µ). Par suite, si p ′ = +∞, L p′ (Ω, A,µ) ⊂ L p (Ω, A,µ).2 nd cas : Supposons p ′ < +∞.Alors p < p ′ < +∞. Posons p 1 = p ′ /p, f = |h| p <strong>et</strong> g = 1. Notons q 1 l’exposant conjugué de p 1 . Alors,d’après l’inégalité de Hölder,∫ ∫‖h‖ p p = |h| p dµ = |fg|dµ = ‖fg‖ 1 ‖f‖ p1‖g‖ q1.ΩΩÉtant donné que 1 p 1 < +∞, q 1 ∈]1,+∞] <strong>et</strong>(∫ 1/p1 (∫‖f‖ p1= |h| pp 1dµ)= |h| p′ dµΩΩ) p/p ′= ‖h‖ p p ′ < +∞79


car h ∈ L p′ (Ω, A,µ). De plus,{ 1 si q1 = +∞‖g‖ 1 =µ(Ω) 1/q 1sinon.La mesure µ étant bornée, ‖g‖ 1 < +∞. Par suite,‖h‖ p p ‖f‖ p 1‖g‖ q1< +∞.Alors, h ∈ L p (Ω, A,µ). Nous venons de montrer que si 1 p < p ′ < +∞, L p′ (Ω, A,µ) ⊂ L p (Ω, A,µ). Établissons à présent l’inégalité triangulaire pour ‖ · ‖ plorsque p 1, inégalité encore appelée Inégalité deMinkowski.Proposition 4.11 (Inégalité de Minkowski)Soient p ∈ [1,+∞] <strong>et</strong> f,g : (Ω, A) → ( R, B ( R )) deux fonctions mesurables. Si f <strong>et</strong> g sont toutes deux àvaleurs dans [0,+∞] µ-presque partout ou toutes deux µ-presque partout finies, alors‖f + g‖ p ‖f‖ p+ ‖g‖ p. (4.3)Preuve de la proposition 4.11. Supposons que les fonctions mesurables f <strong>et</strong> g sont toutes deux à valeurs dans[0,+∞] µ-presque partout ou toutes deux µ-presque partout finies. Alors, la fonction f + g est biendéfinie µ-presque partout <strong>et</strong> se prolonge en une fonction mesurable (car l’ensemble {f = +∞,g = −∞},ensemble sur lequel f + g n’est pas définie, est mesurable).Si ‖f‖ p= +∞ ou ‖g‖ p= +∞, (4.3) est clairement vraie. Supposons que ‖f‖ p< +∞ <strong>et</strong> que ‖g‖ p< +∞.1. Supposons que f <strong>et</strong> g sont à valeurs dans [0,+∞] µ-presque partout.(a) Si p = 1, alors par construction de l’intégrale,∫ ∫‖f + g‖ p= (f + g)dµ =ΩΩ∫fdµ + gdµ = ‖f‖ p+ ‖g‖ pΩcar f <strong>et</strong> g sont positive µ-presque partout. Si p = 1, (4.3) est vérifiée.(b) Supposons 1 < p < +∞. Notons q ∈]1,+∞[ l’exposant conjugué de p. Alors les fonctions f <strong>et</strong>g étant positives µ-presque partout,∫∫‖f + g‖ p p= f(f + g) p−1 dµ + g(f + g) p−1 dµΩΩ ‖f‖ p∥ ∥∥(f + g)p−1 ∥ ∥∥q + ‖g‖ p∥ ∥∥(f + g)p−1 ∥ ∥∥qd’après l’inégalité de Hölder. Comme q < +∞ <strong>et</strong> comme les fonctions f <strong>et</strong> g sont positivesµ-presque partout,∥∥(f + g) p−1∥ (∫1/q (∫ ) 1/q∥∥q = (f + g) dµ) q(p−1) = (f + g) p dµ = ‖f + g‖ p/qpΩΩcar q = p/(p − 1).80


Par suite,‖f + g‖ p p (‖f‖ p+ ‖g‖ p)‖f + g‖ p/qp.De plus, l’espace L p (Ω, A,µ) étant un espace vectoriel, f + g ∈ L p (Ω, A,µ) <strong>et</strong> donc‖f + g‖ p< +∞.Par conséquent, vu ce qui précède si ‖f + g‖ p> 0,‖f + g‖ p ‖f‖ p + ‖g‖ pcar q = p/(p − 1). Si ‖f + g‖ p= 0, l’inégalité précédente est trivialement vérifiée.(c) Supposons p = +∞. Étant donné que f ‖f‖ ∞ <strong>et</strong> que g ‖g‖ ∞µ-presque partout,Alors, par définition de ‖f + g‖ ∞,|f + g| ‖f‖ ∞+ ‖g‖ ∞µ-presque partout.‖f + g‖ ∞ ‖f‖ ∞+ ‖g‖ ∞.3. Supposons que f <strong>et</strong> g sont µ-presque partout finies. Étant donné que |f + g| |f| + |g|,‖f + g‖ p ‖|f| + |g|‖ p.Alors, en appliquant ce qui précède aux fonctions mesurables positives |f| <strong>et</strong> |g|, nous avons :‖f + g‖ p ‖|f|‖ p+ ‖|g|‖ p= ‖f‖ p+ ‖g‖ p.Nous sommes maintenant en mesure de prouver que ‖ · ‖ p, où p ∈ [1,+∞], est une semi-norme.Proposition 4.12Pour tout p ∈ [1,+∞], ‖ · ‖ pest une semi-norme sur l’espace vectoriel réel L p (Ω, A,µ).Preuve de la proposition 4.12. Il s’agit d’une conséquence de la proposition 4.7, de l’inégalité de Minkowski<strong>et</strong> du fait que‖λf‖ p= |λ|‖f‖ ppour tout f ∈ L p (Ω, A,µ)) <strong>et</strong> tout λ ∈ R.4.2 Espaces L p (Ω, A, µ)4.2.1 Définitions <strong>et</strong> propriétésLa semi-norme ‖ · ‖ p n’est pas, en général, une norme sur L p (Ω, A,µ) car si ‖f‖ p = 0, alors f n’est pasnécessairement identiquement nulle. En eff<strong>et</strong>, toute fonction f nulle µ-presque partout vérifie ‖f‖ p= 0.81


Définition 4.13La relation entre deux éléments f <strong>et</strong> g de L 0 (Ω, A,µ) définie parf ∼ g ⇐⇒ f = g µ-presque partout (4.4)est une relation d’équivalence. Pour tout p ∈ [0,+∞], nous notons alors L p (Ω, A,µ) l’ensemble des classesd’équivalence d’éléments de L p (Ω, A,µ) pour la relation ∼ précédente.Si h 1 <strong>et</strong> h 2 sont deux fonctions mesurables à valeurs µ-presque partout dans [0,+∞] <strong>et</strong> égales µ-presquepartout, alors∫ ∫h 1 dµ = h 2 dµ.ΩSi f ∈ L p (Ω, A,µ) est la classe de g ∈ L p (Ω, A,µ), nous pouvons alors définir sans ambiguïté ‖f‖ pparΩ(∫‖f‖ p= |g| p dµΩcar la valeur de l’intégrale précédente ne dépend pas du choix du représentant g. Les inégalités de Hölder <strong>et</strong> deMinkowski restent alors vraies sur l’ensemble L p (Ω, A,µ) pour tout p ∈ [1,+∞].Proposition 4.14) 1/pPour tout p ∈ [1,+∞], ‖ · ‖ pest une norme sur l’espace vectoriel réel L p (Ω, A,µ).Preuve de la proposition 4.14. Soit p ∈ [1,+∞]. L’espace L p (Ω, A,µ) étant un espace vectoriel réel, l’ensembleL p (Ω, A,µ) de ses classes d’équivalence est aussi un espace vectoriel réel.• De plus, ‖ · ‖ vérifie l’inégalité de Minkowski, c’est-à-dire l’inégalité triangulaire.• Pour tout f ∈ L p (Ω, A,µ) <strong>et</strong> tout λ ∈ R, ‖λf‖ p= |λ|‖f‖ p.• Enfin, par définition de L p (Ω, A,µ) <strong>et</strong> d’après la proposition 4.5, si f ∈ L p (Ω, A,µ), alors‖f‖ p= 0 ⇐⇒ f = 0.Par conséquent, ‖ · ‖ pest une norme sur l’espace vectoriel réel L p (Ω, A,µ).Muni de la norme ‖ · ‖ p, l’espace L p (Ω, A,µ) (p 1) est un espace de Banach (c’est-à-dire un espace vectorielnormé compl<strong>et</strong>).Théorème 4.15 (Théorème de Riesz-Fisher)Soit p ∈ [1,+∞].1. L’espace L p (Ω, A,µ) muni de la norme ‖ · ‖ pest un espace de Banach.2. Soit (f n ) n∈N une suite d’éléments de L p (Ω, A,µ) qui converge dans c<strong>et</strong> espace vers f, c’est-à-direque f ∈ L p (Ω, A,µ) <strong>et</strong>limn→+∞ ‖f n − f‖ p= 0.Alors il existe une sous-suite ( f np qui converge µ-presque partout vers f.)p∈N82


C<strong>et</strong>te propriété est une conséquence du lemme suivant.Lemme 4.16Soient p ∈ [1,+∞] <strong>et</strong> (u n ) n∈N une suite de L p (Ω, A,µ) (respectivement de L p (Ω, A,µ)) telle que∑‖u n ‖ p< +∞. (4.5)n∈N|u n | appartient à L p (Ω, A,µ) (respectivement L p (Ω, A,µ)) donc est µ-presque par-1. Alors, V = ∑ n∈Ntout finie.2. La fonction U = ∑ n∈Nu n appartient à L p (Ω, A,µ) (respectivement L p (Ω, A,µ)) <strong>et</strong>limn→+∞∥ n∑ ∥∥∥∥p ∥ U − u k = 0. (4.6)k=0Remarque 4.5 La fonction U n’est bien définie que sur l’ensemble V < +∞ donc µ-presque partout. Nouspouvons la prolonger en une fonction mesurable (car {V = +∞} est un ensemble mesurable négligeable).Preuve du lemme 4.16. Voir Annexe 4.4.1 page 89.Preuve du théorème 4.15. Soit (f n ) n∈Nune suite de Cauchy de L p (Ω, A,µ). Nous pouvons alors définir la suited’entiers (n k ) k∈N par⎧ {⎪⎨ n 0 = inf n / ∀m n, ∀r n, ‖f m − f r ‖ p 2 −0} ,{⎪⎩ ∀k ∈ N, n k+1 = inf n n k / ∀m n, ∀r n, ‖f m − f r ‖ p 2 −(k+1)} .Par construction,car n k+1 n k . Alors,∀k ∈ N, ∥ ∥ fnk+1 − f ∥p nk 2 −k∑∥∥ fnk+1 − f ∥p nk < +∞.k∈NPar suite, d’après le lemme 4.16, F = f no + ∑ k∈N(f nk+1 − f nk ) appartient à L p (Ω, A,µ) <strong>et</strong>limk→+∞∥ F − f n 0−k∑∥ ∥(f ni+1 − f ni )= lim ∥F − f ∥p∥nk+1 = 0.k→∞pi=0Rappelons que pour n n k+1 , ∥ ∥fn − f nk+1∥∥p 2 −(k+1) .Alors, (f n ) n∈N converge, comme (f nk ) k∈N, vers F dans L p (Ω, A,µ). Nous adm<strong>et</strong>tons que la sous-suite(f nk ) k∈Nconverge µ-presque partout. 83


4.2.2 Sous-espaces denses dans L p (Ω, A, P)Proposition 4.17Soit E l’ensemble des fonctions étagées sur (Ω, A) à valeurs réelles. Alors, pour tout p ∈ [1,+∞], l’ensembleE ∩ L p (Ω, A,µ) est dense dans L p (Ω, A,µ) (muni de la norme ‖ · ‖ p).Remarque 4.6 Dans l’énoncé précédent, on a identifié un élément de E à sa classe dans L 0 (Ω, A,µ).Preuve de la proposition 4.17. Soit f ∈ L p (Ω, A,µ).1. Supposons que f est à valeurs dans [0,+∞] <strong>et</strong> considérons la suite de fonctions (f n ) n∈Ndéfinie par∀n ∈ N, f n =n2∑n −1i=1k2 −n 1 {k2 −n fn} .Il est clair que f n ∈ E. De plus, pour tout n ∈ N, 0 f n f n+1 f. Par conséquent,‖f n ‖ p ‖f‖ p< +∞.D’où, f n ∈ L p (Ω, A,µ). Par ailleurs, pour tout w ∈ Ω, limn→+∞ f n(ω) = f(ω)• Supposons p < +∞. Alors, la suite (|f − f n | p ) n∈N converge simplement vers 0 <strong>et</strong> pour tout n ∈ N,|f − f n | p = (f − f n ) p (f − f 0 ) p = g.Étant donné que g ∈ L 1 (Ω, A,µ) (car f,f 0 ∈ L p (Ω, A,µ)), d’après le théorème de convergencedominée appliqué à la suite (|f − f n | p ) n∈N,∫lim |f n − f| p dµ = 0.n→+∞Ω• Lorsque p = +∞, (f n ) n∈Nconverge vers f dans L ∞ (Ω, A,µ) car‖f n − f‖ ∞ 2 −n dès que n > ‖f‖ ∞.2. Supposons que f n’est pas positive. Décomposons f sous la forme f = f + −f − . Alors, f + <strong>et</strong> f − sontpositives <strong>et</strong> dans L p (Ω, A,µ). Nous pouvons alors les approcher dans L p (Ω, A,µ) par des élémentsde E ∩ L p (Ω, A,µ). Nous en déduisons facilement l’existence d’une suite (f n ) n∈Nd’éléments deE ∩ L p (Ω, A,µ) convergeant vers f dans L p (Ω, A,µ).Proposition 4.18Soit p ∈ [1,+∞[ <strong>et</strong> I un intervalle non vide de R.1. L’ensemble C c(Rd ) des fonctions continues définies sur R d <strong>et</strong> à support compact est dense dansL p( R d , B ( R d) ,λ d), où λd désigne la mesure de Lebesgue sur R d .2. L’ensemble C c (I) des fonctions continues définies sur I <strong>et</strong> à support compact est dense dansL p (I, B(I),λ 1 ).84


4.3 Espaces L p <strong>et</strong> L p sur un espace de probabilitéSoit P une probabilité sur l’espace probabilisable (Ω, A).4.3.1 Moments d’une variable aléatoireRappelons les définitions des espaces L p <strong>et</strong> L p sur l’espace de probabilité (Ω, A, P).Définition 4.19 (Espaces L p (Ω, A, P) <strong>et</strong> L p (Ω, A, P))1. Si p ∈ [1,+∞[, L p (Ω, A, P) est l’ensemble des variables aléatoires X à valeurs dans R telles queE(|X| p ) < +∞.2. L ∞ (Ω, A, P) est l’ensemble des variables aléatoires X à valeurs dans R pour lesquelles il existec ∈ R + tel que|X| c P-presque sûrement.Par ailleurs, pour tout X ∈ L 0 (Ω, A, P),‖X‖ ∞= inf {c ∈ R + / |X| c presque sûrement}.3. Pour tout p ∈ [1,+∞], L p (Ω, A, P) est l’ensemble de classes d’équivalence des éléments deL p (Ω, A, P) pour la relation d’équivalenceX ∼ Y ⇐⇒ X = Y presque sûrement.Rappelons que les espaces L p (Ω, A, P), p 1 sont des espaces de Banach. Nous énoncerons les inégalitésclassiques sur ces espaces en section 4.3.2.Proposition 4.20Soit p ∈ [1,+∞]. L’espace L p (Ω, A, P) est un espace de Banach pour la norme définie par{‖X‖p = (E(|X| p )) 1/p si 1 p < +∞‖X‖ ∞= inf {c 0; |X| c presque sûrement}Nous définissons maintenant la notion de moments d’une variable aléatoire.Définition 4.21 (Moment d’une variable aléatoire)Soit X : (Ω, A) → ( R, B ( R )) une variable aléatoire à valeurs dans R <strong>et</strong> p ∈ N ∗ .1. La variable aléatoire X adm<strong>et</strong> un moment d’ordre p siE(|X| p ) < +∞,c’est-à-dire si X ∈ L p (Ω, A, P). De plus, si X ∈ L p (Ω, A, P), le moment d’ordre p de X est leréel E(X p ).2. La variable aléatoire X est centrée si X adm<strong>et</strong> un moment d’ordre 1 nul.85


Remarque 4.71. Si X adm<strong>et</strong> un moment d’ordre 1, alors X − E(X) est une variable aléatoire centrée.2. Soient 1 p p ′ . Étant donné que Lp (Ω, A, P) ⊂ L p′ (Ω, A, P) (car P est une mesure positive bornée), siX adm<strong>et</strong> un moment d’ordre p ′ , alors X adm<strong>et</strong> un moment d’ordre p.Nous pouvons à présent définir les notions de variance <strong>et</strong> écart-type.Définition 4.22 (Variance <strong>et</strong> écart-type)Soit X une variable aléatoire à valeurs dans R adm<strong>et</strong>tant un moment d’ordre 2.[1. La variance de X est définie par Var (X) = E (X − E(X)) 2] .2. De plus, la variable X est réduite si Var (X) = 1.3. L’écart-type de X est défini par σ(X) = √ Var (X).Donnons quelques propriétés de la variance.Proposition 4.23Soit X une variable aléatoire à valeurs dans R adm<strong>et</strong>tant un moment d’ordre 2.1. La variance de X est finie <strong>et</strong>Var X = E ( X 2) − (E(X)) 2 .2. Var (X) = 0 (ou σ(X) = 0) si <strong>et</strong> seulement si X est presque sûrement constante.Preuve de la proposition 4.23.1. Remarquons que(X − E(X)) 2 = X 2 − 2XE(X) + (E(X)) 2 .Étant donné que X adm<strong>et</strong> un moment d’ordre 2, E ( X 2) < +∞ <strong>et</strong> E(|X|) < +∞. Par linéarité del’intégrale sur l’ensemble des fonctions intégrables,[Var X = E (X − E(X)) 2] = E ( X 2) − 2E(X)E(X) + (E(X)) 2 = E ( X 2) − (E(X)) 2car E(a) = a pour tout réel a.2. La deuxième assertion est une conséquence directe de la proposition 2.8 du chapitre 2. Proposition 4.24Soient (a,b) ∈ R 2 <strong>et</strong> X une variable aléatoire à valeurs dans R adm<strong>et</strong>tant un moment d’ordre 2. Alors,Var (aX + b) = Var (aX) = a 2 Var (X).Des exemples de calculs de moments seront donnés en annexe (voir section 4.4.2) pour les lois classiques.86


4.3.2 InégalitésCommençons par rappeler l’inégalité de Hölder.Proposition 4.25 (Inégalité de Hölder)Soient X <strong>et</strong> Y deux variables aléatoires à valeurs dans R.1. Si p ∈]1,+∞[,E(|XY |) (E(|X| p )) 1/p (E(|Y | q )) 1/qqvec q tel que 1/p + 1/q = 1. En particulier si p = q = 2, l’inégalité de Cauchy-Schwarz s’écritE(|XY |) ( E ( X 2)) 1/2( (E Y2 )) 1/2.2. Si p = 1, alorsE(|XY |) E(|X|)‖Y ‖ ∞.Rappelons maintenant l’inégalité de Minkowski.Proposition 4.26 (Inégalité de Minkowski)Soit p ∈ [1,+∞]. Si X <strong>et</strong> Y sont deux variables aléatoires toutes deux à valeurs dans [0,+∞] presquesûrement ou sont toutes deux presque sûrement finies, alors(E[|X + Y | p ]) 1/p (E[|X| p ]) 1/p + (E[|Y | p ]) 1/p .Dans le cadre des espaces de probabilité, on peut établir d’autres inégalités.Proposition 4.27 (Inégalité de Jensen)1. Pour toute fonction convexe φ : R + → R + <strong>et</strong> toute variable aléatoire X à valeurs dans R + ,φ(E(X)) E(φ(X)). (4.7)2. Si X ∈ L 1 (Ω, A, P) <strong>et</strong> si φ : R → R est une fonction convexe telle que φ(X) ∈ L 1 (Ω, A, P), alorsφ(E(X)) E(φ(X)). (4.8)Preuve de la proposition 4.27. On démontre le résultat pour φ convexe positive définie sur R + <strong>et</strong> X variablealéatoire positive. Alors, φ étant convexe,φ(x) = supl i (x), l i (x) = a i x + b i ,i∈Ioù l i φ. Si de plus φ 0 sur R + , on peut choisir l i 0 sur R + . En particulier,φ(E(X)) = supl i (E(X)).i∈IOr, l i (E(X)) = a i E(X) + b i = E(a i X + b i ) = E(l i (X)) <strong>et</strong> E(l i (X)) E(φ(X)). Par conséquent,φ(E(X)) = sup i∈I l i (E(X)) E(φ(X)).87


Remarque 4.81. Soit X ∈ L 0 (Ω, A, P) une v.a réelle. Pour tout 1 p p ′ < +∞,E(|X| p ) = ‖X‖ p p ‖X‖p p= E(|X| p′) p/p ′′(En eff<strong>et</strong>, c<strong>et</strong>te inégalité est évidente si E |X| p′) = +∞ <strong>et</strong> se déduit de l’inégalité de Jensen sinon.2. En appliquant l’inégalité de Jensen à la fonction φ définie par∀x 0, φ(x) = x pavec p 1, on obtient : (E(|X|)) p E(|X| p ) pour toute variable aléatoire réelle X.Proposition 4.28 (Inégalité de Markov)Si X est une variable aléatoire à valeurs dans [0,+∞] presque sûrement <strong>et</strong> si λ ∈ R ∗ + , alors,P(X λ) E(X)λ .Preuve de la proposition 4.28. Soit λ ∈ R ∗ + . Remarquons queX λ1 {Xλ} 0presque sûrement. Alors,ce qui prouve l’inégalité de Markov.E(X) E ( λ1 {Xλ})= λP(X λ),Proposition 4.29 (Inégalité de Bienaymée-Tchebytchef)Soit X une variable aléatoire adm<strong>et</strong>tant un moment d’ordre 2. Alors, pour tout λ ∈]0,+∞[,P(|X − E(X)| λ) Var (X)λ 2 .Preuve de la proposition 4.29. Posons Y = |X − E(X)|. Alors Y 0 <strong>et</strong>{|X − E(X)| λ} = {Y λ} = { Y 2 λ 2} .D’après l’inégalité de Markov appliquée à la variable Y 2 ,P(|X − E(X)| λ) = P ( Y 2 λ 2) E( Y 2)λ 2 ,ce qui prouve l’inégalité Bienaymée-Tchebytchef de car E ( Y 2) = Var (X).88


4.4 Annexes4.4.1 Annexe : Preuve du lemme 4.16, voir énoncé page 83D’après l’inégalité de Minkovski (4.3),n∑n∑|u∥ k | ‖u∥ k ‖ p ∑ ‖u k ‖ p< +∞. (4.9)k=0 p k=0 k∈NPosons g n = ∑ nk=0 |u k|. La suite (gn) p n∈Nest une suite croissante (car p > 0) de fonctions mesurables positives.1. (a) Supposons p ∈ [1,+∞[. D’après le théorème de convergence monotone appliqué à la suite (gn) p n∈N,∫‖V ‖ p p = |V | p n∑pdµ = lim|un→+∞∥k |.∥Dès lors, on déduit de (4.9) que V ∈ L p (Ω, A,µ).Ω(b) Supposons p = +∞. Par définition de ‖ · ‖ ∞, pour tout n ∈ N, |u n | ‖u n ‖ ∞µ-presque partout.Une réunion dénombrable de négligeables étant un négligeable,k=00 V ∑ n∈N‖u n ‖ ∞µ-p.p.ppar définition de V . D’où, vu l’hypothèse (4.5), V ∈ L ∞ (Ω, A,µ).2. La série de terme général u n étant absolument convergente sur {V < +∞}, la fonction U est bien définie<strong>et</strong> |U| V . Étant donné que V ∈ Lp (Ω, A,µ), U est aussi élément de L p (Ω, A,µ). De plus∣ ∣ n∑ ∣∣∣∣ ∣ U − +∞∑ ∣∣∣∣u k =u∣ k 1 V


Preuve de la proposition 4.30.• Par définitionE(X) =n∑kCnp k k (1 − p) k = nk=0car nC k−1n−1 = kCk n pour 1 k n. Alors,d’après la formule du binôme de Newton.n∑k=1C k−1n−1 pk (1 − p) n−kn−1∑E(X) = n Cn−1p l l+1 (1 − p) n−l = pn• Au lieu de calculer l’espérance du carré de X on évalue E[X(X − 1)]. Alors,E(X(X − 1)) =l=0n∑k(k − 1)Cn k pk (1 − p) k = n(n − 1)k=0n∑k=2C k−2n−2 pk (1 − p) n−kSi n = 1 E(X(X − 1)) = 0 <strong>et</strong> donc E ( X 2) = E(X) = p car X 2 = X(X −1)+X. Par conséquent, si n = 1Supposons maintenant n 2. Alors,VarX = p − p 2 = p(1 − p).n−2∑E(X(X − 1)) = n(n − 1) Cn−2p k k+2 (1 − p) n−k−2 = n(n − 1)p 2 .k=0Alors, E ( X 2) = n(n − 1)p 2 + pn <strong>et</strong> VarX = n(n − 1)p 2 + pn − p 2 n 2 = np(1 − p).Intéressons-nous à présent aux lois de Poisson.Proposition 4.31 (Lois de Poisson)Soit X une variable aléatoire de loi de Poisson P(λ) avec λ ∈ R ∗ + . Alors, E(X) = λ <strong>et</strong> Var (Y ) = λ.Preuve de la proposition 4.31.• Par définition,E(X) = ∑ n0nP(Y = n) = ∑ n0= λe −λ e λ = λ.n λnn! e−λ = e −λ ⎛⎝ ∑ n1λ n(n − 1)!⎞⎠ = λe −λ ⎛⎝ ∑ n1λ n−1⎞⎠(n − 1)!• Au lieu de calculer l’espérance du carré de X on évalue E[X(X − 1)].⎛ ⎞ ⎛ ⎞E[X(X − 1)] = ∑ n(n − 1) λnn! e−λ = e −λ ⎝ ∑ λ n⎠ = λ 2 e −λ ⎝ ∑ λ n−2⎠(n − 2)!(n − 2)!n0n2n2= λ 2 e −λ e λ = λ 2 .Mais X 2 = X(X − 1) + X donc E ( X 2) = λ 2 + E[X] = λ 2 + λ <strong>et</strong> Var (X) = λ + λ 2 − λ 2 = λ.90


Étudions à présent les moments d’une loi géométrique.Proposition 4.32 (Lois géométriques)Soit X une variable aléatoire de loi géométrique G(p) avec p ∈]0,1[. Alors,E(X) = 1 p<strong>et</strong> Var (X) =1 − pp 2 .Preuve de la proposition 4.32.Pour le calcul de l’espérance <strong>et</strong> la variance de X on procède comme pour la loi de Poisson, on évaluedirectement E(X) puis E[X(X − 1)]. On utilise les identités suivantes :On en déduit que∑n0⎛ ⎞d⎝ ∑ x n ⎠ = ∑ dxn0 n1nx n−1 =⎛ ⎞d 2⎝ ∑dx 2 x n ⎠ = ∑ − 1)xn0 n2n(n n−2 =x n = 1 ; pour tout x ∈] − 1,1[. (4.10)1 − x1(1 − x) 2; pour tout x ∈] − 1,1[ (4.11)2(1 − x) 3; pour tout x ∈] − 1,1[ (4.12)E(X) = 1 p2(1 − p), E[X(X − 1)] =p 2 , E ( X 2) = 2 p 2 − 1 p<strong>et</strong> Var (X) =1 − pp 2 .Calculons à présent des moments d’une loi uniforme sur un intervalle.Proposition 4.33 (Loi uniforme sur [a, b])Soit X une variable aléatoire de loi uniforme sur [a,b] (avec a,b ∈ R tel que a < b), c’est-à-dire unevariable aléatoire de loi absolument continue ayant pour densité la fonction f définie sur R parAlors,f(x) = 1b − a 1 [a,b](x).E(X) = a + b2<strong>et</strong> Var (X) =(b − a)3.12Preuve de la proposition 4.33. Nous avons :E(X) = 1b − a∫ bD’où Var (X) = b2 + ab + a 2−3axdx = a + b2(a + b)24=<strong>et</strong> E ( X 2) = 1b − a∫ bax 2 dx = b2 + ab + a 2.3(b − a)2. 12Étudions à présent le cas des lois exponentielles.91


Proposition 4.34 (Lois exponentielles)Soit X λ une variable aléatoire réelle de loi exponentielle de paramètre λ > 0, c’est-à-dire de loi absolumentcontinue ayant pour densité la fonction f λ définie sur R parAlors, E(X λ ) = λ <strong>et</strong> Var(X λ ) = λ 2 .∀x ∈ R, f λ (x) = e−x/λλ1 ]0,+∞[ (x).Preuve de la proposition 4.34. La variable aléatoire Y λ = X λ /λ suit une loi exponentielle de paramètre un.Étant donné que X λ = λY λ , E(X λ ) = λE(Y λ ) <strong>et</strong> Var(X λ ) = λ 2 Var (Y λ ). Il suffit par conséquent decalculer l’espérance <strong>et</strong> la variance lorsque λ = 1. Pour λ = 1,∫E(X 1 ) = xe −x λ 1 (dx) <strong>et</strong> E ( ∫X12 )= x 2 e −x λ 1 (dx).]0,+∞[]0,+∞[Les intégrales précédentes au sens de Lebesgue sont aussi des intégrales au sens de Riemann (car il s’agitd’intégrales de fonctions continues positives). En procédant par intégrations par parties, on constate queE(X 1 ) =∫ +∞0e −x dx = 1 <strong>et</strong> E ( ∫X12 ) +∞= 2 xe −x dx = 2.0On en déduit Var(X 1 ) = 1.Terminons ce chapitre par le cas des variables gaussiennes.Proposition 4.35 (Lois gaussiennes)Si X suit une loi N ( m,σ 2) alors, E(X) = m <strong>et</strong> Var X = σ 2 .Preuve de la proposition 4.35. Nous savons que Y = X−mσdensité par rapport à λ 1 la fonctionsuit une loi gaussienne centrée réduite <strong>et</strong> a pourf : R −→ Rx ↦→ √ 12πe −x2 /2 .En utilisant la parité de f, on montre facilement que Y est centrée <strong>et</strong> donc par linéarité de l’espéranceque E(X) = m.Par ailleurs,E ( Y 2) = 1 √2π∫Rt 2 e −t2 /2 λ 1 (dt) = 1 √2π∫Rt(te −t2 /2 )λ 1 (dt).En remarquant que l’intégrale précédente au sens de Lebesgue coïncide avec l’intégrale au sens de Riemann<strong>et</strong> en utilisant une intégration par parties (vue pour l’intégration au sens de Riemann),E ( Y 2) = 1 √2π( [−te −t2 /2 ] +∞−∞ + ∫ +∞−∞)e −t2 /2 dt = √ 1 ∫ +∞2π−∞e −t2 /2 dt = 1.Par conséquent, Y adm<strong>et</strong> un moment d’ordre 2 <strong>et</strong> Var Y = E ( Y 2) − (E(Y )) 2 = 1. Étant donné queX = σY + m,X adm<strong>et</strong> ausssi un moment d’ordre 2 <strong>et</strong> Var X = σ 2 Var Y = σ 2 .92


Annexe AClasses monotonesDe nombreux résultats liés de la théorie de la mesure sont basés sur le concept de classes monotones.Le théorème des classes monotones perm<strong>et</strong> en particulier de donner des caractérisations des lois de variablesaléatoires ou encore d’indépendance de variables aléatoires.Définition A.1 (Classe monotone)Soit Ω un ensemble non vide. Un ensemble M est une classe monotone sur Ω si il vérifie les assertionssuivantes :(i) M ⊂ P(Ω),(ii) Ω ∈ M,(iii) M est stable par réunion croissante, c’est-à-dire quesi (M n ) n∈N est une suite croissante d’éléments de M, alors ⋃ n0M n ∈ M.(iv) si A,B ∈ M <strong>et</strong> si A ⊂ B, alors B\A ∈ M.Remarque A.1 Une classe monotone M est stable par passage au complémentaire. En eff<strong>et</strong>, si A ∈ M, alorsA c = Ω\A ∈ M car Ω ∈ A <strong>et</strong> A ⊂ Ω.Exemple A.1 Une tribu est une classe monotone.Nous pouvons introduire la classe monotone engendrée par un ensemble non vide.Proposition A.2 (Classe monotone engendrée)Soient Ω un ensemble non vide <strong>et</strong> T ⊂ P(Ω) un ensemble non vide. Alors, il existe une unique classemonotone M(T ) sur Ω contenant T <strong>et</strong> telle quesi C est une classe monotone sur Ω contenant T , alors M(T ) ⊂ C.La classe monotone M(T ) est la plus p<strong>et</strong>ite classe monotone (au sens de l’inclusion) sur Ω contenant T<strong>et</strong> est appelée classe monotone engendrée par T sur Ω.Preuve de la proposition A.2. Analogue à la preuve de la proposition 1.3 page 4.93


Énonçons à présent le théorème des classes monotones (version ensembliste).Théorème A.3 (Théorème des classes monotones)Soit Ω un ensemble non vide. Si T ⊂ P(Ω) est un ensemble non vide stable par intersection finie,alors la classe monotone M(T ) engendrée par T sur Ω coïncide avec la tribu σ(T ) engendrée T sur Ω,c’est-à-dire queσ(T ) = M(T ).Preuve du théorème A.3. Supposons que T ⊂ P(Ω) est un ensemble non vide stable par intersection finie.• La tribu σ(T ) étant une classe monotone sur Ω qui contient T , M(T ) ⊂ σ(T ) par définition de M(T ).• Considérons l’ensembleM 1 = {A ∈ M(T )/∀T ∈ T , T ∩ A ∈ M(T )}.M(T ) étant une classe monotone, on vérifie aisément que M 1 ⊂ P(Ω) est aussi une classe monotone surΩ (exercice). Comme T est stable par intersection finie, T ⊂ M 1 . Par suite, M(T ) ⊂ M 1 car M(T ) estla classe monotone engendrée par T . Par conséquent, M 1 = M(T ), c’est-à-dire que∀T ∈ T , ∀A ∈ M(T ), A ∩ T ∈ M(T )(A.1) Considérons à présentM 2 = {B ∈ M(T ) / ∀A ∈ M(T ), A ∩ B ∈ M(T )}.Alors, M 2 est une classe monotone sur Ω (exercice). De plus, d’après (A.1), T ⊂ M 2 (car T ⊂ M(T )).Par conséquent, M(T ) ⊂ M 2 car M(T ) est la classe monotone engendrée par T . Ainsi,∀T ∈ M(T ), ∀A ∈ M(T ), A ∩ T ∈ M(T ).Nous venons de montrer que M(T ) est stable par intersection finie. Montrons que M(T ) est une tribu sur Ω.(a) Ω ∈ M(T ) car M(T ) est une classe monotone sur Ω.(b) D’après la remarque (A.1), la classe monotone M(T ) est stable par passage au complémentaire.(c) Soit (A n ) n∈Nune suite de M(T ). Pour tout n ∈ N, posons B n = A 0 ∪ · · · ∪A n . La classe monotoneM(T ) étant stable par passage au complémentaire <strong>et</strong> par intersection finie, elle est aussi stablepar réunion finie. Par conséquent,∀n ∈ N, B n ∈ M(T ).Alors, (B n ) n∈Nest une suite croissante (par définition) de la classe monotone M(T ) <strong>et</strong> donc⋃n∈NA n = ⋃ n∈NB n ∈ M(T )par stabilité par réunion dénombrable croissante de M(T ).Au vu des trois propriétés précédentes, M(T ) est une tribu sur Ω. De plus, elle contient T . Par conséquent,σ(T ) ⊂ M(T ).Vu ce qui précède, σ(T ) = M(T ).94


Ce théorème perm<strong>et</strong> de montrer que deux probabilités qui coïncident sur une algèbre de parties sont égalessur la tribu engendrée par c<strong>et</strong>te algèbre.Définition A.4 (Algèbre)Soit Ω un ensemble non vide. Un ensemble T est une algèbre sur Ω si il vérifie les assertions suivantes :(i) T ⊂ P(Ω),(ii) Ω ∈ T ,(iii) T est stable par passage au complémentaire,(iv) T est stable par intersection finie.Proposition A.5Soient Ω un ensemble non vide <strong>et</strong> A une tribu engendrée sur Ω par une algèbre T sur Ω. Supposons queµ <strong>et</strong> ν sont deux mesures positives sur (Ω, A) telles que∀T ∈ T , µ(T) = ν(T).Supposons de plus qu’il existe une suite croissante (T n ) n∈Nd’éléments de T telle que Ω = ⋃ n∈N T n <strong>et</strong>telle que pour tout n ∈ N, µ(T n ) = ν(T n ) < ∞. Alors µ <strong>et</strong> ν sont égales sur A.Preuve de la proposition A.5. Fixons n ∈ N. Considérons M n = {A ∈ A /µ(A ∩ T n ) = ν(A ∩ T n )}.Remarquons que Ω ∈ M n ⊂ P(Ω). De plus, en utilisant la continuité monotone des mesures µ <strong>et</strong> ν<strong>et</strong> la stabilité par réunion dénombrable de la tribu A, nous constatons que M n est stable par réunioncroissante dénombrable. Enfin, si A,B ∈ M n <strong>et</strong> si A ⊂ B, alors, B\A = B ∩ A c ∈ A <strong>et</strong>µ(B\A ∩ T n ) = µ(B ∩ T n ) − µ(A ∩ T n ) = ν(B ∩ T n ) − ν(A ∩ T n ) = ν(B\A ∩ T n )car µ(T n ) = ν(T n ) < +∞. Par suite, M n est une classe monotone. De plus elle contient T donc M(T ).Alors, d’après le théorème A.3 A = σ(T ) = M(T ) ⊂ M n . D’où∀A ∈ A, µ(A ∩ T n ) = ν(A ∩ T n ).En faisant tendre n vers +∞, par croissance de la suite (T n ) n∈N<strong>et</strong> continuité monotone des mesures ν<strong>et</strong> µ, nous obtenons : ∀A ∈ A, µ(A) = ν(A).Terminons par un résultat qui perm<strong>et</strong> de caractériser notamment les probabilités.Corollaire A.6Soient µ <strong>et</strong> ν sont deux mesures positives sur (R, B(R)).1. Supposons que pour tout intervalle I de R, µ(I) = ν(I). Supposons de plus qu’il existe (I n ) n∈N unesuite croissante d’intervalles de R telles que pour tout n ∈ R, µ(I n ) = ν(I n ) < ∞ <strong>et</strong> ⋃ n∈N I n = R.Alors les deux mesures µ <strong>et</strong> ν coïncident sur B(R).2. Supposons que les mesures µ <strong>et</strong> ν sont bornées <strong>et</strong> que∀t ∈ R, µ(] − ∞,t]) = ν(] − ∞,t]).Alors, les deux mesures µ <strong>et</strong> ν coïncident sur B(R).95


Preuve du corollaire A.6.1. Notons T l’ensemble des réunions finies des intervalles de R. Alors, T est une algèbre sur Ω. FixonsT ∈ T . Alors, il existe (J n ) n∈Nune famille d’intervalles deux à deux disjoints tels queT = ⋃ n∈NJ n .Alors, en utilisant la σ-additivité de µ <strong>et</strong> de ν <strong>et</strong> le fait que µ <strong>et</strong> ν coïncident sur l’ensemble desintervalles, nous avons :µ(T) = ∑ µ(J n ) = ∑ n ) = ν(T).n∈N n∈Nν(JPar suite, µ <strong>et</strong> ν coïncident sur l’algèbre des parties T <strong>et</strong> donc sur B(R) = σ(T ) d’après la propositionA.5.2. Supposons les hypothèses de l’assertion 2. vérifiées. Nous pouvons alors montrer que ν <strong>et</strong> µcoïncident sur l’ensemble des intervalles (utiliser µ(A c ) = µ(Ω) − µ(A), ν(A c ) = ν(Ω) − ν(A)<strong>et</strong> la continuité monotone de µ <strong>et</strong> ν).96


Annexe BIntégrales dépendant d’un paramètreC<strong>et</strong>te annexe présente une application des théorèmes de convergence à l’étude de fonctions définies par uneintégrale. Dans ce paragraphe, (Ω, A, µ) est un espace mesuré compl<strong>et</strong>.Une application immédiate du théorème de convergence dominée est la suivante.Proposition B.1Soient (E,d) un espace métrique, f : (E × Ω) → R (ou C), a ∈ E <strong>et</strong> g : Ω → R + . Supposons que(i) pour tout x ∈ E, ω ↦→ f(x,ω) est mesurable,(ii) g est µ-intégrable,(iii) pour tout x ∈ E, |f(x,ω)| g(ω) µ-presque partout,(iv) <strong>et</strong> que pour µ-presque tout ω ∈ Ω, l’application x ↦→ f(x,ω) est continue en a ∈ E.∫Alors la fonction x ↦→Ωf(x,ω)dµ(ω) est définie sur E <strong>et</strong> est continue en a.Preuve de la proposition B.1. D’après le théorème de convergence dominée, pour tout x ∈ E∫F(x) = f(x,ω)dµ(ω)est bien défini.Soit (a n ) n∈N une suite de points de E convergeant vers a. PosonsΩ∀n ∈ N, ∀ω ∈ Ω, f n (ω) = f(a n ,ω).Vu les hypothèses, nous pouvons appliquer le théorème de convergence dominée à la suite (f n ) n∈N, cequi nous montre que∫∫lim F(a n) = lim f(a n ,ω)dµ(ω) = f(a,ω)dµ(ω).n→+∞ n→+∞ΩΩCeci étant vrai pour toute suite (a n ) n∈Nconvergeant vers a dans E <strong>et</strong> E étant un métrique, la fonctionF est continue en a.Remarque B.1 L’énoncé de la proposition peut être ≪ localisé ≫. En eff<strong>et</strong>, il suffit que les propriétés (iii) <strong>et</strong>(iv) soient réalisées dans un voisinage de a.97


Supposons E = R. Nous nous intéressons maintenant à la différentiabilité de la fonction∫F : x ↦→ f(x,ω)dµ(ω).Proposition B.2Soient U un ouvert de R, f : U × Ω → R <strong>et</strong> g : Ω → R + tels que(i) pour tout x ∈ U, ω ↦→ f(x,ω) est mesurable <strong>et</strong> µ-intégrable,(ii) pour µ-presque tout ω ∈ Ω, x ↦→ f(x,ω) est dérivable en tout point de U,(iii) g est µ-intégrable;∣ (iv) <strong>et</strong> pour tout x ∈ U,∂f ∣∣∣∣∂x (x,ω) g(ω) µ-presque partout.ΩAlors pour tout x de U, la fonctionest mesurable. De plus, la fonctionest dérivable sur U <strong>et</strong>Ω →ω ↦→∫x ↦→ F(x) =R∂f∂x (x,ω)Ω∫∀x ∈ U, F ′ (x) =f(x,ω)dµ(ω)Ω∂f∂x dµ(ω).Preuve de la proposition B.2. Soit x <strong>et</strong> a deux éléments de U, x ≠ a. Alors,∫F(x) − F(a) f(x,ω) − f(a,ω)=dµ(ω).x − ax − aEn utilisant le théorème des accroissements finis <strong>et</strong> l’hypothèse (iv), nous constatonsf(x,ω) − f(a,ω)∣ x − a ∣ g(ω) µ-presque partout.ΩDe plus,f(x,ω) − f(a,ω)limx→a x − a= ∂f (a,ω) µ-presque partout.∂xIl suffit d’utiliser le théorème de convergence dominée ou la proposition B.1 pour conclure.Remarque B.21. Si U est un ouvert de C <strong>et</strong> si nous remplaçons dans la dernière proposition (ii) parx ↦→ f(x,ω) est une fonction holomorphe sur U pour presque tout ω ∈ Ω,alors F est holomorphe sur U.2. Si U est un ouvert de R n <strong>et</strong> si nous remplaçons dans la dernière proposition (ii) parx ↦→ f(x,ω) est différentiable, pour presque tout ω ∈ Ω,alors F est différentiable sur U.3. En itérant la proposition B.2, nous obtenons des critères pour montrer que F est de classe C k .98


Loi de la v.a. X P X Espérance Variance Fonction CaractéristiqueLoi de BernoulliB(p)P X = (1 − p)δ 0 + pδ 1 p p(1 − p) ϕ X (t) = 1 − p + pe itC.1 Lois discrètesLois classiquesAnnexe C99avec p ∈ [0,1]Loi BinomialeB(n,p)avec n ∈ N ∗ <strong>et</strong> p ∈ [0,1]Loi de PoissonP(λ)n∑( nP X =k)p k (1−p) n−k np np(1 − p) ϕδ X (t) = ( 1 − p + pe it) nkk=0P X =+∞∑k=0e −λ λ kδ kk!λ λ ϕX (t) = e λ(eit −1)avec λ ∈ R ∗ +Loi GéométriqueG(p)avec p ∈]0,1[P X =+∞∑k=1p(1 − p) k−1 δ k1p1 − pp 2 ϕ X (t) =pe it1 − (1 − p)e it


100Loi de la v.a. X Densité de P X Espérance Variance Fonction de répartition Fonction CaractéristiqueLoi GaussienneN(m,σ 2 ),où m ∈ R <strong>et</strong> σ ∈ R ∗ +1f X (x) = √2πσ 2 e−(x−m)2 2σ 2 m σ 2 ∫ xF X (x) = f X (t)λ 1 (dt)−∞ϕ X (x) = e imx− σ2 x 22Loi UniformeU ([0,1]) f X (x) = 1 [0,1] (x) 12Loi ExponentielleE(λ)avec λ ∈ R ∗ +1⎧⎨12 F X (x) =⎩0 si x < 0x si x ∈ [0,1]1 si x > 1{f X (x) = e−x/λλ 1 R ∗ (x) λ λ 2 0 si x < 0F+ X (x) =1 − e −x/λ si x 0ϕ X (x) =ϕ X (x) ={ e ix −1ixsi x ≠ 01 si x = 011 − iλxC.2 Lois absolument continuesLoi de Cauchy f X (x) =1π(1 + x 2 )n’existe pasn’existe pasF X (x) = 1 2 + arctan(x)πϕ X (x) = e −|x|


Bibliographie[1] Barbe, P. <strong>et</strong> Ledoux, M. Probabilités, De la licence à l’agrégation. Belin, 1998.[2] Bouleau, N. Probabilités de l’ingénieur, variables aléatoires <strong>et</strong> simulation. 2nde édition. Hermann, 2002.[3] Briane, M. <strong>et</strong> Pages, G. Théorie de l’intégration. Vuibert, 2006.[4] Foata, D. <strong>et</strong> Fuch, A. Calcul des probabilités. 2nde édition. Dunod, 2003.[5] Herrmann, S. Analyse Fonctionnelle <strong>et</strong> Probabilités. Polycopié de cours, ENSMN, Première année, 2004.[6] Neveu, J. Bases mathématiques du calcul des probabilités. Masson, 1970.[7] Rudin, W. Analyse réelle <strong>et</strong> complexe. 3ème édition. Dunod, 1998.[8] Rudin, W. Principe d’analyse mathématique. Dunod, 2002.[9] Revuz, D. Mesure <strong>et</strong> intégration. Hermann, 1997.[10] Revuz, D. Probabilités. Hermann, 1997.[11] Wagschal, C. Dérivation, intégration. Hermann, 1999.101

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!