23.12.2013 Views

Mélanges de GLMs et nombre de composantes : application ... - Scor

Mélanges de GLMs et nombre de composantes : application ... - Scor

Mélanges de GLMs et nombre de composantes : application ... - Scor

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

4.2. Sélection <strong>de</strong> modèle mélange<br />

Ce lemme est une <strong>application</strong> <strong>de</strong> l’inégalité <strong>de</strong> Markov. Il est très utile pour obtenir <strong>de</strong>s<br />

résultats en probabilité à partir <strong>de</strong> résultats en espérance. C’est d’ailleurs ce lemme qui nous<br />

perm<strong>et</strong>tra d’utiliser le théorème 8 ci-<strong>de</strong>ssous dans une version où la conclusion vaudrait en<br />

probabilité (c’est notre objectif final). En l’occurence, nous avons également besoin du lemme<br />

suivant pour démontrer le théorème 8 :<br />

Lemme 7. (Lemme 4.23 dans Massart (2007))<br />

Soit S un ensemble dénombrable, u ∈ S <strong>et</strong> a : S → R + telle que a(u) = inf t∈S a(t).<br />

Soit Z un processus in<strong>de</strong>xé par S.<br />

Supposons que ∀σ > 0, E[sup t∈B(σ) Z(t) − Z(u)] < ∞ avec B(σ) = {t ∈ S; a(t) ≤ σ}.<br />

Alors,<br />

pour une quelconque fonction ϕ sur R + telle que ϕ(y) est décroissante sur R + <strong>et</strong> satisfait<br />

y<br />

[<br />

]<br />

nous avons<br />

∀σ ≥ σ 0 ,<br />

∀y > σ 0 ,<br />

E<br />

sup Z(t) − Z(u)<br />

t∈B(σ)<br />

< ϕ(σ),<br />

[<br />

]<br />

Z(t) − Z(u)<br />

E sup<br />

t∈S a 2 (t) + y 2 ≤ 4 y 2 ϕ(y).<br />

Ce résultat est tout à fait primordial pour passer d’un contrôle local à un contrôle global <strong>de</strong>s<br />

accroissements d’un processus. Il perm<strong>et</strong> <strong>de</strong> lier les accroissements d’un processus entre <strong>de</strong>ux<br />

points par rapport à la distance entre ces <strong>de</strong>ux points. Dans notre cadre, nous l’appliquons<br />

à la différence entre l’espérance <strong>de</strong> la log-vraisemblance L cc en ψ b g <strong>et</strong> son estimateur. C<strong>et</strong>te<br />

différence est censée tendre vers 0 avec une vitesse <strong>de</strong> convergence en n 1/2 (théorème central<br />

limite) ; mais elle y tend en fait plus vite grâce à ce lemme, avec une vitesse <strong>de</strong> convergence<br />

en n.<br />

Théorème 8. (Théorème 6.8 dans Massart (2007))<br />

Soit F une classe dénombrable <strong>de</strong> fonctions mesurables à valeurs dans R.<br />

Supposons que<br />

[<br />

∃ σ > 0, ∃ b > 0 tel que ∀f ∈ F, ∀k ≥ 2, E |f(Y i )| k] ≤ k!<br />

2 σ2 b k−2 ,<br />

<strong>et</strong> ∀δ > 0, ∃C δ un ensemble <strong>de</strong> croch<strong>et</strong>s qui couvrent F tels que,<br />

[<br />

]<br />

∀[g l , g u ] ∈ C δ , ∀k ∈ N ∗ − {1}, E (g u − g l ) k (Y i ) ≤ k!<br />

2 δ2 b k−2 .<br />

Soit e H(δ) le plus p<strong>et</strong>it cardinal d’une telle couverture <strong>de</strong> F.<br />

Alors<br />

∃κ une constante absolue telle que ∀ɛ ∈]0, 1], ∀A mesurable avec P(A) > 0,<br />

]<br />

√<br />

E<br />

[sup<br />

A S n (f) ≤ E + (1 + 6ɛ)σ 2n ln 1<br />

1<br />

+ 2b ln<br />

f∈F<br />

P(A) P(A)<br />

avec E = κ √ ∫ ɛσ<br />

√<br />

n<br />

ɛ<br />

0 min(H(u), n)du + 2(b + σ)H(σ).<br />

139

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!