23.12.2013 Views

Mélanges de GLMs et nombre de composantes : application ... - Scor

Mélanges de GLMs et nombre de composantes : application ... - Scor

Mélanges de GLMs et nombre de composantes : application ... - Scor

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Chapitre 4. Sélection <strong>de</strong> mélange <strong>de</strong> <strong>GLMs</strong><br />

Avec ce théorème, nous contrôlons le supremum d’un processus empirique sur une certaine<br />

classe <strong>de</strong> fonctions f grâce à <strong>de</strong>s bornes supérieures sur les moments <strong>de</strong>s fonctions dans F,<br />

une grille qui couvre F, <strong>et</strong> donc le <strong>nombre</strong> <strong>de</strong> croch<strong>et</strong>s nécessaires à une telle couverture. Ce<br />

théorème lie grosso modo le supremum du processus empirique avec la complexité <strong>de</strong> la classe<br />

<strong>de</strong> fonctions considérée. Nous ne démontrons pas ces résultats ici, mais le lecteur intéressé<br />

pourra consulter l’ouvrage <strong>de</strong> Massart (2007). Grâce à ces résultats, nous pouvons maintenant<br />

formuler le lemme suivant.<br />

Lemme 8. Soit K g ∈ N ∗ <strong>et</strong> Ψ g ⊂ R Kg supposé convexe.<br />

Soit Ψ O g un ouvert <strong>de</strong> R Kg tel que Ψ g ⊂ Ψ O g . Soit ln L cc : Ψ O g × R d −→ R.<br />

Supposons que<br />

- ψ g ∈ Ψ O g ↦→ ln L cc (ψ g ; y) est f 0 dλ - presque partout C 1 sur Ψ O g .<br />

Soit ψg b ∈ Ψ g tel que E f 0[ln L cc (ψg; b Y )] = max E f 0[ln L cc (ψ g ; Y )].<br />

ψ<br />

⎧<br />

g∈Ψ g<br />

⎪⎨ L(y) = sup | ln L cc (ψ g ; y) | < ∞ f 0 dλ-p.s.,<br />

ψ g∈Ψ g<br />

- Supposons que<br />

⎪⎩ ‖L‖ ∞ = ess sup L(Y ) < ∞.<br />

Y ∼f<br />

⎧<br />

0 ∣∣ ∣∣∣∣ ∣∣∣∣ ( ⎪⎨<br />

∂ ln<br />

L ′ Lcc<br />

(y) = sup<br />

< ∞ f<br />

- Supposons que<br />

ψ g∈Ψ g<br />

∂ψ g<br />

)(ψ 0 dλ-p.s.,<br />

g;y)<br />

∣∣ ⎪⎩<br />

∞<br />

‖L ′ ‖ 2 = E f 0[L ′ (Y ) 2 ] 1 2 < ∞.<br />

Alors ∃ α > 0 tel que ∀n, ∀β > 0, ∀η > 0,<br />

( (<br />

S n ln Lcc (ψ g ) − ln L cc (ψg) b )<br />

)<br />

P sup<br />

ψ g∈Ψ g<br />

‖ψ g − ψg‖ b 2 ∞ + β 2 ≤ h(L, L ′ , α, β, η, K g ) ≥ 1 − e −η<br />

où h(L, L ′ , α, β, η, K g ) = α (‖L ′<br />

β 2 ‖ 2 β √ nK g + (‖L‖ ∞ + ‖L ′ ‖ 2 β)K g + ‖L ′ √<br />

)<br />

‖ 2 nηβ + ‖L‖∞ η .<br />

En réalité, ce résultat est la clef <strong>de</strong> l’hypothèse (H4-C) puisqu’il fournit un moyen <strong>de</strong><br />

contrôler la distance S n qui nous intéresse. Nous proposons ci-<strong>de</strong>ssous une preuve <strong>de</strong> ce lemme<br />

afin d’expliciter les étapes du raisonnement.<br />

Démonstration. Vu que nous utilisons le lemme 7 <strong>et</strong> le théorème 8 dans c<strong>et</strong>te démonstration,<br />

nous <strong>de</strong>vons normalement nous plier aux hypothèses qu’ils requièrent, à savoir que la<br />

classe <strong>de</strong>s fonctions <strong>de</strong> vraisemblance classifiante conditionnelle soit dénombrable. Néanmoins,<br />

nous pourrions vérifier que ces résultats peuvent être appliqués à un sous-ensemble <strong>de</strong>nse <strong>de</strong><br />

{ln L cc (ψ g ) : ψ g ∈ Ψ g } qui contienne ψ b g, ce qui perm<strong>et</strong> ensuite <strong>de</strong> généraliser à l’espace entier.<br />

Soit le processus empirique centré :<br />

S n ln L cc (ψ g ; Y ) = n L n (ψ g ; Y ) − n E f 0[ln L cc (ψ g ; Y )]<br />

=<br />

n∑ (<br />

ln Lcc (ψ g ; Y j ) − E f 0[ln L cc (ψ g ; Y )] )<br />

j=1<br />

Considérons une variable mu<strong>et</strong>te α ; <strong>et</strong> gardons en tête que toutes les probabilités <strong>et</strong> espérances<br />

sont formulées sous f 0 dλ. Soit ψg b [<br />

∈ Ψ g tel que E f 0 ln Lcc (ψg; b Y ) ] = sup E f 0 [ln L cc (ψ g ; Y )].<br />

ψ g∈Ψ g<br />

140

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!