Mélanges de GLMs et nombre de composantes : application ... - Scor
Mélanges de GLMs et nombre de composantes : application ... - Scor
Mélanges de GLMs et nombre de composantes : application ... - Scor
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
Chapitre 4. Sélection <strong>de</strong> mélange <strong>de</strong> <strong>GLMs</strong><br />
Avec ce théorème, nous contrôlons le supremum d’un processus empirique sur une certaine<br />
classe <strong>de</strong> fonctions f grâce à <strong>de</strong>s bornes supérieures sur les moments <strong>de</strong>s fonctions dans F,<br />
une grille qui couvre F, <strong>et</strong> donc le <strong>nombre</strong> <strong>de</strong> croch<strong>et</strong>s nécessaires à une telle couverture. Ce<br />
théorème lie grosso modo le supremum du processus empirique avec la complexité <strong>de</strong> la classe<br />
<strong>de</strong> fonctions considérée. Nous ne démontrons pas ces résultats ici, mais le lecteur intéressé<br />
pourra consulter l’ouvrage <strong>de</strong> Massart (2007). Grâce à ces résultats, nous pouvons maintenant<br />
formuler le lemme suivant.<br />
Lemme 8. Soit K g ∈ N ∗ <strong>et</strong> Ψ g ⊂ R Kg supposé convexe.<br />
Soit Ψ O g un ouvert <strong>de</strong> R Kg tel que Ψ g ⊂ Ψ O g . Soit ln L cc : Ψ O g × R d −→ R.<br />
Supposons que<br />
- ψ g ∈ Ψ O g ↦→ ln L cc (ψ g ; y) est f 0 dλ - presque partout C 1 sur Ψ O g .<br />
Soit ψg b ∈ Ψ g tel que E f 0[ln L cc (ψg; b Y )] = max E f 0[ln L cc (ψ g ; Y )].<br />
ψ<br />
⎧<br />
g∈Ψ g<br />
⎪⎨ L(y) = sup | ln L cc (ψ g ; y) | < ∞ f 0 dλ-p.s.,<br />
ψ g∈Ψ g<br />
- Supposons que<br />
⎪⎩ ‖L‖ ∞ = ess sup L(Y ) < ∞.<br />
Y ∼f<br />
⎧<br />
0 ∣∣ ∣∣∣∣ ∣∣∣∣ ( ⎪⎨<br />
∂ ln<br />
L ′ Lcc<br />
(y) = sup<br />
< ∞ f<br />
- Supposons que<br />
ψ g∈Ψ g<br />
∂ψ g<br />
)(ψ 0 dλ-p.s.,<br />
g;y)<br />
∣∣ ⎪⎩<br />
∞<br />
‖L ′ ‖ 2 = E f 0[L ′ (Y ) 2 ] 1 2 < ∞.<br />
Alors ∃ α > 0 tel que ∀n, ∀β > 0, ∀η > 0,<br />
( (<br />
S n ln Lcc (ψ g ) − ln L cc (ψg) b )<br />
)<br />
P sup<br />
ψ g∈Ψ g<br />
‖ψ g − ψg‖ b 2 ∞ + β 2 ≤ h(L, L ′ , α, β, η, K g ) ≥ 1 − e −η<br />
où h(L, L ′ , α, β, η, K g ) = α (‖L ′<br />
β 2 ‖ 2 β √ nK g + (‖L‖ ∞ + ‖L ′ ‖ 2 β)K g + ‖L ′ √<br />
)<br />
‖ 2 nηβ + ‖L‖∞ η .<br />
En réalité, ce résultat est la clef <strong>de</strong> l’hypothèse (H4-C) puisqu’il fournit un moyen <strong>de</strong><br />
contrôler la distance S n qui nous intéresse. Nous proposons ci-<strong>de</strong>ssous une preuve <strong>de</strong> ce lemme<br />
afin d’expliciter les étapes du raisonnement.<br />
Démonstration. Vu que nous utilisons le lemme 7 <strong>et</strong> le théorème 8 dans c<strong>et</strong>te démonstration,<br />
nous <strong>de</strong>vons normalement nous plier aux hypothèses qu’ils requièrent, à savoir que la<br />
classe <strong>de</strong>s fonctions <strong>de</strong> vraisemblance classifiante conditionnelle soit dénombrable. Néanmoins,<br />
nous pourrions vérifier que ces résultats peuvent être appliqués à un sous-ensemble <strong>de</strong>nse <strong>de</strong><br />
{ln L cc (ψ g ) : ψ g ∈ Ψ g } qui contienne ψ b g, ce qui perm<strong>et</strong> ensuite <strong>de</strong> généraliser à l’espace entier.<br />
Soit le processus empirique centré :<br />
S n ln L cc (ψ g ; Y ) = n L n (ψ g ; Y ) − n E f 0[ln L cc (ψ g ; Y )]<br />
=<br />
n∑ (<br />
ln Lcc (ψ g ; Y j ) − E f 0[ln L cc (ψ g ; Y )] )<br />
j=1<br />
Considérons une variable mu<strong>et</strong>te α ; <strong>et</strong> gardons en tête que toutes les probabilités <strong>et</strong> espérances<br />
sont formulées sous f 0 dλ. Soit ψg b [<br />
∈ Ψ g tel que E f 0 ln Lcc (ψg; b Y ) ] = sup E f 0 [ln L cc (ψ g ; Y )].<br />
ψ g∈Ψ g<br />
140