Mélanges de GLMs et nombre de composantes : application ... - Scor
Mélanges de GLMs et nombre de composantes : application ... - Scor
Mélanges de GLMs et nombre de composantes : application ... - Scor
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
4.2. Sélection <strong>de</strong> modèle mélange<br />
On accroît ensuite n pour avoir n (pen(K g ) − pen(K g b)) > v avec une gran<strong>de</strong> probabilité<br />
(H3-C). Nous obtenons immédiatement<br />
IC(K g)<br />
{ }} {<br />
−L n ( ˆψ g ) + pen(K g ) ≥ −L n ( ˆψ g b) − v n + pen(K g)<br />
> −L n ( ˆψ g b) + pen(K g b)<br />
> IC(K g b).<br />
Encore une fois, nous avons avec gran<strong>de</strong> probabilité ĝ ≠ g.<br />
Finalement, la formule <strong>de</strong>s probabilités totales (les sommes concernent <strong>de</strong>s ensembles dénombrables,<br />
typiquement inclus dans N ∗ ) donne<br />
P(ĝ ≠ g b ) = ∑ g≠g b<br />
g∈E<br />
P(ĝ = g)<br />
} {{ }<br />
−→0<br />
n→∞<br />
+ ∑ P(ĝ = g) ,<br />
} {{ }<br />
g /∈E −→0<br />
n→∞<br />
<strong>et</strong> nous en déduisons le résultat : P(ĝ ≠ g b ) −→<br />
n→∞<br />
0.<br />
Il est à noter qu’une convergence en probabilité au lieu <strong>de</strong> presque sûre pour (H2-C) suffit<br />
à obtenir le même résultat final. L’ajout d’une condition supplémentaire pour la forme <strong>de</strong> la<br />
pénalité (<strong>de</strong> type “Nishii (1988)”), <strong>et</strong> une convergence presque sûre dans (H4-C) perm<strong>et</strong>traient<br />
d’ailleurs d’étendre ce théorème à une version “presque sûre”, mais nous n’avons malheureusement<br />
pas encore réussi à prouver la convergence presque sûre <strong>de</strong> (H4-C). Etant donné la<br />
définition du critère ICL c <strong>et</strong> le fait que l’estimateur ML cc E soit fortement convergent vers le<br />
paramètre théorique, nous nous doutons que ce critère perm<strong>et</strong>tra <strong>de</strong> sélectionner un modèle<br />
dont le <strong>nombre</strong> <strong>de</strong> <strong>composantes</strong> convergera faiblement vers le <strong>nombre</strong> théorique <strong>de</strong> clusters<br />
<strong>de</strong>s observations. En eff<strong>et</strong>, la pénalité (comme pour le BIC) perm<strong>et</strong> intuitivement <strong>de</strong> satisfaire<br />
(H3-C). De plus, c<strong>et</strong>te pénalité satisfait les conditions <strong>de</strong> Nishii (1988) pour avoir un critère<br />
consistant.<br />
Résultats auxiliaires fondamentaux Il nous reste principalement à discuter <strong>de</strong> l’hypothèse<br />
(H4-C). Les conditions pour satisfaire (H4-C) reposent sur <strong>de</strong> multiples résultats que<br />
nous allons évoquer dans c<strong>et</strong>te partie. Nous commençons cependant par démontrer la proximité<br />
entre (H2-C) <strong>et</strong> certains résultats vus au préalable.<br />
Lemme 5. Soit Ψ g ⊂ R Kg <strong>et</strong> ln L cc : Ψ g × R d . Soit Ψ b g = arg max E f 0[ln L cc (ψ g ; Y )].<br />
ψ<br />
⎧<br />
g∈Ψ g<br />
⎨L n ( ˆψ g ; y) ≥ L n (ψg; b y) − ξ n , où ξ n ≥ 0 p.s. <strong>et</strong> ξ n −→ 0 p.s.,<br />
Supposons que<br />
∣<br />
⎩ sup<br />
L n (ψ g ; y) − E f 0[ln L cc (ψ g ; Y )] ∣ −→ 0 p.s.<br />
ψ g∈Ψ g<br />
Alors L n ( ˆψ g ; y) −→<br />
n→∞<br />
E f 0[ln L cc (ψ b g; Y )]<br />
p.s.<br />
Démonstration. Soit ν > 0.<br />
D’après la première hypothèse, nous avons<br />
[<br />
∃n 0 ∈ N, ∀n ≥ n 0 , L n (ψg; b y) − L n ( ˆψ g ; y) < ν ]<br />
2<br />
p.s.<br />
137