Mélanges de GLMs et nombre de composantes : application ... - Scor
Mélanges de GLMs et nombre de composantes : application ... - Scor
Mélanges de GLMs et nombre de composantes : application ... - Scor
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
4.2. Sélection <strong>de</strong> modèle mélange<br />
<strong>de</strong> dimension K g . La <strong>de</strong>nsité du mélange M g est<br />
∀g ∈ N ∗ , ∀ψ g ∈<br />
(<br />
Π g × (R d × S d +) g) , f Mg (y; ψ g ) =<br />
g∑<br />
π i f(y; θ i ).<br />
La première définition du critère ICL diffère <strong>de</strong> celle que nous allons considérer : Biernacki<br />
(2000) part du même principe que le critère BIC <strong>et</strong> sélectionne pami les modèles {M 1 , ..., M m }<br />
le modèle tel que<br />
(<br />
M ICL = arg min<br />
M g∈{M 1 ,...,M m}<br />
− max<br />
= arg min<br />
M g∈{M 1 ,...,M m}<br />
i=1<br />
ln f Mg (Y, Z; ψ g ) + K )<br />
g<br />
ψ g∈Ψ g 2 ln n<br />
(<br />
− max ln L c (ψ g ; Y, Z) + K )<br />
g<br />
ψ g∈Ψ g 2 ln n .<br />
Pour cela, il utilise l’approximation <strong>de</strong> Laplace sur la vraisemblance classifiante L c (ψ g ; y, z).<br />
En pratique, le vecteur Z n’est pas observé <strong>et</strong> il choisit donc <strong>de</strong> le remplacer par les affectations<br />
a posteriori ẐMAP ( ˆψ<br />
MLE<br />
g ). De plus, il considère que ˆψ<br />
MLE<br />
g ≃ arg max ψg L c (ψ g ; Y, Z) lorsque<br />
n est grand. Ces considérations, discutables, amènent ainsi au modèle sélectionné suivant<br />
(<br />
M ICLa = arg min<br />
M g∈{M 1 ,...,M m}<br />
− ln f Mg (Y, ẐMAP ;<br />
= arg min<br />
M g∈{M 1 ,...,M m}<br />
= arg min<br />
M g∈{M 1 ,...,M m}<br />
(<br />
− ln L c (<br />
⎛<br />
− ln L(<br />
⎜<br />
⎝<br />
MLE ˆψ g ) + K )<br />
g<br />
2 ln n<br />
MLE ˆψ g ; Y, ẐMAP ) + K )<br />
g<br />
2 ln n<br />
ˆψ<br />
MLE<br />
g<br />
; y) −<br />
n∑<br />
g∑<br />
j=1 i=1<br />
Ẑ MAP<br />
ij<br />
ln τ i (y j ;<br />
MLE ˆψ g ) + K g<br />
2 ln n<br />
.<br />
⎟<br />
⎠<br />
} {{ }<br />
pen ICLa (K g)<br />
⎞<br />
De leur côté, McLachlan and Peel (2000) proposent <strong>de</strong> remplacer Z par τ i (y;<br />
obtiennent ainsi le critère<br />
(<br />
M ICLb = arg min<br />
M g∈{M 1 ,...,M m}<br />
− ln f Mg (Y, τ(<br />
= arg min<br />
M g∈{M 1 ,...,M m}<br />
= arg min<br />
M g∈{M 1 ,...,M m}<br />
(<br />
− ln L cc (<br />
(<br />
− ln L(<br />
MLE ˆψ g );<br />
MLE ˆψ g ; Y, τ(<br />
ˆψ<br />
MLE<br />
g<br />
) + Ent(<br />
MLE ˆψ g ) + K )<br />
g<br />
2 ln n<br />
MLE ˆψ g )) + K )<br />
g<br />
2 ln n<br />
MLE ˆψ g<br />
) + K g<br />
2 ln n<br />
} {{ }<br />
pen ICLb (K g)<br />
)<br />
.<br />
ˆψ<br />
MLE<br />
g ). Ils<br />
En fait ICL a <strong>et</strong> ICL b ne sont vraiment différents en pratique que si les observations ne sont<br />
pas affectées à une composante avec une gran<strong>de</strong> confiance ; nous pouvons montrer que dans<br />
133