23.12.2013 Views

Mélanges de GLMs et nombre de composantes : application ... - Scor

Mélanges de GLMs et nombre de composantes : application ... - Scor

Mélanges de GLMs et nombre de composantes : application ... - Scor

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

4.2. Sélection <strong>de</strong> modèle mélange<br />

<strong>de</strong> dimension K g . La <strong>de</strong>nsité du mélange M g est<br />

∀g ∈ N ∗ , ∀ψ g ∈<br />

(<br />

Π g × (R d × S d +) g) , f Mg (y; ψ g ) =<br />

g∑<br />

π i f(y; θ i ).<br />

La première définition du critère ICL diffère <strong>de</strong> celle que nous allons considérer : Biernacki<br />

(2000) part du même principe que le critère BIC <strong>et</strong> sélectionne pami les modèles {M 1 , ..., M m }<br />

le modèle tel que<br />

(<br />

M ICL = arg min<br />

M g∈{M 1 ,...,M m}<br />

− max<br />

= arg min<br />

M g∈{M 1 ,...,M m}<br />

i=1<br />

ln f Mg (Y, Z; ψ g ) + K )<br />

g<br />

ψ g∈Ψ g 2 ln n<br />

(<br />

− max ln L c (ψ g ; Y, Z) + K )<br />

g<br />

ψ g∈Ψ g 2 ln n .<br />

Pour cela, il utilise l’approximation <strong>de</strong> Laplace sur la vraisemblance classifiante L c (ψ g ; y, z).<br />

En pratique, le vecteur Z n’est pas observé <strong>et</strong> il choisit donc <strong>de</strong> le remplacer par les affectations<br />

a posteriori ẐMAP ( ˆψ<br />

MLE<br />

g ). De plus, il considère que ˆψ<br />

MLE<br />

g ≃ arg max ψg L c (ψ g ; Y, Z) lorsque<br />

n est grand. Ces considérations, discutables, amènent ainsi au modèle sélectionné suivant<br />

(<br />

M ICLa = arg min<br />

M g∈{M 1 ,...,M m}<br />

− ln f Mg (Y, ẐMAP ;<br />

= arg min<br />

M g∈{M 1 ,...,M m}<br />

= arg min<br />

M g∈{M 1 ,...,M m}<br />

(<br />

− ln L c (<br />

⎛<br />

− ln L(<br />

⎜<br />

⎝<br />

MLE ˆψ g ) + K )<br />

g<br />

2 ln n<br />

MLE ˆψ g ; Y, ẐMAP ) + K )<br />

g<br />

2 ln n<br />

ˆψ<br />

MLE<br />

g<br />

; y) −<br />

n∑<br />

g∑<br />

j=1 i=1<br />

Ẑ MAP<br />

ij<br />

ln τ i (y j ;<br />

MLE ˆψ g ) + K g<br />

2 ln n<br />

.<br />

⎟<br />

⎠<br />

} {{ }<br />

pen ICLa (K g)<br />

⎞<br />

De leur côté, McLachlan and Peel (2000) proposent <strong>de</strong> remplacer Z par τ i (y;<br />

obtiennent ainsi le critère<br />

(<br />

M ICLb = arg min<br />

M g∈{M 1 ,...,M m}<br />

− ln f Mg (Y, τ(<br />

= arg min<br />

M g∈{M 1 ,...,M m}<br />

= arg min<br />

M g∈{M 1 ,...,M m}<br />

(<br />

− ln L cc (<br />

(<br />

− ln L(<br />

MLE ˆψ g );<br />

MLE ˆψ g ; Y, τ(<br />

ˆψ<br />

MLE<br />

g<br />

) + Ent(<br />

MLE ˆψ g ) + K )<br />

g<br />

2 ln n<br />

MLE ˆψ g )) + K )<br />

g<br />

2 ln n<br />

MLE ˆψ g<br />

) + K g<br />

2 ln n<br />

} {{ }<br />

pen ICLb (K g)<br />

)<br />

.<br />

ˆψ<br />

MLE<br />

g ). Ils<br />

En fait ICL a <strong>et</strong> ICL b ne sont vraiment différents en pratique que si les observations ne sont<br />

pas affectées à une composante avec une gran<strong>de</strong> confiance ; nous pouvons montrer que dans<br />

133

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!