Mélanges de GLMs et nombre de composantes : application ... - Scor
Mélanges de GLMs et nombre de composantes : application ... - Scor
Mélanges de GLMs et nombre de composantes : application ... - Scor
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
4.2. Sélection <strong>de</strong> modèle mélange<br />
Figure 4.1 – Fonction d’entropie avec G = 2 (2 groupes possibles).<br />
Fonction d'entropie<br />
0.7<br />
0.6<br />
0.6<br />
0.5<br />
0.5<br />
Entropie0.4<br />
0.3<br />
0.4<br />
0.2<br />
0.1<br />
0.3<br />
0.8<br />
0.6<br />
0.4<br />
Probabilite Classe 2<br />
0.2<br />
0.8<br />
0.6<br />
0.4<br />
0.2<br />
Probabilite Classe 1<br />
0.2<br />
0.1<br />
D’autre part, l’entropie a une limite nulle lorsque l’une <strong>de</strong>s probabilités τ i tend vers 0. En<br />
revanche, elle n’est pas dérivable en 0 car en considérant la fonction f(τ i ) = τ i ln τ i :<br />
f ′ (τ i ) = ln(τ i ) + 1 ⇒ lim<br />
τ i →0 +f ′ (τ i ) = −∞ ⇒ lim<br />
τ i →0 +(Ent τ)′ = +∞.<br />
Ceci constituera un point clef dans la définition <strong>de</strong> l’espace <strong>de</strong>s paramètres acceptable pour<br />
assurer la convergence <strong>de</strong> l’estimateur basé sur la vraisemblance classifiante conditionnelle. Il<br />
faudra donc éviter que les proportions du mélange a posteriori ten<strong>de</strong>nt vers la valeur nulle. En<br />
eff<strong>et</strong> une <strong>de</strong>s hypothèses requiert que la dérivée <strong>de</strong> la vraisemblance classifiante conditionnelle<br />
reste bornée, mais nous reviendrons sur ce point en section 4.2.2.<br />
L’estimateur ML cc E dans le cas <strong>de</strong> mélange gaussien<br />
Rappelons que l’ensemble <strong>de</strong>s mélanges gaussiens est défini ici par<br />
{ G<br />
}<br />
∑<br />
M G = π i f N (.; θ i ) | (π 1 , ..., π G , θ 1 , ..., θ G ) ∈ Ψ G ,<br />
i=1<br />
avec Ψ G ⊂ Π G × Θ G où Θ G ⊂ (R d × S d +) G . D’habitu<strong>de</strong>, les contraintes sur l’espace <strong>de</strong>s paramètres<br />
sont essentiellement formulées sur l’espace Θ G , puisque seuls les paramètres sur Θ G<br />
interviennent dans la maximisation <strong>de</strong> la vraisemblance complète. K G est la dimension “optimale”<br />
du modèle M G : à titre d’exemple, il n’est pas nécessaire <strong>de</strong> calculer les G proportions<br />
du mélange puisque la <strong>de</strong>rnière peut être déduite <strong>de</strong>s autres grâce à la contrainte sur Π G .<br />
121