23.12.2013 Views

Mélanges de GLMs et nombre de composantes : application ... - Scor

Mélanges de GLMs et nombre de composantes : application ... - Scor

Mélanges de GLMs et nombre de composantes : application ... - Scor

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

4.2. Sélection <strong>de</strong> modèle mélange<br />

Figure 4.1 – Fonction d’entropie avec G = 2 (2 groupes possibles).<br />

Fonction d'entropie<br />

0.7<br />

0.6<br />

0.6<br />

0.5<br />

0.5<br />

Entropie0.4<br />

0.3<br />

0.4<br />

0.2<br />

0.1<br />

0.3<br />

0.8<br />

0.6<br />

0.4<br />

Probabilite Classe 2<br />

0.2<br />

0.8<br />

0.6<br />

0.4<br />

0.2<br />

Probabilite Classe 1<br />

0.2<br />

0.1<br />

D’autre part, l’entropie a une limite nulle lorsque l’une <strong>de</strong>s probabilités τ i tend vers 0. En<br />

revanche, elle n’est pas dérivable en 0 car en considérant la fonction f(τ i ) = τ i ln τ i :<br />

f ′ (τ i ) = ln(τ i ) + 1 ⇒ lim<br />

τ i →0 +f ′ (τ i ) = −∞ ⇒ lim<br />

τ i →0 +(Ent τ)′ = +∞.<br />

Ceci constituera un point clef dans la définition <strong>de</strong> l’espace <strong>de</strong>s paramètres acceptable pour<br />

assurer la convergence <strong>de</strong> l’estimateur basé sur la vraisemblance classifiante conditionnelle. Il<br />

faudra donc éviter que les proportions du mélange a posteriori ten<strong>de</strong>nt vers la valeur nulle. En<br />

eff<strong>et</strong> une <strong>de</strong>s hypothèses requiert que la dérivée <strong>de</strong> la vraisemblance classifiante conditionnelle<br />

reste bornée, mais nous reviendrons sur ce point en section 4.2.2.<br />

L’estimateur ML cc E dans le cas <strong>de</strong> mélange gaussien<br />

Rappelons que l’ensemble <strong>de</strong>s mélanges gaussiens est défini ici par<br />

{ G<br />

}<br />

∑<br />

M G = π i f N (.; θ i ) | (π 1 , ..., π G , θ 1 , ..., θ G ) ∈ Ψ G ,<br />

i=1<br />

avec Ψ G ⊂ Π G × Θ G où Θ G ⊂ (R d × S d +) G . D’habitu<strong>de</strong>, les contraintes sur l’espace <strong>de</strong>s paramètres<br />

sont essentiellement formulées sur l’espace Θ G , puisque seuls les paramètres sur Θ G<br />

interviennent dans la maximisation <strong>de</strong> la vraisemblance complète. K G est la dimension “optimale”<br />

du modèle M G : à titre d’exemple, il n’est pas nécessaire <strong>de</strong> calculer les G proportions<br />

du mélange puisque la <strong>de</strong>rnière peut être déduite <strong>de</strong>s autres grâce à la contrainte sur Π G .<br />

121

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!