12.07.2015 Views

Télécharger le texte intégral - ISPED-Enseignement à distance

Télécharger le texte intégral - ISPED-Enseignement à distance

Télécharger le texte intégral - ISPED-Enseignement à distance

SHOW MORE
SHOW LESS
  • No tags were found...

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Etat des connaissances 41de mélange avec un nombre fixe de composantes par un algorithme EM et (2) ladivision des classes trop hétérogènes et la fusion des classes trop proches par descritères.Parallè<strong>le</strong>ment <strong>à</strong> ces approches, Bohning (1995) a proposé un algorithme permettantd’obtenir en deux temps l’estimateur non-paramétrique du maximum de vraisemblances’il existe. Dans un premier temps, <strong>à</strong> partir d’une gril<strong>le</strong> fictive de classes(λ g ) g=1,G où G est pris très grand, il estime <strong>le</strong>s probabilités (π g ) j=1,G associées et nesé<strong>le</strong>ctionne que cel<strong>le</strong>s qui sont positives, obtenant ainsi un estimateur du nombre declasses latentes Ĝ. La deuxième étape consiste <strong>à</strong> estimer <strong>le</strong>s paramètres du modè<strong>le</strong>pour <strong>le</strong> nombre estimé de composantes Ĝ par un algorithme EM classique. Schlattmann(2003) a depuis amélioré l’estimation du nombre de composantes dans cetteméthode par une technique de Bootstrap.Ces méthodes demandent beaucoup de calcul numérique et <strong>le</strong> plus souvent, <strong>le</strong>nombre de composantes est considéré comme un paramètre qu’il faut traiter <strong>à</strong> part.Ce sont <strong>le</strong>s raisons pour <strong>le</strong>squel<strong>le</strong>s, dans la plupart des applications des modè<strong>le</strong>s demélange, l’estimation des paramètres <strong>à</strong> nombre de composantes fixé et la sé<strong>le</strong>ctiondu nombre de composantes a posteriori ont été préférées.Sé<strong>le</strong>ction du nombre de composantesLe test du nombre de composantes dans un modè<strong>le</strong> de mélange a fait l’objet d’ungrand nombre de travaux. En effet, la théorie du rapport de vraisemblance pourtester un modè<strong>le</strong> <strong>à</strong> G 0 composantes versus un modè<strong>le</strong> <strong>à</strong> G 1 composantes ne satisfaitpas <strong>le</strong>s conditions de régularité usuel<strong>le</strong>s et <strong>le</strong>s résultats asymptotiques classiques nes’appliquent pas : la distribution asymptotique du rapport de vraisemblance n’est pasun X 2 . Le problème vient du fait que l’hypothèse nul<strong>le</strong> est en bordure de l’espace desparamètres et que sous l’hypothèse nul<strong>le</strong>, <strong>le</strong> modè<strong>le</strong> n’est pas identifiab<strong>le</strong>. En effet,considérons un mélange simp<strong>le</strong> de deux distributions <strong>à</strong> un paramètre. La densité de

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!