Mélanges de GLMs et nombre de composantes : application ... - Scor
Mélanges de GLMs et nombre de composantes : application ... - Scor
Mélanges de GLMs et nombre de composantes : application ... - Scor
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
4.5. Analyse <strong>et</strong> conclusion<br />
In<strong>de</strong>x-Link <strong>et</strong> Universal Savings<br />
Nous n’avons pas trouvé <strong>de</strong> différence dans ce cas entre la sélection par BIC ou ICL, dans<br />
le sens où les <strong>de</strong>ux critères sélectionnaient systématiquement le même <strong>nombre</strong> <strong>de</strong> <strong>composantes</strong><br />
dans le mélange. Nous imaginons que le peu <strong>de</strong> <strong>nombre</strong> <strong>de</strong> <strong>composantes</strong> initialement sélectionné<br />
par l’un ou l’autre <strong>de</strong>s critères est un signe d’une confiance relativement gran<strong>de</strong> dans<br />
l’affectation <strong>de</strong>s observations aux <strong>composantes</strong>. Les <strong>composantes</strong> sont originellement bien différenciée,<br />
or nous avons vu que l’estimation du <strong>nombre</strong> <strong>de</strong> <strong>composantes</strong> par BIC ou ICL est<br />
relativement similaire dans ce cas-là : en eff<strong>et</strong>, le terme d’entropie tend vers une très p<strong>et</strong>ite<br />
valeur, ce qui provoque sa quasi-disparition.<br />
4.5 Analyse <strong>et</strong> conclusion<br />
Finalement, nous constatons que le critère ICL perm<strong>et</strong> effectivement <strong>de</strong> diminuer <strong>et</strong> <strong>de</strong><br />
créer <strong>de</strong>s groupes <strong>de</strong> comportements d’assurés plus cohérents. De plus les prévisions dans le<br />
futur n’en <strong>de</strong>meurent pas moins correctes, alors même que l’estimation <strong>de</strong>s coefficients <strong>de</strong> régression<br />
est globalement améliorée. Ainsi, la variance <strong>de</strong>s estimateurs est plus p<strong>et</strong>ite, ce qui<br />
renforce le test d’hypothèse d’un coefficient <strong>de</strong> régression non-nul. Pour synthèse, le critère<br />
ICL a permis dans notre étu<strong>de</strong> <strong>de</strong> diminuer le <strong>nombre</strong> <strong>de</strong> <strong>composantes</strong> dans cinq <strong>de</strong>s sept cas<br />
abordés, tout en conservant une bonne approximation <strong>de</strong> la loi sous-jacente aux données réelles<br />
au vu <strong>de</strong>s graphiques précé<strong>de</strong>nts. Ceci vient conforter les résultats théoriques <strong>de</strong> la première<br />
partie du chapitre, selon lesquels ce critère perm<strong>et</strong> <strong>de</strong> sélectionner un mélange <strong>de</strong> <strong>GLMs</strong> dont<br />
le <strong>nombre</strong> <strong>de</strong> <strong>composantes</strong> est convergent vers le <strong>nombre</strong> théorique <strong>de</strong> <strong>composantes</strong>. Evi<strong>de</strong>mment,<br />
ces premiers résultats nécessiteraient d’être davantage développés : ici par exemple, il<br />
est fréquent <strong>de</strong> tomber sur un maximum local lors <strong>de</strong> l’<strong>application</strong> numérique. Ceci a pour<br />
eff<strong>et</strong> que nous ne sommes pas placés dans les conditions exactes d’<strong>application</strong> <strong>de</strong>s théorèmes<br />
présentés.<br />
La baisse en dimension la plus spectaculaire provient <strong>de</strong> la famille <strong>de</strong>s produits Mixtes <strong>et</strong><br />
<strong>de</strong> celle <strong>de</strong>s produits en UC. Nous pouvions nous y attendre car nous avons constaté qu’il<br />
s’agissait effectivement <strong>de</strong>s familles pour lesquelles nous avions <strong>de</strong>s <strong>composantes</strong> particulièrement<br />
ressemblantes. Ensuite, certaines <strong>application</strong>s ont montré le peu d’intérêt du critère ICL,<br />
notamment lorsque le calibrage du mélange a permis d’effectuer une première segmentation<br />
robuste : ce résultat était aussi anticipable car les <strong>de</strong>nsités <strong>de</strong> chaque composante semblaient<br />
déjà bien séparées dans ces cas-là.<br />
Comme future extension, nous pensions à travailler avec la théorie du minimum <strong>de</strong> contraste<br />
pour trouver <strong>de</strong>s formes <strong>de</strong> pénalités non-asymptotiques. Dans le même esprit que certaines<br />
approches qui servent à calibrer spécialement la pénalité (heuristique <strong>de</strong> pente, ...), nous pourrions<br />
aussi définir <strong>de</strong>s critères <strong>de</strong> sélection dépendants <strong>de</strong>s données (Yang (2005)).<br />
171