23.12.2013 Views

Mélanges de GLMs et nombre de composantes : application ... - Scor

Mélanges de GLMs et nombre de composantes : application ... - Scor

Mélanges de GLMs et nombre de composantes : application ... - Scor

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

4.5. Analyse <strong>et</strong> conclusion<br />

In<strong>de</strong>x-Link <strong>et</strong> Universal Savings<br />

Nous n’avons pas trouvé <strong>de</strong> différence dans ce cas entre la sélection par BIC ou ICL, dans<br />

le sens où les <strong>de</strong>ux critères sélectionnaient systématiquement le même <strong>nombre</strong> <strong>de</strong> <strong>composantes</strong><br />

dans le mélange. Nous imaginons que le peu <strong>de</strong> <strong>nombre</strong> <strong>de</strong> <strong>composantes</strong> initialement sélectionné<br />

par l’un ou l’autre <strong>de</strong>s critères est un signe d’une confiance relativement gran<strong>de</strong> dans<br />

l’affectation <strong>de</strong>s observations aux <strong>composantes</strong>. Les <strong>composantes</strong> sont originellement bien différenciée,<br />

or nous avons vu que l’estimation du <strong>nombre</strong> <strong>de</strong> <strong>composantes</strong> par BIC ou ICL est<br />

relativement similaire dans ce cas-là : en eff<strong>et</strong>, le terme d’entropie tend vers une très p<strong>et</strong>ite<br />

valeur, ce qui provoque sa quasi-disparition.<br />

4.5 Analyse <strong>et</strong> conclusion<br />

Finalement, nous constatons que le critère ICL perm<strong>et</strong> effectivement <strong>de</strong> diminuer <strong>et</strong> <strong>de</strong><br />

créer <strong>de</strong>s groupes <strong>de</strong> comportements d’assurés plus cohérents. De plus les prévisions dans le<br />

futur n’en <strong>de</strong>meurent pas moins correctes, alors même que l’estimation <strong>de</strong>s coefficients <strong>de</strong> régression<br />

est globalement améliorée. Ainsi, la variance <strong>de</strong>s estimateurs est plus p<strong>et</strong>ite, ce qui<br />

renforce le test d’hypothèse d’un coefficient <strong>de</strong> régression non-nul. Pour synthèse, le critère<br />

ICL a permis dans notre étu<strong>de</strong> <strong>de</strong> diminuer le <strong>nombre</strong> <strong>de</strong> <strong>composantes</strong> dans cinq <strong>de</strong>s sept cas<br />

abordés, tout en conservant une bonne approximation <strong>de</strong> la loi sous-jacente aux données réelles<br />

au vu <strong>de</strong>s graphiques précé<strong>de</strong>nts. Ceci vient conforter les résultats théoriques <strong>de</strong> la première<br />

partie du chapitre, selon lesquels ce critère perm<strong>et</strong> <strong>de</strong> sélectionner un mélange <strong>de</strong> <strong>GLMs</strong> dont<br />

le <strong>nombre</strong> <strong>de</strong> <strong>composantes</strong> est convergent vers le <strong>nombre</strong> théorique <strong>de</strong> <strong>composantes</strong>. Evi<strong>de</strong>mment,<br />

ces premiers résultats nécessiteraient d’être davantage développés : ici par exemple, il<br />

est fréquent <strong>de</strong> tomber sur un maximum local lors <strong>de</strong> l’<strong>application</strong> numérique. Ceci a pour<br />

eff<strong>et</strong> que nous ne sommes pas placés dans les conditions exactes d’<strong>application</strong> <strong>de</strong>s théorèmes<br />

présentés.<br />

La baisse en dimension la plus spectaculaire provient <strong>de</strong> la famille <strong>de</strong>s produits Mixtes <strong>et</strong><br />

<strong>de</strong> celle <strong>de</strong>s produits en UC. Nous pouvions nous y attendre car nous avons constaté qu’il<br />

s’agissait effectivement <strong>de</strong>s familles pour lesquelles nous avions <strong>de</strong>s <strong>composantes</strong> particulièrement<br />

ressemblantes. Ensuite, certaines <strong>application</strong>s ont montré le peu d’intérêt du critère ICL,<br />

notamment lorsque le calibrage du mélange a permis d’effectuer une première segmentation<br />

robuste : ce résultat était aussi anticipable car les <strong>de</strong>nsités <strong>de</strong> chaque composante semblaient<br />

déjà bien séparées dans ces cas-là.<br />

Comme future extension, nous pensions à travailler avec la théorie du minimum <strong>de</strong> contraste<br />

pour trouver <strong>de</strong>s formes <strong>de</strong> pénalités non-asymptotiques. Dans le même esprit que certaines<br />

approches qui servent à calibrer spécialement la pénalité (heuristique <strong>de</strong> pente, ...), nous pourrions<br />

aussi définir <strong>de</strong>s critères <strong>de</strong> sélection dépendants <strong>de</strong>s données (Yang (2005)).<br />

171

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!