Mélanges de GLMs et nombre de composantes : application ... - Scor
Mélanges de GLMs et nombre de composantes : application ... - Scor
Mélanges de GLMs et nombre de composantes : application ... - Scor
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
3.3. Extension au portefeuille Vie d’AXA<br />
<strong>de</strong>mment souscrits avant 1999), mais la pério<strong>de</strong> d’étu<strong>de</strong> s’étend du 1/1/2000 au 31/12/2007<br />
car les rachats n’ont été répertoriés qu’à partir <strong>de</strong> début 2000.<br />
Modélisation <strong>et</strong> prévisions par mélange <strong>de</strong> GLM<br />
Pour toutes les <strong>application</strong>s suivantes, les mêmes variables explicatives sont considérées en<br />
input <strong>de</strong> la modélisation dynamique <strong>et</strong> <strong>de</strong> la modélisation par mélange. L’approche par mélange<br />
perm<strong>et</strong> <strong>de</strong> prendre ces variables en compte <strong>de</strong> manière différente, mais il est primordial <strong>de</strong><br />
gar<strong>de</strong>r à l’esprit que nous prenons exactement les mêmes informations en entrée <strong>de</strong>s modèles<br />
afin <strong>de</strong> comparer ce qui est comparable. C<strong>et</strong>te remarque justifiera le fait que certains modèles<br />
mélange ne sont pas optimisés (en termes <strong>de</strong> variables considérées, <strong>de</strong> <strong>nombre</strong> <strong>de</strong> <strong>composantes</strong><br />
car parfois certaines <strong>composantes</strong> se ressemblent fortement...). Dans une optique où la volonté<br />
<strong>de</strong> l’utilisateur est <strong>de</strong> trouver la meilleure solution <strong>de</strong> modélisation, c<strong>et</strong>te optimisation est tout<br />
à fait réalisable dans <strong>de</strong>s délais raisonnables.<br />
Le but est <strong>de</strong> comparer l’approche par mélange <strong>de</strong> régressions logistiques avec la régression<br />
logistique dynamique, <strong>et</strong> <strong>de</strong> voir s’il y a un apport conséquent <strong>de</strong> c<strong>et</strong>te nouvelle modélisation.<br />
Nous discutons <strong>de</strong> l’impact <strong>de</strong>s facteurs <strong>de</strong> risque suivant les groupes d’assurés dans le cadre<br />
<strong>de</strong> la modélisation mélange, <strong>et</strong> effectuons <strong>de</strong>s comparaisons grâce aux prévisions <strong>de</strong>s décisions<br />
individuelles qui nous perm<strong>et</strong>tent <strong>de</strong> reconstruire le taux <strong>de</strong> rachat par date.<br />
Comparaison <strong>et</strong> discussion Les mauvais résultats <strong>de</strong> la modélisation par régression logistique<br />
dynamique simple sont très frappants (graphe 3.10). La cause <strong>de</strong> c<strong>et</strong>te “faillite” est<br />
l’environnement économique changeant qui est mal modélisé, pour preuve la valeur du coefficient<br />
<strong>de</strong> régression consacré à l’impact du taux 10Y qui est extrêmement faible (0,06). Cela<br />
signifie qu’une forte variation <strong>de</strong> ce taux n’a que peu d’impact sur la probabilité finale <strong>de</strong> décision<br />
individuelle <strong>de</strong> rachat, ce qui est évi<strong>de</strong>mment très discutable. Nous constatons également<br />
que le modèle logistique dynamique modélise bien la périodicité.<br />
De par la flexibilité permise par les mélanges, les prévisions s’avèrent n<strong>et</strong>tement plus<br />
justes <strong>et</strong> précises aussi bien sur la pério<strong>de</strong> d’apprentissage que sur la pério<strong>de</strong> <strong>de</strong> validation<br />
(graphe 3.11). Ce changement se r<strong>et</strong>rouve notamment dans la valeur <strong>de</strong>s coefficients <strong>de</strong> régression<br />
correspondant au taux 10Y (entre 10 <strong>et</strong> 100 plus élevé suivant les <strong>composantes</strong>),<br />
traduisant un impact n<strong>et</strong>tement plus réaliste <strong>de</strong> c<strong>et</strong>te variable (voir figure C.6).<br />
Impact <strong>de</strong>s variables explicatives par les mélanges <strong>de</strong> Logit<br />
Nous partons du postulat que l’hétérogénéité provient <strong>de</strong> facteurs <strong>de</strong> risque qui peuvent<br />
avoir un eff<strong>et</strong> différent suivant les personnes. L’idée <strong>de</strong> base est donc que les eff<strong>et</strong>s structurels<br />
bien connus (ancienn<strong>et</strong>é <strong>de</strong> contrat, saisonnalité) sont censés avoir un impact homogène <strong>et</strong><br />
constant quels que soient les groupes d’assurés considérés, alors que les eff<strong>et</strong>s conjoncturels<br />
(environnement économique) jouent différemment suivant les assurés. La mise en oeuvre <strong>de</strong><br />
c<strong>et</strong>te idée requiert <strong>de</strong> spécifier une estimation i<strong>de</strong>ntique <strong>de</strong>s coefficients <strong>de</strong> régression correspondant<br />
aux eff<strong>et</strong>s structurels pour toutes les <strong>composantes</strong>, en perm<strong>et</strong>tant aux coefficients<br />
<strong>de</strong> régression dédiés aux eff<strong>et</strong>s conjoncturels <strong>de</strong> varier entre <strong>composantes</strong>. Les professionnels<br />
ont coutume <strong>de</strong> considérer un taux d’intérêt long terme pour les produits <strong>de</strong> pure épargne<br />
à ren<strong>de</strong>ment garanti, aussi nous avons pris le taux 10 ans (taux 10Y). C’est ainsi que nous<br />
obtenons après estimation du modèle les coefficients <strong>de</strong> régression donnés en annexe C.2.4.<br />
Détaillons maintenant les impacts respectifs <strong>de</strong>s facteurs <strong>de</strong> risque :<br />
87