Mélanges de GLMs et nombre de composantes : application ... - Scor
Mélanges de GLMs et nombre de composantes : application ... - Scor
Mélanges de GLMs et nombre de composantes : application ... - Scor
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Chapitre 3<br />
Mélange <strong>de</strong> régressions logistiques<br />
Ce chapitre correspond à l’article “Exogenous and endogenous risk factors<br />
management to predict surren<strong>de</strong>r behaviours” (X. Milhaud), actuellement soumis<br />
pour publication.<br />
Nous avons mis en évi<strong>de</strong>nce toute la difficulté d’étudier <strong>et</strong> <strong>de</strong> modéliser le risque <strong>de</strong> rachat,<br />
notamment car c’est un risque <strong>de</strong> comportement humain qui dépend <strong>de</strong> <strong>nombre</strong>ux facteurs :<br />
les caractéristiques individuelles, les désirs <strong>et</strong> besoins personnels, les options du contrat, son<br />
ancienn<strong>et</strong>é, le contexte économique <strong>et</strong> financier, les aspects socio-culturels (ex : comparaison<br />
expérience Japon / Etats-Unis), mais aussi les décisions du régulateur.<br />
Les <strong>de</strong>ux chapitres précé<strong>de</strong>nts nous ont permis <strong>de</strong> pointer du doigt les trois problématiques<br />
majeures : la dimension <strong>de</strong>s données, les problèmes <strong>de</strong> corrélation entre comportements <strong>et</strong><br />
l’hétérogénéité <strong>de</strong>s décisions face à un environnement évolutif. Les rachats s’expliquent à la<br />
fois par <strong>de</strong>s caractéristiques idiosynchratiques mais aussi par un ensemble <strong>de</strong> facteurs exogènes<br />
dont certains sont très difficilement quantifiables (réputation), voire inaccessible (politique <strong>de</strong><br />
vente future). Une méthodologie quant à la réduction <strong>de</strong> la dimension <strong>de</strong>s données se détache<br />
par l’utilisation <strong>de</strong>s algorithmes CART qui ont l’avantage <strong>de</strong> ne pas supposer d’hypothèses<br />
fortes sous-jacentes aux données (relation linéaire, log-linéaire,...), <strong>et</strong> qui ont démontré leur<br />
robustesse. Les quelques variables sélectionnées (nous nous limitons à <strong>de</strong>ux ou trois variables<br />
en général car un modèle surdimensionné donne souvent <strong>de</strong> mauvaises prévisions) présentant<br />
le plus fort impact sur l’événement <strong>de</strong> rachat seront ensuite introduites dans <strong>de</strong>s modèles<br />
dynamiques. Nous avons également compris que l’association <strong>de</strong> facteurs exogènes <strong>et</strong> endogènes<br />
dans une même <strong>et</strong> unique équation <strong>de</strong> régression ne perm<strong>et</strong> pas <strong>de</strong> capter les bons eff<strong>et</strong>s, le<br />
défi étant donc <strong>de</strong> trouver une manière fonctionnelle <strong>de</strong> considérer ces eff<strong>et</strong>s différemment. Ce<br />
chapitre propose donc une extension <strong>de</strong>s premières modélisations évoquées, en associant les<br />
idées que nous avons développé jusqu’à présent pour parvenir à nos fins.<br />
Les modèles mélange sont une technique populaire pour prendre en compte l’hétérogénéité<br />
non-observable <strong>de</strong> données, ou pour approximer une distribution générale <strong>de</strong> manière semiparamétrique.<br />
Ils sont utilisés dans <strong>de</strong> <strong>nombre</strong>ux domaines d’<strong>application</strong> tels que l’économie,<br />
l’astronomie, la biologie, la mé<strong>de</strong>cine. Historiquement, les mélanges ont été introduit pour la<br />
première fois il y a plus <strong>de</strong> cent ans par Pearson (1894). Karl Pearson utilise un mélange<br />
<strong>de</strong> lois normales dans le cadre <strong>de</strong> la modélisation <strong>de</strong> la longueur du corps <strong>de</strong>s crabes. La<br />
modélisation <strong>de</strong> données asymétriques est aussi réalisable via <strong>de</strong>s transformations <strong>de</strong> données,<br />
notamment la transformation en log (Box and Cox (1964)). Il est souvent difficile <strong>de</strong> faire<br />
un distinguo entre <strong>de</strong>s données présentant une certaine asymétrie <strong>et</strong> <strong>de</strong>s données provenant<br />
69