23.12.2013 Views

Mélanges de GLMs et nombre de composantes : application ... - Scor

Mélanges de GLMs et nombre de composantes : application ... - Scor

Mélanges de GLMs et nombre de composantes : application ... - Scor

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Chapitre 3<br />

Mélange <strong>de</strong> régressions logistiques<br />

Ce chapitre correspond à l’article “Exogenous and endogenous risk factors<br />

management to predict surren<strong>de</strong>r behaviours” (X. Milhaud), actuellement soumis<br />

pour publication.<br />

Nous avons mis en évi<strong>de</strong>nce toute la difficulté d’étudier <strong>et</strong> <strong>de</strong> modéliser le risque <strong>de</strong> rachat,<br />

notamment car c’est un risque <strong>de</strong> comportement humain qui dépend <strong>de</strong> <strong>nombre</strong>ux facteurs :<br />

les caractéristiques individuelles, les désirs <strong>et</strong> besoins personnels, les options du contrat, son<br />

ancienn<strong>et</strong>é, le contexte économique <strong>et</strong> financier, les aspects socio-culturels (ex : comparaison<br />

expérience Japon / Etats-Unis), mais aussi les décisions du régulateur.<br />

Les <strong>de</strong>ux chapitres précé<strong>de</strong>nts nous ont permis <strong>de</strong> pointer du doigt les trois problématiques<br />

majeures : la dimension <strong>de</strong>s données, les problèmes <strong>de</strong> corrélation entre comportements <strong>et</strong><br />

l’hétérogénéité <strong>de</strong>s décisions face à un environnement évolutif. Les rachats s’expliquent à la<br />

fois par <strong>de</strong>s caractéristiques idiosynchratiques mais aussi par un ensemble <strong>de</strong> facteurs exogènes<br />

dont certains sont très difficilement quantifiables (réputation), voire inaccessible (politique <strong>de</strong><br />

vente future). Une méthodologie quant à la réduction <strong>de</strong> la dimension <strong>de</strong>s données se détache<br />

par l’utilisation <strong>de</strong>s algorithmes CART qui ont l’avantage <strong>de</strong> ne pas supposer d’hypothèses<br />

fortes sous-jacentes aux données (relation linéaire, log-linéaire,...), <strong>et</strong> qui ont démontré leur<br />

robustesse. Les quelques variables sélectionnées (nous nous limitons à <strong>de</strong>ux ou trois variables<br />

en général car un modèle surdimensionné donne souvent <strong>de</strong> mauvaises prévisions) présentant<br />

le plus fort impact sur l’événement <strong>de</strong> rachat seront ensuite introduites dans <strong>de</strong>s modèles<br />

dynamiques. Nous avons également compris que l’association <strong>de</strong> facteurs exogènes <strong>et</strong> endogènes<br />

dans une même <strong>et</strong> unique équation <strong>de</strong> régression ne perm<strong>et</strong> pas <strong>de</strong> capter les bons eff<strong>et</strong>s, le<br />

défi étant donc <strong>de</strong> trouver une manière fonctionnelle <strong>de</strong> considérer ces eff<strong>et</strong>s différemment. Ce<br />

chapitre propose donc une extension <strong>de</strong>s premières modélisations évoquées, en associant les<br />

idées que nous avons développé jusqu’à présent pour parvenir à nos fins.<br />

Les modèles mélange sont une technique populaire pour prendre en compte l’hétérogénéité<br />

non-observable <strong>de</strong> données, ou pour approximer une distribution générale <strong>de</strong> manière semiparamétrique.<br />

Ils sont utilisés dans <strong>de</strong> <strong>nombre</strong>ux domaines d’<strong>application</strong> tels que l’économie,<br />

l’astronomie, la biologie, la mé<strong>de</strong>cine. Historiquement, les mélanges ont été introduit pour la<br />

première fois il y a plus <strong>de</strong> cent ans par Pearson (1894). Karl Pearson utilise un mélange<br />

<strong>de</strong> lois normales dans le cadre <strong>de</strong> la modélisation <strong>de</strong> la longueur du corps <strong>de</strong>s crabes. La<br />

modélisation <strong>de</strong> données asymétriques est aussi réalisable via <strong>de</strong>s transformations <strong>de</strong> données,<br />

notamment la transformation en log (Box and Cox (1964)). Il est souvent difficile <strong>de</strong> faire<br />

un distinguo entre <strong>de</strong>s données présentant une certaine asymétrie <strong>et</strong> <strong>de</strong>s données provenant<br />

69

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!