Mélanges de GLMs et nombre de composantes : application ... - Scor

More documents

Recommendations

Info

Chapitre 3. Mélange de régressions logistiques 3.3 Extension au portefeuille Vie d’AXA L’intérêt de cette partie réside dans l’application pratique des théories développées dans les chapitres précédents, dans le but de valider la méthodologie adoptée dans la section antérieure. Le portefeuille d’Assurance-Vie épargne d’AXA Seguros est utilisé dans toute sa “largeur”, avec des résultats allant de produits de pur investissement à des produits alliant des composantes épargne à des garanties de prévoyance, en passant par des produits directement indexés sur les marchés financiers. Nous verrons que la modélisation proposée a un fort pouvoir d’adaptation et fournit des résultats très encourageants en termes de pouvoir prédictif, tout en conservant l’originalité de ne pas impliquer trop de facteurs explicatifs afin de ne pas trop complexifier le modèle. Chaque section de cette partie correspond à l’étude d’une famille de produit, avec toujours le même plan d’étude : une explication très succinte du type de contrat (car les produits sont agrégés), suivie des deux modélisations logistiques (mélange ou non) avec prévisions associées (l’analyse basée sur les statistiques descriptives, les résultats de la méthode CART qui permettent la sélection des facteurs de risque, et les tests se trouvent en annexe C pour ne pas trop alourdir ce chapitre). D’un point de vue granularité des données, il est nécessaire d’étudier les rachats par famille de produits au maximum (une agrégation encore plus grande n’aurait plus de sens) car les supports d’investissement et les options classiques varient d’une famille à l’autre, ce qui apporte des changements importants en termes de modélisation. Il va sans dire que l’idéal est d’affiner les études à l’échelle de lignes de produits, voire de produits. L’outil informatique que nous avons développé permet de choisir son niveau de granularité, mais nous préférions montrer que notre méthode fonctionne à une échelle d’agrégation importante (sachant qu’à l’échelle d’un produit, cette modélisation est souvent moins complexe car nous connaissons exactement toutes les clauses et options qui impactent le rachat ; il suffit alors de les inclure dans la modélisation). De plus, une étude par produit ne permettrait pas de modéliser les rachats globalement, car les corrélations entre produits seraient difficilement calibrables. Pour les résultats de la modélisation par mélange de régressions logistiques, nous avons choisi de commenter les effets des variables explicatives au vu des estimations des coefficients de régression sans pour autant afficher les “boxplots” correspondants pour des soucis de concision. Le lecteur intéressé pourra consulter les annexes C pour accéder à ces informations plus précises. Toute l’étude est basée sur un pas de temps trimestriel et sur une période de retour delta (durée sur laquelle l’assuré regarde la performance des indices avant la date de rachat) de un trimestre, ces options pouvant être ajustée dans notre outil (pas mensuel, trimestriel ou annuel et delta doit être un entier positif). 3.3.1 Les contrats de pure investissement (Ahorro) Les contrats “Ahorro” sont des contrats de pure épargne. Ils offrent un rendement différent suivant le produit considéré, mais tous sont des taux garantis (le risque de taux est donc porté par l’assureur). Nous pourrions comparer ces contrats à des contrats bancaires, avec la différence qu’ils offrent des avantages fiscaux et/ou des garanties supplémentaires. Les informations dont nous disposons pour ce type de contrats sont le numéro du produit, la date d’émission, la date de sortie et sa raison (si sortie il y a), l’option de participation aux bénéfices de l’entreprise (PB), la date de naissance de l’assuré, son sexe, sa richesse, la fréquence de la prime, la prime de risque et la prime d’épargne. Un aperçu des données formatées est disponible en annexe C.2.1. La période de données va de début 1999 à fin 2007 (certains contrats sont évi- 86
3.3. Extension au portefeuille Vie d’AXA demment souscrits avant 1999), mais la période d’étude s’étend du 1/1/2000 au 31/12/2007 car les rachats n’ont été répertoriés qu’à partir de début 2000. Modélisation et prévisions par mélange de GLM Pour toutes les applications suivantes, les mêmes variables explicatives sont considérées en input de la modélisation dynamique et de la modélisation par mélange. L’approche par mélange permet de prendre ces variables en compte de manière différente, mais il est primordial de garder à l’esprit que nous prenons exactement les mêmes informations en entrée des modèles afin de comparer ce qui est comparable. Cette remarque justifiera le fait que certains modèles mélange ne sont pas optimisés (en termes de variables considérées, de nombre de composantes car parfois certaines composantes se ressemblent fortement...). Dans une optique où la volonté de l’utilisateur est de trouver la meilleure solution de modélisation, cette optimisation est tout à fait réalisable dans des délais raisonnables. Le but est de comparer l’approche par mélange de régressions logistiques avec la régression logistique dynamique, et de voir s’il y a un apport conséquent de cette nouvelle modélisation. Nous discutons de l’impact des facteurs de risque suivant les groupes d’assurés dans le cadre de la modélisation mélange, et effectuons des comparaisons grâce aux prévisions des décisions individuelles qui nous permettent de reconstruire le taux de rachat par date. Comparaison et discussion Les mauvais résultats de la modélisation par régression logistique dynamique simple sont très frappants (graphe 3.10). La cause de cette “faillite” est l’environnement économique changeant qui est mal modélisé, pour preuve la valeur du coefficient de régression consacré à l’impact du taux 10Y qui est extrêmement faible (0,06). Cela signifie qu’une forte variation de ce taux n’a que peu d’impact sur la probabilité finale de décision individuelle de rachat, ce qui est évidemment très discutable. Nous constatons également que le modèle logistique dynamique modélise bien la périodicité. De par la flexibilité permise par les mélanges, les prévisions s’avèrent nettement plus justes et précises aussi bien sur la période d’apprentissage que sur la période de validation (graphe 3.11). Ce changement se retrouve notamment dans la valeur des coefficients de régression correspondant au taux 10Y (entre 10 et 100 plus élevé suivant les composantes), traduisant un impact nettement plus réaliste de cette variable (voir figure C.6). Impact des variables explicatives par les mélanges de Logit Nous partons du postulat que l’hétérogénéité provient de facteurs de risque qui peuvent avoir un effet différent suivant les personnes. L’idée de base est donc que les effets structurels bien connus (ancienneté de contrat, saisonnalité) sont censés avoir un impact homogène et constant quels que soient les groupes d’assurés considérés, alors que les effets conjoncturels (environnement économique) jouent différemment suivant les assurés. La mise en oeuvre de cette idée requiert de spécifier une estimation identique des coefficients de régression correspondant aux effets structurels pour toutes les composantes, en permettant aux coefficients de régression dédiés aux effets conjoncturels de varier entre composantes. Les professionnels ont coutume de considérer un taux d’intérêt long terme pour les produits de pure épargne à rendement garanti, aussi nous avons pris le taux 10 ans (taux 10Y). C’est ainsi que nous obtenons après estimation du modèle les coefficients de régression donnés en annexe C.2.4. Détaillons maintenant les impacts respectifs des facteurs de risque : 87
Page 1:
I.S.F.A. École Doctorale Sciences
Page 5:
If you want to be happy... ... for
Page 9 and 10:
Table des matières Remerciements R
Page 11 and 12:
Conclusion et annexes Conclusion et
Page 13:
Introduction générale 1
Page 16 and 17:
Présentation de la thèse personne
Page 18 and 19:
Présentation de la thèse Les assu
Page 20 and 21:
Présentation de la thèse maux, et
Page 22 and 23:
Présentation de la thèse Figure 1
Page 24 and 25:
Présentation de la thèse visible
Page 26 and 27:
Présentation de la thèse Proposit
Page 28 and 29:
Présentation de la thèse { } avec
Page 30 and 31:
Présentation de la thèse Bibliogr
Page 32 and 33:
Présentation de la thèse Torsten,
Page 35 and 36:
Chapitre 1 Segmentation du risque d
Page 37 and 38:
1.1. Modélisation CART Constructio
Page 39 and 40:
1.1. Modélisation CART nous entend
Page 41 and 42:
1.2. Segmentation par modèle logis
Page 43 and 44:
1.2. Segmentation par modèle logis
Page 45 and 46:
1.3. Illustration : application sur
Page 47 and 48: 1.3. Illustration : application sur
Page 53 and 54: 1.4. Conclusion Enfin cette analyse
Page 55 and 56: BIBLIOGRAPHIE Ruiz-Gazen, A. and Vi
Page 57 and 58: Chapitre 2 Crises de corrélation d
Page 59 and 60: 2.1. Problème de la régression lo
Page 61 and 62: 2.2. Impact de crises de corrélati
Page 71 and 72: 2.3. Application sur un portefeuill
Page 73 and 74: 2.3. Application sur un portefeuill
Page 75 and 76: 2.4. Ecart entre hypothéses standa
Page 77 and 78: 2.5. Conclusion encore considérer
Page 79: Deuxième partie Vers la création
Page 82 and 83: Chapitre 3. Mélange de régression
Page 116 and 117: Chapitre 4. Sélection de mélange
Page 148 and 149:
Chapitre 4. Sélection de mélange
Page 150 and 151:
Page 152 and 153:
Page 154 and 155:
Page 156 and 157:
Page 158 and 159:
Page 160 and 161:
Page 162 and 163:
Page 164 and 165:
Page 166 and 167:
Page 168 and 169:
Page 170 and 171:
Page 172 and 173:
Page 174 and 175:
Page 176 and 177:
Page 178 and 179:
Page 180 and 181:
Page 182 and 183:
Page 184 and 185:
Page 186 and 187:
Page 189 and 190:
Conclusion et perspectives Cette é
Page 191 and 192:
BIBLIOGRAPHIE Bibliographie Akaike,
Page 193 and 194:
BIBLIOGRAPHIE Doob, J. (1934), ‘P
Page 195 and 196:
BIBLIOGRAPHIE Loisel, S. (2008),
Page 197 and 198:
BIBLIOGRAPHIE Schlattmann, P. (2003
Page 199 and 200:
Annexe A Articles de presse Figure
Page 201 and 202:
Annexe B Méthodes de segmentation
Page 203 and 204:
B.1.3 Plus loin dans la théorie de
Page 205 and 206:
B.1. Méthode CART Pénalisation de
Page 207 and 208:
B.2. La régression logistique Algo
Page 209 and 210:
B.2. La régression logistique et e
Page 211 and 212:
Annexe C Résultats des mélanges d
Page 213 and 214:
C.2. Famille de produits Ahorro Fig
Page 215 and 216:
C.2. Famille de produits Ahorro C.2
Page 217 and 218:
C.3. Famille de produits Unit-Link
Page 219 and 220:
C.3. Famille de produits Unit-Link
Page 221 and 222:
C.4. Famille de produits Index-Link
Page 223 and 224:
C.4. Famille de produits Index-Link
Page 225 and 226:
C.5. Famille de produits Universal
Page 227 and 228:
C.5. Famille de produits Universal
Page 229 and 230:
C.6. Famille de produits Pure Savin
Page 231 and 232:
C.6. Famille de produits Pure Savin
Page 233 and 234:
C.7. Famille de produits “Structu
Page 235 and 236:
C.7. Famille de produits “Structu
Page 237 and 238:
Annexe D Espace des paramètres des
Page 239 and 240:
D.1. Mélange de régressions liné
Page 241 and 242:
D.3 Mélange de régressions logist
Page 243 and 244:
Calcul de la limite : lim log L cc(
Page 245 and 246:
D.5. Mélange d’Inverses Gaussien
Page 247 and 248:
Annexe E Outil informatique - RExce
Page 249 and 250:
Figure E.2 - Exemple d’interface
Page 251 and 252:
Figure E.4 - Génération des résu
Page 253 and 254:
Figure E.6 - Exposition des résult
show all

Mélanges de GLMs et nombre de composantes : application ... - Scor

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?