Mélanges de GLMs et nombre de composantes : application ... - Scor
Mélanges de GLMs et nombre de composantes : application ... - Scor
Mélanges de GLMs et nombre de composantes : application ... - Scor
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
C.4. Famille <strong>de</strong> produits In<strong>de</strong>x-Link<br />
Figure C.17 – Profil 3D du taux <strong>de</strong> rachat par date <strong>et</strong> par ancienn<strong>et</strong>é <strong>de</strong> contrat, In<strong>de</strong>x-Link.<br />
Surren<strong>de</strong>r rate (in %) VS (date + duration), In<strong>de</strong>x−Link products (All)<br />
7<br />
6<br />
5<br />
z<br />
6<br />
4<br />
2<br />
0<br />
2007.07.01<br />
2007.04.01<br />
2007.01.01<br />
2006.10.01<br />
2006.07.01<br />
2006.04.01<br />
2006.01.01<br />
2005.10.01<br />
2005.07.01<br />
2005.04.01<br />
2005.01.01<br />
2004.10.01<br />
2004.07.01<br />
2004.04.01<br />
2004.01.01<br />
2003.10.01<br />
2003.07.01<br />
2003.04.01<br />
2003.01.01<br />
2002.10.01<br />
2002.07.01 dates<br />
2002.04.01<br />
2002.01.01<br />
2001.10.01<br />
2001.07.01<br />
2001.04.01<br />
2001.01.01<br />
2000.10.01<br />
2000.07.01<br />
2000.04.01<br />
5 2000.01.01<br />
10 1999.10.01<br />
15 1999.07.01<br />
20 1999.04.01<br />
25 1999.01.01<br />
30<br />
35<br />
4<br />
3<br />
2<br />
1<br />
duration<br />
0<br />
C.4.2<br />
Sélection <strong>de</strong>s variables : résultats par CART<br />
Taux d’erreur <strong>de</strong> classification <strong>de</strong> l’arbre Le classifieur par forêts aléatoires se trompe<br />
rarement dans la prévision <strong>de</strong>s rachats lorsque ceux-ci sont effectivement observés (erreur que<br />
nous cherchons à minimiser car la plus risquée pour nous), donnant une spécificité rassurante<br />
<strong>de</strong> 99 %. La sensibilité vaut ici 72 % <strong>et</strong> l’erreur globale <strong>de</strong> classification est égale à 3,6 %. Le<br />
classifieur est très précis sur l’étu<strong>de</strong> statique.<br />
Rachats non-observés<br />
Rachat observés<br />
Rachats non-prédits 6770 70<br />
Rachats prédits 204 526<br />
Importance <strong>de</strong>s variables explicatives Nous avons choisi c<strong>et</strong>te fois <strong>de</strong> montrer le classifieur<br />
sous forme d’arbre (figure C.18) <strong>de</strong> classification par la métho<strong>de</strong> échantillon témoinéchantillon<br />
<strong>de</strong> validation. Nous avons sensiblement le même classement que pour les produits<br />
en UC, avec une certaine importance <strong>de</strong> l’âge <strong>de</strong> souscription. L’intérêt <strong>de</strong> c<strong>et</strong>te représentation<br />
est la définition <strong>de</strong> seuils précis, utiles dans un processus <strong>de</strong> segmentation. Nous r<strong>et</strong>enons donc<br />
l’ancienn<strong>et</strong>é du contrat <strong>et</strong> l’âge <strong>de</strong> souscription.<br />
211