23.12.2013 Views

Mélanges de GLMs et nombre de composantes : application ... - Scor

Mélanges de GLMs et nombre de composantes : application ... - Scor

Mélanges de GLMs et nombre de composantes : application ... - Scor

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

C.4. Famille <strong>de</strong> produits In<strong>de</strong>x-Link<br />

Figure C.17 – Profil 3D du taux <strong>de</strong> rachat par date <strong>et</strong> par ancienn<strong>et</strong>é <strong>de</strong> contrat, In<strong>de</strong>x-Link.<br />

Surren<strong>de</strong>r rate (in %) VS (date + duration), In<strong>de</strong>x−Link products (All)<br />

7<br />

6<br />

5<br />

z<br />

6<br />

4<br />

2<br />

0<br />

2007.07.01<br />

2007.04.01<br />

2007.01.01<br />

2006.10.01<br />

2006.07.01<br />

2006.04.01<br />

2006.01.01<br />

2005.10.01<br />

2005.07.01<br />

2005.04.01<br />

2005.01.01<br />

2004.10.01<br />

2004.07.01<br />

2004.04.01<br />

2004.01.01<br />

2003.10.01<br />

2003.07.01<br />

2003.04.01<br />

2003.01.01<br />

2002.10.01<br />

2002.07.01 dates<br />

2002.04.01<br />

2002.01.01<br />

2001.10.01<br />

2001.07.01<br />

2001.04.01<br />

2001.01.01<br />

2000.10.01<br />

2000.07.01<br />

2000.04.01<br />

5 2000.01.01<br />

10 1999.10.01<br />

15 1999.07.01<br />

20 1999.04.01<br />

25 1999.01.01<br />

30<br />

35<br />

4<br />

3<br />

2<br />

1<br />

duration<br />

0<br />

C.4.2<br />

Sélection <strong>de</strong>s variables : résultats par CART<br />

Taux d’erreur <strong>de</strong> classification <strong>de</strong> l’arbre Le classifieur par forêts aléatoires se trompe<br />

rarement dans la prévision <strong>de</strong>s rachats lorsque ceux-ci sont effectivement observés (erreur que<br />

nous cherchons à minimiser car la plus risquée pour nous), donnant une spécificité rassurante<br />

<strong>de</strong> 99 %. La sensibilité vaut ici 72 % <strong>et</strong> l’erreur globale <strong>de</strong> classification est égale à 3,6 %. Le<br />

classifieur est très précis sur l’étu<strong>de</strong> statique.<br />

Rachats non-observés<br />

Rachat observés<br />

Rachats non-prédits 6770 70<br />

Rachats prédits 204 526<br />

Importance <strong>de</strong>s variables explicatives Nous avons choisi c<strong>et</strong>te fois <strong>de</strong> montrer le classifieur<br />

sous forme d’arbre (figure C.18) <strong>de</strong> classification par la métho<strong>de</strong> échantillon témoinéchantillon<br />

<strong>de</strong> validation. Nous avons sensiblement le même classement que pour les produits<br />

en UC, avec une certaine importance <strong>de</strong> l’âge <strong>de</strong> souscription. L’intérêt <strong>de</strong> c<strong>et</strong>te représentation<br />

est la définition <strong>de</strong> seuils précis, utiles dans un processus <strong>de</strong> segmentation. Nous r<strong>et</strong>enons donc<br />

l’ancienn<strong>et</strong>é du contrat <strong>et</strong> l’âge <strong>de</strong> souscription.<br />

211

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!