23.12.2013 Views

Mélanges de GLMs et nombre de composantes : application ... - Scor

Mélanges de GLMs et nombre de composantes : application ... - Scor

Mélanges de GLMs et nombre de composantes : application ... - Scor

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Chapitre 2. Crises <strong>de</strong> corrélation <strong>de</strong>s comportements<br />

Figure 2.10 – Taux <strong>de</strong> rachat mensuel versus ∆r.<br />

plateau en Région 2). C’est évi<strong>de</strong>mment une première source d’erreur car ce choix est arbitraire,<br />

mais nous nous intéressons principalement à l’impact <strong>de</strong> la corrélation entre comportements<br />

ici. C’est la raison pour laquelle nous introduisons ce modèle comme exemple réel <strong>et</strong> illustratif,<br />

en gardant en tête que la prévision <strong>de</strong>s taux <strong>de</strong> rachat va au-<strong>de</strong>là <strong>de</strong>s objectifs <strong>de</strong> ce chapitre.<br />

Soit Y la variable aléatoire du taux <strong>de</strong> rachat. La moyenne empirique du taux <strong>de</strong> rachat en<br />

Région 1, notée Ỹn 1<br />

, vaut<br />

Ỹ n1 = 1 n 1<br />

∑ n1<br />

i=1 Y i,1, où n 1 est le <strong>nombre</strong> d’observations Y i,1 en Région 1.<br />

L’écart-type empirique, noté ˜σ n1 , est donné par l’estimateur non-biaisé usuel :<br />

√ 1 ∑<br />

˜σ n1 =<br />

n1<br />

i=1<br />

(n 1 − 1)<br />

(Y i,1 − Ỹn 1<br />

) 2 .<br />

Les <strong>application</strong>s numériques donnent comme résultats Ỹn 1<br />

= 6.73×10 −3 , <strong>et</strong> ˜σ n1 = 4.28×10 −3 .<br />

Ainsi le coefficient <strong>de</strong> variation, noté ˜ν n1 <strong>et</strong> défini par ˜ν n1 = ˜σ n 1<br />

Ỹ n1<br />

, vaut 63,5% en Région 1.<br />

C<strong>et</strong>te valeur reflète une forte surdispersion <strong>de</strong>s données.<br />

Ces statistiques sont clairement discutables car basées sur peu d’observations, mais la surdispersion<br />

provient principalement d’eff<strong>et</strong>s cohortes conjugués aux contraintes <strong>de</strong> pénalité. La<br />

dépendance calendaire peut aussi jouer un rôle.<br />

A cause du manque d’observation en Région 2, la <strong>de</strong>uxième hypothèse consiste à supposer<br />

le coefficient <strong>de</strong> variation constant quelle que soit la moyenne du taux <strong>de</strong> rachat. Cela nous<br />

perm<strong>et</strong> d’approcher l’écart-type <strong>de</strong> la Région 2, donné par ˜σ n2 = Ỹn 2<br />

Ỹ n1<br />

˜σ n1 ≃ 0.022. Encore<br />

une fois, ce choix est arbitraire mais il a l’avantage d’être relativement objectif.<br />

Nous simulons donc en Région 1 <strong>de</strong>s expériences <strong>de</strong> Bernoulli <strong>de</strong> paramètre p 1 égal à Ỹn 1<br />

,<br />

<strong>et</strong> vérifions que la distribution <strong>de</strong>s taux <strong>de</strong> rachat est proche d’une gaussienne dont la moyenne<br />

60

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!