23.12.2013 Views

Mélanges de GLMs et nombre de composantes : application ... - Scor

Mélanges de GLMs et nombre de composantes : application ... - Scor

Mélanges de GLMs et nombre de composantes : application ... - Scor

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

4.3. Extension aux mélanges <strong>de</strong> <strong>GLMs</strong><br />

Ces propriétés sont fondamentales pour la construction d’intervalles <strong>de</strong> confiance <strong>de</strong> nos estimateurs.<br />

Remarque 1 : l’hypothèse 5 induit que l’estimateur <strong>de</strong>s moindres carrés est i<strong>de</strong>ntique à l’estimateur<br />

par maximum <strong>de</strong> vraisemblance.<br />

Remarque 2 : c’est un abus <strong>de</strong> langage que <strong>de</strong> parler <strong>de</strong> relation linéaire entre Y <strong>et</strong> X. En fait<br />

c’est une relation affine du vecteur β qui nous intéresse. Voici quelques exemples <strong>de</strong> modèles<br />

<strong>de</strong> régression linéaire :<br />

– Y j = β 0 + β 1 ln x j + ɛ j ;<br />

– Y j = β 0 + β 1 x j + β 2 x 2 j + ɛ j ;<br />

– le modèle logistique présenté au chapitre 1 est un modèle linéaire.<br />

A titre <strong>de</strong> contre exemple, le modèle Y j = β 0 + exp(β 1 x j ) + ɛ j n’est pas linéaire...<br />

En regardant les hypothèses, nous pouvons d’ores <strong>et</strong> déjà remarquer que certaines d’entre<br />

elles sont fortes. Lorsque nous essayons d’estimer numériquement les paramètres, une colinéarité<br />

dans la matrice <strong>de</strong> schéma empêche l’inversibilité <strong>de</strong> celle-ci <strong>et</strong> ne perm<strong>et</strong> donc pas<br />

d’obtenir les résultats. Une solution consiste donc à enlever une à une les variables explicatives.<br />

D’autre part la variance entre individus est supposée constante : nous pouvons nous affranchir<br />

<strong>de</strong> c<strong>et</strong>te hypothèse par l’utilisation <strong>de</strong> certaines transformations (exemple : Box-Cox), mais ces<br />

transformations ne sont pas toujours satisfaisantes au vu <strong>de</strong>s données. Enfin, nous constatons<br />

que la principale limitation <strong>de</strong> la régression linéaire concerne le domaine <strong>de</strong> définition <strong>de</strong> la<br />

variable réponse. En eff<strong>et</strong>, le prédicteur est un réel, alors que parfois nous aimerions que notre<br />

réponse ait un domaine <strong>de</strong> définition différent, à ajuster suivant nos <strong>application</strong>s.<br />

Evolution vers les <strong>GLMs</strong><br />

Pour présenter <strong>de</strong> manière simple <strong>et</strong> claire les <strong>GLMs</strong>, il suffit <strong>de</strong> se rendre compte que ce<br />

type <strong>de</strong> modèles est caractérisé par trois entités :<br />

1. une entité aléatoire qui dicte la loi <strong>de</strong> l’erreur : Y j suit une distribution <strong>de</strong> la famille<br />

exponentielle F exp (θ j , φ j , a, b, c), avec paramètres θ j <strong>et</strong> φ j ; <strong>et</strong> fonctions a, b <strong>et</strong> c ;<br />

2. une entité déterministe qu’est le prédicteur, souvent noté η : η j = X j β ;<br />

3. une fonction <strong>de</strong> lien l, monotone, dérivable, <strong>et</strong> qui adm<strong>et</strong> une fonction réciproque notée<br />

l −1 . Elle lie la moyenne µ j <strong>de</strong> la réponse au prédicteur : l(E[Y j ]) = η j .<br />

En prenant l = Id <strong>et</strong> Y ∼ N (Xβ, σ 2 ), nous r<strong>et</strong>ombons ainsi sur le modèle linéaire classique.<br />

Cependant, il existe <strong>de</strong> multiples choix possibles pour la fonction <strong>de</strong> lien l ainsi que pour la<br />

loi <strong>de</strong> Y . Le tableau 4.1 résume ces choix <strong>et</strong> leur <strong>application</strong> principale dans le domaine <strong>de</strong><br />

l’assurance. Nous pouvons calculer la vraisemblance d’un modèle linéaire généralisé grâce à<br />

l’expression générale <strong>de</strong> la <strong>de</strong>nsité <strong>de</strong> la famille exponentielle. En eff<strong>et</strong>, si Y suit une loi <strong>de</strong> la<br />

famille exponentielle alors sa <strong>de</strong>nsité est donnée par :<br />

{ }<br />

yj θ − b(θ)<br />

f Y (y j ; θ, φ) = exp<br />

+ c(y j , φ) , (4.23)<br />

a(φ)<br />

où a(.), b(.) <strong>et</strong> c(.) sont <strong>de</strong>s fonctions spécifiques suivant le modèle considéré. La fonction a(φ)<br />

est <strong>de</strong> la forme φ ω<br />

, où ω correspond à un poids (une “exposition” dans le jargon assurantiel),<br />

très souvent constant égal à 1 (cas individuel). D’un point <strong>de</strong> vue vocabulaire, nous appelons :<br />

– lien canonique : tout lien qui perm<strong>et</strong> <strong>de</strong> vérifier θ j = µ j , où µ j = E[Y j ] ;<br />

149

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!