Mélanges de GLMs et nombre de composantes : application ... - Scor
Mélanges de GLMs et nombre de composantes : application ... - Scor
Mélanges de GLMs et nombre de composantes : application ... - Scor
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
4.3. Extension aux mélanges <strong>de</strong> <strong>GLMs</strong><br />
Ces propriétés sont fondamentales pour la construction d’intervalles <strong>de</strong> confiance <strong>de</strong> nos estimateurs.<br />
Remarque 1 : l’hypothèse 5 induit que l’estimateur <strong>de</strong>s moindres carrés est i<strong>de</strong>ntique à l’estimateur<br />
par maximum <strong>de</strong> vraisemblance.<br />
Remarque 2 : c’est un abus <strong>de</strong> langage que <strong>de</strong> parler <strong>de</strong> relation linéaire entre Y <strong>et</strong> X. En fait<br />
c’est une relation affine du vecteur β qui nous intéresse. Voici quelques exemples <strong>de</strong> modèles<br />
<strong>de</strong> régression linéaire :<br />
– Y j = β 0 + β 1 ln x j + ɛ j ;<br />
– Y j = β 0 + β 1 x j + β 2 x 2 j + ɛ j ;<br />
– le modèle logistique présenté au chapitre 1 est un modèle linéaire.<br />
A titre <strong>de</strong> contre exemple, le modèle Y j = β 0 + exp(β 1 x j ) + ɛ j n’est pas linéaire...<br />
En regardant les hypothèses, nous pouvons d’ores <strong>et</strong> déjà remarquer que certaines d’entre<br />
elles sont fortes. Lorsque nous essayons d’estimer numériquement les paramètres, une colinéarité<br />
dans la matrice <strong>de</strong> schéma empêche l’inversibilité <strong>de</strong> celle-ci <strong>et</strong> ne perm<strong>et</strong> donc pas<br />
d’obtenir les résultats. Une solution consiste donc à enlever une à une les variables explicatives.<br />
D’autre part la variance entre individus est supposée constante : nous pouvons nous affranchir<br />
<strong>de</strong> c<strong>et</strong>te hypothèse par l’utilisation <strong>de</strong> certaines transformations (exemple : Box-Cox), mais ces<br />
transformations ne sont pas toujours satisfaisantes au vu <strong>de</strong>s données. Enfin, nous constatons<br />
que la principale limitation <strong>de</strong> la régression linéaire concerne le domaine <strong>de</strong> définition <strong>de</strong> la<br />
variable réponse. En eff<strong>et</strong>, le prédicteur est un réel, alors que parfois nous aimerions que notre<br />
réponse ait un domaine <strong>de</strong> définition différent, à ajuster suivant nos <strong>application</strong>s.<br />
Evolution vers les <strong>GLMs</strong><br />
Pour présenter <strong>de</strong> manière simple <strong>et</strong> claire les <strong>GLMs</strong>, il suffit <strong>de</strong> se rendre compte que ce<br />
type <strong>de</strong> modèles est caractérisé par trois entités :<br />
1. une entité aléatoire qui dicte la loi <strong>de</strong> l’erreur : Y j suit une distribution <strong>de</strong> la famille<br />
exponentielle F exp (θ j , φ j , a, b, c), avec paramètres θ j <strong>et</strong> φ j ; <strong>et</strong> fonctions a, b <strong>et</strong> c ;<br />
2. une entité déterministe qu’est le prédicteur, souvent noté η : η j = X j β ;<br />
3. une fonction <strong>de</strong> lien l, monotone, dérivable, <strong>et</strong> qui adm<strong>et</strong> une fonction réciproque notée<br />
l −1 . Elle lie la moyenne µ j <strong>de</strong> la réponse au prédicteur : l(E[Y j ]) = η j .<br />
En prenant l = Id <strong>et</strong> Y ∼ N (Xβ, σ 2 ), nous r<strong>et</strong>ombons ainsi sur le modèle linéaire classique.<br />
Cependant, il existe <strong>de</strong> multiples choix possibles pour la fonction <strong>de</strong> lien l ainsi que pour la<br />
loi <strong>de</strong> Y . Le tableau 4.1 résume ces choix <strong>et</strong> leur <strong>application</strong> principale dans le domaine <strong>de</strong><br />
l’assurance. Nous pouvons calculer la vraisemblance d’un modèle linéaire généralisé grâce à<br />
l’expression générale <strong>de</strong> la <strong>de</strong>nsité <strong>de</strong> la famille exponentielle. En eff<strong>et</strong>, si Y suit une loi <strong>de</strong> la<br />
famille exponentielle alors sa <strong>de</strong>nsité est donnée par :<br />
{ }<br />
yj θ − b(θ)<br />
f Y (y j ; θ, φ) = exp<br />
+ c(y j , φ) , (4.23)<br />
a(φ)<br />
où a(.), b(.) <strong>et</strong> c(.) sont <strong>de</strong>s fonctions spécifiques suivant le modèle considéré. La fonction a(φ)<br />
est <strong>de</strong> la forme φ ω<br />
, où ω correspond à un poids (une “exposition” dans le jargon assurantiel),<br />
très souvent constant égal à 1 (cas individuel). D’un point <strong>de</strong> vue vocabulaire, nous appelons :<br />
– lien canonique : tout lien qui perm<strong>et</strong> <strong>de</strong> vérifier θ j = µ j , où µ j = E[Y j ] ;<br />
149