Modèle logistique et scoring - Université Rennes 2
Modèle logistique et scoring - Université Rennes 2
Modèle logistique et scoring - Université Rennes 2
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
2.1 le modèle <strong>logistique</strong> 21<br />
Le modèle s’écrit donc :<br />
⎧<br />
⎨ 0.6931 si j = 1<br />
logit P(Y = 1|X = gj) = 0<br />
⎩<br />
0.6931 + 17.8729 = 18.566<br />
si j = 2<br />
si j = 3.<br />
ou encore<br />
Plusieurs facteurs<br />
⎧<br />
⎪⎨<br />
P(Y = 1|X = gj) =<br />
⎪⎩<br />
exp(0.6931)<br />
1+exp(0.6391)<br />
= 2/3 si j = 1<br />
1/2 si j = 2<br />
= 1.0000 si j = 3.<br />
exp(18.566)<br />
1+exp(18.566)<br />
On suppose ici que l’on a p facteurs X1,...,Xp à m1,...,mp niveaux. On notera gjk le k ème niveau<br />
du j ème facteur. Dans ce cas là pour une réalisation x = (g1k1,...,gpkp) de la variable X, on écrira<br />
comme modèle :<br />
logit (P(Y = 1|X = x)) = α0 + α1k1 + ... + αpkp.<br />
On remarquera qu’a priori un tel modèle nécessite l’estimation de p<br />
j=1 mj + 1 paramètres.<br />
Exemple Considérons le cas de deux facteurs F <strong>et</strong> H possédant respectivement m1 = 2 <strong>et</strong> m2 = 3<br />
facteurs. On dispose de 16 individus, les sorties R pour un modèle <strong>logistique</strong> sont données par :<br />
model1<br />
Call: glm(formula = Y ~ ., family = binomial, data = X)<br />
Coefficients:<br />
(Intercept) Fg2 Fg3 Hh2<br />
-0.7529 1.3225 2.1600 -0.4011<br />
Degrees of Freedom: 15 Total (i.e. Null); 12 Residual<br />
Null Deviance: 22.18<br />
Residual Deviance: 19.48 AIC: 27.48<br />
On peut alors résumer le modèle par le tableau suivant :<br />
g1 g2 g3<br />
h1 α0 α0 + Fg2 α0 + Fg3<br />
h2 α0 + Hh2 α0 + Fg2 + Hh2 α0 + Fg3 + Hh2<br />
Les probabilités prédites par ce modèle pour les nouveaux individus x1 = (g1,h1), x2 = (g2,h1),<br />
x3 = (g3,h2) sont<br />
P(Y = 1|X = x1) = exp(−0.7529)<br />
1 + exp(−0.7529)<br />
P(Y = 1|X = x2) =<br />
P(Y = 1|X = x3) =<br />
exp(−0.7529 + 1.3225)<br />
1 + exp(−0.7529 + 1.3225)<br />
= 0.3202<br />
exp(−0.7529 + 2.1600 − 0.4011)<br />
1 + exp(−0.7529 + 2.1600 − 0.4011)<br />
= 0.6387<br />
= 0.7322.<br />
Régression <strong>logistique</strong> <strong>et</strong> <strong>scoring</strong> Pierre-André Cornillon<br />
Laurent Rouvière