29.07.2013 Views

Modèle logistique et scoring - Université Rennes 2

Modèle logistique et scoring - Université Rennes 2

Modèle logistique et scoring - Université Rennes 2

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

2.1 le modèle <strong>logistique</strong> 21<br />

Le modèle s’écrit donc :<br />

⎧<br />

⎨ 0.6931 si j = 1<br />

logit P(Y = 1|X = gj) = 0<br />

⎩<br />

0.6931 + 17.8729 = 18.566<br />

si j = 2<br />

si j = 3.<br />

ou encore<br />

Plusieurs facteurs<br />

⎧<br />

⎪⎨<br />

P(Y = 1|X = gj) =<br />

⎪⎩<br />

exp(0.6931)<br />

1+exp(0.6391)<br />

= 2/3 si j = 1<br />

1/2 si j = 2<br />

= 1.0000 si j = 3.<br />

exp(18.566)<br />

1+exp(18.566)<br />

On suppose ici que l’on a p facteurs X1,...,Xp à m1,...,mp niveaux. On notera gjk le k ème niveau<br />

du j ème facteur. Dans ce cas là pour une réalisation x = (g1k1,...,gpkp) de la variable X, on écrira<br />

comme modèle :<br />

logit (P(Y = 1|X = x)) = α0 + α1k1 + ... + αpkp.<br />

On remarquera qu’a priori un tel modèle nécessite l’estimation de p<br />

j=1 mj + 1 paramètres.<br />

Exemple Considérons le cas de deux facteurs F <strong>et</strong> H possédant respectivement m1 = 2 <strong>et</strong> m2 = 3<br />

facteurs. On dispose de 16 individus, les sorties R pour un modèle <strong>logistique</strong> sont données par :<br />

model1<br />

Call: glm(formula = Y ~ ., family = binomial, data = X)<br />

Coefficients:<br />

(Intercept) Fg2 Fg3 Hh2<br />

-0.7529 1.3225 2.1600 -0.4011<br />

Degrees of Freedom: 15 Total (i.e. Null); 12 Residual<br />

Null Deviance: 22.18<br />

Residual Deviance: 19.48 AIC: 27.48<br />

On peut alors résumer le modèle par le tableau suivant :<br />

g1 g2 g3<br />

h1 α0 α0 + Fg2 α0 + Fg3<br />

h2 α0 + Hh2 α0 + Fg2 + Hh2 α0 + Fg3 + Hh2<br />

Les probabilités prédites par ce modèle pour les nouveaux individus x1 = (g1,h1), x2 = (g2,h1),<br />

x3 = (g3,h2) sont<br />

P(Y = 1|X = x1) = exp(−0.7529)<br />

1 + exp(−0.7529)<br />

P(Y = 1|X = x2) =<br />

P(Y = 1|X = x3) =<br />

exp(−0.7529 + 1.3225)<br />

1 + exp(−0.7529 + 1.3225)<br />

= 0.3202<br />

exp(−0.7529 + 2.1600 − 0.4011)<br />

1 + exp(−0.7529 + 2.1600 − 0.4011)<br />

= 0.6387<br />

= 0.7322.<br />

Régression <strong>logistique</strong> <strong>et</strong> <strong>scoring</strong> Pierre-André Cornillon<br />

Laurent Rouvière

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!