29.07.2013 Views

Modèle logistique et scoring - Université Rennes 2

Modèle logistique et scoring - Université Rennes 2

Modèle logistique et scoring - Université Rennes 2

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

1.2 Analyse discriminante de linéaire (au sens de Fisher ou LDA) 13<br />

En passant au log nous obtenons,<br />

ln<br />

|Σj ′|<br />

|Σj|<br />

1<br />

−<br />

2 x′ (Σ −1<br />

j − Σ−1<br />

j ′ )x + x ′ (Σ −1<br />

j µj − Σ −1<br />

j ′ 1<br />

µj ′) −<br />

2 (µ′ jΣ −1<br />

j µj − µ ′ j ′Σ−1 j ′ µj ′) = 0<br />

Si l’on développe c<strong>et</strong>te équation en remplaçant le vecteur x par ses coordonnées (x1,x2) nous<br />

obtenons une équation quadratique en x1 <strong>et</strong> x2 qui perm<strong>et</strong> de dire qu’une frontière sera de la forme<br />

d’une conique. C<strong>et</strong>te constatation donne son nom à la méthode dite de discrimination quadratique.<br />

Par contre lorsque Σ = Σj = Σj ′ nous avons alors<br />

x ′ Σ −1 1<br />

(µj − µj ′) −<br />

2 (µj + µj ′)′ Σ −1 (µj − µj ′) = 0<br />

Si l’on développe c<strong>et</strong>te équation en remplaçant le vecteur x par ses coordonnées (x1,x2) nous<br />

obtenons une équation d’une droite.<br />

Exemple (LDA dans R 2 pour 3 groupes, variables X non corrélées) Supposons que g =<br />

3 <strong>et</strong> que Σ = Σ1 = Σ2 = Σ3 = I2. Les observations suivent toutes des lois normales N(µj,I2), où<br />

µj est la moyenne du groupe. Les moyennes sont choisies égales à µ1 = (2, 2) ′ , µ2 = (−2, 2) ′ <strong>et</strong><br />

µ3 = (0, −2) ′ respectivement.<br />

La frontière entre le groupe 1 <strong>et</strong> le groupe 2 est donc l’ensemble des x ∈ R 2 tel que :<br />

P(Y = 1|X = x) = P(Y = 2|X = x)<br />

f(x|y = 1) = f(x|Y = 2)<br />

1<br />

(2π|Σ|) exp<br />

<br />

− 1<br />

2 (x − µ1) ′ Σ −1 <br />

1<br />

(x − µ1) =<br />

(2π|Σ|) exp<br />

<br />

− 1<br />

2 (x − µ2) ′ Σ −1 (x − µ ′ <br />

2)<br />

− 1<br />

2 (x − µ1) ′ (x − µ1) = − 1<br />

2 (x − µ2) ′ (x − µ ′ 2)<br />

− 1<br />

2 x′ x − x ′ µ1 − 1<br />

2 µ′ 1µ1 = − 1<br />

2 x′ x − x ′ µ2 − 1<br />

2 µ′ 2µ2<br />

x ′ (µ1 − µ2) − 1<br />

2 (µ1 + µ2) ′ (µ1 − µ2) = 0<br />

(x − 1<br />

2 (µ1 + µ2)) ′ (µ1 − µ2) = 0<br />

Soit M le point de coordonnée x, G1 le centre de gravité du groupe 1 de coordonnées µ1 <strong>et</strong> G2 celui<br />

du groupe 2 de coordonnées µ2. Soit G12 le milieu des deux points G1, G2. Il est de coordonnées<br />

1<br />

2 (µ1 + µ2). C<strong>et</strong>te dernière équation se lit alors<br />

< −−−→<br />

G12M, −−−→<br />

G2G1 >= 0,<br />

c’est à dire que les points M cherchés sont sur une droite passant par G12 <strong>et</strong> orthogonale à la droite<br />

portée par −−−→<br />

G2G1 c’est à dire la droite (G1G2).<br />

En faisant de même pour les 2 autres frontières nous pouvons obtenir les frontières théoriques de<br />

la méthode LDA. En général nous n’avons pas les valeurs de µj <strong>et</strong> Σ <strong>et</strong> on les remplace par leurs<br />

estimateurs, donnant des frontières empiriques légèrement différentes.<br />

Régression <strong>logistique</strong> <strong>et</strong> <strong>scoring</strong> Pierre-André Cornillon<br />

Laurent Rouvière

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!