03.07.2015 Views

Le mod`ele de régression multiple

Le mod`ele de régression multiple

Le mod`ele de régression multiple

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Comment faire en présence <strong>de</strong> multicolinéarité?<br />

Il n’y a pas <strong>de</strong> solution miracle! Quand cela est possible, il faut reformuler le<br />

modèle, une possibilité estbiensûr d’enlever une <strong>de</strong>s variables qui pose problème,<br />

mais attention, cela peut causer <strong>de</strong>s biais si cette variable est explicative.<br />

7.2 Spécification du modèle – Choix <strong>de</strong> variables explicatives<br />

Tout ce qu’on a fait précé<strong>de</strong>mment repose sur l’hypothèse que le bon modèle est<br />

connu et qu’il est donné par: y = Xβ + ε. Mais il se peut qu’on ait oublié <strong>de</strong>s<br />

variables explicatives ou qu’il y ait <strong>de</strong>s variables non pertinentes.<br />

a) Omission <strong>de</strong> variables pertinentes<br />

Supposons que le vrai modèle soit :<br />

y = X 1 β 1 + X 2 β 2 + ε<br />

mais que l’économètre a oublié X 2 et qu’il régresse seulement y sur X 1 ,ilobtient:<br />

ˆβ 1 =(X 1 ′ X 1) −1 X 1 ′ y = β 1 +(X 1 ′ X 1) −1 X 1 ′ X 2β 2 +(X 1 ′ X 1) −1 X 1 ′ ε<br />

En prenant l’espérance, on voit que l’estimateur est biaisé (sauf si X ′ 1 X 2 =0ou<br />

β 2 =0).<br />

La variance <strong>de</strong> l’estimateur est :<br />

var( ˆβ 1 )=σ 2 (X ′ 1 X 1) −1<br />

S’il avait fait la bonne régression en incluant X 2 ,lavariance<strong>de</strong>β 1 aurait été<br />

celle <strong>de</strong> l’élément en haut àgauche<strong>de</strong>lamatriceσ 2 (X ′ X) −1 ,soit:<br />

var( ˆβ 1,2 )=σ 2 (X ′ 1 M 2X 1 ) −1 = σ 2 [X ′ 1 X 1 − X ′ 1 X 2(X ′ 2 X 2) −1 X ′ 2 X 1] −1<br />

Pour comparer les <strong>de</strong>ux variances, il est plus pratique <strong>de</strong> prendre leur inverse :<br />

var( ˆβ 1 ) −1 − var( ˆβ 1,2 ) −1 =(1/σ 2 )X ′ 1 X 2(X ′ 2 X 2) −1 X ′ 2 X 1<br />

qui est non négative. Ainsi, même si ˆβ1 est biaisé, il a une variance plus faible<br />

(puisque la variance <strong>de</strong> l’inverse est plus gran<strong>de</strong>).<br />

On peut remarquer que l’estimateur <strong>de</strong> σ 2 sera biaisé aussi car :<br />

Donc<br />

ˆε 1 = M 1 y = M 1 (X 1 β 1 + X 2 β 2 + ε) =M 1 X 2 β 2 + M 1 ε<br />

E[ˆε ′ 1ˆε 1 ]=β ′ 2X ′ 2M 1 X 2 β 2 + σ 2 tr(M 1 )=β ′ 2X ′ 2M 1 X 2 β 2 + σ 2 (n − K 1 )<br />

Cetestimateurrestebiaisémême si X ′ 1X 2 =0(régresseur orthogonal qui permet<br />

<strong>de</strong> ne pas avoir un coefficient ˆβ 1 biaisé).<br />

Ainsi, oublier une variable explicative pertinente conduit à <strong>de</strong>s estimateurs biaisés<br />

pour les autres paramètres, et à <strong>de</strong>s variances estimées <strong>de</strong> ces paramètres<br />

erronées. Faut-il alors préférer mettre beaucoup <strong>de</strong> variables explicatives quitte à<br />

ce qu’elles ne soient pas pertinentes?<br />

46

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!