Le mod`ele de régression multiple
Le mod`ele de régression multiple
Le mod`ele de régression multiple
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Comment faire en présence <strong>de</strong> multicolinéarité?<br />
Il n’y a pas <strong>de</strong> solution miracle! Quand cela est possible, il faut reformuler le<br />
modèle, une possibilité estbiensûr d’enlever une <strong>de</strong>s variables qui pose problème,<br />
mais attention, cela peut causer <strong>de</strong>s biais si cette variable est explicative.<br />
7.2 Spécification du modèle – Choix <strong>de</strong> variables explicatives<br />
Tout ce qu’on a fait précé<strong>de</strong>mment repose sur l’hypothèse que le bon modèle est<br />
connu et qu’il est donné par: y = Xβ + ε. Mais il se peut qu’on ait oublié <strong>de</strong>s<br />
variables explicatives ou qu’il y ait <strong>de</strong>s variables non pertinentes.<br />
a) Omission <strong>de</strong> variables pertinentes<br />
Supposons que le vrai modèle soit :<br />
y = X 1 β 1 + X 2 β 2 + ε<br />
mais que l’économètre a oublié X 2 et qu’il régresse seulement y sur X 1 ,ilobtient:<br />
ˆβ 1 =(X 1 ′ X 1) −1 X 1 ′ y = β 1 +(X 1 ′ X 1) −1 X 1 ′ X 2β 2 +(X 1 ′ X 1) −1 X 1 ′ ε<br />
En prenant l’espérance, on voit que l’estimateur est biaisé (sauf si X ′ 1 X 2 =0ou<br />
β 2 =0).<br />
La variance <strong>de</strong> l’estimateur est :<br />
var( ˆβ 1 )=σ 2 (X ′ 1 X 1) −1<br />
S’il avait fait la bonne régression en incluant X 2 ,lavariance<strong>de</strong>β 1 aurait été<br />
celle <strong>de</strong> l’élément en haut àgauche<strong>de</strong>lamatriceσ 2 (X ′ X) −1 ,soit:<br />
var( ˆβ 1,2 )=σ 2 (X ′ 1 M 2X 1 ) −1 = σ 2 [X ′ 1 X 1 − X ′ 1 X 2(X ′ 2 X 2) −1 X ′ 2 X 1] −1<br />
Pour comparer les <strong>de</strong>ux variances, il est plus pratique <strong>de</strong> prendre leur inverse :<br />
var( ˆβ 1 ) −1 − var( ˆβ 1,2 ) −1 =(1/σ 2 )X ′ 1 X 2(X ′ 2 X 2) −1 X ′ 2 X 1<br />
qui est non négative. Ainsi, même si ˆβ1 est biaisé, il a une variance plus faible<br />
(puisque la variance <strong>de</strong> l’inverse est plus gran<strong>de</strong>).<br />
On peut remarquer que l’estimateur <strong>de</strong> σ 2 sera biaisé aussi car :<br />
Donc<br />
ˆε 1 = M 1 y = M 1 (X 1 β 1 + X 2 β 2 + ε) =M 1 X 2 β 2 + M 1 ε<br />
E[ˆε ′ 1ˆε 1 ]=β ′ 2X ′ 2M 1 X 2 β 2 + σ 2 tr(M 1 )=β ′ 2X ′ 2M 1 X 2 β 2 + σ 2 (n − K 1 )<br />
Cetestimateurrestebiaisémême si X ′ 1X 2 =0(régresseur orthogonal qui permet<br />
<strong>de</strong> ne pas avoir un coefficient ˆβ 1 biaisé).<br />
Ainsi, oublier une variable explicative pertinente conduit à <strong>de</strong>s estimateurs biaisés<br />
pour les autres paramètres, et à <strong>de</strong>s variances estimées <strong>de</strong> ces paramètres<br />
erronées. Faut-il alors préférer mettre beaucoup <strong>de</strong> variables explicatives quitte à<br />
ce qu’elles ne soient pas pertinentes?<br />
46