Le mod`ele de rÃ©gression multiple

More documents

Recommendations

Info

Matrice de projection Bien entendu, on retrouve l’idée que la méthode d’estimation par MCO partitionne y en 2 parties orthogonales. On peut réinterpréter l’estimation effectuée comme la détermination de la projection orthogonale de y sur l’espace engendré par les X, etlasérie ajustée ŷ est alors orthogonale au résidu ˆε. Cette interprétation permet de retrouver directement la définition de l’estimateur des MCO. En effet, puisque ˆε est orthogonal à l’ensemble des X, ona: X ′ˆε =0⇔ X ′ (y − X ˆβ) =0⇔ X ′ y = X ′ X ˆβ A partir de la définition de l’estimateur MCO, on peut définir les matrices de projection : ˆε = y − X ˆβ = y − X(X ′ X) −1 X ′ y =[I − X(X ′ X) −1 X ′ ]y = M X y La matrice M X est fondamentale dans la théorie de la régression. Elle est symétrique (M X ′ = M X), idempotente (MX 2 = M X). Appliquée à y, elle donne les résidus de la régression de y sur X. Ainsi, M X X = 0 : quand X est régressé surX, le fit (ou ajustement) est parfait et le résidu est nul. On a ŷ = y − ˆε =[I − M X ]y = P X y La matrice P X telle que M X = I−P X ou P X = X(X ′ X) −1 X ′ est aussi symétrique et idempotente. C’est une matrice de projection. Appliquée à y, elle donne la série ajustée. On a alors P X X = X et P X M X = M X P X =0. La notion de corrélation partielle En utilisant les matrices de projection, on peut étudier les régressions partitionnées, afin de voir l’effet de l’ajout ou de l’oubli d’une variable dans la régression. Ceci nous permet d’étendre la notion de corrélation simple afin d’étudier le lien entre la variable à expliquer et UNE variable explicative prise séparément : dans les variations de y, qu’est-ce qui est du à la variation d’une variable explicative, l’autre étant maintenue constante. Il s’agit du coefficient de corrélation partielle : c’est la corrélation entre y et X 1 une fois qu’on a retiré l’effet des autres variables àlafois sur y et sur X 1 . Supposons que le modèle s’écrive : ( ) β1 y = X 1 β 1 + X 2 β 2 + ε =[X 1 X 2 ] + ε β 2 X 1 et X 2 pouvant être des matrices à plusieurs colonnes (contenant plusieurs variables). Les équations normales donnent : X 1X ′ 1 β 1 + X 1X ′ 2 β 2 = X 1y ′ X 2X ′ 1 β 1 + X 2X ′ 2 β 2 = X 2y ′ soit ˆβ 1 =(X ′ 1 X 1) −1 X ′ 1 (y − X 2β 2 ) 34
• Si X ′ 1X 2 =0,alors ˆβ 1 =(X ′ 1X 1 ) −1 X ′ 1X 1 ,résultat de la régression de y sur X 1 . Ainsi, si les deux variables sont orthogonales, le coefficient associé à X 1 est le même que celui de la régression de y uniquement sur X 1 . • Sinon, le coefficient estimé est celui de la régression de y − X 2 β 2 sur X 1 .Ainsi, il correspond à l’effet de y sur X 1 une fois qu’on a retiré l’effet de X 2 sur y. Voyons ce que donne ˆβ 2 : X ′ 2 X 1(X ′ 1 X 1) −1 X ′ 1 (y − X 2β 2 )+X ′ 2 X 2β 2 = X ′ 2 y soit Ainsi, (X ′ 2X 2 − X ′ 2X 1 (X ′ 1X 1 ) −1 X ′ 1X 2 )β 2 = X ′ 2y − X ′ 2X 1 (X ′ 1X 1 ) −1 X ′ 1y ˆβ 2 =(X ′ 2 M 1X 2 ) −1 X ′ 2 M 1y Il s’agit du coefficient de la régression de M 1 y sur M 1 X 2 , qui sont respectivement les résidus de la régression de y (et X 2 )surX 1 . C’est donc le coefficient de la régression de y sur X 2 une fois qu’on a retiré l’effet de X 1 sur chaque variable de la régression, c’est donc l’effet net de X 2 sur y. Ceci est le théorèmedeFrisch-Waugh:lecoefficientdeX 2 dans la régression de y sur X 1 et X 2 est aussi le coefficient de la régression des résidus de y sur X 1 sur les résidus de X 2 sur X 1 . Conséquences du théorème de Frisch-Waugh: Supposons que le vrai modèle soit tel que y est expliqué parX 1 et X 2 .Même si on ne s’intéresse qu’à l’influence des variables X 1 sur y, lethéorèmedeFrisch-Waugh implique qu’il faut quand mêmeprendreencomptelaprésence des X 2 dans la liste des variables explicatives de y. Sinon, l’estimateur sera biaisé, sauf si X 1 et X 2 sont orthogonales. Ceci permet de comprendre les bases du modèlederégression multiple. On a dit que quand on avait y = Xβ + ε, les autres déterminants de y que les X sont dans la perturbation. Mais afin de bien connaître l’influence des X sur y, ilfautqueles perturbations soient orthogonales au X. Ceci nous permet aussi de retrouver le concept de toute chose égale par ailleurs. Application : Etude de l’introduction d’une variable indicatrice Supposons que nous disposions d’observations temporelles pour estimer le modèle de régression multiple. Supposons que sur notre échantillon, nous avons une observation particulière ˜t, qui peut ne pas être représentative du phénomène que l’on cherche àmodéliser. Pour prendre en compte cette éventualité, on intègre dans le modèle une variable indicatrice (ou variable muette), d =1sit = ˜t et 0 sinon. Sous forme matricielle, le modèle s’écrit : y = Xβ + dα + ε Estimer ce modèle revient à estimer l’influence de X sur y en éliminant l’observation t = ˜t. Ainsi, introduire la variable d revient àconsidérer l’observation ˜t comme à 35
Page 1 and 2: Université Paris I - Panthéon Sor
Page 3 and 4: ventes des entreprises. Ceci néces
Page 5 and 6: Chapitre 1 : Quelques éléments de
Page 7 and 8: Ainsi, la loi de probabilité d’u
Page 9 and 10: n’est d’échelle prépondérant
Page 11 and 12: la fréquence d’apparition de Pil
Page 13 and 14: L’idée est que notre échantillo
Page 15 and 16: Cela permet de tester si la moyenne
Page 17 and 18: Pour préciser la démarche adopté
Page 19 and 20: sur le salaire perçu, ou l’effet
Page 21 and 22: se peut que, dans l’échantillon
Page 23 and 24: Les conditions du premier ordre, ap
Page 25 and 26: variables du modèle et leur unité
Page 27 and 28: Remarque : tout ceci repose sur le
Page 29 and 30: α qu’on se donne et la procédur
Page 31 and 32: Chapitre 3 : Le modèle de régress
Page 33: 2 L’estimation par MCO Le but de
Page 37 and 38: 4.2 Test de Fisher La statistique d
Page 39 and 40: 5 Variables indicatrices Une variab
Page 41 and 42: Prendre en compte des effets saison
Page 43 and 44: 6 D’autres tests Comme dans le ch
Page 45 and 46: appelé aussi problème d’identif
Page 47 and 48: ) Variables supplémentaires Suppos
Page 49 and 50: • La méthode forward : elle cons
Page 51 and 52: Elle suit une loi de Student sous H
Page 53 and 54: Même si les MCO ne sont pas biais
Page 55 and 56: 2.2 Correction de l’hétéroscéd
Page 57: d) Le h de Durbin en présence d’

Le mod`ele de rÃ©gression multiple

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?