Le mod`ele de rÃ©gression multiple

More documents

Recommendations

Info

ˆb ∼N(b, var(ˆb)) =⇒ ˆb − b √ ∼N(0, 1) var(ˆb) On remarque que les variances des coefficients estimés varient directement avec var(u i )=σ 2 . Ainsi, on pourra obtenir des estimateurs d’autant plus efficaces que cette variance est faible. De plus, les variances des estimateurs varient inversement avec var(x i ). Ainsi, plus les x i sont dispersés et plus on peut avoir des estimateurs précis. En effet, si les variables x i varient très peu, on aura du mal à obtenir de bons estimateurs de la droite de régression puisque toutes les observations seront concentrées. On a vu que la variance des estimateurs dépend de σ 2 qui est inconnue. Il faut alors trouver un estimateur de σ 2 . On montre que : 1 n − 2 est un estimateur sans biais de la variance σ 2 .Onan − 2etnonpasn pour définir la variance estimée des résidus car pour estimer les résidus û i ,onadûestimer2 paramètres, àsavoirâ et ˆb. Ainsi, la variance estimée par maximum de vraisemblance devient valide quand le nombre d’observations n est élevé. Puisque σ 2 doit être estimée, alors les paramètres estimés suivent une loi de student et non plus une loi normale (voir chapitre 1) : ∑ i û 2 i â − a √ ∼St n−2 var(â) ˆ ˆb − b √ var(ˆb) ˆ ∼St n−2 On se servira de ce résultat pour faire des tests sur les paramètres a et b. 3 Décomposition de la variance et qualité dela régression L’idée est de savoir quelle est la part de la variation de y qui est expliquée par les variations de x. Pour cela, décomposons la variance de y i . Puisque y i =ŷ i +û i ,en retranchant ȳ (qui est égal à ¯ŷ) des2cotés, on obtient: y i − ȳ =ŷ i − ¯ŷ +û i Or, comme ŷ i et û i sont orthogonaux, alors la variation totale à expliquer, ou Somme des Carrés Totale SCT = ∑ (y i − ȳ) 2 ,peutsedécomposer en Somme des Carrés Expliquée (par le modèle, ou plus précisément par la variable x) SCE = ∑ (ŷ i − ȳ) 2 et en Somme des Carrés des Résidus (partie que le modèle n’explique pas) SCR = ∑ û2 i . On a alors l’équation d’analyse de la variance suivante : SCT = SCE + SCR 26
Remarque : tout ceci repose sur le fait que les résidus estimés sont centrés, et donc qu’il y a une constante dans le modèle et que la méthode d’estimation est les MCO. On définit alors le coefficient de détermination, qui mesure la part de la variance expliquée par le modèle dans la variance totale : R 2 = SCE SCT =1− SCR SCT Il est compris entre 0 et 1. Plus il est proche de 1 et plus la régression permet d’expliquer une grande partie de la variance totale de la variable à expliquer. Remarque : on peut montrer que ce coefficient de détermination R 2 est égal au coefficient de corrélation entre y et x, r xy = cov(y, x)/σ x σ y , dans le cadre du modèle de régression simple (une seule variable explicative) : R 2 = ∑i (ŷ i − ȳ) ∑ 2 i (y i − ȳ) = ˆb ∑ 2 i (x i − ¯x) ∑ 2 2 i (y = Cov(x i,y i ) 2 i − ȳ) 2 var(x i )var(y i ) = r2 xy Attention, le jugement sur la valeur de R 2 est très subjectif. Bien que ce coefficient soit très facile à comprendre, il faut se garder d’y attacher trop d’importance car il est loin de fournir un critère suffisant pour juger de la qualité d’une régression. • En effet, la valeur de ce critère est aisément manipulable, par exemple elle dépend de la forme sous laquelle on a introduit les variables (en log ou en taux de croissance). On peut donc facilement l’améliorer ou le détériorer en modifiant la forme fonctionnelle dans laquelle la variable y est spécifiée (niveau, log, ratio, taux de croissance). Exemple de limite de R 2 : Si au lieu d’estimer y i = a + bx i + u i ,onestime z i = α + βx i + w i avec z i = y i − x i et β = b − 1, on obtiendra un R 2 supérieur avec le second modèle si b ||û 2 || 2 et donc le R 2 du premier modèle est plus petit que le R 2 du second modèle, de manière purement mécanique, indépendamment de la pertinence de la variable w (dès que son coefficient est non nul). Ainsi, on préfère un coefficient de détermination ajusté par le nombre de variables explicatives, noté ¯R 2 . Cf. chapitre suivant. 27
Page 1 and 2: Université Paris I - Panthéon Sor
Page 3 and 4: ventes des entreprises. Ceci néces
Page 5 and 6: Chapitre 1 : Quelques éléments de
Page 7 and 8: Ainsi, la loi de probabilité d’u
Page 9 and 10: n’est d’échelle prépondérant
Page 11 and 12: la fréquence d’apparition de Pil
Page 13 and 14: L’idée est que notre échantillo
Page 15 and 16: Cela permet de tester si la moyenne
Page 17 and 18: Pour préciser la démarche adopté
Page 19 and 20: sur le salaire perçu, ou l’effet
Page 21 and 22: se peut que, dans l’échantillon
Page 23 and 24: Les conditions du premier ordre, ap
Page 25: variables du modèle et leur unité
Page 29 and 30: α qu’on se donne et la procédur
Page 31 and 32: Chapitre 3 : Le modèle de régress
Page 33 and 34: 2 L’estimation par MCO Le but de
Page 35 and 36: • Si X ′ 1X 2 =0,alors ˆβ 1 =
Page 37 and 38: 4.2 Test de Fisher La statistique d
Page 39 and 40: 5 Variables indicatrices Une variab
Page 41 and 42: Prendre en compte des effets saison
Page 43 and 44: 6 D’autres tests Comme dans le ch
Page 45 and 46: appelé aussi problème d’identif
Page 47 and 48: ) Variables supplémentaires Suppos
Page 49 and 50: • La méthode forward : elle cons
Page 51 and 52: Elle suit une loi de Student sous H
Page 53 and 54: Même si les MCO ne sont pas biais
Page 55 and 56: 2.2 Correction de l’hétéroscéd
Page 57: d) Le h de Durbin en présence d’

Le mod`ele de rÃ©gression multiple

Create successful ePaper yourself

Delete template?

Save as template?