Le mod`ele de rÃ©gression multiple

More documents

Recommendations

Info

Propriétés: Si X et Y sont deux variables aléatoires, alors : E(X + Y )=E(X)+E(Y ) Var(X + Y )=Var(X)+Var(Y )+2Cov(X, Y ) On dit que deux variables aléatoires X et Y sont indépendantes si le fait d’avoir une certaine valeur pour X n’est pas relié àlavaleurdeY et vice versa. Dans ce cas, on a : E(XY )=E(X)E(Y )etdoncCov(X, Y )=0 Attention, deux variables peuvent avoir une covariance nulle et ne pas être indépendantes! par exemple si la relation qui les lie est plutôt non linéaire. 3 Estimation L’estimation est l’un des buts de la statistique et de l’économétrie. L’idée est de relier une valeur non aléatoire mais inconnue (la vraie valeur qui nous intéresse) à une valeur aléatoire mais observable (l’estimation de la valeur inconnue), en mesurant autant que possible la précision de l’estimation, c’est-à-dire la confiance à accorder à cette valeur. Supposons, par exemple, que l’on s’intéresse à l’espérance inconnue d’une variable aléatoire (par exemple la durée moyenne d’un certain équipement) ou alors, la moyenne d’une variable sur une population très grande (la taille moyenne des terriens). Elles prennent une certaine valeur (non aléatoire) mais inconnue (ou alors connue, mais très coûteuse à obtenir dans le cas d’une population de très grande taille). En revanche, si nous disposons d’un échantillon, c’est-à-dire d’observations du phénomène étudié (soit plusieurs équipements, soit un sondage sur une partie de la population), on va pouvoir estimer l’espérance théorique à partir des informations issues de l’échantillon dont on dispose, c’est-à-dire trouver une valeur pour approcher l’espérance inconnue, mais cela sur la base d’un échantillon particulier. Pour illustrer les notions d’échantillon et d’estimation, prenons tout d’abord le cas d’une variable aléatoire discrète. Supposons par exemple que l’on s’intéresse à la probabilité d’apparition de Pile quand on lance une pièce de monnaie, ou la probabilité d’apparition d’une certaine valeur quand on lance un dé. Bien sûr, on sait que la probabilité théorique d’obtenir Pile pour une pièce équilibrée est 0.5 et que la probabilité théorique d’obtenir 1 quand on lance un dé est1/6. Mais supposons que l’on ne connaisse pas ces probabilités théoriques, ou alors que l’on souhaite vérifier que la Pièce ou le dé considéré ne sont pas pipés, et que l’on cherche àestimer ces probabilités d’apparition. C’est ce qui se passe en général pour les variables aléatoires que l’on étudie : on ne connaîtpasleurloi,etonnepeutqu’obtenirdes estimations des paramètres de la loi. Pour estimer la probabilité d’obtenir Pile, on va lancer un grand nombre de fois la pièce de monnaie et on va observer les réalisations de la variable aléatoire. Ces observations ont une valeur déterminée, donnée, et il n’y a plus aucun caractère d’incertitude. Cependant, ce sont les résultats d’une expérience aléatoire. A partir de ces observations, qui constituent un échantillon, on va pouvoir calculer 10
la fréquence d’apparition de Pile lors de nos n lancers (nombre de fois où ona obtenu Pile divisé par nombre de lancers), on parle de fréquence empirique. La fréquence empirique a de “bonnes propriétés” dans le sens où elle s’approche de la probabilité théorique (p i ) quand n devient grand. En effet, en augmentant le nombrederépétitions, on s’attend à obtenir des fréquences (empiriques) de plus en plus proches des probabilités (théoriques). Supposons que l’on lance 10 fois une pièce de monnaie, et que l’on obtienne {P ; F ; F ; P ; F ; P ; P ; F ; F ; F }. Lafréquence d’apparition de Pile de 0.4. Si on refait l’expérience de lancer 10 fois la pièce, on risque d’obtenir d’autres valeurs pour la fréquence. C’est pour cela que l’on parle de fréquence empirique, alors que la probabilité d’obtenir Pile reste toujours égale à 0.5, d’où le nom de probabilité théorique. En augmentant le nombre de répétitions, on s’attend à obtenir des valeurs (pour la fréquence empirique) très proche de 0.5 (probabilité théorique). Supposons maintenant que l’on s’intéresse au lancéd’undéetàlavaleurmoyenne obtenue. Pour un échantillon de taille n (valeurs des n observations quand on a répété n fois l’expérience), on peut calculer la moyenne des valeurs, appelée moyenne empirique et généralement notée ¯x : ¯x = n∑ f i x i = 1 n i=1 n∑ i=1 x i Par exemple, supposons qu’on lance un dé 20 fois et que l’on obtienne {5; 4; 6; 2; 3; 2; 1; 1; 6; 3; 3; 6; 2; 6; 4; 6; 3; 6; 3; 4} alors ¯x =3.8, alors que E(X), la moyenne théorique, reste égale à3.5.Delamême manière que les fréquences empiriques s’approchent des probabilités théoriques quand n devient très grand, on s’attend à ce que la moyenne empirique s’approche de la moyenne théorique (espérance) quand n devient très grand. D’une manière générale, supposons que l’on s’intéresse à la meilleure estimation possible de l’espérance (inconnue) d’une variable aléatoire. Supposons que l’on dispose d’un échantillon de taille n de cette variable aléatoire. On cherche à déterminer une règle, qui nous donne une valeur pour chaque échantillon possible. On parle d’estimateur. La valeur obtenue sur un échantillon particulier sera appelée une estimation (on dit aussi une estimation ponctuelle). L’estimateur est une règle alors que l’estimation donne une valeur. L’estimateur est donc une variable aléatoire puisqu’il dépend de l’échantillon. Pour un échantillon donné, on va obtenir une valeur, mais on obtiendrait sans doute une autre valeur si on disposait d’un autre échantillon. On demande à l’estimateur qu’il ait de “bonnes propriétés”, notamment qu’il soit non biaisé (ou sans biais), c’est-à-dire qu’en moyenne, il donne la vraie valeur du paramètre que l’on cherche. On veut de plus qu’il soit convergent, c’est-àdire que sa variance tende vers 0 quand on augmente le nombre d’observations de l’échantillon. Ainsi, on s’assure d’obtenir une estimation proche de la vraie valeur du paramètre que l’on cherche àestimer. 11
Page 1 and 2: Université Paris I - Panthéon Sor
Page 3 and 4: ventes des entreprises. Ceci néces
Page 5 and 6: Chapitre 1 : Quelques éléments de
Page 7 and 8: Ainsi, la loi de probabilité d’u
Page 9: n’est d’échelle prépondérant
Page 13 and 14: L’idée est que notre échantillo
Page 15 and 16: Cela permet de tester si la moyenne
Page 17 and 18: Pour préciser la démarche adopté
Page 19 and 20: sur le salaire perçu, ou l’effet
Page 21 and 22: se peut que, dans l’échantillon
Page 23 and 24: Les conditions du premier ordre, ap
Page 25 and 26: variables du modèle et leur unité
Page 27 and 28: Remarque : tout ceci repose sur le
Page 29 and 30: α qu’on se donne et la procédur
Page 31 and 32: Chapitre 3 : Le modèle de régress
Page 33 and 34: 2 L’estimation par MCO Le but de
Page 35 and 36: • Si X ′ 1X 2 =0,alors ˆβ 1 =
Page 37 and 38: 4.2 Test de Fisher La statistique d
Page 39 and 40: 5 Variables indicatrices Une variab
Page 41 and 42: Prendre en compte des effets saison
Page 43 and 44: 6 D’autres tests Comme dans le ch
Page 45 and 46: appelé aussi problème d’identif
Page 47 and 48: ) Variables supplémentaires Suppos
Page 49 and 50: • La méthode forward : elle cons
Page 51 and 52: Elle suit une loi de Student sous H
Page 53 and 54: Même si les MCO ne sont pas biais
Page 55 and 56: 2.2 Correction de l’hétéroscéd
Page 57: d) Le h de Durbin en présence d’

Le mod`ele de rÃ©gression multiple

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?