Le mod`ele de régression multiple
Le mod`ele de régression multiple
Le mod`ele de régression multiple
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
Propriétés:<br />
Si X et Y sont <strong>de</strong>ux variables aléatoires, alors :<br />
E(X + Y )=E(X)+E(Y ) Var(X + Y )=Var(X)+Var(Y )+2Cov(X, Y )<br />
On dit que <strong>de</strong>ux variables aléatoires X et Y sont indépendantes si le fait d’avoir<br />
une certaine valeur pour X n’est pas relié àlavaleur<strong>de</strong>Y et vice versa. Dans ce<br />
cas, on a :<br />
E(XY )=E(X)E(Y )etdoncCov(X, Y )=0<br />
Attention, <strong>de</strong>ux variables peuvent avoir une covariance nulle et ne pas être indépendantes!<br />
par exemple si la relation qui les lie est plutôt non linéaire.<br />
3 Estimation<br />
L’estimation est l’un <strong>de</strong>s buts <strong>de</strong> la statistique et <strong>de</strong> l’économétrie. L’idée est <strong>de</strong><br />
relier une valeur non aléatoire mais inconnue (la vraie valeur qui nous intéresse)<br />
à une valeur aléatoire mais observable (l’estimation <strong>de</strong> la valeur inconnue), en<br />
mesurant autant que possible la précision <strong>de</strong> l’estimation, c’est-à-dire la confiance à<br />
accor<strong>de</strong>r à cette valeur.<br />
Supposons, par exemple, que l’on s’intéresse à l’espérance inconnue d’une variable<br />
aléatoire (par exemple la durée moyenne d’un certain équipement) ou alors,<br />
la moyenne d’une variable sur une population très gran<strong>de</strong> (la taille moyenne <strong>de</strong>s<br />
terriens). Elles prennent une certaine valeur (non aléatoire) mais inconnue (ou alors<br />
connue, mais très coûteuse à obtenir dans le cas d’une population <strong>de</strong> très gran<strong>de</strong><br />
taille). En revanche, si nous disposons d’un échantillon, c’est-à-dire d’observations<br />
du phénomène étudié (soit plusieurs équipements, soit un sondage sur une partie<br />
<strong>de</strong> la population), on va pouvoir estimer l’espérance théorique à partir <strong>de</strong>s informations<br />
issues <strong>de</strong> l’échantillon dont on dispose, c’est-à-dire trouver une valeur pour<br />
approcher l’espérance inconnue, mais cela sur la base d’un échantillon particulier.<br />
Pour illustrer les notions d’échantillon et d’estimation, prenons tout d’abord le<br />
cas d’une variable aléatoire discrète. Supposons par exemple que l’on s’intéresse<br />
à la probabilité d’apparition <strong>de</strong> Pile quand on lance une pièce <strong>de</strong> monnaie, ou la<br />
probabilité d’apparition d’une certaine valeur quand on lance un dé. Bien sûr, on sait<br />
que la probabilité théorique d’obtenir Pile pour une pièce équilibrée est 0.5 et que la<br />
probabilité théorique d’obtenir 1 quand on lance un dé est1/6. Mais supposons que<br />
l’on ne connaisse pas ces probabilités théoriques, ou alors que l’on souhaite vérifier<br />
que la Pièce ou le dé considéré ne sont pas pipés, et que l’on cherche àestimer<br />
ces probabilités d’apparition. C’est ce qui se passe en général pour les variables<br />
aléatoires que l’on étudie : on ne connaîtpasleurloi,etonnepeutqu’obtenir<strong>de</strong>s<br />
estimations <strong>de</strong>s paramètres <strong>de</strong> la loi.<br />
Pour estimer la probabilité d’obtenir Pile, on va lancer un grand nombre <strong>de</strong><br />
fois la pièce <strong>de</strong> monnaie et on va observer les réalisations <strong>de</strong> la variable aléatoire.<br />
Ces observations ont une valeur déterminée, donnée, et il n’y a plus aucun caractère<br />
d’incertitu<strong>de</strong>. Cependant, ce sont les résultats d’une expérience aléatoire. A<br />
partir <strong>de</strong> ces observations, qui constituent un échantillon, on va pouvoir calculer<br />
10