Le mod`ele de régression multiple
Le mod`ele de régression multiple
Le mod`ele de régression multiple
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
L’hypothèse <strong>de</strong> normalité estnécessaire pour mener une inférence, c’est–à–dire<br />
<strong>de</strong>s tests sur les paramètres estimés. On <strong>de</strong>vra vérifier, sur la base <strong>de</strong>s résidus<br />
estimés, que cette hypothèse est acceptable.<br />
Conséquences <strong>de</strong>s hypothèses :<br />
Puisque les erreurs sont <strong>de</strong> moyenne nulle et que x i est une variable non aléatoire<br />
(E(x i )=x i ), alors E(y i )=a+bx i .Ainsi,lemodèle théorique est vérifié en moyenne,<br />
même si pour chaque individu, il y a une erreur.<br />
Puisque les erreurs sont <strong>de</strong> même variance, alors var(y i )=var(u i )=σ 2 ∀i =<br />
1,...,n. Ainsi, les données sont telles que la variance est constante (on ne peut<br />
pas avoir <strong>de</strong>s observations <strong>de</strong> variance très différente, par exemple <strong>de</strong>s petites et<br />
<strong>de</strong>s gran<strong>de</strong>s entreprises dans le même échantillon, il faudra dans ce cas adapter la<br />
métho<strong>de</strong> d’estimation. Voir chapitre 4).<br />
Puisque les erreurs ne sont pas corrélées, cov(y i ,y j )=cov(u i ,u j )=0pouri ≠ j.<br />
Ainsi, si les observations sont temporelles, cela signifie que la valeur prise par y à<br />
une date ne dépend pas <strong>de</strong> la valeur prise par y àladated’avantparexemple. Ce<br />
qui est très peu probable avec <strong>de</strong>s données temporelles, et il faudra donc adapter la<br />
métho<strong>de</strong> d’estimation. Voir chapitre 4.<br />
On peut déduire <strong>de</strong> ces différentes hypothèse que chaque y i est supposé suivre<br />
une loi normale <strong>de</strong> moyenne a + bx i et <strong>de</strong> variance σ 2 .<br />
A partir <strong>de</strong> ce modèle et <strong>de</strong>s hypothèses formulées, on peut développer la métho<strong>de</strong><br />
d’estimation. Nous présenterons <strong>de</strong>ux métho<strong>de</strong>s d’estimation : la métho<strong>de</strong> du maximum<br />
<strong>de</strong> vraisemblance et la métho<strong>de</strong> <strong>de</strong>s MCO (qui donnent exactement les mêmes<br />
résultats dans ce cadre).<br />
2 Métho<strong>de</strong>s d’estimation<br />
<strong>Le</strong> but <strong>de</strong> l’économètre est <strong>de</strong> déterminer la valeur <strong>de</strong>s paramètresinconnus(a et<br />
b ici) le mieux possible. Il s’agit <strong>de</strong> trouver l’estimateur <strong>de</strong> ces paramètres qui soit<br />
sans biais et le plus précis possible.<br />
2.1 La métho<strong>de</strong> <strong>de</strong>s MCO<br />
<strong>Le</strong> problème est <strong>de</strong> déterminer les paramètres estimés (â et ˆb) <strong>de</strong> telle sorte que<br />
l’ajustement, ŷ i = â + ˆbx i soit aussi proche que possible <strong>de</strong> l’observation y i ,ou<br />
autrement dit, que l’erreur (estimée) û i = y i − ŷ i = y i − â − ˆbx i soit aussi proche<br />
que possible <strong>de</strong> 0 et cela pour chaque i. Lamesure<strong>de</strong>laproximité que l’on retient<br />
constitue le critère d’ajustement. On retient le critère <strong>de</strong>s moindres carrés ordinaires,<br />
c’est–à–dire qu’on retient les valeurs â et ˆb qui minimisent la somme <strong>de</strong>s carrés <strong>de</strong>s<br />
résidus :<br />
(â, ˆb) =argmin<br />
a,b<br />
n∑<br />
i=1<br />
∑<br />
u 2 i =argmin (yi − a − bx i ) 2<br />
a,b<br />
22