03.07.2015 Views

Le mod`ele de régression multiple

Le mod`ele de régression multiple

Le mod`ele de régression multiple

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

L’hypothèse <strong>de</strong> normalité estnécessaire pour mener une inférence, c’est–à–dire<br />

<strong>de</strong>s tests sur les paramètres estimés. On <strong>de</strong>vra vérifier, sur la base <strong>de</strong>s résidus<br />

estimés, que cette hypothèse est acceptable.<br />

Conséquences <strong>de</strong>s hypothèses :<br />

Puisque les erreurs sont <strong>de</strong> moyenne nulle et que x i est une variable non aléatoire<br />

(E(x i )=x i ), alors E(y i )=a+bx i .Ainsi,lemodèle théorique est vérifié en moyenne,<br />

même si pour chaque individu, il y a une erreur.<br />

Puisque les erreurs sont <strong>de</strong> même variance, alors var(y i )=var(u i )=σ 2 ∀i =<br />

1,...,n. Ainsi, les données sont telles que la variance est constante (on ne peut<br />

pas avoir <strong>de</strong>s observations <strong>de</strong> variance très différente, par exemple <strong>de</strong>s petites et<br />

<strong>de</strong>s gran<strong>de</strong>s entreprises dans le même échantillon, il faudra dans ce cas adapter la<br />

métho<strong>de</strong> d’estimation. Voir chapitre 4).<br />

Puisque les erreurs ne sont pas corrélées, cov(y i ,y j )=cov(u i ,u j )=0pouri ≠ j.<br />

Ainsi, si les observations sont temporelles, cela signifie que la valeur prise par y à<br />

une date ne dépend pas <strong>de</strong> la valeur prise par y àladated’avantparexemple. Ce<br />

qui est très peu probable avec <strong>de</strong>s données temporelles, et il faudra donc adapter la<br />

métho<strong>de</strong> d’estimation. Voir chapitre 4.<br />

On peut déduire <strong>de</strong> ces différentes hypothèse que chaque y i est supposé suivre<br />

une loi normale <strong>de</strong> moyenne a + bx i et <strong>de</strong> variance σ 2 .<br />

A partir <strong>de</strong> ce modèle et <strong>de</strong>s hypothèses formulées, on peut développer la métho<strong>de</strong><br />

d’estimation. Nous présenterons <strong>de</strong>ux métho<strong>de</strong>s d’estimation : la métho<strong>de</strong> du maximum<br />

<strong>de</strong> vraisemblance et la métho<strong>de</strong> <strong>de</strong>s MCO (qui donnent exactement les mêmes<br />

résultats dans ce cadre).<br />

2 Métho<strong>de</strong>s d’estimation<br />

<strong>Le</strong> but <strong>de</strong> l’économètre est <strong>de</strong> déterminer la valeur <strong>de</strong>s paramètresinconnus(a et<br />

b ici) le mieux possible. Il s’agit <strong>de</strong> trouver l’estimateur <strong>de</strong> ces paramètres qui soit<br />

sans biais et le plus précis possible.<br />

2.1 La métho<strong>de</strong> <strong>de</strong>s MCO<br />

<strong>Le</strong> problème est <strong>de</strong> déterminer les paramètres estimés (â et ˆb) <strong>de</strong> telle sorte que<br />

l’ajustement, ŷ i = â + ˆbx i soit aussi proche que possible <strong>de</strong> l’observation y i ,ou<br />

autrement dit, que l’erreur (estimée) û i = y i − ŷ i = y i − â − ˆbx i soit aussi proche<br />

que possible <strong>de</strong> 0 et cela pour chaque i. Lamesure<strong>de</strong>laproximité que l’on retient<br />

constitue le critère d’ajustement. On retient le critère <strong>de</strong>s moindres carrés ordinaires,<br />

c’est–à–dire qu’on retient les valeurs â et ˆb qui minimisent la somme <strong>de</strong>s carrés <strong>de</strong>s<br />

résidus :<br />

(â, ˆb) =argmin<br />

a,b<br />

n∑<br />

i=1<br />

∑<br />

u 2 i =argmin (yi − a − bx i ) 2<br />

a,b<br />

22

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!