03.07.2015 Views

Le mod`ele de régression multiple

Le mod`ele de régression multiple

Le mod`ele de régression multiple

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

dans le modèle ci-<strong>de</strong>ssus, par un test <strong>de</strong> Fisher.<br />

Si l’hypothèse nulle est rejetée, alors il y a un effet trimestriel significatif et la<br />

variable y désaisonnalisée (ou CVS pour Corrigée <strong>de</strong>s Variations Saisonnières) est<br />

donnée par :<br />

]<br />

yt CV S = y t −<br />

[ˆδ1 (T 1,t − T 4,t )+ˆδ 2 (T 2,t − T 4,t )+ˆδ 3 (T 3,t − T 4,t )<br />

Généralisation au <strong>de</strong>là d’une variable dichotomique :<br />

Une variable dichotomique est une variable qui peut prendre uniquement <strong>de</strong>ux<br />

valeurs. Supposons maintenant que l’on dispose d’une variable qui peut prendre plus<br />

<strong>de</strong> <strong>de</strong>ux valeurs. Dans ce cas, il faut alors introduire plus <strong>de</strong> 1 variable indicatrice.<br />

Supposons, par exemple, que l’on étudie l’effet <strong>de</strong>s diplômes sur le salaire. On<br />

dispose alors d’une variable diplôme, qui nous dit que la personne a, soit 0 diplôme,<br />

soit un diplôme niveau BAC, soit un diplôme supérieur.<br />

Si on co<strong>de</strong> cette variable :<br />

⎧<br />

⎨ 1 si l’individu i est sans diplôme<br />

d i = 2 si l’individu i a un diplôme niveau BAC<br />

⎩<br />

3 si l’individu i a un diplôme supérieur<br />

et qu’on introduise cette variable dans la régression, alors le coefficient associé sera<br />

sans doute positif, signifiant que plus un individu a <strong>de</strong> diplômes, plus son salaire<br />

est élevé, mais il est insatisfaisant <strong>de</strong> se dire que l’augmentation <strong>de</strong> salaire pour<br />

chaque diplôme est la même. En effet, le coefficient qui sera estimé correspond à<br />

l’augmentation <strong>de</strong> salaire quand on passe <strong>de</strong> sans diplôme à BAC, ou quand on passe<br />

<strong>de</strong> BAC à diplôme supérieur.<br />

Une manière plus satisfaisante serait d’écrire :<br />

w i = βage i + δ 1 SD i + δ 2 BAC i + δ 3 SUP i + ε i<br />

où SD i (respectivement BAC i et SUP i ) vaut 1 si l’individu i est sans diplôme (respectivement<br />

a un BAC, et diplôme supérieur) et 0 sinon. Ainsi, δ 1 est le coefficient<br />

associé à sans diplôme, δ 2 àBACetδ 3 à diplôme supérieur. Cependant, on note<br />

qu’on ne peut plus conserver la constante dans le modèle puisque la somme <strong>de</strong>s trois<br />

variables indicatrices, SD i ,BAC i ,SUP i est égale au vecteur constant (colinéarité).<br />

Ainsi, on préférera retirer une <strong>de</strong>s variables (on dit que l’on met en “référence” la<br />

modalité correspondante) et n’introduire que les <strong>de</strong>ux autres, ce qui nous permet<br />

<strong>de</strong> conserver la constante. <strong>Le</strong> modèle s’écrit alors, si on met “sans diplôme” en<br />

référence :<br />

w i = β 0 + βage i + δ 2 BAC i + δ 3 SUP i + ε i<br />

<strong>Le</strong>s valeurs δ i sont interprétables : δ 2 mesure l’accroissement <strong>de</strong> salaire quand on<br />

a le BAC relativement à ne pas avoir <strong>de</strong> diplôme, et δ 3 mesure l’accroissement <strong>de</strong><br />

salaire quand on a un diplôme supérieur relativement à ne pas avoir <strong>de</strong> diplôme.<br />

42

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!