Le mod`ele de régression multiple
Le mod`ele de régression multiple
Le mod`ele de régression multiple
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Dans ce cours, nousétudions le modèle <strong>de</strong> régression linéaire, qui explique<br />
le phénomène y (toutes variables quantitatives que l’on cherche à caractériser : la<br />
consommation <strong>de</strong>s ménages, les ventes d’une entreprise, le salaire <strong>de</strong>s gens, etc)<br />
par un modèle linéaire en fonction <strong>de</strong> K variables explicatives (quantitatives ou<br />
qualitatives) x 1 ,x 2 ,...,x K :<br />
y i = β 0 + β 1 x 1i + β 2 x 2i + ...+ β K x Ki + ε i<br />
i =1,...,n<br />
On dit que y est la variable à expliquer et que les x j , j =1,...,K sont les K<br />
variables explicatives. Ces variables sont observées sur i =1,...,nobservations.<br />
ε est une perturbation aléatoire.<br />
<strong>Le</strong> modèle est qualifié <strong>de</strong> linéaire car y est une fonction linéaire <strong>de</strong>s paramètres<br />
(β 0 ,β 1 ,...,β K ). L’hypothèse <strong>de</strong> linéarité nécessite que le terme d’erreur soit introduit<br />
<strong>de</strong> manière additive et que la forme fonctionnelle soit linéaire dans les<br />
paramètres. Cette hypothèse n’est pas si restrictive puisqu’un grand nombre <strong>de</strong><br />
formes fonctionnelles sont linéaires ou quasi-linéaires (linéaire après transformation),<br />
par exemple Y = AL α K β est linéaire après transformation logarithmique :<br />
y = a + αl + βk avec y =lnY,l =lnL, k =lnK, a =lnA.<br />
Autres exemples <strong>de</strong> modèles quasi-linéaires : y = Ax α e ε ; y = α+β cos(x)+ε; y =<br />
α + β/x + ε; y = α + β ln x + ε.<br />
La transformation la plus utilisée reste la transformation logarithmique. Celleci<br />
permet, outre le fait <strong>de</strong> linéariser certains modèles, d’interpréter les paramètres<br />
du modèle comme <strong>de</strong>s élasticités, puisque, si le modèle explique ln y en fonction <strong>de</strong><br />
ln x k , alors le coefficient associé àlnx k est l’élasticité <strong>de</strong>y par rapport à x k :<br />
β k = d ln y<br />
d ln x k<br />
=<br />
dy/y<br />
dx k /x k<br />
=<br />
( )( ∂y xk<br />
∂x k y<br />
alors que l’élasticité danslemodèle linéaire sans logarithme, où y est expliqué par<br />
x k , n’est pas constante : ( )( ) ∂y xk<br />
= β kx k<br />
∂x k y y<br />
L’intérêt d’un modèle<strong>de</strong>régression, relativement au calcul <strong>de</strong>s simples corrélations<br />
entre variables, est qu’il permet d’étudier la proposition chère aux économistes :<br />
“toute chose égale par ailleurs”. En effet, une corrélation entre <strong>de</strong>ux variables<br />
peut être élevée, parce que ces <strong>de</strong>ux variables sont toutes <strong>de</strong>ux influencées par une<br />
troisième. <strong>Le</strong> coefficient <strong>de</strong> corrélation ne nous permet pas <strong>de</strong> mesurer la relation<br />
entre ces <strong>de</strong>ux variables uniquement, indépendamment <strong>de</strong> l’influence <strong>de</strong> la troisième<br />
variable. En revanche, le modèle <strong>de</strong> régression permet <strong>de</strong> déterminer l’effet d’une<br />
variable sur une autre, les autres variables explicatives étant supposées inchangées<br />
(coefficient <strong>de</strong> régression dans une régression comportant plusieurs variables explicatives).<br />
Par exemple, un modèle<strong>de</strong>régression expliquant le salaire <strong>de</strong>s individus en<br />
fonction par exemple du niveau d’étu<strong>de</strong> et <strong>de</strong> l’âge, va nous permettre d’étudier<br />
l’influence du niveau d’étu<strong>de</strong> sur le salaire <strong>de</strong>s gens, àâge donné. On sait en effet<br />
que l’âge a un effet sur le salaire et sur le niveau d’étu<strong>de</strong>. Si on souhaite comparer le<br />
salaire <strong>de</strong> <strong>de</strong>ux individus ayant le même âge pour <strong>de</strong>s niveaux d’étu<strong>de</strong> différents, il<br />
20<br />
)