03.07.2015 Views

Le mod`ele de régression multiple

Le mod`ele de régression multiple

Le mod`ele de régression multiple

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

On remarque que le ¯R 2 peut diminuer quand on ajoute une variable si la SCR du<br />

modèle ne diminue pas suffisamment.<br />

Ainsi, on peut calculer le ¯R 2 pour tous les modèles possibles obtenus àpartir<br />

<strong>de</strong> toutes les combinaisons possibles <strong>de</strong> 1, 2, 3,...,K variables parmi l’ensemble<br />

x 1 ,x 2 ,...,x K . On retient l’ensemble <strong>de</strong> variables explicatives qui conduit àmaximiser<br />

ce critère.<br />

Soulignons cependant que ce critère, pour pertinent qu’il soit, ne suffit pas à<br />

gui<strong>de</strong>r le modélisateur dans son choix <strong>de</strong> variables explicatives. Il présente, à l’instar<br />

du R 2 , l’inconvénient d’être aisément manipulable par une transformation du vecteur<br />

y. De plus, il a le défaut <strong>de</strong> ne pas pouvoir s’interpréter à partir <strong>de</strong> l’équation<br />

d’analyse <strong>de</strong> la variance. Il peut en particulier être négatif.<br />

Que ce soit le R 2 ou le ¯R 2 , ces coefficients doivent toujours être utilisés avec<br />

précaution et jamais comme critère unique pour juger <strong>de</strong> la qualité d’une régression.<br />

Pour comparer 2 modèles qui n’ont pas les mêmes variables explicatives, on ne<br />

peut utiliser le R 2 que si c’est la même variable y que l’on cherche à expliquer (même<br />

nombre d’observations et même forme retenue pour y) etquesiles2modèles ont le<br />

même nombre <strong>de</strong> variables explicatives.<br />

Critères d’information<br />

Ces critères sont utilisés généralement pour choisir le nombre <strong>de</strong> variables explicatives<br />

à introduire dans le modèle. <strong>Le</strong>splusconnussontlecritère d’Akaïke<br />

(AIC) et celui <strong>de</strong> Schwarz (BIC). Pour un modèle avec K variables explicatives, ils<br />

sont donnés par :<br />

AIC = s 2 y (1 − R2 )e 2(K+1)/n<br />

et<br />

BIC = s 2 y (1 − R2 )n (K+1)/n<br />

On cherche le nombre K qui minimisent ces critères. En effet, ce critères diminuent<br />

quand le R 2 augmente, mais ils augmentent quand le nombre <strong>de</strong> régresseurs augmente.<br />

Ainsi, ils permettent <strong>de</strong> pénaliser la variance expliquée du nombre <strong>de</strong> <strong>de</strong>gré<br />

<strong>de</strong> liberté, et donc <strong>de</strong> trouver un modèle parcimonieux.<br />

On utilise en général le log <strong>de</strong> ces critères :<br />

2(K +1)<br />

AIC =log(SCR/n)+<br />

n<br />

et<br />

(K +1)logn<br />

BIC =logSCR/n +<br />

n<br />

Ces 2 critères ont chacun leurs avantages et aucun n’est vraiment meilleur. <strong>Le</strong><br />

critère <strong>de</strong> Schwarz, qui pénalise fortement pour la perte <strong>de</strong> <strong>de</strong>gré <strong>de</strong> liberté, conduira<br />

plus souvent àunmodèle très parcimonieux.<br />

Métho<strong>de</strong>s automatiques <strong>de</strong> choix <strong>de</strong> variables :<br />

Dans le cadre <strong>de</strong> l’estimation MCO d’un modèle <strong>de</strong> régression <strong>multiple</strong>, les logiciels<br />

d’économétrie proposent généralement <strong>de</strong>s procédures d’ai<strong>de</strong> au choix d’un<br />

modèle, c’est–à–dire au choix d’un ensemble <strong>de</strong> variables explicatives. Trois métho<strong>de</strong>s<br />

peuvent être utilisées :<br />

48

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!