03.07.2015 Views

Le mod`ele de régression multiple

Le mod`ele de régression multiple

Le mod`ele de régression multiple

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

<strong>Le</strong>s logiciels permettent <strong>de</strong> conclure sur le rejet ou non <strong>de</strong> l’hypothèse nulle sans<br />

avoir à regar<strong>de</strong>r les valeurs critiques dans une table statistique. En effet, ils donnent<br />

la valeur <strong>de</strong> la statistique <strong>de</strong> test ainsi que la probabilité dutest,appelée p-value.<br />

La p-value est le niveau d’erreur exact associé àunrésultat <strong>de</strong> test particulier.<br />

Elle mesure la vraisemblance d’une erreur <strong>de</strong> première espèce, soit la probabilité<br />

<strong>de</strong> rejeter à tord l’hypothèse nulle. Plus la p-value est élevée, plus il est probable<br />

que l’on se trompe en rejetant l’hypothèse nulle, et il est alors préférable <strong>de</strong> ne pas<br />

rejeter H 0 . Plus la p-value est faible, plus on est rassuré pour la rejeter car moins<br />

on a <strong>de</strong> chance <strong>de</strong> faire une erreur en la rejetant.<br />

Une p-value égale à 0.07 indique que l’on peu rejeter l’hypothèse nulle àunseuil<br />

d’erreur <strong>de</strong> 10%, mais qu’on ne peut pas rejeter l’hypothèse nulle à un seuil d’erreur<br />

<strong>de</strong> 5%. Cela signifie que 7% <strong>de</strong> la distribution <strong>de</strong> la variable qui suit une loi <strong>de</strong><br />

Stu<strong>de</strong>nt est en <strong>de</strong>hors <strong>de</strong> l’intervalle <strong>de</strong> plus ou moins 1.96 écart type.<br />

Test d’absence <strong>de</strong> significativité d’une variable : Pour tester la nullité<br />

d’un coefficient, c’est-à-dire la non significativité <strong>de</strong>lavariablex par exemple, on<br />

utilise la statistique <strong>de</strong> stu<strong>de</strong>nt avec b 0 =0.<br />

Ainsi, on définit<br />

H 0 : b =0<br />

H 1 : b ≠0<br />

La statistique <strong>de</strong> test est la statistique <strong>de</strong> stu<strong>de</strong>nt suivante :<br />

t = ˆb<br />

Cette statistique suit, sous H 0 , une loi <strong>de</strong> Stu<strong>de</strong>nt à n − 2<strong>de</strong>grés <strong>de</strong> liberté.<br />

La région <strong>de</strong> rejet <strong>de</strong> H 0 au seuil <strong>de</strong> α est alors :<br />

ˆσˆb<br />

R α = {|t| >St n−2 }<br />

Si la statistique <strong>de</strong> test calculée est dans la zone <strong>de</strong> rejet <strong>de</strong> H 0 , ou autrement dit si<br />

la p-value est inférieure à α%, alors on conclut que la variable x est significative au<br />

seuil <strong>de</strong> α%. Sinon, c’est-à-dire si la p-value est supérieure à α%, alors on ne peut<br />

pas dire que la variable x est significative au seuil d’erreur <strong>de</strong> α%.<br />

Si la variable x n’est pas significative, alors le modèle n’est pas pertinent. Si elle<br />

est significative, on peut interpréter son signe et sa valeur. Cependant, il faut vérifier,<br />

sur la base <strong>de</strong>s résidus estimés, la validité dumodèle, àsavoirsileshypothèses faites<br />

sur le modèle, sont acceptables ou pas. C’est ce que nous verrons dans le chapitre<br />

suivant, après avoir généralisé lesrésultats du modèle <strong>de</strong> régression simple au cas<br />

<strong>de</strong> plusieurs variables explicatives.<br />

30

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!