Le mod`ele de régression multiple
Le mod`ele de régression multiple
Le mod`ele de régression multiple
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
<strong>Le</strong>s logiciels permettent <strong>de</strong> conclure sur le rejet ou non <strong>de</strong> l’hypothèse nulle sans<br />
avoir à regar<strong>de</strong>r les valeurs critiques dans une table statistique. En effet, ils donnent<br />
la valeur <strong>de</strong> la statistique <strong>de</strong> test ainsi que la probabilité dutest,appelée p-value.<br />
La p-value est le niveau d’erreur exact associé àunrésultat <strong>de</strong> test particulier.<br />
Elle mesure la vraisemblance d’une erreur <strong>de</strong> première espèce, soit la probabilité<br />
<strong>de</strong> rejeter à tord l’hypothèse nulle. Plus la p-value est élevée, plus il est probable<br />
que l’on se trompe en rejetant l’hypothèse nulle, et il est alors préférable <strong>de</strong> ne pas<br />
rejeter H 0 . Plus la p-value est faible, plus on est rassuré pour la rejeter car moins<br />
on a <strong>de</strong> chance <strong>de</strong> faire une erreur en la rejetant.<br />
Une p-value égale à 0.07 indique que l’on peu rejeter l’hypothèse nulle àunseuil<br />
d’erreur <strong>de</strong> 10%, mais qu’on ne peut pas rejeter l’hypothèse nulle à un seuil d’erreur<br />
<strong>de</strong> 5%. Cela signifie que 7% <strong>de</strong> la distribution <strong>de</strong> la variable qui suit une loi <strong>de</strong><br />
Stu<strong>de</strong>nt est en <strong>de</strong>hors <strong>de</strong> l’intervalle <strong>de</strong> plus ou moins 1.96 écart type.<br />
Test d’absence <strong>de</strong> significativité d’une variable : Pour tester la nullité<br />
d’un coefficient, c’est-à-dire la non significativité <strong>de</strong>lavariablex par exemple, on<br />
utilise la statistique <strong>de</strong> stu<strong>de</strong>nt avec b 0 =0.<br />
Ainsi, on définit<br />
H 0 : b =0<br />
H 1 : b ≠0<br />
La statistique <strong>de</strong> test est la statistique <strong>de</strong> stu<strong>de</strong>nt suivante :<br />
t = ˆb<br />
Cette statistique suit, sous H 0 , une loi <strong>de</strong> Stu<strong>de</strong>nt à n − 2<strong>de</strong>grés <strong>de</strong> liberté.<br />
La région <strong>de</strong> rejet <strong>de</strong> H 0 au seuil <strong>de</strong> α est alors :<br />
ˆσˆb<br />
R α = {|t| >St n−2 }<br />
Si la statistique <strong>de</strong> test calculée est dans la zone <strong>de</strong> rejet <strong>de</strong> H 0 , ou autrement dit si<br />
la p-value est inférieure à α%, alors on conclut que la variable x est significative au<br />
seuil <strong>de</strong> α%. Sinon, c’est-à-dire si la p-value est supérieure à α%, alors on ne peut<br />
pas dire que la variable x est significative au seuil d’erreur <strong>de</strong> α%.<br />
Si la variable x n’est pas significative, alors le modèle n’est pas pertinent. Si elle<br />
est significative, on peut interpréter son signe et sa valeur. Cependant, il faut vérifier,<br />
sur la base <strong>de</strong>s résidus estimés, la validité dumodèle, àsavoirsileshypothèses faites<br />
sur le modèle, sont acceptables ou pas. C’est ce que nous verrons dans le chapitre<br />
suivant, après avoir généralisé lesrésultats du modèle <strong>de</strong> régression simple au cas<br />
<strong>de</strong> plusieurs variables explicatives.<br />
30