Le mod`ele de régression multiple
Le mod`ele de régression multiple
Le mod`ele de régression multiple
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
4 <strong>Le</strong>s tests d’hypothèse<br />
Dans le cadre <strong>de</strong> ce chapitre, nous présentons l’idée <strong>de</strong>s tests d’hypothèses, ainsi que<br />
l’application au test <strong>de</strong> stu<strong>de</strong>nt. Dans le chapitre suivant <strong>de</strong> régression <strong>multiple</strong>,<br />
nous présenterons les autres tests.<br />
4.1 Généralités sur les tests<br />
On va chercher à tester la validité d’hypothèses concernant les (vrais) paramètres<br />
du modèle.<br />
On se donne une hypothèse nulle, notée H 0 que l’on teste, et une hypothèse<br />
alternative, notée H 1 .<br />
La procédure est basée sur la construction d’une statistique, calculée sur l’échantillon<br />
aléatoire afin <strong>de</strong> déci<strong>de</strong>r, avec un niveau <strong>de</strong> confiance raisonnable, si on peut supposer<br />
que les données <strong>de</strong> l’échantillon suivent l’hypothèse nulle (c’est-à-dire si on<br />
peut supposer que l’hypothèse nulle est acceptable).<br />
La statistique retenue dépend <strong>de</strong> l’hypothèse que l’on teste (une statistique <strong>de</strong><br />
Stu<strong>de</strong>nt quand on ne teste qu’une contrainte, une statistique <strong>de</strong> Fisher quand on<br />
teste plusieurs contraintes).<br />
On se donne ensuite une règle <strong>de</strong> décision pour savoir si l’hypothèse nulle<br />
doit être acceptée ou rejetée. Plus précisément, on se donne une zone <strong>de</strong> rejet <strong>de</strong><br />
l’hypothèse nulle.<br />
Par exemple, si l’on veut tester si un paramètre est égal à une certaine valeur,<br />
la règle <strong>de</strong> décision sera qu’on rejette H 0 si le paramètre estimé est trop loin <strong>de</strong> la<br />
valeur testée. Il reste àdéfinir la notion <strong>de</strong> “trop loin”.<br />
Puisque l’échantillon est aléatoire, et que la statistique est calculée sur la base<br />
<strong>de</strong> l’échantillon, alors la statistique <strong>de</strong> test est elle aussi aléatoire. Ainsi, la même<br />
procédure <strong>de</strong> test peut conduire à <strong>de</strong>s conclusions différentes sur <strong>de</strong>s échantillons<br />
différents.<br />
Enfait,ilya<strong>de</strong>uxmanières pour que la procédure <strong>de</strong> test fasse une erreur :<br />
• On parle d’erreur <strong>de</strong> première espèce quand la procédure conduit à rejeter<br />
H 0 quand H 0 est vraie<br />
• On parle d’erreur <strong>de</strong> secon<strong>de</strong> espèce quand la procédure conduit ànepas<br />
rejeter H 0 alors que H 0 est fausse<br />
Il y a une probabilité non nulle pour que l’estimation du paramètre soit assez<br />
éloignée <strong>de</strong> la valeur testée, même si l’hypothèse nulle est vraie. Cette situation<br />
conduit à une erreur <strong>de</strong> première espèce. La probabilité d’une erreur <strong>de</strong> première<br />
espèce est la taille du test, notée α. Elle est aussi appelée seuil d’erreur (ou niveau<br />
<strong>de</strong> significativité, significance level).<br />
Ce seuil est choisi par l’économètre, il peut être changé enmodifiantlarègle <strong>de</strong><br />
décision. Ainsi, on peut réduire l’erreur <strong>de</strong> première espèce en rendant la région <strong>de</strong><br />
rejet <strong>de</strong> H 0 très petite, mais on sera alors conduit à ne jamais rejeter H 0 ,même si<br />
elle est fausse, c’est-à-dire à augmenter l’erreur <strong>de</strong> secon<strong>de</strong> espèce! Il y a un arbitrage<br />
entre les <strong>de</strong>ux, et ce qu’on veut, c’est que les <strong>de</strong>ux soient suffisamment petites.<br />
L’erreur <strong>de</strong> secon<strong>de</strong> espèce dépend bien sûr <strong>de</strong> l’hypothèse alternative, et donc<br />
<strong>de</strong> la valeur du paramètre. Ainsi, ce que l’on veut, c’est que sachant le seuil d’erreur<br />
28