03.07.2015 Views

Le mod`ele de régression multiple

Le mod`ele de régression multiple

Le mod`ele de régression multiple

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

4 <strong>Le</strong>s tests d’hypothèse<br />

Dans le cadre <strong>de</strong> ce chapitre, nous présentons l’idée <strong>de</strong>s tests d’hypothèses, ainsi que<br />

l’application au test <strong>de</strong> stu<strong>de</strong>nt. Dans le chapitre suivant <strong>de</strong> régression <strong>multiple</strong>,<br />

nous présenterons les autres tests.<br />

4.1 Généralités sur les tests<br />

On va chercher à tester la validité d’hypothèses concernant les (vrais) paramètres<br />

du modèle.<br />

On se donne une hypothèse nulle, notée H 0 que l’on teste, et une hypothèse<br />

alternative, notée H 1 .<br />

La procédure est basée sur la construction d’une statistique, calculée sur l’échantillon<br />

aléatoire afin <strong>de</strong> déci<strong>de</strong>r, avec un niveau <strong>de</strong> confiance raisonnable, si on peut supposer<br />

que les données <strong>de</strong> l’échantillon suivent l’hypothèse nulle (c’est-à-dire si on<br />

peut supposer que l’hypothèse nulle est acceptable).<br />

La statistique retenue dépend <strong>de</strong> l’hypothèse que l’on teste (une statistique <strong>de</strong><br />

Stu<strong>de</strong>nt quand on ne teste qu’une contrainte, une statistique <strong>de</strong> Fisher quand on<br />

teste plusieurs contraintes).<br />

On se donne ensuite une règle <strong>de</strong> décision pour savoir si l’hypothèse nulle<br />

doit être acceptée ou rejetée. Plus précisément, on se donne une zone <strong>de</strong> rejet <strong>de</strong><br />

l’hypothèse nulle.<br />

Par exemple, si l’on veut tester si un paramètre est égal à une certaine valeur,<br />

la règle <strong>de</strong> décision sera qu’on rejette H 0 si le paramètre estimé est trop loin <strong>de</strong> la<br />

valeur testée. Il reste àdéfinir la notion <strong>de</strong> “trop loin”.<br />

Puisque l’échantillon est aléatoire, et que la statistique est calculée sur la base<br />

<strong>de</strong> l’échantillon, alors la statistique <strong>de</strong> test est elle aussi aléatoire. Ainsi, la même<br />

procédure <strong>de</strong> test peut conduire à <strong>de</strong>s conclusions différentes sur <strong>de</strong>s échantillons<br />

différents.<br />

Enfait,ilya<strong>de</strong>uxmanières pour que la procédure <strong>de</strong> test fasse une erreur :<br />

• On parle d’erreur <strong>de</strong> première espèce quand la procédure conduit à rejeter<br />

H 0 quand H 0 est vraie<br />

• On parle d’erreur <strong>de</strong> secon<strong>de</strong> espèce quand la procédure conduit ànepas<br />

rejeter H 0 alors que H 0 est fausse<br />

Il y a une probabilité non nulle pour que l’estimation du paramètre soit assez<br />

éloignée <strong>de</strong> la valeur testée, même si l’hypothèse nulle est vraie. Cette situation<br />

conduit à une erreur <strong>de</strong> première espèce. La probabilité d’une erreur <strong>de</strong> première<br />

espèce est la taille du test, notée α. Elle est aussi appelée seuil d’erreur (ou niveau<br />

<strong>de</strong> significativité, significance level).<br />

Ce seuil est choisi par l’économètre, il peut être changé enmodifiantlarègle <strong>de</strong><br />

décision. Ainsi, on peut réduire l’erreur <strong>de</strong> première espèce en rendant la région <strong>de</strong><br />

rejet <strong>de</strong> H 0 très petite, mais on sera alors conduit à ne jamais rejeter H 0 ,même si<br />

elle est fausse, c’est-à-dire à augmenter l’erreur <strong>de</strong> secon<strong>de</strong> espèce! Il y a un arbitrage<br />

entre les <strong>de</strong>ux, et ce qu’on veut, c’est que les <strong>de</strong>ux soient suffisamment petites.<br />

L’erreur <strong>de</strong> secon<strong>de</strong> espèce dépend bien sûr <strong>de</strong> l’hypothèse alternative, et donc<br />

<strong>de</strong> la valeur du paramètre. Ainsi, ce que l’on veut, c’est que sachant le seuil d’erreur<br />

28

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!