Le mod`ele de régression multiple
Le mod`ele de régression multiple
Le mod`ele de régression multiple
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
<strong>de</strong> l’écart-type σ par son estimation S, calculée sur l’échantillon, et on peut alors<br />
calculer l’intervalle <strong>de</strong> confiance du paramètre µ inconnu, ou <strong>de</strong> manière équivalente,<br />
la précision <strong>de</strong> l’estimation effectuée sur l’échantillon. Cependant, dans ce cas,<br />
¯X−µ<br />
S/ √ suit, non pas une loi normale centrée réduite, mais une loi <strong>de</strong> Stu<strong>de</strong>nt (que<br />
n<br />
l’on présente ci-après). Disons juste que pour n suffisamment grand, les valeurs t α<br />
correspondant à une loi normale et à une loi <strong>de</strong> Stu<strong>de</strong>nt sont les mêmes.<br />
Par exemple, 15000 personnes ont passé un concours, 600 premières copies prises<br />
au hasard sont déjà corrigées et on a trouvé une moyenne <strong>de</strong> 11.3 et un écart-type <strong>de</strong><br />
2.1. On veut estimer la moyenne générale avec un risque <strong>de</strong> 5% d’erreur (ou à 95%<br />
<strong>de</strong> confiance). On obtient l’intervalle <strong>de</strong> confiance [11.3 − 1.96 × 2.1/ √ 600; 11.3 +<br />
1.96 × 2.1/ √ 600], soit [11.13; 11.47].<br />
Attention: on retiendra que l’estimation par intervalle <strong>de</strong> confiance donne une<br />
réponse en terme <strong>de</strong> précision (par l’intervalle proposé), mais aussi <strong>de</strong> risque (par la<br />
valeur du seuil d’erreur, contraire du seuil <strong>de</strong> confiance). Ainsi, un statisticien qui<br />
fait par exemple <strong>de</strong>s estimations au risque <strong>de</strong> 10% dans <strong>de</strong>s conditions correctes doit<br />
s’attendre à obtenir une fourchette erronée, c’est-à-dire ne contenant pas la vraie<br />
valeur, environ une fois sur 10.<br />
4 Quelques lois dérivées <strong>de</strong> la loi normale<br />
4.1 Loi du chi-<strong>de</strong>ux<br />
La somme du carré <strong>de</strong>n variables aléatoires indépendantes distribuées selon <strong>de</strong>s lois<br />
normales centrées réduites (moyenne 0 et variance 1) est distribuée selon une loi du<br />
chi-<strong>de</strong>ux à n <strong>de</strong>grés <strong>de</strong> liberté, notée χ 2 n.<br />
La distribution du chi-<strong>de</strong>ux est toujours positive, et est disymétrique.<br />
Si on calcule la variance empirique S 2 <strong>de</strong> n observations tirées d’une distribution normale <strong>de</strong><br />
variance σ 2 ,alors(n − 1)S 2 /σ 2 sera distribué selon un chi-<strong>de</strong>ux à n − 1<strong>de</strong>grés <strong>de</strong> liberté.<br />
4.2 Loi <strong>de</strong> Stu<strong>de</strong>nt<br />
Si X est distribuée selon une loi normale centrée réduite, et que Z est distribuée<br />
selon un chi-<strong>de</strong>ux à n <strong>de</strong>grés <strong>de</strong> liberté, et si X et Z sont indépendantes, alors<br />
X/ √ Z/n est distribuée selon une loi <strong>de</strong> stu<strong>de</strong>nt à n <strong>de</strong>grés <strong>de</strong> liberté.<br />
La loi <strong>de</strong> stu<strong>de</strong>nt ressemble àlaloinormaleenétend plus aplatie (elle <strong>de</strong>vient<br />
normale pour <strong>de</strong>s échantillons <strong>de</strong> gran<strong>de</strong> taille).<br />
¯X−µ<br />
σ/ √ n<br />
Si X est normale, est aussi normale <strong>de</strong> moyenne nulle et <strong>de</strong> variance égale à1. Maissi<br />
σ 2 est inconnue, on doit la remplacer par la variance empirique s 2 . Puisque (n − 1)s 2 /σ 2 suit un<br />
chi-<strong>de</strong>ux et que est N (0, 1), alors<br />
¯X−µ<br />
σ/ √ n<br />
( ¯X − µ)/(σ/ √ n)<br />
√<br />
(n − 1)s2 /σ 2 √<br />
n − 1=<br />
( ¯X − µ)<br />
s/ √ n<br />
suit une distribution <strong>de</strong> stu<strong>de</strong>nt à n − 1<strong>de</strong>grés <strong>de</strong> liberté.<br />
14