7.3 Estimation par Intervalle slide 306 - STAT

7.3 Estimation par Intervalle slide 306 

Pivots 

Un élément clé de la statistique est de donner une idée de l’incertitude d’un constat. 

Soit θ un paramètre inconnu, et soit t =1la valeur d’une estimation de θ basée sur un échantillon de 

taille n : 

– alors si n =10 5 on est beaucoup plus sûr que θ ≈ t que si n =10; 

–enplusdet on aimerait ainsi donner un intervalle qui serait plus large quand n =10que quand 

n =10 5 , pour expliciter l’incertitude liée à t. 

Rappels : 

–lesdonnées y 1 ,...,y n sont traitées comme une réalisation 

–d’unéchantillonY 1 ,...,Y n tiré d’un modèle statistique f(y; θ) 

–dontleparamètre θ est considéré comme inconnu, 

–estiméparl’estimateur T = t(Y 1 ,...,Y n ) dont la réalisation est t = t(y 1 ,...,y n ). 

On doit donc trouver un moyen de lier θ et y 1 ,...,y n . 

Définition 275. Soient Y =(Y 1 ,...,Y n ) des données issues d’une loi F avec paramètre θ. Alors un 

pivot est une fonction Q = q(Y,θ) dont la loi est connue et qui ne dépend pas de θ. On dit alors que 

Q est pivotale. 

Exemple 276. Soient Y 1 ,...,Y n 

iid ∼ U(0,θ) avec θ inconnu, M =max(Y1 ,...,Y n ) et 

Y = n −1 ∑ Y j . (a) Montrer que Q 1 = M/θ est un pivot ; (b) utiliser le théorème central limite pour 

trouver un pivot approximatif Q 2 pour n grand, basé sur Y . 

Probabilités et Statistique pour SIC slide 307 

Les intervalles de confiance 

Définition 277. Soient Y =(Y 1 ,...,Y n ) des données issues d’une loi paramétrique F de paramètre θ 

scalaire. Un intervalle de confiance (B I ,B S ) pour θ est une statistique sous forme d’intervalle qui 

contient θ avec un probabilité spécifiée. Cette probabilité s’appelle le niveau de l’intervalle. Noter que 

–leslimitesB I ,B S sont des fonctions des données Y 1 ,...,Y n et non pas des inconnus ; 

– un intervalle de confiance bilatéral, de la forme (B I ,B S ) est le plus souvent utilisé, mais 

– un intervalle de confiance unilatéral, de la forme 

(−∞,B S ) ou (B I , ∞), 

est parfois utile, B S et B I étant les bornes de confiance supérieure et inférieure pour θ. 

Si nous écrivons 

Pr{θ ∈ (−∞,B S )} =Pr(θB I )=1− α I , 

alors le niveau de l’intervalle (B I ,B S ) est 

Pr (B I ≤ θ

Construction d’un IC 

– Avec l’aide d’un pivot, on peut construire des IC pour θ : 

1. on trouve un pivot Q = q(Y,θ) qui contient θ ; 

2. on obtient les quantiles q 1−α1 , q α2 de Q ; 

3. puis on transforme l‘équation 

en la forme 

Pr{q α2 ≤ q(Y,θ) ≤ q 1−α1 } =1− α 1 − α 2 

Pr(B I ≤ θ ≤ B S )=1− α 1 − α 2 , 

où les bornes B I , B S sont fonction de Y , q α2 , q 1−α1 ,etpasdeθ. 

– Dans beaucoup de cas, les bornes sont d’une forme standard. 

– Pour les IC unilatéraux, on peut prendre soit α 1 =0soit α 2 =0. 

Exemple 278. Dans l’exemple 276, trouver les IC basés sur Q 1 et Q 2 . 

Exemple 279. Un échantillon de n =16plaques des voitures vaudoises a maximum 523308 et 

moyenne 320869. Donner des IC bilatéraux à 95% pour le nombre de voitures vaudoises. 


Interprétation d’un IC 

– (B I ,B S ) est un intervalle aléatoire qui contient θ avec probabilité 1 − α. 

– On imagine une suite infinie de répétitions de l’expérience qui a donné (B I ,B S ) 

–L’ICquel’onacalculéestundesICspossibles,etonpeutconsidérer qu’il a été choisi au hasard 

parmi ces possibilités. 

– Bien que nous ne sachions pas si notre IC contient θ, cet événement a une probabilité 1 − α. 

– Pour illustrer ce raisonnement, ici le paramètre θ (vert) est contenu (ou pas) dans des réalisations 

de l’IC (rouge) : 

Repetition 

0 20 40 60 80 100 

−2 0 2 4 6 8 10 12 

Parameter 


283

Rélation avec des tests 

Il y a une relation intime entre les IC et les tests d’hypothèse concernant les paramètres. 

–SoitH 0 : θ = θ 0 une hypothèse nulle concernant un paramètre θ. 

–SoitI =(B I ,B S ) un IC au niveau (1 − α) × 100% pour θ. 

– Alors 

–siθ 0 ∈I, on considère que θ 0 est compatible avec les données, et on ne rejette pas H 0 au niveau 

α. 

– Si par contre θ ∉ I, on considère que θ 0 est incompatible avec les données au niveau α, eton 

rejette H 0 . 

– Donc une manière générale de faire un test au niveau α sur θ est de construire un IC au niveau 

(1 − α) et d’accepter tout θ se trouvant dans le IC, et de rejéter toute autre valeur de θ. 


Les écart-types 

Dans le plupart des cas, on utilise des pivots approximatifs, basés sur des estimateurs, dont on a 

besoin d’estimer les variances. 

Définition 280. Soient T = t(Y 1 ,...,Y n ) un estimateur de θ, τn 2 =var(T ) sa variance, et 

V = v(Y 1 ,...,Y n ) une statistique estimateur de τn 2. Alors on appelle V 1/2 (également sa réalisation 

v 1/2 )uné c a r t - t y p dee 

T . 

Théorème 281. Soient T un estimateur et V son écart-type se basant sur un échantillon de taille n, 

avec 

T − θ D V P 

−→ Z, −→ 1, n →∞, 

τ n 

où Z ∼N(0, 1). Alors par le théorème 237 on a 

τ 2 n 

T − θ 

V 1/2 

= T − θ 

τ n 

× τ n 

V 1/2 

D −→ Z, 

n →∞. 

Implication : En construisant un IC par le TCL, on peut remplacer τ n par V 1/2 . 


284

Des IC approximatifs 

En général on construit des ICs approximatifs à l’aide du théorème central limite. Rappelons que la 

plupart des statistiques se basant sur les moyennes (implicites ou explicites) des variables 

Y =(Y 1 ,...,Y n ) ont des lois normales pour n grand. Si T = t(Y ) est un estimateur de θ avec 

écart-type √ V ,etsi 

T ∼ · N(θ, V ), 

alors (T − θ)/ √ V ∼ · N(0, 1). Ainsi 

{ 

Pr z α2 < (T − θ)/ √ } .=Φ(z1−α1 

V ≤ z 1−α1 ) − Φ(z α2 )=1− α 1 − α 2 , 

impliquant qu’un IC (approx) de niveau (1 − α 1 − α 2 ) pour θ est 

(T − √ Vz 1−α1 ,T − √ Vz α2 ). 

L’exemple 278 en est un exemple, avec T =2Y et V = T 2 /(3n), carpourn grand on a 

B I ≈ T − Tz 1−α1 /(3n) 1/2 , B S ≈ T − Tz α2 /(3n) 1/2 . 


Moyenne et variance d’un échantillon normal 

Un cas très important où les IC exacts sont disponibles est l’échantillon normal. 

Théorème 282. Soient Y 1 ,...,Y n 

iid ∼N(µ, σ 2 ), alors 

Y ∼N(µ, σ 2 } 

/n) 

(n − 1)S 2 = ∑ n 

j=1 (Y j − Y ) 2 ∼ σ 2 χ 2 n−1 

indépendantes 

où χ 2 ν 

represente la loi khi-deux avec ν degrés de liberté. 

Ainsi si σ 2 est inconnu, 

Y − µ 

√ 

S 2 /n ∼ t n−1, 

(n − 1)S 2 

σ 2 

∼ χ 2 n−1 

sont des pivots que l’on peut utiliser pour trouver des IC à (1 − α) × 100% pour µ et σ 2 , 

respectivement, de forme 

Y ± √ S ( (n − 1)S 

2 

) 

(n − 1)S2 

t n−1 (α/2), 

n χ 2 , 

n−1 (1 − α/2) χ 2 n−1 (α/2) , 

où t ν (p) et χ 2 ν (p) sont les quantiles des lois Student t avec ν degrés de liberté et khi-deux avec ν 

degrés de liberté. 


285

Densités de khi-deux et de Student 

PDF 

0.0 0.2 0.4 

1 

2 

4 

6 

10 

PDF 

0.0 0.1 0.2 0.3 0.4 

0 5 10 15 20 

w 

-4 -2 0 2 4 

t 

Densités (à gauche) χ 2 ν avec ν =1, 2, 4, 6, 10, et (à droite) t ν avec ν =1(le plus bas au centre), 2, 4, 

20, ∞ (plus haut au centre). 


Exemple 

Exemple 283. On suppose que la résistance X d’un certain type d’équipements électriques est 

distribuée approximativement suivant une loi normale avec S 2 =0.12 2 ohm 2 .Unéchantillondetaille 

n =9a donné comme moyenne empirique la valeur x =5.34 ohm. 

(a) Trouver un IC bilatéral pour µ au niveau 95%. 

(b) Trouver un IC à 95% pour σ 2 . 

(c) Dans (a), qu’est-ce qui change s’il est connu que σ 2 =0.12 2 

Note : Le remplacement d’un σ 2 inconnu par S 2 élargit l’IC, car la variabilité de S augmente 

l’incertitude concernant µ. 


Commentaires 

– Un IC donne non seulement une idée d’où se trouve un paramètre inconnu, mais sa largeur donne 

en plus un sens de la précision de l’estimation. 

– En générale la largeur varie comme n −1/2 ,etdoncmultiplierpar100latailledel’échantillon 

augmente la précision par un facteur de 10 seulement. 

– La construction des IC se base sur les pivots, souvent utilisant le théorème centrale limite pour 

approcher la loi d’un estimateur, et donc souvent approximatifs. 

– Dans certains cas, notamment pour des modèles normaux, les IC exactssontdisponibles. 


286

7.3 Estimation par Intervalle slide 306 - STAT

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?