CAP 3 – STIMA
Cap. 3 - Dipartimento di Statistica, Informatica, Applicazioni ...
Cap. 3 - Dipartimento di Statistica, Informatica, Applicazioni ...
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Corso di laurea magistrale in Statistica, Scienze Attuariali e Finanziarie<br />
INFERENZA STATISTICA (Note didattiche)<br />
Bruno Chiandotto Versione 2015<br />
3. Stima<br />
3.3.7 Intervallo di confidenza per la differenza fra medie per dati appaiati<br />
Se X ~ N( x ,<br />
2<br />
x<br />
) e Y ~ N( y ,<br />
2<br />
y<br />
) sono due v.c. con varianze<br />
2<br />
x<br />
<br />
2<br />
y<br />
incognite e si<br />
vuole costruire un intervallo di confidenza per x y sulla base dell’evidenza<br />
campionaria, l’elemento definito nella sezione precedente non è più pivotale poiché le<br />
due varianze<br />
2<br />
x<br />
e<br />
2<br />
y<br />
(parametri di disturbo) non sono note. Si può allora pensare di<br />
sostituire alle quantità incognite una loro stima ed ottenere la v.c..<br />
dove<br />
2<br />
S<br />
x<br />
e<br />
2<br />
S y<br />
utilizzate come stimatori di<br />
X Y <br />
S<br />
2<br />
x<br />
<br />
x<br />
/ m S<br />
2<br />
y<br />
y<br />
/ n<br />
sono, rispettivamente, le varianze campionarie corrette di X e di Y<br />
2<br />
x<br />
e<br />
2<br />
y<br />
<br />
,<br />
. Purtroppo, questa v.c., pur non dipendendo da<br />
parametri incogniti, non è elemento pivotale non essendo nota la sua distribuzione.<br />
Infatti, la v.c. di cui si conosce la distribuzione (t di Student con n+m-2 gradi di<br />
libertà) è quella definita dal rapporto tra la v.c. la normale standardizzata relativa alla<br />
differenza tra medie e la radice di un<br />
combinazione delle varianze:<br />
2<br />
<br />
<br />
divisa per i propri gradi di liberta relativa alla<br />
2<br />
2<br />
X Y x y m1<br />
S n1<br />
S <br />
x<br />
y<br />
<br />
2 2 m n<br />
2<br />
2 2<br />
x<br />
/ m<br />
y<br />
/ n <br />
x<br />
<br />
y <br />
Ma in questa espressione le due varianze incognite<br />
2<br />
x<br />
e<br />
2<br />
y<br />
<br />
, che compaiono al<br />
numeratore e al denominatore, non si semplificano.<br />
Per campioni di dimensioni modeste il problema della determinazione dell’intervallo di<br />
confidenza per<br />
<br />
x<br />
y<br />
in presenza di due varianze<br />
2<br />
x<br />
e<br />
2<br />
y<br />
diverse ed incognite trova<br />
la sua soluzione ottimale nel caso in cui le due v.c. X e Y non sono indipendenti, anzi,<br />
si presume che la rilevazione dei due caratteri sia stata effettuata sulle stesse unità<br />
statistiche (dati appaiati). In tale situazione si avranno a disposizione n coppie di<br />
osservazioni x i<br />
, y i<br />
e si può, pertanto considerare la v.c. V = X <strong>–</strong> Y che è ancora una<br />
v.c. normale (essendo combinazione lineare di v.c. normali) con media<br />
<br />
E V E X E Y <br />
v x y<br />
e varianza<br />
Var<br />
2<br />
v<br />
2 2<br />
V<br />
Var X<br />
Var<br />
Y<br />
<br />
Cov X,<br />
Y <br />
x<br />
<br />
y<br />
<br />
xy<br />
Per la determinazione dell’intervallo di interesse basterà applicare la procedura<br />
illustrata in precedenza quando si è trattato della stima di intervallo per la media di una<br />
v.c. normale con varianza incognita. Da rilevare che per risolvere il problema non<br />
2 2<br />
occorre procedere alla stima delle varianze <br />
x<br />
e <br />
y<br />
e della covarianza xy<br />
bastando la<br />
stima della varianza della v.c. differenza V = X <strong>–</strong> Y. L’elemento pivotale è<br />
.<br />
212