Vjerojatnost i matematička statistika - Poslijediplomski specijalistički ...
Vjerojatnost i matematička statistika - Poslijediplomski specijalistički ...
Vjerojatnost i matematička statistika - Poslijediplomski specijalistički ...
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
10.1.2 Normalni model i inferencija<br />
Odgovarajući model za populacijsku razdiobu od (X, Y ) je bivarijatna normalna razdioba<br />
s parametrima µ X , µ Y (populacijske sredine komponenata), σX 2 , σ2 Y (populacijske varijance<br />
komponenata) i ρ (koeficijent korelacije komponenata). Podatke (10.1) možemo interpretirati<br />
kao realizaciju slučajnog uzorka<br />
(X, Y ) = ((X 1 , Y 1 ), (X 2 , Y 2 ), . . . , (X n , Y n ))<br />
za vektor (X, Y ), a Pearsonov koeficijent korelacije (10.2) kao opaženu vrijednost statistike<br />
R =<br />
S XY<br />
√<br />
SXX · S YY<br />
(uzorački koeficijent korelacije).<br />
R je i MLE za parametar ρ, populacijski koeficijent korelacije.<br />
Za konstrukciju pouzdanih intervala za ρ, odnosno za testiranje hipoteza o ρ, treba nam<br />
uzoračka razdioba od R. Pokazuje se da je ta razdioba asimetrična s velikom varijancom.<br />
Želimo li testirati jesu li X i Y korelirane varijable, dakle, nulhipotezu H 0 : ρ = 0, tada<br />
je tesna <strong>statistika</strong><br />
R √ H<br />
√ n − 2 ∼<br />
0<br />
t(n − 2).<br />
1 − R 2<br />
Postoji općenitiji, ali asimptotski rezultat koji nam omogućava testiranje nulhipoteza oblika<br />
H 0 : ρ = ρ 0 , gdje je ρ 0 zadani broj takav da je |ρ 0 | < 1. Naime, vrijedi<br />
W := 1 2 log 1 − R<br />
1 + R ∼: N(1 2 log 1 − ρ<br />
1 + ρ , 1<br />
) za veliko n.<br />
n − 3<br />
Statistika W je Fisherova transformacija od R. Iz nje izvodimo testnu statistiku<br />
Z =<br />
√ n − 3<br />
2<br />
(log 1 − R<br />
1 + R − log 1 − ρ 0<br />
1 + ρ 0<br />
) H 0<br />
∼: N(0, 1) za veliko n.<br />
Standardizirana verzija od W se koristi kao pivotna veličina u konstrukciji aproksimativnih<br />
pouzdanih intervala za ρ na osnovi velikih uzoraka.<br />
Primjer 10.3 Na osnovi podataka iz primjera 10.1, sprovedimo jednostrani test<br />
H 0 : ρ = 0.9, H 1 : ρ > 0.9.<br />
Budući da je r = 0.958, n = 10, opažena wrijednost od W je w = 1.921. Dakle, opažena<br />
vrijednost testne statistike Z je z = (1.921 − 1.472)/0.378 = 1.19, pa je p-vrijednost<br />
P(Z ≥ 1.19|H 0 ) ≈ 0.12. Prema tome, dokazi za odbacivanje H 0 su nedostatni, odnosno<br />
procijenjena vrijednost za ρ nije značajno veća od 0.9.<br />
Napomene:<br />
1. Postojanje “outliera” indicira da je adekvatnost pretpostavke o normalnoj distribuiranosti<br />
bivarijatne populacije upitna.<br />
2. Kako samo jedna opažena vrijednost može imati značajan utjecaj na procjene populacijskih<br />
sredina i varijance, isto tako može imati i znatan utjecaj na procjenu koeficijenta<br />
korelacije.<br />
90