02.11.2014 Views

Vjerojatnost i matematička statistika - Poslijediplomski specijalistički ...

Vjerojatnost i matematička statistika - Poslijediplomski specijalistički ...

Vjerojatnost i matematička statistika - Poslijediplomski specijalistički ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

10.1.2 Normalni model i inferencija<br />

Odgovarajući model za populacijsku razdiobu od (X, Y ) je bivarijatna normalna razdioba<br />

s parametrima µ X , µ Y (populacijske sredine komponenata), σX 2 , σ2 Y (populacijske varijance<br />

komponenata) i ρ (koeficijent korelacije komponenata). Podatke (10.1) možemo interpretirati<br />

kao realizaciju slučajnog uzorka<br />

(X, Y ) = ((X 1 , Y 1 ), (X 2 , Y 2 ), . . . , (X n , Y n ))<br />

za vektor (X, Y ), a Pearsonov koeficijent korelacije (10.2) kao opaženu vrijednost statistike<br />

R =<br />

S XY<br />

√<br />

SXX · S YY<br />

(uzorački koeficijent korelacije).<br />

R je i MLE za parametar ρ, populacijski koeficijent korelacije.<br />

Za konstrukciju pouzdanih intervala za ρ, odnosno za testiranje hipoteza o ρ, treba nam<br />

uzoračka razdioba od R. Pokazuje se da je ta razdioba asimetrična s velikom varijancom.<br />

Želimo li testirati jesu li X i Y korelirane varijable, dakle, nulhipotezu H 0 : ρ = 0, tada<br />

je tesna <strong>statistika</strong><br />

R √ H<br />

√ n − 2 ∼<br />

0<br />

t(n − 2).<br />

1 − R 2<br />

Postoji općenitiji, ali asimptotski rezultat koji nam omogućava testiranje nulhipoteza oblika<br />

H 0 : ρ = ρ 0 , gdje je ρ 0 zadani broj takav da je |ρ 0 | < 1. Naime, vrijedi<br />

W := 1 2 log 1 − R<br />

1 + R ∼: N(1 2 log 1 − ρ<br />

1 + ρ , 1<br />

) za veliko n.<br />

n − 3<br />

Statistika W je Fisherova transformacija od R. Iz nje izvodimo testnu statistiku<br />

Z =<br />

√ n − 3<br />

2<br />

(log 1 − R<br />

1 + R − log 1 − ρ 0<br />

1 + ρ 0<br />

) H 0<br />

∼: N(0, 1) za veliko n.<br />

Standardizirana verzija od W se koristi kao pivotna veličina u konstrukciji aproksimativnih<br />

pouzdanih intervala za ρ na osnovi velikih uzoraka.<br />

Primjer 10.3 Na osnovi podataka iz primjera 10.1, sprovedimo jednostrani test<br />

H 0 : ρ = 0.9, H 1 : ρ > 0.9.<br />

Budući da je r = 0.958, n = 10, opažena wrijednost od W je w = 1.921. Dakle, opažena<br />

vrijednost testne statistike Z je z = (1.921 − 1.472)/0.378 = 1.19, pa je p-vrijednost<br />

P(Z ≥ 1.19|H 0 ) ≈ 0.12. Prema tome, dokazi za odbacivanje H 0 su nedostatni, odnosno<br />

procijenjena vrijednost za ρ nije značajno veća od 0.9.<br />

Napomene:<br />

1. Postojanje “outliera” indicira da je adekvatnost pretpostavke o normalnoj distribuiranosti<br />

bivarijatne populacije upitna.<br />

2. Kako samo jedna opažena vrijednost može imati značajan utjecaj na procjene populacijskih<br />

sredina i varijance, isto tako može imati i znatan utjecaj na procjenu koeficijenta<br />

korelacije.<br />

90

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!