02.11.2014 Views

Vjerojatnost i matematička statistika - Poslijediplomski specijalistički ...

Vjerojatnost i matematička statistika - Poslijediplomski specijalistički ...

Vjerojatnost i matematička statistika - Poslijediplomski specijalistički ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Zadnja smo dva razreda u tablici morali združiti u jedan budući da očekivana frekvencija<br />

u zadnjem razredu (0.4) nije bila veća od 5. Dakle, imamo ukupno k = 5 razreda. Budući<br />

da smo jedan parametar morali procijeniti iz podataka, ukupan broj stupnjeva slobode je<br />

5 − 1 − 1 = 3, pa je<br />

H H 0<br />

∼: χ 2 (3).<br />

Opažena vrijednost te statistike je h = 537.5, pa je p-vrijednost P(H ≥ 537.5|H 0 ) vrlo<br />

mala, gotovo jednaka nuli. Dakle, Poissonova razdioba ne opisuje zakon razdiobe broja<br />

šteta prezentiranih danim uzorkom.<br />

9.7.2 Kontingencijske tablice<br />

Kontingencijskim tablicama prikazujemo frekvencije uzorka dobivenog mjerenjem dvodimenzionalnog<br />

kategorijalnog ili diskretnog numeričkog obilježja (X, Y ). Cilj nam je testirati<br />

nulhipotezu da su X i Y nezavisne varijable ili nulhipotezu da su populacijske razdiobe jedne<br />

varijable, recimo X, homogene obzirom na populacije klasificirane po drugoj komponenti<br />

(Y ). Uz te pretpostavke, očekivane frekvencije svakog polja u tablici računaju se po formuli:<br />

ukupan zbroj toga retka × ukupan zbroj toga stupca<br />

veličina uzorka<br />

Ako u tablici imamo r redaka i c stupaca, tada je broj stupnjeva slobode testne statistike<br />

rc − (r − 1 + c − 1) − 1 = (r − 1)(c − 1).<br />

Primjer 9.6 Za svako od osiguravajućih društava A, B i C uzet je po slučajni uzorak<br />

polica neživotnih osiguranja odredenog tipa. Rezultat dobiven opažanjima tih uzoraka je<br />

da je šteta u prošloj godini bilo po 23% polica od A, po 28% polica od B i po 20% polica<br />

od C. Testirajte ima li značajnih razlika izmedu tih proporcija ako su veličine uzoraka<br />

(a) 100, 100, 200<br />

(b) 300, 300, 600<br />

redom za A, B, C.<br />

Rješenje. Nulhipoteza je da je obilježje “ima ili nema štete po polici” homogeno po distribuciji<br />

obzirom na pripadnost police osiguravajućem društvu A, B ili C.<br />

Za slučaj (a) kontingencijske tablice opaženih i očekivanih frekvencija su:<br />

f ij A B C Σ<br />

ima štete 23 28 40 91<br />

nema štete 77 72 160 309<br />

Σ 100 100 200 400<br />

Vrijednost testne statistike<br />

H = ∑ i,j<br />

e ij A B C Σ<br />

ima štete 22.75 22.75 45.50 91<br />

nema štete 77.25 77.25 154.50 309<br />

Σ 100 100 200 400<br />

(f ij − e ij ) 2<br />

e ij<br />

H 0<br />

∼: χ 2 ((2 − 1) · (3 − 1)) = χ 2 (2)<br />

je h = 2.43, pa je p-vrijednost P(H ≥ 2.43|H 0 ) = 0.30. Dakle, nemamo jakih dokaza<br />

za odbacivanje hipoteze o homogenosti proporcija polica sa štetama u tri navedena osiguravajuća<br />

društva.<br />

Budući da su opažene proporcije iste, u slučaju (b) su sve frekvencije uvećane tri puta u<br />

odnosu na slučaj (a). To znači da je i vrijednost testne statistike uvećana tri puta i iznosi<br />

h = 3 · 2.43 = 7.29. Primijetite da je aproksimativna razdioba testne <strong>statistika</strong> ista. p-<br />

vrijednost je P(H ≥ 7.29|H 0 ) = 0.026, pa ovoga puta imamo jake dokaze za odbacivanje<br />

nulhipoteze o homogenosti proporcija broja šteta.<br />

.<br />

86

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!