Vjerojatnost i matematička statistika - Poslijediplomski specijalistički ...
Vjerojatnost i matematička statistika - Poslijediplomski specijalistički ...
Vjerojatnost i matematička statistika - Poslijediplomski specijalistički ...
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Zadnja smo dva razreda u tablici morali združiti u jedan budući da očekivana frekvencija<br />
u zadnjem razredu (0.4) nije bila veća od 5. Dakle, imamo ukupno k = 5 razreda. Budući<br />
da smo jedan parametar morali procijeniti iz podataka, ukupan broj stupnjeva slobode je<br />
5 − 1 − 1 = 3, pa je<br />
H H 0<br />
∼: χ 2 (3).<br />
Opažena vrijednost te statistike je h = 537.5, pa je p-vrijednost P(H ≥ 537.5|H 0 ) vrlo<br />
mala, gotovo jednaka nuli. Dakle, Poissonova razdioba ne opisuje zakon razdiobe broja<br />
šteta prezentiranih danim uzorkom.<br />
9.7.2 Kontingencijske tablice<br />
Kontingencijskim tablicama prikazujemo frekvencije uzorka dobivenog mjerenjem dvodimenzionalnog<br />
kategorijalnog ili diskretnog numeričkog obilježja (X, Y ). Cilj nam je testirati<br />
nulhipotezu da su X i Y nezavisne varijable ili nulhipotezu da su populacijske razdiobe jedne<br />
varijable, recimo X, homogene obzirom na populacije klasificirane po drugoj komponenti<br />
(Y ). Uz te pretpostavke, očekivane frekvencije svakog polja u tablici računaju se po formuli:<br />
ukupan zbroj toga retka × ukupan zbroj toga stupca<br />
veličina uzorka<br />
Ako u tablici imamo r redaka i c stupaca, tada je broj stupnjeva slobode testne statistike<br />
rc − (r − 1 + c − 1) − 1 = (r − 1)(c − 1).<br />
Primjer 9.6 Za svako od osiguravajućih društava A, B i C uzet je po slučajni uzorak<br />
polica neživotnih osiguranja odredenog tipa. Rezultat dobiven opažanjima tih uzoraka je<br />
da je šteta u prošloj godini bilo po 23% polica od A, po 28% polica od B i po 20% polica<br />
od C. Testirajte ima li značajnih razlika izmedu tih proporcija ako su veličine uzoraka<br />
(a) 100, 100, 200<br />
(b) 300, 300, 600<br />
redom za A, B, C.<br />
Rješenje. Nulhipoteza je da je obilježje “ima ili nema štete po polici” homogeno po distribuciji<br />
obzirom na pripadnost police osiguravajućem društvu A, B ili C.<br />
Za slučaj (a) kontingencijske tablice opaženih i očekivanih frekvencija su:<br />
f ij A B C Σ<br />
ima štete 23 28 40 91<br />
nema štete 77 72 160 309<br />
Σ 100 100 200 400<br />
Vrijednost testne statistike<br />
H = ∑ i,j<br />
e ij A B C Σ<br />
ima štete 22.75 22.75 45.50 91<br />
nema štete 77.25 77.25 154.50 309<br />
Σ 100 100 200 400<br />
(f ij − e ij ) 2<br />
e ij<br />
H 0<br />
∼: χ 2 ((2 − 1) · (3 − 1)) = χ 2 (2)<br />
je h = 2.43, pa je p-vrijednost P(H ≥ 2.43|H 0 ) = 0.30. Dakle, nemamo jakih dokaza<br />
za odbacivanje hipoteze o homogenosti proporcija polica sa štetama u tri navedena osiguravajuća<br />
društva.<br />
Budući da su opažene proporcije iste, u slučaju (b) su sve frekvencije uvećane tri puta u<br />
odnosu na slučaj (a). To znači da je i vrijednost testne statistike uvećana tri puta i iznosi<br />
h = 3 · 2.43 = 7.29. Primijetite da je aproksimativna razdioba testne <strong>statistika</strong> ista. p-<br />
vrijednost je P(H ≥ 7.29|H 0 ) = 0.026, pa ovoga puta imamo jake dokaze za odbacivanje<br />
nulhipoteze o homogenosti proporcija broja šteta.<br />
.<br />
86