pdf - Háskóli Íslands
pdf - Háskóli Íslands
pdf - Háskóli Íslands
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
<strong>Háskóli</strong> <strong>Íslands</strong><br />
STÆ203G Líkindareikningur og tölfræði<br />
STÆ204G Inngangur að líkinda- og tölfræði<br />
HAG206G Líkindareikningur og tölfræði<br />
Vormisseri 2012<br />
FYRIRLESTRANÓTUR Í TÖLFRÆÐI<br />
eftir Birgi Hrafnkelsson<br />
1
Efnisyfirlit<br />
1 Lýsandi tölfræði 5<br />
1.1 Myndrænar aðferðir I . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5<br />
1.2 Tölulegar aðferðir . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7<br />
1.3 Myndrænar aðferðir II . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11<br />
2 Dreifing lýsistærða 14<br />
2.1 Slembiúrtak og lýsistærðir . . . . . . . . . . . . . . . . . . . . . . . . . . 14<br />
2.2 Meðaltal slembiúrtaks . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14<br />
2.3 Höfuðmarkgildisreglan . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15<br />
2.4 Dreifni slembiúrtaks . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17<br />
2.5 Skilgreiningar áz-dreifingu, χ 2 -dreifingum, t-dreifingum og F -dreifingum . 19<br />
2.5.1 z-dreifing (stöðluð normaldreifing) . . . . . . . . . . . . . . . . . . 19<br />
2.5.2 χ 2 -dreifingar (kí-kvaðratsdreifingar) . . . . . . . . . . . . . . . . . 20<br />
2.5.3 t-dreifingar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21<br />
2.5.4 F -dreifingar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22<br />
2.6 Dreifing lýsistærða sem byggðar eru á slembiúrtaki úr normaldreifingu . . . 23<br />
3 Metlar og punktmat 26<br />
3.1 Almennt um metla og punktmat . . . . . . . . . . . . . . . . . . . . . . . 26<br />
3.2 Hugmyndin að baki aðferð sennilegustu gilda . . . . . . . . . . . . . . . . 27<br />
3.3 Aðferð sennilegustu gilda . . . . . . . . . . . . . . . . . . . . . . . . . . . 28<br />
3.4 Eiginleikar metla . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33<br />
3.5 Línulegir óbjagaðir metlar . . . . . . . . . . . . . . . . . . . . . . . . . . 36<br />
4 Öryggisbil 39<br />
4.1 Eiginleikar öryggisbila . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39<br />
4.2 Öryggisbil fyrirµínormaldreifingu þegarσ 2 er óþekkt . . . . . . . . . . . 42<br />
4.3 Öryggisbil fyrirσ 2 og σ í normaldreifingu . . . . . . . . . . . . . . . . . . 43<br />
3
4.4 Öryggisbil fyrirpítvíkostadreifingu . . . . . . . . . . . . . . . . . . . . . 44<br />
4.5 Öryggisbil fyrir nokkur valin tilfelli . . . . . . . . . . . . . . . . . . . . . 48<br />
5 Tilgátupróf 52<br />
5.1 Almennt um tilgátupróf . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52<br />
5.2 P -gildi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55<br />
5.3 Tilgátupróf fyrir meðalgildi í normaldreifingu, þekkt σ . . . . . . . . . . . 57<br />
5.4 Jöfnur fyrirβ og val án . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59<br />
5.5 Tilgátupróf fyrir nokkur valin tilfelli . . . . . . . . . . . . . . . . . . . . . 62<br />
6 Línulegt aðhvarf 70<br />
6.1 Einfalt línulegt líkan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70<br />
6.2 Metlar fyrir stikanaα, β og σ 2 . . . . . . . . . . . . . . . . . . . . . . . . 70<br />
6.3 Dreifingar metlanna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72<br />
6.4 Öryggisbil og tilgátupróf fyrirαog β . . . . . . . . . . . . . . . . . . . . 74<br />
6.5 Öryggisbil fyrirα+βx0 . . . . . . . . . . . . . . . . . . . . . . . . . . . 76<br />
6.6 Spábil fyrir nýttY þegar skýribreytan tekur gildiðx0 . . . . . . . . . . . . 76<br />
6.7 Fylgnistuðull úrtaks og skýringarhlutfall . . . . . . . . . . . . . . . . . . . 77<br />
6.8 Greining á leifunum: Forsendur líkans athugaðar . . . . . . . . . . . . . . 79<br />
6.9 Ólínulegu líkani varpað á línulegt form . . . . . . . . . . . . . . . . . . . . 80<br />
6.10 Dæmi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81<br />
7 Próf fyrir mátgæði og tengslatöflur 85<br />
7.1 Próf fyrir mátgæði þegar allir stikar eru þekktir . . . . . . . . . . . . . . . 85<br />
7.2 Próf fyrir mátgæði þegar einn eða fleiri stikar eru óþekktir . . . . . . . . . 87<br />
7.3 Próf fyrir tengslatöflur . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90<br />
4
1 Lýsandi tölfræði<br />
Við höfum áhuga á ákveðnu þýði (e. population). Til þess að skoða þýðið höfum við tvo<br />
möguleika<br />
i) skoða alla einstaklinga/hluti í þýðinu (e. census)<br />
ii) skoða nokkra einstaklinga/hluti í þýðingu, fáum úrtak úr þýðinu (e. sample)<br />
Til að fá sem besta mynd af þýðinu þarf úrtakið að vera slembiúrtak (e. random sample).<br />
Slembiúrtak úr þýði með endanlegan fjölda einstaklinga/hluta fæst ef hver einstaklingur hef-<br />
ur sömu líkur á að vera valinn í úrtakið. Við viljum fá eins góða hugmynd um dreifingu,<br />
meðalgildi og dreifni þýðisins út frá úrtakinu og hægt er. Til þess notum við lýsandi tölfræði<br />
(e. descriptive statistics) en hún skiptist í myndrænar aðferðir (e. graphical methods) og<br />
tölulegar aðferðir (e. numerical methods).<br />
1.1 Myndrænar aðferðir I<br />
i) Tíðnirit (e. histograms)<br />
Tíðnirit gefa mat á þéttleika, f(x), þegar um samfelldar breytur er að ræða. Eftirfarandi<br />
skref eru tekin:<br />
- veljum bil sem flokkað er í<br />
- teljum fjölda mælinga í hverju bili<br />
- reiknum hlutfallslega tíðni fyrir hvert bil<br />
- teiknum fyrir ofan hvert bil rétthyrning sem hefur sama flatarmál og hlutfallslega<br />
tíðni bilsins<br />
ii) Safntíðnirit (e. cumulative frequency plots)<br />
Safntíðnirit gefa mat á dreififalli, F(x) = Pr(X ≤ x), þegar um samfelldar breytur er að<br />
ræða. Eftirfarandi skref eru tekin:<br />
- leggjum saman hlutfallslega tíðni í bilinu og bilunum fyrir neðan, fáum safntíðni<br />
- teiknum punkt í hæð jafnri safntíðninni við efri mörk bilsins<br />
- drögum línu á milli punktanna<br />
5
Dæmi: Orkunotkun heimila. Stærð úrtaksins er n = 90. Tafla 1 sýnir hlutfallslega tíðni og<br />
safntíðni. Sjá tíðnirit og safntíðnirit fyrir gögnin á mynd 1.<br />
Tafla 1: Gögn um orkunotkun heimila.<br />
Bil Fjöldi Hlutfalls- Safntíðni<br />
MW stundir/ár leg tíðni<br />
iii) Greina- og laufarit (e. stem and leaf plots)<br />
1-3 1 0,011 0,011<br />
3-5 1 0,011 0,022<br />
5-7 11 0,122 0,144<br />
7-9 21 0,233 0,378<br />
9-11 25 0,278 0,656<br />
11-13 17 0,189 0,844<br />
13-15 9 0,100 0,944<br />
15-17 4 0,044 0,989<br />
17-19 1 0,011 1,000<br />
Greina- og laufarit gefa gróft mat á þéttleika, f(x), samfelldra gagna eða á líkindafalli,<br />
p(x) = Pr(X = x), strjálla gagna. Eftirfarandi skref eru tekin:<br />
- grúppum gögnin eftir fyrri hluta talnanna (grein)<br />
- ritum seinni hluta talnanna á eftir (lauf)<br />
Dæmi: Gögn um meðalhita nokkurra fylkja (í gráðum á Fahrenheit):<br />
x1 = 57, x2 = 59, x3 = 55, x4 = 57, x5 = 36, x6 = 45,<br />
x7 = 51, x8 = 39, x9 = 41, x10 = 40, x11 = 46, x12 = 36,<br />
x13 = 44, x14 = 29, x15 = 35, x16 = 43, x17 = 33, x18 = 69.<br />
6
Mat á f(x)<br />
Mat á F(x)<br />
0.15<br />
0.1<br />
0.05<br />
0<br />
0 2 4 6 8 10<br />
MW stundir/ár (x)<br />
12 14 16 18 20<br />
1<br />
0.8<br />
0.6<br />
0.4<br />
0.2<br />
0<br />
0 2 4 6 8 10<br />
MW stundir/ár (x)<br />
12 14 16 18 20<br />
Mynd 1: Tíðnirit (efri myndin) og safntíðnirit (neðri myndin) af gögnum um orkunotkun<br />
heimila.<br />
1.2 Tölulegar aðferðir<br />
i) Reiknistærðir fyrir miðju úrtaks<br />
Greinar Lauf<br />
2 9<br />
3 6 9 6 5 3<br />
4 5 1 0 6 4 3<br />
5 7 9 5 7 1<br />
6 9<br />
SKILGREINING. Segjum að úrtak af stærðn, hafi eftirfarandi gildi: x1,x2, ...,xn. Meðaltal<br />
úrtaks (e. sample mean), táknað með ¯x, er skilgreint með<br />
¯x = 1<br />
n<br />
7<br />
n<br />
xi.<br />
i=1
SKILGREINING. Segjum að úrtak af stærð n, hafi eftirfarandi röðuð gildi:<br />
x(1) < x(2) < ... < x(n−1) < x(n).<br />
Miðgildi úrtaks (e. sample median), táknað með ˜x, er skilgreint með<br />
⎧<br />
⎨ x(n/2+1/2)<br />
efner oddatala,<br />
˜x =<br />
⎩<br />
1<br />
2 {x(n/2) +x(n/2+1)} efner slétt tala.<br />
SKILGREINING. Tíðasta gildi úrtaks (e. sample mode) er gildið sem kemur oftast fyrir.<br />
Dæmi: Gögn um meðalhita nokkurra fylkja. Meðaltal úrtaks er<br />
¯x = 1<br />
n<br />
n<br />
i=1<br />
xi = 1<br />
×815 = 45,28.<br />
18<br />
Úrtakið er af stærð n = 18 sem er slétt tala. Röðuðum gögnunum<br />
x(1) = 29, x(2) = 33, x(3) = 35, x(4) = 36, x(5) = 36, x(6) = 39,<br />
x(7) = 40, x(8) = 41, x(9) = 43, x(10) = 44, x(11) = 45, x(12) = 46,<br />
x(13) = 51, x(14) = 55, x(15) = 57, x(16) = 57, x(17) = 59, x(18) = 69.<br />
Miðgildi úrtaks er<br />
˜x = 1<br />
2 {x(n/2) +x(n/2+1)} = 1<br />
2 {x(9) +x(10)} = 1<br />
2<br />
{43+44} = 43,5.<br />
Tíðasta stærð úrtaks eru tölurnar 36 og 57. Hér segja þessar tölur okkur lítið. Flestar tölurnar<br />
eru á bilinu 40 til 50.<br />
ii) Sætisstærðir úrtaks (e. sample percentiles)<br />
SKILGREINING. 100p-ta sætisstærð úrtaks er tala í úrtakinu sem er þannig að minnsta<br />
kosti 100p% af gögnunum eru minni eða jöfn tölunni og að minnsta kosti 100(1 − p)% af<br />
gögnunum eru stærri eða jöfn tölunni. Ef tvær tölur í úrtakinu uppfylla þessu skilyrði þá er<br />
100p-ta sætisstærð úrtaksins meðaltalið af þessum tveimur tölum.<br />
Dæmi: Gögn um meðalhita nokkurra fylkja.<br />
25. sætisstærðin= x(5) = 36<br />
8
(np = 18×0,25 = 4,5 => 5. talan).<br />
33,3. sætisstærðin= 0,5(x(6) +x(7)) = 0,5(39+40) = 39,5<br />
(np = 18×0,333 = 6=> 6. og 7. talan).<br />
50. sætisstærðin= 0,5(x(9) +x(10)) = 0,5(43+44) = 43,5<br />
(np = 18×0,5 = 9 => 9. og 10. talan).<br />
67,7. sætisstærðin= 0,5(x(12) +x(13)) = 0,5(46+51) = 48,5<br />
(np = 18×0,667 = 12=> 12. og 13. talan).<br />
75. sætisstærðin = = x(14) = 55<br />
(np = 18×0,75 = 13,5 => 14. talan).<br />
Þrjár sætisstærðir hafa sérstök nöfn<br />
Q1 = 25. sætisstærð úrtaks er kölluð fyrsta fjóðungsmark úrtaks (e. first quartile).<br />
Q2 = 50. sætisstærð úrtaks er kölluð annað fjóðungsmark úrtaks (e. second quartile).<br />
Q3 = 75. sætisstærð úrtaks er kölluð þriðja fjóðungsmark úrtaks (e. third quartile).<br />
Athugið aðQ2 = ˜x, þar sem ˜x er miðgildið. Þessar þrjár stærðir skipta samfelldri dreifingu í<br />
fjóra jafna hluta. Mynd 2 sýnir tíðnirit og safntíðnirit af gögnunum ásamt fjóðungsmörkum.<br />
iii) Reiknistærðir fyrir dreifni úrtaks<br />
SKILGREINING. Segjum að úrtak af stærð n, hafi eftirfarandi gildi; x1, x2, ..., xn. Dreifni<br />
úrtaks (e. sample variance), táknað meðs 2 , er skilgreint með<br />
s 2 = 1<br />
n−1<br />
n<br />
(xi − ¯x) 2 , n ≥ 2.<br />
i=1<br />
SKILGREINING. Staðalfrávik úrtaks (e. sample standard deviation) af stærð n, er táknað<br />
með s, og er skilgreint með<br />
Regla um fervikasummu<br />
s = √ s 2 .<br />
n<br />
(xi − ¯x) 2 =<br />
i=1<br />
9<br />
n<br />
x 2 i −n¯x2 .<br />
i=1
Mat á f(x)<br />
Mat á F(x)<br />
0.08<br />
0.06<br />
0.04<br />
0.02<br />
Q 1<br />
Q 2<br />
25% 25% 25% 25%<br />
0<br />
20 25 30 35 40 45 50 55 60 65 70 75<br />
Hiti [°F] (x)<br />
1<br />
0.8<br />
0.6<br />
0.4<br />
0.2<br />
Q 1<br />
Q 2<br />
0<br />
20 25 30 35 40 45 50 55 60 65 70 75<br />
Hiti [°F] (x)<br />
Mynd 2: Tíðnirit (efri myndin) og safntíðnirit (neðri myndin) af gögnum um meðalhita<br />
nokkurra fylkja ásamt fjóðungsmörkum.<br />
Dæmi: Gögn um meðalhita nokkurra fylkja.<br />
n<br />
(xi − ¯x) 2 =<br />
i=1<br />
n<br />
i=1<br />
x 2 i<br />
= 38841,<br />
Q 3<br />
n<br />
x 2 i −n¯x 2 = 38841−18×45,28 2 = 1935,99,<br />
i=1<br />
s 2 = 1<br />
n−1<br />
n<br />
i=1<br />
(xi − ¯x) 2 = 1<br />
17<br />
s = √ s 2 = 10,67.<br />
Q 3<br />
×1935,99 = 113,88,<br />
SKILGREINING. Fjórðungsbil úrtaks (e. sample interquartile range) er táknað með IQR<br />
og er skilgreint með<br />
Dæmi: Gögn um meðalhita nokkurra fylkja.<br />
IQR = Q3 −Q1.<br />
IQR = Q3 −Q1 = 55−36 = 19.<br />
10
1.3 Myndrænar aðferðir II<br />
i) Kassarit (e. box plots)<br />
Byggir á stærðum byggðum á úrtakinu.<br />
1) minnsta mælingin í úrtakinu<br />
2)Q1<br />
3)Q2 = ˜x<br />
4)Q3<br />
5) stærsta mælingin í úrtakinu<br />
Mynd 3 sýnir kassarit fyrir gögnin um meðalhita nokkurra fylkja. Stærðirnar Q1, Q2 og Q3<br />
ákveða lögun kassans. Minnsta mælingin ákveður hversu langt línan nær niður frá Q1 og<br />
stærsta mælingin ákveður hversu hátt línan nær upp fráQ3.<br />
Ef minnsta mælingin er minni en (Q1 − 1,5IQR) nær línan frá Q1 aðeins niður að<br />
minnstu mælingunni sem er stærri en (Q1 − 1,5IQR) og mælingarnar sem eru minni en<br />
(Q1 − 1,5IQR) eru merktar með plús. Að sama skapi ef stærsta mælingin er stærri en<br />
(Q3 +1,5IQR) nær línan frá Q3 aðeins upp að stærstu mælingunni sem er minni en (Q3 +<br />
1,5IQR) og mælingarnar sem eru stærri en (Q3 +1,5IQR) eru merktar með plús. Mynd 4<br />
sýnir kassarit af hermdum gögnum. Gögnin voru hermd með ákveðinni dreifingu til að ná<br />
fram nokkrum mælingum sem voru sérstaklega stórar og litlar og því merktar með plús.<br />
11
x<br />
Hiti [°F] (x)<br />
70<br />
65<br />
60<br />
55<br />
50<br />
45<br />
40<br />
35<br />
30<br />
Mynd 3: Kassarit af gögnum um meðalhita nokkurra fylkja.<br />
3<br />
2<br />
1<br />
0<br />
−1<br />
−2<br />
−3<br />
1<br />
1<br />
max<br />
min<br />
max<br />
Q 3<br />
Q 2<br />
Q 1<br />
x ≤ Q 3 +1.5*IQR<br />
Q 3<br />
Q 2<br />
Q 1<br />
x ≥ Q 1 −1.5*IQR<br />
min<br />
Mynd 4: Kassarit af hermdum gögnum.<br />
12
ii) Dreififall úrtaks (e. empirical cumulative distribution function)<br />
Dreififall úrtaks gefur mat á dreififalli, F(x) = Pr(X ≤ x), fyrir bæði samfelldar og strjálar<br />
breytur. Það byggir á röðuðum gildum úrtaksins, það er, x(1) < x(2) < ... < x(n), þar sem<br />
matið á dreififallinuF(x) er<br />
⎧<br />
⎪⎨<br />
0, ef x < x(1),<br />
ˆF(x) = j/n, ef x(j) ≤ x < x(j+1), j = 1,...,n−1,<br />
⎪⎩<br />
1 ef x ≥ x(n).<br />
Mynd 5 sýnir dreififall úrtaks fyrir gögnin um meðalhita nokkurra fylkja. Lokaður hringur<br />
táknar að endapunktur sé meðtalinn á tilsvarandi bili en opinn hringur táknar að endapunktur<br />
sé ekki meðtalinn á bilinu.<br />
Mat á F(x)<br />
1<br />
0.9<br />
0.8<br />
0.7<br />
0.6<br />
0.5<br />
0.4<br />
0.3<br />
0.2<br />
0.1<br />
0<br />
25 30 35 40 45 50<br />
Hiti [°F] (x)<br />
55 60 65 70 75<br />
Mynd 5: Dreififall úrtaks af gögnum um meðalhita nokkurra fylkja.<br />
13
2 Dreifing lýsistærða<br />
2.1 Slembiúrtak og lýsistærðir<br />
SKILGREINING. Látum X1, X2, ..., Xn vera óháðar slembistærðir sem fylgja sömu dreif-<br />
inguF . Við segjum að saman myndiX1,X2, ...,Xn slembiúrtak úrF .<br />
SKILGREINING. Lýsistærð (e. sampling statistic) er stærð (formúla) sem byggir á slembiúr-<br />
taki. Lýsistærð er því slembistærð.<br />
Ef við gerum ráð fyrir að dreifingunniF sé lýst með falli sem er háð einum eða fleiri stikum<br />
þá er markmiðið að nota slembiúrtak úr F til að meta stikana í F . Lýsistærð byggir á<br />
slembiúrtakinu og við viljum finna út hvernig við getum notað eiginleika lýsistærðarinnar til<br />
að meta stikana í F . Lýsistærð er slembistærð sem hefur dreifingu, meðalgildi, dreifni og<br />
svo framvegis.<br />
2.2 Meðaltal slembiúrtaks<br />
SKILGREINING. Látum X1, X2, ..., Xn vera slembiúrtak úr dreifingu F með meðalgildiµ<br />
og dreifniσ 2 . Meðaltal slembiúrtaks, táknað ¯ X, er lýsistærð sem er skilgreind með<br />
¯X = 1<br />
n<br />
n<br />
Xi.<br />
Meðaltal slembiúrtaks er dæmi um lýsistærð. Hér fyrir neðan er meðalgildi og dreifni ¯ X<br />
fundið. Gerum ráð fyrir að X1, X2, ..., Xn myndi slembiúrtak úr dreifingu F , og að meðal-<br />
gildi og dreifni F séu µ ogσ 2 , það er<br />
i=1<br />
E(Xi) = µ, var(Xi) = σ 2 < ∞, i = 1,...,n.<br />
Það að X1, X2, ..., Xn myndi slembiúrtak fellur einnig í sér að slembibreyturnar eru inn-<br />
byrðis óháðar. Út frá þessum staðreyndum reiknum við meðalgildi ¯ X<br />
E <br />
<br />
n<br />
<br />
X¯ 1<br />
= E Xi =<br />
n<br />
1<br />
n E<br />
<br />
n<br />
<br />
Xi<br />
i=1<br />
14<br />
i=1
og dreifni ¯ X<br />
= 1<br />
n<br />
n<br />
i=1<br />
= 1<br />
<br />
n<br />
<br />
var Xi =<br />
n2 i=1<br />
1<br />
n2 E(Xi) = 1<br />
n<br />
var ¯ X = var<br />
= 1<br />
n 2<br />
n<br />
i=1<br />
<br />
1<br />
n<br />
µ = 1<br />
nµ = µ,<br />
n<br />
n<br />
i=1<br />
Xi<br />
<br />
n<br />
var(Xi) (X-in eru innibyrðis óháð)<br />
i=1<br />
n<br />
i=1<br />
SETNING. Meðalgildi og dreifni ¯ X eru<br />
σ 2 = 1<br />
n 2nσ2 = σ2<br />
n .<br />
E ¯ X = µ, var ¯X = σ 2<br />
n .<br />
Þar sem meðalgildi eða væntigildi ¯ X er µ þá getum við notað ¯ X til að meta µ. Dreifni ¯ X<br />
minnkar eftir því sem n stækkar. Því fáum við betra mat áµeftir því sem n stækkar (að því<br />
gefnu að σ 2 < ∞).<br />
2.3 Höfuðmarkgildisreglan<br />
SETNING. (Höfuðmarkgildisreglan) Látum X1, X2, ..., Xn vera slembiúrtak úr dreifingu<br />
F . Meðalgildi og dreifni dreifingarinnar F er táknað með µ og σ 2 (σ 2 < ∞). Þá má nálga<br />
dreifingu<br />
W = X1 +X2 +...+Xn =<br />
með normaldreifingu með meðalgildinµ og dreifni nσ 2 ef n er nægjanlega stórt.<br />
Byggt á höfuðmarkgildisreglunni má nálga dreifingu<br />
n<br />
i=1<br />
Xi<br />
¯X = 1<br />
n (X1 +X2 +...+Xn) = 1<br />
n W<br />
með normaldreifingu með meðalgildiµog dreifniσ 2 /n efner nægjanlega stórt. Ef dreifing<br />
W er því sem næst normaldreifing þá hefur dreifing ¯ X = n −1 W sömu lögun og dreifingW ,<br />
er einfaldlega kvörðuð útgáfa af dreifingu W .<br />
15
eða<br />
eða<br />
LátumZ ∼ N(0,1). Þá má rita<br />
<br />
X1 +...+Xn −nµ<br />
Pr<br />
σ √ <br />
≤ x ≈ Pr(Z ≤ x)<br />
n<br />
−1 n (X1 +...+Xn)−µ<br />
Pr<br />
n−1σ √ <br />
≤ x ≈ Pr(Z ≤ x)<br />
n<br />
<br />
¯X −µ<br />
Pr<br />
σ/ √ <br />
≤ x ≈ Pr(Z ≤ x).<br />
n<br />
Líkurnar á að ¯ X sé minna eða jafnt og einhver talaumá nálga með<br />
Pr( ¯ <br />
¯X −µ<br />
X ≤ u) = Pr<br />
σ/ √ u−µ<br />
≤<br />
n σ/ √ <br />
≈ Pr Z ≤<br />
n<br />
u−µ<br />
σ/ √ <br />
.<br />
n<br />
Yfirleitt fæst góð nálgun ef n > 30 en í mörgum tilfellum dugar minna n. Ef X1, ..., Xn<br />
fylgja normaldreifingu þá fylgir ¯ X normaldreifingu fyrir ölln ≥ 1.<br />
Dæmi. Látum Xi tákna líftíma i-tu ljósaperunnar þar sem X1, ..., Xn mynda slembi-úrtak<br />
úr veldisdreifingu<br />
Xi ∼ Expon(λ = 1/2), i = 1,...,n,<br />
E(Xi) = µ = 1/λ = 2 mánuðir, var(Xi) = σ 2 = 1/λ 2 = 2 2 mánuðir 2 .<br />
Hverjar eru líkurnar á að meðallíftímin = 49 ljósapera sé lengri en 2,5 mánuðir?<br />
Pr( ¯ X > 2,5) = 1−Pr( ¯ <br />
¯X −µ<br />
X ≤ 2,5) = 1−Pr<br />
σ/ √ 2,5−µ<br />
≤<br />
n σ/ √ <br />
n<br />
<br />
¯X −2<br />
= 1−Pr<br />
2/ √ 2,5−2<br />
≤<br />
49 2/ √ <br />
≈ 1−Pr Z ≤<br />
49<br />
1/2<br />
<br />
= 1−Pr(Z ≤ 7/4)<br />
2/7<br />
= 1−Pr(Z ≤ 1,75) = 1−0,9599 = 0,0401.<br />
Nákvæmt gildi á líkunum Pr( ¯ X > 2,5) er 0,0476. Nálgun er því viðunandi góð fyrir n af<br />
þessari stærðargráðu þegarX-in fylgja veldisdreifingu.<br />
Mynd 6 sýnir dreifingu ¯ X fyrir nokkur mismunandinþegar X-in fylgja veldisdreifingu<br />
með meðalgildi 2. Á myndinni má sjá hvernig dreifing ¯ X færist nær því að líkjast normal-<br />
dreifingu með meðalgildi 2 eftir því sem n vex.<br />
16
f(xbar)<br />
1<br />
0.9<br />
0.8<br />
0.7<br />
0.6<br />
0.5<br />
0.4<br />
0.3<br />
0.2<br />
0.1<br />
X i ~ exp(λ=0.5), i=1,...,n, E(X i )=2, Var(X i )=4<br />
0<br />
0 1 2 3 4 5<br />
xbar<br />
6 7 8 9 10<br />
Mynd 6: Dreifing ¯ X þegarX-in fylgja veldisdreifingu fyrir nokkur mismunandin.<br />
n=20<br />
n=10<br />
n=5<br />
n=1<br />
Mynd 7 sýnir einnig dreifingu ¯ X fyrir nokkur mismunandi n þegar X-in fylgja veldis-<br />
dreifingu með meðalgildi 2. Brotna punktalínan sýnir normaldreifingu með sama meðalgildi<br />
og sömu dreifni og dreifing ¯ X og gefur hugmynd um hversu góða nálgun normaldreifing<br />
gefur. Á mynd 7 má sjá að eftir því sem n vex þeim mun betri verður nálgun með normal-<br />
dreifingu.<br />
2.4 Dreifni slembiúrtaks<br />
SKILGREINING. Látum X1, X2, ..., Xn vera slembiúrtak úr dreifingu F með meðalgildiµ<br />
og dreifniσ 2 . Dreifni slembiúrtaks, táknað S 2 , er lýsistærð sem er skilgreind með<br />
Lýsistærðin<br />
S 2 = 1<br />
n−1<br />
er kölluð staðalfrávik slembiúrtaks.<br />
n<br />
(Xi − ¯ X) 2 , n ≥ 2.<br />
i=1<br />
S = √ S 2<br />
17
f(xbar)<br />
f(xbar)<br />
f(xbar)<br />
2<br />
1.5<br />
1<br />
0.5<br />
n=1<br />
0<br />
0 1 2 3 4<br />
2<br />
1.5<br />
1<br />
0.5<br />
n=10<br />
0<br />
0 1 2 3 4<br />
2<br />
1.5<br />
1<br />
0.5<br />
n=50<br />
0<br />
0 1 2<br />
xbar<br />
3 4<br />
2<br />
1.5<br />
1<br />
0.5<br />
n=5<br />
0<br />
0 1 2 3 4<br />
2<br />
1.5<br />
1<br />
0.5<br />
n=25<br />
0<br />
0 1 2 3 4<br />
2<br />
1.5<br />
1<br />
0.5<br />
n=75<br />
0<br />
0 1 2<br />
xbar<br />
3 4<br />
Mynd 7: Dreifing ¯ X þegar úrtakið er af stærðn = 1,5,10,25,50,75, ogX-in fylgja veldis-<br />
dreifingu (samfelldu línurnar) ásamt nálgun á dreifingunum með normaldreifingum (brotnu<br />
punktalínurnar).<br />
SETNING. VæntigildiS 2 er<br />
Sönnun. Höfum að<br />
og því<br />
E(S 2 ) = σ 2 .<br />
n<br />
(Xi − ¯ X) 2 =<br />
i=1<br />
(n−1)S 2 =<br />
n<br />
X 2 i −n ¯ X 2<br />
i=1<br />
n<br />
X 2 i −n ¯ X 2 .<br />
i=1<br />
Einnig gildir að ef Y er slembibreyta þá gildir að<br />
Því er<br />
E(Y 2 ) = var(Y)+{E(Y)} 2 .<br />
E{(n−1)S 2 <br />
n<br />
} = E X 2 i −n ¯ X 2<br />
<br />
18<br />
i=1
Og því er<br />
=<br />
n<br />
E(X 2 i)−nE( ¯ X 2 )<br />
i=1<br />
= nE(X 2 1 )−n[var( ¯ X)+{E( ¯ X)} 2 ]<br />
= n[var(X1)+{E(X1)} 2 ]−n[σ 2 /n+µ 2 ]<br />
= n[σ 2 +µ 2 ]−σ 2 −nµ 2<br />
= nσ 2 +nµ 2 −σ 2 −nµ 2 = (n−1)σ 2 .<br />
E(S 2 ) = σ 2 . <br />
Hér eru nokkrar athugasemdir. Ef við notumnístað (n−1) fæst<br />
<br />
n 1<br />
E (Xi −<br />
n<br />
¯ X) 2<br />
<br />
= (n−1)<br />
σ<br />
n<br />
2 .<br />
Efµer þekkt þá notum viðnístað(n−1), það er,<br />
<br />
n 1<br />
E (Xi −µ)<br />
n<br />
2<br />
<br />
= σ 2 .<br />
Um staðalfrávikið gildir að<br />
i=1<br />
i=1<br />
ÞegarX-in fylgja normaldreifingu gildir að<br />
E(S) = σ.<br />
Γ(n/2)<br />
E(S) = σ<br />
√ 2<br />
Γ((n−1)/2) √ n−1 .<br />
2.5 Skilgreiningar áz-dreifingu,χ 2 -dreifingum,t-dreifingum ogF -dreifingum<br />
2.5.1 z-dreifing (stöðluð normaldreifing)<br />
Samfellda slembistærðinZ fylgir staðlaðri normaldreifingu, ritað<br />
ef þéttleikiZ er á forminu<br />
Z ∼ N(0,1)<br />
fZ(z) = 1<br />
√ 2π e −z2 /2 , −∞ < z < ∞.<br />
19
Dreififall Z er táknað meðΦ(z) þar sem<br />
UmZ gildir að<br />
Skilgreinum tölunazα með<br />
það er<br />
Φ(z) = Pr(Z ≤ z) =<br />
z<br />
−∞<br />
fZ(z)dz, −∞ < z < ∞.<br />
E(Z) = 0, var(Z) = 1.<br />
zα = 100(1−α)-ta sætisstærðin í staðlaðri normaldreifingu<br />
Pr(Z ≤ zα) = Φ(zα) = 1−α.<br />
Tafla A1 bls. 612 í Ross gefur gildi á Φ(z) fyrir valinz á bilinu 0 til3,49. Tafla A3 bls. 614<br />
í Ross gefur gildi á zα fyrir valin α, sjá neðstu línuna í töflu A3 þar sem n = ∞. Mynd 8,<br />
efst til vinstri, sýnir staðlaða normaldreifingu.<br />
2.5.2 χ 2 -dreifingar (kí-kvaðratsdreifingar)<br />
Samfellda slembistærðinY fylgir kí-kvaðratsdreifingu meðr frítölur, ritað<br />
efY hefur sömu dreifingu og<br />
þar sem Z1, ...,Zr eru óháðar og<br />
ÞéttleikiY er á forminu<br />
fY(y) =<br />
Y ∼ χ 2 r<br />
Z 2 1 +...+Z 2 r =<br />
r<br />
j=1<br />
Z 2 j<br />
Zj ∼ N(0,1), j = 1,...,r.<br />
1<br />
Γ(r/2)2 r/2yr/2−1 e −y/2 , 0 ≤ y < ∞,<br />
20
þar sem Γ(·) er kallað gamma-fallið og er skilgreint sem<br />
UmY gildir að<br />
Skilgreinum tölunaχ 2 α,r með<br />
það er<br />
∞<br />
Γ(α) =<br />
0<br />
u α−1 e −u du.<br />
E(Y) = r, var(Y) = 2r.<br />
χ 2 α,r = 100(1−α)-ta sætisstærðin í χ2 -dreifingu með r frítölur<br />
Pr(Y ≤ χ 2 α,r ) = 1−α.<br />
Tafla A2 bls. 613 í Ross gefur gildi á χ 2 α,r fyrir valinαog r. Mynd 8, neðst til vinstri, sýnir<br />
kí-kvaðratsdreifingar með 5, 10 og 20 frítölur.<br />
2.5.3 t-dreifingar<br />
Samfellda slembistærðinT fylgirt-dreifingu meðr frítölur, ritað<br />
efT hefur sömu dreifingu og<br />
þar sem Z og Y eru óháðar og<br />
ÞéttleikiT er á forminu<br />
UmT gildir að<br />
fT(t) =<br />
T ∼ tr<br />
Z<br />
Y/r<br />
Z ∼ N(0,1), Y ∼ χ 2 r .<br />
Γ((r +1)/2)<br />
√ rπΓ(r/2) (1+t 2 /r) −(r+1)/2 , −∞ < t < ∞.<br />
E(T) = 0, r > 1, var(T) = r<br />
, r > 2.<br />
r −2<br />
21
Skilgreinum tölunatα,r með<br />
það er<br />
tα,r = 100(1−α)-ta sætisstærðin ít-dreifingu með r frítölur<br />
Pr(T ≤ tα,r) = 1−α.<br />
Tafla A3 bls. 614 í Ross gefur gildi á tα,r fyrir valin α og r. Mynd 8, efst til hægri, sýnir<br />
t-dreifingar með 1 og 5 frítölur.<br />
2.5.4 F -dreifingar<br />
Samfellda slembistærðinF fylgirF -dreifingu með r og s frítölur, ritað<br />
efF hefur sömu dreifingu og<br />
þar sem V og W eru óháðar og<br />
ÞéttleikiF er á forminu<br />
fF(x) =<br />
UmF gildir að<br />
F ∼ Fr,s<br />
V/r<br />
W/s<br />
V ∼ χ 2 r , W ∼ χ2 s .<br />
Γ((r +s)/2)(r/s)r/2<br />
x<br />
Γ(r/2)Γ(s/2)<br />
r/2−1 {1+x(r/s)} −(r+s)/2 , 0 ≤ x < ∞.<br />
E(F) = s<br />
s−2 , s > 2, var(F) = 2s2 (r +s−2)<br />
r(s−4)(s−2) 2,<br />
s > 4.<br />
Skilgreinum tölunaFα,r,s með<br />
það er<br />
Fα,r,s = 100(1−α)-ta sætisstærðin íF -dreifingu meðr ogsfrítölur<br />
Pr(F ≤ Fα,r,s) = 1−α.<br />
Tafla A4 bls. 615 í Ross gefur gildi á Fα,r,s fyrir valin α, r og s. Mynd 8, neðst til hægri,<br />
sýnirF -dreifingu með frítölurr = 10 ogs = 20.<br />
22
f Z (z)<br />
f χ (χ)<br />
0.4<br />
0.3<br />
0.2<br />
0.1<br />
0<br />
−5 0<br />
z<br />
5<br />
0.15<br />
0.1<br />
0.05<br />
0<br />
0 10 20 30 40<br />
χ<br />
f T (t)<br />
f F (f)<br />
0.4<br />
0.3<br />
0.2<br />
0.1<br />
0<br />
−5 0<br />
t<br />
5<br />
1<br />
0.8<br />
0.6<br />
0.4<br />
0.2<br />
0<br />
0 1 2 3 4<br />
f<br />
Mynd 8: Stöðluð normaldreifing (efst til vinstri), t-dreifingar með 1 og 5 frítölur (efst til<br />
hægri), kí-kvaðratsdreifingar með 5, 10 og 20 frítölur (neðst til vinstri) og F -dreifing með<br />
frítölurr = 10 ogs = 20 (neðst til hægri).<br />
2.6 Dreifing lýsistærða sem byggðar eru á slembiúrtaki úr normal-<br />
dreifingu<br />
SETNING. LátumX1, ..., Xn vera slembiúrtak úr normaldreifingu<br />
Þá eru ¯ X og S 2 óháðar, og<br />
Xi ∼ N(µ,σ 2 ), i = 1,...,n.<br />
<br />
¯X ∼ N µ, σ2<br />
<br />
,<br />
n<br />
(n−1)S 2<br />
σ 2<br />
∼ χ 2 n−1 .<br />
Setningin gefur dreifingu ¯ X ogS 2 þegar slembiúrtakið er úr normaldreifingu. Athugið að ¯ X<br />
ogS 2 eru óháðar aðeins ef slembiúrtakið er úr normaldreifingu. Í raun er ótrúlegt að ¯ X ogS 2<br />
geti verið óháðar. Út frá setningunni má finna væntigildi og dreifni S 2 þegar slembiúrtakið<br />
23
er úr normaldreifingu. Höfum að<br />
2 (n−1)S<br />
E<br />
σ2 2 (n−1)S<br />
= n−1, var<br />
σ2 <br />
= 2(n−1),<br />
og því<br />
E(S 2 ) = σ 2 , var(S 2 ) = 2σ4<br />
n−1 .<br />
SETNING. LátumX1, ..., Xn vera slembiúrtak úr normaldreifingu<br />
Þá gildir að<br />
Sönnun. Höfum að<br />
Xi ∼ N(µ,σ 2 ), i = 1,...,n.<br />
T = ( ¯ X −µ)<br />
S/ √ n<br />
Z = ( ¯ X −µ)<br />
σ/ √ n<br />
Y = (n−1)S2<br />
σ 2<br />
∼ tn−1<br />
∼ N(0,1),<br />
∼ χ 2 n−1 .<br />
Þessar tvær stærðir eru óháðar því þær eru skalaðar útgáfur af ¯ X og S 2 en þær eru óháðar<br />
samkvæmt setningunni hér á undan. Því er<br />
Z<br />
Y/(n−1) =<br />
√ n( ¯ X −µ)/σ<br />
(n−1)S 2 σ −2 /(n−1)<br />
= ( ¯ X −µ)<br />
S/ √ n ∼ tn−1. <br />
SETNING. LátumX1, ..., Xn vera slembiúrtak úr normaldreifingu<br />
Xi ∼ N(µ1,σ 2 1 ), i = 1,...,n,<br />
og látumY1, ..., Ym vera slembiúrtak úr normaldreifingu<br />
þar sem X-in eru óháð Y -unum. Látum<br />
S 2 1<br />
= 1<br />
n−1<br />
Yi ∼ N(µ2,σ 2 2 ), i = 1,...,m,<br />
n<br />
(Xi − ¯ X) 2 , S 2 2<br />
i=1<br />
24<br />
= 1<br />
m−1<br />
m<br />
(Yi − ¯ Y) 2 .<br />
i=1
Þá gildir<br />
Sönnun. Höfum að<br />
V = (n−1)S2 1<br />
σ 2 1<br />
F = S2 1 /σ2 1<br />
S 2 2 /σ2 2<br />
∼ Fn−1,m−1.<br />
∼ χ 2 n−1 , W = (m−1)S2 2<br />
σ 2 2<br />
∼ χ 2 m−1 ,<br />
ogV ogW eru óháðar slembibreytur þar semX-in eru óháðY-unum. Samkvæmt skilgrein-<br />
ingunni hér að ofan umF -dreifingar, gildir að<br />
V/(n−1)<br />
W/(m−1) = (n−1)S2 1σ−2 1 /(n−1)<br />
(m−1)S 2 2σ −2<br />
2 /(m−1) = S2 1 /σ2 1<br />
S2 2/σ2 2<br />
25<br />
∼ Fn−1,m−1.
3 Metlar og punktmat<br />
3.1 Almennt um metla og punktmat<br />
Sambandinu á milli líkindafræði og ályktunartölfræði má lýsa með framsetningunni hér fyrir<br />
neðan. Líkindafræðin lýsir hegðun úrtaksins úr gefnu þýði. Ályktunartölfræðin gengur út á<br />
að nota úrtakið til að læra um þýðið.<br />
↑ → Líkindafræði → ↓<br />
↑ ↓<br />
ÞÝÐI ÚRTAK<br />
↑ ↓<br />
↑ ← Ályktunartölfræði ← ↓<br />
SKILGREINING. Punktmat (e. point estimate) á stikanum θ er tala sem er „góð ágiskun“<br />
á rétta gildi θ. Punktmatið er reiknað með því að setja fengin gildi í úrtakinu inn í formúlu.<br />
Þegar formúlan inniheldur stærðirnar í slembiúrtakinu er hún kölluð metill (e. estimator)<br />
stikansθ. Metill er því slembistærð.<br />
Dæmi. Viljum meta µ í normaldreifingu. Höfum úrtak af stærð n = 3 úr normaldreifingu<br />
þar sem fengin gildi eru<br />
x1 = 5,6, x2 = 9,1, x3 = 8,5.<br />
LátumX1,X2 ogX3 tákna slembiúrtak úr normaldreifingu. Notum<br />
sem metil fyrirµ. Aftur á móti er<br />
¯x = 1<br />
3<br />
3<br />
i=1<br />
¯X = 1<br />
3<br />
3<br />
i=1<br />
Xi<br />
xi = 1<br />
(5,6+9,1+8,5) = 7,73<br />
3<br />
26
punktmatið á stikanumµbyggt á úrtakinu hér að ofan.<br />
3.2 Hugmyndin að baki aðferð sennilegustu gilda<br />
Dæmi. 3 kúlur í kassa.<br />
2.<br />
- Höfum 3 kúlur í lokuðum kassa.<br />
- Kúlurnar eru rauðar eða hvítar.<br />
- Drögum þrisvar sinnum en skilum kúlu tilbaka í hvert skipti.<br />
- LátumX = fjölda rauðra kúla af þremur.<br />
- Því er X ∼ Bin(3,p).<br />
- Möguleg gildi áperu; p = 0, p = 1/3,p = 2/3, p = 1.<br />
- Mögulegar dreifingar fyrir X, það er, líkurnar á X = x fyrir gefið p, eru gefnar í töflu<br />
Tafla 2: Líkurnar á að X = x fyrirp = 0, p = 1/3,p = 2/3 ogp = 1.<br />
Pr(X = x|p) x = 0 x = 1 x = 2 x = 3<br />
p = 0 1 0 0 0<br />
p = 1/3 8/27 12/27 6/27 1/27<br />
p = 2/3 1/27 6/27 12/27 8/27<br />
p = 1 0 0 0 1<br />
Athugið að líkurnar í töflunni eru reiknaðar með líkindafalli tvíkostadreifingarinnar þegar<br />
n = 3, það er,<br />
Pr(X = x|p) =<br />
<br />
3<br />
p<br />
x<br />
x (1−p) 3−x =<br />
3!<br />
(3−x)!x! px (1−p) 3−x , x = 0,1,2,3.<br />
Gerum ráð fyrir að við vitum ekki gildi p. Ef við fáum X = 1, hvað er sennilegasta gildið<br />
á p? Mynd 9 sýnir líkurnar á að X = 1 fyrir möguleg gildi á p. Af mynd 9 og töflunni<br />
hér að ofan er ljóst að p = 1/3 gefur stærsta gildið á Pr(X = 1|p). Því segjum við að fyrir<br />
ofangreinda útkomu úr tilrauninni (X = 1) þá er sennilegasta gildið á p jafnt 1/3. Athugið<br />
27
að stundum er ritað<br />
P(X=1|p)<br />
0.5<br />
0.45<br />
0.4<br />
0.35<br />
0.3<br />
0.25<br />
0.2<br />
0.15<br />
0.1<br />
0.05<br />
0<br />
3.3 Aðferð sennilegustu gilda<br />
f(x|p) = Pr(X = x|p).<br />
0 0.1 0.2 0.3 0.4 0.5<br />
p<br />
0.6 0.7 0.8 0.9 1<br />
Mynd 9: Líkurnar Pr(X = 1|p) sem fall af p.<br />
SKILGREINING. Látum X1, ..., Xn vera samfelldar (strjálar) slembibreytur sem hafa sam-<br />
þéttifall (samlíkindafall) sem er háð stikavigrinumθ = (θ1,...,θm) T , ritað<br />
f(x1,...,xn|θ).<br />
Fyrir tiltekna útkomu; X1 = x1, ..., Xn = xn, má líta á f sem fall af θ. Köllum fallið<br />
sennileikafall θ (e. the likelihood function of θ) ritað L(θ|x1,...,xn) eða einfaldlega L(θ).<br />
Látumx = (x1,...,xn) T , en þá má rita<br />
L(θ) = L(θ|x1,...,xn) = f(x1,...,xn|θ)<br />
= L(θ|x) = f(x|θ).<br />
28
Lograsennileikafallθ, ritaðl(θ), er skilgreint sem<br />
l(θ) = ln{L(θ)}.<br />
SKILGREINING. Punktmatið ˆ θ = ˆ θ(x) sem hámarkar sennileikafallið, L(θ|x), fyrir gefið<br />
x, nefnist sennileikamat θ (e. maximum likelihood estimate of θ). Metillinn ˆ θ = ˆ θ(X),<br />
X = (X1,...,Xn) T nefnist sennileikametillθ (e. maximum likelihood estimator ofθ).<br />
Athugið að ef X1, X2, ..., Xn eru óháðar samfelldar (eða strjálar) slembibreytur þar sem<br />
hvertXi hefur þéttleika (eða líkindafall)<br />
fi(xi|θ), i = 1,2,...,n,<br />
þar sem θ er eins og áður stikavigur af lengdm, þá má rita sennileikafallθ, L(θ) sem<br />
og lograsennileikafallθ, l(θ), sem<br />
L(θ) =<br />
n<br />
fi(xi|θ)<br />
i=1<br />
l(θ) = ln{L(θ)} =<br />
n<br />
ln{fi(xi|θ)}.<br />
Dæmi. Finnið sennileikametil θ, það er ˆ θ, fyrir eftirfarandi tilvik. Látum X1, X2, ..., Xn<br />
vera slembiúrtak úr dreifingu sem er þannig að þéttleiki hversXi,i = 1,...,n, er gefinn með<br />
⎧<br />
⎨ θx<br />
fi(xi|θ) =<br />
⎩<br />
θ−1<br />
i , ef0≤xi ≤ 1,<br />
0, annars,<br />
fyrirθ > 0. SamþéttifallX1, ..., Xn er<br />
f(x1,...,xn|θ) =<br />
=<br />
n<br />
i=1<br />
θx θ−1<br />
i<br />
i=1<br />
n<br />
fi(xi|θ)<br />
i=1<br />
= L(θ|x).<br />
Hér höfum við því sennileikafallið,L(θ|x), og lograsennileikafallið er<br />
<br />
n<br />
<br />
l(θ|x) = ln{L(θ|x)} = ln<br />
29<br />
i=1<br />
θx θ−1<br />
i
=<br />
=<br />
n<br />
ln(θ)+<br />
i=1<br />
n<br />
i=1<br />
ln(θx θ−1<br />
i ) =<br />
n<br />
i=1<br />
{ln(θ)+ln(x θ−1<br />
i )}<br />
n<br />
(θ −1)ln(xi) = nln(θ)+(θ−1)<br />
i=1<br />
= nln(θ)+θ<br />
n<br />
ln(xi)−<br />
i=1<br />
n<br />
ln(xi).<br />
Hér að ofan eru notaðar eftirfarandi reglur um náttúrulega lografallið<br />
i=1<br />
ln(ab) = ln(a)+ln(b), ln(c d ) = dln(c).<br />
n<br />
ln(xi)<br />
Næsta skref er að hámarka L(θ|x) með tilliti til θ. Athugið að það θ ∗ sem hámarkar<br />
L(θ|x) hámarkar einnig l(θ|x). Oft er léttara að hámarka l(θ|x) heldur en L(θ|x). Diffrum<br />
l(θ|x) með tilliti tilθ<br />
∂l(θ|x)<br />
∂θ<br />
Setjum∂l(θ|x)/∂θ = 0, og leysum fyrirθ<br />
∂l(θ|x)<br />
∂θ<br />
= n<br />
θ +<br />
= n<br />
θ +<br />
n<br />
ln(xi)−0.<br />
i=1<br />
n<br />
ln(xi) = 0.<br />
Þá fæst að sennileikamatið áθ (sem er þaðθsem hámarkarl(θ)) fyrir fengin gildixer gefið<br />
með<br />
Því er sennileikametillθ gefinn með<br />
ˆθ = ˆ θ(x) =<br />
ˆθ = ˆ θ(X) =<br />
i=1<br />
(−n)<br />
.<br />
ln(xi)<br />
n<br />
i=1<br />
n<br />
i=1<br />
(−n)<br />
.<br />
ln(Xi)<br />
Dæmi - framhald. Fengum eftirfarandi gildi áX1, ...,X6, n = 6,<br />
i=1<br />
x1 = 0,6720, x2 = 0,8312, x3 = 0,8853,<br />
x4 = 0,1694, x5 = 0,8210, x6 = 0,2989.<br />
Sennileikamatið (punktmatið) áθ í þessu tilfelli er því<br />
ˆθ =<br />
(−6)<br />
6 = 1,5446.<br />
i=1ln(xi) 30
l(θ)=ln{L(θ)}<br />
0.5<br />
0.4<br />
0.3<br />
0.2<br />
0.1<br />
θ mle =1.5446<br />
0<br />
1 1.1 1.2 1.3 1.4 1.5<br />
θ<br />
1.6 1.7 1.8 1.9 2<br />
Mynd 10: Lograsennileikafalliðl(θ) sem fall afθ.<br />
Mynd 10 sýnirl(θ) sem fall afθ. Á myndinni sést að fallið er í hámarki þegarθ = 1,5446.<br />
Dæmi - Tvíkostadreifingin. X ∼ Bin(n,p), n þekkt,póþekkt. X hefur líkindafallið<br />
Pr(X = x) = f(x|p) =<br />
<br />
n<br />
p<br />
x<br />
x (1−p) n−x , x = 0,1,2,...,n.<br />
Eins og áður erL(p|x) = f(x|p) og lograsennileikafallið er<br />
l(p|x) = ln{L(p|x)} = ln<br />
Diffruml(p|x) með tilliti tilp<br />
<br />
n<br />
p<br />
x<br />
x (1−p) n−x<br />
<br />
= ln<br />
∂l(p|x)<br />
∂p<br />
Setjum∂l(p|x)/∂p = 0, og leysum fyrirp<br />
Þá fæst<br />
∂l(p|x)<br />
∂p<br />
x (n−x)<br />
= 0+ −<br />
p (1−p) .<br />
x (n−x)<br />
= −<br />
p (1−p)<br />
x<br />
p<br />
= (n−x)<br />
(1−p) ,<br />
31<br />
<br />
n<br />
+xln(p)+(n−x)ln(1−p).<br />
x<br />
= 0.
sem jafngildir<br />
Sennileikamatið ápfyrir gefið gildixer því<br />
Og sennileikametillp er því gefinn með<br />
x−xp = np−xp, eða x = np.<br />
ˆp = ˆp(x) = x<br />
n .<br />
ˆp = ˆp(X) = X<br />
n .<br />
Dæmi - Poisson-dreifingin. Látum X1, ..., Xn vera slembiúrtak úr dreifingu sem er þannig<br />
að, Xi ∼ Poisson(λ), i = 1,...,n, ogλ > 0 er óþekkt. Líkindafall hversXi er gefið með<br />
Pr(Xi = xi) = fi(xi|λ) = e−λλxi , xi = 0,1,2,...,∞, i = 1,...,n.<br />
xi!<br />
SamlíkindafallX1, ...,Xn er<br />
f(x1,...,xn|λ) =<br />
=<br />
Því er lograsennileikafallλgefið með<br />
i=1<br />
n<br />
fi(xi|λ)<br />
i=1<br />
n e−λλxi = L(λ|x).<br />
xi!<br />
l(λ|x) = ln{L(λ|x)} = ln<br />
=<br />
=<br />
=<br />
n<br />
i=1<br />
n<br />
ln(e −λ )+<br />
i=1<br />
n<br />
(−λ)+<br />
i=1<br />
n<br />
i=1<br />
ln{e −λ λ xi (xi!) −1 }<br />
n<br />
ln(λ xi )+<br />
i=1<br />
n<br />
xiln(λ)+<br />
i=1<br />
= −nλ+ln(λ)<br />
n<br />
i=1<br />
32<br />
xi −<br />
e −λ λ xi (xi!) −1<br />
<br />
n<br />
ln{(xi!) −1 }<br />
i=1<br />
n<br />
{−ln(xi!)}<br />
i=1<br />
n<br />
ln(xi!).<br />
i=1
Diffruml(λ|x) með tilliti tilλ<br />
∂l(λ|x)<br />
∂λ<br />
Setjum∂l(λ|x)/∂λ = 0, og leysum fyrirλ<br />
∂l(λ|x)<br />
∂λ<br />
= −n+λ−1<br />
= −n+λ−1<br />
Þá fæst að sennileikamatið á λ fyrir fengin gildixer<br />
Því er sennileikametillλgefinn með<br />
ˆλ = ˆ λ(x) = 1<br />
n<br />
ˆλ = ˆ λ(X) = 1<br />
n<br />
n<br />
i=1<br />
xi −0.<br />
n<br />
xi = 0.<br />
i=1<br />
n<br />
xi.<br />
i=1<br />
n<br />
Xi.<br />
Dæmi - Normaldreifingin. (Sjá dæmi 7.2e í Ross, bls. 236). Látum X1, ..., Xn vera<br />
slembiúrtak úr normaldreifingu; Xi ∼ N(µ,σ 2 ), i = 1,...,n, þar sem µ og σ eru óþekkt.<br />
Sennileikametlarµogσ eru gefnir með<br />
ˆµ = ˆµ(X) = 1<br />
n<br />
i=1<br />
n<br />
Xi, ˆσ = ˆσ(X) =<br />
i=1<br />
<br />
1<br />
n<br />
n<br />
(Xi − ¯ X) 2<br />
i=1<br />
1/2<br />
SETNING. (The Invariance Principle) (ekki í Ross). Látum ˆ θ1, ..., ˆ θm vera senni-leikametla<br />
fyrir stikanaθ1, ...,θm. Þá er sennileikametillinn fyrir falliðh(θ1,...,θm) gefinn meðh( ˆ θ1,..., ˆ θm).<br />
Dæmi - Normaldreifingin - framhald. Látum ˆµ og ˆσ vera metlana sem gefnir voru hér að<br />
ofan. Sennileikametlarnir fyrirσ 2 og µ+2σ eru<br />
3.4 Eiginleikar metla<br />
(ˆσ) 2 , og ˆµ+2ˆσ.<br />
Látum X1, ..., Xn vera slembiúrtak úr dreifingu F sem er stikuð með stikanum θ (og hugs-<br />
anlega öðrum stikum). Ef ˆ θ(X) er metill fyrirθ þá höfum við áhuga á<br />
33<br />
.
i) E{ ˆ θ(X)}, væntigildi metilsins<br />
ii) var{ ˆ θ(X)}, dreifni metilsins<br />
iii) E[{ ˆ θ(X)−θ} 2 ], meðalferskekkju metilsins, (sjá skilgreiningu síðar)<br />
iv) Dreifingu ˆ θ(X)<br />
SKILGREINING. Látum ˆ θ(X) vera metil fyrirθ. Þá er stærðin<br />
bθ{ ˆ θ(X)} = E{ ˆ θ(X)}−θ<br />
kölluð bjagi (e. bias) metilsins ˆ θ(X). Ef bθ{ ˆ θ(X)} = 0 fyrir öll θ, þá er ˆ θ(X) sagður<br />
óbjagaður (e. unbiased) metill fyrirθ en bjagaður (e. biased) annars.<br />
Dæmi - tvíkostadreifingin, framhald. X ∼ Bin(n,p), og ˆp(X) = X/n er sennileikametillp<br />
(n þekkt, p óþekkt). Þá er bjagi ˆp(X)<br />
Því er ˆp(X) óbjagaður metill fyrirp.<br />
bp{ˆp(X)} = E{ˆp(X)}−p = E(X/n)−p<br />
= E(X)/n−p = np/n−p = 0.<br />
SKILGREINING. Látum ˆ θ(X) vera metil fyrirθ. Þá er stærðin<br />
rθ{ ˆ θ(X)} = E[{ ˆ θ(X)−θ} 2 ]<br />
kölluð meðalferskekkja (e. mean square error) metilsins ˆ θ(X), og<br />
er dreifni metilsins ˆ θ(X).<br />
var{ ˆ θ(X)} = E[{ ˆ θ(X)−E{ ˆ θ(X)}} 2 ]<br />
Útfrá skilgreiningunum hér að ofan má sýna að (sjá Ross, bls. 269)<br />
rθ{ ˆ θ(X)} = var{ ˆ θ(X)}+bθ{ ˆ θ(X)} 2 .<br />
Ef ˆ θ(X) er óbjagaður metill fyrirθ, það er, bθ{ ˆ θ(X)} = 0, þá gildir að<br />
rθ{ ˆ θ(X)} = var{ ˆ θ(X)}.<br />
34
Dæmi - tvíkostadreifingin, framhald. X ∼ Bin(n,p), ˆp(X) = X/n. Meðalferskekkja ˆp(X)<br />
er<br />
rp{ˆp(X)} = var{ˆp(X)}+bp{ˆp(X)} 2<br />
= var(X/n)+0 2 = 1<br />
var(X)<br />
n2 = 1 p(1−p)<br />
n2np(1−p) = .<br />
n<br />
Ákjósanlegur metill fyrir einhvern stikaθ er metill sem er óbjagaður með minnstu mögu-<br />
legu dreifni. Í mörgum tilfellum er hægt að finna metil af þessu tagi. Annar ákjósanlegur<br />
metill fyrir θ er metill sem gefur minnstu mögulegu meðalferskekkju. Í fæstum tilfellum er<br />
hægt að finna metil af þessu tagi.<br />
Dæmi - 3 lögreglumenn á skotæfingu. Mynd 11 sýnir skotskífur þriggja lögreglumanna. Sá<br />
fyrsti hittir eins og óbjagaður metill með mikla dreifni. Lögreglumaðurinn sem er annar í<br />
röðinni hittir eins og metill sem hefur litla dreifni en er bjagaður. Sá þriðji hittir eins og<br />
metill sem hefur litla dreifni og er óbjagaður.<br />
1 2<br />
3<br />
1. óbjagaður, mikil dreifni<br />
2. bjagaður, lítil dreifni<br />
3. óbjagaður, lítil dreifni<br />
Mynd 11: Skotskífur þriggja lögreglumanna.<br />
35
SETNING. (Aðfellueiginleikar sennileikametla). Látum ˆ θn = ˆ θn(X) vera sennileikametil<br />
fyrir θ sem er byggður á slembiúrtaki af stærð n þar sem dreifing X-anna er aðeins fall af<br />
stikanumθ. Þá gildir um bjaga ˆ θn, bθ{ ˆ θn(X)}, að<br />
Um dreifni ˆ θn gildir að<br />
þar semn −1 σ 2 0<br />
bθ{ ˆ θn(X)} → 0 þegar n → ∞.<br />
nvar{ ˆ θn(X)} → σ 2 0 þegar n → ∞,<br />
er minnsta mögulega dreifni á meðal óbjagaðra metla fyrirθ þegar slembiúr-<br />
takið er af stærð n. Að því gefnu að um slembiúrtak sé að ræða (X-in eru óháð og fylgja<br />
nákvæmlega sömu dreifingu) (og að gefnum nokkrum skilyrðum ál(θ), þar á meðal að l(θ)<br />
sé tvídiffranlegt) þá er dreifninσ 2 0<br />
þar sem g(θ) er raunfall afθ.<br />
á forminu<br />
3.5 Línulegir óbjagaðir metlar<br />
σ 2 0<br />
= g(θ)<br />
Dæmi. Metum þyngd okkar með tveimur vogum.<br />
- Táknum þyngd okkar með µ,µóþekkt.<br />
- Höfum tvær vogir. Getum stigið einu sinni á hvora vog.<br />
- LátumX1 vera mælingu frá vog 1 og X2 frá vog 2.<br />
- Gerum ráð fyrir að X1 og X2 séu óháðar og að<br />
- σ 2 1 ogσ2 2 þekkt.<br />
E(X1) = E(X2) = µ, var(X1) = σ 2 1 , var(X2) = σ 2 2 .<br />
Notum línulegan metil (e. linear estimator) til að metaµ<br />
ˆµ(X1,X2) = λX1 +(1−λ)X2, λ ∈ [0,1].<br />
36
Því gildir að<br />
E{ˆµ(X1,X2)} = λE(X1)+(1−λ)E(X2) = µ.<br />
Metillinn ˆµ(X1,X2) er því línulegur óbjagaður metill (e. linear unbiased estimator) fyrirµ.<br />
Við viljum lágmarka meðalferskekkju ˆµ(X1,X2) og því í raun dreifni ˆµ(X1,X2) þar sem<br />
ˆµ(X1,X2) er óbjagaður metill fyrirµ. Meðalferskekkja ˆµ(X1,X2) er<br />
rµ{ˆµ(X1,X2)} = var{ˆµ(X1,X2)}<br />
= var{λX1 +(1−λ)X2} = var{λX1}+var{(1−λ)X2}<br />
= λ 2 var(X1)+(1−λ) 2 var(X2) = λ 2 σ 2 1 +(1−λ) 2 σ 2 2.<br />
Lágmörkumrµ{ˆµ(X1,X2)} með tilliti tilλ<br />
∂rµ{ˆµ(X1,X2)}<br />
∂λ<br />
Setjum afleiðuna jafna 0 en þá fæst<br />
λ = σ2 2<br />
σ 2 1 +σ 2 2<br />
Ef til dæmisσ 2 1 = 1 2 og σ 2 2 = 2 2 þá fæst<br />
og<br />
og<br />
rµ{ˆµ(X1,X2)} = λ 2 σ 2 1 +(1−λ) 2 σ 2 2 =<br />
= ∂{λ2 σ 2 1 +(1−λ)2 σ 2 2 }<br />
∂λ<br />
= 2λσ 2 1 −2(1−λ)σ 2 2.<br />
1/σ 2 1<br />
=<br />
1/σ2 1 +1/σ2 =<br />
2<br />
λ = 4 1<br />
, 1−λ =<br />
5 5<br />
ˆµ(X1,X2) = 4<br />
5 X1 + 1<br />
5 X2<br />
2 4<br />
1<br />
5<br />
2 +<br />
σ −2<br />
1<br />
σ −2<br />
1 +σ −2<br />
2<br />
.<br />
2 1<br />
2<br />
5<br />
2 = 4<br />
5 < var(X1) = 1<br />
og því er dreifni metilsins ˆµ(X1,X2) minni en dreifni óbjagaða metilsins ˆµ ∗ (X1,X2) = X1<br />
fyrirµ(jafngildir því að nota aðeins vog 1 eða notaλ = 1).<br />
37
LátumX1, ...,Xn vera óháðar slembibreytur sem eru þannig að<br />
Látum ˆµ(X) vera línulegan metil á forminu<br />
E(Xi) = µ, i = 1,...,n, µ óþekkt.<br />
var(Xi) = σ 2 i , i = 1,...,n, σ2 i þekkt.<br />
ˆµ(X) =<br />
n<br />
λiXi.<br />
Viljum a𠈵(X) sé óbjagaður metill fyrirµ. Því þarf að gilda umλ1, ...,λn að<br />
<br />
n<br />
<br />
n<br />
E{ˆµ(X)} = E = E(λiXi)<br />
Því þarf að gilda að<br />
=<br />
n<br />
λiE(Xi) =<br />
i=1<br />
i=1<br />
i=1<br />
λiXi<br />
n<br />
λiµ = µ<br />
i=1<br />
n<br />
λi = 1.<br />
i=1<br />
i=1<br />
n<br />
λi = µ.<br />
Þá má sýna að þau λ1, ..., λn sem uppfylla n<br />
i=1 λi = 1 og gefa minnstu meðalferskekkju<br />
rµ{ˆµ(X)} (og því í raun minnstu dreifni var{ˆµ(X)}) eru á forminu<br />
λi =<br />
σ −2<br />
i<br />
n k=1σ−2 k<br />
=<br />
i=1<br />
1/σ2 i n k=11/σ2 .<br />
k<br />
Lágmarks meðalferskekkja (lágmarks dreifni) ˆµ(X) er því<br />
rµ{ˆµ(X)} = var{ˆµ(X)} = var<br />
=<br />
=<br />
n<br />
λ 2 i var(Xi) =<br />
i=1<br />
n<br />
k=1<br />
σ −2<br />
k<br />
=<br />
−2 n<br />
i=1<br />
n<br />
k=1<br />
⎧<br />
n ⎨<br />
i=1<br />
n<br />
i=1<br />
⎩ σ−2 i<br />
σ −4<br />
i σ2 i =<br />
σ −2<br />
k<br />
−1<br />
38<br />
=<br />
λiXi<br />
n<br />
k=1<br />
n<br />
k=1<br />
1<br />
<br />
σ −2<br />
k<br />
σ −2<br />
k<br />
n i=1σ−2 i<br />
=<br />
n<br />
var(λiXi)<br />
i=1<br />
−1 ⎫ ⎬<br />
⎭<br />
2<br />
−2 n<br />
.<br />
i=1<br />
σ 2 i<br />
σ −2<br />
i
4 Öryggisbil<br />
4.1 Eiginleikar öryggisbila<br />
LátumX1, ..., Xn vera slembiúrtak úr normaldreifingu með stikaµogσ 2 . Þá hefur<br />
staðlaða normaldreifingu og<br />
Umritum<br />
Pr<br />
Z = ¯ X −µ<br />
σ/ √ n<br />
<br />
−1,96 ≤ ¯ X −µ<br />
σ/ √ <br />
≤ 1,96 = 0,95.<br />
n<br />
<br />
Pr −1,96 σ √ ≤<br />
n ¯ X −µ ≤ 1,96 σ <br />
√<br />
n<br />
<br />
= Pr − ¯ X −1,96 σ √ ≤ −µ ≤ −<br />
n ¯ X +1,96 σ <br />
√<br />
n<br />
<br />
= Pr ¯X −1,96 σ √ ≤ µ ≤<br />
n ¯ X +1,96 σ <br />
√ = 0,95.<br />
n<br />
Endapunktarnir( ¯ X −1,96σ/ √ n) og ( ¯ X +1,96σ/ √ n) eru slembibreytur. Bilið<br />
<br />
¯X −1,96 σ √ ,<br />
n ¯ X +1,96 σ <br />
√<br />
n<br />
er því í raun slembibil, og líkurnar á að µ sé á bilinu eru 0,95.<br />
SKILGREINING. LátumX1, ...,Xn vera slembiúrtak úr normaldreifingu með stikaµogσ 2 ,<br />
og látum x1, ..., xn vera fengin gildi á X-unum. Gerum ráð fyrir að σ 2 sé þekkt. Þá er 95%<br />
öryggisbil (e. confidence interval) fyrirµskilgreint sem<br />
<br />
¯x−1,96 σ √ ,¯x+1,96<br />
n σ <br />
√ .<br />
n<br />
Athugasemd. Bilið hér að ofan er ekki slembibil heldur endanlega ákvarðað bil eftir að<br />
gögninx1, ...,xn hafa verið fengin í hendurnar. Hið sanna gildi áµer því annað hvort innan<br />
bilsins eða ekki.<br />
Dæmi. Gögn frá normaldreifingu, σ þekkt, σ = 1,6, n = 3, x1 = 21,7, x2 = 26,9,<br />
x3 = 25,9,<br />
¯x = (21,7+26,9+25,9)/3 = 24,83.<br />
39
95% öryggisbil fyrirµer því<br />
<br />
¯x−1,96 σ √ ,¯x+1,96<br />
n σ <br />
√<br />
n<br />
<br />
24,83−1,96× 1,6<br />
√ ,24,83+1,96×<br />
3 1,6<br />
<br />
√<br />
3<br />
(23,02,26,64).<br />
TÚLKUN Á ÖRYGGISBILUM. Það er ekki rétt að segja að það séu 95% líkur á því að µ<br />
sé innan útreiknaðs 95% öryggisbils. Öryggisbilið er endanlega ákvarðað bil eftir að gögnin<br />
x1, ..., xn hafa verið fengin í hendurnar og annað hvort er µ innan öryggisbilsins eða ekki.<br />
En hugsunin er sú að ef við reiknum 95% öryggisbil fyrirµaftur og aftur með nýju úrtaki af<br />
sömu stærð sem kemur úr nákvæmlega sömu dreifingu þá munu um 95% af öryggisbilunum<br />
innihaldaµog um 5% þeirra munu ekki innihaldaµ.<br />
Mynd 12 sýnir 95% öryggisbil frá normaldreifingu þegar hið sanna µ er 10, σ = 2 og<br />
n = 64. Á myndinni sést að af 40 öryggisbilum þá eru 3 öryggisbil sem innihalda ekki hið<br />
sanna gildi á µ. Þessi öryggisbil eru merkt með stjörnu. Athugið að fjöldi öryggisbila sem<br />
ekki inniheldur µ fylgir tvíkostadreifingu með stika m = 40 og p = 0,05. Væntigildið er<br />
mp = 2 öryggisbil sem ekki innihaldaµíþessu tilfelli.<br />
SKILGREINING. Látum X1, ..., Xn vera slembiúrtak úr normaldreifingu með stika µ og<br />
σ 2 , og látum x1, ..., xn vera fengin gildi á X-unum. Gerum ráð fyrir að σ 2 sé þekkt. Þá er<br />
100(1−α)% öryggisbil fyrirµskilgreint sem<br />
<br />
<br />
σ σ<br />
¯x−zα/2 √ ,¯x+zα/2 √<br />
n n<br />
þar sem zα/2 er100(1−α/2)-ta sætisstærðin í staðlaðri normaldreifingu.<br />
Athugasemd. Umzα/2 gildir að<br />
Pr(Z > zα/2) = α/2, Pr(Z ≤ −zα/2) = α/2,<br />
þar sem Z fylgir staðlaðri normaldreifingu.<br />
40
Númer úrtaks<br />
40<br />
35<br />
30<br />
25<br />
20<br />
15<br />
10<br />
5<br />
0<br />
8.5 9 9.5 10 10.5<br />
Hugsanleg gildi µ<br />
11 11.5 12 12.5<br />
Mynd 12: 95% öryggisbil fyrir µ byggð á 40 úrtökum frá normaldreifingu þegar hið sanna<br />
gildi áµer 10 og σ = 2 ogn = 64.<br />
Við segjum að öryggisstig (e. confidence level) bilsins sé100(1−α)% og að óþekkti stikinn<br />
liggi innan reiknaðs öryggisbils með100(1−α)% vissu. Algengt er að velja 90% öryggisstig,<br />
(α = 0,10), 95% öryggisstig, (α = 0,05), 99% öryggisstig, (α = 0,01). Tafla 3 sýnir gildi á<br />
zα/2 fyrir valin gildi áα.<br />
Í því tilfelli þegar gögnin koma frá normaldreifingu og σ 2 er þekkt, þá er breidd öryggis-<br />
bilsins fyrirµekki háð gögnunum en er háð σ2 ,nogα. Breiddin er<br />
<br />
σ σ<br />
w = ¯x+zα/2 √ − ¯x−zα/2 √<br />
n n<br />
= 2zα/2<br />
σ<br />
√ .<br />
n<br />
Ef við viljum 100(1−α)% öryggisbil fyrir µ sem er þannig að breidd bilsins sé minni eða<br />
jöfn w, þá þarfnað vera<br />
<br />
n ≥<br />
2zα/2<br />
σ<br />
2 .<br />
w<br />
Dæmi - framhald. Höfumσ = 1,6. Viljum 99% öryggisbil sem hefur breidd sem er jöfn eða<br />
minni en w = 0,75. Hér er α = 0,01, zα/2 = z0,005 = 2,576, sjá neðst í töflu A3 (n = ∞),<br />
41
ls. 614 í Ross. Hér þarfnað vera þannig að<br />
n ≥<br />
<br />
2×2,576× 1,6<br />
2 = 120,8.<br />
0,75<br />
Þar semner heiltala þá látum viðn = 121 til að tryggja að w ≤ 0,75.<br />
Tafla 3: Gildi ázα/2 fyrir valin gildi áα<br />
Öryggisstig 80% 90% 95% 98% 99%<br />
α 0.20 0.10 0.05 0.02 0.01<br />
z1−α/2 1.282 1.645 1.960 2.326 2.576<br />
4.2 Öryggisbil fyrir µ í normaldreifingu þegar σ 2 er óþekkt<br />
Látum X1, ..., Xn vera slembiúrtak úr normaldreifingu með stika µ og σ 2 , og látum x1, ...,<br />
xn vera fengin gildi á X-unum. Gerum ráð fyrir að bæðiµog σ 2 séu óþekkt. Þá gildir<br />
og<br />
¯X −µ<br />
S/ √ n<br />
∼ tn−1<br />
<br />
Pr −tα/2,n−1 ≤ ¯ X −µ<br />
S/ √ <br />
≤ tα/2,n−1 = 1−α.<br />
n<br />
Eins og hér á undan má umrita og við fáum að<br />
<br />
Pr<br />
¯X<br />
S<br />
−tα/2,n−1 √ ≤ µ ≤<br />
n ¯ <br />
S<br />
X +tα/2,n−1 √ = 1−α.<br />
n<br />
Því er100(1−α)% öryggisbil fyrirµgefið með<br />
<br />
¯x−tα/2,n−1<br />
<br />
s s<br />
√ ,¯x+tα/2,n−1 √ .<br />
n n<br />
Dæmi. Höfum normaldreifð gögn. Viljum 99% öryggisbil fyrir µ. Úrtakið er þannig að<br />
n = 18, ¯x = 38,66, s = 8,473. Hér er α = 0,01, tα/2,n−1 = t0,005,17 = 2,898, sjá töflu A3,<br />
42
ls. 614 í Ross. Því er 99% öryggisbil fyrirµíþessu tilfelli<br />
<br />
38,66−2,898× 8,473<br />
√ ,38,66+2,898×<br />
18 8,473<br />
<br />
√<br />
18<br />
= (32,87,44,45).<br />
4.3 Öryggisbil fyrir σ 2 og σ í normaldreifingu<br />
Látum X1, ..., Xn vera slembiúrtak úr normaldreifingu með stika µ og σ 2 , og látum x1, ...,<br />
xn vera fengin gildi á X-unum. Gerum ráð fyrir að bæðiµog σ 2 séu óþekkt. Þá gildir<br />
og<br />
(n−1)S 2<br />
σ 2 ∼ χ 2 n−1<br />
<br />
Pr χ 2 (n−1)S2<br />
1−α/2,n−1 ≤<br />
σ2 Eins og hér á undan má umrita og við fáum að<br />
Pr<br />
<br />
(n−1)S 2<br />
χ 2 α/2,n−1<br />
≤ σ 2 ≤ (n−1)S2<br />
χ2 <br />
1−α/2,n−1<br />
≤ χ 2 <br />
α/2,n−1 = 1−α.<br />
= 1−α.<br />
Því eru 100(1−α)% öryggisbil fyrirσ2 ogσ gefin með<br />
σ 2<br />
<br />
:<br />
(n−1)s 2<br />
χ2 ,<br />
α/2,n−1<br />
(n−1)s2<br />
χ2 <br />
1−α/2,n−1<br />
<br />
σ :<br />
(n−1)s 2<br />
χ2 <br />
,<br />
α/2,n−1<br />
(n−1)s 2<br />
χ2 <br />
1−α/2,n−1<br />
Dæmi - framhald. Höfum normaldreifð gögn. Viljum 95% öryggisbil fyrirσ. Úrtakið gefur<br />
eins og áður,n = 18, ¯x = 38,66,s = 8,473. Hér erα = 0,05,χ 2 α/2,n−1 = χ2 0,025,17 = 30,191,<br />
χ 2 1−α/2,n−1 = χ2 0,975,17<br />
= 7,564, sjá töflu A2, bls. 613 í Ross. Því er 95% öryggisbil fyrirσ í<br />
þessu tilfelli ⎛<br />
⎝<br />
17×8,474 2<br />
<br />
,<br />
30,191<br />
17×8,474 2<br />
⎞<br />
⎠<br />
7,564<br />
= (6,358,12,702).<br />
Athugið að bilið er ekki samhverft ums = 8,473.<br />
43
4.4 Öryggisbil fyrir p í tvíkostadreifingu<br />
LátumX ∼ Bin(n,p). Metumpmeð sennileikametlinum ˆp = X/n. Um ˆp gildir að<br />
ˆp−p<br />
p(1−p)/n ∼ N(0,1), þegar n → ∞<br />
og efner nægjanlega stórt (np ≥ 10, þumalputtaregla) þá er<br />
<br />
<br />
ˆp−p<br />
Pr −zα/2 ≤ ≤ zα/2 ≈ 1−α.<br />
p(1−p)/n<br />
Þessi nálgun byggir á höfuðmarkgildisreglunni, því hægt er að ritaX sem summu af Bernoulli<br />
slembibreytum (sem eru líka tvíkostaslembibreytur meðn = 1), það er,<br />
þar sem<br />
Því fæst<br />
og<br />
X =<br />
n<br />
Xi,<br />
i=1<br />
Xi ∼ Bernoulli(p), E(Xi) = p, var(Xi) = p(1−p), i = 1,...,n.<br />
var(X) = var<br />
E(X) = E<br />
n<br />
i=1<br />
n<br />
Xi<br />
i=1<br />
<br />
=<br />
Xi<br />
<br />
=<br />
n<br />
E(Xi) =<br />
i=1<br />
n<br />
var(Xi) =<br />
i=1<br />
n<br />
p = np<br />
i=1<br />
n<br />
p(1−p) = np(1−p).<br />
Efner stórt(np ≥ 10) þá má nálga dreifinguX með normaldreifingu<br />
i=1<br />
X ∼ N(np,np(1−p)), þegar n → ∞.<br />
og dreifingu ˆp = X/n má einnig nálga með normaldreifingu<br />
ˆp ∼ N(p,p(1−p)/n), þegar n → ∞.<br />
Við viljum leysa fyrirpíjöfnunni hér að ofan sem gefur nálgun á líkunum fyrir ˆp.<br />
2 (ˆp−p)<br />
Pr<br />
p(1−p)/n ≤ z2 <br />
α/2<br />
= Pr (ˆp−p) 2 ≤ z 2 α/2 p(1−p)/n<br />
44
þar sem<br />
= Pr ˆp 2 −2ˆpp+p 2 ≤ z 2 α/2 p/n−z2 α/2 p2 /n <br />
= Pr (1+z 2 α/2 /n)p2 +(−2ˆp−z 2 α/2 /n)p+ ˆp2 ≤ 0 <br />
= Pr ap 2 +bp+c ≤ 0 ≈ 1−α<br />
a = 1+z 2 α/2/n, b = −2ˆp−z 2 α/2/n, c = ˆp 2 .<br />
Hér þarf að finna þau p sem að uppfylla ójöfnuna hér að ofan. Stærðin vinstra megin við<br />
ójöfnumerkið er parabóla í p. Finnum skurðpunktana með því að setja jafnaðarmerki í stað-<br />
inn fyrir ójöfnumerkið og leysa svo fyrirp. Þá fæst<br />
p = −b±√b 2 −4ac<br />
.<br />
2a<br />
Að því gefnu að fengið gildi á X sé x, þá er punktmatið á p, ˆp = x/n, og 100(1 − α)%<br />
öryggisbil fyrirper gefið með<br />
<br />
ˆp+ z2<br />
<br />
α/2<br />
2n<br />
<br />
1+ z2<br />
±<br />
α/2<br />
n<br />
zα/2<br />
<br />
ˆp(1−ˆp)<br />
n + z2 α/2<br />
4n2 <br />
1+ z2<br />
<br />
α/2<br />
n<br />
þar sem mínusinn gefur neðri mörkin og plúsinn gefur efri mörkin á öryggisbilinu.<br />
Dæmi. Viljum finna 95% öryggisbil fyrir p í tvíkostadreifingu. Úrtakið er af stærð n = 30.<br />
Fjöldi jákvæðra niðurstaðna er x = 14. Sennileikamatið er því ˆp = 14/30 = 0,4667.<br />
Jöfnurnar fyrir neðri og efri mörk öryggisbilsins gefa<br />
(0,3023,0,6386).<br />
Mynd 13 sýnir parabóluna í ójöfnunni. Skurðpunktarnir við lárétta ásinn gefa efri og neðri<br />
mörkin.<br />
Efner mjög stórt þá má nálga100(1−α)% öryggisbil fyrirpmeð<br />
<br />
ˆp(1− ˆp) ˆp(1− ˆp)<br />
ˆp−zα/2 , ˆp+zα/2 .<br />
n n<br />
Þessi nálgun byggir á því að<br />
ˆp−p<br />
ˆp(1− ˆp)/n ∼ N(0,1), þegar n → ∞<br />
45
f(p)=ap 2 +bp+c<br />
0.05<br />
0.04<br />
0.03<br />
0.02<br />
0.01<br />
0<br />
−0.01<br />
−0.02<br />
−0.03<br />
−0.04<br />
−0.05<br />
0 0.1 0.2 0.3 0.4 0.5<br />
p<br />
0.6 0.7 0.8 0.9 1<br />
Mynd 13: Parabólan í ójöfnunni fyrirpþegarx = 14, n = 30, ogα = 0,05.<br />
og efner nægjanlega stórt þá er<br />
<br />
Pr<br />
−zα/2 ≤<br />
<br />
ˆp−p<br />
≤ zα/2 ≈ 1−α.<br />
ˆp(1− ˆp)/n<br />
Dæmi - framhald. Finnum 95% öryggisbil fyrirpítvíkostadreifingu þegar eins og áðurn =<br />
30 ogx = 14 en notum einfaldari jöfnurnar. Jöfnurnar fyrir neðri og efri mörk öryggisbilsins<br />
gefa<br />
(0,2881,0,6452).<br />
Athugasemd. Ef við drögum aftur og aftur (með aðstoð tölvu) frá tvíkostadreifingu með stika<br />
p = 0,6 og n = 10 og reiknum bæði öryggisbilin, kemur í ljós að fyrra öryggisbilið hefur<br />
í raun 98% öryggisstig en seinna öryggisbilið hefur í raun 90% öryggisstig. Við mundum<br />
kjósa að öryggisstigið væri að minnsta kosti 95%. Fyrra öryggisbilið gefur betri raun hvað<br />
öryggisstigið varðar. Seinna öryggisbilið gefur oft of lágt öryggisstig þegar n er minna en<br />
50 ogper nærri 0 eða 1.<br />
Ef við viljum 100(1−α)% öryggisbil fyrir p sem er þannig að breidd öryggisbilsins sé<br />
46
jöfn eða minni en w, þá þarf n að vera<br />
n ≥<br />
2z 2 α/2 ˆp(1− ˆp)−z2 α/2 w2 +<br />
<br />
4z 4 α/2 ˆp(1− ˆp){ˆp(1− ˆp)−w2 }+w 2 z 4 α/2<br />
w 2<br />
Efw er mjög lítið þá má nálga ójöfnuna fyrirnmeð<br />
n ≥ 4z2 α/2ˆp(1− ˆp)<br />
w2 .<br />
Ef við viljum vera viss um að n sé örugglega þannig að öryggisbilið sé ekki breiðara en w<br />
þá látum við ˆp(1− ˆp) = 0,25 sem er stærsta gildið sem ˆp(1− ˆp) getur tekið og notum<br />
n ≥ z2 α/2<br />
.<br />
w2 Dæmi. Viljum að 95% öryggisbil fyrir p sé þannig að breidd þess sé örugglega ekki meiri<br />
en 0,01. Þá þarfnað vera<br />
n ≥ z2 α/2<br />
w<br />
1,962<br />
= = 38416.<br />
2 0,012 47<br />
.
4.5 Öryggisbil fyrir nokkur valin tilfelli<br />
Tilfelli 1<br />
100(1−α)% öryggisbil fyrirµínormaldreifingu.<br />
X1,...,Xn ∼ N(µ,σ 2 ), slembiúrtak.<br />
Fengin gildiX1 = x1,...,Xn = xn.<br />
¯x = 1<br />
<br />
n<br />
<br />
<br />
xi, s = <br />
n<br />
1<br />
n−1<br />
i=1<br />
i)100(1−α)% öryggisbil fyrirµ, σ 2 þekkt.<br />
σ<br />
¯x±zα/2 √<br />
n<br />
ii)100(1−α)% öryggisbil fyrirµ,σ 2 óþekkt.<br />
Tilfelli 2<br />
¯x±tα/2,n−1<br />
s<br />
√<br />
n<br />
100(1−α)% öryggisbil fyrirσ 2 ogσ í normaldreifingu.<br />
X1,...,Xn ∼ N(µ,σ 2 ), slembiúrtak.<br />
Fengin gildiX1 = x1,...,Xn = xn.<br />
¯x = 1<br />
n<br />
n<br />
i=1<br />
xi, s 2 = 1<br />
n−1<br />
i)100(1−α)% öryggisbil fyrirσ2 .<br />
<br />
(n−1)s 2<br />
χ2 ,<br />
α/2,n−1<br />
(n−1)s2<br />
χ2 <br />
1−α/2,n−1<br />
ii)100(1−α)% öryggisbil fyrirσ.<br />
<br />
(n−1)s 2<br />
χ2 <br />
,<br />
α/2,n−1<br />
(n−1)s 2<br />
χ2 <br />
1−α/2,n−1<br />
48<br />
n<br />
(xi − ¯x) 2<br />
i=1<br />
n<br />
(xi − ¯x) 2<br />
i=1
Tilfelli 3<br />
100(1−α)% öryggisbil fyrirpítvíkostadreifingu.<br />
X ∼ Bin(n,p), slembistærð.<br />
Fengið gildiX = x.<br />
i)100(1−α)% öryggisbil fyrirp, nálgun I.<br />
<br />
ˆp+ z2 α/2<br />
2n<br />
<br />
1+ z2 α/2<br />
n<br />
ˆp = x<br />
n<br />
ˆp(1−ˆp)<br />
± zα/2 n + z2 α/2<br />
4n2 <br />
1+ z2 <br />
α/2<br />
n<br />
ii)100(1−α)% öryggisbil fyrirp, nálgun II.<br />
<br />
ˆp(1− ˆp)<br />
ˆp±zα/2<br />
n<br />
Tilfelli 4<br />
100(1−α)% öryggisbil fyrirµ1 −µ2, µ1 og µ2 í normaldreifingum.<br />
X1,...,Xn ∼ N(µ1,σ2 1 ), slembiúrtak.<br />
Y1,...,Ym ∼ N(µ2,σ2 2 ), slembiúrtak, óháð X-unum.<br />
Fengin gildiX1 = x1,...,Xn = xn og Y1 = y1,...,Ym = ym.<br />
¯x = 1<br />
n<br />
xi, s<br />
n<br />
2 n 1<br />
1 = (xi − ¯x)<br />
n−1<br />
2 , ¯y = 1<br />
m<br />
m<br />
i=1<br />
s 2 p = (n−1)s2 1 +(m−1)s 2 2<br />
n+m−2<br />
i=1<br />
i=1<br />
yi, s 2 2<br />
= 1<br />
m−1<br />
m<br />
(yi − ¯y) 2<br />
, υ = (s21/n+s 2 2/m) 2<br />
<br />
(s2 1 /n) 2<br />
n−1 + (s2 2 /m)2<br />
, (υ er lækkað niður í næstu heiltölu)<br />
m−1<br />
i)100(1−α)% öryggisbil fyrirµ1 −µ2, σ2 1 og σ2 2 þekkt.<br />
<br />
2 σ1 (¯x− ¯y)±zα/2<br />
n + σ2 2<br />
m<br />
ii)100(1−α)% öryggisbil fyrirµ1 −µ2, σ2 1 og σ2 2 óþekkt,σ2 1 = σ2 2.<br />
<br />
1 1<br />
(¯x− ¯y)±tα/2,n+m−2sp +<br />
n m<br />
iii)100(1−α)% öryggisbil fyrirµ1 −µ2,σ 2 1 ogσ2 2 óþekkt,σ2 1 = σ2 2 .<br />
<br />
2 s1 (¯x− ¯y)±tα/2,υ<br />
n + s22 m<br />
49<br />
i=1
Tilfelli 5<br />
100(1−α)% öryggisbil fyrirσ 2 1/σ 2 2, σ 2 1 og σ 2 2 í normaldreifingum.<br />
X1,...,Xn ∼ N(µ1,σ2 1 ), slembiúrtak.<br />
Y1,...,Ym ∼ N(µ2,σ2 2 ), slembiúrtak, óháð X-unum.<br />
Fengin gildiX1 = x1,...,Xn = xn og Y1 = y1,...,Ym = ym.<br />
¯x = 1<br />
n<br />
¯y = 1<br />
m<br />
n<br />
i=1<br />
m<br />
i=1<br />
i)100(1−α)% öryggisbil fyrirσ 2 1/σ 2 2.<br />
Tilfelli 6<br />
<br />
xi, s 2 1 = 1<br />
n−1<br />
yi, s 2 2<br />
s 2 1 /s2 2<br />
Fα/2,n−1,m−1<br />
,<br />
= 1<br />
m−1<br />
s 2 1 /s2 2<br />
n<br />
(xi − ¯x) 2<br />
i=1<br />
m<br />
(yi − ¯y) 2<br />
i=1<br />
F1−α/2,n−1,m−1<br />
100(1−α)% öryggisbil fyrirµw = µ1 −µ2, paraðar mælingar.<br />
(X1,Y1),...,(Xn,Yn) eru n óháð pör, en Xi og Yi, i = 1,...,n, geta verið innbyrðis háð.<br />
Hvert par (Xi,Yi), i = 1,...,n, er yfirleitt tvær mælingar á sama hlut eða einstaklingi.<br />
Wi = Xi −Yi, E(Xi) = µ1, E(Yi) = µ2, E(Wi) = µw = µ1 −µ2,i = 1,...,n.<br />
W1,...,Wn ∼ N(µw,σ2 w ), óháðar.<br />
Fengin gildi (X1,Y1) = (x1,y1),...,(Xn,Yn) = (xn,yn), W1 = w1 = x1 − y1,...,Wn =<br />
wn = xn −yn.<br />
¯w = 1<br />
n<br />
<br />
n<br />
<br />
<br />
wi, sw = 1<br />
n−1<br />
i=1<br />
i)100(1−α)% öryggisbil fyrirµw.<br />
¯w ±tα/2,n−1 √<br />
n<br />
50<br />
sw<br />
<br />
n<br />
(wi − ¯w) 2<br />
i=1
Tilfelli 7<br />
100(1−α)% öryggisbil fyrirp1 −p2, p1 og p2 í tvíkostadreifingum.<br />
X ∼ Bin(n1,p1), Y ∼ Bin(n2,p2), slembistærðir.<br />
Fengin gildiX = x ogY = y.<br />
ˆp1 = x<br />
, ˆp2 = y<br />
n1<br />
i)100(1−α)% öryggisbil fyrirp1 −p2, nálgun: min(n1p1(1−p1),n2p2(1−p2)) ≥ 10.<br />
Tilfelli 8<br />
ˆp1 − ˆp2 ±zα/2<br />
<br />
ˆp1(1− ˆp1)<br />
n1<br />
n2<br />
+ ˆp2(1− ˆp2)<br />
n2<br />
100(1−α)% öryggisbil fyrirθ = 1/λ, meðalgildi veldisdreifingar.<br />
X1,...,Xn ∼ Expon(λ), slembiúrtak.<br />
E(Xi) = θ, i = 1,...,n.<br />
Fengin gildiX1 = x1,...,Xn = xn.<br />
i)100(1−α)% öryggisbil fyrirθ.<br />
<br />
¯x = 1<br />
n<br />
2n¯x<br />
χ 2 α/2,2n<br />
,<br />
n<br />
i=1<br />
xi<br />
2n¯x<br />
χ 2 1−α/2,2n<br />
51
5 Tilgátupróf<br />
5.1 Almennt um tilgátupróf<br />
SKILGREINING. Núlltilgáta, táknuð með H0, er staðhæfing um stika þýðis sem „eðlilegt“<br />
er að halda fram í upphafi. Gagntilgáta, táknuð meðH1, staðhæfir öfugt viðH0. Við höfnum<br />
H0 ef gögnin benda sterklega til þess að H0 sé röng. Við höfnum ekki H0 ef gögnin benda<br />
ekki nægjanlega sterkt til þess að H0 sé röng.<br />
Dæmi. Meðallíftími ákveðinnar tegundar af rafhlöðum er 325 klukkustundir. Hönn-unin á<br />
rafhlöðunum er endurbætt og spurningin er hvort meðallíftíminn hafi lengst. Núlltilgátan og<br />
gagntilgátan eru hér<br />
Ritum einnig<br />
H0 : µ ≤ 325 á móti H1 : µ > 325.<br />
H0 : µ = 325 á móti H1 : µ > 325.<br />
Tilgátupróf samanstanda af prófstærð og höfnunarsvæði.<br />
SKILGREINING. Prófstærð (e. test statistic) er fall af úrtakinu. Ákvörðin um að hafna H0<br />
eða ekki er byggð á prófstærðinni.<br />
SKILGREINING. Höfnunarsvæði (e. critical region) er svæði sem inniheldur öll gildi á<br />
prófstærðinni sem leiða til höfnunar á H0, það er, H0 er hafnað ef prófstærðin er innan<br />
höfnunarsvæðisins.<br />
Hægt er gera að tvennskonar villur við tilgátupróf.<br />
SKILGREINING. Mistök af gerð I (e. type I error) eiga sér stað þegar H0 er hafnað þegar<br />
H0 er í raun sönn.<br />
SKILGREINING. Mistök af gerð II (e. type II error) eiga sér stað þegar H0 er ekki hafnað<br />
þegarH0 er í raun röng.<br />
Tafla 4 sýnir hvenær mistök af gerð I og II eiga sér stað og hvenær rétt ákvörðun er tekin.<br />
52
Látum<br />
Tafla 4: Mistök af gerð I og II.<br />
H0 sönn H0 röng<br />
Höfnum ekkiH0 rétt ákvörðun Mistök af gerð II<br />
HöfnumH0 Mistök af gerð I rétt ákvörðun<br />
Dæmi. Normaldreifð gögn. n = 14,σ = 4.<br />
Prófstærð: ¯ X.<br />
α = Pr(mistök af gerð I),<br />
β = Pr(mistök af gerð II).<br />
H0 : µ = 50 á móti H1 : µ > 50.<br />
Höfnunarsvæði: Ákveðum að hafnaH0 ef ¯ X > 51,75.<br />
Talan51,75 er valin sem hugsanlega skynsamlegur skurðpunktur. Athugum hvaða áhrif þetta<br />
val hefur á mistök af gerð I og II, það er, áαog β.<br />
EfH0 er sönn þá erµ = 50.<br />
α = Pr(mistök af gerð I)<br />
= Pr(höfnumH0 þegarH0 er í raun sönn)<br />
= Pr( ¯ X > 51,75|µ = 50)<br />
<br />
¯X −µ<br />
= Pr<br />
σ/ √ 51,75−µ<br />
><br />
n σ/ √ <br />
<br />
<br />
n µ = 50<br />
<br />
= Pr Z > 51,75−50<br />
4/ √ <br />
14<br />
= 1−Pr(Z ≤ 1,64) = 1−Φ(1,64)<br />
= 1−0,9495 = 0,0505.<br />
53
β er ekki ein tala heldur fall afµíH1. Segjum að H0 sé röng, t.d. µ = 51.<br />
Ef til dæmisµ = 53 fæst<br />
β(µ = 51) = Pr(mistök af gerð II þegarµ = 51)<br />
1<br />
0.9<br />
0.8<br />
0.7<br />
0.6<br />
0.5<br />
β(µ) 1−α<br />
0.4<br />
0.3<br />
0.2<br />
0.1<br />
= Pr(höfnum ekki H0 þegar í raun erµ = 51)<br />
= Pr( ¯ X ≤ 51,75|µ = 51)<br />
<br />
¯X −µ<br />
= Pr<br />
σ/ √ 51,75−µ<br />
≤<br />
n σ/ √ <br />
<br />
<br />
n µ = 51<br />
<br />
= Pr Z ≤ 51,75−51<br />
4/ √ <br />
14<br />
= Pr(Z ≤ 0,70)<br />
= Φ(0,70)<br />
= 0,7580.<br />
µ 0 =50<br />
µ=51<br />
µ=53<br />
0<br />
49 50 51 52<br />
µ<br />
53 54 55<br />
Mynd 14: Líkurnar á því að gera mistök af gerð II sem fall af µ.<br />
54
β(µ = 53) = Pr Z ≤ 51,75−53<br />
4/ √ <br />
= 0,1210.<br />
14<br />
Á mynd 14 sést hvernigβ minnkar eftir því semµfærist fjærµ0 = 50.<br />
Sambandið á milliα,β ogner eftirfarandi<br />
n fast α ↑ ⇒ β ↓ eða α ↓ ⇒ β ↑<br />
α fast n ↑ ⇒ β ↓<br />
Vanalega er α valið fyrst. Algengt val á α er 0,01, 0,05 og 0,10. Ef við viljum litlar líkur á<br />
mistökum af gerð I þá veljum við enn smærra α. Ef hægt er, þá er n valið þannig að β fyrir<br />
ákveðiðµíH1 fari niður fyrir valið gildi. Stærðirnarα, β og (1−β) hafa eftirfarandi heiti.<br />
5.2 P -gildi<br />
α = marktektarkrafa (e. significance level)<br />
β = fastheldnisfall (e. operating characteristic function)<br />
1−β = höfnunarfall (e. power function)<br />
SKILGREINING. Látum T tákna slembistærð sem hefur sömu dreifingu og prófstærðin<br />
þegarH0 er sönn ogter gildið á prófstærðinni fyrir gefna tilraun, þá er P -gildið<br />
P -gildi = Pr(T ≥ t)<br />
ef höfnunarsvæði prófs er hægra megin við gefna rauntölu en<br />
P -gildi = Pr(T ≤ t)<br />
ef höfnunarsvæði prófs er vinstra megin við gefna rauntölu. Ef höfnunarsvæði prófs er ann-<br />
ars vegar vinstra megin við gefna rauntölur1 og hins vegar hægra megin við gefna rauntölu<br />
r2,(r1 < r2), þá erP -gildið<br />
P -gildi = 2min{Pr(T ≥ t), Pr(T ≤ t)}.<br />
55
f Z (z)<br />
0.45<br />
0.4<br />
0.35<br />
0.3<br />
0.25<br />
0.2<br />
0.15<br />
0.1<br />
0.05<br />
0<br />
z=1.39<br />
P−gildi=flatarmál<br />
=1−Φ(1.39)=0.0823<br />
−3 −2 −1 0<br />
z<br />
1 2 3<br />
Mynd 15: Flatarmálið undir dreifingu prófstærðarinnar þegar H0 er sönn svarar til P -<br />
gildisins.<br />
Með öðrum orðum má segja að þegar til dæmis höfnunarsvæði prófs er hægra megin við<br />
gefna rauntölu þá erP -gildið líkurnar á því að fá prófstærð sem er jöfn eða stærri en útreikn-<br />
uð prófstærð að því gefnu að H0 sé sönn. Athugið að P -gildið er ekki líkurnar á því að H0<br />
sé sönn.<br />
Við getum notað P -gildi til að ákveða hvort við höfnumH0 eða ekki:<br />
P -gildi < α ⇒ höfnumH0 fyrir gefið α<br />
P -gildi ≥ α ⇒ höfnum ekkiH0 fyrir gefið α<br />
Prófum H0 : µ = µ0 á móti H1 : µ > µ0, fyrir µ í normaldreifingu þegar σ er þekkt, (sjá<br />
nánar í næsta kafla). Segjum að gildið á prófstærðinni séz, þá er<br />
EfH1 : µ < µ0, þá er<br />
P -gildi = Pr(Z ≥ z) = 1−Φ(z).<br />
P -gildi = Pr(Z ≤ z) = Φ(z).<br />
56
EfH1 : µ = µ0, þá er<br />
P -gildi = 2min{Pr(Z ≥ z), Pr(Z ≤ z)} = 2{1−Φ(|z|)}.<br />
Mynd 15 sýnir flatarmálið undir stöðluðu normaldreifingunni sem svarar til P -gildis þegar<br />
gildið á prófstærðinni er z = 1,39 og gagntilgátan er H1 : µ > µ0.<br />
5.3 Tilgátupróf fyrir meðalgildi í normaldreifingu, þekkt σ<br />
Dæmi. Þykkt 50 glerja í gleraugu eru mæld. Meðaltal úrtaksins er ¯x = 3,05 mm og staðal-<br />
frávikið er þekkt,σ = 0,34 mm. Glerin eiga að hafa meðalþykktµ = 3,20 mm. Gefa gögnin<br />
til kynna að µ = 3,20 mm eða gefa þau til kynna að µ = 3,20 mm. Notumα = 0,05.<br />
Prófstærðin í prófi fyrirµínormaldreifingu þegarσ er þekkt er<br />
Z = ¯ X −µ0<br />
σ/ √ n .<br />
Z fylgir staðlaðri normaldreifingu efH0 er sönn,H0 : µ = µ0.<br />
Veljumα = Pr(mistök af gerð I).<br />
Tafla 5 sýnir próf fyrirµfyrir þrjár mismunandi gagntilgátur. Í töflu 5 er að finna gagntilgát-<br />
urnar, tilsvarandi höfnunarsvæði og P -gildi.<br />
57
Skref við tilgátupróf<br />
Tafla 5: Núlltilgáta: H0: µ = µ0, Prófstærð: z = (¯x−µ0)<br />
σ/ √ n<br />
Gagntilgátur Höfnunarsvæði P -gildi<br />
H1: µ > µ0 z > zα Pr(Z ≥ z) = 1−Φ(z)<br />
H1: µ < µ0 z < −zα Pr(Z ≤ z) = Φ(z)<br />
H1: µ = µ0 |z| > zα/2 2Pr(Z ≥ |z|) = 2{1−Φ(|z|)}<br />
1. Ákveða hvaða stika á að prófa.<br />
2. Ákveða núlltilgátuna.<br />
3. Ákveða gagntilgátuna.<br />
4. Finna jöfnu fyrir prófstærðina.<br />
5. Finna höfnunarsvæðið fyrir gefna marktektarkröfuα.<br />
6. Reikna gildið á prófstærðinni.<br />
7. Ákveða hvort við höfnumH0 eða ekki og lýsa ákvörðuninni í orðum.<br />
Dæmi - þykkt glerja - framhald. Tökum þessi 7 skref.<br />
1. Stikinn sem á að prófa: µ = meðalþykkt glerja<br />
2. Núlltilgátan: H0 : µ = 3,20 (= µ0)<br />
3. Gagntilgátan: H1 : µ = 3,20<br />
4. Prófstærðin:<br />
z = (¯x−µ0)<br />
σ/ √ n<br />
5. Höfnunarsvæðið,α = 0,05. HöfnumH0 ef:<br />
= (¯x−3,20)<br />
0,34/ √ 50<br />
|z| > zα/2 = z0,05/2 = z0,025 = 1,96<br />
58
6. Gildið á prófstærðinni er:<br />
7. Ákvörðun<br />
z = (3,05−3,20)<br />
0,34/ √ 50<br />
= −3,12<br />
|z| = |−3,12| = 3,12 > 1,96<br />
P -gildi = 2{1−Φ(|z|)} = 2{1−Φ(|3,12|)} = 0,0018<br />
⇒ höfnumH0 viðα = 0,05<br />
⇒ gögnin gefa til kynna að meðalþykkt glerjanna sé ekki3,20 mm.<br />
5.4 Jöfnur fyrir β og val án<br />
Hér skoðum við einungis jöfnur fyrirβ og val ánþegar verið er að prófaµínormaldreifingu<br />
og σ er þekkt. Skoðum fyrst tilfellið þegar núlltilgátan og gagntilgátan eru<br />
H0 : µ = µ0 á móti H1 : µ > µ0<br />
og höfnunarsvæðið er z > zα. Hér er µ hið sanna gildi á meðalgildi normaldreifingar-innar<br />
og µ0 er gildið á µ í tilgátunum. Látum µ1 vera eitthvað hugsanlegt gildi á µ í H1, það er,<br />
µ1 > µ0. Þegarµ = µ1 þá eru líkurnar á mistökum af gerð II gefnar með<br />
β(µ1) = Pr(mistök af gerð II|µ = µ1)<br />
= Pr(höfnum ekkiH0 þegar í raun erµ = µ1 > µ0)<br />
<br />
¯X −µ0<br />
= Pr<br />
σ/ √ <br />
<br />
≤ zα<br />
<br />
n µ = µ1<br />
= Pr( ¯ X ≤ µ0 +zασ/ √ n|µ = µ1)<br />
<br />
¯X −µ1<br />
= Pr<br />
σ/ √ n ≤ µ0 −µ1<br />
σ/ √ n +zα<br />
<br />
<br />
<br />
µ = µ1<br />
<br />
= Pr Z ≤ µ0 −µ1<br />
σ/ √ n +zα<br />
<br />
59
µ0 −µ1<br />
= Φ<br />
σ/ √ n +zα<br />
<br />
.<br />
Við viljum finna n þannig að fyrir valið µ1 ∈ H1 sé β(µ1) = β þar sem β er valið gildi.<br />
Leysum fyrirn.<br />
<br />
µ0 −µ1<br />
β = Φ<br />
σ/ √ n +zα<br />
<br />
= Φ(−zβ) = Φ(z1−β)<br />
z1−β = −zβ = µ0 −µ1<br />
σ/ √ n +zα<br />
n = (zα +zβ) 2σ2 .<br />
(µ1 −µ0) 2<br />
Tafla 6 sýnir formúlur fyrirβ(µ1) fyrir mismunandi gagntilgátur.<br />
Tafla 6: Formúlur fyrirβ(µ1), mistök af gerð II<br />
Gagntilgátur β(µ1) fyrirµ1 ∈ H1<br />
<br />
µ0−µ1 H1: µ > µ0 Φ σ/ √ n +zα<br />
<br />
<br />
µ0−µ1<br />
H1: µ < µ0 1−Φ σ/ √ n −zα<br />
<br />
<br />
H1: µ = µ0 Φ −Φ<br />
µ0−µ1<br />
σ/ √ n +zα/2<br />
Tafla 7 sýnir formúlur fyrirnfyrir mismunandi gagntilgátur.<br />
Tafla 7: Formúlur fyrirn<br />
Gagntilgátur n fyrirµ1 ∈ H1<br />
H1: µ > µ0<br />
H1: µ < µ0<br />
H1: µ = µ0<br />
(zα+zβ) 2 σ 2<br />
(µ1−µ0) 2<br />
(zα+zβ) 2 σ 2<br />
(µ1−µ0) 2<br />
(z α/2+zβ) 2 σ 2<br />
(µ1−µ0) 2<br />
60<br />
<br />
µ0−µ1<br />
σ/ √ n −zα/2
Dæmi - þykkt glerja - framhald. Höfum α = 0,05, H1 : µ = 3,20, zα/2 = z0,025 = 1,96.<br />
Þegarn = 50 ogµíraun3,15, þá eru líkurnar á mistökum af gerð II<br />
<br />
3,20−3,15<br />
β(µ1 = 3,15) = Φ<br />
0,34/ √ 50 +1,96<br />
<br />
3,20−3,15<br />
−Φ<br />
0,34/ √ 50 −1,96<br />
<br />
= Φ(3,00)−Φ(−0,92) = 0,9987−0,1788 = 0,8199.<br />
Segjum að við viljum aðβ(µ1 = 3,15) ≤ 0,10. Því erzβ = z0,10 = 1,2816 ognþarf að vera<br />
n = (1,96+1,2816)2 0,34 2<br />
(3,15−3,20) 2<br />
= 485,89.<br />
Veljum n = 486 en þá er β(µ1 = 3,15) = 0,0999 < 0,10. Mynd 16 sýnir fallið β(µ1) fyrir<br />
glerjadæmið þegarn = 50 og n = 486.<br />
β(µ)<br />
1<br />
0.9<br />
0.8<br />
0.7<br />
0.6<br />
0.5<br />
0.4<br />
0.3<br />
0.2<br />
0.1<br />
1−α<br />
µ 1 =3.15<br />
β<br />
n=50<br />
n=486<br />
µ 0 =3.20<br />
0<br />
3.1 3.12 3.14 3.16 3.18 3.2<br />
µ [mm]<br />
3.22 3.24 3.26 3.28<br />
Mynd 16: Líkurnar á því því að gera mistök af gerð II sem fall afµídæminu um meðalþykkt<br />
glerja þegarn = 50 ogn = 486.<br />
61
5.5 Tilgátupróf fyrir nokkur valin tilfelli<br />
Tilfelli 1<br />
Próf fyrirµínormaldreifingu.<br />
X1,...,Xn ∼ N(µ,σ 2 ), slembiúrtak.<br />
Fengin gildiX1 = x1,...,Xn = xn.<br />
¯x = 1<br />
<br />
n<br />
<br />
<br />
xi, s = <br />
n<br />
1<br />
n−1<br />
i) Próf fyrirµ, σ 2 þekkt.<br />
ii) Próf fyrirµ,σ 2 óþekkt.<br />
i=1<br />
n<br />
(xi − ¯x) 2<br />
i=1<br />
Z ∼ N(0,1), Tn−1 ∼ tn−1<br />
Tafla 8: Núlltilgáta: H0: µ = µ0, Prófstærð: z = (¯x−µ0)<br />
σ/ √ n<br />
Gagntilgátur Höfnunarsvæði P -gildi<br />
H1: µ > µ0 z > zα Pr(Z ≥ z) = 1−Φ(z)<br />
H1: µ < µ0 z < −zα Pr(Z ≤ z) = Φ(z)<br />
H1: µ = µ0 |z| > zα/2 2Pr(Z ≥ |z|) = 2{1−Φ(|z|)}<br />
Tafla 9: Núlltilgáta: H0: µ = µ0, Prófstærð: t = (¯x−µ0)<br />
s/ √ n<br />
Gagntilgátur Höfnunarsvæði P -gildi<br />
H1: µ > µ0 t > tα,n−1 Pr(Tn−1 ≥ t)<br />
H1: µ < µ0 t < −tα,n−1 Pr(Tn−1 ≤ t)<br />
H1: µ = µ0 |t| > tα/2,n−1 2Pr(Tn−1 ≥ |t|)<br />
62
Tilfelli 2<br />
Próf fyrirσ 2 í normaldreifingu.<br />
X1,...,Xn ∼ N(µ,σ 2 ), slembiúrtak.<br />
Fengin gildiX1 = x1,...,Xn = xn.<br />
i) Próf fyrirσ 2 .<br />
¯x = 1<br />
n<br />
n<br />
i=1<br />
xi, s 2 = 1<br />
n−1<br />
X 2 n−1 ∼ χ2 n−1<br />
n<br />
(xi − ¯x) 2<br />
Tafla 10: Núlltilgáta: H0: σ 2 = σ 2 0 , Prófstærð: w2 = (n−1)s2<br />
σ 2 0<br />
Gagntilgátur Höfnunarsvæði P -gildi<br />
i=1<br />
H1: σ 2 > σ 2 0 w 2 > χ 2 α,n−1 Pr(X 2 n−1 ≥ w 2 )<br />
H1: σ 2 < σ 2 0 w2 < χ 2 1−α,n−1 Pr(X 2 n−1 ≤ w2 )<br />
H1: σ 2 = σ 2 0 w2 > χ 2 α/2,n−1 2min{Pr(X 2 n−1 ≥ w2 ), Pr(X 2 n−1 ≤ w2 )}<br />
eðaw 2 < χ 2 1−α/2,n−1<br />
63
Tilfelli 3<br />
Próf fyrirpítvíkostadreifingu.<br />
X ∼ Bin(n,p), slembistærð.<br />
Fengið gildiX = x.<br />
i) Próf fyrirp, nálgun,np0 ≥ 20.<br />
ˆp = x<br />
n<br />
Z ∼ N(0,1)<br />
Tafla 11: Núlltilgáta: H0: p = p0, Prófstærð: z = (x−np0) √<br />
np0(1−p0) =<br />
Gagntilgátur Höfnunarsvæði P -gildi<br />
H1: p > p0 z > zα Pr(Z ≥ z) = 1−Φ(z)<br />
H1: p < p0 z < −zα Pr(Z ≤ z) = Φ(z)<br />
H1: p = p0 |z| > zα/2 2Pr(Z ≥ |z|) = 2{1−Φ(|z|)}<br />
ii) Nákvæmt próf fyrirp, sjá bls. 323-326 í Ross.<br />
64<br />
(ˆp−p0) √<br />
p0(1−p0)/n
Tilfelli 4<br />
Próf fyrirµ1 −µ2,µ1 og µ2 í normaldreifingum.<br />
X1,...,Xn ∼ N(µ1,σ2 1 ), slembiúrtak.<br />
Y1,...,Ym ∼ N(µ2,σ2 2 ), slembiúrtak, óháð X-unum.<br />
Fengin gildiX1 = x1,...,Xn = xn og Y1 = y1,...,Ym = ym.<br />
¯x = 1<br />
n<br />
¯y = 1<br />
m<br />
n<br />
i=1<br />
m<br />
i=1<br />
xi, s 2 1 = 1<br />
n−1<br />
yi, s 2 2<br />
= 1<br />
m−1<br />
n<br />
(xi − ¯x) 2<br />
i=1<br />
m<br />
(yi − ¯y) 2<br />
i=1<br />
s 2 p = (n−1)s2 1 +(m−1)s 2 2<br />
n+m−2<br />
υ = (s21 /n+s2 2 /m)2<br />
<br />
(s2 1 /n) 2<br />
n−1 + (s2 2 /m)2<br />
, (υ er lækkað niður í næstu heiltölu)<br />
m−1<br />
i) Próf fyrirµ1 −µ2, σ 2 1 og σ2 2 þekkt.<br />
Z ∼ N(0,1), Tn+m−2 ∼ tn+m−2, Tυ ∼ tυ<br />
Tafla 12: Núlltilgáta: H0: µ1 −µ2 = δ0, Prófstærð: z = (¯x−¯y−δ0) √<br />
σ2 1 /n+σ2 2 /m<br />
Gagntilgátur Höfnunarsvæði P -gildi<br />
H1: µ1 −µ2 > δ0 z > zα Pr(Z ≥ z) = 1−Φ(z)<br />
H1: µ1 −µ2 < δ0 z < −zα Pr(Z ≤ z) = Φ(z)<br />
H1: µ1 −µ2 = δ0 |z| > zα/2 2Pr(Z ≥ |z|) = 2{1−Φ(|z|)}<br />
65
ii) Próf fyrirµ1 −µ2, σ 2 1 og σ2 2 óþekkt,σ2 1 = σ2 2 .<br />
√<br />
sp 1/n+1/m<br />
Tafla 13: Núlltilgáta: H0: µ1 −µ2 = δ0, Prófstærð: t = (¯x−¯y−δ0)<br />
Gagntilgátur Höfnunarsvæði P -gildi<br />
H1: µ1 −µ2 > δ0 t > tα,n+m−2 Pr(Tn+m−2 ≥ t)<br />
H1: µ1 −µ2 < δ0 t < −tα,n+m−2 Pr(Tn+m−2 ≤ t)<br />
H1: µ1 −µ2 = δ0 |t| > tα/2,n+m−2 2Pr(Tn+m−2 ≥ |t|)<br />
iii) Próf fyrirµ1 −µ2, σ 2 1 ogσ2 2 óþekkt,σ2 1 = σ2 2 .<br />
Tafla 14: Núlltilgáta: H0: µ1 −µ2 = δ0, Prófstærð: t = (¯x−¯y−δ0) √<br />
s2 1 /n+s2 2 /m<br />
Gagntilgátur Höfnunarsvæði P -gildi<br />
H1: µ1 −µ2 > δ0 t > tα,υ Pr(Tυ ≥ t)<br />
H1: µ1 −µ2 < δ0 t < −tα,υ Pr(Tυ ≤ t)<br />
H1: µ1 −µ2 = δ0 |t| > tα/2,υ 2Pr(Tυ ≥ |t|)<br />
66
Tilfelli 5<br />
Próf fyrirσ 2 1 ogσ 2 2 í normaldreifingum.<br />
X1,...,Xn ∼ N(µ1,σ2 1 ), slembiúrtak.<br />
Y1,...,Ym ∼ N(µ2,σ2 2 ), slembiúrtak, óháð X-unum.<br />
Fengin gildiX1 = x1,...,Xn = xn og Y1 = y1,...,Ym = ym.<br />
i) Próf fyrirσ 2 1 ogσ2 2 .<br />
¯x = 1<br />
n<br />
¯y = 1<br />
m<br />
n<br />
i=1<br />
m<br />
i=1<br />
xi, s 2 1 = 1<br />
n−1<br />
yi, s 2 2<br />
= 1<br />
m−1<br />
n<br />
(xi − ¯x) 2<br />
i=1<br />
Qn−1,m−1 ∼ Fn−1,m−1<br />
m<br />
(yi − ¯y) 2<br />
i=1<br />
Tafla 15: Núlltilgáta: H0: σ 2 1 = σ2 2 , Prófstærð: f = s2 1<br />
s 2 2<br />
Gagntilgátur Höfnunarsvæði P -gildi<br />
H1: σ 2 1 > σ2 2 f > Fα,n−1,m−1 Pr(Qn−1,m−1 ≥ f)<br />
H1: σ 2 1 < σ2 2 f < F1−α,n−1,m−1 Pr(Qn−1,m−1 ≤ f)<br />
H1: σ 2 1 = σ 2 2 f > Fα/2,n−1,m−1 2min{Pr(Qn−1,m−1 ≥ f), Pr(Qn−1,m−1 ≤ f)}<br />
eðaf < F1−α/2,n−1,m−1<br />
67
Tilfelli 6<br />
Próf fyrirµw = µ1 −µ2, paraðar mælingar.<br />
(X1,Y1),...,(Xn,Yn) eru n óháð pör, en Xi og Yi, i = 1,...,n, geta verið innbyrðis háð.<br />
Hvert par (Xi,Yi), i = 1,...,n, er yfirleitt tvær mælingar á sama hlut eða einstaklingi.<br />
Wi = Xi −Yi, E(Xi) = µ1, E(Yi) = µ2, E(Wi) = µw = µ1 −µ2,i = 1,...,n.<br />
W1,...,Wn ∼ N(µw,σ2 w ), óháðar.<br />
Fengin gildi (X1,Y1) = (x1,y1),...,(Xn,Yn) = (xn,yn), W1 = w1 = x1 − y1,...,Wn =<br />
wn = xn −yn.<br />
¯w = 1<br />
n<br />
i) Próf fyrirµw = µ1 −µ2.<br />
<br />
n<br />
<br />
<br />
wi, sw = 1<br />
n−1<br />
i=1<br />
Tn−1 ∼ tn−1<br />
n<br />
(wi − ¯w) 2<br />
Tafla 16: Núlltilgáta: H0: µw = ∆0, Prófstærð: t = (¯w−∆0)<br />
sw/ √ n<br />
i=1<br />
Gagntilgátur Höfnunarsvæði P -gildi<br />
H1: µw > ∆0 t > tα,n−1 Pr(Tn−1 ≥ t)<br />
H1: µw < ∆0 t < −tα,n−1 Pr(Tn−1 ≤ t)<br />
H1: µw = ∆0 |t| > tα/2,n−1 2Pr(Tn−1 ≥ |t|)<br />
68
Tilfelli 7<br />
Próf fyrirp1 −p2, p1 og p2 í tvíkostadreifingum.<br />
X ∼ Bin(n1,p1), Y ∼ Bin(n2,p2), slembistærðir.<br />
Fengin gildiX = x ogY = y.<br />
ˆp1 = x<br />
, ˆp2 = y<br />
, ˆp = x+y<br />
n1<br />
n2<br />
Z ∼ N(0,1)<br />
n1 +n2<br />
i) Próf fyrirp1 −p2, nálgun,min{n1p1(1−p1),n2p2(1−p2)} ≥ 10.<br />
Tafla 17: Núlltilgáta: H0: p1 = p2, Prófstærð: z =<br />
Gagntilgátur Höfnunarsvæði P -gildi<br />
H1: p1 > p2 z > zα Pr(Z ≥ z) = 1−Φ(z)<br />
H1: p1 < p2 z < −zα Pr(Z ≤ z) = Φ(z)<br />
(ˆp1−ˆp2) √<br />
ˆp(1−ˆp)(1/n1+1/n2)<br />
H1: p1 = p2 |z| > zα/2 2Pr(Z ≥ |z|) = 2{1−Φ(|z|)}<br />
ii) Nákvæmt próf fyrirp1 −p2, sjá bls. 327-329 í Ross.<br />
69
6 Línulegt aðhvarf<br />
Í þessum kafla er fjallað um línulegt aðhvarf (e. linear regression) en einungis verður skoðað<br />
einfalt línulegt líkan (e. simple linear model).<br />
6.1 Einfalt línulegt líkan<br />
Gerum ráð fyrir að lýsa megi slembibreytuY fyrir tilsvarandixmeð<br />
Y = α+βx+ǫ,<br />
þar semαogβ eru fastar, ogǫer slembistærð,ǫ ∼ N(0,σ 2 ). Breytanxer kölluð skýribreyta<br />
(e. predictor variable). Ef við höfum n slembistærðir Yi, i = 1,...,n, og fyrir hvert Yi er<br />
tilsvarandi gildi á skýribreytunnixi, i = 1,...,n, þá má rita<br />
Yi = α+βxi +ǫi, ǫi ∼ N(0,σ 2 ), i = 1,...,n,<br />
og ǫ-in eru innbyrðis óháð. Því gildir fyrir hverti = 1,...,n að<br />
og<br />
E(Yi) = E(α+βxi +ǫi) = α+βxi + E(ǫi) = α+βxi +0 = α+βxi,<br />
var(Yi) = var(α+βxi +ǫi) = var(ǫi) = σ 2 .<br />
Þar sem hvertYi er summa af fasta og normaldreifðri slembistærð þá gildir að<br />
Yi ∼ N(α+βxi,σ 2 ), i = 1,...,n,<br />
og þar semǫ-in eru innbyrðis óháð þá eru Y -in einnig innbyrðis óháð.<br />
6.2 Metlar fyrir stikana α, β og σ 2<br />
Segjum að við höfum mælingar (x1,y1), (x2,y2), ..., (xn,yn), á x og Y , og að við viljum<br />
finna línu, y = a+bx, í gegnum mælingarnar. Skilgreinum leif (e. residual)i-tu mælingar-<br />
innar sem<br />
ei = yi −a−bxi, i = 1,...,n.<br />
70
Línan er valin þannig að summa leifa í öðru veldi sé sem minnst. Þetta jafngildir því að finna<br />
a og b sem lágmarka fallið<br />
f(a,b) =<br />
n<br />
(yi −a−bxi) 2 =<br />
i=1<br />
Diffrumf(a,b) með tilliti tilaogb<br />
∂f(a,b)<br />
∂a =<br />
∂f(a,b)<br />
∂b<br />
=<br />
n<br />
i=1<br />
e 2 i .<br />
n<br />
(−2)(yi −a−bxi),<br />
i=1<br />
n<br />
(−2xi)(yi −a−bxi).<br />
i=1<br />
Setjum afleiðurnar ∂f(a,b)/∂a og∂f(a,b)/∂b jafnar núlli og leysum fyriraogb<br />
Endurritum jöfnurnar<br />
−2<br />
−2<br />
n<br />
(yi −a−bxi) = 0,<br />
i=1<br />
n<br />
xi(yi −a−bxi) = 0.<br />
i=1<br />
n<br />
yi = na+b<br />
i=1<br />
n<br />
xiyi = a<br />
i=1<br />
n<br />
i=1<br />
n<br />
xi,<br />
i=1<br />
xi +b<br />
n<br />
x 2 i.<br />
Látum ¯y = n<br />
i=1 yi/n og ¯x = n<br />
i=1 xi/n, þá má rita fyrri jöfnuna á forminu<br />
Setjum inn fyriraíseinni jöfnunni, þá fæst<br />
a = ¯y −b¯x.<br />
i=1<br />
n<br />
xiyi = (¯y −b¯x)n¯x+b<br />
i=1<br />
<br />
n<br />
b x 2 i −n¯x2<br />
<br />
=<br />
i=1<br />
b =<br />
n<br />
i=1<br />
n i=1xiyi −n¯x¯y<br />
n i=1x2i 71<br />
n<br />
x 2 i,<br />
i=1<br />
xiyi −n¯x¯y,<br />
−n¯x2 .
Hér verða eftirfarandi summur táknaðar með<br />
Þá má ritabmeð<br />
Sxy =<br />
n<br />
(xi − ¯x)(yi − ¯y) =<br />
i=1<br />
Sxx =<br />
Syy =<br />
n<br />
(xi − ¯x) 2 =<br />
i=1<br />
n<br />
(yi − ¯y) 2 =<br />
i=1<br />
b = Sxy<br />
.<br />
Sxx<br />
n<br />
i=1<br />
xiyi −n¯x¯y,<br />
n<br />
x 2 i −n¯x 2 ,<br />
i=1<br />
n<br />
y 2 i −n¯y2 .<br />
Hér eru a og b punktmatið á α og β. Látum A og B vera metla fyrir α og β, og ¯ Y =<br />
n −1 n<br />
i=1 Yi. Þá má ritaAogB<br />
B =<br />
n i=1xiYi −n¯x ¯ Y<br />
n i=1x2i −n¯x2 =<br />
i=1<br />
n<br />
A = ¯ Y −B¯x.<br />
i=1 (xi − ¯x)Yi<br />
n i=1 (xi<br />
,<br />
− ¯x) 2<br />
Þessi aðferð er kölluð aðferð minnstu kvaðrata (e. least squares method). Að því gefnu að<br />
Y -in fylgi normaldreifingu, þá eru A og B einnig sennileikametlarα ogβ. Línan<br />
y = a+bx<br />
er kölluð aðhvarfslína úrtaks (e. sample regression line).<br />
6.3 Dreifingar metlanna<br />
MetlarnirAog B eru línulegar samtektir afY1, ..., Yn. Til dæmis erB þannig að<br />
þar sem ci er<br />
ci =<br />
B =<br />
n<br />
i=1 (xi − ¯x)Yi<br />
n i=1 (xi − ¯x)<br />
2 =<br />
n<br />
ciYi,<br />
i=1<br />
(xi − ¯x)<br />
n<br />
i=1 (xi − ¯x) 2 = (Sxx) −1 (xi − ¯x), i = 1,...,n.<br />
72
Hvert ci er fasti, og hvert Yi fylgir normaldreifingu og Y -in eru innbyrðis óháð. Þar af<br />
leiðandi fylgirB normaldreifingu með meðalgildi<br />
<br />
n<br />
<br />
n n<br />
E(B) = E = ciE(Yi) = ci(α+βxi) =<br />
= (Sxx) −1<br />
og dreifni<br />
<br />
α<br />
i=1<br />
ciYi<br />
i=1<br />
n<br />
(xi − ¯x)+β<br />
i=1<br />
var(B) = var<br />
og við ritum<br />
n<br />
i=1<br />
ciYi<br />
<br />
i=1<br />
n<br />
<br />
(xi − ¯x)xi<br />
i=1<br />
=<br />
= σ 2 (Sxx) −2<br />
Á sama hátt má sýna að umAgildi<br />
og að A fylgi normaldreifingu<br />
= (Sxx) −1<br />
= (Sxx) −1 {βSxx} = β,<br />
n<br />
c 2 i var(Yi) =<br />
i=1<br />
n<br />
i=1<br />
n<br />
i=1<br />
n<br />
i=1<br />
(Sxx) −1 (xi − ¯x)(α+βxi)<br />
<br />
n<br />
α×0+β x 2 i −n¯x2<br />
<br />
c 2 i σ2 = σ 2<br />
n<br />
i=1<br />
(xi − ¯x) 2 = σ 2 (Sxx) −2 Sxx = σ2<br />
<br />
B ∼ N β, σ2<br />
<br />
.<br />
Sxx<br />
E(A) = α,<br />
var(A) = σ 2<br />
<br />
1 ¯x2<br />
+ ,<br />
n Sxx<br />
<br />
A ∼ N α,σ 2<br />
<br />
1 ¯x2<br />
+ .<br />
n Sxx<br />
Sxx<br />
i=1<br />
(Sxx) −2 (xi − ¯x) 2<br />
MetillinnAer því óbjagaður metill fyrirα, og metillinnB er óbjagaður metill fyrirβ.<br />
Summa leifanna í öðru veldi er kölluð fervikasumma. Fervikasumman sem fall af Y -<br />
unum,AogB er<br />
SSR =<br />
n<br />
(Yi −A−Bxi) 2<br />
i=1<br />
og er því slembistærð. Ef fervikasumman er fall af fengnumy-gildum og punktmatiaístað<br />
A og b í staðB, þá erSSR punktmat á einhverjum stika. Um slembistærðinaSSR gildir að<br />
SSR<br />
σ 2 ∼ χ2 n−2 .<br />
73<br />
,
Því eru meðalgildi og dreifniSSR/σ 2<br />
E<br />
<br />
SSR<br />
σ2 <br />
= n−2, var<br />
Þá má sýna að meðalgildi og dreifni SSR/(n−2) eru<br />
Þar af leiðandi er metillinn<br />
<br />
SSR<br />
σ2 <br />
= 2(n−2).<br />
<br />
SSR<br />
E = σ<br />
n−2<br />
2 <br />
SSR<br />
, var =<br />
n−2<br />
2σ4<br />
(n−2) .<br />
S 2 r = SSR<br />
(n−2)<br />
óbjagaður metill fyrirσ 2 . Einnig má sýna að metillinnS 2 r<br />
er óháður metlunumAogB (ekki<br />
sýnt hér). Þar semσ 2 er yfirleitt óþekkt þarf að metaσ 2 og því einnig dreifniAogB. Dreifni<br />
A má meta með S 2 A og dreifni B má meta með S2 B<br />
S 2 A = S 2 r<br />
þar sem<br />
<br />
1 ¯x2<br />
+ , S<br />
n Sxx<br />
2 B = S2 r<br />
.<br />
Sxx<br />
Punktmat áσ 2 , táknað meðs 2 r , fæst með því að nota jöfnuna fyrirS2 r<br />
í staðY -anna, það er,<br />
s 2 r<br />
= 1<br />
n−2<br />
n<br />
(yi −a−bxi) 2 .<br />
i=1<br />
6.4 Öryggisbil og tilgátupróf fyrir α ogβ<br />
með fengnumy-gildum<br />
Í ljósi þess aðAogB fylgja normaldreifingum og aðSSR/σ 2 fylgir kí-kvaðratsdreifingu og<br />
er óháð A og B, má sýna að<br />
(A−α)<br />
SA<br />
∼ tn−2,<br />
(B −β)<br />
SB<br />
∼ tn−2<br />
með hjálp setningarinnar um t-dreifinguna. Við notum þessar staðreyndir til að búa til ör-<br />
yggisbil fyrirαogβ. UmAogB gildir að<br />
<br />
Pr −tα ′ /2,n−2 < (A−α)<br />
< tα<br />
SA<br />
′ <br />
/2,n−2 = 1−α ′ ,<br />
<br />
Pr −tα ′ /2,n−2 <<br />
(B −β)<br />
SB<br />
74<br />
< tα ′ /2,n−2<br />
<br />
= 1−α ′ .
Því er100(1−α ′ )% öryggisbil fyrirαgefið með<br />
a±tα ′ /2,n−2sA,<br />
og 100(1−α ′ )% öryggisbil fyrirβ er gefið með<br />
b±tα ′ /2,n−2sB,<br />
þar semaogberu punktmat áαogβ ogs 2 A , ogs2 B<br />
eru punktmat á dreifni metlannaAogB<br />
sem fæst með því að notas 2 r í stað σ 2 , það er, s 2 A = s2 r(1/n+ ¯x 2 /Sxx) ogs 2 B = s2 r/Sxx.<br />
Ef við viljum gera tilgátupróf fyrir stikanaαogβ, þá notum við ofangreindar staðreyndir.<br />
Töflur 18 og 19 sýna þær jöfnur og ójöfnur sem þarf að nota við tilgátupróf fyrir α og β.<br />
LátumTn−2 tákna slembibreytu sem fylgirt-dreifingu með (n−2) frítölur.<br />
Tafla 18: Próf fyrirα. Núlltilgáta: H0: α = α0 Prófstærð: t = (a−α0)<br />
Gagntilgátur Höfnunarsvæði P -gildi<br />
H1: α > α0 t > tα ′ ,n−2 Pr(Tn−2 ≥ t)<br />
H1: α < α0 t < −tα ′ ,n−2 Pr(Tn−2 ≤ t)<br />
H1: α = α0 |t| > tα ′ /2,n−2 2Pr(Tn−2 ≥ |t|)<br />
Tafla 19: Próf fyrirβ. Núlltilgáta: H0: β = β0 Prófstærð: t = (b−β0)<br />
Gagntilgátur Höfnunarsvæði P -gildi<br />
H1: β > β0 t > tα ′ ,n−2 Pr(Tn−2 ≥ t)<br />
H1: β < β0 t < −tα ′ ,n−2 Pr(Tn−2 ≤ t)<br />
H1: β = β0 |t| > tα ′ /2,n−2 2Pr(Tn−2 ≥ |t|)<br />
75<br />
sA<br />
sB
6.5 Öryggisbil fyrir α+βx0<br />
Látum A + Bx0 vera metil fyrir α + βx0, það er, meðalgildi Y þegar skýribreytan tekur<br />
gildiðx0. Þá má sýna á sama máta og við sýndum fyrirB að<br />
og að A+Bx0 fylgi normaldreifingu<br />
Metillinn fyrir dreifniA+Bx0 er<br />
E(A+Bx0) = α+βx0,<br />
var(A+Bx0) = σ 2<br />
<br />
1<br />
n + (x0 − ¯x) 2<br />
Sxx<br />
<br />
A+Bx0 ∼ N α+βx0,σ 2<br />
<br />
1<br />
n + (x0 − ¯x) 2<br />
.<br />
Sxx<br />
S 2 A+Bx0 = S2 r<br />
Einnig má sýna á sama hátt og hér að ofan að<br />
<br />
1<br />
n + (x0 − ¯x) 2<br />
.<br />
Sxx<br />
(A+Bx0 −α−βx0)<br />
SA+Bx0<br />
∼ tn−2.<br />
Við notum þessa staðreynd til að mynda 100(1−α ′ )% öryggisbil fyrir α + βx0, en það er<br />
gefið með<br />
þar sem s 2 A+Bx0<br />
(a+bx0)±tα ′ /2,n−2sA+Bx0,<br />
er punktmat á dreifniA+Bx0.<br />
6.6 Spábil fyrir nýttY þegar skýribreytan tekur gildið x0<br />
Ef við eigum að spá fyrir um gildið á nýju Y -i þegar skýribreytan tekur gildið x0 þá er<br />
meðalgildi Y , E(Y) = α + βx0, gott spágildi fyrir Y . Þar sem α og β eru óþekkt, þá er<br />
eðlilegt að meta spágildið með A+Bx0.<br />
Við viljum segja til um á hvaða bili nýttY er líklegast til að falla. Dreifing Y er<br />
Y ∼ N(α+βx0,σ 2 )<br />
76
og ef við þekktum α, β og σ 2 þá gætum við sagt að 95% af nýjum Y -um muni falla innan<br />
bilsins<br />
(α+βx0)±1,96σ.<br />
Þar semα,β og σ 2 eru óþekkt þá verðum við að taka óvissuna í matinu á þessu stikum með<br />
í reikninginn. Við gerum það með því að finna dreifingu Y −A−Bx0. Dreifing A+Bx0<br />
er eins og hér að ofan. Þar semY er óháðY1, ...,Yn sem voru notuð til að reiknaAogB, þá<br />
erY óháðAog B. Því er dreifing Y −A−Bx0<br />
<br />
Y −A−Bx0 ∼ N 0,σ 2<br />
<br />
1+ 1<br />
n + (x0 − ¯x) 2<br />
.<br />
Sxx<br />
Metill fyrir dreifniY −A−Bx0 er á forminu<br />
S 2 r<br />
<br />
1+ 1<br />
n + (x0 − ¯x) 2<br />
= S<br />
Sxx<br />
2 r +S 2 A+Bx0 .<br />
Á sama máta og við sýndum að breytur hér að ofan fylgi t-dreifingu með (n − 2) frítölum<br />
má sýna að<br />
Sr<br />
Y −A−Bx0<br />
<br />
1+ 1 (x0−¯x) 2<br />
+ n Sxx<br />
= Y −A−Bx0<br />
<br />
S 2 r +S 2 A+Bx0<br />
∼ tn−2.<br />
Við notum staðreyndirnar hér að ofan til að mynda 100(1−α ′ )% spábil fyrir nýtt Y þegar<br />
skýribreytan tekur gildiðx0 en það er gefið með<br />
<br />
eða<br />
(a+bx0)±tα ′ /2,n−2sr<br />
(a+bx0)±tα ′ /2,n−2<br />
1+ 1<br />
n + (x0 − ¯x) 2<br />
Sxx<br />
<br />
s 2 r +s2 A+Bx0 .<br />
6.7 Fylgnistuðull úrtaks og skýringarhlutfall<br />
Fylgnistuðull úrtaks metur styrk og stefnu línulegar fylgni á milli x og Y . Ef við höfum<br />
mælingar(x1,y1), ..., (xn,yn) þá er fylgnistuðull úrtaks,r, gefinn með<br />
r =<br />
n i=1 (xi − ¯x)(yi − ¯y)<br />
n i=1 (xi − ¯x) 2n i=1 (yi − ¯y)<br />
77<br />
2 =<br />
Sxy<br />
.<br />
SxxSyy
Umr gildir eftirfarandi<br />
i)rer óháð einingumxogY.<br />
ii)−1 ≤ r ≤ 1<br />
iii)r = 1 ef allir punktarnir eru á beinni línu með jákvæðri hallatölu.<br />
iv)r = −1 ef allir punktarnir eru á beinni línu með neikvæðri hallatölu.<br />
Til viðmiðunar fyrir gildi árþá setjum við fram Töflu 20.<br />
Tafla 20: Flokkun á gildumr.<br />
Bil Fylgni Formerki<br />
−1,0 ≤ r < −0,8 Sterk Neikvætt<br />
−0,8 ≤ r < −0,5 Miðlungs Neikvætt<br />
−0,5 ≤ r < 0,0 Veik Neikvætt<br />
r = 0,0 Engin<br />
0,0 < r ≤ 0,5 Veik Jákvætt<br />
0,5 < r ≤ 0,8 Miðlungs Jákvætt<br />
0,8 < r ≤ 1,0 Sterk Jákvætt<br />
Köllum Syy = (yi − ¯y) 2 heildardreifni mældu y-anna. Fervikasumman er eins og<br />
áðurSSR = e 2 i , og er mælikvarði á heildardreifni leifanna. Nefnum stærðinaSSE skýrða<br />
dreifni þar sem<br />
SSE =<br />
n<br />
(a+bxi − ¯y) 2 .<br />
i=1<br />
SSE mælir dreifnina sem líkanið skýrir. Sýna má að<br />
Syy = SSE +SSR.<br />
Heildardreifninni má því skipta í þátt sem að líkanið skýrir (SSE) og þátt sem ekki verður<br />
skýrður með skýribreytunni x (SSR). Skilgreinum skýringarhlutfall, R 2 , (e. coefficient of<br />
78
determination) sem hlutfall skýrðrar dreifni og heildardreifniy-anna<br />
UmR 2 gildir að<br />
R 2 = SSE<br />
Syy<br />
= Syy −SSR<br />
Syy<br />
0 ≤ R 2 ≤ 1.<br />
= 1− SSR<br />
.<br />
Syy<br />
Ef R 2 er til dæmis jafnt og 0,83, þá segjum við að x skýri 83% af dreifni Y . Sýna má að<br />
sambandið á millir ogR 2 sé<br />
r 2 = R 2<br />
Athugið að R 2 segir ekki til um formerkir.<br />
eða |r| = √ R 2 .<br />
6.8 Greining á leifunum: Forsendur líkans athugaðar<br />
Við notum leifarnar til að athuga hvort forsendurnar sem við gáfum okkur í upphafi séu réttar.<br />
Við fáum ekki beinar mælingar áǫ-unum en við getum notað leifarnar til að fá hugmynd um<br />
hvernigǫ-in hegða sér.<br />
Fyrst er athugað hvort sambandið sé línulegt með því að skoða leifarnar á mótix. Ef það<br />
er sýnilegt form í myndinni er möguleiki á að línanα+βx lýsi E(Y)ekki nægjanlega vel. Ef<br />
línan virðist lýsa E(Y) nægjanlega vel er næst athugað hvort ǫ-in hafi sömu dreifni með því<br />
að teikna leifarnar á móti x. Ef dreifnin virðist til dæmis vera að vaxa með skýribreytunni<br />
x þá er hugsanlegt að ǫ-in hafi ekki sömu dreifni fyrir mismunandi x. Ef dreifnin er sú<br />
sama fyrir öll x er athugað hvort ǫ-in fylgi normaldreifingu með því að teikna svokallað<br />
normaldreifingarrit af leifunum. Ef punktarnir á normaldreifingarritinu liggja nálægt línunni<br />
á myndinni og endapunktarnir báðum megin sveigjast ekki afgerandi upp eða niður þá er<br />
ásættanlegt að gera ráð fyrir að ǫ-in fylgi normaldreifingu.<br />
Mynd 17 sýnir þrjú tilfelli af gögnum. Í hverju tilfelli er sýnd mynd af gögnunum og<br />
aðhvarfslínunni, leifunum á móti x breytunni og normaldreifingarrit. Þrjár efstu mynd-irnar<br />
sýna tilfelli þar sem öllum forsendum er fullnægt. Myndirnar þrjár í miðjunni sýna tilfelli<br />
þar sem parabólulið eða einhvern ólínulegan lið vantar í líkanið. Þetta sést vel á myndinni<br />
79
af leifunum á mótix-unum. Þrjár neðstu myndirnar sýna tilfelli þar sem dreifniǫ-anna er að<br />
vaxa meðx-unum.<br />
Hermd gögn og aðhvarfslína úrtaks<br />
20<br />
10<br />
0<br />
−10<br />
0 5 10 15<br />
200<br />
150<br />
100<br />
50<br />
0<br />
0 5 10 15<br />
60<br />
40<br />
20<br />
0<br />
0 10 20<br />
x<br />
10<br />
0<br />
−10<br />
40<br />
20<br />
0<br />
−20<br />
Leifar (e i ) á móti x<br />
0 5 10 15<br />
−40<br />
0 5 10 15<br />
50<br />
0<br />
−50<br />
0 10 20<br />
x<br />
Normaldreifingarrit af leifum<br />
0.99<br />
0.98<br />
0.95<br />
0.90<br />
0.75<br />
0.50<br />
0.25<br />
0.10<br />
0.05<br />
0.02<br />
0.01<br />
−10 −5 0 5<br />
0.98<br />
0.95<br />
0.90<br />
0.75<br />
0.50<br />
0.25<br />
0.10<br />
0.05<br />
0.02<br />
−20 0 20 40<br />
0.99<br />
0.98<br />
0.95<br />
0.90<br />
0.75<br />
0.50<br />
0.25<br />
0.10<br />
0.05<br />
0.02<br />
0.01<br />
−20 0 20<br />
e<br />
i<br />
40<br />
Mynd 17: Dæmi um greiningu á leifum úr línulegri aðhvarfsgreiningu.<br />
6.9 Ólínulegu líkani varpað á línulegt form<br />
Sambandið á milliY ogxgetur verið ólínulegt. Í sumum tilfellum er hægt að varpa ólínulegu<br />
líkani yfir í línulegt líkan. Hér skoðum við tvö slík tilfelli. Fyrra líkanið er á forminu<br />
Yi = γx θ i eφi , φi ∼ N(0,η 2 ), i = 1,...,n,<br />
þar sem x1, ..., xn, γ, θ og η 2 eru fastar. Ef við notum náttúrulega lografallið báðum megin<br />
við jafnaðarmerkið fæst<br />
Ef við látum<br />
ln(Yi) = ln(γ)+θln(xi)+φi, i = 1,...,n.<br />
Y ∗<br />
i = ln(Yi), x ∗ i = ln(xi), i = 1,...,n, γ ∗ = ln(γ),<br />
80
þá má skrifa líkanið á forminu<br />
Y ∗<br />
i = γ ∗ +θx ∗ i +φi, i = 1,...,n,<br />
og meta stikana γ ∗ og θ með aðferð minnstu kvaðrata. Einnig er hægt að nota aðferð-irnar<br />
sem sýndar hafa verið hér að ofan til að finna öryggisbil og gera tilgátupróf.<br />
Seinna líkanið er á forminu<br />
Yi = κe λxi+υi , υi ∼ N(0,τ 2 ), i = 1,...,n,<br />
þar sem x1, ..., xn, κ, λ og τ 2 eru fastar. Ef við notum náttúrulega lografallið báðum megin<br />
við jafnaðarmerkið fæst<br />
Ef við látum<br />
þá má skrifa líkanið á forminu<br />
ln(Yi) = ln(κ)+λxi +υi, i = 1,...,n.<br />
κ ∗ = ln(κ),<br />
Y ∗<br />
i = κ∗ +λxi +υi, i = 1,...,n,<br />
og meta stikana κ ∗ og λ með aðferð minnstu kvaðrata. Eins og gilti um fyrra líkanið er<br />
hægt að nota jöfnurnar hér að ofan til að reikna öryggisbil og gera tilgátupróf. Til að finna<br />
öryggisbil fyrir γ og κ í líkönunum hér að ofan verður að varpa öryggisbilunum fyrir γ ∗ og<br />
κ ∗ með því að setjaeíveldið af efri og neðri mörkunum.<br />
6.10 Dæmi<br />
Fyrirtæki í tölvugeiranum sér um þjónustu fyrir tölvur. Látum x vera fjölda tölva sem eru<br />
þjónustaðar í einu útkalli og látumY vera heildartímann við að þjónustax vélar í einu útkalli.<br />
Tafla 21 sýnir mælingar sem fengust úr 18 útköllum starfsmanna.<br />
Gerum ráð fyrir að gögnin fylgi línulegu líkani<br />
Yi = α+βxi +ǫi, ǫi ∼ N(0,σ 2 ), i = 1,...,18.<br />
81
Tafla 21: Heildartími við þjónustu á tölvum.<br />
Mæl- Fjöldi Tími Mæl- Fjöldi Tími Mæl- Fjöldi Tími<br />
ing # tölva (mín.) ing # tölva (mín.) ing # tölva (mín.)<br />
i xi yi i xi yi i xi yi<br />
1 7 97 7 7 101 13 2 25<br />
2 6 86 8 3 39 14 5 71<br />
3 5 78 9 4 53 15 7 105<br />
4 1 10 10 2 33 16 1 17<br />
5 5 75 11 8 118 17 4 49<br />
6 4 62 12 5 65 18 5 68<br />
Nokkrar reiknistærðir byggðar á gögnunum;<br />
Sxy =<br />
Sxx =<br />
i=1<br />
n = 18, ¯x = 4,5, ¯y = 64,0,<br />
n<br />
(xi − ¯x) 2 = 74,5, Syy =<br />
i=1<br />
Punktmatið á α,β ogσ er<br />
Fylgnistuðull úrtaks er<br />
n<br />
(yi − ¯y) 2 = 16504,<br />
n<br />
(xi − ¯x)(yi − ¯y) = 1098, SSR = (SxxSyy −S 2 xy )<br />
= 321,396.<br />
b = Sxy<br />
Sxx<br />
= 1098<br />
74,5<br />
i=1<br />
= 14,738<br />
Sxx<br />
a = ¯y −b¯x = 64,0−14,738×4,5 = −2,322<br />
r =<br />
sr =<br />
SSR<br />
n−2 =<br />
Sxy<br />
SxxSyy<br />
=<br />
321,396<br />
18−2<br />
= 4,482.<br />
1098<br />
√ 74,5×16504 = 0,9902<br />
og við segjum að fylgnin sé sterk og jákvæð. Skýringarhlutfallið er<br />
R 2 = r 2 = 0,9902 2 = 0,9805<br />
82
og því skýrirx98% af dreifni Y .<br />
Mat á staðalfrávikiAer<br />
<br />
sA = sr<br />
1 ¯x2<br />
+ = 4,482×<br />
n Sxx<br />
1 4,52<br />
+ = 2,564<br />
18 74,5<br />
og því er 95% öryggisbil fyrirα<br />
a±tα ′ /2,n−2sA = −2,322±2,120×2,564 = (−7,76,3,11).<br />
Reiknum 95% öryggisbil fyrirβ<br />
b±tα ′ /2,n−2sr/ Sxx = 14,738±2,120×4,482/ √ 74,5 = (13,64,15,84).<br />
Hvert er punktmatið á meðalgildi Y þegar skýribreytan tekur gildið x0 = 5? Meðalgildi Y<br />
þegarx0 = 5 erα+βx0 = α+β5 og er metið með<br />
a+bx0 = a+b5 = −2,331+14,738×5 = 71,37.<br />
Hversu vel er meðalgildi Y metið þegar x0 = 5? Notum 95% öryggisbil fyrir α + βx0 =<br />
α+β5 til að meta vissuna í matinu<br />
a+bx0 ±tα ′ /2,n−2sA+Bx0 = a+bx0 ±tα ′ /2,n−2sr<br />
= (−2,331+14,738×5)±2,120×4,482<br />
<br />
1 (5−4,5)2<br />
+<br />
18 74,5<br />
<br />
1<br />
n + (x0 − ¯x) 2<br />
Sxx<br />
= (69,06,73,68).<br />
Ef það er gefið að þjónusta eigi x0 = 5 tölvur, á hvaða bili má búast við að heildartíminn<br />
verði? Notum 95% spábil til að finna þetta bil<br />
a+bx0 ±tα ′ <br />
/2,n−2 s2 r +s2 A+Bx0 = a+bx0 ±tα ′ <br />
/2,n−2sr 1+ 1<br />
n + (x0 − ¯x) 2<br />
Sxx<br />
<br />
= (−2,331+14,738×5)±2,120×4,482 1+ 1 (5−4,5)2<br />
+ = (61,59,81,15).<br />
18 74,5<br />
Það er hugsanlegt að það sé enginn fastur tími sem fer í útkall. Það þýðir að α = 0. Prófum<br />
núlltilgátuna H0 : α = 0 á móti gagntilgátunni H1 : α = 0. Notum marktektarkröfu<br />
α ′ = 0,01. Prófstærðin er<br />
t = a−α0<br />
sA<br />
= a−0<br />
sA<br />
= −2,322−0<br />
2,564<br />
83<br />
= −0,906.
Höfnunarsvæðið er; |t| > tα ′ /2,n−2 = t0,005,16 = 2,921. Þar sem |t| = |−0,906| < 2,921 =<br />
t0,005,16 þá höfnum við ekki H0 við marktektarkröfu α ′ = 0,01. Því er möguleiki að líkanið<br />
sé á forminu<br />
Tími (mín)<br />
e i<br />
140<br />
120<br />
100<br />
80<br />
60<br />
40<br />
20<br />
0<br />
Yi = βxi +ǫi, ǫi ∼ N(0,σ 2 ), i = 1,...,18.<br />
Heildartími á móti fjölda tölva<br />
−20<br />
0 2 4<br />
Fjöldi (x)<br />
6 8<br />
10<br />
5<br />
0<br />
−5<br />
−10<br />
Leifar (e i ) á móti fjölda (x)<br />
0 2 4<br />
Fjöldi (x)<br />
6 8<br />
Líkur<br />
Tími (mín)<br />
140<br />
120<br />
100<br />
80<br />
60<br />
40<br />
20<br />
0<br />
95% öryggisbil og 95% spábil<br />
−20<br />
0 2 4<br />
Fjöldi (x)<br />
6 8<br />
0.98<br />
0.95<br />
0.90<br />
0.75<br />
0.50<br />
0.25<br />
0.10<br />
0.05<br />
0.02<br />
Normaldreifingarrit af leifum<br />
−5 0<br />
e<br />
i<br />
5<br />
Mynd 18: Línuleg aðhvarfsgreining á gögnum um heildarþjónustutíma á móti fjölda tölva<br />
Mynd 18 sýnir aðhvarfsgreiningu á gögnunum um þjónustutíma fyrir tölvur. Myndin<br />
efst vinstra megin sýnir heildarþjónustutímann á móti fjölda tölva. Myndin efst hægra megin<br />
sýnir aðhvarfslínuna, 95% öryggisbil fyrir α + βx, og 95% spábil fyrir ný Y á móti fjölda<br />
tölva. Myndin neðst vinstra megin sýnir leifarnar á móti skýribreytunni x, það er, fjölda<br />
tölva. Myndin neðst til hægri sýnir normaldreifingarrit af leifunum. Af neðri myndunum<br />
á Mynd 18 er ásættanlegt að ætla að α + βx lýsi E(Y) nægjanlega vel, að ǫ-in hafi sömu<br />
dreifni fyrirxábilinu 1 til 8 og að ǫ-in fylgi normaldreifingu.<br />
84
7 Próf fyrir mátgæði og tengslatöflur<br />
7.1 Próf fyrir mátgæði þegar allir stikar eru þekktir<br />
Höfum slembiúrtak Y1, ..., Yn úr strjálli dreifingu. Við viljum prófa hvort líkindadreifing<br />
Y -anna sé<br />
Pr(Y = j) = pj, j = 1,2,...,k,<br />
þar sem Y hefur sömu dreifingu og Y1, ...,Yn ogp1,...,pk, eru þekktir fastar.<br />
Núlltilgátan er<br />
á móti gagntilgátunni<br />
H0 : Pr(Y = j) = pj, j = 1,2,...,k,<br />
H1 : Pr(Y = j) = pj, fyrir eitthvertj ∈ {1,2,...,k}.<br />
Próf af þessu tagi eru nefnd próf fyrir mátgæði (e. goodness-of-fit tests).<br />
Látum Xj, j = 1,...,k, vera fjölda þeirra Y -a sem eru jöfn j. Að því gefnu að H0 sé<br />
sönn, eru líkurnar á að Y sé jafnt og j jafnar pj, og þar sem Xj telur fjöldann af n óháðum<br />
Y -um sem eru jöfn j, þá er<br />
Xj ∼ Bin(n,pj), E(Xj) = npj, j = 1,...,k.<br />
Stærðin (Xj − npj) 2 mælir hversu langt Xj er frá meðalgildi sínu að því gefnu að H0 sé<br />
sönn.<br />
Prófstærðin fyrir tilgáturnar hér að ofan er<br />
T =<br />
k (Xj −npj) 2<br />
.<br />
npj<br />
j=1<br />
Við höfnum H0 ef gildið á T fyrir gefna tilraun er stórt. Að því gefnu að H0 sé sönn má<br />
nálga dreifingu T með kí-kvaðratsdreifingu með (k −1) frítölum<br />
T ∼ χ 2 k−1.<br />
85
Höfnunarsvæðið er þannig að við höfnumH0 ef<br />
t > χ 2 α,k−1<br />
þar sem t er gildið á prófstærðinni fyrir gefna tilraun.<br />
P -gildið er<br />
þar sem W 2 k−1 ∼ χ2 k−1 .<br />
P -gildi = Pr(W 2 k−1 ≥ t).<br />
Dæmi. 120 dúfur á heimleið eru gerðar áttavilltar og svo sleppt. Eru dúfurnar algerlega<br />
áttavilltar? Setjum áttirnar í 8 flokka, sjá Töflu 22 ásamt gögnum. Notum marktektarkröfu<br />
α = 0,01. Tafla 23 sýnir fjölda og væntanlega fjölda í hverjum flokki.<br />
Núlltilgátan er<br />
á móti gagntilgátunni<br />
Tafla 22: Flokkar og fjöldi í flokkum fyrir gögn um dúfur.<br />
Stefna 0 ◦ −45 ◦ 45 ◦ −90 ◦ 90 ◦ −135 ◦ 135 ◦ −180 ◦<br />
Fjöldi 12 16 17 15<br />
Stefna 180 ◦ −225 ◦ 225 ◦ −270 ◦ 270 ◦ −315 ◦ 315 ◦ −360 ◦<br />
Fjöldi 13 20 17 10<br />
H0 : Pr(Y = j) = pj = 1<br />
, j = 1,2,...,8,<br />
8<br />
H1 : Pr(Y = j) = 1<br />
, fyrir eitthvertj ∈ {1,2,...,8}.<br />
8<br />
Tafla 23: Fjöldi og væntanlegur fjöldi í flokkum fyrir gögn um dúfur.<br />
j 1 2 3 4 5 6 7 8 Heild<br />
xj 12 16 17 15 13 20 17 10 120<br />
npj 15 15 15 15 15 15 15 15 120<br />
86
HöfnumH0 ef<br />
t =<br />
8 (xj −npj) 2<br />
j=1<br />
npj<br />
= (12−15)2<br />
15<br />
+...+ (10−15)2<br />
15<br />
= 32 12 22 02 22 52 22 52 72<br />
+ + + + + + + = = 4,8<br />
15 15 15 15 15 15 15 15 15<br />
t > χ 2 0,01,7 = 18,475.<br />
Því höfnum við ekki H0 miðað við marktektarkröfu α = 0,01. P -gildið gefur einnig til<br />
kynna að ekki skuli hafnaH0.<br />
P -gildi = Pr(W 2 7 ≥ 4,8) = 0,6844 > α = 0,01.<br />
7.2 Próf fyrir mátgæði þegar einn eða fleiri stikar eru óþekktir<br />
Hér eru p1,...,pk föll af einhverjum m óþekktum stikum, θ = (θ1,...,θm) T , og því eru p-<br />
in einnig óþekkt. Við viljum prófa hvort gögnin fylgi stikaðri líkindadreifingu, til dæmis<br />
Poisson dreifingu eða tvíkostadreifingu. Gildin á stikunum eru fundin með sennileikamati.<br />
Táknum matið ápj = pj(θ) með ˆpj = pj( ˆ θ), j = 1,...,k.<br />
Núlltilgátan er<br />
á móti gagntilgátunni<br />
H0 : Pr(Y = j) = pj(θ), j = 1,2,...,k,<br />
H1 : Pr(Y = j) = pj(θ), fyrir eitthvertj ∈ {1,2,...,k}.<br />
Prófstærðin fyrir tilgáturnar hér að ofan er<br />
T =<br />
k (Xj −nˆpj) 2<br />
.<br />
nˆpj<br />
j=1<br />
Að því gefnu að H0 sé sönn má nálga dreifinguT með<br />
T ∼ χ 2 k−1−m .<br />
Höfnunarsvæðið er þannig að við höfnumH0 ef<br />
t > χ 2 α,k−1−m<br />
87
þar sem t er gildið á prófstærðinni fyrir gefna tilraun.<br />
P -gildið er<br />
þar sem W 2 k−1−m ∼ χ2 k−1−m .<br />
P -gildi = Pr(W 2 k−1−m ≥ t).<br />
Dæmi. 150 vasaljós(n = 150), hvert með 4 rafhlöðum. Notum marktektarkröfu α = 0,01.<br />
Yi = fjöldi bilaðra rafhlaðna íi-ta vasaljósinu, i = 1,...,150.<br />
HvertYi getur tekið gildin0,1,2,3 og 4. Sjá gögn um vasaljósin í Töflu 24.<br />
Tafla 24: Flokkar vasaljósa, flokkað eftir fjölda bilaðra rafhlaðna.<br />
Flokkurj 1 2 3 4 5<br />
Fjöldi bilaðra rafhlaðna 0 1 2 3 4<br />
Fjöldi í flokkij (xj) 26 51 47 16 10<br />
FylgirY tvíkostadreifingu? Núlltilgátuna má rita<br />
á móti gagntilgátunni<br />
H0 : Pr{Y = y(j)} = pj(θ) =<br />
4!<br />
{4−y(j)}!y(j)! θy(j) (1−θ) 4−y(j) ,<br />
y(j) = j −1, j = 1,2,...,5,<br />
H1 : Pr{Y = y(j)} = pj(θ), fyrir eitthvertj ∈ {1,2,...,5}.<br />
Metumθ með sennileikametli. Sennileikametillinn fæst með því að lágmarka<br />
L(θ) =<br />
150<br />
i=1<br />
fYi (yi)<br />
150<br />
<br />
4<br />
=<br />
i=1<br />
Sennileikametillinn fyrirθ er<br />
yi<br />
ˆθ = 1<br />
150<br />
θ yi (1−θ) 4−yi , yi ∈ {0,1,2,3,4}, i = 1,...,150.<br />
150<br />
i=1<br />
1<br />
4 Yi =<br />
1<br />
4×150<br />
88<br />
5<br />
(j −1)Xj.<br />
j=1
Sennileikamatið áθ er<br />
ˆθ = 1<br />
(0×26+1×51+2×47+3×16+4×10) = 0,3883.<br />
600<br />
Reiknum hvert ˆpj, j = 1,...,5,<br />
ˆp1 = Pr(Y = 0) =<br />
ˆp2 = Pr(Y = 1) =<br />
ˆp3 = Pr(Y = 2) =<br />
ˆp4 = Pr(Y = 3) =<br />
ˆp5 = Pr(Y = 4) =<br />
<br />
4<br />
ˆθ<br />
0<br />
0 (1− ˆ θ) 4−0 =<br />
<br />
4<br />
ˆθ<br />
1<br />
1 (1− ˆ θ) 4−1 =<br />
<br />
4<br />
ˆθ<br />
2<br />
2 (1− ˆ θ) 4−2 =<br />
<br />
4<br />
ˆθ<br />
3<br />
3 (1− ˆ θ) 4−3 =<br />
<br />
4<br />
ˆθ<br />
4<br />
4 (1− ˆ θ) 4−4 =<br />
<br />
4<br />
0,3883<br />
0<br />
0 (1−0,3883) 4 = 0,1400,<br />
<br />
4<br />
0,3883<br />
1<br />
1 (1−0,3883) 3 = 0,3555,<br />
<br />
4<br />
0,3883<br />
2<br />
2 (1−0,3883) 2 = 0,3385,<br />
<br />
4<br />
0,3883<br />
3<br />
3 (1−0,3883) 1 = 0,1433,<br />
<br />
4<br />
0,3883<br />
4<br />
4 (1−0,3883) 0 = 0,0227.<br />
Notum þessi gildi á ˆpj, j = 1,...,5 til að reikna út væntanlegan fjölda, sjá Töflu 25, og<br />
prófstærðina.<br />
Tafla 25: Fjöldi og væntanlegur fjöldi í flokkum.<br />
j 1 2 3 4 5<br />
y(j) 0 1 2 3 4<br />
xj 26 51 47 16 10<br />
nˆpj 21,00 53,32 50,78 21,49 3,41<br />
89
HöfnumH0 ef<br />
t =<br />
5 (xj −nˆpj) 2<br />
j=1<br />
+ (47−50,78)2<br />
50,78<br />
npj<br />
= (26−21,00)2<br />
21,00<br />
+ (16−21,49)2<br />
21,49<br />
t > χ 2 α,k−1−m = χ2 0,01,5−1−1<br />
+ (51−53,32)2<br />
53,32<br />
+ (10−3,41)2<br />
3,41<br />
= 11,345.<br />
= 15,71.<br />
Þar sem t = 15,71 > 11,345 = χ 2 0,01,3 þá höfnum við H0 miðað við marktektarkröfu<br />
α = 0,01. P -gildið er<br />
P -gildi = Pr(W 2 3<br />
≥ 15,71) = 0,0013.<br />
Því mundum við hafna H0 við marktektarkröfuα > 0,0013.<br />
7.3 Próf fyrir tengslatöflur<br />
Hér hefur hver einstaklingur í þýðinu tvö einkenni (tvö gildi) þar sem hvort einkenni greinist<br />
í nokkra flokka. Köllum fyrra einkennið X-einkenni og segjum að það greinist í r flokka.<br />
Köllum seinna einkenniðY -einkenni og segjum að það greinist í s flokka.<br />
Gerum ráð fyrir að einstaklingar í þýðinu séu óháðir. Líkurnar á að einstaklingur sem<br />
valinn er af handahófi sé meðX-einkenni í i-ta flokki ogY-einkenni íj-ta flokki, eru<br />
Látum<br />
og<br />
pij = Pr(X = i,Y = j), i = 1,...,r, j = 1,...,s.<br />
pi = Pr(X = i) =<br />
qj = Pr(Y = j) =<br />
s<br />
pij, i = 1,...,r,<br />
j=1<br />
r<br />
pij, j = 1,...,s.<br />
i=1<br />
Við viljum prófa hvort einkenninX ogY séu óháð en það felur meðal annars í sér að ef við<br />
vitum til dæmisX-einkennið þá breytir það ekki líkunum á að vera með ákveðiðY-einkenni.<br />
Núlltilgátan er<br />
H0 : pij = piqj, fyrir ölli = 1,...,r, j = 1,...,s,<br />
90
á móti gagntilgátunni<br />
H1 : pij = piqj, fyrir eitthvert(i,j) .<br />
Þetta próf er kallað próf fyrir tengslatöflur (e. test of independence in contingency tables).<br />
Við vitum ekki gildin ápi og qj og því þarf að meta þau með gögnunum. Látum<br />
Metumpi með<br />
og metumqj með<br />
Nij = fjöldi með X = i ogY = j,<br />
Ni =<br />
Mj =<br />
Ef núlltilgátan er sönn þá gildir að<br />
Prófstærðin er<br />
s<br />
Nij, i = 1,...,r,<br />
j=1<br />
r<br />
Nij, j = 1,...,s,<br />
i=1<br />
n = heildarfjöldi einstaklinga í úrtaki =<br />
T =<br />
s<br />
j=1<br />
r<br />
i=1<br />
ˆpi = Ni<br />
, i = 1,...,r,<br />
n<br />
ˆqj = Mj<br />
, j = 1,...,s.<br />
n<br />
E(Nij) = npij = npiqj.<br />
(Nij −nˆpiˆqj) 2<br />
nˆpiˆqj<br />
Við höfum í raun r ×s flokka og metum alls<br />
stika. Frítölurnar eru því<br />
=<br />
s<br />
j=1<br />
r<br />
i=1<br />
r −1+s−1 = r +s−2<br />
s<br />
j=1<br />
N 2 ij<br />
nˆpiˆqj<br />
rs−1−(r+s−2) = (r −1)(s−1).<br />
91<br />
r<br />
i=1<br />
Nij.<br />
−n.
Athugið að<br />
r<br />
pi = 1,<br />
i=1<br />
s<br />
qj = 1,<br />
j=1<br />
Að því gefnu að H0 sé sönn má nálga dreifinguT með<br />
T ∼ χ 2 (r−1)(s−1).<br />
Höfnunarsvæðið er þannig að við höfnumH0 ef<br />
t > χ 2 α,(r−1)(s−1)<br />
þar sem t er gildið á prófstærðinni fyrir gefna tilraun.<br />
P -gildið er<br />
þar sem W 2<br />
(r−1)(s−1) ∼ χ2 (r−1)(s−1) .<br />
s<br />
j=1<br />
r<br />
pij = 1.<br />
i=1<br />
P -gildi = Pr(W 2<br />
(r−1)(s−1) ≥ t).<br />
Dæmi. Lungnakrabbi og reykingar, sjá gögn Töflu 26.<br />
Tafla 26: X: fékk lungnakrabba eða ekki Y : reykir eða reykir ekki<br />
Y<br />
Reykir Reykir ekki Heild<br />
X Lungnakrabbi N11 = 62 N12 = 14 N1 = 76<br />
Mat áp1, p2, q1 ogq2 er<br />
ˆp1 = N1<br />
n<br />
ˆq1 = M1<br />
n<br />
Ekki lungnakrabbi N21 = 9938 N22 = 19986 N2 = 29924<br />
Heild M1 = 10000 M2 = 20000 n = 30000<br />
76<br />
=<br />
30000 = 0,002533, ˆp2 = N2<br />
n<br />
10000<br />
=<br />
30000 = 0,333333, ˆq2 = M2<br />
n<br />
Stærðirnar nˆp1ˆq1, nˆp1ˆq2, nˆp2ˆq1 og nˆp2ˆq2 eru<br />
92<br />
29924<br />
= = 0,997467,<br />
30000<br />
20000<br />
= = 0,666667.<br />
30000
Prófstærðin er<br />
nˆp1ˆq1 = n N1M1<br />
n n<br />
nˆp1ˆq2 = n N1<br />
n<br />
nˆp2ˆq1 = n N2<br />
n<br />
nˆp2ˆq2 = n N2<br />
n<br />
t =<br />
2<br />
j=1<br />
2<br />
i=1<br />
M1<br />
n<br />
M2<br />
n<br />
M2<br />
n<br />
= N1M1<br />
n<br />
= N1M2<br />
n<br />
= N2M1<br />
n<br />
= N2M2<br />
n<br />
(Nij −nˆpiˆqj) 2<br />
nˆpiˆqj<br />
+ (9938−9974,67)2<br />
9974,67<br />
= 76×10000<br />
30000<br />
= 76×20000<br />
30000<br />
= 29924×10000<br />
30000<br />
= 29924×20000<br />
30000<br />
= (62−25,33)2<br />
25,33<br />
+ (19986−19949,33)2<br />
19949,33<br />
= 25,33,<br />
= 50,67,<br />
= 9974,67,<br />
= 19949,33.<br />
+ (14−50,67)2<br />
50,67<br />
= 79,83.<br />
Notum marktektarkröfu α = 0,01. Stærðirnar r og s eru hér r = 2 og s = 2. Höfn-<br />
unarsvæðið er<br />
t > χ 2 α,(r−1)(s−1) = χ 2 0,01,1 = 6,635.<br />
Þar semt = 79,81 > 6,635 = χ 2 0,01,1 þá höfnum viðH0. P -gildið er<br />
P -gildi = Pr(W 2 1 ≥ 79,83) = 0,<br />
og því mundum við hafnaH0 fyrir hvaða marktektarkröfu sem er.<br />
Niðurstaðan er því sú að líkurnar á því að fá lungnakrabbamein eru ekki óháðar því<br />
hvort maður reykir eða ekki. Af gögnunum má sjá að reykingar auka líkurnar á því að fá<br />
lungnakrabbamein. En við getum ekki fullyrt að reykingarnar hafi valdið krabbameini hjá<br />
þeim sem reyktu og fengu krabbamein.<br />
93
Heimildir<br />
Ross, S. M. (2004), Introduction to Probability and Statistics for Engineers and Scientists<br />
(3rd ed.), Belmont, CA: Duxbury.<br />
94