12.08.2013 Views

pdf - Háskóli Íslands

pdf - Háskóli Íslands

pdf - Háskóli Íslands

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>Háskóli</strong> <strong>Íslands</strong><br />

STÆ203G Líkindareikningur og tölfræði<br />

STÆ204G Inngangur að líkinda- og tölfræði<br />

HAG206G Líkindareikningur og tölfræði<br />

Vormisseri 2012<br />

FYRIRLESTRANÓTUR Í TÖLFRÆÐI<br />

eftir Birgi Hrafnkelsson<br />

1


Efnisyfirlit<br />

1 Lýsandi tölfræði 5<br />

1.1 Myndrænar aðferðir I . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5<br />

1.2 Tölulegar aðferðir . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7<br />

1.3 Myndrænar aðferðir II . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11<br />

2 Dreifing lýsistærða 14<br />

2.1 Slembiúrtak og lýsistærðir . . . . . . . . . . . . . . . . . . . . . . . . . . 14<br />

2.2 Meðaltal slembiúrtaks . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14<br />

2.3 Höfuðmarkgildisreglan . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15<br />

2.4 Dreifni slembiúrtaks . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17<br />

2.5 Skilgreiningar áz-dreifingu, χ 2 -dreifingum, t-dreifingum og F -dreifingum . 19<br />

2.5.1 z-dreifing (stöðluð normaldreifing) . . . . . . . . . . . . . . . . . . 19<br />

2.5.2 χ 2 -dreifingar (kí-kvaðratsdreifingar) . . . . . . . . . . . . . . . . . 20<br />

2.5.3 t-dreifingar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21<br />

2.5.4 F -dreifingar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22<br />

2.6 Dreifing lýsistærða sem byggðar eru á slembiúrtaki úr normaldreifingu . . . 23<br />

3 Metlar og punktmat 26<br />

3.1 Almennt um metla og punktmat . . . . . . . . . . . . . . . . . . . . . . . 26<br />

3.2 Hugmyndin að baki aðferð sennilegustu gilda . . . . . . . . . . . . . . . . 27<br />

3.3 Aðferð sennilegustu gilda . . . . . . . . . . . . . . . . . . . . . . . . . . . 28<br />

3.4 Eiginleikar metla . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33<br />

3.5 Línulegir óbjagaðir metlar . . . . . . . . . . . . . . . . . . . . . . . . . . 36<br />

4 Öryggisbil 39<br />

4.1 Eiginleikar öryggisbila . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39<br />

4.2 Öryggisbil fyrirµínormaldreifingu þegarσ 2 er óþekkt . . . . . . . . . . . 42<br />

4.3 Öryggisbil fyrirσ 2 og σ í normaldreifingu . . . . . . . . . . . . . . . . . . 43<br />

3


4.4 Öryggisbil fyrirpítvíkostadreifingu . . . . . . . . . . . . . . . . . . . . . 44<br />

4.5 Öryggisbil fyrir nokkur valin tilfelli . . . . . . . . . . . . . . . . . . . . . 48<br />

5 Tilgátupróf 52<br />

5.1 Almennt um tilgátupróf . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52<br />

5.2 P -gildi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55<br />

5.3 Tilgátupróf fyrir meðalgildi í normaldreifingu, þekkt σ . . . . . . . . . . . 57<br />

5.4 Jöfnur fyrirβ og val án . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59<br />

5.5 Tilgátupróf fyrir nokkur valin tilfelli . . . . . . . . . . . . . . . . . . . . . 62<br />

6 Línulegt aðhvarf 70<br />

6.1 Einfalt línulegt líkan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70<br />

6.2 Metlar fyrir stikanaα, β og σ 2 . . . . . . . . . . . . . . . . . . . . . . . . 70<br />

6.3 Dreifingar metlanna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72<br />

6.4 Öryggisbil og tilgátupróf fyrirαog β . . . . . . . . . . . . . . . . . . . . 74<br />

6.5 Öryggisbil fyrirα+βx0 . . . . . . . . . . . . . . . . . . . . . . . . . . . 76<br />

6.6 Spábil fyrir nýttY þegar skýribreytan tekur gildiðx0 . . . . . . . . . . . . 76<br />

6.7 Fylgnistuðull úrtaks og skýringarhlutfall . . . . . . . . . . . . . . . . . . . 77<br />

6.8 Greining á leifunum: Forsendur líkans athugaðar . . . . . . . . . . . . . . 79<br />

6.9 Ólínulegu líkani varpað á línulegt form . . . . . . . . . . . . . . . . . . . . 80<br />

6.10 Dæmi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81<br />

7 Próf fyrir mátgæði og tengslatöflur 85<br />

7.1 Próf fyrir mátgæði þegar allir stikar eru þekktir . . . . . . . . . . . . . . . 85<br />

7.2 Próf fyrir mátgæði þegar einn eða fleiri stikar eru óþekktir . . . . . . . . . 87<br />

7.3 Próf fyrir tengslatöflur . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90<br />

4


1 Lýsandi tölfræði<br />

Við höfum áhuga á ákveðnu þýði (e. population). Til þess að skoða þýðið höfum við tvo<br />

möguleika<br />

i) skoða alla einstaklinga/hluti í þýðinu (e. census)<br />

ii) skoða nokkra einstaklinga/hluti í þýðingu, fáum úrtak úr þýðinu (e. sample)<br />

Til að fá sem besta mynd af þýðinu þarf úrtakið að vera slembiúrtak (e. random sample).<br />

Slembiúrtak úr þýði með endanlegan fjölda einstaklinga/hluta fæst ef hver einstaklingur hef-<br />

ur sömu líkur á að vera valinn í úrtakið. Við viljum fá eins góða hugmynd um dreifingu,<br />

meðalgildi og dreifni þýðisins út frá úrtakinu og hægt er. Til þess notum við lýsandi tölfræði<br />

(e. descriptive statistics) en hún skiptist í myndrænar aðferðir (e. graphical methods) og<br />

tölulegar aðferðir (e. numerical methods).<br />

1.1 Myndrænar aðferðir I<br />

i) Tíðnirit (e. histograms)<br />

Tíðnirit gefa mat á þéttleika, f(x), þegar um samfelldar breytur er að ræða. Eftirfarandi<br />

skref eru tekin:<br />

- veljum bil sem flokkað er í<br />

- teljum fjölda mælinga í hverju bili<br />

- reiknum hlutfallslega tíðni fyrir hvert bil<br />

- teiknum fyrir ofan hvert bil rétthyrning sem hefur sama flatarmál og hlutfallslega<br />

tíðni bilsins<br />

ii) Safntíðnirit (e. cumulative frequency plots)<br />

Safntíðnirit gefa mat á dreififalli, F(x) = Pr(X ≤ x), þegar um samfelldar breytur er að<br />

ræða. Eftirfarandi skref eru tekin:<br />

- leggjum saman hlutfallslega tíðni í bilinu og bilunum fyrir neðan, fáum safntíðni<br />

- teiknum punkt í hæð jafnri safntíðninni við efri mörk bilsins<br />

- drögum línu á milli punktanna<br />

5


Dæmi: Orkunotkun heimila. Stærð úrtaksins er n = 90. Tafla 1 sýnir hlutfallslega tíðni og<br />

safntíðni. Sjá tíðnirit og safntíðnirit fyrir gögnin á mynd 1.<br />

Tafla 1: Gögn um orkunotkun heimila.<br />

Bil Fjöldi Hlutfalls- Safntíðni<br />

MW stundir/ár leg tíðni<br />

iii) Greina- og laufarit (e. stem and leaf plots)<br />

1-3 1 0,011 0,011<br />

3-5 1 0,011 0,022<br />

5-7 11 0,122 0,144<br />

7-9 21 0,233 0,378<br />

9-11 25 0,278 0,656<br />

11-13 17 0,189 0,844<br />

13-15 9 0,100 0,944<br />

15-17 4 0,044 0,989<br />

17-19 1 0,011 1,000<br />

Greina- og laufarit gefa gróft mat á þéttleika, f(x), samfelldra gagna eða á líkindafalli,<br />

p(x) = Pr(X = x), strjálla gagna. Eftirfarandi skref eru tekin:<br />

- grúppum gögnin eftir fyrri hluta talnanna (grein)<br />

- ritum seinni hluta talnanna á eftir (lauf)<br />

Dæmi: Gögn um meðalhita nokkurra fylkja (í gráðum á Fahrenheit):<br />

x1 = 57, x2 = 59, x3 = 55, x4 = 57, x5 = 36, x6 = 45,<br />

x7 = 51, x8 = 39, x9 = 41, x10 = 40, x11 = 46, x12 = 36,<br />

x13 = 44, x14 = 29, x15 = 35, x16 = 43, x17 = 33, x18 = 69.<br />

6


Mat á f(x)<br />

Mat á F(x)<br />

0.15<br />

0.1<br />

0.05<br />

0<br />

0 2 4 6 8 10<br />

MW stundir/ár (x)<br />

12 14 16 18 20<br />

1<br />

0.8<br />

0.6<br />

0.4<br />

0.2<br />

0<br />

0 2 4 6 8 10<br />

MW stundir/ár (x)<br />

12 14 16 18 20<br />

Mynd 1: Tíðnirit (efri myndin) og safntíðnirit (neðri myndin) af gögnum um orkunotkun<br />

heimila.<br />

1.2 Tölulegar aðferðir<br />

i) Reiknistærðir fyrir miðju úrtaks<br />

Greinar Lauf<br />

2 9<br />

3 6 9 6 5 3<br />

4 5 1 0 6 4 3<br />

5 7 9 5 7 1<br />

6 9<br />

SKILGREINING. Segjum að úrtak af stærðn, hafi eftirfarandi gildi: x1,x2, ...,xn. Meðaltal<br />

úrtaks (e. sample mean), táknað með ¯x, er skilgreint með<br />

¯x = 1<br />

n<br />

7<br />

n<br />

xi.<br />

i=1


SKILGREINING. Segjum að úrtak af stærð n, hafi eftirfarandi röðuð gildi:<br />

x(1) < x(2) < ... < x(n−1) < x(n).<br />

Miðgildi úrtaks (e. sample median), táknað með ˜x, er skilgreint með<br />

⎧<br />

⎨ x(n/2+1/2)<br />

efner oddatala,<br />

˜x =<br />

⎩<br />

1<br />

2 {x(n/2) +x(n/2+1)} efner slétt tala.<br />

SKILGREINING. Tíðasta gildi úrtaks (e. sample mode) er gildið sem kemur oftast fyrir.<br />

Dæmi: Gögn um meðalhita nokkurra fylkja. Meðaltal úrtaks er<br />

¯x = 1<br />

n<br />

n<br />

i=1<br />

xi = 1<br />

×815 = 45,28.<br />

18<br />

Úrtakið er af stærð n = 18 sem er slétt tala. Röðuðum gögnunum<br />

x(1) = 29, x(2) = 33, x(3) = 35, x(4) = 36, x(5) = 36, x(6) = 39,<br />

x(7) = 40, x(8) = 41, x(9) = 43, x(10) = 44, x(11) = 45, x(12) = 46,<br />

x(13) = 51, x(14) = 55, x(15) = 57, x(16) = 57, x(17) = 59, x(18) = 69.<br />

Miðgildi úrtaks er<br />

˜x = 1<br />

2 {x(n/2) +x(n/2+1)} = 1<br />

2 {x(9) +x(10)} = 1<br />

2<br />

{43+44} = 43,5.<br />

Tíðasta stærð úrtaks eru tölurnar 36 og 57. Hér segja þessar tölur okkur lítið. Flestar tölurnar<br />

eru á bilinu 40 til 50.<br />

ii) Sætisstærðir úrtaks (e. sample percentiles)<br />

SKILGREINING. 100p-ta sætisstærð úrtaks er tala í úrtakinu sem er þannig að minnsta<br />

kosti 100p% af gögnunum eru minni eða jöfn tölunni og að minnsta kosti 100(1 − p)% af<br />

gögnunum eru stærri eða jöfn tölunni. Ef tvær tölur í úrtakinu uppfylla þessu skilyrði þá er<br />

100p-ta sætisstærð úrtaksins meðaltalið af þessum tveimur tölum.<br />

Dæmi: Gögn um meðalhita nokkurra fylkja.<br />

25. sætisstærðin= x(5) = 36<br />

8


(np = 18×0,25 = 4,5 => 5. talan).<br />

33,3. sætisstærðin= 0,5(x(6) +x(7)) = 0,5(39+40) = 39,5<br />

(np = 18×0,333 = 6=> 6. og 7. talan).<br />

50. sætisstærðin= 0,5(x(9) +x(10)) = 0,5(43+44) = 43,5<br />

(np = 18×0,5 = 9 => 9. og 10. talan).<br />

67,7. sætisstærðin= 0,5(x(12) +x(13)) = 0,5(46+51) = 48,5<br />

(np = 18×0,667 = 12=> 12. og 13. talan).<br />

75. sætisstærðin = = x(14) = 55<br />

(np = 18×0,75 = 13,5 => 14. talan).<br />

Þrjár sætisstærðir hafa sérstök nöfn<br />

Q1 = 25. sætisstærð úrtaks er kölluð fyrsta fjóðungsmark úrtaks (e. first quartile).<br />

Q2 = 50. sætisstærð úrtaks er kölluð annað fjóðungsmark úrtaks (e. second quartile).<br />

Q3 = 75. sætisstærð úrtaks er kölluð þriðja fjóðungsmark úrtaks (e. third quartile).<br />

Athugið aðQ2 = ˜x, þar sem ˜x er miðgildið. Þessar þrjár stærðir skipta samfelldri dreifingu í<br />

fjóra jafna hluta. Mynd 2 sýnir tíðnirit og safntíðnirit af gögnunum ásamt fjóðungsmörkum.<br />

iii) Reiknistærðir fyrir dreifni úrtaks<br />

SKILGREINING. Segjum að úrtak af stærð n, hafi eftirfarandi gildi; x1, x2, ..., xn. Dreifni<br />

úrtaks (e. sample variance), táknað meðs 2 , er skilgreint með<br />

s 2 = 1<br />

n−1<br />

n<br />

(xi − ¯x) 2 , n ≥ 2.<br />

i=1<br />

SKILGREINING. Staðalfrávik úrtaks (e. sample standard deviation) af stærð n, er táknað<br />

með s, og er skilgreint með<br />

Regla um fervikasummu<br />

s = √ s 2 .<br />

n<br />

(xi − ¯x) 2 =<br />

i=1<br />

9<br />

n<br />

x 2 i −n¯x2 .<br />

i=1


Mat á f(x)<br />

Mat á F(x)<br />

0.08<br />

0.06<br />

0.04<br />

0.02<br />

Q 1<br />

Q 2<br />

25% 25% 25% 25%<br />

0<br />

20 25 30 35 40 45 50 55 60 65 70 75<br />

Hiti [°F] (x)<br />

1<br />

0.8<br />

0.6<br />

0.4<br />

0.2<br />

Q 1<br />

Q 2<br />

0<br />

20 25 30 35 40 45 50 55 60 65 70 75<br />

Hiti [°F] (x)<br />

Mynd 2: Tíðnirit (efri myndin) og safntíðnirit (neðri myndin) af gögnum um meðalhita<br />

nokkurra fylkja ásamt fjóðungsmörkum.<br />

Dæmi: Gögn um meðalhita nokkurra fylkja.<br />

n<br />

(xi − ¯x) 2 =<br />

i=1<br />

n<br />

i=1<br />

x 2 i<br />

= 38841,<br />

Q 3<br />

n<br />

x 2 i −n¯x 2 = 38841−18×45,28 2 = 1935,99,<br />

i=1<br />

s 2 = 1<br />

n−1<br />

n<br />

i=1<br />

(xi − ¯x) 2 = 1<br />

17<br />

s = √ s 2 = 10,67.<br />

Q 3<br />

×1935,99 = 113,88,<br />

SKILGREINING. Fjórðungsbil úrtaks (e. sample interquartile range) er táknað með IQR<br />

og er skilgreint með<br />

Dæmi: Gögn um meðalhita nokkurra fylkja.<br />

IQR = Q3 −Q1.<br />

IQR = Q3 −Q1 = 55−36 = 19.<br />

10


1.3 Myndrænar aðferðir II<br />

i) Kassarit (e. box plots)<br />

Byggir á stærðum byggðum á úrtakinu.<br />

1) minnsta mælingin í úrtakinu<br />

2)Q1<br />

3)Q2 = ˜x<br />

4)Q3<br />

5) stærsta mælingin í úrtakinu<br />

Mynd 3 sýnir kassarit fyrir gögnin um meðalhita nokkurra fylkja. Stærðirnar Q1, Q2 og Q3<br />

ákveða lögun kassans. Minnsta mælingin ákveður hversu langt línan nær niður frá Q1 og<br />

stærsta mælingin ákveður hversu hátt línan nær upp fráQ3.<br />

Ef minnsta mælingin er minni en (Q1 − 1,5IQR) nær línan frá Q1 aðeins niður að<br />

minnstu mælingunni sem er stærri en (Q1 − 1,5IQR) og mælingarnar sem eru minni en<br />

(Q1 − 1,5IQR) eru merktar með plús. Að sama skapi ef stærsta mælingin er stærri en<br />

(Q3 +1,5IQR) nær línan frá Q3 aðeins upp að stærstu mælingunni sem er minni en (Q3 +<br />

1,5IQR) og mælingarnar sem eru stærri en (Q3 +1,5IQR) eru merktar með plús. Mynd 4<br />

sýnir kassarit af hermdum gögnum. Gögnin voru hermd með ákveðinni dreifingu til að ná<br />

fram nokkrum mælingum sem voru sérstaklega stórar og litlar og því merktar með plús.<br />

11


x<br />

Hiti [°F] (x)<br />

70<br />

65<br />

60<br />

55<br />

50<br />

45<br />

40<br />

35<br />

30<br />

Mynd 3: Kassarit af gögnum um meðalhita nokkurra fylkja.<br />

3<br />

2<br />

1<br />

0<br />

−1<br />

−2<br />

−3<br />

1<br />

1<br />

max<br />

min<br />

max<br />

Q 3<br />

Q 2<br />

Q 1<br />

x ≤ Q 3 +1.5*IQR<br />

Q 3<br />

Q 2<br />

Q 1<br />

x ≥ Q 1 −1.5*IQR<br />

min<br />

Mynd 4: Kassarit af hermdum gögnum.<br />

12


ii) Dreififall úrtaks (e. empirical cumulative distribution function)<br />

Dreififall úrtaks gefur mat á dreififalli, F(x) = Pr(X ≤ x), fyrir bæði samfelldar og strjálar<br />

breytur. Það byggir á röðuðum gildum úrtaksins, það er, x(1) < x(2) < ... < x(n), þar sem<br />

matið á dreififallinuF(x) er<br />

⎧<br />

⎪⎨<br />

0, ef x < x(1),<br />

ˆF(x) = j/n, ef x(j) ≤ x < x(j+1), j = 1,...,n−1,<br />

⎪⎩<br />

1 ef x ≥ x(n).<br />

Mynd 5 sýnir dreififall úrtaks fyrir gögnin um meðalhita nokkurra fylkja. Lokaður hringur<br />

táknar að endapunktur sé meðtalinn á tilsvarandi bili en opinn hringur táknar að endapunktur<br />

sé ekki meðtalinn á bilinu.<br />

Mat á F(x)<br />

1<br />

0.9<br />

0.8<br />

0.7<br />

0.6<br />

0.5<br />

0.4<br />

0.3<br />

0.2<br />

0.1<br />

0<br />

25 30 35 40 45 50<br />

Hiti [°F] (x)<br />

55 60 65 70 75<br />

Mynd 5: Dreififall úrtaks af gögnum um meðalhita nokkurra fylkja.<br />

13


2 Dreifing lýsistærða<br />

2.1 Slembiúrtak og lýsistærðir<br />

SKILGREINING. Látum X1, X2, ..., Xn vera óháðar slembistærðir sem fylgja sömu dreif-<br />

inguF . Við segjum að saman myndiX1,X2, ...,Xn slembiúrtak úrF .<br />

SKILGREINING. Lýsistærð (e. sampling statistic) er stærð (formúla) sem byggir á slembiúr-<br />

taki. Lýsistærð er því slembistærð.<br />

Ef við gerum ráð fyrir að dreifingunniF sé lýst með falli sem er háð einum eða fleiri stikum<br />

þá er markmiðið að nota slembiúrtak úr F til að meta stikana í F . Lýsistærð byggir á<br />

slembiúrtakinu og við viljum finna út hvernig við getum notað eiginleika lýsistærðarinnar til<br />

að meta stikana í F . Lýsistærð er slembistærð sem hefur dreifingu, meðalgildi, dreifni og<br />

svo framvegis.<br />

2.2 Meðaltal slembiúrtaks<br />

SKILGREINING. Látum X1, X2, ..., Xn vera slembiúrtak úr dreifingu F með meðalgildiµ<br />

og dreifniσ 2 . Meðaltal slembiúrtaks, táknað ¯ X, er lýsistærð sem er skilgreind með<br />

¯X = 1<br />

n<br />

n<br />

Xi.<br />

Meðaltal slembiúrtaks er dæmi um lýsistærð. Hér fyrir neðan er meðalgildi og dreifni ¯ X<br />

fundið. Gerum ráð fyrir að X1, X2, ..., Xn myndi slembiúrtak úr dreifingu F , og að meðal-<br />

gildi og dreifni F séu µ ogσ 2 , það er<br />

i=1<br />

E(Xi) = µ, var(Xi) = σ 2 < ∞, i = 1,...,n.<br />

Það að X1, X2, ..., Xn myndi slembiúrtak fellur einnig í sér að slembibreyturnar eru inn-<br />

byrðis óháðar. Út frá þessum staðreyndum reiknum við meðalgildi ¯ X<br />

E <br />

<br />

n<br />

<br />

X¯ 1<br />

= E Xi =<br />

n<br />

1<br />

n E<br />

<br />

n<br />

<br />

Xi<br />

i=1<br />

14<br />

i=1


og dreifni ¯ X<br />

= 1<br />

n<br />

n<br />

i=1<br />

= 1<br />

<br />

n<br />

<br />

var Xi =<br />

n2 i=1<br />

1<br />

n2 E(Xi) = 1<br />

n<br />

var ¯ X = var<br />

= 1<br />

n 2<br />

n<br />

i=1<br />

<br />

1<br />

n<br />

µ = 1<br />

nµ = µ,<br />

n<br />

n<br />

i=1<br />

Xi<br />

<br />

n<br />

var(Xi) (X-in eru innibyrðis óháð)<br />

i=1<br />

n<br />

i=1<br />

SETNING. Meðalgildi og dreifni ¯ X eru<br />

σ 2 = 1<br />

n 2nσ2 = σ2<br />

n .<br />

E ¯ X = µ, var ¯X = σ 2<br />

n .<br />

Þar sem meðalgildi eða væntigildi ¯ X er µ þá getum við notað ¯ X til að meta µ. Dreifni ¯ X<br />

minnkar eftir því sem n stækkar. Því fáum við betra mat áµeftir því sem n stækkar (að því<br />

gefnu að σ 2 < ∞).<br />

2.3 Höfuðmarkgildisreglan<br />

SETNING. (Höfuðmarkgildisreglan) Látum X1, X2, ..., Xn vera slembiúrtak úr dreifingu<br />

F . Meðalgildi og dreifni dreifingarinnar F er táknað með µ og σ 2 (σ 2 < ∞). Þá má nálga<br />

dreifingu<br />

W = X1 +X2 +...+Xn =<br />

með normaldreifingu með meðalgildinµ og dreifni nσ 2 ef n er nægjanlega stórt.<br />

Byggt á höfuðmarkgildisreglunni má nálga dreifingu<br />

n<br />

i=1<br />

Xi<br />

¯X = 1<br />

n (X1 +X2 +...+Xn) = 1<br />

n W<br />

með normaldreifingu með meðalgildiµog dreifniσ 2 /n efner nægjanlega stórt. Ef dreifing<br />

W er því sem næst normaldreifing þá hefur dreifing ¯ X = n −1 W sömu lögun og dreifingW ,<br />

er einfaldlega kvörðuð útgáfa af dreifingu W .<br />

15


eða<br />

eða<br />

LátumZ ∼ N(0,1). Þá má rita<br />

<br />

X1 +...+Xn −nµ<br />

Pr<br />

σ √ <br />

≤ x ≈ Pr(Z ≤ x)<br />

n<br />

−1 n (X1 +...+Xn)−µ<br />

Pr<br />

n−1σ √ <br />

≤ x ≈ Pr(Z ≤ x)<br />

n<br />

<br />

¯X −µ<br />

Pr<br />

σ/ √ <br />

≤ x ≈ Pr(Z ≤ x).<br />

n<br />

Líkurnar á að ¯ X sé minna eða jafnt og einhver talaumá nálga með<br />

Pr( ¯ <br />

¯X −µ<br />

X ≤ u) = Pr<br />

σ/ √ u−µ<br />

≤<br />

n σ/ √ <br />

≈ Pr Z ≤<br />

n<br />

u−µ<br />

σ/ √ <br />

.<br />

n<br />

Yfirleitt fæst góð nálgun ef n > 30 en í mörgum tilfellum dugar minna n. Ef X1, ..., Xn<br />

fylgja normaldreifingu þá fylgir ¯ X normaldreifingu fyrir ölln ≥ 1.<br />

Dæmi. Látum Xi tákna líftíma i-tu ljósaperunnar þar sem X1, ..., Xn mynda slembi-úrtak<br />

úr veldisdreifingu<br />

Xi ∼ Expon(λ = 1/2), i = 1,...,n,<br />

E(Xi) = µ = 1/λ = 2 mánuðir, var(Xi) = σ 2 = 1/λ 2 = 2 2 mánuðir 2 .<br />

Hverjar eru líkurnar á að meðallíftímin = 49 ljósapera sé lengri en 2,5 mánuðir?<br />

Pr( ¯ X > 2,5) = 1−Pr( ¯ <br />

¯X −µ<br />

X ≤ 2,5) = 1−Pr<br />

σ/ √ 2,5−µ<br />

≤<br />

n σ/ √ <br />

n<br />

<br />

¯X −2<br />

= 1−Pr<br />

2/ √ 2,5−2<br />

≤<br />

49 2/ √ <br />

≈ 1−Pr Z ≤<br />

49<br />

1/2<br />

<br />

= 1−Pr(Z ≤ 7/4)<br />

2/7<br />

= 1−Pr(Z ≤ 1,75) = 1−0,9599 = 0,0401.<br />

Nákvæmt gildi á líkunum Pr( ¯ X > 2,5) er 0,0476. Nálgun er því viðunandi góð fyrir n af<br />

þessari stærðargráðu þegarX-in fylgja veldisdreifingu.<br />

Mynd 6 sýnir dreifingu ¯ X fyrir nokkur mismunandinþegar X-in fylgja veldisdreifingu<br />

með meðalgildi 2. Á myndinni má sjá hvernig dreifing ¯ X færist nær því að líkjast normal-<br />

dreifingu með meðalgildi 2 eftir því sem n vex.<br />

16


f(xbar)<br />

1<br />

0.9<br />

0.8<br />

0.7<br />

0.6<br />

0.5<br />

0.4<br />

0.3<br />

0.2<br />

0.1<br />

X i ~ exp(λ=0.5), i=1,...,n, E(X i )=2, Var(X i )=4<br />

0<br />

0 1 2 3 4 5<br />

xbar<br />

6 7 8 9 10<br />

Mynd 6: Dreifing ¯ X þegarX-in fylgja veldisdreifingu fyrir nokkur mismunandin.<br />

n=20<br />

n=10<br />

n=5<br />

n=1<br />

Mynd 7 sýnir einnig dreifingu ¯ X fyrir nokkur mismunandi n þegar X-in fylgja veldis-<br />

dreifingu með meðalgildi 2. Brotna punktalínan sýnir normaldreifingu með sama meðalgildi<br />

og sömu dreifni og dreifing ¯ X og gefur hugmynd um hversu góða nálgun normaldreifing<br />

gefur. Á mynd 7 má sjá að eftir því sem n vex þeim mun betri verður nálgun með normal-<br />

dreifingu.<br />

2.4 Dreifni slembiúrtaks<br />

SKILGREINING. Látum X1, X2, ..., Xn vera slembiúrtak úr dreifingu F með meðalgildiµ<br />

og dreifniσ 2 . Dreifni slembiúrtaks, táknað S 2 , er lýsistærð sem er skilgreind með<br />

Lýsistærðin<br />

S 2 = 1<br />

n−1<br />

er kölluð staðalfrávik slembiúrtaks.<br />

n<br />

(Xi − ¯ X) 2 , n ≥ 2.<br />

i=1<br />

S = √ S 2<br />

17


f(xbar)<br />

f(xbar)<br />

f(xbar)<br />

2<br />

1.5<br />

1<br />

0.5<br />

n=1<br />

0<br />

0 1 2 3 4<br />

2<br />

1.5<br />

1<br />

0.5<br />

n=10<br />

0<br />

0 1 2 3 4<br />

2<br />

1.5<br />

1<br />

0.5<br />

n=50<br />

0<br />

0 1 2<br />

xbar<br />

3 4<br />

2<br />

1.5<br />

1<br />

0.5<br />

n=5<br />

0<br />

0 1 2 3 4<br />

2<br />

1.5<br />

1<br />

0.5<br />

n=25<br />

0<br />

0 1 2 3 4<br />

2<br />

1.5<br />

1<br />

0.5<br />

n=75<br />

0<br />

0 1 2<br />

xbar<br />

3 4<br />

Mynd 7: Dreifing ¯ X þegar úrtakið er af stærðn = 1,5,10,25,50,75, ogX-in fylgja veldis-<br />

dreifingu (samfelldu línurnar) ásamt nálgun á dreifingunum með normaldreifingum (brotnu<br />

punktalínurnar).<br />

SETNING. VæntigildiS 2 er<br />

Sönnun. Höfum að<br />

og því<br />

E(S 2 ) = σ 2 .<br />

n<br />

(Xi − ¯ X) 2 =<br />

i=1<br />

(n−1)S 2 =<br />

n<br />

X 2 i −n ¯ X 2<br />

i=1<br />

n<br />

X 2 i −n ¯ X 2 .<br />

i=1<br />

Einnig gildir að ef Y er slembibreyta þá gildir að<br />

Því er<br />

E(Y 2 ) = var(Y)+{E(Y)} 2 .<br />

E{(n−1)S 2 <br />

n<br />

} = E X 2 i −n ¯ X 2<br />

<br />

18<br />

i=1


Og því er<br />

=<br />

n<br />

E(X 2 i)−nE( ¯ X 2 )<br />

i=1<br />

= nE(X 2 1 )−n[var( ¯ X)+{E( ¯ X)} 2 ]<br />

= n[var(X1)+{E(X1)} 2 ]−n[σ 2 /n+µ 2 ]<br />

= n[σ 2 +µ 2 ]−σ 2 −nµ 2<br />

= nσ 2 +nµ 2 −σ 2 −nµ 2 = (n−1)σ 2 .<br />

E(S 2 ) = σ 2 . <br />

Hér eru nokkrar athugasemdir. Ef við notumnístað (n−1) fæst<br />

<br />

n 1<br />

E (Xi −<br />

n<br />

¯ X) 2<br />

<br />

= (n−1)<br />

σ<br />

n<br />

2 .<br />

Efµer þekkt þá notum viðnístað(n−1), það er,<br />

<br />

n 1<br />

E (Xi −µ)<br />

n<br />

2<br />

<br />

= σ 2 .<br />

Um staðalfrávikið gildir að<br />

i=1<br />

i=1<br />

ÞegarX-in fylgja normaldreifingu gildir að<br />

E(S) = σ.<br />

Γ(n/2)<br />

E(S) = σ<br />

√ 2<br />

Γ((n−1)/2) √ n−1 .<br />

2.5 Skilgreiningar áz-dreifingu,χ 2 -dreifingum,t-dreifingum ogF -dreifingum<br />

2.5.1 z-dreifing (stöðluð normaldreifing)<br />

Samfellda slembistærðinZ fylgir staðlaðri normaldreifingu, ritað<br />

ef þéttleikiZ er á forminu<br />

Z ∼ N(0,1)<br />

fZ(z) = 1<br />

√ 2π e −z2 /2 , −∞ < z < ∞.<br />

19


Dreififall Z er táknað meðΦ(z) þar sem<br />

UmZ gildir að<br />

Skilgreinum tölunazα með<br />

það er<br />

Φ(z) = Pr(Z ≤ z) =<br />

z<br />

−∞<br />

fZ(z)dz, −∞ < z < ∞.<br />

E(Z) = 0, var(Z) = 1.<br />

zα = 100(1−α)-ta sætisstærðin í staðlaðri normaldreifingu<br />

Pr(Z ≤ zα) = Φ(zα) = 1−α.<br />

Tafla A1 bls. 612 í Ross gefur gildi á Φ(z) fyrir valinz á bilinu 0 til3,49. Tafla A3 bls. 614<br />

í Ross gefur gildi á zα fyrir valin α, sjá neðstu línuna í töflu A3 þar sem n = ∞. Mynd 8,<br />

efst til vinstri, sýnir staðlaða normaldreifingu.<br />

2.5.2 χ 2 -dreifingar (kí-kvaðratsdreifingar)<br />

Samfellda slembistærðinY fylgir kí-kvaðratsdreifingu meðr frítölur, ritað<br />

efY hefur sömu dreifingu og<br />

þar sem Z1, ...,Zr eru óháðar og<br />

ÞéttleikiY er á forminu<br />

fY(y) =<br />

Y ∼ χ 2 r<br />

Z 2 1 +...+Z 2 r =<br />

r<br />

j=1<br />

Z 2 j<br />

Zj ∼ N(0,1), j = 1,...,r.<br />

1<br />

Γ(r/2)2 r/2yr/2−1 e −y/2 , 0 ≤ y < ∞,<br />

20


þar sem Γ(·) er kallað gamma-fallið og er skilgreint sem<br />

UmY gildir að<br />

Skilgreinum tölunaχ 2 α,r með<br />

það er<br />

∞<br />

Γ(α) =<br />

0<br />

u α−1 e −u du.<br />

E(Y) = r, var(Y) = 2r.<br />

χ 2 α,r = 100(1−α)-ta sætisstærðin í χ2 -dreifingu með r frítölur<br />

Pr(Y ≤ χ 2 α,r ) = 1−α.<br />

Tafla A2 bls. 613 í Ross gefur gildi á χ 2 α,r fyrir valinαog r. Mynd 8, neðst til vinstri, sýnir<br />

kí-kvaðratsdreifingar með 5, 10 og 20 frítölur.<br />

2.5.3 t-dreifingar<br />

Samfellda slembistærðinT fylgirt-dreifingu meðr frítölur, ritað<br />

efT hefur sömu dreifingu og<br />

þar sem Z og Y eru óháðar og<br />

ÞéttleikiT er á forminu<br />

UmT gildir að<br />

fT(t) =<br />

T ∼ tr<br />

Z<br />

Y/r<br />

Z ∼ N(0,1), Y ∼ χ 2 r .<br />

Γ((r +1)/2)<br />

√ rπΓ(r/2) (1+t 2 /r) −(r+1)/2 , −∞ < t < ∞.<br />

E(T) = 0, r > 1, var(T) = r<br />

, r > 2.<br />

r −2<br />

21


Skilgreinum tölunatα,r með<br />

það er<br />

tα,r = 100(1−α)-ta sætisstærðin ít-dreifingu með r frítölur<br />

Pr(T ≤ tα,r) = 1−α.<br />

Tafla A3 bls. 614 í Ross gefur gildi á tα,r fyrir valin α og r. Mynd 8, efst til hægri, sýnir<br />

t-dreifingar með 1 og 5 frítölur.<br />

2.5.4 F -dreifingar<br />

Samfellda slembistærðinF fylgirF -dreifingu með r og s frítölur, ritað<br />

efF hefur sömu dreifingu og<br />

þar sem V og W eru óháðar og<br />

ÞéttleikiF er á forminu<br />

fF(x) =<br />

UmF gildir að<br />

F ∼ Fr,s<br />

V/r<br />

W/s<br />

V ∼ χ 2 r , W ∼ χ2 s .<br />

Γ((r +s)/2)(r/s)r/2<br />

x<br />

Γ(r/2)Γ(s/2)<br />

r/2−1 {1+x(r/s)} −(r+s)/2 , 0 ≤ x < ∞.<br />

E(F) = s<br />

s−2 , s > 2, var(F) = 2s2 (r +s−2)<br />

r(s−4)(s−2) 2,<br />

s > 4.<br />

Skilgreinum tölunaFα,r,s með<br />

það er<br />

Fα,r,s = 100(1−α)-ta sætisstærðin íF -dreifingu meðr ogsfrítölur<br />

Pr(F ≤ Fα,r,s) = 1−α.<br />

Tafla A4 bls. 615 í Ross gefur gildi á Fα,r,s fyrir valin α, r og s. Mynd 8, neðst til hægri,<br />

sýnirF -dreifingu með frítölurr = 10 ogs = 20.<br />

22


f Z (z)<br />

f χ (χ)<br />

0.4<br />

0.3<br />

0.2<br />

0.1<br />

0<br />

−5 0<br />

z<br />

5<br />

0.15<br />

0.1<br />

0.05<br />

0<br />

0 10 20 30 40<br />

χ<br />

f T (t)<br />

f F (f)<br />

0.4<br />

0.3<br />

0.2<br />

0.1<br />

0<br />

−5 0<br />

t<br />

5<br />

1<br />

0.8<br />

0.6<br />

0.4<br />

0.2<br />

0<br />

0 1 2 3 4<br />

f<br />

Mynd 8: Stöðluð normaldreifing (efst til vinstri), t-dreifingar með 1 og 5 frítölur (efst til<br />

hægri), kí-kvaðratsdreifingar með 5, 10 og 20 frítölur (neðst til vinstri) og F -dreifing með<br />

frítölurr = 10 ogs = 20 (neðst til hægri).<br />

2.6 Dreifing lýsistærða sem byggðar eru á slembiúrtaki úr normal-<br />

dreifingu<br />

SETNING. LátumX1, ..., Xn vera slembiúrtak úr normaldreifingu<br />

Þá eru ¯ X og S 2 óháðar, og<br />

Xi ∼ N(µ,σ 2 ), i = 1,...,n.<br />

<br />

¯X ∼ N µ, σ2<br />

<br />

,<br />

n<br />

(n−1)S 2<br />

σ 2<br />

∼ χ 2 n−1 .<br />

Setningin gefur dreifingu ¯ X ogS 2 þegar slembiúrtakið er úr normaldreifingu. Athugið að ¯ X<br />

ogS 2 eru óháðar aðeins ef slembiúrtakið er úr normaldreifingu. Í raun er ótrúlegt að ¯ X ogS 2<br />

geti verið óháðar. Út frá setningunni má finna væntigildi og dreifni S 2 þegar slembiúrtakið<br />

23


er úr normaldreifingu. Höfum að<br />

2 (n−1)S<br />

E<br />

σ2 2 (n−1)S<br />

= n−1, var<br />

σ2 <br />

= 2(n−1),<br />

og því<br />

E(S 2 ) = σ 2 , var(S 2 ) = 2σ4<br />

n−1 .<br />

SETNING. LátumX1, ..., Xn vera slembiúrtak úr normaldreifingu<br />

Þá gildir að<br />

Sönnun. Höfum að<br />

Xi ∼ N(µ,σ 2 ), i = 1,...,n.<br />

T = ( ¯ X −µ)<br />

S/ √ n<br />

Z = ( ¯ X −µ)<br />

σ/ √ n<br />

Y = (n−1)S2<br />

σ 2<br />

∼ tn−1<br />

∼ N(0,1),<br />

∼ χ 2 n−1 .<br />

Þessar tvær stærðir eru óháðar því þær eru skalaðar útgáfur af ¯ X og S 2 en þær eru óháðar<br />

samkvæmt setningunni hér á undan. Því er<br />

Z<br />

Y/(n−1) =<br />

√ n( ¯ X −µ)/σ<br />

(n−1)S 2 σ −2 /(n−1)<br />

= ( ¯ X −µ)<br />

S/ √ n ∼ tn−1. <br />

SETNING. LátumX1, ..., Xn vera slembiúrtak úr normaldreifingu<br />

Xi ∼ N(µ1,σ 2 1 ), i = 1,...,n,<br />

og látumY1, ..., Ym vera slembiúrtak úr normaldreifingu<br />

þar sem X-in eru óháð Y -unum. Látum<br />

S 2 1<br />

= 1<br />

n−1<br />

Yi ∼ N(µ2,σ 2 2 ), i = 1,...,m,<br />

n<br />

(Xi − ¯ X) 2 , S 2 2<br />

i=1<br />

24<br />

= 1<br />

m−1<br />

m<br />

(Yi − ¯ Y) 2 .<br />

i=1


Þá gildir<br />

Sönnun. Höfum að<br />

V = (n−1)S2 1<br />

σ 2 1<br />

F = S2 1 /σ2 1<br />

S 2 2 /σ2 2<br />

∼ Fn−1,m−1.<br />

∼ χ 2 n−1 , W = (m−1)S2 2<br />

σ 2 2<br />

∼ χ 2 m−1 ,<br />

ogV ogW eru óháðar slembibreytur þar semX-in eru óháðY-unum. Samkvæmt skilgrein-<br />

ingunni hér að ofan umF -dreifingar, gildir að<br />

V/(n−1)<br />

W/(m−1) = (n−1)S2 1σ−2 1 /(n−1)<br />

(m−1)S 2 2σ −2<br />

2 /(m−1) = S2 1 /σ2 1<br />

S2 2/σ2 2<br />

25<br />

∼ Fn−1,m−1.


3 Metlar og punktmat<br />

3.1 Almennt um metla og punktmat<br />

Sambandinu á milli líkindafræði og ályktunartölfræði má lýsa með framsetningunni hér fyrir<br />

neðan. Líkindafræðin lýsir hegðun úrtaksins úr gefnu þýði. Ályktunartölfræðin gengur út á<br />

að nota úrtakið til að læra um þýðið.<br />

↑ → Líkindafræði → ↓<br />

↑ ↓<br />

ÞÝÐI ÚRTAK<br />

↑ ↓<br />

↑ ← Ályktunartölfræði ← ↓<br />

SKILGREINING. Punktmat (e. point estimate) á stikanum θ er tala sem er „góð ágiskun“<br />

á rétta gildi θ. Punktmatið er reiknað með því að setja fengin gildi í úrtakinu inn í formúlu.<br />

Þegar formúlan inniheldur stærðirnar í slembiúrtakinu er hún kölluð metill (e. estimator)<br />

stikansθ. Metill er því slembistærð.<br />

Dæmi. Viljum meta µ í normaldreifingu. Höfum úrtak af stærð n = 3 úr normaldreifingu<br />

þar sem fengin gildi eru<br />

x1 = 5,6, x2 = 9,1, x3 = 8,5.<br />

LátumX1,X2 ogX3 tákna slembiúrtak úr normaldreifingu. Notum<br />

sem metil fyrirµ. Aftur á móti er<br />

¯x = 1<br />

3<br />

3<br />

i=1<br />

¯X = 1<br />

3<br />

3<br />

i=1<br />

Xi<br />

xi = 1<br />

(5,6+9,1+8,5) = 7,73<br />

3<br />

26


punktmatið á stikanumµbyggt á úrtakinu hér að ofan.<br />

3.2 Hugmyndin að baki aðferð sennilegustu gilda<br />

Dæmi. 3 kúlur í kassa.<br />

2.<br />

- Höfum 3 kúlur í lokuðum kassa.<br />

- Kúlurnar eru rauðar eða hvítar.<br />

- Drögum þrisvar sinnum en skilum kúlu tilbaka í hvert skipti.<br />

- LátumX = fjölda rauðra kúla af þremur.<br />

- Því er X ∼ Bin(3,p).<br />

- Möguleg gildi áperu; p = 0, p = 1/3,p = 2/3, p = 1.<br />

- Mögulegar dreifingar fyrir X, það er, líkurnar á X = x fyrir gefið p, eru gefnar í töflu<br />

Tafla 2: Líkurnar á að X = x fyrirp = 0, p = 1/3,p = 2/3 ogp = 1.<br />

Pr(X = x|p) x = 0 x = 1 x = 2 x = 3<br />

p = 0 1 0 0 0<br />

p = 1/3 8/27 12/27 6/27 1/27<br />

p = 2/3 1/27 6/27 12/27 8/27<br />

p = 1 0 0 0 1<br />

Athugið að líkurnar í töflunni eru reiknaðar með líkindafalli tvíkostadreifingarinnar þegar<br />

n = 3, það er,<br />

Pr(X = x|p) =<br />

<br />

3<br />

p<br />

x<br />

x (1−p) 3−x =<br />

3!<br />

(3−x)!x! px (1−p) 3−x , x = 0,1,2,3.<br />

Gerum ráð fyrir að við vitum ekki gildi p. Ef við fáum X = 1, hvað er sennilegasta gildið<br />

á p? Mynd 9 sýnir líkurnar á að X = 1 fyrir möguleg gildi á p. Af mynd 9 og töflunni<br />

hér að ofan er ljóst að p = 1/3 gefur stærsta gildið á Pr(X = 1|p). Því segjum við að fyrir<br />

ofangreinda útkomu úr tilrauninni (X = 1) þá er sennilegasta gildið á p jafnt 1/3. Athugið<br />

27


að stundum er ritað<br />

P(X=1|p)<br />

0.5<br />

0.45<br />

0.4<br />

0.35<br />

0.3<br />

0.25<br />

0.2<br />

0.15<br />

0.1<br />

0.05<br />

0<br />

3.3 Aðferð sennilegustu gilda<br />

f(x|p) = Pr(X = x|p).<br />

0 0.1 0.2 0.3 0.4 0.5<br />

p<br />

0.6 0.7 0.8 0.9 1<br />

Mynd 9: Líkurnar Pr(X = 1|p) sem fall af p.<br />

SKILGREINING. Látum X1, ..., Xn vera samfelldar (strjálar) slembibreytur sem hafa sam-<br />

þéttifall (samlíkindafall) sem er háð stikavigrinumθ = (θ1,...,θm) T , ritað<br />

f(x1,...,xn|θ).<br />

Fyrir tiltekna útkomu; X1 = x1, ..., Xn = xn, má líta á f sem fall af θ. Köllum fallið<br />

sennileikafall θ (e. the likelihood function of θ) ritað L(θ|x1,...,xn) eða einfaldlega L(θ).<br />

Látumx = (x1,...,xn) T , en þá má rita<br />

L(θ) = L(θ|x1,...,xn) = f(x1,...,xn|θ)<br />

= L(θ|x) = f(x|θ).<br />

28


Lograsennileikafallθ, ritaðl(θ), er skilgreint sem<br />

l(θ) = ln{L(θ)}.<br />

SKILGREINING. Punktmatið ˆ θ = ˆ θ(x) sem hámarkar sennileikafallið, L(θ|x), fyrir gefið<br />

x, nefnist sennileikamat θ (e. maximum likelihood estimate of θ). Metillinn ˆ θ = ˆ θ(X),<br />

X = (X1,...,Xn) T nefnist sennileikametillθ (e. maximum likelihood estimator ofθ).<br />

Athugið að ef X1, X2, ..., Xn eru óháðar samfelldar (eða strjálar) slembibreytur þar sem<br />

hvertXi hefur þéttleika (eða líkindafall)<br />

fi(xi|θ), i = 1,2,...,n,<br />

þar sem θ er eins og áður stikavigur af lengdm, þá má rita sennileikafallθ, L(θ) sem<br />

og lograsennileikafallθ, l(θ), sem<br />

L(θ) =<br />

n<br />

fi(xi|θ)<br />

i=1<br />

l(θ) = ln{L(θ)} =<br />

n<br />

ln{fi(xi|θ)}.<br />

Dæmi. Finnið sennileikametil θ, það er ˆ θ, fyrir eftirfarandi tilvik. Látum X1, X2, ..., Xn<br />

vera slembiúrtak úr dreifingu sem er þannig að þéttleiki hversXi,i = 1,...,n, er gefinn með<br />

⎧<br />

⎨ θx<br />

fi(xi|θ) =<br />

⎩<br />

θ−1<br />

i , ef0≤xi ≤ 1,<br />

0, annars,<br />

fyrirθ > 0. SamþéttifallX1, ..., Xn er<br />

f(x1,...,xn|θ) =<br />

=<br />

n<br />

i=1<br />

θx θ−1<br />

i<br />

i=1<br />

n<br />

fi(xi|θ)<br />

i=1<br />

= L(θ|x).<br />

Hér höfum við því sennileikafallið,L(θ|x), og lograsennileikafallið er<br />

<br />

n<br />

<br />

l(θ|x) = ln{L(θ|x)} = ln<br />

29<br />

i=1<br />

θx θ−1<br />

i


=<br />

=<br />

n<br />

ln(θ)+<br />

i=1<br />

n<br />

i=1<br />

ln(θx θ−1<br />

i ) =<br />

n<br />

i=1<br />

{ln(θ)+ln(x θ−1<br />

i )}<br />

n<br />

(θ −1)ln(xi) = nln(θ)+(θ−1)<br />

i=1<br />

= nln(θ)+θ<br />

n<br />

ln(xi)−<br />

i=1<br />

n<br />

ln(xi).<br />

Hér að ofan eru notaðar eftirfarandi reglur um náttúrulega lografallið<br />

i=1<br />

ln(ab) = ln(a)+ln(b), ln(c d ) = dln(c).<br />

n<br />

ln(xi)<br />

Næsta skref er að hámarka L(θ|x) með tilliti til θ. Athugið að það θ ∗ sem hámarkar<br />

L(θ|x) hámarkar einnig l(θ|x). Oft er léttara að hámarka l(θ|x) heldur en L(θ|x). Diffrum<br />

l(θ|x) með tilliti tilθ<br />

∂l(θ|x)<br />

∂θ<br />

Setjum∂l(θ|x)/∂θ = 0, og leysum fyrirθ<br />

∂l(θ|x)<br />

∂θ<br />

= n<br />

θ +<br />

= n<br />

θ +<br />

n<br />

ln(xi)−0.<br />

i=1<br />

n<br />

ln(xi) = 0.<br />

Þá fæst að sennileikamatið áθ (sem er þaðθsem hámarkarl(θ)) fyrir fengin gildixer gefið<br />

með<br />

Því er sennileikametillθ gefinn með<br />

ˆθ = ˆ θ(x) =<br />

ˆθ = ˆ θ(X) =<br />

i=1<br />

(−n)<br />

.<br />

ln(xi)<br />

n<br />

i=1<br />

n<br />

i=1<br />

(−n)<br />

.<br />

ln(Xi)<br />

Dæmi - framhald. Fengum eftirfarandi gildi áX1, ...,X6, n = 6,<br />

i=1<br />

x1 = 0,6720, x2 = 0,8312, x3 = 0,8853,<br />

x4 = 0,1694, x5 = 0,8210, x6 = 0,2989.<br />

Sennileikamatið (punktmatið) áθ í þessu tilfelli er því<br />

ˆθ =<br />

(−6)<br />

6 = 1,5446.<br />

i=1ln(xi) 30


l(θ)=ln{L(θ)}<br />

0.5<br />

0.4<br />

0.3<br />

0.2<br />

0.1<br />

θ mle =1.5446<br />

0<br />

1 1.1 1.2 1.3 1.4 1.5<br />

θ<br />

1.6 1.7 1.8 1.9 2<br />

Mynd 10: Lograsennileikafalliðl(θ) sem fall afθ.<br />

Mynd 10 sýnirl(θ) sem fall afθ. Á myndinni sést að fallið er í hámarki þegarθ = 1,5446.<br />

Dæmi - Tvíkostadreifingin. X ∼ Bin(n,p), n þekkt,póþekkt. X hefur líkindafallið<br />

Pr(X = x) = f(x|p) =<br />

<br />

n<br />

p<br />

x<br />

x (1−p) n−x , x = 0,1,2,...,n.<br />

Eins og áður erL(p|x) = f(x|p) og lograsennileikafallið er<br />

l(p|x) = ln{L(p|x)} = ln<br />

Diffruml(p|x) með tilliti tilp<br />

<br />

n<br />

p<br />

x<br />

x (1−p) n−x<br />

<br />

= ln<br />

∂l(p|x)<br />

∂p<br />

Setjum∂l(p|x)/∂p = 0, og leysum fyrirp<br />

Þá fæst<br />

∂l(p|x)<br />

∂p<br />

x (n−x)<br />

= 0+ −<br />

p (1−p) .<br />

x (n−x)<br />

= −<br />

p (1−p)<br />

x<br />

p<br />

= (n−x)<br />

(1−p) ,<br />

31<br />

<br />

n<br />

+xln(p)+(n−x)ln(1−p).<br />

x<br />

= 0.


sem jafngildir<br />

Sennileikamatið ápfyrir gefið gildixer því<br />

Og sennileikametillp er því gefinn með<br />

x−xp = np−xp, eða x = np.<br />

ˆp = ˆp(x) = x<br />

n .<br />

ˆp = ˆp(X) = X<br />

n .<br />

Dæmi - Poisson-dreifingin. Látum X1, ..., Xn vera slembiúrtak úr dreifingu sem er þannig<br />

að, Xi ∼ Poisson(λ), i = 1,...,n, ogλ > 0 er óþekkt. Líkindafall hversXi er gefið með<br />

Pr(Xi = xi) = fi(xi|λ) = e−λλxi , xi = 0,1,2,...,∞, i = 1,...,n.<br />

xi!<br />

SamlíkindafallX1, ...,Xn er<br />

f(x1,...,xn|λ) =<br />

=<br />

Því er lograsennileikafallλgefið með<br />

i=1<br />

n<br />

fi(xi|λ)<br />

i=1<br />

n e−λλxi = L(λ|x).<br />

xi!<br />

l(λ|x) = ln{L(λ|x)} = ln<br />

=<br />

=<br />

=<br />

n<br />

i=1<br />

n<br />

ln(e −λ )+<br />

i=1<br />

n<br />

(−λ)+<br />

i=1<br />

n<br />

i=1<br />

ln{e −λ λ xi (xi!) −1 }<br />

n<br />

ln(λ xi )+<br />

i=1<br />

n<br />

xiln(λ)+<br />

i=1<br />

= −nλ+ln(λ)<br />

n<br />

i=1<br />

32<br />

xi −<br />

e −λ λ xi (xi!) −1<br />

<br />

n<br />

ln{(xi!) −1 }<br />

i=1<br />

n<br />

{−ln(xi!)}<br />

i=1<br />

n<br />

ln(xi!).<br />

i=1


Diffruml(λ|x) með tilliti tilλ<br />

∂l(λ|x)<br />

∂λ<br />

Setjum∂l(λ|x)/∂λ = 0, og leysum fyrirλ<br />

∂l(λ|x)<br />

∂λ<br />

= −n+λ−1<br />

= −n+λ−1<br />

Þá fæst að sennileikamatið á λ fyrir fengin gildixer<br />

Því er sennileikametillλgefinn með<br />

ˆλ = ˆ λ(x) = 1<br />

n<br />

ˆλ = ˆ λ(X) = 1<br />

n<br />

n<br />

i=1<br />

xi −0.<br />

n<br />

xi = 0.<br />

i=1<br />

n<br />

xi.<br />

i=1<br />

n<br />

Xi.<br />

Dæmi - Normaldreifingin. (Sjá dæmi 7.2e í Ross, bls. 236). Látum X1, ..., Xn vera<br />

slembiúrtak úr normaldreifingu; Xi ∼ N(µ,σ 2 ), i = 1,...,n, þar sem µ og σ eru óþekkt.<br />

Sennileikametlarµogσ eru gefnir með<br />

ˆµ = ˆµ(X) = 1<br />

n<br />

i=1<br />

n<br />

Xi, ˆσ = ˆσ(X) =<br />

i=1<br />

<br />

1<br />

n<br />

n<br />

(Xi − ¯ X) 2<br />

i=1<br />

1/2<br />

SETNING. (The Invariance Principle) (ekki í Ross). Látum ˆ θ1, ..., ˆ θm vera senni-leikametla<br />

fyrir stikanaθ1, ...,θm. Þá er sennileikametillinn fyrir falliðh(θ1,...,θm) gefinn meðh( ˆ θ1,..., ˆ θm).<br />

Dæmi - Normaldreifingin - framhald. Látum ˆµ og ˆσ vera metlana sem gefnir voru hér að<br />

ofan. Sennileikametlarnir fyrirσ 2 og µ+2σ eru<br />

3.4 Eiginleikar metla<br />

(ˆσ) 2 , og ˆµ+2ˆσ.<br />

Látum X1, ..., Xn vera slembiúrtak úr dreifingu F sem er stikuð með stikanum θ (og hugs-<br />

anlega öðrum stikum). Ef ˆ θ(X) er metill fyrirθ þá höfum við áhuga á<br />

33<br />

.


i) E{ ˆ θ(X)}, væntigildi metilsins<br />

ii) var{ ˆ θ(X)}, dreifni metilsins<br />

iii) E[{ ˆ θ(X)−θ} 2 ], meðalferskekkju metilsins, (sjá skilgreiningu síðar)<br />

iv) Dreifingu ˆ θ(X)<br />

SKILGREINING. Látum ˆ θ(X) vera metil fyrirθ. Þá er stærðin<br />

bθ{ ˆ θ(X)} = E{ ˆ θ(X)}−θ<br />

kölluð bjagi (e. bias) metilsins ˆ θ(X). Ef bθ{ ˆ θ(X)} = 0 fyrir öll θ, þá er ˆ θ(X) sagður<br />

óbjagaður (e. unbiased) metill fyrirθ en bjagaður (e. biased) annars.<br />

Dæmi - tvíkostadreifingin, framhald. X ∼ Bin(n,p), og ˆp(X) = X/n er sennileikametillp<br />

(n þekkt, p óþekkt). Þá er bjagi ˆp(X)<br />

Því er ˆp(X) óbjagaður metill fyrirp.<br />

bp{ˆp(X)} = E{ˆp(X)}−p = E(X/n)−p<br />

= E(X)/n−p = np/n−p = 0.<br />

SKILGREINING. Látum ˆ θ(X) vera metil fyrirθ. Þá er stærðin<br />

rθ{ ˆ θ(X)} = E[{ ˆ θ(X)−θ} 2 ]<br />

kölluð meðalferskekkja (e. mean square error) metilsins ˆ θ(X), og<br />

er dreifni metilsins ˆ θ(X).<br />

var{ ˆ θ(X)} = E[{ ˆ θ(X)−E{ ˆ θ(X)}} 2 ]<br />

Útfrá skilgreiningunum hér að ofan má sýna að (sjá Ross, bls. 269)<br />

rθ{ ˆ θ(X)} = var{ ˆ θ(X)}+bθ{ ˆ θ(X)} 2 .<br />

Ef ˆ θ(X) er óbjagaður metill fyrirθ, það er, bθ{ ˆ θ(X)} = 0, þá gildir að<br />

rθ{ ˆ θ(X)} = var{ ˆ θ(X)}.<br />

34


Dæmi - tvíkostadreifingin, framhald. X ∼ Bin(n,p), ˆp(X) = X/n. Meðalferskekkja ˆp(X)<br />

er<br />

rp{ˆp(X)} = var{ˆp(X)}+bp{ˆp(X)} 2<br />

= var(X/n)+0 2 = 1<br />

var(X)<br />

n2 = 1 p(1−p)<br />

n2np(1−p) = .<br />

n<br />

Ákjósanlegur metill fyrir einhvern stikaθ er metill sem er óbjagaður með minnstu mögu-<br />

legu dreifni. Í mörgum tilfellum er hægt að finna metil af þessu tagi. Annar ákjósanlegur<br />

metill fyrir θ er metill sem gefur minnstu mögulegu meðalferskekkju. Í fæstum tilfellum er<br />

hægt að finna metil af þessu tagi.<br />

Dæmi - 3 lögreglumenn á skotæfingu. Mynd 11 sýnir skotskífur þriggja lögreglumanna. Sá<br />

fyrsti hittir eins og óbjagaður metill með mikla dreifni. Lögreglumaðurinn sem er annar í<br />

röðinni hittir eins og metill sem hefur litla dreifni en er bjagaður. Sá þriðji hittir eins og<br />

metill sem hefur litla dreifni og er óbjagaður.<br />

1 2<br />

3<br />

1. óbjagaður, mikil dreifni<br />

2. bjagaður, lítil dreifni<br />

3. óbjagaður, lítil dreifni<br />

Mynd 11: Skotskífur þriggja lögreglumanna.<br />

35


SETNING. (Aðfellueiginleikar sennileikametla). Látum ˆ θn = ˆ θn(X) vera sennileikametil<br />

fyrir θ sem er byggður á slembiúrtaki af stærð n þar sem dreifing X-anna er aðeins fall af<br />

stikanumθ. Þá gildir um bjaga ˆ θn, bθ{ ˆ θn(X)}, að<br />

Um dreifni ˆ θn gildir að<br />

þar semn −1 σ 2 0<br />

bθ{ ˆ θn(X)} → 0 þegar n → ∞.<br />

nvar{ ˆ θn(X)} → σ 2 0 þegar n → ∞,<br />

er minnsta mögulega dreifni á meðal óbjagaðra metla fyrirθ þegar slembiúr-<br />

takið er af stærð n. Að því gefnu að um slembiúrtak sé að ræða (X-in eru óháð og fylgja<br />

nákvæmlega sömu dreifingu) (og að gefnum nokkrum skilyrðum ál(θ), þar á meðal að l(θ)<br />

sé tvídiffranlegt) þá er dreifninσ 2 0<br />

þar sem g(θ) er raunfall afθ.<br />

á forminu<br />

3.5 Línulegir óbjagaðir metlar<br />

σ 2 0<br />

= g(θ)<br />

Dæmi. Metum þyngd okkar með tveimur vogum.<br />

- Táknum þyngd okkar með µ,µóþekkt.<br />

- Höfum tvær vogir. Getum stigið einu sinni á hvora vog.<br />

- LátumX1 vera mælingu frá vog 1 og X2 frá vog 2.<br />

- Gerum ráð fyrir að X1 og X2 séu óháðar og að<br />

- σ 2 1 ogσ2 2 þekkt.<br />

E(X1) = E(X2) = µ, var(X1) = σ 2 1 , var(X2) = σ 2 2 .<br />

Notum línulegan metil (e. linear estimator) til að metaµ<br />

ˆµ(X1,X2) = λX1 +(1−λ)X2, λ ∈ [0,1].<br />

36


Því gildir að<br />

E{ˆµ(X1,X2)} = λE(X1)+(1−λ)E(X2) = µ.<br />

Metillinn ˆµ(X1,X2) er því línulegur óbjagaður metill (e. linear unbiased estimator) fyrirµ.<br />

Við viljum lágmarka meðalferskekkju ˆµ(X1,X2) og því í raun dreifni ˆµ(X1,X2) þar sem<br />

ˆµ(X1,X2) er óbjagaður metill fyrirµ. Meðalferskekkja ˆµ(X1,X2) er<br />

rµ{ˆµ(X1,X2)} = var{ˆµ(X1,X2)}<br />

= var{λX1 +(1−λ)X2} = var{λX1}+var{(1−λ)X2}<br />

= λ 2 var(X1)+(1−λ) 2 var(X2) = λ 2 σ 2 1 +(1−λ) 2 σ 2 2.<br />

Lágmörkumrµ{ˆµ(X1,X2)} með tilliti tilλ<br />

∂rµ{ˆµ(X1,X2)}<br />

∂λ<br />

Setjum afleiðuna jafna 0 en þá fæst<br />

λ = σ2 2<br />

σ 2 1 +σ 2 2<br />

Ef til dæmisσ 2 1 = 1 2 og σ 2 2 = 2 2 þá fæst<br />

og<br />

og<br />

rµ{ˆµ(X1,X2)} = λ 2 σ 2 1 +(1−λ) 2 σ 2 2 =<br />

= ∂{λ2 σ 2 1 +(1−λ)2 σ 2 2 }<br />

∂λ<br />

= 2λσ 2 1 −2(1−λ)σ 2 2.<br />

1/σ 2 1<br />

=<br />

1/σ2 1 +1/σ2 =<br />

2<br />

λ = 4 1<br />

, 1−λ =<br />

5 5<br />

ˆµ(X1,X2) = 4<br />

5 X1 + 1<br />

5 X2<br />

2 4<br />

1<br />

5<br />

2 +<br />

σ −2<br />

1<br />

σ −2<br />

1 +σ −2<br />

2<br />

.<br />

2 1<br />

2<br />

5<br />

2 = 4<br />

5 < var(X1) = 1<br />

og því er dreifni metilsins ˆµ(X1,X2) minni en dreifni óbjagaða metilsins ˆµ ∗ (X1,X2) = X1<br />

fyrirµ(jafngildir því að nota aðeins vog 1 eða notaλ = 1).<br />

37


LátumX1, ...,Xn vera óháðar slembibreytur sem eru þannig að<br />

Látum ˆµ(X) vera línulegan metil á forminu<br />

E(Xi) = µ, i = 1,...,n, µ óþekkt.<br />

var(Xi) = σ 2 i , i = 1,...,n, σ2 i þekkt.<br />

ˆµ(X) =<br />

n<br />

λiXi.<br />

Viljum a𠈵(X) sé óbjagaður metill fyrirµ. Því þarf að gilda umλ1, ...,λn að<br />

<br />

n<br />

<br />

n<br />

E{ˆµ(X)} = E = E(λiXi)<br />

Því þarf að gilda að<br />

=<br />

n<br />

λiE(Xi) =<br />

i=1<br />

i=1<br />

i=1<br />

λiXi<br />

n<br />

λiµ = µ<br />

i=1<br />

n<br />

λi = 1.<br />

i=1<br />

i=1<br />

n<br />

λi = µ.<br />

Þá má sýna að þau λ1, ..., λn sem uppfylla n<br />

i=1 λi = 1 og gefa minnstu meðalferskekkju<br />

rµ{ˆµ(X)} (og því í raun minnstu dreifni var{ˆµ(X)}) eru á forminu<br />

λi =<br />

σ −2<br />

i<br />

n k=1σ−2 k<br />

=<br />

i=1<br />

1/σ2 i n k=11/σ2 .<br />

k<br />

Lágmarks meðalferskekkja (lágmarks dreifni) ˆµ(X) er því<br />

rµ{ˆµ(X)} = var{ˆµ(X)} = var<br />

=<br />

=<br />

n<br />

λ 2 i var(Xi) =<br />

i=1<br />

n<br />

k=1<br />

σ −2<br />

k<br />

=<br />

−2 n<br />

i=1<br />

n<br />

k=1<br />

⎧<br />

n ⎨<br />

i=1<br />

n<br />

i=1<br />

⎩ σ−2 i<br />

σ −4<br />

i σ2 i =<br />

σ −2<br />

k<br />

−1<br />

38<br />

=<br />

λiXi<br />

n<br />

k=1<br />

n<br />

k=1<br />

1<br />

<br />

σ −2<br />

k<br />

σ −2<br />

k<br />

n i=1σ−2 i<br />

=<br />

n<br />

var(λiXi)<br />

i=1<br />

−1 ⎫ ⎬<br />

⎭<br />

2<br />

−2 n<br />

.<br />

i=1<br />

σ 2 i<br />

σ −2<br />

i


4 Öryggisbil<br />

4.1 Eiginleikar öryggisbila<br />

LátumX1, ..., Xn vera slembiúrtak úr normaldreifingu með stikaµogσ 2 . Þá hefur<br />

staðlaða normaldreifingu og<br />

Umritum<br />

Pr<br />

Z = ¯ X −µ<br />

σ/ √ n<br />

<br />

−1,96 ≤ ¯ X −µ<br />

σ/ √ <br />

≤ 1,96 = 0,95.<br />

n<br />

<br />

Pr −1,96 σ √ ≤<br />

n ¯ X −µ ≤ 1,96 σ <br />

√<br />

n<br />

<br />

= Pr − ¯ X −1,96 σ √ ≤ −µ ≤ −<br />

n ¯ X +1,96 σ <br />

√<br />

n<br />

<br />

= Pr ¯X −1,96 σ √ ≤ µ ≤<br />

n ¯ X +1,96 σ <br />

√ = 0,95.<br />

n<br />

Endapunktarnir( ¯ X −1,96σ/ √ n) og ( ¯ X +1,96σ/ √ n) eru slembibreytur. Bilið<br />

<br />

¯X −1,96 σ √ ,<br />

n ¯ X +1,96 σ <br />

√<br />

n<br />

er því í raun slembibil, og líkurnar á að µ sé á bilinu eru 0,95.<br />

SKILGREINING. LátumX1, ...,Xn vera slembiúrtak úr normaldreifingu með stikaµogσ 2 ,<br />

og látum x1, ..., xn vera fengin gildi á X-unum. Gerum ráð fyrir að σ 2 sé þekkt. Þá er 95%<br />

öryggisbil (e. confidence interval) fyrirµskilgreint sem<br />

<br />

¯x−1,96 σ √ ,¯x+1,96<br />

n σ <br />

√ .<br />

n<br />

Athugasemd. Bilið hér að ofan er ekki slembibil heldur endanlega ákvarðað bil eftir að<br />

gögninx1, ...,xn hafa verið fengin í hendurnar. Hið sanna gildi áµer því annað hvort innan<br />

bilsins eða ekki.<br />

Dæmi. Gögn frá normaldreifingu, σ þekkt, σ = 1,6, n = 3, x1 = 21,7, x2 = 26,9,<br />

x3 = 25,9,<br />

¯x = (21,7+26,9+25,9)/3 = 24,83.<br />

39


95% öryggisbil fyrirµer því<br />

<br />

¯x−1,96 σ √ ,¯x+1,96<br />

n σ <br />

√<br />

n<br />

<br />

24,83−1,96× 1,6<br />

√ ,24,83+1,96×<br />

3 1,6<br />

<br />

√<br />

3<br />

(23,02,26,64).<br />

TÚLKUN Á ÖRYGGISBILUM. Það er ekki rétt að segja að það séu 95% líkur á því að µ<br />

sé innan útreiknaðs 95% öryggisbils. Öryggisbilið er endanlega ákvarðað bil eftir að gögnin<br />

x1, ..., xn hafa verið fengin í hendurnar og annað hvort er µ innan öryggisbilsins eða ekki.<br />

En hugsunin er sú að ef við reiknum 95% öryggisbil fyrirµaftur og aftur með nýju úrtaki af<br />

sömu stærð sem kemur úr nákvæmlega sömu dreifingu þá munu um 95% af öryggisbilunum<br />

innihaldaµog um 5% þeirra munu ekki innihaldaµ.<br />

Mynd 12 sýnir 95% öryggisbil frá normaldreifingu þegar hið sanna µ er 10, σ = 2 og<br />

n = 64. Á myndinni sést að af 40 öryggisbilum þá eru 3 öryggisbil sem innihalda ekki hið<br />

sanna gildi á µ. Þessi öryggisbil eru merkt með stjörnu. Athugið að fjöldi öryggisbila sem<br />

ekki inniheldur µ fylgir tvíkostadreifingu með stika m = 40 og p = 0,05. Væntigildið er<br />

mp = 2 öryggisbil sem ekki innihaldaµíþessu tilfelli.<br />

SKILGREINING. Látum X1, ..., Xn vera slembiúrtak úr normaldreifingu með stika µ og<br />

σ 2 , og látum x1, ..., xn vera fengin gildi á X-unum. Gerum ráð fyrir að σ 2 sé þekkt. Þá er<br />

100(1−α)% öryggisbil fyrirµskilgreint sem<br />

<br />

<br />

σ σ<br />

¯x−zα/2 √ ,¯x+zα/2 √<br />

n n<br />

þar sem zα/2 er100(1−α/2)-ta sætisstærðin í staðlaðri normaldreifingu.<br />

Athugasemd. Umzα/2 gildir að<br />

Pr(Z > zα/2) = α/2, Pr(Z ≤ −zα/2) = α/2,<br />

þar sem Z fylgir staðlaðri normaldreifingu.<br />

40


Númer úrtaks<br />

40<br />

35<br />

30<br />

25<br />

20<br />

15<br />

10<br />

5<br />

0<br />

8.5 9 9.5 10 10.5<br />

Hugsanleg gildi µ<br />

11 11.5 12 12.5<br />

Mynd 12: 95% öryggisbil fyrir µ byggð á 40 úrtökum frá normaldreifingu þegar hið sanna<br />

gildi áµer 10 og σ = 2 ogn = 64.<br />

Við segjum að öryggisstig (e. confidence level) bilsins sé100(1−α)% og að óþekkti stikinn<br />

liggi innan reiknaðs öryggisbils með100(1−α)% vissu. Algengt er að velja 90% öryggisstig,<br />

(α = 0,10), 95% öryggisstig, (α = 0,05), 99% öryggisstig, (α = 0,01). Tafla 3 sýnir gildi á<br />

zα/2 fyrir valin gildi áα.<br />

Í því tilfelli þegar gögnin koma frá normaldreifingu og σ 2 er þekkt, þá er breidd öryggis-<br />

bilsins fyrirµekki háð gögnunum en er háð σ2 ,nogα. Breiddin er<br />

<br />

σ σ<br />

w = ¯x+zα/2 √ − ¯x−zα/2 √<br />

n n<br />

= 2zα/2<br />

σ<br />

√ .<br />

n<br />

Ef við viljum 100(1−α)% öryggisbil fyrir µ sem er þannig að breidd bilsins sé minni eða<br />

jöfn w, þá þarfnað vera<br />

<br />

n ≥<br />

2zα/2<br />

σ<br />

2 .<br />

w<br />

Dæmi - framhald. Höfumσ = 1,6. Viljum 99% öryggisbil sem hefur breidd sem er jöfn eða<br />

minni en w = 0,75. Hér er α = 0,01, zα/2 = z0,005 = 2,576, sjá neðst í töflu A3 (n = ∞),<br />

41


ls. 614 í Ross. Hér þarfnað vera þannig að<br />

n ≥<br />

<br />

2×2,576× 1,6<br />

2 = 120,8.<br />

0,75<br />

Þar semner heiltala þá látum viðn = 121 til að tryggja að w ≤ 0,75.<br />

Tafla 3: Gildi ázα/2 fyrir valin gildi áα<br />

Öryggisstig 80% 90% 95% 98% 99%<br />

α 0.20 0.10 0.05 0.02 0.01<br />

z1−α/2 1.282 1.645 1.960 2.326 2.576<br />

4.2 Öryggisbil fyrir µ í normaldreifingu þegar σ 2 er óþekkt<br />

Látum X1, ..., Xn vera slembiúrtak úr normaldreifingu með stika µ og σ 2 , og látum x1, ...,<br />

xn vera fengin gildi á X-unum. Gerum ráð fyrir að bæðiµog σ 2 séu óþekkt. Þá gildir<br />

og<br />

¯X −µ<br />

S/ √ n<br />

∼ tn−1<br />

<br />

Pr −tα/2,n−1 ≤ ¯ X −µ<br />

S/ √ <br />

≤ tα/2,n−1 = 1−α.<br />

n<br />

Eins og hér á undan má umrita og við fáum að<br />

<br />

Pr<br />

¯X<br />

S<br />

−tα/2,n−1 √ ≤ µ ≤<br />

n ¯ <br />

S<br />

X +tα/2,n−1 √ = 1−α.<br />

n<br />

Því er100(1−α)% öryggisbil fyrirµgefið með<br />

<br />

¯x−tα/2,n−1<br />

<br />

s s<br />

√ ,¯x+tα/2,n−1 √ .<br />

n n<br />

Dæmi. Höfum normaldreifð gögn. Viljum 99% öryggisbil fyrir µ. Úrtakið er þannig að<br />

n = 18, ¯x = 38,66, s = 8,473. Hér er α = 0,01, tα/2,n−1 = t0,005,17 = 2,898, sjá töflu A3,<br />

42


ls. 614 í Ross. Því er 99% öryggisbil fyrirµíþessu tilfelli<br />

<br />

38,66−2,898× 8,473<br />

√ ,38,66+2,898×<br />

18 8,473<br />

<br />

√<br />

18<br />

= (32,87,44,45).<br />

4.3 Öryggisbil fyrir σ 2 og σ í normaldreifingu<br />

Látum X1, ..., Xn vera slembiúrtak úr normaldreifingu með stika µ og σ 2 , og látum x1, ...,<br />

xn vera fengin gildi á X-unum. Gerum ráð fyrir að bæðiµog σ 2 séu óþekkt. Þá gildir<br />

og<br />

(n−1)S 2<br />

σ 2 ∼ χ 2 n−1<br />

<br />

Pr χ 2 (n−1)S2<br />

1−α/2,n−1 ≤<br />

σ2 Eins og hér á undan má umrita og við fáum að<br />

Pr<br />

<br />

(n−1)S 2<br />

χ 2 α/2,n−1<br />

≤ σ 2 ≤ (n−1)S2<br />

χ2 <br />

1−α/2,n−1<br />

≤ χ 2 <br />

α/2,n−1 = 1−α.<br />

= 1−α.<br />

Því eru 100(1−α)% öryggisbil fyrirσ2 ogσ gefin með<br />

σ 2<br />

<br />

:<br />

(n−1)s 2<br />

χ2 ,<br />

α/2,n−1<br />

(n−1)s2<br />

χ2 <br />

1−α/2,n−1<br />

<br />

σ :<br />

(n−1)s 2<br />

χ2 <br />

,<br />

α/2,n−1<br />

(n−1)s 2<br />

χ2 <br />

1−α/2,n−1<br />

Dæmi - framhald. Höfum normaldreifð gögn. Viljum 95% öryggisbil fyrirσ. Úrtakið gefur<br />

eins og áður,n = 18, ¯x = 38,66,s = 8,473. Hér erα = 0,05,χ 2 α/2,n−1 = χ2 0,025,17 = 30,191,<br />

χ 2 1−α/2,n−1 = χ2 0,975,17<br />

= 7,564, sjá töflu A2, bls. 613 í Ross. Því er 95% öryggisbil fyrirσ í<br />

þessu tilfelli ⎛<br />

⎝<br />

17×8,474 2<br />

<br />

,<br />

30,191<br />

17×8,474 2<br />

⎞<br />

⎠<br />

7,564<br />

= (6,358,12,702).<br />

Athugið að bilið er ekki samhverft ums = 8,473.<br />

43


4.4 Öryggisbil fyrir p í tvíkostadreifingu<br />

LátumX ∼ Bin(n,p). Metumpmeð sennileikametlinum ˆp = X/n. Um ˆp gildir að<br />

ˆp−p<br />

p(1−p)/n ∼ N(0,1), þegar n → ∞<br />

og efner nægjanlega stórt (np ≥ 10, þumalputtaregla) þá er<br />

<br />

<br />

ˆp−p<br />

Pr −zα/2 ≤ ≤ zα/2 ≈ 1−α.<br />

p(1−p)/n<br />

Þessi nálgun byggir á höfuðmarkgildisreglunni, því hægt er að ritaX sem summu af Bernoulli<br />

slembibreytum (sem eru líka tvíkostaslembibreytur meðn = 1), það er,<br />

þar sem<br />

Því fæst<br />

og<br />

X =<br />

n<br />

Xi,<br />

i=1<br />

Xi ∼ Bernoulli(p), E(Xi) = p, var(Xi) = p(1−p), i = 1,...,n.<br />

var(X) = var<br />

E(X) = E<br />

n<br />

i=1<br />

n<br />

Xi<br />

i=1<br />

<br />

=<br />

Xi<br />

<br />

=<br />

n<br />

E(Xi) =<br />

i=1<br />

n<br />

var(Xi) =<br />

i=1<br />

n<br />

p = np<br />

i=1<br />

n<br />

p(1−p) = np(1−p).<br />

Efner stórt(np ≥ 10) þá má nálga dreifinguX með normaldreifingu<br />

i=1<br />

X ∼ N(np,np(1−p)), þegar n → ∞.<br />

og dreifingu ˆp = X/n má einnig nálga með normaldreifingu<br />

ˆp ∼ N(p,p(1−p)/n), þegar n → ∞.<br />

Við viljum leysa fyrirpíjöfnunni hér að ofan sem gefur nálgun á líkunum fyrir ˆp.<br />

2 (ˆp−p)<br />

Pr<br />

p(1−p)/n ≤ z2 <br />

α/2<br />

= Pr (ˆp−p) 2 ≤ z 2 α/2 p(1−p)/n<br />

44


þar sem<br />

= Pr ˆp 2 −2ˆpp+p 2 ≤ z 2 α/2 p/n−z2 α/2 p2 /n <br />

= Pr (1+z 2 α/2 /n)p2 +(−2ˆp−z 2 α/2 /n)p+ ˆp2 ≤ 0 <br />

= Pr ap 2 +bp+c ≤ 0 ≈ 1−α<br />

a = 1+z 2 α/2/n, b = −2ˆp−z 2 α/2/n, c = ˆp 2 .<br />

Hér þarf að finna þau p sem að uppfylla ójöfnuna hér að ofan. Stærðin vinstra megin við<br />

ójöfnumerkið er parabóla í p. Finnum skurðpunktana með því að setja jafnaðarmerki í stað-<br />

inn fyrir ójöfnumerkið og leysa svo fyrirp. Þá fæst<br />

p = −b±√b 2 −4ac<br />

.<br />

2a<br />

Að því gefnu að fengið gildi á X sé x, þá er punktmatið á p, ˆp = x/n, og 100(1 − α)%<br />

öryggisbil fyrirper gefið með<br />

<br />

ˆp+ z2<br />

<br />

α/2<br />

2n<br />

<br />

1+ z2<br />

±<br />

α/2<br />

n<br />

zα/2<br />

<br />

ˆp(1−ˆp)<br />

n + z2 α/2<br />

4n2 <br />

1+ z2<br />

<br />

α/2<br />

n<br />

þar sem mínusinn gefur neðri mörkin og plúsinn gefur efri mörkin á öryggisbilinu.<br />

Dæmi. Viljum finna 95% öryggisbil fyrir p í tvíkostadreifingu. Úrtakið er af stærð n = 30.<br />

Fjöldi jákvæðra niðurstaðna er x = 14. Sennileikamatið er því ˆp = 14/30 = 0,4667.<br />

Jöfnurnar fyrir neðri og efri mörk öryggisbilsins gefa<br />

(0,3023,0,6386).<br />

Mynd 13 sýnir parabóluna í ójöfnunni. Skurðpunktarnir við lárétta ásinn gefa efri og neðri<br />

mörkin.<br />

Efner mjög stórt þá má nálga100(1−α)% öryggisbil fyrirpmeð<br />

<br />

ˆp(1− ˆp) ˆp(1− ˆp)<br />

ˆp−zα/2 , ˆp+zα/2 .<br />

n n<br />

Þessi nálgun byggir á því að<br />

ˆp−p<br />

ˆp(1− ˆp)/n ∼ N(0,1), þegar n → ∞<br />

45


f(p)=ap 2 +bp+c<br />

0.05<br />

0.04<br />

0.03<br />

0.02<br />

0.01<br />

0<br />

−0.01<br />

−0.02<br />

−0.03<br />

−0.04<br />

−0.05<br />

0 0.1 0.2 0.3 0.4 0.5<br />

p<br />

0.6 0.7 0.8 0.9 1<br />

Mynd 13: Parabólan í ójöfnunni fyrirpþegarx = 14, n = 30, ogα = 0,05.<br />

og efner nægjanlega stórt þá er<br />

<br />

Pr<br />

−zα/2 ≤<br />

<br />

ˆp−p<br />

≤ zα/2 ≈ 1−α.<br />

ˆp(1− ˆp)/n<br />

Dæmi - framhald. Finnum 95% öryggisbil fyrirpítvíkostadreifingu þegar eins og áðurn =<br />

30 ogx = 14 en notum einfaldari jöfnurnar. Jöfnurnar fyrir neðri og efri mörk öryggisbilsins<br />

gefa<br />

(0,2881,0,6452).<br />

Athugasemd. Ef við drögum aftur og aftur (með aðstoð tölvu) frá tvíkostadreifingu með stika<br />

p = 0,6 og n = 10 og reiknum bæði öryggisbilin, kemur í ljós að fyrra öryggisbilið hefur<br />

í raun 98% öryggisstig en seinna öryggisbilið hefur í raun 90% öryggisstig. Við mundum<br />

kjósa að öryggisstigið væri að minnsta kosti 95%. Fyrra öryggisbilið gefur betri raun hvað<br />

öryggisstigið varðar. Seinna öryggisbilið gefur oft of lágt öryggisstig þegar n er minna en<br />

50 ogper nærri 0 eða 1.<br />

Ef við viljum 100(1−α)% öryggisbil fyrir p sem er þannig að breidd öryggisbilsins sé<br />

46


jöfn eða minni en w, þá þarf n að vera<br />

n ≥<br />

2z 2 α/2 ˆp(1− ˆp)−z2 α/2 w2 +<br />

<br />

4z 4 α/2 ˆp(1− ˆp){ˆp(1− ˆp)−w2 }+w 2 z 4 α/2<br />

w 2<br />

Efw er mjög lítið þá má nálga ójöfnuna fyrirnmeð<br />

n ≥ 4z2 α/2ˆp(1− ˆp)<br />

w2 .<br />

Ef við viljum vera viss um að n sé örugglega þannig að öryggisbilið sé ekki breiðara en w<br />

þá látum við ˆp(1− ˆp) = 0,25 sem er stærsta gildið sem ˆp(1− ˆp) getur tekið og notum<br />

n ≥ z2 α/2<br />

.<br />

w2 Dæmi. Viljum að 95% öryggisbil fyrir p sé þannig að breidd þess sé örugglega ekki meiri<br />

en 0,01. Þá þarfnað vera<br />

n ≥ z2 α/2<br />

w<br />

1,962<br />

= = 38416.<br />

2 0,012 47<br />

.


4.5 Öryggisbil fyrir nokkur valin tilfelli<br />

Tilfelli 1<br />

100(1−α)% öryggisbil fyrirµínormaldreifingu.<br />

X1,...,Xn ∼ N(µ,σ 2 ), slembiúrtak.<br />

Fengin gildiX1 = x1,...,Xn = xn.<br />

¯x = 1<br />

<br />

n<br />

<br />

<br />

xi, s = <br />

n<br />

1<br />

n−1<br />

i=1<br />

i)100(1−α)% öryggisbil fyrirµ, σ 2 þekkt.<br />

σ<br />

¯x±zα/2 √<br />

n<br />

ii)100(1−α)% öryggisbil fyrirµ,σ 2 óþekkt.<br />

Tilfelli 2<br />

¯x±tα/2,n−1<br />

s<br />

√<br />

n<br />

100(1−α)% öryggisbil fyrirσ 2 ogσ í normaldreifingu.<br />

X1,...,Xn ∼ N(µ,σ 2 ), slembiúrtak.<br />

Fengin gildiX1 = x1,...,Xn = xn.<br />

¯x = 1<br />

n<br />

n<br />

i=1<br />

xi, s 2 = 1<br />

n−1<br />

i)100(1−α)% öryggisbil fyrirσ2 .<br />

<br />

(n−1)s 2<br />

χ2 ,<br />

α/2,n−1<br />

(n−1)s2<br />

χ2 <br />

1−α/2,n−1<br />

ii)100(1−α)% öryggisbil fyrirσ.<br />

<br />

(n−1)s 2<br />

χ2 <br />

,<br />

α/2,n−1<br />

(n−1)s 2<br />

χ2 <br />

1−α/2,n−1<br />

48<br />

n<br />

(xi − ¯x) 2<br />

i=1<br />

n<br />

(xi − ¯x) 2<br />

i=1


Tilfelli 3<br />

100(1−α)% öryggisbil fyrirpítvíkostadreifingu.<br />

X ∼ Bin(n,p), slembistærð.<br />

Fengið gildiX = x.<br />

i)100(1−α)% öryggisbil fyrirp, nálgun I.<br />

<br />

ˆp+ z2 α/2<br />

2n<br />

<br />

1+ z2 α/2<br />

n<br />

ˆp = x<br />

n<br />

ˆp(1−ˆp)<br />

± zα/2 n + z2 α/2<br />

4n2 <br />

1+ z2 <br />

α/2<br />

n<br />

ii)100(1−α)% öryggisbil fyrirp, nálgun II.<br />

<br />

ˆp(1− ˆp)<br />

ˆp±zα/2<br />

n<br />

Tilfelli 4<br />

100(1−α)% öryggisbil fyrirµ1 −µ2, µ1 og µ2 í normaldreifingum.<br />

X1,...,Xn ∼ N(µ1,σ2 1 ), slembiúrtak.<br />

Y1,...,Ym ∼ N(µ2,σ2 2 ), slembiúrtak, óháð X-unum.<br />

Fengin gildiX1 = x1,...,Xn = xn og Y1 = y1,...,Ym = ym.<br />

¯x = 1<br />

n<br />

xi, s<br />

n<br />

2 n 1<br />

1 = (xi − ¯x)<br />

n−1<br />

2 , ¯y = 1<br />

m<br />

m<br />

i=1<br />

s 2 p = (n−1)s2 1 +(m−1)s 2 2<br />

n+m−2<br />

i=1<br />

i=1<br />

yi, s 2 2<br />

= 1<br />

m−1<br />

m<br />

(yi − ¯y) 2<br />

, υ = (s21/n+s 2 2/m) 2<br />

<br />

(s2 1 /n) 2<br />

n−1 + (s2 2 /m)2<br />

, (υ er lækkað niður í næstu heiltölu)<br />

m−1<br />

i)100(1−α)% öryggisbil fyrirµ1 −µ2, σ2 1 og σ2 2 þekkt.<br />

<br />

2 σ1 (¯x− ¯y)±zα/2<br />

n + σ2 2<br />

m<br />

ii)100(1−α)% öryggisbil fyrirµ1 −µ2, σ2 1 og σ2 2 óþekkt,σ2 1 = σ2 2.<br />

<br />

1 1<br />

(¯x− ¯y)±tα/2,n+m−2sp +<br />

n m<br />

iii)100(1−α)% öryggisbil fyrirµ1 −µ2,σ 2 1 ogσ2 2 óþekkt,σ2 1 = σ2 2 .<br />

<br />

2 s1 (¯x− ¯y)±tα/2,υ<br />

n + s22 m<br />

49<br />

i=1


Tilfelli 5<br />

100(1−α)% öryggisbil fyrirσ 2 1/σ 2 2, σ 2 1 og σ 2 2 í normaldreifingum.<br />

X1,...,Xn ∼ N(µ1,σ2 1 ), slembiúrtak.<br />

Y1,...,Ym ∼ N(µ2,σ2 2 ), slembiúrtak, óháð X-unum.<br />

Fengin gildiX1 = x1,...,Xn = xn og Y1 = y1,...,Ym = ym.<br />

¯x = 1<br />

n<br />

¯y = 1<br />

m<br />

n<br />

i=1<br />

m<br />

i=1<br />

i)100(1−α)% öryggisbil fyrirσ 2 1/σ 2 2.<br />

Tilfelli 6<br />

<br />

xi, s 2 1 = 1<br />

n−1<br />

yi, s 2 2<br />

s 2 1 /s2 2<br />

Fα/2,n−1,m−1<br />

,<br />

= 1<br />

m−1<br />

s 2 1 /s2 2<br />

n<br />

(xi − ¯x) 2<br />

i=1<br />

m<br />

(yi − ¯y) 2<br />

i=1<br />

F1−α/2,n−1,m−1<br />

100(1−α)% öryggisbil fyrirµw = µ1 −µ2, paraðar mælingar.<br />

(X1,Y1),...,(Xn,Yn) eru n óháð pör, en Xi og Yi, i = 1,...,n, geta verið innbyrðis háð.<br />

Hvert par (Xi,Yi), i = 1,...,n, er yfirleitt tvær mælingar á sama hlut eða einstaklingi.<br />

Wi = Xi −Yi, E(Xi) = µ1, E(Yi) = µ2, E(Wi) = µw = µ1 −µ2,i = 1,...,n.<br />

W1,...,Wn ∼ N(µw,σ2 w ), óháðar.<br />

Fengin gildi (X1,Y1) = (x1,y1),...,(Xn,Yn) = (xn,yn), W1 = w1 = x1 − y1,...,Wn =<br />

wn = xn −yn.<br />

¯w = 1<br />

n<br />

<br />

n<br />

<br />

<br />

wi, sw = 1<br />

n−1<br />

i=1<br />

i)100(1−α)% öryggisbil fyrirµw.<br />

¯w ±tα/2,n−1 √<br />

n<br />

50<br />

sw<br />

<br />

n<br />

(wi − ¯w) 2<br />

i=1


Tilfelli 7<br />

100(1−α)% öryggisbil fyrirp1 −p2, p1 og p2 í tvíkostadreifingum.<br />

X ∼ Bin(n1,p1), Y ∼ Bin(n2,p2), slembistærðir.<br />

Fengin gildiX = x ogY = y.<br />

ˆp1 = x<br />

, ˆp2 = y<br />

n1<br />

i)100(1−α)% öryggisbil fyrirp1 −p2, nálgun: min(n1p1(1−p1),n2p2(1−p2)) ≥ 10.<br />

Tilfelli 8<br />

ˆp1 − ˆp2 ±zα/2<br />

<br />

ˆp1(1− ˆp1)<br />

n1<br />

n2<br />

+ ˆp2(1− ˆp2)<br />

n2<br />

100(1−α)% öryggisbil fyrirθ = 1/λ, meðalgildi veldisdreifingar.<br />

X1,...,Xn ∼ Expon(λ), slembiúrtak.<br />

E(Xi) = θ, i = 1,...,n.<br />

Fengin gildiX1 = x1,...,Xn = xn.<br />

i)100(1−α)% öryggisbil fyrirθ.<br />

<br />

¯x = 1<br />

n<br />

2n¯x<br />

χ 2 α/2,2n<br />

,<br />

n<br />

i=1<br />

xi<br />

2n¯x<br />

χ 2 1−α/2,2n<br />

51


5 Tilgátupróf<br />

5.1 Almennt um tilgátupróf<br />

SKILGREINING. Núlltilgáta, táknuð með H0, er staðhæfing um stika þýðis sem „eðlilegt“<br />

er að halda fram í upphafi. Gagntilgáta, táknuð meðH1, staðhæfir öfugt viðH0. Við höfnum<br />

H0 ef gögnin benda sterklega til þess að H0 sé röng. Við höfnum ekki H0 ef gögnin benda<br />

ekki nægjanlega sterkt til þess að H0 sé röng.<br />

Dæmi. Meðallíftími ákveðinnar tegundar af rafhlöðum er 325 klukkustundir. Hönn-unin á<br />

rafhlöðunum er endurbætt og spurningin er hvort meðallíftíminn hafi lengst. Núlltilgátan og<br />

gagntilgátan eru hér<br />

Ritum einnig<br />

H0 : µ ≤ 325 á móti H1 : µ > 325.<br />

H0 : µ = 325 á móti H1 : µ > 325.<br />

Tilgátupróf samanstanda af prófstærð og höfnunarsvæði.<br />

SKILGREINING. Prófstærð (e. test statistic) er fall af úrtakinu. Ákvörðin um að hafna H0<br />

eða ekki er byggð á prófstærðinni.<br />

SKILGREINING. Höfnunarsvæði (e. critical region) er svæði sem inniheldur öll gildi á<br />

prófstærðinni sem leiða til höfnunar á H0, það er, H0 er hafnað ef prófstærðin er innan<br />

höfnunarsvæðisins.<br />

Hægt er gera að tvennskonar villur við tilgátupróf.<br />

SKILGREINING. Mistök af gerð I (e. type I error) eiga sér stað þegar H0 er hafnað þegar<br />

H0 er í raun sönn.<br />

SKILGREINING. Mistök af gerð II (e. type II error) eiga sér stað þegar H0 er ekki hafnað<br />

þegarH0 er í raun röng.<br />

Tafla 4 sýnir hvenær mistök af gerð I og II eiga sér stað og hvenær rétt ákvörðun er tekin.<br />

52


Látum<br />

Tafla 4: Mistök af gerð I og II.<br />

H0 sönn H0 röng<br />

Höfnum ekkiH0 rétt ákvörðun Mistök af gerð II<br />

HöfnumH0 Mistök af gerð I rétt ákvörðun<br />

Dæmi. Normaldreifð gögn. n = 14,σ = 4.<br />

Prófstærð: ¯ X.<br />

α = Pr(mistök af gerð I),<br />

β = Pr(mistök af gerð II).<br />

H0 : µ = 50 á móti H1 : µ > 50.<br />

Höfnunarsvæði: Ákveðum að hafnaH0 ef ¯ X > 51,75.<br />

Talan51,75 er valin sem hugsanlega skynsamlegur skurðpunktur. Athugum hvaða áhrif þetta<br />

val hefur á mistök af gerð I og II, það er, áαog β.<br />

EfH0 er sönn þá erµ = 50.<br />

α = Pr(mistök af gerð I)<br />

= Pr(höfnumH0 þegarH0 er í raun sönn)<br />

= Pr( ¯ X > 51,75|µ = 50)<br />

<br />

¯X −µ<br />

= Pr<br />

σ/ √ 51,75−µ<br />

><br />

n σ/ √ <br />

<br />

<br />

n µ = 50<br />

<br />

= Pr Z > 51,75−50<br />

4/ √ <br />

14<br />

= 1−Pr(Z ≤ 1,64) = 1−Φ(1,64)<br />

= 1−0,9495 = 0,0505.<br />

53


β er ekki ein tala heldur fall afµíH1. Segjum að H0 sé röng, t.d. µ = 51.<br />

Ef til dæmisµ = 53 fæst<br />

β(µ = 51) = Pr(mistök af gerð II þegarµ = 51)<br />

1<br />

0.9<br />

0.8<br />

0.7<br />

0.6<br />

0.5<br />

β(µ) 1−α<br />

0.4<br />

0.3<br />

0.2<br />

0.1<br />

= Pr(höfnum ekki H0 þegar í raun erµ = 51)<br />

= Pr( ¯ X ≤ 51,75|µ = 51)<br />

<br />

¯X −µ<br />

= Pr<br />

σ/ √ 51,75−µ<br />

≤<br />

n σ/ √ <br />

<br />

<br />

n µ = 51<br />

<br />

= Pr Z ≤ 51,75−51<br />

4/ √ <br />

14<br />

= Pr(Z ≤ 0,70)<br />

= Φ(0,70)<br />

= 0,7580.<br />

µ 0 =50<br />

µ=51<br />

µ=53<br />

0<br />

49 50 51 52<br />

µ<br />

53 54 55<br />

Mynd 14: Líkurnar á því að gera mistök af gerð II sem fall af µ.<br />

54


β(µ = 53) = Pr Z ≤ 51,75−53<br />

4/ √ <br />

= 0,1210.<br />

14<br />

Á mynd 14 sést hvernigβ minnkar eftir því semµfærist fjærµ0 = 50.<br />

Sambandið á milliα,β ogner eftirfarandi<br />

n fast α ↑ ⇒ β ↓ eða α ↓ ⇒ β ↑<br />

α fast n ↑ ⇒ β ↓<br />

Vanalega er α valið fyrst. Algengt val á α er 0,01, 0,05 og 0,10. Ef við viljum litlar líkur á<br />

mistökum af gerð I þá veljum við enn smærra α. Ef hægt er, þá er n valið þannig að β fyrir<br />

ákveðiðµíH1 fari niður fyrir valið gildi. Stærðirnarα, β og (1−β) hafa eftirfarandi heiti.<br />

5.2 P -gildi<br />

α = marktektarkrafa (e. significance level)<br />

β = fastheldnisfall (e. operating characteristic function)<br />

1−β = höfnunarfall (e. power function)<br />

SKILGREINING. Látum T tákna slembistærð sem hefur sömu dreifingu og prófstærðin<br />

þegarH0 er sönn ogter gildið á prófstærðinni fyrir gefna tilraun, þá er P -gildið<br />

P -gildi = Pr(T ≥ t)<br />

ef höfnunarsvæði prófs er hægra megin við gefna rauntölu en<br />

P -gildi = Pr(T ≤ t)<br />

ef höfnunarsvæði prófs er vinstra megin við gefna rauntölu. Ef höfnunarsvæði prófs er ann-<br />

ars vegar vinstra megin við gefna rauntölur1 og hins vegar hægra megin við gefna rauntölu<br />

r2,(r1 < r2), þá erP -gildið<br />

P -gildi = 2min{Pr(T ≥ t), Pr(T ≤ t)}.<br />

55


f Z (z)<br />

0.45<br />

0.4<br />

0.35<br />

0.3<br />

0.25<br />

0.2<br />

0.15<br />

0.1<br />

0.05<br />

0<br />

z=1.39<br />

P−gildi=flatarmál<br />

=1−Φ(1.39)=0.0823<br />

−3 −2 −1 0<br />

z<br />

1 2 3<br />

Mynd 15: Flatarmálið undir dreifingu prófstærðarinnar þegar H0 er sönn svarar til P -<br />

gildisins.<br />

Með öðrum orðum má segja að þegar til dæmis höfnunarsvæði prófs er hægra megin við<br />

gefna rauntölu þá erP -gildið líkurnar á því að fá prófstærð sem er jöfn eða stærri en útreikn-<br />

uð prófstærð að því gefnu að H0 sé sönn. Athugið að P -gildið er ekki líkurnar á því að H0<br />

sé sönn.<br />

Við getum notað P -gildi til að ákveða hvort við höfnumH0 eða ekki:<br />

P -gildi < α ⇒ höfnumH0 fyrir gefið α<br />

P -gildi ≥ α ⇒ höfnum ekkiH0 fyrir gefið α<br />

Prófum H0 : µ = µ0 á móti H1 : µ > µ0, fyrir µ í normaldreifingu þegar σ er þekkt, (sjá<br />

nánar í næsta kafla). Segjum að gildið á prófstærðinni séz, þá er<br />

EfH1 : µ < µ0, þá er<br />

P -gildi = Pr(Z ≥ z) = 1−Φ(z).<br />

P -gildi = Pr(Z ≤ z) = Φ(z).<br />

56


EfH1 : µ = µ0, þá er<br />

P -gildi = 2min{Pr(Z ≥ z), Pr(Z ≤ z)} = 2{1−Φ(|z|)}.<br />

Mynd 15 sýnir flatarmálið undir stöðluðu normaldreifingunni sem svarar til P -gildis þegar<br />

gildið á prófstærðinni er z = 1,39 og gagntilgátan er H1 : µ > µ0.<br />

5.3 Tilgátupróf fyrir meðalgildi í normaldreifingu, þekkt σ<br />

Dæmi. Þykkt 50 glerja í gleraugu eru mæld. Meðaltal úrtaksins er ¯x = 3,05 mm og staðal-<br />

frávikið er þekkt,σ = 0,34 mm. Glerin eiga að hafa meðalþykktµ = 3,20 mm. Gefa gögnin<br />

til kynna að µ = 3,20 mm eða gefa þau til kynna að µ = 3,20 mm. Notumα = 0,05.<br />

Prófstærðin í prófi fyrirµínormaldreifingu þegarσ er þekkt er<br />

Z = ¯ X −µ0<br />

σ/ √ n .<br />

Z fylgir staðlaðri normaldreifingu efH0 er sönn,H0 : µ = µ0.<br />

Veljumα = Pr(mistök af gerð I).<br />

Tafla 5 sýnir próf fyrirµfyrir þrjár mismunandi gagntilgátur. Í töflu 5 er að finna gagntilgát-<br />

urnar, tilsvarandi höfnunarsvæði og P -gildi.<br />

57


Skref við tilgátupróf<br />

Tafla 5: Núlltilgáta: H0: µ = µ0, Prófstærð: z = (¯x−µ0)<br />

σ/ √ n<br />

Gagntilgátur Höfnunarsvæði P -gildi<br />

H1: µ > µ0 z > zα Pr(Z ≥ z) = 1−Φ(z)<br />

H1: µ < µ0 z < −zα Pr(Z ≤ z) = Φ(z)<br />

H1: µ = µ0 |z| > zα/2 2Pr(Z ≥ |z|) = 2{1−Φ(|z|)}<br />

1. Ákveða hvaða stika á að prófa.<br />

2. Ákveða núlltilgátuna.<br />

3. Ákveða gagntilgátuna.<br />

4. Finna jöfnu fyrir prófstærðina.<br />

5. Finna höfnunarsvæðið fyrir gefna marktektarkröfuα.<br />

6. Reikna gildið á prófstærðinni.<br />

7. Ákveða hvort við höfnumH0 eða ekki og lýsa ákvörðuninni í orðum.<br />

Dæmi - þykkt glerja - framhald. Tökum þessi 7 skref.<br />

1. Stikinn sem á að prófa: µ = meðalþykkt glerja<br />

2. Núlltilgátan: H0 : µ = 3,20 (= µ0)<br />

3. Gagntilgátan: H1 : µ = 3,20<br />

4. Prófstærðin:<br />

z = (¯x−µ0)<br />

σ/ √ n<br />

5. Höfnunarsvæðið,α = 0,05. HöfnumH0 ef:<br />

= (¯x−3,20)<br />

0,34/ √ 50<br />

|z| > zα/2 = z0,05/2 = z0,025 = 1,96<br />

58


6. Gildið á prófstærðinni er:<br />

7. Ákvörðun<br />

z = (3,05−3,20)<br />

0,34/ √ 50<br />

= −3,12<br />

|z| = |−3,12| = 3,12 > 1,96<br />

P -gildi = 2{1−Φ(|z|)} = 2{1−Φ(|3,12|)} = 0,0018<br />

⇒ höfnumH0 viðα = 0,05<br />

⇒ gögnin gefa til kynna að meðalþykkt glerjanna sé ekki3,20 mm.<br />

5.4 Jöfnur fyrir β og val án<br />

Hér skoðum við einungis jöfnur fyrirβ og val ánþegar verið er að prófaµínormaldreifingu<br />

og σ er þekkt. Skoðum fyrst tilfellið þegar núlltilgátan og gagntilgátan eru<br />

H0 : µ = µ0 á móti H1 : µ > µ0<br />

og höfnunarsvæðið er z > zα. Hér er µ hið sanna gildi á meðalgildi normaldreifingar-innar<br />

og µ0 er gildið á µ í tilgátunum. Látum µ1 vera eitthvað hugsanlegt gildi á µ í H1, það er,<br />

µ1 > µ0. Þegarµ = µ1 þá eru líkurnar á mistökum af gerð II gefnar með<br />

β(µ1) = Pr(mistök af gerð II|µ = µ1)<br />

= Pr(höfnum ekkiH0 þegar í raun erµ = µ1 > µ0)<br />

<br />

¯X −µ0<br />

= Pr<br />

σ/ √ <br />

<br />

≤ zα<br />

<br />

n µ = µ1<br />

= Pr( ¯ X ≤ µ0 +zασ/ √ n|µ = µ1)<br />

<br />

¯X −µ1<br />

= Pr<br />

σ/ √ n ≤ µ0 −µ1<br />

σ/ √ n +zα<br />

<br />

<br />

<br />

µ = µ1<br />

<br />

= Pr Z ≤ µ0 −µ1<br />

σ/ √ n +zα<br />

<br />

59


µ0 −µ1<br />

= Φ<br />

σ/ √ n +zα<br />

<br />

.<br />

Við viljum finna n þannig að fyrir valið µ1 ∈ H1 sé β(µ1) = β þar sem β er valið gildi.<br />

Leysum fyrirn.<br />

<br />

µ0 −µ1<br />

β = Φ<br />

σ/ √ n +zα<br />

<br />

= Φ(−zβ) = Φ(z1−β)<br />

z1−β = −zβ = µ0 −µ1<br />

σ/ √ n +zα<br />

n = (zα +zβ) 2σ2 .<br />

(µ1 −µ0) 2<br />

Tafla 6 sýnir formúlur fyrirβ(µ1) fyrir mismunandi gagntilgátur.<br />

Tafla 6: Formúlur fyrirβ(µ1), mistök af gerð II<br />

Gagntilgátur β(µ1) fyrirµ1 ∈ H1<br />

<br />

µ0−µ1 H1: µ > µ0 Φ σ/ √ n +zα<br />

<br />

<br />

µ0−µ1<br />

H1: µ < µ0 1−Φ σ/ √ n −zα<br />

<br />

<br />

H1: µ = µ0 Φ −Φ<br />

µ0−µ1<br />

σ/ √ n +zα/2<br />

Tafla 7 sýnir formúlur fyrirnfyrir mismunandi gagntilgátur.<br />

Tafla 7: Formúlur fyrirn<br />

Gagntilgátur n fyrirµ1 ∈ H1<br />

H1: µ > µ0<br />

H1: µ < µ0<br />

H1: µ = µ0<br />

(zα+zβ) 2 σ 2<br />

(µ1−µ0) 2<br />

(zα+zβ) 2 σ 2<br />

(µ1−µ0) 2<br />

(z α/2+zβ) 2 σ 2<br />

(µ1−µ0) 2<br />

60<br />

<br />

µ0−µ1<br />

σ/ √ n −zα/2


Dæmi - þykkt glerja - framhald. Höfum α = 0,05, H1 : µ = 3,20, zα/2 = z0,025 = 1,96.<br />

Þegarn = 50 ogµíraun3,15, þá eru líkurnar á mistökum af gerð II<br />

<br />

3,20−3,15<br />

β(µ1 = 3,15) = Φ<br />

0,34/ √ 50 +1,96<br />

<br />

3,20−3,15<br />

−Φ<br />

0,34/ √ 50 −1,96<br />

<br />

= Φ(3,00)−Φ(−0,92) = 0,9987−0,1788 = 0,8199.<br />

Segjum að við viljum aðβ(µ1 = 3,15) ≤ 0,10. Því erzβ = z0,10 = 1,2816 ognþarf að vera<br />

n = (1,96+1,2816)2 0,34 2<br />

(3,15−3,20) 2<br />

= 485,89.<br />

Veljum n = 486 en þá er β(µ1 = 3,15) = 0,0999 < 0,10. Mynd 16 sýnir fallið β(µ1) fyrir<br />

glerjadæmið þegarn = 50 og n = 486.<br />

β(µ)<br />

1<br />

0.9<br />

0.8<br />

0.7<br />

0.6<br />

0.5<br />

0.4<br />

0.3<br />

0.2<br />

0.1<br />

1−α<br />

µ 1 =3.15<br />

β<br />

n=50<br />

n=486<br />

µ 0 =3.20<br />

0<br />

3.1 3.12 3.14 3.16 3.18 3.2<br />

µ [mm]<br />

3.22 3.24 3.26 3.28<br />

Mynd 16: Líkurnar á því því að gera mistök af gerð II sem fall afµídæminu um meðalþykkt<br />

glerja þegarn = 50 ogn = 486.<br />

61


5.5 Tilgátupróf fyrir nokkur valin tilfelli<br />

Tilfelli 1<br />

Próf fyrirµínormaldreifingu.<br />

X1,...,Xn ∼ N(µ,σ 2 ), slembiúrtak.<br />

Fengin gildiX1 = x1,...,Xn = xn.<br />

¯x = 1<br />

<br />

n<br />

<br />

<br />

xi, s = <br />

n<br />

1<br />

n−1<br />

i) Próf fyrirµ, σ 2 þekkt.<br />

ii) Próf fyrirµ,σ 2 óþekkt.<br />

i=1<br />

n<br />

(xi − ¯x) 2<br />

i=1<br />

Z ∼ N(0,1), Tn−1 ∼ tn−1<br />

Tafla 8: Núlltilgáta: H0: µ = µ0, Prófstærð: z = (¯x−µ0)<br />

σ/ √ n<br />

Gagntilgátur Höfnunarsvæði P -gildi<br />

H1: µ > µ0 z > zα Pr(Z ≥ z) = 1−Φ(z)<br />

H1: µ < µ0 z < −zα Pr(Z ≤ z) = Φ(z)<br />

H1: µ = µ0 |z| > zα/2 2Pr(Z ≥ |z|) = 2{1−Φ(|z|)}<br />

Tafla 9: Núlltilgáta: H0: µ = µ0, Prófstærð: t = (¯x−µ0)<br />

s/ √ n<br />

Gagntilgátur Höfnunarsvæði P -gildi<br />

H1: µ > µ0 t > tα,n−1 Pr(Tn−1 ≥ t)<br />

H1: µ < µ0 t < −tα,n−1 Pr(Tn−1 ≤ t)<br />

H1: µ = µ0 |t| > tα/2,n−1 2Pr(Tn−1 ≥ |t|)<br />

62


Tilfelli 2<br />

Próf fyrirσ 2 í normaldreifingu.<br />

X1,...,Xn ∼ N(µ,σ 2 ), slembiúrtak.<br />

Fengin gildiX1 = x1,...,Xn = xn.<br />

i) Próf fyrirσ 2 .<br />

¯x = 1<br />

n<br />

n<br />

i=1<br />

xi, s 2 = 1<br />

n−1<br />

X 2 n−1 ∼ χ2 n−1<br />

n<br />

(xi − ¯x) 2<br />

Tafla 10: Núlltilgáta: H0: σ 2 = σ 2 0 , Prófstærð: w2 = (n−1)s2<br />

σ 2 0<br />

Gagntilgátur Höfnunarsvæði P -gildi<br />

i=1<br />

H1: σ 2 > σ 2 0 w 2 > χ 2 α,n−1 Pr(X 2 n−1 ≥ w 2 )<br />

H1: σ 2 < σ 2 0 w2 < χ 2 1−α,n−1 Pr(X 2 n−1 ≤ w2 )<br />

H1: σ 2 = σ 2 0 w2 > χ 2 α/2,n−1 2min{Pr(X 2 n−1 ≥ w2 ), Pr(X 2 n−1 ≤ w2 )}<br />

eðaw 2 < χ 2 1−α/2,n−1<br />

63


Tilfelli 3<br />

Próf fyrirpítvíkostadreifingu.<br />

X ∼ Bin(n,p), slembistærð.<br />

Fengið gildiX = x.<br />

i) Próf fyrirp, nálgun,np0 ≥ 20.<br />

ˆp = x<br />

n<br />

Z ∼ N(0,1)<br />

Tafla 11: Núlltilgáta: H0: p = p0, Prófstærð: z = (x−np0) √<br />

np0(1−p0) =<br />

Gagntilgátur Höfnunarsvæði P -gildi<br />

H1: p > p0 z > zα Pr(Z ≥ z) = 1−Φ(z)<br />

H1: p < p0 z < −zα Pr(Z ≤ z) = Φ(z)<br />

H1: p = p0 |z| > zα/2 2Pr(Z ≥ |z|) = 2{1−Φ(|z|)}<br />

ii) Nákvæmt próf fyrirp, sjá bls. 323-326 í Ross.<br />

64<br />

(ˆp−p0) √<br />

p0(1−p0)/n


Tilfelli 4<br />

Próf fyrirµ1 −µ2,µ1 og µ2 í normaldreifingum.<br />

X1,...,Xn ∼ N(µ1,σ2 1 ), slembiúrtak.<br />

Y1,...,Ym ∼ N(µ2,σ2 2 ), slembiúrtak, óháð X-unum.<br />

Fengin gildiX1 = x1,...,Xn = xn og Y1 = y1,...,Ym = ym.<br />

¯x = 1<br />

n<br />

¯y = 1<br />

m<br />

n<br />

i=1<br />

m<br />

i=1<br />

xi, s 2 1 = 1<br />

n−1<br />

yi, s 2 2<br />

= 1<br />

m−1<br />

n<br />

(xi − ¯x) 2<br />

i=1<br />

m<br />

(yi − ¯y) 2<br />

i=1<br />

s 2 p = (n−1)s2 1 +(m−1)s 2 2<br />

n+m−2<br />

υ = (s21 /n+s2 2 /m)2<br />

<br />

(s2 1 /n) 2<br />

n−1 + (s2 2 /m)2<br />

, (υ er lækkað niður í næstu heiltölu)<br />

m−1<br />

i) Próf fyrirµ1 −µ2, σ 2 1 og σ2 2 þekkt.<br />

Z ∼ N(0,1), Tn+m−2 ∼ tn+m−2, Tυ ∼ tυ<br />

Tafla 12: Núlltilgáta: H0: µ1 −µ2 = δ0, Prófstærð: z = (¯x−¯y−δ0) √<br />

σ2 1 /n+σ2 2 /m<br />

Gagntilgátur Höfnunarsvæði P -gildi<br />

H1: µ1 −µ2 > δ0 z > zα Pr(Z ≥ z) = 1−Φ(z)<br />

H1: µ1 −µ2 < δ0 z < −zα Pr(Z ≤ z) = Φ(z)<br />

H1: µ1 −µ2 = δ0 |z| > zα/2 2Pr(Z ≥ |z|) = 2{1−Φ(|z|)}<br />

65


ii) Próf fyrirµ1 −µ2, σ 2 1 og σ2 2 óþekkt,σ2 1 = σ2 2 .<br />

√<br />

sp 1/n+1/m<br />

Tafla 13: Núlltilgáta: H0: µ1 −µ2 = δ0, Prófstærð: t = (¯x−¯y−δ0)<br />

Gagntilgátur Höfnunarsvæði P -gildi<br />

H1: µ1 −µ2 > δ0 t > tα,n+m−2 Pr(Tn+m−2 ≥ t)<br />

H1: µ1 −µ2 < δ0 t < −tα,n+m−2 Pr(Tn+m−2 ≤ t)<br />

H1: µ1 −µ2 = δ0 |t| > tα/2,n+m−2 2Pr(Tn+m−2 ≥ |t|)<br />

iii) Próf fyrirµ1 −µ2, σ 2 1 ogσ2 2 óþekkt,σ2 1 = σ2 2 .<br />

Tafla 14: Núlltilgáta: H0: µ1 −µ2 = δ0, Prófstærð: t = (¯x−¯y−δ0) √<br />

s2 1 /n+s2 2 /m<br />

Gagntilgátur Höfnunarsvæði P -gildi<br />

H1: µ1 −µ2 > δ0 t > tα,υ Pr(Tυ ≥ t)<br />

H1: µ1 −µ2 < δ0 t < −tα,υ Pr(Tυ ≤ t)<br />

H1: µ1 −µ2 = δ0 |t| > tα/2,υ 2Pr(Tυ ≥ |t|)<br />

66


Tilfelli 5<br />

Próf fyrirσ 2 1 ogσ 2 2 í normaldreifingum.<br />

X1,...,Xn ∼ N(µ1,σ2 1 ), slembiúrtak.<br />

Y1,...,Ym ∼ N(µ2,σ2 2 ), slembiúrtak, óháð X-unum.<br />

Fengin gildiX1 = x1,...,Xn = xn og Y1 = y1,...,Ym = ym.<br />

i) Próf fyrirσ 2 1 ogσ2 2 .<br />

¯x = 1<br />

n<br />

¯y = 1<br />

m<br />

n<br />

i=1<br />

m<br />

i=1<br />

xi, s 2 1 = 1<br />

n−1<br />

yi, s 2 2<br />

= 1<br />

m−1<br />

n<br />

(xi − ¯x) 2<br />

i=1<br />

Qn−1,m−1 ∼ Fn−1,m−1<br />

m<br />

(yi − ¯y) 2<br />

i=1<br />

Tafla 15: Núlltilgáta: H0: σ 2 1 = σ2 2 , Prófstærð: f = s2 1<br />

s 2 2<br />

Gagntilgátur Höfnunarsvæði P -gildi<br />

H1: σ 2 1 > σ2 2 f > Fα,n−1,m−1 Pr(Qn−1,m−1 ≥ f)<br />

H1: σ 2 1 < σ2 2 f < F1−α,n−1,m−1 Pr(Qn−1,m−1 ≤ f)<br />

H1: σ 2 1 = σ 2 2 f > Fα/2,n−1,m−1 2min{Pr(Qn−1,m−1 ≥ f), Pr(Qn−1,m−1 ≤ f)}<br />

eðaf < F1−α/2,n−1,m−1<br />

67


Tilfelli 6<br />

Próf fyrirµw = µ1 −µ2, paraðar mælingar.<br />

(X1,Y1),...,(Xn,Yn) eru n óháð pör, en Xi og Yi, i = 1,...,n, geta verið innbyrðis háð.<br />

Hvert par (Xi,Yi), i = 1,...,n, er yfirleitt tvær mælingar á sama hlut eða einstaklingi.<br />

Wi = Xi −Yi, E(Xi) = µ1, E(Yi) = µ2, E(Wi) = µw = µ1 −µ2,i = 1,...,n.<br />

W1,...,Wn ∼ N(µw,σ2 w ), óháðar.<br />

Fengin gildi (X1,Y1) = (x1,y1),...,(Xn,Yn) = (xn,yn), W1 = w1 = x1 − y1,...,Wn =<br />

wn = xn −yn.<br />

¯w = 1<br />

n<br />

i) Próf fyrirµw = µ1 −µ2.<br />

<br />

n<br />

<br />

<br />

wi, sw = 1<br />

n−1<br />

i=1<br />

Tn−1 ∼ tn−1<br />

n<br />

(wi − ¯w) 2<br />

Tafla 16: Núlltilgáta: H0: µw = ∆0, Prófstærð: t = (¯w−∆0)<br />

sw/ √ n<br />

i=1<br />

Gagntilgátur Höfnunarsvæði P -gildi<br />

H1: µw > ∆0 t > tα,n−1 Pr(Tn−1 ≥ t)<br />

H1: µw < ∆0 t < −tα,n−1 Pr(Tn−1 ≤ t)<br />

H1: µw = ∆0 |t| > tα/2,n−1 2Pr(Tn−1 ≥ |t|)<br />

68


Tilfelli 7<br />

Próf fyrirp1 −p2, p1 og p2 í tvíkostadreifingum.<br />

X ∼ Bin(n1,p1), Y ∼ Bin(n2,p2), slembistærðir.<br />

Fengin gildiX = x ogY = y.<br />

ˆp1 = x<br />

, ˆp2 = y<br />

, ˆp = x+y<br />

n1<br />

n2<br />

Z ∼ N(0,1)<br />

n1 +n2<br />

i) Próf fyrirp1 −p2, nálgun,min{n1p1(1−p1),n2p2(1−p2)} ≥ 10.<br />

Tafla 17: Núlltilgáta: H0: p1 = p2, Prófstærð: z =<br />

Gagntilgátur Höfnunarsvæði P -gildi<br />

H1: p1 > p2 z > zα Pr(Z ≥ z) = 1−Φ(z)<br />

H1: p1 < p2 z < −zα Pr(Z ≤ z) = Φ(z)<br />

(ˆp1−ˆp2) √<br />

ˆp(1−ˆp)(1/n1+1/n2)<br />

H1: p1 = p2 |z| > zα/2 2Pr(Z ≥ |z|) = 2{1−Φ(|z|)}<br />

ii) Nákvæmt próf fyrirp1 −p2, sjá bls. 327-329 í Ross.<br />

69


6 Línulegt aðhvarf<br />

Í þessum kafla er fjallað um línulegt aðhvarf (e. linear regression) en einungis verður skoðað<br />

einfalt línulegt líkan (e. simple linear model).<br />

6.1 Einfalt línulegt líkan<br />

Gerum ráð fyrir að lýsa megi slembibreytuY fyrir tilsvarandixmeð<br />

Y = α+βx+ǫ,<br />

þar semαogβ eru fastar, ogǫer slembistærð,ǫ ∼ N(0,σ 2 ). Breytanxer kölluð skýribreyta<br />

(e. predictor variable). Ef við höfum n slembistærðir Yi, i = 1,...,n, og fyrir hvert Yi er<br />

tilsvarandi gildi á skýribreytunnixi, i = 1,...,n, þá má rita<br />

Yi = α+βxi +ǫi, ǫi ∼ N(0,σ 2 ), i = 1,...,n,<br />

og ǫ-in eru innbyrðis óháð. Því gildir fyrir hverti = 1,...,n að<br />

og<br />

E(Yi) = E(α+βxi +ǫi) = α+βxi + E(ǫi) = α+βxi +0 = α+βxi,<br />

var(Yi) = var(α+βxi +ǫi) = var(ǫi) = σ 2 .<br />

Þar sem hvertYi er summa af fasta og normaldreifðri slembistærð þá gildir að<br />

Yi ∼ N(α+βxi,σ 2 ), i = 1,...,n,<br />

og þar semǫ-in eru innbyrðis óháð þá eru Y -in einnig innbyrðis óháð.<br />

6.2 Metlar fyrir stikana α, β og σ 2<br />

Segjum að við höfum mælingar (x1,y1), (x2,y2), ..., (xn,yn), á x og Y , og að við viljum<br />

finna línu, y = a+bx, í gegnum mælingarnar. Skilgreinum leif (e. residual)i-tu mælingar-<br />

innar sem<br />

ei = yi −a−bxi, i = 1,...,n.<br />

70


Línan er valin þannig að summa leifa í öðru veldi sé sem minnst. Þetta jafngildir því að finna<br />

a og b sem lágmarka fallið<br />

f(a,b) =<br />

n<br />

(yi −a−bxi) 2 =<br />

i=1<br />

Diffrumf(a,b) með tilliti tilaogb<br />

∂f(a,b)<br />

∂a =<br />

∂f(a,b)<br />

∂b<br />

=<br />

n<br />

i=1<br />

e 2 i .<br />

n<br />

(−2)(yi −a−bxi),<br />

i=1<br />

n<br />

(−2xi)(yi −a−bxi).<br />

i=1<br />

Setjum afleiðurnar ∂f(a,b)/∂a og∂f(a,b)/∂b jafnar núlli og leysum fyriraogb<br />

Endurritum jöfnurnar<br />

−2<br />

−2<br />

n<br />

(yi −a−bxi) = 0,<br />

i=1<br />

n<br />

xi(yi −a−bxi) = 0.<br />

i=1<br />

n<br />

yi = na+b<br />

i=1<br />

n<br />

xiyi = a<br />

i=1<br />

n<br />

i=1<br />

n<br />

xi,<br />

i=1<br />

xi +b<br />

n<br />

x 2 i.<br />

Látum ¯y = n<br />

i=1 yi/n og ¯x = n<br />

i=1 xi/n, þá má rita fyrri jöfnuna á forminu<br />

Setjum inn fyriraíseinni jöfnunni, þá fæst<br />

a = ¯y −b¯x.<br />

i=1<br />

n<br />

xiyi = (¯y −b¯x)n¯x+b<br />

i=1<br />

<br />

n<br />

b x 2 i −n¯x2<br />

<br />

=<br />

i=1<br />

b =<br />

n<br />

i=1<br />

n i=1xiyi −n¯x¯y<br />

n i=1x2i 71<br />

n<br />

x 2 i,<br />

i=1<br />

xiyi −n¯x¯y,<br />

−n¯x2 .


Hér verða eftirfarandi summur táknaðar með<br />

Þá má ritabmeð<br />

Sxy =<br />

n<br />

(xi − ¯x)(yi − ¯y) =<br />

i=1<br />

Sxx =<br />

Syy =<br />

n<br />

(xi − ¯x) 2 =<br />

i=1<br />

n<br />

(yi − ¯y) 2 =<br />

i=1<br />

b = Sxy<br />

.<br />

Sxx<br />

n<br />

i=1<br />

xiyi −n¯x¯y,<br />

n<br />

x 2 i −n¯x 2 ,<br />

i=1<br />

n<br />

y 2 i −n¯y2 .<br />

Hér eru a og b punktmatið á α og β. Látum A og B vera metla fyrir α og β, og ¯ Y =<br />

n −1 n<br />

i=1 Yi. Þá má ritaAogB<br />

B =<br />

n i=1xiYi −n¯x ¯ Y<br />

n i=1x2i −n¯x2 =<br />

i=1<br />

n<br />

A = ¯ Y −B¯x.<br />

i=1 (xi − ¯x)Yi<br />

n i=1 (xi<br />

,<br />

− ¯x) 2<br />

Þessi aðferð er kölluð aðferð minnstu kvaðrata (e. least squares method). Að því gefnu að<br />

Y -in fylgi normaldreifingu, þá eru A og B einnig sennileikametlarα ogβ. Línan<br />

y = a+bx<br />

er kölluð aðhvarfslína úrtaks (e. sample regression line).<br />

6.3 Dreifingar metlanna<br />

MetlarnirAog B eru línulegar samtektir afY1, ..., Yn. Til dæmis erB þannig að<br />

þar sem ci er<br />

ci =<br />

B =<br />

n<br />

i=1 (xi − ¯x)Yi<br />

n i=1 (xi − ¯x)<br />

2 =<br />

n<br />

ciYi,<br />

i=1<br />

(xi − ¯x)<br />

n<br />

i=1 (xi − ¯x) 2 = (Sxx) −1 (xi − ¯x), i = 1,...,n.<br />

72


Hvert ci er fasti, og hvert Yi fylgir normaldreifingu og Y -in eru innbyrðis óháð. Þar af<br />

leiðandi fylgirB normaldreifingu með meðalgildi<br />

<br />

n<br />

<br />

n n<br />

E(B) = E = ciE(Yi) = ci(α+βxi) =<br />

= (Sxx) −1<br />

og dreifni<br />

<br />

α<br />

i=1<br />

ciYi<br />

i=1<br />

n<br />

(xi − ¯x)+β<br />

i=1<br />

var(B) = var<br />

og við ritum<br />

n<br />

i=1<br />

ciYi<br />

<br />

i=1<br />

n<br />

<br />

(xi − ¯x)xi<br />

i=1<br />

=<br />

= σ 2 (Sxx) −2<br />

Á sama hátt má sýna að umAgildi<br />

og að A fylgi normaldreifingu<br />

= (Sxx) −1<br />

= (Sxx) −1 {βSxx} = β,<br />

n<br />

c 2 i var(Yi) =<br />

i=1<br />

n<br />

i=1<br />

n<br />

i=1<br />

n<br />

i=1<br />

(Sxx) −1 (xi − ¯x)(α+βxi)<br />

<br />

n<br />

α×0+β x 2 i −n¯x2<br />

<br />

c 2 i σ2 = σ 2<br />

n<br />

i=1<br />

(xi − ¯x) 2 = σ 2 (Sxx) −2 Sxx = σ2<br />

<br />

B ∼ N β, σ2<br />

<br />

.<br />

Sxx<br />

E(A) = α,<br />

var(A) = σ 2<br />

<br />

1 ¯x2<br />

+ ,<br />

n Sxx<br />

<br />

A ∼ N α,σ 2<br />

<br />

1 ¯x2<br />

+ .<br />

n Sxx<br />

Sxx<br />

i=1<br />

(Sxx) −2 (xi − ¯x) 2<br />

MetillinnAer því óbjagaður metill fyrirα, og metillinnB er óbjagaður metill fyrirβ.<br />

Summa leifanna í öðru veldi er kölluð fervikasumma. Fervikasumman sem fall af Y -<br />

unum,AogB er<br />

SSR =<br />

n<br />

(Yi −A−Bxi) 2<br />

i=1<br />

og er því slembistærð. Ef fervikasumman er fall af fengnumy-gildum og punktmatiaístað<br />

A og b í staðB, þá erSSR punktmat á einhverjum stika. Um slembistærðinaSSR gildir að<br />

SSR<br />

σ 2 ∼ χ2 n−2 .<br />

73<br />

,


Því eru meðalgildi og dreifniSSR/σ 2<br />

E<br />

<br />

SSR<br />

σ2 <br />

= n−2, var<br />

Þá má sýna að meðalgildi og dreifni SSR/(n−2) eru<br />

Þar af leiðandi er metillinn<br />

<br />

SSR<br />

σ2 <br />

= 2(n−2).<br />

<br />

SSR<br />

E = σ<br />

n−2<br />

2 <br />

SSR<br />

, var =<br />

n−2<br />

2σ4<br />

(n−2) .<br />

S 2 r = SSR<br />

(n−2)<br />

óbjagaður metill fyrirσ 2 . Einnig má sýna að metillinnS 2 r<br />

er óháður metlunumAogB (ekki<br />

sýnt hér). Þar semσ 2 er yfirleitt óþekkt þarf að metaσ 2 og því einnig dreifniAogB. Dreifni<br />

A má meta með S 2 A og dreifni B má meta með S2 B<br />

S 2 A = S 2 r<br />

þar sem<br />

<br />

1 ¯x2<br />

+ , S<br />

n Sxx<br />

2 B = S2 r<br />

.<br />

Sxx<br />

Punktmat áσ 2 , táknað meðs 2 r , fæst með því að nota jöfnuna fyrirS2 r<br />

í staðY -anna, það er,<br />

s 2 r<br />

= 1<br />

n−2<br />

n<br />

(yi −a−bxi) 2 .<br />

i=1<br />

6.4 Öryggisbil og tilgátupróf fyrir α ogβ<br />

með fengnumy-gildum<br />

Í ljósi þess aðAogB fylgja normaldreifingum og aðSSR/σ 2 fylgir kí-kvaðratsdreifingu og<br />

er óháð A og B, má sýna að<br />

(A−α)<br />

SA<br />

∼ tn−2,<br />

(B −β)<br />

SB<br />

∼ tn−2<br />

með hjálp setningarinnar um t-dreifinguna. Við notum þessar staðreyndir til að búa til ör-<br />

yggisbil fyrirαogβ. UmAogB gildir að<br />

<br />

Pr −tα ′ /2,n−2 < (A−α)<br />

< tα<br />

SA<br />

′ <br />

/2,n−2 = 1−α ′ ,<br />

<br />

Pr −tα ′ /2,n−2 <<br />

(B −β)<br />

SB<br />

74<br />

< tα ′ /2,n−2<br />

<br />

= 1−α ′ .


Því er100(1−α ′ )% öryggisbil fyrirαgefið með<br />

a±tα ′ /2,n−2sA,<br />

og 100(1−α ′ )% öryggisbil fyrirβ er gefið með<br />

b±tα ′ /2,n−2sB,<br />

þar semaogberu punktmat áαogβ ogs 2 A , ogs2 B<br />

eru punktmat á dreifni metlannaAogB<br />

sem fæst með því að notas 2 r í stað σ 2 , það er, s 2 A = s2 r(1/n+ ¯x 2 /Sxx) ogs 2 B = s2 r/Sxx.<br />

Ef við viljum gera tilgátupróf fyrir stikanaαogβ, þá notum við ofangreindar staðreyndir.<br />

Töflur 18 og 19 sýna þær jöfnur og ójöfnur sem þarf að nota við tilgátupróf fyrir α og β.<br />

LátumTn−2 tákna slembibreytu sem fylgirt-dreifingu með (n−2) frítölur.<br />

Tafla 18: Próf fyrirα. Núlltilgáta: H0: α = α0 Prófstærð: t = (a−α0)<br />

Gagntilgátur Höfnunarsvæði P -gildi<br />

H1: α > α0 t > tα ′ ,n−2 Pr(Tn−2 ≥ t)<br />

H1: α < α0 t < −tα ′ ,n−2 Pr(Tn−2 ≤ t)<br />

H1: α = α0 |t| > tα ′ /2,n−2 2Pr(Tn−2 ≥ |t|)<br />

Tafla 19: Próf fyrirβ. Núlltilgáta: H0: β = β0 Prófstærð: t = (b−β0)<br />

Gagntilgátur Höfnunarsvæði P -gildi<br />

H1: β > β0 t > tα ′ ,n−2 Pr(Tn−2 ≥ t)<br />

H1: β < β0 t < −tα ′ ,n−2 Pr(Tn−2 ≤ t)<br />

H1: β = β0 |t| > tα ′ /2,n−2 2Pr(Tn−2 ≥ |t|)<br />

75<br />

sA<br />

sB


6.5 Öryggisbil fyrir α+βx0<br />

Látum A + Bx0 vera metil fyrir α + βx0, það er, meðalgildi Y þegar skýribreytan tekur<br />

gildiðx0. Þá má sýna á sama máta og við sýndum fyrirB að<br />

og að A+Bx0 fylgi normaldreifingu<br />

Metillinn fyrir dreifniA+Bx0 er<br />

E(A+Bx0) = α+βx0,<br />

var(A+Bx0) = σ 2<br />

<br />

1<br />

n + (x0 − ¯x) 2<br />

Sxx<br />

<br />

A+Bx0 ∼ N α+βx0,σ 2<br />

<br />

1<br />

n + (x0 − ¯x) 2<br />

.<br />

Sxx<br />

S 2 A+Bx0 = S2 r<br />

Einnig má sýna á sama hátt og hér að ofan að<br />

<br />

1<br />

n + (x0 − ¯x) 2<br />

.<br />

Sxx<br />

(A+Bx0 −α−βx0)<br />

SA+Bx0<br />

∼ tn−2.<br />

Við notum þessa staðreynd til að mynda 100(1−α ′ )% öryggisbil fyrir α + βx0, en það er<br />

gefið með<br />

þar sem s 2 A+Bx0<br />

(a+bx0)±tα ′ /2,n−2sA+Bx0,<br />

er punktmat á dreifniA+Bx0.<br />

6.6 Spábil fyrir nýttY þegar skýribreytan tekur gildið x0<br />

Ef við eigum að spá fyrir um gildið á nýju Y -i þegar skýribreytan tekur gildið x0 þá er<br />

meðalgildi Y , E(Y) = α + βx0, gott spágildi fyrir Y . Þar sem α og β eru óþekkt, þá er<br />

eðlilegt að meta spágildið með A+Bx0.<br />

Við viljum segja til um á hvaða bili nýttY er líklegast til að falla. Dreifing Y er<br />

Y ∼ N(α+βx0,σ 2 )<br />

76


og ef við þekktum α, β og σ 2 þá gætum við sagt að 95% af nýjum Y -um muni falla innan<br />

bilsins<br />

(α+βx0)±1,96σ.<br />

Þar semα,β og σ 2 eru óþekkt þá verðum við að taka óvissuna í matinu á þessu stikum með<br />

í reikninginn. Við gerum það með því að finna dreifingu Y −A−Bx0. Dreifing A+Bx0<br />

er eins og hér að ofan. Þar semY er óháðY1, ...,Yn sem voru notuð til að reiknaAogB, þá<br />

erY óháðAog B. Því er dreifing Y −A−Bx0<br />

<br />

Y −A−Bx0 ∼ N 0,σ 2<br />

<br />

1+ 1<br />

n + (x0 − ¯x) 2<br />

.<br />

Sxx<br />

Metill fyrir dreifniY −A−Bx0 er á forminu<br />

S 2 r<br />

<br />

1+ 1<br />

n + (x0 − ¯x) 2<br />

= S<br />

Sxx<br />

2 r +S 2 A+Bx0 .<br />

Á sama máta og við sýndum að breytur hér að ofan fylgi t-dreifingu með (n − 2) frítölum<br />

má sýna að<br />

Sr<br />

Y −A−Bx0<br />

<br />

1+ 1 (x0−¯x) 2<br />

+ n Sxx<br />

= Y −A−Bx0<br />

<br />

S 2 r +S 2 A+Bx0<br />

∼ tn−2.<br />

Við notum staðreyndirnar hér að ofan til að mynda 100(1−α ′ )% spábil fyrir nýtt Y þegar<br />

skýribreytan tekur gildiðx0 en það er gefið með<br />

<br />

eða<br />

(a+bx0)±tα ′ /2,n−2sr<br />

(a+bx0)±tα ′ /2,n−2<br />

1+ 1<br />

n + (x0 − ¯x) 2<br />

Sxx<br />

<br />

s 2 r +s2 A+Bx0 .<br />

6.7 Fylgnistuðull úrtaks og skýringarhlutfall<br />

Fylgnistuðull úrtaks metur styrk og stefnu línulegar fylgni á milli x og Y . Ef við höfum<br />

mælingar(x1,y1), ..., (xn,yn) þá er fylgnistuðull úrtaks,r, gefinn með<br />

r =<br />

n i=1 (xi − ¯x)(yi − ¯y)<br />

n i=1 (xi − ¯x) 2n i=1 (yi − ¯y)<br />

77<br />

2 =<br />

Sxy<br />

.<br />

SxxSyy


Umr gildir eftirfarandi<br />

i)rer óháð einingumxogY.<br />

ii)−1 ≤ r ≤ 1<br />

iii)r = 1 ef allir punktarnir eru á beinni línu með jákvæðri hallatölu.<br />

iv)r = −1 ef allir punktarnir eru á beinni línu með neikvæðri hallatölu.<br />

Til viðmiðunar fyrir gildi árþá setjum við fram Töflu 20.<br />

Tafla 20: Flokkun á gildumr.<br />

Bil Fylgni Formerki<br />

−1,0 ≤ r < −0,8 Sterk Neikvætt<br />

−0,8 ≤ r < −0,5 Miðlungs Neikvætt<br />

−0,5 ≤ r < 0,0 Veik Neikvætt<br />

r = 0,0 Engin<br />

0,0 < r ≤ 0,5 Veik Jákvætt<br />

0,5 < r ≤ 0,8 Miðlungs Jákvætt<br />

0,8 < r ≤ 1,0 Sterk Jákvætt<br />

Köllum Syy = (yi − ¯y) 2 heildardreifni mældu y-anna. Fervikasumman er eins og<br />

áðurSSR = e 2 i , og er mælikvarði á heildardreifni leifanna. Nefnum stærðinaSSE skýrða<br />

dreifni þar sem<br />

SSE =<br />

n<br />

(a+bxi − ¯y) 2 .<br />

i=1<br />

SSE mælir dreifnina sem líkanið skýrir. Sýna má að<br />

Syy = SSE +SSR.<br />

Heildardreifninni má því skipta í þátt sem að líkanið skýrir (SSE) og þátt sem ekki verður<br />

skýrður með skýribreytunni x (SSR). Skilgreinum skýringarhlutfall, R 2 , (e. coefficient of<br />

78


determination) sem hlutfall skýrðrar dreifni og heildardreifniy-anna<br />

UmR 2 gildir að<br />

R 2 = SSE<br />

Syy<br />

= Syy −SSR<br />

Syy<br />

0 ≤ R 2 ≤ 1.<br />

= 1− SSR<br />

.<br />

Syy<br />

Ef R 2 er til dæmis jafnt og 0,83, þá segjum við að x skýri 83% af dreifni Y . Sýna má að<br />

sambandið á millir ogR 2 sé<br />

r 2 = R 2<br />

Athugið að R 2 segir ekki til um formerkir.<br />

eða |r| = √ R 2 .<br />

6.8 Greining á leifunum: Forsendur líkans athugaðar<br />

Við notum leifarnar til að athuga hvort forsendurnar sem við gáfum okkur í upphafi séu réttar.<br />

Við fáum ekki beinar mælingar áǫ-unum en við getum notað leifarnar til að fá hugmynd um<br />

hvernigǫ-in hegða sér.<br />

Fyrst er athugað hvort sambandið sé línulegt með því að skoða leifarnar á mótix. Ef það<br />

er sýnilegt form í myndinni er möguleiki á að línanα+βx lýsi E(Y)ekki nægjanlega vel. Ef<br />

línan virðist lýsa E(Y) nægjanlega vel er næst athugað hvort ǫ-in hafi sömu dreifni með því<br />

að teikna leifarnar á móti x. Ef dreifnin virðist til dæmis vera að vaxa með skýribreytunni<br />

x þá er hugsanlegt að ǫ-in hafi ekki sömu dreifni fyrir mismunandi x. Ef dreifnin er sú<br />

sama fyrir öll x er athugað hvort ǫ-in fylgi normaldreifingu með því að teikna svokallað<br />

normaldreifingarrit af leifunum. Ef punktarnir á normaldreifingarritinu liggja nálægt línunni<br />

á myndinni og endapunktarnir báðum megin sveigjast ekki afgerandi upp eða niður þá er<br />

ásættanlegt að gera ráð fyrir að ǫ-in fylgi normaldreifingu.<br />

Mynd 17 sýnir þrjú tilfelli af gögnum. Í hverju tilfelli er sýnd mynd af gögnunum og<br />

aðhvarfslínunni, leifunum á móti x breytunni og normaldreifingarrit. Þrjár efstu mynd-irnar<br />

sýna tilfelli þar sem öllum forsendum er fullnægt. Myndirnar þrjár í miðjunni sýna tilfelli<br />

þar sem parabólulið eða einhvern ólínulegan lið vantar í líkanið. Þetta sést vel á myndinni<br />

79


af leifunum á mótix-unum. Þrjár neðstu myndirnar sýna tilfelli þar sem dreifniǫ-anna er að<br />

vaxa meðx-unum.<br />

Hermd gögn og aðhvarfslína úrtaks<br />

20<br />

10<br />

0<br />

−10<br />

0 5 10 15<br />

200<br />

150<br />

100<br />

50<br />

0<br />

0 5 10 15<br />

60<br />

40<br />

20<br />

0<br />

0 10 20<br />

x<br />

10<br />

0<br />

−10<br />

40<br />

20<br />

0<br />

−20<br />

Leifar (e i ) á móti x<br />

0 5 10 15<br />

−40<br />

0 5 10 15<br />

50<br />

0<br />

−50<br />

0 10 20<br />

x<br />

Normaldreifingarrit af leifum<br />

0.99<br />

0.98<br />

0.95<br />

0.90<br />

0.75<br />

0.50<br />

0.25<br />

0.10<br />

0.05<br />

0.02<br />

0.01<br />

−10 −5 0 5<br />

0.98<br />

0.95<br />

0.90<br />

0.75<br />

0.50<br />

0.25<br />

0.10<br />

0.05<br />

0.02<br />

−20 0 20 40<br />

0.99<br />

0.98<br />

0.95<br />

0.90<br />

0.75<br />

0.50<br />

0.25<br />

0.10<br />

0.05<br />

0.02<br />

0.01<br />

−20 0 20<br />

e<br />

i<br />

40<br />

Mynd 17: Dæmi um greiningu á leifum úr línulegri aðhvarfsgreiningu.<br />

6.9 Ólínulegu líkani varpað á línulegt form<br />

Sambandið á milliY ogxgetur verið ólínulegt. Í sumum tilfellum er hægt að varpa ólínulegu<br />

líkani yfir í línulegt líkan. Hér skoðum við tvö slík tilfelli. Fyrra líkanið er á forminu<br />

Yi = γx θ i eφi , φi ∼ N(0,η 2 ), i = 1,...,n,<br />

þar sem x1, ..., xn, γ, θ og η 2 eru fastar. Ef við notum náttúrulega lografallið báðum megin<br />

við jafnaðarmerkið fæst<br />

Ef við látum<br />

ln(Yi) = ln(γ)+θln(xi)+φi, i = 1,...,n.<br />

Y ∗<br />

i = ln(Yi), x ∗ i = ln(xi), i = 1,...,n, γ ∗ = ln(γ),<br />

80


þá má skrifa líkanið á forminu<br />

Y ∗<br />

i = γ ∗ +θx ∗ i +φi, i = 1,...,n,<br />

og meta stikana γ ∗ og θ með aðferð minnstu kvaðrata. Einnig er hægt að nota aðferð-irnar<br />

sem sýndar hafa verið hér að ofan til að finna öryggisbil og gera tilgátupróf.<br />

Seinna líkanið er á forminu<br />

Yi = κe λxi+υi , υi ∼ N(0,τ 2 ), i = 1,...,n,<br />

þar sem x1, ..., xn, κ, λ og τ 2 eru fastar. Ef við notum náttúrulega lografallið báðum megin<br />

við jafnaðarmerkið fæst<br />

Ef við látum<br />

þá má skrifa líkanið á forminu<br />

ln(Yi) = ln(κ)+λxi +υi, i = 1,...,n.<br />

κ ∗ = ln(κ),<br />

Y ∗<br />

i = κ∗ +λxi +υi, i = 1,...,n,<br />

og meta stikana κ ∗ og λ með aðferð minnstu kvaðrata. Eins og gilti um fyrra líkanið er<br />

hægt að nota jöfnurnar hér að ofan til að reikna öryggisbil og gera tilgátupróf. Til að finna<br />

öryggisbil fyrir γ og κ í líkönunum hér að ofan verður að varpa öryggisbilunum fyrir γ ∗ og<br />

κ ∗ með því að setjaeíveldið af efri og neðri mörkunum.<br />

6.10 Dæmi<br />

Fyrirtæki í tölvugeiranum sér um þjónustu fyrir tölvur. Látum x vera fjölda tölva sem eru<br />

þjónustaðar í einu útkalli og látumY vera heildartímann við að þjónustax vélar í einu útkalli.<br />

Tafla 21 sýnir mælingar sem fengust úr 18 útköllum starfsmanna.<br />

Gerum ráð fyrir að gögnin fylgi línulegu líkani<br />

Yi = α+βxi +ǫi, ǫi ∼ N(0,σ 2 ), i = 1,...,18.<br />

81


Tafla 21: Heildartími við þjónustu á tölvum.<br />

Mæl- Fjöldi Tími Mæl- Fjöldi Tími Mæl- Fjöldi Tími<br />

ing # tölva (mín.) ing # tölva (mín.) ing # tölva (mín.)<br />

i xi yi i xi yi i xi yi<br />

1 7 97 7 7 101 13 2 25<br />

2 6 86 8 3 39 14 5 71<br />

3 5 78 9 4 53 15 7 105<br />

4 1 10 10 2 33 16 1 17<br />

5 5 75 11 8 118 17 4 49<br />

6 4 62 12 5 65 18 5 68<br />

Nokkrar reiknistærðir byggðar á gögnunum;<br />

Sxy =<br />

Sxx =<br />

i=1<br />

n = 18, ¯x = 4,5, ¯y = 64,0,<br />

n<br />

(xi − ¯x) 2 = 74,5, Syy =<br />

i=1<br />

Punktmatið á α,β ogσ er<br />

Fylgnistuðull úrtaks er<br />

n<br />

(yi − ¯y) 2 = 16504,<br />

n<br />

(xi − ¯x)(yi − ¯y) = 1098, SSR = (SxxSyy −S 2 xy )<br />

= 321,396.<br />

b = Sxy<br />

Sxx<br />

= 1098<br />

74,5<br />

i=1<br />

= 14,738<br />

Sxx<br />

a = ¯y −b¯x = 64,0−14,738×4,5 = −2,322<br />

r =<br />

sr =<br />

SSR<br />

n−2 =<br />

Sxy<br />

SxxSyy<br />

=<br />

321,396<br />

18−2<br />

= 4,482.<br />

1098<br />

√ 74,5×16504 = 0,9902<br />

og við segjum að fylgnin sé sterk og jákvæð. Skýringarhlutfallið er<br />

R 2 = r 2 = 0,9902 2 = 0,9805<br />

82


og því skýrirx98% af dreifni Y .<br />

Mat á staðalfrávikiAer<br />

<br />

sA = sr<br />

1 ¯x2<br />

+ = 4,482×<br />

n Sxx<br />

1 4,52<br />

+ = 2,564<br />

18 74,5<br />

og því er 95% öryggisbil fyrirα<br />

a±tα ′ /2,n−2sA = −2,322±2,120×2,564 = (−7,76,3,11).<br />

Reiknum 95% öryggisbil fyrirβ<br />

b±tα ′ /2,n−2sr/ Sxx = 14,738±2,120×4,482/ √ 74,5 = (13,64,15,84).<br />

Hvert er punktmatið á meðalgildi Y þegar skýribreytan tekur gildið x0 = 5? Meðalgildi Y<br />

þegarx0 = 5 erα+βx0 = α+β5 og er metið með<br />

a+bx0 = a+b5 = −2,331+14,738×5 = 71,37.<br />

Hversu vel er meðalgildi Y metið þegar x0 = 5? Notum 95% öryggisbil fyrir α + βx0 =<br />

α+β5 til að meta vissuna í matinu<br />

a+bx0 ±tα ′ /2,n−2sA+Bx0 = a+bx0 ±tα ′ /2,n−2sr<br />

= (−2,331+14,738×5)±2,120×4,482<br />

<br />

1 (5−4,5)2<br />

+<br />

18 74,5<br />

<br />

1<br />

n + (x0 − ¯x) 2<br />

Sxx<br />

= (69,06,73,68).<br />

Ef það er gefið að þjónusta eigi x0 = 5 tölvur, á hvaða bili má búast við að heildartíminn<br />

verði? Notum 95% spábil til að finna þetta bil<br />

a+bx0 ±tα ′ <br />

/2,n−2 s2 r +s2 A+Bx0 = a+bx0 ±tα ′ <br />

/2,n−2sr 1+ 1<br />

n + (x0 − ¯x) 2<br />

Sxx<br />

<br />

= (−2,331+14,738×5)±2,120×4,482 1+ 1 (5−4,5)2<br />

+ = (61,59,81,15).<br />

18 74,5<br />

Það er hugsanlegt að það sé enginn fastur tími sem fer í útkall. Það þýðir að α = 0. Prófum<br />

núlltilgátuna H0 : α = 0 á móti gagntilgátunni H1 : α = 0. Notum marktektarkröfu<br />

α ′ = 0,01. Prófstærðin er<br />

t = a−α0<br />

sA<br />

= a−0<br />

sA<br />

= −2,322−0<br />

2,564<br />

83<br />

= −0,906.


Höfnunarsvæðið er; |t| > tα ′ /2,n−2 = t0,005,16 = 2,921. Þar sem |t| = |−0,906| < 2,921 =<br />

t0,005,16 þá höfnum við ekki H0 við marktektarkröfu α ′ = 0,01. Því er möguleiki að líkanið<br />

sé á forminu<br />

Tími (mín)<br />

e i<br />

140<br />

120<br />

100<br />

80<br />

60<br />

40<br />

20<br />

0<br />

Yi = βxi +ǫi, ǫi ∼ N(0,σ 2 ), i = 1,...,18.<br />

Heildartími á móti fjölda tölva<br />

−20<br />

0 2 4<br />

Fjöldi (x)<br />

6 8<br />

10<br />

5<br />

0<br />

−5<br />

−10<br />

Leifar (e i ) á móti fjölda (x)<br />

0 2 4<br />

Fjöldi (x)<br />

6 8<br />

Líkur<br />

Tími (mín)<br />

140<br />

120<br />

100<br />

80<br />

60<br />

40<br />

20<br />

0<br />

95% öryggisbil og 95% spábil<br />

−20<br />

0 2 4<br />

Fjöldi (x)<br />

6 8<br />

0.98<br />

0.95<br />

0.90<br />

0.75<br />

0.50<br />

0.25<br />

0.10<br />

0.05<br />

0.02<br />

Normaldreifingarrit af leifum<br />

−5 0<br />

e<br />

i<br />

5<br />

Mynd 18: Línuleg aðhvarfsgreining á gögnum um heildarþjónustutíma á móti fjölda tölva<br />

Mynd 18 sýnir aðhvarfsgreiningu á gögnunum um þjónustutíma fyrir tölvur. Myndin<br />

efst vinstra megin sýnir heildarþjónustutímann á móti fjölda tölva. Myndin efst hægra megin<br />

sýnir aðhvarfslínuna, 95% öryggisbil fyrir α + βx, og 95% spábil fyrir ný Y á móti fjölda<br />

tölva. Myndin neðst vinstra megin sýnir leifarnar á móti skýribreytunni x, það er, fjölda<br />

tölva. Myndin neðst til hægri sýnir normaldreifingarrit af leifunum. Af neðri myndunum<br />

á Mynd 18 er ásættanlegt að ætla að α + βx lýsi E(Y) nægjanlega vel, að ǫ-in hafi sömu<br />

dreifni fyrirxábilinu 1 til 8 og að ǫ-in fylgi normaldreifingu.<br />

84


7 Próf fyrir mátgæði og tengslatöflur<br />

7.1 Próf fyrir mátgæði þegar allir stikar eru þekktir<br />

Höfum slembiúrtak Y1, ..., Yn úr strjálli dreifingu. Við viljum prófa hvort líkindadreifing<br />

Y -anna sé<br />

Pr(Y = j) = pj, j = 1,2,...,k,<br />

þar sem Y hefur sömu dreifingu og Y1, ...,Yn ogp1,...,pk, eru þekktir fastar.<br />

Núlltilgátan er<br />

á móti gagntilgátunni<br />

H0 : Pr(Y = j) = pj, j = 1,2,...,k,<br />

H1 : Pr(Y = j) = pj, fyrir eitthvertj ∈ {1,2,...,k}.<br />

Próf af þessu tagi eru nefnd próf fyrir mátgæði (e. goodness-of-fit tests).<br />

Látum Xj, j = 1,...,k, vera fjölda þeirra Y -a sem eru jöfn j. Að því gefnu að H0 sé<br />

sönn, eru líkurnar á að Y sé jafnt og j jafnar pj, og þar sem Xj telur fjöldann af n óháðum<br />

Y -um sem eru jöfn j, þá er<br />

Xj ∼ Bin(n,pj), E(Xj) = npj, j = 1,...,k.<br />

Stærðin (Xj − npj) 2 mælir hversu langt Xj er frá meðalgildi sínu að því gefnu að H0 sé<br />

sönn.<br />

Prófstærðin fyrir tilgáturnar hér að ofan er<br />

T =<br />

k (Xj −npj) 2<br />

.<br />

npj<br />

j=1<br />

Við höfnum H0 ef gildið á T fyrir gefna tilraun er stórt. Að því gefnu að H0 sé sönn má<br />

nálga dreifingu T með kí-kvaðratsdreifingu með (k −1) frítölum<br />

T ∼ χ 2 k−1.<br />

85


Höfnunarsvæðið er þannig að við höfnumH0 ef<br />

t > χ 2 α,k−1<br />

þar sem t er gildið á prófstærðinni fyrir gefna tilraun.<br />

P -gildið er<br />

þar sem W 2 k−1 ∼ χ2 k−1 .<br />

P -gildi = Pr(W 2 k−1 ≥ t).<br />

Dæmi. 120 dúfur á heimleið eru gerðar áttavilltar og svo sleppt. Eru dúfurnar algerlega<br />

áttavilltar? Setjum áttirnar í 8 flokka, sjá Töflu 22 ásamt gögnum. Notum marktektarkröfu<br />

α = 0,01. Tafla 23 sýnir fjölda og væntanlega fjölda í hverjum flokki.<br />

Núlltilgátan er<br />

á móti gagntilgátunni<br />

Tafla 22: Flokkar og fjöldi í flokkum fyrir gögn um dúfur.<br />

Stefna 0 ◦ −45 ◦ 45 ◦ −90 ◦ 90 ◦ −135 ◦ 135 ◦ −180 ◦<br />

Fjöldi 12 16 17 15<br />

Stefna 180 ◦ −225 ◦ 225 ◦ −270 ◦ 270 ◦ −315 ◦ 315 ◦ −360 ◦<br />

Fjöldi 13 20 17 10<br />

H0 : Pr(Y = j) = pj = 1<br />

, j = 1,2,...,8,<br />

8<br />

H1 : Pr(Y = j) = 1<br />

, fyrir eitthvertj ∈ {1,2,...,8}.<br />

8<br />

Tafla 23: Fjöldi og væntanlegur fjöldi í flokkum fyrir gögn um dúfur.<br />

j 1 2 3 4 5 6 7 8 Heild<br />

xj 12 16 17 15 13 20 17 10 120<br />

npj 15 15 15 15 15 15 15 15 120<br />

86


HöfnumH0 ef<br />

t =<br />

8 (xj −npj) 2<br />

j=1<br />

npj<br />

= (12−15)2<br />

15<br />

+...+ (10−15)2<br />

15<br />

= 32 12 22 02 22 52 22 52 72<br />

+ + + + + + + = = 4,8<br />

15 15 15 15 15 15 15 15 15<br />

t > χ 2 0,01,7 = 18,475.<br />

Því höfnum við ekki H0 miðað við marktektarkröfu α = 0,01. P -gildið gefur einnig til<br />

kynna að ekki skuli hafnaH0.<br />

P -gildi = Pr(W 2 7 ≥ 4,8) = 0,6844 > α = 0,01.<br />

7.2 Próf fyrir mátgæði þegar einn eða fleiri stikar eru óþekktir<br />

Hér eru p1,...,pk föll af einhverjum m óþekktum stikum, θ = (θ1,...,θm) T , og því eru p-<br />

in einnig óþekkt. Við viljum prófa hvort gögnin fylgi stikaðri líkindadreifingu, til dæmis<br />

Poisson dreifingu eða tvíkostadreifingu. Gildin á stikunum eru fundin með sennileikamati.<br />

Táknum matið ápj = pj(θ) með ˆpj = pj( ˆ θ), j = 1,...,k.<br />

Núlltilgátan er<br />

á móti gagntilgátunni<br />

H0 : Pr(Y = j) = pj(θ), j = 1,2,...,k,<br />

H1 : Pr(Y = j) = pj(θ), fyrir eitthvertj ∈ {1,2,...,k}.<br />

Prófstærðin fyrir tilgáturnar hér að ofan er<br />

T =<br />

k (Xj −nˆpj) 2<br />

.<br />

nˆpj<br />

j=1<br />

Að því gefnu að H0 sé sönn má nálga dreifinguT með<br />

T ∼ χ 2 k−1−m .<br />

Höfnunarsvæðið er þannig að við höfnumH0 ef<br />

t > χ 2 α,k−1−m<br />

87


þar sem t er gildið á prófstærðinni fyrir gefna tilraun.<br />

P -gildið er<br />

þar sem W 2 k−1−m ∼ χ2 k−1−m .<br />

P -gildi = Pr(W 2 k−1−m ≥ t).<br />

Dæmi. 150 vasaljós(n = 150), hvert með 4 rafhlöðum. Notum marktektarkröfu α = 0,01.<br />

Yi = fjöldi bilaðra rafhlaðna íi-ta vasaljósinu, i = 1,...,150.<br />

HvertYi getur tekið gildin0,1,2,3 og 4. Sjá gögn um vasaljósin í Töflu 24.<br />

Tafla 24: Flokkar vasaljósa, flokkað eftir fjölda bilaðra rafhlaðna.<br />

Flokkurj 1 2 3 4 5<br />

Fjöldi bilaðra rafhlaðna 0 1 2 3 4<br />

Fjöldi í flokkij (xj) 26 51 47 16 10<br />

FylgirY tvíkostadreifingu? Núlltilgátuna má rita<br />

á móti gagntilgátunni<br />

H0 : Pr{Y = y(j)} = pj(θ) =<br />

4!<br />

{4−y(j)}!y(j)! θy(j) (1−θ) 4−y(j) ,<br />

y(j) = j −1, j = 1,2,...,5,<br />

H1 : Pr{Y = y(j)} = pj(θ), fyrir eitthvertj ∈ {1,2,...,5}.<br />

Metumθ með sennileikametli. Sennileikametillinn fæst með því að lágmarka<br />

L(θ) =<br />

150<br />

i=1<br />

fYi (yi)<br />

150<br />

<br />

4<br />

=<br />

i=1<br />

Sennileikametillinn fyrirθ er<br />

yi<br />

ˆθ = 1<br />

150<br />

θ yi (1−θ) 4−yi , yi ∈ {0,1,2,3,4}, i = 1,...,150.<br />

150<br />

i=1<br />

1<br />

4 Yi =<br />

1<br />

4×150<br />

88<br />

5<br />

(j −1)Xj.<br />

j=1


Sennileikamatið áθ er<br />

ˆθ = 1<br />

(0×26+1×51+2×47+3×16+4×10) = 0,3883.<br />

600<br />

Reiknum hvert ˆpj, j = 1,...,5,<br />

ˆp1 = Pr(Y = 0) =<br />

ˆp2 = Pr(Y = 1) =<br />

ˆp3 = Pr(Y = 2) =<br />

ˆp4 = Pr(Y = 3) =<br />

ˆp5 = Pr(Y = 4) =<br />

<br />

4<br />

ˆθ<br />

0<br />

0 (1− ˆ θ) 4−0 =<br />

<br />

4<br />

ˆθ<br />

1<br />

1 (1− ˆ θ) 4−1 =<br />

<br />

4<br />

ˆθ<br />

2<br />

2 (1− ˆ θ) 4−2 =<br />

<br />

4<br />

ˆθ<br />

3<br />

3 (1− ˆ θ) 4−3 =<br />

<br />

4<br />

ˆθ<br />

4<br />

4 (1− ˆ θ) 4−4 =<br />

<br />

4<br />

0,3883<br />

0<br />

0 (1−0,3883) 4 = 0,1400,<br />

<br />

4<br />

0,3883<br />

1<br />

1 (1−0,3883) 3 = 0,3555,<br />

<br />

4<br />

0,3883<br />

2<br />

2 (1−0,3883) 2 = 0,3385,<br />

<br />

4<br />

0,3883<br />

3<br />

3 (1−0,3883) 1 = 0,1433,<br />

<br />

4<br />

0,3883<br />

4<br />

4 (1−0,3883) 0 = 0,0227.<br />

Notum þessi gildi á ˆpj, j = 1,...,5 til að reikna út væntanlegan fjölda, sjá Töflu 25, og<br />

prófstærðina.<br />

Tafla 25: Fjöldi og væntanlegur fjöldi í flokkum.<br />

j 1 2 3 4 5<br />

y(j) 0 1 2 3 4<br />

xj 26 51 47 16 10<br />

nˆpj 21,00 53,32 50,78 21,49 3,41<br />

89


HöfnumH0 ef<br />

t =<br />

5 (xj −nˆpj) 2<br />

j=1<br />

+ (47−50,78)2<br />

50,78<br />

npj<br />

= (26−21,00)2<br />

21,00<br />

+ (16−21,49)2<br />

21,49<br />

t > χ 2 α,k−1−m = χ2 0,01,5−1−1<br />

+ (51−53,32)2<br />

53,32<br />

+ (10−3,41)2<br />

3,41<br />

= 11,345.<br />

= 15,71.<br />

Þar sem t = 15,71 > 11,345 = χ 2 0,01,3 þá höfnum við H0 miðað við marktektarkröfu<br />

α = 0,01. P -gildið er<br />

P -gildi = Pr(W 2 3<br />

≥ 15,71) = 0,0013.<br />

Því mundum við hafna H0 við marktektarkröfuα > 0,0013.<br />

7.3 Próf fyrir tengslatöflur<br />

Hér hefur hver einstaklingur í þýðinu tvö einkenni (tvö gildi) þar sem hvort einkenni greinist<br />

í nokkra flokka. Köllum fyrra einkennið X-einkenni og segjum að það greinist í r flokka.<br />

Köllum seinna einkenniðY -einkenni og segjum að það greinist í s flokka.<br />

Gerum ráð fyrir að einstaklingar í þýðinu séu óháðir. Líkurnar á að einstaklingur sem<br />

valinn er af handahófi sé meðX-einkenni í i-ta flokki ogY-einkenni íj-ta flokki, eru<br />

Látum<br />

og<br />

pij = Pr(X = i,Y = j), i = 1,...,r, j = 1,...,s.<br />

pi = Pr(X = i) =<br />

qj = Pr(Y = j) =<br />

s<br />

pij, i = 1,...,r,<br />

j=1<br />

r<br />

pij, j = 1,...,s.<br />

i=1<br />

Við viljum prófa hvort einkenninX ogY séu óháð en það felur meðal annars í sér að ef við<br />

vitum til dæmisX-einkennið þá breytir það ekki líkunum á að vera með ákveðiðY-einkenni.<br />

Núlltilgátan er<br />

H0 : pij = piqj, fyrir ölli = 1,...,r, j = 1,...,s,<br />

90


á móti gagntilgátunni<br />

H1 : pij = piqj, fyrir eitthvert(i,j) .<br />

Þetta próf er kallað próf fyrir tengslatöflur (e. test of independence in contingency tables).<br />

Við vitum ekki gildin ápi og qj og því þarf að meta þau með gögnunum. Látum<br />

Metumpi með<br />

og metumqj með<br />

Nij = fjöldi með X = i ogY = j,<br />

Ni =<br />

Mj =<br />

Ef núlltilgátan er sönn þá gildir að<br />

Prófstærðin er<br />

s<br />

Nij, i = 1,...,r,<br />

j=1<br />

r<br />

Nij, j = 1,...,s,<br />

i=1<br />

n = heildarfjöldi einstaklinga í úrtaki =<br />

T =<br />

s<br />

j=1<br />

r<br />

i=1<br />

ˆpi = Ni<br />

, i = 1,...,r,<br />

n<br />

ˆqj = Mj<br />

, j = 1,...,s.<br />

n<br />

E(Nij) = npij = npiqj.<br />

(Nij −nˆpiˆqj) 2<br />

nˆpiˆqj<br />

Við höfum í raun r ×s flokka og metum alls<br />

stika. Frítölurnar eru því<br />

=<br />

s<br />

j=1<br />

r<br />

i=1<br />

r −1+s−1 = r +s−2<br />

s<br />

j=1<br />

N 2 ij<br />

nˆpiˆqj<br />

rs−1−(r+s−2) = (r −1)(s−1).<br />

91<br />

r<br />

i=1<br />

Nij.<br />

−n.


Athugið að<br />

r<br />

pi = 1,<br />

i=1<br />

s<br />

qj = 1,<br />

j=1<br />

Að því gefnu að H0 sé sönn má nálga dreifinguT með<br />

T ∼ χ 2 (r−1)(s−1).<br />

Höfnunarsvæðið er þannig að við höfnumH0 ef<br />

t > χ 2 α,(r−1)(s−1)<br />

þar sem t er gildið á prófstærðinni fyrir gefna tilraun.<br />

P -gildið er<br />

þar sem W 2<br />

(r−1)(s−1) ∼ χ2 (r−1)(s−1) .<br />

s<br />

j=1<br />

r<br />

pij = 1.<br />

i=1<br />

P -gildi = Pr(W 2<br />

(r−1)(s−1) ≥ t).<br />

Dæmi. Lungnakrabbi og reykingar, sjá gögn Töflu 26.<br />

Tafla 26: X: fékk lungnakrabba eða ekki Y : reykir eða reykir ekki<br />

Y<br />

Reykir Reykir ekki Heild<br />

X Lungnakrabbi N11 = 62 N12 = 14 N1 = 76<br />

Mat áp1, p2, q1 ogq2 er<br />

ˆp1 = N1<br />

n<br />

ˆq1 = M1<br />

n<br />

Ekki lungnakrabbi N21 = 9938 N22 = 19986 N2 = 29924<br />

Heild M1 = 10000 M2 = 20000 n = 30000<br />

76<br />

=<br />

30000 = 0,002533, ˆp2 = N2<br />

n<br />

10000<br />

=<br />

30000 = 0,333333, ˆq2 = M2<br />

n<br />

Stærðirnar nˆp1ˆq1, nˆp1ˆq2, nˆp2ˆq1 og nˆp2ˆq2 eru<br />

92<br />

29924<br />

= = 0,997467,<br />

30000<br />

20000<br />

= = 0,666667.<br />

30000


Prófstærðin er<br />

nˆp1ˆq1 = n N1M1<br />

n n<br />

nˆp1ˆq2 = n N1<br />

n<br />

nˆp2ˆq1 = n N2<br />

n<br />

nˆp2ˆq2 = n N2<br />

n<br />

t =<br />

2<br />

j=1<br />

2<br />

i=1<br />

M1<br />

n<br />

M2<br />

n<br />

M2<br />

n<br />

= N1M1<br />

n<br />

= N1M2<br />

n<br />

= N2M1<br />

n<br />

= N2M2<br />

n<br />

(Nij −nˆpiˆqj) 2<br />

nˆpiˆqj<br />

+ (9938−9974,67)2<br />

9974,67<br />

= 76×10000<br />

30000<br />

= 76×20000<br />

30000<br />

= 29924×10000<br />

30000<br />

= 29924×20000<br />

30000<br />

= (62−25,33)2<br />

25,33<br />

+ (19986−19949,33)2<br />

19949,33<br />

= 25,33,<br />

= 50,67,<br />

= 9974,67,<br />

= 19949,33.<br />

+ (14−50,67)2<br />

50,67<br />

= 79,83.<br />

Notum marktektarkröfu α = 0,01. Stærðirnar r og s eru hér r = 2 og s = 2. Höfn-<br />

unarsvæðið er<br />

t > χ 2 α,(r−1)(s−1) = χ 2 0,01,1 = 6,635.<br />

Þar semt = 79,81 > 6,635 = χ 2 0,01,1 þá höfnum viðH0. P -gildið er<br />

P -gildi = Pr(W 2 1 ≥ 79,83) = 0,<br />

og því mundum við hafnaH0 fyrir hvaða marktektarkröfu sem er.<br />

Niðurstaðan er því sú að líkurnar á því að fá lungnakrabbamein eru ekki óháðar því<br />

hvort maður reykir eða ekki. Af gögnunum má sjá að reykingar auka líkurnar á því að fá<br />

lungnakrabbamein. En við getum ekki fullyrt að reykingarnar hafi valdið krabbameini hjá<br />

þeim sem reyktu og fengu krabbamein.<br />

93


Heimildir<br />

Ross, S. M. (2004), Introduction to Probability and Statistics for Engineers and Scientists<br />

(3rd ed.), Belmont, CA: Duxbury.<br />

94

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!