pdf - Háskóli Íslands

Háskóli Íslands 

STÆ203G Líkindareikningur og tölfræði 

STÆ204G Inngangur að líkinda- og tölfræði 

HAG206G Líkindareikningur og tölfræði 

Vormisseri 2012 

FYRIRLESTRANÓTUR Í TÖLFRÆÐI 

eftir Birgi Hrafnkelsson 

1

Efnisyfirlit 

1 Lýsandi tölfræði 5 

1.1 Myndrænar aðferðir I . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 

1.2 Tölulegar aðferðir . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 

1.3 Myndrænar aðferðir II . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 

2 Dreifing lýsistærða 14 

2.1 Slembiúrtak og lýsistærðir . . . . . . . . . . . . . . . . . . . . . . . . . . 14 

2.2 Meðaltal slembiúrtaks . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 

2.3 Höfuðmarkgildisreglan . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 

2.4 Dreifni slembiúrtaks . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 

2.5 Skilgreiningar áz-dreifingu, χ 2 -dreifingum, t-dreifingum og F -dreifingum . 19 

2.5.1 z-dreifing (stöðluð normaldreifing) . . . . . . . . . . . . . . . . . . 19 

2.5.2 χ 2 -dreifingar (kí-kvaðratsdreifingar) . . . . . . . . . . . . . . . . . 20 

2.5.3 t-dreifingar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 

2.5.4 F -dreifingar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 

2.6 Dreifing lýsistærða sem byggðar eru á slembiúrtaki úr normaldreifingu . . . 23 

3 Metlar og punktmat 26 

3.1 Almennt um metla og punktmat . . . . . . . . . . . . . . . . . . . . . . . 26 

3.2 Hugmyndin að baki aðferð sennilegustu gilda . . . . . . . . . . . . . . . . 27 

3.3 Aðferð sennilegustu gilda . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 

3.4 Eiginleikar metla . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 

3.5 Línulegir óbjagaðir metlar . . . . . . . . . . . . . . . . . . . . . . . . . . 36 

4 Öryggisbil 39 

4.1 Eiginleikar öryggisbila . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 

4.2 Öryggisbil fyrirµínormaldreifingu þegarσ 2 er óþekkt . . . . . . . . . . . 42 

4.3 Öryggisbil fyrirσ 2 og σ í normaldreifingu . . . . . . . . . . . . . . . . . . 43 

3

4.4 Öryggisbil fyrirpítvíkostadreifingu . . . . . . . . . . . . . . . . . . . . . 44 

4.5 Öryggisbil fyrir nokkur valin tilfelli . . . . . . . . . . . . . . . . . . . . . 48 

5 Tilgátupróf 52 

5.1 Almennt um tilgátupróf . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 

5.2 P -gildi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 

5.3 Tilgátupróf fyrir meðalgildi í normaldreifingu, þekkt σ . . . . . . . . . . . 57 

5.4 Jöfnur fyrirβ og val án . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 

5.5 Tilgátupróf fyrir nokkur valin tilfelli . . . . . . . . . . . . . . . . . . . . . 62 

6 Línulegt aðhvarf 70 

6.1 Einfalt línulegt líkan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 

6.2 Metlar fyrir stikanaα, β og σ 2 . . . . . . . . . . . . . . . . . . . . . . . . 70 

6.3 Dreifingar metlanna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 

6.4 Öryggisbil og tilgátupróf fyrirαog β . . . . . . . . . . . . . . . . . . . . 74 

6.5 Öryggisbil fyrirα+βx0 . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 

6.6 Spábil fyrir nýttY þegar skýribreytan tekur gildiðx0 . . . . . . . . . . . . 76 

6.7 Fylgnistuðull úrtaks og skýringarhlutfall . . . . . . . . . . . . . . . . . . . 77 

6.8 Greining á leifunum: Forsendur líkans athugaðar . . . . . . . . . . . . . . 79 

6.9 Ólínulegu líkani varpað á línulegt form . . . . . . . . . . . . . . . . . . . . 80 

6.10 Dæmi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 

7 Próf fyrir mátgæði og tengslatöflur 85 

7.1 Próf fyrir mátgæði þegar allir stikar eru þekktir . . . . . . . . . . . . . . . 85 

7.2 Próf fyrir mátgæði þegar einn eða fleiri stikar eru óþekktir . . . . . . . . . 87 

7.3 Próf fyrir tengslatöflur . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 

4

1 Lýsandi tölfræði 

Við höfum áhuga á ákveðnu þýði (e. population). Til þess að skoða þýðið höfum við tvo 

möguleika 

i) skoða alla einstaklinga/hluti í þýðinu (e. census) 

ii) skoða nokkra einstaklinga/hluti í þýðingu, fáum úrtak úr þýðinu (e. sample) 

Til að fá sem besta mynd af þýðinu þarf úrtakið að vera slembiúrtak (e. random sample). 

Slembiúrtak úr þýði með endanlegan fjölda einstaklinga/hluta fæst ef hver einstaklingur hef- 

ur sömu líkur á að vera valinn í úrtakið. Við viljum fá eins góða hugmynd um dreifingu, 

meðalgildi og dreifni þýðisins út frá úrtakinu og hægt er. Til þess notum við lýsandi tölfræði 

(e. descriptive statistics) en hún skiptist í myndrænar aðferðir (e. graphical methods) og 

tölulegar aðferðir (e. numerical methods). 

1.1 Myndrænar aðferðir I 

i) Tíðnirit (e. histograms) 

Tíðnirit gefa mat á þéttleika, f(x), þegar um samfelldar breytur er að ræða. Eftirfarandi 

skref eru tekin: 

- veljum bil sem flokkað er í 

- teljum fjölda mælinga í hverju bili 

- reiknum hlutfallslega tíðni fyrir hvert bil 

- teiknum fyrir ofan hvert bil rétthyrning sem hefur sama flatarmál og hlutfallslega 

tíðni bilsins 

ii) Safntíðnirit (e. cumulative frequency plots) 

Safntíðnirit gefa mat á dreififalli, F(x) = Pr(X ≤ x), þegar um samfelldar breytur er að 

ræða. Eftirfarandi skref eru tekin: 

- leggjum saman hlutfallslega tíðni í bilinu og bilunum fyrir neðan, fáum safntíðni 

- teiknum punkt í hæð jafnri safntíðninni við efri mörk bilsins 

- drögum línu á milli punktanna 

5

Dæmi: Orkunotkun heimila. Stærð úrtaksins er n = 90. Tafla 1 sýnir hlutfallslega tíðni og 

safntíðni. Sjá tíðnirit og safntíðnirit fyrir gögnin á mynd 1. 

Tafla 1: Gögn um orkunotkun heimila. 

Bil Fjöldi Hlutfalls- Safntíðni 

MW stundir/ár leg tíðni 

iii) Greina- og laufarit (e. stem and leaf plots) 

1-3 1 0,011 0,011 

3-5 1 0,011 0,022 

5-7 11 0,122 0,144 

7-9 21 0,233 0,378 

9-11 25 0,278 0,656 

11-13 17 0,189 0,844 

13-15 9 0,100 0,944 

15-17 4 0,044 0,989 

17-19 1 0,011 1,000 

Greina- og laufarit gefa gróft mat á þéttleika, f(x), samfelldra gagna eða á líkindafalli, 

p(x) = Pr(X = x), strjálla gagna. Eftirfarandi skref eru tekin: 

- grúppum gögnin eftir fyrri hluta talnanna (grein) 

- ritum seinni hluta talnanna á eftir (lauf) 

Dæmi: Gögn um meðalhita nokkurra fylkja (í gráðum á Fahrenheit): 

x1 = 57, x2 = 59, x3 = 55, x4 = 57, x5 = 36, x6 = 45, 

x7 = 51, x8 = 39, x9 = 41, x10 = 40, x11 = 46, x12 = 36, 

x13 = 44, x14 = 29, x15 = 35, x16 = 43, x17 = 33, x18 = 69. 

6

Mat á f(x) 

Mat á F(x) 

0.15 

0.1 

0.05 

0 

0 2 4 6 8 10 

MW stundir/ár (x) 

12 14 16 18 20 

1 

0.8 

0.6 

0.4 

0.2 

0 

0 2 4 6 8 10 

MW stundir/ár (x) 

12 14 16 18 20 

Mynd 1: Tíðnirit (efri myndin) og safntíðnirit (neðri myndin) af gögnum um orkunotkun 

heimila. 

1.2 Tölulegar aðferðir 

i) Reiknistærðir fyrir miðju úrtaks 

Greinar Lauf 

2 9 

3 6 9 6 5 3 

4 5 1 0 6 4 3 

5 7 9 5 7 1 

6 9 

SKILGREINING. Segjum að úrtak af stærðn, hafi eftirfarandi gildi: x1,x2, ...,xn. Meðaltal 

úrtaks (e. sample mean), táknað með ¯x, er skilgreint með 

¯x = 1 

n 

7 

n 

xi. 

i=1

SKILGREINING. Segjum að úrtak af stærð n, hafi eftirfarandi röðuð gildi: 

x(1) < x(2) < ... < x(n−1) < x(n). 

Miðgildi úrtaks (e. sample median), táknað með ˜x, er skilgreint með 

⎧ 

⎨ x(n/2+1/2) 

efner oddatala, 

˜x = 

⎩ 

1 

2 {x(n/2) +x(n/2+1)} efner slétt tala. 

SKILGREINING. Tíðasta gildi úrtaks (e. sample mode) er gildið sem kemur oftast fyrir. 

Dæmi: Gögn um meðalhita nokkurra fylkja. Meðaltal úrtaks er 

¯x = 1 

n 

n 

i=1 

xi = 1 

×815 = 45,28. 

18 

Úrtakið er af stærð n = 18 sem er slétt tala. Röðuðum gögnunum 

x(1) = 29, x(2) = 33, x(3) = 35, x(4) = 36, x(5) = 36, x(6) = 39, 

x(7) = 40, x(8) = 41, x(9) = 43, x(10) = 44, x(11) = 45, x(12) = 46, 

x(13) = 51, x(14) = 55, x(15) = 57, x(16) = 57, x(17) = 59, x(18) = 69. 

Miðgildi úrtaks er 

˜x = 1 

2 {x(n/2) +x(n/2+1)} = 1 

2 {x(9) +x(10)} = 1 

2 

{43+44} = 43,5. 

Tíðasta stærð úrtaks eru tölurnar 36 og 57. Hér segja þessar tölur okkur lítið. Flestar tölurnar 

eru á bilinu 40 til 50. 

ii) Sætisstærðir úrtaks (e. sample percentiles) 

SKILGREINING. 100p-ta sætisstærð úrtaks er tala í úrtakinu sem er þannig að minnsta 

kosti 100p% af gögnunum eru minni eða jöfn tölunni og að minnsta kosti 100(1 − p)% af 

gögnunum eru stærri eða jöfn tölunni. Ef tvær tölur í úrtakinu uppfylla þessu skilyrði þá er 

100p-ta sætisstærð úrtaksins meðaltalið af þessum tveimur tölum. 

Dæmi: Gögn um meðalhita nokkurra fylkja. 

25. sætisstærðin= x(5) = 36 

8

(np = 18×0,25 = 4,5 => 5. talan). 

33,3. sætisstærðin= 0,5(x(6) +x(7)) = 0,5(39+40) = 39,5 

(np = 18×0,333 = 6=> 6. og 7. talan). 

50. sætisstærðin= 0,5(x(9) +x(10)) = 0,5(43+44) = 43,5 

(np = 18×0,5 = 9 => 9. og 10. talan). 

67,7. sætisstærðin= 0,5(x(12) +x(13)) = 0,5(46+51) = 48,5 

(np = 18×0,667 = 12=> 12. og 13. talan). 

75. sætisstærðin = = x(14) = 55 

(np = 18×0,75 = 13,5 => 14. talan). 

Þrjár sætisstærðir hafa sérstök nöfn 

Q1 = 25. sætisstærð úrtaks er kölluð fyrsta fjóðungsmark úrtaks (e. first quartile). 

Q2 = 50. sætisstærð úrtaks er kölluð annað fjóðungsmark úrtaks (e. second quartile). 

Q3 = 75. sætisstærð úrtaks er kölluð þriðja fjóðungsmark úrtaks (e. third quartile). 

Athugið aðQ2 = ˜x, þar sem ˜x er miðgildið. Þessar þrjár stærðir skipta samfelldri dreifingu í 

fjóra jafna hluta. Mynd 2 sýnir tíðnirit og safntíðnirit af gögnunum ásamt fjóðungsmörkum. 

iii) Reiknistærðir fyrir dreifni úrtaks 

SKILGREINING. Segjum að úrtak af stærð n, hafi eftirfarandi gildi; x1, x2, ..., xn. Dreifni 

úrtaks (e. sample variance), táknað meðs 2 , er skilgreint með 

s 2 = 1 

n−1 

n 

(xi − ¯x) 2 , n ≥ 2. 

i=1 

SKILGREINING. Staðalfrávik úrtaks (e. sample standard deviation) af stærð n, er táknað 

með s, og er skilgreint með 

Regla um fervikasummu 

s = √ s 2 . 

n 

(xi − ¯x) 2 = 

i=1 

9 

n 

x 2 i −n¯x2 . 

i=1

Mat á f(x) 

Mat á F(x) 

0.08 

0.06 

0.04 

0.02 

Q 1 

Q 2 

25% 25% 25% 25% 

0 

20 25 30 35 40 45 50 55 60 65 70 75 

Hiti [°F] (x) 

1 

0.8 

0.6 

0.4 

0.2 

Q 1 

Q 2 

0 

20 25 30 35 40 45 50 55 60 65 70 75 


Mynd 2: Tíðnirit (efri myndin) og safntíðnirit (neðri myndin) af gögnum um meðalhita 

nokkurra fylkja ásamt fjóðungsmörkum. 


n 

(xi − ¯x) 2 = 

i=1 

n 

i=1 

x 2 i 

= 38841, 

Q 3 

n 

x 2 i −n¯x 2 = 38841−18×45,28 2 = 1935,99, 

i=1 

s 2 = 1 

n−1 

n 

i=1 

(xi − ¯x) 2 = 1 

17 

s = √ s 2 = 10,67. 

Q 3 

×1935,99 = 113,88, 

SKILGREINING. Fjórðungsbil úrtaks (e. sample interquartile range) er táknað með IQR 

og er skilgreint með 


IQR = Q3 −Q1. 

IQR = Q3 −Q1 = 55−36 = 19. 

10

1.3 Myndrænar aðferðir II 

i) Kassarit (e. box plots) 

Byggir á stærðum byggðum á úrtakinu. 

1) minnsta mælingin í úrtakinu 

2)Q1 

3)Q2 = ˜x 

4)Q3 

5) stærsta mælingin í úrtakinu 

Mynd 3 sýnir kassarit fyrir gögnin um meðalhita nokkurra fylkja. Stærðirnar Q1, Q2 og Q3 

ákveða lögun kassans. Minnsta mælingin ákveður hversu langt línan nær niður frá Q1 og 

stærsta mælingin ákveður hversu hátt línan nær upp fráQ3. 

Ef minnsta mælingin er minni en (Q1 − 1,5IQR) nær línan frá Q1 aðeins niður að 

minnstu mælingunni sem er stærri en (Q1 − 1,5IQR) og mælingarnar sem eru minni en 

(Q1 − 1,5IQR) eru merktar með plús. Að sama skapi ef stærsta mælingin er stærri en 

(Q3 +1,5IQR) nær línan frá Q3 aðeins upp að stærstu mælingunni sem er minni en (Q3 + 

1,5IQR) og mælingarnar sem eru stærri en (Q3 +1,5IQR) eru merktar með plús. Mynd 4 

sýnir kassarit af hermdum gögnum. Gögnin voru hermd með ákveðinni dreifingu til að ná 

fram nokkrum mælingum sem voru sérstaklega stórar og litlar og því merktar með plús. 

11

x 


70 

65 

60 

55 

50 

45 

40 

35 

30 

Mynd 3: Kassarit af gögnum um meðalhita nokkurra fylkja. 

3 

2 

1 

0 

−1 

−2 

−3 

1 

1 

max 

min 

max 

Q 3 

Q 2 

Q 1 

x ≤ Q 3 +1.5*IQR 

Q 3 

Q 2 

Q 1 

x ≥ Q 1 −1.5*IQR 

min 

Mynd 4: Kassarit af hermdum gögnum. 

12

ii) Dreififall úrtaks (e. empirical cumulative distribution function) 

Dreififall úrtaks gefur mat á dreififalli, F(x) = Pr(X ≤ x), fyrir bæði samfelldar og strjálar 

breytur. Það byggir á röðuðum gildum úrtaksins, það er, x(1) < x(2) < ... < x(n), þar sem 

matið á dreififallinuF(x) er 

⎧ 

⎪⎨ 

0, ef x < x(1), 

ˆF(x) = j/n, ef x(j) ≤ x < x(j+1), j = 1,...,n−1, 

⎪⎩ 

1 ef x ≥ x(n). 

Mynd 5 sýnir dreififall úrtaks fyrir gögnin um meðalhita nokkurra fylkja. Lokaður hringur 

táknar að endapunktur sé meðtalinn á tilsvarandi bili en opinn hringur táknar að endapunktur 

sé ekki meðtalinn á bilinu. 

Mat á F(x) 

1 

0.9 

0.8 

0.7 

0.6 

0.5 

0.4 

0.3 

0.2 

0.1 

0 

25 30 35 40 45 50 


55 60 65 70 75 

Mynd 5: Dreififall úrtaks af gögnum um meðalhita nokkurra fylkja. 

13

2 Dreifing lýsistærða 

2.1 Slembiúrtak og lýsistærðir 

SKILGREINING. Látum X1, X2, ..., Xn vera óháðar slembistærðir sem fylgja sömu dreif- 

inguF . Við segjum að saman myndiX1,X2, ...,Xn slembiúrtak úrF . 

SKILGREINING. Lýsistærð (e. sampling statistic) er stærð (formúla) sem byggir á slembiúr- 

taki. Lýsistærð er því slembistærð. 

Ef við gerum ráð fyrir að dreifingunniF sé lýst með falli sem er háð einum eða fleiri stikum 

þá er markmiðið að nota slembiúrtak úr F til að meta stikana í F . Lýsistærð byggir á 

slembiúrtakinu og við viljum finna út hvernig við getum notað eiginleika lýsistærðarinnar til 

að meta stikana í F . Lýsistærð er slembistærð sem hefur dreifingu, meðalgildi, dreifni og 

svo framvegis. 

2.2 Meðaltal slembiúrtaks 

SKILGREINING. Látum X1, X2, ..., Xn vera slembiúrtak úr dreifingu F með meðalgildiµ 

og dreifniσ 2 . Meðaltal slembiúrtaks, táknað ¯ X, er lýsistærð sem er skilgreind með 

¯X = 1 

n 

n 

Xi. 

Meðaltal slembiúrtaks er dæmi um lýsistærð. Hér fyrir neðan er meðalgildi og dreifni ¯ X 

fundið. Gerum ráð fyrir að X1, X2, ..., Xn myndi slembiúrtak úr dreifingu F , og að meðal- 

gildi og dreifni F séu µ ogσ 2 , það er 

i=1 

E(Xi) = µ, var(Xi) = σ 2 < ∞, i = 1,...,n. 

Það að X1, X2, ..., Xn myndi slembiúrtak fellur einnig í sér að slembibreyturnar eru inn- 

byrðis óháðar. Út frá þessum staðreyndum reiknum við meðalgildi ¯ X 

E 

 

n 

 

X¯ 1 

= E Xi = 

n 

1 

n E 

 

n 

 

Xi 

i=1 

14 

i=1

og dreifni ¯ X 

= 1 

n 

n 

i=1 

= 1 

 

n 

 

var Xi = 

n2 i=1 

1 

n2 E(Xi) = 1 

n 

var ¯ X = var 

= 1 

n 2 

n 

i=1 

 

1 

n 

µ = 1 

nµ = µ, 

n 

n 

i=1 

Xi 

 

n 

var(Xi) (X-in eru innibyrðis óháð) 

i=1 

n 

i=1 

SETNING. Meðalgildi og dreifni ¯ X eru 

σ 2 = 1 

n 2nσ2 = σ2 

n . 

E ¯ X = µ, var ¯X = σ 2 

n . 

Þar sem meðalgildi eða væntigildi ¯ X er µ þá getum við notað ¯ X til að meta µ. Dreifni ¯ X 

minnkar eftir því sem n stækkar. Því fáum við betra mat áµeftir því sem n stækkar (að því 

gefnu að σ 2 < ∞). 

2.3 Höfuðmarkgildisreglan 

SETNING. (Höfuðmarkgildisreglan) Látum X1, X2, ..., Xn vera slembiúrtak úr dreifingu 

F . Meðalgildi og dreifni dreifingarinnar F er táknað með µ og σ 2 (σ 2 < ∞). Þá má nálga 

dreifingu 

W = X1 +X2 +...+Xn = 

með normaldreifingu með meðalgildinµ og dreifni nσ 2 ef n er nægjanlega stórt. 

Byggt á höfuðmarkgildisreglunni má nálga dreifingu 

n 

i=1 

Xi 

¯X = 1 

n (X1 +X2 +...+Xn) = 1 

n W 

með normaldreifingu með meðalgildiµog dreifniσ 2 /n efner nægjanlega stórt. Ef dreifing 

W er því sem næst normaldreifing þá hefur dreifing ¯ X = n −1 W sömu lögun og dreifingW , 

er einfaldlega kvörðuð útgáfa af dreifingu W . 

15

eða 

eða 

LátumZ ∼ N(0,1). Þá má rita 

 

X1 +...+Xn −nµ 

Pr 

σ √ 

≤ x ≈ Pr(Z ≤ x) 

n 

−1 n (X1 +...+Xn)−µ 

Pr 

n−1σ √ 

≤ x ≈ Pr(Z ≤ x) 

n 

 

¯X −µ 

Pr 

σ/ √ 

≤ x ≈ Pr(Z ≤ x). 

n 

Líkurnar á að ¯ X sé minna eða jafnt og einhver talaumá nálga með 

Pr( ¯ 

¯X −µ 

X ≤ u) = Pr 

σ/ √ u−µ 

≤ 

n σ/ √ 

≈ Pr Z ≤ 

n 

u−µ 

σ/ √ 

. 

n 

Yfirleitt fæst góð nálgun ef n > 30 en í mörgum tilfellum dugar minna n. Ef X1, ..., Xn 

fylgja normaldreifingu þá fylgir ¯ X normaldreifingu fyrir ölln ≥ 1. 

Dæmi. Látum Xi tákna líftíma i-tu ljósaperunnar þar sem X1, ..., Xn mynda slembi-úrtak 

úr veldisdreifingu 

Xi ∼ Expon(λ = 1/2), i = 1,...,n, 

E(Xi) = µ = 1/λ = 2 mánuðir, var(Xi) = σ 2 = 1/λ 2 = 2 2 mánuðir 2 . 

Hverjar eru líkurnar á að meðallíftímin = 49 ljósapera sé lengri en 2,5 mánuðir? 

Pr( ¯ X > 2,5) = 1−Pr( ¯ 

¯X −µ 

X ≤ 2,5) = 1−Pr 

σ/ √ 2,5−µ 

≤ 

n σ/ √ 

n 

 

¯X −2 

= 1−Pr 

2/ √ 2,5−2 

≤ 

49 2/ √ 

≈ 1−Pr Z ≤ 

49 

1/2 

 

= 1−Pr(Z ≤ 7/4) 

2/7 

= 1−Pr(Z ≤ 1,75) = 1−0,9599 = 0,0401. 

Nákvæmt gildi á líkunum Pr( ¯ X > 2,5) er 0,0476. Nálgun er því viðunandi góð fyrir n af 

þessari stærðargráðu þegarX-in fylgja veldisdreifingu. 

Mynd 6 sýnir dreifingu ¯ X fyrir nokkur mismunandinþegar X-in fylgja veldisdreifingu 

með meðalgildi 2. Á myndinni má sjá hvernig dreifing ¯ X færist nær því að líkjast normal- 

dreifingu með meðalgildi 2 eftir því sem n vex. 

16

f(xbar) 

1 

0.9 

0.8 

0.7 

0.6 

0.5 

0.4 

0.3 

0.2 

0.1 

X i ~ exp(λ=0.5), i=1,...,n, E(X i )=2, Var(X i )=4 

0 

0 1 2 3 4 5 

xbar 

6 7 8 9 10 

Mynd 6: Dreifing ¯ X þegarX-in fylgja veldisdreifingu fyrir nokkur mismunandin. 

n=20 

n=10 

n=5 

n=1 

Mynd 7 sýnir einnig dreifingu ¯ X fyrir nokkur mismunandi n þegar X-in fylgja veldis- 

dreifingu með meðalgildi 2. Brotna punktalínan sýnir normaldreifingu með sama meðalgildi 

og sömu dreifni og dreifing ¯ X og gefur hugmynd um hversu góða nálgun normaldreifing 

gefur. Á mynd 7 má sjá að eftir því sem n vex þeim mun betri verður nálgun með normal- 

dreifingu. 

2.4 Dreifni slembiúrtaks 

SKILGREINING. Látum X1, X2, ..., Xn vera slembiúrtak úr dreifingu F með meðalgildiµ 

og dreifniσ 2 . Dreifni slembiúrtaks, táknað S 2 , er lýsistærð sem er skilgreind með 

Lýsistærðin 

S 2 = 1 

n−1 

er kölluð staðalfrávik slembiúrtaks. 

n 

(Xi − ¯ X) 2 , n ≥ 2. 

i=1 

S = √ S 2 

17

f(xbar) 

f(xbar) 

f(xbar) 

2 

1.5 

1 

0.5 

n=1 

0 

0 1 2 3 4 

2 

1.5 

1 

0.5 

n=10 

0 

0 1 2 3 4 

2 

1.5 

1 

0.5 

n=50 

0 

0 1 2 

xbar 

3 4 

2 

1.5 

1 

0.5 

n=5 

0 

0 1 2 3 4 

2 

1.5 

1 

0.5 

n=25 

0 

0 1 2 3 4 

2 

1.5 

1 

0.5 

n=75 

0 

0 1 2 

xbar 

3 4 

Mynd 7: Dreifing ¯ X þegar úrtakið er af stærðn = 1,5,10,25,50,75, ogX-in fylgja veldis- 

dreifingu (samfelldu línurnar) ásamt nálgun á dreifingunum með normaldreifingum (brotnu 

punktalínurnar). 

SETNING. VæntigildiS 2 er 

Sönnun. Höfum að 

og því 

E(S 2 ) = σ 2 . 

n 

(Xi − ¯ X) 2 = 

i=1 

(n−1)S 2 = 

n 

X 2 i −n ¯ X 2 

i=1 

n 

X 2 i −n ¯ X 2 . 

i=1 

Einnig gildir að ef Y er slembibreyta þá gildir að 

Því er 

E(Y 2 ) = var(Y)+{E(Y)} 2 . 

E{(n−1)S 2 

n 

} = E X 2 i −n ¯ X 2 

 

18 

i=1

Og því er 

= 

n 

E(X 2 i)−nE( ¯ X 2 ) 

i=1 

= nE(X 2 1 )−n[var( ¯ X)+{E( ¯ X)} 2 ] 

= n[var(X1)+{E(X1)} 2 ]−n[σ 2 /n+µ 2 ] 

= n[σ 2 +µ 2 ]−σ 2 −nµ 2 

= nσ 2 +nµ 2 −σ 2 −nµ 2 = (n−1)σ 2 . 

E(S 2 ) = σ 2 . 

Hér eru nokkrar athugasemdir. Ef við notumnístað (n−1) fæst 

 

n 1 

E (Xi − 

n 

¯ X) 2 

 

= (n−1) 

σ 

n 

2 . 

Efµer þekkt þá notum viðnístað(n−1), það er, 

 

n 1 

E (Xi −µ) 

n 

2 

 

= σ 2 . 

Um staðalfrávikið gildir að 

i=1 

i=1 

ÞegarX-in fylgja normaldreifingu gildir að 

E(S) = σ. 

Γ(n/2) 

E(S) = σ 

√ 2 

Γ((n−1)/2) √ n−1 . 

2.5 Skilgreiningar áz-dreifingu,χ 2 -dreifingum,t-dreifingum ogF -dreifingum 

2.5.1 z-dreifing (stöðluð normaldreifing) 

Samfellda slembistærðinZ fylgir staðlaðri normaldreifingu, ritað 

ef þéttleikiZ er á forminu 

Z ∼ N(0,1) 

fZ(z) = 1 

√ 2π e −z2 /2 , −∞ < z < ∞. 

19

Dreififall Z er táknað meðΦ(z) þar sem 

UmZ gildir að 

Skilgreinum tölunazα með 

það er 

Φ(z) = Pr(Z ≤ z) = 

z 

−∞ 

fZ(z)dz, −∞ < z < ∞. 

E(Z) = 0, var(Z) = 1. 

zα = 100(1−α)-ta sætisstærðin í staðlaðri normaldreifingu 

Pr(Z ≤ zα) = Φ(zα) = 1−α. 

Tafla A1 bls. 612 í Ross gefur gildi á Φ(z) fyrir valinz á bilinu 0 til3,49. Tafla A3 bls. 614 

í Ross gefur gildi á zα fyrir valin α, sjá neðstu línuna í töflu A3 þar sem n = ∞. Mynd 8, 

efst til vinstri, sýnir staðlaða normaldreifingu. 

2.5.2 χ 2 -dreifingar (kí-kvaðratsdreifingar) 

Samfellda slembistærðinY fylgir kí-kvaðratsdreifingu meðr frítölur, ritað 

efY hefur sömu dreifingu og 

þar sem Z1, ...,Zr eru óháðar og 

ÞéttleikiY er á forminu 

fY(y) = 

Y ∼ χ 2 r 

Z 2 1 +...+Z 2 r = 

r 

j=1 

Z 2 j 

Zj ∼ N(0,1), j = 1,...,r. 

1 

Γ(r/2)2 r/2yr/2−1 e −y/2 , 0 ≤ y < ∞, 

20

þar sem Γ(·) er kallað gamma-fallið og er skilgreint sem 

UmY gildir að 

Skilgreinum tölunaχ 2 α,r með 

það er 

∞ 

Γ(α) = 

0 

u α−1 e −u du. 

E(Y) = r, var(Y) = 2r. 

χ 2 α,r = 100(1−α)-ta sætisstærðin í χ2 -dreifingu með r frítölur 

Pr(Y ≤ χ 2 α,r ) = 1−α. 

Tafla A2 bls. 613 í Ross gefur gildi á χ 2 α,r fyrir valinαog r. Mynd 8, neðst til vinstri, sýnir 

kí-kvaðratsdreifingar með 5, 10 og 20 frítölur. 

2.5.3 t-dreifingar 

Samfellda slembistærðinT fylgirt-dreifingu meðr frítölur, ritað 

efT hefur sömu dreifingu og 

þar sem Z og Y eru óháðar og 

ÞéttleikiT er á forminu 

UmT gildir að 

fT(t) = 

T ∼ tr 

Z 

Y/r 

Z ∼ N(0,1), Y ∼ χ 2 r . 

Γ((r +1)/2) 

√ rπΓ(r/2) (1+t 2 /r) −(r+1)/2 , −∞ < t < ∞. 

E(T) = 0, r > 1, var(T) = r 

, r > 2. 

r −2 

21

Skilgreinum tölunatα,r með 

það er 

tα,r = 100(1−α)-ta sætisstærðin ít-dreifingu með r frítölur 

Pr(T ≤ tα,r) = 1−α. 

Tafla A3 bls. 614 í Ross gefur gildi á tα,r fyrir valin α og r. Mynd 8, efst til hægri, sýnir 

t-dreifingar með 1 og 5 frítölur. 

2.5.4 F -dreifingar 

Samfellda slembistærðinF fylgirF -dreifingu með r og s frítölur, ritað 

efF hefur sömu dreifingu og 

þar sem V og W eru óháðar og 

ÞéttleikiF er á forminu 

fF(x) = 

UmF gildir að 

F ∼ Fr,s 

V/r 

W/s 

V ∼ χ 2 r , W ∼ χ2 s . 

Γ((r +s)/2)(r/s)r/2 

x 

Γ(r/2)Γ(s/2) 

r/2−1 {1+x(r/s)} −(r+s)/2 , 0 ≤ x < ∞. 

E(F) = s 

s−2 , s > 2, var(F) = 2s2 (r +s−2) 

r(s−4)(s−2) 2, 

s > 4. 

Skilgreinum tölunaFα,r,s með 

það er 

Fα,r,s = 100(1−α)-ta sætisstærðin íF -dreifingu meðr ogsfrítölur 

Pr(F ≤ Fα,r,s) = 1−α. 

Tafla A4 bls. 615 í Ross gefur gildi á Fα,r,s fyrir valin α, r og s. Mynd 8, neðst til hægri, 

sýnirF -dreifingu með frítölurr = 10 ogs = 20. 

22

f Z (z) 

f χ (χ) 

0.4 

0.3 

0.2 

0.1 

0 

−5 0 

z 

5 

0.15 

0.1 

0.05 

0 

0 10 20 30 40 

χ 

f T (t) 

f F (f) 

0.4 

0.3 

0.2 

0.1 

0 

−5 0 

t 

5 

1 

0.8 

0.6 

0.4 

0.2 

0 

0 1 2 3 4 

f 

Mynd 8: Stöðluð normaldreifing (efst til vinstri), t-dreifingar með 1 og 5 frítölur (efst til 

hægri), kí-kvaðratsdreifingar með 5, 10 og 20 frítölur (neðst til vinstri) og F -dreifing með 

frítölurr = 10 ogs = 20 (neðst til hægri). 

2.6 Dreifing lýsistærða sem byggðar eru á slembiúrtaki úr normal- 

dreifingu 

SETNING. LátumX1, ..., Xn vera slembiúrtak úr normaldreifingu 

Þá eru ¯ X og S 2 óháðar, og 

Xi ∼ N(µ,σ 2 ), i = 1,...,n. 

 

¯X ∼ N µ, σ2 

 

, 

n 

(n−1)S 2 

σ 2 

∼ χ 2 n−1 . 

Setningin gefur dreifingu ¯ X ogS 2 þegar slembiúrtakið er úr normaldreifingu. Athugið að ¯ X 

ogS 2 eru óháðar aðeins ef slembiúrtakið er úr normaldreifingu. Í raun er ótrúlegt að ¯ X ogS 2 

geti verið óháðar. Út frá setningunni má finna væntigildi og dreifni S 2 þegar slembiúrtakið 

23

er úr normaldreifingu. Höfum að 

2 (n−1)S 

E 

σ2 2 (n−1)S 

= n−1, var 

σ2 

= 2(n−1), 

og því 

E(S 2 ) = σ 2 , var(S 2 ) = 2σ4 

n−1 . 


Þá gildir að 


Xi ∼ N(µ,σ 2 ), i = 1,...,n. 

T = ( ¯ X −µ) 

S/ √ n 

Z = ( ¯ X −µ) 

σ/ √ n 

Y = (n−1)S2 

σ 2 

∼ tn−1 

∼ N(0,1), 

∼ χ 2 n−1 . 

Þessar tvær stærðir eru óháðar því þær eru skalaðar útgáfur af ¯ X og S 2 en þær eru óháðar 

samkvæmt setningunni hér á undan. Því er 

Z 

Y/(n−1) = 

√ n( ¯ X −µ)/σ 

(n−1)S 2 σ −2 /(n−1) 

= ( ¯ X −µ) 

S/ √ n ∼ tn−1. 


Xi ∼ N(µ1,σ 2 1 ), i = 1,...,n, 

og látumY1, ..., Ym vera slembiúrtak úr normaldreifingu 

þar sem X-in eru óháð Y -unum. Látum 

S 2 1 

= 1 

n−1 

Yi ∼ N(µ2,σ 2 2 ), i = 1,...,m, 

n 

(Xi − ¯ X) 2 , S 2 2 

i=1 

24 

= 1 

m−1 

m 

(Yi − ¯ Y) 2 . 

i=1

Þá gildir 


V = (n−1)S2 1 

σ 2 1 

F = S2 1 /σ2 1 

S 2 2 /σ2 2 

∼ Fn−1,m−1. 

∼ χ 2 n−1 , W = (m−1)S2 2 

σ 2 2 

∼ χ 2 m−1 , 

ogV ogW eru óháðar slembibreytur þar semX-in eru óháðY-unum. Samkvæmt skilgrein- 

ingunni hér að ofan umF -dreifingar, gildir að 

V/(n−1) 

W/(m−1) = (n−1)S2 1σ−2 1 /(n−1) 

(m−1)S 2 2σ −2 

2 /(m−1) = S2 1 /σ2 1 

S2 2/σ2 2 

25 

∼ Fn−1,m−1.

3 Metlar og punktmat 

3.1 Almennt um metla og punktmat 

Sambandinu á milli líkindafræði og ályktunartölfræði má lýsa með framsetningunni hér fyrir 

neðan. Líkindafræðin lýsir hegðun úrtaksins úr gefnu þýði. Ályktunartölfræðin gengur út á 

að nota úrtakið til að læra um þýðið. 

↑ → Líkindafræði → ↓ 

↑ ↓ 

ÞÝÐI ÚRTAK 

↑ ↓ 

↑ ← Ályktunartölfræði ← ↓ 

SKILGREINING. Punktmat (e. point estimate) á stikanum θ er tala sem er „góð ágiskun“ 

á rétta gildi θ. Punktmatið er reiknað með því að setja fengin gildi í úrtakinu inn í formúlu. 

Þegar formúlan inniheldur stærðirnar í slembiúrtakinu er hún kölluð metill (e. estimator) 

stikansθ. Metill er því slembistærð. 

Dæmi. Viljum meta µ í normaldreifingu. Höfum úrtak af stærð n = 3 úr normaldreifingu 

þar sem fengin gildi eru 

x1 = 5,6, x2 = 9,1, x3 = 8,5. 

LátumX1,X2 ogX3 tákna slembiúrtak úr normaldreifingu. Notum 

sem metil fyrirµ. Aftur á móti er 

¯x = 1 

3 

3 

i=1 

¯X = 1 

3 

3 

i=1 

Xi 

xi = 1 

(5,6+9,1+8,5) = 7,73 

3 

26

punktmatið á stikanumµbyggt á úrtakinu hér að ofan. 

3.2 Hugmyndin að baki aðferð sennilegustu gilda 

Dæmi. 3 kúlur í kassa. 

2. 

- Höfum 3 kúlur í lokuðum kassa. 

- Kúlurnar eru rauðar eða hvítar. 

- Drögum þrisvar sinnum en skilum kúlu tilbaka í hvert skipti. 

- LátumX = fjölda rauðra kúla af þremur. 

- Því er X ∼ Bin(3,p). 

- Möguleg gildi áperu; p = 0, p = 1/3,p = 2/3, p = 1. 

- Mögulegar dreifingar fyrir X, það er, líkurnar á X = x fyrir gefið p, eru gefnar í töflu 

Tafla 2: Líkurnar á að X = x fyrirp = 0, p = 1/3,p = 2/3 ogp = 1. 

Pr(X = x|p) x = 0 x = 1 x = 2 x = 3 

p = 0 1 0 0 0 

p = 1/3 8/27 12/27 6/27 1/27 

p = 2/3 1/27 6/27 12/27 8/27 

p = 1 0 0 0 1 

Athugið að líkurnar í töflunni eru reiknaðar með líkindafalli tvíkostadreifingarinnar þegar 

n = 3, það er, 

Pr(X = x|p) = 

 

3 

p 

x 

x (1−p) 3−x = 

3! 

(3−x)!x! px (1−p) 3−x , x = 0,1,2,3. 

Gerum ráð fyrir að við vitum ekki gildi p. Ef við fáum X = 1, hvað er sennilegasta gildið 

á p? Mynd 9 sýnir líkurnar á að X = 1 fyrir möguleg gildi á p. Af mynd 9 og töflunni 

hér að ofan er ljóst að p = 1/3 gefur stærsta gildið á Pr(X = 1|p). Því segjum við að fyrir 

ofangreinda útkomu úr tilrauninni (X = 1) þá er sennilegasta gildið á p jafnt 1/3. Athugið 

27

að stundum er ritað 

P(X=1|p) 

0.5 

0.45 

0.4 

0.35 

0.3 

0.25 

0.2 

0.15 

0.1 

0.05 

0 

3.3 Aðferð sennilegustu gilda 

f(x|p) = Pr(X = x|p). 

0 0.1 0.2 0.3 0.4 0.5 

p 

0.6 0.7 0.8 0.9 1 

Mynd 9: Líkurnar Pr(X = 1|p) sem fall af p. 

SKILGREINING. Látum X1, ..., Xn vera samfelldar (strjálar) slembibreytur sem hafa sam- 

þéttifall (samlíkindafall) sem er háð stikavigrinumθ = (θ1,...,θm) T , ritað 

f(x1,...,xn|θ). 

Fyrir tiltekna útkomu; X1 = x1, ..., Xn = xn, má líta á f sem fall af θ. Köllum fallið 

sennileikafall θ (e. the likelihood function of θ) ritað L(θ|x1,...,xn) eða einfaldlega L(θ). 

Látumx = (x1,...,xn) T , en þá má rita 

L(θ) = L(θ|x1,...,xn) = f(x1,...,xn|θ) 

= L(θ|x) = f(x|θ). 

28

Lograsennileikafallθ, ritaðl(θ), er skilgreint sem 

l(θ) = ln{L(θ)}. 

SKILGREINING. Punktmatið ˆ θ = ˆ θ(x) sem hámarkar sennileikafallið, L(θ|x), fyrir gefið 

x, nefnist sennileikamat θ (e. maximum likelihood estimate of θ). Metillinn ˆ θ = ˆ θ(X), 

X = (X1,...,Xn) T nefnist sennileikametillθ (e. maximum likelihood estimator ofθ). 

Athugið að ef X1, X2, ..., Xn eru óháðar samfelldar (eða strjálar) slembibreytur þar sem 

hvertXi hefur þéttleika (eða líkindafall) 

fi(xi|θ), i = 1,2,...,n, 

þar sem θ er eins og áður stikavigur af lengdm, þá má rita sennileikafallθ, L(θ) sem 

og lograsennileikafallθ, l(θ), sem 

L(θ) = 

n 

fi(xi|θ) 

i=1 

l(θ) = ln{L(θ)} = 

n 

ln{fi(xi|θ)}. 

Dæmi. Finnið sennileikametil θ, það er ˆ θ, fyrir eftirfarandi tilvik. Látum X1, X2, ..., Xn 

vera slembiúrtak úr dreifingu sem er þannig að þéttleiki hversXi,i = 1,...,n, er gefinn með 

⎧ 

⎨ θx 

fi(xi|θ) = 

⎩ 

θ−1 

i , ef0≤xi ≤ 1, 

0, annars, 

fyrirθ > 0. SamþéttifallX1, ..., Xn er 

f(x1,...,xn|θ) = 

= 

n 

i=1 

θx θ−1 

i 

i=1 

n 

fi(xi|θ) 

i=1 

= L(θ|x). 

Hér höfum við því sennileikafallið,L(θ|x), og lograsennileikafallið er 

 

n 

 

l(θ|x) = ln{L(θ|x)} = ln 

29 

i=1 

θx θ−1 

i

= 

= 

n 

ln(θ)+ 

i=1 

n 

i=1 

ln(θx θ−1 

i ) = 

n 

i=1 

{ln(θ)+ln(x θ−1 

i )} 

n 

(θ −1)ln(xi) = nln(θ)+(θ−1) 

i=1 

= nln(θ)+θ 

n 

ln(xi)− 

i=1 

n 

ln(xi). 

Hér að ofan eru notaðar eftirfarandi reglur um náttúrulega lografallið 

i=1 

ln(ab) = ln(a)+ln(b), ln(c d ) = dln(c). 

n 

ln(xi) 

Næsta skref er að hámarka L(θ|x) með tilliti til θ. Athugið að það θ ∗ sem hámarkar 

L(θ|x) hámarkar einnig l(θ|x). Oft er léttara að hámarka l(θ|x) heldur en L(θ|x). Diffrum 

l(θ|x) með tilliti tilθ 

∂l(θ|x) 

∂θ 

Setjum∂l(θ|x)/∂θ = 0, og leysum fyrirθ 

∂l(θ|x) 

∂θ 

= n 

θ + 

= n 

θ + 

n 

ln(xi)−0. 

i=1 

n 

ln(xi) = 0. 

Þá fæst að sennileikamatið áθ (sem er þaðθsem hámarkarl(θ)) fyrir fengin gildixer gefið 

með 

Því er sennileikametillθ gefinn með 

ˆθ = ˆ θ(x) = 

ˆθ = ˆ θ(X) = 

i=1 

(−n) 

. 

ln(xi) 

n 

i=1 

n 

i=1 

(−n) 

. 

ln(Xi) 

Dæmi - framhald. Fengum eftirfarandi gildi áX1, ...,X6, n = 6, 

i=1 

x1 = 0,6720, x2 = 0,8312, x3 = 0,8853, 

x4 = 0,1694, x5 = 0,8210, x6 = 0,2989. 

Sennileikamatið (punktmatið) áθ í þessu tilfelli er því 

ˆθ = 

(−6) 

6 = 1,5446. 

i=1ln(xi) 30

l(θ)=ln{L(θ)} 

0.5 

0.4 

0.3 

0.2 

0.1 

θ mle =1.5446 

0 

1 1.1 1.2 1.3 1.4 1.5 

θ 

1.6 1.7 1.8 1.9 2 

Mynd 10: Lograsennileikafalliðl(θ) sem fall afθ. 

Mynd 10 sýnirl(θ) sem fall afθ. Á myndinni sést að fallið er í hámarki þegarθ = 1,5446. 

Dæmi - Tvíkostadreifingin. X ∼ Bin(n,p), n þekkt,póþekkt. X hefur líkindafallið 

Pr(X = x) = f(x|p) = 

 

n 

p 

x 

x (1−p) n−x , x = 0,1,2,...,n. 

Eins og áður erL(p|x) = f(x|p) og lograsennileikafallið er 

l(p|x) = ln{L(p|x)} = ln 

Diffruml(p|x) með tilliti tilp 

 

n 

p 

x 

x (1−p) n−x 

 

= ln 

∂l(p|x) 

∂p 

Setjum∂l(p|x)/∂p = 0, og leysum fyrirp 

Þá fæst 

∂l(p|x) 

∂p 

x (n−x) 

= 0+ − 

p (1−p) . 

x (n−x) 

= − 

p (1−p) 

x 

p 

= (n−x) 

(1−p) , 

31 

 

n 

+xln(p)+(n−x)ln(1−p). 

x 

= 0.

sem jafngildir 

Sennileikamatið ápfyrir gefið gildixer því 

Og sennileikametillp er því gefinn með 

x−xp = np−xp, eða x = np. 

ˆp = ˆp(x) = x 

n . 

ˆp = ˆp(X) = X 

n . 

Dæmi - Poisson-dreifingin. Látum X1, ..., Xn vera slembiúrtak úr dreifingu sem er þannig 

að, Xi ∼ Poisson(λ), i = 1,...,n, ogλ > 0 er óþekkt. Líkindafall hversXi er gefið með 

Pr(Xi = xi) = fi(xi|λ) = e−λλxi , xi = 0,1,2,...,∞, i = 1,...,n. 

xi! 

SamlíkindafallX1, ...,Xn er 

f(x1,...,xn|λ) = 

= 

Því er lograsennileikafallλgefið með 

i=1 

n 

fi(xi|λ) 

i=1 

n e−λλxi = L(λ|x). 

xi! 

l(λ|x) = ln{L(λ|x)} = ln 

= 

= 

= 

n 

i=1 

n 

ln(e −λ )+ 

i=1 

n 

(−λ)+ 

i=1 

n 

i=1 

ln{e −λ λ xi (xi!) −1 } 

n 

ln(λ xi )+ 

i=1 

n 

xiln(λ)+ 

i=1 

= −nλ+ln(λ) 

n 

i=1 

32 

xi − 

e −λ λ xi (xi!) −1 

 

n 

ln{(xi!) −1 } 

i=1 

n 

{−ln(xi!)} 

i=1 

n 

ln(xi!). 

i=1

Diffruml(λ|x) með tilliti tilλ 

∂l(λ|x) 

∂λ 

Setjum∂l(λ|x)/∂λ = 0, og leysum fyrirλ 

∂l(λ|x) 

∂λ 

= −n+λ−1 

= −n+λ−1 

Þá fæst að sennileikamatið á λ fyrir fengin gildixer 

Því er sennileikametillλgefinn með 

ˆλ = ˆ λ(x) = 1 

n 

ˆλ = ˆ λ(X) = 1 

n 

n 

i=1 

xi −0. 

n 

xi = 0. 

i=1 

n 

xi. 

i=1 

n 

Xi. 

Dæmi - Normaldreifingin. (Sjá dæmi 7.2e í Ross, bls. 236). Látum X1, ..., Xn vera 

slembiúrtak úr normaldreifingu; Xi ∼ N(µ,σ 2 ), i = 1,...,n, þar sem µ og σ eru óþekkt. 

Sennileikametlarµogσ eru gefnir með 

ˆµ = ˆµ(X) = 1 

n 

i=1 

n 

Xi, ˆσ = ˆσ(X) = 

i=1 

 

1 

n 

n 

(Xi − ¯ X) 2 

i=1 

1/2 

SETNING. (The Invariance Principle) (ekki í Ross). Látum ˆ θ1, ..., ˆ θm vera senni-leikametla 

fyrir stikanaθ1, ...,θm. Þá er sennileikametillinn fyrir falliðh(θ1,...,θm) gefinn meðh( ˆ θ1,..., ˆ θm). 

Dæmi - Normaldreifingin - framhald. Látum ˆµ og ˆσ vera metlana sem gefnir voru hér að 

ofan. Sennileikametlarnir fyrirσ 2 og µ+2σ eru 

3.4 Eiginleikar metla 

(ˆσ) 2 , og ˆµ+2ˆσ. 

Látum X1, ..., Xn vera slembiúrtak úr dreifingu F sem er stikuð með stikanum θ (og hugs- 

anlega öðrum stikum). Ef ˆ θ(X) er metill fyrirθ þá höfum við áhuga á 

33 

.

i) E{ ˆ θ(X)}, væntigildi metilsins 

ii) var{ ˆ θ(X)}, dreifni metilsins 

iii) E[{ ˆ θ(X)−θ} 2 ], meðalferskekkju metilsins, (sjá skilgreiningu síðar) 

iv) Dreifingu ˆ θ(X) 

SKILGREINING. Látum ˆ θ(X) vera metil fyrirθ. Þá er stærðin 

bθ{ ˆ θ(X)} = E{ ˆ θ(X)}−θ 

kölluð bjagi (e. bias) metilsins ˆ θ(X). Ef bθ{ ˆ θ(X)} = 0 fyrir öll θ, þá er ˆ θ(X) sagður 

óbjagaður (e. unbiased) metill fyrirθ en bjagaður (e. biased) annars. 

Dæmi - tvíkostadreifingin, framhald. X ∼ Bin(n,p), og ˆp(X) = X/n er sennileikametillp 

(n þekkt, p óþekkt). Þá er bjagi ˆp(X) 

Því er ˆp(X) óbjagaður metill fyrirp. 

bp{ˆp(X)} = E{ˆp(X)}−p = E(X/n)−p 

= E(X)/n−p = np/n−p = 0. 

SKILGREINING. Látum ˆ θ(X) vera metil fyrirθ. Þá er stærðin 

rθ{ ˆ θ(X)} = E[{ ˆ θ(X)−θ} 2 ] 

kölluð meðalferskekkja (e. mean square error) metilsins ˆ θ(X), og 

er dreifni metilsins ˆ θ(X). 

var{ ˆ θ(X)} = E[{ ˆ θ(X)−E{ ˆ θ(X)}} 2 ] 

Útfrá skilgreiningunum hér að ofan má sýna að (sjá Ross, bls. 269) 

rθ{ ˆ θ(X)} = var{ ˆ θ(X)}+bθ{ ˆ θ(X)} 2 . 

Ef ˆ θ(X) er óbjagaður metill fyrirθ, það er, bθ{ ˆ θ(X)} = 0, þá gildir að 

rθ{ ˆ θ(X)} = var{ ˆ θ(X)}. 

34

Dæmi - tvíkostadreifingin, framhald. X ∼ Bin(n,p), ˆp(X) = X/n. Meðalferskekkja ˆp(X) 

er 

rp{ˆp(X)} = var{ˆp(X)}+bp{ˆp(X)} 2 

= var(X/n)+0 2 = 1 

var(X) 

n2 = 1 p(1−p) 

n2np(1−p) = . 

n 

Ákjósanlegur metill fyrir einhvern stikaθ er metill sem er óbjagaður með minnstu mögu- 

legu dreifni. Í mörgum tilfellum er hægt að finna metil af þessu tagi. Annar ákjósanlegur 

metill fyrir θ er metill sem gefur minnstu mögulegu meðalferskekkju. Í fæstum tilfellum er 

hægt að finna metil af þessu tagi. 

Dæmi - 3 lögreglumenn á skotæfingu. Mynd 11 sýnir skotskífur þriggja lögreglumanna. Sá 

fyrsti hittir eins og óbjagaður metill með mikla dreifni. Lögreglumaðurinn sem er annar í 

röðinni hittir eins og metill sem hefur litla dreifni en er bjagaður. Sá þriðji hittir eins og 

metill sem hefur litla dreifni og er óbjagaður. 

1 2 

3 

1. óbjagaður, mikil dreifni 

2. bjagaður, lítil dreifni 

3. óbjagaður, lítil dreifni 

Mynd 11: Skotskífur þriggja lögreglumanna. 

35

SETNING. (Aðfellueiginleikar sennileikametla). Látum ˆ θn = ˆ θn(X) vera sennileikametil 

fyrir θ sem er byggður á slembiúrtaki af stærð n þar sem dreifing X-anna er aðeins fall af 

stikanumθ. Þá gildir um bjaga ˆ θn, bθ{ ˆ θn(X)}, að 

Um dreifni ˆ θn gildir að 

þar semn −1 σ 2 0 

bθ{ ˆ θn(X)} → 0 þegar n → ∞. 

nvar{ ˆ θn(X)} → σ 2 0 þegar n → ∞, 

er minnsta mögulega dreifni á meðal óbjagaðra metla fyrirθ þegar slembiúr- 

takið er af stærð n. Að því gefnu að um slembiúrtak sé að ræða (X-in eru óháð og fylgja 

nákvæmlega sömu dreifingu) (og að gefnum nokkrum skilyrðum ál(θ), þar á meðal að l(θ) 

sé tvídiffranlegt) þá er dreifninσ 2 0 

þar sem g(θ) er raunfall afθ. 

á forminu 

3.5 Línulegir óbjagaðir metlar 

σ 2 0 

= g(θ) 

Dæmi. Metum þyngd okkar með tveimur vogum. 

- Táknum þyngd okkar með µ,µóþekkt. 

- Höfum tvær vogir. Getum stigið einu sinni á hvora vog. 

- LátumX1 vera mælingu frá vog 1 og X2 frá vog 2. 

- Gerum ráð fyrir að X1 og X2 séu óháðar og að 

- σ 2 1 ogσ2 2 þekkt. 

E(X1) = E(X2) = µ, var(X1) = σ 2 1 , var(X2) = σ 2 2 . 

Notum línulegan metil (e. linear estimator) til að metaµ 

ˆµ(X1,X2) = λX1 +(1−λ)X2, λ ∈ [0,1]. 

36

Því gildir að 

E{ˆµ(X1,X2)} = λE(X1)+(1−λ)E(X2) = µ. 

Metillinn ˆµ(X1,X2) er því línulegur óbjagaður metill (e. linear unbiased estimator) fyrirµ. 

Við viljum lágmarka meðalferskekkju ˆµ(X1,X2) og því í raun dreifni ˆµ(X1,X2) þar sem 

ˆµ(X1,X2) er óbjagaður metill fyrirµ. Meðalferskekkja ˆµ(X1,X2) er 

rµ{ˆµ(X1,X2)} = var{ˆµ(X1,X2)} 

= var{λX1 +(1−λ)X2} = var{λX1}+var{(1−λ)X2} 

= λ 2 var(X1)+(1−λ) 2 var(X2) = λ 2 σ 2 1 +(1−λ) 2 σ 2 2. 

Lágmörkumrµ{ˆµ(X1,X2)} með tilliti tilλ 

∂rµ{ˆµ(X1,X2)} 

∂λ 

Setjum afleiðuna jafna 0 en þá fæst 

λ = σ2 2 

σ 2 1 +σ 2 2 

Ef til dæmisσ 2 1 = 1 2 og σ 2 2 = 2 2 þá fæst 

og 

og 

rµ{ˆµ(X1,X2)} = λ 2 σ 2 1 +(1−λ) 2 σ 2 2 = 

= ∂{λ2 σ 2 1 +(1−λ)2 σ 2 2 } 

∂λ 

= 2λσ 2 1 −2(1−λ)σ 2 2. 

1/σ 2 1 

= 

1/σ2 1 +1/σ2 = 

2 

λ = 4 1 

, 1−λ = 

5 5 

ˆµ(X1,X2) = 4 

5 X1 + 1 

5 X2 

2 4 

1 

5 

2 + 

σ −2 

1 

σ −2 

1 +σ −2 

2 

. 

2 1 

2 

5 

2 = 4 

5 < var(X1) = 1 

og því er dreifni metilsins ˆµ(X1,X2) minni en dreifni óbjagaða metilsins ˆµ ∗ (X1,X2) = X1 

fyrirµ(jafngildir því að nota aðeins vog 1 eða notaλ = 1). 

37

LátumX1, ...,Xn vera óháðar slembibreytur sem eru þannig að 

Látum ˆµ(X) vera línulegan metil á forminu 

E(Xi) = µ, i = 1,...,n, µ óþekkt. 

var(Xi) = σ 2 i , i = 1,...,n, σ2 i þekkt. 

ˆµ(X) = 

n 

λiXi. 

Viljum að ˆµ(X) sé óbjagaður metill fyrirµ. Því þarf að gilda umλ1, ...,λn að 

 

n 

 

n 

E{ˆµ(X)} = E = E(λiXi) 

Því þarf að gilda að 

= 

n 

λiE(Xi) = 

i=1 

i=1 

i=1 

λiXi 

n 

λiµ = µ 

i=1 

n 

λi = 1. 

i=1 

i=1 

n 

λi = µ. 

Þá má sýna að þau λ1, ..., λn sem uppfylla n 

i=1 λi = 1 og gefa minnstu meðalferskekkju 

rµ{ˆµ(X)} (og því í raun minnstu dreifni var{ˆµ(X)}) eru á forminu 

λi = 

σ −2 

i 

n k=1σ−2 k 

= 

i=1 

1/σ2 i n k=11/σ2 . 

k 

Lágmarks meðalferskekkja (lágmarks dreifni) ˆµ(X) er því 

rµ{ˆµ(X)} = var{ˆµ(X)} = var 

= 

= 

n 

λ 2 i var(Xi) = 

i=1 

n 

k=1 

σ −2 

k 

= 

−2 n 

i=1 

n 

k=1 

⎧ 

n ⎨ 

i=1 

n 

i=1 

⎩ σ−2 i 

σ −4 

i σ2 i = 

σ −2 

k 

−1 

38 

= 

λiXi 

n 

k=1 

n 

k=1 

1 

 

σ −2 

k 

σ −2 

k 

n i=1σ−2 i 

= 

n 

var(λiXi) 

i=1 

−1 ⎫ ⎬ 

⎭ 

2 

−2 n 

. 

i=1 

σ 2 i 

σ −2 

i

4 Öryggisbil 

4.1 Eiginleikar öryggisbila 

LátumX1, ..., Xn vera slembiúrtak úr normaldreifingu með stikaµogσ 2 . Þá hefur 

staðlaða normaldreifingu og 

Umritum 

Pr 

Z = ¯ X −µ 

σ/ √ n 

 

−1,96 ≤ ¯ X −µ 

σ/ √ 

≤ 1,96 = 0,95. 

n 

 

Pr −1,96 σ √ ≤ 

n ¯ X −µ ≤ 1,96 σ 

√ 

n 

 

= Pr − ¯ X −1,96 σ √ ≤ −µ ≤ − 

n ¯ X +1,96 σ 

√ 

n 

 

= Pr ¯X −1,96 σ √ ≤ µ ≤ 

n ¯ X +1,96 σ 

√ = 0,95. 

n 

Endapunktarnir( ¯ X −1,96σ/ √ n) og ( ¯ X +1,96σ/ √ n) eru slembibreytur. Bilið 

 

¯X −1,96 σ √ , 

n ¯ X +1,96 σ 

√ 

n 

er því í raun slembibil, og líkurnar á að µ sé á bilinu eru 0,95. 

SKILGREINING. LátumX1, ...,Xn vera slembiúrtak úr normaldreifingu með stikaµogσ 2 , 

og látum x1, ..., xn vera fengin gildi á X-unum. Gerum ráð fyrir að σ 2 sé þekkt. Þá er 95% 

öryggisbil (e. confidence interval) fyrirµskilgreint sem 

 

¯x−1,96 σ √ ,¯x+1,96 

n σ 

√ . 

n 

Athugasemd. Bilið hér að ofan er ekki slembibil heldur endanlega ákvarðað bil eftir að 

gögninx1, ...,xn hafa verið fengin í hendurnar. Hið sanna gildi áµer því annað hvort innan 

bilsins eða ekki. 

Dæmi. Gögn frá normaldreifingu, σ þekkt, σ = 1,6, n = 3, x1 = 21,7, x2 = 26,9, 

x3 = 25,9, 

¯x = (21,7+26,9+25,9)/3 = 24,83. 

39

95% öryggisbil fyrirµer því 

 

¯x−1,96 σ √ ,¯x+1,96 

n σ 

√ 

n 

 

24,83−1,96× 1,6 

√ ,24,83+1,96× 

3 1,6 

 

√ 

3 

(23,02,26,64). 

TÚLKUN Á ÖRYGGISBILUM. Það er ekki rétt að segja að það séu 95% líkur á því að µ 

sé innan útreiknaðs 95% öryggisbils. Öryggisbilið er endanlega ákvarðað bil eftir að gögnin 

x1, ..., xn hafa verið fengin í hendurnar og annað hvort er µ innan öryggisbilsins eða ekki. 

En hugsunin er sú að ef við reiknum 95% öryggisbil fyrirµaftur og aftur með nýju úrtaki af 

sömu stærð sem kemur úr nákvæmlega sömu dreifingu þá munu um 95% af öryggisbilunum 

innihaldaµog um 5% þeirra munu ekki innihaldaµ. 

Mynd 12 sýnir 95% öryggisbil frá normaldreifingu þegar hið sanna µ er 10, σ = 2 og 

n = 64. Á myndinni sést að af 40 öryggisbilum þá eru 3 öryggisbil sem innihalda ekki hið 

sanna gildi á µ. Þessi öryggisbil eru merkt með stjörnu. Athugið að fjöldi öryggisbila sem 

ekki inniheldur µ fylgir tvíkostadreifingu með stika m = 40 og p = 0,05. Væntigildið er 

mp = 2 öryggisbil sem ekki innihaldaµíþessu tilfelli. 

SKILGREINING. Látum X1, ..., Xn vera slembiúrtak úr normaldreifingu með stika µ og 

σ 2 , og látum x1, ..., xn vera fengin gildi á X-unum. Gerum ráð fyrir að σ 2 sé þekkt. Þá er 

100(1−α)% öryggisbil fyrirµskilgreint sem 

 

 

σ σ 

¯x−zα/2 √ ,¯x+zα/2 √ 

n n 

þar sem zα/2 er100(1−α/2)-ta sætisstærðin í staðlaðri normaldreifingu. 

Athugasemd. Umzα/2 gildir að 

Pr(Z > zα/2) = α/2, Pr(Z ≤ −zα/2) = α/2, 

þar sem Z fylgir staðlaðri normaldreifingu. 

40

Númer úrtaks 

40 

35 

30 

25 

20 

15 

10 

5 

0 

8.5 9 9.5 10 10.5 

Hugsanleg gildi µ 

11 11.5 12 12.5 

Mynd 12: 95% öryggisbil fyrir µ byggð á 40 úrtökum frá normaldreifingu þegar hið sanna 

gildi áµer 10 og σ = 2 ogn = 64. 

Við segjum að öryggisstig (e. confidence level) bilsins sé100(1−α)% og að óþekkti stikinn 

liggi innan reiknaðs öryggisbils með100(1−α)% vissu. Algengt er að velja 90% öryggisstig, 

(α = 0,10), 95% öryggisstig, (α = 0,05), 99% öryggisstig, (α = 0,01). Tafla 3 sýnir gildi á 

zα/2 fyrir valin gildi áα. 

Í því tilfelli þegar gögnin koma frá normaldreifingu og σ 2 er þekkt, þá er breidd öryggis- 

bilsins fyrirµekki háð gögnunum en er háð σ2 ,nogα. Breiddin er 

 

σ σ 

w = ¯x+zα/2 √ − ¯x−zα/2 √ 

n n 

= 2zα/2 

σ 

√ . 

n 

Ef við viljum 100(1−α)% öryggisbil fyrir µ sem er þannig að breidd bilsins sé minni eða 

jöfn w, þá þarfnað vera 

 

n ≥ 

2zα/2 

σ 

2 . 

w 

Dæmi - framhald. Höfumσ = 1,6. Viljum 99% öryggisbil sem hefur breidd sem er jöfn eða 

minni en w = 0,75. Hér er α = 0,01, zα/2 = z0,005 = 2,576, sjá neðst í töflu A3 (n = ∞), 

41

ls. 614 í Ross. Hér þarfnað vera þannig að 

n ≥ 

 

2×2,576× 1,6 

2 = 120,8. 

0,75 

Þar semner heiltala þá látum viðn = 121 til að tryggja að w ≤ 0,75. 

Tafla 3: Gildi ázα/2 fyrir valin gildi áα 

Öryggisstig 80% 90% 95% 98% 99% 

α 0.20 0.10 0.05 0.02 0.01 

z1−α/2 1.282 1.645 1.960 2.326 2.576 

4.2 Öryggisbil fyrir µ í normaldreifingu þegar σ 2 er óþekkt 

Látum X1, ..., Xn vera slembiúrtak úr normaldreifingu með stika µ og σ 2 , og látum x1, ..., 

xn vera fengin gildi á X-unum. Gerum ráð fyrir að bæðiµog σ 2 séu óþekkt. Þá gildir 

og 

¯X −µ 

S/ √ n 

∼ tn−1 

 

Pr −tα/2,n−1 ≤ ¯ X −µ 

S/ √ 

≤ tα/2,n−1 = 1−α. 

n 

Eins og hér á undan má umrita og við fáum að 

 

Pr 

¯X 

S 

−tα/2,n−1 √ ≤ µ ≤ 

n ¯ 

S 

X +tα/2,n−1 √ = 1−α. 

n 

Því er100(1−α)% öryggisbil fyrirµgefið með 

 

¯x−tα/2,n−1 

 

s s 

√ ,¯x+tα/2,n−1 √ . 

n n 

Dæmi. Höfum normaldreifð gögn. Viljum 99% öryggisbil fyrir µ. Úrtakið er þannig að 

n = 18, ¯x = 38,66, s = 8,473. Hér er α = 0,01, tα/2,n−1 = t0,005,17 = 2,898, sjá töflu A3, 

42

ls. 614 í Ross. Því er 99% öryggisbil fyrirµíþessu tilfelli 

 

38,66−2,898× 8,473 

√ ,38,66+2,898× 

18 8,473 

 

√ 

18 

= (32,87,44,45). 

4.3 Öryggisbil fyrir σ 2 og σ í normaldreifingu 

Látum X1, ..., Xn vera slembiúrtak úr normaldreifingu með stika µ og σ 2 , og látum x1, ..., 

xn vera fengin gildi á X-unum. Gerum ráð fyrir að bæðiµog σ 2 séu óþekkt. Þá gildir 

og 

(n−1)S 2 

σ 2 ∼ χ 2 n−1 

 

Pr χ 2 (n−1)S2 

1−α/2,n−1 ≤ 

σ2 Eins og hér á undan má umrita og við fáum að 

Pr 

 

(n−1)S 2 

χ 2 α/2,n−1 

≤ σ 2 ≤ (n−1)S2 

χ2 

1−α/2,n−1 

≤ χ 2 

α/2,n−1 = 1−α. 

= 1−α. 

Því eru 100(1−α)% öryggisbil fyrirσ2 ogσ gefin með 

σ 2 

 

: 

(n−1)s 2 

χ2 , 

α/2,n−1 

(n−1)s2 

χ2 

1−α/2,n−1 

 

σ : 

(n−1)s 2 

χ2 

, 

α/2,n−1 

(n−1)s 2 

χ2 

1−α/2,n−1 

Dæmi - framhald. Höfum normaldreifð gögn. Viljum 95% öryggisbil fyrirσ. Úrtakið gefur 

eins og áður,n = 18, ¯x = 38,66,s = 8,473. Hér erα = 0,05,χ 2 α/2,n−1 = χ2 0,025,17 = 30,191, 

χ 2 1−α/2,n−1 = χ2 0,975,17 

= 7,564, sjá töflu A2, bls. 613 í Ross. Því er 95% öryggisbil fyrirσ í 

þessu tilfelli ⎛ 

⎝ 

17×8,474 2 

 

, 

30,191 

17×8,474 2 

⎞ 

⎠ 

7,564 

= (6,358,12,702). 

Athugið að bilið er ekki samhverft ums = 8,473. 

43

4.4 Öryggisbil fyrir p í tvíkostadreifingu 

LátumX ∼ Bin(n,p). Metumpmeð sennileikametlinum ˆp = X/n. Um ˆp gildir að 

ˆp−p 

p(1−p)/n ∼ N(0,1), þegar n → ∞ 

og efner nægjanlega stórt (np ≥ 10, þumalputtaregla) þá er 

 

 

ˆp−p 

Pr −zα/2 ≤ ≤ zα/2 ≈ 1−α. 

p(1−p)/n 

Þessi nálgun byggir á höfuðmarkgildisreglunni, því hægt er að ritaX sem summu af Bernoulli 

slembibreytum (sem eru líka tvíkostaslembibreytur meðn = 1), það er, 

þar sem 

Því fæst 

og 

X = 

n 

Xi, 

i=1 

Xi ∼ Bernoulli(p), E(Xi) = p, var(Xi) = p(1−p), i = 1,...,n. 

var(X) = var 

E(X) = E 

n 

i=1 

n 

Xi 

i=1 

 

= 

Xi 

 

= 

n 

E(Xi) = 

i=1 

n 

var(Xi) = 

i=1 

n 

p = np 

i=1 

n 

p(1−p) = np(1−p). 

Efner stórt(np ≥ 10) þá má nálga dreifinguX með normaldreifingu 

i=1 

X ∼ N(np,np(1−p)), þegar n → ∞. 

og dreifingu ˆp = X/n má einnig nálga með normaldreifingu 

ˆp ∼ N(p,p(1−p)/n), þegar n → ∞. 

Við viljum leysa fyrirpíjöfnunni hér að ofan sem gefur nálgun á líkunum fyrir ˆp. 

2 (ˆp−p) 

Pr 

p(1−p)/n ≤ z2 

α/2 

= Pr (ˆp−p) 2 ≤ z 2 α/2 p(1−p)/n 

44

þar sem 

= Pr ˆp 2 −2ˆpp+p 2 ≤ z 2 α/2 p/n−z2 α/2 p2 /n 

= Pr (1+z 2 α/2 /n)p2 +(−2ˆp−z 2 α/2 /n)p+ ˆp2 ≤ 0 

= Pr ap 2 +bp+c ≤ 0 ≈ 1−α 

a = 1+z 2 α/2/n, b = −2ˆp−z 2 α/2/n, c = ˆp 2 . 

Hér þarf að finna þau p sem að uppfylla ójöfnuna hér að ofan. Stærðin vinstra megin við 

ójöfnumerkið er parabóla í p. Finnum skurðpunktana með því að setja jafnaðarmerki í stað- 

inn fyrir ójöfnumerkið og leysa svo fyrirp. Þá fæst 

p = −b±√b 2 −4ac 

. 

2a 

Að því gefnu að fengið gildi á X sé x, þá er punktmatið á p, ˆp = x/n, og 100(1 − α)% 

öryggisbil fyrirper gefið með 

 

ˆp+ z2 

 

α/2 

2n 

 

1+ z2 

± 

α/2 

n 

zα/2 

 

ˆp(1−ˆp) 

n + z2 α/2 

4n2 

1+ z2 

 

α/2 

n 

þar sem mínusinn gefur neðri mörkin og plúsinn gefur efri mörkin á öryggisbilinu. 

Dæmi. Viljum finna 95% öryggisbil fyrir p í tvíkostadreifingu. Úrtakið er af stærð n = 30. 

Fjöldi jákvæðra niðurstaðna er x = 14. Sennileikamatið er því ˆp = 14/30 = 0,4667. 

Jöfnurnar fyrir neðri og efri mörk öryggisbilsins gefa 

(0,3023,0,6386). 

Mynd 13 sýnir parabóluna í ójöfnunni. Skurðpunktarnir við lárétta ásinn gefa efri og neðri 

mörkin. 

Efner mjög stórt þá má nálga100(1−α)% öryggisbil fyrirpmeð 

 

ˆp(1− ˆp) ˆp(1− ˆp) 

ˆp−zα/2 , ˆp+zα/2 . 

n n 

Þessi nálgun byggir á því að 

ˆp−p 

ˆp(1− ˆp)/n ∼ N(0,1), þegar n → ∞ 

45

f(p)=ap 2 +bp+c 

0.05 

0.04 

0.03 

0.02 

0.01 

0 

−0.01 

−0.02 

−0.03 

−0.04 

−0.05 

0 0.1 0.2 0.3 0.4 0.5 

p 

0.6 0.7 0.8 0.9 1 

Mynd 13: Parabólan í ójöfnunni fyrirpþegarx = 14, n = 30, ogα = 0,05. 

og efner nægjanlega stórt þá er 

 

Pr 

−zα/2 ≤ 

 

ˆp−p 

≤ zα/2 ≈ 1−α. 

ˆp(1− ˆp)/n 

Dæmi - framhald. Finnum 95% öryggisbil fyrirpítvíkostadreifingu þegar eins og áðurn = 

30 ogx = 14 en notum einfaldari jöfnurnar. Jöfnurnar fyrir neðri og efri mörk öryggisbilsins 

gefa 

(0,2881,0,6452). 

Athugasemd. Ef við drögum aftur og aftur (með aðstoð tölvu) frá tvíkostadreifingu með stika 

p = 0,6 og n = 10 og reiknum bæði öryggisbilin, kemur í ljós að fyrra öryggisbilið hefur 

í raun 98% öryggisstig en seinna öryggisbilið hefur í raun 90% öryggisstig. Við mundum 

kjósa að öryggisstigið væri að minnsta kosti 95%. Fyrra öryggisbilið gefur betri raun hvað 

öryggisstigið varðar. Seinna öryggisbilið gefur oft of lágt öryggisstig þegar n er minna en 

50 ogper nærri 0 eða 1. 

Ef við viljum 100(1−α)% öryggisbil fyrir p sem er þannig að breidd öryggisbilsins sé 

46

jöfn eða minni en w, þá þarf n að vera 

n ≥ 

2z 2 α/2 ˆp(1− ˆp)−z2 α/2 w2 + 

 

4z 4 α/2 ˆp(1− ˆp){ˆp(1− ˆp)−w2 }+w 2 z 4 α/2 

w 2 

Efw er mjög lítið þá má nálga ójöfnuna fyrirnmeð 

n ≥ 4z2 α/2ˆp(1− ˆp) 

w2 . 

Ef við viljum vera viss um að n sé örugglega þannig að öryggisbilið sé ekki breiðara en w 

þá látum við ˆp(1− ˆp) = 0,25 sem er stærsta gildið sem ˆp(1− ˆp) getur tekið og notum 

n ≥ z2 α/2 

. 

w2 Dæmi. Viljum að 95% öryggisbil fyrir p sé þannig að breidd þess sé örugglega ekki meiri 

en 0,01. Þá þarfnað vera 

n ≥ z2 α/2 

w 

1,962 

= = 38416. 

2 0,012 47 

.

4.5 Öryggisbil fyrir nokkur valin tilfelli 

Tilfelli 1 

100(1−α)% öryggisbil fyrirµínormaldreifingu. 

X1,...,Xn ∼ N(µ,σ 2 ), slembiúrtak. 

Fengin gildiX1 = x1,...,Xn = xn. 

¯x = 1 

 

n 

 

 

xi, s = 

n 

1 

n−1 

i=1 

i)100(1−α)% öryggisbil fyrirµ, σ 2 þekkt. 

σ 

¯x±zα/2 √ 

n 

ii)100(1−α)% öryggisbil fyrirµ,σ 2 óþekkt. 

Tilfelli 2 

¯x±tα/2,n−1 

s 

√ 

n 

100(1−α)% öryggisbil fyrirσ 2 ogσ í normaldreifingu. 



¯x = 1 

n 

n 

i=1 

xi, s 2 = 1 

n−1 

i)100(1−α)% öryggisbil fyrirσ2 . 

 

(n−1)s 2 

χ2 , 

α/2,n−1 

(n−1)s2 

χ2 

1−α/2,n−1 

ii)100(1−α)% öryggisbil fyrirσ. 

 

(n−1)s 2 

χ2 

, 

α/2,n−1 

(n−1)s 2 

χ2 

1−α/2,n−1 

48 

n 

(xi − ¯x) 2 

i=1 

n 

(xi − ¯x) 2 

i=1

Tilfelli 3 

100(1−α)% öryggisbil fyrirpítvíkostadreifingu. 

X ∼ Bin(n,p), slembistærð. 

Fengið gildiX = x. 

i)100(1−α)% öryggisbil fyrirp, nálgun I. 

 

ˆp+ z2 α/2 

2n 

 

1+ z2 α/2 

n 

ˆp = x 

n 

ˆp(1−ˆp) 

± zα/2 n + z2 α/2 

4n2 

1+ z2 

α/2 

n 

ii)100(1−α)% öryggisbil fyrirp, nálgun II. 

 

ˆp(1− ˆp) 

ˆp±zα/2 

n 

Tilfelli 4 

100(1−α)% öryggisbil fyrirµ1 −µ2, µ1 og µ2 í normaldreifingum. 

X1,...,Xn ∼ N(µ1,σ2 1 ), slembiúrtak. 

Y1,...,Ym ∼ N(µ2,σ2 2 ), slembiúrtak, óháð X-unum. 

Fengin gildiX1 = x1,...,Xn = xn og Y1 = y1,...,Ym = ym. 

¯x = 1 

n 

xi, s 

n 

2 n 1 

1 = (xi − ¯x) 

n−1 

2 , ¯y = 1 

m 

m 

i=1 

s 2 p = (n−1)s2 1 +(m−1)s 2 2 

n+m−2 

i=1 

i=1 

yi, s 2 2 

= 1 

m−1 

m 

(yi − ¯y) 2 

, υ = (s21/n+s 2 2/m) 2 

 

(s2 1 /n) 2 

n−1 + (s2 2 /m)2 

, (υ er lækkað niður í næstu heiltölu) 

m−1 

i)100(1−α)% öryggisbil fyrirµ1 −µ2, σ2 1 og σ2 2 þekkt. 

 

2 σ1 (¯x− ¯y)±zα/2 

n + σ2 2 

m 

ii)100(1−α)% öryggisbil fyrirµ1 −µ2, σ2 1 og σ2 2 óþekkt,σ2 1 = σ2 2. 

 

1 1 

(¯x− ¯y)±tα/2,n+m−2sp + 

n m 

iii)100(1−α)% öryggisbil fyrirµ1 −µ2,σ 2 1 ogσ2 2 óþekkt,σ2 1 = σ2 2 . 

 

2 s1 (¯x− ¯y)±tα/2,υ 

n + s22 m 

49 

i=1

Tilfelli 5 

100(1−α)% öryggisbil fyrirσ 2 1/σ 2 2, σ 2 1 og σ 2 2 í normaldreifingum. 




¯x = 1 

n 

¯y = 1 

m 

n 

i=1 

m 

i=1 

i)100(1−α)% öryggisbil fyrirσ 2 1/σ 2 2. 

Tilfelli 6 

 

xi, s 2 1 = 1 

n−1 

yi, s 2 2 

s 2 1 /s2 2 

Fα/2,n−1,m−1 

, 

= 1 

m−1 

s 2 1 /s2 2 

n 

(xi − ¯x) 2 

i=1 

m 

(yi − ¯y) 2 

i=1 

F1−α/2,n−1,m−1 

100(1−α)% öryggisbil fyrirµw = µ1 −µ2, paraðar mælingar. 

(X1,Y1),...,(Xn,Yn) eru n óháð pör, en Xi og Yi, i = 1,...,n, geta verið innbyrðis háð. 

Hvert par (Xi,Yi), i = 1,...,n, er yfirleitt tvær mælingar á sama hlut eða einstaklingi. 

Wi = Xi −Yi, E(Xi) = µ1, E(Yi) = µ2, E(Wi) = µw = µ1 −µ2,i = 1,...,n. 

W1,...,Wn ∼ N(µw,σ2 w ), óháðar. 

Fengin gildi (X1,Y1) = (x1,y1),...,(Xn,Yn) = (xn,yn), W1 = w1 = x1 − y1,...,Wn = 

wn = xn −yn. 

¯w = 1 

n 

 

n 

 

 

wi, sw = 1 

n−1 

i=1 

i)100(1−α)% öryggisbil fyrirµw. 

¯w ±tα/2,n−1 √ 

n 

50 

sw 

 

n 

(wi − ¯w) 2 

i=1

Tilfelli 7 

100(1−α)% öryggisbil fyrirp1 −p2, p1 og p2 í tvíkostadreifingum. 

X ∼ Bin(n1,p1), Y ∼ Bin(n2,p2), slembistærðir. 

Fengin gildiX = x ogY = y. 

ˆp1 = x 

, ˆp2 = y 

n1 

i)100(1−α)% öryggisbil fyrirp1 −p2, nálgun: min(n1p1(1−p1),n2p2(1−p2)) ≥ 10. 

Tilfelli 8 

ˆp1 − ˆp2 ±zα/2 

 

ˆp1(1− ˆp1) 

n1 

n2 

+ ˆp2(1− ˆp2) 

n2 

100(1−α)% öryggisbil fyrirθ = 1/λ, meðalgildi veldisdreifingar. 

X1,...,Xn ∼ Expon(λ), slembiúrtak. 

E(Xi) = θ, i = 1,...,n. 


i)100(1−α)% öryggisbil fyrirθ. 

 

¯x = 1 

n 

2n¯x 

χ 2 α/2,2n 

, 

n 

i=1 

xi 

2n¯x 

χ 2 1−α/2,2n 

51

5 Tilgátupróf 

5.1 Almennt um tilgátupróf 

SKILGREINING. Núlltilgáta, táknuð með H0, er staðhæfing um stika þýðis sem „eðlilegt“ 

er að halda fram í upphafi. Gagntilgáta, táknuð meðH1, staðhæfir öfugt viðH0. Við höfnum 

H0 ef gögnin benda sterklega til þess að H0 sé röng. Við höfnum ekki H0 ef gögnin benda 

ekki nægjanlega sterkt til þess að H0 sé röng. 

Dæmi. Meðallíftími ákveðinnar tegundar af rafhlöðum er 325 klukkustundir. Hönn-unin á 

rafhlöðunum er endurbætt og spurningin er hvort meðallíftíminn hafi lengst. Núlltilgátan og 

gagntilgátan eru hér 

Ritum einnig 

H0 : µ ≤ 325 á móti H1 : µ > 325. 

H0 : µ = 325 á móti H1 : µ > 325. 

Tilgátupróf samanstanda af prófstærð og höfnunarsvæði. 

SKILGREINING. Prófstærð (e. test statistic) er fall af úrtakinu. Ákvörðin um að hafna H0 

eða ekki er byggð á prófstærðinni. 

SKILGREINING. Höfnunarsvæði (e. critical region) er svæði sem inniheldur öll gildi á 

prófstærðinni sem leiða til höfnunar á H0, það er, H0 er hafnað ef prófstærðin er innan 

höfnunarsvæðisins. 

Hægt er gera að tvennskonar villur við tilgátupróf. 

SKILGREINING. Mistök af gerð I (e. type I error) eiga sér stað þegar H0 er hafnað þegar 

H0 er í raun sönn. 

SKILGREINING. Mistök af gerð II (e. type II error) eiga sér stað þegar H0 er ekki hafnað 

þegarH0 er í raun röng. 

Tafla 4 sýnir hvenær mistök af gerð I og II eiga sér stað og hvenær rétt ákvörðun er tekin. 

52

Látum 

Tafla 4: Mistök af gerð I og II. 

H0 sönn H0 röng 

Höfnum ekkiH0 rétt ákvörðun Mistök af gerð II 

HöfnumH0 Mistök af gerð I rétt ákvörðun 

Dæmi. Normaldreifð gögn. n = 14,σ = 4. 

Prófstærð: ¯ X. 

α = Pr(mistök af gerð I), 

β = Pr(mistök af gerð II). 

H0 : µ = 50 á móti H1 : µ > 50. 

Höfnunarsvæði: Ákveðum að hafnaH0 ef ¯ X > 51,75. 

Talan51,75 er valin sem hugsanlega skynsamlegur skurðpunktur. Athugum hvaða áhrif þetta 

val hefur á mistök af gerð I og II, það er, áαog β. 

EfH0 er sönn þá erµ = 50. 

α = Pr(mistök af gerð I) 

= Pr(höfnumH0 þegarH0 er í raun sönn) 

= Pr( ¯ X > 51,75|µ = 50) 

 

¯X −µ 

= Pr 

σ/ √ 51,75−µ 

> 

n σ/ √ 

 

 

n µ = 50 

 

= Pr Z > 51,75−50 

4/ √ 

14 

= 1−Pr(Z ≤ 1,64) = 1−Φ(1,64) 

= 1−0,9495 = 0,0505. 

53

β er ekki ein tala heldur fall afµíH1. Segjum að H0 sé röng, t.d. µ = 51. 

Ef til dæmisµ = 53 fæst 

β(µ = 51) = Pr(mistök af gerð II þegarµ = 51) 

1 

0.9 

0.8 

0.7 

0.6 

0.5 

β(µ) 1−α 

0.4 

0.3 

0.2 

0.1 

= Pr(höfnum ekki H0 þegar í raun erµ = 51) 

= Pr( ¯ X ≤ 51,75|µ = 51) 

 

¯X −µ 

= Pr 

σ/ √ 51,75−µ 

≤ 

n σ/ √ 

 

 

n µ = 51 

 

= Pr Z ≤ 51,75−51 

4/ √ 

14 

= Pr(Z ≤ 0,70) 

= Φ(0,70) 

= 0,7580. 

µ 0 =50 

µ=51 

µ=53 

0 

49 50 51 52 

µ 

53 54 55 

Mynd 14: Líkurnar á því að gera mistök af gerð II sem fall af µ. 

54

β(µ = 53) = Pr Z ≤ 51,75−53 

4/ √ 

= 0,1210. 

14 

Á mynd 14 sést hvernigβ minnkar eftir því semµfærist fjærµ0 = 50. 

Sambandið á milliα,β ogner eftirfarandi 

n fast α ↑ ⇒ β ↓ eða α ↓ ⇒ β ↑ 

α fast n ↑ ⇒ β ↓ 

Vanalega er α valið fyrst. Algengt val á α er 0,01, 0,05 og 0,10. Ef við viljum litlar líkur á 

mistökum af gerð I þá veljum við enn smærra α. Ef hægt er, þá er n valið þannig að β fyrir 

ákveðiðµíH1 fari niður fyrir valið gildi. Stærðirnarα, β og (1−β) hafa eftirfarandi heiti. 

5.2 P -gildi 

α = marktektarkrafa (e. significance level) 

β = fastheldnisfall (e. operating characteristic function) 

1−β = höfnunarfall (e. power function) 

SKILGREINING. Látum T tákna slembistærð sem hefur sömu dreifingu og prófstærðin 

þegarH0 er sönn ogter gildið á prófstærðinni fyrir gefna tilraun, þá er P -gildið 

P -gildi = Pr(T ≥ t) 

ef höfnunarsvæði prófs er hægra megin við gefna rauntölu en 

P -gildi = Pr(T ≤ t) 

ef höfnunarsvæði prófs er vinstra megin við gefna rauntölu. Ef höfnunarsvæði prófs er ann- 

ars vegar vinstra megin við gefna rauntölur1 og hins vegar hægra megin við gefna rauntölu 

r2,(r1 < r2), þá erP -gildið 

P -gildi = 2min{Pr(T ≥ t), Pr(T ≤ t)}. 

55

f Z (z) 

0.45 

0.4 

0.35 

0.3 

0.25 

0.2 

0.15 

0.1 

0.05 

0 

z=1.39 

P−gildi=flatarmál 

=1−Φ(1.39)=0.0823 

−3 −2 −1 0 

z 

1 2 3 

Mynd 15: Flatarmálið undir dreifingu prófstærðarinnar þegar H0 er sönn svarar til P - 

gildisins. 

Með öðrum orðum má segja að þegar til dæmis höfnunarsvæði prófs er hægra megin við 

gefna rauntölu þá erP -gildið líkurnar á því að fá prófstærð sem er jöfn eða stærri en útreikn- 

uð prófstærð að því gefnu að H0 sé sönn. Athugið að P -gildið er ekki líkurnar á því að H0 

sé sönn. 

Við getum notað P -gildi til að ákveða hvort við höfnumH0 eða ekki: 

P -gildi < α ⇒ höfnumH0 fyrir gefið α 

P -gildi ≥ α ⇒ höfnum ekkiH0 fyrir gefið α 

Prófum H0 : µ = µ0 á móti H1 : µ > µ0, fyrir µ í normaldreifingu þegar σ er þekkt, (sjá 

nánar í næsta kafla). Segjum að gildið á prófstærðinni séz, þá er 

EfH1 : µ < µ0, þá er 

P -gildi = Pr(Z ≥ z) = 1−Φ(z). 

P -gildi = Pr(Z ≤ z) = Φ(z). 

56

EfH1 : µ = µ0, þá er 

P -gildi = 2min{Pr(Z ≥ z), Pr(Z ≤ z)} = 2{1−Φ(|z|)}. 

Mynd 15 sýnir flatarmálið undir stöðluðu normaldreifingunni sem svarar til P -gildis þegar 

gildið á prófstærðinni er z = 1,39 og gagntilgátan er H1 : µ > µ0. 

5.3 Tilgátupróf fyrir meðalgildi í normaldreifingu, þekkt σ 

Dæmi. Þykkt 50 glerja í gleraugu eru mæld. Meðaltal úrtaksins er ¯x = 3,05 mm og staðal- 

frávikið er þekkt,σ = 0,34 mm. Glerin eiga að hafa meðalþykktµ = 3,20 mm. Gefa gögnin 

til kynna að µ = 3,20 mm eða gefa þau til kynna að µ = 3,20 mm. Notumα = 0,05. 

Prófstærðin í prófi fyrirµínormaldreifingu þegarσ er þekkt er 

Z = ¯ X −µ0 

σ/ √ n . 

Z fylgir staðlaðri normaldreifingu efH0 er sönn,H0 : µ = µ0. 

Veljumα = Pr(mistök af gerð I). 

Tafla 5 sýnir próf fyrirµfyrir þrjár mismunandi gagntilgátur. Í töflu 5 er að finna gagntilgát- 

urnar, tilsvarandi höfnunarsvæði og P -gildi. 

57

Skref við tilgátupróf 

Tafla 5: Núlltilgáta: H0: µ = µ0, Prófstærð: z = (¯x−µ0) 

σ/ √ n 

Gagntilgátur Höfnunarsvæði P -gildi 

H1: µ > µ0 z > zα Pr(Z ≥ z) = 1−Φ(z) 

H1: µ < µ0 z < −zα Pr(Z ≤ z) = Φ(z) 

H1: µ = µ0 |z| > zα/2 2Pr(Z ≥ |z|) = 2{1−Φ(|z|)} 

1. Ákveða hvaða stika á að prófa. 

2. Ákveða núlltilgátuna. 

3. Ákveða gagntilgátuna. 

4. Finna jöfnu fyrir prófstærðina. 

5. Finna höfnunarsvæðið fyrir gefna marktektarkröfuα. 

6. Reikna gildið á prófstærðinni. 

7. Ákveða hvort við höfnumH0 eða ekki og lýsa ákvörðuninni í orðum. 

Dæmi - þykkt glerja - framhald. Tökum þessi 7 skref. 

1. Stikinn sem á að prófa: µ = meðalþykkt glerja 

2. Núlltilgátan: H0 : µ = 3,20 (= µ0) 

3. Gagntilgátan: H1 : µ = 3,20 

4. Prófstærðin: 

z = (¯x−µ0) 

σ/ √ n 

5. Höfnunarsvæðið,α = 0,05. HöfnumH0 ef: 

= (¯x−3,20) 

0,34/ √ 50 

|z| > zα/2 = z0,05/2 = z0,025 = 1,96 

58

6. Gildið á prófstærðinni er: 

7. Ákvörðun 

z = (3,05−3,20) 

0,34/ √ 50 

= −3,12 

|z| = |−3,12| = 3,12 > 1,96 

P -gildi = 2{1−Φ(|z|)} = 2{1−Φ(|3,12|)} = 0,0018 

⇒ höfnumH0 viðα = 0,05 

⇒ gögnin gefa til kynna að meðalþykkt glerjanna sé ekki3,20 mm. 

5.4 Jöfnur fyrir β og val án 

Hér skoðum við einungis jöfnur fyrirβ og val ánþegar verið er að prófaµínormaldreifingu 

og σ er þekkt. Skoðum fyrst tilfellið þegar núlltilgátan og gagntilgátan eru 

H0 : µ = µ0 á móti H1 : µ > µ0 

og höfnunarsvæðið er z > zα. Hér er µ hið sanna gildi á meðalgildi normaldreifingar-innar 

og µ0 er gildið á µ í tilgátunum. Látum µ1 vera eitthvað hugsanlegt gildi á µ í H1, það er, 

µ1 > µ0. Þegarµ = µ1 þá eru líkurnar á mistökum af gerð II gefnar með 

β(µ1) = Pr(mistök af gerð II|µ = µ1) 

= Pr(höfnum ekkiH0 þegar í raun erµ = µ1 > µ0) 

 

¯X −µ0 

= Pr 

σ/ √ 

 

≤ zα 

 

n µ = µ1 

= Pr( ¯ X ≤ µ0 +zασ/ √ n|µ = µ1) 

 

¯X −µ1 

= Pr 

σ/ √ n ≤ µ0 −µ1 

σ/ √ n +zα 

 

 

 

µ = µ1 

 

= Pr Z ≤ µ0 −µ1 

σ/ √ n +zα 

 

59

µ0 −µ1 

= Φ 

σ/ √ n +zα 

 

. 

Við viljum finna n þannig að fyrir valið µ1 ∈ H1 sé β(µ1) = β þar sem β er valið gildi. 

Leysum fyrirn. 

 

µ0 −µ1 

β = Φ 

σ/ √ n +zα 

 

= Φ(−zβ) = Φ(z1−β) 

z1−β = −zβ = µ0 −µ1 

σ/ √ n +zα 

n = (zα +zβ) 2σ2 . 

(µ1 −µ0) 2 

Tafla 6 sýnir formúlur fyrirβ(µ1) fyrir mismunandi gagntilgátur. 

Tafla 6: Formúlur fyrirβ(µ1), mistök af gerð II 

Gagntilgátur β(µ1) fyrirµ1 ∈ H1 

 

µ0−µ1 H1: µ > µ0 Φ σ/ √ n +zα 

 

 

µ0−µ1 

H1: µ < µ0 1−Φ σ/ √ n −zα 

 

 

H1: µ = µ0 Φ −Φ 

µ0−µ1 

σ/ √ n +zα/2 

Tafla 7 sýnir formúlur fyrirnfyrir mismunandi gagntilgátur. 

Tafla 7: Formúlur fyrirn 

Gagntilgátur n fyrirµ1 ∈ H1 

H1: µ > µ0 

H1: µ < µ0 

H1: µ = µ0 

(zα+zβ) 2 σ 2 

(µ1−µ0) 2 

(zα+zβ) 2 σ 2 

(µ1−µ0) 2 

(z α/2+zβ) 2 σ 2 

(µ1−µ0) 2 

60 

 

µ0−µ1 

σ/ √ n −zα/2

Dæmi - þykkt glerja - framhald. Höfum α = 0,05, H1 : µ = 3,20, zα/2 = z0,025 = 1,96. 

Þegarn = 50 ogµíraun3,15, þá eru líkurnar á mistökum af gerð II 

 

3,20−3,15 

β(µ1 = 3,15) = Φ 

0,34/ √ 50 +1,96 

 

3,20−3,15 

−Φ 

0,34/ √ 50 −1,96 

 

= Φ(3,00)−Φ(−0,92) = 0,9987−0,1788 = 0,8199. 

Segjum að við viljum aðβ(µ1 = 3,15) ≤ 0,10. Því erzβ = z0,10 = 1,2816 ognþarf að vera 

n = (1,96+1,2816)2 0,34 2 

(3,15−3,20) 2 

= 485,89. 

Veljum n = 486 en þá er β(µ1 = 3,15) = 0,0999 < 0,10. Mynd 16 sýnir fallið β(µ1) fyrir 

glerjadæmið þegarn = 50 og n = 486. 

β(µ) 

1 

0.9 

0.8 

0.7 

0.6 

0.5 

0.4 

0.3 

0.2 

0.1 

1−α 

µ 1 =3.15 

β 

n=50 

n=486 

µ 0 =3.20 

0 

3.1 3.12 3.14 3.16 3.18 3.2 

µ [mm] 

3.22 3.24 3.26 3.28 

Mynd 16: Líkurnar á því því að gera mistök af gerð II sem fall afµídæminu um meðalþykkt 

glerja þegarn = 50 ogn = 486. 

61

5.5 Tilgátupróf fyrir nokkur valin tilfelli 

Tilfelli 1 

Próf fyrirµínormaldreifingu. 



¯x = 1 

 

n 

 

 

xi, s = 

n 

1 

n−1 

i) Próf fyrirµ, σ 2 þekkt. 

ii) Próf fyrirµ,σ 2 óþekkt. 

i=1 

n 

(xi − ¯x) 2 

i=1 

Z ∼ N(0,1), Tn−1 ∼ tn−1 

Tafla 8: Núlltilgáta: H0: µ = µ0, Prófstærð: z = (¯x−µ0) 

σ/ √ n 


H1: µ > µ0 z > zα Pr(Z ≥ z) = 1−Φ(z) 

H1: µ < µ0 z < −zα Pr(Z ≤ z) = Φ(z) 

H1: µ = µ0 |z| > zα/2 2Pr(Z ≥ |z|) = 2{1−Φ(|z|)} 

Tafla 9: Núlltilgáta: H0: µ = µ0, Prófstærð: t = (¯x−µ0) 

s/ √ n 


H1: µ > µ0 t > tα,n−1 Pr(Tn−1 ≥ t) 

H1: µ < µ0 t < −tα,n−1 Pr(Tn−1 ≤ t) 

H1: µ = µ0 |t| > tα/2,n−1 2Pr(Tn−1 ≥ |t|) 

62

Tilfelli 2 

Próf fyrirσ 2 í normaldreifingu. 



i) Próf fyrirσ 2 . 

¯x = 1 

n 

n 

i=1 

xi, s 2 = 1 

n−1 

X 2 n−1 ∼ χ2 n−1 

n 

(xi − ¯x) 2 

Tafla 10: Núlltilgáta: H0: σ 2 = σ 2 0 , Prófstærð: w2 = (n−1)s2 

σ 2 0 


i=1 

H1: σ 2 > σ 2 0 w 2 > χ 2 α,n−1 Pr(X 2 n−1 ≥ w 2 ) 

H1: σ 2 < σ 2 0 w2 < χ 2 1−α,n−1 Pr(X 2 n−1 ≤ w2 ) 

H1: σ 2 = σ 2 0 w2 > χ 2 α/2,n−1 2min{Pr(X 2 n−1 ≥ w2 ), Pr(X 2 n−1 ≤ w2 )} 

eðaw 2 < χ 2 1−α/2,n−1 

63

Tilfelli 3 

Próf fyrirpítvíkostadreifingu. 

X ∼ Bin(n,p), slembistærð. 

Fengið gildiX = x. 

i) Próf fyrirp, nálgun,np0 ≥ 20. 

ˆp = x 

n 

Z ∼ N(0,1) 

Tafla 11: Núlltilgáta: H0: p = p0, Prófstærð: z = (x−np0) √ 

np0(1−p0) = 


H1: p > p0 z > zα Pr(Z ≥ z) = 1−Φ(z) 

H1: p < p0 z < −zα Pr(Z ≤ z) = Φ(z) 

H1: p = p0 |z| > zα/2 2Pr(Z ≥ |z|) = 2{1−Φ(|z|)} 

ii) Nákvæmt próf fyrirp, sjá bls. 323-326 í Ross. 

64 

(ˆp−p0) √ 

p0(1−p0)/n

Tilfelli 4 

Próf fyrirµ1 −µ2,µ1 og µ2 í normaldreifingum. 




¯x = 1 

n 

¯y = 1 

m 

n 

i=1 

m 

i=1 

xi, s 2 1 = 1 

n−1 

yi, s 2 2 

= 1 

m−1 

n 

(xi − ¯x) 2 

i=1 

m 

(yi − ¯y) 2 

i=1 

s 2 p = (n−1)s2 1 +(m−1)s 2 2 

n+m−2 

υ = (s21 /n+s2 2 /m)2 

 

(s2 1 /n) 2 

n−1 + (s2 2 /m)2 

, (υ er lækkað niður í næstu heiltölu) 

m−1 

i) Próf fyrirµ1 −µ2, σ 2 1 og σ2 2 þekkt. 

Z ∼ N(0,1), Tn+m−2 ∼ tn+m−2, Tυ ∼ tυ 

Tafla 12: Núlltilgáta: H0: µ1 −µ2 = δ0, Prófstærð: z = (¯x−¯y−δ0) √ 

σ2 1 /n+σ2 2 /m 


H1: µ1 −µ2 > δ0 z > zα Pr(Z ≥ z) = 1−Φ(z) 

H1: µ1 −µ2 < δ0 z < −zα Pr(Z ≤ z) = Φ(z) 

H1: µ1 −µ2 = δ0 |z| > zα/2 2Pr(Z ≥ |z|) = 2{1−Φ(|z|)} 

65

ii) Próf fyrirµ1 −µ2, σ 2 1 og σ2 2 óþekkt,σ2 1 = σ2 2 . 

√ 

sp 1/n+1/m 

Tafla 13: Núlltilgáta: H0: µ1 −µ2 = δ0, Prófstærð: t = (¯x−¯y−δ0) 


H1: µ1 −µ2 > δ0 t > tα,n+m−2 Pr(Tn+m−2 ≥ t) 

H1: µ1 −µ2 < δ0 t < −tα,n+m−2 Pr(Tn+m−2 ≤ t) 

H1: µ1 −µ2 = δ0 |t| > tα/2,n+m−2 2Pr(Tn+m−2 ≥ |t|) 

iii) Próf fyrirµ1 −µ2, σ 2 1 ogσ2 2 óþekkt,σ2 1 = σ2 2 . 

Tafla 14: Núlltilgáta: H0: µ1 −µ2 = δ0, Prófstærð: t = (¯x−¯y−δ0) √ 

s2 1 /n+s2 2 /m 


H1: µ1 −µ2 > δ0 t > tα,υ Pr(Tυ ≥ t) 

H1: µ1 −µ2 < δ0 t < −tα,υ Pr(Tυ ≤ t) 

H1: µ1 −µ2 = δ0 |t| > tα/2,υ 2Pr(Tυ ≥ |t|) 

66

Tilfelli 5 

Próf fyrirσ 2 1 ogσ 2 2 í normaldreifingum. 




i) Próf fyrirσ 2 1 ogσ2 2 . 

¯x = 1 

n 

¯y = 1 

m 

n 

i=1 

m 

i=1 

xi, s 2 1 = 1 

n−1 

yi, s 2 2 

= 1 

m−1 

n 

(xi − ¯x) 2 

i=1 

Qn−1,m−1 ∼ Fn−1,m−1 

m 

(yi − ¯y) 2 

i=1 

Tafla 15: Núlltilgáta: H0: σ 2 1 = σ2 2 , Prófstærð: f = s2 1 

s 2 2 


H1: σ 2 1 > σ2 2 f > Fα,n−1,m−1 Pr(Qn−1,m−1 ≥ f) 

H1: σ 2 1 < σ2 2 f < F1−α,n−1,m−1 Pr(Qn−1,m−1 ≤ f) 

H1: σ 2 1 = σ 2 2 f > Fα/2,n−1,m−1 2min{Pr(Qn−1,m−1 ≥ f), Pr(Qn−1,m−1 ≤ f)} 

eðaf < F1−α/2,n−1,m−1 

67

Tilfelli 6 

Próf fyrirµw = µ1 −µ2, paraðar mælingar. 

(X1,Y1),...,(Xn,Yn) eru n óháð pör, en Xi og Yi, i = 1,...,n, geta verið innbyrðis háð. 

Hvert par (Xi,Yi), i = 1,...,n, er yfirleitt tvær mælingar á sama hlut eða einstaklingi. 

Wi = Xi −Yi, E(Xi) = µ1, E(Yi) = µ2, E(Wi) = µw = µ1 −µ2,i = 1,...,n. 

W1,...,Wn ∼ N(µw,σ2 w ), óháðar. 

Fengin gildi (X1,Y1) = (x1,y1),...,(Xn,Yn) = (xn,yn), W1 = w1 = x1 − y1,...,Wn = 

wn = xn −yn. 

¯w = 1 

n 

i) Próf fyrirµw = µ1 −µ2. 

 

n 

 

 

wi, sw = 1 

n−1 

i=1 

Tn−1 ∼ tn−1 

n 

(wi − ¯w) 2 

Tafla 16: Núlltilgáta: H0: µw = ∆0, Prófstærð: t = (¯w−∆0) 

sw/ √ n 

i=1 


H1: µw > ∆0 t > tα,n−1 Pr(Tn−1 ≥ t) 

H1: µw < ∆0 t < −tα,n−1 Pr(Tn−1 ≤ t) 

H1: µw = ∆0 |t| > tα/2,n−1 2Pr(Tn−1 ≥ |t|) 

68

Tilfelli 7 

Próf fyrirp1 −p2, p1 og p2 í tvíkostadreifingum. 

X ∼ Bin(n1,p1), Y ∼ Bin(n2,p2), slembistærðir. 

Fengin gildiX = x ogY = y. 

ˆp1 = x 

, ˆp2 = y 

, ˆp = x+y 

n1 

n2 

Z ∼ N(0,1) 

n1 +n2 

i) Próf fyrirp1 −p2, nálgun,min{n1p1(1−p1),n2p2(1−p2)} ≥ 10. 

Tafla 17: Núlltilgáta: H0: p1 = p2, Prófstærð: z = 


H1: p1 > p2 z > zα Pr(Z ≥ z) = 1−Φ(z) 

H1: p1 < p2 z < −zα Pr(Z ≤ z) = Φ(z) 

(ˆp1−ˆp2) √ 

ˆp(1−ˆp)(1/n1+1/n2) 

H1: p1 = p2 |z| > zα/2 2Pr(Z ≥ |z|) = 2{1−Φ(|z|)} 

ii) Nákvæmt próf fyrirp1 −p2, sjá bls. 327-329 í Ross. 

69

6 Línulegt aðhvarf 

Í þessum kafla er fjallað um línulegt aðhvarf (e. linear regression) en einungis verður skoðað 

einfalt línulegt líkan (e. simple linear model). 

6.1 Einfalt línulegt líkan 

Gerum ráð fyrir að lýsa megi slembibreytuY fyrir tilsvarandixmeð 

Y = α+βx+ǫ, 

þar semαogβ eru fastar, ogǫer slembistærð,ǫ ∼ N(0,σ 2 ). Breytanxer kölluð skýribreyta 

(e. predictor variable). Ef við höfum n slembistærðir Yi, i = 1,...,n, og fyrir hvert Yi er 

tilsvarandi gildi á skýribreytunnixi, i = 1,...,n, þá má rita 

Yi = α+βxi +ǫi, ǫi ∼ N(0,σ 2 ), i = 1,...,n, 

og ǫ-in eru innbyrðis óháð. Því gildir fyrir hverti = 1,...,n að 

og 

E(Yi) = E(α+βxi +ǫi) = α+βxi + E(ǫi) = α+βxi +0 = α+βxi, 

var(Yi) = var(α+βxi +ǫi) = var(ǫi) = σ 2 . 

Þar sem hvertYi er summa af fasta og normaldreifðri slembistærð þá gildir að 

Yi ∼ N(α+βxi,σ 2 ), i = 1,...,n, 

og þar semǫ-in eru innbyrðis óháð þá eru Y -in einnig innbyrðis óháð. 

6.2 Metlar fyrir stikana α, β og σ 2 

Segjum að við höfum mælingar (x1,y1), (x2,y2), ..., (xn,yn), á x og Y , og að við viljum 

finna línu, y = a+bx, í gegnum mælingarnar. Skilgreinum leif (e. residual)i-tu mælingar- 

innar sem 

ei = yi −a−bxi, i = 1,...,n. 

70

Línan er valin þannig að summa leifa í öðru veldi sé sem minnst. Þetta jafngildir því að finna 

a og b sem lágmarka fallið 

f(a,b) = 

n 

(yi −a−bxi) 2 = 

i=1 

Diffrumf(a,b) með tilliti tilaogb 

∂f(a,b) 

∂a = 

∂f(a,b) 

∂b 

= 

n 

i=1 

e 2 i . 

n 

(−2)(yi −a−bxi), 

i=1 

n 

(−2xi)(yi −a−bxi). 

i=1 

Setjum afleiðurnar ∂f(a,b)/∂a og∂f(a,b)/∂b jafnar núlli og leysum fyriraogb 

Endurritum jöfnurnar 

−2 

−2 

n 

(yi −a−bxi) = 0, 

i=1 

n 

xi(yi −a−bxi) = 0. 

i=1 

n 

yi = na+b 

i=1 

n 

xiyi = a 

i=1 

n 

i=1 

n 

xi, 

i=1 

xi +b 

n 

x 2 i. 

Látum ¯y = n 

i=1 yi/n og ¯x = n 

i=1 xi/n, þá má rita fyrri jöfnuna á forminu 

Setjum inn fyriraíseinni jöfnunni, þá fæst 

a = ¯y −b¯x. 

i=1 

n 

xiyi = (¯y −b¯x)n¯x+b 

i=1 

 

n 

b x 2 i −n¯x2 

 

= 

i=1 

b = 

n 

i=1 

n i=1xiyi −n¯x¯y 

n i=1x2i 71 

n 

x 2 i, 

i=1 

xiyi −n¯x¯y, 

−n¯x2 .

Hér verða eftirfarandi summur táknaðar með 

Þá má ritabmeð 

Sxy = 

n 

(xi − ¯x)(yi − ¯y) = 

i=1 

Sxx = 

Syy = 

n 

(xi − ¯x) 2 = 

i=1 

n 

(yi − ¯y) 2 = 

i=1 

b = Sxy 

. 

Sxx 

n 

i=1 

xiyi −n¯x¯y, 

n 

x 2 i −n¯x 2 , 

i=1 

n 

y 2 i −n¯y2 . 

Hér eru a og b punktmatið á α og β. Látum A og B vera metla fyrir α og β, og ¯ Y = 

n −1 n 

i=1 Yi. Þá má ritaAogB 

B = 

n i=1xiYi −n¯x ¯ Y 

n i=1x2i −n¯x2 = 

i=1 

n 

A = ¯ Y −B¯x. 

i=1 (xi − ¯x)Yi 

n i=1 (xi 

, 

− ¯x) 2 

Þessi aðferð er kölluð aðferð minnstu kvaðrata (e. least squares method). Að því gefnu að 

Y -in fylgi normaldreifingu, þá eru A og B einnig sennileikametlarα ogβ. Línan 

y = a+bx 

er kölluð aðhvarfslína úrtaks (e. sample regression line). 

6.3 Dreifingar metlanna 

MetlarnirAog B eru línulegar samtektir afY1, ..., Yn. Til dæmis erB þannig að 

þar sem ci er 

ci = 

B = 

n 

i=1 (xi − ¯x)Yi 

n i=1 (xi − ¯x) 

2 = 

n 

ciYi, 

i=1 

(xi − ¯x) 

n 

i=1 (xi − ¯x) 2 = (Sxx) −1 (xi − ¯x), i = 1,...,n. 

72

Hvert ci er fasti, og hvert Yi fylgir normaldreifingu og Y -in eru innbyrðis óháð. Þar af 

leiðandi fylgirB normaldreifingu með meðalgildi 

 

n 

 

n n 

E(B) = E = ciE(Yi) = ci(α+βxi) = 

= (Sxx) −1 

og dreifni 

 

α 

i=1 

ciYi 

i=1 

n 

(xi − ¯x)+β 

i=1 

var(B) = var 

og við ritum 

n 

i=1 

ciYi 

 

i=1 

n 

 

(xi − ¯x)xi 

i=1 

= 

= σ 2 (Sxx) −2 

Á sama hátt má sýna að umAgildi 

og að A fylgi normaldreifingu 

= (Sxx) −1 

= (Sxx) −1 {βSxx} = β, 

n 

c 2 i var(Yi) = 

i=1 

n 

i=1 

n 

i=1 

n 

i=1 

(Sxx) −1 (xi − ¯x)(α+βxi) 

 

n 

α×0+β x 2 i −n¯x2 

 

c 2 i σ2 = σ 2 

n 

i=1 

(xi − ¯x) 2 = σ 2 (Sxx) −2 Sxx = σ2 

 

B ∼ N β, σ2 

 

. 

Sxx 

E(A) = α, 

var(A) = σ 2 

 

1 ¯x2 

+ , 

n Sxx 

 

A ∼ N α,σ 2 

 

1 ¯x2 

+ . 

n Sxx 

Sxx 

i=1 

(Sxx) −2 (xi − ¯x) 2 

MetillinnAer því óbjagaður metill fyrirα, og metillinnB er óbjagaður metill fyrirβ. 

Summa leifanna í öðru veldi er kölluð fervikasumma. Fervikasumman sem fall af Y - 

unum,AogB er 

SSR = 

n 

(Yi −A−Bxi) 2 

i=1 

og er því slembistærð. Ef fervikasumman er fall af fengnumy-gildum og punktmatiaístað 

A og b í staðB, þá erSSR punktmat á einhverjum stika. Um slembistærðinaSSR gildir að 

SSR 

σ 2 ∼ χ2 n−2 . 

73 

,

Því eru meðalgildi og dreifniSSR/σ 2 

E 

 

SSR 

σ2 

= n−2, var 

Þá má sýna að meðalgildi og dreifni SSR/(n−2) eru 

Þar af leiðandi er metillinn 

 

SSR 

σ2 

= 2(n−2). 

 

SSR 

E = σ 

n−2 

2 

SSR 

, var = 

n−2 

2σ4 

(n−2) . 

S 2 r = SSR 

(n−2) 

óbjagaður metill fyrirσ 2 . Einnig má sýna að metillinnS 2 r 

er óháður metlunumAogB (ekki 

sýnt hér). Þar semσ 2 er yfirleitt óþekkt þarf að metaσ 2 og því einnig dreifniAogB. Dreifni 

A má meta með S 2 A og dreifni B má meta með S2 B 

S 2 A = S 2 r 

þar sem 

 

1 ¯x2 

+ , S 

n Sxx 

2 B = S2 r 

. 

Sxx 

Punktmat áσ 2 , táknað meðs 2 r , fæst með því að nota jöfnuna fyrirS2 r 

í staðY -anna, það er, 

s 2 r 

= 1 

n−2 

n 

(yi −a−bxi) 2 . 

i=1 

6.4 Öryggisbil og tilgátupróf fyrir α ogβ 

með fengnumy-gildum 

Í ljósi þess aðAogB fylgja normaldreifingum og aðSSR/σ 2 fylgir kí-kvaðratsdreifingu og 

er óháð A og B, má sýna að 

(A−α) 

SA 

∼ tn−2, 

(B −β) 

SB 

∼ tn−2 

með hjálp setningarinnar um t-dreifinguna. Við notum þessar staðreyndir til að búa til ör- 

yggisbil fyrirαogβ. UmAogB gildir að 

 

Pr −tα ′ /2,n−2 < (A−α) 

< tα 

SA 

′ 

/2,n−2 = 1−α ′ , 

 

Pr −tα ′ /2,n−2 < 

(B −β) 

SB 

74 

< tα ′ /2,n−2 

 

= 1−α ′ .

Því er100(1−α ′ )% öryggisbil fyrirαgefið með 

a±tα ′ /2,n−2sA, 

og 100(1−α ′ )% öryggisbil fyrirβ er gefið með 

b±tα ′ /2,n−2sB, 

þar semaogberu punktmat áαogβ ogs 2 A , ogs2 B 

eru punktmat á dreifni metlannaAogB 

sem fæst með því að notas 2 r í stað σ 2 , það er, s 2 A = s2 r(1/n+ ¯x 2 /Sxx) ogs 2 B = s2 r/Sxx. 

Ef við viljum gera tilgátupróf fyrir stikanaαogβ, þá notum við ofangreindar staðreyndir. 

Töflur 18 og 19 sýna þær jöfnur og ójöfnur sem þarf að nota við tilgátupróf fyrir α og β. 

LátumTn−2 tákna slembibreytu sem fylgirt-dreifingu með (n−2) frítölur. 

Tafla 18: Próf fyrirα. Núlltilgáta: H0: α = α0 Prófstærð: t = (a−α0) 


H1: α > α0 t > tα ′ ,n−2 Pr(Tn−2 ≥ t) 

H1: α < α0 t < −tα ′ ,n−2 Pr(Tn−2 ≤ t) 

H1: α = α0 |t| > tα ′ /2,n−2 2Pr(Tn−2 ≥ |t|) 

Tafla 19: Próf fyrirβ. Núlltilgáta: H0: β = β0 Prófstærð: t = (b−β0) 


H1: β > β0 t > tα ′ ,n−2 Pr(Tn−2 ≥ t) 

H1: β < β0 t < −tα ′ ,n−2 Pr(Tn−2 ≤ t) 

H1: β = β0 |t| > tα ′ /2,n−2 2Pr(Tn−2 ≥ |t|) 

75 

sA 

sB

6.5 Öryggisbil fyrir α+βx0 

Látum A + Bx0 vera metil fyrir α + βx0, það er, meðalgildi Y þegar skýribreytan tekur 

gildiðx0. Þá má sýna á sama máta og við sýndum fyrirB að 

og að A+Bx0 fylgi normaldreifingu 

Metillinn fyrir dreifniA+Bx0 er 

E(A+Bx0) = α+βx0, 

var(A+Bx0) = σ 2 

 

1 

n + (x0 − ¯x) 2 

Sxx 

 

A+Bx0 ∼ N α+βx0,σ 2 

 

1 

n + (x0 − ¯x) 2 

. 

Sxx 

S 2 A+Bx0 = S2 r 

Einnig má sýna á sama hátt og hér að ofan að 

 

1 

n + (x0 − ¯x) 2 

. 

Sxx 

(A+Bx0 −α−βx0) 

SA+Bx0 

∼ tn−2. 

Við notum þessa staðreynd til að mynda 100(1−α ′ )% öryggisbil fyrir α + βx0, en það er 

gefið með 

þar sem s 2 A+Bx0 

(a+bx0)±tα ′ /2,n−2sA+Bx0, 

er punktmat á dreifniA+Bx0. 

6.6 Spábil fyrir nýttY þegar skýribreytan tekur gildið x0 

Ef við eigum að spá fyrir um gildið á nýju Y -i þegar skýribreytan tekur gildið x0 þá er 

meðalgildi Y , E(Y) = α + βx0, gott spágildi fyrir Y . Þar sem α og β eru óþekkt, þá er 

eðlilegt að meta spágildið með A+Bx0. 

Við viljum segja til um á hvaða bili nýttY er líklegast til að falla. Dreifing Y er 

Y ∼ N(α+βx0,σ 2 ) 

76

og ef við þekktum α, β og σ 2 þá gætum við sagt að 95% af nýjum Y -um muni falla innan 

bilsins 

(α+βx0)±1,96σ. 

Þar semα,β og σ 2 eru óþekkt þá verðum við að taka óvissuna í matinu á þessu stikum með 

í reikninginn. Við gerum það með því að finna dreifingu Y −A−Bx0. Dreifing A+Bx0 

er eins og hér að ofan. Þar semY er óháðY1, ...,Yn sem voru notuð til að reiknaAogB, þá 

erY óháðAog B. Því er dreifing Y −A−Bx0 

 

Y −A−Bx0 ∼ N 0,σ 2 

 

1+ 1 

n + (x0 − ¯x) 2 

. 

Sxx 

Metill fyrir dreifniY −A−Bx0 er á forminu 

S 2 r 

 

1+ 1 

n + (x0 − ¯x) 2 

= S 

Sxx 

2 r +S 2 A+Bx0 . 

Á sama máta og við sýndum að breytur hér að ofan fylgi t-dreifingu með (n − 2) frítölum 

má sýna að 

Sr 

Y −A−Bx0 

 

1+ 1 (x0−¯x) 2 

+ n Sxx 

= Y −A−Bx0 

 

S 2 r +S 2 A+Bx0 

∼ tn−2. 

Við notum staðreyndirnar hér að ofan til að mynda 100(1−α ′ )% spábil fyrir nýtt Y þegar 

skýribreytan tekur gildiðx0 en það er gefið með 

 

eða 

(a+bx0)±tα ′ /2,n−2sr 

(a+bx0)±tα ′ /2,n−2 

1+ 1 

n + (x0 − ¯x) 2 

Sxx 

 

s 2 r +s2 A+Bx0 . 

6.7 Fylgnistuðull úrtaks og skýringarhlutfall 

Fylgnistuðull úrtaks metur styrk og stefnu línulegar fylgni á milli x og Y . Ef við höfum 

mælingar(x1,y1), ..., (xn,yn) þá er fylgnistuðull úrtaks,r, gefinn með 

r = 

n i=1 (xi − ¯x)(yi − ¯y) 

n i=1 (xi − ¯x) 2n i=1 (yi − ¯y) 

77 

2 = 

Sxy 

. 

SxxSyy

Umr gildir eftirfarandi 

i)rer óháð einingumxogY. 

ii)−1 ≤ r ≤ 1 

iii)r = 1 ef allir punktarnir eru á beinni línu með jákvæðri hallatölu. 

iv)r = −1 ef allir punktarnir eru á beinni línu með neikvæðri hallatölu. 

Til viðmiðunar fyrir gildi árþá setjum við fram Töflu 20. 

Tafla 20: Flokkun á gildumr. 

Bil Fylgni Formerki 

−1,0 ≤ r < −0,8 Sterk Neikvætt 

−0,8 ≤ r < −0,5 Miðlungs Neikvætt 

−0,5 ≤ r < 0,0 Veik Neikvætt 

r = 0,0 Engin 

0,0 < r ≤ 0,5 Veik Jákvætt 

0,5 < r ≤ 0,8 Miðlungs Jákvætt 

0,8 < r ≤ 1,0 Sterk Jákvætt 

Köllum Syy = (yi − ¯y) 2 heildardreifni mældu y-anna. Fervikasumman er eins og 

áðurSSR = e 2 i , og er mælikvarði á heildardreifni leifanna. Nefnum stærðinaSSE skýrða 

dreifni þar sem 

SSE = 

n 

(a+bxi − ¯y) 2 . 

i=1 

SSE mælir dreifnina sem líkanið skýrir. Sýna má að 

Syy = SSE +SSR. 

Heildardreifninni má því skipta í þátt sem að líkanið skýrir (SSE) og þátt sem ekki verður 

skýrður með skýribreytunni x (SSR). Skilgreinum skýringarhlutfall, R 2 , (e. coefficient of 

78

determination) sem hlutfall skýrðrar dreifni og heildardreifniy-anna 

UmR 2 gildir að 

R 2 = SSE 

Syy 

= Syy −SSR 

Syy 

0 ≤ R 2 ≤ 1. 

= 1− SSR 

. 

Syy 

Ef R 2 er til dæmis jafnt og 0,83, þá segjum við að x skýri 83% af dreifni Y . Sýna má að 

sambandið á millir ogR 2 sé 

r 2 = R 2 

Athugið að R 2 segir ekki til um formerkir. 

eða |r| = √ R 2 . 

6.8 Greining á leifunum: Forsendur líkans athugaðar 

Við notum leifarnar til að athuga hvort forsendurnar sem við gáfum okkur í upphafi séu réttar. 

Við fáum ekki beinar mælingar áǫ-unum en við getum notað leifarnar til að fá hugmynd um 

hvernigǫ-in hegða sér. 

Fyrst er athugað hvort sambandið sé línulegt með því að skoða leifarnar á mótix. Ef það 

er sýnilegt form í myndinni er möguleiki á að línanα+βx lýsi E(Y)ekki nægjanlega vel. Ef 

línan virðist lýsa E(Y) nægjanlega vel er næst athugað hvort ǫ-in hafi sömu dreifni með því 

að teikna leifarnar á móti x. Ef dreifnin virðist til dæmis vera að vaxa með skýribreytunni 

x þá er hugsanlegt að ǫ-in hafi ekki sömu dreifni fyrir mismunandi x. Ef dreifnin er sú 

sama fyrir öll x er athugað hvort ǫ-in fylgi normaldreifingu með því að teikna svokallað 

normaldreifingarrit af leifunum. Ef punktarnir á normaldreifingarritinu liggja nálægt línunni 

á myndinni og endapunktarnir báðum megin sveigjast ekki afgerandi upp eða niður þá er 

ásættanlegt að gera ráð fyrir að ǫ-in fylgi normaldreifingu. 

Mynd 17 sýnir þrjú tilfelli af gögnum. Í hverju tilfelli er sýnd mynd af gögnunum og 

aðhvarfslínunni, leifunum á móti x breytunni og normaldreifingarrit. Þrjár efstu mynd-irnar 

sýna tilfelli þar sem öllum forsendum er fullnægt. Myndirnar þrjár í miðjunni sýna tilfelli 

þar sem parabólulið eða einhvern ólínulegan lið vantar í líkanið. Þetta sést vel á myndinni 

79

af leifunum á mótix-unum. Þrjár neðstu myndirnar sýna tilfelli þar sem dreifniǫ-anna er að 

vaxa meðx-unum. 

Hermd gögn og aðhvarfslína úrtaks 

20 

10 

0 

−10 

0 5 10 15 

200 

150 

100 

50 

0 

0 5 10 15 

60 

40 

20 

0 

0 10 20 

x 

10 

0 

−10 

40 

20 

0 

−20 

Leifar (e i ) á móti x 

0 5 10 15 

−40 

0 5 10 15 

50 

0 

−50 

0 10 20 

x 

Normaldreifingarrit af leifum 

0.99 

0.98 

0.95 

0.90 

0.75 

0.50 

0.25 

0.10 

0.05 

0.02 

0.01 

−10 −5 0 5 

0.98 

0.95 

0.90 

0.75 

0.50 

0.25 

0.10 

0.05 

0.02 

−20 0 20 40 

0.99 

0.98 

0.95 

0.90 

0.75 

0.50 

0.25 

0.10 

0.05 

0.02 

0.01 

−20 0 20 

e 

i 

40 

Mynd 17: Dæmi um greiningu á leifum úr línulegri aðhvarfsgreiningu. 

6.9 Ólínulegu líkani varpað á línulegt form 

Sambandið á milliY ogxgetur verið ólínulegt. Í sumum tilfellum er hægt að varpa ólínulegu 

líkani yfir í línulegt líkan. Hér skoðum við tvö slík tilfelli. Fyrra líkanið er á forminu 

Yi = γx θ i eφi , φi ∼ N(0,η 2 ), i = 1,...,n, 

þar sem x1, ..., xn, γ, θ og η 2 eru fastar. Ef við notum náttúrulega lografallið báðum megin 

við jafnaðarmerkið fæst 

Ef við látum 

ln(Yi) = ln(γ)+θln(xi)+φi, i = 1,...,n. 

Y ∗ 

i = ln(Yi), x ∗ i = ln(xi), i = 1,...,n, γ ∗ = ln(γ), 

80

þá má skrifa líkanið á forminu 

Y ∗ 

i = γ ∗ +θx ∗ i +φi, i = 1,...,n, 

og meta stikana γ ∗ og θ með aðferð minnstu kvaðrata. Einnig er hægt að nota aðferð-irnar 

sem sýndar hafa verið hér að ofan til að finna öryggisbil og gera tilgátupróf. 

Seinna líkanið er á forminu 

Yi = κe λxi+υi , υi ∼ N(0,τ 2 ), i = 1,...,n, 

þar sem x1, ..., xn, κ, λ og τ 2 eru fastar. Ef við notum náttúrulega lografallið báðum megin 

við jafnaðarmerkið fæst 

Ef við látum 

þá má skrifa líkanið á forminu 

ln(Yi) = ln(κ)+λxi +υi, i = 1,...,n. 

κ ∗ = ln(κ), 

Y ∗ 

i = κ∗ +λxi +υi, i = 1,...,n, 

og meta stikana κ ∗ og λ með aðferð minnstu kvaðrata. Eins og gilti um fyrra líkanið er 

hægt að nota jöfnurnar hér að ofan til að reikna öryggisbil og gera tilgátupróf. Til að finna 

öryggisbil fyrir γ og κ í líkönunum hér að ofan verður að varpa öryggisbilunum fyrir γ ∗ og 

κ ∗ með því að setjaeíveldið af efri og neðri mörkunum. 

6.10 Dæmi 

Fyrirtæki í tölvugeiranum sér um þjónustu fyrir tölvur. Látum x vera fjölda tölva sem eru 

þjónustaðar í einu útkalli og látumY vera heildartímann við að þjónustax vélar í einu útkalli. 

Tafla 21 sýnir mælingar sem fengust úr 18 útköllum starfsmanna. 

Gerum ráð fyrir að gögnin fylgi línulegu líkani 

Yi = α+βxi +ǫi, ǫi ∼ N(0,σ 2 ), i = 1,...,18. 

81

Tafla 21: Heildartími við þjónustu á tölvum. 

Mæl- Fjöldi Tími Mæl- Fjöldi Tími Mæl- Fjöldi Tími 

ing # tölva (mín.) ing # tölva (mín.) ing # tölva (mín.) 

i xi yi i xi yi i xi yi 

1 7 97 7 7 101 13 2 25 

2 6 86 8 3 39 14 5 71 

3 5 78 9 4 53 15 7 105 

4 1 10 10 2 33 16 1 17 

5 5 75 11 8 118 17 4 49 

6 4 62 12 5 65 18 5 68 

Nokkrar reiknistærðir byggðar á gögnunum; 

Sxy = 

Sxx = 

i=1 

n = 18, ¯x = 4,5, ¯y = 64,0, 

n 

(xi − ¯x) 2 = 74,5, Syy = 

i=1 

Punktmatið á α,β ogσ er 

Fylgnistuðull úrtaks er 

n 

(yi − ¯y) 2 = 16504, 

n 

(xi − ¯x)(yi − ¯y) = 1098, SSR = (SxxSyy −S 2 xy ) 

= 321,396. 

b = Sxy 

Sxx 

= 1098 

74,5 

i=1 

= 14,738 

Sxx 

a = ¯y −b¯x = 64,0−14,738×4,5 = −2,322 

r = 

sr = 

SSR 

n−2 = 

Sxy 

SxxSyy 

= 

321,396 

18−2 

= 4,482. 

1098 

√ 74,5×16504 = 0,9902 

og við segjum að fylgnin sé sterk og jákvæð. Skýringarhlutfallið er 

R 2 = r 2 = 0,9902 2 = 0,9805 

82

og því skýrirx98% af dreifni Y . 

Mat á staðalfrávikiAer 

 

sA = sr 

1 ¯x2 

+ = 4,482× 

n Sxx 

1 4,52 

+ = 2,564 

18 74,5 

og því er 95% öryggisbil fyrirα 

a±tα ′ /2,n−2sA = −2,322±2,120×2,564 = (−7,76,3,11). 

Reiknum 95% öryggisbil fyrirβ 

b±tα ′ /2,n−2sr/ Sxx = 14,738±2,120×4,482/ √ 74,5 = (13,64,15,84). 

Hvert er punktmatið á meðalgildi Y þegar skýribreytan tekur gildið x0 = 5? Meðalgildi Y 

þegarx0 = 5 erα+βx0 = α+β5 og er metið með 

a+bx0 = a+b5 = −2,331+14,738×5 = 71,37. 

Hversu vel er meðalgildi Y metið þegar x0 = 5? Notum 95% öryggisbil fyrir α + βx0 = 

α+β5 til að meta vissuna í matinu 

a+bx0 ±tα ′ /2,n−2sA+Bx0 = a+bx0 ±tα ′ /2,n−2sr 

= (−2,331+14,738×5)±2,120×4,482 

 

1 (5−4,5)2 

+ 

18 74,5 

 

1 

n + (x0 − ¯x) 2 

Sxx 

= (69,06,73,68). 

Ef það er gefið að þjónusta eigi x0 = 5 tölvur, á hvaða bili má búast við að heildartíminn 

verði? Notum 95% spábil til að finna þetta bil 

a+bx0 ±tα ′ 

/2,n−2 s2 r +s2 A+Bx0 = a+bx0 ±tα ′ 

/2,n−2sr 1+ 1 

n + (x0 − ¯x) 2 

Sxx 

 

= (−2,331+14,738×5)±2,120×4,482 1+ 1 (5−4,5)2 

+ = (61,59,81,15). 

18 74,5 

Það er hugsanlegt að það sé enginn fastur tími sem fer í útkall. Það þýðir að α = 0. Prófum 

núlltilgátuna H0 : α = 0 á móti gagntilgátunni H1 : α = 0. Notum marktektarkröfu 

α ′ = 0,01. Prófstærðin er 

t = a−α0 

sA 

= a−0 

sA 

= −2,322−0 

2,564 

83 

= −0,906.

Höfnunarsvæðið er; |t| > tα ′ /2,n−2 = t0,005,16 = 2,921. Þar sem |t| = |−0,906| < 2,921 = 

t0,005,16 þá höfnum við ekki H0 við marktektarkröfu α ′ = 0,01. Því er möguleiki að líkanið 

sé á forminu 

Tími (mín) 

e i 

140 

120 

100 

80 

60 

40 

20 

0 

Yi = βxi +ǫi, ǫi ∼ N(0,σ 2 ), i = 1,...,18. 

Heildartími á móti fjölda tölva 

−20 

0 2 4 

Fjöldi (x) 

6 8 

10 

5 

0 

−5 

−10 

Leifar (e i ) á móti fjölda (x) 

0 2 4 

Fjöldi (x) 

6 8 

Líkur 

Tími (mín) 

140 

120 

100 

80 

60 

40 

20 

0 

95% öryggisbil og 95% spábil 

−20 

0 2 4 

Fjöldi (x) 

6 8 

0.98 

0.95 

0.90 

0.75 

0.50 

0.25 

0.10 

0.05 

0.02 

Normaldreifingarrit af leifum 

−5 0 

e 

i 

5 

Mynd 18: Línuleg aðhvarfsgreining á gögnum um heildarþjónustutíma á móti fjölda tölva 

Mynd 18 sýnir aðhvarfsgreiningu á gögnunum um þjónustutíma fyrir tölvur. Myndin 

efst vinstra megin sýnir heildarþjónustutímann á móti fjölda tölva. Myndin efst hægra megin 

sýnir aðhvarfslínuna, 95% öryggisbil fyrir α + βx, og 95% spábil fyrir ný Y á móti fjölda 

tölva. Myndin neðst vinstra megin sýnir leifarnar á móti skýribreytunni x, það er, fjölda 

tölva. Myndin neðst til hægri sýnir normaldreifingarrit af leifunum. Af neðri myndunum 

á Mynd 18 er ásættanlegt að ætla að α + βx lýsi E(Y) nægjanlega vel, að ǫ-in hafi sömu 

dreifni fyrirxábilinu 1 til 8 og að ǫ-in fylgi normaldreifingu. 

84

7 Próf fyrir mátgæði og tengslatöflur 

7.1 Próf fyrir mátgæði þegar allir stikar eru þekktir 

Höfum slembiúrtak Y1, ..., Yn úr strjálli dreifingu. Við viljum prófa hvort líkindadreifing 

Y -anna sé 

Pr(Y = j) = pj, j = 1,2,...,k, 

þar sem Y hefur sömu dreifingu og Y1, ...,Yn ogp1,...,pk, eru þekktir fastar. 

Núlltilgátan er 

á móti gagntilgátunni 

H0 : Pr(Y = j) = pj, j = 1,2,...,k, 

H1 : Pr(Y = j) = pj, fyrir eitthvertj ∈ {1,2,...,k}. 

Próf af þessu tagi eru nefnd próf fyrir mátgæði (e. goodness-of-fit tests). 

Látum Xj, j = 1,...,k, vera fjölda þeirra Y -a sem eru jöfn j. Að því gefnu að H0 sé 

sönn, eru líkurnar á að Y sé jafnt og j jafnar pj, og þar sem Xj telur fjöldann af n óháðum 

Y -um sem eru jöfn j, þá er 

Xj ∼ Bin(n,pj), E(Xj) = npj, j = 1,...,k. 

Stærðin (Xj − npj) 2 mælir hversu langt Xj er frá meðalgildi sínu að því gefnu að H0 sé 

sönn. 

Prófstærðin fyrir tilgáturnar hér að ofan er 

T = 

k (Xj −npj) 2 

. 

npj 

j=1 

Við höfnum H0 ef gildið á T fyrir gefna tilraun er stórt. Að því gefnu að H0 sé sönn má 

nálga dreifingu T með kí-kvaðratsdreifingu með (k −1) frítölum 

T ∼ χ 2 k−1. 

85

Höfnunarsvæðið er þannig að við höfnumH0 ef 

t > χ 2 α,k−1 

þar sem t er gildið á prófstærðinni fyrir gefna tilraun. 

P -gildið er 

þar sem W 2 k−1 ∼ χ2 k−1 . 

P -gildi = Pr(W 2 k−1 ≥ t). 

Dæmi. 120 dúfur á heimleið eru gerðar áttavilltar og svo sleppt. Eru dúfurnar algerlega 

áttavilltar? Setjum áttirnar í 8 flokka, sjá Töflu 22 ásamt gögnum. Notum marktektarkröfu 

α = 0,01. Tafla 23 sýnir fjölda og væntanlega fjölda í hverjum flokki. 



Tafla 22: Flokkar og fjöldi í flokkum fyrir gögn um dúfur. 

Stefna 0 ◦ −45 ◦ 45 ◦ −90 ◦ 90 ◦ −135 ◦ 135 ◦ −180 ◦ 

Fjöldi 12 16 17 15 

Stefna 180 ◦ −225 ◦ 225 ◦ −270 ◦ 270 ◦ −315 ◦ 315 ◦ −360 ◦ 

Fjöldi 13 20 17 10 

H0 : Pr(Y = j) = pj = 1 

, j = 1,2,...,8, 

8 

H1 : Pr(Y = j) = 1 

, fyrir eitthvertj ∈ {1,2,...,8}. 

8 

Tafla 23: Fjöldi og væntanlegur fjöldi í flokkum fyrir gögn um dúfur. 

j 1 2 3 4 5 6 7 8 Heild 

xj 12 16 17 15 13 20 17 10 120 

npj 15 15 15 15 15 15 15 15 120 

86

HöfnumH0 ef 

t = 

8 (xj −npj) 2 

j=1 

npj 

= (12−15)2 

15 

+...+ (10−15)2 

15 

= 32 12 22 02 22 52 22 52 72 

+ + + + + + + = = 4,8 

15 15 15 15 15 15 15 15 15 

t > χ 2 0,01,7 = 18,475. 

Því höfnum við ekki H0 miðað við marktektarkröfu α = 0,01. P -gildið gefur einnig til 

kynna að ekki skuli hafnaH0. 

P -gildi = Pr(W 2 7 ≥ 4,8) = 0,6844 > α = 0,01. 

7.2 Próf fyrir mátgæði þegar einn eða fleiri stikar eru óþekktir 

Hér eru p1,...,pk föll af einhverjum m óþekktum stikum, θ = (θ1,...,θm) T , og því eru p- 

in einnig óþekkt. Við viljum prófa hvort gögnin fylgi stikaðri líkindadreifingu, til dæmis 

Poisson dreifingu eða tvíkostadreifingu. Gildin á stikunum eru fundin með sennileikamati. 

Táknum matið ápj = pj(θ) með ˆpj = pj( ˆ θ), j = 1,...,k. 



H0 : Pr(Y = j) = pj(θ), j = 1,2,...,k, 

H1 : Pr(Y = j) = pj(θ), fyrir eitthvertj ∈ {1,2,...,k}. 

Prófstærðin fyrir tilgáturnar hér að ofan er 

T = 

k (Xj −nˆpj) 2 

. 

nˆpj 

j=1 

Að því gefnu að H0 sé sönn má nálga dreifinguT með 

T ∼ χ 2 k−1−m . 


t > χ 2 α,k−1−m 

87


P -gildið er 

þar sem W 2 k−1−m ∼ χ2 k−1−m . 

P -gildi = Pr(W 2 k−1−m ≥ t). 

Dæmi. 150 vasaljós(n = 150), hvert með 4 rafhlöðum. Notum marktektarkröfu α = 0,01. 

Yi = fjöldi bilaðra rafhlaðna íi-ta vasaljósinu, i = 1,...,150. 

HvertYi getur tekið gildin0,1,2,3 og 4. Sjá gögn um vasaljósin í Töflu 24. 

Tafla 24: Flokkar vasaljósa, flokkað eftir fjölda bilaðra rafhlaðna. 

Flokkurj 1 2 3 4 5 

Fjöldi bilaðra rafhlaðna 0 1 2 3 4 

Fjöldi í flokkij (xj) 26 51 47 16 10 

FylgirY tvíkostadreifingu? Núlltilgátuna má rita 


H0 : Pr{Y = y(j)} = pj(θ) = 

4! 

{4−y(j)}!y(j)! θy(j) (1−θ) 4−y(j) , 

y(j) = j −1, j = 1,2,...,5, 

H1 : Pr{Y = y(j)} = pj(θ), fyrir eitthvertj ∈ {1,2,...,5}. 

Metumθ með sennileikametli. Sennileikametillinn fæst með því að lágmarka 

L(θ) = 

150 

i=1 

fYi (yi) 

150 

 

4 

= 

i=1 

Sennileikametillinn fyrirθ er 

yi 

ˆθ = 1 

150 

θ yi (1−θ) 4−yi , yi ∈ {0,1,2,3,4}, i = 1,...,150. 

150 

i=1 

1 

4 Yi = 

1 

4×150 

88 

5 

(j −1)Xj. 

j=1

Sennileikamatið áθ er 

ˆθ = 1 

(0×26+1×51+2×47+3×16+4×10) = 0,3883. 

600 

Reiknum hvert ˆpj, j = 1,...,5, 

ˆp1 = Pr(Y = 0) = 

ˆp2 = Pr(Y = 1) = 

ˆp3 = Pr(Y = 2) = 

ˆp4 = Pr(Y = 3) = 

ˆp5 = Pr(Y = 4) = 

 

4 

ˆθ 

0 

0 (1− ˆ θ) 4−0 = 

 

4 

ˆθ 

1 

1 (1− ˆ θ) 4−1 = 

 

4 

ˆθ 

2 

2 (1− ˆ θ) 4−2 = 

 

4 

ˆθ 

3 

3 (1− ˆ θ) 4−3 = 

 

4 

ˆθ 

4 

4 (1− ˆ θ) 4−4 = 

 

4 

0,3883 

0 

0 (1−0,3883) 4 = 0,1400, 

 

4 

0,3883 

1 

1 (1−0,3883) 3 = 0,3555, 

 

4 

0,3883 

2 

2 (1−0,3883) 2 = 0,3385, 

 

4 

0,3883 

3 

3 (1−0,3883) 1 = 0,1433, 

 

4 

0,3883 

4 

4 (1−0,3883) 0 = 0,0227. 

Notum þessi gildi á ˆpj, j = 1,...,5 til að reikna út væntanlegan fjölda, sjá Töflu 25, og 

prófstærðina. 

Tafla 25: Fjöldi og væntanlegur fjöldi í flokkum. 

j 1 2 3 4 5 

y(j) 0 1 2 3 4 

xj 26 51 47 16 10 

nˆpj 21,00 53,32 50,78 21,49 3,41 

89

HöfnumH0 ef 

t = 

5 (xj −nˆpj) 2 

j=1 

+ (47−50,78)2 

50,78 

npj 

= (26−21,00)2 

21,00 

+ (16−21,49)2 

21,49 

t > χ 2 α,k−1−m = χ2 0,01,5−1−1 

+ (51−53,32)2 

53,32 

+ (10−3,41)2 

3,41 

= 11,345. 

= 15,71. 

Þar sem t = 15,71 > 11,345 = χ 2 0,01,3 þá höfnum við H0 miðað við marktektarkröfu 

α = 0,01. P -gildið er 

P -gildi = Pr(W 2 3 

≥ 15,71) = 0,0013. 

Því mundum við hafna H0 við marktektarkröfuα > 0,0013. 

7.3 Próf fyrir tengslatöflur 

Hér hefur hver einstaklingur í þýðinu tvö einkenni (tvö gildi) þar sem hvort einkenni greinist 

í nokkra flokka. Köllum fyrra einkennið X-einkenni og segjum að það greinist í r flokka. 

Köllum seinna einkenniðY -einkenni og segjum að það greinist í s flokka. 

Gerum ráð fyrir að einstaklingar í þýðinu séu óháðir. Líkurnar á að einstaklingur sem 

valinn er af handahófi sé meðX-einkenni í i-ta flokki ogY-einkenni íj-ta flokki, eru 

Látum 

og 

pij = Pr(X = i,Y = j), i = 1,...,r, j = 1,...,s. 

pi = Pr(X = i) = 

qj = Pr(Y = j) = 

s 

pij, i = 1,...,r, 

j=1 

r 

pij, j = 1,...,s. 

i=1 

Við viljum prófa hvort einkenninX ogY séu óháð en það felur meðal annars í sér að ef við 

vitum til dæmisX-einkennið þá breytir það ekki líkunum á að vera með ákveðiðY-einkenni. 


H0 : pij = piqj, fyrir ölli = 1,...,r, j = 1,...,s, 

90


H1 : pij = piqj, fyrir eitthvert(i,j) . 

Þetta próf er kallað próf fyrir tengslatöflur (e. test of independence in contingency tables). 

Við vitum ekki gildin ápi og qj og því þarf að meta þau með gögnunum. Látum 

Metumpi með 

og metumqj með 

Nij = fjöldi með X = i ogY = j, 

Ni = 

Mj = 

Ef núlltilgátan er sönn þá gildir að 

Prófstærðin er 

s 

Nij, i = 1,...,r, 

j=1 

r 

Nij, j = 1,...,s, 

i=1 

n = heildarfjöldi einstaklinga í úrtaki = 

T = 

s 

j=1 

r 

i=1 

ˆpi = Ni 

, i = 1,...,r, 

n 

ˆqj = Mj 

, j = 1,...,s. 

n 

E(Nij) = npij = npiqj. 

(Nij −nˆpiˆqj) 2 

nˆpiˆqj 

Við höfum í raun r ×s flokka og metum alls 

stika. Frítölurnar eru því 

= 

s 

j=1 

r 

i=1 

r −1+s−1 = r +s−2 

s 

j=1 

N 2 ij 

nˆpiˆqj 

rs−1−(r+s−2) = (r −1)(s−1). 

91 

r 

i=1 

Nij. 

−n.

Athugið að 

r 

pi = 1, 

i=1 

s 

qj = 1, 

j=1 

Að því gefnu að H0 sé sönn má nálga dreifinguT með 

T ∼ χ 2 (r−1)(s−1). 


t > χ 2 α,(r−1)(s−1) 


P -gildið er 

þar sem W 2 

(r−1)(s−1) ∼ χ2 (r−1)(s−1) . 

s 

j=1 

r 

pij = 1. 

i=1 

P -gildi = Pr(W 2 

(r−1)(s−1) ≥ t). 

Dæmi. Lungnakrabbi og reykingar, sjá gögn Töflu 26. 

Tafla 26: X: fékk lungnakrabba eða ekki Y : reykir eða reykir ekki 

Y 

Reykir Reykir ekki Heild 

X Lungnakrabbi N11 = 62 N12 = 14 N1 = 76 

Mat áp1, p2, q1 ogq2 er 

ˆp1 = N1 

n 

ˆq1 = M1 

n 

Ekki lungnakrabbi N21 = 9938 N22 = 19986 N2 = 29924 

Heild M1 = 10000 M2 = 20000 n = 30000 

76 

= 

30000 = 0,002533, ˆp2 = N2 

n 

10000 

= 

30000 = 0,333333, ˆq2 = M2 

n 

Stærðirnar nˆp1ˆq1, nˆp1ˆq2, nˆp2ˆq1 og nˆp2ˆq2 eru 

92 

29924 

= = 0,997467, 

30000 

20000 

= = 0,666667. 

30000

Prófstærðin er 

nˆp1ˆq1 = n N1M1 

n n 

nˆp1ˆq2 = n N1 

n 


n 


n 

t = 

2 

j=1 

2 

i=1 

M1 

n 

M2 

n 

M2 

n 

= N1M1 

n 

= N1M2 

n 

= N2M1 

n 

= N2M2 

n 

(Nij −nˆpiˆqj) 2 

nˆpiˆqj 

+ (9938−9974,67)2 

9974,67 

= 76×10000 

30000 

= 76×20000 

30000 

= 29924×10000 

30000 

= 29924×20000 

30000 

= (62−25,33)2 

25,33 

+ (19986−19949,33)2 

19949,33 

= 25,33, 

= 50,67, 

= 9974,67, 

= 19949,33. 

+ (14−50,67)2 

50,67 

= 79,83. 

Notum marktektarkröfu α = 0,01. Stærðirnar r og s eru hér r = 2 og s = 2. Höfn- 

unarsvæðið er 

t > χ 2 α,(r−1)(s−1) = χ 2 0,01,1 = 6,635. 

Þar semt = 79,81 > 6,635 = χ 2 0,01,1 þá höfnum viðH0. P -gildið er 

P -gildi = Pr(W 2 1 ≥ 79,83) = 0, 

og því mundum við hafnaH0 fyrir hvaða marktektarkröfu sem er. 

Niðurstaðan er því sú að líkurnar á því að fá lungnakrabbamein eru ekki óháðar því 

hvort maður reykir eða ekki. Af gögnunum má sjá að reykingar auka líkurnar á því að fá 

lungnakrabbamein. En við getum ekki fullyrt að reykingarnar hafi valdið krabbameini hjá 

þeim sem reyktu og fengu krabbamein. 

93

Heimildir 

Ross, S. M. (2004), Introduction to Probability and Statistics for Engineers and Scientists 

(3rd ed.), Belmont, CA: Duxbury. 

94

pdf - Háskóli Íslands

Create successful ePaper yourself

Delete template?

Save as template?