29.07.2013 Views

Lærebog i matematik.pdf

Lærebog i matematik.pdf

Lærebog i matematik.pdf

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

KAPITEL 2<br />

TESTS<br />

2.1 Statistik kontra sandsynlighedsregning<br />

Inden for sandsynlighedsregning opstiller vi en model, som vi kan benytte til at<br />

beskrive de hcendelser, som vi forventer kan indtrceffe. Vi kan ikke vcere sikre pa,<br />

at hcendelserne indtrceffer, men vi kan scette tal pa vore forventninger i form af<br />

sandsynligheder.<br />

Et klassisk eksempel er kast med en m0nt. Nar m0nten er "cerlig", er sandsyn­<br />

ligheden 50 % for at fa krone og 50 % for at fa plat. Det betyder ikke, at hvert<br />

andet m0ntkast skal give krone, sa det vil ikke komme bag pa os, hvis tre kast<br />

med m0nten giver os 3 gange krone, men hvis 10 kast med m0nten giver 10 gan­<br />

ge krone, vil vi for alvor begynde at betvivle m0ntens cerlighed. Kaster vi m0nten<br />

et start antal gange, vil vi forvente, at ca. halvdelen af kastene giver krone. Ved<br />

10 kast med m0nten er 7 gange krone ikke uscedvanligt, men ved 100 000 kast er<br />

70 000 gange krone meget uscedvanligt.<br />

Ved brug af sandsynlighedsregning kan vi beregne sandsynligheden for de data,<br />

vi observerer ved udf0rte eksperimenter. Sandsynlighedsregning henregner vi til<br />

en matematisk disciplin.<br />

Inden for statistik er udgangspunktet i stedet observerede data, og statistik gar<br />

ud pa at gcette/ give bud pa en sandsynlighedsmodel, som kan forklare de obser­<br />

verede data.<br />

Som eksempel pa data kan vi se pa en liste med kr, kr, kr. Som statistikere kan<br />

vi opstille en hypotese om, at data stammer fra et simpelt fors0g, hvor vi kaster<br />

en m0nt tre gange, og hvor sandsynligheden for bade plat og krone er 50 % ved<br />

hvert kast.<br />

Har vii stedet et datascet, der indeholder 10 gange krone, vii vi tage den f0rste<br />

hypotese op til revision og erstatte den med en hypotese om, at m0nten har krone<br />

43


pa begge sider, dvs. at sandsynligheden for at sla krone er 100 %, og sandsynlig­<br />

heden for plat er 0 %.<br />

Hvis datascettet skiftevis bestar af krone, plat, krone, plat, krone, plat kan vi fast­<br />

holde vor f0rste hypotese. Men hvis datascettet skiftevis bestar af krone og plat<br />

svarende til i alt 25 par, vil vi cendre vor hypotese. Data svarer da nceppe til et<br />

kast med en m0nt, men er bedre beskrevet ved et eksperiment, hvor vi systema­<br />

tisk vender m0nten. Hvis resultatet af en udf0relse af fors0get er krone, vil den<br />

nceste udf0relse af fors0get resultere i plat med 1 00 % sandsynlighed.<br />

Forskellen mellem sandsynlighedsregning og statistik er illustreret i figur 2.1.<br />

Sandsynlighedsregning<br />

Statistik<br />

Figur 2.1<br />

Ved en statistisk test fors0ger vi at bekrcefte eller afkrcefte formodninger, sammen­<br />

hcenge eller egenskaber ud fra indsamlede data.<br />

Udgangspunktet er nogle observerede vcerdier, som vi har skaffet os ved en un­<br />

ders0gelse f.eks. et eksperiment, en stikpmve eller en systematiske indsamling<br />

af data. De observerede vcerdier sammenligner vi med forventede vrerdier, som vi<br />

beregner ud fra en hypotese, som vi opstiller.<br />

Safremt der er god overensstemmelse mellem observerede og forventede vcerdi­<br />

er, kan denne sammenligning, som vi altsa kalder en test, f0re til, at vi accepterer<br />

hypotesen. At vi accepterer hypotesen svarer ikke til, at vi har bevist, at hypotesen<br />

er sand, men kun til at de observerede data ikke er "ekstreme" under hypotesen.<br />

Hvis vi ved sammenligningen rna forkaste hypotesen, har vi ikke bevist, at hypo­<br />

tesen er forkert. Det betyder sa blot, at de observerede data er sa ekstreme, at vi<br />

har rigtig god grund til at mene, at vor hypotese formodentlig er forkert.<br />

De data, vi ser pa, er ofte indsamlet for at pavise en bestemt sammenhceng. Vi<br />

opstiller sa en hypotese om mangel pa netop denne sammenhceng. Den s0gte<br />

sammenhreng far vi sa pavist ved at forkaste hypotesen.<br />

44 KAPITEL TESTS


2.2 Hypotesetest<br />

Ved en statistisk test sammenligner vi observerede data med forventede data ud<br />

fra en hypotese, som vi har opstillet.<br />

Den hypotese, vi tester, betegner vi med H 0 og kalder den nulhypotesen. En test af<br />

hypotesen f0rer nu til, at vi en ten accepterer hypotesen eller forkaster hypotesen.<br />

Eftersom en hypotese enten er sand eller falsk, vii vi i testsituationen kunne bega<br />

to typer af fejl.<br />

Hvis vi forkaster en sand hypotese, begar vi en type-1 fejl.<br />

Hvis vi accepterer en falsk hypotese, begar vi en type-2 fejl.<br />

OK<br />

Figur 2.2<br />

At acceptere en hypotese svarer som mevnt ikke til at have vist, at hypotesen er<br />

sand, kun at data ikke giver anledning til, at vi kan afvise den. Vi opnar saledes<br />

kun ny viden ved at forkaste en hypotese, og derfor vii vi ofte formulere nul­<br />

hypoteser, som indeholder en pastand, der er den omvendte af det, vi gerne vii<br />

konkludere. Saiedes vii nulhypoteser ofte rumme pastande om "ingen sammen­<br />

hceng" mellem st0rrelser eller 11ingen virkning" af f.eks. en medicinsk behand­<br />

ling.<br />

Nar vi har opstillet en nulhypotese, skal vi desuden opstille en alternativ hypotese<br />

Ha, som svarer til, hvad der rna gcelde, hvis H 0 ikke er opfyldt. Den simpleste<br />

alternative hypotese Ha svarer til negationen af H 0 , som sjceldent er scerlig infor­<br />

mativ. Den alternative hypotese er imidlertid vigtig, da den influerer pa, hvornar<br />

vi accepterer nulhypotesen.<br />

Ved selve testen tager vi udgangspunkt i nulhypotesen og beregner nogle sand­<br />

synligheder ved hjcelp af en teststorrelse X. Disse sandsynligheder benytter vi sa<br />

til at afg0re, i hvor h0j grad data passer til nulhypotesen H 0 •<br />

45


Vi er naturligvis interesseret i at begrrense risikoen for at forkaste en sand hypo­<br />

tese, dvs. bega en type-1 fejl.<br />

Derfor knytter vi en testsandsynlighed, som vi omtaler som p-vcerdien, til testen.<br />

p-vrerdien er sandsynligheden for den observerede vrerdi Xobs eller noget, der er<br />

vrerre under nulhypotesen, dvs. noget, der er mere ekstremt i forhold til nulhy­<br />

potesen. p-vrerdien viser os, hvor rimeligt deter at tro pa, at data er fremkommet<br />

ved tilfreldigheder, nar nulhypotesen er sand, og jo mindre p-vrerdien er, jo mere<br />

tyder det pa, at H 0 ikke er sand.<br />

Vi rna derfor acceptere en vis sandsynlighed for at bega en type-1 fejl, ogden­<br />

ne sandsynlighed fastsretter vi selv uafhrengigt af data, og vi omtaler den som<br />

testens signifikansniveau a.<br />

Hvis p-vrerdien er mindre end signifikansniveauet, forkaster vi nulhypotesen, og<br />

vi siger, at resultatet er signifikant pa signifikansniveau a. Vi siger ogsa, at resul­<br />

tatet er signifikant pa signifikansniveau p, nar p ::5 a.<br />

De hyppigst anvendte signifikansniveauer er a = 5 %, a = 1 % og a = 0, 1 %, og<br />

hvis p-vrerdien er under signifikansniveauet, forkaster vi nulhypotesen.<br />

Et signifikansniveau fastlregger en kritisk mcengde K, som bestar af de ekstreme<br />

vrerdier af testst0rrelsen, inden for hvilken vi forkaster nulhypotesen, samt en<br />

acceptmcengde A, inden for hvilken vi accepterer nulhypotesen.<br />

De ekstreme vrerdier kalder vi ogsa de kritiske vrerdier, og hvis de kritiske vrerdi­<br />

er alle er sma, eller alle er store, kalder vi testen ensidet. Hvis de kritiske vrerdier<br />

af testst0rrelsen bade kan vrere sma eller store bestar den kritiske mrengde af to<br />

dele, og vi kalder testen tosidet. I dette tilfrelde deler vi signifikansniveauet lige<br />

pa de to dele.<br />

Hojre kritisk<br />

mrengde<br />

Figur 2.4 Kun store kritiske<br />

v


Ha: Forekomst af autistiske tegn blandt b0rn er ikke 7%<br />

Vi udf0rer en test pa 5 %-niveau, og som testst0rrelse anvender vi den b(384, 0, 07)­<br />

fordelte stokastiske varia bel X, der an giver antallet af b0rn med tegn pa autisme.<br />

Da bade et meget lille og et meget stort antal bmn med tegn pa autisme under­<br />

st0tter den alternative hypotese, benytter vi en tosidet test med tilh0rende todelt<br />

kritisk ma:ngde. De to dele af den kritiske ma:ngde fastla:gger vi ved at kra:ve, at<br />

sandsynligheden for hver af delene ikke rna overstige 2,5 %.<br />

Idet<br />

P(X::::; 17) = 0,0247 = 2,47%<br />

P(18::::; X::::; 37) = 0, 9546 = 95,46%<br />

P(X ::::: 38) = 0, 0207 = 2, 07%<br />

bliver den kritiske ma:ngde K og acceptma:ngden A<br />

K = {0, 1,2, ... , 17} U {38, 39, ... , 384}<br />

A= {18,19, ... ,36,37}<br />

Da Xobs = 46 tilh0rer den kritiske ma:ngde, forkaster vi nulhypotesen, og resulta­<br />

tet er signifikant pa 5 % niveau.<br />

p-va:rdien finder vi i dette tosidede tilfa:lde som 2 gange den mindste af sand­<br />

synlighederne P(X ::::; Xobs) og P(X ::?: X 0 b 5 ).<br />

Nuer<br />

P(X::::; 46) = 0, 9998<br />

P(X ::::: 46) = 0, 000293<br />

sa p-va:rdien er 0,059 %.


Eksempel22<br />

Tabellen nedenfor viser fordelingen af unge ud fra deres foretrukne drik.<br />

Drik Kaffe Te Sodavand Mrelk Vand Juice Saft<br />

Frekvens 14% 12% 40% 6% 16% 8% 4%<br />

Tabel 2.4<br />

En stikpnwe blandt 250 gymnasieelever gav folgende fordeling<br />

Drik Kaffe Te Sodavand Mrelk Vand Juice Saft<br />

Hyppighed 28 33 112 6 49 14 8<br />

Tabel 2.5<br />

Vi vil undersoge, om stikproveresultatet stemmer overens med fordelingen i<br />

tabel 2.4 pa signifikansniveau 1 %, sa nulhypotesen er<br />

H 0 : Gymnasieeleverne foretrrekker drikke som i tabel 2.4<br />

De forventede vrerdier udregner vi med procenterne i tabel 2.4.<br />

Drik Kaffe Te Sodavand Mrelk Vand Juice<br />

Forvent. hyp. 35 30 100 15 40 20<br />

som giver teststorrelsen<br />

Tabel 2.6<br />

X 2 (28-35)2 (33-30) 2 (112-100) 2 (6-15) 2 (49-40) 2 (14-20) 2 (8-10) 2<br />

beregn = 35 + 30 + 100 + _1_5_ + 40 + 20 + _1_0_<br />

=12,765<br />

Antallet af frihedsgrader er 6, og dermed finder vi p-vrerdien ved brug af<br />

x 2 -fordelingen med 6 frihedsgrader.<br />

p = P(x 2 2:: 12, 765) = o,0469 = 4,69%<br />

Da p-vrerdien er storre end 1 %, accepterer vi vor hypotese.<br />

Saft<br />

for of Fit 55<br />

10


Eksempel23<br />

Et firma lover, at dets olieboreteknologi, hvor man udforer fire samtidige borin­<br />

ger, vil sikre, at 60 % af de udforte boringer giver aktive oliekilder. Teknologien<br />

er blevet afprovet ved at udfore fire boringer og herefter optrelle antallet af aktive<br />

kilder. Dette blev gentaget 500 gange.<br />

Resultatet fremgar af tabel 2.7.<br />

Vi opstiller nu hypotesen<br />

Antal aktive kilder 0 1 2 3 4<br />

Observeret hyppighed 21 72 152 197 58<br />

Tabel 2.7<br />

H 0 : Antallet af aktive boringer er binomialfordelt med p = 0, 6<br />

ved brug af den nye teknologi<br />

Vi vil teste denne hypotese pa signifikansniveau 1 %.<br />

De tilhorende binomialfordelingssandsynligheder er<br />

P(X = 0) = b(4, 0, 6, 0) = 0, 0256<br />

P(X=1)=b(4, 0,6, 1)=0,1536<br />

P(X=2)=b(4, 0,6, 2)=0,3456<br />

P(X = 3) = b(4, 0,6, 3) = 0,3456<br />

P(X = 4) = b(4, 0,6, 4) = 0,1296<br />

Vi benytter sandsynlighederne som frekvenser, sa de forventede vrerdier er<br />

Teststorrelsen er<br />

56<br />

Antal aktive kilder 0 1 2 3 4<br />

Forventet hyppighed 12,8 76,8 172,8 172,8 64,8<br />

Tabel 2.8<br />

xz - (21-12,8) 2 (72-76,8) 2 (152-172,8) 2 (197-172,8) 2 (58-64,8) 2<br />

beregn - 12,8 + 7 6,8 + 172,8 + 172,8 + 64,8<br />

= 12,16


Vi skal benytte en x 2 -fordeling med 4 frihedsgrader. I denne er (se tabel 2.15 side<br />

67)<br />

ks% = 9,488, k1 % = 13,277 og k 0 , 1 % = 18,467<br />

Dermed rna vi forkaste nulhypotesen pa 5 %-niveau og acceptere den pa 1 %niveau<br />

og 0, 1 %-niveau.<br />

2.3 -test for Goodness of Fit<br />

57


2.4.2 Test i n x m-tabeller<br />

Vi kan ogsa teste for uafhc.engighed i stmre krydstabeller. En krydstabel med n<br />

rc.ekker og m sojler kalder vi en n x m-krydstabel.<br />

Som eksempel ser vi pa 4x2-krydstabel tabel 2.12, der viser, ved hvilken praktisk<br />

korepmve 319 tilfc.eldigt udvalgte bilister erhvervede korekortet.<br />

Kvinder Mc.end<br />

1. prove 37 56<br />

2. prove 63 60<br />

3. prove 47 43<br />

4. prove 7 6<br />

Tabel 2.12 Observerede hyppigheder<br />

Vi vii undersoge, om antallet af aflagte korepmver er uafhc.engigt af kon, sa vi<br />

opstiller nulhypotesen<br />

H 0 : Antallet af aflagte korepmver er uafhc.engig af kon<br />

Som signifikansniveau benytter vi 5 %.<br />

Hvis vi forkaster nulhypotesen, accepterer vi den alternative hypotese<br />

Cellerne i tabellen<br />

Ha : Antallet af aflagte korepmver afhc.enger af kon<br />

Kvinder Mc.end Sum<br />

1. prove 93<br />

2. prove 123<br />

3. prove 90<br />

4. prove 13<br />

Sum 154 165 319<br />

Tabel2.13<br />

udfylder vi med forventede hyppigheder, som vi pa baggrund af vor antagelse<br />

2.4 for uafha:ngighed 63


om uafhrengighed kan udregne som<br />

fi<br />

. h d rrekkesum · sojlesum<br />

orventet h ypp1g e =<br />

tota 1 sum<br />

De forventede hyppigheder er<br />

som giver teststorrelsen<br />

Kvinder Mrend Sum<br />

1. pmve 44,90 48,10 93<br />

2. pmve 59,38 63,62 123<br />

3. pmve 43,45 46,55 90<br />

4. pmve 6,28 6,72 13<br />

Sum 154 165 319<br />

Tabel 2.14 Forventede hyppigheder<br />

xz = \ (oij- /ij)2 = 3 83<br />

beregn L_, f; . '<br />

1<br />

aile celler 1<br />

Antallet af frihedsgrader er 3, og x 2 -fordelingen med 3 frihedsgrader giver OS<br />

testsandsynligheden p = 0, 28 = 28 %.<br />

Dermed accepterer vi nulhypotesen og konkluderer, at undersogelsen understot­<br />

ter, at antallet af aflagte korepmver er uafhrengigt af kon.<br />

Generelt kan vi udregne antallet af frihedsgrader svarende til en n x m - krydsta­<br />

bel, hvor vi tester for uafhrengighed, som<br />

antallet af frihedsgrader = (antallet af rrekker- 1) · (antallet af sojler- 1)<br />

64 TESTS


2.4.3 Oversigt til x 2 -test af uafhrengighed<br />

Udgangspunkt er en n x m-krydstabel.<br />

Niv. 1<br />

Niv. n<br />

Kat. 1 Kat. 2 ... Kat. m<br />

65

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!