Lærebog i matematik.pdf

KAPITEL 2 

TESTS 

2.1 Statistik kontra sandsynlighedsregning 

Inden for sandsynlighedsregning opstiller vi en model, som vi kan benytte til at 

beskrive de hcendelser, som vi forventer kan indtrceffe. Vi kan ikke vcere sikre pa, 

at hcendelserne indtrceffer, men vi kan scette tal pa vore forventninger i form af 

sandsynligheder. 

Et klassisk eksempel er kast med en m0nt. Nar m0nten er "cerlig", er sandsyn 

ligheden 50 % for at fa krone og 50 % for at fa plat. Det betyder ikke, at hvert 

andet m0ntkast skal give krone, sa det vil ikke komme bag pa os, hvis tre kast 

med m0nten giver os 3 gange krone, men hvis 10 kast med m0nten giver 10 gan 

ge krone, vil vi for alvor begynde at betvivle m0ntens cerlighed. Kaster vi m0nten 

et start antal gange, vil vi forvente, at ca. halvdelen af kastene giver krone. Ved 

10 kast med m0nten er 7 gange krone ikke uscedvanligt, men ved 100 000 kast er 

70 000 gange krone meget uscedvanligt. 

Ved brug af sandsynlighedsregning kan vi beregne sandsynligheden for de data, 

vi observerer ved udf0rte eksperimenter. Sandsynlighedsregning henregner vi til 

en matematisk disciplin. 

Inden for statistik er udgangspunktet i stedet observerede data, og statistik gar 

ud pa at gcette/ give bud pa en sandsynlighedsmodel, som kan forklare de obser 

verede data. 

Som eksempel pa data kan vi se pa en liste med kr, kr, kr. Som statistikere kan 

vi opstille en hypotese om, at data stammer fra et simpelt fors0g, hvor vi kaster 

en m0nt tre gange, og hvor sandsynligheden for bade plat og krone er 50 % ved 

hvert kast. 

Har vii stedet et datascet, der indeholder 10 gange krone, vii vi tage den f0rste 

hypotese op til revision og erstatte den med en hypotese om, at m0nten har krone 

43

pa begge sider, dvs. at sandsynligheden for at sla krone er 100 %, og sandsynlig 

heden for plat er 0 %. 

Hvis datascettet skiftevis bestar af krone, plat, krone, plat, krone, plat kan vi fast 

holde vor f0rste hypotese. Men hvis datascettet skiftevis bestar af krone og plat 

svarende til i alt 25 par, vil vi cendre vor hypotese. Data svarer da nceppe til et 

kast med en m0nt, men er bedre beskrevet ved et eksperiment, hvor vi systema 

tisk vender m0nten. Hvis resultatet af en udf0relse af fors0get er krone, vil den 

nceste udf0relse af fors0get resultere i plat med 1 00 % sandsynlighed. 

Forskellen mellem sandsynlighedsregning og statistik er illustreret i figur 2.1. 

Sandsynlighedsregning 

Statistik 

Figur 2.1 

Ved en statistisk test fors0ger vi at bekrcefte eller afkrcefte formodninger, sammen 

hcenge eller egenskaber ud fra indsamlede data. 

Udgangspunktet er nogle observerede vcerdier, som vi har skaffet os ved en un 

ders0gelse f.eks. et eksperiment, en stikpmve eller en systematiske indsamling 

af data. De observerede vcerdier sammenligner vi med forventede vrerdier, som vi 

beregner ud fra en hypotese, som vi opstiller. 

Safremt der er god overensstemmelse mellem observerede og forventede vcerdi 

er, kan denne sammenligning, som vi altsa kalder en test, f0re til, at vi accepterer 

hypotesen. At vi accepterer hypotesen svarer ikke til, at vi har bevist, at hypotesen 

er sand, men kun til at de observerede data ikke er "ekstreme" under hypotesen. 

Hvis vi ved sammenligningen rna forkaste hypotesen, har vi ikke bevist, at hypo 

tesen er forkert. Det betyder sa blot, at de observerede data er sa ekstreme, at vi 

har rigtig god grund til at mene, at vor hypotese formodentlig er forkert. 

De data, vi ser pa, er ofte indsamlet for at pavise en bestemt sammenhceng. Vi 

opstiller sa en hypotese om mangel pa netop denne sammenhceng. Den s0gte 

sammenhreng far vi sa pavist ved at forkaste hypotesen. 

44 KAPITEL TESTS

2.2 Hypotesetest 

Ved en statistisk test sammenligner vi observerede data med forventede data ud 

fra en hypotese, som vi har opstillet. 

Den hypotese, vi tester, betegner vi med H 0 og kalder den nulhypotesen. En test af 

hypotesen f0rer nu til, at vi en ten accepterer hypotesen eller forkaster hypotesen. 

Eftersom en hypotese enten er sand eller falsk, vii vi i testsituationen kunne bega 

to typer af fejl. 

Hvis vi forkaster en sand hypotese, begar vi en type-1 fejl. 

Hvis vi accepterer en falsk hypotese, begar vi en type-2 fejl. 

OK 

Figur 2.2 

At acceptere en hypotese svarer som mevnt ikke til at have vist, at hypotesen er 

sand, kun at data ikke giver anledning til, at vi kan afvise den. Vi opnar saledes 

kun ny viden ved at forkaste en hypotese, og derfor vii vi ofte formulere nul 

hypoteser, som indeholder en pastand, der er den omvendte af det, vi gerne vii 

konkludere. Saiedes vii nulhypoteser ofte rumme pastande om "ingen sammen 

hceng" mellem st0rrelser eller 11ingen virkning" af f.eks. en medicinsk behand 

ling. 

Nar vi har opstillet en nulhypotese, skal vi desuden opstille en alternativ hypotese 

Ha, som svarer til, hvad der rna gcelde, hvis H 0 ikke er opfyldt. Den simpleste 

alternative hypotese Ha svarer til negationen af H 0 , som sjceldent er scerlig infor 

mativ. Den alternative hypotese er imidlertid vigtig, da den influerer pa, hvornar 

vi accepterer nulhypotesen. 

Ved selve testen tager vi udgangspunkt i nulhypotesen og beregner nogle sand 

synligheder ved hjcelp af en teststorrelse X. Disse sandsynligheder benytter vi sa 

til at afg0re, i hvor h0j grad data passer til nulhypotesen H 0 • 

45

Vi er naturligvis interesseret i at begrrense risikoen for at forkaste en sand hypo 

tese, dvs. bega en type-1 fejl. 

Derfor knytter vi en testsandsynlighed, som vi omtaler som p-vcerdien, til testen. 

p-vrerdien er sandsynligheden for den observerede vrerdi Xobs eller noget, der er 

vrerre under nulhypotesen, dvs. noget, der er mere ekstremt i forhold til nulhy 

potesen. p-vrerdien viser os, hvor rimeligt deter at tro pa, at data er fremkommet 

ved tilfreldigheder, nar nulhypotesen er sand, og jo mindre p-vrerdien er, jo mere 

tyder det pa, at H 0 ikke er sand. 

Vi rna derfor acceptere en vis sandsynlighed for at bega en type-1 fejl, ogden 

ne sandsynlighed fastsretter vi selv uafhrengigt af data, og vi omtaler den som 

testens signifikansniveau a. 

Hvis p-vrerdien er mindre end signifikansniveauet, forkaster vi nulhypotesen, og 

vi siger, at resultatet er signifikant pa signifikansniveau a. Vi siger ogsa, at resul 

tatet er signifikant pa signifikansniveau p, nar p ::5 a. 

De hyppigst anvendte signifikansniveauer er a = 5 %, a = 1 % og a = 0, 1 %, og 

hvis p-vrerdien er under signifikansniveauet, forkaster vi nulhypotesen. 

Et signifikansniveau fastlregger en kritisk mcengde K, som bestar af de ekstreme 

vrerdier af testst0rrelsen, inden for hvilken vi forkaster nulhypotesen, samt en 

acceptmcengde A, inden for hvilken vi accepterer nulhypotesen. 

De ekstreme vrerdier kalder vi ogsa de kritiske vrerdier, og hvis de kritiske vrerdi 

er alle er sma, eller alle er store, kalder vi testen ensidet. Hvis de kritiske vrerdier 

af testst0rrelsen bade kan vrere sma eller store bestar den kritiske mrengde af to 

dele, og vi kalder testen tosidet. I dette tilfrelde deler vi signifikansniveauet lige 

pa de to dele. 

Hojre kritisk 

mrengde 

Figur 2.4 Kun store kritiske 

v

Ha: Forekomst af autistiske tegn blandt b0rn er ikke 7% 

Vi udf0rer en test pa 5 %-niveau, og som testst0rrelse anvender vi den b(384, 0, 07) 

fordelte stokastiske varia bel X, der an giver antallet af b0rn med tegn pa autisme. 

Da bade et meget lille og et meget stort antal bmn med tegn pa autisme under 

st0tter den alternative hypotese, benytter vi en tosidet test med tilh0rende todelt 

kritisk ma:ngde. De to dele af den kritiske ma:ngde fastla:gger vi ved at kra:ve, at 

sandsynligheden for hver af delene ikke rna overstige 2,5 %. 

Idet 

P(X::::; 17) = 0,0247 = 2,47% 

P(18::::; X::::; 37) = 0, 9546 = 95,46% 

P(X ::::: 38) = 0, 0207 = 2, 07% 

bliver den kritiske ma:ngde K og acceptma:ngden A 

K = {0, 1,2, ... , 17} U {38, 39, ... , 384} 

A= {18,19, ... ,36,37} 

Da Xobs = 46 tilh0rer den kritiske ma:ngde, forkaster vi nulhypotesen, og resulta 

tet er signifikant pa 5 % niveau. 

p-va:rdien finder vi i dette tosidede tilfa:lde som 2 gange den mindste af sand 

synlighederne P(X ::::; Xobs) og P(X ::?: X 0 b 5 ). 

Nuer 

P(X::::; 46) = 0, 9998 

P(X ::::: 46) = 0, 000293 

sa p-va:rdien er 0,059 %.

Eksempel22 

Tabellen nedenfor viser fordelingen af unge ud fra deres foretrukne drik. 

Drik Kaffe Te Sodavand Mrelk Vand Juice Saft 

Frekvens 14% 12% 40% 6% 16% 8% 4% 

Tabel 2.4 

En stikpnwe blandt 250 gymnasieelever gav folgende fordeling 

Drik Kaffe Te Sodavand Mrelk Vand Juice Saft 

Hyppighed 28 33 112 6 49 14 8 

Tabel 2.5 

Vi vil undersoge, om stikproveresultatet stemmer overens med fordelingen i 

tabel 2.4 pa signifikansniveau 1 %, sa nulhypotesen er 

H 0 : Gymnasieeleverne foretrrekker drikke som i tabel 2.4 

De forventede vrerdier udregner vi med procenterne i tabel 2.4. 

Drik Kaffe Te Sodavand Mrelk Vand Juice 

Forvent. hyp. 35 30 100 15 40 20 

som giver teststorrelsen 

Tabel 2.6 

X 2 (28-35)2 (33-30) 2 (112-100) 2 (6-15) 2 (49-40) 2 (14-20) 2 (8-10) 2 

beregn = 35 + 30 + 100 + _1_5_ + 40 + 20 + _1_0_ 

=12,765 

Antallet af frihedsgrader er 6, og dermed finder vi p-vrerdien ved brug af 

x 2 -fordelingen med 6 frihedsgrader. 

p = P(x 2 2:: 12, 765) = o,0469 = 4,69% 

Da p-vrerdien er storre end 1 %, accepterer vi vor hypotese. 

Saft 

for of Fit 55 

10

Eksempel23 

Et firma lover, at dets olieboreteknologi, hvor man udforer fire samtidige borin 

ger, vil sikre, at 60 % af de udforte boringer giver aktive oliekilder. Teknologien 

er blevet afprovet ved at udfore fire boringer og herefter optrelle antallet af aktive 

kilder. Dette blev gentaget 500 gange. 

Resultatet fremgar af tabel 2.7. 

Vi opstiller nu hypotesen 

Antal aktive kilder 0 1 2 3 4 

Observeret hyppighed 21 72 152 197 58 

Tabel 2.7 

H 0 : Antallet af aktive boringer er binomialfordelt med p = 0, 6 

ved brug af den nye teknologi 

Vi vil teste denne hypotese pa signifikansniveau 1 %. 

De tilhorende binomialfordelingssandsynligheder er 

P(X = 0) = b(4, 0, 6, 0) = 0, 0256 

P(X=1)=b(4, 0,6, 1)=0,1536 

P(X=2)=b(4, 0,6, 2)=0,3456 

P(X = 3) = b(4, 0,6, 3) = 0,3456 

P(X = 4) = b(4, 0,6, 4) = 0,1296 

Vi benytter sandsynlighederne som frekvenser, sa de forventede vrerdier er 

Teststorrelsen er 

56 

Antal aktive kilder 0 1 2 3 4 

Forventet hyppighed 12,8 76,8 172,8 172,8 64,8 

Tabel 2.8 

xz - (21-12,8) 2 (72-76,8) 2 (152-172,8) 2 (197-172,8) 2 (58-64,8) 2 

beregn - 12,8 + 7 6,8 + 172,8 + 172,8 + 64,8 

= 12,16

Vi skal benytte en x 2 -fordeling med 4 frihedsgrader. I denne er (se tabel 2.15 side 

67) 

ks% = 9,488, k1 % = 13,277 og k 0 , 1 % = 18,467 

Dermed rna vi forkaste nulhypotesen pa 5 %-niveau og acceptere den pa 1 %niveau 

og 0, 1 %-niveau. 

2.3 -test for Goodness of Fit 

57

2.4.2 Test i n x m-tabeller 

Vi kan ogsa teste for uafhc.engighed i stmre krydstabeller. En krydstabel med n 

rc.ekker og m sojler kalder vi en n x m-krydstabel. 

Som eksempel ser vi pa 4x2-krydstabel tabel 2.12, der viser, ved hvilken praktisk 

korepmve 319 tilfc.eldigt udvalgte bilister erhvervede korekortet. 

Kvinder Mc.end 

1. prove 37 56 

2. prove 63 60 

3. prove 47 43 

4. prove 7 6 

Tabel 2.12 Observerede hyppigheder 

Vi vii undersoge, om antallet af aflagte korepmver er uafhc.engigt af kon, sa vi 

opstiller nulhypotesen 

H 0 : Antallet af aflagte korepmver er uafhc.engig af kon 

Som signifikansniveau benytter vi 5 %. 

Hvis vi forkaster nulhypotesen, accepterer vi den alternative hypotese 

Cellerne i tabellen 

Ha : Antallet af aflagte korepmver afhc.enger af kon 

Kvinder Mc.end Sum 

1. prove 93 

2. prove 123 

3. prove 90 

4. prove 13 

Sum 154 165 319 

Tabel2.13 

udfylder vi med forventede hyppigheder, som vi pa baggrund af vor antagelse 

2.4 for uafha:ngighed 63

om uafhrengighed kan udregne som 

fi 

. h d rrekkesum · sojlesum 

orventet h ypp1g e = 

tota 1 sum 

De forventede hyppigheder er 

som giver teststorrelsen 

Kvinder Mrend Sum 

1. pmve 44,90 48,10 93 

2. pmve 59,38 63,62 123 

3. pmve 43,45 46,55 90 

4. pmve 6,28 6,72 13 

Sum 154 165 319 

Tabel 2.14 Forventede hyppigheder 

xz = \ (oij- /ij)2 = 3 83 

beregn L_, f; . ' 

1 

aile celler 1 

Antallet af frihedsgrader er 3, og x 2 -fordelingen med 3 frihedsgrader giver OS 

testsandsynligheden p = 0, 28 = 28 %. 

Dermed accepterer vi nulhypotesen og konkluderer, at undersogelsen understot 

ter, at antallet af aflagte korepmver er uafhrengigt af kon. 

Generelt kan vi udregne antallet af frihedsgrader svarende til en n x m - krydsta 

bel, hvor vi tester for uafhrengighed, som 

antallet af frihedsgrader = (antallet af rrekker- 1) · (antallet af sojler- 1) 

64 TESTS

2.4.3 Oversigt til x 2 -test af uafhrengighed 

Udgangspunkt er en n x m-krydstabel. 

Niv. 1 

Niv. n 

Kat. 1 Kat. 2 ... Kat. m 

65

Lærebog i matematik.pdf

Create successful ePaper yourself

Delete template?

Save as template?