Lærebog i matematik.pdf
Lærebog i matematik.pdf
Lærebog i matematik.pdf
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
KAPITEL 2<br />
TESTS<br />
2.1 Statistik kontra sandsynlighedsregning<br />
Inden for sandsynlighedsregning opstiller vi en model, som vi kan benytte til at<br />
beskrive de hcendelser, som vi forventer kan indtrceffe. Vi kan ikke vcere sikre pa,<br />
at hcendelserne indtrceffer, men vi kan scette tal pa vore forventninger i form af<br />
sandsynligheder.<br />
Et klassisk eksempel er kast med en m0nt. Nar m0nten er "cerlig", er sandsyn<br />
ligheden 50 % for at fa krone og 50 % for at fa plat. Det betyder ikke, at hvert<br />
andet m0ntkast skal give krone, sa det vil ikke komme bag pa os, hvis tre kast<br />
med m0nten giver os 3 gange krone, men hvis 10 kast med m0nten giver 10 gan<br />
ge krone, vil vi for alvor begynde at betvivle m0ntens cerlighed. Kaster vi m0nten<br />
et start antal gange, vil vi forvente, at ca. halvdelen af kastene giver krone. Ved<br />
10 kast med m0nten er 7 gange krone ikke uscedvanligt, men ved 100 000 kast er<br />
70 000 gange krone meget uscedvanligt.<br />
Ved brug af sandsynlighedsregning kan vi beregne sandsynligheden for de data,<br />
vi observerer ved udf0rte eksperimenter. Sandsynlighedsregning henregner vi til<br />
en matematisk disciplin.<br />
Inden for statistik er udgangspunktet i stedet observerede data, og statistik gar<br />
ud pa at gcette/ give bud pa en sandsynlighedsmodel, som kan forklare de obser<br />
verede data.<br />
Som eksempel pa data kan vi se pa en liste med kr, kr, kr. Som statistikere kan<br />
vi opstille en hypotese om, at data stammer fra et simpelt fors0g, hvor vi kaster<br />
en m0nt tre gange, og hvor sandsynligheden for bade plat og krone er 50 % ved<br />
hvert kast.<br />
Har vii stedet et datascet, der indeholder 10 gange krone, vii vi tage den f0rste<br />
hypotese op til revision og erstatte den med en hypotese om, at m0nten har krone<br />
43
pa begge sider, dvs. at sandsynligheden for at sla krone er 100 %, og sandsynlig<br />
heden for plat er 0 %.<br />
Hvis datascettet skiftevis bestar af krone, plat, krone, plat, krone, plat kan vi fast<br />
holde vor f0rste hypotese. Men hvis datascettet skiftevis bestar af krone og plat<br />
svarende til i alt 25 par, vil vi cendre vor hypotese. Data svarer da nceppe til et<br />
kast med en m0nt, men er bedre beskrevet ved et eksperiment, hvor vi systema<br />
tisk vender m0nten. Hvis resultatet af en udf0relse af fors0get er krone, vil den<br />
nceste udf0relse af fors0get resultere i plat med 1 00 % sandsynlighed.<br />
Forskellen mellem sandsynlighedsregning og statistik er illustreret i figur 2.1.<br />
Sandsynlighedsregning<br />
Statistik<br />
Figur 2.1<br />
Ved en statistisk test fors0ger vi at bekrcefte eller afkrcefte formodninger, sammen<br />
hcenge eller egenskaber ud fra indsamlede data.<br />
Udgangspunktet er nogle observerede vcerdier, som vi har skaffet os ved en un<br />
ders0gelse f.eks. et eksperiment, en stikpmve eller en systematiske indsamling<br />
af data. De observerede vcerdier sammenligner vi med forventede vrerdier, som vi<br />
beregner ud fra en hypotese, som vi opstiller.<br />
Safremt der er god overensstemmelse mellem observerede og forventede vcerdi<br />
er, kan denne sammenligning, som vi altsa kalder en test, f0re til, at vi accepterer<br />
hypotesen. At vi accepterer hypotesen svarer ikke til, at vi har bevist, at hypotesen<br />
er sand, men kun til at de observerede data ikke er "ekstreme" under hypotesen.<br />
Hvis vi ved sammenligningen rna forkaste hypotesen, har vi ikke bevist, at hypo<br />
tesen er forkert. Det betyder sa blot, at de observerede data er sa ekstreme, at vi<br />
har rigtig god grund til at mene, at vor hypotese formodentlig er forkert.<br />
De data, vi ser pa, er ofte indsamlet for at pavise en bestemt sammenhceng. Vi<br />
opstiller sa en hypotese om mangel pa netop denne sammenhceng. Den s0gte<br />
sammenhreng far vi sa pavist ved at forkaste hypotesen.<br />
44 KAPITEL TESTS
2.2 Hypotesetest<br />
Ved en statistisk test sammenligner vi observerede data med forventede data ud<br />
fra en hypotese, som vi har opstillet.<br />
Den hypotese, vi tester, betegner vi med H 0 og kalder den nulhypotesen. En test af<br />
hypotesen f0rer nu til, at vi en ten accepterer hypotesen eller forkaster hypotesen.<br />
Eftersom en hypotese enten er sand eller falsk, vii vi i testsituationen kunne bega<br />
to typer af fejl.<br />
Hvis vi forkaster en sand hypotese, begar vi en type-1 fejl.<br />
Hvis vi accepterer en falsk hypotese, begar vi en type-2 fejl.<br />
OK<br />
Figur 2.2<br />
At acceptere en hypotese svarer som mevnt ikke til at have vist, at hypotesen er<br />
sand, kun at data ikke giver anledning til, at vi kan afvise den. Vi opnar saledes<br />
kun ny viden ved at forkaste en hypotese, og derfor vii vi ofte formulere nul<br />
hypoteser, som indeholder en pastand, der er den omvendte af det, vi gerne vii<br />
konkludere. Saiedes vii nulhypoteser ofte rumme pastande om "ingen sammen<br />
hceng" mellem st0rrelser eller 11ingen virkning" af f.eks. en medicinsk behand<br />
ling.<br />
Nar vi har opstillet en nulhypotese, skal vi desuden opstille en alternativ hypotese<br />
Ha, som svarer til, hvad der rna gcelde, hvis H 0 ikke er opfyldt. Den simpleste<br />
alternative hypotese Ha svarer til negationen af H 0 , som sjceldent er scerlig infor<br />
mativ. Den alternative hypotese er imidlertid vigtig, da den influerer pa, hvornar<br />
vi accepterer nulhypotesen.<br />
Ved selve testen tager vi udgangspunkt i nulhypotesen og beregner nogle sand<br />
synligheder ved hjcelp af en teststorrelse X. Disse sandsynligheder benytter vi sa<br />
til at afg0re, i hvor h0j grad data passer til nulhypotesen H 0 •<br />
45
Vi er naturligvis interesseret i at begrrense risikoen for at forkaste en sand hypo<br />
tese, dvs. bega en type-1 fejl.<br />
Derfor knytter vi en testsandsynlighed, som vi omtaler som p-vcerdien, til testen.<br />
p-vrerdien er sandsynligheden for den observerede vrerdi Xobs eller noget, der er<br />
vrerre under nulhypotesen, dvs. noget, der er mere ekstremt i forhold til nulhy<br />
potesen. p-vrerdien viser os, hvor rimeligt deter at tro pa, at data er fremkommet<br />
ved tilfreldigheder, nar nulhypotesen er sand, og jo mindre p-vrerdien er, jo mere<br />
tyder det pa, at H 0 ikke er sand.<br />
Vi rna derfor acceptere en vis sandsynlighed for at bega en type-1 fejl, ogden<br />
ne sandsynlighed fastsretter vi selv uafhrengigt af data, og vi omtaler den som<br />
testens signifikansniveau a.<br />
Hvis p-vrerdien er mindre end signifikansniveauet, forkaster vi nulhypotesen, og<br />
vi siger, at resultatet er signifikant pa signifikansniveau a. Vi siger ogsa, at resul<br />
tatet er signifikant pa signifikansniveau p, nar p ::5 a.<br />
De hyppigst anvendte signifikansniveauer er a = 5 %, a = 1 % og a = 0, 1 %, og<br />
hvis p-vrerdien er under signifikansniveauet, forkaster vi nulhypotesen.<br />
Et signifikansniveau fastlregger en kritisk mcengde K, som bestar af de ekstreme<br />
vrerdier af testst0rrelsen, inden for hvilken vi forkaster nulhypotesen, samt en<br />
acceptmcengde A, inden for hvilken vi accepterer nulhypotesen.<br />
De ekstreme vrerdier kalder vi ogsa de kritiske vrerdier, og hvis de kritiske vrerdi<br />
er alle er sma, eller alle er store, kalder vi testen ensidet. Hvis de kritiske vrerdier<br />
af testst0rrelsen bade kan vrere sma eller store bestar den kritiske mrengde af to<br />
dele, og vi kalder testen tosidet. I dette tilfrelde deler vi signifikansniveauet lige<br />
pa de to dele.<br />
Hojre kritisk<br />
mrengde<br />
Figur 2.4 Kun store kritiske<br />
v
Ha: Forekomst af autistiske tegn blandt b0rn er ikke 7%<br />
Vi udf0rer en test pa 5 %-niveau, og som testst0rrelse anvender vi den b(384, 0, 07)<br />
fordelte stokastiske varia bel X, der an giver antallet af b0rn med tegn pa autisme.<br />
Da bade et meget lille og et meget stort antal bmn med tegn pa autisme under<br />
st0tter den alternative hypotese, benytter vi en tosidet test med tilh0rende todelt<br />
kritisk ma:ngde. De to dele af den kritiske ma:ngde fastla:gger vi ved at kra:ve, at<br />
sandsynligheden for hver af delene ikke rna overstige 2,5 %.<br />
Idet<br />
P(X::::; 17) = 0,0247 = 2,47%<br />
P(18::::; X::::; 37) = 0, 9546 = 95,46%<br />
P(X ::::: 38) = 0, 0207 = 2, 07%<br />
bliver den kritiske ma:ngde K og acceptma:ngden A<br />
K = {0, 1,2, ... , 17} U {38, 39, ... , 384}<br />
A= {18,19, ... ,36,37}<br />
Da Xobs = 46 tilh0rer den kritiske ma:ngde, forkaster vi nulhypotesen, og resulta<br />
tet er signifikant pa 5 % niveau.<br />
p-va:rdien finder vi i dette tosidede tilfa:lde som 2 gange den mindste af sand<br />
synlighederne P(X ::::; Xobs) og P(X ::?: X 0 b 5 ).<br />
Nuer<br />
P(X::::; 46) = 0, 9998<br />
P(X ::::: 46) = 0, 000293<br />
sa p-va:rdien er 0,059 %.
Eksempel22<br />
Tabellen nedenfor viser fordelingen af unge ud fra deres foretrukne drik.<br />
Drik Kaffe Te Sodavand Mrelk Vand Juice Saft<br />
Frekvens 14% 12% 40% 6% 16% 8% 4%<br />
Tabel 2.4<br />
En stikpnwe blandt 250 gymnasieelever gav folgende fordeling<br />
Drik Kaffe Te Sodavand Mrelk Vand Juice Saft<br />
Hyppighed 28 33 112 6 49 14 8<br />
Tabel 2.5<br />
Vi vil undersoge, om stikproveresultatet stemmer overens med fordelingen i<br />
tabel 2.4 pa signifikansniveau 1 %, sa nulhypotesen er<br />
H 0 : Gymnasieeleverne foretrrekker drikke som i tabel 2.4<br />
De forventede vrerdier udregner vi med procenterne i tabel 2.4.<br />
Drik Kaffe Te Sodavand Mrelk Vand Juice<br />
Forvent. hyp. 35 30 100 15 40 20<br />
som giver teststorrelsen<br />
Tabel 2.6<br />
X 2 (28-35)2 (33-30) 2 (112-100) 2 (6-15) 2 (49-40) 2 (14-20) 2 (8-10) 2<br />
beregn = 35 + 30 + 100 + _1_5_ + 40 + 20 + _1_0_<br />
=12,765<br />
Antallet af frihedsgrader er 6, og dermed finder vi p-vrerdien ved brug af<br />
x 2 -fordelingen med 6 frihedsgrader.<br />
p = P(x 2 2:: 12, 765) = o,0469 = 4,69%<br />
Da p-vrerdien er storre end 1 %, accepterer vi vor hypotese.<br />
Saft<br />
for of Fit 55<br />
10
Eksempel23<br />
Et firma lover, at dets olieboreteknologi, hvor man udforer fire samtidige borin<br />
ger, vil sikre, at 60 % af de udforte boringer giver aktive oliekilder. Teknologien<br />
er blevet afprovet ved at udfore fire boringer og herefter optrelle antallet af aktive<br />
kilder. Dette blev gentaget 500 gange.<br />
Resultatet fremgar af tabel 2.7.<br />
Vi opstiller nu hypotesen<br />
Antal aktive kilder 0 1 2 3 4<br />
Observeret hyppighed 21 72 152 197 58<br />
Tabel 2.7<br />
H 0 : Antallet af aktive boringer er binomialfordelt med p = 0, 6<br />
ved brug af den nye teknologi<br />
Vi vil teste denne hypotese pa signifikansniveau 1 %.<br />
De tilhorende binomialfordelingssandsynligheder er<br />
P(X = 0) = b(4, 0, 6, 0) = 0, 0256<br />
P(X=1)=b(4, 0,6, 1)=0,1536<br />
P(X=2)=b(4, 0,6, 2)=0,3456<br />
P(X = 3) = b(4, 0,6, 3) = 0,3456<br />
P(X = 4) = b(4, 0,6, 4) = 0,1296<br />
Vi benytter sandsynlighederne som frekvenser, sa de forventede vrerdier er<br />
Teststorrelsen er<br />
56<br />
Antal aktive kilder 0 1 2 3 4<br />
Forventet hyppighed 12,8 76,8 172,8 172,8 64,8<br />
Tabel 2.8<br />
xz - (21-12,8) 2 (72-76,8) 2 (152-172,8) 2 (197-172,8) 2 (58-64,8) 2<br />
beregn - 12,8 + 7 6,8 + 172,8 + 172,8 + 64,8<br />
= 12,16
Vi skal benytte en x 2 -fordeling med 4 frihedsgrader. I denne er (se tabel 2.15 side<br />
67)<br />
ks% = 9,488, k1 % = 13,277 og k 0 , 1 % = 18,467<br />
Dermed rna vi forkaste nulhypotesen pa 5 %-niveau og acceptere den pa 1 %niveau<br />
og 0, 1 %-niveau.<br />
2.3 -test for Goodness of Fit<br />
57
2.4.2 Test i n x m-tabeller<br />
Vi kan ogsa teste for uafhc.engighed i stmre krydstabeller. En krydstabel med n<br />
rc.ekker og m sojler kalder vi en n x m-krydstabel.<br />
Som eksempel ser vi pa 4x2-krydstabel tabel 2.12, der viser, ved hvilken praktisk<br />
korepmve 319 tilfc.eldigt udvalgte bilister erhvervede korekortet.<br />
Kvinder Mc.end<br />
1. prove 37 56<br />
2. prove 63 60<br />
3. prove 47 43<br />
4. prove 7 6<br />
Tabel 2.12 Observerede hyppigheder<br />
Vi vii undersoge, om antallet af aflagte korepmver er uafhc.engigt af kon, sa vi<br />
opstiller nulhypotesen<br />
H 0 : Antallet af aflagte korepmver er uafhc.engig af kon<br />
Som signifikansniveau benytter vi 5 %.<br />
Hvis vi forkaster nulhypotesen, accepterer vi den alternative hypotese<br />
Cellerne i tabellen<br />
Ha : Antallet af aflagte korepmver afhc.enger af kon<br />
Kvinder Mc.end Sum<br />
1. prove 93<br />
2. prove 123<br />
3. prove 90<br />
4. prove 13<br />
Sum 154 165 319<br />
Tabel2.13<br />
udfylder vi med forventede hyppigheder, som vi pa baggrund af vor antagelse<br />
2.4 for uafha:ngighed 63
om uafhrengighed kan udregne som<br />
fi<br />
. h d rrekkesum · sojlesum<br />
orventet h ypp1g e =<br />
tota 1 sum<br />
De forventede hyppigheder er<br />
som giver teststorrelsen<br />
Kvinder Mrend Sum<br />
1. pmve 44,90 48,10 93<br />
2. pmve 59,38 63,62 123<br />
3. pmve 43,45 46,55 90<br />
4. pmve 6,28 6,72 13<br />
Sum 154 165 319<br />
Tabel 2.14 Forventede hyppigheder<br />
xz = \ (oij- /ij)2 = 3 83<br />
beregn L_, f; . '<br />
1<br />
aile celler 1<br />
Antallet af frihedsgrader er 3, og x 2 -fordelingen med 3 frihedsgrader giver OS<br />
testsandsynligheden p = 0, 28 = 28 %.<br />
Dermed accepterer vi nulhypotesen og konkluderer, at undersogelsen understot<br />
ter, at antallet af aflagte korepmver er uafhrengigt af kon.<br />
Generelt kan vi udregne antallet af frihedsgrader svarende til en n x m - krydsta<br />
bel, hvor vi tester for uafhrengighed, som<br />
antallet af frihedsgrader = (antallet af rrekker- 1) · (antallet af sojler- 1)<br />
64 TESTS
2.4.3 Oversigt til x 2 -test af uafhrengighed<br />
Udgangspunkt er en n x m-krydstabel.<br />
Niv. 1<br />
Niv. n<br />
Kat. 1 Kat. 2 ... Kat. m<br />
65