Hypotesetest

Overordnet 1 

Hypotesetest 

Helene Regitze Lund Wandsøe 

November 28, 2011 

Vi har en påstand eller en teori og en modpåstand og -teori. Vores påstande og 

teorier vil være hypoteser. Disse kan hver især udtrykkes som en sandsynlighedsmodel 

eller en mængde af sandsynlighedsmodeller. Denne model vil 

beskrive en population. Vi antager, at vores stikprøve udtrækkes tilfældigt 

fra denne population. 

H0 og HA 

Hypotesen om “ingen forskel” kaldes ofte nulhypotesen eller H0. Når man indsamler 

data og bruger dem som bevis for nulhypotesen, siger man, at man 

“tester” nulhypotesen. Den grundlæggende idé bag en statistisk test af H0 er at 

sammenligne data fra en faktisk stikprøve med, hvad der forventes, når H0 er 

sand. Denne sammenligning er normalt baseret på værdien af teststatistikken. 

Stikprøvefordelingen for teststatistikken under H0 kaldes nulfordelingen. Alternativet 

til H0 kaldes alternativ hypotesen eller HA. Detteernormaltentenen 

bestemt sandsynlighedsfordeling eller en familie af fordelinger. 

P værdien 

P-værdien er sandsynligheden for at befinde sig i halen af nulfordelingen for 

teststatistikken Y i og over den observerede værdi for Y . Dvs. man beskriver 

beliggenheden af det observerede testresultat i nulfordelingen for teststatistikken 

ved at angive halesandsynligheden over (/under) den observerede værdi. Des 

mindre P-værdi des længere er den observerede værdi af teststatistikken fra den 

forventede værdi under H0. En meget lille P-værdi ses altså som bevis imod 

nulhypotesen. De fleste statistikere bruger følgende grænser for P-værdien til at 

afvise H0: 

P

Figure 1: P-værdier - de tre tilfælde (se B&L side 425) 

Når man udregner P-værdien fra et givent datasæt eller bestemmer, hvorvidt 

den er mindre end en valgt grænse, kaldes det at lave en signifikanstest. Pværdien 

kaldes også det observerede signifikansniveau. 

Fremgangsmåden 2 

1. Angiv H0. Heropskrivesaltsådenpåstandellerteori,somønskesundersøgt. 

2. Angiv HA. Heropskrivesaltsådenrelevantemodpåstandeller-teori. 

3. Angiv teststørrelsen Y . 

4. Angiv ekstreme værdier for Y ,nårnulhypotesenersand. Detvilsige 

hvilke værdier vil tale for, at alternativhypotesen er bedre til at forklare 

data end nulhypotesen. 

5. P-værdien udregnes. Det vil sige, værdien af teststørrelsen udregne og 

testsandsynligheden bestemmes heraf. 

Teststørrelsen 3 

Z-test 

Hvis nulfordelingen for en teststatistik Y er approksimativt normal, vil nulfordelingen 

for standardscoren i ligning (1) være approksimativt standardnor- 

2 Side 424-425 i B&L 

3 Side 429-436 i B&L 

2

mal. 

Z = 

Y E(Y |H0) 

s.d.(Y |H0) 

Hvis nævneren i ligning (1) er kendt, vil vi bruge Z som vores test statistik 

istedetforY . Hvis nævneren derimod er ukendt definerer vi T som givet i 

ligning (2). 

T = 

Y E(Y |H0) 

s.e.(Y |H0) 

Når n er stor, vil nulfordelingen for T dog være approksimativt standardnormalfordelt, 

og vi kan også kaldes udtrykket i ligning (2) for Z. Bådeligning(1) 

og (2) måler forskellen mellem den observerede Y og E(Y |H0), dvs. detY vi 

forventer, når H0 er sand. Man kan sige, at Z og T scoren måler antallet 

af hhv. s.d. og s.e., der er mellem den sande og den forventede værdi. 

T-test 

Hvis vi derimod har, at vores nævner i ligning (1) er ukendt, og n er lille, kan 

vi ikke længere antage, at stikprøvegennemsnittet er approksimativt normalfordelt 

og stikprøve s.d. vil således ikke længere være en god approksimation 

for populationens s.d. Vi skriver derfor T som i ligning (3). 

T = X µ 0 

S/ p n 

Såfremt stikprøven er tilfældigt udtrukket og populationen er normal, vil nulfordelingen 

for T være t(n 1). Statistikkeniligning(3)ernormaltikket-fordelt, 

når populationen ikke er normal. Som tommelfingerregel gælder, at såfremt vi 

har en stikprøve, som er mindre end omkring 40 observationer, må populationen 

ikke være alt for langt fra normal. 

3 

(1) 

(2) 

(3)

Hypotesetest

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?