08.08.2013 Views

Konfidensintervaller Hypotesetest og

Konfidensintervaller Hypotesetest og

Konfidensintervaller Hypotesetest og

SHOW MORE
SHOW LESS

Transform your PDFs into Flipbooks and boost your revenue!

Leverage SEO-optimized Flipbooks, powerful backlinks, and multimedia content to professionally showcase your products and significantly increase your reach.

<strong>Konfidensintervaller</strong><br />

<strong>Hypotesetest</strong><br />

<strong>og</strong><br />

Konfidensinterval for andele<br />

χ2-fordelingen <strong>og</strong> konfidensinterval for variansen<br />

Hypoteseteori<br />

<strong>Hypotesetest</strong> af middelværdi, varians <strong>og</strong> andele


Repetition fra sidst: <strong>Konfidensintervaller</strong><br />

Et punkt-estimat<br />

punkt estimat estimerer værdien af en ukendt populations<br />

parameter ved en enkelt værdi.<br />

Fx: Middelhøjden blandt oecon studernde x<br />

= 172,<br />

73.<br />

Et konfidens interval er et interval, der estimerer værdien af en<br />

ukendt populations parameter. Kaldes <strong>og</strong>så et interval estimat. estimat<br />

Sammen med intervallet gives et mål for, hvor sikker man er på, at<br />

den sande populations parameter ligger i intervallet. Dette mål<br />

kaldes for konfidens niveauet. niveauet<br />

Et punkt estimat indeholder ikke meget information om den faktiske<br />

værdi af μ – fx hvor sikkert er vores punkt estimat?<br />

Et interval estimat indeholder flere informationer, for eksempel:<br />

Vi er 95% sikre på, at intervallet [164,8 ; 180,7] indeholde den sande<br />

middelværdi μ.<br />

Eller vi er 90% sikre på, at intervallet [166,1 ; 179,3] indeholder den<br />

sande middelværdi μ.


Repetition fra sidst<br />

(1-α)100% konfidens interval for:<br />

Populations middelværdi μ, når X er normal fordelt (eller<br />

stikprøven er stor) <strong>og</strong> σ er kendt:<br />

x<br />

±<br />

z<br />

α<br />

2<br />

Populations middelværdi μ, når X er normal fordelt <strong>og</strong> σ er<br />

ukendt:<br />

x ± t<br />

s<br />

n<br />

α<br />

α<br />

2<br />

Husk: n-1 frihedsgrader<br />

σ<br />

n<br />

zα<br />

tα<br />

α


Konfidensinterval<br />

for andele<br />

Estimatet af populations-andelen, p, er stikprøve-andelen<br />

, ,dvs. andelen af succeser i stikprøven.<br />

pˆ<br />

Hvis np>5 <strong>og</strong> n(1-p)>5, så er stikprøve-fordelingen af<br />

stikprøve-andelen ca normalfordelt:<br />

⎛ p − p ⎞<br />

Pˆ<br />

( 1 )<br />

~ N⎜<br />

p,<br />

⎟<br />

⎝ n ⎠<br />

Et (1-α)100% konfidensinterval for p er<br />

pˆ<br />

± zα<br />

2<br />

pˆ<br />

( 1−<br />

pˆ<br />

)<br />

n


Eksempel 6-4<br />

For For en en given produkttype: Hvor stor stor en en andel af af det det amerikanske<br />

marked er er besat af af udenlandske virksomheder?<br />

En En stikprøve på på100<br />

100 forbrugere udtages <strong>og</strong> <strong>og</strong> 34 34 af af disse bruger et et<br />

udenlandske produkt; resten bruger et et amerikanske produkt.<br />

Giv Giv et et 95% 95% konfidensinterval<br />

for for andelen af af brugere af af udenlandske<br />

produkter.<br />

ˆ<br />

p ± zα<br />

2<br />

pˆ<br />

qˆ<br />

n<br />

( 0.<br />

34)(<br />

0.<br />

66)<br />

= 0.<br />

34 ± 1.<br />

96<br />

100<br />

= 0.<br />

34 ± ( 1.<br />

96)(<br />

0.<br />

04737)<br />

= 0.<br />

34 ± 0.<br />

0928<br />

=<br />

[ 0.<br />

2472,<br />

0.<br />

4328]


χ 2 -fordelingen<br />

χ 2 -fordelingen [ki-i-anden] er<br />

asymmetrisk <strong>og</strong> kun defineret for<br />

positive tal.<br />

χ 2 -fordelingen er (li’som t-fordelingen)<br />

specificeret ved antal frihedsgrader (df).<br />

Notation: X~χ 2 (n) [X følger en χ 2 -<br />

fordelingenmed n frihedsgrader].<br />

χ2-fordelingen er sandsynligheds<br />

fordelingen for en sum af uafhængige<br />

kvadrerede standard normal fordelte<br />

stokastiske variable.<br />

Hvis X~χ2 (df) gælder:<br />

Chi-Square<br />

D istrib ution: df=10 , df=3 0, df=50<br />

0<br />

df = 10<br />

df = 30<br />

Middelværdien er lig med antallet af frihedsgraden, E(X)=df<br />

Variansen er lig med to gange antallet af frihedsgrader, V(X)=2df<br />

5 0<br />

χ2 df = 50<br />

100


χ 2 -fordelingen <strong>og</strong> stikprøvevariansen<br />

Stikprøve variansen,<br />

S<br />

2<br />

er en central estimator for populations variansen σ².<br />

Hvis stikprøven er taget fra en normal-fordeling, så er den<br />

stokastiske variabel:<br />

2<br />

2 ( n −1)<br />

S<br />

χ = 2<br />

σ<br />

χ 2 -fordelt med n-1 frihedsgrader.<br />

( ) n<br />

X<br />

n<br />

2 n 2<br />

∑ ( X − X ) n −<br />

1 ∑ X<br />

i=<br />

i<br />

i=<br />

1 i ∑i=<br />

=<br />

=<br />

n −1<br />

n −1<br />

<strong>Konfidensintervaller</strong> for populations-variansen er baseret på<br />

χ 2 -fordelingen.<br />

1<br />

i<br />

2


Sandsynligheder i χ2 fordelingen<br />

Tabel 4 s778 α<br />

Areal i højre hale (α)<br />

.995 .990 .975 .950 .900 .100 .050 .025 .010 .005<br />

1 0.0000393 0.000157 0.000982 0.000393 0.0158 2.71 3.84 5.02 6.63 7.88<br />

2 0.0100 0.0201 0.0506 0.103 0.211 4.61 5.99 7.38 9.21 10.60<br />

3 0.0717 0.115 0.216 0.352 0.584 6.25 7.81 9.35 11.34 12.84<br />

4 0.207 0.297 0.484 0.711 1.06 7.78 9.49 11.14 13.28 14.86<br />

5 0.412 0.554 0.831 1.15 1.61 9.24 11.07 12.83 15.09 16.75<br />

6 0.676 0.872 1.24 1.64 2.20 10.64 12.59 14.45 16.81 18.55<br />

7 0.989 1.24 1.69 2.17 2.83 12.02 14.07 16.01 18.48 20.28<br />

8 1.34 1.65 2.18 2.73 3.49 13.36 15.51 17.53 20.09 21.95<br />

9 1.73 2.09 2.70 3.33 4.17 14.68 16.92 19.02 21.67 23.59<br />

10 2.16 2.56 3.25 3.94 4.87 15.99 18.31 20.48 23.21 25.19<br />

11 2.60 3.05 3.82 4.57 5.58 17.28 19.68 21.92 24.72 26.76<br />

12 3.07 3.57 4.40 5.23 6.30 18.55 21.03 23.34 26.22 28.30<br />

13 3.57 4.11 5.01 5.89 7.04 19.81 22.36 24.74 27.69 29.82<br />

14 4.07 4.66 5.63 6.57 7.79 21.06 23.68 26.12 29.14 31.32<br />

15 4.60 5.23 6.26 7.26 8.55 22.31 25.00 27.49 30.58 32.80<br />

16 5.14 5.81 6.91 7.96 9.31 23.54 26.30 28.85 32.00 34.27<br />

17 5.70 6.41 7.56 8.67 10.09 24.77 27.59 30.19 33.41 35.72<br />

18 6.26 7.01 8.23 9.39 10.86 25.99 28.87 31.53 34.81 37.16<br />

19 6.84 7.63 8.91 10.12 11.65 27.20 30.14 32.85 36.19 38.58<br />

20 7.43 8.26 9.59 10.85 12.44 28.41 31.41 34.17 37.57 40.00<br />

21 8.03 8.90 10.28 11.59 13.24 29.62 32.67 35.48 38.93 41.40<br />

22 8.64 9.54 10.98 12.34 14.04 30.81 33.92 36.78 40.29 42.80<br />

23 9.26 10.20 11.69 13.09 14.85 32.01 35.17 38.08 41.64 44.18<br />

2<br />

χα


Konfidens interval for populations<br />

variansen, σ 2<br />

Et (1-α)100% konfidens interval for populations variansen σ2 (hvis populationen<br />

er normal fordelt) er givet som:<br />

α<br />

hvor er fraktilen i χ2 2<br />

χ α 2<br />

2<br />

( )<br />

, ( )<br />

⎡<br />

2<br />

⎢ n−1 s n−1 s<br />

2<br />

2<br />

⎢ χ α χ α<br />

1− ⎣ 2<br />

2<br />

fordelingen<br />

<strong>og</strong><br />

2<br />

2<br />

χ α<br />

1− 2<br />

⎤<br />

⎥<br />

⎥<br />

⎦<br />

er 1− fraktilen.<br />

2<br />

α<br />

Bemærk: Fordi χ2 fordelingen er skæv, er konfidens-intervallet<br />

for populations-variansen ikke symmetrisk omkring s2 Bemærk: Fordi χ<br />

.<br />

2 fordelingen er skæv, er konfidens-intervallet<br />

for populations-variansen ikke symmetrisk omkring s2 .


Eksempel 6-5<br />

En maskine fylder kaffekander (med kaffe ;-) Hvis det gennemsnitlige<br />

indhold er forskellig fra hvad det skal være, kan maskinen justeres.<br />

Hvis variansen er for høj, skal maskinen sendes til reparation. En<br />

stikprøve på 30 kander giver et varians estimat på s2 = 18,540. Giv et<br />

95% konfidens interval for populations variansen, σ2 En maskine fylder kaffekander (med kaffe ;-) Hvis det gennemsnitlige<br />

indhold er forskellig fra hvad det skal være, kan maskinen justeres.<br />

Hvis variansen er for høj, skal maskinen sendes til reparation. En<br />

stikprøve på 30 kander giver et varians estimat på s<br />

.<br />

2 = 18,540. Giv et<br />

95% konfidens interval for populations variansen, σ2 .<br />

⎡<br />

⎢(<br />

n −1)<br />

s<br />

⎢ 2<br />

χα<br />

⎢<br />

⎣ 2<br />

2<br />

( n −1)<br />

s<br />

, 2<br />

χ<br />

α<br />

1−<br />

2<br />

2<br />

⎤<br />

⎥<br />

⎥<br />

=<br />

⎥<br />


Eksempel 6-5<br />

⎡<br />

⎢(<br />

n<br />

−1)<br />

s<br />

⎢ 2<br />

χα<br />

⎢<br />

⎣ 2<br />

2<br />

( n −1)<br />

s<br />

, 2<br />

χ<br />

α<br />

1−<br />

2<br />

2<br />

⎤<br />

⎥<br />

⎥<br />

⎥<br />

⎦<br />

f(χ 2 )<br />

0.06<br />

0.05<br />

0.04<br />

0.03<br />

0.02<br />

0.01<br />

0.00<br />

0<br />

Areal i højre hale<br />

Chi-Square Distribution: df = 29<br />

0.025<br />

10<br />

20<br />

30<br />

40<br />

0.95<br />

50<br />

χ2 2<br />

2<br />

χ = 16. 05<br />

0. 975<br />

χ 0. 025<br />

0.025<br />

60<br />

= 4572 .<br />

df .995 .990 .975 .950 .900 .100 .050 .025 .010 .005<br />

.<br />

.<br />

.<br />

.<br />

.<br />

.<br />

.<br />

.<br />

.<br />

.<br />

.<br />

.<br />

.<br />

.<br />

.<br />

.<br />

.<br />

.<br />

.<br />

.<br />

.<br />

.<br />

.<br />

.<br />

.<br />

.<br />

.<br />

.<br />

.<br />

.<br />

.<br />

.<br />

.<br />

28 12.46 13.56 15.31 16.93 18.94 37.92 41.34 44.46 48.28 50.99<br />

29 13.12 14.26 16.05 17.71 19.77 39.09 42.56 45.72 49.59 52.34<br />

30 13.79 14.95 16.79 18.49 20.60 40.26 43.77 46.98 50.89 53.67<br />

70


Hypoteser <strong>og</strong> hypotesetest.<br />

En hypotese er et udsagn om n<strong>og</strong>le karakteristika af en variabel eller<br />

mængde af variable<br />

Fx ”Er middelhøjden af de Oecon studerende lig 175cm?”<br />

I en hypotesetest testes værdier, der er opstillet i en hypotese, ved at<br />

sammenligne med værdier beregnet fra data.<br />

For eksempel kan gennemsnittet af en stikprøve af jeres vægte beregnes til<br />

172,7 cm. Er det (signifikant) forskellig fra 175? Det er forskellig fra 175,<br />

men kan vi derfra konkludere, at det ikke bare skyldes tilfældig variation,<br />

afhængig af eksempelvis stikprøvestørrelsen?<br />

En hypotesetest består af 5 elementer:<br />

I. Antagelser<br />

II. Hypoteser<br />

III. Teststørrelser<br />

IV. p-værdi<br />

V. Beslutning/konklusion


I:<br />

Antagelser<br />

Type af data: Se på om det er diskrete eller kontinuerte data.<br />

Populationsfordeling: Se på hvilken fordeling populationen<br />

har.<br />

Stikprøve: Hvilken metode er brugt til at indsamle data. Skal<br />

være en simpel stikprøve i de test vi bruger.<br />

Stikprøvestørrelse: Hvor stor er den stikprøve vi har til at<br />

beregne test størrelsen?


II: Hypoteser<br />

Nul hypotesen H0 : En påstand om en<br />

populationsparameter. Er sand indtil vi<br />

statistisk er bevist at den er sand.<br />

Den alternative hypotese H1 : En<br />

påstand om alle situationer, der ikke er<br />

dækket af H0 , dvs. det ”modsatte af<br />

H0 ”.<br />

Nul hypotesen er sand indtil det<br />

modsatte er bevist.<br />

Oecon<br />

eksempel: H0: μ<br />

= 175 vs<br />

H1: μ<br />

≠<br />

175<br />

Eksempel: Nul<strong>og</strong> alternativ-hypoteser<br />

for middelværdien<br />

•H<br />

H<br />

0<br />

1<br />

•H<br />

H<br />

•H<br />

H<br />

0<br />

1<br />

0<br />

1<br />

: μ = 5<br />

: μ ≠ 5<br />

: μ ≥ 5<br />

: μ < 5<br />

: μ ≤ 5<br />

: μ > 5


III:<br />

Test størrelsen<br />

Teststørrelsen beregnes fra stikprøve data <strong>og</strong> bruges til at vurdere<br />

nul-hypotesen H 0.<br />

Den indeholder typisk et punktestimat for den parameter, der indgår<br />

i nul hypotesen – for eksempel stikprøve gennemsnittet som<br />

punktestimat for middelværdien.<br />

Oecon eksempel: Stikprøvegennemsnittet er<br />

teststørrelsen til test af H0 hypotesen μ = 175.<br />

Konkret x<br />

= 172. 7 ≠ 175 , hvilket er ufavorabelt for<br />

H0 , men er det bevis nok til at afvise H0 eller er det<br />

bare tilfældighedernes spil?<br />

x


IV:<br />

p-værdi<br />

p-værdien er et mål for troværdigheden af H 0 set i lyset<br />

af den aktuelle stikprøve.<br />

Formelt er p-værdien af en test, er sandsynligheden for<br />

at observere en ny teststørrelse, der er mindst lige så<br />

ufarvorabel for H0 som den observerede teststørrelse,<br />

når nul hypotesen er sand.<br />

Jo mindre p-værdi jo mere signifikant siger man testet er.<br />

Bemærk: Selvom H0 er sand kan man godt få en lille pværdi<br />

– <strong>og</strong> omvendt.


V:<br />

Konklusion/beslutnings regel<br />

En beslutningsregel for en hypotese test, er en regel for under hvilke<br />

betingelse nul hypotesen kan forkastes.<br />

Betragt H 0 : μ=175. Beslutnings reglen kan her være at forkaste H 0 , når<br />

stikprøve gennemsnittet er under 170.<br />

Typisk bruges d<strong>og</strong> p-værdien for testen. Så en beslutningsregel er for<br />

eksempel at forkaste H 0 , når p-værdien er mindre end 0.05.<br />

Vi accepterer/beviser aldrig, at nul hypotesen er sand. Hvis vi ikke kan<br />

forkaste nul hypotesen, siger vi, at der ikke er nok beviser til at forkaste den.<br />

Hvis vi forkaster nul hypotesen, kan vi konkludere, at der er beviser nok til<br />

at sige, at den alternative hypotese er sand.


Signifikansniveau α<br />

Signifikansniveauet α er et tal,<br />

således at H 0 forkastes, hvis pværdien<br />

er mindre end α.<br />

α er normalvis 0.05 eller 0.01.<br />

Vælges før analysen foretages.<br />

Konklusion<br />

p-værdi H 0 H 1<br />

p<br />

p<br />

< α Forkast Accepter<br />

> α Forkast<br />

ikke<br />

Accepter<br />

ikke<br />

Hvor lille et signifikans niveau man vælger, afhænger af hvilke<br />

konsekvenser beslutningen om at forkaste H 0 har. Hvis det er et spørgsmål<br />

om liv eller død, for eksempel i medicinske forsøg, vælges α meget lille.<br />

Men hvis det ”bare” er at teste om et folketingsparti er større end et andet,<br />

kan man godt α større.


Test af middelværdi<br />

Antagelse: Test af μ, X kvantitativ variabel <strong>og</strong> n>30.<br />

Hypoteser:<br />

X<br />

middelværdi μ0 <strong>og</strong> standard afvigelse σ<br />

(to-sidet<br />

test)<br />

Stikprøvefordeling af når H 0 er sand er approksimativ normal med<br />

Teststørrelse:<br />

Z<br />

H<br />

H<br />

0<br />

1<br />

=<br />

: μ = μ<br />

: μ ≠ μ<br />

X − μ0 σ n<br />

0<br />

0<br />

n<br />

μ x<br />

0 z<br />

0<br />

standardisering


Beregning af p-værdi<br />

Når H 0 er sand, er fordelingen af Z approksimativt standard normal<br />

fordelt (dvs. normal fordelt med middelværdi 0 <strong>og</strong> standard afvigelse 1).<br />

p-værdien er sandsynligheden for at observere en teststørrelse mindst<br />

så ufavorabel, som den observerede, givet at H 0 er sand.<br />

I formler: P( |Z| > beregnet z værdi), svarende til sandsynligheden for at<br />

observere et gennemsnit der er længere fra μ0 end , hvis H0 er sand.<br />

Sansynligheden ovenfor bestemmes ved tabelopslag (det er derfor vi<br />

standardiserer).<br />

Meget nemmere at se ved hjælp af et eksempel…<br />

x


Eksempel<br />

Hypoteser:<br />

H 0 : μ = 30<br />

H 1 : μ 30<br />

Stikprøve:<br />

n = 50<br />

x<br />

= 31.5<br />

σ = 5<br />

Teststørrelse:<br />

31.<br />

5−<br />

30<br />

Z = = 2,<br />

12<br />

5 50<br />

p-værdi:<br />

p = p(|<br />

Z | > 2,<br />

12)<br />

=<br />

2×<br />

p(<br />

Z > 2,<br />

12)<br />

=<br />

2×<br />

0.<br />

017 = 0.<br />

034<br />

Lille p-værdi, så H0 forkastes.<br />

Fordeling:<br />

0.8<br />

0.7<br />

0.6<br />

0.5<br />

0.4<br />

0.3<br />

0.2<br />

0.1<br />

0.0<br />

.017 .017<br />

− z = −2.<br />

12 0 z<br />

= 2.<br />

12


Summe opgave<br />

H0: μ = 30<br />

H1: μ 30<br />

Stikprøve:<br />

n = 20<br />

n = 100<br />

x = 31.5<br />

x<br />

= 31.5<br />

σ = 5<br />

σ = 5<br />

Beregn værdien af test<br />

størrelsen <strong>og</strong> p-værdien.<br />

H0: μ = 30<br />

H1: μ 30<br />

Stikprøve:<br />

Beregn værdien af test<br />

størrelsen <strong>og</strong> p-værdien


Relation til konfidens intervaller<br />

95% konfidensinterval<br />

σ<br />

x±<br />

1 . 96 = 31.<br />

5±<br />

1.<br />

96<br />

n<br />

Middelværdi<br />

under<br />

H 0<br />

μ 0<br />

for μ, dvs. α = 0.05:<br />

5<br />

50<br />

95% konfidensinterval<br />

omkring observeret<br />

middelværdi<br />

= 30 32.88<br />

30.11 x = 31.5<br />

Da (1−α)100% konfidensintervallet ikke overlapper μ0 er p-værdien mindre<br />

end α=0.05, dvs. vi forkaster H0.


Hvorfor = i nul hypotesen<br />

H<br />

H<br />

:<br />

som<br />

følgende<br />

det<br />

i<br />

skrives<br />

H<br />

H<br />

H<br />

0<br />

1<br />

0<br />

1<br />

0<br />

0<br />

0<br />

0<br />

0<br />

:<br />

:<br />

:<br />

:<br />

μ<br />

μ<br />

μ<br />

μ<br />

μ<br />

μ<br />

μ<br />

μ<br />

><br />

=<br />

•<br />

><br />

≤<br />

•<br />

mindre.<br />

er<br />

evt.<br />

den<br />

meget<br />

hvor<br />

ikke<br />

værdi,<br />

givet<br />

en<br />

end<br />

)<br />

hvis<br />

mindre,<br />

eller<br />

(<br />

større<br />

er<br />

om<br />

i,<br />

et<br />

interesser<br />

kun<br />

vi<br />

er<br />

Desuden<br />

gode".<br />

til<br />

H<br />

komme<br />

tvivlen<br />

lader<br />

"<br />

måde<br />

denne<br />

på<br />

man<br />

at<br />

er,<br />

dette<br />

til<br />

Grunden<br />

0<br />

<<br />

μ


Højresidet<br />

test<br />

(et en-sidet<br />

Antagelse: Test af μ, X kontinuert variabel <strong>og</strong> n>30.<br />

Hypoteser:<br />

H<br />

H<br />

test)<br />

Stikprøve fordeling af når H 0 er sand er approksimativ normal<br />

med middelværdi μ <strong>og</strong> standard afvigelse<br />

Teststørrelse:<br />

0<br />

1<br />

: μ = μ<br />

: μ > μ<br />

P-værdien: p( Z > observeret z værdi)<br />

Z<br />

0<br />

0<br />

X<br />

X − μ0 =<br />

σ n<br />

σ<br />

n


Eksempel højresidet<br />

H0: μ = 30<br />

H1: μ > 30<br />

Stikprøve:<br />

n = 50<br />

x<br />

= 31.5<br />

σ = 5<br />

Test størrelse:<br />

Z<br />

=<br />

31.<br />

5<br />

5<br />

−30<br />

=<br />

50<br />

2,<br />

12<br />

test<br />

P-værdi:<br />

p = p(<br />

z > 2,<br />

21)<br />

=<br />

Lille p-værdi, så H0 forkastes.<br />

0. 8<br />

0. 7<br />

0. 6<br />

0. 5<br />

0. 4<br />

0. 3<br />

0. 2<br />

0. 1<br />

0. 0<br />

Fordeling:<br />

0.8<br />

0.7<br />

0.6<br />

0.5<br />

0.4<br />

0.3<br />

0.2<br />

0.1<br />

0.0<br />

0.<br />

017<br />

0<br />

μ0=30 Z=2,12<br />

x=31.5<br />

.017<br />

.017


Venstresidet<br />

test<br />

Antagelse: Test af μ, X kvantitativ variabel <strong>og</strong> n>30.<br />

Hypoteser:<br />

Stikprøve fordeling af X når H0 er sand er approksimativ normal med<br />

middelværdi μ <strong>og</strong> standard afvigelse σ<br />

n<br />

Teststørrelse:<br />

H<br />

H<br />

0<br />

1<br />

: μ = μ<br />

: μ < μ<br />

P-værdien: p( Z < observeret z værdi)<br />

Z<br />

=<br />

0<br />

0<br />

X − μ0 σ n


Eksempel venstresidet<br />

H0: μ = 30<br />

H1: μ < 30<br />

Stikprøve:<br />

n = 50<br />

x<br />

= 31.5<br />

σ = 5<br />

Test størrelse:<br />

Z<br />

=<br />

31.<br />

5<br />

5<br />

−30<br />

=<br />

50<br />

2,<br />

12<br />

test<br />

P-værdi:<br />

Stor p-værdi, så H 0 forkastes ikke.<br />

0. 8<br />

1-.017 0. 7<br />

0. 6<br />

0. 5<br />

0. 4<br />

0. 3<br />

0. 2<br />

0. 1<br />

0. 0<br />

Fordeling:<br />

0.8<br />

0.7<br />

0.6<br />

1-.017<br />

0.5<br />

0.4<br />

0.3<br />

0.2<br />

0.1<br />

0.0<br />

p = p(<br />

z < 2,<br />

12)<br />

= 1−<br />

0<br />

μ0=30 Z=2,12<br />

x=31.5<br />

0.<br />

017


Test af middelværdi for ukendt varians<br />

Antagelse: Test af μ, X normalfordelt variabel <strong>og</strong> σ² ukendt (estimeret ved s²).<br />

Hypoteser:<br />

: μ ≠ μ<br />

Teststørrelse t er t-fordelt med (n-1) frihedsgrader:<br />

p-værdien: p( |t| > observeret t værdi) – kan ikke bestemmes ved tabel opslag,<br />

men SPSS gør det!<br />

Venstre <strong>og</strong> højre sidet test efter samme princip som før.<br />

H<br />

H<br />

0<br />

1<br />

X − μ0<br />

t =<br />

s n<br />

: μ = μ<br />

0<br />

0


Eksempel<br />

H0: μ = 30<br />

H1: μ 30<br />

Stikprøve:<br />

n = 50<br />

x<br />

= 31.5<br />

s = 5<br />

Test størrelse:<br />

31.<br />

5 − 30<br />

t = =<br />

5 50<br />

2,<br />

12<br />

Svært at slå op i tabel. Ligger<br />

mellem 0.025 <strong>og</strong> 0.01.<br />

P-værdi:<br />

p = p(|<br />

t | > 2,<br />

12)<br />

=<br />

2×<br />

p(<br />

t > 2,<br />

12)<br />

=<br />

2×<br />

0.<br />

020 = 0.<br />

040<br />

Lille p-værdi, så H 0 forkastes.<br />

Fordeling:<br />

0.8<br />

0.7<br />

0.6<br />

0.5<br />

0.4<br />

0.3<br />

0.2<br />

0.1<br />

0.0<br />

x=−31.5<br />

.020 .020<br />

μ0=30 x=31.5


Eksempel -<br />

H 0 : μ = 30<br />

H 1 : μ 30<br />

Stikprøve:<br />

n = 50<br />

x<br />

= 31.5<br />

s = 5<br />

Test størrelse:<br />

31.<br />

5 − 30<br />

t = =<br />

5 50<br />

2,<br />

12<br />

fortsat<br />

Svært at slå op i tabel. Ligger<br />

mellem 0.025 <strong>og</strong> 0.01.<br />

I stedet for p-værdi, vælges<br />

signifikans niveau α, for eksempel<br />

α=0,05.<br />

Slå op i t-tabellen med 49<br />

frihedsgrader under 0,025, da det<br />

er en 2-sidet test.<br />

t-værdien er cirka lig med 2.01. Da<br />

2,12 er større end 2,01, forkastes<br />

H0 .<br />

Hvis t=-2,12 skulle vi have sagt,<br />

da -2,12 er mindre end -2.01,<br />

forkastes H0 .


<strong>Hypotesetest</strong> for middelværdi i SPSS<br />

SPSS: Analyze<br />

Højde<br />

μ 0 i H 0<br />

Typisk output af spss<br />

One-Sample Statistics<br />

> Compare<br />

N Mean Std. Deviation<br />

Std. Error<br />

Mean<br />

24 172,7292 18,86737 3,85129<br />

n<br />

hypotesen<br />

x s s n<br />

Means<br />

Højde<br />

> One<br />

Sample T-Test<br />

One-Sample Test<br />

Test Value = 175<br />

Angiver (1−α)100%<br />

konfidensinterval<br />

Mean<br />

95% Confidence<br />

Interval of the<br />

Difference<br />

t df Sig. (2-tailed) Difference Lower Upper<br />

-,590 23 ,561 -2,27083 -10,2378 5,6962<br />

p-værdi for to-sidet<br />

(1−α)100% konfidensinterval<br />

for μ −<br />

μ 0<br />

t-test, dvs. H1: μ ≠ μ0


Test af en andel<br />

Antagelse: Test af populations andel p, når np>5 <strong>og</strong> n(1-p)>5.<br />

Hypoteser:<br />

Stikprøve fordeling af når H0 er sand er approksimativ normal med<br />

middelværdi <strong>og</strong> standard afvigelse p 1 p ) / n −<br />

p<br />

Teststørrelse:<br />

0<br />

P-værdien: p( |Z| > beregnet z værdi)<br />

Z<br />

=<br />

pˆ<br />

p<br />

0<br />

Højresidet <strong>og</strong> venstresidet test efter samme princip som før.<br />

H<br />

H<br />

0<br />

1<br />

pˆ<br />

−<br />

( 1−<br />

:<br />

:<br />

p<br />

p<br />

p<br />

p<br />

0<br />

0<br />

=<br />

≠<br />

p<br />

p<br />

) / n<br />

0<br />

0<br />

0(<br />

0


Test af variansen<br />

Antagelse: Test af populations variansen σ², X normal fordelt.<br />

Hypoteser:<br />

Teststørrelse:<br />

H<br />

H<br />

0<br />

1<br />

2<br />

: σ = σ<br />

2<br />

: σ ≠ σ<br />

P-værdi: p(|Χ²|> beregnet Χ² værdi) – kan ikke beregnes ved tabel opslag.<br />

Højresidet <strong>og</strong> venstresidet test efter samme princip som før.<br />

2<br />

0<br />

2<br />

0<br />

2<br />

2 ( n −1)<br />

s<br />

χ =<br />

2<br />

σ<br />

2<br />

( χ fordelt med(n<br />

-1)<br />

frihedsgrader)


Test af varians -<br />

H 0 : σ 2 =1<br />

H 1 : σ 2 χ1−α<br />

( n −1)<br />

kan vi ikke<br />

forkaste H0 .<br />

2<br />

=<br />

−1)<br />

⋅0.<br />

8659<br />

=<br />

1<br />

20.<br />

78<br />

0<br />

2<br />

2<br />

χ α ( n −1)<br />

= χ<br />

1 −<br />

0.05<br />

13.85 20.78<br />

0.<br />

95<br />

( 24)<br />

=<br />

13.<br />

85

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!