Konfidensintervaller Hypotesetest og

people.math.aau.dk

Konfidensintervaller Hypotesetest og

Konfidensintervaller

Hypotesetest

og

Konfidensinterval for andele

χ2-fordelingen og konfidensinterval for variansen

Hypoteseteori

Hypotesetest af middelværdi, varians og andele


Repetition fra sidst: Konfidensintervaller

Et punkt-estimat

punkt estimat estimerer værdien af en ukendt populations

parameter ved en enkelt værdi.

Fx: Middelhøjden blandt oecon studernde x

= 172,

73.

Et konfidens interval er et interval, der estimerer værdien af en

ukendt populations parameter. Kaldes også et interval estimat. estimat

Sammen med intervallet gives et mål for, hvor sikker man er på, at

den sande populations parameter ligger i intervallet. Dette mål

kaldes for konfidens niveauet. niveauet

Et punkt estimat indeholder ikke meget information om den faktiske

værdi af μ – fx hvor sikkert er vores punkt estimat?

Et interval estimat indeholder flere informationer, for eksempel:

Vi er 95% sikre på, at intervallet [164,8 ; 180,7] indeholde den sande

middelværdi μ.

Eller vi er 90% sikre på, at intervallet [166,1 ; 179,3] indeholder den

sande middelværdi μ.


Repetition fra sidst

(1-α)100% konfidens interval for:

Populations middelværdi μ, når X er normal fordelt (eller

stikprøven er stor) og σ er kendt:

x

±

z

α

2

Populations middelværdi μ, når X er normal fordelt og σ er

ukendt:

x ± t

s

n

α

α

2

Husk: n-1 frihedsgrader

σ

n



α


Konfidensinterval

for andele

Estimatet af populations-andelen, p, er stikprøve-andelen

, ,dvs. andelen af succeser i stikprøven.


Hvis np>5 og n(1-p)>5, så er stikprøve-fordelingen af

stikprøve-andelen ca normalfordelt:

⎛ p − p ⎞


( 1 )

~ N⎜

p,


⎝ n ⎠

Et (1-α)100% konfidensinterval for p er


± zα

2


( 1−


)

n


Eksempel 6-4

For For en en given produkttype: Hvor stor stor en en andel af af det det amerikanske

marked er er besat af af udenlandske virksomheder?

En En stikprøve på på100

100 forbrugere udtages og og 34 34 af af disse bruger et et

udenlandske produkt; resten bruger et et amerikanske produkt.

Giv Giv et et 95% 95% konfidensinterval

for for andelen af af brugere af af udenlandske

produkter.

ˆ

p ± zα

2



n

( 0.

34)(

0.

66)

= 0.

34 ± 1.

96

100

= 0.

34 ± ( 1.

96)(

0.

04737)

= 0.

34 ± 0.

0928

=

[ 0.

2472,

0.

4328]


χ 2 -fordelingen

χ 2 -fordelingen [ki-i-anden] er

asymmetrisk og kun defineret for

positive tal.

χ 2 -fordelingen er (li’som t-fordelingen)

specificeret ved antal frihedsgrader (df).

Notation: X~χ 2 (n) [X følger en χ 2 -

fordelingenmed n frihedsgrader].

χ2-fordelingen er sandsynligheds

fordelingen for en sum af uafhængige

kvadrerede standard normal fordelte

stokastiske variable.

Hvis X~χ2 (df) gælder:

Chi-Square

D istrib ution: df=10 , df=3 0, df=50

0

df = 10

df = 30

Middelværdien er lig med antallet af frihedsgraden, E(X)=df

Variansen er lig med to gange antallet af frihedsgrader, V(X)=2df

5 0

χ2 df = 50

100


χ 2 -fordelingen og stikprøvevariansen

Stikprøve variansen,

S

2

er en central estimator for populations variansen σ².

Hvis stikprøven er taget fra en normal-fordeling, så er den

stokastiske variabel:

2

2 ( n −1)

S

χ = 2

σ

χ 2 -fordelt med n-1 frihedsgrader.

( ) n

X

n

2 n 2

∑ ( X − X ) n −

1 ∑ X

i=

i

i=

1 i ∑i=

=

=

n −1

n −1

Konfidensintervaller for populations-variansen er baseret på

χ 2 -fordelingen.

1

i

2


Sandsynligheder i χ2 fordelingen

Tabel 4 s778 α

Areal i højre hale (α)

.995 .990 .975 .950 .900 .100 .050 .025 .010 .005

1 0.0000393 0.000157 0.000982 0.000393 0.0158 2.71 3.84 5.02 6.63 7.88

2 0.0100 0.0201 0.0506 0.103 0.211 4.61 5.99 7.38 9.21 10.60

3 0.0717 0.115 0.216 0.352 0.584 6.25 7.81 9.35 11.34 12.84

4 0.207 0.297 0.484 0.711 1.06 7.78 9.49 11.14 13.28 14.86

5 0.412 0.554 0.831 1.15 1.61 9.24 11.07 12.83 15.09 16.75

6 0.676 0.872 1.24 1.64 2.20 10.64 12.59 14.45 16.81 18.55

7 0.989 1.24 1.69 2.17 2.83 12.02 14.07 16.01 18.48 20.28

8 1.34 1.65 2.18 2.73 3.49 13.36 15.51 17.53 20.09 21.95

9 1.73 2.09 2.70 3.33 4.17 14.68 16.92 19.02 21.67 23.59

10 2.16 2.56 3.25 3.94 4.87 15.99 18.31 20.48 23.21 25.19

11 2.60 3.05 3.82 4.57 5.58 17.28 19.68 21.92 24.72 26.76

12 3.07 3.57 4.40 5.23 6.30 18.55 21.03 23.34 26.22 28.30

13 3.57 4.11 5.01 5.89 7.04 19.81 22.36 24.74 27.69 29.82

14 4.07 4.66 5.63 6.57 7.79 21.06 23.68 26.12 29.14 31.32

15 4.60 5.23 6.26 7.26 8.55 22.31 25.00 27.49 30.58 32.80

16 5.14 5.81 6.91 7.96 9.31 23.54 26.30 28.85 32.00 34.27

17 5.70 6.41 7.56 8.67 10.09 24.77 27.59 30.19 33.41 35.72

18 6.26 7.01 8.23 9.39 10.86 25.99 28.87 31.53 34.81 37.16

19 6.84 7.63 8.91 10.12 11.65 27.20 30.14 32.85 36.19 38.58

20 7.43 8.26 9.59 10.85 12.44 28.41 31.41 34.17 37.57 40.00

21 8.03 8.90 10.28 11.59 13.24 29.62 32.67 35.48 38.93 41.40

22 8.64 9.54 10.98 12.34 14.04 30.81 33.92 36.78 40.29 42.80

23 9.26 10.20 11.69 13.09 14.85 32.01 35.17 38.08 41.64 44.18

2

χα


Konfidens interval for populations

variansen, σ 2

Et (1-α)100% konfidens interval for populations variansen σ2 (hvis populationen

er normal fordelt) er givet som:

α

hvor er fraktilen i χ2 2

χ α 2

2

( )

, ( )


2

⎢ n−1 s n−1 s

2

2

⎢ χ α χ α

1− ⎣ 2

2

fordelingen

og

2

2

χ α

1− 2





er 1− fraktilen.

2

α

Bemærk: Fordi χ2 fordelingen er skæv, er konfidens-intervallet

for populations-variansen ikke symmetrisk omkring s2 Bemærk: Fordi χ

.

2 fordelingen er skæv, er konfidens-intervallet

for populations-variansen ikke symmetrisk omkring s2 .


Eksempel 6-5

En maskine fylder kaffekander (med kaffe ;-) Hvis det gennemsnitlige

indhold er forskellig fra hvad det skal være, kan maskinen justeres.

Hvis variansen er for høj, skal maskinen sendes til reparation. En

stikprøve på 30 kander giver et varians estimat på s2 = 18,540. Giv et

95% konfidens interval for populations variansen, σ2 En maskine fylder kaffekander (med kaffe ;-) Hvis det gennemsnitlige

indhold er forskellig fra hvad det skal være, kan maskinen justeres.

Hvis variansen er for høj, skal maskinen sendes til reparation. En

stikprøve på 30 kander giver et varians estimat på s

.

2 = 18,540. Giv et

95% konfidens interval for populations variansen, σ2 .


⎢(

n −1)

s

⎢ 2

χα


⎣ 2

2

( n −1)

s

, 2

χ

α

1−

2

2




=



Eksempel 6-5


⎢(

n

−1)

s

⎢ 2

χα


⎣ 2

2

( n −1)

s

, 2

χ

α

1−

2

2






f(χ 2 )

0.06

0.05

0.04

0.03

0.02

0.01

0.00

0

Areal i højre hale

Chi-Square Distribution: df = 29

0.025

10

20

30

40

0.95

50

χ2 2

2

χ = 16. 05

0. 975

χ 0. 025

0.025

60

= 4572 .

df .995 .990 .975 .950 .900 .100 .050 .025 .010 .005

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

28 12.46 13.56 15.31 16.93 18.94 37.92 41.34 44.46 48.28 50.99

29 13.12 14.26 16.05 17.71 19.77 39.09 42.56 45.72 49.59 52.34

30 13.79 14.95 16.79 18.49 20.60 40.26 43.77 46.98 50.89 53.67

70


Hypoteser og hypotesetest.

En hypotese er et udsagn om nogle karakteristika af en variabel eller

mængde af variable

Fx ”Er middelhøjden af de Oecon studerende lig 175cm?”

I en hypotesetest testes værdier, der er opstillet i en hypotese, ved at

sammenligne med værdier beregnet fra data.

For eksempel kan gennemsnittet af en stikprøve af jeres vægte beregnes til

172,7 cm. Er det (signifikant) forskellig fra 175? Det er forskellig fra 175,

men kan vi derfra konkludere, at det ikke bare skyldes tilfældig variation,

afhængig af eksempelvis stikprøvestørrelsen?

En hypotesetest består af 5 elementer:

I. Antagelser

II. Hypoteser

III. Teststørrelser

IV. p-værdi

V. Beslutning/konklusion


I:

Antagelser

Type af data: Se på om det er diskrete eller kontinuerte data.

Populationsfordeling: Se på hvilken fordeling populationen

har.

Stikprøve: Hvilken metode er brugt til at indsamle data. Skal

være en simpel stikprøve i de test vi bruger.

Stikprøvestørrelse: Hvor stor er den stikprøve vi har til at

beregne test størrelsen?


II: Hypoteser

Nul hypotesen H0 : En påstand om en

populationsparameter. Er sand indtil vi

statistisk er bevist at den er sand.

Den alternative hypotese H1 : En

påstand om alle situationer, der ikke er

dækket af H0 , dvs. det ”modsatte af

H0 ”.

Nul hypotesen er sand indtil det

modsatte er bevist.

Oecon

eksempel: H0: μ

= 175 vs

H1: μ


175

Eksempel: Nulog alternativ-hypoteser

for middelværdien

•H

H

0

1

•H

H

•H

H

0

1

0

1

: μ = 5

: μ ≠ 5

: μ ≥ 5

: μ < 5

: μ ≤ 5

: μ > 5


III:

Test størrelsen

Teststørrelsen beregnes fra stikprøve data og bruges til at vurdere

nul-hypotesen H 0.

Den indeholder typisk et punktestimat for den parameter, der indgår

i nul hypotesen – for eksempel stikprøve gennemsnittet som

punktestimat for middelværdien.

Oecon eksempel: Stikprøvegennemsnittet er

teststørrelsen til test af H0 hypotesen μ = 175.

Konkret x

= 172. 7 ≠ 175 , hvilket er ufavorabelt for

H0 , men er det bevis nok til at afvise H0 eller er det

bare tilfældighedernes spil?

x


IV:

p-værdi

p-værdien er et mål for troværdigheden af H 0 set i lyset

af den aktuelle stikprøve.

Formelt er p-værdien af en test, er sandsynligheden for

at observere en ny teststørrelse, der er mindst lige så

ufarvorabel for H0 som den observerede teststørrelse,

når nul hypotesen er sand.

Jo mindre p-værdi jo mere signifikant siger man testet er.

Bemærk: Selvom H0 er sand kan man godt få en lille pværdi

og omvendt.


V:

Konklusion/beslutnings regel

En beslutningsregel for en hypotese test, er en regel for under hvilke

betingelse nul hypotesen kan forkastes.

Betragt H 0 : μ=175. Beslutnings reglen kan her være at forkaste H 0 , når

stikprøve gennemsnittet er under 170.

Typisk bruges dog p-værdien for testen. Så en beslutningsregel er for

eksempel at forkaste H 0 , når p-værdien er mindre end 0.05.

Vi accepterer/beviser aldrig, at nul hypotesen er sand. Hvis vi ikke kan

forkaste nul hypotesen, siger vi, at der ikke er nok beviser til at forkaste den.

Hvis vi forkaster nul hypotesen, kan vi konkludere, at der er beviser nok til

at sige, at den alternative hypotese er sand.


Signifikansniveau α

Signifikansniveauet α er et tal,

således at H 0 forkastes, hvis pværdien

er mindre end α.

α er normalvis 0.05 eller 0.01.

Vælges før analysen foretages.

Konklusion

p-værdi H 0 H 1

p

p

< α Forkast Accepter

> α Forkast

ikke

Accepter

ikke

Hvor lille et signifikans niveau man vælger, afhænger af hvilke

konsekvenser beslutningen om at forkaste H 0 har. Hvis det er et spørgsmål

om liv eller død, for eksempel i medicinske forsøg, vælges α meget lille.

Men hvis det ”bare” er at teste om et folketingsparti er større end et andet,

kan man godt α større.


Test af middelværdi

Antagelse: Test af μ, X kvantitativ variabel og n>30.

Hypoteser:

X

middelværdi μ0 og standard afvigelse σ

(to-sidet

test)

Stikprøvefordeling af når H 0 er sand er approksimativ normal med

Teststørrelse:

Z

H

H

0

1

=

: μ = μ

: μ ≠ μ

X − μ0 σ n

0

0

n

μ x

0 z

0

standardisering


Beregning af p-værdi

Når H 0 er sand, er fordelingen af Z approksimativt standard normal

fordelt (dvs. normal fordelt med middelværdi 0 og standard afvigelse 1).

p-værdien er sandsynligheden for at observere en teststørrelse mindst

så ufavorabel, som den observerede, givet at H 0 er sand.

I formler: P( |Z| > beregnet z værdi), svarende til sandsynligheden for at

observere et gennemsnit der er længere fra μ0 end , hvis H0 er sand.

Sansynligheden ovenfor bestemmes ved tabelopslag (det er derfor vi

standardiserer).

Meget nemmere at se ved hjælp af et eksempel…

x


Eksempel

Hypoteser:

H 0 : μ = 30

H 1 : μ 30

Stikprøve:

n = 50

x

= 31.5

σ = 5

Teststørrelse:

31.

5−

30

Z = = 2,

12

5 50

p-værdi:

p = p(|

Z | > 2,

12)

=


p(

Z > 2,

12)

=


0.

017 = 0.

034

Lille p-værdi, så H0 forkastes.

Fordeling:

0.8

0.7

0.6

0.5

0.4

0.3

0.2

0.1

0.0

.017 .017

− z = −2.

12 0 z

= 2.

12


Summe opgave

H0: μ = 30

H1: μ 30

Stikprøve:

n = 20

n = 100

x = 31.5

x

= 31.5

σ = 5

σ = 5

Beregn værdien af test

størrelsen og p-værdien.

H0: μ = 30

H1: μ 30

Stikprøve:

Beregn værdien af test

størrelsen og p-værdien


Relation til konfidens intervaller

95% konfidensinterval

σ


1 . 96 = 31.


1.

96

n

Middelværdi

under

H 0

μ 0

for μ, dvs. α = 0.05:

5

50

95% konfidensinterval

omkring observeret

middelværdi

= 30 32.88

30.11 x = 31.5

Da (1−α)100% konfidensintervallet ikke overlapper μ0 er p-værdien mindre

end α=0.05, dvs. vi forkaster H0.


Hvorfor = i nul hypotesen

H

H

:

som

følgende

det

i

skrives

H

H

H

0

1

0

1

0

0

0

0

0

:

:

:

:

μ

μ

μ

μ

μ

μ

μ

μ

>

=


>



mindre.

er

evt.

den

meget

hvor

ikke

værdi,

givet

en

end

)

hvis

mindre,

eller

(

større

er

om

i,

et

interesser

kun

vi

er

Desuden

gode".

til

H

komme

tvivlen

lader

"

måde

denne


man

at

er,

dette

til

Grunden

0

<

μ


Højresidet

test

(et en-sidet

Antagelse: Test af μ, X kontinuert variabel og n>30.

Hypoteser:

H

H

test)

Stikprøve fordeling af når H 0 er sand er approksimativ normal

med middelværdi μ og standard afvigelse

Teststørrelse:

0

1

: μ = μ

: μ > μ

P-værdien: p( Z > observeret z værdi)

Z

0

0

X

X − μ0 =

σ n

σ

n


Eksempel højresidet

H0: μ = 30

H1: μ > 30

Stikprøve:

n = 50

x

= 31.5

σ = 5

Test størrelse:

Z

=

31.

5

5

−30

=

50

2,

12

test

P-værdi:

p = p(

z > 2,

21)

=

Lille p-værdi, så H0 forkastes.

0. 8

0. 7

0. 6

0. 5

0. 4

0. 3

0. 2

0. 1

0. 0

Fordeling:

0.8

0.7

0.6

0.5

0.4

0.3

0.2

0.1

0.0

0.

017

0

μ0=30 Z=2,12

x=31.5

.017

.017


Venstresidet

test

Antagelse: Test af μ, X kvantitativ variabel og n>30.

Hypoteser:

Stikprøve fordeling af X når H0 er sand er approksimativ normal med

middelværdi μ og standard afvigelse σ

n

Teststørrelse:

H

H

0

1

: μ = μ

: μ < μ

P-værdien: p( Z < observeret z værdi)

Z

=

0

0

X − μ0 σ n


Eksempel venstresidet

H0: μ = 30

H1: μ < 30

Stikprøve:

n = 50

x

= 31.5

σ = 5

Test størrelse:

Z

=

31.

5

5

−30

=

50

2,

12

test

P-værdi:

Stor p-værdi, så H 0 forkastes ikke.

0. 8

1-.017 0. 7

0. 6

0. 5

0. 4

0. 3

0. 2

0. 1

0. 0

Fordeling:

0.8

0.7

0.6

1-.017

0.5

0.4

0.3

0.2

0.1

0.0

p = p(

z < 2,

12)

= 1−

0

μ0=30 Z=2,12

x=31.5

0.

017


Test af middelværdi for ukendt varians

Antagelse: Test af μ, X normalfordelt variabel og σ² ukendt (estimeret ved s²).

Hypoteser:

: μ ≠ μ

Teststørrelse t er t-fordelt med (n-1) frihedsgrader:

p-værdien: p( |t| > observeret t værdi) – kan ikke bestemmes ved tabel opslag,

men SPSS gør det!

Venstre og højre sidet test efter samme princip som før.

H

H

0

1

X − μ0

t =

s n

: μ = μ

0

0


Eksempel

H0: μ = 30

H1: μ 30

Stikprøve:

n = 50

x

= 31.5

s = 5

Test størrelse:

31.

5 − 30

t = =

5 50

2,

12

Svært at slå op i tabel. Ligger

mellem 0.025 og 0.01.

P-værdi:

p = p(|

t | > 2,

12)

=


p(

t > 2,

12)

=


0.

020 = 0.

040

Lille p-værdi, så H 0 forkastes.

Fordeling:

0.8

0.7

0.6

0.5

0.4

0.3

0.2

0.1

0.0

x=−31.5

.020 .020

μ0=30 x=31.5


Eksempel -

H 0 : μ = 30

H 1 : μ 30

Stikprøve:

n = 50

x

= 31.5

s = 5

Test størrelse:

31.

5 − 30

t = =

5 50

2,

12

fortsat

Svært at slå op i tabel. Ligger

mellem 0.025 og 0.01.

I stedet for p-værdi, vælges

signifikans niveau α, for eksempel

α=0,05.

Slå op i t-tabellen med 49

frihedsgrader under 0,025, da det

er en 2-sidet test.

t-værdien er cirka lig med 2.01. Da

2,12 er større end 2,01, forkastes

H0 .

Hvis t=-2,12 skulle vi have sagt,

da -2,12 er mindre end -2.01,

forkastes H0 .


Hypotesetest for middelværdi i SPSS

SPSS: Analyze

Højde

μ 0 i H 0

Typisk output af spss

One-Sample Statistics

> Compare

N Mean Std. Deviation

Std. Error

Mean

24 172,7292 18,86737 3,85129

n

hypotesen

x s s n

Means

Højde

> One

Sample T-Test

One-Sample Test

Test Value = 175

Angiver (1−α)100%

konfidensinterval

Mean

95% Confidence

Interval of the

Difference

t df Sig. (2-tailed) Difference Lower Upper

-,590 23 ,561 -2,27083 -10,2378 5,6962

p-værdi for to-sidet

(1−α)100% konfidensinterval

for μ −

μ 0

t-test, dvs. H1: μ ≠ μ0


Test af en andel

Antagelse: Test af populations andel p, når np>5 og n(1-p)>5.

Hypoteser:

Stikprøve fordeling af når H0 er sand er approksimativ normal med

middelværdi og standard afvigelse p 1 p ) / n −

p

Teststørrelse:

0

P-værdien: p( |Z| > beregnet z værdi)

Z

=


p

0

Højresidet og venstresidet test efter samme princip som før.

H

H

0

1



( 1−

:

:

p

p

p

p

0

0

=


p

p

) / n

0

0

0(

0


Test af variansen

Antagelse: Test af populations variansen σ², X normal fordelt.

Hypoteser:

Teststørrelse:

H

H

0

1

2

: σ = σ

2

: σ ≠ σ

P-værdi: p(|Χ²|> beregnet Χ² værdi) – kan ikke beregnes ved tabel opslag.

Højresidet og venstresidet test efter samme princip som før.

2

0

2

0

2

2 ( n −1)

s

χ =

2

σ

2

( χ fordelt med(n

-1)

frihedsgrader)


Test af varians -

H 0 : σ 2 =1

H 1 : σ 2 χ1−α

( n −1)

kan vi ikke

forkaste H0 .

2

=

−1)

⋅0.

8659

=

1

20.

78

0

2

2

χ α ( n −1)

= χ

1 −

0.05

13.85 20.78

0.

95

( 24)

=

13.

85

More magazines by this user
Similar magazines