21.01.2015 Views

Iz zakladnice statističnih testov - Oddelek za psihologijo - Univerza v ...

Iz zakladnice statističnih testov - Oddelek za psihologijo - Univerza v ...

Iz zakladnice statističnih testov - Oddelek za psihologijo - Univerza v ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Statistično <strong>za</strong>ključevanje, Enosmerna<br />

ANOVA <strong>za</strong> neponovljene meritve<br />

5.12.2011<br />

Testiranje hipotez o povprečju<br />

Testiranje enakosti sredin več<br />

vzorcev<br />

Univer<strong>za</strong> v Ljubljani, Filozofska fakulteta, <strong>Oddelek</strong> <strong>za</strong> <strong>psihologijo</strong><br />

Študij prve stopnje Psihologija<br />

2. semester, predmet Statistično <strong>za</strong>ključevanje<br />

<strong>Iz</strong>r. prof. dr. Anja Podlesek<br />

N.D.<br />

parametrični testi<br />

1 vzorec 2 vzorca<br />

neodvisna<br />

odvisna<br />

Povprečja<br />

(dva ali) več vzorcev<br />

neodvisnih odvisnih<br />

1<br />

t test<br />

(one-sample)<br />

t test<br />

(independent)<br />

t test<br />

(paired-samples)<br />

enosmerna<br />

ANOVA<br />

(GLM - univariate)<br />

enosmerna<br />

ANOVA<br />

(GLM -<br />

repeated-measures) 2<br />

Testiranje hipotez o povprečju<br />

Povprečja<br />

ni N.D.<br />

neparametrični testi<br />

1 vzorec 2 vzorca<br />

binomski<br />

test<br />

neodvisna<br />

- Mann-<br />

Whitneyev<br />

U<br />

- medianski test<br />

odvisna<br />

- Wilcoxonov<br />

T test<br />

(matched pairs)<br />

- test predznakov<br />

neodvisnih<br />

več vzorcev<br />

- Kruskal-<br />

Wallisov H<br />

- razširjeni<br />

medianski test<br />

odvisnih<br />

Friedmanov<br />

test<br />

3<br />

Več vzorcev<br />

ALI VZORCI IZHAJAJO IZ ISTE<br />

POPULACIJE<br />

PRIMERJAVA NJIHOVIH M<br />

4<br />

Anali<strong>za</strong> variance<br />

1 NV z variacijami, merimo OV<br />

• enosmerna ANOVA <strong>za</strong> ponovljene meritve<br />

• enosmerna ANOVA <strong>za</strong> neponovljene meritve<br />

Več NV, 1 OV<br />

• dvosmerna, trismerna ANOVA<br />

• glavni učinki + interakcija med NV<br />

Enosmerna anali<strong>za</strong> variance <strong>za</strong><br />

neponovljene meritve<br />

5<br />

6<br />

1


Statistično <strong>za</strong>ključevanje, Enosmerna<br />

ANOVA <strong>za</strong> neponovljene meritve<br />

5.12.2011<br />

Anali<strong>za</strong> variance<br />

Anali<strong>za</strong> variance<br />

• H 0 : m 1 = m 2 = m 3<br />

variabilnost med skupinami<br />

F =<br />

variabilnost znotraj skupin<br />

Y M<br />

ij<br />

tot<br />

<br />

= Y M<br />

ij<br />

M tot M j Y i<br />

j<br />

M M<br />

2<br />

2<br />

2<br />

Y<br />

ij<br />

Mtot<br />

= Y<br />

ij<br />

M<br />

j<br />

M<br />

j<br />

Mtot<br />

<br />

j<br />

tot<br />

7<br />

skupna<br />

variabilnost<br />

SSzn<br />

MSzn<br />

=<br />

df<br />

zn<br />

variabilnost<br />

znotraj skupin<br />

SSzn<br />

=<br />

MS<br />

n<br />

<br />

n<br />

1 n<br />

1<br />

1<br />

1<br />

2<br />

3<br />

<br />

variabilnost<br />

med skupinami<br />

med<br />

SS<br />

=<br />

df<br />

med<br />

med<br />

SSmed<br />

=<br />

a 1<br />

MS<br />

F =<br />

MS<br />

med<br />

zn<br />

8<br />

M 1 = 4 M 2 = 10<br />

M T = 7<br />

2 3 4 5 6 7 8 9 10 11 12<br />

X i - M tot<br />

M i - M tot<br />

X i - M i<br />

Primer analize<br />

variance <strong>za</strong><br />

dva vzorca<br />

2 3 4 5 6 7 8 9 10 11 12<br />

M tot = 7; M 1 = 4; M 2 = 10<br />

SS znotraj-1 = 1(2-4) 2 + 2(3-4) 2 + 3(4-4) 2 + 2(5-4) 2 + 1(6-4) 2 =12<br />

SS znotraj-2 = 1(8-10) 2 + 2(9-10) 2 + 3(10-10) 2 + 2(11-10) 2 + 1(12-10) 2 =12<br />

SS med = 9(4-7) 2 + 9(10-7) 2 = 81 + 81 = 162<br />

df znotraj = N - a = 18 - 2 = 16<br />

df med = a - 1 = 2 - 1 = 1<br />

Primer analize<br />

variance <strong>za</strong><br />

dva vzorca<br />

Razstavljanje odklona posameznega rezultata:<br />

X i - M tot = (X i - M i ) + (M i - M tot )<br />

9<br />

MS znotraj = SS znotraj / df znotraj = 24 / 16 = 1,5<br />

MS med = SS med / df med = 162 / 1 = 162<br />

F = 162 /1,5 = 108<br />

F t (1, 16) = 4,49<br />

10<br />

Tabela povzetka analize variance<br />

izvor<br />

variabilnosti SS df MS F p<br />

NV 162 1 162,0 108,0 < ,001<br />

napaka 24 16 1,5<br />

skupaj 186 17<br />

Primer analize<br />

variance <strong>za</strong><br />

dva vzorca<br />

Skupina 1 (M = 4,0, SD = 1,2) je dosegla statistično pomembno drugačne<br />

rezultate od skupine 2 (M = 10,0, SD = 1,2), F (1, 16) = 108,0, p < ,001, MSE = 1,5.<br />

t-test: t(16)<br />

11<br />

2 δ<br />

ω A = =<br />

σ<br />

ωˆ<br />

2<br />

A<br />

2<br />

med<br />

2<br />

Y<br />

a<br />

<br />

j=<br />

1<br />

μ μ<br />

j<br />

a<br />

σ<br />

2<br />

Y<br />

Velikost učinka<br />

Ocena deleža pojasnjene variance oz. variance učinka<br />

= kolikšen delež variance Y pojasnjuje NV<br />

= Haysova w 2 ali koeficient determinacije<br />

tot<br />

2<br />

<br />

a 1<br />

MSmed<br />

MSzn<br />

<br />

<br />

2 a n<br />

ωˆ<br />

A = <br />

a 1<br />

MSmed<br />

MSzn<br />

<br />

MSzn<br />

a n <br />

=<br />

a<br />

1F<br />

1<br />

MSmed<br />

, pri čemer F =<br />

a<br />

1F<br />

1 na<br />

MSzn<br />

ω 2 :<br />

0,01 – majhen učinek<br />

0,06 – srednji učinek<br />

0,15 – velik učinek<br />

12<br />

2


Statistično <strong>za</strong>ključevanje, Enosmerna<br />

ANOVA <strong>za</strong> neponovljene meritve<br />

5.12.2011<br />

M T = 7<br />

M 1 = 4<br />

M 2 = 10<br />

n = 9<br />

a = 2<br />

2 3 4 5 6 7 8 9 10 11 12<br />

df znotraj = N - a = 18 - 2 = 16<br />

df med = a - 1 = 2 - 1 = 1<br />

MS znotraj = 1.5<br />

MS med = 162<br />

F = 162 / 1.5 = 108<br />

F .05 (1, 16) = 4,49<br />

δˆ<br />

<br />

<br />

a<br />

2<br />

μ<br />

j<br />

μ<br />

tot<br />

2 j=<br />

1<br />

A<br />

=<br />

=<br />

a<br />

2<br />

2 δA<br />

9<br />

ω A = = = 0,87<br />

2<br />

2<br />

σ 3,21<br />

Y<br />

2<br />

2<br />

(4 7) (10 7) 18<br />

=<br />

=<br />

2 2<br />

a 1<br />

MSmed<br />

MSzn<br />

1 162<br />

1,5<br />

<br />

<br />

<br />

2<br />

2 9<br />

ωˆ a <br />

n<br />

A =<br />

<br />

=<br />

<br />

= 0,86<br />

a 1<br />

MSmed<br />

MSzn<br />

1 162<br />

1,5<br />

<br />

<br />

MSzn<br />

1,5<br />

a <br />

n 2 9 <br />

2 a<br />

1F<br />

1<br />

1107<br />

ωˆ<br />

A =<br />

=<br />

= 0,86<br />

a<br />

1F<br />

1<br />

na 1107<br />

9 2<br />

9<br />

13<br />

Predpostavke analize variance<br />

• nominalna NV<br />

• OV intervalna<br />

• neodvisnost podatkov<br />

• normalna porazdelitev<br />

spremenljivke v populaciji<br />

– F-test je precej robusten, razen<br />

v primerih ekstremne As ali Spl<br />

• enakost varianc vzorcev<br />

– Levenov test<br />

– Pregled grafov<br />

• Spread vs. Level Plot<br />

• Box-Plot<br />

14<br />

Rešitve v primeru kršenja predpostavk<br />

Primerjave (kontrasti) posameznih<br />

sredin<br />

• v popravkih stopenj svobode<br />

– Welchov test<br />

• boljši pri visokem razmerju varianc različnih skupin, pri n j vsaj 10 in<br />

N.D.<br />

– Brown-Forsythov F test enakosti sredin<br />

• primernejši ob asimetrični porazdelitvi<br />

• Z WLS (weighted least squares) utežmi – osebe različno<br />

obtežimo, da bi zmanjšali heteroscedastičnost<br />

• v transformaciji podatkov<br />

– Asimetrične porazdelitve približamo normalnim.<br />

– Zmanjšamo heterogenost varianc.<br />

– Transformacije: arc sin (sqrt(Y ij )), log, potence …<br />

– Težave pri interpretaciji rezultatov.<br />

15<br />

• ANOVA je omnibus test<br />

• Posamezne razlike opazujemo s posebnimi testi.<br />

• Več <strong>testov</strong> večja verjetnost a napake.<br />

• Zaradi multiplih primerjav moramo imeti pri<br />

testiranju strožji kriterij.<br />

16<br />

Kontrola a napake<br />

• Raven a napake pri posameznem kontrastu (EC)<br />

• Skupna raven a napake pri družini kontrastov<br />

(FWER – familywise error rate)<br />

– Npr., če je EC <strong>za</strong> vsakega od 6 neodvisnih <strong>testov</strong> 0,05, je<br />

FWER 0,265. Če so testi odvisni, je FWER manjša.<br />

– Več kot je <strong>testov</strong>, večja je FWER.<br />

Pri posameznem testu : p ni α napake = 1<br />

EC<br />

Pri skupini <strong>testov</strong> : FWER<br />

= 1<br />

= 1<br />

p<br />

1<br />

ni<br />

EC<br />

K<br />

<br />

α napake pri nobenem v druzini<br />

<br />

<br />

= p α napaka vsaj pri enem kontrastu =<br />

<br />

kontrastov =<br />

<br />

17<br />

Kontrasti v enofaktorskem načrtu <strong>za</strong><br />

neponovljene meritve<br />

• Kontrasti: (parne)<br />

primerjave in druge<br />

linearne kombinacije<br />

povprečij<br />

• Ortogonalni in<br />

neortogonalni kontrasti<br />

– Kontrasta sta ortogonalna<br />

(= aditivna), če njune uteži<br />

niso korelirane<br />

– Npr. in<br />

<br />

<br />

j<br />

wjpwjq<br />

n j<br />

1 (1) <br />

2 <br />

=<br />

0<br />

1 ( 1)<br />

<br />

2 <br />

<br />

(0) <br />

<br />

1<br />

2<br />

<br />

<br />

<br />

<br />

(0) <br />

<br />

1<br />

2<br />

<br />

<br />

<br />

=<br />

0<br />

H<br />

1 μ<br />

1μ<br />

0μ<br />

0μ<br />

01:<br />

SK1<br />

SK2<br />

SK3<br />

H<br />

: μSK1<br />

μSK2<br />

μSK3<br />

μSK4<br />

<br />

3<br />

= 0<br />

02<br />

H<br />

μSK1<br />

μSK2<br />

μSK3<br />

μSK4<br />

: 2 2<br />

= 0<br />

03<br />

ψ =<br />

j<br />

a<br />

<br />

j=<br />

1<br />

w μ<br />

j<br />

w = 0<br />

j<br />

j<br />

H 1 : Linearna kombinacija ni enaka 0.<br />

SK4<br />

= 0<br />

Statistika t: primerjava linearne kombinacije<br />

z 0<br />

• števec: obtežena povprečja<br />

• imenovalec: obtežena standardna napaka 18<br />

3


Statistično <strong>za</strong>ključevanje, Enosmerna<br />

ANOVA <strong>za</strong> neponovljene meritve<br />

5.12.2011<br />

S t statistiko<br />

ψˆ<br />

t =<br />

σˆ<br />

ψˆ<br />

H : t =<br />

01<br />

H : t =<br />

02<br />

=<br />

<br />

MS<br />

zn<br />

Testiranje kontrastov<br />

w μ<br />

j j<br />

<br />

w<br />

n<br />

2<br />

j<br />

j<br />

<br />

<br />

SK1 SK2 SK3 SK4<br />

Mj 8,80 4,20 3,40 2,50<br />

Vir variabilnosti SS df MS F<br />

A 377,4 3,0 125,8 8,39<br />

S/A 900,0 60,0 15,0<br />

M<br />

SK1<br />

M<br />

SK2<br />

8,80 4,20<br />

=<br />

= 3,36<br />

2 2<br />

2 2<br />

1 1<br />

1 1<br />

<br />

MS 15,0<br />

<br />

zn<br />

<br />

16 16<br />

<br />

16 16<br />

<br />

M<br />

SK2<br />

M<br />

SK3<br />

M<br />

SK4<br />

4,20 3,40 2,50<br />

M<br />

SK1<br />

<br />

8,80 <br />

3<br />

=<br />

3<br />

= 4,86<br />

2<br />

2<br />

2<br />

2<br />

2<br />

2<br />

1 1 1 1 1 1 <br />

<br />

2 <br />

2 <br />

1 3 3 3 1 3 3 3<br />

MSzn<br />

15,0<br />

<br />

<br />

<br />

16 16 16 16 <br />

<br />

16 16 16 16 <br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

19<br />

Načrtovani (a priori) kontrasti<br />

• Načrtujemo jih, preden imamo vpogled v podatke.<br />

Število testiranih kontrastov temelji na teoriji.<br />

• V SPSS: deviation, simple, difference, helmert, repeated, polynomial<br />

• Če računamo le en kontrast, je verjetnost a napake (EC)<br />

ustrezna in lahko uporabimo t-test.<br />

• Pri več kontrastih moramo poskrbeti, da FWER ni<br />

prevelika: FWER ≤ 1-(1-EC) K ≤ 1-(1-K(EC))<br />

• Bonferronijeva neenakost: FWER ≤ vsota vseh EC<br />

• Testi:<br />

– Bonferroni,<br />

– Sidak,<br />

– Dunnet<br />

20<br />

Post hoc kontrasti<br />

• <strong>Iz</strong>vedemo jih šele, ko že izvemo <strong>za</strong> rezultate ANOVE. Če<br />

je F stat. pomemben, izvedemo različne post hoc teste.<br />

eksploratoren pristop<br />

• Dejanska verjetnost a napake je <strong>za</strong>to večja od<br />

predvidene. Kriterij testiranja mora biti strog.<br />

• Za vsako primerjavo izračunamo t, a potem dobljeno<br />

vrednost primerjamo s strožjim kriterijem kot pri<br />

običajnem t-testu ali a priori kontrastih.<br />

• (Fisherjev LSD), Tukeyev (HSD) postopek, Schefféjev<br />

test, sekvenčni testi (kriterij je pove<strong>za</strong>n z mestom<br />

razlike v vrsti), npr. R-E-G-W Q, itd.<br />

21<br />

Neparametrični testi<br />

Primerjava median več neodvisnih vzorcev:<br />

Kruskal-Wallisov H test<br />

• zvezna spremenljivka, ordinalna<br />

• Ali je porazdelitev (Mdn) v vseh vzorcih enaka<br />

• Vse podatke rangiramo. <strong>Iz</strong>računamo vsote rangov v vsakem<br />

vzorcu in statistiko H. Primerjamo jo s c 2 p(df = a-1).<br />

Razširjeni medianski test<br />

Poiščemo skupno mediano vseh podatkov.<br />

Preštejemo, koliko podatkov posameznega<br />

vzorca pade pod / nad skupno mediano - c 2<br />

test (2 × a tabela).<br />

22<br />

Kruskal - Wallisov test:<br />

glasba tišina hrup<br />

6 5 3<br />

4 7 2<br />

4 8 1<br />

rangirano:<br />

7 6 3<br />

4,5 8 2<br />

4,5 9 1<br />

16 23 6 R j<br />

256 529 36 R<br />

2 j<br />

12 R<br />

H = N N <br />

<br />

1 n<br />

2<br />

j<br />

j<br />

točke rang o<strong>za</strong>dje<br />

1 1 hrup<br />

2 2 hrup<br />

3 3 hrup<br />

4 4,5 glasba<br />

4 4,5 glasba<br />

5 6 tišina<br />

6 7 glasba<br />

7 8 tišina<br />

8 9 tišina<br />

3<br />

N 1<br />

Pri majhnih<br />

vzorcih - tablice.<br />

Pri velikih<br />

vzorcih<br />

= (12/(9·10)) · (256/3+529/3+36/3) - 3(9+1) = 6,49 c 2 ,05(2) = 5,991<br />

23<br />

4

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!