Iz zakladnice statistiÄnih testov - Oddelek za psihologijo - Univerza v ...
Iz zakladnice statistiÄnih testov - Oddelek za psihologijo - Univerza v ...
Iz zakladnice statistiÄnih testov - Oddelek za psihologijo - Univerza v ...
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
Statistično <strong>za</strong>ključevanje, Enosmerna<br />
ANOVA <strong>za</strong> neponovljene meritve<br />
5.12.2011<br />
Testiranje hipotez o povprečju<br />
Testiranje enakosti sredin več<br />
vzorcev<br />
Univer<strong>za</strong> v Ljubljani, Filozofska fakulteta, <strong>Oddelek</strong> <strong>za</strong> <strong>psihologijo</strong><br />
Študij prve stopnje Psihologija<br />
2. semester, predmet Statistično <strong>za</strong>ključevanje<br />
<strong>Iz</strong>r. prof. dr. Anja Podlesek<br />
N.D.<br />
parametrični testi<br />
1 vzorec 2 vzorca<br />
neodvisna<br />
odvisna<br />
Povprečja<br />
(dva ali) več vzorcev<br />
neodvisnih odvisnih<br />
1<br />
t test<br />
(one-sample)<br />
t test<br />
(independent)<br />
t test<br />
(paired-samples)<br />
enosmerna<br />
ANOVA<br />
(GLM - univariate)<br />
enosmerna<br />
ANOVA<br />
(GLM -<br />
repeated-measures) 2<br />
Testiranje hipotez o povprečju<br />
Povprečja<br />
ni N.D.<br />
neparametrični testi<br />
1 vzorec 2 vzorca<br />
binomski<br />
test<br />
neodvisna<br />
- Mann-<br />
Whitneyev<br />
U<br />
- medianski test<br />
odvisna<br />
- Wilcoxonov<br />
T test<br />
(matched pairs)<br />
- test predznakov<br />
neodvisnih<br />
več vzorcev<br />
- Kruskal-<br />
Wallisov H<br />
- razširjeni<br />
medianski test<br />
odvisnih<br />
Friedmanov<br />
test<br />
3<br />
Več vzorcev<br />
ALI VZORCI IZHAJAJO IZ ISTE<br />
POPULACIJE<br />
PRIMERJAVA NJIHOVIH M<br />
4<br />
Anali<strong>za</strong> variance<br />
1 NV z variacijami, merimo OV<br />
• enosmerna ANOVA <strong>za</strong> ponovljene meritve<br />
• enosmerna ANOVA <strong>za</strong> neponovljene meritve<br />
Več NV, 1 OV<br />
• dvosmerna, trismerna ANOVA<br />
• glavni učinki + interakcija med NV<br />
Enosmerna anali<strong>za</strong> variance <strong>za</strong><br />
neponovljene meritve<br />
5<br />
6<br />
1
Statistično <strong>za</strong>ključevanje, Enosmerna<br />
ANOVA <strong>za</strong> neponovljene meritve<br />
5.12.2011<br />
Anali<strong>za</strong> variance<br />
Anali<strong>za</strong> variance<br />
• H 0 : m 1 = m 2 = m 3<br />
variabilnost med skupinami<br />
F =<br />
variabilnost znotraj skupin<br />
Y M<br />
ij<br />
tot<br />
<br />
= Y M<br />
ij<br />
M tot M j Y i<br />
j<br />
M M<br />
2<br />
2<br />
2<br />
Y<br />
ij<br />
Mtot<br />
= Y<br />
ij<br />
M<br />
j<br />
M<br />
j<br />
Mtot<br />
<br />
j<br />
tot<br />
7<br />
skupna<br />
variabilnost<br />
SSzn<br />
MSzn<br />
=<br />
df<br />
zn<br />
variabilnost<br />
znotraj skupin<br />
SSzn<br />
=<br />
MS<br />
n<br />
<br />
n<br />
1 n<br />
1<br />
1<br />
1<br />
2<br />
3<br />
<br />
variabilnost<br />
med skupinami<br />
med<br />
SS<br />
=<br />
df<br />
med<br />
med<br />
SSmed<br />
=<br />
a 1<br />
MS<br />
F =<br />
MS<br />
med<br />
zn<br />
8<br />
M 1 = 4 M 2 = 10<br />
M T = 7<br />
2 3 4 5 6 7 8 9 10 11 12<br />
X i - M tot<br />
M i - M tot<br />
X i - M i<br />
Primer analize<br />
variance <strong>za</strong><br />
dva vzorca<br />
2 3 4 5 6 7 8 9 10 11 12<br />
M tot = 7; M 1 = 4; M 2 = 10<br />
SS znotraj-1 = 1(2-4) 2 + 2(3-4) 2 + 3(4-4) 2 + 2(5-4) 2 + 1(6-4) 2 =12<br />
SS znotraj-2 = 1(8-10) 2 + 2(9-10) 2 + 3(10-10) 2 + 2(11-10) 2 + 1(12-10) 2 =12<br />
SS med = 9(4-7) 2 + 9(10-7) 2 = 81 + 81 = 162<br />
df znotraj = N - a = 18 - 2 = 16<br />
df med = a - 1 = 2 - 1 = 1<br />
Primer analize<br />
variance <strong>za</strong><br />
dva vzorca<br />
Razstavljanje odklona posameznega rezultata:<br />
X i - M tot = (X i - M i ) + (M i - M tot )<br />
9<br />
MS znotraj = SS znotraj / df znotraj = 24 / 16 = 1,5<br />
MS med = SS med / df med = 162 / 1 = 162<br />
F = 162 /1,5 = 108<br />
F t (1, 16) = 4,49<br />
10<br />
Tabela povzetka analize variance<br />
izvor<br />
variabilnosti SS df MS F p<br />
NV 162 1 162,0 108,0 < ,001<br />
napaka 24 16 1,5<br />
skupaj 186 17<br />
Primer analize<br />
variance <strong>za</strong><br />
dva vzorca<br />
Skupina 1 (M = 4,0, SD = 1,2) je dosegla statistično pomembno drugačne<br />
rezultate od skupine 2 (M = 10,0, SD = 1,2), F (1, 16) = 108,0, p < ,001, MSE = 1,5.<br />
t-test: t(16)<br />
11<br />
2 δ<br />
ω A = =<br />
σ<br />
ωˆ<br />
2<br />
A<br />
2<br />
med<br />
2<br />
Y<br />
a<br />
<br />
j=<br />
1<br />
μ μ<br />
j<br />
a<br />
σ<br />
2<br />
Y<br />
Velikost učinka<br />
Ocena deleža pojasnjene variance oz. variance učinka<br />
= kolikšen delež variance Y pojasnjuje NV<br />
= Haysova w 2 ali koeficient determinacije<br />
tot<br />
2<br />
<br />
a 1<br />
MSmed<br />
MSzn<br />
<br />
<br />
2 a n<br />
ωˆ<br />
A = <br />
a 1<br />
MSmed<br />
MSzn<br />
<br />
MSzn<br />
a n <br />
=<br />
a<br />
1F<br />
1<br />
MSmed<br />
, pri čemer F =<br />
a<br />
1F<br />
1 na<br />
MSzn<br />
ω 2 :<br />
0,01 – majhen učinek<br />
0,06 – srednji učinek<br />
0,15 – velik učinek<br />
12<br />
2
Statistično <strong>za</strong>ključevanje, Enosmerna<br />
ANOVA <strong>za</strong> neponovljene meritve<br />
5.12.2011<br />
M T = 7<br />
M 1 = 4<br />
M 2 = 10<br />
n = 9<br />
a = 2<br />
2 3 4 5 6 7 8 9 10 11 12<br />
df znotraj = N - a = 18 - 2 = 16<br />
df med = a - 1 = 2 - 1 = 1<br />
MS znotraj = 1.5<br />
MS med = 162<br />
F = 162 / 1.5 = 108<br />
F .05 (1, 16) = 4,49<br />
δˆ<br />
<br />
<br />
a<br />
2<br />
μ<br />
j<br />
μ<br />
tot<br />
2 j=<br />
1<br />
A<br />
=<br />
=<br />
a<br />
2<br />
2 δA<br />
9<br />
ω A = = = 0,87<br />
2<br />
2<br />
σ 3,21<br />
Y<br />
2<br />
2<br />
(4 7) (10 7) 18<br />
=<br />
=<br />
2 2<br />
a 1<br />
MSmed<br />
MSzn<br />
1 162<br />
1,5<br />
<br />
<br />
<br />
2<br />
2 9<br />
ωˆ a <br />
n<br />
A =<br />
<br />
=<br />
<br />
= 0,86<br />
a 1<br />
MSmed<br />
MSzn<br />
1 162<br />
1,5<br />
<br />
<br />
MSzn<br />
1,5<br />
a <br />
n 2 9 <br />
2 a<br />
1F<br />
1<br />
1107<br />
ωˆ<br />
A =<br />
=<br />
= 0,86<br />
a<br />
1F<br />
1<br />
na 1107<br />
9 2<br />
9<br />
13<br />
Predpostavke analize variance<br />
• nominalna NV<br />
• OV intervalna<br />
• neodvisnost podatkov<br />
• normalna porazdelitev<br />
spremenljivke v populaciji<br />
– F-test je precej robusten, razen<br />
v primerih ekstremne As ali Spl<br />
• enakost varianc vzorcev<br />
– Levenov test<br />
– Pregled grafov<br />
• Spread vs. Level Plot<br />
• Box-Plot<br />
14<br />
Rešitve v primeru kršenja predpostavk<br />
Primerjave (kontrasti) posameznih<br />
sredin<br />
• v popravkih stopenj svobode<br />
– Welchov test<br />
• boljši pri visokem razmerju varianc različnih skupin, pri n j vsaj 10 in<br />
N.D.<br />
– Brown-Forsythov F test enakosti sredin<br />
• primernejši ob asimetrični porazdelitvi<br />
• Z WLS (weighted least squares) utežmi – osebe različno<br />
obtežimo, da bi zmanjšali heteroscedastičnost<br />
• v transformaciji podatkov<br />
– Asimetrične porazdelitve približamo normalnim.<br />
– Zmanjšamo heterogenost varianc.<br />
– Transformacije: arc sin (sqrt(Y ij )), log, potence …<br />
– Težave pri interpretaciji rezultatov.<br />
15<br />
• ANOVA je omnibus test<br />
• Posamezne razlike opazujemo s posebnimi testi.<br />
• Več <strong>testov</strong> večja verjetnost a napake.<br />
• Zaradi multiplih primerjav moramo imeti pri<br />
testiranju strožji kriterij.<br />
16<br />
Kontrola a napake<br />
• Raven a napake pri posameznem kontrastu (EC)<br />
• Skupna raven a napake pri družini kontrastov<br />
(FWER – familywise error rate)<br />
– Npr., če je EC <strong>za</strong> vsakega od 6 neodvisnih <strong>testov</strong> 0,05, je<br />
FWER 0,265. Če so testi odvisni, je FWER manjša.<br />
– Več kot je <strong>testov</strong>, večja je FWER.<br />
Pri posameznem testu : p ni α napake = 1<br />
EC<br />
Pri skupini <strong>testov</strong> : FWER<br />
= 1<br />
= 1<br />
p<br />
1<br />
ni<br />
EC<br />
K<br />
<br />
α napake pri nobenem v druzini<br />
<br />
<br />
= p α napaka vsaj pri enem kontrastu =<br />
<br />
kontrastov =<br />
<br />
17<br />
Kontrasti v enofaktorskem načrtu <strong>za</strong><br />
neponovljene meritve<br />
• Kontrasti: (parne)<br />
primerjave in druge<br />
linearne kombinacije<br />
povprečij<br />
• Ortogonalni in<br />
neortogonalni kontrasti<br />
– Kontrasta sta ortogonalna<br />
(= aditivna), če njune uteži<br />
niso korelirane<br />
– Npr. in<br />
<br />
<br />
j<br />
wjpwjq<br />
n j<br />
1 (1) <br />
2 <br />
=<br />
0<br />
1 ( 1)<br />
<br />
2 <br />
<br />
(0) <br />
<br />
1<br />
2<br />
<br />
<br />
<br />
<br />
(0) <br />
<br />
1<br />
2<br />
<br />
<br />
<br />
=<br />
0<br />
H<br />
1 μ<br />
1μ<br />
0μ<br />
0μ<br />
01:<br />
SK1<br />
SK2<br />
SK3<br />
H<br />
: μSK1<br />
μSK2<br />
μSK3<br />
μSK4<br />
<br />
3<br />
= 0<br />
02<br />
H<br />
μSK1<br />
μSK2<br />
μSK3<br />
μSK4<br />
: 2 2<br />
= 0<br />
03<br />
ψ =<br />
j<br />
a<br />
<br />
j=<br />
1<br />
w μ<br />
j<br />
w = 0<br />
j<br />
j<br />
H 1 : Linearna kombinacija ni enaka 0.<br />
SK4<br />
= 0<br />
Statistika t: primerjava linearne kombinacije<br />
z 0<br />
• števec: obtežena povprečja<br />
• imenovalec: obtežena standardna napaka 18<br />
3
Statistično <strong>za</strong>ključevanje, Enosmerna<br />
ANOVA <strong>za</strong> neponovljene meritve<br />
5.12.2011<br />
S t statistiko<br />
ψˆ<br />
t =<br />
σˆ<br />
ψˆ<br />
H : t =<br />
01<br />
H : t =<br />
02<br />
=<br />
<br />
MS<br />
zn<br />
Testiranje kontrastov<br />
w μ<br />
j j<br />
<br />
w<br />
n<br />
2<br />
j<br />
j<br />
<br />
<br />
SK1 SK2 SK3 SK4<br />
Mj 8,80 4,20 3,40 2,50<br />
Vir variabilnosti SS df MS F<br />
A 377,4 3,0 125,8 8,39<br />
S/A 900,0 60,0 15,0<br />
M<br />
SK1<br />
M<br />
SK2<br />
8,80 4,20<br />
=<br />
= 3,36<br />
2 2<br />
2 2<br />
1 1<br />
1 1<br />
<br />
MS 15,0<br />
<br />
zn<br />
<br />
16 16<br />
<br />
16 16<br />
<br />
M<br />
SK2<br />
M<br />
SK3<br />
M<br />
SK4<br />
4,20 3,40 2,50<br />
M<br />
SK1<br />
<br />
8,80 <br />
3<br />
=<br />
3<br />
= 4,86<br />
2<br />
2<br />
2<br />
2<br />
2<br />
2<br />
1 1 1 1 1 1 <br />
<br />
2 <br />
2 <br />
1 3 3 3 1 3 3 3<br />
MSzn<br />
15,0<br />
<br />
<br />
<br />
16 16 16 16 <br />
<br />
16 16 16 16 <br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
19<br />
Načrtovani (a priori) kontrasti<br />
• Načrtujemo jih, preden imamo vpogled v podatke.<br />
Število testiranih kontrastov temelji na teoriji.<br />
• V SPSS: deviation, simple, difference, helmert, repeated, polynomial<br />
• Če računamo le en kontrast, je verjetnost a napake (EC)<br />
ustrezna in lahko uporabimo t-test.<br />
• Pri več kontrastih moramo poskrbeti, da FWER ni<br />
prevelika: FWER ≤ 1-(1-EC) K ≤ 1-(1-K(EC))<br />
• Bonferronijeva neenakost: FWER ≤ vsota vseh EC<br />
• Testi:<br />
– Bonferroni,<br />
– Sidak,<br />
– Dunnet<br />
20<br />
Post hoc kontrasti<br />
• <strong>Iz</strong>vedemo jih šele, ko že izvemo <strong>za</strong> rezultate ANOVE. Če<br />
je F stat. pomemben, izvedemo različne post hoc teste.<br />
eksploratoren pristop<br />
• Dejanska verjetnost a napake je <strong>za</strong>to večja od<br />
predvidene. Kriterij testiranja mora biti strog.<br />
• Za vsako primerjavo izračunamo t, a potem dobljeno<br />
vrednost primerjamo s strožjim kriterijem kot pri<br />
običajnem t-testu ali a priori kontrastih.<br />
• (Fisherjev LSD), Tukeyev (HSD) postopek, Schefféjev<br />
test, sekvenčni testi (kriterij je pove<strong>za</strong>n z mestom<br />
razlike v vrsti), npr. R-E-G-W Q, itd.<br />
21<br />
Neparametrični testi<br />
Primerjava median več neodvisnih vzorcev:<br />
Kruskal-Wallisov H test<br />
• zvezna spremenljivka, ordinalna<br />
• Ali je porazdelitev (Mdn) v vseh vzorcih enaka<br />
• Vse podatke rangiramo. <strong>Iz</strong>računamo vsote rangov v vsakem<br />
vzorcu in statistiko H. Primerjamo jo s c 2 p(df = a-1).<br />
Razširjeni medianski test<br />
Poiščemo skupno mediano vseh podatkov.<br />
Preštejemo, koliko podatkov posameznega<br />
vzorca pade pod / nad skupno mediano - c 2<br />
test (2 × a tabela).<br />
22<br />
Kruskal - Wallisov test:<br />
glasba tišina hrup<br />
6 5 3<br />
4 7 2<br />
4 8 1<br />
rangirano:<br />
7 6 3<br />
4,5 8 2<br />
4,5 9 1<br />
16 23 6 R j<br />
256 529 36 R<br />
2 j<br />
12 R<br />
H = N N <br />
<br />
1 n<br />
2<br />
j<br />
j<br />
točke rang o<strong>za</strong>dje<br />
1 1 hrup<br />
2 2 hrup<br />
3 3 hrup<br />
4 4,5 glasba<br />
4 4,5 glasba<br />
5 6 tišina<br />
6 7 glasba<br />
7 8 tišina<br />
8 9 tišina<br />
3<br />
N 1<br />
Pri majhnih<br />
vzorcih - tablice.<br />
Pri velikih<br />
vzorcih<br />
= (12/(9·10)) · (256/3+529/3+36/3) - 3(9+1) = 6,49 c 2 ,05(2) = 5,991<br />
23<br />
4