23.10.2014 Views

Over misverstanden rond Cronbachs alfa en de wenselijkheid van ...

Over misverstanden rond Cronbachs alfa en de wenselijkheid van ...

Over misverstanden rond Cronbachs alfa en de wenselijkheid van ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

ar<br />

<strong>Over</strong> <strong>misverstand<strong>en</strong></strong> <strong>rond</strong><br />

<strong>Cronbachs</strong> <strong>alfa</strong> <strong>en</strong> <strong>de</strong><br />

w<strong>en</strong>selijkheid <strong>van</strong> alternatiev<strong>en</strong><br />

<strong>Cronbachs</strong> <strong>alfa</strong> wordt gebruikt als maat voor <strong>de</strong><br />

interne consist<strong>en</strong>tie <strong>van</strong> <strong>de</strong> items in e<strong>en</strong> test, <strong>en</strong><br />

is tev<strong>en</strong>s <strong>de</strong> bek<strong>en</strong>dste metho<strong>de</strong> voor <strong>de</strong> schatting<br />

<strong>van</strong> <strong>de</strong> betrouwbaarheid <strong>van</strong> <strong>de</strong> testscore.<br />

In <strong>de</strong> psychometrie is echter bek<strong>en</strong>d dat <strong>alfa</strong><br />

juist ge<strong>en</strong> goe<strong>de</strong> maat is voor <strong>de</strong> interne consist<strong>en</strong>tie,<br />

<strong>en</strong> ev<strong>en</strong>e<strong>en</strong>s dat <strong>alfa</strong> niet alle<strong>en</strong> <strong>de</strong><br />

betrouwbaarheid on<strong>de</strong>rschat, maar dat ook nog<br />

e<strong>en</strong>s sterker doet dan <strong>de</strong> meeste an<strong>de</strong>re method<strong>en</strong>.<br />

In dit artikel wordt het fal<strong>en</strong> <strong>van</strong> <strong>alfa</strong><br />

uite<strong>en</strong>gezet <strong>en</strong> word<strong>en</strong> alternatieve method<strong>en</strong><br />

besprok<strong>en</strong> <strong>en</strong> aangerad<strong>en</strong>.<br />

Klaas Sijtsma<br />

Foto: Herman Wouters<br />

In <strong>de</strong> test- <strong>en</strong> vrag<strong>en</strong>lijstconstructie is ge<strong>en</strong> kwaliteitsmaat<br />

zo populair als <strong>Cronbachs</strong> <strong>alfa</strong>. Alfa wordt op twee<br />

manier<strong>en</strong> gebruikt: als maat <strong>van</strong> <strong>de</strong> interne consist<strong>en</strong>tie<br />

<strong>van</strong> <strong>de</strong> items in <strong>de</strong> test <strong>en</strong> als schatting <strong>van</strong> <strong>de</strong> betrouwbaarheid<br />

<strong>van</strong> <strong>de</strong> testscores. Daar wringt mete<strong>en</strong> al <strong>de</strong><br />

scho<strong>en</strong>, want als <strong>alfa</strong> twee k<strong>en</strong>merk<strong>en</strong> <strong>van</strong> e<strong>en</strong> test kan<br />

beschrijv<strong>en</strong>, dan zoud<strong>en</strong> die k<strong>en</strong>merk<strong>en</strong> moet<strong>en</strong> sam<strong>en</strong>vall<strong>en</strong>.<br />

Dus, interne consist<strong>en</strong>tie zou hetzelf<strong>de</strong> moet<strong>en</strong><br />

zijn als betrouwbaarheid. In dit artikel wordt uitgelegd<br />

dat het om verschill<strong>en</strong><strong>de</strong> zak<strong>en</strong> gaat. Interne consist<strong>en</strong>tie<br />

is <strong>de</strong> mate waarin <strong>de</strong> items in <strong>de</strong> test sam<strong>en</strong>hang<strong>en</strong><br />

als uiting <strong>van</strong> e<strong>en</strong> geme<strong>en</strong>schappelijk psychologisch<br />

proces of gedragsprincipe. Interne consist<strong>en</strong>tie is dus<br />

e<strong>en</strong> aspect <strong>van</strong> <strong>de</strong> constructvaliditeit <strong>van</strong> <strong>de</strong> test. Betrouwbaarheid<br />

is <strong>de</strong> mate waarin testscores on<strong>de</strong>r <strong>de</strong>zelf<strong>de</strong><br />

condities herhaalbaar zijn.<br />

De vraag lijkt dan te zijn wat <strong>Cronbachs</strong> (1951) <strong>alfa</strong><br />

uitdrukt. Betoogd zal word<strong>en</strong> dat <strong>alfa</strong> ge<strong>en</strong> maat is voor<br />

<strong>de</strong> interne consist<strong>en</strong>tie, <strong>en</strong> één <strong>van</strong> <strong>de</strong> slechtst d<strong>en</strong>kbare<br />

mat<strong>en</strong> voor <strong>de</strong> betrouwbaarheid <strong>van</strong> e<strong>en</strong> testscore. Betere<br />

method<strong>en</strong> voor het schatt<strong>en</strong> <strong>van</strong> <strong>de</strong> betrouwbaarheid<br />

bestaan al sinds <strong>de</strong> jar<strong>en</strong> veertig (bijvoorbeeld Guttman,<br />

1945), <strong>en</strong> sommige zijn gewoon beschikbaar in spss, in<br />

<strong>de</strong> procedure waarin ook <strong>alfa</strong> is opg<strong>en</strong>om<strong>en</strong>. An<strong>de</strong>re<br />

zijn wel in softwarepakkett<strong>en</strong> beschikbaar, maar die zijn<br />

doorgaans min<strong>de</strong>r gemakkelijk te bedi<strong>en</strong><strong>en</strong> dan spss of<br />

vereis<strong>en</strong> specialistische k<strong>en</strong>nis waarover niet elke on<strong>de</strong>rzoeker<br />

beschikt.<br />

Doel <strong>van</strong> dit artikel is aandacht te vrag<strong>en</strong> voor <strong>de</strong> betek<strong>en</strong>is<br />

<strong>van</strong> <strong>Cronbachs</strong> <strong>alfa</strong>, <strong>en</strong> vervolg<strong>en</strong>s e<strong>en</strong> advies te<br />

gev<strong>en</strong> over <strong>de</strong> schatting <strong>van</strong> <strong>de</strong> betrouwbaarheid <strong>van</strong> <strong>de</strong><br />

testscore. Ook wordt ingegaan op <strong>de</strong> wijze waarop <strong>de</strong><br />

interne consist<strong>en</strong>tie <strong>van</strong> e<strong>en</strong> test of vrag<strong>en</strong>lijst kan word<strong>en</strong><br />

on<strong>de</strong>rzocht. Testconstructeurs <strong>en</strong> on<strong>de</strong>rzoekers die<br />

met tests <strong>en</strong> vrag<strong>en</strong>lijst<strong>en</strong> werk<strong>en</strong>, wordt aangerad<strong>en</strong><br />

k<strong>en</strong>nis te nem<strong>en</strong> <strong>van</strong> <strong>de</strong> bestaan<strong>de</strong>, goed toegankelijke<br />

<strong>en</strong> bov<strong>en</strong>al, betere method<strong>en</strong> om <strong>de</strong> betrouwbaarheid te<br />

schatt<strong>en</strong>. Om <strong>de</strong> boodschap optimaal voor het voetlicht<br />

te krijg<strong>en</strong>, beperk<strong>en</strong> we technische uitwijding<strong>en</strong> zoveel<br />

mogelijk, overig<strong>en</strong>s zon<strong>de</strong>r ze helemaal te kunn<strong>en</strong> vermijd<strong>en</strong>.<br />

<strong>Cronbachs</strong> <strong>alfa</strong><br />

artikel<strong>en</strong> artikel<strong>en</strong><br />

artikel<strong>en</strong> artikel<strong>en</strong><br />

We nem<strong>en</strong> aan dat e<strong>en</strong> test of vrag<strong>en</strong>lijst bestaat uit J<br />

items, die g<strong>en</strong>ummerd zijn als j = 1,...,J. De score op item<br />

j wordt g<strong>en</strong>oteerd als X j . Itemscores kunn<strong>en</strong> bijvoorbeeld<br />

0 <strong>en</strong> 1 zijn voor respectievelijk foute <strong>en</strong> goe<strong>de</strong> ant-<br />

Wet<strong>en</strong>schap november 2009<br />

De Psycholoog<br />

561


Tabel 1. Voorbeeld <strong>van</strong> e<strong>en</strong> variantie-covariantiematrix voor vier items<br />

items in <strong>de</strong> test met elkaar sam<strong>en</strong>hang<strong>en</strong>, als tek<strong>en</strong> <strong>van</strong><br />

wat zij geme<strong>en</strong>schappelijk met elkaar met<strong>en</strong>’ (Sijtsma,<br />

2009). <strong>Cronbachs</strong> <strong>alfa</strong> wordt vaak opgevat als e<strong>en</strong> maat<br />

voor <strong>de</strong> interne consist<strong>en</strong>tie <strong>van</strong> e<strong>en</strong> test. De vraag is nu<br />

of <strong>de</strong>ze interpretatie wel correct is. Wat zijn <strong>de</strong> condities<br />

waa<strong>rond</strong>er <strong>de</strong>ze vraag beslecht kan word<strong>en</strong>?<br />

Om te beginn<strong>en</strong> di<strong>en</strong>t onafhankelijk <strong>van</strong> <strong>Cronbachs</strong><br />

<strong>alfa</strong> te word<strong>en</strong> vastgesteld wanneer e<strong>en</strong> test wel of niet<br />

intern consist<strong>en</strong>t is. Is dat gebeurd, dan zou m<strong>en</strong> eerst<br />

bij to<strong>en</strong>em<strong>en</strong><strong>de</strong> grad<strong>en</strong> <strong>van</strong> interne consist<strong>en</strong>tie <strong>alfa</strong><br />

kunn<strong>en</strong> berek<strong>en</strong><strong>en</strong>, <strong>en</strong> zou e<strong>en</strong> to<strong>en</strong>em<strong>en</strong><strong>de</strong> waar<strong>de</strong> gevond<strong>en</strong><br />

moet<strong>en</strong> word<strong>en</strong>. Daarna zou m<strong>en</strong> voor verschilwoord<strong>en</strong><br />

op <strong>de</strong> items uit e<strong>en</strong> intellig<strong>en</strong>tietest, maar ze<br />

kunn<strong>en</strong> ook gelijk zijn aan bijvoorbeeld <strong>de</strong> scores 1, 2, 3,<br />

4, 5, die aangev<strong>en</strong> hoe e<strong>en</strong> respond<strong>en</strong>t heeft geantwoord<br />

op e<strong>en</strong> rating scale uit e<strong>en</strong> persoonlijkheidsvrag<strong>en</strong>lijst.<br />

Meestal wordt <strong>de</strong> som <strong>van</strong> <strong>de</strong> itemscores, ook wel testscore<br />

of totaalscore g<strong>en</strong>oemd, gebruikt om testprestaties<br />

uit te drukk<strong>en</strong>:<br />

j<br />

X +<br />

= Σ X j .<br />

j = 1<br />

1 2 3 4<br />

1 .25 .12 .16 .10<br />

2 .12 .24 .08 .09<br />

3 .16 .08 .25 .12<br />

4 .10 .09 .12 .21<br />

De kwaliteit <strong>van</strong> <strong>de</strong> testscore (we lat<strong>en</strong> nog ev<strong>en</strong> op<strong>en</strong><br />

wat met ‘kwaliteit’ wordt bedoeld) wordt vrijwel standaard<br />

in <strong>Cronbachs</strong> <strong>alfa</strong> uitgedrukt. Om <strong>alfa</strong> te schatt<strong>en</strong>,<br />

zijn <strong>de</strong> covarianties of correlaties tuss<strong>en</strong> <strong>de</strong> itemscores<br />

on<strong>de</strong>rling nodig, <strong>en</strong> <strong>de</strong> variantie <strong>van</strong> <strong>de</strong> testscore X + . De<br />

covariantie voor twee items, j <strong>en</strong> k, noter<strong>en</strong> we als s jk , <strong>en</strong><br />

hun product-mom<strong>en</strong>tcorrelatie als r jk . De variantie <strong>van</strong><br />

<strong>de</strong> itemscores op item j gev<strong>en</strong> we aan als s 2<br />

j , <strong>en</strong> <strong>de</strong> variantie<br />

<strong>van</strong> X + als S 2 . Voor <strong>de</strong> boodschap <strong>van</strong> dit artikel<br />

x +<br />

is het on<strong>de</strong>rscheid tuss<strong>en</strong> populatie <strong>en</strong> steekproef niet<br />

<strong>van</strong> belang. We lat<strong>en</strong> het dus achterwege.<br />

Voor <strong>de</strong> uitleg <strong>van</strong> <strong>Cronbachs</strong> <strong>alfa</strong> is het handig om<br />

eerst <strong>de</strong> covarianties tuss<strong>en</strong> alle mogelijk par<strong>en</strong> <strong>van</strong><br />

items in e<strong>en</strong> variantie-covariantiematrix bije<strong>en</strong> te zett<strong>en</strong>.<br />

Tabel 1 geeft voor vier items (J = 4) e<strong>en</strong> voorbeeld <strong>van</strong><br />

zo’n matrix. De itemvarianties staan in <strong>de</strong> cell<strong>en</strong> op <strong>de</strong><br />

hoofddiagonaal (<strong>van</strong> linksbov<strong>en</strong> naar rechtson<strong>de</strong>r): dus,<br />

s 2 1 = .25, s2 2<br />

= .24, <strong>en</strong>zovoort. De covarianties staan in <strong>de</strong><br />

an<strong>de</strong>re cell<strong>en</strong>: bijvoorbeeld, S 12<br />

= .12, S 13<br />

= .16. Ver<strong>de</strong>r is <strong>de</strong><br />

matrix symmetrisch in <strong>de</strong> hoofddiagonaal: S 21<br />

= S 12<br />

= .12,<br />

S 31 = S 13<br />

= .16, <strong>en</strong>zovoort. Alle covarianties staan er dus<br />

twee maal in.<br />

<strong>Cronbachs</strong> <strong>alfa</strong> is ge<strong>de</strong>finieerd als<br />

j–1 J<br />

2x Σ Σ S jk<br />

J<br />

j=1 k=j+1<br />

<strong>alfa</strong> = –––– x––––––––––––––<br />

J – 1 S 2 x +<br />

Alfa hangt af <strong>van</strong> drie k<strong>en</strong>merk<strong>en</strong> <strong>van</strong> <strong>de</strong> test: het aantal<br />

items J, <strong>de</strong> variantie <strong>van</strong> <strong>de</strong> testscore S 2 x , <strong>en</strong> <strong>de</strong> covarianties<br />

tuss<strong>en</strong> <strong>de</strong> itemscores S jk . In het voorbeeld, waarin<br />

+<br />

J = 4, is <strong>de</strong> eerste breuk dus gelijk aan 4/3. Het dubbele<br />

somtek<strong>en</strong> in <strong>de</strong> teller <strong>van</strong> <strong>de</strong> twee<strong>de</strong> breuk zorgt ervoor<br />

dat alle covarianties die bov<strong>en</strong> <strong>de</strong> hoofddiagonaal in <strong>de</strong><br />

variantie-covariantiematrix staan bij elkaar word<strong>en</strong> opgeteld;<br />

dit levert 0.67. Daarna volgt verm<strong>en</strong>igvuldiging<br />

met 2, wat resulteert in 1.34. Dit is <strong>de</strong> som <strong>van</strong> alle covarianties<br />

in <strong>de</strong> variantie-covariantiematrix. Tot slot is <strong>de</strong><br />

variantie <strong>van</strong> <strong>de</strong> testscore, S 2 x , gelijk aan <strong>de</strong> som <strong>van</strong> alle<br />

+<br />

itemvarianties <strong>en</strong> alle itemcovarianties in <strong>de</strong> variantiecovariantiematrix<br />

(dus, <strong>de</strong> som <strong>van</strong> alle getall<strong>en</strong> in <strong>de</strong><br />

matrix); dit levert 2.29. We vind<strong>en</strong> voor <strong>alfa</strong><br />

4 1.34<br />

<strong>alfa</strong> = – x –––– ≈ 0.78.<br />

3 2.29<br />

Voor e<strong>en</strong> concrete test heeft <strong>alfa</strong> e<strong>en</strong> waar<strong>de</strong> tuss<strong>en</strong><br />

<strong>de</strong> theoretische extrem<strong>en</strong> a <strong>en</strong> 1. Minimum a is negatief<br />

als <strong>de</strong> gemid<strong>de</strong>l<strong>de</strong> covariantie tuss<strong>en</strong> <strong>de</strong> items negatief<br />

is. Zoiets kan gebeur<strong>en</strong> als verschill<strong>en</strong><strong>de</strong> items<br />

sterk verschill<strong>en</strong><strong>de</strong> eig<strong>en</strong>schapp<strong>en</strong> met<strong>en</strong>, die negatief<br />

sam<strong>en</strong>hang<strong>en</strong>, maar ook als e<strong>en</strong> <strong>de</strong>el <strong>van</strong> <strong>de</strong> items verkeerd<br />

om geco<strong>de</strong>erd is. Dit gebeurt wel e<strong>en</strong>s bij negatief<br />

geformuleer<strong>de</strong> rating-scale-items. Het gaat dan uiteraard<br />

om e<strong>en</strong> administratieve fout. De waar<strong>de</strong> 1 kan<br />

alle<strong>en</strong> word<strong>en</strong> bereikt on<strong>de</strong>r theoretische condities die<br />

in <strong>de</strong> praktijk overig<strong>en</strong>s nooit word<strong>en</strong> gerealiseerd. De<br />

uitleg hier<strong>van</strong> valt buit<strong>en</strong> het bestek <strong>van</strong> dit artikel (maar<br />

zie bijvoorbeeld Nunnally, 1978).<br />

Relatie <strong>alfa</strong> met interne consist<strong>en</strong>tie<br />

Het begrip interne consist<strong>en</strong>tie wordt in <strong>de</strong> literatuur<br />

over testtheorie <strong>en</strong> testconstructie niet ondubbelzinnig<br />

ge<strong>de</strong>finieerd. Cronbach (1951, p. 320) stel<strong>de</strong> bijvoorbeeld<br />

dat e<strong>en</strong> intern consist<strong>en</strong>te test ‘psychologically interpretable’<br />

is, hoewel dit niet betek<strong>en</strong>t ‘that all items be<br />

factorially similar’. Auteurs (bijvoorbeeld Cortina, 1993;<br />

Schmitt, 1996) die later e<strong>en</strong> poging tot e<strong>en</strong> <strong>de</strong>finitie<br />

waagd<strong>en</strong>, hadd<strong>en</strong> vervolg<strong>en</strong>s weinig invloed op het gebruik<br />

<strong>van</strong> <strong>de</strong> term. De grootste gem<strong>en</strong>e <strong>de</strong>ler <strong>van</strong> alle<br />

<strong>de</strong>finities <strong>en</strong> opvatting<strong>en</strong> lijkt te zijn ‘<strong>de</strong> mate waarin <strong>de</strong><br />

Al sinds <strong>de</strong> jar<strong>en</strong> veertig bestaan<br />

er betere method<strong>en</strong> voor het<br />

schatt<strong>en</strong> <strong>van</strong> <strong>de</strong> betrouwbaarheid<br />

562 De Psycholoog<br />

Wet<strong>en</strong>schap november 2009


l<strong>en</strong><strong>de</strong> tests, waar<strong>van</strong> sommige dui<strong>de</strong>lijk intern consist<strong>en</strong>t<br />

zijn <strong>en</strong> an<strong>de</strong>re niet, <strong>alfa</strong> kunn<strong>en</strong> berek<strong>en</strong><strong>en</strong>. Voor<br />

intern consist<strong>en</strong>te tests zou dan e<strong>en</strong> hogere <strong>alfa</strong>waar<strong>de</strong><br />

gevond<strong>en</strong> moet<strong>en</strong> word<strong>en</strong> dan voor intern inconsist<strong>en</strong>te<br />

tests. Als <strong>de</strong>ze relaties niet word<strong>en</strong> gevond<strong>en</strong>, kan word<strong>en</strong><br />

geconclu<strong>de</strong>erd dat <strong>alfa</strong> niet e<strong>en</strong> geschikte maat voor<br />

<strong>de</strong> interne consist<strong>en</strong>tie is.<br />

Invloed <strong>van</strong> interne consist<strong>en</strong>tie op <strong>alfa</strong><br />

We nem<strong>en</strong> voor het gemak aan dat e<strong>en</strong> test intern consist<strong>en</strong>t<br />

is als <strong>de</strong> sam<strong>en</strong>hang tuss<strong>en</strong> <strong>de</strong> items gelijk is <strong>en</strong> ook<br />

nog e<strong>en</strong>s sterk. Dit wordt als volgt geoperationaliseerd.<br />

We gaan uit <strong>van</strong> vier items (J = 4), die alle e<strong>en</strong> variantie<br />

hebb<strong>en</strong> <strong>van</strong> .25 (dus, s 2<br />

j = .25, voor j = 1,...,4), terwijl alle covarianties<br />

<strong>de</strong>zelf<strong>de</strong> positieve waar<strong>de</strong> c hebb<strong>en</strong> (dus, S jk = c,<br />

voor alle j < k, dus alle itempar<strong>en</strong>). Naarmate c groter is, is<br />

<strong>de</strong> interne consist<strong>en</strong>tie <strong>van</strong> <strong>de</strong> 4-itemtest dus ook groter.<br />

We bekijk<strong>en</strong> vijf gevall<strong>en</strong>: c = .01, .02, .05, .08, .11.<br />

Toepassing <strong>van</strong> <strong>de</strong> formule voor <strong>alfa</strong> levert respectievelijk<br />

<strong>alfa</strong> = .14, .26, .50, .65, .76. Als het aantal items <strong>en</strong><br />

<strong>de</strong> itemvarianties dus gelijk blijv<strong>en</strong>, <strong>en</strong> <strong>de</strong> (gelijke) covarianties<br />

nem<strong>en</strong> toe, neemt ook <strong>alfa</strong> toe. Dat lijkt dus e<strong>en</strong><br />

goed begin.<br />

Interne consist<strong>en</strong>tie na<strong>de</strong>r beschouwd: dim<strong>en</strong>sionaliteit<br />

Aangezi<strong>en</strong> in <strong>de</strong> vakliteratuur e<strong>en</strong> ondubbelzinnige<br />

Alfa zegt niets over <strong>de</strong> interne<br />

consist<strong>en</strong>tie <strong>van</strong> e<strong>en</strong> test<br />

<strong>de</strong>finitie <strong>van</strong> interne consist<strong>en</strong>tie ontbreekt, is het niet<br />

goed mogelijk om <strong>de</strong> relatie te on<strong>de</strong>rzoek<strong>en</strong> <strong>van</strong> interne<br />

consist<strong>en</strong>tie met e<strong>en</strong>dim<strong>en</strong>sionaliteit <strong>van</strong> <strong>de</strong> test of, in<br />

term<strong>en</strong> <strong>van</strong> factoranalyse, e<strong>en</strong> 1-factoroplossing. Het<br />

voorbeeld <strong>van</strong> daarnet was echter zo geconstrueerd, dat<br />

alle variantie-covariantiematrices 1-factorieel war<strong>en</strong>. Dit<br />

is na te gaan door eerst <strong>de</strong> covarianties om te rek<strong>en</strong><strong>en</strong><br />

naar correlaties via r jk = S jk / S j S k (bijv., r 12 = .02/√.25√.25<br />

= .08), <strong>en</strong> vervolg<strong>en</strong>s factoranalyse op <strong>de</strong> correlatiematrices<br />

te do<strong>en</strong>. Daarbij wordt slechts één factor berek<strong>en</strong>d<br />

die zoveel mogelijk geme<strong>en</strong>schappelijke variantie <strong>van</strong><br />

<strong>de</strong> items verklaart. Dit wordt gerealiseerd met behulp<br />

<strong>van</strong> minimum-rank-factoranalysis (mrfa; T<strong>en</strong> Berge &<br />

Kiers, 1991).<br />

Ondanks dat alle correlatiematrices in het voorbeeld<br />

verschill<strong>en</strong><strong>de</strong> grad<strong>en</strong> <strong>van</strong> interne consist<strong>en</strong>tie repres<strong>en</strong>ter<strong>en</strong>,<br />

laat mrfa zi<strong>en</strong> dat ze alle perfect 1-factorieel zijn.<br />

Het verschil is dat als c to<strong>en</strong>eemt, <strong>de</strong> invloed <strong>van</strong> meetfout<strong>en</strong><br />

afneemt. In term<strong>en</strong> <strong>van</strong> signaal <strong>en</strong> ruis, neemt bij<br />

to<strong>en</strong>em<strong>en</strong><strong>de</strong> c <strong>de</strong> ruis (dat is <strong>de</strong> meetfout) af waardoor<br />

het signaal (dat is <strong>de</strong> factor) beter waarneembaar wordt,<br />

Wet<strong>en</strong>schap november 2009<br />

De Psycholoog<br />

563


maar er is in alle gevall<strong>en</strong> één signaal. Terzij<strong>de</strong> zij opgemerkt<br />

dat psycholog<strong>en</strong> meestal hoofdcompon<strong>en</strong>t<strong>en</strong>analyse<br />

gebruik<strong>en</strong>. Deze metho<strong>de</strong> ve<strong>rond</strong>erstelt dat <strong>de</strong><br />

data ge<strong>en</strong> meetfout<strong>en</strong> bevatt<strong>en</strong>. Het gevolg is dat <strong>de</strong> eerste<br />

factor min<strong>de</strong>r variantie verklaart dan bijvoorbeeld <strong>de</strong><br />

eerste factor <strong>van</strong> e<strong>en</strong> mrfa (T<strong>en</strong> Berge & Sočan, 2004).<br />

In het voorbeeld gaat e<strong>en</strong> sterkere mate <strong>van</strong> interne<br />

consist<strong>en</strong>tie dus sam<strong>en</strong> met 1 factor, <strong>en</strong> <strong>de</strong> oplop<strong>en</strong><strong>de</strong><br />

waard<strong>en</strong> <strong>van</strong> <strong>alfa</strong> hor<strong>en</strong> dus steeds bij e<strong>en</strong> 1-factortest.<br />

De to<strong>en</strong>em<strong>en</strong><strong>de</strong> <strong>alfa</strong>waard<strong>en</strong> weerspiegel<strong>en</strong> dat <strong>de</strong><br />

items sterker sam<strong>en</strong>hang<strong>en</strong> maar ook dat <strong>de</strong> invloed<br />

<strong>van</strong> meetfout<strong>en</strong> (‘ruis’) in <strong>de</strong> itemscores geringer wordt.<br />

E<strong>en</strong> 1-factortest kan dus sterk uite<strong>en</strong>lop<strong>en</strong><strong>de</strong> waard<strong>en</strong><br />

<strong>van</strong> <strong>alfa</strong> hebb<strong>en</strong>, in principe tuss<strong>en</strong> 0 <strong>en</strong> 1. Ker<strong>en</strong> we<br />

<strong>de</strong> zak<strong>en</strong> om, <strong>en</strong> we zoud<strong>en</strong> <strong>de</strong> variantie-covariantiematrix<br />

niet k<strong>en</strong>n<strong>en</strong>, dan zoud<strong>en</strong> we elke waar<strong>de</strong> <strong>van</strong> <strong>alfa</strong><br />

kunn<strong>en</strong> vind<strong>en</strong> terwijl we steeds te mak<strong>en</strong> hadd<strong>en</strong> met<br />

e<strong>en</strong> 1-factortest. Bij e<strong>en</strong> waar<strong>de</strong> <strong>van</strong> <strong>alfa</strong> = .14 zou echter<br />

niemand bewer<strong>en</strong> dat <strong>de</strong> test intern consist<strong>en</strong>t is, maar<br />

toch is hij 1-factorieel <strong>en</strong> met<strong>en</strong> <strong>de</strong> items alle hetzelf<strong>de</strong>,<br />

zij het met veel ruis.<br />

M<strong>en</strong> zou vervolg<strong>en</strong>s kunn<strong>en</strong> red<strong>en</strong>er<strong>en</strong> dat het juist<br />

<strong>de</strong> 1-factortests zijn die niet intern consist<strong>en</strong>t zijn, die<br />

e<strong>en</strong> lage <strong>alfa</strong>waar<strong>de</strong> hebb<strong>en</strong>. Deze red<strong>en</strong>ering is te on<strong>de</strong>rgrav<strong>en</strong><br />

door e<strong>en</strong> langere test te nem<strong>en</strong>. Kiez<strong>en</strong> we<br />

bijvoorbeeld J = 40, itemvarianties <strong>van</strong> .25, <strong>en</strong> covarianties<br />

<strong>van</strong> .01, dan vind<strong>en</strong> we <strong>alfa</strong> = .625. Bij covarianties<br />

covarianties zijn gelijk aan r = S jk / S j S k = .06/√.25√.25 =<br />

.24), <strong>en</strong> alle correlaties zijn gelijk aan ), maar <strong>de</strong> eerste<br />

e<strong>en</strong> 2-factorstructuur heeft (‘intern inconsist<strong>en</strong>t’): De<br />

eerste twee items <strong>en</strong> <strong>de</strong> laatste twee items hebb<strong>en</strong> e<strong>en</strong><br />

covariantie <strong>van</strong> .16 (correlatie gelijk aan .64), terwijl <strong>de</strong><br />

items uit <strong>de</strong> verschill<strong>en</strong><strong>de</strong> par<strong>en</strong> covarianties hebb<strong>en</strong><br />

<strong>van</strong> .01 (corrrelatie .04). In bei<strong>de</strong> gevall<strong>en</strong> geldt J = 4<br />

<strong>en</strong> zijn <strong>de</strong> itemvarianties, s 2<br />

j ( j = 1,..., 4), gelijk aan .25.<br />

Cruciaal is nu dat <strong>de</strong> som <strong>van</strong> <strong>de</strong> covarianties in bei<strong>de</strong><br />

gevall<strong>en</strong> gelijk is aan .72, <strong>en</strong> <strong>alfa</strong> daardoor aan .56.<br />

Alfa hangt hier dus alle<strong>en</strong> af <strong>van</strong> <strong>de</strong> som <strong>van</strong> <strong>de</strong> covarianties,<br />

wat neerkomt op <strong>de</strong> gemid<strong>de</strong>l<strong>de</strong> covariantie,<br />

aangegev<strong>en</strong> als S _ , terwijl <strong>de</strong> informatie over variatie tuss<strong>en</strong><br />

covarianties verlor<strong>en</strong> gaat zodra m<strong>en</strong> ze alle optelt.<br />

Beschikt m<strong>en</strong> alle<strong>en</strong> over dit hogere aggregati<strong>en</strong>iveau,<br />

dan is <strong>de</strong> informatie over het lagere niveau, <strong>de</strong> afzon<strong>de</strong>rlijke<br />

covarianties, niet meer terug te krijg<strong>en</strong>. Voor <strong>de</strong><br />

volledigheid gev<strong>en</strong> we ook <strong>de</strong> formule <strong>van</strong> <strong>alfa</strong> met <strong>de</strong><br />

gemid<strong>de</strong>l<strong>de</strong> covariantie,<br />

J 2 S _<br />

<strong>alfa</strong> = ––––.<br />

S 2 x +<br />

Dezelf<strong>de</strong> som <strong>van</strong> covarianties of, id<strong>en</strong>tiek, hetzelf<strong>de</strong><br />

gemid<strong>de</strong>l<strong>de</strong>, kan dus ev<strong>en</strong>goed verwijz<strong>en</strong> naar e<strong>en</strong> 1- of<br />

2-factorstructuur, <strong>en</strong> dat geldt ook weer voor elke an<strong>de</strong>re<br />

som (of elk an<strong>de</strong>r gemid<strong>de</strong>l<strong>de</strong>) <strong>en</strong> elke an<strong>de</strong>re factorstructuur.<br />

Dus, <strong>alfa</strong> = .25 kan bij elke factorstructuur<br />

Tabel 2. Twee variantie-covariantiematrices met <strong>de</strong>zelf<strong>de</strong> waar<strong>de</strong> <strong>van</strong> <strong>Cronbachs</strong> <strong>alfa</strong><br />

1 2 3 4 1 2 3 4<br />

1 .25 .16 .01 .01 .25 .06 .06 .06<br />

2 .16 .25 .01 .01 .06 .25 .06 .06<br />

3 .01 .01 .25 .16 .06 .06 .25 .06<br />

4 .01 .01 .16 .25 .06 .06 .06 .25<br />

gelijk aan .02 vind<strong>en</strong> we <strong>alfa</strong> = .78. T<strong>en</strong> opzichte <strong>van</strong><br />

<strong>de</strong> test met vier items, is het <strong>en</strong>ige verschil het grotere<br />

aantal items, wat dus voldo<strong>en</strong><strong>de</strong> is om <strong>alfa</strong> te lat<strong>en</strong> to<strong>en</strong>em<strong>en</strong><br />

<strong>van</strong> .14 naar .625, <strong>en</strong> <strong>van</strong> .26 naar .78. Als nu<br />

bijvoorbeeld alle<strong>en</strong> <strong>de</strong> <strong>alfa</strong>waard<strong>en</strong> .14 <strong>en</strong> .625 bek<strong>en</strong>d<br />

zoud<strong>en</strong> zijn, <strong>en</strong> we zoud<strong>en</strong> ge<strong>en</strong> an<strong>de</strong>re voork<strong>en</strong>nis hebb<strong>en</strong>,<br />

dan zoud<strong>en</strong> we conclu<strong>de</strong>r<strong>en</strong> dat <strong>de</strong> twee<strong>de</strong> test e<strong>en</strong><br />

grotere interne consist<strong>en</strong>tie heeft. Toch is dit niet zo: <strong>de</strong><br />

covarianties zijn alle nog steeds .01, <strong>en</strong> <strong>de</strong> verschill<strong>en</strong><strong>de</strong><br />

<strong>alfa</strong>waard<strong>en</strong> voor bei<strong>de</strong> tests verwijz<strong>en</strong> naar <strong>de</strong>zelf<strong>de</strong><br />

1-factorstructuur. Het verschil zit hier dus alle<strong>en</strong> in het<br />

aantal items, maar dat heeft niets met interne consist<strong>en</strong>tie<br />

te mak<strong>en</strong>.<br />

Interne consist<strong>en</strong>tie <strong>en</strong> inconsist<strong>en</strong>tie, <strong>en</strong> <strong>alfa</strong><br />

Tabel 2 laat twee variantie-covariantiematrices zi<strong>en</strong>,<br />

waar<strong>van</strong> <strong>de</strong> twee<strong>de</strong> 1-factorieel is (‘intern consist<strong>en</strong>t’; alle<br />

hor<strong>en</strong>, maar dat geldt ook voor <strong>alfa</strong> = .90. K<strong>en</strong>t m<strong>en</strong><br />

alle<strong>en</strong> <strong>de</strong> waar<strong>de</strong> <strong>van</strong> <strong>alfa</strong>, dan zegt dit nog niets over <strong>de</strong><br />

sam<strong>en</strong>stelling <strong>van</strong> <strong>de</strong> test.<br />

Zodra m<strong>en</strong> begrijpt hoe <strong>alfa</strong> in elkaar steekt, wordt<br />

het gemakkelijk om voorbeeld<strong>en</strong> te mak<strong>en</strong> waarbij<br />

on<strong>de</strong>r uiterst verschill<strong>en</strong><strong>de</strong> omstandighed<strong>en</strong> – bijvoorbeeld,<br />

1, 2, 3, 4 factor<strong>en</strong>, verschill<strong>en</strong><strong>de</strong> aantall<strong>en</strong> items<br />

per factor – toch <strong>de</strong>zelf<strong>de</strong> <strong>alfa</strong> wordt gevond<strong>en</strong>. Daarbij<br />

moet <strong>de</strong> variantie-covariantiematrix wel steeds aan e<strong>en</strong><br />

technische voorwaar<strong>de</strong> voldo<strong>en</strong>, die ermee te mak<strong>en</strong><br />

heeft dat <strong>de</strong> covarianties on<strong>de</strong>rling afhankelijk zijn, <strong>en</strong><br />

<strong>de</strong> matrix ook bij echte data gevond<strong>en</strong> zou kunn<strong>en</strong> word<strong>en</strong>.<br />

Conclusies over <strong>alfa</strong> <strong>en</strong> interne consist<strong>en</strong>tie<br />

We conclu<strong>de</strong>r<strong>en</strong> dat <strong>alfa</strong> sterk uite<strong>en</strong>lop<strong>en</strong><strong>de</strong> waard<strong>en</strong><br />

kan hebb<strong>en</strong> voor<br />

564 De Psycholoog<br />

Wet<strong>en</strong>schap november 2009


• verschill<strong>en</strong><strong>de</strong> 1-factortests die variër<strong>en</strong> in <strong>de</strong> hoeveelheid<br />

ruis (meetfout<strong>en</strong>); <strong>en</strong><br />

• tests met <strong>de</strong>zelf<strong>de</strong> interne consist<strong>en</strong>tie, maar die bestaan<br />

uit verschill<strong>en</strong><strong>de</strong> aantall<strong>en</strong> items;<br />

maar<br />

• dat <strong>alfa</strong> <strong>de</strong>zelf<strong>de</strong> waar<strong>de</strong> kan hebb<strong>en</strong> voor tests met<br />

verschill<strong>en</strong><strong>de</strong> factoriële sam<strong>en</strong>stelling, waar<strong>van</strong><br />

sommige wel intern consist<strong>en</strong>t zijn <strong>en</strong> an<strong>de</strong>re niet.<br />

Derhalve kan <strong>alfa</strong> niet word<strong>en</strong> opgevat als e<strong>en</strong> maat voor<br />

interne consist<strong>en</strong>tie.<br />

Relatie <strong>alfa</strong> met betrouwbaarheid<br />

De betrouwbaarheid is <strong>de</strong> correlatie tuss<strong>en</strong> <strong>de</strong> testscores<br />

behaald op twee parallelle tests (Lord & Novick, 1968,<br />

p. 48). Testscores verkreg<strong>en</strong> door mid<strong>de</strong>l <strong>van</strong> twee parallelle<br />

tests verschill<strong>en</strong> alle<strong>en</strong> <strong>van</strong> elkaar wat betreft <strong>de</strong><br />

meetfout<strong>en</strong>, <strong>en</strong> zijn op te vatt<strong>en</strong> als testscores behaald<br />

op twee onafhankelijke afnam<strong>en</strong> <strong>van</strong> <strong>de</strong>zelf<strong>de</strong> test. We<br />

gev<strong>en</strong> <strong>de</strong> betrouwbaarheid aan met ρ. Voor e<strong>en</strong> concrete<br />

test geldt dat 0 ≤ ρ ≤ 1.<br />

Alfa is gebaseerd op <strong>de</strong> gegev<strong>en</strong>s <strong>van</strong> e<strong>en</strong> <strong>en</strong>kele test,<br />

wat betek<strong>en</strong>t dat we <strong>de</strong> gegev<strong>en</strong>s <strong>van</strong> e<strong>en</strong> twee<strong>de</strong>, parallelle<br />

test te kort kom<strong>en</strong>. De helft <strong>van</strong> <strong>de</strong> b<strong>en</strong>odig<strong>de</strong> gegev<strong>en</strong>s<br />

ontbreekt dus, <strong>en</strong> dat gaat t<strong>en</strong> koste <strong>van</strong> <strong>de</strong> zuiverheid<br />

<strong>van</strong> <strong>de</strong> schatting <strong>van</strong> <strong>de</strong> betrouwbaarheid. Bewez<strong>en</strong><br />

kan word<strong>en</strong> (bijvoorbeeld Dr<strong>en</strong>th & Sijtsma, 2006, p.<br />

215-220) dat <strong>alfa</strong> daardoor systematisch te laag is, dus<br />

dat <strong>alfa</strong> ≤ ρ.<br />

Gelijkheid wordt alle<strong>en</strong> gehaald on<strong>de</strong>r theoretische<br />

condities waaraan in <strong>de</strong> praktijk <strong>van</strong> <strong>de</strong> psychologische<br />

test niet wordt voldaan. Van belang is <strong>de</strong> betek<strong>en</strong>is <strong>van</strong><br />

<strong>de</strong> ongelijkheid: <strong>alfa</strong> geeft altijd e<strong>en</strong> lagere waar<strong>de</strong> dan <strong>de</strong><br />

echte betrouwbaarheid, <strong>en</strong> is daarmee e<strong>en</strong> on<strong>de</strong>rgr<strong>en</strong>s<br />

voor <strong>de</strong> betrouwbaarheid. Dit betek<strong>en</strong>t bijvoorbeeld dat<br />

als m<strong>en</strong> pas tevred<strong>en</strong> is met e<strong>en</strong> betrouwbaarheid <strong>van</strong><br />

.85, e<strong>en</strong> gerealiseer<strong>de</strong> waar<strong>de</strong> <strong>van</strong> <strong>alfa</strong> = .85 inhoudt dat<br />

<strong>de</strong> echte betrouwbaarheid hoger is.<br />

Er bestaan diverse method<strong>en</strong> die waard<strong>en</strong> gev<strong>en</strong> die<br />

dichter bij <strong>de</strong> betrouwbaarheid ligg<strong>en</strong> dan <strong>alfa</strong>. E<strong>en</strong> mogelijkheid<br />

is <strong>de</strong> metho<strong>de</strong> die <strong>de</strong> grootste on<strong>de</strong>rgr<strong>en</strong>s voor<br />

<strong>de</strong> betrouwbaarheid levert. Deze grootste on<strong>de</strong>rgr<strong>en</strong>s<br />

wordt aangeduid als glb (<strong>van</strong> greatest lower bound).<br />

E<strong>en</strong> an<strong>de</strong>re mogelijkheid wordt gebod<strong>en</strong> door kant <strong>en</strong><br />

klare formules die e<strong>en</strong> waar<strong>de</strong> gev<strong>en</strong> die tuss<strong>en</strong> <strong>alfa</strong> <strong>en</strong><br />

<strong>de</strong> grootste on<strong>de</strong>rgr<strong>en</strong>s ligt.<br />

De grootste on<strong>de</strong>rgr<strong>en</strong>s voor <strong>de</strong> betrouwbaarheid<br />

Het probleem <strong>van</strong> het vind<strong>en</strong> <strong>van</strong> <strong>de</strong> glb is in <strong>de</strong> jar<strong>en</strong><br />

zev<strong>en</strong>tig <strong>en</strong> tachtig opgelost. Het probleem is als volgt.<br />

We gaan uit <strong>van</strong> <strong>de</strong> voo<strong>rond</strong>erstelling<strong>en</strong> <strong>van</strong> <strong>de</strong> klassieke<br />

testtheorie. Die kom<strong>en</strong> erop neer dat testscores meetfout<strong>en</strong><br />

bevatt<strong>en</strong>, die nerg<strong>en</strong>s mee correler<strong>en</strong>. Dit wordt<br />

als uitgangspunt g<strong>en</strong>om<strong>en</strong> voor e<strong>en</strong> zoektocht naar <strong>de</strong><br />

meetfout<strong>en</strong>varianties <strong>van</strong> <strong>de</strong> J items in <strong>de</strong> test, waar<strong>van</strong><br />

<strong>de</strong> som maximaal groot is bij <strong>de</strong> variantie-covariantie-<br />

matrix die uit <strong>de</strong> data is berek<strong>en</strong>d, on<strong>de</strong>r <strong>de</strong> voorwaar<strong>de</strong><br />

dat <strong>de</strong> berek<strong>en</strong>ing<strong>en</strong> gebaseerd zijn op echte variantiecovariantiematrices<br />

voor true scores <strong>en</strong> meetfout<strong>en</strong> (T<strong>en</strong><br />

Berge & Sočan, 2004). Dit betek<strong>en</strong>t dat gezocht wordt<br />

naar e<strong>en</strong> ‘worst-case sc<strong>en</strong>ario’ voor <strong>de</strong> betrouwbaarheid:<br />

Gegev<strong>en</strong> <strong>de</strong> gevond<strong>en</strong> variantie-covariantiematrix <strong>van</strong><br />

<strong>de</strong> items, wordt gezocht naar <strong>de</strong> laagst d<strong>en</strong>kbare betrouwbaarheid.<br />

Dit is dan <strong>de</strong> grootste on<strong>de</strong>rgr<strong>en</strong>s, ofwel<br />

<strong>de</strong> glb.<br />

Is voor e<strong>en</strong> bepaal<strong>de</strong> test <strong>de</strong> glb gevond<strong>en</strong>, dan ligt<br />

<strong>de</strong> betrouwbaarheid <strong>van</strong> <strong>de</strong> testscore dus in het interval<br />

tuss<strong>en</strong> <strong>de</strong> glb <strong>en</strong> <strong>de</strong> theoretisch maximale betrouwbaarheid<br />

<strong>van</strong> 1: GLB ≤ ρ ≤ 1. Twee zak<strong>en</strong> vall<strong>en</strong> op. T<strong>en</strong> eerste<br />

kan op basis <strong>van</strong> e<strong>en</strong> <strong>en</strong>kele testafname alle<strong>en</strong> maar e<strong>en</strong><br />

interval voor ρ word<strong>en</strong> vastgesteld. De verklaring is dat<br />

er twee onafhankelijke testafnam<strong>en</strong> nodig zijn om ρ te<br />

kunn<strong>en</strong> schatt<strong>en</strong>. Op basis <strong>van</strong> e<strong>en</strong> <strong>en</strong>kele testafname<br />

legt het patroon <strong>van</strong> itemvarianties <strong>en</strong> -covarianties wel<br />

Door <strong>alfa</strong> te rapporter<strong>en</strong>, do<strong>en</strong><br />

teston<strong>de</strong>rzoekers zichzelf tekort<br />

beperking<strong>en</strong> op aan ρ, maar ρ in één waar<strong>de</strong> vastlegg<strong>en</strong><br />

gaat niet. T<strong>en</strong> twee<strong>de</strong> kan m<strong>en</strong> op basis <strong>van</strong> e<strong>en</strong><br />

<strong>en</strong>kele testafname niet uitsluit<strong>en</strong> dat <strong>de</strong> testscore perfect<br />

betrouwbaar is; immers, <strong>de</strong> waar<strong>de</strong> 1 behoort tot het<br />

interval. Deze onbepaaldheid volgt weer uit <strong>de</strong> beschikbaarheid<br />

<strong>van</strong> slechts één testafname, daar waar er twee<br />

nodig zijn.<br />

Omdat <strong>alfa</strong> per <strong>de</strong>finitie e<strong>en</strong> kleinere on<strong>de</strong>rgr<strong>en</strong>s is<br />

dan <strong>de</strong> glb, geldt dat <strong>alfa</strong> ≤ GLB ≤ ρ ≤ 1. Alfa ligt dus buit<strong>en</strong><br />

het interval <strong>van</strong> mogelijke waard<strong>en</strong> <strong>van</strong> ρ, <strong>en</strong> heeft<br />

<strong>de</strong>rhalve altijd waard<strong>en</strong> die ge<strong>en</strong> waard<strong>en</strong> <strong>van</strong> ρ kunn<strong>en</strong><br />

zijn, voor zover dat op basis <strong>van</strong> e<strong>en</strong> <strong>en</strong>kele testafname<br />

<strong>en</strong> on<strong>de</strong>r aanname <strong>van</strong> <strong>de</strong> klassieke testtheorie valt te<br />

zegg<strong>en</strong>. Dus, als <strong>alfa</strong> voor e<strong>en</strong> test gelijk zou zijn aan<br />

.8, dan wet<strong>en</strong> we niet alle<strong>en</strong> dat <strong>de</strong> echte betrouwbaarheid<br />

ρ groter is, maar ook dat <strong>de</strong>ze test ge<strong>en</strong> betrouwbaarheid<br />

<strong>van</strong> .8 zou kunn<strong>en</strong> hebb<strong>en</strong>. Op zich is dit weer<br />

ge<strong>en</strong> ramp, als m<strong>en</strong> er<strong>van</strong> uit wil gaan dat e<strong>en</strong> te lage<br />

schatting <strong>van</strong> <strong>de</strong> betrouwbaarheid door mid<strong>de</strong>l <strong>van</strong> <strong>alfa</strong><br />

als aansporing kan word<strong>en</strong> opgevat om te strev<strong>en</strong> naar<br />

e<strong>en</strong> nog betere test.<br />

De glb zit niet in spss, maar is wel te schatt<strong>en</strong> met<br />

behulp <strong>van</strong> software, zoals beschikbaar via http://www.<br />

ppsw.rug.nl/~kiers/ (T<strong>en</strong> Berge & Kiers, 2003), http://<br />

www.citogroep.nl/o<strong>en</strong>w/on<strong>de</strong>rzoek/psychometrie/<br />

eind_fr.htm (cito, Arnhem), <strong>en</strong> http://www.mvsoft.<br />

com/eqs60.htm (het programma eqs; B<strong>en</strong>tler, 1995).<br />

E<strong>en</strong> na<strong>de</strong>el is voorlopig nog dat <strong>de</strong> schatting<strong>en</strong> te hoog<br />

kunn<strong>en</strong> uitvall<strong>en</strong> in steekproev<strong>en</strong> kleiner dan duiz<strong>en</strong>d<br />

proefperson<strong>en</strong> <strong>en</strong> tests groter dan ti<strong>en</strong> items. Dat is e<strong>en</strong><br />

behoorlijke beperking, <strong>en</strong> het is te hop<strong>en</strong> dat <strong>de</strong> psychometrie<br />

met oplossing<strong>en</strong> komt voor dit probleem.<br />

Wet<strong>en</strong>schap november 2009<br />

De Psycholoog<br />

565


An<strong>de</strong>re alternatiev<strong>en</strong> voor <strong>Cronbachs</strong> <strong>alfa</strong><br />

Reeds lang bestaan formules die net als <strong>alfa</strong> e<strong>en</strong> on<strong>de</strong>rgr<strong>en</strong>s<br />

voor <strong>de</strong> betrouwbaarheid oplever<strong>en</strong>, maar gegaran<strong>de</strong>erd<br />

één die groter is dan <strong>alfa</strong>. We noem<strong>en</strong> Guttmans<br />

(1945) lambda2 <strong>en</strong> <strong>de</strong> mu-reeks <strong>van</strong> T<strong>en</strong> Berge <strong>en</strong><br />

Zegers (1978). De bijbehor<strong>en</strong><strong>de</strong> formules zijn net als<br />

<strong>alfa</strong> afhankelijk <strong>van</strong> <strong>de</strong> testl<strong>en</strong>gte, J, <strong>de</strong> testscorevariantie,<br />

S 2 x + , <strong>en</strong> <strong>de</strong> covarianties tuss<strong>en</strong> <strong>de</strong> items, S jk , maar ze<br />

zijn wel ingewikkel<strong>de</strong>r wat betreft <strong>de</strong> structuur. Om die<br />

red<strong>en</strong> lat<strong>en</strong> we ze weg, maar gev<strong>en</strong> wel <strong>de</strong> relaties <strong>van</strong><br />

<strong>de</strong>ze on<strong>de</strong>rgr<strong>en</strong>z<strong>en</strong> met <strong>alfa</strong>.<br />

T<strong>en</strong> eerste is bewez<strong>en</strong> dat <strong>alfa</strong> ≤ lambda2. Dus, als<br />

voor e<strong>en</strong> concrete test <strong>alfa</strong> = .82, dan is lambda2 minst<strong>en</strong>s<br />

zo groot. Alfa is in <strong>de</strong> mu-reeks <strong>van</strong> T<strong>en</strong> Berge<br />

<strong>en</strong> Zegers (1978) het eerste elem<strong>en</strong>t, mu0, <strong>en</strong> lambda2<br />

het twee<strong>de</strong>, mu1. Deze auteurs toond<strong>en</strong> aan dat<br />

mu0 (<strong>alfa</strong>) ≤ mu1 (lambda2) ≤ mu2 ≤ mu3 ≤.... Zij raadd<strong>en</strong><br />

ver<strong>de</strong>r aan om mu2 of mu3 te berek<strong>en</strong><strong>en</strong> voor tests<br />

die slechts uit <strong>en</strong>kele items bestaan. In het algeme<strong>en</strong><br />

geldt echter dat alle<strong>en</strong> het verschil tuss<strong>en</strong> mu0 (= <strong>alfa</strong>)<br />

<strong>en</strong> mu1 (=lambda2) <strong>de</strong> moeite waard is. Ver<strong>de</strong>r is elk <strong>van</strong><br />

<strong>de</strong>ze on<strong>de</strong>rgr<strong>en</strong>z<strong>en</strong> kleiner dan <strong>de</strong> glb, zodat we uitein<strong>de</strong>lijk<br />

hebb<strong>en</strong>: mu0 (<strong>alfa</strong>) ≤ mu1 (lambda2) ≤ mu2 ≤ mu3<br />

≤ ... ≤ GLB ≤ ρ ≤ 1.<br />

Het berek<strong>en</strong><strong>en</strong> <strong>van</strong> mu2 <strong>en</strong> mu3 is dus alle<strong>en</strong> voor<strong>de</strong>lig<br />

voor zeer korte tests, <strong>en</strong> <strong>de</strong> glb is vooralsnog alle<strong>en</strong><br />

te vertrouw<strong>en</strong> bij grote steekproev<strong>en</strong> <strong>en</strong> korte tests.<br />

Lambda2 kan zon<strong>de</strong>r bezwaar altijd word<strong>en</strong> gerapporteerd<br />

in plaats <strong>van</strong> <strong>alfa</strong>. Ook al is lambda2 niet veel groter<br />

dan <strong>alfa</strong>, hij zit ev<strong>en</strong>als <strong>alfa</strong> in spss, is altijd minst<strong>en</strong>s<br />

zo groot, <strong>en</strong> ligt gegaran<strong>de</strong>erd dichter bij <strong>de</strong> echte betrouwbaarheid<br />

ρ.<br />

T<strong>en</strong> slotte kan vermeld word<strong>en</strong> dat er an<strong>de</strong>re method<strong>en</strong><br />

bestaan om <strong>de</strong> betrouwbaarheid te schatt<strong>en</strong>. E<strong>en</strong><br />

mogelijkheid is om dit te do<strong>en</strong> via e<strong>en</strong> confirmatief factormo<strong>de</strong>l,<br />

zoals aanbevol<strong>en</strong> door Raykov (1997) <strong>en</strong> B<strong>en</strong>tler<br />

(2009). Revelle <strong>en</strong> Zinbarg (2009) stell<strong>en</strong> nog weer<br />

an<strong>de</strong>re method<strong>en</strong> voor. Hoewel <strong>de</strong>ze method<strong>en</strong> het alle<br />

beter do<strong>en</strong> dan <strong>alfa</strong>, hebb<strong>en</strong> ze soortgelijke problem<strong>en</strong><br />

in kleine steekproev<strong>en</strong> als <strong>de</strong> glb (T<strong>en</strong> Berge & Sočan,<br />

2004).<br />

E<strong>en</strong> rek<strong>en</strong>voorbeeld<br />

Alfa, lambda2 <strong>en</strong> <strong>de</strong> glb werd<strong>en</strong> berek<strong>en</strong>d voor acht<br />

rating scale items, elk gescoord 0, 1, 2, 3, die war<strong>en</strong> afg<strong>en</strong>om<strong>en</strong><br />

bij 828 respond<strong>en</strong>t<strong>en</strong>. Met <strong>de</strong>ze items werd<br />

‘coping behavior’ gemet<strong>en</strong> <strong>van</strong> m<strong>en</strong>s<strong>en</strong> die in <strong>de</strong> buurt<br />

woond<strong>en</strong> <strong>van</strong> industrie die stank verspreid<strong>de</strong> waar m<strong>en</strong><br />

regelmatig last <strong>van</strong> had (Cavalini, 1992). Er bestond<strong>en</strong><br />

sterke aanwijzing<strong>en</strong> dat <strong>de</strong> acht items in twee viertall<strong>en</strong><br />

kond<strong>en</strong> word<strong>en</strong> ver<strong>de</strong>eld, die elk e<strong>en</strong> verschill<strong>en</strong>d aspect<br />

<strong>van</strong> coping behavior repres<strong>en</strong>teerd<strong>en</strong>.<br />

Zowel voor <strong>de</strong> totaalscore op alle acht items als <strong>de</strong> totaalscores<br />

op <strong>de</strong> twee viertall<strong>en</strong> geeft Tabel 3 <strong>de</strong> drie on<strong>de</strong>rgr<strong>en</strong>z<strong>en</strong>.<br />

Noodzakelijkerwijs is lambda2 groter dan<br />

<strong>alfa</strong>, maar <strong>de</strong> verschill<strong>en</strong> zijn klein. De glb werd bere-<br />

Tabel 3. Alfa, Lambda2 <strong>en</strong> <strong>de</strong> GLB voor drie totaalscores<br />

k<strong>en</strong>d omdat <strong>de</strong> steekproef bijna duiz<strong>en</strong>d respond<strong>en</strong>t<strong>en</strong><br />

tel<strong>de</strong> <strong>en</strong> het aantal items kleiner was dan ti<strong>en</strong>. De verschill<strong>en</strong><br />

<strong>van</strong> <strong>alfa</strong> <strong>en</strong> lambda2 met <strong>de</strong> glb zijn spectaculair.<br />

Als we het mogelijke verschil tuss<strong>en</strong> steekproef <strong>en</strong><br />

populatie ev<strong>en</strong> verget<strong>en</strong> <strong>en</strong> do<strong>en</strong> alsof het hier populatieresultat<strong>en</strong><br />

betreft, dan zou <strong>de</strong> echte betrouwbaarheid<br />

dus weer groter zijn dan <strong>de</strong> glb.<br />

Conclusies<br />

Aantal Items<br />

8 4 (set 1) 4 (set 2)<br />

Alfa .778 .736 .640<br />

Lambda2 .785 .746 .644<br />

GLB .852 .820 .696<br />

We trekk<strong>en</strong> twee conclusies uit dit on<strong>de</strong>rzoek. T<strong>en</strong> eerste<br />

is <strong>alfa</strong> ge<strong>en</strong> maat voor <strong>de</strong> interne consist<strong>en</strong>tie <strong>van</strong><br />

e<strong>en</strong> test, ondanks <strong>de</strong> vasthoud<strong>en</strong>dheid waarmee dit in<br />

<strong>de</strong> literatuur wordt beweerd. Uitsprak<strong>en</strong> zoals ‘Voor<br />

<strong>de</strong>ze test is <strong>alfa</strong> gelijk aan .88, <strong>en</strong> dus is <strong>de</strong> interne consist<strong>en</strong>tie<br />

in or<strong>de</strong>’ moet<strong>en</strong> t<strong>en</strong> zeerste word<strong>en</strong> afgerad<strong>en</strong>.<br />

De red<strong>en</strong> is dat e<strong>en</strong> test met e<strong>en</strong> <strong>alfa</strong> <strong>van</strong> .88, zowel<br />

intern consist<strong>en</strong>t als intern inconsist<strong>en</strong>t kan zijn: <strong>alfa</strong><br />

zegt hier gewoon niets over. Los <strong>van</strong> wat m<strong>en</strong> er precies<br />

on<strong>de</strong>r wil verstaan, kan m<strong>en</strong> interne consist<strong>en</strong>tie beter<br />

on<strong>de</strong>rzoek<strong>en</strong> met behulp <strong>van</strong> factoranalyse <strong>en</strong> item-responstheorie.<br />

T<strong>en</strong> twee<strong>de</strong> is <strong>alfa</strong> bijna <strong>de</strong> kleinste on<strong>de</strong>rgr<strong>en</strong>s voor<br />

<strong>de</strong> betrouwbaarheid die bek<strong>en</strong>d is. Door <strong>alfa</strong> te rapporter<strong>en</strong>,<br />

do<strong>en</strong> teston<strong>de</strong>rzoekers zichzelf tekort. Voor<br />

steekproev<strong>en</strong> groter dan duiz<strong>en</strong>d waarneming<strong>en</strong> <strong>en</strong><br />

tests met hooguit ti<strong>en</strong> items doet m<strong>en</strong> er goed aan <strong>de</strong><br />

glb te schatt<strong>en</strong>. Zolang voor kleinere steekproev<strong>en</strong> <strong>en</strong><br />

langere tests het bias-probleem in <strong>de</strong> glb-schatting niet<br />

is opgelost, kan m<strong>en</strong> beter Guttmans lambda2 schatt<strong>en</strong>.<br />

Het verschil met <strong>alfa</strong> is doorgaans klein, maar er is ge<strong>en</strong><br />

argum<strong>en</strong>t om <strong>de</strong>ze kleine verbetering te neger<strong>en</strong>, zeker<br />

als m<strong>en</strong> naast Guttmans lambda2 of <strong>de</strong> glb ook <strong>alfa</strong><br />

rapporteert. Dan is ook dui<strong>de</strong>lijk dat <strong>alfa</strong> in<strong>de</strong>rdaad e<strong>en</strong><br />

kleinere schatting oplevert dan <strong>de</strong> an<strong>de</strong>re method<strong>en</strong>.<br />

M<strong>en</strong> zou kunn<strong>en</strong> beargum<strong>en</strong>ter<strong>en</strong> dat m<strong>en</strong> <strong>alfa</strong> alle<strong>en</strong><br />

zou moet<strong>en</strong> berek<strong>en</strong><strong>en</strong> voor testscores die zijn gebaseerd<br />

op items die hoog lad<strong>en</strong> op <strong>de</strong>zelf<strong>de</strong> factor. M<strong>en</strong><br />

gebruikt dan factoranalyse om <strong>de</strong> interne consist<strong>en</strong>tie<br />

te on<strong>de</strong>rzoek<strong>en</strong> <strong>en</strong> <strong>alfa</strong> om <strong>de</strong> betrouwbaarheid <strong>van</strong> <strong>de</strong><br />

testscore per factor te schatt<strong>en</strong>. Dat is e<strong>en</strong> correcte werkwijze,<br />

maar staan blijft dat er betere method<strong>en</strong> zijn dan<br />

<strong>alfa</strong> om <strong>de</strong> betrouwbaarheid te schatt<strong>en</strong>. Die method<strong>en</strong><br />

zou m<strong>en</strong> dan ook moet<strong>en</strong> gebruik<strong>en</strong>.<br />

566 De Psycholoog<br />

Wet<strong>en</strong>schap november 2009


Testconstructeurs <strong>en</strong> testgebruikers lijk<strong>en</strong> vaak niet<br />

te wet<strong>en</strong> dat <strong>alfa</strong> ge<strong>en</strong> maat is voor <strong>de</strong> interne consist<strong>en</strong>tie<br />

<strong>van</strong> <strong>de</strong> test <strong>en</strong> ook niet dat <strong>alfa</strong> e<strong>en</strong> on<strong>de</strong>rschatting<br />

is <strong>van</strong> <strong>de</strong> betrouwbaarheid, maar in <strong>de</strong> psychometrie<br />

is <strong>de</strong>ze k<strong>en</strong>nis geme<strong>en</strong>goed. Cortina (1993) <strong>en</strong> Schmitt<br />

(1996) besprek<strong>en</strong> op kritische wijze <strong>de</strong> verme<strong>en</strong><strong>de</strong> relatie<br />

tuss<strong>en</strong> <strong>alfa</strong> <strong>en</strong> interne consist<strong>en</strong>tie, <strong>en</strong> Cronbach<br />

(1951) <strong>en</strong> Dr<strong>en</strong>th <strong>en</strong> Sijtsma (2006, p. 215-222) gev<strong>en</strong> het<br />

wiskundige bewijs dat <strong>alfa</strong> kleiner is dan <strong>de</strong> betrouwbaarheid.<br />

Ook Sijtsma (2009) bekritiseert het gebruik<br />

<strong>van</strong> <strong>alfa</strong>, terwijl <strong>de</strong> discussiant<strong>en</strong> <strong>van</strong> dit artikel (B<strong>en</strong>tler,<br />

2009; Gre<strong>en</strong> & Yang, 2009; Revelle & Zinbarg, 2009)<br />

het overweg<strong>en</strong>d met hem e<strong>en</strong>s zijn <strong>en</strong> hun bijdrag<strong>en</strong><br />

vervolg<strong>en</strong>s wijd<strong>en</strong> aan het schatt<strong>en</strong> <strong>van</strong> <strong>de</strong> betrouwbaarheid<br />

met behulp <strong>van</strong> confirmatieve factoranalyse. Door<br />

bijvoorbeeld Cronbach (1954) <strong>en</strong> Borsboom (2006) is<br />

gewez<strong>en</strong> op <strong>de</strong> kloof tuss<strong>en</strong> <strong>de</strong> theorie <strong>van</strong> <strong>de</strong> psychometrie<br />

<strong>en</strong> <strong>de</strong> praktijk <strong>van</strong> <strong>de</strong> testconstructie <strong>en</strong> het testgebruik.<br />

De bedoeling <strong>van</strong> dit artikel is het overbrugg<strong>en</strong><br />

<strong>van</strong> <strong>de</strong>ze kloof voor wat betreft het begrip <strong>van</strong> <strong>Cronbachs</strong><br />

<strong>alfa</strong>.<br />

Schmitt, N. (1996). Uses and abuses of coeffici<strong>en</strong>t alpha. Psychological Assessm<strong>en</strong>t, 8,<br />

350-353.<br />

Sijtsma, K. (2009). On the use, the misuse, and the very limited usefulness of Cronbach’s<br />

alpha. Psychometrika, 74, 107-120.<br />

Prof.dr. K. Sijtsma is als hoogleraar verbond<strong>en</strong> aan het Departem<strong>en</strong>t<br />

Method<strong>en</strong> <strong>en</strong> Techniek<strong>en</strong> <strong>van</strong> On<strong>de</strong>rzoek, <strong>van</strong> <strong>de</strong> Faculteit Sociale<br />

Wet<strong>en</strong>schapp<strong>en</strong> <strong>van</strong> <strong>de</strong> Universiteit <strong>van</strong> Tilburg, Postbus 90153, 5000 LE<br />

Tilburg. E-mailadres: .<br />

Literatuur<br />

B<strong>en</strong>tler, P.A. (1995). EQS Structural Equations Program Manual. Encino, ca: Multivariate<br />

Software, Inc.<br />

B<strong>en</strong>tler, P.A. (2009). Alpha, dim<strong>en</strong>sion-free, and mo<strong>de</strong>l-based internal consist<strong>en</strong>cy reliability.<br />

Psychometrika, 74, 137-143.<br />

Berge, J.M.F. t<strong>en</strong> & Kiers, H.A.L. (1991). A numerical approach to the exact and the approximate<br />

minimum rank of a covariance matrix. Psychometrika, 56, 309 -315.<br />

Berge, J.M.F. t<strong>en</strong> & Kiers, H.A.L. (2003). The minimum rank factor analysis program<br />

MRFA. Internal report, Departm<strong>en</strong>t of Psychology, University of Groning<strong>en</strong>, The<br />

Netherlands.<br />

Berge, J.M.F. t<strong>en</strong> & Sočan, G. (2004). The greatest lower bound to the reliability of a test and<br />

the hypothesis of unidim<strong>en</strong>sionality. Psychometrika, 69, 613-625.<br />

Berge, J.M.F. t<strong>en</strong> & Zegers, F. E. (1978). A series of lower bounds to the reliability of a test.<br />

Psychometrika, 43, 575-579.<br />

Borsboom, D. (2006). The attack of the psychometricians. Psychometrika, 71, 425-440.<br />

Cavalini, P.M. (1992). It’s an ill wind that brings no good. Studies on odour annoyance<br />

and the dispersion of odorant conc<strong>en</strong>trations from industries. Ph.D.<br />

thesis, University of Groning<strong>en</strong>, The Netherlands.<br />

Cortina, J.M. (1993). What is coeffici<strong>en</strong>t alpha? An examination of theory and applications.<br />

Journal of Applied Psychology, 78, 98-104.<br />

Cronbach, L.J. (1951). Coeffici<strong>en</strong>t alpha and the internal structure of tests. Psychometrika,<br />

16, 297-334.<br />

Cronbach, L.J. (1954). Report on a psychometric mission to Clinicia. Psychometrika, 19,<br />

263-270.<br />

Dr<strong>en</strong>th, P.J.D. & Sijtsma, K. (2006). Testtheorie. Inleiding in <strong>de</strong> theorie <strong>van</strong> <strong>de</strong> psychologische<br />

test <strong>en</strong> zijn toepassing<strong>en</strong>. Hout<strong>en</strong>: Bohn Stafleu <strong>van</strong> Loghum.<br />

Gre<strong>en</strong>, S.A. & Yang, Y. (2009). Coeffici<strong>en</strong>t alpha: a cautionary tale. Psychometrika, 74,<br />

121-135.<br />

Guttman, L. (1945). A basis for analyzing test-retest reliability. Psychometrika, 10, 255-<br />

282.<br />

Lord, F.M. & Novick, M.R. (1968). Statistical theories of m<strong>en</strong>tal test scores. Reading,<br />

m a : Addison-Wesley.<br />

Nunnally, J.C. (1978). Psychometric theory. New York: McGraw-Hill.<br />

Raykov, T. (1997). Estimation of composite reliability for cong<strong>en</strong>eric measures. Applied<br />

Psychological Measurem<strong>en</strong>t, 21, 173-184.<br />

Revelle, W. & Zinbarg, R.E. (2009). Coeffici<strong>en</strong>ts alpha, beta, omega and the glb. Comm<strong>en</strong>ts<br />

on Sijtsma. Psychometrika, 74, 145-154.<br />

Misun<strong>de</strong>rstandings concerning<br />

Cronbach’s alpha<br />

K. Sijtsma<br />

Cronbach’s alpha is used for estimating both the<br />

internal consist<strong>en</strong>cy and the reliability of a test. It is<br />

<strong>de</strong>monstrated that alpha has no relationship to the<br />

test’s internal consist<strong>en</strong>cy, consi<strong>de</strong>red as the <strong>de</strong>gree to<br />

which items are associated as a sign of what they share<br />

in common. Instead of alpha, factor analysis and item<br />

response theory are recomm<strong>en</strong><strong>de</strong>d for investigating a<br />

test’s internal consist<strong>en</strong>cy. Alpha is a lower bound to the<br />

reliability. Many alternative lower bounds are available,<br />

which exceed alpha and thus are closer to the test’s<br />

reliability. A real-data example shows that the differ<strong>en</strong>ces<br />

can be consi<strong>de</strong>rable. It is recomm<strong>en</strong><strong>de</strong>d to estimate the<br />

reliability using, for example, Guttman’s lambda2 and<br />

the greatest lower bound instead of alpha.<br />

summary<br />

Wet<strong>en</strong>schap november 2009<br />

De Psycholoog<br />

567

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!