COTAN beoordelingssysteem voor de kwaliteit van tests - NIP
COTAN beoordelingssysteem voor de kwaliteit van tests - NIP
COTAN beoordelingssysteem voor de kwaliteit van tests - NIP
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Aanwijzingen bij basisvraag 4.1: “Wor<strong>de</strong>n normen verstrekt?”<br />
Normgegevens, hetzij bedoeld <strong>voor</strong> normgerichte interpretatie<br />
(zoals normtabellen), hetzij bedoeld <strong>voor</strong> domeingerichte of<br />
criteriumgerichte interpretatie (zoals grensscores of verwachtingstabellen),<br />
moeten beschikbaar zijn op het moment dat <strong>de</strong> test<br />
<strong>voor</strong> daadwerkelijk gebruik verkrijgbaar is. De volgen<strong>de</strong> situaties<br />
kunnen lei<strong>de</strong>n tot een negatief antwoord op <strong>de</strong>ze vraag:<br />
• De hier bedoel<strong>de</strong> gegevens wor<strong>de</strong>n niet verstrekt (er wor<strong>de</strong>n<br />
bij<strong>voor</strong>beeld alleen gemid<strong>de</strong>l<strong>de</strong>n en standaard<strong>de</strong>viaties <strong>van</strong><br />
<strong>de</strong> on<strong>de</strong>rzochte groepen vermeld).<br />
• Bij <strong>tests</strong> die zijn bedoeld <strong>voor</strong> interpretatie op groepsniveau<br />
wor<strong>de</strong>n normtabellen verstrekt die zijn gebaseerd op individuele<br />
scores, en omgekeerd (zie ook ad. 4.3.a).<br />
• Nadat <strong>de</strong> normen zijn verzameld, hebben er nog wijzigingen<br />
in <strong>de</strong> test zelf plaatsgevon<strong>de</strong>n, bij<strong>voor</strong>beeld wijzigingen in <strong>de</strong><br />
items of <strong>de</strong> instructie.<br />
• De normen zijn verzameld met behulp <strong>van</strong> een papier-en-potloodversie,<br />
terwijl <strong>de</strong> te beoor<strong>de</strong>len versie een computerversie<br />
betreft (of vice versa). Voor vragenlijsten heeft dit in het<br />
algemeen weinig invloed op <strong>de</strong> waar<strong>de</strong> <strong>van</strong> <strong>de</strong> normen<br />
(Bartram, 2005; King & Miles, 1995; Mead & Drasgow, 1993).<br />
Voor capaciteiten- en vaardigheids<strong>tests</strong> en/of <strong>tests</strong> die<br />
gebon<strong>de</strong>n zijn aan een tijdslimiet zullen echter nieuwe normen<br />
moeten wor<strong>de</strong>n verzameld.<br />
Aanwijzingen bij basisvraag 4.2: “Zijn <strong>de</strong> normen actueel?”<br />
Normen zijn aan slijtage on<strong>de</strong>rhevig. Van <strong>de</strong> psychometrische<br />
kenmerken <strong>van</strong> een test zijn normen het meest gevoelig <strong>voor</strong><br />
maatschappelijke veran<strong>de</strong>ringen, veran<strong>de</strong>ringen in het on<strong>de</strong>rwijs<br />
en in <strong>de</strong> inhoud <strong>van</strong> functies. Daarom moet er <strong>van</strong> tijd tot tijd<br />
hernormering <strong>van</strong> <strong>de</strong> test plaatsvin<strong>de</strong>n, of moet <strong>de</strong> auteur<br />
door on<strong>de</strong>rzoek aantonen dat hernormering niet nodig is. Voor<br />
intelligentie<strong>tests</strong> moet bij<strong>voor</strong>beeld rekening wor<strong>de</strong>n gehou<strong>de</strong>n<br />
met het Flynn-effect, waardoor normen verou<strong>de</strong>ren (zie bij<strong>voor</strong>beeld<br />
Resing & Drenth, 2007, p. 142-145). Dit effect wordt geschat<br />
op 3 IQ-punten per tien jaar, of 4.5 IQ-punten per vijftien jaar. Dit<br />
is gelijk aan circa één standaardmeetfout (bij een betrouwbaarheid<br />
<strong>van</strong> .91). Waarschijnlijk geldt een <strong>de</strong>rgelijk effect ook <strong>voor</strong> verwante<br />
<strong>tests</strong>, zoals testbatterijen <strong>voor</strong> algemene of specifieke cognitieve<br />
capaciteiten. Voor persoonlijkheids<strong>tests</strong> is er niets bekend over<br />
<strong>de</strong>rgelijke algemene effecten. Vergelijking tussen <strong>de</strong> gegevens in<br />
<strong>de</strong> handleidingen <strong>van</strong> enkele Ne<strong>de</strong>rlandse <strong>tests</strong> heeft het volgen<strong>de</strong><br />
opgeleverd. Voor <strong>de</strong> Amsterdamse Beroepen Interessen Vragenlijst<br />
(Evers, 1979, 1992) wor<strong>de</strong>n over een perio<strong>de</strong> <strong>van</strong> zestien jaar <strong>voor</strong><br />
sommige schalen verschillen gevon<strong>de</strong>n die oplopen tot twee<br />
standaard<strong>de</strong>viaties. Voor <strong>de</strong> NPV wor<strong>de</strong>n over een perio<strong>de</strong> <strong>van</strong> ruim<br />
twintig jaar verschillen gevon<strong>de</strong>n <strong>van</strong> maximaal 1.4 standaard<strong>de</strong>viatie<br />
bij <strong>de</strong> normgroep selectie, <strong>van</strong> maximaal 1.2 standaard<strong>de</strong>viatie bij<br />
<strong>de</strong> normgroep algemeen en <strong>van</strong> maximaal 0.5 standaard<strong>de</strong>viatie bij<br />
<strong>de</strong> normgroep psychiatrische patiënten (Luteijn, Starren & <strong>van</strong> Dijk,<br />
1985; Barelds, Luteijn, <strong>van</strong> Dijk & Starren, 2007). Hierbij moet<br />
overigens wor<strong>de</strong>n aangetekend dat in bei<strong>de</strong> vragenlijsten ook items<br />
zijn gewijzigd. Amerikaans on<strong>de</strong>rzoek (Twenge, 2000) laat zien dat<br />
over een perio<strong>de</strong> <strong>van</strong> veertig jaar angst- en neuroticismescores in<br />
<strong>de</strong> VS met circa een hele standaardafwijking zijn toegenomen.<br />
In het Duitse <strong>beoor<strong>de</strong>lingssysteem</strong> <strong>voor</strong> <strong>de</strong> <strong>kwaliteit</strong> <strong>van</strong> <strong>tests</strong><br />
(Kersting, 2006) wordt een perio<strong>de</strong> <strong>van</strong> acht jaar <strong>voor</strong> hernormering<br />
aanbevolen, overigens zon<strong>de</strong>r hier consequenties aan te verbin<strong>de</strong>n.<br />
In <strong>de</strong> APA-Standards (APA, 1999, p. 59, Standard 4.18) wordt<br />
gesteld dat: “... so long as the test remains in print, it is the<br />
publisher’s responsibility to assure that the test is renormed with<br />
sufficient frequency to permit continued accurate and appropriate<br />
score interpretations”. De APA noemt hierbij geen termijn. Op basis<br />
<strong>van</strong> bovenstaan<strong>de</strong> bevindingen en daarbij een afweging makend<br />
tussen wat praktisch haalbaar en wenselijk is, komt <strong>de</strong> <strong>COTAN</strong><br />
tot <strong>de</strong> volgen<strong>de</strong> regel. Om <strong>de</strong> gebruiker te atten<strong>de</strong>ren op mogelijk<br />
versleten normen, wordt aan <strong>de</strong> beoor<strong>de</strong>ling <strong>van</strong> <strong>tests</strong> waar<strong>van</strong><br />
hernormerings- of ijkingson<strong>de</strong>rzoek sinds vijftien jaar na het<br />
afsluiten <strong>van</strong> het normeringson<strong>de</strong>rzoek niet heeft plaatsgevon<strong>de</strong>n,<br />
<strong>de</strong> kwalificatie “De normen zijn verou<strong>de</strong>rd” toegevoegd. Na nog<br />
eens vijf jaar zon<strong>de</strong>r <strong>de</strong>rgelijk on<strong>de</strong>rzoek wordt <strong>de</strong>ze kwalificatie<br />
gewijzigd in: “Wegens verou<strong>de</strong>ring zijn <strong>de</strong> normen niet meer<br />
bruikbaar” en wordt <strong>de</strong> beoor<strong>de</strong>ling ‘onvoldoen<strong>de</strong>’. Eenmaal per<br />
jaar zullen alle testbeschrijvingen in <strong>de</strong> via internet te raadplegen<br />
Documentatie <strong>van</strong> Tests en Testresearch op dit punt wor<strong>de</strong>n<br />
aangepast. Om te kunnen beoor<strong>de</strong>len in hoeverre normen mogelijk<br />
zijn verou<strong>de</strong>rd, is het vermel<strong>de</strong>n <strong>van</strong> het jaar (of <strong>de</strong> perio<strong>de</strong>) <strong>van</strong><br />
gegevensverzameling <strong>van</strong> belang. Als dit niet wordt vermeld, wordt<br />
<strong>de</strong> beoor<strong>de</strong>ling <strong>voor</strong> ‘Normen’ daarom ‘onvoldoen<strong>de</strong>’.<br />
Normgerichte interpretatie<br />
Aanwijzingen bij basisvraag 4.3: “Wat is <strong>de</strong> <strong>kwaliteit</strong><br />
<strong>van</strong> <strong>de</strong> verstrekte normgroepen?”<br />
In principe moet <strong>de</strong> testauteur normen verschaffen <strong>voor</strong> elk door<br />
hem genoemd gebruiksdoel (zie vraag 1.1). Het kan blijken dat <strong>de</strong><br />
groepen waar<strong>voor</strong> normen wor<strong>de</strong>n verschaft slechts ge<strong>de</strong>eltelijk<br />
<strong>de</strong> meetpretentie <strong>de</strong>kken. Wanneer een auteur bij<strong>voor</strong>beeld<br />
aangeeft dat een test is bedoeld <strong>voor</strong> keuzebegeleiding binnen<br />
het <strong>voor</strong>berei<strong>de</strong>nd beroepson<strong>de</strong>rwijs én <strong>voor</strong> selectie <strong>voor</strong> functies<br />
op dit niveau, dan moeten <strong>voor</strong> bei<strong>de</strong> situaties normen wor<strong>de</strong>n<br />
verstrekt. Het is echter irreëel te verwachten dat <strong>voor</strong> elke functie<br />
op dit niveau normen wor<strong>de</strong>n verschaft.<br />
Wil een normgroep goed aan zijn doel kunnen beantwoor<strong>de</strong>n<br />
(namelijk het vormen <strong>van</strong> een betrouwbare reeks <strong>van</strong> referentiepunten),<br />
dan moet <strong>de</strong> normgroep én <strong>van</strong> voldoen<strong>de</strong> om<strong>van</strong>g te zijn<br />
én representatief zijn <strong>voor</strong> <strong>de</strong> bedoel<strong>de</strong> groep. Voor <strong>de</strong> beoor<strong>de</strong>ling<br />
<strong>van</strong> bei<strong>de</strong> aspecten wor<strong>de</strong>n hieron<strong>de</strong>r aanwijzingen gegeven. De<br />
beoor<strong>de</strong>ling <strong>voor</strong> vraag 4.3 kan alleen ‘goed’ wor<strong>de</strong>n wanneer bei<strong>de</strong><br />
aspecten (vragen 4.3.a en 4.3.b) als ‘goed’ wor<strong>de</strong>n beoor<strong>de</strong>eld. De<br />
beoor<strong>de</strong>ling wordt ‘onvoldoen<strong>de</strong>’ wanneer minstens een <strong>van</strong> bei<strong>de</strong><br />
aspecten ‘onvoldoen<strong>de</strong>’ wordt beoor<strong>de</strong>eld. In alle an<strong>de</strong>re gevallen<br />
wordt <strong>de</strong> beoor<strong>de</strong>ling ‘voldoen<strong>de</strong>’.<br />
<strong>COTAN</strong> Beoor<strong>de</strong>lingssysteem <strong>voor</strong> <strong>de</strong> <strong>kwaliteit</strong> <strong>van</strong> <strong>tests</strong><br />
21