01.09.2013 Views

COTAN beoordelingssysteem voor de kwaliteit van tests - NIP

COTAN beoordelingssysteem voor de kwaliteit van tests - NIP

COTAN beoordelingssysteem voor de kwaliteit van tests - NIP

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Aanwijzingen bij basisvraag 4.1: “Wor<strong>de</strong>n normen verstrekt?”<br />

Normgegevens, hetzij bedoeld <strong>voor</strong> normgerichte interpretatie<br />

(zoals normtabellen), hetzij bedoeld <strong>voor</strong> domeingerichte of<br />

criteriumgerichte interpretatie (zoals grensscores of verwachtingstabellen),<br />

moeten beschikbaar zijn op het moment dat <strong>de</strong> test<br />

<strong>voor</strong> daadwerkelijk gebruik verkrijgbaar is. De volgen<strong>de</strong> situaties<br />

kunnen lei<strong>de</strong>n tot een negatief antwoord op <strong>de</strong>ze vraag:<br />

• De hier bedoel<strong>de</strong> gegevens wor<strong>de</strong>n niet verstrekt (er wor<strong>de</strong>n<br />

bij<strong>voor</strong>beeld alleen gemid<strong>de</strong>l<strong>de</strong>n en standaard<strong>de</strong>viaties <strong>van</strong><br />

<strong>de</strong> on<strong>de</strong>rzochte groepen vermeld).<br />

• Bij <strong>tests</strong> die zijn bedoeld <strong>voor</strong> interpretatie op groepsniveau<br />

wor<strong>de</strong>n normtabellen verstrekt die zijn gebaseerd op individuele<br />

scores, en omgekeerd (zie ook ad. 4.3.a).<br />

• Nadat <strong>de</strong> normen zijn verzameld, hebben er nog wijzigingen<br />

in <strong>de</strong> test zelf plaatsgevon<strong>de</strong>n, bij<strong>voor</strong>beeld wijzigingen in <strong>de</strong><br />

items of <strong>de</strong> instructie.<br />

• De normen zijn verzameld met behulp <strong>van</strong> een papier-en-potloodversie,<br />

terwijl <strong>de</strong> te beoor<strong>de</strong>len versie een computerversie<br />

betreft (of vice versa). Voor vragenlijsten heeft dit in het<br />

algemeen weinig invloed op <strong>de</strong> waar<strong>de</strong> <strong>van</strong> <strong>de</strong> normen<br />

(Bartram, 2005; King & Miles, 1995; Mead & Drasgow, 1993).<br />

Voor capaciteiten- en vaardigheids<strong>tests</strong> en/of <strong>tests</strong> die<br />

gebon<strong>de</strong>n zijn aan een tijdslimiet zullen echter nieuwe normen<br />

moeten wor<strong>de</strong>n verzameld.<br />

Aanwijzingen bij basisvraag 4.2: “Zijn <strong>de</strong> normen actueel?”<br />

Normen zijn aan slijtage on<strong>de</strong>rhevig. Van <strong>de</strong> psychometrische<br />

kenmerken <strong>van</strong> een test zijn normen het meest gevoelig <strong>voor</strong><br />

maatschappelijke veran<strong>de</strong>ringen, veran<strong>de</strong>ringen in het on<strong>de</strong>rwijs<br />

en in <strong>de</strong> inhoud <strong>van</strong> functies. Daarom moet er <strong>van</strong> tijd tot tijd<br />

hernormering <strong>van</strong> <strong>de</strong> test plaatsvin<strong>de</strong>n, of moet <strong>de</strong> auteur<br />

door on<strong>de</strong>rzoek aantonen dat hernormering niet nodig is. Voor<br />

intelligentie<strong>tests</strong> moet bij<strong>voor</strong>beeld rekening wor<strong>de</strong>n gehou<strong>de</strong>n<br />

met het Flynn-effect, waardoor normen verou<strong>de</strong>ren (zie bij<strong>voor</strong>beeld<br />

Resing & Drenth, 2007, p. 142-145). Dit effect wordt geschat<br />

op 3 IQ-punten per tien jaar, of 4.5 IQ-punten per vijftien jaar. Dit<br />

is gelijk aan circa één standaardmeetfout (bij een betrouwbaarheid<br />

<strong>van</strong> .91). Waarschijnlijk geldt een <strong>de</strong>rgelijk effect ook <strong>voor</strong> verwante<br />

<strong>tests</strong>, zoals testbatterijen <strong>voor</strong> algemene of specifieke cognitieve<br />

capaciteiten. Voor persoonlijkheids<strong>tests</strong> is er niets bekend over<br />

<strong>de</strong>rgelijke algemene effecten. Vergelijking tussen <strong>de</strong> gegevens in<br />

<strong>de</strong> handleidingen <strong>van</strong> enkele Ne<strong>de</strong>rlandse <strong>tests</strong> heeft het volgen<strong>de</strong><br />

opgeleverd. Voor <strong>de</strong> Amsterdamse Beroepen Interessen Vragenlijst<br />

(Evers, 1979, 1992) wor<strong>de</strong>n over een perio<strong>de</strong> <strong>van</strong> zestien jaar <strong>voor</strong><br />

sommige schalen verschillen gevon<strong>de</strong>n die oplopen tot twee<br />

standaard<strong>de</strong>viaties. Voor <strong>de</strong> NPV wor<strong>de</strong>n over een perio<strong>de</strong> <strong>van</strong> ruim<br />

twintig jaar verschillen gevon<strong>de</strong>n <strong>van</strong> maximaal 1.4 standaard<strong>de</strong>viatie<br />

bij <strong>de</strong> normgroep selectie, <strong>van</strong> maximaal 1.2 standaard<strong>de</strong>viatie bij<br />

<strong>de</strong> normgroep algemeen en <strong>van</strong> maximaal 0.5 standaard<strong>de</strong>viatie bij<br />

<strong>de</strong> normgroep psychiatrische patiënten (Luteijn, Starren & <strong>van</strong> Dijk,<br />

1985; Barelds, Luteijn, <strong>van</strong> Dijk & Starren, 2007). Hierbij moet<br />

overigens wor<strong>de</strong>n aangetekend dat in bei<strong>de</strong> vragenlijsten ook items<br />

zijn gewijzigd. Amerikaans on<strong>de</strong>rzoek (Twenge, 2000) laat zien dat<br />

over een perio<strong>de</strong> <strong>van</strong> veertig jaar angst- en neuroticismescores in<br />

<strong>de</strong> VS met circa een hele standaardafwijking zijn toegenomen.<br />

In het Duitse <strong>beoor<strong>de</strong>lingssysteem</strong> <strong>voor</strong> <strong>de</strong> <strong>kwaliteit</strong> <strong>van</strong> <strong>tests</strong><br />

(Kersting, 2006) wordt een perio<strong>de</strong> <strong>van</strong> acht jaar <strong>voor</strong> hernormering<br />

aanbevolen, overigens zon<strong>de</strong>r hier consequenties aan te verbin<strong>de</strong>n.<br />

In <strong>de</strong> APA-Standards (APA, 1999, p. 59, Standard 4.18) wordt<br />

gesteld dat: “... so long as the test remains in print, it is the<br />

publisher’s responsibility to assure that the test is renormed with<br />

sufficient frequency to permit continued accurate and appropriate<br />

score interpretations”. De APA noemt hierbij geen termijn. Op basis<br />

<strong>van</strong> bovenstaan<strong>de</strong> bevindingen en daarbij een afweging makend<br />

tussen wat praktisch haalbaar en wenselijk is, komt <strong>de</strong> <strong>COTAN</strong><br />

tot <strong>de</strong> volgen<strong>de</strong> regel. Om <strong>de</strong> gebruiker te atten<strong>de</strong>ren op mogelijk<br />

versleten normen, wordt aan <strong>de</strong> beoor<strong>de</strong>ling <strong>van</strong> <strong>tests</strong> waar<strong>van</strong><br />

hernormerings- of ijkingson<strong>de</strong>rzoek sinds vijftien jaar na het<br />

afsluiten <strong>van</strong> het normeringson<strong>de</strong>rzoek niet heeft plaatsgevon<strong>de</strong>n,<br />

<strong>de</strong> kwalificatie “De normen zijn verou<strong>de</strong>rd” toegevoegd. Na nog<br />

eens vijf jaar zon<strong>de</strong>r <strong>de</strong>rgelijk on<strong>de</strong>rzoek wordt <strong>de</strong>ze kwalificatie<br />

gewijzigd in: “Wegens verou<strong>de</strong>ring zijn <strong>de</strong> normen niet meer<br />

bruikbaar” en wordt <strong>de</strong> beoor<strong>de</strong>ling ‘onvoldoen<strong>de</strong>’. Eenmaal per<br />

jaar zullen alle testbeschrijvingen in <strong>de</strong> via internet te raadplegen<br />

Documentatie <strong>van</strong> Tests en Testresearch op dit punt wor<strong>de</strong>n<br />

aangepast. Om te kunnen beoor<strong>de</strong>len in hoeverre normen mogelijk<br />

zijn verou<strong>de</strong>rd, is het vermel<strong>de</strong>n <strong>van</strong> het jaar (of <strong>de</strong> perio<strong>de</strong>) <strong>van</strong><br />

gegevensverzameling <strong>van</strong> belang. Als dit niet wordt vermeld, wordt<br />

<strong>de</strong> beoor<strong>de</strong>ling <strong>voor</strong> ‘Normen’ daarom ‘onvoldoen<strong>de</strong>’.<br />

Normgerichte interpretatie<br />

Aanwijzingen bij basisvraag 4.3: “Wat is <strong>de</strong> <strong>kwaliteit</strong><br />

<strong>van</strong> <strong>de</strong> verstrekte normgroepen?”<br />

In principe moet <strong>de</strong> testauteur normen verschaffen <strong>voor</strong> elk door<br />

hem genoemd gebruiksdoel (zie vraag 1.1). Het kan blijken dat <strong>de</strong><br />

groepen waar<strong>voor</strong> normen wor<strong>de</strong>n verschaft slechts ge<strong>de</strong>eltelijk<br />

<strong>de</strong> meetpretentie <strong>de</strong>kken. Wanneer een auteur bij<strong>voor</strong>beeld<br />

aangeeft dat een test is bedoeld <strong>voor</strong> keuzebegeleiding binnen<br />

het <strong>voor</strong>berei<strong>de</strong>nd beroepson<strong>de</strong>rwijs én <strong>voor</strong> selectie <strong>voor</strong> functies<br />

op dit niveau, dan moeten <strong>voor</strong> bei<strong>de</strong> situaties normen wor<strong>de</strong>n<br />

verstrekt. Het is echter irreëel te verwachten dat <strong>voor</strong> elke functie<br />

op dit niveau normen wor<strong>de</strong>n verschaft.<br />

Wil een normgroep goed aan zijn doel kunnen beantwoor<strong>de</strong>n<br />

(namelijk het vormen <strong>van</strong> een betrouwbare reeks <strong>van</strong> referentiepunten),<br />

dan moet <strong>de</strong> normgroep én <strong>van</strong> voldoen<strong>de</strong> om<strong>van</strong>g te zijn<br />

én representatief zijn <strong>voor</strong> <strong>de</strong> bedoel<strong>de</strong> groep. Voor <strong>de</strong> beoor<strong>de</strong>ling<br />

<strong>van</strong> bei<strong>de</strong> aspecten wor<strong>de</strong>n hieron<strong>de</strong>r aanwijzingen gegeven. De<br />

beoor<strong>de</strong>ling <strong>voor</strong> vraag 4.3 kan alleen ‘goed’ wor<strong>de</strong>n wanneer bei<strong>de</strong><br />

aspecten (vragen 4.3.a en 4.3.b) als ‘goed’ wor<strong>de</strong>n beoor<strong>de</strong>eld. De<br />

beoor<strong>de</strong>ling wordt ‘onvoldoen<strong>de</strong>’ wanneer minstens een <strong>van</strong> bei<strong>de</strong><br />

aspecten ‘onvoldoen<strong>de</strong>’ wordt beoor<strong>de</strong>eld. In alle an<strong>de</strong>re gevallen<br />

wordt <strong>de</strong> beoor<strong>de</strong>ling ‘voldoen<strong>de</strong>’.<br />

<strong>COTAN</strong> Beoor<strong>de</strong>lingssysteem <strong>voor</strong> <strong>de</strong> <strong>kwaliteit</strong> <strong>van</strong> <strong>tests</strong><br />

21

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!