01.09.2013 Views

COTAN beoordelingssysteem voor de kwaliteit van tests - NIP

COTAN beoordelingssysteem voor de kwaliteit van tests - NIP

COTAN beoordelingssysteem voor de kwaliteit van tests - NIP

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

komen. Er ligt geen steekproefmo<strong>de</strong>l aan <strong>de</strong> verzameling <strong>van</strong><br />

<strong>de</strong> gegevens ten grondslag. Het probleem bij gelegenheidssteekproeven<br />

is dat men niet goed weet wat men precies verzamelt.<br />

Wanneer bij<strong>voor</strong>beeld een <strong>de</strong>rgelijke steekproef is gebaseerd op <strong>de</strong><br />

cliënten <strong>van</strong> een aantal beroepskeuzebureaus, kan men een <strong>de</strong>rgelijke<br />

groep dan beschouwen als een doorsne<strong>de</strong> <strong>van</strong> <strong>de</strong> Ne<strong>de</strong>rlandse<br />

bevolking <strong>van</strong> <strong>de</strong>zelf<strong>de</strong> leeftijd en opleiding, of is er re<strong>de</strong>n om aan<br />

te nemen dat mensen met een beroepskeuzeprobleem verschillen<br />

<strong>van</strong> <strong>de</strong> overige Ne<strong>de</strong>rlan<strong>de</strong>rs? Of: kan men <strong>de</strong> normgroep die is<br />

opgebouwd uit <strong>de</strong> sollicitanten die zijn getest door wervings- en<br />

selectiebureau X met drie vestigingen verspreid over Ne<strong>de</strong>rland<br />

gebruiken <strong>voor</strong> <strong>de</strong> sollicitanten bij bureau Y? In het algemeen zullen<br />

<strong>de</strong>rgelijke normgroepen <strong>de</strong> beoor<strong>de</strong>ling ‘onvoldoen<strong>de</strong>’ krijgen,<br />

omdat hun samenstelling onbekend of oncontroleerbaar is. Door<br />

sommige testauteurs wordt <strong>de</strong> om<strong>van</strong>g <strong>van</strong> <strong>de</strong> normgroep wel als<br />

argument <strong>voor</strong> <strong>de</strong> representativiteit, geldigheid of toepasbaarheid<br />

<strong>van</strong> <strong>de</strong> normen beschouwd. De om<strong>van</strong>g <strong>van</strong> <strong>de</strong>rgelijke normgroepen<br />

is in<strong>de</strong>rdaad meestal geen probleem (aantallen <strong>van</strong> enkele duizen<strong>de</strong>n<br />

zijn geen uitzon<strong>de</strong>ring), maar <strong>de</strong> om<strong>van</strong>g <strong>van</strong> <strong>de</strong> steekproef zegt op<br />

zich niets over <strong>de</strong> representativiteit, noch over <strong>de</strong> bruikbaarheid.<br />

Bij<strong>voor</strong>beeld: <strong>de</strong> opdrachtgevers <strong>van</strong> bureau X bestaan <strong>voor</strong>namelijk<br />

uit bedrijven in <strong>de</strong> sector ICT. De normen die gebaseerd zijn op <strong>de</strong>ze<br />

sollicitantengroep zijn mogelijk wel geschikt <strong>voor</strong> an<strong>de</strong>re wervings-<br />

en selectiebureaus die gespecialiseerd zijn in <strong>de</strong> ICT-branche, maar<br />

niet <strong>voor</strong> bureaus die hun opdrachten <strong>voor</strong>namelijk uit an<strong>de</strong>re<br />

branches ont<strong>van</strong>gen.<br />

Men kan op gelegenheidssteekproeven gebaseer<strong>de</strong> normen<br />

beschouwen als een bijzon<strong>de</strong>re vorm <strong>van</strong> regionale normen (omgekeerd<br />

zullen regionale normen ook vaak een gelegenheidssteekproef<br />

zijn); men zou bij<strong>voor</strong>beeld <strong>de</strong> sollicitanten bij bureau X kunnen<br />

beschouwen als een steekproef <strong>van</strong> alle sollicitanten in Ne<strong>de</strong>rland.<br />

Net zoals bij regionale normen, kan <strong>de</strong> <strong>kwaliteit</strong> <strong>van</strong> een gelegenheidssteekproef<br />

als ‘voldoen<strong>de</strong>’ wor<strong>de</strong>n beoor<strong>de</strong>eld wanneer er een<br />

uitputten<strong>de</strong> beschrijving <strong>van</strong> <strong>de</strong> normgroep over mogelijk rele<strong>van</strong>te<br />

variabelen <strong>van</strong> <strong>de</strong> normgroep wordt gegeven. Een beschrijving en<br />

het aantonen <strong>van</strong> representativiteit <strong>voor</strong> <strong>de</strong> beoog<strong>de</strong> doelgroep in<br />

termen <strong>van</strong> sekse, leeftijd en etniciteit alléén is echter niet genoeg;<br />

het gaat daarnaast om variabelen die samenhangen met het<br />

gebruiksdoel <strong>van</strong> <strong>de</strong> test, zoals bedrijfstak en functie in selectiesituaties<br />

en type stoornis in klinische situaties. Of <strong>de</strong> beoor<strong>de</strong>ling<br />

‘voldoen<strong>de</strong>’ vervolgens daadwerkelijk wordt toegekend, is volgens<br />

<strong>de</strong> gebruikelijke wegingsregels afhankelijk <strong>van</strong> <strong>de</strong> beoor<strong>de</strong>ling <strong>van</strong><br />

<strong>de</strong> vragen 4.4 tot en met 4.7. De motivering <strong>voor</strong> het geven <strong>van</strong><br />

een ‘voldoen<strong>de</strong>’ in <strong>de</strong>ze gevallen is dat <strong>de</strong>rgelijke normen goed<br />

bruikbaar zijn wanneer <strong>de</strong> gebruiker weet waarmee een cliënt of<br />

sollicitant kan wor<strong>de</strong>n vergeleken.<br />

Aanwijzingen bij vraag 4.4: “Wor<strong>de</strong>n <strong>de</strong> betekenis en <strong>de</strong><br />

beperkingen <strong>van</strong> <strong>de</strong> normschaal dui<strong>de</strong>lijk gemaakt <strong>voor</strong> <strong>de</strong><br />

gebruiker en is het type normschaal in overeenstemming<br />

met het doel <strong>van</strong> <strong>de</strong> test?”<br />

Bij <strong>de</strong> omzetting <strong>van</strong> ruwe scores in afgelei<strong>de</strong> scores kan er een<br />

keuze wor<strong>de</strong>n gemaakt uit drie typen normen (Drenth & Sijtsma,<br />

2006): verhoudingsnormen, normen gebaseerd op rangor<strong>de</strong> en<br />

normen gebaseerd op gemid<strong>de</strong>l<strong>de</strong> en spreiding.<br />

Een bekend <strong>voor</strong>beeld <strong>van</strong> verhoudingsnormen is het ou<strong>de</strong>rwetse<br />

Intelligentie Quotiënt (IQ), waarbij mentale leeftijd wordt ge<strong>de</strong>eld<br />

door chronologische leeftijd. Tegenwoordig wordt <strong>de</strong>ze wijze <strong>van</strong><br />

IQ-berekening echter niet of nauwelijks meer gebruikt. Een an<strong>de</strong>r<br />

<strong>voor</strong>beeld is het Didactisch Leeftijds Equivalent (DLE), waarbij <strong>de</strong><br />

verhouding wordt berekend tussen het niveau <strong>van</strong> <strong>de</strong> leerprestatie<br />

die een kind heeft geleverd in termen <strong>van</strong> aantal maan<strong>de</strong>n on<strong>de</strong>rwijs<br />

waarna <strong>de</strong>ze prestatie mag wor<strong>de</strong>n verwacht, en het werkelijk<br />

aantal maan<strong>de</strong>n gevolgd on<strong>de</strong>rwijs. Tegen verhoudingsnormen<br />

bestaan vele praktische en theoretische bezwaren. Zie <strong>voor</strong> een<br />

uitgebrei<strong>de</strong> bespreking hier<strong>van</strong> Evers en Resing (2007). Het gebruik<br />

<strong>van</strong> verhoudingsnormen in het algemeen en DLE’s in het bijzon<strong>de</strong>r<br />

wordt door <strong>de</strong> <strong>COTAN</strong> afgekeurd. Dit heeft als consequentie dat<br />

<strong>tests</strong> die uitsluitend in termen <strong>van</strong> DLE’s rapporteren een ‘onvoldoen<strong>de</strong>’<br />

krijgen <strong>voor</strong> normen. Ook bij <strong>tests</strong> die naast standaard -<br />

scores of rangor<strong>de</strong>scores DLE’s rapporteren – maar <strong>de</strong> <strong>COTAN</strong> ziet<br />

rapportage in termen <strong>van</strong> DLE’s het liefst geheel verdwijnen – moet<br />

<strong>de</strong> rapportage in standaardscores of rangor<strong>de</strong>scores <strong>voor</strong>opstaan en<br />

nadrukkelijk wor<strong>de</strong>n aanbevolen, vergezeld <strong>van</strong> een ge<strong>de</strong>gen uitleg<br />

<strong>van</strong> <strong>de</strong>ze systemen <strong>voor</strong> <strong>de</strong> gebruikers. Daarnaast moet <strong>de</strong> gebruiker<br />

in elk geval in <strong>de</strong> handleiding uitdrukkelijk <strong>voor</strong> <strong>de</strong> beperkingen <strong>van</strong><br />

DLE’s wor<strong>de</strong>n gewaarschuwd.<br />

Normen die gebaseerd zijn op rangor<strong>de</strong> zijn percentielen en daar<strong>van</strong><br />

afgelei<strong>de</strong> schaaltypen, zoals vigintielen, <strong>de</strong>cielen en het A t/m E-<br />

systeem dat door het Cito wordt gebruikt. Voorbeel<strong>de</strong>n <strong>van</strong> normtypen<br />

die gebaseerd zijn op gemid<strong>de</strong>l<strong>de</strong> en spreiding, hier <strong>de</strong>viatienormen<br />

genoemd, zijn stanines, C-scores, T-scores en <strong>de</strong>viatie-IQ’s.<br />

Bij <strong>de</strong>viatienormen kan er ver<strong>de</strong>r nog on<strong>de</strong>rscheid wor<strong>de</strong>n gemaakt<br />

tussen lineaire transformaties en genormaliseer<strong>de</strong> transformaties.<br />

In principe moet er <strong>van</strong> normaliseren<strong>de</strong> transformaties gebruik<br />

zijn gemaakt, tenzij <strong>de</strong> ruwe scores al bij bena<strong>de</strong>ring normaal zijn<br />

ver<strong>de</strong>eld. Als er meer dan één normgroep wordt on<strong>de</strong>rschei<strong>de</strong>n,<br />

bij<strong>voor</strong>beeld <strong>voor</strong> opeenvolgen<strong>de</strong> leeftijdsgroepen of leerjaren,<br />

is het beter als er eerst fit-procedures zijn toegepast op <strong>de</strong> cumulatieve<br />

ver<strong>de</strong>ling (Laros & Tellegen, 1991), omdat transformaties die<br />

zijn gebaseerd op het direct omzetten <strong>van</strong> <strong>de</strong> geobserveer<strong>de</strong> cumulatieve<br />

proporties sterk steekproefgevoelig zijn.<br />

Wanneer leeftijds- of leerjaarnormen wor<strong>de</strong>n verstrekt, kan een te<br />

breed leeftijds- of leerjaarinterval ertoe lei<strong>de</strong>n dat <strong>de</strong> prestaties aan<br />

het begin <strong>van</strong> het interval wor<strong>de</strong>n on<strong>de</strong>rschat en aan het eind overschat.<br />

Vooral bij capaciteiten<strong>tests</strong> <strong>voor</strong> jonge kin<strong>de</strong>ren kan dit een<br />

rol spelen, omdat het verschil in score binnen het tijdsbestek <strong>van</strong><br />

een jaar een tiental IQ-punten kan bedragen. Echter, ook in <strong>de</strong> eerste<br />

leerjaren <strong>van</strong> het <strong>voor</strong>tgezet on<strong>de</strong>rwijs kan het verschil tussen twee<br />

opeenvolgen<strong>de</strong> leerjaren nog een halve standaard<strong>de</strong>viatie bedragen.<br />

Dergelijke vertekeningen kunnen gemakkelijk wor<strong>de</strong>n <strong>voor</strong>komen<br />

door het aantal normtabellen bij leeftijds- en leerjaarnormen uit te<br />

brei<strong>de</strong>n, door zogenoem<strong>de</strong> continue normen te gebruiken of door te<br />

corrigeren <strong>voor</strong> <strong>de</strong> dag waarop <strong>de</strong> test is afgenomen (zogenoem<strong>de</strong><br />

<strong>COTAN</strong> Beoor<strong>de</strong>lingssysteem <strong>voor</strong> <strong>de</strong> <strong>kwaliteit</strong> <strong>van</strong> <strong>tests</strong> 25

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!