07.01.2016 Views

Prestaties op papieren en digitale examens wat is het verschil?

resultaten_literatuuronderzoek

resultaten_literatuuronderzoek

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

mede veroorzaakt doordat de computer ingevoerde antwoord<strong>en</strong> van kandidat<strong>en</strong> t<strong>en</strong> onrechte als<br />

fout interpreteert terwijl e<strong>en</strong> m<strong>en</strong>selijke beoordelaar ze <strong>op</strong> papier goed of gedeeltelijk goed zou<br />

rek<strong>en</strong><strong>en</strong> (zie hiervoor ook paragraaf 3.5).<br />

E<strong>en</strong> andere mogelijk bron van moduseffect<strong>en</strong> <strong>is</strong> dat <strong>het</strong> ontwerp van de interface <strong>het</strong> niet toestaat<br />

om fout<strong>en</strong> bij <strong>het</strong> invoer<strong>en</strong> van antwoord<strong>en</strong> onmiddellijk te corriger<strong>en</strong> of om eerder ingevoerde<br />

antwoord<strong>en</strong> te bekijk<strong>en</strong> <strong>en</strong> zo nodig te verander<strong>en</strong>, zoals bij e<strong>en</strong> PPT-versie van dezelfde toets<br />

uiteraard wel mogelijk <strong>is</strong>. Overig<strong>en</strong>s zijn de auteurs van m<strong>en</strong>ing dat <strong>het</strong> hier e<strong>en</strong> triviaal<br />

ontwerpprobleem betreft aangezi<strong>en</strong> er t<strong>en</strong> tijde van hun review reeds <strong>verschil</strong>l<strong>en</strong>de goede<br />

<strong>op</strong>lossing<strong>en</strong> beschikbaar war<strong>en</strong> (die vanaf 2015 ook in de rek<strong>en</strong>toets<strong>en</strong> geïmplem<strong>en</strong>teerd zijn).<br />

W<strong>is</strong>e <strong>en</strong> Plake (1989)<br />

De review van W<strong>is</strong>e <strong>en</strong> Plake (1989) <strong>is</strong> vooral van belang voor onze derde vraagstelling naar <strong>het</strong><br />

verme<strong>en</strong>de negatieve effect van <strong>het</strong> ontbrek<strong>en</strong> van mogelijkhed<strong>en</strong> tot item review in eersteg<strong>en</strong>eratie<br />

CBT <strong>op</strong> de prestaties. Vandaar dat we de resultat<strong>en</strong> ervan besprek<strong>en</strong> in paragraaf 3.3.<br />

Dillon (1992)<br />

De review van Dillon (1992) <strong>is</strong> voor ons minder interessant omdat <strong>het</strong> vooral betrekking heeft <strong>op</strong><br />

<strong>verschil</strong>l<strong>en</strong> tuss<strong>en</strong> <strong>het</strong> lez<strong>en</strong> <strong>en</strong> begrijp<strong>en</strong> van grote hoeveelhed<strong>en</strong> informatie <strong>op</strong> <strong>het</strong> scherm of<br />

papier. E<strong>en</strong> van de conclusies was dat <strong>het</strong> lez<strong>en</strong> van <strong>het</strong> scherm ongeveer 20% tot 30% langzamer<br />

gaat dan van papier, e<strong>en</strong> conclusies die anno 2015 vanwege de grote techn<strong>is</strong>che verbetering<strong>en</strong><br />

waarschijnlijk grot<strong>en</strong>deels achterhaald <strong>is</strong>.<br />

Bergstrom (1992)<br />

Bergstrom (1992) analyseerde twintig studies zoals beschrev<strong>en</strong> in acht onderzoeksrapport<strong>en</strong> waarin<br />

de prestaties <strong>op</strong> PPP werd<strong>en</strong> vergelek<strong>en</strong> met die <strong>op</strong> adaptieve computertoets<strong>en</strong> (CAT). Ondanks<br />

<strong>verschil</strong>l<strong>en</strong> tuss<strong>en</strong> de studies qua getoetste leerstof, de leeftijd van de proefperson<strong>en</strong>, <strong>het</strong> gebruikte<br />

IRT-model <strong>en</strong> <strong>het</strong> onderzoekontwerp blek<strong>en</strong> PPT <strong>en</strong> CAT over <strong>het</strong> algeme<strong>en</strong> tot vergelijkbare<br />

prestaties te leid<strong>en</strong>. Na verwijdering van vijf studies die te sterk bijdroeg<strong>en</strong> aan de <strong>het</strong>erog<strong>en</strong>iteit van<br />

de effectgroottes, vond zij e<strong>en</strong> gemiddelde effectgrootte van -.002. In de studies waarin e<strong>en</strong><br />

significant gemiddeld <strong>verschil</strong> gevond<strong>en</strong> werd, war<strong>en</strong> de scores <strong>op</strong> de PPT hoger dan die <strong>op</strong> de CAT<br />

als de PPT als eerste was afg<strong>en</strong>om<strong>en</strong>. De auteur doet de aanbeveling nader onderzoek te do<strong>en</strong> naar<br />

scroll<strong>en</strong> als mogelijke verklaring voor de lagere prestaties <strong>op</strong> CAT.<br />

Mead <strong>en</strong> Drasgow (1993)<br />

In hun meta-analyse analyseerd<strong>en</strong> Mead <strong>en</strong> Drasgow (1993) e<strong>en</strong> groot aantal studies naar <strong>verschil</strong>l<strong>en</strong><br />

tuss<strong>en</strong> <strong>papier<strong>en</strong></strong> <strong>en</strong> <strong>digitale</strong> afname van power <strong>en</strong> speedtests. Voor power tests met e<strong>en</strong> tijdslimiet -<br />

die in <strong>het</strong> onderwijs veel gebruikt word<strong>en</strong> - bedroeg de effectgrootte van <strong>het</strong> gemiddeld <strong>verschil</strong><br />

tuss<strong>en</strong> PPT <strong>en</strong> CBT .03 met e<strong>en</strong> standaarddeviatie van .15. CBT’s zijn gemiddeld dus nauwelijks<br />

moeilijker dan PPT’s <strong>en</strong> <strong>het</strong> gemiddeld prestatie<strong>verschil</strong> varieert weinig van studie tot studie.<br />

Mead <strong>en</strong> Drasgow (1993) kek<strong>en</strong> ook naar <strong>het</strong> effect van de afnamemodus <strong>op</strong> de rangord<strong>en</strong>ing van<br />

deg<strong>en</strong><strong>en</strong> die getoetst werd<strong>en</strong>. Voor power tests was de gemiddelde correlatie (na correctie voor<br />

onbetrouwbaarheid) zeer hoog, te wet<strong>en</strong> .91 over 123 geanalyseerde correlaties, <strong>wat</strong> er <strong>op</strong> wijst dat<br />

de rangord<strong>en</strong>ing van de leerling<strong>en</strong> nag<strong>en</strong>oeg gelijk <strong>is</strong>.<br />

Voor speed tests was de gemiddelde correlatie veel lager, namelijk .72 over 36 correlaties.<br />

De auteurs vond<strong>en</strong> ge<strong>en</strong> <strong>verschil</strong> tuss<strong>en</strong> lineaire (CBT) <strong>en</strong> adaptieve (CAT) <strong>digitale</strong> toetsing.<br />

© Stichting Cito, Arnhem 2015 10

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!