Rekenen voor peuters - Toetswijzer
Rekenen voor peuters - Toetswijzer
Rekenen voor peuters - Toetswijzer
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Het referentieprofiel<br />
Om terdege rekening te houden met de verschillen in moeilijkheid van de onderscheiden<br />
categorieën kunnen we het beste een soort verwacht profiel gaan nemen als referentielijn.<br />
Maar we dienen goed te formuleren wat we met ‘verwachting’ bedoelen. Nemen we<br />
bij<strong>voor</strong>beeld als verwachting de gemiddelde categoriescore in de populatie van leerlingen van<br />
groep acht die deelnemen aan de Eindtoets, dan wordt de vergelijking weer gecompliceerd<br />
omdat het aldus gedefinieerde verwachte profiel in twee opzichten kan verschillen van het<br />
geobserveerde profiel uit Figuur 1: het kan verschillen door het algemene niveau (in het<br />
<strong>voor</strong>beeld doet het dit ook, want een gewogen score van 120 op het onderdeel <strong>Rekenen</strong> is een<br />
tamelijk lage score) en het kan ook verschillen qua vorm. De directe visuele interpretatie van<br />
beide profielen wordt daardoor bemoeilijkt. We kunnen het probleem vereenvoudigen door<br />
een specifiek geobserveerd profiel te vergelijken met een gemiddeld profiel van alle<br />
leerlingen die op de hele toets (d.i. op het hele onderdeel <strong>Rekenen</strong>) dezelfde of ongeveer<br />
dezelfde score behalen als de score van het geobserveerde profiel.<br />
Dit verwachte profiel kunnen we op twee manieren bepalen: empirisch of theoretisch.<br />
Empirisch betekent dat we in het databestand van de Eindtoets het gemiddelde profiel bepalen<br />
van alle leerlingen met dezelfde score op het hele onderdeel <strong>Rekenen</strong> als de onderzochte<br />
leerling. Voor het onderzoek naar een andere leerling met een andere gewogen score op het<br />
onderdeel <strong>Rekenen</strong> kunnen we hetzelfde doen. We moeten deze hele procedure dus uitvoeren<br />
<strong>voor</strong> alle mogelijke scores op het onderdeel <strong>Rekenen</strong>. Drukken we het geobserveerde profiel<br />
uit met gewogen scores, dan moeten we deze procedure toepassen <strong>voor</strong> alle mogelijke<br />
gewogen scores. In termen van computertijd is dit niet zo’n groot probleem, maar wel in<br />
termen van statistische stabiliteit. Immers de frequentie van sommige gewogen scores zal<br />
behoorlijk groot zijn, maar <strong>voor</strong> andere scores zullen we onvermijdelijk te maken krijgen met<br />
kleine tot zeer kleine frequenties. De statistische stabiliteit van de verwachte profielen zal dan<br />
van score tot score gaan verschillen en dit is een onwenselijke situatie. Bovendien komt er<br />
nog een probleem bij als we een dergelijke werkwijze zouden willen toepassen in het LVS.<br />
Bij de Eindtoets worden de data centraal verzameld op het Cito, maar bij het LVS is dat niet<br />
zo. De data die daar beschikbaar zijn betreffen alleen de leerlingen van de school zelf en dan<br />
wordt de empirische aanpak wel heel problematisch.<br />
Als de gegevens met OPLM gecalibreerd zijn kunnen we ook theoretisch het verwachte<br />
profiel afleiden. De verwachte (gewogen) score <strong>voor</strong> elke categorie is een (nogal<br />
ingewikkelde) functie van de itemparameters (de discriminatie-indices en de moeilijkheidsparameters).<br />
Details over hoe die verwachte waarden worden berekend worden gegeven in<br />
Appendix A van dit rapport. In Figuur 3a wordt hetzelfde geobserveerde profiel afgebeeld als<br />
in Figuur 2, maar nu samen met het verwachte profiel. In Figuur 3b zijn beide profielen<br />
omgezet als percentage van de maximum te behalen score op elke categorie.<br />
9