04.02.2014 Aufrufe

Herunterladen - MDR

Herunterladen - MDR

Herunterladen - MDR

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Testdesign und Auswertung des Ländervergleichs 395<br />

13.1.3 Verteilung der Testhefte auf Schülerinnen und Schüler<br />

Die Stichprobenziehung erfolgte ebenso wie die gesamte Testadministration<br />

durch das IEA Data Processing and Research Center (DPC; siehe Kapitel 4).<br />

Schülerinnen und Schülern ohne sonderpädagogischen Förderbedarf wurde<br />

jeweils eines der insgesamt 70 Testhefte des ersten bis dritten Teildesigns<br />

zur Bearbeitung vorgelegt. Schülerinnen und Schüler mit sonderpädagogischem<br />

Förderbedarf erhielten – unabhängig vom Beschulungsort Förderschule<br />

beziehungsweise reguläre Schule – eines der elf Testhefte des vierten und fünften<br />

Teildesigns. Das Vorgehen bei der Testheftverteilung erfolgte nach dem sogenannten<br />

Spiralisierungsprinzip. Dabei werden die Testhefte in eine zufällige,<br />

alternierende Reihenfolge gebracht und anschließend in dieser Reihenfolge in<br />

den Schulklassen verteilt, sodass jede Schülerin und jeder Schüler jedes Testheft<br />

mit der gleichen Wahrscheinlichkeit erhalten kann. Durch dieses Verfahren wird<br />

sichergestellt, dass jedes einzelne Testheft an ungefähr die gleiche Anzahl von<br />

Schülerinnen und Schülern verteilt wird und so auch der Stichprobenumfang für<br />

alle Items etwa gleich groß ist.<br />

13.2 Skalierung<br />

Für die Schätzung und Darstellung der mathematischen und naturwissenschaftlichen<br />

Kompetenzen von Schülerinnen und Schülern auf Länderebene müssen<br />

statistische Verfahren angewendet werden, die verschiedene Anforderungen erfüllen.<br />

Erstens sollen die Kompetenzwerte der Personen auf aggregierter Ebene<br />

möglichst unverfälscht, konsistent und effizient geschätzt werden. Zweitens<br />

müssen Effekte, die durch die spezifische Stichprobenstruktur (insbesondere<br />

die Clusterung der Schülerinnen und Schüler in Klassen und Schulen) entstehen,<br />

adäquat berücksichtigt werden. Und drittens sollen die Kompetenzwerte<br />

von Schülerinnen und Schülern auf einer verständlichen und transparenten<br />

Metrik berichtet werden, um die Interpretation der Ergebnisse zu erleichtern. Zur<br />

Erreichung dieser Ziele wurden die Kompetenzstatistiken in einem mehrstufigen<br />

Verfahren ermittelt, das in allen großen Schulleistungsstudien der letzten Jahre<br />

in ähnlicher Weise angewendet wurde und sich insbesondere bereits in den beiden<br />

vorhergehenden IQB-Ländervergleichsstudien bewährt hat (Böhme et al.,<br />

2010; Weirich et al., 2012). In Anlehnung an Weirich et al. (2012) lässt sich das<br />

Vorgehen in folgende Schritte unterteilen:<br />

1. Kalibrierung der Items zur Bestimmung von Itemschwierigkeiten<br />

2. Bestimmung von personenspezifischen Plausible Values<br />

3. Bestimmung der Transformationsvorschrift für die Berichtsmetrik<br />

4. Bestimmung der Standardfehler für die relevanten Statistiken<br />

Im Folgenden werden diese vier Auswertungsschritte genauer beschrieben. Zur<br />

Qualitätssicherung wurden alle Analysen von jeweils mindestens zwei Personen<br />

unabhängig voneinander durchgeführt und die Analyseergebnisse auf Konsistenz<br />

geprüft.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!