04.02.2014 Aufrufe

Herunterladen - MDR

Herunterladen - MDR

Herunterladen - MDR

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Testdesign und Auswertung des Ländervergleichs 399<br />

13.2.3 Bestimmung der Transformationsvorschrift für<br />

die Berichtsmetrik<br />

Durch die Verwendung von IRT-Modellen liegen die berechneten Kompetenzwerte<br />

zunächst auf der Logit-Skala vor, die verschiedene günstige Eigenschaften<br />

aufweist: Ihr Wertebereich umfasst die gesamten reellen Zahlen, wobei in praktischen<br />

Anwendungen vor allem Werte im Bereich von –4 bis +4 auftreten.<br />

Diese Skala kann ohne Bedeutungsänderung beliebig linear transformiert, also<br />

verschoben und gestaucht oder gestreckt werden, ohne dass die für weitere<br />

Analysen wichtige Eigenschaft des Intervallskalenniveaus verloren ginge. Für die<br />

Darstellung der Ergebnisse können somit auch andere Skalenmetriken verwendet<br />

werden. Dazu werden die Kompetenzwerte von der ursprünglichen Logit-Metrik<br />

in die entsprechenden Werte einer anderen Berichtsmetrik umgerechnet. Bei PISA<br />

und den bisherigen IQB-Ländervergleichsstudien kam als Berichtsmetrik eine<br />

Skala zum Einsatz, deren Mittelwert 500 und deren Standardabweichung 100<br />

beträgt. Diese 500-100-Metrik wird auch für die Darstellung der Ergebnisse<br />

des Ländervergleichs 2012 verwendet. Außerdem wird diese Metrik für weitere<br />

Ländervergleiche in Mathematik und den Naturwissenschaften als Referenz<br />

(„Baseline“) dienen, anhand derer später Kompetenzveränderungen über die Jahre<br />

dargestellt werden sollen, ähnlich wie beispielsweise in der PISA-Studie (OECD,<br />

2012). Für die Transformation der Logit-Metrik in die 500-100-Metrik wurde der<br />

mittlere gewichtete Mittelwert und die mittlere gewichtete Standardabweichung<br />

der Plausible Values (siehe Abschnitt 13.2.2) der jeweiligen Leitidee beziehungsweise<br />

des jeweiligen Kompetenzbereichs für Deutschland bestimmt. Diese<br />

Mittelwerte und Standardabweichungen wurden dann per Definition jeweils auf<br />

500 beziehungsweise 100 gesetzt und die Plausible Values entsprechend angepasst.<br />

Weirich et al. (2012, S. 287 f.) beschreiben diese Transformation wie folgt:<br />

Für die Transformation wird je Kompetenzbereich der gewichtete<br />

Mittelwert M g<br />

und die gewichtete Standardabweichung SD g<br />

über die<br />

in den jeweiligen Ländern gezogenen Plausible Values bestimmt. Das<br />

Fallgewicht einer Person beschreibt, wie viele Personen in der Population<br />

diese Person der Stichprobe repräsentiert. Der gewichtete Mittelwert berechnet<br />

sich für jeden Kompetenzbereich folgendermaßen:<br />

<br />

Dabei ist I die Anzahl der gezogenen Plausible Values je Person, N ist<br />

die Gesamtzahl der Personen in der Stichprobe, w n<br />

ist das Fallgewicht<br />

der n-ten Person in der Stichprobe, W ist die Summe aller Gewichte, und<br />

pv n,i<br />

ist der i-te Plausible Value der n-ten Person. Analog dazu berechnet<br />

sich die gewichtete Standardabweichung für jeden Kompetenzbereich wie<br />

folgt:<br />

SD g<br />

= 1 I<br />

I<br />

∑<br />

i=1<br />

N<br />

∑<br />

n=1<br />

w n<br />

( ) 2<br />

W −1 ⋅ pv n,i − M g,i

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!