Fachgruppe für Methoden und Evaluation - Universität Bamberg
Fachgruppe für Methoden und Evaluation - Universität Bamberg
Fachgruppe für Methoden und Evaluation - Universität Bamberg
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Do., 22.09., Symposium: Items, responses, and theory, 10.20-10.40<br />
Uhr, Hörsaal M3/232N (H)<br />
Berechnung von Standardfehlern in Large-Scale Assessments auf Gr<strong>und</strong><br />
von Item Sampling <strong>für</strong> Ländermittelwerte, originale <strong>und</strong> marginale Trendschätzungen<br />
Alexander Robitzsch<br />
B<strong>und</strong>esinstitut <strong>für</strong> Bildungsforschung,Innovation<br />
& Entwicklung des österreichischenSchulwesens<br />
(BIFIE)<br />
Salzburg<br />
Zentrum <strong>für</strong> Bildungsmonitoring<br />
& Bildungsstandards<br />
Alpenstraße 121<br />
5020 Salzburg, Österreich<br />
a.robitzsch@bifie.at<br />
In Large-Scale Assessments (z. B. der internationalen<br />
Schulleistungsstudie PISA) werden mehrere Ländermittelwerte<br />
interessierenden Domänen (wie der Lesekompetenz)<br />
verglichen. Diese Studien verwenden Item-Response-Modelle<br />
(z. B. das Raschmodell) als Gr<strong>und</strong>lage der Schätzung<br />
von Personenfähigkeiten. Oft wird dabei jedoch die Auswahl<br />
von Items (sog. Item Sampling) als Variabilitätsquelle<br />
<strong>für</strong> Mittelwertvergleiche ignoriert (Brennan, 2011).<br />
Dieser Beitrag definiert einen Standardfehler <strong>für</strong> einen Ländermittelwert<br />
auf Gr<strong>und</strong> von Item Sampling auf Basis der<br />
Varianz von Effekten differenziellen Itemfunktionierens<br />
(DIF-Varianz) eines Landes. Außerdem werden verschiedene<br />
Techniken zur Ermittlung von Standardfehlern <strong>für</strong> originale<br />
<strong>und</strong> marginale Trendschätzungen diskutiert (Carstensen,<br />
Prenzel & Baumert, 2008; Monseur & Berezner,<br />
2007), die mit der Auswahl von Items zusammenhängen.<br />
Anhand der österreichischen PISA-Daten in den Studien<br />
2000, 2003, 2006 <strong>und</strong> 2009 werden die durch Item Sampling<br />
bedingten Standardfehler <strong>für</strong> Querschnitts- <strong>und</strong> Trendschätzungen<br />
<strong>für</strong> die Domäne der Lesekompetenz vorgestellt<br />
<strong>und</strong> deren Implikation ausgeführt.<br />
Brennan, R. L. (2011). Generalizability theory and classical test<br />
theory. Applied Measurement in Education, 24, 1-21.<br />
Carstensen, C. H., Prenzel, M. & Baumert, J. (2008).<br />
Trendanalysen in PISA: Wie haben sich die Kompetenzen in<br />
Deutschland zwischen PISA 2000 <strong>und</strong> PISA 2006 entwickelt?<br />
Zeitschrift <strong>für</strong> Erziehungswissenschaften, 10, 11-34.<br />
Monseur, C. & Berezner, A. (2007). The computation of equating<br />
errors in international surveys in education. Journal of Applied<br />
Measurement, 8, 323-335.<br />
50