03.12.2012 Aufrufe

Fachgruppe für Methoden und Evaluation - Universität Bamberg

Fachgruppe für Methoden und Evaluation - Universität Bamberg

Fachgruppe für Methoden und Evaluation - Universität Bamberg

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Do., 22.09., Symposium: Items, responses, and theory, 10.20-10.40<br />

Uhr, Hörsaal M3/232N (H)<br />

Berechnung von Standardfehlern in Large-Scale Assessments auf Gr<strong>und</strong><br />

von Item Sampling <strong>für</strong> Ländermittelwerte, originale <strong>und</strong> marginale Trendschätzungen<br />

Alexander Robitzsch<br />

B<strong>und</strong>esinstitut <strong>für</strong> Bildungsforschung,Innovation<br />

& Entwicklung des österreichischenSchulwesens<br />

(BIFIE)<br />

Salzburg<br />

Zentrum <strong>für</strong> Bildungsmonitoring<br />

& Bildungsstandards<br />

Alpenstraße 121<br />

5020 Salzburg, Österreich<br />

a.robitzsch@bifie.at<br />

In Large-Scale Assessments (z. B. der internationalen<br />

Schulleistungsstudie PISA) werden mehrere Ländermittelwerte<br />

interessierenden Domänen (wie der Lesekompetenz)<br />

verglichen. Diese Studien verwenden Item-Response-Modelle<br />

(z. B. das Raschmodell) als Gr<strong>und</strong>lage der Schätzung<br />

von Personenfähigkeiten. Oft wird dabei jedoch die Auswahl<br />

von Items (sog. Item Sampling) als Variabilitätsquelle<br />

<strong>für</strong> Mittelwertvergleiche ignoriert (Brennan, 2011).<br />

Dieser Beitrag definiert einen Standardfehler <strong>für</strong> einen Ländermittelwert<br />

auf Gr<strong>und</strong> von Item Sampling auf Basis der<br />

Varianz von Effekten differenziellen Itemfunktionierens<br />

(DIF-Varianz) eines Landes. Außerdem werden verschiedene<br />

Techniken zur Ermittlung von Standardfehlern <strong>für</strong> originale<br />

<strong>und</strong> marginale Trendschätzungen diskutiert (Carstensen,<br />

Prenzel & Baumert, 2008; Monseur & Berezner,<br />

2007), die mit der Auswahl von Items zusammenhängen.<br />

Anhand der österreichischen PISA-Daten in den Studien<br />

2000, 2003, 2006 <strong>und</strong> 2009 werden die durch Item Sampling<br />

bedingten Standardfehler <strong>für</strong> Querschnitts- <strong>und</strong> Trendschätzungen<br />

<strong>für</strong> die Domäne der Lesekompetenz vorgestellt<br />

<strong>und</strong> deren Implikation ausgeführt.<br />

Brennan, R. L. (2011). Generalizability theory and classical test<br />

theory. Applied Measurement in Education, 24, 1-21.<br />

Carstensen, C. H., Prenzel, M. & Baumert, J. (2008).<br />

Trendanalysen in PISA: Wie haben sich die Kompetenzen in<br />

Deutschland zwischen PISA 2000 <strong>und</strong> PISA 2006 entwickelt?<br />

Zeitschrift <strong>für</strong> Erziehungswissenschaften, 10, 11-34.<br />

Monseur, C. & Berezner, A. (2007). The computation of equating<br />

errors in international surveys in education. Journal of Applied<br />

Measurement, 8, 323-335.<br />

50

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!