04.02.2014 Aufrufe

Herunterladen - MDR

Herunterladen - MDR

Herunterladen - MDR

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

396<br />

Martin Hecht, Alexander Roppelt und Thilo Siegle<br />

13.2.1 Kalibrierung der Items<br />

Unter der Kalibrierung der Items versteht man die Bestimmung der Itemschwierig<br />

keiten mit Hilfe eines statistischen Modells. In Schul leistungs studien<br />

(z. B. PISA, IQB-Ländervergleiche) kommt dabei häufig das Rasch-Modell<br />

(Rasch, 1960) zum Einsatz, das zur Gruppe der Modelle der Item Response<br />

Theory (IRT; siehe z. B. Embretson & Reise, 2000; DeMars, 2010; Rost, 2004)<br />

beziehungsweise allgemeiner zur Gruppe latenter Messmodelle gehört. Bei latenten<br />

Messmodellen wird davon ausgegangen, dass jede Schülerin und jeder<br />

Schüler eine bestimmte, nicht direkt beobachtbare (latente) Kompetenz besitzt,<br />

die durch geeignete Testverfahren messbar wird. Um die Genauigkeit der<br />

Erfassung solcher Fähigkeiten zu erhöhen, werden üblicherweise Messungen<br />

mit mehreren Items durchgeführt. Das statistische Messmodell legt dabei fest,<br />

wie von den direkt beobachtbaren Messungen (also der korrekten oder fehlerhaften<br />

Beantwortung von Items) auf die latente Kompetenzausprägung einer<br />

Schülerin oder eines Schülers geschlossen wird. Dem liegt die Annahme<br />

zugrunde, dass die latente Kompetenz die Lösungswahrscheinlichkeit bestimmt,<br />

wobei eine höhere Kompetenz zu einer höheren Wahrscheinlichkeit<br />

führt, ein Item richtig zu lösen. Das Ergebnis der Rasch-Modellierung ist<br />

eine kontinuierliche Skala, die einen nach oben und nach unten unbegrenzten<br />

Wertebereich aufweist und deren Nullpunkt frei wählbar ist. Diese Skala wird<br />

auch Logit-Skala oder Logit-Metrik genannt, da im Rasch-Modell nicht direkt<br />

die Lösungswahrscheinlichkeiten, sondern die logarithmierten Quotienten aus<br />

Lösungs- und Nicht-Lösungswahrscheinlichkeit (Logits) vorhergesagt werden.<br />

Diese Logit-Skala wird dann häufig in eine leichter zu interpretierende Skala<br />

transformiert (siehe Abschnitt 13.2.3).<br />

Eine gemeinsame Bestimmung der individuellen Kompetenzausprägungen<br />

der Schülerinnen und Schüler und der Itemschwierigkeiten ist statistisch ungünstig.<br />

Deshalb wird meist ein zweischrittiges Verfahren verwendet, wobei zuerst<br />

die Itemschwierigkeiten und die Verteilungsparameter der Kompetenz in der<br />

Population geschätzt werden. In einem zweiten Schritt folgt die Schätzung der<br />

personenspezifischen Ausprägungen (siehe Abschnitt 13.2.2). Zur Bestimmung<br />

der Schwierigkeit jedes Items wurde im Ländervergleich 2012 je Leitidee im<br />

Fach Mathematik beziehungsweise je Kompetenzbereich in den naturwissenschaftlichen<br />

Fächern ein separates Rasch-Modell unter Verwendung der Software<br />

ConQuest 2.0 (Wu, Adams, Wilson & Haldane, 2007) berechnet. Hierzu wurden<br />

die Daten der Schülerinnen und Schüler verwendet, die Testhefte aus<br />

dem ersten Teildesign (für Mathematik) oder dem zweiten Teildesign (für<br />

Naturwissenschaften) erhalten hatten, da angenommen werden kann, dass die<br />

Eigenschaften dieser Youden-Square-Designs (siehe Abschnitt 13.1) eine unverfälschte<br />

Kalibrierung der Items ermöglichen.<br />

Obwohl ausschließlich mehrfach vorerprobte Items zum Einsatz kamen, wurden<br />

die Items nach der Kalibrierung nochmals auf ihre psychometrische Güte<br />

geprüft. Zur Einschätzung der psychometrischen Eignung eines jeden Items wurden<br />

die Kriterien Itemschwierigkeit, Trennschärfe und Modellpassung herangezogen.<br />

Auf diese Weise konnten unter anderem fehlerhaft kodierte Items<br />

identi fiziert und die Falschkodierung berichtigt werden. Aus den weiteren<br />

Analysen wurden 38 Items ausgeschlossen, die eine schlechte Modellpassung<br />

(Weighted Fit > 1.15) aufwiesen. Als Resultat der Kalibrierung liegt für jedes<br />

Item ein Schätzer der Itemschwierigkeit auf der Logit-Skala vor, der den folgenden<br />

Auswertungsschritten zugrunde gelegt wird.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!