Fachgruppe für Methoden und Evaluation - Universität Bamberg
Fachgruppe für Methoden und Evaluation - Universität Bamberg
Fachgruppe für Methoden und Evaluation - Universität Bamberg
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
Do., 22.09., IRT-Modellgeltungstests, 15.50-16.10 Uhr, Hörsaal<br />
M3/232N (H)<br />
Tücken des Bootstrap<br />
Rainer W. Alexandrowicz<br />
Clemens Draxler<br />
Alpen-Adria-<strong>Universität</strong><br />
Klagenfurt<br />
Abteilung <strong>für</strong> Angewandte<br />
Psychologie <strong>und</strong> <strong>Methoden</strong>forschung<br />
<strong>Universität</strong>sstraße 65–67<br />
9020 Klagenfurt<br />
Österreich<br />
Die Überprüfung der Gültigkeit des Rasch-Modells mittels<br />
des Likelihood-Ratio-Tests nach Andersen (1973) zählt bereits<br />
seit Langem zu den Standardverfahren der Item Response<br />
Modelle. Der Test ist asymptotisch χ²-verteilt mit<br />
(k – 1)(g – 1) Freiheitsgraden (mit k Anzahl der Items <strong>und</strong> g<br />
Anzahl der Teilgruppen). Trotz seiner großen Bedeutung<br />
liegen bislang kaum Bef<strong>und</strong>e hinsichtlich der Qualität der<br />
Approximation der Testgröße an die theoretische χ²-Verteilung<br />
bei gegebenem Stichprobenumfang n <strong>und</strong> Itemzahl<br />
vor. In vorliegender Studie wird daher zuerst die Güte der<br />
Anpassung <strong>für</strong> endliches n <strong>und</strong> k untersucht. In Fällen, wo<br />
die Anpassung als nicht hinreichend zu beurteilen ist, steht<br />
der Bootstrap (Davison & Hinkley, 1997) als Methode der<br />
Wahl zur Gewinnung einer Prüfverteilung zur Verfügung.<br />
Dabei lassen sich grob der "naive" <strong>und</strong> der parametrische<br />
Bootstrap unterscheiden. Bei ersterem wird wiederholt aus<br />
den vorliegenden Beobachtungen mit Zurücklegen gezogen,<br />
während letzterer eine Monte-Carlo-Methode unter<br />
Verwendung der Modellgleichung <strong>und</strong> der geschätzten<br />
Item- <strong>und</strong> Personenparameter darstellt.<br />
Im konkreten Fall des LRT stellt sich jedoch eine weitere<br />
Frage: Da mittels der aus theoretischen Gründen zu bevorzugenden<br />
Conditional Maximum Likelihood Methode (CML)<br />
primär nur Itemparameter gewonnen werden, ist nicht eindeutig<br />
geklärt, wie <strong>für</strong> den parametrischen Bootstrap die<br />
Personenparameter gewählt werden. Erstens kann – auf<br />
die Modelleigenschaft der spezifischen Objektivität zurückgreifend<br />
– aus einer beliebig (allerdings zumeist<br />
normal-)verteilten Zufallsverteilung gezogen werden, zweitens<br />
können die mittels Maximum Likelihood gewonnene<br />
Personenparameter verwendet werden <strong>und</strong> drittens kann<br />
auch ein sequentielles Wahrscheinlichkeitsverfahren gewählt<br />
werden, welches konstante Zeilenrandsummen gewährleistet.<br />
Der Vergleich der drei Varianten zeigt, dass die drei Verfahren<br />
zu teilweise enorm abweichenden Ergebnissen führen<br />
können. Damit belegt diese Studie klar, daß die unbedachte<br />
Wahl des Bootstrapverfahrens grob irreführende Ergebnisse<br />
liefern kann. Ferner wird auch die Unanwendbarkeit<br />
des naiven Bootstraps schlüssig aufgezeigt.<br />
Andersen, E. B. (1973). A goodness of fit test for the Rasch model.<br />
Psychometrika, 38, 123–140.<br />
Davison, A. C. and Hinkley, D. V. (1997). Bootstrap Methods and<br />
their Application. Cambridge: University Press.<br />
58