03.12.2012 Aufrufe

Fachgruppe für Methoden und Evaluation - Universität Bamberg

Fachgruppe für Methoden und Evaluation - Universität Bamberg

Fachgruppe für Methoden und Evaluation - Universität Bamberg

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Do., 22.09., IRT-Modellgeltungstests, 15.50-16.10 Uhr, Hörsaal<br />

M3/232N (H)<br />

Tücken des Bootstrap<br />

Rainer W. Alexandrowicz<br />

Clemens Draxler<br />

Alpen-Adria-<strong>Universität</strong><br />

Klagenfurt<br />

Abteilung <strong>für</strong> Angewandte<br />

Psychologie <strong>und</strong> <strong>Methoden</strong>forschung<br />

<strong>Universität</strong>sstraße 65–67<br />

9020 Klagenfurt<br />

Österreich<br />

Die Überprüfung der Gültigkeit des Rasch-Modells mittels<br />

des Likelihood-Ratio-Tests nach Andersen (1973) zählt bereits<br />

seit Langem zu den Standardverfahren der Item Response<br />

Modelle. Der Test ist asymptotisch χ²-verteilt mit<br />

(k – 1)(g – 1) Freiheitsgraden (mit k Anzahl der Items <strong>und</strong> g<br />

Anzahl der Teilgruppen). Trotz seiner großen Bedeutung<br />

liegen bislang kaum Bef<strong>und</strong>e hinsichtlich der Qualität der<br />

Approximation der Testgröße an die theoretische χ²-Verteilung<br />

bei gegebenem Stichprobenumfang n <strong>und</strong> Itemzahl<br />

vor. In vorliegender Studie wird daher zuerst die Güte der<br />

Anpassung <strong>für</strong> endliches n <strong>und</strong> k untersucht. In Fällen, wo<br />

die Anpassung als nicht hinreichend zu beurteilen ist, steht<br />

der Bootstrap (Davison & Hinkley, 1997) als Methode der<br />

Wahl zur Gewinnung einer Prüfverteilung zur Verfügung.<br />

Dabei lassen sich grob der "naive" <strong>und</strong> der parametrische<br />

Bootstrap unterscheiden. Bei ersterem wird wiederholt aus<br />

den vorliegenden Beobachtungen mit Zurücklegen gezogen,<br />

während letzterer eine Monte-Carlo-Methode unter<br />

Verwendung der Modellgleichung <strong>und</strong> der geschätzten<br />

Item- <strong>und</strong> Personenparameter darstellt.<br />

Im konkreten Fall des LRT stellt sich jedoch eine weitere<br />

Frage: Da mittels der aus theoretischen Gründen zu bevorzugenden<br />

Conditional Maximum Likelihood Methode (CML)<br />

primär nur Itemparameter gewonnen werden, ist nicht eindeutig<br />

geklärt, wie <strong>für</strong> den parametrischen Bootstrap die<br />

Personenparameter gewählt werden. Erstens kann – auf<br />

die Modelleigenschaft der spezifischen Objektivität zurückgreifend<br />

– aus einer beliebig (allerdings zumeist<br />

normal-)verteilten Zufallsverteilung gezogen werden, zweitens<br />

können die mittels Maximum Likelihood gewonnene<br />

Personenparameter verwendet werden <strong>und</strong> drittens kann<br />

auch ein sequentielles Wahrscheinlichkeitsverfahren gewählt<br />

werden, welches konstante Zeilenrandsummen gewährleistet.<br />

Der Vergleich der drei Varianten zeigt, dass die drei Verfahren<br />

zu teilweise enorm abweichenden Ergebnissen führen<br />

können. Damit belegt diese Studie klar, daß die unbedachte<br />

Wahl des Bootstrapverfahrens grob irreführende Ergebnisse<br />

liefern kann. Ferner wird auch die Unanwendbarkeit<br />

des naiven Bootstraps schlüssig aufgezeigt.<br />

Andersen, E. B. (1973). A goodness of fit test for the Rasch model.<br />

Psychometrika, 38, 123–140.<br />

Davison, A. C. and Hinkley, D. V. (1997). Bootstrap Methods and<br />

their Application. Cambridge: University Press.<br />

58

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!