03.06.2014 Aufrufe

Entwicklung eines Tests zur Erfassung interkultureller ...

Entwicklung eines Tests zur Erfassung interkultureller ...

Entwicklung eines Tests zur Erfassung interkultureller ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

DISKUSSION 83<br />

7.2.5 Die Testkonstruktion<br />

Zur Testkonstruktion des TIHK wurden die Mittelwerte der Probanden über den gesamten<br />

Test berechnet. Da durch die Berechnung von Mittelwerten Informationen verloren gehen,<br />

wäre es im Sinne einer besseren Differenzierungsfähigkeit des <strong>Tests</strong> im Nachhinein sinnvoller<br />

gewesen, den TIHK anhand einer anderen Maßzahl zu entwickeln. Hier würden sich die<br />

Summenwerte über alle Aufgaben pro Proband anbieten, die auch bei der Interpretation der<br />

Testergebnisse verwendet worden sind (vgl. Kap. 6.5). Auf diese Weise ist eine höhere Varianz<br />

der Testergebnisse zu erwarten, die sich positiv auf die Differenzierungsfähigkeit des<br />

<strong>Tests</strong> auswirkt. In der vorliegenden Arbeit wurde jedoch auf die Methode der Mittelwerte <strong>zur</strong>ückgegriffen,<br />

um die Probanden auf der verwendeten 4er Skala lokalisieren zu können. Unabhängig<br />

von der inhaltlichen Interpretation wird vorgeschlagen, die Testkonstruktion zukünftig<br />

grundsätzlich an den Gesamtrohwerten vorzunehmen. Dort ist der statistische<br />

Mehrgewinn bedeutsamer als bei der Interpretation der Testergebnisse.<br />

Als weitere methodische Kritik im Rahmen der Testkonstruktion des TIHK sind 2 statistische<br />

Verfahren anzuführen. Zum einen betrifft dies die Vorgehensweise <strong>zur</strong> Bestimmung der<br />

Schwierigkeitsindices (vgl. Kap. 5.2.1.1). Der gewählten Vorgehensweise <strong>zur</strong> Bestimmung<br />

der Aufgabenschwierigkeit wurde ein „Richtig-Falsch“-Antwortschema zugrunde gelegt. Pro<br />

Aufgabe gab es eine Antwortalternative mit der richtigen Lösung, die 3 anderen Antworten<br />

wurden mit falsch bewertet. Somit wurde die geforderte Rangreihenbildung der Antworten<br />

(vgl. Kap. 5.2.2.1) wieder außer Kraft gesetzt. Dadurch gingen Informationen über die Güte<br />

des Antwortverhaltens des Probanden verloren, nämlich wie nah der Proband an der richtigen<br />

Lösung der Aufgabe war. Eine Möglichkeit, dem entgegenzuwirken, stellt der plausibilitätskorrigierte<br />

Schwierigkeitsindex von HORST (1971) dar, der die meistfrequentierteste falsche<br />

Antwortalternative <strong>zur</strong> Berechnung des Schwierigkeitsindex berücksichtigt. Da die<br />

Formel von HORST (1971) jedoch wenig erprobt und damit in der Anwendung zweifelhaft ist,<br />

wurde auf die bewährte Methode <strong>zur</strong> Berechnung des Schwierigkeitsindex <strong>zur</strong>ückgegriffen.<br />

Das zweite zu kritisierende Vorgehen bei der Konstruktion des TIHK betrifft die Verwendung<br />

de c-Koeffizienten von SIMON ET AL. (in Vorbereitung) (vgl. Kap. 6.2.3.3). Dieser hätte sinnvollerweise<br />

bereits <strong>zur</strong> Konstruktion von Testform A eingesetzt werden müssen, um einem<br />

einheitlichen methodischen Vorgehen gerecht zu werden und aussagekräftige Ergebnisse zu<br />

gewährleisten. Da die Ergebnisse der Testkonstruktion A allerdings keinen Anlass gaben, die<br />

Methoden der klassischen Testtheorie anzuzweifeln, wurde erst an späterer Stelle (bei der<br />

Konstruktion von Test B) offensichtlich, dass die Verfahren der klassischen Testtheorie im<br />

vorliegenden Fall un<strong>zur</strong>eichend waren (vgl. Kap. 6.2.3.2). Infolgedessen wurde von der Auto-

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!