03.06.2014 Aufrufe

Entwicklung eines Tests zur Erfassung interkultureller ...

Entwicklung eines Tests zur Erfassung interkultureller ...

Entwicklung eines Tests zur Erfassung interkultureller ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

DIE METHODE ZUR ENTWICKLUNG DES TIHK 36<br />

Das bedeutet, man berechnet den Prozentsatz der Aufgaben, die richtig beantwortet werden<br />

und setzt diesen ins Verhältnis <strong>zur</strong> Gesamtzahl der Probanden. Der Schwierigkeitsindex einer<br />

Aufgabe kann sich demnach zwischen den Werten 0 (von keinem Teilnehmer gelöst,<br />

extrem schwierig) und 100 (von allen Teilnehmern gelöst, extrem leicht) bewegen. Normalerweise<br />

wird bei Testkonstruktionen angestrebt, dass die Schwierigkeitsindizes über den<br />

gesamten Bereich streuen und in etwa normalverteilt sind, d.h., einige leichte und schwere<br />

Aufgaben sowie viele mittelschwere Aufgaben im Test enthalten sind. Eliminiert werden sollen<br />

nach LIENERT UND RAATZ (1994) die Aufgaben, die außerhalb des Schwierigkeitsbereiches<br />

von 95 > P > 5 liegen, da sie mit hoher Wahrscheinlichkeit nicht trennscharf sind. Bei<br />

Aufgaben außerhalb des Schwierigkeitsgrads 80 > P > 20 ist zumindest Vorsicht geboten.<br />

Im Rahmen der Schwierigkeitsanalyse sollen demnach die Aufgaben mit einem mittleren<br />

Schwierigkeitsgrad herausgefiltert werden. Dies ist deswegen erforderlich, da zwischen<br />

Schwierigkeit und Trennschärfe eine paraboloide Abhängigkeit besteht. Damit ist gemeint,<br />

dass bei geringer Schwierigkeit einer Aufgabe auch ihre Trennschärfe gering ist, die aber mit<br />

ansteigender Schwierigkeit wachsen kann, bis sie bei einer mittleren (50 %igen) Schwierigkeit<br />

ihr Maximum erreicht und dann bei weiter ansteigender Schwierigkeit wieder abnimmt<br />

bis zu einem Minimum bei höchster Schwierigkeit. Aufgaben von mittlerer Schwierigkeit bieten<br />

demnach die besten Voraussetzungen für eine hohe Trennschärfe.<br />

5.2.1.2 Trennschärfenanalyse<br />

Für die Güte einer Aufgabe verwenden LIENERT UND RAATZ (1994) den Begriff der Trennschärfe,<br />

die ein Maß dafür ist, wie gut eine Aufgabe „gute“ Probanden mit hohem Gesamttestpunktwert<br />

von „schlechten“ Probanden mit niedrigem Punktwert unterscheidet.<br />

Dazu sind in einem ersten Schritt nach LIENERT UND RAATZ (1994) solche Aufgaben zu eliminieren,<br />

die von „guten“ und „schlechten“ Probanden gleich häufig richtig beantwortet werden<br />

(dies entspricht einem Trennschärfenkoeffizienten von 0) oder die von „schlechten" Probanden<br />

häufiger richtig beantwortet werden als von „guten" Probanden (dies entspricht einem<br />

negativen Trennschärfenkoeffizienten). Statistisch gesehen ist „die Trennschärfe <strong>eines</strong> Items<br />

(...) durch die Korrelation der Itemlösungen mit den Gesamttestwerten [, die gewöhnlich aus<br />

der Summe aller Itemwerte berechnet werden,] der Probanden definiert" (ROGGE, 1995,<br />

S. 94). Die Korrelation des Einzelitems mit dem Summenwert gibt an, ob das Item inhaltlich<br />

wirklich zu der Skala passt (SCHMID, 1992).<br />

Nach LIENERT UND RAATZ (1994) wird der Trennschärfenkoeffizient bei einem quantitativen<br />

Analysekriterium und vollständiger Aufgabendarbietung mit der Methode der so genannten<br />

punktbiseralen Korrelation berechnet. Erreichen die Variablenwerte jedoch Intervallniveau,

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!