Entwicklung eines Tests zur Erfassung interkultureller ...

Weitere Magazine

Empfehlungen

Info

DIE METHODE ZUR ENTWICKLUNG DES TIHK 35 5.2.1 Die Aufgabenanalyse Unter der Aufgabenanalyse versteht man die Darbietung der Testvorform an einer Analysestichprobe. Sie gibt Aufschluss über die Güte der verwendeten Testaufgaben und dient der Selektion von Aufgaben für die Testendform. Die Aufgabenanalyse verfolgt nach LIENERT UND RAATZ (1994) den Zweck der Revision nicht geeigneter Testaufgaben hinsichtlich einer höheren Reliabilität und Validität sowie die Überprüfung der Testpunktverteilung und Durchführungsmodalitäten des Tests. Die Testpunktverteilung sollte für den Fall einer späteren Eichung des Tests eine hinreichende Streuung, Symmetrie und Eingipfligkeit wie bei einer Normalverteilung aufweisen. Für die Aufgabenanalyse sollte die Wahl der Analysestichprobe in höchstmöglichem Maße für das später zu testende Kollektiv repräsentativ sein. Weiterhin sollte bei reinen Niveautests nach LIENERT UND RAATZ (1994) eine Gesamtdarbietung der Testaufgaben erfolgen, d.h., die Testvorform wird bei konstanter Reihenfolge der Aufgaben vollständig der Analysestichprobe zur Beantwortung dargeboten, wobei jeder Proband sich für jede Aufgabe theoretisch so viel Zeit nehmen kann, wie er dazu benötigt. Im Rahmen der Aufgabenanalyse werden nun Schwierigkeit und Trennschärfe der Testaufgaben ermittelt, um die geeigneten Aufgaben für die Testendform auszuwählen. 5.2.1.1 Schwierigkeitsanalyse Nach LIENERT UND RAATZ (1994) ist der Schwierigkeitsindex einer Aufgabe gleich dem prozentualen Anteil P der auf diese Aufgabe entfallenden richtigen Antworten in einer Analysenstichprobe von der Größe N; der Schwierigkeitsindex liegt also bei schwierigen Aufgaben niedrig, bei leichten hoch. Die Schwierigkeit einer Aufgabe wird hier aufgrund wissenschaftlicher Sparsamkeit anhand dichotomer Variablen bestimmt, da es letztendlich um die Frage geht, ob der Proband das Item richtig oder falsch beantwortet hat. Eine Aufgabe gilt hierbei als „richtig“ beantwortet, wenn der Proband die „richtige“ Erklärungsalternative mit „am meistern zutreffend“ beantwortet hat. Aus diesem Grund wird hier das komplette Antwortverhalten, nämlich die Rangreihenbildung des Probanden nicht berücksichtigt. Die Berechnung des Schwierigkeitsindex bei Niveautestaufgaben (Aufgaben, die entweder überhaupt keine Testzeit vorschreiben oder eine solche, innerhalb der alle Probanden alle Aufgaben bearbeiten können) wird nach LIENERT UND RAATZ (1994) nach folgender Definition berechnet: P = 100 x N R N
DIE METHODE ZUR ENTWICKLUNG DES TIHK 36 Das bedeutet, man berechnet den Prozentsatz der Aufgaben, die richtig beantwortet werden und setzt diesen ins Verhältnis zur Gesamtzahl der Probanden. Der Schwierigkeitsindex einer Aufgabe kann sich demnach zwischen den Werten 0 (von keinem Teilnehmer gelöst, extrem schwierig) und 100 (von allen Teilnehmern gelöst, extrem leicht) bewegen. Normalerweise wird bei Testkonstruktionen angestrebt, dass die Schwierigkeitsindizes über den gesamten Bereich streuen und in etwa normalverteilt sind, d.h., einige leichte und schwere Aufgaben sowie viele mittelschwere Aufgaben im Test enthalten sind. Eliminiert werden sollen nach LIENERT UND RAATZ (1994) die Aufgaben, die außerhalb des Schwierigkeitsbereiches von 95 > P > 5 liegen, da sie mit hoher Wahrscheinlichkeit nicht trennscharf sind. Bei Aufgaben außerhalb des Schwierigkeitsgrads 80 > P > 20 ist zumindest Vorsicht geboten. Im Rahmen der Schwierigkeitsanalyse sollen demnach die Aufgaben mit einem mittleren Schwierigkeitsgrad herausgefiltert werden. Dies ist deswegen erforderlich, da zwischen Schwierigkeit und Trennschärfe eine paraboloide Abhängigkeit besteht. Damit ist gemeint, dass bei geringer Schwierigkeit einer Aufgabe auch ihre Trennschärfe gering ist, die aber mit ansteigender Schwierigkeit wachsen kann, bis sie bei einer mittleren (50 %igen) Schwierigkeit ihr Maximum erreicht und dann bei weiter ansteigender Schwierigkeit wieder abnimmt bis zu einem Minimum bei höchster Schwierigkeit. Aufgaben von mittlerer Schwierigkeit bieten demnach die besten Voraussetzungen für eine hohe Trennschärfe. 5.2.1.2 Trennschärfenanalyse Für die Güte einer Aufgabe verwenden LIENERT UND RAATZ (1994) den Begriff der Trennschärfe, die ein Maß dafür ist, wie gut eine Aufgabe „gute“ Probanden mit hohem Gesamttestpunktwert von „schlechten“ Probanden mit niedrigem Punktwert unterscheidet. Dazu sind in einem ersten Schritt nach LIENERT UND RAATZ (1994) solche Aufgaben zu eliminieren, die von „guten“ und „schlechten“ Probanden gleich häufig richtig beantwortet werden (dies entspricht einem Trennschärfenkoeffizienten von 0) oder die von „schlechten" Probanden häufiger richtig beantwortet werden als von „guten" Probanden (dies entspricht einem negativen Trennschärfenkoeffizienten). Statistisch gesehen ist „die Trennschärfe eines Items (...) durch die Korrelation der Itemlösungen mit den Gesamttestwerten [, die gewöhnlich aus der Summe aller Itemwerte berechnet werden,] der Probanden definiert" (ROGGE, 1995, S. 94). Die Korrelation des Einzelitems mit dem Summenwert gibt an, ob das Item inhaltlich wirklich zu der Skala passt (SCHMID, 1992). Nach LIENERT UND RAATZ (1994) wird der Trennschärfenkoeffizient bei einem quantitativen Analysekriterium und vollständiger Aufgabendarbietung mit der Methode der so genannten punktbiseralen Korrelation berechnet. Erreichen die Variablenwerte jedoch Intervallniveau,
Seite 1 und 2: Entwicklung eines Tests zur Erfassu
Seite 3 und 4: INHALTSVERZEICHNIS II 5 DIE METHODE
Seite 5 und 6: TABELLEN- UND ABBILDUNGSVERZEICHNIS
Seite 7 und 8: EINLEITUNG 2 theoretische Grundlage
Seite 9 und 10: ANALYSE BESTEHENDER TESTVERFAHREN 4
Seite 17 und 18: THEORETISCHE GRUNDLAGEN FÜR DIE EN
Seite 33 und 34: KRITERIEN DER TESTENTWICKLUNG 28 me
Seite 35 und 36: KRITERIEN DER TESTENTWICKLUNG 30 At
Seite 37 und 38: DIE METHODE ZUR ENTWICKLUNG DES TIH
Seite 39: DIE METHODE ZUR ENTWICKLUNG DES TIH
Seite 53 und 54: DIE PRAKTISCHE ENTWICKLUNGSARBEIT 4
Seite 83 und 84: DISKUSSION 78 7 Diskussion Die Disk
Seite 85 und 86: DISKUSSION 80 eineinhalb bis 2 Stun
Seite 87 und 88: DISKUSSION 82 Zusammenfassend kann
Seite 89 und 90: DISKUSSION 84 rin im Rahmen der kri
Seite 91 und 92:
DISKUSSION 86 den. Schwierigere Auf
Seite 93 und 94:
DISKUSSION 88 7.2.6.4 Das zu messen
Seite 95 und 96:
DISKUSSION 90 7.3 Die Praktikabilit
Seite 97 und 98:
DISKUSSION 92 Die generelle Erweite
Seite 99 und 100:
ZUSAMMENFASSUNG 94 8 Zusammenfassun
Seite 101 und 102:
LITERATUR 96 BRISLIN, R. W. (1989).
Seite 103 und 104:
LITERATUR 98 HAMMER, M. R., GUDYKUN
Seite 105 und 106:
LITERATUR 100 LANDIS, D., DAY, H. R
Seite 107 und 108:
LITERATUR 102 THOMAS, A. & SCHENK,
Seite 109:
Erklärung Ich versichere hiermit,
Alle anzeigen

Entwicklung eines Tests zur Erfassung interkultureller ...

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?