Methoden und Datenanalyse interkultureller Forschung - Kognition
Methoden und Datenanalyse interkultureller Forschung - Kognition
Methoden und Datenanalyse interkultureller Forschung - Kognition
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
Äquivalenz<br />
<strong>Methoden</strong> <strong>und</strong> <strong>Datenanalyse</strong> <strong>interkultureller</strong> <strong>Forschung</strong><br />
Man unterscheidet verschiedene Äquivalenzlevels (in aufsteigender Reihenfolge):<br />
1. strukturelle Inäquivalenz<br />
Ein Instrument misst unterschiedliche Konstrukte in verschiedenen Kulturen („Äpfel<br />
mit Birnen vergleichen“). Ein Vergleich der beobachteten Werte ist nicht möglich. Es<br />
kann durch Messprobleme entstehen, wenn bspw ein Konstrukt wie Mittelklasse in<br />
den untersuchten Kulturen unterschiedliche Bedeutung hat.<br />
2. strukturelle Äquivalenz<br />
Es kennzeichnet, ob das zu messende Konstrukt in den untersuchten Kulturen<br />
tatsächlich sinnvoll erfasst werden kann. Dasselbe Konstrukt wird also in den Kulturen<br />
gemessen, wobei es nicht auf gleiche Weise operationalisiert sein muss. Das hat<br />
wiederum zur Folge, dass interkulturelle Vergleiche nicht möglich sind.<br />
3. Äquivalenz der Maßeinheit<br />
Damit wird die Tatsache gekennzeichnet, dass die Messung in zwei Stichproben Daten<br />
mit der gleichen Skalierung hervorbringen kann, der Skalenursprung jedoch<br />
unterschiedlich ist. Ein Beispiel dafür ist die Messung von Temperatur in Celsius<br />
Graden oder in Kelvin Graden (K = C - 273). Meistens ist der Skalenursprung in<br />
interkulturellen Studien nicht bekannt, weshalb die auf Intervalllevel beobachteten<br />
Werte in den verschiedenen Kulturen nicht vergleichbar sind.<br />
4. Skalenäquivalenz (skalare Äquivalenz; „full score comparability“)<br />
Bias<br />
Wenn nachgewiesen werden kann, dass Werte nicht nur über die gleiche Maßeinheit<br />
sondern auch über den gleichen Skalenursprung verfügen, so wird von voller<br />
Skalenäquivalenz gesprochen. Beispiele für Werte mit voller Skalenäquivalenz sind<br />
Körpergewicht <strong>und</strong> Körpergröße. Skalenäquivalenz ermöglicht die direkte<br />
Vergleichbarkeit von Testwerten zwischen unterschiedlichen Stichproben.<br />
1. Konstrukt-Bias<br />
bezeichnet die mangelhafte Abbildung eines psychologischen Konstrukts im<br />
Instrument. In diesem Fall werden in den untersuchten Kulturen verschiedene<br />
Konstrukte gemessen, ein Vergleich ist nicht möglich. Ein besonders hohes Risiko für<br />
Konstruktbias besteht darin, Testverfahren, die in einer Kultur entwickelt wurden, in<br />
einer anderen Kultur einzusetzen, da das zu messende psychologische Konstrukt
durch die in der Ursprungskultur entwickelte Operationalisierung in der Zielkultur<br />
möglicherweise nur unvollständig (oder gar nicht) abgebildet werden kann.<br />
Ursachen:<br />
- das zugr<strong>und</strong>e liegende theoretische Konzept eines Konstrukts umfasst in einer der<br />
untersuchten Kulturen noch weitere zusätzliche Dimensionen, die vom Test nicht<br />
abgedeckt werden, d.h. die Definitionen eines Konstrukts in unterschiedlichen<br />
Stichproben stimmen nur teilweise überein.<br />
- das Verhalten, das mit dem Konstrukt assoziiert wird, stimmt in den<br />
verschiedenen Kulturen zu wenig überein; es werden nicht alle relevanten<br />
Verhaltensweisen eines Konstrukts von einer Skala berücksichtigt.<br />
- „construct <strong>und</strong>errepresentation“: relevante Verhaltensweisen werden nur<br />
unzureichend oder gar nicht abgetestet.<br />
- nicht alle Wertebereiche eines Konstrukts sind abgedeckt.<br />
Ermittlung über (a) Faktorenanalyse (Faktorenstruktur oder Faktorladungen) oder (b)<br />
zusätzliche Untersuchungen bezüglich über die Anwendbarkeit des Konstrukts <strong>und</strong><br />
des verwendeten Messinstruments.<br />
Es gibt drei Möglichkeiten, um eine kulturell balancierte/ausgeglichene Studie zu<br />
entwerfen: entweder durch einen dezentrierten Ansatz (eine kulturell facettenreiche<br />
Perspektive wird bei der Konzeptualisierung <strong>und</strong> Versuchsplanung eingenommen,<br />
indem Forscher mit unterschiedlichen kulturellen Hintergründen mitarbeiten) oder<br />
mittels Konvergenzmethode (ein Forscher aus jeder der untersuchten Kulturen<br />
entwirft ein für die jeweilige Kultur adäquates Messinstrument, welches dann in allen<br />
Kulturen getestet wird). Als dritte Möglichkeit kann man eine Studie entwerfen, die<br />
soweit wie möglich kulturabhängig ist im Vergleich zu bereits existierenden Studien,<br />
wobei untersucht wird, ob sich die beobachteten Ergebnisse mit früheren Ergebnissen<br />
decken. Wenn ja, kann man davon ausgehen, dass der kulturelle Ursprung der<br />
früheren Studien die Ergebnisse nicht verfälscht hat.<br />
2. <strong>Methoden</strong>-Bias<br />
Wenn ein Konstrukt durch eine Testskala angemessen abgebildet wird, kann es durch<br />
die verwendete Methodik zu einer Verzerrung der Ergebnisse kommen.<br />
Ursachen:<br />
- (kulturell) unterschiedliches Antwortverhalten wie etwa Zustimmungstendenz<br />
(vorgegebenen Statements in einem Test wird unabhängig vom Inhalt<br />
zugestimmt. Die tatsächliche Meinung wird so verzerrt, die Messung fehlerhaft),<br />
Extrembewertungen sowie soziale Erwünschtheit von Antworten.<br />
Beispiel: Hui & Triandis (1989) stellten fest, dass die Erhebung auf einer 5-stufigen Likertskala bei<br />
Mexikanern im Vergleich zu US-Amerikanern zu einer verstärkten Tendenz zu extremen Antworten<br />
führte. Bei Verwendung einer 10-stufigen Skala verschwand diese Tendenz. Die Antwortstile waren<br />
also nicht durch die Items an sich bedingt, sondern durch die Form ihrer Darbietung.
- unterschiedliche Vertrautheit mit dem getesteten Stimulusmaterial.<br />
- unterschiedliche Vertrautheit mit der zu verwendenden Antwortprozedur.<br />
- mangelhafte Vergleichbarkeit der getesteten Populationen (Unterschiede in der<br />
schulischen Ausbildung, im Alter, in der Geschlechtszusammensetzung...)<br />
- Testleiter-/Interviewereffekte<br />
- Unterschiedliche physikalische Bedingungen während der Testdurchführung (z.B.<br />
Lärm in der Umgebung, Anwesenheit anderer Personen)<br />
- Kommunikationsprobleme, wie z.B. zwischen dem Tester <strong>und</strong> dem Testenden<br />
(Sprachprobleme, Interviewerfähigkeiten) aber auch Verletzung von Normen<br />
durch die Versuchsanordnung/den Test)<br />
Da <strong>Methoden</strong>bias auf die Gesamtheit der Items wirkt <strong>und</strong> nicht selektiv, bleibt die<br />
Vergleichbarkeit innerhalb einer Stichprobe auch bei Vorliegen von <strong>Methoden</strong>bias<br />
erhalten. Da aber die Größe des Einflusses des <strong>Methoden</strong>bias auf die Testwerte nicht<br />
beziffert werden kann, ist ein Vergleich zwischen unterschiedlichen Stichproben auf<br />
Skalenebene nicht möglich.<br />
Abschätzen des Einflusses eines <strong>Methoden</strong>bias durch (a) wiederholtes Testen mit dem<br />
gleichen Testinstrument in verschiedenen kulturellen Gruppen <strong>und</strong> Untersuchung der<br />
Änderungen (normalerweise Zunahmen) der erzielten Testscores (diese Methode wird<br />
vor allem bei kognitiven Tests eingesetzt) oder (b) systematische Variation des<br />
Stimulusmaterials über alle Kulturen hinweg.<br />
3. Item-Bias<br />
Diese Art der Verzerrung bezieht sich auf Messartefakte auf Itemlevel.<br />
Ursachen:<br />
- schlechte Übersetzung des Items<br />
- schlechte Formulierung des Items (zu komplex, zu kompliziertes Wording)<br />
- zufällige Unterschiede in der Eignung eines Iteminhalts (Gegenstand eines Items<br />
kommt in einer der untersuchten Kulturen gar nicht vor).<br />
Bei Untersuchungen unterschiedlicher Kulturen ist es wichtig festzustellen, ob die<br />
eingesetzten Items in jeder Kultur das im Fokus stehende Konzept sinnvoll erfassen!<br />
Auswirkungen von Bias auf die Äquivalenzstufen<br />
Bias <strong>und</strong> Äquivalenz sind miteinander verknüpft („scores are equivalent when they are<br />
unbiased“). Allgemein gilt, dass ein Bias das Äquivalenzlevel herabsetzt.<br />
Im Fall von <strong>Methoden</strong>- <strong>und</strong> Item-Bias unterscheidet man einen uniformen <strong>und</strong> einen<br />
nonuniformen Bias. Uniformer Bias kennzeichnet eine systematische Verzerrung, die auf<br />
alle Stufen der Messung gleich wirkt (in einer Gruppe wird konstant um 1kg mehr<br />
gemessen. Ein Vergleich der Gewichte verschiedener Personen ist trotz dieser Verzerrung<br />
möglich). Nonuniformer Bias wirkt unterschiedlich auf bestimmte Stufen/Wertelevels,
sodass ein Vergleich zwischen den Gruppen nicht mehr möglich (In der ersten Gruppe<br />
misst die Waage das Gewicht akkurat, in der zweiten Gruppe zeigt die Waage jeweils ein<br />
10% höheres Gewicht als das tatsächliche an. Je höher das Gewicht einer Person, desto<br />
stärker also die Verzerrung der Messung).<br />
Tabelle: Beeinflusst ein Bias das Level der Äquvalenz?<br />
Bei Auftreten von Konstruktbias können gar keine Aussagen zum betreffenden<br />
psychologischen Konstrukt getroffen werden, außer, dass es in einer der untersuchten<br />
Stichproben so nicht nachweisbar ist. Tritt eine Verzerrung auf der Ebene der Methode<br />
auf, <strong>und</strong> wirkt diese auf alle Items in gleicher Weise, wie z.B. Antwortstile, so kann zum<br />
einen Konstruktäquivalenz nachgewiesen werden, zum anderen ist ein Vergleich der<br />
Testwerte zwischen Teilnehmern innerhalb einer Stichprobe möglich. Ist der Einfluss der<br />
Verzerrung aber nicht gleichmäßig, so ist dieser Vergleich zwischen Teilnehmern nicht<br />
möglich. Genauso verhält es sich mit Itembias. Wirkt dieser auf alle Teilnehmer einer<br />
Stichprobe in gleicher Weise, beantworten also alle Teilnehmer ein unangemessenes<br />
Item, so werden die Testwerte einer Stichprobe einer uniformen Verzerrung unterworfen.<br />
Damit bleibt die Vergleichbarkeit der Testwerte zwischen den Teilnehmer einer<br />
Stichprobe erhalten, Vergleiche mit anderen Stichproben sind jedoch nicht möglich.<br />
Systematik <strong>interkultureller</strong> Studien<br />
Interkulturelle Untersuchungen unterscheiden sich in zwei Dimensionen: zum einen gibt<br />
es explorative Studien, zum anderen Hypothesen testende Studien. Je nachdem, ob<br />
kontextabhängige Variablen bei den Untersuchungen mit eine Rolle spielen, ergeben sich<br />
vier verschiedene Arten vergleichender Studien: Generalisierbarkeitsstudien <strong>und</strong> Theorie<br />
geleitete Studien (beide zählen zu Hypothesen testenden Untersuchungsdesign), sowie<br />
psychologische Unterschiedsstudien <strong>und</strong> externe Validierungsstudien (explorativer<br />
Charakter).<br />
Betrachtung kontextabhängiger Variablen Hypothesen testend explorativ<br />
Nein Generalisierbarkeit Psychologische Unterschiede<br />
Ja Theorie geleitet Externe Validierung
Diese vier verschiedenen Ansätze können jeweils entweder Struktur orientiert<br />
(Beziehungen zwischen Variablen; Identifikation von Ähnlichkeiten <strong>und</strong> Unterschieden in<br />
diesen Beziehungen zwischen Kulturen) oder Level orientiert sein (Unterschiede in<br />
Variablenwerten zwischen Kulturen). Ein Beispiel für eine Struktur orientierte<br />
Generalisierbarkeitsstudie ist die interkulturelle Erforschung der Gültigkeit der „Big Five“<br />
- Persönlichkeitstheorie.<br />
1. Generalisierbarkeitsstudien<br />
Versuch, <strong>Forschung</strong>sergebnissen in einer Population auf andere Populationen zu<br />
generalisieren. Der Fokus liegt ausschließlich auf der/den Zielvariablen, in der zwei<br />
Kulturen verglichen werden, andere kulturelle Elemente finden keine Beachtung.<br />
2. Theorie geleitete Studien<br />
Spezifische kulturelle Aspekte (bspw. Art der Kindererziehung, ökologische Faktoren)<br />
oder bestimmte kulturelle Gewohnheiten/Bräuche sind Teil des theoretischen Gerüsts,<br />
auf dem das Studiendesign basiert. Kulturell bedingte Abweichungen in diesen<br />
Aspekten werden bewusst gesucht um das zugr<strong>und</strong>e liegende theoretische Modell zu<br />
bestätigen. Kontextabhängige Variable spielen hier also eine äußerst wichtige Rolle.<br />
3. Psychologische Unterschiedsstudien<br />
Dieser <strong>Forschung</strong>sansatz ist bei interkulturellen Untersuchungen am weitesten<br />
verbreitet. Ein Messinstrument wird in zumindest zwei Kulturen angewendet um<br />
herauszufinden, ob es irgendwelche interkulturellen Unterschiede gibt oder nicht.<br />
Kontextabhängige Variablen werden in diesem Design nicht berücksichtigt, mittels<br />
Post-hoc-Erklärungen werden beobachtete Unterschiede interpretiert.<br />
4. Externe Validierungsstudien<br />
Untersuchungsgegenstand sind die Bedeutung <strong>und</strong> Ursachen <strong>interkultureller</strong><br />
Unterschiede mithilfe von kontextabhängigen Variablen, wobei es keine vorher<br />
aufgestellten Hypothesen gibt. Am häufigsten wird hierbei eine Regressionsanalyse<br />
durchgeführt, um herauszufinden, inwiefern kontextabhängige Variablen Unterschiede<br />
in der abhängigen Variablen klären kann. Diese Methode ist normalerweise nicht<br />
durch strukturelle oder Skalenäquivalenz gekennzeichnet, sondern es sollen so<br />
Variablen identifiziert werden, die helfen sollen die interkulturellen Unterschiede zu<br />
erklären.