18.07.2013 Aufrufe

Methoden und Datenanalyse interkultureller Forschung - Kognition

Methoden und Datenanalyse interkultureller Forschung - Kognition

Methoden und Datenanalyse interkultureller Forschung - Kognition

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Äquivalenz<br />

<strong>Methoden</strong> <strong>und</strong> <strong>Datenanalyse</strong> <strong>interkultureller</strong> <strong>Forschung</strong><br />

Man unterscheidet verschiedene Äquivalenzlevels (in aufsteigender Reihenfolge):<br />

1. strukturelle Inäquivalenz<br />

Ein Instrument misst unterschiedliche Konstrukte in verschiedenen Kulturen („Äpfel<br />

mit Birnen vergleichen“). Ein Vergleich der beobachteten Werte ist nicht möglich. Es<br />

kann durch Messprobleme entstehen, wenn bspw ein Konstrukt wie Mittelklasse in<br />

den untersuchten Kulturen unterschiedliche Bedeutung hat.<br />

2. strukturelle Äquivalenz<br />

Es kennzeichnet, ob das zu messende Konstrukt in den untersuchten Kulturen<br />

tatsächlich sinnvoll erfasst werden kann. Dasselbe Konstrukt wird also in den Kulturen<br />

gemessen, wobei es nicht auf gleiche Weise operationalisiert sein muss. Das hat<br />

wiederum zur Folge, dass interkulturelle Vergleiche nicht möglich sind.<br />

3. Äquivalenz der Maßeinheit<br />

Damit wird die Tatsache gekennzeichnet, dass die Messung in zwei Stichproben Daten<br />

mit der gleichen Skalierung hervorbringen kann, der Skalenursprung jedoch<br />

unterschiedlich ist. Ein Beispiel dafür ist die Messung von Temperatur in Celsius<br />

Graden oder in Kelvin Graden (K = C - 273). Meistens ist der Skalenursprung in<br />

interkulturellen Studien nicht bekannt, weshalb die auf Intervalllevel beobachteten<br />

Werte in den verschiedenen Kulturen nicht vergleichbar sind.<br />

4. Skalenäquivalenz (skalare Äquivalenz; „full score comparability“)<br />

Bias<br />

Wenn nachgewiesen werden kann, dass Werte nicht nur über die gleiche Maßeinheit<br />

sondern auch über den gleichen Skalenursprung verfügen, so wird von voller<br />

Skalenäquivalenz gesprochen. Beispiele für Werte mit voller Skalenäquivalenz sind<br />

Körpergewicht <strong>und</strong> Körpergröße. Skalenäquivalenz ermöglicht die direkte<br />

Vergleichbarkeit von Testwerten zwischen unterschiedlichen Stichproben.<br />

1. Konstrukt-Bias<br />

bezeichnet die mangelhafte Abbildung eines psychologischen Konstrukts im<br />

Instrument. In diesem Fall werden in den untersuchten Kulturen verschiedene<br />

Konstrukte gemessen, ein Vergleich ist nicht möglich. Ein besonders hohes Risiko für<br />

Konstruktbias besteht darin, Testverfahren, die in einer Kultur entwickelt wurden, in<br />

einer anderen Kultur einzusetzen, da das zu messende psychologische Konstrukt


durch die in der Ursprungskultur entwickelte Operationalisierung in der Zielkultur<br />

möglicherweise nur unvollständig (oder gar nicht) abgebildet werden kann.<br />

Ursachen:<br />

- das zugr<strong>und</strong>e liegende theoretische Konzept eines Konstrukts umfasst in einer der<br />

untersuchten Kulturen noch weitere zusätzliche Dimensionen, die vom Test nicht<br />

abgedeckt werden, d.h. die Definitionen eines Konstrukts in unterschiedlichen<br />

Stichproben stimmen nur teilweise überein.<br />

- das Verhalten, das mit dem Konstrukt assoziiert wird, stimmt in den<br />

verschiedenen Kulturen zu wenig überein; es werden nicht alle relevanten<br />

Verhaltensweisen eines Konstrukts von einer Skala berücksichtigt.<br />

- „construct <strong>und</strong>errepresentation“: relevante Verhaltensweisen werden nur<br />

unzureichend oder gar nicht abgetestet.<br />

- nicht alle Wertebereiche eines Konstrukts sind abgedeckt.<br />

Ermittlung über (a) Faktorenanalyse (Faktorenstruktur oder Faktorladungen) oder (b)<br />

zusätzliche Untersuchungen bezüglich über die Anwendbarkeit des Konstrukts <strong>und</strong><br />

des verwendeten Messinstruments.<br />

Es gibt drei Möglichkeiten, um eine kulturell balancierte/ausgeglichene Studie zu<br />

entwerfen: entweder durch einen dezentrierten Ansatz (eine kulturell facettenreiche<br />

Perspektive wird bei der Konzeptualisierung <strong>und</strong> Versuchsplanung eingenommen,<br />

indem Forscher mit unterschiedlichen kulturellen Hintergründen mitarbeiten) oder<br />

mittels Konvergenzmethode (ein Forscher aus jeder der untersuchten Kulturen<br />

entwirft ein für die jeweilige Kultur adäquates Messinstrument, welches dann in allen<br />

Kulturen getestet wird). Als dritte Möglichkeit kann man eine Studie entwerfen, die<br />

soweit wie möglich kulturabhängig ist im Vergleich zu bereits existierenden Studien,<br />

wobei untersucht wird, ob sich die beobachteten Ergebnisse mit früheren Ergebnissen<br />

decken. Wenn ja, kann man davon ausgehen, dass der kulturelle Ursprung der<br />

früheren Studien die Ergebnisse nicht verfälscht hat.<br />

2. <strong>Methoden</strong>-Bias<br />

Wenn ein Konstrukt durch eine Testskala angemessen abgebildet wird, kann es durch<br />

die verwendete Methodik zu einer Verzerrung der Ergebnisse kommen.<br />

Ursachen:<br />

- (kulturell) unterschiedliches Antwortverhalten wie etwa Zustimmungstendenz<br />

(vorgegebenen Statements in einem Test wird unabhängig vom Inhalt<br />

zugestimmt. Die tatsächliche Meinung wird so verzerrt, die Messung fehlerhaft),<br />

Extrembewertungen sowie soziale Erwünschtheit von Antworten.<br />

Beispiel: Hui & Triandis (1989) stellten fest, dass die Erhebung auf einer 5-stufigen Likertskala bei<br />

Mexikanern im Vergleich zu US-Amerikanern zu einer verstärkten Tendenz zu extremen Antworten<br />

führte. Bei Verwendung einer 10-stufigen Skala verschwand diese Tendenz. Die Antwortstile waren<br />

also nicht durch die Items an sich bedingt, sondern durch die Form ihrer Darbietung.


- unterschiedliche Vertrautheit mit dem getesteten Stimulusmaterial.<br />

- unterschiedliche Vertrautheit mit der zu verwendenden Antwortprozedur.<br />

- mangelhafte Vergleichbarkeit der getesteten Populationen (Unterschiede in der<br />

schulischen Ausbildung, im Alter, in der Geschlechtszusammensetzung...)<br />

- Testleiter-/Interviewereffekte<br />

- Unterschiedliche physikalische Bedingungen während der Testdurchführung (z.B.<br />

Lärm in der Umgebung, Anwesenheit anderer Personen)<br />

- Kommunikationsprobleme, wie z.B. zwischen dem Tester <strong>und</strong> dem Testenden<br />

(Sprachprobleme, Interviewerfähigkeiten) aber auch Verletzung von Normen<br />

durch die Versuchsanordnung/den Test)<br />

Da <strong>Methoden</strong>bias auf die Gesamtheit der Items wirkt <strong>und</strong> nicht selektiv, bleibt die<br />

Vergleichbarkeit innerhalb einer Stichprobe auch bei Vorliegen von <strong>Methoden</strong>bias<br />

erhalten. Da aber die Größe des Einflusses des <strong>Methoden</strong>bias auf die Testwerte nicht<br />

beziffert werden kann, ist ein Vergleich zwischen unterschiedlichen Stichproben auf<br />

Skalenebene nicht möglich.<br />

Abschätzen des Einflusses eines <strong>Methoden</strong>bias durch (a) wiederholtes Testen mit dem<br />

gleichen Testinstrument in verschiedenen kulturellen Gruppen <strong>und</strong> Untersuchung der<br />

Änderungen (normalerweise Zunahmen) der erzielten Testscores (diese Methode wird<br />

vor allem bei kognitiven Tests eingesetzt) oder (b) systematische Variation des<br />

Stimulusmaterials über alle Kulturen hinweg.<br />

3. Item-Bias<br />

Diese Art der Verzerrung bezieht sich auf Messartefakte auf Itemlevel.<br />

Ursachen:<br />

- schlechte Übersetzung des Items<br />

- schlechte Formulierung des Items (zu komplex, zu kompliziertes Wording)<br />

- zufällige Unterschiede in der Eignung eines Iteminhalts (Gegenstand eines Items<br />

kommt in einer der untersuchten Kulturen gar nicht vor).<br />

Bei Untersuchungen unterschiedlicher Kulturen ist es wichtig festzustellen, ob die<br />

eingesetzten Items in jeder Kultur das im Fokus stehende Konzept sinnvoll erfassen!<br />

Auswirkungen von Bias auf die Äquivalenzstufen<br />

Bias <strong>und</strong> Äquivalenz sind miteinander verknüpft („scores are equivalent when they are<br />

unbiased“). Allgemein gilt, dass ein Bias das Äquivalenzlevel herabsetzt.<br />

Im Fall von <strong>Methoden</strong>- <strong>und</strong> Item-Bias unterscheidet man einen uniformen <strong>und</strong> einen<br />

nonuniformen Bias. Uniformer Bias kennzeichnet eine systematische Verzerrung, die auf<br />

alle Stufen der Messung gleich wirkt (in einer Gruppe wird konstant um 1kg mehr<br />

gemessen. Ein Vergleich der Gewichte verschiedener Personen ist trotz dieser Verzerrung<br />

möglich). Nonuniformer Bias wirkt unterschiedlich auf bestimmte Stufen/Wertelevels,


sodass ein Vergleich zwischen den Gruppen nicht mehr möglich (In der ersten Gruppe<br />

misst die Waage das Gewicht akkurat, in der zweiten Gruppe zeigt die Waage jeweils ein<br />

10% höheres Gewicht als das tatsächliche an. Je höher das Gewicht einer Person, desto<br />

stärker also die Verzerrung der Messung).<br />

Tabelle: Beeinflusst ein Bias das Level der Äquvalenz?<br />

Bei Auftreten von Konstruktbias können gar keine Aussagen zum betreffenden<br />

psychologischen Konstrukt getroffen werden, außer, dass es in einer der untersuchten<br />

Stichproben so nicht nachweisbar ist. Tritt eine Verzerrung auf der Ebene der Methode<br />

auf, <strong>und</strong> wirkt diese auf alle Items in gleicher Weise, wie z.B. Antwortstile, so kann zum<br />

einen Konstruktäquivalenz nachgewiesen werden, zum anderen ist ein Vergleich der<br />

Testwerte zwischen Teilnehmern innerhalb einer Stichprobe möglich. Ist der Einfluss der<br />

Verzerrung aber nicht gleichmäßig, so ist dieser Vergleich zwischen Teilnehmern nicht<br />

möglich. Genauso verhält es sich mit Itembias. Wirkt dieser auf alle Teilnehmer einer<br />

Stichprobe in gleicher Weise, beantworten also alle Teilnehmer ein unangemessenes<br />

Item, so werden die Testwerte einer Stichprobe einer uniformen Verzerrung unterworfen.<br />

Damit bleibt die Vergleichbarkeit der Testwerte zwischen den Teilnehmer einer<br />

Stichprobe erhalten, Vergleiche mit anderen Stichproben sind jedoch nicht möglich.<br />

Systematik <strong>interkultureller</strong> Studien<br />

Interkulturelle Untersuchungen unterscheiden sich in zwei Dimensionen: zum einen gibt<br />

es explorative Studien, zum anderen Hypothesen testende Studien. Je nachdem, ob<br />

kontextabhängige Variablen bei den Untersuchungen mit eine Rolle spielen, ergeben sich<br />

vier verschiedene Arten vergleichender Studien: Generalisierbarkeitsstudien <strong>und</strong> Theorie<br />

geleitete Studien (beide zählen zu Hypothesen testenden Untersuchungsdesign), sowie<br />

psychologische Unterschiedsstudien <strong>und</strong> externe Validierungsstudien (explorativer<br />

Charakter).<br />

Betrachtung kontextabhängiger Variablen Hypothesen testend explorativ<br />

Nein Generalisierbarkeit Psychologische Unterschiede<br />

Ja Theorie geleitet Externe Validierung


Diese vier verschiedenen Ansätze können jeweils entweder Struktur orientiert<br />

(Beziehungen zwischen Variablen; Identifikation von Ähnlichkeiten <strong>und</strong> Unterschieden in<br />

diesen Beziehungen zwischen Kulturen) oder Level orientiert sein (Unterschiede in<br />

Variablenwerten zwischen Kulturen). Ein Beispiel für eine Struktur orientierte<br />

Generalisierbarkeitsstudie ist die interkulturelle Erforschung der Gültigkeit der „Big Five“<br />

- Persönlichkeitstheorie.<br />

1. Generalisierbarkeitsstudien<br />

Versuch, <strong>Forschung</strong>sergebnissen in einer Population auf andere Populationen zu<br />

generalisieren. Der Fokus liegt ausschließlich auf der/den Zielvariablen, in der zwei<br />

Kulturen verglichen werden, andere kulturelle Elemente finden keine Beachtung.<br />

2. Theorie geleitete Studien<br />

Spezifische kulturelle Aspekte (bspw. Art der Kindererziehung, ökologische Faktoren)<br />

oder bestimmte kulturelle Gewohnheiten/Bräuche sind Teil des theoretischen Gerüsts,<br />

auf dem das Studiendesign basiert. Kulturell bedingte Abweichungen in diesen<br />

Aspekten werden bewusst gesucht um das zugr<strong>und</strong>e liegende theoretische Modell zu<br />

bestätigen. Kontextabhängige Variable spielen hier also eine äußerst wichtige Rolle.<br />

3. Psychologische Unterschiedsstudien<br />

Dieser <strong>Forschung</strong>sansatz ist bei interkulturellen Untersuchungen am weitesten<br />

verbreitet. Ein Messinstrument wird in zumindest zwei Kulturen angewendet um<br />

herauszufinden, ob es irgendwelche interkulturellen Unterschiede gibt oder nicht.<br />

Kontextabhängige Variablen werden in diesem Design nicht berücksichtigt, mittels<br />

Post-hoc-Erklärungen werden beobachtete Unterschiede interpretiert.<br />

4. Externe Validierungsstudien<br />

Untersuchungsgegenstand sind die Bedeutung <strong>und</strong> Ursachen <strong>interkultureller</strong><br />

Unterschiede mithilfe von kontextabhängigen Variablen, wobei es keine vorher<br />

aufgestellten Hypothesen gibt. Am häufigsten wird hierbei eine Regressionsanalyse<br />

durchgeführt, um herauszufinden, inwiefern kontextabhängige Variablen Unterschiede<br />

in der abhängigen Variablen klären kann. Diese Methode ist normalerweise nicht<br />

durch strukturelle oder Skalenäquivalenz gekennzeichnet, sondern es sollen so<br />

Variablen identifiziert werden, die helfen sollen die interkulturellen Unterschiede zu<br />

erklären.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!