vl4_skalen,gütekriterien_aktualisiert - Universität Flensburg
vl4_skalen,gütekriterien_aktualisiert - Universität Flensburg
vl4_skalen,gütekriterien_aktualisiert - Universität Flensburg
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
<strong>Universität</strong> <strong>Flensburg</strong><br />
Zentrum für Methodenlehre<br />
Tutorium Empirie I<br />
Vorlesung 4 - Skalen, Gütekriterien<br />
Item:<br />
- einzelne Frage/Aufgabe in einem Fragebogen oder Test<br />
Skalenwert:<br />
- „[...] die Summe der positiven Reaktionen auf die vorgelegten Items.“ (Diekmann 2008, S. 273)<br />
Reifizierung:<br />
- die Annahme, dass es einen theoretischen Begriff wirklich gibt, weil man diesen mittels<br />
konkreter Indikatoren gemessen hat<br />
Index:<br />
- aus mehreren Indikatoren errechneter Wert, der meist einen theoretischen Begriff repräsentieren soll<br />
Item-Schwierigkeit:<br />
- prozentualer Anteil der Nicht-Zustimmung zu einem Item<br />
Likert-Skala:<br />
- a) Instrument zur Einstellungsmessung, bestehend aus Items mit monoton ansteigenden Charakteristiken<br />
- b) 5 stufiger Antwortvorgabe für ein Item von „stimme überhaupt nicht zu“ bis „stimme voll<br />
und ganz zu“<br />
Guttman-Skala:<br />
- Skala, bei der die Items nur zwei Werte annehmen können (z. B. ja/nein)<br />
- Items haben sinkende Zustimmungswahrscheinlichkeit bzw. steigende Item-Schwierigkeit<br />
Trennschärfe-Index:<br />
- für ein Item werden die Werte des Viertels der Befragten mit den niedrigsten<br />
Gesamtergebnissen und dem Viertel mit den höchsten Gesamtergebnissen verglichen<br />
Trennschärfe-Koeffizient/ Item- Gesamtscore- Korrelation:<br />
- gibt an, inwieweit ein Item in Beziehung zum Gesamtscore steht<br />
- Berechnung der Korrelation zwischen den jeweiligen Items und dem Summenscore<br />
1
Beispiel für einen theoretischen Begriff: Umweltbewusstsein<br />
Operationalisierung: Zuweisen geeigneter Indikatoren, Wahl der Erhebungsmethode/ des<br />
Erhebungsinstruments<br />
- um z.B. Umweltbewusstsein zu messen, könnte man sich z. B. für eine Befragung als Methode und die<br />
Likert- Skala als Instrument entscheiden<br />
- die einzelnen Items wären dann die manifesten Variablen<br />
Umweltbewusstsein<br />
→ Operationalisierung → (jeweils Antwortvorgaben von 1= „stimme<br />
überhaupt nicht zu“ bis 5= „stimme voll zu“) z.B.:<br />
→ „Wenn wir so weitermachen wie bisher, steuern wir auf eine Umweltkatastrophe zu.“<br />
→ „Es ist noch immer so, dass die Politiker viel zu wenig für den Umweltschutz tun.“<br />
→ „Nach meiner Einschätzung wird das Umweltproblem in seiner Bedeutung von vielen<br />
Umweltschützern stark übertrieben.“<br />
2
aus: Diekmann 2008, S. 243-248<br />
4
Objektivität: Verschiedene Untersucher kommen mit demselben Messinstrument zu dem<br />
gleichen Ergebnis; Differenzierungen: Durchführungsobjektivität (2 verschiedene Interviewer lösen mit der<br />
gleichen Antwortbatterie gleiche Reaktionen bei Befragtem X aus) / Auswertungsobjektivität (2 Auswerter<br />
kommen zu gleichen Schlüssen bei der Bewertung der Antworten von Befragtem X); Beispiel: man legt zwei<br />
Lehrern eine bestimmte Anzahl von Klassenarbeiten vor und schaut sich die Benotung an- sie wird bei der<br />
gleichen Arbeit durch die verschiedenen Lehrer wahrscheinlich unterschiedlich beurteilt werden.<br />
(Korrelationskoeffizient zwischen „Benotung durch Lehrer A“ und „Benotung durch Lehrer B“ berechnen)<br />
Reliabilität: Wiederholte Messungen unter denselben Rahmenbedingungen müssen zum gleichen<br />
Ergebnis führen (Grad der Reproduzierbarkeit).<br />
Differenzierungen: Split-Half-Reliabilität (ein Fragebogen wird in zwei Hälften mit gleich vielen Items<br />
aufgeteilt und an Stichproben angewendet, die Korrelation der beiden Hälften wird ermittelt), Paralleltest-<br />
Reliabilität (die Ergebnisse eines Messinstruments werden mit denen eines anderen Instruments<br />
verglichen- z.B. zwei Intelligenztests bei einer Person), Test-Retest Reliabilität (das Messinstrument wird<br />
wiederholt angewendet und die Ergebnisse miteinander verglichen, Probleme: Lerneffekte, Änderungen bei<br />
den Ausprägungen der zu messenden Eigenschaft); Reliabilität setzt Objektivität voraus!<br />
Beispiel für Vorliegen von Objektivität, aber nicht von Reliabilität: 2 unterschiedliche Personen lesen von<br />
einem Thermometer das gleiche, aber leider falsche Ergebnis ab<br />
Validität: Gültigkeit eines Messinstruments. Das Testverfahren muss auch tatsächlich das messen, was es<br />
messen soll oder zu messen vorgibt.<br />
Differenzierungen: Inhaltsvalidität (repräsentiert die Auswahl der Items die interessierende Eigenschaft<br />
genügend?), Kriteriumsvalidität (sind die Ergebnisse mit einem unabhängig gemessenen relevanten<br />
Außenkriterium korreliert?), Konstruktvalidität (ist das Messinstrument brauchbar zur Entwicklung von<br />
Theorien?); Validität setzt Objektivität und Reliabilität voraus!<br />
Cronbachs a: Maß der Reliabilität, sollte über 0,7 liegen<br />
Halo-Effekt (auch: Fragereiheneffekt, Fragekontexteffekt, Positionseffekt) :<br />
Ausstrahlungseffekt von Fragen auf andere Fragen, z. B. „Haben Sie Angst vor Überfällen?“;<br />
„Gehen Sie gerne nachts spazieren?“<br />
Arten von Fragen<br />
1. Wissensfragen: subjektive Aussagen über Fakten, die überprüfbar sind<br />
Beispiel: „Wie hoch schätzen Sie den Anteil an von Armut betroffenen Menschen in Ihrer Stadt?“<br />
2. Meinungsfragen: Beispiel: „Sollte die NPD Ihrer Meinung nach verboten werden?“<br />
3. Verhaltens-/Einstellungsfragen: sind in der Regel Retrospektivfragen, erfragt wird die Dauer,<br />
Häufigkeit und Art von Handlungen in der Vergangenheit und Zukunft oder ob eine bestimmte Aktivität<br />
in der Vergangenheit stattgefunden hat.<br />
Beispiel: „Wie oft waren Sie im letzten Monat im Kino?“<br />
Zukünftiges Verhalten: „Wie viel Geld planen Sie im nächsten Jahr für Ihren Urlaub<br />
auszugeben?“<br />
4. Fragen nach sozialstatistischen Merkmalen: Beispiel: „ Besitzen Sie ein Auto?“<br />
5
weitere Unterscheidungen:<br />
- Selbstauskunft<br />
- Fremdauskunft<br />
- direkt<br />
- indirekt: Fragen, die Rückschlüsse auf Hintergründe einer Einstellung zulassen sollen, das Ziel der<br />
Frage wird dem Befragten nicht deutlich; Beispiel: „Viele Menschen lesen die Bildzeitung. Was denken<br />
Sie darüber?“<br />
- projektive Fragen: es wird ein Szenario dargestellt, Beispiel: „Stellen sie sich vor, zum nächsten<br />
Semester würden Studiengebühren eingeführt. Wie würden sie reagieren?“<br />
- geschlossene Fragen: vorgegebene Antwortkategorien wie „Ja/ Nein“<br />
- offene Fragen: keine vorgegebenen Antwortkategorien<br />
- halboffene Fragen: Kompromiss zwischen offenen und geschlossenen Fragen<br />
6
Zusätzliche Aufgaben<br />
1. Um welche Skala handelt es sich? Begründen Sie Ihre Antwort.<br />
1. Würden Sie es tolerieren, wenn Ausländer in Ihrem Land leben?<br />
2. Würden Sie es tolerieren, wenn Ausländern in Ihrem Wohnort leben?<br />
3. Würden Sie es tolerieren, wenn Ausländer in Ihrem Wohnviertel eben?<br />
4. Würden Sie es tolerieren, wenn Ausländern direkt neben Ihnen leben?<br />
5. Würden Sie es tolerieren, wenn Ihr Kind einen Ausländer heiratet?<br />
Antwortvorgaben jeweils „Ja“/“Nein“<br />
Antwort: Guttman-Skala, weil: aufsteigende Item-Schwierigkeit und dichotome Antwortmöglichkeiten<br />
7
2. Im Folgenden steht eine Skala, auf der Schüler Aussagen über das Lesen von Büchern<br />
beurteilen sollen. Die Antwortmöglichkeiten reichen von 1 = „stimme überhaupt nicht zu“ bis<br />
5 = „stimme vollkommen zu“.<br />
(1) Ich lese nur, wenn ich unbedingt muss.<br />
(2) Ein Buch als Geschenk zum Geburtstag zu bekommen, fände ich schrecklich.<br />
(3) Ich finde alle Kinder, die Bücher lesen, sind Streber.<br />
(4) Lesen ist langweilig.<br />
(5) Für meine Zukunft ist es besser, wenn ich gut lesen kann.<br />
Um welche Art von Skala handelt es sich hierbei? Begründen Sie Ihre Antwort.<br />
Lösung:<br />
Likert-Skala, weil die Antwortvorgaben aus der Likert-Antwortskala bestehen<br />
3. Welche der folgenden Aussagen in Bezug auf die Guttman- Skala trifft/treffen zu?<br />
a) Es ist wichtig, die Antwortmuster an einer Testpopulation zu testen.<br />
b) Die Skalenwerte haben rationales Skalenniveau.<br />
c) Eine Guttman- Skala ist nicht geeignet, eine latente Variable zu messen.<br />
d) Die Item-Schwierigkeit sollte bei allen verwendeten Items in etwa gleich sein.<br />
Lösung: a)<br />
4. Eine Likert-Skala unterscheidet sich von einer Guttman-Skala dadurch, dass…<br />
a) sie ein höheres Skalenniveau hat.<br />
b) sie sich zur Einstellungsmessung mit Hilfe von Items mit nicht-monotonen<br />
Charakteristiken eignet.<br />
c) sich kein Index berechnen lässt.<br />
d) sie eine absinkende Item-Schwierigkeit besitzen muss.<br />
Lösung: a)<br />
5. Welche der folgenden Aussagen über die Beziehung zwischen theoretischen Begriffen und<br />
ihrer Messung trifft zu?<br />
a) Operationalisierung bedeutet die Auswahl zwischen verschiedenen theoretischen Begriffen.<br />
b) Das Skalenniveau einer Variable kann nicht empirisch bestimmt werden, sondern wird<br />
theoretisch oder durch die vorgegebenen Antwortmöglichkeiten festgelegt.<br />
c) Manifeste Variablen sind nicht direkt messbar.<br />
d) Reifikation bedeutet, theoretische Konstrukte für wahr zu halten, nur weil man sie<br />
gemessen hat.<br />
8
Lösung: d)<br />
6. Füllen Sie bitte den folgenden Lückentext über die Gütekriterien eines Messinstrumentes mit den<br />
Begriffen objektiv, nicht objektiv, reliabel, nicht reliabel, valide und nicht valide aus!<br />
Wenn verschiedene Lehrer dieselbe Schülerleistung gleich beurteilen, dann ist das Urteil<br />
(1) __________________.<br />
Geben verschiedene Lehrer zu verschiedenen Zeitpunkten über dieselbe Schülerleistung das<br />
gleiche Urteil ab, dann sind die Urteile sowohl (2) __________________ wie<br />
auch (3)__________________.<br />
Sind erhebliche Zweifel daran berechtigt und nachgewiesen, dass der Lehrer nicht das<br />
beurteilt, was er zu beurteilen vorgibt, dann ist das Urteil (4) __________________, das<br />
Urteil kann aber (5) __________________sein.<br />
Ein Lehrer, der zu verschiedenen Zeitpunkten dieselbe Schülerleistung unterschiedlich<br />
beurteilt, gibt ein Urteil ab, das (6) __________________ ist.<br />
Wenn ein Urteil gültig ist, so bezeichnet man dieses Urteil auch als (7) __________________.<br />
Zuverlässigkeit muss gegeben sein, damit ein Urteil überhaupt (8) __________________ sein<br />
kann.<br />
Lösung: (1) objektiv; (2) objektiv, (3) reliabel, (4) nicht valide, (5) reliabel oder objektiv, (6) nicht reliabel, (7)<br />
valide, (8) valide<br />
7. Welche der folgenden Aussagen zu den Gütekriterien trifft/treffen zu?<br />
a) Ist ein Messinstrument reliabel, so müssten verschiedene Forscher zu gleichen Ergebnissen<br />
kommen.<br />
b) Ist ein Messinstrument reliabel, so bedeutet dies, dass der Test das misst, was er messen soll.<br />
c) Ein Messinstrument kann valide sein ohne objektiv zu sein.<br />
d) Ein Messinstrument, das objektiv ist, führt bei wiederholter Anwendung immer zu den gleichen<br />
Ergebnissen.<br />
e) Ein valides Messinstrument ist unabhängig vom jeweiligen Forscher.<br />
Lösung: a; e<br />
8. Welche Aussage(n) über das Verhältnis der drei Gütekriterien zueinander trifft/ treffen zu?<br />
a) Kommt man bei Messungen zu unterschiedlichen Zeitpunkten zu ähnlichen Ergebnissen, kann man<br />
neben der Reliabilität auch gleichzeitig die Validität annehmen.<br />
b) Damit ein Messinstrument den Anforderungen genügt, müssen mindestens zwei Gütekriterien<br />
erfüllt sein.<br />
c) Es müssen immer alle drei Gütekriterien erfüllt sein, damit ein Messinstrument die Anforderungen<br />
erfüllt.<br />
d) Die Validität einer Messung ist immer größer als die Reliabilität.<br />
e) Wenn bei einer Umfrage die Ergebnisse zwischen den Interviewern auch bei ähnlichen Befragten<br />
stark schwanken, ist das Messinstrument automatisch auch nicht reliabel und valide.<br />
Lösung: c,e<br />
9
9. Füllen Sie bitte den folgenden Lückentext über die Gütekriterien eines Messinstrumentes mit den<br />
folgenden Begriffen aus: objektiv, nicht objektiv, reliabel, nicht reliabel, valide, nicht valide.<br />
Ein Evaluationsbogen, der zu verschiedenen Zeitpunkten für dieselbe Vorlesung ähnliche Beurteilungen<br />
liefert, gibt ein Urteil ab, das (1) __________________ ist. Wenn ein Urteil nicht „gültig“ ist, so bezeichnet<br />
man dieses Urteil auch als (2) __________________. Wenn vermutet werden kann, dass die Studierenden<br />
bei der Beurteilung der Vorlesung doch auch das Verhalten der Dozentin in der Sprechstunde<br />
mitberücksichtigen, dann ist das Urteil (3) __________________, das Urteil kann aber trotzdem (4)<br />
__________________sein.<br />
Lösung: 1) reliabel 2) nicht valide 3) nicht valide 4) reliabel oder objektiv<br />
10. Bestimmen sie jeweils alle zutreffenden Fragearten:<br />
a) „Wenn in Ihrer <strong>Universität</strong> Studiengebühren eingeführt würden, würde dies Ihren weiteren<br />
Studienverlauf beeinträchtigen?“<br />
□Ja □Nein □Weiß nicht<br />
b) „Wie viel Zeit haben Sie in der letzten Woche damit zugebracht, sich auf Ihre Lehrveranstaltungen<br />
vorzubereiten?“<br />
.............................<br />
c) „Menschen mit Migrationshintergrund werden auf dem Arbeitsmarkt bevorzugt behandelt.“<br />
□ stimme stark zu □ stimme zu □ teils, teils □ stimme nicht zu □ stimme überhaupt<br />
nicht zu<br />
d) „Wie hoch schätzen Sie den Anteil an Arbeitslosen, die unter Depressionen leiden?“<br />
e) „Wie viel Geld verdient Ihr Lebenspartner?<br />
□ unter 1500 € □ 1500 - 3000 € □ über 3000 €<br />
Lösung: a.): Verhaltensfrage, Selbstauskunft, projektiv, geschlossen<br />
b.): Verhaltensfrage, Selbstauskunft, direkt, offen<br />
c.): Meinungsfrage, Selbstauskunft, indirekt, geschlossen<br />
d.): Wissensfrage, Fremdauskunft, direkt, offen<br />
e): Frage nach sozialstatistischen Merkmalen, Fremdauskunft, direkt, geschlossen<br />
11. Verbessern Sie die folgende Fragebogenfrage einschließlich der dazugehörigen<br />
Antwortkategorien!<br />
In einer allgemeinen Umfrage wurde gefragt:<br />
Sollten die Tamil- Tigers ein autonomes Gebiet erhalten?<br />
□ Ja □ Nein<br />
Lösung: „weiß nicht“ Option fehlt; die Tamil-Tigers sind nicht bekannt genug, um sie erklärungslos in einer<br />
10
Umfrage zu präsentieren.<br />
12. Verbessern Sie folgende Fragen:<br />
a) „Viele Politiker sind ja der Ansicht, dass Studiengebühren an allen <strong>Universität</strong>en<br />
eingeführt werden sollten - würden auch Sie Studiengebühren zustimmen?“<br />
□ Ja □ Nein<br />
b) „Für das Engagement der Schüler im Unterricht sind die Eltern mehr verantwortlich als die Lehrer.“<br />
□ Ja □ Nein □ Weiß nicht<br />
c) „Schätzen Sie bitte, wie viel Prozent der Einwohner Ihrer Stadt nicht weniger als das doppelte<br />
Durchschnittseinkommen zur Verfügung haben.“<br />
Lösung: a: Suggestivfrage! Sollte neutral formuliert werden. b: besser: „Wer ist Ihrer Meinung nach mehr<br />
verantwortlich für das Engagement der Schüler?“, Antwortvorgaben „Eltern“, „Lehrer“, „weiß nicht“/ c:<br />
Formulierung zu unklar! Doppelte Verneinung („nicht weniger“)! Einschätzen von Prozentangaben<br />
problematisch! Besser: „Wie viele Einwohner Ihrer Stadt haben nach Ihrer Schätzung mindestens das doppelte<br />
Durchschnittseinkommen zur Verfügung?“ Antwortvorgaben (z.B.): „Die Hälfte“, „ein Drittel“, „ein Zehntel“<br />
13. Was ist an folgender Frageformulierung zu kritisieren?<br />
„Sind Sie mit der Qualität und dem Preis unseres Produktes zufrieden?“<br />
□ Ja □Nein<br />
Lösung: Mehrdimensionale Frage, besser zwei getrennte Fragen: einmal nach der Zufriedenheit mit dem Preis<br />
und dann nach der Zufriedenheit mit der Qualität.<br />
14. Welche der folgenden Aussagen zu den verschiedenen Fragearten trifft/treffen zu?<br />
a) Mit projektiven Fragen testet man die Aufrichtigkeit des Befragten.<br />
b) Bei Wissensfragen sollte es eine „Weiß nicht“ –Kategorie geben.<br />
c) Mit einer einzelnen Frage kann man mehrere Dimensionen abfragen.<br />
d) Die Reihenfolge der Fragen spielt keine Rolle.<br />
e) Kontrollfragen dienen dazu, die Konsistenz des Antwortverhaltens eines Befragten zu<br />
prüfen.<br />
Lösung: b;e<br />
11
15. Sie sind mit der Entwicklung einer Mitarbeiterbefragung in einem Unternehmen beauftragt.<br />
Welche der unten aufgeführten Fragebatterien würden Sie wählen, um die Zufriedenheit der<br />
MitarbeiterInnen mit dem Aus- und Weiterbildungsangebot des Unternehmens festzustellen?<br />
Begründen Sie Ihre Wahl!<br />
Fragebatterie 1: (Antwortmöglichkeiten auf einer Skala von 1= völlig unzutreffend bis 5= völlig zutreffend)<br />
a) Das Unternehmen bietet mir genug Möglichkeiten, mich weiter zu entwickeln.<br />
b) Mit dem Aus- und Weiterbildungsangebot bin ich zufrieden.<br />
c) Die Aus- und Weiterbildung hat einen zu geringen Stellenwert in unserem Unternehmen.<br />
d) Das unternehmensinterne Angebot zur Aus- und Weiterbildung ist ausreichend.<br />
e) Die angebotenen Aus- und Weiterbildungen decken sich meiner Meinung nach nicht mit dem<br />
Bedarf der Mitarbeiter.<br />
Fragebatterie 2: (Antwortmöglichkeiten auf einer Skala von 1= völlig unzutreffend bis 5= völlig zutreffend)<br />
a) Mit dem Aus- und Weiterbildungsangebot bin ich zufrieden.<br />
b) Mein Vorgesetzter bietet mir genug Möglichkeiten, mich weiter zu entwickeln.<br />
c) Die Aus- und Weiterbildung hat einen hohen Stellenwert in unserem Unternehmen.<br />
d) An meinem Arbeitsplatz kann ich mein Potenzial ausreichend entwickeln.<br />
e) Die angebotenen Aus- und Weiterbildungen decken sich meiner Meinung nach mit dem Bedarf der<br />
Mitarbeiter.<br />
Lösung: Fragebatterie 1, da in Fragebatterie 2 zwei Items nicht die Zufriedenheit mit dem Weiterbildungsangebot messen (Item 2:<br />
Zufriedenheit mit dem Vorgesetzten, Item 4: Zufriedenheit mit dem Arbeitsplatz) und keine der Fragen umgepolt wurde.<br />
12