Blocktermin 2
Blocktermin 2
Blocktermin 2
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Methodisch fit für die<br />
Abschlussarbeit<br />
<strong>Blocktermin</strong> 2 – 09.12.2011<br />
Fabian Hölzenbein<br />
hoelzenbein@psychologie.uni-freiburg.de
Übersicht – <strong>Blocktermin</strong> 2<br />
• Teil 1: Offene Fragen, Auswahl geeigneter<br />
Testverfahren<br />
• Teil 2: Explorative Datenanalyse<br />
• Teil 3: Varianzanalyse<br />
09.12.2011 Methodisch Fit 2
Übersicht – <strong>Blocktermin</strong> 3<br />
• Samstag, 10.12. 12<br />
- Teil 1: Offene Fragen, Regression<br />
- Teil 2: Faktorenanalyse, AMOS<br />
- Teil 3: Spezielle Fragen / Methoden<br />
- Teil 4: Zusammenfassung Stolpersteine,<br />
t Lehrevaluation<br />
09.12.2011 Methodisch Fit 3
Übersicht – <strong>Blocktermin</strong> 2<br />
• Teil 1: Offene Fragen, Auswahl geeigneter<br />
Testverfahren<br />
• Teil 2: Explorative Datenanalyse<br />
• Teil 3: Varianzanalyse<br />
09.12.2011 Methodisch Fit 4
Offene Fragen vom letzten Termin?<br />
09.12.2011 Methodisch Fit 5
Auswahl geeigneter Testverfahren<br />
• Fragestellungen<br />
• Kennwerte<br />
• Stichproben und Zeitpunkte<br />
• uVs und aVs<br />
• Skalenniveau<br />
• Zusammenfassung und Beispiele<br />
09.12.2011 Methodisch Fit 6
Auswahl geeigneter Testverfahren<br />
• Verbreitete Fehlannahmen:<br />
- Die Wahl des statistischen Analyseverfahrens<br />
erfolgt nach der Datenerhebung<br />
„Wenn die Daten erhoben sind, kann man mit entsprechenden<br />
statistischen Verfahren alle möglichen Fragestellungen beantworten“<br />
- Die Wahl des statistischen Analyseverfahrens wird<br />
primär durch die Eigenschaften der Daten<br />
bestimmt<br />
„Vor der Datenerhebung kann ich noch nicht wissen, wie meine<br />
Daten verteilt sind, also brauche ich mir vorher keine Gedanken über<br />
die statistischen Analyseverfahren machen“<br />
09.12.2011 Methodisch Fit 7
Entscheidungskriterien<br />
1. Atd Art der Fragestellung/Hypothese<br />
th<br />
2. Untersuchter Kennwert<br />
3. Anzahl der Stichproben/Zeitpunkte<br />
4. Anzahl der unabhängigen Variablen<br />
5. Anzahl der abhängigen Variablen<br />
6. Skalenniveau<br />
7. Spezielle Voraussetzungen<br />
8. Verteilungsform der Daten<br />
09.12.2011 Methodisch Fit 8
Statistik – vereinfachtes Prinzip<br />
• (1) Deskriptive Statistik:<br />
Berechnen von Kennwerten, die die Stichprobe(n)<br />
beschreiben (z.B. Mittelwertsdifferenzen, Varianzen,<br />
Korrelationskoeffizienten…)<br />
• (2) Inferenzstatistik („klassisch“)<br />
Überprüfen, ob die in (1) berechneten Kennwerte sich<br />
signifikant von bestimmten Referenzwerten<br />
unterscheiden (z.B. Korrelation“0“)<br />
Bestimmung des p-Wertes<br />
09.12.2011 Methodisch Fit 9
Fragestellungen/Hypothesenformen<br />
• Unterschiedshypothesen<br />
- Unterscheiden sich IG und KG in Stärke des Rückenschmerzes?<br />
z.B. Tests auf Mittelwertsunterschiede/ Häufigkeitsunterschiede<br />
• Zusammenhangshypothesen<br />
- Hängt die Stärke des Rückenschmerzes mit dem Alter zusammen?<br />
z.B. Korrelationsanalysen/Regressionsanalysen<br />
• Verlaufs-/Veränderungshypothesen<br />
- Verändert sich die Stimmung der Patienten während einer Therapie?<br />
z.B. Varianzanalysen mit Messwiederholung/Zeitreihenanalysen<br />
09.12.2011 Methodisch Fit 10
Kennwerte<br />
• Arithmetisches Mittel:<br />
- Definition:<br />
• Summe aller Messwerte geteilt durch deren Anzahl<br />
(”Durchschnitt”)<br />
- Bemerkungen:<br />
• Erwartungstreuer, konsistenter und effizienter Schätzer<br />
• Setzt Intervalldaten voraus<br />
• Problematisch bei sehr schiefen Verteilungen und Ausreissern<br />
- Beispielfrage:<br />
• Unterscheidet sich die Häufigkeit des Sport Treibens zwischen<br />
den Patienten der KG und der EG?<br />
- Testverfahren:<br />
• t-Test, t Varianzanalyse<br />
09.12.2011 Methodisch Fit 11
Kennwerte<br />
• Median<br />
- Definition:<br />
• Wert, der die geordnete Reihe der Messwerte in obere und<br />
untere 50% aufteilt<br />
- Bemerkungen:<br />
• Nur Ordinalskalenniveau vorausgesetzt<br />
• Bei Ausreißern und schiefen Verteilungen dennoch<br />
interpretierbar<br />
• Bei intervallskalierten Daten: Informationsverlust<br />
- Testverfahren:<br />
• Mann-Whitney, Kruskal-Wallis, Wilcoxon, Friedmann<br />
09.12.2011 Methodisch Fit 12
Kennwerte<br />
• Häufigkeiten<br />
- Definition:<br />
• Klassifikation in Kategorien(system)<br />
- Bemerkungen:<br />
• Setzt nur Nominalskalenniveau voraus („qualitative (q Variablen“)<br />
• Ordinal- und Intervalldaten können nachträglich in Kategorien<br />
klassifiziert werden (Aber: eventuell massiver<br />
Informationsverlust)<br />
- Beispiele:<br />
• Geschlecht, Altersklassen, Interventionsbedingung<br />
- Testverfahren:<br />
• Chi²-Test, Binomialtest, McNemar-Test, Cochrans Q<br />
09.12.2011 Methodisch Fit 13
Stichproben und Zeitpunkte<br />
• 1 Stichprobe, 1 Zeitpunkt<br />
- Zusammenhangsanalysen (z.B. Korrelationsanalyse)<br />
• 1 Stichprobe, mehrere Zeitpunkte („abhängige<br />
Stichproben“)<br />
- Verlaufs-/Veränderungsanalysen (z.B. Varianzanalyse mit<br />
Messwiederholung)<br />
• Mehrere Stichproben, 1 Zeitpunkt („unabhängige<br />
Stichproben“)<br />
- Unterschiedshypothesen (z.B. t-Test, Varianzanalyse)<br />
• Mehrere Stichproben, mehrere Zeitpunkte<br />
- Differenzielle Veränderungshypothesen (z.B.<br />
Kovarianzanalyse)<br />
09.12.2011 Methodisch Fit 14
Anzahl der unabhängigen Variablen<br />
• 1UV<br />
- Unterschiedshypothesen: T-Test, einfaktorielle<br />
Varianzanalyse<br />
- Zusammenhangshypothesen: Korrelationsanalysen<br />
- Veränderungshypothesen: Einfaktorielle Varianzanalyse mit<br />
Messwiederholung<br />
• Mehrere UV<br />
- Unterschiedshypothesen: Mehrfaktorielle Varianzanalyse<br />
- Zusammenhangshypothesen: Multiple<br />
Regressionsanalyse/Faktorenanalyse<br />
- Veränderungshypothesen: Mehrfaktorielle Varianzanalyse mit<br />
Messwiederholung<br />
09.12.2011 Methodisch Fit 15
Anzahl der abhängigen Variablen<br />
• Unterschiedshypothesen<br />
- Mehrere univariate Analysen oder<br />
- Multivariate Varianzanalyse<br />
• Zusammenhangshypothesen<br />
- Pfadanalysen/Strukturgleichungsmodelle<br />
09.12.2011 Methodisch Fit 16
Skalenniveau<br />
• Bivariate Verfahren<br />
- Intervallskala: parametrische Verfahren (z.B. t-Test,<br />
Varianzanalysen)<br />
- Ordinalskala: nichtparametrische Verfahren (z.B. Mann-<br />
Whitney)<br />
- Nominalskala: Chi²-Techniken<br />
• Multivariate Verfahren<br />
- Z.T. Spezielle Verfahren für nominal- oder ordinalskalierte<br />
abhänge Variablen (z.B. logistische Regression für binäre<br />
AV)<br />
- Durch Dummykodierung u.ä. oder spezielle<br />
Schätzverfahren/Korrekturformeln sind nominal- oder<br />
ordinalskalierte (un-) abhängige Variablen in bestimmten<br />
multivariaten Verfahren einsetzbar<br />
09.12.2011 Methodisch Fit 17
Dummycodierung<br />
Idee: Skalenniveau „erhöhen“<br />
• Hypothetisches Beispiel:<br />
- Parteipräferenz hängt mit Intelligenz zusammen<br />
- Regression von Intelligenz auf Parteipräferenz<br />
(=Nominalskala) l nicht so einfach möglich<br />
- Lösung: Dummykodierung von Parteipräferenz:<br />
• CDU-Wähler: ja/nein (1/0)<br />
• SPD-Wähler: ja/nein (1/0)<br />
• Grüne-Wähler: ja/nein (1/0)<br />
• …<br />
- Dichotome Variablen sind „pseudo-intervallskaliert“<br />
09.12.2011 Methodisch Fit 18
Dummycodierung<br />
• Dummycodierung wird manchmal auch bei<br />
Intervallskalenniveau verwendet:<br />
• Alter in Jahren Über 50 Jahre ja/nein (1/0)<br />
09.12.2011 Methodisch Fit 19
Zusammenfassung<br />
• Das zur Forschungsfrage und zum Forschungsdesign<br />
am besten passende statistische Verfahren ist schon<br />
vor der Datenerhebung bekannt<br />
Überprüfen der speziellen Voraussetzungen für das<br />
Verfahren und eventuell Anpassen der<br />
Forschungsfrage bzw. der Datenerhebung<br />
Bsp.:<br />
- Anzahl der Prädiktoren für eine multiple Regressionsanalyse<br />
- Anzahl der Merkmale (Variablen) für eine Clusteranalyse<br />
- Anzahl benötigter Probanden (Poweranalyse)<br />
09.12.2011 Methodisch Fit 20
Stolperstein<br />
5. Die Hypothesen sind unklar formuliert<br />
Erschwert die Auswahl geeigneter Tests und die<br />
anschließende Auswertung<br />
Nicht:<br />
Depressionstherapie X wirkt besser als<br />
Depressionstherapie Y<br />
Besser:<br />
Patienten mit einer leichten Depressiven Episode (F32.0),<br />
die mit Therapie X behandelt wurden, weisen nach der<br />
Behandlung im Durchschnitt geringere Werte im BDI auf,<br />
als Patienten te mit einer e leichten Depressiven ess e Episode, die<br />
mit Therapie Y behandelt wurden.<br />
09.12.2011 Methodisch Fit 21
Beispiel: Entscheidungskriterien festlegen<br />
„Patienten mit einer leichten Depressiven Episode (F32.0), die mit<br />
Therapie X behandelt wurden, weisen nach der Behandlung im<br />
Durchschnitt geringere Werte im BDI auf, als Patienten mit einer leichten<br />
Depressiven Episode (F32.0), die mit Therapie Y behandelt wurden.“<br />
Veränderungshypothese<br />
Untersuchter Kennwert ist Mittelwert<br />
t<br />
2 Stichproben, 2 Zeitpunkte<br />
1UV(B (Behandlungsgruppe)<br />
1 AV (BDI)<br />
Metrisches Skalenniveau<br />
Kovarianzanalyse (oder Varianzanalyse mit<br />
Messwiederholung)<br />
09.12.2011 Methodisch Fit 22
Übung: Entscheidungskriterien festlegen<br />
• Bestimmen Sie ein statistisches Verfahren,<br />
das für die Untersuchung einer Fragestellung<br />
Ihres Exposés angemessen ist.<br />
• Kriterien durchgehen:<br />
- Hypothese (Unterschied, Zusammenhang,<br />
Veränderung)?<br />
- Stichproben, Zeitpunkte?<br />
- Wie viele UVs?<br />
- Wie viele AVs?<br />
- Skalenniveau?<br />
Testverfahren<br />
09.12.2011 Methodisch Fit 23
Voraussetzungsprüfung<br />
• Endgültige Entscheidung für ein Verfahren<br />
erst nach Voraussetzungsprüfung:<br />
- Verteilungsannahmen gegeben?<br />
- Skalenniveau wirklich gegeben (z.B. Likert-Skala<br />
ausgenutzt?)<br />
- Vergleichbare Gruppengrößen?<br />
• Bsp. Varianzanalsye: Nmax / Nmin 20<br />
• Faktorenanalyse: N > 5* Anzahl der Variablen<br />
• Strukturgleichungsmodelle: N > 100 bzw. N > 5 *<br />
Anzahl der Elemente<br />
09.12.2011 Methodisch Fit 24
Voraussetzungsprüfung<br />
• Explorative Datenanalyse:<br />
- Korrekte Eingabe?<br />
- Ausreißer?<br />
- Fehlende Werte?<br />
09.12.2011 Methodisch Fit 25
Kurze Pause<br />
09.12.2011 Methodisch Fit 26
Übersicht – <strong>Blocktermin</strong> 2<br />
• Teil 1: Offene Fragen, Auswahl geeigneter<br />
Testverfahren<br />
• Teil 2: Explorative Datenanalyse<br />
• Teil 3: Varianzanalyse<br />
09.12.2011 Methodisch Fit 1
Explorative Datenanalyse<br />
• Aktueller Stand:<br />
- Tolle Messinstrumente<br />
- Für die Fragestellung angemessene<br />
Stichprobengröße<br />
- Tolles Versuchsdesign<br />
- Datenerhebung abgeschlossen<br />
• Was nun?<br />
- Dateneingabe<br />
- Plausibilitäts-Check<br />
- Ausreißer<br />
09.12.2011 Methodisch Fit 2
Dateneingabe<br />
• Daten von Hand eingeben<br />
- z.B. Paper-and-Pencil Test, Beobachtungsdaten<br />
• Daten via Internet<br />
t<br />
- Online-Fragebogen<br />
• Daten liegen als .txt, .dat o.ä. vor und können<br />
in SPSS importiert werden<br />
- z.B. Reaktionszeitdaten<br />
09.12.2011 Methodisch Fit 3
Dateneingabe: Tipps<br />
• SPSS: Arbeitet mit der Syntax!<br />
- Genaue Dokumentation<br />
- Reproduzierbarkeit und Nachvollziehbarkeit (auch<br />
für Betreuer)<br />
- Spart Zeit<br />
• Viel Zeit für Explorative Datenanalyse<br />
einplanen<br />
- Vermeidet Fehler<br />
- Macht mit den Daten vertraut<br />
09.12.2011 Methodisch Fit 4
(sehr kurzer) SPSS-Exkurs<br />
• Fenster in SPSS<br />
- Daten<br />
- Ausgabe<br />
- Syntax<br />
• Umgang mit Syntax<br />
- „Einfügen“ statt „OK“<br />
- Kommentare über * alles hinter dem Stern wird<br />
bei der Ausführung ignoriert<br />
- STRG+R R führt den Befehl, an dem der Cursor<br />
steht, aus (oder über Button „play“ in der Leiste)<br />
09.12.2011 Methodisch Fit 5
Explorative Analysen<br />
• Vor der Datenanalyse Daten kontrollieren auf:<br />
- Korrektheit<br />
- Plausibilität<br />
- Fehleingaben<br />
Idealerweise: Mehrfacheingabe eines Teils<br />
der Daten (mindestens 10%)<br />
09.12.2011 Methodisch Fit 6
Plausibilitätsprüfung<br />
• „Spielen Spielen“ mit den Daten:<br />
- Wie groß sind Veränderungen prä-post? (z.B.<br />
negative Werte)<br />
- Sind eingegebene Werte realistisch? (z.B. 120<br />
Zigaretten am Tag)<br />
- Bleibt das Geschlecht konstant?<br />
- Sind die Daten überhaupt möglich?<br />
• Alter 555 Jahre<br />
• 7 auf einer 5-stufigen Skala<br />
09.12.2011 Methodisch Fit 7
Plausibilitätsprüfung<br />
• Explorative Datenanalyse: Min/Max prüfen:<br />
09.12.2011 Methodisch Fit 8
Grafische Darstellung<br />
09.12.2011 Methodisch Fit 9
Ausreißer<br />
• In kleinen Stichproben (N
Ausreißer<br />
• Grafische Darstellung:<br />
09.12.2011 Methodisch Fit 11
Ausreißer<br />
09.12.2011 Methodisch Fit 12
Ausreißer<br />
• Grafische Darstellung:<br />
09.12.2011 Methodisch Fit 13
Ausreißer<br />
• Ein Fall ist kritisch zu sehen, sobald er (alleine) die<br />
vollständige deskriptive und inferenzstatistische<br />
Auswertung verändern kann<br />
• Abwägen zwischen möglichst großer und möglichst<br />
konstanter Stichprobe<br />
• Ausreißer bei mehreren Variablen:<br />
- Indexvariable erstellen<br />
- Immer der gleiche Ausreißer?<br />
- Untergruppe?<br />
- Ausschließen oder Gruppenfaktor aufnehmen<br />
- Was unterscheidet die Ausreißergruppe vom „Rest Rest“?<br />
• In jedem Fall:<br />
- Transparenter Umgang g mit dem Problem<br />
- Klare Darstellung<br />
09.12.2011 Methodisch Fit 14
Stolperstein<br />
6. „Wildes Wildes“ Ausschließen kann zu nicht<br />
reproduzierbaren Ergebnissen führen<br />
Transparente und genaue Darstellung der<br />
Ausreißeranalysen<br />
Wie immer: Rücksprache mit dem Betreuer!<br />
09.12.2011 Methodisch Fit 15
Übung: Explorative Datenanalyse<br />
• Lesen Sie die Daten auswert.dat ein<br />
(Reaktionszeitexperiment mit zwei<br />
Antwortmöglichkeiten).<br />
- Die Variablenliste finden Sie in der Datei<br />
Variablenliste.txt.<br />
• Führen Sie eine explorative Datenanalyse durch<br />
(Plausibilitäts-Check, Vollständigkeit der Daten).<br />
• Suchen Sie nach Ausreißern in den<br />
Reaktionszeiten und Fehlern (dazu müssen Sie<br />
die Daten über die Versuchspersonen<br />
aggregieren).<br />
g 09.12.2011 Methodisch Fit 16
Übersicht – <strong>Blocktermin</strong> 2<br />
• Teil 1: Offene Fragen, Auswahl geeigneter<br />
Testverfahren<br />
• Teil 2: Explorative Datenanalyse<br />
• Teil 3: Varianzanalyse<br />
09.12.2011 Methodisch Fit 1
Varianzanalyse<br />
• Allgemeines zu Varianzanalysen<br />
• Mehrfaktorielle Varianzanalysen<br />
- Übung<br />
• Varianzanalyse mit Messwiederholung<br />
- Übung<br />
09.12.2011 Methodisch Fit 2
Das allgemeine Lineare Modell (ALM)<br />
• Das ALM ist ein verallgemeinertes statistisches<br />
Modell, welches die wichtigsten Verfahren der<br />
Elementarstatistik (zum Beispiel t-Tests),<br />
varianzanalytische Verfahren, sowie die Korrelationsund<br />
Regressionsrechnung integriert<br />
• Der beobachtete individuelle Wert einer<br />
Versuchsperson i in der abhängigen gg Variablen y i ist<br />
zusammengesetzt aus einer gewichteten Summe von<br />
Werten anderer Variablen x j und einem individuellen<br />
Fehler e i .<br />
09.12.2011 Methodisch Fit 3
Varianz- und Regressionsanalysen<br />
• Regressionsanalyse<br />
- Wird verwendet, wenn eine abhängige Variable<br />
über verschiedene (metrische) unabhängige<br />
Variablen vorhergesagt werden soll<br />
• Varianzanalyse<br />
- Wird verwendet, wenn geschaut werden soll, ob<br />
eine UV einen bedeutsamen Einfluss auf die<br />
Ausprägung in einer AV hat<br />
09.12.2011 Methodisch Fit 4
Varianzanalyse<br />
• Die Varianzanalyse ist die Erweiterung des t-<br />
Tests für unabhängige Gruppen auf mehr als<br />
zwei Gruppen<br />
- Mittels Varianzanalyse wird eine α-Fehler-Inflation<br />
vermieden:<br />
• P(Fehler) = 1-(1-α) m mit m = ( ) und p = Anzahl der<br />
Gruppen<br />
• Je mehr Gruppenvergleiche, desto höher die<br />
Wahrscheinlichkeit für mindestens einen α-Fehler<br />
• Alternative zur Varianzanalyse: Bonferroni-Korrektur<br />
( )<br />
09.12.2011 Methodisch Fit 5
Varianzanalyse<br />
• Mit der Varianzanalyse wird die Varianz der<br />
Messwerte innerhalb der einzelnen Gruppen<br />
mit der Varianz der Gruppenmittelwerte<br />
verglichen<br />
- Je größer die Varianz der Gruppenmittelwerte im<br />
Vergleich zur Varianz innerhalb der Gruppen, desto<br />
größer die Effekte der UV<br />
09.12.2011 Methodisch Fit 6
Varianzanalyse<br />
• Voraussetzungen:<br />
- Mindestens Intervallskalenniveau und<br />
Normalverteilung innerhalb der Stichproben bei der<br />
abhängigen Variablen.<br />
- Mindestens 20 Elemente pro Stichprobe (Gruppe,<br />
Zelle).<br />
- Ähnlich stark besetzte Gruppen (Zellen).<br />
- Varianzhomogenität der abhängigen Variablen<br />
zwischen den einzelnen Stichproben (empfohlen:<br />
Levene-Test)<br />
09.12.2011 Methodisch Fit 7
Varianzanalyse<br />
• Varianzanalyse in SPSS<br />
- unianova: ein- und mehrfaktorielle Varianzanalyse<br />
- glm: multivariate (mehrere abhängige Variablen)<br />
und Messwiederholung<br />
09.12.2011 Methodisch Fit 8
UNIANOVA in SPSS<br />
• Gegeben sei ein Datensatz mit den folgenden<br />
Variablen:<br />
- lfdnr: Nummer der Vp (insgesamt 48)<br />
- gruppe: Faktor A in 4 Stufen<br />
- lehrer: Faktor B in 2 Stufen<br />
- stufe: Faktor C in 3 Stufen<br />
- testwert: t t AV<br />
- intellig: Kovariate<br />
09.12.2011 Methodisch Fit 9
UNIANOVA in SPSS<br />
09.12.2011 Methodisch Fit 10
UNIANOVA in SPSS<br />
09.12.2011 Methodisch Fit 11
UNIANOVA in SPSS<br />
Tests der Zwischensubjekteffekte<br />
Abhängige Variable:testwert<br />
Quelle<br />
Quadratsumme<br />
vom Typ III df<br />
Mittel der<br />
Quadrate F Sig.<br />
Korrigiertes Modell 788,229 a 3 262,743 16,957 ,000<br />
Konstanter Term 125563,021 1 125563,021 8103,811 ,000<br />
gruppe 788,229 3 262,743 16,957 ,000<br />
Fehler 681,750 44 15,494<br />
Gesamt 127033,000 48<br />
Korrigierte Gesamtvariation 1469,979 47<br />
a. R-Quadrat = ,536 (korrigiertes R-Quadrat = ,505)<br />
Je höher durch den jeweiligen Faktor erklärten Varianzanteil, desto<br />
stärker der Einfluss des Faktors auf die abhängige Variable.<br />
09.12.2011 Methodisch Fit 12
Zufallsfaktoren vs. Feste Faktoren<br />
• Zufallsfaktoren<br />
- Weist ein Faktor theoretisch unendlich viele Abstufungen auf<br />
und ist die Realisation einzelner Abstufungen nicht von<br />
Interesse, dann können einige Abstufungen des Faktors<br />
zufällig ausgewählt werden, die in eine Varianzanalyse mit<br />
zufälligen Effekten eingehen<br />
- Die Ergebnisse der inferenzstatistischen Prüfung sind auf<br />
sämtliche mögliche Stufen dieses Faktors generalisierbar<br />
- Beispiel: Ausprägungen auf Persönlichkeitsdimensionen,<br />
Medikamentendosis<br />
- Vorteil: Trotz vorher nicht bekannten Werten können Gruppen<br />
gebildet werden<br />
- Nachteil: Intervallskalierte Information wird auf Nominalskala<br />
heruntergebrochen<br />
09.12.2011 Methodisch Fit 13
Zufallsfaktoren vs. Feste Faktoren<br />
• Feste Faktoren<br />
- Weist ein Faktor theoretisch distinkte Abstufungen auf und ist<br />
die Realisation einzelner Abstufungen von Interesse, spricht<br />
man von festen Effekten.<br />
- Beispiel: Therapieform, Geschlecht, Abschluss<br />
- Vorteil: Klare Strukturierung der Untersuchung, klares<br />
Treatment<br />
- Nachteil: Nur auf die bestimmten Bedingungen<br />
generalisierbar<br />
• Feste Faktoren sind üblicher als Zufallsfaktoren und<br />
sollten verwendet werden, sofern die UV vor der<br />
Datenerhebung e ebu eindeutig operationalisiert o a e t wurde<br />
09.12.2011 Methodisch Fit 14
Mehrfaktorielle Varianzanalysen<br />
• Durch die Hinzunahme eines zweiten (dritten,<br />
vierten, ...) Faktors kann möglicherweise der<br />
Anteil der erklärten Varianz erhöht und die<br />
Fehlervarianz reduziert werden<br />
- Durch Reduktion der Fehlervarianz höherer<br />
Prüfwert des jeweiligen F-Tests<br />
- Prüfung möglicher Interaktionseffekte zwischen<br />
den Faktoren<br />
09.12.2011 Methodisch Fit 15
Mehrfaktorielle Varianzanalysen<br />
• Beispiel:<br />
• Zwei jeweils einfaktorielle i Varianzanalysen: Keine<br />
signifikanten Effekte<br />
• Zweifaktorielle Varianzanalyse: signifikante Interaktion der<br />
beiden Faktoren<br />
09.12.2011 Methodisch Fit 16
Zweifaktorielle Varianzanalysen mit SPSS<br />
• Beispiel:<br />
09.12.2011 Methodisch Fit 17
Zweifaktorielle Varianzanalysen mit SPSS<br />
• Beispiel:<br />
Abhängige gg Variable:testwert<br />
Tests der Zwischensubjekteffekte<br />
Quelle<br />
Quadratsumme<br />
vom Typ III df<br />
Mittel der<br />
Quadrate F Sig.<br />
Korrigiertes Modell 982,729 a 11 89,339 6,601 ,000<br />
Konstanter Term 125563,021 1 125563,021 9277,104 ,000<br />
gruppe 788,229 3 262,743 19,413 ,000<br />
stufe 26,292 2 13,146 ,971 ,388<br />
gruppe * stufe 168,208 6 28,035 2,071 ,081<br />
Fehler 487,250 36 13,535<br />
Gesamt 127033,000 48<br />
Korrigierte Gesamtvariation 1469,979 47<br />
a. R-Quadrat = ,669 (korrigiertes R-Quadrat = ,567)<br />
09.12.2011 Methodisch Fit 18
Zweifaktorielle Varianzanalysen mit SPSS<br />
09.12.2011 Methodisch Fit 19
Zweifaktorielle Varianzanalysen mit SPSS<br />
Abhängige Variable:testwert<br />
Tests der Zwischensubjekteffekte<br />
Quelle<br />
Quadratsumme<br />
vom Typ III df<br />
Mittel der<br />
Quadrate F Sig.<br />
Partielles Eta-<br />
Quadrat<br />
Korrigiertes Modell 982,729 a 11 89,339 6,601 ,000 ,669<br />
Konstanter Term 125563,021 1 125563,021 9277,104 ,000 ,996<br />
gruppe 788,229 3 262,743 19,413 ,000 ,618<br />
stufe 26,292292 2 13,146146 ,971 ,388 ,051<br />
gruppe * stufe 168,208 6 28,035 2,071 ,081 ,257<br />
Fehler 487,250 36 13,535<br />
Gesamt 127033,000000 48<br />
Korrigierte Gesamtvariation 1469,979 47<br />
a. R-Quadrat = ,669 (korrigiertes R-Quadrat = ,567)<br />
Richtwerte: 0.01 = kleiner, 0.06 = mittlerer, 0.14 = großer Effekt<br />
(Umrechnung von η 2 in f mit G*Power möglich)<br />
09.12.2011 Methodisch Fit 20
Dreifaktorielle Varianzanalysen<br />
• Die Anzahl der Faktoren kann beliebig erhöht<br />
werden<br />
• Allerdings ergeben sich hierdurch h mehr (und<br />
höherstufige) Interaktionseffekte.<br />
• Drei Faktoren haben schon vier<br />
Interaktionseffekte.<br />
• Bei zu vielen Faktoren sind die<br />
Interaktionseffekte nur schwer interpretierbar.<br />
09.12.2011 Methodisch Fit 21
Kontraste und Post-hoc-Tests<br />
• Anhand eines signifikanten F-Werts kann<br />
geschlussfolgert werden, dass es einen<br />
signifikanten Mittelwertsunterschied,<br />
beziehungsweise einen signifikanten Einfluss<br />
des Treatments gibt<br />
• Worin genau die Mittelwertsunterschiede<br />
liegen kann mit Hilfe von Kontrasten t oder<br />
post-hoc-Tests festgestellt werden<br />
09.12.2011 Methodisch Fit 22
Kontraste und Post-hoc-Tests<br />
• Kontraste<br />
- a priori formuliert<br />
- Strukturiertes, hypothesengeleitetes Vorgehen<br />
- Teststark, da keine α-Adjustierung wegen der<br />
Unabhängigkeit der Kontraste notwendig<br />
- Begrenzte Anzahl von Mittelwertsvergleichen<br />
09.12.2011 Methodisch Fit 23
Kontraste und Post-hoc-Tests<br />
• Kontraste<br />
- Ein Kontrast ist die gewichtete Summe von p<br />
Stichprobenmittelwerten, in denen mindestens ein<br />
Gewicht ungleich 0 ist<br />
- Die Summe aller Gewichte ist Null<br />
- Bei p Gruppen lassen sich generell nur p-1<br />
voneinander unabhängige gg Kontraste finden. Diese<br />
Einschränkung ist begründet durch die<br />
Voraussetzung der linearen Unabhängigkeit<br />
(Orthogonalität) der Kontraste<br />
t<br />
- Die Überprüfung der Unabhängigkeit muss bei<br />
SPSS „von Hand“ erfolgen<br />
09.12.2011 Methodisch Fit 24
Kontraste berechnen mit SPSS<br />
09.12.2011 Methodisch Fit 25
Kontraste berechnen mit SPSS<br />
09.12.2011 Methodisch Fit 26
Kontraste berechnen mit SPSS<br />
09.12.2011 Methodisch Fit 27
Kontraste berechnen mit SPSS<br />
Kontrastergebnisse (K-Matrix)<br />
Abhängige<br />
Variable<br />
Unterrichtsformen Spezieller Kontrast<br />
testwert<br />
L1 Kontrastschätzer 3,750<br />
Hypothesenwert 0<br />
Differenz (Schätzung - Hypothesen) 3,750<br />
Standardfehler 2,124<br />
Sig. ,086<br />
95% Konfidenzintervall für Untergrenze -,558<br />
die Differenz<br />
Obergrenze 8,058<br />
09.12.2011 Methodisch Fit 28
Kontraste und Post-hoc-Tests<br />
• post-hoc-Tests<br />
- post-hoc formuliert<br />
- Exploratives Vorgehen zum Generieren neuer<br />
Hypothesen<br />
- Uneingeschränkte Anzahl von<br />
Mittelwertsvergleichen<br />
- Weniger teststark, da α-Adjustierung wegen der<br />
abhängigen post-hoc-Tests notwendig<br />
09.12.2011 Methodisch Fit 29
Post-hoc-Tests berechnen mit SPSS<br />
09.12.2011 Methodisch Fit 30
Diagramme mit SPSS<br />
09.12.2011 Methodisch Fit 31
Diagramme mit SPSS<br />
09.12.2011 Methodisch Fit 32
Übung<br />
• Öffnet die Datei var.sav<br />
- Rechnet eine UNIANOVA mit Kontrasten<br />
• Verwendet dazu die Syntax<br />
• AVs: einmal eval (Rating), einmal rt (Reaktionszeit)<br />
• Uvs:<br />
- cond_group (Versuchsbedingungen: 0 = KG, 1 =<br />
EG1, 2 = EG2)<br />
- age<br />
- Sex (1 = weiblich, 2 = männlich)<br />
+ Diagramme, (korrekte) kt Darstellung der Ergebnisse<br />
ca. 30 Min<br />
09.12.2011 Methodisch Fit 33
Varianzanalyse mit Messwiederholung<br />
• Die Varianzanalyse ohne Messwiederholung<br />
ist eine Erweiterung des t-Tests für<br />
unabhängige Stichproben<br />
• Bei der Varianzanalyse mit Messwiederholung<br />
handelt es sich hingegen um die Erweiterung<br />
des t-Test für abhängige Stichproben<br />
- Hierbei wird eine Person, eine Objekt zu mehreren<br />
Messzeitpunkten untersucht<br />
09.12.2011 Methodisch Fit 34
Varianzanalyse mit Messwiederholung<br />
• Vorteil:<br />
- Teststärkeres Verfahren (ähnlich wie beim t-Test für<br />
abhängige Stichproben), da Mittelwertsunterschiede auf das<br />
Treatment bezogen werden können.<br />
- Einsparung an Versuchspersonen<br />
• Nachteil:<br />
- Sphärizitätsannahme: Korrelationen zwischen den<br />
Messzeitpunkten müssen ähnlich sein (sonst Korrektur nach<br />
Greenhouse- Geisser)<br />
- Sequenzeffekte (Reihenfolge der Testung kann Einfluss<br />
haben)<br />
- Fehlen Daten an einem Messzeitpunkt, wird Person komplett<br />
ausgeschlossen<br />
09.12.2011 Methodisch Fit 35
Varianzanalyse mit Messwiederholung in SPSS<br />
09.12.2011 Methodisch Fit 36
Varianzanalyse mit Messwiederholung in SPSS<br />
09.12.2011 Methodisch Fit 37
Varianzanalyse mit Messwiederholung in SPSS<br />
Multivariate Tests b<br />
Hypothese<br />
Effekt Wert F<br />
df Fehler df Sig.<br />
Faktor1 Pillai-Spur ,943 812,511 a 2,000 98,000 ,000<br />
a. Exakte Statistik<br />
b. Design: Konstanter Term<br />
Innersubjektdesign: Faktor1<br />
Wilks-Lambda ,057 812,511 a 2,000 98,000 ,000<br />
Hotelling-Spur 16,582 812,511 a 2,000 98,000 ,000<br />
Größte<br />
charakteristische<br />
Wurzel nach Roy<br />
16,582 812,511 a 2,000 98,000 ,000<br />
09.12.2011 Methodisch Fit 38
Varianzanalyse mit Messwiederholung in SPSS<br />
Maß:MASS_1<br />
Innersubjekteffekt<br />
Mauchly-W<br />
Mauchly-Test auf Sphärizität b<br />
Approximiertes<br />
Chi-Quadrat df Sig.<br />
Epsilon a<br />
Greenhouse-<br />
Geisser Huynh-Feldt Untergrenze<br />
Faktor1 ,437 81,075 2 ,000 ,640 ,645 ,500<br />
Prüft die Nullhypothese, daß sich die Fehlerkovarianz-Matrix der orthonormalisierten transformierten abhängigen Variablen<br />
proportional zur Einheitsmatrix verhält.<br />
a. Kann zum Korrigieren der Freiheitsgrade für die gemittelten Signifikanztests verwendet werden. In der Tabelle mit den Tests<br />
der Effekte innerhalb der Subjekte werden korrigierte Tests angezeigt.<br />
b. Design: Konstanter Term<br />
Innersubjektdesign: Faktor1<br />
09.12.2011 Methodisch Fit 39
Varianzanalyse mit Messwiederholung in SPSS<br />
Tests der Innersubjekteffekte<br />
Maß:MASS_1<br />
Quadratsumm<br />
Mittel der<br />
Quelle<br />
e vom Typ III df Quadrate F Sig.<br />
Faktor1 Sphärizität angenommen 18705,201 2 9352,601 450,136 ,000<br />
Greenhouse-Geisser 18705,201 1,280 14615,979 450,136 ,000<br />
Huynh-Feldt 18705,201 1,289 14509,518 450,136 ,000<br />
Untergrenze 18705,201 1,000 18705,201 450,136 ,000<br />
Fehler(Faktor1) Sphärizität angenommen 4113,896 198 20,777<br />
Greenhouse-Geisser 4113,896 126,698 32,470<br />
Huynh-Feldt 4113,896 127,628 32,234<br />
Untergrenze 4113,896 99,000 41,555<br />
09.12.2011 Methodisch Fit 40
Varianzanalyse mit Messwiederholung in SPSS<br />
Maß:MASS_1<br />
Tests der Innersubjektkontraste<br />
Quelle<br />
Faktor1<br />
Quadratsumme<br />
vom Typ III df<br />
Mittel der<br />
Quadrate F Sig.<br />
Faktor1 Linear 18146,617617 1 18146,617617 607,998 ,000<br />
Quadratisch 558,584 1 558,584 47,710 ,000<br />
Fehler(Faktor1) Linear 2954,803 99 29,846<br />
Quadratisch 1159,093 99 11,708<br />
Maß:MASS_1<br />
Transformierte Variable:Mittel<br />
Tests der Zwischensubjekteffekte<br />
Quadratsumme<br />
Mittel der<br />
Quelle<br />
vom Typ III df Quadrate F Sig.<br />
Konstanter Term 2911250,596 1 2911250,596 13201,184 ,000<br />
Fehler 21832,421 99 220,530<br />
09.12.2011 Methodisch Fit 41
MANOVA<br />
• Wird verwendet, falls:<br />
- die aV hoch miteinander korrelieren (Bsp:<br />
nonverbale und verbale Gedächtnisleistung).<br />
- Falls die Voraussetzungen (Varianzhomogenität)<br />
der „normalen“ Varianzanalyse nicht gegeben sind<br />
• Wichtig: Andere Kennwerte beim F-Test (z. B.<br />
Hotellings T)<br />
09.12.2011 Methodisch Fit 42
MANOVA<br />
09.12.2011 Methodisch Fit 43
MANOVA<br />
09.12.2011 Methodisch Fit 44
MANOVA<br />
09.12.2011 Methodisch Fit 45
MANOVA<br />
09.12.2011 Methodisch Fit 46
MANOVA<br />
09.12.2011 Methodisch Fit 47
MANOVA mit Messwiederholung<br />
• Die multivariate Varianzanalyse ist auch auf<br />
ein Messwiederholungsdesign „ausbaubar“<br />
• Vorteile:<br />
- Kein Problem mit der Alpha-Fehler-Inflationierung.<br />
- Weniger Probleme mit<br />
Voraussetzungsverletzungen<br />
09.12.2011 Methodisch Fit 48
Übung: Varianzanalyse mit Messwiederholung<br />
• Öffnet die Datei var_messwdh.sav<br />
sav<br />
- Rechnet eine Varianzanalyse mit<br />
Messwiederholung (für die Fehler und<br />
Reaktionszeiten getrennt)<br />
- Prüft, ob sich die Effekte in Abhängigkeit der<br />
Gruppenzuweisung unterscheiden<br />
- Erstellt Diagramm(e), um mögliche<br />
Interaktionseffekte zu veranschaulichen<br />
- Interpretiert die Ausgabe und schreibt die<br />
Ergebnisse im Rahmen eines fiktiven Ergebnisteils<br />
nieder<br />
ca. 30 Min<br />
09.12.2011 Methodisch Fit 49
Vielen Dank für die Aufmerksamkeit und bis<br />
morgen! !(10Uh)<br />
Uhr)<br />
09.12.2011 Methodisch Fit 50