wird oder wenn es sich um sogenannte matched pairs Designs handelt. In diesem Fall sinddie Messwerte (mehr oder weniger) voneinander abhängig bzw. korrelieren mehr oderweniger positiv miteinander. Das führt dazu, dass die Variabilität der paarweisen Messwertdifferenzenbzw. der Standardfehler der Differenzen geringer wird. Deshalb werden für denTest von Mittelwertsunterschieden aus gepaarten (oder abhängigen) Stichproben zunächstdie n paarweisen Messwertdifferenzen d berechnet, deren Standardabweichung zurSchätzung <strong>des</strong> Standardmessfehlers der Differenzen benutzt wird. Formel 8 zur Berechnung<strong>des</strong> t-Werts verändert sich <strong>des</strong>halb zu:d - mdt = (12)sˆwobei die zugehörige t-Verteilung (n – 1) Freiheitsgrade (df) hat. Auf Grund der imAllgemeinen positiven Korrelation zwischen den Messwerten wird ein t-Test für gepaarte(abhängige) Stichproben im Allgemeinen eher signifikant als ein t-Test für unabhängigeStichproben.dnBeispiel 7:Werte <strong>einer</strong> Introversionsskala für 10 Zwillinge (matched pairs, hypothetische Daten)Paar erstgeboren ( x ) zweitgeboren ( x ) d = x - x121 21 65 61 42 48 42 63 63 66 -34 52 52 05 61 47 146 53 58 -57 63 65 -28 70 62 89 65 64 110 66 69 -3xsˆ1) H 0 : m d= 0H 1 : ¹ 0m d60.67.1372) zweiseitiges Signifikanzniveau α = .05sˆd5.9633) sˆ = = = 1. 886dn 10t =(0d - m ) 2 - 0= = 1.06sˆ1.886df = n -1 = 9d58.68.8472.05.96312
4) Akzeptanzregion H 0 (1 – α) :[-t( 1-a / 2), df = 9;t(1-a/ 2), df = 9] = [–2.26; 2.26]bzw.p = 2 × (1 - p(t )) = 2×(1 - .842) = .316( 1.06,9)1.3.4 SchlussbemerkungDie hier behandelten t-Test Verfahren können bei großen Stichproben auch als z-<strong>Tests</strong> (alsostatt anhand <strong>einer</strong> entsprechenden t-Verteilung anhand der Standardnormalverteilung)durchgeführt werden. Bei allen diesen <strong>Tests</strong> ist der Standardfehler <strong>des</strong> Mittelwerts bzw. derMittelwertsdifferenz zentral. Da der t-Test jedoch Verzerrungen der Schätzung <strong>des</strong> Standardfehlers(die bei Stichprobengrößen kl<strong>einer</strong> 30 substanziell sind) korrigiert, ist der t-<strong>Tests</strong>tandardmäßig angewandt für die oben dargestellten Fragestellungen immer das richtigeVerfahren.Eine wesentliche Voraussetzung dieser und aller weiteren Schätzverfahren bzw. <strong>Signifikanztests</strong>der Inferenzstatistik ist, dass die Stichprobenwerte zufällig aus der Populationgezogen wurden, es sich also um (wie auch immer geartete) Zufallsstichproben handelt. DerSinn von <strong>Signifikanztests</strong> ist immer der Schluss von Stichprobenkennwerten auf diePopulation. Das bedeutet auch, dass es vollkommen unsinnig ist, <strong>Signifikanztests</strong> z.B. zurPrüfung von Mittelwertsunterschieden anzuwenden, wenn es sich um eine Totalerhebunghandelt, die „Stichprobe“ also mit der Population identisch ist.1.4 Was ist ein Beta-Fehler bzw. was ist Power?Beim Testen der Hypothesen sind nun zwei Fehler möglich:– Man kann auf Grund der Daten fälschlicherweise die Nullhypothese ablehnen. Da dieseIrrtumswahrscheinlichkeit gleich a ist, wird der Fehler als a-Fehler (oder Fehler 1. Art)bezeichnet. Der Fehler 1. Art ist also der Fehler, die Nullhypothese abzulehnen obwohlsie tatsächlich richtig ist und seine Wahrscheinlichkeit ist das Signifikanz-Niveau. Eshandelt sich hier um eine bedingte Wahrscheinlichkeit, nämlich die Wahrscheinlichkeit,ein bestimmtes beobachtetes Ergebnis zu erhalten (z.B. einen Mittelwert in <strong>einer</strong>Stichprobe), wenn die Annahme der Nullhypothese gilt.– Man kann auf Grund der Daten fälschlicherweise die Nullhypothese annehmen. DieserFehler wird b-Fehler (oder Fehler 2. Art) genannt. Der Fehler 2. Art ist also der Fehler,die Nullhypothese anzunehmen, obwohl sie tatsächlich falsch ist. Aber: Seine Wahrscheinlichkeitist nicht einfach das Gegenstück zum Signifikanz-Niveau a; zwar sind aund b voneinander abhängig, aber üblicherweise ist b ¹ (1 – a) !Letzteres kann anhand von Abbildung 3 4 verdeutlicht werden, in der die bei <strong>einer</strong> spezifischenH 1 und H 0 ermittelten a-Fehler- und b-Fehler-Wahrscheinlichkeiten dargestellt sind.In diesem Beispiel eines zweiseitigen Einstichproben z-<strong>Tests</strong> wird als Nullhypotheseangenommen, der Populationsmittelwert sei m 0 . Die Fläche, die rechts von vom kritischenWert 68.61 aus der Stichprobenkennwerteverteilung um m 0 herausgeschnitten wird, stelltdie a/2-Fehler-Wahrscheinlichkeit dar (2.5 %): Bei Gültigkeit von H 0 können nur 2.5 %aller Stichprobenmittelwerte rechts vom Kriterium erwartet werden. Die Alternativ-4Erstellt mit der R-Funktion –plot.power()–, siehe: http://www2.jura.unihamburg.de/instkrim/kriminologie/Mitarbeiter/Enzmann/Software/Enzmann_Software.html13