Kapitel 30 Nichtparametrische Tests
Kapitel 30 Nichtparametrische Tests
Kapitel 30 Nichtparametrische Tests
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
<strong>Kapitel</strong> <strong>30</strong><br />
<strong>Nichtparametrische</strong> <strong>Tests</strong><br />
<strong>30</strong>.1 Überblick<br />
<strong>Nichtparametrische</strong> <strong>Tests</strong> dienen dazu, aufgrund der Daten einer Stichprobe Rückschlüsse<br />
auf die Eigenschaften der Werte in der Grundgesamtheit zu ziehen. Dies<br />
haben sie mit allen anderen Testverfahren auf stichprobentheoretischer Grundlage<br />
wie beispielsweise dem T-Test oder den Varianzanalysen (ANOVA) gemeinsam.<br />
Auch in dem konkret zu untersuchenden Sachverhalt unterscheiden sich die nichtparametrischen<br />
<strong>Tests</strong> häufig nicht von anderen Testverfahren. So kann zum Beispiel<br />
anstatt des T-<strong>Tests</strong> grundsätzlich auch stets der nichtparametrische Mann-<br />
Whitney-Test durchgeführt werden. (Umgekehrt gilt jedoch nicht, daß der Mann-<br />
Whitney-Test jederzeit durch den T-Test ersetzt werden kann.) Der wesentliche<br />
Unterschied zwischen nichtparametrischen <strong>Tests</strong> und den übrigen Testverfahren<br />
besteht darin, daß die nichtparametrischen <strong>Tests</strong> wesentlich geringere Anforderungen<br />
an die Verteilung der Werte in der Grundgesamtheit stellen. Während zum<br />
Beispiel der T-Test verlangt, daß die zu vergleichenden Stichproben jeweils einer<br />
annähernd normalverteilten Grundgesamtheit entstammen und gleiche Varianzen<br />
aufweisen, müssen diese Voraussetzungen für den Mann-Whitney-Test nicht erfüllt<br />
sein.<br />
Zudem stellen nichtparametrische <strong>Tests</strong> häufig weniger starke Anforderungen an<br />
das Skalenniveau der zu untersuchenden Variablen. Dies hängt damit zusammen,<br />
daß ein Großteil der nichtparametrischen <strong>Tests</strong> auf der Betrachtung von Rangzahlen<br />
basiert und daher oftmals ein Ordinalskalenniveau genügt, wenn bei alternativen<br />
<strong>Tests</strong> intervallskalierte Daten erforderlich sind.<br />
Aus dem bisher Gesagten ergibt sich unmittelbar das primäre Anwendungsgebiet<br />
nichtparametrischer <strong>Tests</strong>: Sie kommen insbesondere dann zur Anwendung, wenn<br />
die stärkeren Voraussetzungen alternativer <strong>Tests</strong> von den zugrundeliegenden Daten<br />
nicht erfüllt werden. Der Preis für das Ausweichen auf <strong>Tests</strong> mit schwächeren<br />
Anforderungen an die Daten besteht allerdings darin, daß sich mit nichtparametrischen<br />
<strong>Tests</strong> auch nur weniger scharfe und klare Hypothesen testen lassen. Die aus<br />
diesen <strong>Tests</strong> abgeleiteten Aussagen sind häufig weniger fundiert, da bei den <strong>Tests</strong><br />
nur ein geringerer Teil der verfügbaren Informationen ausgenutzt wird. Wird bei-<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing
740 <strong>Kapitel</strong> <strong>30</strong> <strong>Nichtparametrische</strong> <strong>Tests</strong><br />
spielsweise eine intervallskalierte Variable mit einem nichtparametrischen Test<br />
untersucht, der auf der Betrachtung von Rangwerten basiert, werden die verfügbaren<br />
Informationen über die Größe von Wertdifferenzen nicht verwendet. Daher<br />
kann der Test auch keine so starken Ergebnisse liefern, wie es parametrische <strong>Tests</strong><br />
vermögen. Dies ist der Grund dafür, daß im allgemeinen den parametrischen Verfahren<br />
der Vorzug gegeben wird, sofern von den zu untersuchenden Daten die entsprechenden<br />
Voraussetzungen erfüllt werden. Umgekehrt sind nichtparametrische<br />
<strong>Tests</strong> vor allem dann sinnvoll, wenn die Variablen ein zu niedriges Skalenniveau<br />
für parametrische <strong>Tests</strong> aufweisen oder die Verteilungsannahmen der parametrischen<br />
Verfahren nicht hinreichend erfüllt sind.<br />
Insgesamt stehen bei SPSS 16 nichtparametrische Testverfahren zur Verfügung,<br />
die in acht Unterbefehlen des Menüs<br />
STATISTIK<br />
NICHTPARAMETRISCHE TESTS<br />
zusammengefaßt sind. Es folgt eine Übersicht über die zur Verfügung stehenden<br />
Testverfahren unter Angabe der jeweils zugrundeliegenden Fragestellung, des erforderlichen<br />
Skalenniveaus, des Unterbefehls, mit dem der Test angefordert werden<br />
kann, und der Seitenzahl, bei der die jeweilige Prozedur ausführlicher beschrieben<br />
wird.<br />
¾ Chi-Quadrat: Stimmen die beobachteten Häufigkeiten einer Variablen mit<br />
vorgegebenen erwarteten Häufigkeiten überein? Nominalskalenniveau. CHI-<br />
QUADRAT (S. 741).<br />
¾ Binomial: Stimmen die beobachteten Häufigkeiten einer dichotomen Variablen<br />
mit vorgegebenen erwarteten Häufigkeiten überein? Dichotome Variable.<br />
BINOMIAL (S. 748).<br />
¾ Sequenz: Sind die Werte einer dichotomen Variablen in einer Folge von<br />
Werten zufällig angeordnet? Dichotome Variable. SEQUENZEN (S. 751).<br />
¾ Kolmogorov-Smirnov bei einer Stichprobe: Folgen die Werte in der Grundgesamtheit<br />
einer bestimmten Verteilung? Getestet werden kann auf Normalverteilung,<br />
Gleichverteilung, Poissonverteilung und Exponentialverteilung.<br />
Intervallskalenniveau. K-S BEI EINER STICHPROBE (S. 754).<br />
¾ Mann-Whitney: Entstammen zwei unabhängige Stichproben derselben<br />
Grundgesamtheit? Der Test erfolgt auf der Basis von Rangunterschieden. Ordinalskalenniveau.<br />
ZWEI UNABHÄNGIGE STICHPROBEN (S. 757).<br />
¾ Kolmogorov-Smirnov-Z: Entstammen zwei unabhängige Stichproben derselben<br />
Grundgesamtheit? Der Test basiert auf einem Vergleich der Verteilungen.<br />
Intervallskalenniveau. ZWEI UNABHÄNGIGE STICHPROBEN (S. 757).<br />
¾ Moses: Ist die Spannweite der Werte in den Grundgesamtheiten zweier unabhängiger<br />
Stichproben gleich groß? Ordinalskalenniveau. ZWEI UNABHÄNGIGE<br />
STICHPROBEN (S. 757).<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing
<strong>30</strong>.2 Chi-Quadrat-Test 741<br />
¾ Wald-Wolfowitz: Entstammen zwei unabhängige Stichproben derselben<br />
Grundgesamtheit? Der Test basiert auf einer Sequenzanalyse für die Gruppenzugehörigkeiten<br />
in einer Rangfolge. Ordinalskalenniveau. ZWEI UNAB-<br />
HÄNGIGE STICHPROBEN (S. 757).<br />
¾ Kruskal-Wallis: Entstammen mehrere unabhängige Stichproben derselben<br />
Grundgesamtheit? Hierbei werden die mittleren Rangwerte verglichen. Ordinalskalenniveau.<br />
K UNABHÄNGIGE STICHPROBEN (S. 764).<br />
¾ Median: Weisen mehrere unabhängige Stichproben in der Grundgesamtheit<br />
den gleichen Median auf? Ordinalskalenniveau. K UNABHÄNGIGE STICHPRO-<br />
BEN (S. 764).<br />
¾ Wilcoxon: Entstammen zwei verbundene Stichproben Grundgesamtheiten mit<br />
gleicher Verteilung? Ordinalskalenniveau. ZWEI VERBUNDENE STICHPROBEN<br />
(S. 770).<br />
¾ Vorzeichen: Entstammen zwei verbundene Stichproben Grundgesamtheiten<br />
mit gleicher Verteilung? Ordinalskalenniveau. ZWEI VERBUNDENE STICHPRO-<br />
BEN (S. 770).<br />
¾ McNemar: Erfolgen Änderungen zwischen zwei verbundenen Variablen in<br />
beiden Richtungen gleichermaßen? Dichotome Variablen. ZWEI VERBUNDENE<br />
STICHPROBEN (S. 770).<br />
¾ Friedman: Entstammen mehrere verbundene Stichproben derselben Grundgesamtheit?<br />
Ordinalskalenniveau. K VERBUNDENE STICHPROBEN (S. 774).<br />
¾ Kendall: Entstammen mehrere verbundene Stichproben derselben Grundgesamtheit?<br />
Ordinalskalenniveau. K VERBUNDENE STICHPROBEN (S. 774).<br />
¾ Cochran: Haben mehrere verbundene dichotome Variablen die gleiche Verteilung.<br />
Dichotome Variablen. K VERBUNDENE STICHPROBEN (S. 774).<br />
<strong>30</strong>.2 Chi-Quadrat-Test<br />
Mit diesem χ 2 -Test können Sie überprüfen, ob die Häufigkeiten der Werte einer<br />
Variablen in der Grundgesamtheit vorgegebenen erwarteten Häufigkeiten entsprechen.<br />
Dabei können auch Variablen untersucht werden, die lediglich Nominalskalenniveau<br />
aufweisen. Per Voreinstellung wird getestet, ob die unterschiedlichen<br />
Werte der Variablen in der Grundgesamtheit mit der gleichen Häufigkeit<br />
vertreten sind. Diese Voreinstellung können Sie jedoch ändern und die erwartete<br />
Häufigkeit für jeden Wert manuell vorgeben. Der Test untersucht dann, ob aus den<br />
empirischen Häufigkeiten, die in der vorliegenden Stichprobe beobachtet wurden,<br />
geschlossen werden kann, daß die angegebenen erwarteten Häufigkeiten in der<br />
Grundgesamtheit tatsächlich gelten. 343<br />
343 Zur Berechnung des χ 2 -Wertes und zur <strong>Tests</strong>tatistik vgl. Abschnitt 16.2, Chi-Quadrat-<br />
Test, S. 402.<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing
742 <strong>Kapitel</strong> <strong>30</strong> <strong>Nichtparametrische</strong> <strong>Tests</strong><br />
<strong>30</strong>.2.1 Interpretation eines Chi-Quadrat-<strong>Tests</strong><br />
Die Datendatei allbus.sav von der Begleit-CD enthält Daten einer 1996 in<br />
Deutschland durchgeführten Bevölkerungsbefragung. 344 Im folgenden sollen ausschließlich<br />
die Personen aus den neuen Bundesländern betrachtet werden. Für jeden<br />
Befragten ist unter anderem in der Variablen v35 sein Geburtsmonat angegeben.<br />
Mit dem Chi-Quadrat-Test wird nun untersucht, ob die Anzahl der Geburten<br />
in den einzelnen Monaten in der Grundgesamtheit gleich ist. Hierzu sind die folgenden<br />
Einstellungen erforderlich:<br />
¾ Fälle auswählen: Zunächst ist der Test auf die Befragten aus den neuen Bundesländern<br />
zu beschränken. Hierzu wird der Befehl<br />
DATEN<br />
FÄLLE AUSWÄHLEN...<br />
verwendet. In dem damit geöffneten Dialogfeld wird die Option Falls Bedingung<br />
zutrifft ausgewählt und anschließend auf die zu dieser Option gehörenden<br />
Schaltfläche Falls geklickt. In dem damit geöffneten Dialogfeld wird in das<br />
große Eingabefeld die Bedingung v3 = 2 geschrieben. Anschließend wird dieses<br />
Dialogfeld mit der Schaltfläche Weiter und das Hauptdialogfeld mit der<br />
Schaltfläche OK geschlossen. Achten Sie vor dem Schließen des Hauptdialogfeldes<br />
darauf, daß in der Gruppe Nicht ausgewählte Fälle die Option Filtern<br />
eingestellt ist.<br />
¾ Fälle nicht gewichten: Anders als in vielen anderen <strong>Kapitel</strong>n werden im folgenden<br />
Beispiel nicht gewichtete Fälle betrachtet. Sollten die Fälle in der Datendatei<br />
gewichtet sein, muß die Gewichtung zuvor ausgeschaltet werden. Dies<br />
geschieht mit dem Befehl<br />
DATEN<br />
FÄLLE GEWICHTEN...<br />
Wählen Sie in dem damit geöffneten Dialogfeld die Option Fälle nicht gewichten,<br />
und schließen Sie das Dialogfeld mit OK.<br />
¾ Chi-Quadrat-Test aufrufen: Um den Chi-Quadrat-Test aufzurufen, wählen<br />
Sie den Befehl<br />
STATISTIK<br />
NICHTPARAMETRISCHE TESTS<br />
CHI-QUADRAT...<br />
¾ Einstellungen: Verschieben Sie die Variable v35 in das Feld Testvariable. Bei<br />
allen übrigen Optionen werden die Voreinstellungen beibehalten. Abbildung<br />
<strong>30</strong>.2, S. 745 zeigt die hier verwendeten Dialogfeldeinstellungen.<br />
Durch die voreingestellten Optionen wurde unter anderem festgelegt, daß untersucht<br />
werden soll, ob angenommen werden kann, daß die 12 Monate als Geburtsmonate<br />
in der Grundgesamtheit mit der gleichen Häufigkeit vorkommen. Abwei-<br />
344 Siehe hierzu im einzelnen <strong>Kapitel</strong> 1, Überblick.<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing
<strong>30</strong>.2 Chi-Quadrat-Test 743<br />
chend von dieser Voreinstellung hätte auch untersucht werden können, ob beispielsweise<br />
die Hypothese vertreten werden kann, daß die Sommermonate in der<br />
Grundgesamtheit mit einer 10% höheren Häufigkeit vertreten sind als die Wintermonate.<br />
Der mit den hier verwendeten Einstellungen erzeugte Output ist in Abbildung<br />
<strong>30</strong>.1 wiedergegeben.<br />
Häufigkeiten<br />
1<br />
2<br />
3<br />
4<br />
5<br />
6<br />
7<br />
8<br />
9<br />
10<br />
11<br />
12<br />
Gesamt<br />
Kategorie<br />
V35<br />
Beobachtetes<br />
N<br />
Erwartete<br />
Anzahl<br />
Residuum<br />
Januar 27 28,9 -1,9<br />
Februar 22 28,9 -6,9<br />
März <strong>30</strong> 28,9 1,1<br />
April 32 28,9 3,1<br />
Mai 32 28,9 3,1<br />
Juni 29 28,9 ,1<br />
Juli 31 28,9 2,1<br />
August 35 28,9 6,1<br />
September 38 28,9 9,1<br />
Oktober 21 28,9 -7,9<br />
November 20 28,9 -8,9<br />
Dezember <strong>30</strong> 28,9 1,1<br />
347<br />
Statistik für Test<br />
Chi-Quadrat a<br />
df<br />
Asymptotische Signifikanz<br />
V35<br />
11,720<br />
11<br />
,385<br />
a. Bei 0 Zellen (,0%) werden weniger als 5 Häufigkeiten<br />
erwartet. Die kleinste erwartete Zellenhäufigkeit ist<br />
28,9.<br />
Abbildung <strong>30</strong>.1: Ergebnisse des Chi-Quadrat-<strong>Tests</strong> für die<br />
Variable „v35“ (Geburtsmonat der Befragten)<br />
Die betrachtete Stichprobe umfaßt 347 Personen aus den neuen Bundesländern,<br />
deren Geburtsmonat bekannt ist. Dieser Wert wird in der Tabelle Häufigkeiten und<br />
dort in der Zeile Gesamt angegeben. Wäre nun in der Stichprobe jeder Geburtsmonat<br />
mit der gleichen Häufigkeit vertreten, müßten in jedem Monat ein Zwölftel<br />
der 347 Personen geboren sein. Dies wären 28,9 Personen in jedem Monat. Auch<br />
dieser Wert wird in der Tabelle Häufigkeiten in der Spalte Erwartete Anzahl für<br />
jeden Monat mitgeteilt. Daß diese Häufigkeit von 28,9 Personen in jedem Monat<br />
als erwartete Häufigkeit bezeichnet wird, hat folgenden Hintergrund: Werden in<br />
jedem Monat tatsächlich gleich viele Personen geboren, wäre in einer Zufallsstichprobe<br />
von 347 Personen zu erwarten, daß (rein rechnerisch) 28,9 von den insgesamt<br />
347 Personen im Januar geboren wurden. Die gilt ebenso für den Monat<br />
Februar, den März etc.<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing
744 <strong>Kapitel</strong> <strong>30</strong> <strong>Nichtparametrische</strong> <strong>Tests</strong><br />
Die tatsächlich beobachteten Häufigkeiten der einzelnen Monate, die in der Spalte<br />
Beobachtetes N ausgewiesen werden, weichen mehr oder weniger stark von den<br />
erwarteten Häufigkeiten ab. So wurden nicht 29 (als gerundeter Wert von 28,9)<br />
Personen im Januar geboren, sondern lediglich 27. Die Monate April und Mai sind<br />
dagegen mit jeweils 32 Personen etwas stärker vertreten, als es den erwarteten<br />
Häufigkeiten entsprochen hätte.<br />
Diese Abweichungen der beobachteten von den erwarteten Häufigkeiten lassen<br />
jedoch noch nicht den Schluß zu, die Hypothese, in der Grundgesamtheit seien<br />
alle Monate mit der gleichen Häufigkeit als Geburtsmonate vertreten, sei falsch.<br />
Vielmehr ist es durchaus möglich, daß die Hypothese vollkommen richtig ist und<br />
die Abweichungen zwischen den beobachteten und den erwarteten Häufigkeiten<br />
lediglich auf zufällige Einflüsse bei der Stichprobenziehung zurückzuführen sind.<br />
Die Tatsache, daß entsprechende Abweichungen auch bei Gültigkeit der Nullhypothese<br />
auftreten, ergibt sich schon daraus, daß die erwarteten Häufigkeiten ein<br />
Wert mit Dezimalstellen sind, tatsächlich aber immer nur ganzzahlige Häufigkeiten<br />
beobachtet werden können.<br />
Der Chi-Quadrat-Test untersucht nun, ob die Abweichungen zwischen den beobachteten<br />
und den erwarteten Häufigkeiten so groß sind, daß angenommen werden<br />
kann, sie seien nicht durch zufällige Einflüsse entstanden, sondern auf entsprechend<br />
unterschiedliche Häufigkeiten der Geburtsmonate in der Grundgesamtheit<br />
zurückzuführen. Das Ergebnis des Chi-Quadrat-<strong>Tests</strong> wird in der unteren Tabelle<br />
Statistik für Test mitgeteilt. Der zentrale Wert bei diesen Ergebnissen ist die Signifikanz,<br />
die in diesem Fall 0,385 beträgt. Dieser Wert ist die Irrtumswahrscheinlichkeit,<br />
die mit einem Zurückweisen der Nullhypothese verbunden ist. Er ist in<br />
diesem Fall also folgendermaßen zu interpretieren: Weist man die Nullhypothese<br />
zurück, derzufolge in der Grundgesamtheit jeder Monat mit der gleichen Häufigkeit<br />
als Geburtsmonat vertreten ist, begeht man mit einer Wahrscheinlichkeit von<br />
38,5% einen Irrtum. Diese Irrtumswahrscheinlichkeit ist derart hoch, daß man die<br />
Nullhypothese nicht zurückweisen wird. 345<br />
Die Tatsache, daß die Nullhypothese aufgrund der hohen Irrtumswahrscheinlichkeit<br />
nicht zurückgewiesen werden kann, läßt nicht umgekehrt den Schluß zu, die<br />
Nullhypothese sei richtig. Vielmehr ist das Ergebnis lediglich so zu interpretieren,<br />
daß sich aus den vorhanden Daten keine handfesten Anhaltspunkte dafür ergeben,<br />
daß die Nullhypothese falsch ist. Man kann also zunächst einmal weiter an der<br />
Nullhypothese festhalten, hat sie damit aber nicht verifiziert.<br />
345 Üblicherweise wird die Nullhypothese bei einer Irrtumswahrscheinlichkeit von 5% oder<br />
weniger zurückgewiesen. Je nach zugrundeliegender Fragestellung kann man auch beliebige andere<br />
Grenzen als die 5%-Grenze verwenden, eine Irrtumswahrscheinlichkeit von 38% ist jedoch<br />
derart hoch, daß man die Nullhypothese unter keinen ersichtlichen Umständen zurückweisen<br />
kann.<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing
<strong>30</strong>.2 Chi-Quadrat-Test 745<br />
<strong>30</strong>.2.2 Einstellungen des Chi-Quadrat-<strong>Tests</strong> bei SPSS<br />
Um einen Chi-Quadrat-Test durchzuführen, öffnen Sie das Dialogfeld aus Abbildung<br />
<strong>30</strong>.2 mit dem Befehl<br />
STATISTIK<br />
NICHTPARAMETRISCHE TESTS<br />
CHI-QUADRAT...<br />
Abbildung <strong>30</strong>.2: Dialogfeld des Befehls STATISTIK,<br />
NICHTPARAMETRISCHE TESTS, CHI-QUADRAT<br />
Variablen<br />
Die Variablenliste führt lediglich alle numerischen Variablen der Datendatei auf.<br />
Textvariablen können Sie mit dem χ 2 -Test daher nicht untersuchen, obwohl es für<br />
eine sinnvolle Interpretation des <strong>Tests</strong> genügt, wenn die Variablen nominalskaliert<br />
sind. Daher müssen Sie Textvariablen ggf. zunächst in eine numerische Variable<br />
umcodieren. 346<br />
Verschieben Sie die Variablen, für deren Werte Sie die Häufigkeiten mit exogen<br />
vorgegebenen erwarteten Häufigkeiten vergleichen möchten, in das Feld Testvariablen.<br />
Wenn Sie mehrere Variablen auswählen, wird für jede der Variablen ein<br />
eigener Test durchgeführt. Wenn Sie nicht davon ausgehen, daß die Werte in der<br />
Testvariablen alle mit der gleichen Häufigkeit vorkommen und daher die erwarteten<br />
Häufigkeiten in der Gruppe Erwartete Werte manuell festlegen (s.u.), müssen<br />
diese für alle Testvariablen identisch sein. Ist dies nicht der Fall, müssen Sie die<br />
Variablen nacheinander durch wiederholtes Aufrufen der Prozedur untersuchen.<br />
346 Hierzu können Sie zum Beispiel den Befehl TRANSFORMIEREN, UMKODIEREN, IN<br />
ANDERE VARIABLEN verwenden.<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing
746 <strong>Kapitel</strong> <strong>30</strong> <strong>Nichtparametrische</strong> <strong>Tests</strong><br />
Erwarteter Bereich<br />
Per Voreinstellung werden die Häufigkeiten aller in der Testvariablen vorkommenden<br />
gültigen Werte miteinander verglichen. Abweichend von dieser Voreinstellung<br />
können Sie jedoch auch einen Wertebereich vorgeben, um nur die Werte<br />
innerhalb dieses Bereichs in den Test einzubeziehen. Dies bewirkt zugleich, daß<br />
die Werte in der Testvariablen zu ganzzahligen Werten zusammengefaßt werden:<br />
¾ Aus den Daten: Diese Option ist voreingestellt. Damit werden die Häufigkeiten<br />
für alle gültigen Werte der Testvariablen miteinander verglichen. Dabei<br />
werden auch Dezimalstellen berücksichtigt. Zwischen den Werten 7,53 und<br />
7,52 wird also unterschieden.<br />
¾ Angegebenen Bereich verwenden: Sie können einen Bereich der zu berücksichtigenden<br />
Werte vorgeben. Dies bewirkt gegenüber der Voreinstellung zwei<br />
Veränderungen. Zum einen werden nur die Werte innerhalb des Bereichs<br />
- einschließlich der angegebenen Grenzen - berücksichtigt. Werte, die nicht in<br />
den Bereich fallen, werden von dem Test ausgeschlossen. Zum zweiten werden<br />
die Dezimalstellen der Werte aus der Testvariablen nicht mehr berücksichtigt.<br />
Vielmehr werden die Dezimalstellen abgeschnitten, so daß nur der<br />
ganzzahlige Teil eines Wertes Berücksichtigung findet. Die Werte 7,01 und<br />
7,99 werden somit beide als 7 interpretiert. Zudem werden auch solche ganzzahligen<br />
Werte berücksichtigt, die zwar im vorgegebenen Wertebereich, nicht<br />
aber in der Testvariablen enthalten sind. Für diese Werte wird eine beobachtete<br />
Häufigkeit von null zugrunde gelegt.<br />
Auch die Grenzen des zu berücksichtigenden Wertebereichs müssen durch<br />
ganzzahlige Werte in den Feldern Minimum und Maximum angegeben werden.<br />
Wenn Sie beispielsweise ein Minimum von -1 und ein Maximum von 2 angeben,<br />
werden die Häufigkeiten der Werte -1, 0, 1 und 2 betrachtet.<br />
Erwartete Werte<br />
Per Voreinstellung wird angenommen, daß alle Werte der Testvariablen in der<br />
Grundgesamtheit mit der gleichen Häufigkeit vertreten sind. Diese Voreinstellung<br />
können Sie mit den folgenden Optionen ändern:<br />
¾ Alle Kategorien gleich: Diese Option ist voreingestellt. Damit wird angenommen,<br />
daß alle Werte der Testvariablen in der Grundgesamtheit mit der<br />
gleichen Häufigkeit vertreten sind. Die absoluten erwarteten Häufigkeiten der<br />
einzelnen Werte ergeben sich damit aus der Anzahl der berücksichtigten Fälle,<br />
dividiert durch die Anzahl der unterschiedlichen Werte in der Testvariablen.<br />
¾ Werte: Wenn Sie nicht von gleichen erwarteten Häufigkeiten für alle Werte<br />
der Testvariablen ausgehen, können Sie die erwartete Häufigkeit für jeden<br />
Wert einzeln festlegen. Hierzu müssen Sie für jeden Wert der Testvariablen<br />
einen Wert vorgeben, es darf also kein Wert unberücksichtigt bleiben. Sollten<br />
Sie in der Gruppe Erwarteter Bereich einen Wertebereich festgelegt haben,<br />
müssen Sie für jeden ganzzahligen Wert aus dem Bereich eine erwartete Häu-<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing
<strong>30</strong>.2 Chi-Quadrat-Test 747<br />
figkeit angeben, auch wenn einzelne Werte in der Testvariablen gar nicht vorkommen.<br />
Um die erwarteten Häufigkeiten festzulegen, gehen Sie folgendermaßen vor:<br />
y Legen Sie als erstes die erwartete Häufigkeit für den kleinsten in der<br />
Testvariablen vorkommenden Wert fest. 347 Schreiben Sie den Wert in das<br />
Eingabefeld, und klicken Sie auf die Schaltfläche Hinzufügen. Daraufhin<br />
wird der Wert in das Listenfeld übertragen.<br />
y Legen Sie nun auf die gleiche Weise die erwarteten Häufigkeiten der übrigen<br />
Werte fest. Beachten Sie hierbei, daß die Häufigkeiten in aufsteigender<br />
Reihenfolge der Werte aus der Testvariablen zugeordnet werden.<br />
y Um einen bereits in das Listenfeld eingefügten Wert zu ändern, markieren<br />
Sie den betreffenden Eintrag, ändern Sie den Wert in dem Eingabefeld, und<br />
wählen Sie anschließend die Schaltfläche Ändern. Um einen Wert aus der<br />
Liste zu löschen, markieren Sie ihn, und wählen Sie die Schaltfläche Entfernen.<br />
Beachten Sie hierbei jedoch, daß die verbleibenden Werte in der<br />
Liste am Ende in ihrer Reihenfolge den Werten aus der Testvariablen entsprechen<br />
müssen.<br />
Optionen<br />
Mit der Schaltfläche Optionen öffnen Sie das Dialogfeld aus Abbildung <strong>30</strong>.3. Dort<br />
können Sie ergänzenden Output mit deskriptiven Maßzahlen und den Quartilen<br />
der Testvariablen anfordern und den Ausschluß von Fällen mit fehlenden Werten<br />
steuern.<br />
Abbildung <strong>30</strong>.3: Dialogfeld der Schaltfläche „Optionen“<br />
Statistiken: Mit den beiden folgenden Optionen können Sie ergänzenden Output<br />
anfordern:<br />
¾ Deskriptive Statistik: Hiermit werden die Anzahl der Fälle mit gültigen Werten,<br />
der Mittelwert, die Standardabweichung sowie der kleinste und der größte<br />
347 Es genügt, wenn die Häufigkeiten die Relationen richtig widerspiegeln. Sie können also<br />
wahlweise die erwarteten relativen Häufigkeiten oder ein beliebiges Vielfaches der erwarteten<br />
relativen Häufigkeiten angeben.<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing
748 <strong>Kapitel</strong> <strong>30</strong> <strong>Nichtparametrische</strong> <strong>Tests</strong><br />
Wert angegeben. Beachten Sie, daß der Mittelwert und die Standardabweichung<br />
nur bei Variablen mit Intervallskalenniveau sinnvoll interpretiert werden<br />
können.<br />
¾ Quartile: Es werden das 25%-, das 50%- und das 75%-Perzentil sowie die Anzahl<br />
der Fälle mit gültigen Werten mitgeteilt.<br />
Fehlende Werte: Wenn Sie mehr als eine Testvariable ausgewählt haben, können<br />
Sie mit den beiden folgenden Optionen den Ausschluß von Fällen mit fehlenden<br />
Werten steuern. Wenn Sie nur eine Testvariable betrachten, haben beide Optionen<br />
den gleichen Effekt.<br />
¾ Fallausschluß Test für Test: Diese Option ist voreingestellt. Bei der Untersuchung<br />
der einzelnen Testvariablen werden nur jeweils die Fälle ausgeschlossen,<br />
die in der betreffenden Variablen einen fehlenden Wert aufweisen. Fälle<br />
mit fehlenden Werten in anderen Testvariablen werden dagegen in den Test<br />
einbezogen.<br />
¾ Listenweiser Fallausschluß: Alle Fälle, die in mindestens einer der Testvariablen<br />
einen fehlenden Wert aufweisen, werden aus der gesamten Prozedur ausgeschlossen.<br />
<strong>30</strong>.3 Binomial-Test<br />
Mit einem Binomial-Test können Sie für eine dichotome Variable - dies ist eine<br />
Variable mit nur zwei unterschiedlichen Wertausprägungen - untersuchen, ob die<br />
beobachteten Häufigkeiten mit exogen vorgegebenen erwarteten Häufigkeiten<br />
vereinbar sind. Hierbei ist es nicht erforderlich, daß die Testvariable tatsächlich<br />
nur zwei unterschiedliche Werte enthält. Vielmehr können die Werte der Variablen<br />
beim Binomial-Test dichotomisiert, also zu zwei Gruppen zusammengefaßt,<br />
werden.<br />
<strong>30</strong>.3.1 Interpretation eines Binomial-<strong>Tests</strong><br />
In der Datei allbus.sav ist unter anderem das Geschlecht der Befragten (Variable<br />
v141) angegeben. Hierbei handelt es sich naturgemäß um eine dichotome Variable.<br />
Im folgenden soll die Hypothese getestet werden, in der Grundgesamtheit der<br />
Allbus-Daten seien Männer und Frauen zu gleichen Anteilen vertreten. Hierzu<br />
wird mit Hilfe eines Binomial-<strong>Tests</strong> untersucht, ob die in der Stichprobe beobachteten<br />
Häufigkeiten dieser Hypothese widersprechen. Um diesen Test durchzuführen,<br />
sind die folgenden Einstellungen erforderlich:<br />
¾ Daten: Die Daten entstammen der Datendatei allbus.sav. Auch hier werden<br />
wie bei dem im vorhergehenden Abschnitt durchgeführten Chi-Quadrat-Test<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing
<strong>30</strong>.3 Binomial-Test 749<br />
nur die Personen aus den neuen Bundesländern betrachtet, und es werden ungewichtete<br />
Daten verwendet. 348<br />
¾ Binomial-Test aufrufen: Um den Test aufzurufen, wählen Sie den Befehl<br />
STATISTIK<br />
NICHTPARAMETRISCHE TESTS<br />
BINOMIAL...<br />
¾ Einstellungen: Fügen Sie die Variable v141 in das Feld Testvariablen ein. Bei<br />
den übrigen Optionen werden die Voreinstellungen verwendet (siehe<br />
Abbildung <strong>30</strong>.5, S. 750). Damit wird die Hypothese getestet, in der Grundgesamtheit<br />
seien Männer und Frauen mit der gleiche Häufigkeit vertreten.<br />
Mit diesen Einstellungen erhalten Sie den Output aus Abbildung <strong>30</strong>.4. In der<br />
Spalte N werden zunächst die beobachteten Häufigkeiten der beiden Kategorien<br />
mitgeteilt. Die Stichprobe umfaßt 160 Männer und 189 Frauen aus den neuen<br />
Bundesländern. Damit sind die beiden Gruppen in der Stichprobe offensichtlich<br />
nicht zu gleichen Anteilen vertreten. Die relativen Häufigkeiten aus der Stichprobe<br />
werden in der Spalte Beobachteter Anteil ausgewiesen. Da die Stichprobe insgesamt<br />
349 Personen aus den neuen Ländern umfaßt, stellen die 189 Frauen einen<br />
Anteil von 54% dar. Entsprechend beträgt der Anteil der Männer 46%. Bei Gültigkeit<br />
der Nullhypothese wäre dagegen ein Anteil von jeweils 50% zu erwarten<br />
gewesen. Von diesem erwarteten Anteil können sich durch die Stichprobenbetrachtung<br />
zufällige Abweichungen ergeben. Ob sich die Abweichungen der beobachteten<br />
von den erwarteten Häufigkeiten plausibel durch Zufallseinflüsse erklären<br />
lassen und folglich mit der Nullhypothese, in der Grundgesamtheit seien beide<br />
Gruppen zu gleichen Anteilen vertreten, vereinbar sind, wird mit dem Binomial-<br />
Test untersucht. Die Wahrscheinlichkeit dafür, daß sich bei Gültigkeit der Nullhypothese<br />
mindestens so große Abweichungen ergeben wie in der vorliegenden<br />
Stichprobe, beträgt 0,134 bzw. 13,4%. Dieser Wert wird in der Spalte Asymptotische<br />
Signifikanz mitgeteilt. Der Wert läßt sich auch folgendermaßen interpretieren:<br />
Weist man die Nullhypothese, in der Grundgesamtheit seien Männer und<br />
Frauen zu gleichen Anteilen vertreten, zurück, begeht man mit einer Wahrscheinlichkeit<br />
von 13,4% einen Irrtum.<br />
V141<br />
Gruppe 1<br />
Gruppe 2<br />
Gesamt<br />
Test auf Binomialverteilung<br />
Asymptotische<br />
Beobachteter<br />
Signifikanz<br />
Kategorie N<br />
Anteil Testanteil (2-seitig)<br />
MANN 160 ,46 ,50 ,134 a<br />
FRAU 189 ,54<br />
349 1,00<br />
a. Basiert auf der Z-Approximation.<br />
Abbildung <strong>30</strong>.4: Ergebnis des Binomial-<strong>Tests</strong> für die Variable „v434“<br />
348 Um diese Einstellungen herbeizuführen, siehe die Aufzählungspunkte Fälle auswählen<br />
und Fälle nicht gewichten, S. 742.<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing
750 <strong>Kapitel</strong> <strong>30</strong> <strong>Nichtparametrische</strong> <strong>Tests</strong><br />
<strong>30</strong>.3.2 Einstellungen des Binomial-<strong>Tests</strong> bei SPSS<br />
Die Einstellungen zum Durchführen eines Binomial-<strong>Tests</strong> werden in dem Dialogfeld<br />
aus Abbildung <strong>30</strong>.5 vorgenommen. Um dieses Dialogfeld zu öffnen, wählen<br />
Sie den Befehl<br />
STATISTIK<br />
NICHTPARAMETRISCHE TESTS<br />
BINOMIAL...<br />
Abbildung <strong>30</strong>.5: Dialogfeld des Befehls STATISTIK,<br />
NICHTPARAMETRISCHE TESTS, BINOMIAL<br />
Variablen<br />
In der Variablenliste werden lediglich die numerischen Variablen der Datendatei<br />
aufgeführt. Um Textvariablen mit einem Binomial-Test zu untersuchen, müssen<br />
Sie diese daher zuvor in eine numerische Variable umcodieren.<br />
Fügen Sie die zu untersuchenden Variablen in das Feld Testvariablen ein. Wenn<br />
Sie mehr als eine Testvariable angeben, wird für jede Variable ein eigener Test<br />
durchgeführt. Per Voreinstellung wird die Hypothese untersucht, die beiden Werte<br />
der Testvariablen seien in der Grundgesamtheit mit der gleichen Häufigkeit vertreten.<br />
Sie können einen anderen Testanteil zugrunde legen (s.u., Abschnitt Testanteil),<br />
dieser gilt dann jedoch für alle Testvariablen gleichermaßen.<br />
Dichotomie definieren<br />
Sie können auch Testvariablen untersuchen, die mehr als zwei unterschiedliche<br />
Werte enthalten, diese müssen dann jedoch zu zwei Gruppen zusammengefaßt<br />
werden:<br />
¾ Aus den Daten: Behalten Sie diese voreingestellte Option bei, wenn die<br />
Testvariable nur zwei unterschiedliche Werte enthält. Es werden dann die Häufigkeiten<br />
dieser beiden Werte untersucht.<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing
<strong>30</strong>.4 Sequenzanalyse 751<br />
¾ Trennwert: Enthält die Testvariable mehr als zwei unterschiedliche Werte,<br />
wählen Sie diese Option, und geben Sie einen Trennwert an, der die Werte in<br />
zwei Gruppen unterteilt. Alle Werte, die kleiner oder gleich dem Trennwert<br />
sind, bilden die eine Gruppe, Werte über dem Trennwert werden zu der zweiten<br />
Gruppen zusammengefaßt. Der Trennwert kann insgesamt fünf Zeichen<br />
(einschließlich Dezimaltrennzeichen) umfassen. Die Gruppe mit den kleineren<br />
Werte wird als erste Gruppe angesehen. Auf diese beziehen sich die Angaben<br />
über die erwarteten und realisierten Häufigkeiten.<br />
Testanteil<br />
Per Voreinstellung wird für die beiden Werte bzw. für die Wertegruppen jeweils<br />
eine relative Häufigkeit von 0,5 erwartet. Um diese Voreinstellung zu ändern, geben<br />
Sie die erwartete Häufigkeit des ersten Wertes an. Dies ist der Wert, der in der<br />
Datendatei als erstes aufgeführt wird. Bei gruppierten Werten ist es dagegen die<br />
Gruppe mit den niedrigeren Werten. Sie können eine erwartete Häufigkeit zwischen<br />
0,001 und 0,999 angeben. Der Wert darf insgesamt nur vier Zeichen umfassen,<br />
Sie können jedoch die führende null vor dem Dezimaltrennzeichen weglassen.<br />
Optionen<br />
Die Schaltfläche Optionen öffnet das Dialogfeld aus Abbildung <strong>30</strong>.3, S. 747. Dort<br />
können Sie ergänzenden Output anfordern und den Ausschluß von Fällen mit<br />
fehlenden Werten steuern. Zur Bedeutung der Optionen siehe im einzelnen Abschnitt<br />
Optionen, S. 747.<br />
<strong>30</strong>.4 Sequenzanalyse<br />
Mit der Sequenzanalyse können Sie für eine dichotome Variable - eine Variable<br />
mit nur zwei unterschiedlichen Wertausprägungen - bzw. für eine dichotomisierte<br />
Variable testen, ob die Werte in zufälliger Reihenfolge auftreten oder ob sie ein<br />
Muster aufweisen.<br />
<strong>30</strong>.4.1 Interpretation einer Sequenzanalyse<br />
Die Erfahrung legt die Vermutung nahe, daß Sonnen- und Regentagen nicht zufällig<br />
aufeinanderfolgen. Hat es einen Tag lang geregnet, ist es nicht unplausibel,<br />
auch für den kommenden Tag eher Regen als Sonnenschein zu erwarten, sofern<br />
nicht bessere Informationen über das Wetter vorliegen. In einem fiktiven Beispiel<br />
sei das Wetter an 40 Tagen beobachtet und mit den Werten 0 (Sonnenschein) und<br />
1 (Regen) codiert worden, wobei sich die folgende Sequenz von Sonnen- und Regentagen<br />
ergeben habe:<br />
1 0 1 1 0 1 0 1 1 0 0 1 0 0 0 1 0 0 1 0 1 1 1 0 1 0 0 1 1 0 0 0 1 0 0 1 0 1 0 1<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing
752 <strong>Kapitel</strong> <strong>30</strong> <strong>Nichtparametrische</strong> <strong>Tests</strong><br />
Die Datendatei Wetter.sav von der Begleit-CD enthält lediglich eine einzige Variable,<br />
die ebenfalls den Namen wetter hat und die dargestellte Wertefolge enthält.<br />
Im folgenden soll mit einem Sequenztest untersucht werden, ob vor dem Hintergrund<br />
der (fiktiven) Beobachtungen an der Hypothese zufällig aufeinanderfolgender<br />
Sonnen- und Regentage festgehalten werden kann. Zum Durchführen des<br />
<strong>Tests</strong> werden die folgenden Einstellungen vorgenommen:<br />
¾ Befehl: Um eine Sequenzanalyse durchzuführen, wählen Sie den Befehl<br />
STATISTIK<br />
NICHTPARAMETRISCHE TESTS<br />
SEQUENZEN...<br />
¾ Einstellungen: Verschieben Sie in dem Dialogfeld Sequenzentest die Variable<br />
Wetter in das Feld Testvariablen. In der Gruppe Trennwert wird die Option<br />
Anderer gewählt und der Wert 1 in das zugehörige Eingabefeld eingegeben.<br />
Die übrigen Optionen der Gruppe Trennwert werden abgewählt. Abbildung<br />
<strong>30</strong>.7, S. 753 zeigt das Dialogfeld mit diesen Einstellungen.<br />
Als Ergebnis wird die Tabelle aus Abbildung <strong>30</strong>.6 ausgegeben. In der Zeile Testwert<br />
wird noch einmal der Wert mitgeteilt, den wir im Dialogfeld als Testwert<br />
vorgegeben haben. Die untersuchte Gesamtsequenz umfaßt 40 Werte (Gesamtzahl<br />
der Fälle), die sich in 27 Sequenzen unterteilen. Eine Sequenz in diesem Sinne ist<br />
eine Folge gleicher Werte. Die ersten fünf Werte der Gesamtsequenz lauten 1 0 1<br />
1 0 (s.o.). Diese fünf Werte bilden die vier Sequenzen 1 - 0 - 1 1 - 0. Entsprechend<br />
läßt sich die Gesamtsequenz in 27 derartige Sequenzen unterteilen.<br />
Sequenzentest<br />
Testwert a<br />
Gesamte Fälle<br />
Anzahl der Sequenzen<br />
Z<br />
Asymptotische Signifikanz<br />
(2-seitig)<br />
a. Benutzerdefiniert<br />
WETTER<br />
1<br />
40<br />
27<br />
1,783<br />
,075<br />
Abbildung <strong>30</strong>.6: Ergebnis der Sequenzanalyse<br />
Auf der Basis dieser Werte wird die Nullhypothese getestet, die Sonnen- und Regentage<br />
und damit die Werte 0 und 1 würden in der Grundgesamtheit rein zufällig<br />
aufeinanderfolgen. In der Zeile Asymptotische Signifikanz wird das Ergebnis dieses<br />
<strong>Tests</strong> mitgeteilt. Ist die Nullhypothese wahr, ergibt sich eine Folge von Sonnen-<br />
und Regentagen, wie sie in der Stichprobe vorliegt, nur mit einer Wahrscheinlichkeit<br />
von 0,075 bzw. 7,5%. Umgekehrt bedeutet dies: Weist man die<br />
Nullhypothese zurück, begeht man mit einer Wahrscheinlichkeit von 7,5% einen<br />
Fehler. Diese Wahrscheinlichkeit ist zwar sehr gering, aber vermutlich noch nicht<br />
gering genug, um die Nullhypothese tatsächlich abzulehnen.<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing
<strong>30</strong>.4 Sequenzanalyse 753<br />
Ergibt sich bei einem Test eine noch geringere Irrtumswahrscheinlichkeit, so daß<br />
die Nullhypothese zurückgewiesen wird, besagt dies noch nichts über das „wahre“<br />
Muster der untersuchten Daten, das in diesem Fall in dem tatsächlichen Zusammenhang<br />
zwischen Sonnen- und Regentagen bestehen würde. Eine geringe Irrtumswahrscheinlichkeit<br />
ergibt sich sowohl dann, wenn aufeinanderfolgende Beobachtungen<br />
häufig den gleichen Wert aufweisen, als auch in dem Fall, daß sich<br />
die Werte häufig abwechseln und damit benachbarte Beobachtungen unterschiedliche<br />
Werte enthalten.<br />
<strong>30</strong>.4.2 Einstellungen der Sequenzanalyse bei SPSS<br />
Zum Durchführen einer Sequenzanalyse dient das Dialogfeld aus Abbildung <strong>30</strong>.7.<br />
Um das Dialogfeld zu öffnen, wählen Sie den Befehl<br />
STATISTIK<br />
NICHTPARAMETRISCHE TESTS<br />
SEQUENZEN...<br />
Abbildung <strong>30</strong>.7: Dialogfeld des Befehls STATISTIK,<br />
NICHTPARAMETRISCHE TESTS, SEQUENZEN<br />
Variablen<br />
In der Variablenliste werden nur die numerischen Variablen der Datendatei aufgeführt.<br />
Textvariablen können Sie mit einer Sequenzanalyse daher nicht untersuchen,<br />
ohne sie zuvor in eine numerische Variable umzucodieren.<br />
Verschieben Sie die Variablen, für die eine Sequenzanalyse durchgeführt werden<br />
soll, in das Feld Testvariablen. Wenn Sie mehr als eine Testvariable angeben,<br />
wird für jede Variable ein eigener Test durchgeführt, die Ergebnisse werden jedoch<br />
gemeinsam in einer Pivot-Tabelle dargestellt.<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing
754 <strong>Kapitel</strong> <strong>30</strong> <strong>Nichtparametrische</strong> <strong>Tests</strong><br />
Trennwert<br />
Sie können mit der Sequenzanalyse auch Variablen untersuchen, die mehr als zwei<br />
unterschiedliche Werte enthalten. In diesem Fall müssen die Werte jedoch dichotomisiert,<br />
also in zwei Gruppen zusammengefaßt werden. Anstatt der Folge einzelner<br />
Werte wird dann die Folge der Gruppenzugehörigkeiten untersucht.<br />
Um die Werte zu dichotomisieren, müssen Sie einen Trennwert angeben. Alle<br />
Werte der Variablen, die größer oder gleich dem Trennwert sind, werden dann zu<br />
einer Gruppe zusammengefaßt, alle Werte, die kleiner sind als der Trennwert, bilden<br />
die zweite Gruppe. Die Angabe eines Trennwertes ist auch dann erforderlich,<br />
wenn die Variable ohnehin nur zwei unterschiedliche Werte enthält.<br />
Die folgenden vier Optionen stehen zur Verfügung, um den Trennwert zu definieren.<br />
Die Optionen schließen sich nicht gegenseitig aus. Wenn Sie mehr als eine<br />
Option ankreuzen, wird für jeden Trennwert ein eigener Sequenztest durchgeführt.<br />
¾ Median: Das 50%-Perzentil der Variablen bildet den Trennwert.<br />
¾ Modalwert: Der Modus, also der am häufigsten in der Variable vorkommende<br />
Wert, wird als Trennwert verwendet.<br />
¾ Mittelwert: Das arithmetische Mittel der Variablen bildet den Trennwert.<br />
¾ Anderer: Mit dieser Option können Sie den Trennwert frei festlegen, indem<br />
Sie ihn in das zugehörige Eingabefeld schreiben. Der Wert kann bis zu fünf<br />
Zeichen umfassen, zu denen auch ein eventuelles Dezimaltrennzeichen zählt.<br />
Diese Option können Sie auch verwenden, wenn die Variable ohnehin nur<br />
zwei unterschiedliche Werte enthält. Legen Sie dann den größeren der beiden<br />
Werte als Trennwert fest.<br />
Optionen<br />
Die Schaltfläche Optionen öffnet das Dialogfeld aus Abbildung <strong>30</strong>.3, S. 747. Dort<br />
können Sie ergänzenden Output anfordern und den Ausschluß von Fällen mit<br />
fehlenden Werten steuern. Zur Bedeutung der Optionen siehe im einzelnen Abschnitt<br />
Optionen, S. 747.<br />
<strong>30</strong>.5 Ein-Stichproben-Kolmogorov-Smirnov-Test<br />
Mit dem Kolmogorov-Smirnov-Test können Sie überprüfen, ob die Werte einer<br />
Variablen einer theoretischen Verteilung folgen. Dabei können Sie den Test für<br />
eine Normal-, Poisson-, Gleich- oder Exponentialverteilung durchführen.<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing
<strong>30</strong>.5 Ein-Stichproben-Kolmogorov-Smirnov-Test 755<br />
<strong>30</strong>.5.1 Interpretation des Ein-Stichproben-Kolmogorov-<br />
Smirnov-<strong>Tests</strong><br />
In der Datendatei allbus.sav mit den Ergebnissen der Bevölkerungsbefragung ist<br />
unter anderem in der Variablen v338 die Dauer des Interviews in Minuten angegeben.<br />
Im folgenden soll mit dem Kolmogorov-Smirnov-Test untersucht werden, ob<br />
die Annahme, die Dauer des Interviews folge einer Normalverteilung, vor dem<br />
Hintergrund der Beobachtungen aus der Stichprobe aufrechterhalten werden kann.<br />
¾ Daten: Die Daten entstammen der Datei allbus.sav. Im folgenden sollen nur<br />
die Personen aus den neuen Bundesländern betrachtet werden. Damit entfällt<br />
auch Notwendigkeit zur Gewichtung der Daten. 349<br />
¾ Kolmogorov-Smirnov-Test aufrufen: Um den Test aufzurufen, wählen Sie<br />
den Befehl<br />
STATISTIK<br />
NICHTPARAMETRISCHE TESTS<br />
K-S BEI EINER STICHPROBE...<br />
¾ Einstellungen: Fügen Sie in dem Dialogfeld der Prozedur die Variable v338 in<br />
das Feld Testvariablen ein. Bei den übrigen Optionen werden die Voreinstellungen<br />
verwendet. Abbildung <strong>30</strong>.9, S. 756 zeigt die für dieses Beispiel verwendeten<br />
Einstellungen.<br />
Die Ergebnisse des <strong>Tests</strong> werden in Abbildung <strong>30</strong>.8 dargestellt. Der Test wird anhand<br />
der größten (absoluten) Abweichung der empirischen von der theoretischen<br />
Verteilung durchgeführt. Die größte absolute, die größte positive und die größte<br />
negative Abweichung der beiden Verteilungen voneinander werden als Extremste<br />
Differenzen in der Tabelle ausgewiesen. Zudem werden die Parameter der Normalverteilung<br />
angegeben, mit der die empirische Verteilung verglichen wird. Die<br />
Parameter einer Normalverteilung sind der Mittelwert und die Standardabweichung.<br />
Die ausgewiesenen Werte von 59,26 bzw. 19,41 entsprechen den Werten<br />
der Variablen v338 in der betrachteten Stichprobe. Die durchgeführten Interviews<br />
dauerten in den neuen Bundesländern somit im Durchschnitt 59,26 Minuten.<br />
Das eigentliche Ergebnis des <strong>Tests</strong> wird in der untersten Zeile mit der Beschriftung<br />
Asymptotische Signifikanz angegeben. Dies ist die Irrtumswahrscheinlichkeit,<br />
die mit einem Zurückweisen der Nullhypothese verbunden ist. Die getestete Nullhypothese<br />
besagt, daß die Dauer des Interviews in der Grundgesamtheit einer<br />
Normalverteilung folgt. Die Wahrscheinlichkeit für das Zutreffen der Hypothese<br />
wird mit 0,000 angegeben. Die Nullhypothese kann damit zurückgewiesen werden.<br />
Trotz dieser geringen Irrtumswahrscheinlichkeit ist es möglich, daß die Werte in<br />
der Grundgesamtheit annähernd normalverteilt sind. Dies genügt bereits als Voraussetzung<br />
für viele statistische Prozeduren. Um einen Eindruck von der Ähnlich-<br />
349 Um diese Einstellungen herbeizuführen, siehe die Aufzählungspunkte Fälle auswählen<br />
und Fälle nicht gewichten, S. 742.<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing
756 <strong>Kapitel</strong> <strong>30</strong> <strong>Nichtparametrische</strong> <strong>Tests</strong><br />
keit der empirischen Verteilung mit der Normalverteilung zu gewinnen, kann zum<br />
Beispiel ein Histogramm mit Normalverteilungskurve erstellt werden.<br />
Kolmogorov-Smirnov-Anpassungstest<br />
N<br />
Parameter der Normalverteilung a,b<br />
Extremste Differenzen<br />
Kolmogorov-Smirnov-Z<br />
Asymptotische Signifikanz (2-seitig)<br />
Mittelwert<br />
Standardabweichung<br />
Absolut<br />
Positiv<br />
Negativ<br />
V338<br />
348<br />
59,26<br />
19,41<br />
,126<br />
,126<br />
-,074<br />
2,344<br />
,000<br />
a. Die zu testende Verteilung ist eine Normalverteilung.<br />
b. Aus den Daten berechnet.<br />
Abbildung <strong>30</strong>.8: Ergebnis des Kolmogorov-Smirnov-<strong>Tests</strong> für<br />
die Variable „v338“ zum Testen auf eine Normalverteilung<br />
<strong>30</strong>.5.2 Einstellungen des Kolmogorov-Smirnov-<strong>Tests</strong> bei SPSS<br />
Um einen Kolmogorov-Smirnov-Test bei einer Stichprobe durchzuführen, wählen<br />
Sie den folgenden Befehl, der das Dialogfeld aus Abbildung <strong>30</strong>.9 öffnet:<br />
STATISTIK<br />
NICHTPARAMETRISCHE TESTS<br />
K-S BEI EINER STICHPROBE...<br />
Abbildung <strong>30</strong>.9: Dialogfeld des Befehls STATISTIK, NICHTPARA-<br />
METRISCHE TESTS, K-S BEI EINER STICHPROBE<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing
<strong>30</strong>.6 <strong>Tests</strong> für zwei unabhängige Stichproben 757<br />
Variablen<br />
In der Variablenliste werden nur die numerischen Variablen der Datendatei aufgeführt,<br />
denn der Kolmogorov-Smirnov-Test ist nur für Variablen mit Intervallskalenniveau<br />
sinnvoll durchzuführen. Verschieben Sie die zu testenden Variablen in<br />
das Feld Testvariablen. Wenn Sie hier mehr als eine Variablen angeben, wird für<br />
jede Variable ein eigenständiger Test durchgeführt.<br />
Testverteilung<br />
Per Voreinstellung wird ein Test auf Normalverteilung durchgeführt, es stehen jedoch<br />
die folgenden vier Verteilungen zur Verfügung:<br />
¾ Normalverteilung: Testet auf eine Normalverteilung mit dem Mittelwert und<br />
der Standardabweichung der Stichprobe.<br />
¾ Gleichverteilung: Testet auf eine Gleichverteilung über den gesamten Wertebereich<br />
der Testvariablen.<br />
¾ Poissonverteilung: Testet auf eine Poissonverteilung mit dem Mittelwert der<br />
Stichprobe.<br />
¾ Exponentialverteilung: Testet auf eine Exponentialverteilung mit dem Mittelwert<br />
der Stichprobe.<br />
Optionen<br />
Die Schaltfläche Optionen öffnet das Dialogfeld aus Abbildung <strong>30</strong>.3, S. 747. Dort<br />
können Sie ergänzenden Output anfordern und den Ausschluß von Fällen mit<br />
fehlenden Werten steuern. Zur Bedeutung der Optionen siehe im einzelnen Abschnitt<br />
Optionen, S. 747.<br />
<strong>30</strong>.6 <strong>Tests</strong> für zwei unabhängige Stichproben<br />
Insgesamt stehen vier <strong>Tests</strong> zum Vergleichen zweier unabhängiger Stichproben<br />
zur Verfügung. 350 Mit dem Mann-Whitney-Test, dem Kolmogorov-Smirnov-Test<br />
und dem Wald-Wolfowitz-Test überprüfen Sie jeweils die Hypothese, die beiden<br />
Stichproben würden derselben Grundgesamtheit entstammen. Der Moses-Test<br />
vergleicht dagegen die Spannweite der beiden Stichproben. Er testet die Hypothese,<br />
die Spannweite sei in beiden Stichproben gleich groß. Der Kolmogorov-<br />
Smirnov-Test setzt intervallskalierte Variablen voraus, für die drei übrigen <strong>Tests</strong><br />
ist Ordinalskalenniveau ausreichend.<br />
350 Zum Begriff von unabhängigen und abhängigen Stichproben siehe <strong>Kapitel</strong> 19, T-Test.<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing
758 <strong>Kapitel</strong> <strong>30</strong> <strong>Nichtparametrische</strong> <strong>Tests</strong><br />
<strong>30</strong>.6.1 Interpretation der Testergebnisse<br />
In den Befragungsdaten der allbus-Datei von der Begleit-CD sind unter anderem<br />
das Nettoeinkommen (Variable v261) und das Geschlecht der Befragten (v141)<br />
angegeben. Im folgenden soll untersucht werden, ob sich die Einkommensangaben<br />
von Männern und Frauen so ähnlich sind, daß auf eine einheitliche Grundgesamtheit<br />
geschlossen werden kann, oder ob von zwei unterschiedlichen Grundgesamtheiten<br />
auszugehen ist.<br />
Mann-Whitney-Test<br />
Der Mann-Whitney-Test für die beschriebene Fragestellung wird folgendermaßen<br />
angefordert:<br />
¾ Daten: Die Daten entstammen der Datei allbus.sav. Im folgenden sollen nur<br />
die Personen aus den neuen Bundesländern betrachtet werden. Damit entfällt<br />
auch die Notwendigkeit zur Gewichtung der Daten. 351<br />
¾ Test für zwei unabhängige Stichproben aufrufen: Um den Test aufzurufen,<br />
wählen Sie den Befehl<br />
STATISTIK<br />
NICHTPARAMETRISCHE TESTS<br />
ZWEI UNABHÄNGIGE STICHPROBEN...<br />
¾ Einstellungen: Fügen Sie in dem Dialogfeld der Prozedur die Variablen v261<br />
in das Feld Testvariablen und v141 in das Feld Gruppenvariable ein. Klicken<br />
Sie anschließend auf die Schaltfläche Gruppen definieren, 352 und geben Sie in<br />
dem damit geöffneten Dialogfeld die Werte 1 und 2 in die beiden Eingabefelder<br />
ein.<br />
Bei allen anderen Optionen werden die Voreinstellungen verwendet. Dies bedeutet<br />
insbesondere, daß in der Gruppe Welche <strong>Tests</strong> durchführen? die Option<br />
Mann-Whitney-U-Test angekreuzt bleibt. Diese Einstellungen, die in dem<br />
Dialogfeld in Abbildung <strong>30</strong>.12 auf S. 762 dargestellt sind, liefern den Output<br />
aus Abbildung <strong>30</strong>.10.<br />
Bei einem Mann-Whitney-Test werden die Werte der beiden Gruppen zunächst zu<br />
einer Gruppe zusammengefaßt und in aufsteigender Folge geordnet. Jedem der<br />
Werte wird seiner Position in der Ordnung entsprechend ein Rang zugewiesen.<br />
Anschließend wird für die beiden Gruppen getrennt die Summe der Rangwerte<br />
berechnet. Anhand der beiden sich dabei ergebenden Summen wird die Hypothese<br />
getestet, die beiden Stichproben würden der gleichen Grundgesamtheit entstammen.<br />
Trifft die Hypothese zu, sollten die Werte der beiden Gruppen in der zu Be-<br />
351 In den Aufzählungspunkten Fälle auswählen und Fälle nicht gewichten, S. 742 wird beschrieben,<br />
wie Sie diese Einstellungen in der Datendatei herbeiführen können.<br />
352 Diese Schaltfläche ist nur aktiv, wenn bereits eine Gruppenvariable ausgewählt wurde<br />
und diese aktuell markiert ist.<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing
<strong>30</strong>.6 <strong>Tests</strong> für zwei unabhängige Stichproben 759<br />
ginn gebildeten Reihenfolge in etwa gleichmäßig verteilt sein, die durchschnittlichen<br />
Ränge beider Gruppen sollten also ungefähr die gleiche Größe haben.<br />
Ränge<br />
V261<br />
V141<br />
MANN<br />
FRAU<br />
Gesamt<br />
Mittlerer<br />
N Rang Rangsumme<br />
95 121,37 115<strong>30</strong>,00<br />
109 86,06 9380,00<br />
204<br />
Statistik für Test a 3385,000<br />
Mann-Whitney-U<br />
Wilcoxon-W<br />
Z<br />
Asymptotische Signifikanz<br />
(2-seitig)<br />
a. Gruppenvariable: V141<br />
V261<br />
9380,000<br />
-4,266<br />
,000<br />
Abbildung <strong>30</strong>.10: Ergebnis des Mann-Whitney-<strong>Tests</strong> für zwei unabhängige Stichproben<br />
Der durchschnittliche Rang (Mittlerer Rang) für das Einkommen der Frauen liegt<br />
mit 86,06 deutlich unter dem mittleren Rang von 121,37, der sich für das Einkommen<br />
der Männer ergeben hat. Dies deutet bereits darauf hin, daß die Nullhypothese<br />
falsch ist und die beiden Stichproben nicht der gleichen Grundgesamtheit<br />
entstammen. Selbst wenn sich sehr ähnliche mittlere Rangwerte ergeben hätten,<br />
könnte daraus jedoch noch nicht geschlossen werden, daß die Stichproben aus der<br />
gleichen Grundgesamtheit stammen. Es wäre beispielsweise denkbar, daß Männer<br />
entweder sehr hohe oder sehr niedrige Einkommen erzielen, während Frauen<br />
überwiegend im mittleren Bereich der Einkommensverteilung anzutreffen sind. In<br />
diesem Fall würden die durchschnittlichen Rangwerte bei Männern und Frauen<br />
ungefähr gleich groß sein, obwohl die tatsächliche Verteilung der Werte sehr unterschiedlich<br />
wäre und die beiden Gruppen nicht der gleichen Grundgesamtheit<br />
zugeordnet werden könnten. Aus diesem Grund wird neben den durchschnittlichen<br />
Rangwerten zusätzlich untersucht, wie häufig ein Wert der ersten Gruppe einem<br />
der zweiten Gruppe vorausgeht bzw. wie häufig ein Wert der zweiten Gruppe vor<br />
einem der ersten Gruppe angeordnet ist. Die geringere der beiden Häufigkeiten<br />
wird in der rechten Tabelle in der Zeile mit der Beschriftung Mann-Whitney-U angegeben.<br />
Bei der Berechnung wird für jeden Wert der zweiten Gruppe die Anzahl<br />
der Werte aus der ersten Gruppe gezählt, die einen niedrigeren Rang haben. Die so<br />
gezählten Werte werden addiert, so daß jeder Wert der ersten Gruppe mehrmals in<br />
die Zählung eingehen kann.<br />
Beispiel: Bei den vier Werten, die in geordneter Form den beiden Gruppen in der<br />
Reihenfolge 1 2 1 2 zuzuordnen sind, gehen drei Werte aus der Gruppe 1 der<br />
Gruppe 2 voraus, da der ersten 2 ein Wert der ersten Gruppe und der zweiten 2<br />
zwei Werte der ersten Gruppe vorausgehen. Umgekehrt geht nur ein Wert der<br />
zweiten Gruppe den Werten der ersten Gruppe voraus. In der Zeile mit der Beschriftung<br />
Wilcoxon-W wird zusätzlich die Summe der Ränge angegeben, die sich<br />
für die Gruppe mit der geringeren Fallzahl ergibt, bei diesem Test also für die<br />
Gruppe der Frauen.<br />
Anhand dieser Werte wird eine Signifikanz für die Nullhypothese berechnet. Für<br />
dieses Beispiel wird der Signifikanzwert mit 0,000 angegeben und ist damit kleiner<br />
als 0,0005. Bei einer derart niedrigen Irrtumswahrscheinlichkeit kann die<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing
760 <strong>Kapitel</strong> <strong>30</strong> <strong>Nichtparametrische</strong> <strong>Tests</strong><br />
Nullhypothese, die Einkommensangaben von Männern und Frauen würden der<br />
gleichen Grundgesamtheit entstammen, zurückgewiesen werden.<br />
Moses-Test<br />
Um die Spannweite der Einkommensangaben von Männern und Frauen aus den<br />
neuen Bundesländern zu vergleichen, kann mit einem Moses-Test die Nullhypothese<br />
getestet werden, nach der die Spannweiten beider Stichproben in der Grundgesamtheit<br />
gleich sind. Um einen solchen Test durchzuführen, können Sie die<br />
oben (S. 758) beschriebenen Einstellungen verwenden. Sie müssen lediglich im<br />
Hauptdialogfeld der Prozedur die Option Extremreaktionen nach Moses aus der<br />
Gruppe Welche <strong>Tests</strong> durchführen? ankreuzen. Die Ergebnisse dieses <strong>Tests</strong> sind in<br />
Abbildung <strong>30</strong>.11 wiedergegeben.<br />
Häufigkeiten<br />
V261<br />
V141<br />
MANN (Kontrolle)<br />
FRAU (Experimentell)<br />
Gesamt<br />
N<br />
95<br />
109<br />
204<br />
Statistik für Test a,b 203<br />
Beobachtete Spannweite der<br />
Kontrollgruppe<br />
Spannweite der getrimmten<br />
Kontrollgruppe<br />
Ausreißer an beiden Enden entfernt<br />
a. Moses-Test<br />
b. Gruppenvariable: V141<br />
Signifikanz (1-seitig)<br />
Signifikanz (1-seitig)<br />
V261<br />
,784<br />
179<br />
,136<br />
4<br />
Abbildung <strong>30</strong>.11: Ergebnisse eines Moses-<strong>Tests</strong> für zwei unabhängige Stichproben<br />
In der oberen Tabelle wird lediglich die Anzahl der Fälle für die beiden Gruppen<br />
mitgeteilt. Der Moses-Test verwendet eine der beiden Gruppen als Kontrollgruppe.<br />
Wie aus der oberen Tabelle hervorgeht, ist dies in diesem Fall die Gruppe der<br />
Männer. Die Werte beider Gruppen werden gemeinsam geordnet und der Ordnung<br />
entsprechend mit Rangwerten versehen. Für die Kontrollgruppe wird die Spannweite<br />
der Rangwerte als Differenz zwischen dem größten und dem kleinsten Rang<br />
berechnet. Diese Spannweite wird in der unteren Tabelle in der Zeile Beobachtete<br />
Spannweite der Kontrollgruppe mit 203 angegeben. Bei einer Gesamtstichprobe<br />
von 204 Fällen bedeutet dies, daß entweder der größte und der zweitkleinste oder<br />
umgekehrt der zweitgrößte sowie der kleinste Rang einem Wert der Kontrollgruppe<br />
zugeordnet wurde. 353<br />
353 Die Spannweite wird beim Moses-Test von SPSS berechnet als Höchster Rang – Niedrigster<br />
Rang + 1 und nicht, wie erwartet werden könnte, als Höchster Rang – Niedrigster Rang.<br />
Die größte erreichbare Spannweite entspricht damit der Anzahl der Beobachtungen.<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing
<strong>30</strong>.6 <strong>Tests</strong> für zwei unabhängige Stichproben 761<br />
Die Wahrscheinlichkeit dafür, daß sich eine solche Spannweite für die Kontrollgruppe<br />
ergibt, wenn die beiden Stichproben (Männer und Frauen) in der Grundgesamtheit<br />
die gleiche Spannweite aufweisen, beträgt 78,4%. Dieser Wert wird in<br />
der Zeile Signifikanz (1-seitig) für die Beobachtete Spannweite der Kontrollgruppe<br />
angegeben. Bei einer derart hohen Irrtumswahrscheinlichkeit kann die Nullhypothese<br />
nicht zurückgewiesen werden. Aus der Stichprobe ergibt sich somit kein<br />
Hinweis darauf, daß die Einkommenswerte von Männern und Frauen in der<br />
Grundgesamtheit eine unterschiedliche Spannweite aufweisen.<br />
Bei der Betrachtung von Spannweiten können die Ergebnisse leicht durch einzelne<br />
Ausreißer verzerrt werden. Aus diesem Grund wird ein zweiter Signifikanzwert<br />
mitgeteilt, der sich auf eine getrimmte Kontrollgruppe bezieht, also auf eine Kontrollgruppe,<br />
aus der einige Ausreißer entfernt wurden. In der untersten Zeile der<br />
Tabelle wird angegeben, daß an jedem Ende der gesamten Rangordnung (die sowohl<br />
Männer als auch Frauen umfaßt) vier Werte entfernt wurden. Damit verringert<br />
sich die Fallzahl der Gesamtstichprobe um 8 auf 196. Die Spannweite der<br />
Kontrollgruppe hat sich dabei jedoch wesentlich stärker verringert, und zwar um<br />
24 auf 179. Dieser Wert wird als Spannweite der getrimmten Kontrollgruppe ausgewiesen.<br />
Die Wahrscheinlichkeit für das Eintreten einer Spannweite dieser Größe<br />
beträgt bei Gültigkeit der Nullhypothese nur noch 13,6%. Unter Ausschluß der<br />
extremen Werte kann die Nullhypothese damit bei weitem nicht so deutlich bestätigt<br />
werden wie bei Einbeziehung der Ausreißer, allerdings läßt sich die Nullhypothese<br />
auch bei einer Irrtumswahrscheinlichkeit von 13,6% nicht zurückweisen.<br />
<strong>30</strong>.6.2 Einstellungen der <strong>Tests</strong> für zwei unabhängige Stichproben<br />
bei SPSS<br />
Um nichtparametrische <strong>Tests</strong> für zwei unabhängige Stichproben durchzuführen,<br />
öffnen Sie mit dem folgenden Befehl das Dialogfeld aus Abbildung <strong>30</strong>.12:<br />
STATISTIK<br />
NICHTPARAMETRISCHE TESTS<br />
ZWEI UNABHÄNGIGE STICHPROBEN...<br />
In der Variablenliste werden nur die numerischen Variablen der Datendatei aufgeführt.<br />
Textvariablen können weder als Test- noch als Gruppenvariable verwendet<br />
werden, obwohl die Gruppenvariable lediglich Nominalskalenniveau besitzen<br />
muß. Um einen oder mehrere der <strong>Tests</strong> durchzuführen, gehen Sie folgendermaßen<br />
vor:<br />
¾ Testvariablen: Geben Sie die Testvariablen in dem gleichnamigen Feld an.<br />
Für jede der angegebenen Variablen werden alle angeforderten <strong>Tests</strong> berechnet.<br />
Die Testvariablen müssen mindestens Ordinalskalenniveau besitzen, für<br />
die Durchführung eines Kolmogorov-Smirnov-<strong>Tests</strong> ist sogar Intervallskalenniveau<br />
erforderlich.<br />
¾ Gruppierungsvariablen: Verschieben Sie eine Gruppierungsvariable in das<br />
Feld Gruppenvariable. Zusätzlich müssen für diese Variable zwei Werte ange-<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing
762 <strong>Kapitel</strong> <strong>30</strong> <strong>Nichtparametrische</strong> <strong>Tests</strong><br />
geben werden, die die beiden zu vergleichenden Gruppen (Stichproben) definieren<br />
(s.u.).<br />
¾ <strong>Tests</strong>: Kreuzen Sie die durchzuführenden <strong>Tests</strong> an.<br />
¾ Optionen: Sie können ergänzende Maßzahlen für die Testvariablen anfordern<br />
und den Ausschluß von fehlenden Werten regeln.<br />
Abbildung <strong>30</strong>.12: Dialogfeld des Befehls STATISTIK, NICHTPARA-<br />
METRISCHE TESTS, ZWEI UNABHÄNGIGE STICHPROBEN<br />
Gruppierungsvariable<br />
Geben Sie eine Gruppierungsvariable an, anhand derer aus den Fällen der Stichprobe<br />
zwei Gruppen gebildet werden sollen. Zur Gruppenbildung müssen zwei<br />
Werte der Variablen angegeben werden. Fälle, die keinen der angegebenen Werte<br />
in der Gruppierungsvariable enthalten, werden von den <strong>Tests</strong> ausgeschlossen. Von<br />
den übrigen Fällen bilden jeweils die Fälle mit den gleichen Werten in der Gruppierungsvariable<br />
eine Gruppe.<br />
Um die Gruppen zu definieren, verschieben Sie die gruppierende Variable in das<br />
Feld Gruppenvariable, und klicken Sie anschließend auf die Schaltfläche Gruppen<br />
definieren. Diese Schaltfläche ist nur aktiv, wenn die Variable in dem Feld<br />
Gruppenvariable ausgewählt ist. Hierzu müssen Sie die Variable ggf. einmal mit<br />
der Maus anklicken. Die Schaltfläche öffnet das Dialogfeld aus Abbildung <strong>30</strong>.13.<br />
Abbildung <strong>30</strong>.13: Dialogfeld der Schaltfläche „Gruppen definieren“<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing
<strong>30</strong>.6 <strong>Tests</strong> für zwei unabhängige Stichproben 763<br />
Geben Sie zwei ganzzahlige Werte zur Gruppenbildung an. Fälle, die keinen der<br />
angegebenen Werte aufweisen, werden in den <strong>Tests</strong> nicht berücksichtigt. Werte<br />
mit Dezimalstellen werden auch nicht gerundet oder abgeschnitten. In den Gruppen<br />
1 und 2 ist der Wert 1,4 also nicht enthalten. Die Gruppe des ersten Wertes<br />
wird in dem Moses-Test als Kontrollgruppe verwendet. In dem Mann-Whitney-<br />
Test bezieht sich der Wert W auf diese Gruppe, sofern beide Gruppen die gleiche<br />
Anzahl von Fällen umfassen.<br />
Welche <strong>Tests</strong> durchführen?<br />
Per Voreinstellung wird nur der Mann-Whitney-Test durchgeführt, es stehen jedoch<br />
die folgende vier <strong>Tests</strong> zur Verfügung:<br />
¾ Mann-Whitney-U-Test: Nullhypothese: Beide Stichproben entstammen der<br />
gleichen Grundgesamtheit. Die Werte beider Gruppen werden gemeinsam in<br />
aufsteigender Folge der Werte geordnet und mit Rangwerten versehen. Aus<br />
dieser Reihenfolge wird der Wert U berechnet, der angibt, wie häufig der Wert<br />
einer Gruppe einem Wert der anderen Gruppe vorausgeht. Zusätzlich wird<br />
Wilcoxons W berechnet. Dies ist die Summe der Ränge für die Gruppe mit geringerer<br />
Fallzahl. Für diese Werte wird die zweiseitige Wahrscheinlichkeit als<br />
Fehlerwahrscheinlichkeit für die Nullhypothese berechnet. Zusätzlich werden<br />
die mittleren Ränge beider Stichproben sowie die Anzahl der Fälle in den<br />
Gruppen angegeben. Für ein Beispiel siehe oben Mann-Whitney-Test, S. 758.<br />
¾ Kolmogorov-Smirnov-Z: Nullhypothese: Beide Stichproben entstammen der<br />
gleichen Grundgesamtheit. Dieser Test vergleicht die Verteilungen der beiden<br />
Stichproben miteinander. Er reagiert empfindlich auf Unterschiede in Median,<br />
Schiefe u.a. Dieser Test erfordert Intervallskalenniveau der Testvariablen. Im<br />
Output werden die Fallzahlen der Gruppen, die größten negativen, positiven<br />
und absoluten Differenzen, der Kolmogorov-Smirnov-Z-Wert sowie die zweiseitige<br />
Wahrscheinlichkeit mitgeteilt.<br />
¾ Extremreaktionen nach Moses: Nullhypothese: Die Spannweite der Werte ist<br />
in beiden Gruppen gleich groß. Die Werte beider Gruppen werden in eine gemeinsame<br />
Reihenfolge gebracht. Anschließend werden ihnen Rangwerte zugewiesen.<br />
Eine der Gruppen (die Gruppe des Wertes, der in dem Dialogfeld<br />
Gruppen definieren als erstes angegeben ist) wird als Kontrollgruppe verwendet.<br />
Für diese Gruppe wird die Spannweite der Ränge als Differenz zwischen<br />
dem größten und kleinsten Rangwert berechnet. Anhand dieser Spannweite errechnet<br />
sich die einseitige Signifikanz. Zusätzlich wird der Test ein zweites<br />
Mal durchgeführt, wobei die Ausreißer der Gesamtstichprobe ausgeschlossen<br />
werden (insgesamt 5% der Fälle). Dabei werden sowohl die höchsten als auch<br />
die niedrigsten Ränge entfernt. Das Testergebnis teilt die Anzahl der Fälle beider<br />
Gruppen, die Spannweiten und die entsprechenden einseitigen Signifikanzen<br />
für beide <strong>Tests</strong> (mit und ohne Ausreißer) mit. Für ein Beispiel siehe oben<br />
Abschnitt Moses-Test, S. 760.<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing
764 <strong>Kapitel</strong> <strong>30</strong> <strong>Nichtparametrische</strong> <strong>Tests</strong><br />
¾ Wald-Wolfowitz-Sequenzen: Nullhypothese: Beide Stichproben entstammen<br />
der gleichen Grundgesamtheit. Die Werte beider Gruppen werden in eine gemeinsame<br />
Reihenfolge gebracht. Für diese Werte wird eine Sequenzanalyse<br />
für die Gruppenzugehörigkeit durchgeführt. Im Output angegeben wird die<br />
Anzahl der Fälle in beiden Gruppen, die Zahl der Sequenzen in der Rangfolge,<br />
der Z-Wert und die entsprechende Signifikanz. Außerdem wird die Zahl der<br />
Rangbindungen ausgewiesen. Sind in der Rangfolge verbundene Fälle enthalten,<br />
werden die Höchst- und Mindestzahl der möglichen Sequenzen angegeben.<br />
Für beide werden der Z-Wert und die einseitige Signifikanz mitgeteilt.<br />
Optionen<br />
Die Schaltfläche Optionen öffnet das Dialogfeld aus Abbildung <strong>30</strong>.3, S. 747. Dort<br />
können Sie ergänzenden Output anfordern und den Ausschluß von Fällen mit<br />
fehlenden Werten steuern. Zur Bedeutung der Optionen siehe im einzelnen Abschnitt<br />
Optionen, S. 747.<br />
<strong>30</strong>.7 <strong>Tests</strong> für mehrere unabhängige Stichproben<br />
Zum Vergleich mehrerer unabhängiger Stichproben stehen zwei <strong>Tests</strong> zur Verfügung,<br />
der Kruskal-Wallis-Test und der Median-Test. Beide <strong>Tests</strong> vergleichen die<br />
Werte einer Variablen in verschiedenen Fallgruppen der Datendatei miteinander.<br />
Jede Fallgruppe bildet im Sinne der <strong>Tests</strong> eine unabhängige Stichprobe. Die Fallgruppen<br />
werden dabei mit Hilfe einer gruppierenden (kategorialen) Variablen aus<br />
der Datendatei definiert.<br />
Der Median-Test untersucht, ob die verschiedenen Stichproben in der Grundgesamtheit<br />
den gleichen Median aufweisen. Er entspricht insofern einem T-Test, der<br />
einen Vergleich der Mittelwerte verschiedener Stichproben durchführt. Der Kruskal-Wallis-Test<br />
erstellt eine gemeinsame Rangfolge aller Werte der verschiedenen<br />
Stichproben und testet anschließend die Nullhypothese, die mittleren Rangzahlen<br />
in den einzelnen Gruppen seien gleich. Für beide <strong>Tests</strong> müssen die Testvariablen<br />
mindestens Ordinalskalenniveau aufweisen.<br />
<strong>30</strong>.7.1 Interpretation der Testergebnisse<br />
Beispiel<br />
Im Rahmen der ALLBUS-Umfrage wurde den Befragten unter anderem der in<br />
Abbildung <strong>30</strong>.14 wiedergegebene Fragetext mit den ebenfalls aufgeführt Antwortkategorien<br />
vorgelegt. Im folgenden soll untersucht werden, ob sich die Antworten<br />
von Befragten mit unterschiedlichem allgemeinen Schulabschluß bei dieser<br />
Frage unterscheiden. Hierzu werden sowohl ein Median-Test als auch ein<br />
Kruskal-Wallis-Test durchgeführt.<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing
<strong>30</strong>.7 <strong>Tests</strong> für mehrere unabhängige Stichproben 765<br />
Im Vergleich dazu, wie andere hier in Deutschland leben: Glauben Sie, daß Sie Ihren<br />
gerechten Anteil erhalten, mehr als Ihren gerechten Anteil, etwas weniger oder sehr<br />
viel weniger?<br />
‰ 1 Sehr viel weniger<br />
‰ 2 Etwas weniger<br />
‰ 3 Gerechten Anteil<br />
‰ 4 Mehr als den gerechten Anteil<br />
Abbildung <strong>30</strong>.14: Fragetext und Antwortkategorien für die Variable „v<strong>30</strong>“<br />
Die <strong>Tests</strong> zur Untersuchung der beschriebenen Fragestellungen fordern Sie mit<br />
den folgenden Einstellungen an:<br />
¾ Daten: Die Daten entstammen der Datei allbus.sav. Im folgenden sollen nur<br />
die Personen aus den neuen Bundesländern betrachtet werden. Damit entfällt<br />
auch die Notwendigkeit zur Gewichtung der Daten. 354<br />
¾ Test für mehrere unabhängige Stichproben aufrufen: Um den Test aufzurufen,<br />
wählen Sie den Befehl<br />
STATISTIK<br />
NICHTPARAMETRISCHE TESTS<br />
K UNABHÄNGIGE STICHPROBEN...<br />
¾ Einstellungen: Fügen Sie in dem Dialogfeld der Prozedur die Variablen v<strong>30</strong><br />
(Gerechter Anteil am Lebensstandard?) in das Feld Testvariablen und bildung<br />
(Allgemeiner Schulabschluß) in das Feld Gruppenvariable ein. Klicken Sie<br />
anschließend auf die Schaltfläche Gruppen definieren, 355 und geben Sie in dem<br />
damit geöffneten Dialogfeld den Wert 1 als Minimum und den Wert 3 als Maximum<br />
an.<br />
Da im folgenden sowohl der Median-Test als auch der Kruskal-Wallis-Test<br />
betrachtet werden sollen, werden in der Gruppe Welche <strong>Tests</strong> durchführen? im<br />
Hauptdialogfeld beide Optionen angekreuzt. Die beschriebenen Einstellungen<br />
sind in dem Dialogfeld in Abbildung <strong>30</strong>.17, S. 768 dargestellt und liefern den<br />
Output aus den Abbildung <strong>30</strong>.15 und <strong>30</strong>.16.<br />
Kruskal-Wallis-Test<br />
Die Ergebnisse des Kruskal-Wallis-<strong>Tests</strong> sind in Abbildung <strong>30</strong>.15 dargestellt. Die<br />
Variable bildung unterscheidet zwischen drei allgemeinen Schulabschlüssen. In<br />
der Spalte Mittlerer Rang werden die durchschnittlichen Rangzahlen für diese drei<br />
Gruppen ausgegeben. Diese werden berechnet, indem zunächst alle Werte der<br />
Testvariablen in eine gemeinsame Rangordnung gebracht werden. Jedem Variablenwert<br />
wird dabei ein Rangwert entsprechend seiner Position in der Rangord-<br />
354 In den Aufzählungspunkten Fälle auswählen und Fälle nicht gewichten, S. 742 wird beschrieben,<br />
wie Sie diese Einstellungen in der Datendatei herbeiführen können.<br />
355 Diese Schaltfläche ist nur aktiv, wenn bereits eine Gruppenvariable ausgewählt wurde<br />
und diese aktuell markiert ist.<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing
766 <strong>Kapitel</strong> <strong>30</strong> <strong>Nichtparametrische</strong> <strong>Tests</strong><br />
nung zugewiesen. Anschließend werden die durchschnittlichen Rangwerte getrennt<br />
für die drei Kategorien des Schulabschlusses errechnet. Es ist sehr deutlich,<br />
daß die mittleren Rangwerte mit der Höhe des Schulabschlusses ansteigen. Während<br />
der durchschnittliche Rangwerte in der Kategorie Hauptschule 154,50 beträgt,<br />
hat er in der Kategorie Mittlere Reife einen Wert von 172,65 und in erreicht<br />
in der Kategorie Abitur sogar den Wert 202,51.<br />
Anhand des Wertes Kruskal-Wallis-H, der annähernd Chi-Quadrat verteilt ist,<br />
wird ein Signifikanzwert für die Nullhypothese berechnet, derzufolge die mittleren<br />
Ränge in der Grundgesamtheit gleich sind. Diese Signifikanz beträgt im vorliegenden<br />
Beispiel 0,010 bzw. 1,0%. Weist man die Nullhypothese gleicher mittlerer<br />
Rangwerte der drei Gruppen in der Grundgesamtheit zurück, begeht man folglich<br />
mit einer Wahrscheinlichkeit von 1,0% einen Irrtum. Bei einer so geringen Irrtumswahrscheinlichkeit<br />
kann die Nullhypothese zurückgewiesen werden, die<br />
mittleren Rangwerte der Zufriedenheit mit dem Lebensstandard in den drei unterschiedlichen<br />
Schulabschluß-Kategorien sind in der Grundgesamtheit offenbar<br />
nicht gleich.<br />
Ränge<br />
V<strong>30</strong><br />
BILDUNG<br />
Hauptschule, Polytech.<br />
Schule 8. o. 9. Kl., kein<br />
Abschluß<br />
Mittlere Reife,<br />
Fachhochschule,<br />
Polytech. Schule 10.<br />
Klasse<br />
Abitur bzw. Erw.<br />
Oberschule<br />
Gesamt<br />
N<br />
Mittlerer<br />
Rang<br />
141 154,50<br />
156 172,65<br />
39 202,51<br />
Statistik für Test a,b V<strong>30</strong><br />
Chi-Quadrat<br />
9,249<br />
df<br />
2<br />
Asymptotische Signifikanz ,010<br />
a. Kruskal-Wallis-Test<br />
336<br />
b. Gruppenvariable: BILDUNG<br />
Abbildung <strong>30</strong>.15: Ergebnisse des Kruskal-Wallis-<strong>Tests</strong> für mehrere unabhängige<br />
Stichproben<br />
Median-Test<br />
Für den Median-Test hat die Prozedur die Ergebnisse aus Abbildung <strong>30</strong>.16 ausgegeben.<br />
Zunächst wurde der Median der Testvariablen für die Gesamtheit der in<br />
den Test eingegangenen Fälle berechnet. Dieser Median wird in der unteren Tabelle<br />
mit 2 angegeben. Anschließend werden die Werte der einzelnen Gruppen mit<br />
dem Gesamtmedian verglichen. Für jede Gruppen wird die Anzahl der Fälle mitgeteilt,<br />
deren Werte größer bzw. kleiner sind als der Median aller Fälle. Entstammen<br />
die Werte alle der gleichen Grundgesamtheit, sollten die Mediane in den drei<br />
Gruppen ungefähr gleich sein. In dem Fall würden auch in jeder Gruppe in etwa<br />
die Hälfte der Werte über und die andere Hälfte unter dem Median liegen, der für<br />
die Gesamtheit der Fälle berechnet wurde. Für die drei Gruppen aus dem Beispiel<br />
trifft dies nicht uneingeschränkt zu. Zunächst ist zu beobachten, daß in jeder<br />
Gruppe deutlich mehr Werte kleiner oder gleich dem Median (
<strong>30</strong>.7 <strong>Tests</strong> für mehrere unabhängige Stichproben 767<br />
wenige Gruppen unterschieden werden und der Median mit einer häufig vertretenen<br />
Gruppe zusammenfällt. Für den Test ist aber vor allem entscheidend, daß die<br />
Verteilung der Werte in den drei Gruppen sehr ähnlich ist, sich die Werte also in<br />
ähnlicher Weise auf die beiden Seiten des Medians verteilen.<br />
Mit einem Chi-Quadrat-Test wird überprüft, inwieweit die Unterschiede zwischen<br />
den Gruppen auf tatsächliche Unterschiede in der Grundgesamtheit hindeuten. Der<br />
Signifikanzwert für die Nullhypothese wird mit 0,114% bzw. 11,4% angegeben.<br />
Bei einer so hohen Irrtumswahrscheinlichkeit kann die Nullhypothese, derzufolge<br />
die Mediane der einzelnen Gruppen der gleichen Grundgesamtheit entstammen<br />
(das bedeutet hier einfach, daß die Mediane gleich sind) nicht zurückgewiesen<br />
werden.<br />
Häufigkeiten<br />
V<strong>30</strong><br />
> Median<br />
< = Median<br />
Hauptschule,<br />
Polytech.<br />
Schule 8. o.<br />
9. Kl., kein<br />
BILDUNG<br />
Mittlere Reife,<br />
Fachhochschule,<br />
Polytech. Schule<br />
Abitur bzw.<br />
Erw.<br />
Abschluß 10. Klasse Oberschule<br />
44 59 19<br />
97 97 20<br />
N<br />
Median<br />
Statistik für Test b V<strong>30</strong><br />
336<br />
2,00<br />
4,339 a<br />
Chi-Quadrat<br />
df<br />
Asymptotische Signifikanz<br />
2<br />
,114<br />
a. Bei 0 Zellen (,0%) werden weniger als 5 Häufigkeiten<br />
erwartet. Die kleinste erwartete Zellenhäufigkeit ist<br />
14,2.<br />
b. Gruppenvariable: BILDUNG<br />
Abbildung <strong>30</strong>.16: Ergebnisse eines Median-<strong>Tests</strong> für mehrere unabhängige Stichproben<br />
<strong>30</strong>.7.2 Einstellungen eines <strong>Tests</strong> für mehrere unabhängige<br />
Stichproben bei SPSS<br />
Um nichtparametrische <strong>Tests</strong> für mehrere unabhängige Stichproben durchzuführen,<br />
öffnen Sie mit dem folgenden Befehl das Dialogfeld aus Abbildung <strong>30</strong>.17:<br />
STATISTIK<br />
NICHTPARAMETRISCHE TESTS<br />
K UNABHÄNGIGE STICHPROBEN...<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing
768 <strong>Kapitel</strong> <strong>30</strong> <strong>Nichtparametrische</strong> <strong>Tests</strong><br />
Abbildung <strong>30</strong>.17: Dialogfeld des Befehls STATISTIK, NICHTPARA-<br />
METRISCHE TESTS, K UNABHÄNGIGE STICHPROBEN<br />
Das abgebildete Dialogfeld zeigt die für das obige Beispiel verwendeten Einstellungen.<br />
In der Variablenliste werden nur die numerischen Variablen der Datendatei<br />
aufgeführt, Textvariablen können also auch nicht als Gruppierungsvariablen<br />
verwendet werden. Um einen Test für mehrere unabhängige Stichproben durchzuführen,<br />
nehmen Sie die folgenden Einstellungen vor:<br />
¾ Testvariablen: Geben Sie in diesem Feld mindestens eine Testvariable an. Die<br />
Werte der Testvariablen in verschieden Fallgruppen der Datendatei werden<br />
anhand der <strong>Tests</strong> miteinander verglichen.<br />
¾ Gruppenvariable: Geben Sie hier die gruppierende Variable an. Zusätzlich<br />
muß in dem Dialogfeld der Schaltfläche Bereich definieren ein Wertebereich<br />
angegeben werden (s.u.). Jeder Wert der Gruppenvariablen innerhalb dieses<br />
Bereichs bildet eine Fallgruppe in der Datendatei.<br />
¾ Welche <strong>Tests</strong> durchführen?: Kreuzen Sie die durchzuführenden <strong>Tests</strong> an.<br />
¾ Optionen: Hier können Sie zusätzliche Maßzahlen für den Output anfordern<br />
und den Ausschluß von Fällen mit fehlenden Werten regeln.<br />
Gruppenvariable<br />
Geben Sie die Variable, durch deren Werte die Fallgruppen definiert werden sollen,<br />
in dem Feld Gruppenvariable an. Um die Gruppen zu definieren, müssen Sie<br />
zusätzliche einen Wertebereich festlegen. Jeder ganzzahlige Wert innerhalb dieses<br />
Bereichs (einschließlich der Grenzen) bildet eine Fallgruppe und damit eine der zu<br />
vergleichenden unabhängigen Stichproben. Um den Wertebereich anzugeben, öffnen<br />
Sie mit der Schaltfläche Bereiche definieren das in Abbildung <strong>30</strong>.18 dargestellte<br />
Dialogfeld.<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing
<strong>30</strong>.7 <strong>Tests</strong> für mehrere unabhängige Stichproben 769<br />
Abbildung <strong>30</strong>.18: Dialogfeld der Schaltfläche "Bereich<br />
definieren“ für mehrere unabhängige Stichproben<br />
Geben Sie in den Feldern Minimum und Maximum die untere und obere Grenze<br />
des Wertebereichs an. Jeder ganzzahlige Werte innerhalb dieses Bereichs definiert<br />
eine Fallgruppe in der Datendatei. Durch die Angaben in Abbildung <strong>30</strong>.17 werden<br />
damit die drei Fallgruppen 1, 2 und 3 definiert. Enthält die Gruppenvariable Werte<br />
mit Dezimalstellen, werden diese abgeschnitten. Der Wert 3,9 wird damit noch der<br />
Gruppe 3 zugeordnet, auch wenn er bereits außerhalb des angegeben Wertebereichs<br />
liegt.<br />
Welche <strong>Tests</strong> durchführen?<br />
Für mehrere unabhängige Stichproben stehen die beiden folgenden <strong>Tests</strong> zur Verfügung:<br />
¾ Kruskal-Wallis H: Nullhypothese: Die Stichproben entstammen derselben<br />
Grundgesamtheit. Um die Hypothese zu überprüfen, werden die Werte in eine<br />
gemeinsame Rangordnung gebracht. Getestet wird anschließend mit einem χ 2 -<br />
Test, ob die durchschnittlichen Rangwerte in den einzelnen Stichproben gleich<br />
groß sind. Es werden die durchschnittlichen Ränge sowie die Anzahl der Fälle<br />
und außerdem der χ 2 -Wert, die Anzahl der Freiheitsgrade sowie die Signifikanz<br />
ausgegeben.<br />
¾ Median: Nullhypothese: Die Stichproben entstammen Grundgesamtheiten mit<br />
dem gleichen Median. Zunächst wird der Median für die Gesamtheit der Variablenwerte<br />
berechnet. Anschließend wird jeweils die Anzahl der Fälle in den<br />
einzelnen Gruppen betrachtet, deren Werte größer bzw. kleiner als der Gesamtmedian<br />
sind. Bei Gültigkeit der Nullhypothese müßte jeweils die Hälfte<br />
der Werte über und die andere Hälfte unter dem Median liegen. Anhand der<br />
Abweichungen der beobachteten von den erwarteten Fallzahlen wird ein χ 2 -<br />
Test durchgeführt. Im Output werden der χ 2 -Wert, die Anzahl der Freiheitsgrade<br />
sowie die Signifikanz mitgeteilt, außerdem die Anzahl der Fälle, der Gesamtmedian<br />
sowie für die einzelnen Gruppen die Zahl der Fälle mit Werten<br />
größer und kleiner oder gleich dem Gesamtmedian.<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing
770 <strong>Kapitel</strong> <strong>30</strong> <strong>Nichtparametrische</strong> <strong>Tests</strong><br />
Optionen<br />
Die Schaltfläche Optionen öffnet das Dialogfeld aus Abbildung <strong>30</strong>.3, S. 747. Dort<br />
können Sie ergänzenden Output anfordern und den Ausschluß von Fällen mit<br />
fehlenden Werten steuern. Zur Bedeutung der Optionen siehe im einzelnen Abschnitt<br />
Optionen, S. 747.<br />
<strong>30</strong>.8 <strong>Tests</strong> für zwei verbundene Stichproben<br />
Für zwei verbundene Stichproben können Sie mit dem Wilcoxon-Test und dem<br />
Vorzeichen-Test überprüfen, ob die beiden Stichproben Grundgesamtheiten mit<br />
der gleichen Verteilung entstammen. Mit dem McNemar-Test können Sie für zwei<br />
dichotome Variablen untersuchen, ob diese systematische Unterschiede aufweisen.<br />
Zwei Stichproben werden als verbunden bezeichnet, wenn ihre Werte gemeinsam<br />
und damit paarweise auftreten und inhaltlich zusammenhängen. Werden<br />
bei einer Befragung die Personen zum Beispiel nach dem Alter der Mutter sowie<br />
nach dem Alter des Vaters gefragt, bilden die beiden Altersangaben zwei verbundene<br />
Stichproben, da die einzelnen Werte jeweils paarweise miteinander verbunden<br />
sind. Die beiden Werte werden dabei in zwei Variablen, aber im gleichen Fall<br />
gespeichert. Bei verbundenen Stichproben bilden also die Werte einer Stichprobe<br />
jeweils eine eigene Variable.<br />
<strong>30</strong>.8.1 Interpretation des Wilcoxon-<strong>Tests</strong><br />
Im Rahmen der ALLBUS-Umfrage wurden den Befragten unter anderem die beiden<br />
in den Abbildungen <strong>30</strong>.19 und <strong>30</strong>.20 wiedergegebenen Fragen vorgelegt.<br />
Im folgenden geht es um den Zuzug verschiedener Personengruppen nach<br />
Deutschland. Wie ist Ihre Einstellung dazu?<br />
Wie ist es mit Arbeitnehmern aus der Europäischen Union?<br />
‰ 1 Der Zuzug soll uneingeschränkt möglich sein.<br />
‰ 2 Der Zuzug soll begrenzt werden.<br />
‰ 3 Der Zuzug soll völlig unterbunden werden.<br />
Abbildung <strong>30</strong>.19: Fragetext und Antwortkategorien für die Variable „v33“<br />
Und wie ist es mit Arbeitnehmern aus Nicht-EU-Staaten, z.B. Türken?<br />
‰ 1 Der Zuzug soll uneingeschränkt möglich sein.<br />
‰ 2 Der Zuzug soll begrenzt werden.<br />
‰ 3 Der Zuzug soll völlig unterbunden werden.<br />
Abbildung <strong>30</strong>.20: Fragetext und Antwortkategorien für die Variable „v34“<br />
Im folgenden wird mit einem Wilcoxon-Test untersucht, ob die beiden Variablen<br />
in der Grundgesamtheit die gleiche Verteilung aufweisen. Ein solcher Test läßt<br />
sich mit den folgenden Einstellungen anfordern:<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing
<strong>30</strong>.8 <strong>Tests</strong> für zwei verbundene Stichproben 771<br />
¾ Daten: Die Daten entstammen der Datei allbus.sav. Im folgenden sollen nur<br />
die Personen aus den neuen Bundesländern betrachtet. Damit entfällt auch die<br />
Notwendigkeit zur Gewichtung der Daten. 356<br />
¾ Test für zwei verbundene Stichproben aufrufen: Um den Test aufzurufen,<br />
wählen Sie den Befehl<br />
STATISTIK<br />
NICHTPARAMETRISCHE TESTS<br />
ZWEI VERBUNDENE STICHPROBEN...<br />
¾ Einstellungen: Fügen Sie in dem Dialogfeld der Prozedur das Variablenpaar<br />
v33 - v34 in das Feld Ausgewählte Variablenpaare ein. Klicken Sie hierzu in<br />
der Quellvariablenliste nacheinander auf die Variablen v33 und v34, und verschieben<br />
Sie das Paar anschließend mit der Pfeil-Schaltfläche in das Feld Ausgewählte<br />
Variablenpaare.<br />
Bei den übrigen Optionen werden die Voreinstellungen verwendet. Dies bedeutet<br />
insbesondere, daß in der Gruppe Welche <strong>Tests</strong> durchführen? die Option<br />
Wilcoxon angekreuzt bleibt. Die beschriebenen Einstellungen sind in dem<br />
Dialogfeld in Abbildung <strong>30</strong>.22, S. 772 dargestellt und liefern den Output aus<br />
Abbildung <strong>30</strong>.21.<br />
Der Wilcoxon-Test vergleicht die Verteilung beider Variablen anhand der Differenzen<br />
zwischen den Wertepaaren. Zunächst werden die Differenzen berechnet<br />
und nach ihrer absoluten Größe in eine Rangordnung gebracht. Anschließend<br />
werden die mittleren Rangzahlen der positiven und der negativen Differenzen berechnet.<br />
Die Zahl der positiven und negativen Differenzen sowie ihr durchschnittlicher<br />
Rangwert werden in dem Output angegeben. Insgesamt wurden 329<br />
Fälle in den Test einbezogen, davon wiesen 7 Fälle negative und 73 Fälle positive<br />
Differenzen auf. In 7 Fällen wurde der Zuzug von EU-Ausländern damit ablehnender<br />
beurteilt als der Zuzug von Nicht-EU-Ausländern, in 73 Fälle verhielt es<br />
sich genau umgekehrt. 249 Befragte haben den Zuzug der beiden Gruppen von<br />
ausländischen Arbeitnehmern gleich bewertet (Bindungen).<br />
Nicht nur die Anzahl negativer Differenzen, sondern auch ihr durchschnittlicher<br />
absoluter Betrag scheinen etwas kleiner zu sein als die positiven Abweichungen.<br />
Der mittlere Rang der sieben negativen Abweichungen ist mit 37,00 angegeben,<br />
während der für positive Differenzen 40,84 beträgt. Aufgrund dieser Beobachtungen<br />
ergibt sich für die Nullhypothese, derzufolge beide Stichproben einer<br />
Grundgesamtheit mit der gleichen Verteilung entstammen, ein Signifikanzwert<br />
von 0,000 bzw. 0,0%. Die Nullhypothese kann damit zurückgewiesen werden. Der<br />
annähernd standardnormalverteilte Z-Wert, der zur Berechnung der Signifikanz<br />
diente, wird ebenfalls ausgewiesen und beträgt -7,238.<br />
356 In den Aufzählungspunkten Fälle auswählen und Fälle nicht gewichten, S. 742 wird beschrieben,<br />
wie Sie diese Einstellungen in der Datendatei herbeiführen können.<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing
772 <strong>Kapitel</strong> <strong>30</strong> <strong>Nichtparametrische</strong> <strong>Tests</strong><br />
V34 - V33<br />
a. V34 < V33<br />
b. V34 > V33<br />
c. V33 = V34<br />
Negative Ränge<br />
Positive Ränge<br />
Bindungen<br />
Gesamt<br />
Ränge<br />
N<br />
Mittlerer<br />
Rang Rangsumme<br />
7 a 37,00 259,00<br />
73 b 40,84 2981,00<br />
249 c<br />
329<br />
Z<br />
Statistik für Test b<br />
Asymptotische Signifikanz<br />
(2-seitig)<br />
V34 - V33<br />
-7,238 a<br />
a. Basiert auf negativen Rängen.<br />
b. Wilcoxon-Test<br />
,000<br />
Abbildung <strong>30</strong>.21: Ergebnisse eines Wilcoxon-<strong>Tests</strong> für zwei verbundene Stichproben<br />
<strong>30</strong>.8.2 Einstellungen der <strong>Tests</strong> für zwei verbundene Stichproben<br />
bei SPSS<br />
Um einen nichtparametrischen Test für zwei verbundene Stichproben durchzuführen,<br />
wählen Sie den folgenden Befehl, der das Dialogfeld aus Abbildung <strong>30</strong>.22<br />
öffnet. Das abgebildete Dialogfeld zeigt die für das vorhergehende Beispiel verwendeten<br />
Einstellungen.<br />
STATISTIK<br />
NICHTPARAMETRISCHE TESTS<br />
ZWEI VERBUNDENE STICHPROBEN...<br />
Abbildung <strong>30</strong>.22: Dialogfeld des Befehls STATISTIK, NICHTPARAME-<br />
TRISCHE TESTS, ZWEI VERBUNDENE STICHPROBEN<br />
¾ Variablen: Geben Sie in dem Feld Ausgewählte Variablenpaare die Paare der<br />
jeweils miteinander zu vergleichenden Variablen an. Klicken Sie dafür zunächst<br />
nacheinander auf die beiden Variablen eines Paares, und fügen Sie das<br />
Paar anschließend durch Klicken auf die Pfeil-Schaltfläche der Liste Ausgewählte<br />
Variablenpaare hinzu. Wenn Sie mehrere Variablenpaare angeben,<br />
werden die <strong>Tests</strong> für jedes Paar getrennt durchgeführt.<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing
<strong>30</strong>.8 <strong>Tests</strong> für zwei verbundene Stichproben 773<br />
¾ <strong>Tests</strong>: Per Voreinstellung wird lediglich der Wilcoxon-Test durchgeführt.<br />
Möchten Sie andere oder zusätzliche <strong>Tests</strong> durchführen, kreuzen Sie diese in<br />
der Gruppe Welche <strong>Tests</strong> durchführen? an (s.u.).<br />
¾ Optionen: Die Schaltfläche Optionen öffnet das Dialogfeld aus Abbildung<br />
<strong>30</strong>.3, S. 747. Dort können Sie ergänzenden Output anfordern und den<br />
Ausschluß von Fällen mit fehlenden Werten steuern. Zur Bedeutung der Optionen<br />
siehe im einzelnen Abschnitt Optionen, S. 747.<br />
Welche <strong>Tests</strong> durchführen?<br />
Die folgenden drei <strong>Tests</strong> stehen für zwei verbundene Stichproben zur Verfügung:<br />
¾ Wilcoxon: Nullhypothese: Beide Stichproben entstammen einer Grundgesamtheit<br />
mit gleicher Verteilung. Der Wilcoxon-Test erstellt eine gemeinsame<br />
Rangfolge aller Werte aus den beiden Stichproben. Anschließend vergleicht er<br />
die Ränge der einzelnen Wertepaare miteinander. Dazu wird die Differenz<br />
zwischen den beiden Rängen eines Paares berechnet und der durchschnittliche<br />
Rang für alle positiven sowie für alle negativen Differenzen ermittelt. Anhand<br />
des unter der Nullhypothese annähernd standardnormalverteilten Testwertes Z<br />
wird die Signifikanz der Nullhypothese ermittelt. Im Output werden für die<br />
positiven und negativen Abweichungen sowie für die Fälle ohne Differenzen<br />
(Bindungen) die Anzahl der Fälle sowie der mittlere Rangwert angegeben.<br />
Außerdem werden der Z-Wert und die Signifikanz mitgeteilt.<br />
¾ Vorzeichen: Nullhypothese: Beide Stichproben entstammen einer Grundgesamtheit<br />
mit gleicher Verteilung. Der Test vergleicht jeweils die Werte der<br />
einzelnen Paare miteinander. Er berechnet die Differenzen beider Werte und<br />
zählt die Anzahl der positiven und die der negativen Abweichungen. Anschließend<br />
wird der bei Gültigkeit der Nullhypothese standardnormalverteilte Z-<br />
Wert berechnet und auf diese Weise die Signifikanz der Nullhypothese bestimmt.<br />
Die Anzahl der positiven und negativen Abweichungen sowie die Zahl<br />
der Fälle mit gleichen Werten in beiden Variablen werden neben dem Z-Wert<br />
und der Signifikanz im Output mitgeteilt.<br />
¾ McNemar: Nullhypothese: Unterschiede in den Werten beider Variablen liegen<br />
in beiden Richtungen gleichermaßen vor. Der Test untersucht für dichotome<br />
Variablen, ob Unterschiede in den Werten beider Variablen in eine<br />
Richtung stärker ausgeprägt sind als in die andere. Dieser Test wird insbesondere<br />
für Voher/Nachher-Vergleiche verwendet. Der Test betrachtet lediglich<br />
die Fälle, in denen sich die Werte beider Variablen unterscheiden. Er erstellt<br />
eine 2 × 2-Tabelle für die dichotomen Werte der beiden Variablen und gibt die<br />
Anzahl der Fälle für die vier verschiedenen Wertekombinationen an. Wenn die<br />
Unterschiede zwischen den Variablen zufällig sind, müßten die beiden ungleichen<br />
Wertekombinationen - in Relation zu der Häufigkeit der einzelnen Werte<br />
- mit gleicher Häufigkeit auftreten. Die Nullhypothese wird mit einem χ 2 -<br />
Test überprüft. Weisen weniger als 25 Fälle verschiedene Werte auf, wird ein<br />
Binomial-Test durchgeführt. Im Output werden die 2 × 2-Tabelle sowie der χ 2 -<br />
Wert und die Signifikanz angegeben.<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing
774 <strong>Kapitel</strong> <strong>30</strong> <strong>Nichtparametrische</strong> <strong>Tests</strong><br />
<strong>30</strong>.9 Test für mehrere verbundene Stichproben<br />
Analog zu den <strong>Tests</strong> für zwei verbundene Stichproben können Sie auch mehrere<br />
verbundene Stichproben daraufhin untersuchen, ob sie derselben Grundgesamtheit<br />
entstammen. Mit dem Friedman-Test können Sie für ordinalskalierte Variablen die<br />
mittleren Ränge der Variablen vergleichen. Kendalls W wird häufig verwendet,<br />
um die Zuverlässigkeit von Gutachtern oder <strong>Tests</strong> zu überprüfen. Der Test untersucht<br />
die Übereinstimmung zwischen verschiedenen Bewertungen. Die Verteilung<br />
mehrerer dichotomer Variablen können Sie mit Cochrans Q auf Gleichheit untersuchen.<br />
Die Interpretation der Testergebnisse erfolgt dabei ganz analog zu den<br />
<strong>Tests</strong> für zwei verbundene Stichproben.<br />
Um nichtparametrische <strong>Tests</strong> für mehrere verbundene Stichproben durchzuführen,<br />
wählen Sie den folgenden Befehl, der das Dialogfeld aus Abbildung <strong>30</strong>.23 öffnet:<br />
STATISTIK<br />
NICHTPARAMETRISCHE TESTS<br />
K VERBUNDENE STICHPROBEN...<br />
Abbildung <strong>30</strong>.23: Dialogfeld des Befehls STATISTIK, NICHTPARA-<br />
METRISCHE TESTS, K VERBUNDENE STICHPROBEN<br />
¾ Variablen: Verschieben Sie die Variablen, die die einzelnen verbundenen<br />
Stichproben repräsentieren, in das Feld Testvariablen. Es müssen mindestens<br />
zwei Variablen angegeben werden. Die Angabe dieser Variablen genügt, um<br />
die Prozedur auszuführen.<br />
¾ <strong>Tests</strong>: Kreuzen Sie in der Gruppe Welche <strong>Tests</strong> durchführen? die gewünschten<br />
<strong>Tests</strong> an (s.u.).<br />
¾ Statistik: Sie können für die Testvariablen zusätzlichen deskriptive Maßzahlen<br />
anfordern (s.u.).<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing
<strong>30</strong>.9 Test für mehrere verbundene Stichproben 775<br />
Welche <strong>Tests</strong> durchführen?<br />
¾ Friedman: Nullhypothese: Die Stichproben entstammen derselben Grundgesamtheit.<br />
Betrachtet werden jeweils die Werte der Testvariablen in demselben<br />
Fall. Für diese Werte eines Falles wird eine Rangordnung erstellt. Anschließend<br />
werden die mittleren Rangzahlen der einzelnen Testvariablen ermittelt.<br />
Anhand eines annähernd χ 2 -verteilten Testwertes wird der Signifikanzwert<br />
für die Nullhypothese berechnet. Der χ 2 -Wert, die Anzahl der Freiheitsgrade<br />
sowie die Signifikanz werden im Output mitgeteilt, ebenso wie die<br />
Anzahl der Fälle sowie die mittleren Rangzahlen der einzelnen Variablen.<br />
¾ Kendall-W: Nullhypothese: Die Stichproben entstammen derselben Grundgesamtheit.<br />
Der Test interpretiert die einzelnen Variablen als verschiedene zu<br />
bewertende Sachverhalte und die einzelnen Fälle als unterschiedliche Prüfer<br />
oder <strong>Tests</strong>. Der Test mißt die Übereinstimmung zwischen den Prüfern. Für jeden<br />
Fall werden die Werte der Variablen dabei in eine Rangordnung gebracht.<br />
Anschließend werden die mittleren Ränge der Variablen ermittelt. Daraus wird<br />
Kendalls W sowie ein χ 2 -Wert berechnet. Kendalls W liegt zwischen 0 und 1<br />
und gibt die Stärke der Übereinstimmung an. Bei einem Wert von 0 besteht gar<br />
keine, bei einem Wert von 1 perfekte Übereinstimmung. Zu dem χ 2 -Wert wird<br />
die Signifikanz mitgeteilt. Neben dem χ 2 -Wert, der Anzahl der Freiheitsgrade<br />
und der Signifikanz und Kendalls W werden die Anzahl der Fälle sowie die<br />
mittleren Ränge der einzelnen Testvariablen mitgeteilt.<br />
¾ Cochran-Q: Nullhypothese: Die verschiedenen dichotomen Variablen haben<br />
dieselbe Verteilung. Bei dichotomen Variablen läuft diese Hypothese darauf<br />
hinaus, daß sie denselben Mittelwert haben. Der Test zählt jeweils die Häufigkeiten<br />
der einzelnen Werte in den Variablen und berechnet den annähernd χ 2 -<br />
verteilten Testwert Q. Cochrans Q, die Anzahl der Freiheitsgrade sowie die Signifikanz<br />
werden im Output angegeben. Zusätzlich werden die Anzahl der<br />
Fälle und die Häufigkeiten der einzelnen Werte in den Testvariablen mitgeteilt.<br />
Statistik<br />
Die Schaltfläche Statistik öffnet das Dialogfeld aus Abbildung <strong>30</strong>.24.<br />
Abbildung <strong>30</strong>.24: Dialogfeld der Schaltfläche „Statistik“<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing
776 <strong>Kapitel</strong> <strong>30</strong> <strong>Nichtparametrische</strong> <strong>Tests</strong><br />
In diesem Dialogfeld können Sie folgende ergänzende Maßzahlen anfordern können:<br />
¾ Deskriptive Statistik: Berechnet für die Testvariablen auf der Basis der in die<br />
<strong>Tests</strong> einbezogenen Fälle den Mittelwert und die Standardabweichung. Zusätzlich<br />
werden das Minimum und das Maximum sowie die Anzahl der Fälle<br />
mitgeteilt.<br />
¾ Quartile: Für die in die Prozedur einbezogenen Fälle werden die 25%-, 50%-<br />
und 75%-Perzentile der Testvariablen angegeben.<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing