20.06.2014 Aufrufe

Kapitel 30 Nichtparametrische Tests

Kapitel 30 Nichtparametrische Tests

Kapitel 30 Nichtparametrische Tests

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

<strong>Kapitel</strong> <strong>30</strong><br />

<strong>Nichtparametrische</strong> <strong>Tests</strong><br />

<strong>30</strong>.1 Überblick<br />

<strong>Nichtparametrische</strong> <strong>Tests</strong> dienen dazu, aufgrund der Daten einer Stichprobe Rückschlüsse<br />

auf die Eigenschaften der Werte in der Grundgesamtheit zu ziehen. Dies<br />

haben sie mit allen anderen Testverfahren auf stichprobentheoretischer Grundlage<br />

wie beispielsweise dem T-Test oder den Varianzanalysen (ANOVA) gemeinsam.<br />

Auch in dem konkret zu untersuchenden Sachverhalt unterscheiden sich die nichtparametrischen<br />

<strong>Tests</strong> häufig nicht von anderen Testverfahren. So kann zum Beispiel<br />

anstatt des T-<strong>Tests</strong> grundsätzlich auch stets der nichtparametrische Mann-<br />

Whitney-Test durchgeführt werden. (Umgekehrt gilt jedoch nicht, daß der Mann-<br />

Whitney-Test jederzeit durch den T-Test ersetzt werden kann.) Der wesentliche<br />

Unterschied zwischen nichtparametrischen <strong>Tests</strong> und den übrigen Testverfahren<br />

besteht darin, daß die nichtparametrischen <strong>Tests</strong> wesentlich geringere Anforderungen<br />

an die Verteilung der Werte in der Grundgesamtheit stellen. Während zum<br />

Beispiel der T-Test verlangt, daß die zu vergleichenden Stichproben jeweils einer<br />

annähernd normalverteilten Grundgesamtheit entstammen und gleiche Varianzen<br />

aufweisen, müssen diese Voraussetzungen für den Mann-Whitney-Test nicht erfüllt<br />

sein.<br />

Zudem stellen nichtparametrische <strong>Tests</strong> häufig weniger starke Anforderungen an<br />

das Skalenniveau der zu untersuchenden Variablen. Dies hängt damit zusammen,<br />

daß ein Großteil der nichtparametrischen <strong>Tests</strong> auf der Betrachtung von Rangzahlen<br />

basiert und daher oftmals ein Ordinalskalenniveau genügt, wenn bei alternativen<br />

<strong>Tests</strong> intervallskalierte Daten erforderlich sind.<br />

Aus dem bisher Gesagten ergibt sich unmittelbar das primäre Anwendungsgebiet<br />

nichtparametrischer <strong>Tests</strong>: Sie kommen insbesondere dann zur Anwendung, wenn<br />

die stärkeren Voraussetzungen alternativer <strong>Tests</strong> von den zugrundeliegenden Daten<br />

nicht erfüllt werden. Der Preis für das Ausweichen auf <strong>Tests</strong> mit schwächeren<br />

Anforderungen an die Daten besteht allerdings darin, daß sich mit nichtparametrischen<br />

<strong>Tests</strong> auch nur weniger scharfe und klare Hypothesen testen lassen. Die aus<br />

diesen <strong>Tests</strong> abgeleiteten Aussagen sind häufig weniger fundiert, da bei den <strong>Tests</strong><br />

nur ein geringerer Teil der verfügbaren Informationen ausgenutzt wird. Wird bei-<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing


740 <strong>Kapitel</strong> <strong>30</strong> <strong>Nichtparametrische</strong> <strong>Tests</strong><br />

spielsweise eine intervallskalierte Variable mit einem nichtparametrischen Test<br />

untersucht, der auf der Betrachtung von Rangwerten basiert, werden die verfügbaren<br />

Informationen über die Größe von Wertdifferenzen nicht verwendet. Daher<br />

kann der Test auch keine so starken Ergebnisse liefern, wie es parametrische <strong>Tests</strong><br />

vermögen. Dies ist der Grund dafür, daß im allgemeinen den parametrischen Verfahren<br />

der Vorzug gegeben wird, sofern von den zu untersuchenden Daten die entsprechenden<br />

Voraussetzungen erfüllt werden. Umgekehrt sind nichtparametrische<br />

<strong>Tests</strong> vor allem dann sinnvoll, wenn die Variablen ein zu niedriges Skalenniveau<br />

für parametrische <strong>Tests</strong> aufweisen oder die Verteilungsannahmen der parametrischen<br />

Verfahren nicht hinreichend erfüllt sind.<br />

Insgesamt stehen bei SPSS 16 nichtparametrische Testverfahren zur Verfügung,<br />

die in acht Unterbefehlen des Menüs<br />

STATISTIK<br />

NICHTPARAMETRISCHE TESTS<br />

zusammengefaßt sind. Es folgt eine Übersicht über die zur Verfügung stehenden<br />

Testverfahren unter Angabe der jeweils zugrundeliegenden Fragestellung, des erforderlichen<br />

Skalenniveaus, des Unterbefehls, mit dem der Test angefordert werden<br />

kann, und der Seitenzahl, bei der die jeweilige Prozedur ausführlicher beschrieben<br />

wird.<br />

¾ Chi-Quadrat: Stimmen die beobachteten Häufigkeiten einer Variablen mit<br />

vorgegebenen erwarteten Häufigkeiten überein? Nominalskalenniveau. CHI-<br />

QUADRAT (S. 741).<br />

¾ Binomial: Stimmen die beobachteten Häufigkeiten einer dichotomen Variablen<br />

mit vorgegebenen erwarteten Häufigkeiten überein? Dichotome Variable.<br />

BINOMIAL (S. 748).<br />

¾ Sequenz: Sind die Werte einer dichotomen Variablen in einer Folge von<br />

Werten zufällig angeordnet? Dichotome Variable. SEQUENZEN (S. 751).<br />

¾ Kolmogorov-Smirnov bei einer Stichprobe: Folgen die Werte in der Grundgesamtheit<br />

einer bestimmten Verteilung? Getestet werden kann auf Normalverteilung,<br />

Gleichverteilung, Poissonverteilung und Exponentialverteilung.<br />

Intervallskalenniveau. K-S BEI EINER STICHPROBE (S. 754).<br />

¾ Mann-Whitney: Entstammen zwei unabhängige Stichproben derselben<br />

Grundgesamtheit? Der Test erfolgt auf der Basis von Rangunterschieden. Ordinalskalenniveau.<br />

ZWEI UNABHÄNGIGE STICHPROBEN (S. 757).<br />

¾ Kolmogorov-Smirnov-Z: Entstammen zwei unabhängige Stichproben derselben<br />

Grundgesamtheit? Der Test basiert auf einem Vergleich der Verteilungen.<br />

Intervallskalenniveau. ZWEI UNABHÄNGIGE STICHPROBEN (S. 757).<br />

¾ Moses: Ist die Spannweite der Werte in den Grundgesamtheiten zweier unabhängiger<br />

Stichproben gleich groß? Ordinalskalenniveau. ZWEI UNABHÄNGIGE<br />

STICHPROBEN (S. 757).<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing


<strong>30</strong>.2 Chi-Quadrat-Test 741<br />

¾ Wald-Wolfowitz: Entstammen zwei unabhängige Stichproben derselben<br />

Grundgesamtheit? Der Test basiert auf einer Sequenzanalyse für die Gruppenzugehörigkeiten<br />

in einer Rangfolge. Ordinalskalenniveau. ZWEI UNAB-<br />

HÄNGIGE STICHPROBEN (S. 757).<br />

¾ Kruskal-Wallis: Entstammen mehrere unabhängige Stichproben derselben<br />

Grundgesamtheit? Hierbei werden die mittleren Rangwerte verglichen. Ordinalskalenniveau.<br />

K UNABHÄNGIGE STICHPROBEN (S. 764).<br />

¾ Median: Weisen mehrere unabhängige Stichproben in der Grundgesamtheit<br />

den gleichen Median auf? Ordinalskalenniveau. K UNABHÄNGIGE STICHPRO-<br />

BEN (S. 764).<br />

¾ Wilcoxon: Entstammen zwei verbundene Stichproben Grundgesamtheiten mit<br />

gleicher Verteilung? Ordinalskalenniveau. ZWEI VERBUNDENE STICHPROBEN<br />

(S. 770).<br />

¾ Vorzeichen: Entstammen zwei verbundene Stichproben Grundgesamtheiten<br />

mit gleicher Verteilung? Ordinalskalenniveau. ZWEI VERBUNDENE STICHPRO-<br />

BEN (S. 770).<br />

¾ McNemar: Erfolgen Änderungen zwischen zwei verbundenen Variablen in<br />

beiden Richtungen gleichermaßen? Dichotome Variablen. ZWEI VERBUNDENE<br />

STICHPROBEN (S. 770).<br />

¾ Friedman: Entstammen mehrere verbundene Stichproben derselben Grundgesamtheit?<br />

Ordinalskalenniveau. K VERBUNDENE STICHPROBEN (S. 774).<br />

¾ Kendall: Entstammen mehrere verbundene Stichproben derselben Grundgesamtheit?<br />

Ordinalskalenniveau. K VERBUNDENE STICHPROBEN (S. 774).<br />

¾ Cochran: Haben mehrere verbundene dichotome Variablen die gleiche Verteilung.<br />

Dichotome Variablen. K VERBUNDENE STICHPROBEN (S. 774).<br />

<strong>30</strong>.2 Chi-Quadrat-Test<br />

Mit diesem χ 2 -Test können Sie überprüfen, ob die Häufigkeiten der Werte einer<br />

Variablen in der Grundgesamtheit vorgegebenen erwarteten Häufigkeiten entsprechen.<br />

Dabei können auch Variablen untersucht werden, die lediglich Nominalskalenniveau<br />

aufweisen. Per Voreinstellung wird getestet, ob die unterschiedlichen<br />

Werte der Variablen in der Grundgesamtheit mit der gleichen Häufigkeit<br />

vertreten sind. Diese Voreinstellung können Sie jedoch ändern und die erwartete<br />

Häufigkeit für jeden Wert manuell vorgeben. Der Test untersucht dann, ob aus den<br />

empirischen Häufigkeiten, die in der vorliegenden Stichprobe beobachtet wurden,<br />

geschlossen werden kann, daß die angegebenen erwarteten Häufigkeiten in der<br />

Grundgesamtheit tatsächlich gelten. 343<br />

343 Zur Berechnung des χ 2 -Wertes und zur <strong>Tests</strong>tatistik vgl. Abschnitt 16.2, Chi-Quadrat-<br />

Test, S. 402.<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing


742 <strong>Kapitel</strong> <strong>30</strong> <strong>Nichtparametrische</strong> <strong>Tests</strong><br />

<strong>30</strong>.2.1 Interpretation eines Chi-Quadrat-<strong>Tests</strong><br />

Die Datendatei allbus.sav von der Begleit-CD enthält Daten einer 1996 in<br />

Deutschland durchgeführten Bevölkerungsbefragung. 344 Im folgenden sollen ausschließlich<br />

die Personen aus den neuen Bundesländern betrachtet werden. Für jeden<br />

Befragten ist unter anderem in der Variablen v35 sein Geburtsmonat angegeben.<br />

Mit dem Chi-Quadrat-Test wird nun untersucht, ob die Anzahl der Geburten<br />

in den einzelnen Monaten in der Grundgesamtheit gleich ist. Hierzu sind die folgenden<br />

Einstellungen erforderlich:<br />

¾ Fälle auswählen: Zunächst ist der Test auf die Befragten aus den neuen Bundesländern<br />

zu beschränken. Hierzu wird der Befehl<br />

DATEN<br />

FÄLLE AUSWÄHLEN...<br />

verwendet. In dem damit geöffneten Dialogfeld wird die Option Falls Bedingung<br />

zutrifft ausgewählt und anschließend auf die zu dieser Option gehörenden<br />

Schaltfläche Falls geklickt. In dem damit geöffneten Dialogfeld wird in das<br />

große Eingabefeld die Bedingung v3 = 2 geschrieben. Anschließend wird dieses<br />

Dialogfeld mit der Schaltfläche Weiter und das Hauptdialogfeld mit der<br />

Schaltfläche OK geschlossen. Achten Sie vor dem Schließen des Hauptdialogfeldes<br />

darauf, daß in der Gruppe Nicht ausgewählte Fälle die Option Filtern<br />

eingestellt ist.<br />

¾ Fälle nicht gewichten: Anders als in vielen anderen <strong>Kapitel</strong>n werden im folgenden<br />

Beispiel nicht gewichtete Fälle betrachtet. Sollten die Fälle in der Datendatei<br />

gewichtet sein, muß die Gewichtung zuvor ausgeschaltet werden. Dies<br />

geschieht mit dem Befehl<br />

DATEN<br />

FÄLLE GEWICHTEN...<br />

Wählen Sie in dem damit geöffneten Dialogfeld die Option Fälle nicht gewichten,<br />

und schließen Sie das Dialogfeld mit OK.<br />

¾ Chi-Quadrat-Test aufrufen: Um den Chi-Quadrat-Test aufzurufen, wählen<br />

Sie den Befehl<br />

STATISTIK<br />

NICHTPARAMETRISCHE TESTS<br />

CHI-QUADRAT...<br />

¾ Einstellungen: Verschieben Sie die Variable v35 in das Feld Testvariable. Bei<br />

allen übrigen Optionen werden die Voreinstellungen beibehalten. Abbildung<br />

<strong>30</strong>.2, S. 745 zeigt die hier verwendeten Dialogfeldeinstellungen.<br />

Durch die voreingestellten Optionen wurde unter anderem festgelegt, daß untersucht<br />

werden soll, ob angenommen werden kann, daß die 12 Monate als Geburtsmonate<br />

in der Grundgesamtheit mit der gleichen Häufigkeit vorkommen. Abwei-<br />

344 Siehe hierzu im einzelnen <strong>Kapitel</strong> 1, Überblick.<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing


<strong>30</strong>.2 Chi-Quadrat-Test 743<br />

chend von dieser Voreinstellung hätte auch untersucht werden können, ob beispielsweise<br />

die Hypothese vertreten werden kann, daß die Sommermonate in der<br />

Grundgesamtheit mit einer 10% höheren Häufigkeit vertreten sind als die Wintermonate.<br />

Der mit den hier verwendeten Einstellungen erzeugte Output ist in Abbildung<br />

<strong>30</strong>.1 wiedergegeben.<br />

Häufigkeiten<br />

1<br />

2<br />

3<br />

4<br />

5<br />

6<br />

7<br />

8<br />

9<br />

10<br />

11<br />

12<br />

Gesamt<br />

Kategorie<br />

V35<br />

Beobachtetes<br />

N<br />

Erwartete<br />

Anzahl<br />

Residuum<br />

Januar 27 28,9 -1,9<br />

Februar 22 28,9 -6,9<br />

März <strong>30</strong> 28,9 1,1<br />

April 32 28,9 3,1<br />

Mai 32 28,9 3,1<br />

Juni 29 28,9 ,1<br />

Juli 31 28,9 2,1<br />

August 35 28,9 6,1<br />

September 38 28,9 9,1<br />

Oktober 21 28,9 -7,9<br />

November 20 28,9 -8,9<br />

Dezember <strong>30</strong> 28,9 1,1<br />

347<br />

Statistik für Test<br />

Chi-Quadrat a<br />

df<br />

Asymptotische Signifikanz<br />

V35<br />

11,720<br />

11<br />

,385<br />

a. Bei 0 Zellen (,0%) werden weniger als 5 Häufigkeiten<br />

erwartet. Die kleinste erwartete Zellenhäufigkeit ist<br />

28,9.<br />

Abbildung <strong>30</strong>.1: Ergebnisse des Chi-Quadrat-<strong>Tests</strong> für die<br />

Variable „v35“ (Geburtsmonat der Befragten)<br />

Die betrachtete Stichprobe umfaßt 347 Personen aus den neuen Bundesländern,<br />

deren Geburtsmonat bekannt ist. Dieser Wert wird in der Tabelle Häufigkeiten und<br />

dort in der Zeile Gesamt angegeben. Wäre nun in der Stichprobe jeder Geburtsmonat<br />

mit der gleichen Häufigkeit vertreten, müßten in jedem Monat ein Zwölftel<br />

der 347 Personen geboren sein. Dies wären 28,9 Personen in jedem Monat. Auch<br />

dieser Wert wird in der Tabelle Häufigkeiten in der Spalte Erwartete Anzahl für<br />

jeden Monat mitgeteilt. Daß diese Häufigkeit von 28,9 Personen in jedem Monat<br />

als erwartete Häufigkeit bezeichnet wird, hat folgenden Hintergrund: Werden in<br />

jedem Monat tatsächlich gleich viele Personen geboren, wäre in einer Zufallsstichprobe<br />

von 347 Personen zu erwarten, daß (rein rechnerisch) 28,9 von den insgesamt<br />

347 Personen im Januar geboren wurden. Die gilt ebenso für den Monat<br />

Februar, den März etc.<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing


744 <strong>Kapitel</strong> <strong>30</strong> <strong>Nichtparametrische</strong> <strong>Tests</strong><br />

Die tatsächlich beobachteten Häufigkeiten der einzelnen Monate, die in der Spalte<br />

Beobachtetes N ausgewiesen werden, weichen mehr oder weniger stark von den<br />

erwarteten Häufigkeiten ab. So wurden nicht 29 (als gerundeter Wert von 28,9)<br />

Personen im Januar geboren, sondern lediglich 27. Die Monate April und Mai sind<br />

dagegen mit jeweils 32 Personen etwas stärker vertreten, als es den erwarteten<br />

Häufigkeiten entsprochen hätte.<br />

Diese Abweichungen der beobachteten von den erwarteten Häufigkeiten lassen<br />

jedoch noch nicht den Schluß zu, die Hypothese, in der Grundgesamtheit seien<br />

alle Monate mit der gleichen Häufigkeit als Geburtsmonate vertreten, sei falsch.<br />

Vielmehr ist es durchaus möglich, daß die Hypothese vollkommen richtig ist und<br />

die Abweichungen zwischen den beobachteten und den erwarteten Häufigkeiten<br />

lediglich auf zufällige Einflüsse bei der Stichprobenziehung zurückzuführen sind.<br />

Die Tatsache, daß entsprechende Abweichungen auch bei Gültigkeit der Nullhypothese<br />

auftreten, ergibt sich schon daraus, daß die erwarteten Häufigkeiten ein<br />

Wert mit Dezimalstellen sind, tatsächlich aber immer nur ganzzahlige Häufigkeiten<br />

beobachtet werden können.<br />

Der Chi-Quadrat-Test untersucht nun, ob die Abweichungen zwischen den beobachteten<br />

und den erwarteten Häufigkeiten so groß sind, daß angenommen werden<br />

kann, sie seien nicht durch zufällige Einflüsse entstanden, sondern auf entsprechend<br />

unterschiedliche Häufigkeiten der Geburtsmonate in der Grundgesamtheit<br />

zurückzuführen. Das Ergebnis des Chi-Quadrat-<strong>Tests</strong> wird in der unteren Tabelle<br />

Statistik für Test mitgeteilt. Der zentrale Wert bei diesen Ergebnissen ist die Signifikanz,<br />

die in diesem Fall 0,385 beträgt. Dieser Wert ist die Irrtumswahrscheinlichkeit,<br />

die mit einem Zurückweisen der Nullhypothese verbunden ist. Er ist in<br />

diesem Fall also folgendermaßen zu interpretieren: Weist man die Nullhypothese<br />

zurück, derzufolge in der Grundgesamtheit jeder Monat mit der gleichen Häufigkeit<br />

als Geburtsmonat vertreten ist, begeht man mit einer Wahrscheinlichkeit von<br />

38,5% einen Irrtum. Diese Irrtumswahrscheinlichkeit ist derart hoch, daß man die<br />

Nullhypothese nicht zurückweisen wird. 345<br />

Die Tatsache, daß die Nullhypothese aufgrund der hohen Irrtumswahrscheinlichkeit<br />

nicht zurückgewiesen werden kann, läßt nicht umgekehrt den Schluß zu, die<br />

Nullhypothese sei richtig. Vielmehr ist das Ergebnis lediglich so zu interpretieren,<br />

daß sich aus den vorhanden Daten keine handfesten Anhaltspunkte dafür ergeben,<br />

daß die Nullhypothese falsch ist. Man kann also zunächst einmal weiter an der<br />

Nullhypothese festhalten, hat sie damit aber nicht verifiziert.<br />

345 Üblicherweise wird die Nullhypothese bei einer Irrtumswahrscheinlichkeit von 5% oder<br />

weniger zurückgewiesen. Je nach zugrundeliegender Fragestellung kann man auch beliebige andere<br />

Grenzen als die 5%-Grenze verwenden, eine Irrtumswahrscheinlichkeit von 38% ist jedoch<br />

derart hoch, daß man die Nullhypothese unter keinen ersichtlichen Umständen zurückweisen<br />

kann.<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing


<strong>30</strong>.2 Chi-Quadrat-Test 745<br />

<strong>30</strong>.2.2 Einstellungen des Chi-Quadrat-<strong>Tests</strong> bei SPSS<br />

Um einen Chi-Quadrat-Test durchzuführen, öffnen Sie das Dialogfeld aus Abbildung<br />

<strong>30</strong>.2 mit dem Befehl<br />

STATISTIK<br />

NICHTPARAMETRISCHE TESTS<br />

CHI-QUADRAT...<br />

Abbildung <strong>30</strong>.2: Dialogfeld des Befehls STATISTIK,<br />

NICHTPARAMETRISCHE TESTS, CHI-QUADRAT<br />

Variablen<br />

Die Variablenliste führt lediglich alle numerischen Variablen der Datendatei auf.<br />

Textvariablen können Sie mit dem χ 2 -Test daher nicht untersuchen, obwohl es für<br />

eine sinnvolle Interpretation des <strong>Tests</strong> genügt, wenn die Variablen nominalskaliert<br />

sind. Daher müssen Sie Textvariablen ggf. zunächst in eine numerische Variable<br />

umcodieren. 346<br />

Verschieben Sie die Variablen, für deren Werte Sie die Häufigkeiten mit exogen<br />

vorgegebenen erwarteten Häufigkeiten vergleichen möchten, in das Feld Testvariablen.<br />

Wenn Sie mehrere Variablen auswählen, wird für jede der Variablen ein<br />

eigener Test durchgeführt. Wenn Sie nicht davon ausgehen, daß die Werte in der<br />

Testvariablen alle mit der gleichen Häufigkeit vorkommen und daher die erwarteten<br />

Häufigkeiten in der Gruppe Erwartete Werte manuell festlegen (s.u.), müssen<br />

diese für alle Testvariablen identisch sein. Ist dies nicht der Fall, müssen Sie die<br />

Variablen nacheinander durch wiederholtes Aufrufen der Prozedur untersuchen.<br />

346 Hierzu können Sie zum Beispiel den Befehl TRANSFORMIEREN, UMKODIEREN, IN<br />

ANDERE VARIABLEN verwenden.<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing


746 <strong>Kapitel</strong> <strong>30</strong> <strong>Nichtparametrische</strong> <strong>Tests</strong><br />

Erwarteter Bereich<br />

Per Voreinstellung werden die Häufigkeiten aller in der Testvariablen vorkommenden<br />

gültigen Werte miteinander verglichen. Abweichend von dieser Voreinstellung<br />

können Sie jedoch auch einen Wertebereich vorgeben, um nur die Werte<br />

innerhalb dieses Bereichs in den Test einzubeziehen. Dies bewirkt zugleich, daß<br />

die Werte in der Testvariablen zu ganzzahligen Werten zusammengefaßt werden:<br />

¾ Aus den Daten: Diese Option ist voreingestellt. Damit werden die Häufigkeiten<br />

für alle gültigen Werte der Testvariablen miteinander verglichen. Dabei<br />

werden auch Dezimalstellen berücksichtigt. Zwischen den Werten 7,53 und<br />

7,52 wird also unterschieden.<br />

¾ Angegebenen Bereich verwenden: Sie können einen Bereich der zu berücksichtigenden<br />

Werte vorgeben. Dies bewirkt gegenüber der Voreinstellung zwei<br />

Veränderungen. Zum einen werden nur die Werte innerhalb des Bereichs<br />

- einschließlich der angegebenen Grenzen - berücksichtigt. Werte, die nicht in<br />

den Bereich fallen, werden von dem Test ausgeschlossen. Zum zweiten werden<br />

die Dezimalstellen der Werte aus der Testvariablen nicht mehr berücksichtigt.<br />

Vielmehr werden die Dezimalstellen abgeschnitten, so daß nur der<br />

ganzzahlige Teil eines Wertes Berücksichtigung findet. Die Werte 7,01 und<br />

7,99 werden somit beide als 7 interpretiert. Zudem werden auch solche ganzzahligen<br />

Werte berücksichtigt, die zwar im vorgegebenen Wertebereich, nicht<br />

aber in der Testvariablen enthalten sind. Für diese Werte wird eine beobachtete<br />

Häufigkeit von null zugrunde gelegt.<br />

Auch die Grenzen des zu berücksichtigenden Wertebereichs müssen durch<br />

ganzzahlige Werte in den Feldern Minimum und Maximum angegeben werden.<br />

Wenn Sie beispielsweise ein Minimum von -1 und ein Maximum von 2 angeben,<br />

werden die Häufigkeiten der Werte -1, 0, 1 und 2 betrachtet.<br />

Erwartete Werte<br />

Per Voreinstellung wird angenommen, daß alle Werte der Testvariablen in der<br />

Grundgesamtheit mit der gleichen Häufigkeit vertreten sind. Diese Voreinstellung<br />

können Sie mit den folgenden Optionen ändern:<br />

¾ Alle Kategorien gleich: Diese Option ist voreingestellt. Damit wird angenommen,<br />

daß alle Werte der Testvariablen in der Grundgesamtheit mit der<br />

gleichen Häufigkeit vertreten sind. Die absoluten erwarteten Häufigkeiten der<br />

einzelnen Werte ergeben sich damit aus der Anzahl der berücksichtigten Fälle,<br />

dividiert durch die Anzahl der unterschiedlichen Werte in der Testvariablen.<br />

¾ Werte: Wenn Sie nicht von gleichen erwarteten Häufigkeiten für alle Werte<br />

der Testvariablen ausgehen, können Sie die erwartete Häufigkeit für jeden<br />

Wert einzeln festlegen. Hierzu müssen Sie für jeden Wert der Testvariablen<br />

einen Wert vorgeben, es darf also kein Wert unberücksichtigt bleiben. Sollten<br />

Sie in der Gruppe Erwarteter Bereich einen Wertebereich festgelegt haben,<br />

müssen Sie für jeden ganzzahligen Wert aus dem Bereich eine erwartete Häu-<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing


<strong>30</strong>.2 Chi-Quadrat-Test 747<br />

figkeit angeben, auch wenn einzelne Werte in der Testvariablen gar nicht vorkommen.<br />

Um die erwarteten Häufigkeiten festzulegen, gehen Sie folgendermaßen vor:<br />

y Legen Sie als erstes die erwartete Häufigkeit für den kleinsten in der<br />

Testvariablen vorkommenden Wert fest. 347 Schreiben Sie den Wert in das<br />

Eingabefeld, und klicken Sie auf die Schaltfläche Hinzufügen. Daraufhin<br />

wird der Wert in das Listenfeld übertragen.<br />

y Legen Sie nun auf die gleiche Weise die erwarteten Häufigkeiten der übrigen<br />

Werte fest. Beachten Sie hierbei, daß die Häufigkeiten in aufsteigender<br />

Reihenfolge der Werte aus der Testvariablen zugeordnet werden.<br />

y Um einen bereits in das Listenfeld eingefügten Wert zu ändern, markieren<br />

Sie den betreffenden Eintrag, ändern Sie den Wert in dem Eingabefeld, und<br />

wählen Sie anschließend die Schaltfläche Ändern. Um einen Wert aus der<br />

Liste zu löschen, markieren Sie ihn, und wählen Sie die Schaltfläche Entfernen.<br />

Beachten Sie hierbei jedoch, daß die verbleibenden Werte in der<br />

Liste am Ende in ihrer Reihenfolge den Werten aus der Testvariablen entsprechen<br />

müssen.<br />

Optionen<br />

Mit der Schaltfläche Optionen öffnen Sie das Dialogfeld aus Abbildung <strong>30</strong>.3. Dort<br />

können Sie ergänzenden Output mit deskriptiven Maßzahlen und den Quartilen<br />

der Testvariablen anfordern und den Ausschluß von Fällen mit fehlenden Werten<br />

steuern.<br />

Abbildung <strong>30</strong>.3: Dialogfeld der Schaltfläche „Optionen“<br />

Statistiken: Mit den beiden folgenden Optionen können Sie ergänzenden Output<br />

anfordern:<br />

¾ Deskriptive Statistik: Hiermit werden die Anzahl der Fälle mit gültigen Werten,<br />

der Mittelwert, die Standardabweichung sowie der kleinste und der größte<br />

347 Es genügt, wenn die Häufigkeiten die Relationen richtig widerspiegeln. Sie können also<br />

wahlweise die erwarteten relativen Häufigkeiten oder ein beliebiges Vielfaches der erwarteten<br />

relativen Häufigkeiten angeben.<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing


748 <strong>Kapitel</strong> <strong>30</strong> <strong>Nichtparametrische</strong> <strong>Tests</strong><br />

Wert angegeben. Beachten Sie, daß der Mittelwert und die Standardabweichung<br />

nur bei Variablen mit Intervallskalenniveau sinnvoll interpretiert werden<br />

können.<br />

¾ Quartile: Es werden das 25%-, das 50%- und das 75%-Perzentil sowie die Anzahl<br />

der Fälle mit gültigen Werten mitgeteilt.<br />

Fehlende Werte: Wenn Sie mehr als eine Testvariable ausgewählt haben, können<br />

Sie mit den beiden folgenden Optionen den Ausschluß von Fällen mit fehlenden<br />

Werten steuern. Wenn Sie nur eine Testvariable betrachten, haben beide Optionen<br />

den gleichen Effekt.<br />

¾ Fallausschluß Test für Test: Diese Option ist voreingestellt. Bei der Untersuchung<br />

der einzelnen Testvariablen werden nur jeweils die Fälle ausgeschlossen,<br />

die in der betreffenden Variablen einen fehlenden Wert aufweisen. Fälle<br />

mit fehlenden Werten in anderen Testvariablen werden dagegen in den Test<br />

einbezogen.<br />

¾ Listenweiser Fallausschluß: Alle Fälle, die in mindestens einer der Testvariablen<br />

einen fehlenden Wert aufweisen, werden aus der gesamten Prozedur ausgeschlossen.<br />

<strong>30</strong>.3 Binomial-Test<br />

Mit einem Binomial-Test können Sie für eine dichotome Variable - dies ist eine<br />

Variable mit nur zwei unterschiedlichen Wertausprägungen - untersuchen, ob die<br />

beobachteten Häufigkeiten mit exogen vorgegebenen erwarteten Häufigkeiten<br />

vereinbar sind. Hierbei ist es nicht erforderlich, daß die Testvariable tatsächlich<br />

nur zwei unterschiedliche Werte enthält. Vielmehr können die Werte der Variablen<br />

beim Binomial-Test dichotomisiert, also zu zwei Gruppen zusammengefaßt,<br />

werden.<br />

<strong>30</strong>.3.1 Interpretation eines Binomial-<strong>Tests</strong><br />

In der Datei allbus.sav ist unter anderem das Geschlecht der Befragten (Variable<br />

v141) angegeben. Hierbei handelt es sich naturgemäß um eine dichotome Variable.<br />

Im folgenden soll die Hypothese getestet werden, in der Grundgesamtheit der<br />

Allbus-Daten seien Männer und Frauen zu gleichen Anteilen vertreten. Hierzu<br />

wird mit Hilfe eines Binomial-<strong>Tests</strong> untersucht, ob die in der Stichprobe beobachteten<br />

Häufigkeiten dieser Hypothese widersprechen. Um diesen Test durchzuführen,<br />

sind die folgenden Einstellungen erforderlich:<br />

¾ Daten: Die Daten entstammen der Datendatei allbus.sav. Auch hier werden<br />

wie bei dem im vorhergehenden Abschnitt durchgeführten Chi-Quadrat-Test<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing


<strong>30</strong>.3 Binomial-Test 749<br />

nur die Personen aus den neuen Bundesländern betrachtet, und es werden ungewichtete<br />

Daten verwendet. 348<br />

¾ Binomial-Test aufrufen: Um den Test aufzurufen, wählen Sie den Befehl<br />

STATISTIK<br />

NICHTPARAMETRISCHE TESTS<br />

BINOMIAL...<br />

¾ Einstellungen: Fügen Sie die Variable v141 in das Feld Testvariablen ein. Bei<br />

den übrigen Optionen werden die Voreinstellungen verwendet (siehe<br />

Abbildung <strong>30</strong>.5, S. 750). Damit wird die Hypothese getestet, in der Grundgesamtheit<br />

seien Männer und Frauen mit der gleiche Häufigkeit vertreten.<br />

Mit diesen Einstellungen erhalten Sie den Output aus Abbildung <strong>30</strong>.4. In der<br />

Spalte N werden zunächst die beobachteten Häufigkeiten der beiden Kategorien<br />

mitgeteilt. Die Stichprobe umfaßt 160 Männer und 189 Frauen aus den neuen<br />

Bundesländern. Damit sind die beiden Gruppen in der Stichprobe offensichtlich<br />

nicht zu gleichen Anteilen vertreten. Die relativen Häufigkeiten aus der Stichprobe<br />

werden in der Spalte Beobachteter Anteil ausgewiesen. Da die Stichprobe insgesamt<br />

349 Personen aus den neuen Ländern umfaßt, stellen die 189 Frauen einen<br />

Anteil von 54% dar. Entsprechend beträgt der Anteil der Männer 46%. Bei Gültigkeit<br />

der Nullhypothese wäre dagegen ein Anteil von jeweils 50% zu erwarten<br />

gewesen. Von diesem erwarteten Anteil können sich durch die Stichprobenbetrachtung<br />

zufällige Abweichungen ergeben. Ob sich die Abweichungen der beobachteten<br />

von den erwarteten Häufigkeiten plausibel durch Zufallseinflüsse erklären<br />

lassen und folglich mit der Nullhypothese, in der Grundgesamtheit seien beide<br />

Gruppen zu gleichen Anteilen vertreten, vereinbar sind, wird mit dem Binomial-<br />

Test untersucht. Die Wahrscheinlichkeit dafür, daß sich bei Gültigkeit der Nullhypothese<br />

mindestens so große Abweichungen ergeben wie in der vorliegenden<br />

Stichprobe, beträgt 0,134 bzw. 13,4%. Dieser Wert wird in der Spalte Asymptotische<br />

Signifikanz mitgeteilt. Der Wert läßt sich auch folgendermaßen interpretieren:<br />

Weist man die Nullhypothese, in der Grundgesamtheit seien Männer und<br />

Frauen zu gleichen Anteilen vertreten, zurück, begeht man mit einer Wahrscheinlichkeit<br />

von 13,4% einen Irrtum.<br />

V141<br />

Gruppe 1<br />

Gruppe 2<br />

Gesamt<br />

Test auf Binomialverteilung<br />

Asymptotische<br />

Beobachteter<br />

Signifikanz<br />

Kategorie N<br />

Anteil Testanteil (2-seitig)<br />

MANN 160 ,46 ,50 ,134 a<br />

FRAU 189 ,54<br />

349 1,00<br />

a. Basiert auf der Z-Approximation.<br />

Abbildung <strong>30</strong>.4: Ergebnis des Binomial-<strong>Tests</strong> für die Variable „v434“<br />

348 Um diese Einstellungen herbeizuführen, siehe die Aufzählungspunkte Fälle auswählen<br />

und Fälle nicht gewichten, S. 742.<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing


750 <strong>Kapitel</strong> <strong>30</strong> <strong>Nichtparametrische</strong> <strong>Tests</strong><br />

<strong>30</strong>.3.2 Einstellungen des Binomial-<strong>Tests</strong> bei SPSS<br />

Die Einstellungen zum Durchführen eines Binomial-<strong>Tests</strong> werden in dem Dialogfeld<br />

aus Abbildung <strong>30</strong>.5 vorgenommen. Um dieses Dialogfeld zu öffnen, wählen<br />

Sie den Befehl<br />

STATISTIK<br />

NICHTPARAMETRISCHE TESTS<br />

BINOMIAL...<br />

Abbildung <strong>30</strong>.5: Dialogfeld des Befehls STATISTIK,<br />

NICHTPARAMETRISCHE TESTS, BINOMIAL<br />

Variablen<br />

In der Variablenliste werden lediglich die numerischen Variablen der Datendatei<br />

aufgeführt. Um Textvariablen mit einem Binomial-Test zu untersuchen, müssen<br />

Sie diese daher zuvor in eine numerische Variable umcodieren.<br />

Fügen Sie die zu untersuchenden Variablen in das Feld Testvariablen ein. Wenn<br />

Sie mehr als eine Testvariable angeben, wird für jede Variable ein eigener Test<br />

durchgeführt. Per Voreinstellung wird die Hypothese untersucht, die beiden Werte<br />

der Testvariablen seien in der Grundgesamtheit mit der gleichen Häufigkeit vertreten.<br />

Sie können einen anderen Testanteil zugrunde legen (s.u., Abschnitt Testanteil),<br />

dieser gilt dann jedoch für alle Testvariablen gleichermaßen.<br />

Dichotomie definieren<br />

Sie können auch Testvariablen untersuchen, die mehr als zwei unterschiedliche<br />

Werte enthalten, diese müssen dann jedoch zu zwei Gruppen zusammengefaßt<br />

werden:<br />

¾ Aus den Daten: Behalten Sie diese voreingestellte Option bei, wenn die<br />

Testvariable nur zwei unterschiedliche Werte enthält. Es werden dann die Häufigkeiten<br />

dieser beiden Werte untersucht.<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing


<strong>30</strong>.4 Sequenzanalyse 751<br />

¾ Trennwert: Enthält die Testvariable mehr als zwei unterschiedliche Werte,<br />

wählen Sie diese Option, und geben Sie einen Trennwert an, der die Werte in<br />

zwei Gruppen unterteilt. Alle Werte, die kleiner oder gleich dem Trennwert<br />

sind, bilden die eine Gruppe, Werte über dem Trennwert werden zu der zweiten<br />

Gruppen zusammengefaßt. Der Trennwert kann insgesamt fünf Zeichen<br />

(einschließlich Dezimaltrennzeichen) umfassen. Die Gruppe mit den kleineren<br />

Werte wird als erste Gruppe angesehen. Auf diese beziehen sich die Angaben<br />

über die erwarteten und realisierten Häufigkeiten.<br />

Testanteil<br />

Per Voreinstellung wird für die beiden Werte bzw. für die Wertegruppen jeweils<br />

eine relative Häufigkeit von 0,5 erwartet. Um diese Voreinstellung zu ändern, geben<br />

Sie die erwartete Häufigkeit des ersten Wertes an. Dies ist der Wert, der in der<br />

Datendatei als erstes aufgeführt wird. Bei gruppierten Werten ist es dagegen die<br />

Gruppe mit den niedrigeren Werten. Sie können eine erwartete Häufigkeit zwischen<br />

0,001 und 0,999 angeben. Der Wert darf insgesamt nur vier Zeichen umfassen,<br />

Sie können jedoch die führende null vor dem Dezimaltrennzeichen weglassen.<br />

Optionen<br />

Die Schaltfläche Optionen öffnet das Dialogfeld aus Abbildung <strong>30</strong>.3, S. 747. Dort<br />

können Sie ergänzenden Output anfordern und den Ausschluß von Fällen mit<br />

fehlenden Werten steuern. Zur Bedeutung der Optionen siehe im einzelnen Abschnitt<br />

Optionen, S. 747.<br />

<strong>30</strong>.4 Sequenzanalyse<br />

Mit der Sequenzanalyse können Sie für eine dichotome Variable - eine Variable<br />

mit nur zwei unterschiedlichen Wertausprägungen - bzw. für eine dichotomisierte<br />

Variable testen, ob die Werte in zufälliger Reihenfolge auftreten oder ob sie ein<br />

Muster aufweisen.<br />

<strong>30</strong>.4.1 Interpretation einer Sequenzanalyse<br />

Die Erfahrung legt die Vermutung nahe, daß Sonnen- und Regentagen nicht zufällig<br />

aufeinanderfolgen. Hat es einen Tag lang geregnet, ist es nicht unplausibel,<br />

auch für den kommenden Tag eher Regen als Sonnenschein zu erwarten, sofern<br />

nicht bessere Informationen über das Wetter vorliegen. In einem fiktiven Beispiel<br />

sei das Wetter an 40 Tagen beobachtet und mit den Werten 0 (Sonnenschein) und<br />

1 (Regen) codiert worden, wobei sich die folgende Sequenz von Sonnen- und Regentagen<br />

ergeben habe:<br />

1 0 1 1 0 1 0 1 1 0 0 1 0 0 0 1 0 0 1 0 1 1 1 0 1 0 0 1 1 0 0 0 1 0 0 1 0 1 0 1<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing


752 <strong>Kapitel</strong> <strong>30</strong> <strong>Nichtparametrische</strong> <strong>Tests</strong><br />

Die Datendatei Wetter.sav von der Begleit-CD enthält lediglich eine einzige Variable,<br />

die ebenfalls den Namen wetter hat und die dargestellte Wertefolge enthält.<br />

Im folgenden soll mit einem Sequenztest untersucht werden, ob vor dem Hintergrund<br />

der (fiktiven) Beobachtungen an der Hypothese zufällig aufeinanderfolgender<br />

Sonnen- und Regentage festgehalten werden kann. Zum Durchführen des<br />

<strong>Tests</strong> werden die folgenden Einstellungen vorgenommen:<br />

¾ Befehl: Um eine Sequenzanalyse durchzuführen, wählen Sie den Befehl<br />

STATISTIK<br />

NICHTPARAMETRISCHE TESTS<br />

SEQUENZEN...<br />

¾ Einstellungen: Verschieben Sie in dem Dialogfeld Sequenzentest die Variable<br />

Wetter in das Feld Testvariablen. In der Gruppe Trennwert wird die Option<br />

Anderer gewählt und der Wert 1 in das zugehörige Eingabefeld eingegeben.<br />

Die übrigen Optionen der Gruppe Trennwert werden abgewählt. Abbildung<br />

<strong>30</strong>.7, S. 753 zeigt das Dialogfeld mit diesen Einstellungen.<br />

Als Ergebnis wird die Tabelle aus Abbildung <strong>30</strong>.6 ausgegeben. In der Zeile Testwert<br />

wird noch einmal der Wert mitgeteilt, den wir im Dialogfeld als Testwert<br />

vorgegeben haben. Die untersuchte Gesamtsequenz umfaßt 40 Werte (Gesamtzahl<br />

der Fälle), die sich in 27 Sequenzen unterteilen. Eine Sequenz in diesem Sinne ist<br />

eine Folge gleicher Werte. Die ersten fünf Werte der Gesamtsequenz lauten 1 0 1<br />

1 0 (s.o.). Diese fünf Werte bilden die vier Sequenzen 1 - 0 - 1 1 - 0. Entsprechend<br />

läßt sich die Gesamtsequenz in 27 derartige Sequenzen unterteilen.<br />

Sequenzentest<br />

Testwert a<br />

Gesamte Fälle<br />

Anzahl der Sequenzen<br />

Z<br />

Asymptotische Signifikanz<br />

(2-seitig)<br />

a. Benutzerdefiniert<br />

WETTER<br />

1<br />

40<br />

27<br />

1,783<br />

,075<br />

Abbildung <strong>30</strong>.6: Ergebnis der Sequenzanalyse<br />

Auf der Basis dieser Werte wird die Nullhypothese getestet, die Sonnen- und Regentage<br />

und damit die Werte 0 und 1 würden in der Grundgesamtheit rein zufällig<br />

aufeinanderfolgen. In der Zeile Asymptotische Signifikanz wird das Ergebnis dieses<br />

<strong>Tests</strong> mitgeteilt. Ist die Nullhypothese wahr, ergibt sich eine Folge von Sonnen-<br />

und Regentagen, wie sie in der Stichprobe vorliegt, nur mit einer Wahrscheinlichkeit<br />

von 0,075 bzw. 7,5%. Umgekehrt bedeutet dies: Weist man die<br />

Nullhypothese zurück, begeht man mit einer Wahrscheinlichkeit von 7,5% einen<br />

Fehler. Diese Wahrscheinlichkeit ist zwar sehr gering, aber vermutlich noch nicht<br />

gering genug, um die Nullhypothese tatsächlich abzulehnen.<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing


<strong>30</strong>.4 Sequenzanalyse 753<br />

Ergibt sich bei einem Test eine noch geringere Irrtumswahrscheinlichkeit, so daß<br />

die Nullhypothese zurückgewiesen wird, besagt dies noch nichts über das „wahre“<br />

Muster der untersuchten Daten, das in diesem Fall in dem tatsächlichen Zusammenhang<br />

zwischen Sonnen- und Regentagen bestehen würde. Eine geringe Irrtumswahrscheinlichkeit<br />

ergibt sich sowohl dann, wenn aufeinanderfolgende Beobachtungen<br />

häufig den gleichen Wert aufweisen, als auch in dem Fall, daß sich<br />

die Werte häufig abwechseln und damit benachbarte Beobachtungen unterschiedliche<br />

Werte enthalten.<br />

<strong>30</strong>.4.2 Einstellungen der Sequenzanalyse bei SPSS<br />

Zum Durchführen einer Sequenzanalyse dient das Dialogfeld aus Abbildung <strong>30</strong>.7.<br />

Um das Dialogfeld zu öffnen, wählen Sie den Befehl<br />

STATISTIK<br />

NICHTPARAMETRISCHE TESTS<br />

SEQUENZEN...<br />

Abbildung <strong>30</strong>.7: Dialogfeld des Befehls STATISTIK,<br />

NICHTPARAMETRISCHE TESTS, SEQUENZEN<br />

Variablen<br />

In der Variablenliste werden nur die numerischen Variablen der Datendatei aufgeführt.<br />

Textvariablen können Sie mit einer Sequenzanalyse daher nicht untersuchen,<br />

ohne sie zuvor in eine numerische Variable umzucodieren.<br />

Verschieben Sie die Variablen, für die eine Sequenzanalyse durchgeführt werden<br />

soll, in das Feld Testvariablen. Wenn Sie mehr als eine Testvariable angeben,<br />

wird für jede Variable ein eigener Test durchgeführt, die Ergebnisse werden jedoch<br />

gemeinsam in einer Pivot-Tabelle dargestellt.<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing


754 <strong>Kapitel</strong> <strong>30</strong> <strong>Nichtparametrische</strong> <strong>Tests</strong><br />

Trennwert<br />

Sie können mit der Sequenzanalyse auch Variablen untersuchen, die mehr als zwei<br />

unterschiedliche Werte enthalten. In diesem Fall müssen die Werte jedoch dichotomisiert,<br />

also in zwei Gruppen zusammengefaßt werden. Anstatt der Folge einzelner<br />

Werte wird dann die Folge der Gruppenzugehörigkeiten untersucht.<br />

Um die Werte zu dichotomisieren, müssen Sie einen Trennwert angeben. Alle<br />

Werte der Variablen, die größer oder gleich dem Trennwert sind, werden dann zu<br />

einer Gruppe zusammengefaßt, alle Werte, die kleiner sind als der Trennwert, bilden<br />

die zweite Gruppe. Die Angabe eines Trennwertes ist auch dann erforderlich,<br />

wenn die Variable ohnehin nur zwei unterschiedliche Werte enthält.<br />

Die folgenden vier Optionen stehen zur Verfügung, um den Trennwert zu definieren.<br />

Die Optionen schließen sich nicht gegenseitig aus. Wenn Sie mehr als eine<br />

Option ankreuzen, wird für jeden Trennwert ein eigener Sequenztest durchgeführt.<br />

¾ Median: Das 50%-Perzentil der Variablen bildet den Trennwert.<br />

¾ Modalwert: Der Modus, also der am häufigsten in der Variable vorkommende<br />

Wert, wird als Trennwert verwendet.<br />

¾ Mittelwert: Das arithmetische Mittel der Variablen bildet den Trennwert.<br />

¾ Anderer: Mit dieser Option können Sie den Trennwert frei festlegen, indem<br />

Sie ihn in das zugehörige Eingabefeld schreiben. Der Wert kann bis zu fünf<br />

Zeichen umfassen, zu denen auch ein eventuelles Dezimaltrennzeichen zählt.<br />

Diese Option können Sie auch verwenden, wenn die Variable ohnehin nur<br />

zwei unterschiedliche Werte enthält. Legen Sie dann den größeren der beiden<br />

Werte als Trennwert fest.<br />

Optionen<br />

Die Schaltfläche Optionen öffnet das Dialogfeld aus Abbildung <strong>30</strong>.3, S. 747. Dort<br />

können Sie ergänzenden Output anfordern und den Ausschluß von Fällen mit<br />

fehlenden Werten steuern. Zur Bedeutung der Optionen siehe im einzelnen Abschnitt<br />

Optionen, S. 747.<br />

<strong>30</strong>.5 Ein-Stichproben-Kolmogorov-Smirnov-Test<br />

Mit dem Kolmogorov-Smirnov-Test können Sie überprüfen, ob die Werte einer<br />

Variablen einer theoretischen Verteilung folgen. Dabei können Sie den Test für<br />

eine Normal-, Poisson-, Gleich- oder Exponentialverteilung durchführen.<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing


<strong>30</strong>.5 Ein-Stichproben-Kolmogorov-Smirnov-Test 755<br />

<strong>30</strong>.5.1 Interpretation des Ein-Stichproben-Kolmogorov-<br />

Smirnov-<strong>Tests</strong><br />

In der Datendatei allbus.sav mit den Ergebnissen der Bevölkerungsbefragung ist<br />

unter anderem in der Variablen v338 die Dauer des Interviews in Minuten angegeben.<br />

Im folgenden soll mit dem Kolmogorov-Smirnov-Test untersucht werden, ob<br />

die Annahme, die Dauer des Interviews folge einer Normalverteilung, vor dem<br />

Hintergrund der Beobachtungen aus der Stichprobe aufrechterhalten werden kann.<br />

¾ Daten: Die Daten entstammen der Datei allbus.sav. Im folgenden sollen nur<br />

die Personen aus den neuen Bundesländern betrachtet werden. Damit entfällt<br />

auch Notwendigkeit zur Gewichtung der Daten. 349<br />

¾ Kolmogorov-Smirnov-Test aufrufen: Um den Test aufzurufen, wählen Sie<br />

den Befehl<br />

STATISTIK<br />

NICHTPARAMETRISCHE TESTS<br />

K-S BEI EINER STICHPROBE...<br />

¾ Einstellungen: Fügen Sie in dem Dialogfeld der Prozedur die Variable v338 in<br />

das Feld Testvariablen ein. Bei den übrigen Optionen werden die Voreinstellungen<br />

verwendet. Abbildung <strong>30</strong>.9, S. 756 zeigt die für dieses Beispiel verwendeten<br />

Einstellungen.<br />

Die Ergebnisse des <strong>Tests</strong> werden in Abbildung <strong>30</strong>.8 dargestellt. Der Test wird anhand<br />

der größten (absoluten) Abweichung der empirischen von der theoretischen<br />

Verteilung durchgeführt. Die größte absolute, die größte positive und die größte<br />

negative Abweichung der beiden Verteilungen voneinander werden als Extremste<br />

Differenzen in der Tabelle ausgewiesen. Zudem werden die Parameter der Normalverteilung<br />

angegeben, mit der die empirische Verteilung verglichen wird. Die<br />

Parameter einer Normalverteilung sind der Mittelwert und die Standardabweichung.<br />

Die ausgewiesenen Werte von 59,26 bzw. 19,41 entsprechen den Werten<br />

der Variablen v338 in der betrachteten Stichprobe. Die durchgeführten Interviews<br />

dauerten in den neuen Bundesländern somit im Durchschnitt 59,26 Minuten.<br />

Das eigentliche Ergebnis des <strong>Tests</strong> wird in der untersten Zeile mit der Beschriftung<br />

Asymptotische Signifikanz angegeben. Dies ist die Irrtumswahrscheinlichkeit,<br />

die mit einem Zurückweisen der Nullhypothese verbunden ist. Die getestete Nullhypothese<br />

besagt, daß die Dauer des Interviews in der Grundgesamtheit einer<br />

Normalverteilung folgt. Die Wahrscheinlichkeit für das Zutreffen der Hypothese<br />

wird mit 0,000 angegeben. Die Nullhypothese kann damit zurückgewiesen werden.<br />

Trotz dieser geringen Irrtumswahrscheinlichkeit ist es möglich, daß die Werte in<br />

der Grundgesamtheit annähernd normalverteilt sind. Dies genügt bereits als Voraussetzung<br />

für viele statistische Prozeduren. Um einen Eindruck von der Ähnlich-<br />

349 Um diese Einstellungen herbeizuführen, siehe die Aufzählungspunkte Fälle auswählen<br />

und Fälle nicht gewichten, S. 742.<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing


756 <strong>Kapitel</strong> <strong>30</strong> <strong>Nichtparametrische</strong> <strong>Tests</strong><br />

keit der empirischen Verteilung mit der Normalverteilung zu gewinnen, kann zum<br />

Beispiel ein Histogramm mit Normalverteilungskurve erstellt werden.<br />

Kolmogorov-Smirnov-Anpassungstest<br />

N<br />

Parameter der Normalverteilung a,b<br />

Extremste Differenzen<br />

Kolmogorov-Smirnov-Z<br />

Asymptotische Signifikanz (2-seitig)<br />

Mittelwert<br />

Standardabweichung<br />

Absolut<br />

Positiv<br />

Negativ<br />

V338<br />

348<br />

59,26<br />

19,41<br />

,126<br />

,126<br />

-,074<br />

2,344<br />

,000<br />

a. Die zu testende Verteilung ist eine Normalverteilung.<br />

b. Aus den Daten berechnet.<br />

Abbildung <strong>30</strong>.8: Ergebnis des Kolmogorov-Smirnov-<strong>Tests</strong> für<br />

die Variable „v338“ zum Testen auf eine Normalverteilung<br />

<strong>30</strong>.5.2 Einstellungen des Kolmogorov-Smirnov-<strong>Tests</strong> bei SPSS<br />

Um einen Kolmogorov-Smirnov-Test bei einer Stichprobe durchzuführen, wählen<br />

Sie den folgenden Befehl, der das Dialogfeld aus Abbildung <strong>30</strong>.9 öffnet:<br />

STATISTIK<br />

NICHTPARAMETRISCHE TESTS<br />

K-S BEI EINER STICHPROBE...<br />

Abbildung <strong>30</strong>.9: Dialogfeld des Befehls STATISTIK, NICHTPARA-<br />

METRISCHE TESTS, K-S BEI EINER STICHPROBE<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing


<strong>30</strong>.6 <strong>Tests</strong> für zwei unabhängige Stichproben 757<br />

Variablen<br />

In der Variablenliste werden nur die numerischen Variablen der Datendatei aufgeführt,<br />

denn der Kolmogorov-Smirnov-Test ist nur für Variablen mit Intervallskalenniveau<br />

sinnvoll durchzuführen. Verschieben Sie die zu testenden Variablen in<br />

das Feld Testvariablen. Wenn Sie hier mehr als eine Variablen angeben, wird für<br />

jede Variable ein eigenständiger Test durchgeführt.<br />

Testverteilung<br />

Per Voreinstellung wird ein Test auf Normalverteilung durchgeführt, es stehen jedoch<br />

die folgenden vier Verteilungen zur Verfügung:<br />

¾ Normalverteilung: Testet auf eine Normalverteilung mit dem Mittelwert und<br />

der Standardabweichung der Stichprobe.<br />

¾ Gleichverteilung: Testet auf eine Gleichverteilung über den gesamten Wertebereich<br />

der Testvariablen.<br />

¾ Poissonverteilung: Testet auf eine Poissonverteilung mit dem Mittelwert der<br />

Stichprobe.<br />

¾ Exponentialverteilung: Testet auf eine Exponentialverteilung mit dem Mittelwert<br />

der Stichprobe.<br />

Optionen<br />

Die Schaltfläche Optionen öffnet das Dialogfeld aus Abbildung <strong>30</strong>.3, S. 747. Dort<br />

können Sie ergänzenden Output anfordern und den Ausschluß von Fällen mit<br />

fehlenden Werten steuern. Zur Bedeutung der Optionen siehe im einzelnen Abschnitt<br />

Optionen, S. 747.<br />

<strong>30</strong>.6 <strong>Tests</strong> für zwei unabhängige Stichproben<br />

Insgesamt stehen vier <strong>Tests</strong> zum Vergleichen zweier unabhängiger Stichproben<br />

zur Verfügung. 350 Mit dem Mann-Whitney-Test, dem Kolmogorov-Smirnov-Test<br />

und dem Wald-Wolfowitz-Test überprüfen Sie jeweils die Hypothese, die beiden<br />

Stichproben würden derselben Grundgesamtheit entstammen. Der Moses-Test<br />

vergleicht dagegen die Spannweite der beiden Stichproben. Er testet die Hypothese,<br />

die Spannweite sei in beiden Stichproben gleich groß. Der Kolmogorov-<br />

Smirnov-Test setzt intervallskalierte Variablen voraus, für die drei übrigen <strong>Tests</strong><br />

ist Ordinalskalenniveau ausreichend.<br />

350 Zum Begriff von unabhängigen und abhängigen Stichproben siehe <strong>Kapitel</strong> 19, T-Test.<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing


758 <strong>Kapitel</strong> <strong>30</strong> <strong>Nichtparametrische</strong> <strong>Tests</strong><br />

<strong>30</strong>.6.1 Interpretation der Testergebnisse<br />

In den Befragungsdaten der allbus-Datei von der Begleit-CD sind unter anderem<br />

das Nettoeinkommen (Variable v261) und das Geschlecht der Befragten (v141)<br />

angegeben. Im folgenden soll untersucht werden, ob sich die Einkommensangaben<br />

von Männern und Frauen so ähnlich sind, daß auf eine einheitliche Grundgesamtheit<br />

geschlossen werden kann, oder ob von zwei unterschiedlichen Grundgesamtheiten<br />

auszugehen ist.<br />

Mann-Whitney-Test<br />

Der Mann-Whitney-Test für die beschriebene Fragestellung wird folgendermaßen<br />

angefordert:<br />

¾ Daten: Die Daten entstammen der Datei allbus.sav. Im folgenden sollen nur<br />

die Personen aus den neuen Bundesländern betrachtet werden. Damit entfällt<br />

auch die Notwendigkeit zur Gewichtung der Daten. 351<br />

¾ Test für zwei unabhängige Stichproben aufrufen: Um den Test aufzurufen,<br />

wählen Sie den Befehl<br />

STATISTIK<br />

NICHTPARAMETRISCHE TESTS<br />

ZWEI UNABHÄNGIGE STICHPROBEN...<br />

¾ Einstellungen: Fügen Sie in dem Dialogfeld der Prozedur die Variablen v261<br />

in das Feld Testvariablen und v141 in das Feld Gruppenvariable ein. Klicken<br />

Sie anschließend auf die Schaltfläche Gruppen definieren, 352 und geben Sie in<br />

dem damit geöffneten Dialogfeld die Werte 1 und 2 in die beiden Eingabefelder<br />

ein.<br />

Bei allen anderen Optionen werden die Voreinstellungen verwendet. Dies bedeutet<br />

insbesondere, daß in der Gruppe Welche <strong>Tests</strong> durchführen? die Option<br />

Mann-Whitney-U-Test angekreuzt bleibt. Diese Einstellungen, die in dem<br />

Dialogfeld in Abbildung <strong>30</strong>.12 auf S. 762 dargestellt sind, liefern den Output<br />

aus Abbildung <strong>30</strong>.10.<br />

Bei einem Mann-Whitney-Test werden die Werte der beiden Gruppen zunächst zu<br />

einer Gruppe zusammengefaßt und in aufsteigender Folge geordnet. Jedem der<br />

Werte wird seiner Position in der Ordnung entsprechend ein Rang zugewiesen.<br />

Anschließend wird für die beiden Gruppen getrennt die Summe der Rangwerte<br />

berechnet. Anhand der beiden sich dabei ergebenden Summen wird die Hypothese<br />

getestet, die beiden Stichproben würden der gleichen Grundgesamtheit entstammen.<br />

Trifft die Hypothese zu, sollten die Werte der beiden Gruppen in der zu Be-<br />

351 In den Aufzählungspunkten Fälle auswählen und Fälle nicht gewichten, S. 742 wird beschrieben,<br />

wie Sie diese Einstellungen in der Datendatei herbeiführen können.<br />

352 Diese Schaltfläche ist nur aktiv, wenn bereits eine Gruppenvariable ausgewählt wurde<br />

und diese aktuell markiert ist.<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing


<strong>30</strong>.6 <strong>Tests</strong> für zwei unabhängige Stichproben 759<br />

ginn gebildeten Reihenfolge in etwa gleichmäßig verteilt sein, die durchschnittlichen<br />

Ränge beider Gruppen sollten also ungefähr die gleiche Größe haben.<br />

Ränge<br />

V261<br />

V141<br />

MANN<br />

FRAU<br />

Gesamt<br />

Mittlerer<br />

N Rang Rangsumme<br />

95 121,37 115<strong>30</strong>,00<br />

109 86,06 9380,00<br />

204<br />

Statistik für Test a 3385,000<br />

Mann-Whitney-U<br />

Wilcoxon-W<br />

Z<br />

Asymptotische Signifikanz<br />

(2-seitig)<br />

a. Gruppenvariable: V141<br />

V261<br />

9380,000<br />

-4,266<br />

,000<br />

Abbildung <strong>30</strong>.10: Ergebnis des Mann-Whitney-<strong>Tests</strong> für zwei unabhängige Stichproben<br />

Der durchschnittliche Rang (Mittlerer Rang) für das Einkommen der Frauen liegt<br />

mit 86,06 deutlich unter dem mittleren Rang von 121,37, der sich für das Einkommen<br />

der Männer ergeben hat. Dies deutet bereits darauf hin, daß die Nullhypothese<br />

falsch ist und die beiden Stichproben nicht der gleichen Grundgesamtheit<br />

entstammen. Selbst wenn sich sehr ähnliche mittlere Rangwerte ergeben hätten,<br />

könnte daraus jedoch noch nicht geschlossen werden, daß die Stichproben aus der<br />

gleichen Grundgesamtheit stammen. Es wäre beispielsweise denkbar, daß Männer<br />

entweder sehr hohe oder sehr niedrige Einkommen erzielen, während Frauen<br />

überwiegend im mittleren Bereich der Einkommensverteilung anzutreffen sind. In<br />

diesem Fall würden die durchschnittlichen Rangwerte bei Männern und Frauen<br />

ungefähr gleich groß sein, obwohl die tatsächliche Verteilung der Werte sehr unterschiedlich<br />

wäre und die beiden Gruppen nicht der gleichen Grundgesamtheit<br />

zugeordnet werden könnten. Aus diesem Grund wird neben den durchschnittlichen<br />

Rangwerten zusätzlich untersucht, wie häufig ein Wert der ersten Gruppe einem<br />

der zweiten Gruppe vorausgeht bzw. wie häufig ein Wert der zweiten Gruppe vor<br />

einem der ersten Gruppe angeordnet ist. Die geringere der beiden Häufigkeiten<br />

wird in der rechten Tabelle in der Zeile mit der Beschriftung Mann-Whitney-U angegeben.<br />

Bei der Berechnung wird für jeden Wert der zweiten Gruppe die Anzahl<br />

der Werte aus der ersten Gruppe gezählt, die einen niedrigeren Rang haben. Die so<br />

gezählten Werte werden addiert, so daß jeder Wert der ersten Gruppe mehrmals in<br />

die Zählung eingehen kann.<br />

Beispiel: Bei den vier Werten, die in geordneter Form den beiden Gruppen in der<br />

Reihenfolge 1 2 1 2 zuzuordnen sind, gehen drei Werte aus der Gruppe 1 der<br />

Gruppe 2 voraus, da der ersten 2 ein Wert der ersten Gruppe und der zweiten 2<br />

zwei Werte der ersten Gruppe vorausgehen. Umgekehrt geht nur ein Wert der<br />

zweiten Gruppe den Werten der ersten Gruppe voraus. In der Zeile mit der Beschriftung<br />

Wilcoxon-W wird zusätzlich die Summe der Ränge angegeben, die sich<br />

für die Gruppe mit der geringeren Fallzahl ergibt, bei diesem Test also für die<br />

Gruppe der Frauen.<br />

Anhand dieser Werte wird eine Signifikanz für die Nullhypothese berechnet. Für<br />

dieses Beispiel wird der Signifikanzwert mit 0,000 angegeben und ist damit kleiner<br />

als 0,0005. Bei einer derart niedrigen Irrtumswahrscheinlichkeit kann die<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing


760 <strong>Kapitel</strong> <strong>30</strong> <strong>Nichtparametrische</strong> <strong>Tests</strong><br />

Nullhypothese, die Einkommensangaben von Männern und Frauen würden der<br />

gleichen Grundgesamtheit entstammen, zurückgewiesen werden.<br />

Moses-Test<br />

Um die Spannweite der Einkommensangaben von Männern und Frauen aus den<br />

neuen Bundesländern zu vergleichen, kann mit einem Moses-Test die Nullhypothese<br />

getestet werden, nach der die Spannweiten beider Stichproben in der Grundgesamtheit<br />

gleich sind. Um einen solchen Test durchzuführen, können Sie die<br />

oben (S. 758) beschriebenen Einstellungen verwenden. Sie müssen lediglich im<br />

Hauptdialogfeld der Prozedur die Option Extremreaktionen nach Moses aus der<br />

Gruppe Welche <strong>Tests</strong> durchführen? ankreuzen. Die Ergebnisse dieses <strong>Tests</strong> sind in<br />

Abbildung <strong>30</strong>.11 wiedergegeben.<br />

Häufigkeiten<br />

V261<br />

V141<br />

MANN (Kontrolle)<br />

FRAU (Experimentell)<br />

Gesamt<br />

N<br />

95<br />

109<br />

204<br />

Statistik für Test a,b 203<br />

Beobachtete Spannweite der<br />

Kontrollgruppe<br />

Spannweite der getrimmten<br />

Kontrollgruppe<br />

Ausreißer an beiden Enden entfernt<br />

a. Moses-Test<br />

b. Gruppenvariable: V141<br />

Signifikanz (1-seitig)<br />

Signifikanz (1-seitig)<br />

V261<br />

,784<br />

179<br />

,136<br />

4<br />

Abbildung <strong>30</strong>.11: Ergebnisse eines Moses-<strong>Tests</strong> für zwei unabhängige Stichproben<br />

In der oberen Tabelle wird lediglich die Anzahl der Fälle für die beiden Gruppen<br />

mitgeteilt. Der Moses-Test verwendet eine der beiden Gruppen als Kontrollgruppe.<br />

Wie aus der oberen Tabelle hervorgeht, ist dies in diesem Fall die Gruppe der<br />

Männer. Die Werte beider Gruppen werden gemeinsam geordnet und der Ordnung<br />

entsprechend mit Rangwerten versehen. Für die Kontrollgruppe wird die Spannweite<br />

der Rangwerte als Differenz zwischen dem größten und dem kleinsten Rang<br />

berechnet. Diese Spannweite wird in der unteren Tabelle in der Zeile Beobachtete<br />

Spannweite der Kontrollgruppe mit 203 angegeben. Bei einer Gesamtstichprobe<br />

von 204 Fällen bedeutet dies, daß entweder der größte und der zweitkleinste oder<br />

umgekehrt der zweitgrößte sowie der kleinste Rang einem Wert der Kontrollgruppe<br />

zugeordnet wurde. 353<br />

353 Die Spannweite wird beim Moses-Test von SPSS berechnet als Höchster Rang – Niedrigster<br />

Rang + 1 und nicht, wie erwartet werden könnte, als Höchster Rang – Niedrigster Rang.<br />

Die größte erreichbare Spannweite entspricht damit der Anzahl der Beobachtungen.<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing


<strong>30</strong>.6 <strong>Tests</strong> für zwei unabhängige Stichproben 761<br />

Die Wahrscheinlichkeit dafür, daß sich eine solche Spannweite für die Kontrollgruppe<br />

ergibt, wenn die beiden Stichproben (Männer und Frauen) in der Grundgesamtheit<br />

die gleiche Spannweite aufweisen, beträgt 78,4%. Dieser Wert wird in<br />

der Zeile Signifikanz (1-seitig) für die Beobachtete Spannweite der Kontrollgruppe<br />

angegeben. Bei einer derart hohen Irrtumswahrscheinlichkeit kann die Nullhypothese<br />

nicht zurückgewiesen werden. Aus der Stichprobe ergibt sich somit kein<br />

Hinweis darauf, daß die Einkommenswerte von Männern und Frauen in der<br />

Grundgesamtheit eine unterschiedliche Spannweite aufweisen.<br />

Bei der Betrachtung von Spannweiten können die Ergebnisse leicht durch einzelne<br />

Ausreißer verzerrt werden. Aus diesem Grund wird ein zweiter Signifikanzwert<br />

mitgeteilt, der sich auf eine getrimmte Kontrollgruppe bezieht, also auf eine Kontrollgruppe,<br />

aus der einige Ausreißer entfernt wurden. In der untersten Zeile der<br />

Tabelle wird angegeben, daß an jedem Ende der gesamten Rangordnung (die sowohl<br />

Männer als auch Frauen umfaßt) vier Werte entfernt wurden. Damit verringert<br />

sich die Fallzahl der Gesamtstichprobe um 8 auf 196. Die Spannweite der<br />

Kontrollgruppe hat sich dabei jedoch wesentlich stärker verringert, und zwar um<br />

24 auf 179. Dieser Wert wird als Spannweite der getrimmten Kontrollgruppe ausgewiesen.<br />

Die Wahrscheinlichkeit für das Eintreten einer Spannweite dieser Größe<br />

beträgt bei Gültigkeit der Nullhypothese nur noch 13,6%. Unter Ausschluß der<br />

extremen Werte kann die Nullhypothese damit bei weitem nicht so deutlich bestätigt<br />

werden wie bei Einbeziehung der Ausreißer, allerdings läßt sich die Nullhypothese<br />

auch bei einer Irrtumswahrscheinlichkeit von 13,6% nicht zurückweisen.<br />

<strong>30</strong>.6.2 Einstellungen der <strong>Tests</strong> für zwei unabhängige Stichproben<br />

bei SPSS<br />

Um nichtparametrische <strong>Tests</strong> für zwei unabhängige Stichproben durchzuführen,<br />

öffnen Sie mit dem folgenden Befehl das Dialogfeld aus Abbildung <strong>30</strong>.12:<br />

STATISTIK<br />

NICHTPARAMETRISCHE TESTS<br />

ZWEI UNABHÄNGIGE STICHPROBEN...<br />

In der Variablenliste werden nur die numerischen Variablen der Datendatei aufgeführt.<br />

Textvariablen können weder als Test- noch als Gruppenvariable verwendet<br />

werden, obwohl die Gruppenvariable lediglich Nominalskalenniveau besitzen<br />

muß. Um einen oder mehrere der <strong>Tests</strong> durchzuführen, gehen Sie folgendermaßen<br />

vor:<br />

¾ Testvariablen: Geben Sie die Testvariablen in dem gleichnamigen Feld an.<br />

Für jede der angegebenen Variablen werden alle angeforderten <strong>Tests</strong> berechnet.<br />

Die Testvariablen müssen mindestens Ordinalskalenniveau besitzen, für<br />

die Durchführung eines Kolmogorov-Smirnov-<strong>Tests</strong> ist sogar Intervallskalenniveau<br />

erforderlich.<br />

¾ Gruppierungsvariablen: Verschieben Sie eine Gruppierungsvariable in das<br />

Feld Gruppenvariable. Zusätzlich müssen für diese Variable zwei Werte ange-<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing


762 <strong>Kapitel</strong> <strong>30</strong> <strong>Nichtparametrische</strong> <strong>Tests</strong><br />

geben werden, die die beiden zu vergleichenden Gruppen (Stichproben) definieren<br />

(s.u.).<br />

¾ <strong>Tests</strong>: Kreuzen Sie die durchzuführenden <strong>Tests</strong> an.<br />

¾ Optionen: Sie können ergänzende Maßzahlen für die Testvariablen anfordern<br />

und den Ausschluß von fehlenden Werten regeln.<br />

Abbildung <strong>30</strong>.12: Dialogfeld des Befehls STATISTIK, NICHTPARA-<br />

METRISCHE TESTS, ZWEI UNABHÄNGIGE STICHPROBEN<br />

Gruppierungsvariable<br />

Geben Sie eine Gruppierungsvariable an, anhand derer aus den Fällen der Stichprobe<br />

zwei Gruppen gebildet werden sollen. Zur Gruppenbildung müssen zwei<br />

Werte der Variablen angegeben werden. Fälle, die keinen der angegebenen Werte<br />

in der Gruppierungsvariable enthalten, werden von den <strong>Tests</strong> ausgeschlossen. Von<br />

den übrigen Fällen bilden jeweils die Fälle mit den gleichen Werten in der Gruppierungsvariable<br />

eine Gruppe.<br />

Um die Gruppen zu definieren, verschieben Sie die gruppierende Variable in das<br />

Feld Gruppenvariable, und klicken Sie anschließend auf die Schaltfläche Gruppen<br />

definieren. Diese Schaltfläche ist nur aktiv, wenn die Variable in dem Feld<br />

Gruppenvariable ausgewählt ist. Hierzu müssen Sie die Variable ggf. einmal mit<br />

der Maus anklicken. Die Schaltfläche öffnet das Dialogfeld aus Abbildung <strong>30</strong>.13.<br />

Abbildung <strong>30</strong>.13: Dialogfeld der Schaltfläche „Gruppen definieren“<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing


<strong>30</strong>.6 <strong>Tests</strong> für zwei unabhängige Stichproben 763<br />

Geben Sie zwei ganzzahlige Werte zur Gruppenbildung an. Fälle, die keinen der<br />

angegebenen Werte aufweisen, werden in den <strong>Tests</strong> nicht berücksichtigt. Werte<br />

mit Dezimalstellen werden auch nicht gerundet oder abgeschnitten. In den Gruppen<br />

1 und 2 ist der Wert 1,4 also nicht enthalten. Die Gruppe des ersten Wertes<br />

wird in dem Moses-Test als Kontrollgruppe verwendet. In dem Mann-Whitney-<br />

Test bezieht sich der Wert W auf diese Gruppe, sofern beide Gruppen die gleiche<br />

Anzahl von Fällen umfassen.<br />

Welche <strong>Tests</strong> durchführen?<br />

Per Voreinstellung wird nur der Mann-Whitney-Test durchgeführt, es stehen jedoch<br />

die folgende vier <strong>Tests</strong> zur Verfügung:<br />

¾ Mann-Whitney-U-Test: Nullhypothese: Beide Stichproben entstammen der<br />

gleichen Grundgesamtheit. Die Werte beider Gruppen werden gemeinsam in<br />

aufsteigender Folge der Werte geordnet und mit Rangwerten versehen. Aus<br />

dieser Reihenfolge wird der Wert U berechnet, der angibt, wie häufig der Wert<br />

einer Gruppe einem Wert der anderen Gruppe vorausgeht. Zusätzlich wird<br />

Wilcoxons W berechnet. Dies ist die Summe der Ränge für die Gruppe mit geringerer<br />

Fallzahl. Für diese Werte wird die zweiseitige Wahrscheinlichkeit als<br />

Fehlerwahrscheinlichkeit für die Nullhypothese berechnet. Zusätzlich werden<br />

die mittleren Ränge beider Stichproben sowie die Anzahl der Fälle in den<br />

Gruppen angegeben. Für ein Beispiel siehe oben Mann-Whitney-Test, S. 758.<br />

¾ Kolmogorov-Smirnov-Z: Nullhypothese: Beide Stichproben entstammen der<br />

gleichen Grundgesamtheit. Dieser Test vergleicht die Verteilungen der beiden<br />

Stichproben miteinander. Er reagiert empfindlich auf Unterschiede in Median,<br />

Schiefe u.a. Dieser Test erfordert Intervallskalenniveau der Testvariablen. Im<br />

Output werden die Fallzahlen der Gruppen, die größten negativen, positiven<br />

und absoluten Differenzen, der Kolmogorov-Smirnov-Z-Wert sowie die zweiseitige<br />

Wahrscheinlichkeit mitgeteilt.<br />

¾ Extremreaktionen nach Moses: Nullhypothese: Die Spannweite der Werte ist<br />

in beiden Gruppen gleich groß. Die Werte beider Gruppen werden in eine gemeinsame<br />

Reihenfolge gebracht. Anschließend werden ihnen Rangwerte zugewiesen.<br />

Eine der Gruppen (die Gruppe des Wertes, der in dem Dialogfeld<br />

Gruppen definieren als erstes angegeben ist) wird als Kontrollgruppe verwendet.<br />

Für diese Gruppe wird die Spannweite der Ränge als Differenz zwischen<br />

dem größten und kleinsten Rangwert berechnet. Anhand dieser Spannweite errechnet<br />

sich die einseitige Signifikanz. Zusätzlich wird der Test ein zweites<br />

Mal durchgeführt, wobei die Ausreißer der Gesamtstichprobe ausgeschlossen<br />

werden (insgesamt 5% der Fälle). Dabei werden sowohl die höchsten als auch<br />

die niedrigsten Ränge entfernt. Das Testergebnis teilt die Anzahl der Fälle beider<br />

Gruppen, die Spannweiten und die entsprechenden einseitigen Signifikanzen<br />

für beide <strong>Tests</strong> (mit und ohne Ausreißer) mit. Für ein Beispiel siehe oben<br />

Abschnitt Moses-Test, S. 760.<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing


764 <strong>Kapitel</strong> <strong>30</strong> <strong>Nichtparametrische</strong> <strong>Tests</strong><br />

¾ Wald-Wolfowitz-Sequenzen: Nullhypothese: Beide Stichproben entstammen<br />

der gleichen Grundgesamtheit. Die Werte beider Gruppen werden in eine gemeinsame<br />

Reihenfolge gebracht. Für diese Werte wird eine Sequenzanalyse<br />

für die Gruppenzugehörigkeit durchgeführt. Im Output angegeben wird die<br />

Anzahl der Fälle in beiden Gruppen, die Zahl der Sequenzen in der Rangfolge,<br />

der Z-Wert und die entsprechende Signifikanz. Außerdem wird die Zahl der<br />

Rangbindungen ausgewiesen. Sind in der Rangfolge verbundene Fälle enthalten,<br />

werden die Höchst- und Mindestzahl der möglichen Sequenzen angegeben.<br />

Für beide werden der Z-Wert und die einseitige Signifikanz mitgeteilt.<br />

Optionen<br />

Die Schaltfläche Optionen öffnet das Dialogfeld aus Abbildung <strong>30</strong>.3, S. 747. Dort<br />

können Sie ergänzenden Output anfordern und den Ausschluß von Fällen mit<br />

fehlenden Werten steuern. Zur Bedeutung der Optionen siehe im einzelnen Abschnitt<br />

Optionen, S. 747.<br />

<strong>30</strong>.7 <strong>Tests</strong> für mehrere unabhängige Stichproben<br />

Zum Vergleich mehrerer unabhängiger Stichproben stehen zwei <strong>Tests</strong> zur Verfügung,<br />

der Kruskal-Wallis-Test und der Median-Test. Beide <strong>Tests</strong> vergleichen die<br />

Werte einer Variablen in verschiedenen Fallgruppen der Datendatei miteinander.<br />

Jede Fallgruppe bildet im Sinne der <strong>Tests</strong> eine unabhängige Stichprobe. Die Fallgruppen<br />

werden dabei mit Hilfe einer gruppierenden (kategorialen) Variablen aus<br />

der Datendatei definiert.<br />

Der Median-Test untersucht, ob die verschiedenen Stichproben in der Grundgesamtheit<br />

den gleichen Median aufweisen. Er entspricht insofern einem T-Test, der<br />

einen Vergleich der Mittelwerte verschiedener Stichproben durchführt. Der Kruskal-Wallis-Test<br />

erstellt eine gemeinsame Rangfolge aller Werte der verschiedenen<br />

Stichproben und testet anschließend die Nullhypothese, die mittleren Rangzahlen<br />

in den einzelnen Gruppen seien gleich. Für beide <strong>Tests</strong> müssen die Testvariablen<br />

mindestens Ordinalskalenniveau aufweisen.<br />

<strong>30</strong>.7.1 Interpretation der Testergebnisse<br />

Beispiel<br />

Im Rahmen der ALLBUS-Umfrage wurde den Befragten unter anderem der in<br />

Abbildung <strong>30</strong>.14 wiedergegebene Fragetext mit den ebenfalls aufgeführt Antwortkategorien<br />

vorgelegt. Im folgenden soll untersucht werden, ob sich die Antworten<br />

von Befragten mit unterschiedlichem allgemeinen Schulabschluß bei dieser<br />

Frage unterscheiden. Hierzu werden sowohl ein Median-Test als auch ein<br />

Kruskal-Wallis-Test durchgeführt.<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing


<strong>30</strong>.7 <strong>Tests</strong> für mehrere unabhängige Stichproben 765<br />

Im Vergleich dazu, wie andere hier in Deutschland leben: Glauben Sie, daß Sie Ihren<br />

gerechten Anteil erhalten, mehr als Ihren gerechten Anteil, etwas weniger oder sehr<br />

viel weniger?<br />

‰ 1 Sehr viel weniger<br />

‰ 2 Etwas weniger<br />

‰ 3 Gerechten Anteil<br />

‰ 4 Mehr als den gerechten Anteil<br />

Abbildung <strong>30</strong>.14: Fragetext und Antwortkategorien für die Variable „v<strong>30</strong>“<br />

Die <strong>Tests</strong> zur Untersuchung der beschriebenen Fragestellungen fordern Sie mit<br />

den folgenden Einstellungen an:<br />

¾ Daten: Die Daten entstammen der Datei allbus.sav. Im folgenden sollen nur<br />

die Personen aus den neuen Bundesländern betrachtet werden. Damit entfällt<br />

auch die Notwendigkeit zur Gewichtung der Daten. 354<br />

¾ Test für mehrere unabhängige Stichproben aufrufen: Um den Test aufzurufen,<br />

wählen Sie den Befehl<br />

STATISTIK<br />

NICHTPARAMETRISCHE TESTS<br />

K UNABHÄNGIGE STICHPROBEN...<br />

¾ Einstellungen: Fügen Sie in dem Dialogfeld der Prozedur die Variablen v<strong>30</strong><br />

(Gerechter Anteil am Lebensstandard?) in das Feld Testvariablen und bildung<br />

(Allgemeiner Schulabschluß) in das Feld Gruppenvariable ein. Klicken Sie<br />

anschließend auf die Schaltfläche Gruppen definieren, 355 und geben Sie in dem<br />

damit geöffneten Dialogfeld den Wert 1 als Minimum und den Wert 3 als Maximum<br />

an.<br />

Da im folgenden sowohl der Median-Test als auch der Kruskal-Wallis-Test<br />

betrachtet werden sollen, werden in der Gruppe Welche <strong>Tests</strong> durchführen? im<br />

Hauptdialogfeld beide Optionen angekreuzt. Die beschriebenen Einstellungen<br />

sind in dem Dialogfeld in Abbildung <strong>30</strong>.17, S. 768 dargestellt und liefern den<br />

Output aus den Abbildung <strong>30</strong>.15 und <strong>30</strong>.16.<br />

Kruskal-Wallis-Test<br />

Die Ergebnisse des Kruskal-Wallis-<strong>Tests</strong> sind in Abbildung <strong>30</strong>.15 dargestellt. Die<br />

Variable bildung unterscheidet zwischen drei allgemeinen Schulabschlüssen. In<br />

der Spalte Mittlerer Rang werden die durchschnittlichen Rangzahlen für diese drei<br />

Gruppen ausgegeben. Diese werden berechnet, indem zunächst alle Werte der<br />

Testvariablen in eine gemeinsame Rangordnung gebracht werden. Jedem Variablenwert<br />

wird dabei ein Rangwert entsprechend seiner Position in der Rangord-<br />

354 In den Aufzählungspunkten Fälle auswählen und Fälle nicht gewichten, S. 742 wird beschrieben,<br />

wie Sie diese Einstellungen in der Datendatei herbeiführen können.<br />

355 Diese Schaltfläche ist nur aktiv, wenn bereits eine Gruppenvariable ausgewählt wurde<br />

und diese aktuell markiert ist.<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing


766 <strong>Kapitel</strong> <strong>30</strong> <strong>Nichtparametrische</strong> <strong>Tests</strong><br />

nung zugewiesen. Anschließend werden die durchschnittlichen Rangwerte getrennt<br />

für die drei Kategorien des Schulabschlusses errechnet. Es ist sehr deutlich,<br />

daß die mittleren Rangwerte mit der Höhe des Schulabschlusses ansteigen. Während<br />

der durchschnittliche Rangwerte in der Kategorie Hauptschule 154,50 beträgt,<br />

hat er in der Kategorie Mittlere Reife einen Wert von 172,65 und in erreicht<br />

in der Kategorie Abitur sogar den Wert 202,51.<br />

Anhand des Wertes Kruskal-Wallis-H, der annähernd Chi-Quadrat verteilt ist,<br />

wird ein Signifikanzwert für die Nullhypothese berechnet, derzufolge die mittleren<br />

Ränge in der Grundgesamtheit gleich sind. Diese Signifikanz beträgt im vorliegenden<br />

Beispiel 0,010 bzw. 1,0%. Weist man die Nullhypothese gleicher mittlerer<br />

Rangwerte der drei Gruppen in der Grundgesamtheit zurück, begeht man folglich<br />

mit einer Wahrscheinlichkeit von 1,0% einen Irrtum. Bei einer so geringen Irrtumswahrscheinlichkeit<br />

kann die Nullhypothese zurückgewiesen werden, die<br />

mittleren Rangwerte der Zufriedenheit mit dem Lebensstandard in den drei unterschiedlichen<br />

Schulabschluß-Kategorien sind in der Grundgesamtheit offenbar<br />

nicht gleich.<br />

Ränge<br />

V<strong>30</strong><br />

BILDUNG<br />

Hauptschule, Polytech.<br />

Schule 8. o. 9. Kl., kein<br />

Abschluß<br />

Mittlere Reife,<br />

Fachhochschule,<br />

Polytech. Schule 10.<br />

Klasse<br />

Abitur bzw. Erw.<br />

Oberschule<br />

Gesamt<br />

N<br />

Mittlerer<br />

Rang<br />

141 154,50<br />

156 172,65<br />

39 202,51<br />

Statistik für Test a,b V<strong>30</strong><br />

Chi-Quadrat<br />

9,249<br />

df<br />

2<br />

Asymptotische Signifikanz ,010<br />

a. Kruskal-Wallis-Test<br />

336<br />

b. Gruppenvariable: BILDUNG<br />

Abbildung <strong>30</strong>.15: Ergebnisse des Kruskal-Wallis-<strong>Tests</strong> für mehrere unabhängige<br />

Stichproben<br />

Median-Test<br />

Für den Median-Test hat die Prozedur die Ergebnisse aus Abbildung <strong>30</strong>.16 ausgegeben.<br />

Zunächst wurde der Median der Testvariablen für die Gesamtheit der in<br />

den Test eingegangenen Fälle berechnet. Dieser Median wird in der unteren Tabelle<br />

mit 2 angegeben. Anschließend werden die Werte der einzelnen Gruppen mit<br />

dem Gesamtmedian verglichen. Für jede Gruppen wird die Anzahl der Fälle mitgeteilt,<br />

deren Werte größer bzw. kleiner sind als der Median aller Fälle. Entstammen<br />

die Werte alle der gleichen Grundgesamtheit, sollten die Mediane in den drei<br />

Gruppen ungefähr gleich sein. In dem Fall würden auch in jeder Gruppe in etwa<br />

die Hälfte der Werte über und die andere Hälfte unter dem Median liegen, der für<br />

die Gesamtheit der Fälle berechnet wurde. Für die drei Gruppen aus dem Beispiel<br />

trifft dies nicht uneingeschränkt zu. Zunächst ist zu beobachten, daß in jeder<br />

Gruppe deutlich mehr Werte kleiner oder gleich dem Median (


<strong>30</strong>.7 <strong>Tests</strong> für mehrere unabhängige Stichproben 767<br />

wenige Gruppen unterschieden werden und der Median mit einer häufig vertretenen<br />

Gruppe zusammenfällt. Für den Test ist aber vor allem entscheidend, daß die<br />

Verteilung der Werte in den drei Gruppen sehr ähnlich ist, sich die Werte also in<br />

ähnlicher Weise auf die beiden Seiten des Medians verteilen.<br />

Mit einem Chi-Quadrat-Test wird überprüft, inwieweit die Unterschiede zwischen<br />

den Gruppen auf tatsächliche Unterschiede in der Grundgesamtheit hindeuten. Der<br />

Signifikanzwert für die Nullhypothese wird mit 0,114% bzw. 11,4% angegeben.<br />

Bei einer so hohen Irrtumswahrscheinlichkeit kann die Nullhypothese, derzufolge<br />

die Mediane der einzelnen Gruppen der gleichen Grundgesamtheit entstammen<br />

(das bedeutet hier einfach, daß die Mediane gleich sind) nicht zurückgewiesen<br />

werden.<br />

Häufigkeiten<br />

V<strong>30</strong><br />

> Median<br />

< = Median<br />

Hauptschule,<br />

Polytech.<br />

Schule 8. o.<br />

9. Kl., kein<br />

BILDUNG<br />

Mittlere Reife,<br />

Fachhochschule,<br />

Polytech. Schule<br />

Abitur bzw.<br />

Erw.<br />

Abschluß 10. Klasse Oberschule<br />

44 59 19<br />

97 97 20<br />

N<br />

Median<br />

Statistik für Test b V<strong>30</strong><br />

336<br />

2,00<br />

4,339 a<br />

Chi-Quadrat<br />

df<br />

Asymptotische Signifikanz<br />

2<br />

,114<br />

a. Bei 0 Zellen (,0%) werden weniger als 5 Häufigkeiten<br />

erwartet. Die kleinste erwartete Zellenhäufigkeit ist<br />

14,2.<br />

b. Gruppenvariable: BILDUNG<br />

Abbildung <strong>30</strong>.16: Ergebnisse eines Median-<strong>Tests</strong> für mehrere unabhängige Stichproben<br />

<strong>30</strong>.7.2 Einstellungen eines <strong>Tests</strong> für mehrere unabhängige<br />

Stichproben bei SPSS<br />

Um nichtparametrische <strong>Tests</strong> für mehrere unabhängige Stichproben durchzuführen,<br />

öffnen Sie mit dem folgenden Befehl das Dialogfeld aus Abbildung <strong>30</strong>.17:<br />

STATISTIK<br />

NICHTPARAMETRISCHE TESTS<br />

K UNABHÄNGIGE STICHPROBEN...<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing


768 <strong>Kapitel</strong> <strong>30</strong> <strong>Nichtparametrische</strong> <strong>Tests</strong><br />

Abbildung <strong>30</strong>.17: Dialogfeld des Befehls STATISTIK, NICHTPARA-<br />

METRISCHE TESTS, K UNABHÄNGIGE STICHPROBEN<br />

Das abgebildete Dialogfeld zeigt die für das obige Beispiel verwendeten Einstellungen.<br />

In der Variablenliste werden nur die numerischen Variablen der Datendatei<br />

aufgeführt, Textvariablen können also auch nicht als Gruppierungsvariablen<br />

verwendet werden. Um einen Test für mehrere unabhängige Stichproben durchzuführen,<br />

nehmen Sie die folgenden Einstellungen vor:<br />

¾ Testvariablen: Geben Sie in diesem Feld mindestens eine Testvariable an. Die<br />

Werte der Testvariablen in verschieden Fallgruppen der Datendatei werden<br />

anhand der <strong>Tests</strong> miteinander verglichen.<br />

¾ Gruppenvariable: Geben Sie hier die gruppierende Variable an. Zusätzlich<br />

muß in dem Dialogfeld der Schaltfläche Bereich definieren ein Wertebereich<br />

angegeben werden (s.u.). Jeder Wert der Gruppenvariablen innerhalb dieses<br />

Bereichs bildet eine Fallgruppe in der Datendatei.<br />

¾ Welche <strong>Tests</strong> durchführen?: Kreuzen Sie die durchzuführenden <strong>Tests</strong> an.<br />

¾ Optionen: Hier können Sie zusätzliche Maßzahlen für den Output anfordern<br />

und den Ausschluß von Fällen mit fehlenden Werten regeln.<br />

Gruppenvariable<br />

Geben Sie die Variable, durch deren Werte die Fallgruppen definiert werden sollen,<br />

in dem Feld Gruppenvariable an. Um die Gruppen zu definieren, müssen Sie<br />

zusätzliche einen Wertebereich festlegen. Jeder ganzzahlige Wert innerhalb dieses<br />

Bereichs (einschließlich der Grenzen) bildet eine Fallgruppe und damit eine der zu<br />

vergleichenden unabhängigen Stichproben. Um den Wertebereich anzugeben, öffnen<br />

Sie mit der Schaltfläche Bereiche definieren das in Abbildung <strong>30</strong>.18 dargestellte<br />

Dialogfeld.<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing


<strong>30</strong>.7 <strong>Tests</strong> für mehrere unabhängige Stichproben 769<br />

Abbildung <strong>30</strong>.18: Dialogfeld der Schaltfläche "Bereich<br />

definieren“ für mehrere unabhängige Stichproben<br />

Geben Sie in den Feldern Minimum und Maximum die untere und obere Grenze<br />

des Wertebereichs an. Jeder ganzzahlige Werte innerhalb dieses Bereichs definiert<br />

eine Fallgruppe in der Datendatei. Durch die Angaben in Abbildung <strong>30</strong>.17 werden<br />

damit die drei Fallgruppen 1, 2 und 3 definiert. Enthält die Gruppenvariable Werte<br />

mit Dezimalstellen, werden diese abgeschnitten. Der Wert 3,9 wird damit noch der<br />

Gruppe 3 zugeordnet, auch wenn er bereits außerhalb des angegeben Wertebereichs<br />

liegt.<br />

Welche <strong>Tests</strong> durchführen?<br />

Für mehrere unabhängige Stichproben stehen die beiden folgenden <strong>Tests</strong> zur Verfügung:<br />

¾ Kruskal-Wallis H: Nullhypothese: Die Stichproben entstammen derselben<br />

Grundgesamtheit. Um die Hypothese zu überprüfen, werden die Werte in eine<br />

gemeinsame Rangordnung gebracht. Getestet wird anschließend mit einem χ 2 -<br />

Test, ob die durchschnittlichen Rangwerte in den einzelnen Stichproben gleich<br />

groß sind. Es werden die durchschnittlichen Ränge sowie die Anzahl der Fälle<br />

und außerdem der χ 2 -Wert, die Anzahl der Freiheitsgrade sowie die Signifikanz<br />

ausgegeben.<br />

¾ Median: Nullhypothese: Die Stichproben entstammen Grundgesamtheiten mit<br />

dem gleichen Median. Zunächst wird der Median für die Gesamtheit der Variablenwerte<br />

berechnet. Anschließend wird jeweils die Anzahl der Fälle in den<br />

einzelnen Gruppen betrachtet, deren Werte größer bzw. kleiner als der Gesamtmedian<br />

sind. Bei Gültigkeit der Nullhypothese müßte jeweils die Hälfte<br />

der Werte über und die andere Hälfte unter dem Median liegen. Anhand der<br />

Abweichungen der beobachteten von den erwarteten Fallzahlen wird ein χ 2 -<br />

Test durchgeführt. Im Output werden der χ 2 -Wert, die Anzahl der Freiheitsgrade<br />

sowie die Signifikanz mitgeteilt, außerdem die Anzahl der Fälle, der Gesamtmedian<br />

sowie für die einzelnen Gruppen die Zahl der Fälle mit Werten<br />

größer und kleiner oder gleich dem Gesamtmedian.<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing


770 <strong>Kapitel</strong> <strong>30</strong> <strong>Nichtparametrische</strong> <strong>Tests</strong><br />

Optionen<br />

Die Schaltfläche Optionen öffnet das Dialogfeld aus Abbildung <strong>30</strong>.3, S. 747. Dort<br />

können Sie ergänzenden Output anfordern und den Ausschluß von Fällen mit<br />

fehlenden Werten steuern. Zur Bedeutung der Optionen siehe im einzelnen Abschnitt<br />

Optionen, S. 747.<br />

<strong>30</strong>.8 <strong>Tests</strong> für zwei verbundene Stichproben<br />

Für zwei verbundene Stichproben können Sie mit dem Wilcoxon-Test und dem<br />

Vorzeichen-Test überprüfen, ob die beiden Stichproben Grundgesamtheiten mit<br />

der gleichen Verteilung entstammen. Mit dem McNemar-Test können Sie für zwei<br />

dichotome Variablen untersuchen, ob diese systematische Unterschiede aufweisen.<br />

Zwei Stichproben werden als verbunden bezeichnet, wenn ihre Werte gemeinsam<br />

und damit paarweise auftreten und inhaltlich zusammenhängen. Werden<br />

bei einer Befragung die Personen zum Beispiel nach dem Alter der Mutter sowie<br />

nach dem Alter des Vaters gefragt, bilden die beiden Altersangaben zwei verbundene<br />

Stichproben, da die einzelnen Werte jeweils paarweise miteinander verbunden<br />

sind. Die beiden Werte werden dabei in zwei Variablen, aber im gleichen Fall<br />

gespeichert. Bei verbundenen Stichproben bilden also die Werte einer Stichprobe<br />

jeweils eine eigene Variable.<br />

<strong>30</strong>.8.1 Interpretation des Wilcoxon-<strong>Tests</strong><br />

Im Rahmen der ALLBUS-Umfrage wurden den Befragten unter anderem die beiden<br />

in den Abbildungen <strong>30</strong>.19 und <strong>30</strong>.20 wiedergegebenen Fragen vorgelegt.<br />

Im folgenden geht es um den Zuzug verschiedener Personengruppen nach<br />

Deutschland. Wie ist Ihre Einstellung dazu?<br />

Wie ist es mit Arbeitnehmern aus der Europäischen Union?<br />

‰ 1 Der Zuzug soll uneingeschränkt möglich sein.<br />

‰ 2 Der Zuzug soll begrenzt werden.<br />

‰ 3 Der Zuzug soll völlig unterbunden werden.<br />

Abbildung <strong>30</strong>.19: Fragetext und Antwortkategorien für die Variable „v33“<br />

Und wie ist es mit Arbeitnehmern aus Nicht-EU-Staaten, z.B. Türken?<br />

‰ 1 Der Zuzug soll uneingeschränkt möglich sein.<br />

‰ 2 Der Zuzug soll begrenzt werden.<br />

‰ 3 Der Zuzug soll völlig unterbunden werden.<br />

Abbildung <strong>30</strong>.20: Fragetext und Antwortkategorien für die Variable „v34“<br />

Im folgenden wird mit einem Wilcoxon-Test untersucht, ob die beiden Variablen<br />

in der Grundgesamtheit die gleiche Verteilung aufweisen. Ein solcher Test läßt<br />

sich mit den folgenden Einstellungen anfordern:<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing


<strong>30</strong>.8 <strong>Tests</strong> für zwei verbundene Stichproben 771<br />

¾ Daten: Die Daten entstammen der Datei allbus.sav. Im folgenden sollen nur<br />

die Personen aus den neuen Bundesländern betrachtet. Damit entfällt auch die<br />

Notwendigkeit zur Gewichtung der Daten. 356<br />

¾ Test für zwei verbundene Stichproben aufrufen: Um den Test aufzurufen,<br />

wählen Sie den Befehl<br />

STATISTIK<br />

NICHTPARAMETRISCHE TESTS<br />

ZWEI VERBUNDENE STICHPROBEN...<br />

¾ Einstellungen: Fügen Sie in dem Dialogfeld der Prozedur das Variablenpaar<br />

v33 - v34 in das Feld Ausgewählte Variablenpaare ein. Klicken Sie hierzu in<br />

der Quellvariablenliste nacheinander auf die Variablen v33 und v34, und verschieben<br />

Sie das Paar anschließend mit der Pfeil-Schaltfläche in das Feld Ausgewählte<br />

Variablenpaare.<br />

Bei den übrigen Optionen werden die Voreinstellungen verwendet. Dies bedeutet<br />

insbesondere, daß in der Gruppe Welche <strong>Tests</strong> durchführen? die Option<br />

Wilcoxon angekreuzt bleibt. Die beschriebenen Einstellungen sind in dem<br />

Dialogfeld in Abbildung <strong>30</strong>.22, S. 772 dargestellt und liefern den Output aus<br />

Abbildung <strong>30</strong>.21.<br />

Der Wilcoxon-Test vergleicht die Verteilung beider Variablen anhand der Differenzen<br />

zwischen den Wertepaaren. Zunächst werden die Differenzen berechnet<br />

und nach ihrer absoluten Größe in eine Rangordnung gebracht. Anschließend<br />

werden die mittleren Rangzahlen der positiven und der negativen Differenzen berechnet.<br />

Die Zahl der positiven und negativen Differenzen sowie ihr durchschnittlicher<br />

Rangwert werden in dem Output angegeben. Insgesamt wurden 329<br />

Fälle in den Test einbezogen, davon wiesen 7 Fälle negative und 73 Fälle positive<br />

Differenzen auf. In 7 Fällen wurde der Zuzug von EU-Ausländern damit ablehnender<br />

beurteilt als der Zuzug von Nicht-EU-Ausländern, in 73 Fälle verhielt es<br />

sich genau umgekehrt. 249 Befragte haben den Zuzug der beiden Gruppen von<br />

ausländischen Arbeitnehmern gleich bewertet (Bindungen).<br />

Nicht nur die Anzahl negativer Differenzen, sondern auch ihr durchschnittlicher<br />

absoluter Betrag scheinen etwas kleiner zu sein als die positiven Abweichungen.<br />

Der mittlere Rang der sieben negativen Abweichungen ist mit 37,00 angegeben,<br />

während der für positive Differenzen 40,84 beträgt. Aufgrund dieser Beobachtungen<br />

ergibt sich für die Nullhypothese, derzufolge beide Stichproben einer<br />

Grundgesamtheit mit der gleichen Verteilung entstammen, ein Signifikanzwert<br />

von 0,000 bzw. 0,0%. Die Nullhypothese kann damit zurückgewiesen werden. Der<br />

annähernd standardnormalverteilte Z-Wert, der zur Berechnung der Signifikanz<br />

diente, wird ebenfalls ausgewiesen und beträgt -7,238.<br />

356 In den Aufzählungspunkten Fälle auswählen und Fälle nicht gewichten, S. 742 wird beschrieben,<br />

wie Sie diese Einstellungen in der Datendatei herbeiführen können.<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing


772 <strong>Kapitel</strong> <strong>30</strong> <strong>Nichtparametrische</strong> <strong>Tests</strong><br />

V34 - V33<br />

a. V34 < V33<br />

b. V34 > V33<br />

c. V33 = V34<br />

Negative Ränge<br />

Positive Ränge<br />

Bindungen<br />

Gesamt<br />

Ränge<br />

N<br />

Mittlerer<br />

Rang Rangsumme<br />

7 a 37,00 259,00<br />

73 b 40,84 2981,00<br />

249 c<br />

329<br />

Z<br />

Statistik für Test b<br />

Asymptotische Signifikanz<br />

(2-seitig)<br />

V34 - V33<br />

-7,238 a<br />

a. Basiert auf negativen Rängen.<br />

b. Wilcoxon-Test<br />

,000<br />

Abbildung <strong>30</strong>.21: Ergebnisse eines Wilcoxon-<strong>Tests</strong> für zwei verbundene Stichproben<br />

<strong>30</strong>.8.2 Einstellungen der <strong>Tests</strong> für zwei verbundene Stichproben<br />

bei SPSS<br />

Um einen nichtparametrischen Test für zwei verbundene Stichproben durchzuführen,<br />

wählen Sie den folgenden Befehl, der das Dialogfeld aus Abbildung <strong>30</strong>.22<br />

öffnet. Das abgebildete Dialogfeld zeigt die für das vorhergehende Beispiel verwendeten<br />

Einstellungen.<br />

STATISTIK<br />

NICHTPARAMETRISCHE TESTS<br />

ZWEI VERBUNDENE STICHPROBEN...<br />

Abbildung <strong>30</strong>.22: Dialogfeld des Befehls STATISTIK, NICHTPARAME-<br />

TRISCHE TESTS, ZWEI VERBUNDENE STICHPROBEN<br />

¾ Variablen: Geben Sie in dem Feld Ausgewählte Variablenpaare die Paare der<br />

jeweils miteinander zu vergleichenden Variablen an. Klicken Sie dafür zunächst<br />

nacheinander auf die beiden Variablen eines Paares, und fügen Sie das<br />

Paar anschließend durch Klicken auf die Pfeil-Schaltfläche der Liste Ausgewählte<br />

Variablenpaare hinzu. Wenn Sie mehrere Variablenpaare angeben,<br />

werden die <strong>Tests</strong> für jedes Paar getrennt durchgeführt.<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing


<strong>30</strong>.8 <strong>Tests</strong> für zwei verbundene Stichproben 773<br />

¾ <strong>Tests</strong>: Per Voreinstellung wird lediglich der Wilcoxon-Test durchgeführt.<br />

Möchten Sie andere oder zusätzliche <strong>Tests</strong> durchführen, kreuzen Sie diese in<br />

der Gruppe Welche <strong>Tests</strong> durchführen? an (s.u.).<br />

¾ Optionen: Die Schaltfläche Optionen öffnet das Dialogfeld aus Abbildung<br />

<strong>30</strong>.3, S. 747. Dort können Sie ergänzenden Output anfordern und den<br />

Ausschluß von Fällen mit fehlenden Werten steuern. Zur Bedeutung der Optionen<br />

siehe im einzelnen Abschnitt Optionen, S. 747.<br />

Welche <strong>Tests</strong> durchführen?<br />

Die folgenden drei <strong>Tests</strong> stehen für zwei verbundene Stichproben zur Verfügung:<br />

¾ Wilcoxon: Nullhypothese: Beide Stichproben entstammen einer Grundgesamtheit<br />

mit gleicher Verteilung. Der Wilcoxon-Test erstellt eine gemeinsame<br />

Rangfolge aller Werte aus den beiden Stichproben. Anschließend vergleicht er<br />

die Ränge der einzelnen Wertepaare miteinander. Dazu wird die Differenz<br />

zwischen den beiden Rängen eines Paares berechnet und der durchschnittliche<br />

Rang für alle positiven sowie für alle negativen Differenzen ermittelt. Anhand<br />

des unter der Nullhypothese annähernd standardnormalverteilten Testwertes Z<br />

wird die Signifikanz der Nullhypothese ermittelt. Im Output werden für die<br />

positiven und negativen Abweichungen sowie für die Fälle ohne Differenzen<br />

(Bindungen) die Anzahl der Fälle sowie der mittlere Rangwert angegeben.<br />

Außerdem werden der Z-Wert und die Signifikanz mitgeteilt.<br />

¾ Vorzeichen: Nullhypothese: Beide Stichproben entstammen einer Grundgesamtheit<br />

mit gleicher Verteilung. Der Test vergleicht jeweils die Werte der<br />

einzelnen Paare miteinander. Er berechnet die Differenzen beider Werte und<br />

zählt die Anzahl der positiven und die der negativen Abweichungen. Anschließend<br />

wird der bei Gültigkeit der Nullhypothese standardnormalverteilte Z-<br />

Wert berechnet und auf diese Weise die Signifikanz der Nullhypothese bestimmt.<br />

Die Anzahl der positiven und negativen Abweichungen sowie die Zahl<br />

der Fälle mit gleichen Werten in beiden Variablen werden neben dem Z-Wert<br />

und der Signifikanz im Output mitgeteilt.<br />

¾ McNemar: Nullhypothese: Unterschiede in den Werten beider Variablen liegen<br />

in beiden Richtungen gleichermaßen vor. Der Test untersucht für dichotome<br />

Variablen, ob Unterschiede in den Werten beider Variablen in eine<br />

Richtung stärker ausgeprägt sind als in die andere. Dieser Test wird insbesondere<br />

für Voher/Nachher-Vergleiche verwendet. Der Test betrachtet lediglich<br />

die Fälle, in denen sich die Werte beider Variablen unterscheiden. Er erstellt<br />

eine 2 × 2-Tabelle für die dichotomen Werte der beiden Variablen und gibt die<br />

Anzahl der Fälle für die vier verschiedenen Wertekombinationen an. Wenn die<br />

Unterschiede zwischen den Variablen zufällig sind, müßten die beiden ungleichen<br />

Wertekombinationen - in Relation zu der Häufigkeit der einzelnen Werte<br />

- mit gleicher Häufigkeit auftreten. Die Nullhypothese wird mit einem χ 2 -<br />

Test überprüft. Weisen weniger als 25 Fälle verschiedene Werte auf, wird ein<br />

Binomial-Test durchgeführt. Im Output werden die 2 × 2-Tabelle sowie der χ 2 -<br />

Wert und die Signifikanz angegeben.<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing


774 <strong>Kapitel</strong> <strong>30</strong> <strong>Nichtparametrische</strong> <strong>Tests</strong><br />

<strong>30</strong>.9 Test für mehrere verbundene Stichproben<br />

Analog zu den <strong>Tests</strong> für zwei verbundene Stichproben können Sie auch mehrere<br />

verbundene Stichproben daraufhin untersuchen, ob sie derselben Grundgesamtheit<br />

entstammen. Mit dem Friedman-Test können Sie für ordinalskalierte Variablen die<br />

mittleren Ränge der Variablen vergleichen. Kendalls W wird häufig verwendet,<br />

um die Zuverlässigkeit von Gutachtern oder <strong>Tests</strong> zu überprüfen. Der Test untersucht<br />

die Übereinstimmung zwischen verschiedenen Bewertungen. Die Verteilung<br />

mehrerer dichotomer Variablen können Sie mit Cochrans Q auf Gleichheit untersuchen.<br />

Die Interpretation der Testergebnisse erfolgt dabei ganz analog zu den<br />

<strong>Tests</strong> für zwei verbundene Stichproben.<br />

Um nichtparametrische <strong>Tests</strong> für mehrere verbundene Stichproben durchzuführen,<br />

wählen Sie den folgenden Befehl, der das Dialogfeld aus Abbildung <strong>30</strong>.23 öffnet:<br />

STATISTIK<br />

NICHTPARAMETRISCHE TESTS<br />

K VERBUNDENE STICHPROBEN...<br />

Abbildung <strong>30</strong>.23: Dialogfeld des Befehls STATISTIK, NICHTPARA-<br />

METRISCHE TESTS, K VERBUNDENE STICHPROBEN<br />

¾ Variablen: Verschieben Sie die Variablen, die die einzelnen verbundenen<br />

Stichproben repräsentieren, in das Feld Testvariablen. Es müssen mindestens<br />

zwei Variablen angegeben werden. Die Angabe dieser Variablen genügt, um<br />

die Prozedur auszuführen.<br />

¾ <strong>Tests</strong>: Kreuzen Sie in der Gruppe Welche <strong>Tests</strong> durchführen? die gewünschten<br />

<strong>Tests</strong> an (s.u.).<br />

¾ Statistik: Sie können für die Testvariablen zusätzlichen deskriptive Maßzahlen<br />

anfordern (s.u.).<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing


<strong>30</strong>.9 Test für mehrere verbundene Stichproben 775<br />

Welche <strong>Tests</strong> durchführen?<br />

¾ Friedman: Nullhypothese: Die Stichproben entstammen derselben Grundgesamtheit.<br />

Betrachtet werden jeweils die Werte der Testvariablen in demselben<br />

Fall. Für diese Werte eines Falles wird eine Rangordnung erstellt. Anschließend<br />

werden die mittleren Rangzahlen der einzelnen Testvariablen ermittelt.<br />

Anhand eines annähernd χ 2 -verteilten Testwertes wird der Signifikanzwert<br />

für die Nullhypothese berechnet. Der χ 2 -Wert, die Anzahl der Freiheitsgrade<br />

sowie die Signifikanz werden im Output mitgeteilt, ebenso wie die<br />

Anzahl der Fälle sowie die mittleren Rangzahlen der einzelnen Variablen.<br />

¾ Kendall-W: Nullhypothese: Die Stichproben entstammen derselben Grundgesamtheit.<br />

Der Test interpretiert die einzelnen Variablen als verschiedene zu<br />

bewertende Sachverhalte und die einzelnen Fälle als unterschiedliche Prüfer<br />

oder <strong>Tests</strong>. Der Test mißt die Übereinstimmung zwischen den Prüfern. Für jeden<br />

Fall werden die Werte der Variablen dabei in eine Rangordnung gebracht.<br />

Anschließend werden die mittleren Ränge der Variablen ermittelt. Daraus wird<br />

Kendalls W sowie ein χ 2 -Wert berechnet. Kendalls W liegt zwischen 0 und 1<br />

und gibt die Stärke der Übereinstimmung an. Bei einem Wert von 0 besteht gar<br />

keine, bei einem Wert von 1 perfekte Übereinstimmung. Zu dem χ 2 -Wert wird<br />

die Signifikanz mitgeteilt. Neben dem χ 2 -Wert, der Anzahl der Freiheitsgrade<br />

und der Signifikanz und Kendalls W werden die Anzahl der Fälle sowie die<br />

mittleren Ränge der einzelnen Testvariablen mitgeteilt.<br />

¾ Cochran-Q: Nullhypothese: Die verschiedenen dichotomen Variablen haben<br />

dieselbe Verteilung. Bei dichotomen Variablen läuft diese Hypothese darauf<br />

hinaus, daß sie denselben Mittelwert haben. Der Test zählt jeweils die Häufigkeiten<br />

der einzelnen Werte in den Variablen und berechnet den annähernd χ 2 -<br />

verteilten Testwert Q. Cochrans Q, die Anzahl der Freiheitsgrade sowie die Signifikanz<br />

werden im Output angegeben. Zusätzlich werden die Anzahl der<br />

Fälle und die Häufigkeiten der einzelnen Werte in den Testvariablen mitgeteilt.<br />

Statistik<br />

Die Schaltfläche Statistik öffnet das Dialogfeld aus Abbildung <strong>30</strong>.24.<br />

Abbildung <strong>30</strong>.24: Dialogfeld der Schaltfläche „Statistik“<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing


776 <strong>Kapitel</strong> <strong>30</strong> <strong>Nichtparametrische</strong> <strong>Tests</strong><br />

In diesem Dialogfeld können Sie folgende ergänzende Maßzahlen anfordern können:<br />

¾ Deskriptive Statistik: Berechnet für die Testvariablen auf der Basis der in die<br />

<strong>Tests</strong> einbezogenen Fälle den Mittelwert und die Standardabweichung. Zusätzlich<br />

werden das Minimum und das Maximum sowie die Anzahl der Fälle<br />

mitgeteilt.<br />

¾ Quartile: Für die in die Prozedur einbezogenen Fälle werden die 25%-, 50%-<br />

und 75%-Perzentile der Testvariablen angegeben.<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!