Kapitel 30 Nichtparametrische Tests

Kapitel 30 

Nichtparametrische Tests 

30.1 Überblick 

Nichtparametrische Tests dienen dazu, aufgrund der Daten einer Stichprobe Rückschlüsse 

auf die Eigenschaften der Werte in der Grundgesamtheit zu ziehen. Dies 

haben sie mit allen anderen Testverfahren auf stichprobentheoretischer Grundlage 

wie beispielsweise dem T-Test oder den Varianzanalysen (ANOVA) gemeinsam. 

Auch in dem konkret zu untersuchenden Sachverhalt unterscheiden sich die nichtparametrischen 

Tests häufig nicht von anderen Testverfahren. So kann zum Beispiel 

anstatt des T-Tests grundsätzlich auch stets der nichtparametrische Mann- 

Whitney-Test durchgeführt werden. (Umgekehrt gilt jedoch nicht, daß der Mann- 

Whitney-Test jederzeit durch den T-Test ersetzt werden kann.) Der wesentliche 

Unterschied zwischen nichtparametrischen Tests und den übrigen Testverfahren 

besteht darin, daß die nichtparametrischen Tests wesentlich geringere Anforderungen 

an die Verteilung der Werte in der Grundgesamtheit stellen. Während zum 

Beispiel der T-Test verlangt, daß die zu vergleichenden Stichproben jeweils einer 

annähernd normalverteilten Grundgesamtheit entstammen und gleiche Varianzen 

aufweisen, müssen diese Voraussetzungen für den Mann-Whitney-Test nicht erfüllt 

sein. 

Zudem stellen nichtparametrische Tests häufig weniger starke Anforderungen an 

das Skalenniveau der zu untersuchenden Variablen. Dies hängt damit zusammen, 

daß ein Großteil der nichtparametrischen Tests auf der Betrachtung von Rangzahlen 

basiert und daher oftmals ein Ordinalskalenniveau genügt, wenn bei alternativen 

Tests intervallskalierte Daten erforderlich sind. 

Aus dem bisher Gesagten ergibt sich unmittelbar das primäre Anwendungsgebiet 

nichtparametrischer Tests: Sie kommen insbesondere dann zur Anwendung, wenn 

die stärkeren Voraussetzungen alternativer Tests von den zugrundeliegenden Daten 

nicht erfüllt werden. Der Preis für das Ausweichen auf Tests mit schwächeren 

Anforderungen an die Daten besteht allerdings darin, daß sich mit nichtparametrischen 

Tests auch nur weniger scharfe und klare Hypothesen testen lassen. Die aus 

diesen Tests abgeleiteten Aussagen sind häufig weniger fundiert, da bei den Tests 

nur ein geringerer Teil der verfügbaren Informationen ausgenutzt wird. Wird bei- 

Felix Brosius, SPSS 8 

International Thomson Publishing

740 Kapitel 30 Nichtparametrische Tests 

spielsweise eine intervallskalierte Variable mit einem nichtparametrischen Test 

untersucht, der auf der Betrachtung von Rangwerten basiert, werden die verfügbaren 

Informationen über die Größe von Wertdifferenzen nicht verwendet. Daher 

kann der Test auch keine so starken Ergebnisse liefern, wie es parametrische Tests 

vermögen. Dies ist der Grund dafür, daß im allgemeinen den parametrischen Verfahren 

der Vorzug gegeben wird, sofern von den zu untersuchenden Daten die entsprechenden 

Voraussetzungen erfüllt werden. Umgekehrt sind nichtparametrische 

Tests vor allem dann sinnvoll, wenn die Variablen ein zu niedriges Skalenniveau 

für parametrische Tests aufweisen oder die Verteilungsannahmen der parametrischen 

Verfahren nicht hinreichend erfüllt sind. 

Insgesamt stehen bei SPSS 16 nichtparametrische Testverfahren zur Verfügung, 

die in acht Unterbefehlen des Menüs 

STATISTIK 

NICHTPARAMETRISCHE TESTS 

zusammengefaßt sind. Es folgt eine Übersicht über die zur Verfügung stehenden 

Testverfahren unter Angabe der jeweils zugrundeliegenden Fragestellung, des erforderlichen 

Skalenniveaus, des Unterbefehls, mit dem der Test angefordert werden 

kann, und der Seitenzahl, bei der die jeweilige Prozedur ausführlicher beschrieben 

wird. 

¾ Chi-Quadrat: Stimmen die beobachteten Häufigkeiten einer Variablen mit 

vorgegebenen erwarteten Häufigkeiten überein? Nominalskalenniveau. CHI- 

QUADRAT (S. 741). 

¾ Binomial: Stimmen die beobachteten Häufigkeiten einer dichotomen Variablen 

mit vorgegebenen erwarteten Häufigkeiten überein? Dichotome Variable. 

BINOMIAL (S. 748). 

¾ Sequenz: Sind die Werte einer dichotomen Variablen in einer Folge von 

Werten zufällig angeordnet? Dichotome Variable. SEQUENZEN (S. 751). 

¾ Kolmogorov-Smirnov bei einer Stichprobe: Folgen die Werte in der Grundgesamtheit 

einer bestimmten Verteilung? Getestet werden kann auf Normalverteilung, 

Gleichverteilung, Poissonverteilung und Exponentialverteilung. 

Intervallskalenniveau. K-S BEI EINER STICHPROBE (S. 754). 

¾ Mann-Whitney: Entstammen zwei unabhängige Stichproben derselben 

Grundgesamtheit? Der Test erfolgt auf der Basis von Rangunterschieden. Ordinalskalenniveau. 

ZWEI UNABHÄNGIGE STICHPROBEN (S. 757). 

¾ Kolmogorov-Smirnov-Z: Entstammen zwei unabhängige Stichproben derselben 

Grundgesamtheit? Der Test basiert auf einem Vergleich der Verteilungen. 

Intervallskalenniveau. ZWEI UNABHÄNGIGE STICHPROBEN (S. 757). 

¾ Moses: Ist die Spannweite der Werte in den Grundgesamtheiten zweier unabhängiger 

Stichproben gleich groß? Ordinalskalenniveau. ZWEI UNABHÄNGIGE 

STICHPROBEN (S. 757). 



30.2 Chi-Quadrat-Test 741 

¾ Wald-Wolfowitz: Entstammen zwei unabhängige Stichproben derselben 

Grundgesamtheit? Der Test basiert auf einer Sequenzanalyse für die Gruppenzugehörigkeiten 

in einer Rangfolge. Ordinalskalenniveau. ZWEI UNAB- 

HÄNGIGE STICHPROBEN (S. 757). 

¾ Kruskal-Wallis: Entstammen mehrere unabhängige Stichproben derselben 

Grundgesamtheit? Hierbei werden die mittleren Rangwerte verglichen. Ordinalskalenniveau. 

K UNABHÄNGIGE STICHPROBEN (S. 764). 

¾ Median: Weisen mehrere unabhängige Stichproben in der Grundgesamtheit 

den gleichen Median auf? Ordinalskalenniveau. K UNABHÄNGIGE STICHPRO- 

BEN (S. 764). 

¾ Wilcoxon: Entstammen zwei verbundene Stichproben Grundgesamtheiten mit 

gleicher Verteilung? Ordinalskalenniveau. ZWEI VERBUNDENE STICHPROBEN 

(S. 770). 

¾ Vorzeichen: Entstammen zwei verbundene Stichproben Grundgesamtheiten 

mit gleicher Verteilung? Ordinalskalenniveau. ZWEI VERBUNDENE STICHPRO- 

BEN (S. 770). 

¾ McNemar: Erfolgen Änderungen zwischen zwei verbundenen Variablen in 

beiden Richtungen gleichermaßen? Dichotome Variablen. ZWEI VERBUNDENE 

STICHPROBEN (S. 770). 

¾ Friedman: Entstammen mehrere verbundene Stichproben derselben Grundgesamtheit? 

Ordinalskalenniveau. K VERBUNDENE STICHPROBEN (S. 774). 

¾ Kendall: Entstammen mehrere verbundene Stichproben derselben Grundgesamtheit? 

Ordinalskalenniveau. K VERBUNDENE STICHPROBEN (S. 774). 

¾ Cochran: Haben mehrere verbundene dichotome Variablen die gleiche Verteilung. 

Dichotome Variablen. K VERBUNDENE STICHPROBEN (S. 774). 

30.2 Chi-Quadrat-Test 

Mit diesem χ 2 -Test können Sie überprüfen, ob die Häufigkeiten der Werte einer 

Variablen in der Grundgesamtheit vorgegebenen erwarteten Häufigkeiten entsprechen. 

Dabei können auch Variablen untersucht werden, die lediglich Nominalskalenniveau 

aufweisen. Per Voreinstellung wird getestet, ob die unterschiedlichen 

Werte der Variablen in der Grundgesamtheit mit der gleichen Häufigkeit 

vertreten sind. Diese Voreinstellung können Sie jedoch ändern und die erwartete 

Häufigkeit für jeden Wert manuell vorgeben. Der Test untersucht dann, ob aus den 

empirischen Häufigkeiten, die in der vorliegenden Stichprobe beobachtet wurden, 

geschlossen werden kann, daß die angegebenen erwarteten Häufigkeiten in der 

Grundgesamtheit tatsächlich gelten. 343 

343 Zur Berechnung des χ 2 -Wertes und zur Teststatistik vgl. Abschnitt 16.2, Chi-Quadrat- 

Test, S. 402. 




30.2.1 Interpretation eines Chi-Quadrat-Tests 

Die Datendatei allbus.sav von der Begleit-CD enthält Daten einer 1996 in 

Deutschland durchgeführten Bevölkerungsbefragung. 344 Im folgenden sollen ausschließlich 

die Personen aus den neuen Bundesländern betrachtet werden. Für jeden 

Befragten ist unter anderem in der Variablen v35 sein Geburtsmonat angegeben. 

Mit dem Chi-Quadrat-Test wird nun untersucht, ob die Anzahl der Geburten 

in den einzelnen Monaten in der Grundgesamtheit gleich ist. Hierzu sind die folgenden 

Einstellungen erforderlich: 

¾ Fälle auswählen: Zunächst ist der Test auf die Befragten aus den neuen Bundesländern 

zu beschränken. Hierzu wird der Befehl 

DATEN 

FÄLLE AUSWÄHLEN... 

verwendet. In dem damit geöffneten Dialogfeld wird die Option Falls Bedingung 

zutrifft ausgewählt und anschließend auf die zu dieser Option gehörenden 

Schaltfläche Falls geklickt. In dem damit geöffneten Dialogfeld wird in das 

große Eingabefeld die Bedingung v3 = 2 geschrieben. Anschließend wird dieses 

Dialogfeld mit der Schaltfläche Weiter und das Hauptdialogfeld mit der 

Schaltfläche OK geschlossen. Achten Sie vor dem Schließen des Hauptdialogfeldes 

darauf, daß in der Gruppe Nicht ausgewählte Fälle die Option Filtern 

eingestellt ist. 

¾ Fälle nicht gewichten: Anders als in vielen anderen Kapiteln werden im folgenden 

Beispiel nicht gewichtete Fälle betrachtet. Sollten die Fälle in der Datendatei 

gewichtet sein, muß die Gewichtung zuvor ausgeschaltet werden. Dies 

geschieht mit dem Befehl 

DATEN 

FÄLLE GEWICHTEN... 

Wählen Sie in dem damit geöffneten Dialogfeld die Option Fälle nicht gewichten, 

und schließen Sie das Dialogfeld mit OK. 

¾ Chi-Quadrat-Test aufrufen: Um den Chi-Quadrat-Test aufzurufen, wählen 

Sie den Befehl 

STATISTIK 


CHI-QUADRAT... 

¾ Einstellungen: Verschieben Sie die Variable v35 in das Feld Testvariable. Bei 

allen übrigen Optionen werden die Voreinstellungen beibehalten. Abbildung 

30.2, S. 745 zeigt die hier verwendeten Dialogfeldeinstellungen. 

Durch die voreingestellten Optionen wurde unter anderem festgelegt, daß untersucht 

werden soll, ob angenommen werden kann, daß die 12 Monate als Geburtsmonate 

in der Grundgesamtheit mit der gleichen Häufigkeit vorkommen. Abwei- 

344 Siehe hierzu im einzelnen Kapitel 1, Überblick. 




chend von dieser Voreinstellung hätte auch untersucht werden können, ob beispielsweise 

die Hypothese vertreten werden kann, daß die Sommermonate in der 

Grundgesamtheit mit einer 10% höheren Häufigkeit vertreten sind als die Wintermonate. 

Der mit den hier verwendeten Einstellungen erzeugte Output ist in Abbildung 

30.1 wiedergegeben. 

Häufigkeiten 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

Gesamt 

Kategorie 

V35 

Beobachtetes 

N 

Erwartete 

Anzahl 

Residuum 

Januar 27 28,9 -1,9 

Februar 22 28,9 -6,9 

März 30 28,9 1,1 

April 32 28,9 3,1 

Mai 32 28,9 3,1 

Juni 29 28,9 ,1 

Juli 31 28,9 2,1 

August 35 28,9 6,1 

September 38 28,9 9,1 

Oktober 21 28,9 -7,9 

November 20 28,9 -8,9 

Dezember 30 28,9 1,1 

347 

Statistik für Test 

Chi-Quadrat a 

df 

Asymptotische Signifikanz 

V35 

11,720 

11 

,385 

a. Bei 0 Zellen (,0%) werden weniger als 5 Häufigkeiten 

erwartet. Die kleinste erwartete Zellenhäufigkeit ist 

28,9. 

Abbildung 30.1: Ergebnisse des Chi-Quadrat-Tests für die 

Variable „v35“ (Geburtsmonat der Befragten) 

Die betrachtete Stichprobe umfaßt 347 Personen aus den neuen Bundesländern, 

deren Geburtsmonat bekannt ist. Dieser Wert wird in der Tabelle Häufigkeiten und 

dort in der Zeile Gesamt angegeben. Wäre nun in der Stichprobe jeder Geburtsmonat 

mit der gleichen Häufigkeit vertreten, müßten in jedem Monat ein Zwölftel 

der 347 Personen geboren sein. Dies wären 28,9 Personen in jedem Monat. Auch 

dieser Wert wird in der Tabelle Häufigkeiten in der Spalte Erwartete Anzahl für 

jeden Monat mitgeteilt. Daß diese Häufigkeit von 28,9 Personen in jedem Monat 

als erwartete Häufigkeit bezeichnet wird, hat folgenden Hintergrund: Werden in 

jedem Monat tatsächlich gleich viele Personen geboren, wäre in einer Zufallsstichprobe 

von 347 Personen zu erwarten, daß (rein rechnerisch) 28,9 von den insgesamt 

347 Personen im Januar geboren wurden. Die gilt ebenso für den Monat 

Februar, den März etc. 




Die tatsächlich beobachteten Häufigkeiten der einzelnen Monate, die in der Spalte 

Beobachtetes N ausgewiesen werden, weichen mehr oder weniger stark von den 

erwarteten Häufigkeiten ab. So wurden nicht 29 (als gerundeter Wert von 28,9) 

Personen im Januar geboren, sondern lediglich 27. Die Monate April und Mai sind 

dagegen mit jeweils 32 Personen etwas stärker vertreten, als es den erwarteten 

Häufigkeiten entsprochen hätte. 

Diese Abweichungen der beobachteten von den erwarteten Häufigkeiten lassen 

jedoch noch nicht den Schluß zu, die Hypothese, in der Grundgesamtheit seien 

alle Monate mit der gleichen Häufigkeit als Geburtsmonate vertreten, sei falsch. 

Vielmehr ist es durchaus möglich, daß die Hypothese vollkommen richtig ist und 

die Abweichungen zwischen den beobachteten und den erwarteten Häufigkeiten 

lediglich auf zufällige Einflüsse bei der Stichprobenziehung zurückzuführen sind. 

Die Tatsache, daß entsprechende Abweichungen auch bei Gültigkeit der Nullhypothese 

auftreten, ergibt sich schon daraus, daß die erwarteten Häufigkeiten ein 

Wert mit Dezimalstellen sind, tatsächlich aber immer nur ganzzahlige Häufigkeiten 

beobachtet werden können. 

Der Chi-Quadrat-Test untersucht nun, ob die Abweichungen zwischen den beobachteten 

und den erwarteten Häufigkeiten so groß sind, daß angenommen werden 

kann, sie seien nicht durch zufällige Einflüsse entstanden, sondern auf entsprechend 

unterschiedliche Häufigkeiten der Geburtsmonate in der Grundgesamtheit 

zurückzuführen. Das Ergebnis des Chi-Quadrat-Tests wird in der unteren Tabelle 

Statistik für Test mitgeteilt. Der zentrale Wert bei diesen Ergebnissen ist die Signifikanz, 

die in diesem Fall 0,385 beträgt. Dieser Wert ist die Irrtumswahrscheinlichkeit, 

die mit einem Zurückweisen der Nullhypothese verbunden ist. Er ist in 

diesem Fall also folgendermaßen zu interpretieren: Weist man die Nullhypothese 

zurück, derzufolge in der Grundgesamtheit jeder Monat mit der gleichen Häufigkeit 

als Geburtsmonat vertreten ist, begeht man mit einer Wahrscheinlichkeit von 

38,5% einen Irrtum. Diese Irrtumswahrscheinlichkeit ist derart hoch, daß man die 

Nullhypothese nicht zurückweisen wird. 345 

Die Tatsache, daß die Nullhypothese aufgrund der hohen Irrtumswahrscheinlichkeit 

nicht zurückgewiesen werden kann, läßt nicht umgekehrt den Schluß zu, die 

Nullhypothese sei richtig. Vielmehr ist das Ergebnis lediglich so zu interpretieren, 

daß sich aus den vorhanden Daten keine handfesten Anhaltspunkte dafür ergeben, 

daß die Nullhypothese falsch ist. Man kann also zunächst einmal weiter an der 

Nullhypothese festhalten, hat sie damit aber nicht verifiziert. 

345 Üblicherweise wird die Nullhypothese bei einer Irrtumswahrscheinlichkeit von 5% oder 

weniger zurückgewiesen. Je nach zugrundeliegender Fragestellung kann man auch beliebige andere 

Grenzen als die 5%-Grenze verwenden, eine Irrtumswahrscheinlichkeit von 38% ist jedoch 

derart hoch, daß man die Nullhypothese unter keinen ersichtlichen Umständen zurückweisen 

kann. 




30.2.2 Einstellungen des Chi-Quadrat-Tests bei SPSS 

Um einen Chi-Quadrat-Test durchzuführen, öffnen Sie das Dialogfeld aus Abbildung 

30.2 mit dem Befehl 

STATISTIK 


CHI-QUADRAT... 

Abbildung 30.2: Dialogfeld des Befehls STATISTIK, 

NICHTPARAMETRISCHE TESTS, CHI-QUADRAT 

Variablen 

Die Variablenliste führt lediglich alle numerischen Variablen der Datendatei auf. 

Textvariablen können Sie mit dem χ 2 -Test daher nicht untersuchen, obwohl es für 

eine sinnvolle Interpretation des Tests genügt, wenn die Variablen nominalskaliert 

sind. Daher müssen Sie Textvariablen ggf. zunächst in eine numerische Variable 

umcodieren. 346 

Verschieben Sie die Variablen, für deren Werte Sie die Häufigkeiten mit exogen 

vorgegebenen erwarteten Häufigkeiten vergleichen möchten, in das Feld Testvariablen. 

Wenn Sie mehrere Variablen auswählen, wird für jede der Variablen ein 

eigener Test durchgeführt. Wenn Sie nicht davon ausgehen, daß die Werte in der 

Testvariablen alle mit der gleichen Häufigkeit vorkommen und daher die erwarteten 

Häufigkeiten in der Gruppe Erwartete Werte manuell festlegen (s.u.), müssen 

diese für alle Testvariablen identisch sein. Ist dies nicht der Fall, müssen Sie die 

Variablen nacheinander durch wiederholtes Aufrufen der Prozedur untersuchen. 

346 Hierzu können Sie zum Beispiel den Befehl TRANSFORMIEREN, UMKODIEREN, IN 

ANDERE VARIABLEN verwenden. 




Erwarteter Bereich 

Per Voreinstellung werden die Häufigkeiten aller in der Testvariablen vorkommenden 

gültigen Werte miteinander verglichen. Abweichend von dieser Voreinstellung 

können Sie jedoch auch einen Wertebereich vorgeben, um nur die Werte 

innerhalb dieses Bereichs in den Test einzubeziehen. Dies bewirkt zugleich, daß 

die Werte in der Testvariablen zu ganzzahligen Werten zusammengefaßt werden: 

¾ Aus den Daten: Diese Option ist voreingestellt. Damit werden die Häufigkeiten 

für alle gültigen Werte der Testvariablen miteinander verglichen. Dabei 

werden auch Dezimalstellen berücksichtigt. Zwischen den Werten 7,53 und 

7,52 wird also unterschieden. 

¾ Angegebenen Bereich verwenden: Sie können einen Bereich der zu berücksichtigenden 

Werte vorgeben. Dies bewirkt gegenüber der Voreinstellung zwei 

Veränderungen. Zum einen werden nur die Werte innerhalb des Bereichs 

- einschließlich der angegebenen Grenzen - berücksichtigt. Werte, die nicht in 

den Bereich fallen, werden von dem Test ausgeschlossen. Zum zweiten werden 

die Dezimalstellen der Werte aus der Testvariablen nicht mehr berücksichtigt. 

Vielmehr werden die Dezimalstellen abgeschnitten, so daß nur der 

ganzzahlige Teil eines Wertes Berücksichtigung findet. Die Werte 7,01 und 

7,99 werden somit beide als 7 interpretiert. Zudem werden auch solche ganzzahligen 

Werte berücksichtigt, die zwar im vorgegebenen Wertebereich, nicht 

aber in der Testvariablen enthalten sind. Für diese Werte wird eine beobachtete 

Häufigkeit von null zugrunde gelegt. 

Auch die Grenzen des zu berücksichtigenden Wertebereichs müssen durch 

ganzzahlige Werte in den Feldern Minimum und Maximum angegeben werden. 

Wenn Sie beispielsweise ein Minimum von -1 und ein Maximum von 2 angeben, 

werden die Häufigkeiten der Werte -1, 0, 1 und 2 betrachtet. 

Erwartete Werte 

Per Voreinstellung wird angenommen, daß alle Werte der Testvariablen in der 

Grundgesamtheit mit der gleichen Häufigkeit vertreten sind. Diese Voreinstellung 

können Sie mit den folgenden Optionen ändern: 

¾ Alle Kategorien gleich: Diese Option ist voreingestellt. Damit wird angenommen, 

daß alle Werte der Testvariablen in der Grundgesamtheit mit der 

gleichen Häufigkeit vertreten sind. Die absoluten erwarteten Häufigkeiten der 

einzelnen Werte ergeben sich damit aus der Anzahl der berücksichtigten Fälle, 

dividiert durch die Anzahl der unterschiedlichen Werte in der Testvariablen. 

¾ Werte: Wenn Sie nicht von gleichen erwarteten Häufigkeiten für alle Werte 

der Testvariablen ausgehen, können Sie die erwartete Häufigkeit für jeden 

Wert einzeln festlegen. Hierzu müssen Sie für jeden Wert der Testvariablen 

einen Wert vorgeben, es darf also kein Wert unberücksichtigt bleiben. Sollten 

Sie in der Gruppe Erwarteter Bereich einen Wertebereich festgelegt haben, 

müssen Sie für jeden ganzzahligen Wert aus dem Bereich eine erwartete Häu- 




figkeit angeben, auch wenn einzelne Werte in der Testvariablen gar nicht vorkommen. 

Um die erwarteten Häufigkeiten festzulegen, gehen Sie folgendermaßen vor: 

y Legen Sie als erstes die erwartete Häufigkeit für den kleinsten in der 

Testvariablen vorkommenden Wert fest. 347 Schreiben Sie den Wert in das 

Eingabefeld, und klicken Sie auf die Schaltfläche Hinzufügen. Daraufhin 

wird der Wert in das Listenfeld übertragen. 

y Legen Sie nun auf die gleiche Weise die erwarteten Häufigkeiten der übrigen 

Werte fest. Beachten Sie hierbei, daß die Häufigkeiten in aufsteigender 

Reihenfolge der Werte aus der Testvariablen zugeordnet werden. 

y Um einen bereits in das Listenfeld eingefügten Wert zu ändern, markieren 

Sie den betreffenden Eintrag, ändern Sie den Wert in dem Eingabefeld, und 

wählen Sie anschließend die Schaltfläche Ändern. Um einen Wert aus der 

Liste zu löschen, markieren Sie ihn, und wählen Sie die Schaltfläche Entfernen. 

Beachten Sie hierbei jedoch, daß die verbleibenden Werte in der 

Liste am Ende in ihrer Reihenfolge den Werten aus der Testvariablen entsprechen 

müssen. 

Optionen 

Mit der Schaltfläche Optionen öffnen Sie das Dialogfeld aus Abbildung 30.3. Dort 

können Sie ergänzenden Output mit deskriptiven Maßzahlen und den Quartilen 

der Testvariablen anfordern und den Ausschluß von Fällen mit fehlenden Werten 

steuern. 

Abbildung 30.3: Dialogfeld der Schaltfläche „Optionen“ 

Statistiken: Mit den beiden folgenden Optionen können Sie ergänzenden Output 

anfordern: 

¾ Deskriptive Statistik: Hiermit werden die Anzahl der Fälle mit gültigen Werten, 

der Mittelwert, die Standardabweichung sowie der kleinste und der größte 

347 Es genügt, wenn die Häufigkeiten die Relationen richtig widerspiegeln. Sie können also 

wahlweise die erwarteten relativen Häufigkeiten oder ein beliebiges Vielfaches der erwarteten 

relativen Häufigkeiten angeben. 




Wert angegeben. Beachten Sie, daß der Mittelwert und die Standardabweichung 

nur bei Variablen mit Intervallskalenniveau sinnvoll interpretiert werden 

können. 

¾ Quartile: Es werden das 25%-, das 50%- und das 75%-Perzentil sowie die Anzahl 

der Fälle mit gültigen Werten mitgeteilt. 

Fehlende Werte: Wenn Sie mehr als eine Testvariable ausgewählt haben, können 

Sie mit den beiden folgenden Optionen den Ausschluß von Fällen mit fehlenden 

Werten steuern. Wenn Sie nur eine Testvariable betrachten, haben beide Optionen 

den gleichen Effekt. 

¾ Fallausschluß Test für Test: Diese Option ist voreingestellt. Bei der Untersuchung 

der einzelnen Testvariablen werden nur jeweils die Fälle ausgeschlossen, 

die in der betreffenden Variablen einen fehlenden Wert aufweisen. Fälle 

mit fehlenden Werten in anderen Testvariablen werden dagegen in den Test 

einbezogen. 

¾ Listenweiser Fallausschluß: Alle Fälle, die in mindestens einer der Testvariablen 

einen fehlenden Wert aufweisen, werden aus der gesamten Prozedur ausgeschlossen. 

30.3 Binomial-Test 

Mit einem Binomial-Test können Sie für eine dichotome Variable - dies ist eine 

Variable mit nur zwei unterschiedlichen Wertausprägungen - untersuchen, ob die 

beobachteten Häufigkeiten mit exogen vorgegebenen erwarteten Häufigkeiten 

vereinbar sind. Hierbei ist es nicht erforderlich, daß die Testvariable tatsächlich 

nur zwei unterschiedliche Werte enthält. Vielmehr können die Werte der Variablen 

beim Binomial-Test dichotomisiert, also zu zwei Gruppen zusammengefaßt, 

werden. 

30.3.1 Interpretation eines Binomial-Tests 

In der Datei allbus.sav ist unter anderem das Geschlecht der Befragten (Variable 

v141) angegeben. Hierbei handelt es sich naturgemäß um eine dichotome Variable. 

Im folgenden soll die Hypothese getestet werden, in der Grundgesamtheit der 

Allbus-Daten seien Männer und Frauen zu gleichen Anteilen vertreten. Hierzu 

wird mit Hilfe eines Binomial-Tests untersucht, ob die in der Stichprobe beobachteten 

Häufigkeiten dieser Hypothese widersprechen. Um diesen Test durchzuführen, 

sind die folgenden Einstellungen erforderlich: 

¾ Daten: Die Daten entstammen der Datendatei allbus.sav. Auch hier werden 

wie bei dem im vorhergehenden Abschnitt durchgeführten Chi-Quadrat-Test 



30.3 Binomial-Test 749 

nur die Personen aus den neuen Bundesländern betrachtet, und es werden ungewichtete 

Daten verwendet. 348 

¾ Binomial-Test aufrufen: Um den Test aufzurufen, wählen Sie den Befehl 

STATISTIK 


BINOMIAL... 

¾ Einstellungen: Fügen Sie die Variable v141 in das Feld Testvariablen ein. Bei 

den übrigen Optionen werden die Voreinstellungen verwendet (siehe 

Abbildung 30.5, S. 750). Damit wird die Hypothese getestet, in der Grundgesamtheit 

seien Männer und Frauen mit der gleiche Häufigkeit vertreten. 

Mit diesen Einstellungen erhalten Sie den Output aus Abbildung 30.4. In der 

Spalte N werden zunächst die beobachteten Häufigkeiten der beiden Kategorien 

mitgeteilt. Die Stichprobe umfaßt 160 Männer und 189 Frauen aus den neuen 

Bundesländern. Damit sind die beiden Gruppen in der Stichprobe offensichtlich 

nicht zu gleichen Anteilen vertreten. Die relativen Häufigkeiten aus der Stichprobe 

werden in der Spalte Beobachteter Anteil ausgewiesen. Da die Stichprobe insgesamt 

349 Personen aus den neuen Ländern umfaßt, stellen die 189 Frauen einen 

Anteil von 54% dar. Entsprechend beträgt der Anteil der Männer 46%. Bei Gültigkeit 

der Nullhypothese wäre dagegen ein Anteil von jeweils 50% zu erwarten 

gewesen. Von diesem erwarteten Anteil können sich durch die Stichprobenbetrachtung 

zufällige Abweichungen ergeben. Ob sich die Abweichungen der beobachteten 

von den erwarteten Häufigkeiten plausibel durch Zufallseinflüsse erklären 

lassen und folglich mit der Nullhypothese, in der Grundgesamtheit seien beide 

Gruppen zu gleichen Anteilen vertreten, vereinbar sind, wird mit dem Binomial- 

Test untersucht. Die Wahrscheinlichkeit dafür, daß sich bei Gültigkeit der Nullhypothese 

mindestens so große Abweichungen ergeben wie in der vorliegenden 

Stichprobe, beträgt 0,134 bzw. 13,4%. Dieser Wert wird in der Spalte Asymptotische 

Signifikanz mitgeteilt. Der Wert läßt sich auch folgendermaßen interpretieren: 

Weist man die Nullhypothese, in der Grundgesamtheit seien Männer und 

Frauen zu gleichen Anteilen vertreten, zurück, begeht man mit einer Wahrscheinlichkeit 

von 13,4% einen Irrtum. 

V141 

Gruppe 1 

Gruppe 2 

Gesamt 

Test auf Binomialverteilung 

Asymptotische 

Beobachteter 

Signifikanz 

Kategorie N 

Anteil Testanteil (2-seitig) 

MANN 160 ,46 ,50 ,134 a 

FRAU 189 ,54 

349 1,00 

a. Basiert auf der Z-Approximation. 

Abbildung 30.4: Ergebnis des Binomial-Tests für die Variable „v434“ 

348 Um diese Einstellungen herbeizuführen, siehe die Aufzählungspunkte Fälle auswählen 

und Fälle nicht gewichten, S. 742. 




30.3.2 Einstellungen des Binomial-Tests bei SPSS 

Die Einstellungen zum Durchführen eines Binomial-Tests werden in dem Dialogfeld 

aus Abbildung 30.5 vorgenommen. Um dieses Dialogfeld zu öffnen, wählen 

Sie den Befehl 

STATISTIK 


BINOMIAL... 


NICHTPARAMETRISCHE TESTS, BINOMIAL 

Variablen 

In der Variablenliste werden lediglich die numerischen Variablen der Datendatei 

aufgeführt. Um Textvariablen mit einem Binomial-Test zu untersuchen, müssen 

Sie diese daher zuvor in eine numerische Variable umcodieren. 

Fügen Sie die zu untersuchenden Variablen in das Feld Testvariablen ein. Wenn 

Sie mehr als eine Testvariable angeben, wird für jede Variable ein eigener Test 

durchgeführt. Per Voreinstellung wird die Hypothese untersucht, die beiden Werte 

der Testvariablen seien in der Grundgesamtheit mit der gleichen Häufigkeit vertreten. 

Sie können einen anderen Testanteil zugrunde legen (s.u., Abschnitt Testanteil), 

dieser gilt dann jedoch für alle Testvariablen gleichermaßen. 

Dichotomie definieren 

Sie können auch Testvariablen untersuchen, die mehr als zwei unterschiedliche 

Werte enthalten, diese müssen dann jedoch zu zwei Gruppen zusammengefaßt 

werden: 

¾ Aus den Daten: Behalten Sie diese voreingestellte Option bei, wenn die 

Testvariable nur zwei unterschiedliche Werte enthält. Es werden dann die Häufigkeiten 

dieser beiden Werte untersucht. 



30.4 Sequenzanalyse 751 

¾ Trennwert: Enthält die Testvariable mehr als zwei unterschiedliche Werte, 

wählen Sie diese Option, und geben Sie einen Trennwert an, der die Werte in 

zwei Gruppen unterteilt. Alle Werte, die kleiner oder gleich dem Trennwert 

sind, bilden die eine Gruppe, Werte über dem Trennwert werden zu der zweiten 

Gruppen zusammengefaßt. Der Trennwert kann insgesamt fünf Zeichen 

(einschließlich Dezimaltrennzeichen) umfassen. Die Gruppe mit den kleineren 

Werte wird als erste Gruppe angesehen. Auf diese beziehen sich die Angaben 

über die erwarteten und realisierten Häufigkeiten. 

Testanteil 

Per Voreinstellung wird für die beiden Werte bzw. für die Wertegruppen jeweils 

eine relative Häufigkeit von 0,5 erwartet. Um diese Voreinstellung zu ändern, geben 

Sie die erwartete Häufigkeit des ersten Wertes an. Dies ist der Wert, der in der 

Datendatei als erstes aufgeführt wird. Bei gruppierten Werten ist es dagegen die 

Gruppe mit den niedrigeren Werten. Sie können eine erwartete Häufigkeit zwischen 

0,001 und 0,999 angeben. Der Wert darf insgesamt nur vier Zeichen umfassen, 

Sie können jedoch die führende null vor dem Dezimaltrennzeichen weglassen. 

Optionen 

Die Schaltfläche Optionen öffnet das Dialogfeld aus Abbildung 30.3, S. 747. Dort 

können Sie ergänzenden Output anfordern und den Ausschluß von Fällen mit 

fehlenden Werten steuern. Zur Bedeutung der Optionen siehe im einzelnen Abschnitt 

Optionen, S. 747. 

30.4 Sequenzanalyse 

Mit der Sequenzanalyse können Sie für eine dichotome Variable - eine Variable 

mit nur zwei unterschiedlichen Wertausprägungen - bzw. für eine dichotomisierte 

Variable testen, ob die Werte in zufälliger Reihenfolge auftreten oder ob sie ein 

Muster aufweisen. 

30.4.1 Interpretation einer Sequenzanalyse 

Die Erfahrung legt die Vermutung nahe, daß Sonnen- und Regentagen nicht zufällig 

aufeinanderfolgen. Hat es einen Tag lang geregnet, ist es nicht unplausibel, 

auch für den kommenden Tag eher Regen als Sonnenschein zu erwarten, sofern 

nicht bessere Informationen über das Wetter vorliegen. In einem fiktiven Beispiel 

sei das Wetter an 40 Tagen beobachtet und mit den Werten 0 (Sonnenschein) und 

1 (Regen) codiert worden, wobei sich die folgende Sequenz von Sonnen- und Regentagen 

ergeben habe: 

1 0 1 1 0 1 0 1 1 0 0 1 0 0 0 1 0 0 1 0 1 1 1 0 1 0 0 1 1 0 0 0 1 0 0 1 0 1 0 1 




Die Datendatei Wetter.sav von der Begleit-CD enthält lediglich eine einzige Variable, 

die ebenfalls den Namen wetter hat und die dargestellte Wertefolge enthält. 

Im folgenden soll mit einem Sequenztest untersucht werden, ob vor dem Hintergrund 

der (fiktiven) Beobachtungen an der Hypothese zufällig aufeinanderfolgender 

Sonnen- und Regentage festgehalten werden kann. Zum Durchführen des 

Tests werden die folgenden Einstellungen vorgenommen: 

¾ Befehl: Um eine Sequenzanalyse durchzuführen, wählen Sie den Befehl 

STATISTIK 


SEQUENZEN... 

¾ Einstellungen: Verschieben Sie in dem Dialogfeld Sequenzentest die Variable 

Wetter in das Feld Testvariablen. In der Gruppe Trennwert wird die Option 

Anderer gewählt und der Wert 1 in das zugehörige Eingabefeld eingegeben. 

Die übrigen Optionen der Gruppe Trennwert werden abgewählt. Abbildung 

30.7, S. 753 zeigt das Dialogfeld mit diesen Einstellungen. 

Als Ergebnis wird die Tabelle aus Abbildung 30.6 ausgegeben. In der Zeile Testwert 

wird noch einmal der Wert mitgeteilt, den wir im Dialogfeld als Testwert 

vorgegeben haben. Die untersuchte Gesamtsequenz umfaßt 40 Werte (Gesamtzahl 

der Fälle), die sich in 27 Sequenzen unterteilen. Eine Sequenz in diesem Sinne ist 

eine Folge gleicher Werte. Die ersten fünf Werte der Gesamtsequenz lauten 1 0 1 

1 0 (s.o.). Diese fünf Werte bilden die vier Sequenzen 1 - 0 - 1 1 - 0. Entsprechend 

läßt sich die Gesamtsequenz in 27 derartige Sequenzen unterteilen. 

Sequenzentest 

Testwert a 

Gesamte Fälle 

Anzahl der Sequenzen 

Z 


(2-seitig) 

a. Benutzerdefiniert 

WETTER 

1 

40 

27 

1,783 

,075 

Abbildung 30.6: Ergebnis der Sequenzanalyse 

Auf der Basis dieser Werte wird die Nullhypothese getestet, die Sonnen- und Regentage 

und damit die Werte 0 und 1 würden in der Grundgesamtheit rein zufällig 

aufeinanderfolgen. In der Zeile Asymptotische Signifikanz wird das Ergebnis dieses 

Tests mitgeteilt. Ist die Nullhypothese wahr, ergibt sich eine Folge von Sonnen- 

und Regentagen, wie sie in der Stichprobe vorliegt, nur mit einer Wahrscheinlichkeit 

von 0,075 bzw. 7,5%. Umgekehrt bedeutet dies: Weist man die 

Nullhypothese zurück, begeht man mit einer Wahrscheinlichkeit von 7,5% einen 

Fehler. Diese Wahrscheinlichkeit ist zwar sehr gering, aber vermutlich noch nicht 

gering genug, um die Nullhypothese tatsächlich abzulehnen. 



30.4 Sequenzanalyse 753 

Ergibt sich bei einem Test eine noch geringere Irrtumswahrscheinlichkeit, so daß 

die Nullhypothese zurückgewiesen wird, besagt dies noch nichts über das „wahre“ 

Muster der untersuchten Daten, das in diesem Fall in dem tatsächlichen Zusammenhang 

zwischen Sonnen- und Regentagen bestehen würde. Eine geringe Irrtumswahrscheinlichkeit 

ergibt sich sowohl dann, wenn aufeinanderfolgende Beobachtungen 

häufig den gleichen Wert aufweisen, als auch in dem Fall, daß sich 

die Werte häufig abwechseln und damit benachbarte Beobachtungen unterschiedliche 

Werte enthalten. 

30.4.2 Einstellungen der Sequenzanalyse bei SPSS 

Zum Durchführen einer Sequenzanalyse dient das Dialogfeld aus Abbildung 30.7. 

Um das Dialogfeld zu öffnen, wählen Sie den Befehl 

STATISTIK 


SEQUENZEN... 


NICHTPARAMETRISCHE TESTS, SEQUENZEN 

Variablen 

In der Variablenliste werden nur die numerischen Variablen der Datendatei aufgeführt. 

Textvariablen können Sie mit einer Sequenzanalyse daher nicht untersuchen, 

ohne sie zuvor in eine numerische Variable umzucodieren. 

Verschieben Sie die Variablen, für die eine Sequenzanalyse durchgeführt werden 

soll, in das Feld Testvariablen. Wenn Sie mehr als eine Testvariable angeben, 

wird für jede Variable ein eigener Test durchgeführt, die Ergebnisse werden jedoch 

gemeinsam in einer Pivot-Tabelle dargestellt. 




Trennwert 

Sie können mit der Sequenzanalyse auch Variablen untersuchen, die mehr als zwei 

unterschiedliche Werte enthalten. In diesem Fall müssen die Werte jedoch dichotomisiert, 

also in zwei Gruppen zusammengefaßt werden. Anstatt der Folge einzelner 

Werte wird dann die Folge der Gruppenzugehörigkeiten untersucht. 

Um die Werte zu dichotomisieren, müssen Sie einen Trennwert angeben. Alle 

Werte der Variablen, die größer oder gleich dem Trennwert sind, werden dann zu 

einer Gruppe zusammengefaßt, alle Werte, die kleiner sind als der Trennwert, bilden 

die zweite Gruppe. Die Angabe eines Trennwertes ist auch dann erforderlich, 

wenn die Variable ohnehin nur zwei unterschiedliche Werte enthält. 

Die folgenden vier Optionen stehen zur Verfügung, um den Trennwert zu definieren. 

Die Optionen schließen sich nicht gegenseitig aus. Wenn Sie mehr als eine 

Option ankreuzen, wird für jeden Trennwert ein eigener Sequenztest durchgeführt. 

¾ Median: Das 50%-Perzentil der Variablen bildet den Trennwert. 

¾ Modalwert: Der Modus, also der am häufigsten in der Variable vorkommende 

Wert, wird als Trennwert verwendet. 

¾ Mittelwert: Das arithmetische Mittel der Variablen bildet den Trennwert. 

¾ Anderer: Mit dieser Option können Sie den Trennwert frei festlegen, indem 

Sie ihn in das zugehörige Eingabefeld schreiben. Der Wert kann bis zu fünf 

Zeichen umfassen, zu denen auch ein eventuelles Dezimaltrennzeichen zählt. 

Diese Option können Sie auch verwenden, wenn die Variable ohnehin nur 

zwei unterschiedliche Werte enthält. Legen Sie dann den größeren der beiden 

Werte als Trennwert fest. 

Optionen 





30.5 Ein-Stichproben-Kolmogorov-Smirnov-Test 

Mit dem Kolmogorov-Smirnov-Test können Sie überprüfen, ob die Werte einer 

Variablen einer theoretischen Verteilung folgen. Dabei können Sie den Test für 

eine Normal-, Poisson-, Gleich- oder Exponentialverteilung durchführen. 



30.5 Ein-Stichproben-Kolmogorov-Smirnov-Test 755 

30.5.1 Interpretation des Ein-Stichproben-Kolmogorov- 

Smirnov-Tests 

In der Datendatei allbus.sav mit den Ergebnissen der Bevölkerungsbefragung ist 

unter anderem in der Variablen v338 die Dauer des Interviews in Minuten angegeben. 

Im folgenden soll mit dem Kolmogorov-Smirnov-Test untersucht werden, ob 

die Annahme, die Dauer des Interviews folge einer Normalverteilung, vor dem 

Hintergrund der Beobachtungen aus der Stichprobe aufrechterhalten werden kann. 

¾ Daten: Die Daten entstammen der Datei allbus.sav. Im folgenden sollen nur 

die Personen aus den neuen Bundesländern betrachtet werden. Damit entfällt 

auch Notwendigkeit zur Gewichtung der Daten. 349 

¾ Kolmogorov-Smirnov-Test aufrufen: Um den Test aufzurufen, wählen Sie 

den Befehl 

STATISTIK 


K-S BEI EINER STICHPROBE... 

¾ Einstellungen: Fügen Sie in dem Dialogfeld der Prozedur die Variable v338 in 

das Feld Testvariablen ein. Bei den übrigen Optionen werden die Voreinstellungen 

verwendet. Abbildung 30.9, S. 756 zeigt die für dieses Beispiel verwendeten 

Einstellungen. 

Die Ergebnisse des Tests werden in Abbildung 30.8 dargestellt. Der Test wird anhand 

der größten (absoluten) Abweichung der empirischen von der theoretischen 

Verteilung durchgeführt. Die größte absolute, die größte positive und die größte 

negative Abweichung der beiden Verteilungen voneinander werden als Extremste 

Differenzen in der Tabelle ausgewiesen. Zudem werden die Parameter der Normalverteilung 

angegeben, mit der die empirische Verteilung verglichen wird. Die 

Parameter einer Normalverteilung sind der Mittelwert und die Standardabweichung. 

Die ausgewiesenen Werte von 59,26 bzw. 19,41 entsprechen den Werten 

der Variablen v338 in der betrachteten Stichprobe. Die durchgeführten Interviews 

dauerten in den neuen Bundesländern somit im Durchschnitt 59,26 Minuten. 

Das eigentliche Ergebnis des Tests wird in der untersten Zeile mit der Beschriftung 

Asymptotische Signifikanz angegeben. Dies ist die Irrtumswahrscheinlichkeit, 

die mit einem Zurückweisen der Nullhypothese verbunden ist. Die getestete Nullhypothese 

besagt, daß die Dauer des Interviews in der Grundgesamtheit einer 

Normalverteilung folgt. Die Wahrscheinlichkeit für das Zutreffen der Hypothese 

wird mit 0,000 angegeben. Die Nullhypothese kann damit zurückgewiesen werden. 

Trotz dieser geringen Irrtumswahrscheinlichkeit ist es möglich, daß die Werte in 

der Grundgesamtheit annähernd normalverteilt sind. Dies genügt bereits als Voraussetzung 

für viele statistische Prozeduren. Um einen Eindruck von der Ähnlich- 

349 Um diese Einstellungen herbeizuführen, siehe die Aufzählungspunkte Fälle auswählen 

und Fälle nicht gewichten, S. 742. 




keit der empirischen Verteilung mit der Normalverteilung zu gewinnen, kann zum 

Beispiel ein Histogramm mit Normalverteilungskurve erstellt werden. 

Kolmogorov-Smirnov-Anpassungstest 

N 

Parameter der Normalverteilung a,b 

Extremste Differenzen 

Kolmogorov-Smirnov-Z 

Asymptotische Signifikanz (2-seitig) 

Mittelwert 

Standardabweichung 

Absolut 

Positiv 

Negativ 

V338 

348 

59,26 

19,41 

,126 

,126 

-,074 

2,344 

,000 

a. Die zu testende Verteilung ist eine Normalverteilung. 

b. Aus den Daten berechnet. 

Abbildung 30.8: Ergebnis des Kolmogorov-Smirnov-Tests für 

die Variable „v338“ zum Testen auf eine Normalverteilung 

30.5.2 Einstellungen des Kolmogorov-Smirnov-Tests bei SPSS 

Um einen Kolmogorov-Smirnov-Test bei einer Stichprobe durchzuführen, wählen 

Sie den folgenden Befehl, der das Dialogfeld aus Abbildung 30.9 öffnet: 

STATISTIK 


K-S BEI EINER STICHPROBE... 

Abbildung 30.9: Dialogfeld des Befehls STATISTIK, NICHTPARA- 

METRISCHE TESTS, K-S BEI EINER STICHPROBE 



30.6 Tests für zwei unabhängige Stichproben 757 

Variablen 

In der Variablenliste werden nur die numerischen Variablen der Datendatei aufgeführt, 

denn der Kolmogorov-Smirnov-Test ist nur für Variablen mit Intervallskalenniveau 

sinnvoll durchzuführen. Verschieben Sie die zu testenden Variablen in 

das Feld Testvariablen. Wenn Sie hier mehr als eine Variablen angeben, wird für 

jede Variable ein eigenständiger Test durchgeführt. 

Testverteilung 

Per Voreinstellung wird ein Test auf Normalverteilung durchgeführt, es stehen jedoch 

die folgenden vier Verteilungen zur Verfügung: 

¾ Normalverteilung: Testet auf eine Normalverteilung mit dem Mittelwert und 

der Standardabweichung der Stichprobe. 

¾ Gleichverteilung: Testet auf eine Gleichverteilung über den gesamten Wertebereich 

der Testvariablen. 

¾ Poissonverteilung: Testet auf eine Poissonverteilung mit dem Mittelwert der 

Stichprobe. 

¾ Exponentialverteilung: Testet auf eine Exponentialverteilung mit dem Mittelwert 

der Stichprobe. 

Optionen 





30.6 Tests für zwei unabhängige Stichproben 

Insgesamt stehen vier Tests zum Vergleichen zweier unabhängiger Stichproben 

zur Verfügung. 350 Mit dem Mann-Whitney-Test, dem Kolmogorov-Smirnov-Test 

und dem Wald-Wolfowitz-Test überprüfen Sie jeweils die Hypothese, die beiden 

Stichproben würden derselben Grundgesamtheit entstammen. Der Moses-Test 

vergleicht dagegen die Spannweite der beiden Stichproben. Er testet die Hypothese, 

die Spannweite sei in beiden Stichproben gleich groß. Der Kolmogorov- 

Smirnov-Test setzt intervallskalierte Variablen voraus, für die drei übrigen Tests 

ist Ordinalskalenniveau ausreichend. 

350 Zum Begriff von unabhängigen und abhängigen Stichproben siehe Kapitel 19, T-Test. 




30.6.1 Interpretation der Testergebnisse 

In den Befragungsdaten der allbus-Datei von der Begleit-CD sind unter anderem 

das Nettoeinkommen (Variable v261) und das Geschlecht der Befragten (v141) 

angegeben. Im folgenden soll untersucht werden, ob sich die Einkommensangaben 

von Männern und Frauen so ähnlich sind, daß auf eine einheitliche Grundgesamtheit 

geschlossen werden kann, oder ob von zwei unterschiedlichen Grundgesamtheiten 

auszugehen ist. 

Mann-Whitney-Test 

Der Mann-Whitney-Test für die beschriebene Fragestellung wird folgendermaßen 

angefordert: 



auch die Notwendigkeit zur Gewichtung der Daten. 351 

¾ Test für zwei unabhängige Stichproben aufrufen: Um den Test aufzurufen, 

wählen Sie den Befehl 

STATISTIK 


ZWEI UNABHÄNGIGE STICHPROBEN... 

¾ Einstellungen: Fügen Sie in dem Dialogfeld der Prozedur die Variablen v261 

in das Feld Testvariablen und v141 in das Feld Gruppenvariable ein. Klicken 

Sie anschließend auf die Schaltfläche Gruppen definieren, 352 und geben Sie in 

dem damit geöffneten Dialogfeld die Werte 1 und 2 in die beiden Eingabefelder 

ein. 

Bei allen anderen Optionen werden die Voreinstellungen verwendet. Dies bedeutet 

insbesondere, daß in der Gruppe Welche Tests durchführen? die Option 

Mann-Whitney-U-Test angekreuzt bleibt. Diese Einstellungen, die in dem 

Dialogfeld in Abbildung 30.12 auf S. 762 dargestellt sind, liefern den Output 

aus Abbildung 30.10. 

Bei einem Mann-Whitney-Test werden die Werte der beiden Gruppen zunächst zu 

einer Gruppe zusammengefaßt und in aufsteigender Folge geordnet. Jedem der 

Werte wird seiner Position in der Ordnung entsprechend ein Rang zugewiesen. 

Anschließend wird für die beiden Gruppen getrennt die Summe der Rangwerte 

berechnet. Anhand der beiden sich dabei ergebenden Summen wird die Hypothese 

getestet, die beiden Stichproben würden der gleichen Grundgesamtheit entstammen. 

Trifft die Hypothese zu, sollten die Werte der beiden Gruppen in der zu Be- 

351 In den Aufzählungspunkten Fälle auswählen und Fälle nicht gewichten, S. 742 wird beschrieben, 

wie Sie diese Einstellungen in der Datendatei herbeiführen können. 

352 Diese Schaltfläche ist nur aktiv, wenn bereits eine Gruppenvariable ausgewählt wurde 

und diese aktuell markiert ist. 




ginn gebildeten Reihenfolge in etwa gleichmäßig verteilt sein, die durchschnittlichen 

Ränge beider Gruppen sollten also ungefähr die gleiche Größe haben. 

Ränge 

V261 

V141 

MANN 

FRAU 

Gesamt 

Mittlerer 

N Rang Rangsumme 

95 121,37 11530,00 

109 86,06 9380,00 

204 

Statistik für Test a 3385,000 

Mann-Whitney-U 

Wilcoxon-W 

Z 


(2-seitig) 

a. Gruppenvariable: V141 

V261 

9380,000 

-4,266 

,000 

Abbildung 30.10: Ergebnis des Mann-Whitney-Tests für zwei unabhängige Stichproben 

Der durchschnittliche Rang (Mittlerer Rang) für das Einkommen der Frauen liegt 

mit 86,06 deutlich unter dem mittleren Rang von 121,37, der sich für das Einkommen 

der Männer ergeben hat. Dies deutet bereits darauf hin, daß die Nullhypothese 

falsch ist und die beiden Stichproben nicht der gleichen Grundgesamtheit 

entstammen. Selbst wenn sich sehr ähnliche mittlere Rangwerte ergeben hätten, 

könnte daraus jedoch noch nicht geschlossen werden, daß die Stichproben aus der 

gleichen Grundgesamtheit stammen. Es wäre beispielsweise denkbar, daß Männer 

entweder sehr hohe oder sehr niedrige Einkommen erzielen, während Frauen 

überwiegend im mittleren Bereich der Einkommensverteilung anzutreffen sind. In 

diesem Fall würden die durchschnittlichen Rangwerte bei Männern und Frauen 

ungefähr gleich groß sein, obwohl die tatsächliche Verteilung der Werte sehr unterschiedlich 

wäre und die beiden Gruppen nicht der gleichen Grundgesamtheit 

zugeordnet werden könnten. Aus diesem Grund wird neben den durchschnittlichen 

Rangwerten zusätzlich untersucht, wie häufig ein Wert der ersten Gruppe einem 

der zweiten Gruppe vorausgeht bzw. wie häufig ein Wert der zweiten Gruppe vor 

einem der ersten Gruppe angeordnet ist. Die geringere der beiden Häufigkeiten 

wird in der rechten Tabelle in der Zeile mit der Beschriftung Mann-Whitney-U angegeben. 

Bei der Berechnung wird für jeden Wert der zweiten Gruppe die Anzahl 

der Werte aus der ersten Gruppe gezählt, die einen niedrigeren Rang haben. Die so 

gezählten Werte werden addiert, so daß jeder Wert der ersten Gruppe mehrmals in 

die Zählung eingehen kann. 

Beispiel: Bei den vier Werten, die in geordneter Form den beiden Gruppen in der 

Reihenfolge 1 2 1 2 zuzuordnen sind, gehen drei Werte aus der Gruppe 1 der 

Gruppe 2 voraus, da der ersten 2 ein Wert der ersten Gruppe und der zweiten 2 

zwei Werte der ersten Gruppe vorausgehen. Umgekehrt geht nur ein Wert der 

zweiten Gruppe den Werten der ersten Gruppe voraus. In der Zeile mit der Beschriftung 

Wilcoxon-W wird zusätzlich die Summe der Ränge angegeben, die sich 

für die Gruppe mit der geringeren Fallzahl ergibt, bei diesem Test also für die 

Gruppe der Frauen. 

Anhand dieser Werte wird eine Signifikanz für die Nullhypothese berechnet. Für 

dieses Beispiel wird der Signifikanzwert mit 0,000 angegeben und ist damit kleiner 

als 0,0005. Bei einer derart niedrigen Irrtumswahrscheinlichkeit kann die 




Nullhypothese, die Einkommensangaben von Männern und Frauen würden der 

gleichen Grundgesamtheit entstammen, zurückgewiesen werden. 

Moses-Test 

Um die Spannweite der Einkommensangaben von Männern und Frauen aus den 

neuen Bundesländern zu vergleichen, kann mit einem Moses-Test die Nullhypothese 

getestet werden, nach der die Spannweiten beider Stichproben in der Grundgesamtheit 

gleich sind. Um einen solchen Test durchzuführen, können Sie die 

oben (S. 758) beschriebenen Einstellungen verwenden. Sie müssen lediglich im 

Hauptdialogfeld der Prozedur die Option Extremreaktionen nach Moses aus der 

Gruppe Welche Tests durchführen? ankreuzen. Die Ergebnisse dieses Tests sind in 

Abbildung 30.11 wiedergegeben. 

Häufigkeiten 

V261 

V141 

MANN (Kontrolle) 

FRAU (Experimentell) 

Gesamt 

N 

95 

109 

204 

Statistik für Test a,b 203 

Beobachtete Spannweite der 

Kontrollgruppe 

Spannweite der getrimmten 

Kontrollgruppe 

Ausreißer an beiden Enden entfernt 

a. Moses-Test 

b. Gruppenvariable: V141 

Signifikanz (1-seitig) 

Signifikanz (1-seitig) 

V261 

,784 

179 

,136 

4 

Abbildung 30.11: Ergebnisse eines Moses-Tests für zwei unabhängige Stichproben 

In der oberen Tabelle wird lediglich die Anzahl der Fälle für die beiden Gruppen 

mitgeteilt. Der Moses-Test verwendet eine der beiden Gruppen als Kontrollgruppe. 

Wie aus der oberen Tabelle hervorgeht, ist dies in diesem Fall die Gruppe der 

Männer. Die Werte beider Gruppen werden gemeinsam geordnet und der Ordnung 

entsprechend mit Rangwerten versehen. Für die Kontrollgruppe wird die Spannweite 

der Rangwerte als Differenz zwischen dem größten und dem kleinsten Rang 

berechnet. Diese Spannweite wird in der unteren Tabelle in der Zeile Beobachtete 

Spannweite der Kontrollgruppe mit 203 angegeben. Bei einer Gesamtstichprobe 

von 204 Fällen bedeutet dies, daß entweder der größte und der zweitkleinste oder 

umgekehrt der zweitgrößte sowie der kleinste Rang einem Wert der Kontrollgruppe 

zugeordnet wurde. 353 

353 Die Spannweite wird beim Moses-Test von SPSS berechnet als Höchster Rang – Niedrigster 

Rang + 1 und nicht, wie erwartet werden könnte, als Höchster Rang – Niedrigster Rang. 

Die größte erreichbare Spannweite entspricht damit der Anzahl der Beobachtungen. 




Die Wahrscheinlichkeit dafür, daß sich eine solche Spannweite für die Kontrollgruppe 

ergibt, wenn die beiden Stichproben (Männer und Frauen) in der Grundgesamtheit 

die gleiche Spannweite aufweisen, beträgt 78,4%. Dieser Wert wird in 

der Zeile Signifikanz (1-seitig) für die Beobachtete Spannweite der Kontrollgruppe 

angegeben. Bei einer derart hohen Irrtumswahrscheinlichkeit kann die Nullhypothese 

nicht zurückgewiesen werden. Aus der Stichprobe ergibt sich somit kein 

Hinweis darauf, daß die Einkommenswerte von Männern und Frauen in der 

Grundgesamtheit eine unterschiedliche Spannweite aufweisen. 

Bei der Betrachtung von Spannweiten können die Ergebnisse leicht durch einzelne 

Ausreißer verzerrt werden. Aus diesem Grund wird ein zweiter Signifikanzwert 

mitgeteilt, der sich auf eine getrimmte Kontrollgruppe bezieht, also auf eine Kontrollgruppe, 

aus der einige Ausreißer entfernt wurden. In der untersten Zeile der 

Tabelle wird angegeben, daß an jedem Ende der gesamten Rangordnung (die sowohl 

Männer als auch Frauen umfaßt) vier Werte entfernt wurden. Damit verringert 

sich die Fallzahl der Gesamtstichprobe um 8 auf 196. Die Spannweite der 

Kontrollgruppe hat sich dabei jedoch wesentlich stärker verringert, und zwar um 

24 auf 179. Dieser Wert wird als Spannweite der getrimmten Kontrollgruppe ausgewiesen. 

Die Wahrscheinlichkeit für das Eintreten einer Spannweite dieser Größe 

beträgt bei Gültigkeit der Nullhypothese nur noch 13,6%. Unter Ausschluß der 

extremen Werte kann die Nullhypothese damit bei weitem nicht so deutlich bestätigt 

werden wie bei Einbeziehung der Ausreißer, allerdings läßt sich die Nullhypothese 

auch bei einer Irrtumswahrscheinlichkeit von 13,6% nicht zurückweisen. 

30.6.2 Einstellungen der Tests für zwei unabhängige Stichproben 

bei SPSS 

Um nichtparametrische Tests für zwei unabhängige Stichproben durchzuführen, 

öffnen Sie mit dem folgenden Befehl das Dialogfeld aus Abbildung 30.12: 

STATISTIK 


ZWEI UNABHÄNGIGE STICHPROBEN... 

In der Variablenliste werden nur die numerischen Variablen der Datendatei aufgeführt. 

Textvariablen können weder als Test- noch als Gruppenvariable verwendet 

werden, obwohl die Gruppenvariable lediglich Nominalskalenniveau besitzen 

muß. Um einen oder mehrere der Tests durchzuführen, gehen Sie folgendermaßen 

vor: 

¾ Testvariablen: Geben Sie die Testvariablen in dem gleichnamigen Feld an. 

Für jede der angegebenen Variablen werden alle angeforderten Tests berechnet. 

Die Testvariablen müssen mindestens Ordinalskalenniveau besitzen, für 

die Durchführung eines Kolmogorov-Smirnov-Tests ist sogar Intervallskalenniveau 

erforderlich. 

¾ Gruppierungsvariablen: Verschieben Sie eine Gruppierungsvariable in das 

Feld Gruppenvariable. Zusätzlich müssen für diese Variable zwei Werte ange- 




geben werden, die die beiden zu vergleichenden Gruppen (Stichproben) definieren 

(s.u.). 

¾ Tests: Kreuzen Sie die durchzuführenden Tests an. 

¾ Optionen: Sie können ergänzende Maßzahlen für die Testvariablen anfordern 

und den Ausschluß von fehlenden Werten regeln. 


METRISCHE TESTS, ZWEI UNABHÄNGIGE STICHPROBEN 

Gruppierungsvariable 

Geben Sie eine Gruppierungsvariable an, anhand derer aus den Fällen der Stichprobe 

zwei Gruppen gebildet werden sollen. Zur Gruppenbildung müssen zwei 

Werte der Variablen angegeben werden. Fälle, die keinen der angegebenen Werte 

in der Gruppierungsvariable enthalten, werden von den Tests ausgeschlossen. Von 

den übrigen Fällen bilden jeweils die Fälle mit den gleichen Werten in der Gruppierungsvariable 

eine Gruppe. 

Um die Gruppen zu definieren, verschieben Sie die gruppierende Variable in das 

Feld Gruppenvariable, und klicken Sie anschließend auf die Schaltfläche Gruppen 

definieren. Diese Schaltfläche ist nur aktiv, wenn die Variable in dem Feld 

Gruppenvariable ausgewählt ist. Hierzu müssen Sie die Variable ggf. einmal mit 

der Maus anklicken. Die Schaltfläche öffnet das Dialogfeld aus Abbildung 30.13. 

Abbildung 30.13: Dialogfeld der Schaltfläche „Gruppen definieren“ 




Geben Sie zwei ganzzahlige Werte zur Gruppenbildung an. Fälle, die keinen der 

angegebenen Werte aufweisen, werden in den Tests nicht berücksichtigt. Werte 

mit Dezimalstellen werden auch nicht gerundet oder abgeschnitten. In den Gruppen 

1 und 2 ist der Wert 1,4 also nicht enthalten. Die Gruppe des ersten Wertes 

wird in dem Moses-Test als Kontrollgruppe verwendet. In dem Mann-Whitney- 

Test bezieht sich der Wert W auf diese Gruppe, sofern beide Gruppen die gleiche 

Anzahl von Fällen umfassen. 

Welche Tests durchführen? 

Per Voreinstellung wird nur der Mann-Whitney-Test durchgeführt, es stehen jedoch 

die folgende vier Tests zur Verfügung: 

¾ Mann-Whitney-U-Test: Nullhypothese: Beide Stichproben entstammen der 

gleichen Grundgesamtheit. Die Werte beider Gruppen werden gemeinsam in 

aufsteigender Folge der Werte geordnet und mit Rangwerten versehen. Aus 

dieser Reihenfolge wird der Wert U berechnet, der angibt, wie häufig der Wert 

einer Gruppe einem Wert der anderen Gruppe vorausgeht. Zusätzlich wird 

Wilcoxons W berechnet. Dies ist die Summe der Ränge für die Gruppe mit geringerer 

Fallzahl. Für diese Werte wird die zweiseitige Wahrscheinlichkeit als 

Fehlerwahrscheinlichkeit für die Nullhypothese berechnet. Zusätzlich werden 

die mittleren Ränge beider Stichproben sowie die Anzahl der Fälle in den 

Gruppen angegeben. Für ein Beispiel siehe oben Mann-Whitney-Test, S. 758. 

¾ Kolmogorov-Smirnov-Z: Nullhypothese: Beide Stichproben entstammen der 

gleichen Grundgesamtheit. Dieser Test vergleicht die Verteilungen der beiden 

Stichproben miteinander. Er reagiert empfindlich auf Unterschiede in Median, 

Schiefe u.a. Dieser Test erfordert Intervallskalenniveau der Testvariablen. Im 

Output werden die Fallzahlen der Gruppen, die größten negativen, positiven 

und absoluten Differenzen, der Kolmogorov-Smirnov-Z-Wert sowie die zweiseitige 

Wahrscheinlichkeit mitgeteilt. 

¾ Extremreaktionen nach Moses: Nullhypothese: Die Spannweite der Werte ist 

in beiden Gruppen gleich groß. Die Werte beider Gruppen werden in eine gemeinsame 

Reihenfolge gebracht. Anschließend werden ihnen Rangwerte zugewiesen. 

Eine der Gruppen (die Gruppe des Wertes, der in dem Dialogfeld 

Gruppen definieren als erstes angegeben ist) wird als Kontrollgruppe verwendet. 

Für diese Gruppe wird die Spannweite der Ränge als Differenz zwischen 

dem größten und kleinsten Rangwert berechnet. Anhand dieser Spannweite errechnet 

sich die einseitige Signifikanz. Zusätzlich wird der Test ein zweites 

Mal durchgeführt, wobei die Ausreißer der Gesamtstichprobe ausgeschlossen 

werden (insgesamt 5% der Fälle). Dabei werden sowohl die höchsten als auch 

die niedrigsten Ränge entfernt. Das Testergebnis teilt die Anzahl der Fälle beider 

Gruppen, die Spannweiten und die entsprechenden einseitigen Signifikanzen 

für beide Tests (mit und ohne Ausreißer) mit. Für ein Beispiel siehe oben 

Abschnitt Moses-Test, S. 760. 




¾ Wald-Wolfowitz-Sequenzen: Nullhypothese: Beide Stichproben entstammen 

der gleichen Grundgesamtheit. Die Werte beider Gruppen werden in eine gemeinsame 

Reihenfolge gebracht. Für diese Werte wird eine Sequenzanalyse 

für die Gruppenzugehörigkeit durchgeführt. Im Output angegeben wird die 

Anzahl der Fälle in beiden Gruppen, die Zahl der Sequenzen in der Rangfolge, 

der Z-Wert und die entsprechende Signifikanz. Außerdem wird die Zahl der 

Rangbindungen ausgewiesen. Sind in der Rangfolge verbundene Fälle enthalten, 

werden die Höchst- und Mindestzahl der möglichen Sequenzen angegeben. 

Für beide werden der Z-Wert und die einseitige Signifikanz mitgeteilt. 

Optionen 





30.7 Tests für mehrere unabhängige Stichproben 

Zum Vergleich mehrerer unabhängiger Stichproben stehen zwei Tests zur Verfügung, 

der Kruskal-Wallis-Test und der Median-Test. Beide Tests vergleichen die 

Werte einer Variablen in verschiedenen Fallgruppen der Datendatei miteinander. 

Jede Fallgruppe bildet im Sinne der Tests eine unabhängige Stichprobe. Die Fallgruppen 

werden dabei mit Hilfe einer gruppierenden (kategorialen) Variablen aus 

der Datendatei definiert. 

Der Median-Test untersucht, ob die verschiedenen Stichproben in der Grundgesamtheit 

den gleichen Median aufweisen. Er entspricht insofern einem T-Test, der 

einen Vergleich der Mittelwerte verschiedener Stichproben durchführt. Der Kruskal-Wallis-Test 

erstellt eine gemeinsame Rangfolge aller Werte der verschiedenen 

Stichproben und testet anschließend die Nullhypothese, die mittleren Rangzahlen 

in den einzelnen Gruppen seien gleich. Für beide Tests müssen die Testvariablen 

mindestens Ordinalskalenniveau aufweisen. 

30.7.1 Interpretation der Testergebnisse 

Beispiel 

Im Rahmen der ALLBUS-Umfrage wurde den Befragten unter anderem der in 

Abbildung 30.14 wiedergegebene Fragetext mit den ebenfalls aufgeführt Antwortkategorien 

vorgelegt. Im folgenden soll untersucht werden, ob sich die Antworten 

von Befragten mit unterschiedlichem allgemeinen Schulabschluß bei dieser 

Frage unterscheiden. Hierzu werden sowohl ein Median-Test als auch ein 

Kruskal-Wallis-Test durchgeführt. 



30.7 Tests für mehrere unabhängige Stichproben 765 

Im Vergleich dazu, wie andere hier in Deutschland leben: Glauben Sie, daß Sie Ihren 

gerechten Anteil erhalten, mehr als Ihren gerechten Anteil, etwas weniger oder sehr 

viel weniger? 

‰ 1 Sehr viel weniger 

‰ 2 Etwas weniger 

‰ 3 Gerechten Anteil 

‰ 4 Mehr als den gerechten Anteil 

Abbildung 30.14: Fragetext und Antwortkategorien für die Variable „v30“ 

Die Tests zur Untersuchung der beschriebenen Fragestellungen fordern Sie mit 

den folgenden Einstellungen an: 



auch die Notwendigkeit zur Gewichtung der Daten. 354 

¾ Test für mehrere unabhängige Stichproben aufrufen: Um den Test aufzurufen, 


STATISTIK 


K UNABHÄNGIGE STICHPROBEN... 

¾ Einstellungen: Fügen Sie in dem Dialogfeld der Prozedur die Variablen v30 

(Gerechter Anteil am Lebensstandard?) in das Feld Testvariablen und bildung 

(Allgemeiner Schulabschluß) in das Feld Gruppenvariable ein. Klicken Sie 

anschließend auf die Schaltfläche Gruppen definieren, 355 und geben Sie in dem 

damit geöffneten Dialogfeld den Wert 1 als Minimum und den Wert 3 als Maximum 

an. 

Da im folgenden sowohl der Median-Test als auch der Kruskal-Wallis-Test 

betrachtet werden sollen, werden in der Gruppe Welche Tests durchführen? im 

Hauptdialogfeld beide Optionen angekreuzt. Die beschriebenen Einstellungen 

sind in dem Dialogfeld in Abbildung 30.17, S. 768 dargestellt und liefern den 

Output aus den Abbildung 30.15 und 30.16. 

Kruskal-Wallis-Test 

Die Ergebnisse des Kruskal-Wallis-Tests sind in Abbildung 30.15 dargestellt. Die 

Variable bildung unterscheidet zwischen drei allgemeinen Schulabschlüssen. In 

der Spalte Mittlerer Rang werden die durchschnittlichen Rangzahlen für diese drei 

Gruppen ausgegeben. Diese werden berechnet, indem zunächst alle Werte der 

Testvariablen in eine gemeinsame Rangordnung gebracht werden. Jedem Variablenwert 

wird dabei ein Rangwert entsprechend seiner Position in der Rangord- 



355 Diese Schaltfläche ist nur aktiv, wenn bereits eine Gruppenvariable ausgewählt wurde 

und diese aktuell markiert ist. 




nung zugewiesen. Anschließend werden die durchschnittlichen Rangwerte getrennt 

für die drei Kategorien des Schulabschlusses errechnet. Es ist sehr deutlich, 

daß die mittleren Rangwerte mit der Höhe des Schulabschlusses ansteigen. Während 

der durchschnittliche Rangwerte in der Kategorie Hauptschule 154,50 beträgt, 

hat er in der Kategorie Mittlere Reife einen Wert von 172,65 und in erreicht 

in der Kategorie Abitur sogar den Wert 202,51. 

Anhand des Wertes Kruskal-Wallis-H, der annähernd Chi-Quadrat verteilt ist, 

wird ein Signifikanzwert für die Nullhypothese berechnet, derzufolge die mittleren 

Ränge in der Grundgesamtheit gleich sind. Diese Signifikanz beträgt im vorliegenden 

Beispiel 0,010 bzw. 1,0%. Weist man die Nullhypothese gleicher mittlerer 

Rangwerte der drei Gruppen in der Grundgesamtheit zurück, begeht man folglich 

mit einer Wahrscheinlichkeit von 1,0% einen Irrtum. Bei einer so geringen Irrtumswahrscheinlichkeit 

kann die Nullhypothese zurückgewiesen werden, die 

mittleren Rangwerte der Zufriedenheit mit dem Lebensstandard in den drei unterschiedlichen 

Schulabschluß-Kategorien sind in der Grundgesamtheit offenbar 

nicht gleich. 

Ränge 

V30 

BILDUNG 

Hauptschule, Polytech. 

Schule 8. o. 9. Kl., kein 

Abschluß 

Mittlere Reife, 

Fachhochschule, 

Polytech. Schule 10. 

Klasse 

Abitur bzw. Erw. 

Oberschule 

Gesamt 

N 

Mittlerer 

Rang 

141 154,50 

156 172,65 

39 202,51 

Statistik für Test a,b V30 

Chi-Quadrat 

9,249 

df 

2 

Asymptotische Signifikanz ,010 

a. Kruskal-Wallis-Test 

336 

b. Gruppenvariable: BILDUNG 

Abbildung 30.15: Ergebnisse des Kruskal-Wallis-Tests für mehrere unabhängige 

Stichproben 

Median-Test 

Für den Median-Test hat die Prozedur die Ergebnisse aus Abbildung 30.16 ausgegeben. 

Zunächst wurde der Median der Testvariablen für die Gesamtheit der in 

den Test eingegangenen Fälle berechnet. Dieser Median wird in der unteren Tabelle 

mit 2 angegeben. Anschließend werden die Werte der einzelnen Gruppen mit 

dem Gesamtmedian verglichen. Für jede Gruppen wird die Anzahl der Fälle mitgeteilt, 

deren Werte größer bzw. kleiner sind als der Median aller Fälle. Entstammen 

die Werte alle der gleichen Grundgesamtheit, sollten die Mediane in den drei 

Gruppen ungefähr gleich sein. In dem Fall würden auch in jeder Gruppe in etwa 

die Hälfte der Werte über und die andere Hälfte unter dem Median liegen, der für 

die Gesamtheit der Fälle berechnet wurde. Für die drei Gruppen aus dem Beispiel 

trifft dies nicht uneingeschränkt zu. Zunächst ist zu beobachten, daß in jeder 

Gruppe deutlich mehr Werte kleiner oder gleich dem Median (


wenige Gruppen unterschieden werden und der Median mit einer häufig vertretenen 

Gruppe zusammenfällt. Für den Test ist aber vor allem entscheidend, daß die 

Verteilung der Werte in den drei Gruppen sehr ähnlich ist, sich die Werte also in 

ähnlicher Weise auf die beiden Seiten des Medians verteilen. 

Mit einem Chi-Quadrat-Test wird überprüft, inwieweit die Unterschiede zwischen 

den Gruppen auf tatsächliche Unterschiede in der Grundgesamtheit hindeuten. Der 

Signifikanzwert für die Nullhypothese wird mit 0,114% bzw. 11,4% angegeben. 

Bei einer so hohen Irrtumswahrscheinlichkeit kann die Nullhypothese, derzufolge 

die Mediane der einzelnen Gruppen der gleichen Grundgesamtheit entstammen 

(das bedeutet hier einfach, daß die Mediane gleich sind) nicht zurückgewiesen 

werden. 

Häufigkeiten 

V30 

> Median 

< = Median 

Hauptschule, 

Polytech. 

Schule 8. o. 

9. Kl., kein 

BILDUNG 

Mittlere Reife, 

Fachhochschule, 

Polytech. Schule 

Abitur bzw. 

Erw. 

Abschluß 10. Klasse Oberschule 

44 59 19 

97 97 20 

N 

Median 

Statistik für Test b V30 

336 

2,00 

4,339 a 

Chi-Quadrat 

df 


2 

,114 

a. Bei 0 Zellen (,0%) werden weniger als 5 Häufigkeiten 

erwartet. Die kleinste erwartete Zellenhäufigkeit ist 

14,2. 

b. Gruppenvariable: BILDUNG 

Abbildung 30.16: Ergebnisse eines Median-Tests für mehrere unabhängige Stichproben 

30.7.2 Einstellungen eines Tests für mehrere unabhängige 

Stichproben bei SPSS 

Um nichtparametrische Tests für mehrere unabhängige Stichproben durchzuführen, 

öffnen Sie mit dem folgenden Befehl das Dialogfeld aus Abbildung 30.17: 

STATISTIK 


K UNABHÄNGIGE STICHPROBEN... 





METRISCHE TESTS, K UNABHÄNGIGE STICHPROBEN 

Das abgebildete Dialogfeld zeigt die für das obige Beispiel verwendeten Einstellungen. 

In der Variablenliste werden nur die numerischen Variablen der Datendatei 

aufgeführt, Textvariablen können also auch nicht als Gruppierungsvariablen 

verwendet werden. Um einen Test für mehrere unabhängige Stichproben durchzuführen, 

nehmen Sie die folgenden Einstellungen vor: 

¾ Testvariablen: Geben Sie in diesem Feld mindestens eine Testvariable an. Die 

Werte der Testvariablen in verschieden Fallgruppen der Datendatei werden 

anhand der Tests miteinander verglichen. 

¾ Gruppenvariable: Geben Sie hier die gruppierende Variable an. Zusätzlich 

muß in dem Dialogfeld der Schaltfläche Bereich definieren ein Wertebereich 

angegeben werden (s.u.). Jeder Wert der Gruppenvariablen innerhalb dieses 

Bereichs bildet eine Fallgruppe in der Datendatei. 

¾ Welche Tests durchführen?: Kreuzen Sie die durchzuführenden Tests an. 

¾ Optionen: Hier können Sie zusätzliche Maßzahlen für den Output anfordern 

und den Ausschluß von Fällen mit fehlenden Werten regeln. 

Gruppenvariable 

Geben Sie die Variable, durch deren Werte die Fallgruppen definiert werden sollen, 

in dem Feld Gruppenvariable an. Um die Gruppen zu definieren, müssen Sie 

zusätzliche einen Wertebereich festlegen. Jeder ganzzahlige Wert innerhalb dieses 

Bereichs (einschließlich der Grenzen) bildet eine Fallgruppe und damit eine der zu 

vergleichenden unabhängigen Stichproben. Um den Wertebereich anzugeben, öffnen 

Sie mit der Schaltfläche Bereiche definieren das in Abbildung 30.18 dargestellte 

Dialogfeld. 




Abbildung 30.18: Dialogfeld der Schaltfläche "Bereich 

definieren“ für mehrere unabhängige Stichproben 

Geben Sie in den Feldern Minimum und Maximum die untere und obere Grenze 

des Wertebereichs an. Jeder ganzzahlige Werte innerhalb dieses Bereichs definiert 

eine Fallgruppe in der Datendatei. Durch die Angaben in Abbildung 30.17 werden 

damit die drei Fallgruppen 1, 2 und 3 definiert. Enthält die Gruppenvariable Werte 

mit Dezimalstellen, werden diese abgeschnitten. Der Wert 3,9 wird damit noch der 

Gruppe 3 zugeordnet, auch wenn er bereits außerhalb des angegeben Wertebereichs 

liegt. 


Für mehrere unabhängige Stichproben stehen die beiden folgenden Tests zur Verfügung: 

¾ Kruskal-Wallis H: Nullhypothese: Die Stichproben entstammen derselben 

Grundgesamtheit. Um die Hypothese zu überprüfen, werden die Werte in eine 

gemeinsame Rangordnung gebracht. Getestet wird anschließend mit einem χ 2 - 

Test, ob die durchschnittlichen Rangwerte in den einzelnen Stichproben gleich 

groß sind. Es werden die durchschnittlichen Ränge sowie die Anzahl der Fälle 

und außerdem der χ 2 -Wert, die Anzahl der Freiheitsgrade sowie die Signifikanz 

ausgegeben. 

¾ Median: Nullhypothese: Die Stichproben entstammen Grundgesamtheiten mit 

dem gleichen Median. Zunächst wird der Median für die Gesamtheit der Variablenwerte 

berechnet. Anschließend wird jeweils die Anzahl der Fälle in den 

einzelnen Gruppen betrachtet, deren Werte größer bzw. kleiner als der Gesamtmedian 

sind. Bei Gültigkeit der Nullhypothese müßte jeweils die Hälfte 

der Werte über und die andere Hälfte unter dem Median liegen. Anhand der 

Abweichungen der beobachteten von den erwarteten Fallzahlen wird ein χ 2 - 

Test durchgeführt. Im Output werden der χ 2 -Wert, die Anzahl der Freiheitsgrade 

sowie die Signifikanz mitgeteilt, außerdem die Anzahl der Fälle, der Gesamtmedian 

sowie für die einzelnen Gruppen die Zahl der Fälle mit Werten 

größer und kleiner oder gleich dem Gesamtmedian. 




Optionen 





30.8 Tests für zwei verbundene Stichproben 

Für zwei verbundene Stichproben können Sie mit dem Wilcoxon-Test und dem 

Vorzeichen-Test überprüfen, ob die beiden Stichproben Grundgesamtheiten mit 

der gleichen Verteilung entstammen. Mit dem McNemar-Test können Sie für zwei 

dichotome Variablen untersuchen, ob diese systematische Unterschiede aufweisen. 

Zwei Stichproben werden als verbunden bezeichnet, wenn ihre Werte gemeinsam 

und damit paarweise auftreten und inhaltlich zusammenhängen. Werden 

bei einer Befragung die Personen zum Beispiel nach dem Alter der Mutter sowie 

nach dem Alter des Vaters gefragt, bilden die beiden Altersangaben zwei verbundene 

Stichproben, da die einzelnen Werte jeweils paarweise miteinander verbunden 

sind. Die beiden Werte werden dabei in zwei Variablen, aber im gleichen Fall 

gespeichert. Bei verbundenen Stichproben bilden also die Werte einer Stichprobe 

jeweils eine eigene Variable. 

30.8.1 Interpretation des Wilcoxon-Tests 

Im Rahmen der ALLBUS-Umfrage wurden den Befragten unter anderem die beiden 

in den Abbildungen 30.19 und 30.20 wiedergegebenen Fragen vorgelegt. 

Im folgenden geht es um den Zuzug verschiedener Personengruppen nach 

Deutschland. Wie ist Ihre Einstellung dazu? 

Wie ist es mit Arbeitnehmern aus der Europäischen Union? 

‰ 1 Der Zuzug soll uneingeschränkt möglich sein. 

‰ 2 Der Zuzug soll begrenzt werden. 

‰ 3 Der Zuzug soll völlig unterbunden werden. 

Abbildung 30.19: Fragetext und Antwortkategorien für die Variable „v33“ 

Und wie ist es mit Arbeitnehmern aus Nicht-EU-Staaten, z.B. Türken? 

‰ 1 Der Zuzug soll uneingeschränkt möglich sein. 

‰ 2 Der Zuzug soll begrenzt werden. 

‰ 3 Der Zuzug soll völlig unterbunden werden. 

Abbildung 30.20: Fragetext und Antwortkategorien für die Variable „v34“ 

Im folgenden wird mit einem Wilcoxon-Test untersucht, ob die beiden Variablen 

in der Grundgesamtheit die gleiche Verteilung aufweisen. Ein solcher Test läßt 

sich mit den folgenden Einstellungen anfordern: 



30.8 Tests für zwei verbundene Stichproben 771 


die Personen aus den neuen Bundesländern betrachtet. Damit entfällt auch die 

Notwendigkeit zur Gewichtung der Daten. 356 

¾ Test für zwei verbundene Stichproben aufrufen: Um den Test aufzurufen, 


STATISTIK 


ZWEI VERBUNDENE STICHPROBEN... 

¾ Einstellungen: Fügen Sie in dem Dialogfeld der Prozedur das Variablenpaar 

v33 - v34 in das Feld Ausgewählte Variablenpaare ein. Klicken Sie hierzu in 

der Quellvariablenliste nacheinander auf die Variablen v33 und v34, und verschieben 

Sie das Paar anschließend mit der Pfeil-Schaltfläche in das Feld Ausgewählte 

Variablenpaare. 

Bei den übrigen Optionen werden die Voreinstellungen verwendet. Dies bedeutet 

insbesondere, daß in der Gruppe Welche Tests durchführen? die Option 

Wilcoxon angekreuzt bleibt. Die beschriebenen Einstellungen sind in dem 

Dialogfeld in Abbildung 30.22, S. 772 dargestellt und liefern den Output aus 

Abbildung 30.21. 

Der Wilcoxon-Test vergleicht die Verteilung beider Variablen anhand der Differenzen 

zwischen den Wertepaaren. Zunächst werden die Differenzen berechnet 

und nach ihrer absoluten Größe in eine Rangordnung gebracht. Anschließend 

werden die mittleren Rangzahlen der positiven und der negativen Differenzen berechnet. 

Die Zahl der positiven und negativen Differenzen sowie ihr durchschnittlicher 

Rangwert werden in dem Output angegeben. Insgesamt wurden 329 

Fälle in den Test einbezogen, davon wiesen 7 Fälle negative und 73 Fälle positive 

Differenzen auf. In 7 Fällen wurde der Zuzug von EU-Ausländern damit ablehnender 

beurteilt als der Zuzug von Nicht-EU-Ausländern, in 73 Fälle verhielt es 

sich genau umgekehrt. 249 Befragte haben den Zuzug der beiden Gruppen von 

ausländischen Arbeitnehmern gleich bewertet (Bindungen). 

Nicht nur die Anzahl negativer Differenzen, sondern auch ihr durchschnittlicher 

absoluter Betrag scheinen etwas kleiner zu sein als die positiven Abweichungen. 

Der mittlere Rang der sieben negativen Abweichungen ist mit 37,00 angegeben, 

während der für positive Differenzen 40,84 beträgt. Aufgrund dieser Beobachtungen 

ergibt sich für die Nullhypothese, derzufolge beide Stichproben einer 

Grundgesamtheit mit der gleichen Verteilung entstammen, ein Signifikanzwert 

von 0,000 bzw. 0,0%. Die Nullhypothese kann damit zurückgewiesen werden. Der 

annähernd standardnormalverteilte Z-Wert, der zur Berechnung der Signifikanz 

diente, wird ebenfalls ausgewiesen und beträgt -7,238. 






V34 - V33 

a. V34 < V33 

b. V34 > V33 

c. V33 = V34 

Negative Ränge 

Positive Ränge 

Bindungen 

Gesamt 

Ränge 

N 

Mittlerer 

Rang Rangsumme 

7 a 37,00 259,00 

73 b 40,84 2981,00 

249 c 

329 

Z 

Statistik für Test b 


(2-seitig) 

V34 - V33 

-7,238 a 

a. Basiert auf negativen Rängen. 

b. Wilcoxon-Test 

,000 

Abbildung 30.21: Ergebnisse eines Wilcoxon-Tests für zwei verbundene Stichproben 

30.8.2 Einstellungen der Tests für zwei verbundene Stichproben 

bei SPSS 

Um einen nichtparametrischen Test für zwei verbundene Stichproben durchzuführen, 

wählen Sie den folgenden Befehl, der das Dialogfeld aus Abbildung 30.22 

öffnet. Das abgebildete Dialogfeld zeigt die für das vorhergehende Beispiel verwendeten 

Einstellungen. 

STATISTIK 


ZWEI VERBUNDENE STICHPROBEN... 

Abbildung 30.22: Dialogfeld des Befehls STATISTIK, NICHTPARAME- 

TRISCHE TESTS, ZWEI VERBUNDENE STICHPROBEN 

¾ Variablen: Geben Sie in dem Feld Ausgewählte Variablenpaare die Paare der 

jeweils miteinander zu vergleichenden Variablen an. Klicken Sie dafür zunächst 

nacheinander auf die beiden Variablen eines Paares, und fügen Sie das 

Paar anschließend durch Klicken auf die Pfeil-Schaltfläche der Liste Ausgewählte 

Variablenpaare hinzu. Wenn Sie mehrere Variablenpaare angeben, 

werden die Tests für jedes Paar getrennt durchgeführt. 



30.8 Tests für zwei verbundene Stichproben 773 

¾ Tests: Per Voreinstellung wird lediglich der Wilcoxon-Test durchgeführt. 

Möchten Sie andere oder zusätzliche Tests durchführen, kreuzen Sie diese in 

der Gruppe Welche Tests durchführen? an (s.u.). 

¾ Optionen: Die Schaltfläche Optionen öffnet das Dialogfeld aus Abbildung 

30.3, S. 747. Dort können Sie ergänzenden Output anfordern und den 

Ausschluß von Fällen mit fehlenden Werten steuern. Zur Bedeutung der Optionen 

siehe im einzelnen Abschnitt Optionen, S. 747. 


Die folgenden drei Tests stehen für zwei verbundene Stichproben zur Verfügung: 

¾ Wilcoxon: Nullhypothese: Beide Stichproben entstammen einer Grundgesamtheit 

mit gleicher Verteilung. Der Wilcoxon-Test erstellt eine gemeinsame 

Rangfolge aller Werte aus den beiden Stichproben. Anschließend vergleicht er 

die Ränge der einzelnen Wertepaare miteinander. Dazu wird die Differenz 

zwischen den beiden Rängen eines Paares berechnet und der durchschnittliche 

Rang für alle positiven sowie für alle negativen Differenzen ermittelt. Anhand 

des unter der Nullhypothese annähernd standardnormalverteilten Testwertes Z 

wird die Signifikanz der Nullhypothese ermittelt. Im Output werden für die 

positiven und negativen Abweichungen sowie für die Fälle ohne Differenzen 

(Bindungen) die Anzahl der Fälle sowie der mittlere Rangwert angegeben. 

Außerdem werden der Z-Wert und die Signifikanz mitgeteilt. 

¾ Vorzeichen: Nullhypothese: Beide Stichproben entstammen einer Grundgesamtheit 

mit gleicher Verteilung. Der Test vergleicht jeweils die Werte der 

einzelnen Paare miteinander. Er berechnet die Differenzen beider Werte und 

zählt die Anzahl der positiven und die der negativen Abweichungen. Anschließend 

wird der bei Gültigkeit der Nullhypothese standardnormalverteilte Z- 

Wert berechnet und auf diese Weise die Signifikanz der Nullhypothese bestimmt. 

Die Anzahl der positiven und negativen Abweichungen sowie die Zahl 

der Fälle mit gleichen Werten in beiden Variablen werden neben dem Z-Wert 

und der Signifikanz im Output mitgeteilt. 

¾ McNemar: Nullhypothese: Unterschiede in den Werten beider Variablen liegen 

in beiden Richtungen gleichermaßen vor. Der Test untersucht für dichotome 

Variablen, ob Unterschiede in den Werten beider Variablen in eine 

Richtung stärker ausgeprägt sind als in die andere. Dieser Test wird insbesondere 

für Voher/Nachher-Vergleiche verwendet. Der Test betrachtet lediglich 

die Fälle, in denen sich die Werte beider Variablen unterscheiden. Er erstellt 

eine 2 × 2-Tabelle für die dichotomen Werte der beiden Variablen und gibt die 

Anzahl der Fälle für die vier verschiedenen Wertekombinationen an. Wenn die 

Unterschiede zwischen den Variablen zufällig sind, müßten die beiden ungleichen 

Wertekombinationen - in Relation zu der Häufigkeit der einzelnen Werte 

- mit gleicher Häufigkeit auftreten. Die Nullhypothese wird mit einem χ 2 - 

Test überprüft. Weisen weniger als 25 Fälle verschiedene Werte auf, wird ein 

Binomial-Test durchgeführt. Im Output werden die 2 × 2-Tabelle sowie der χ 2 - 

Wert und die Signifikanz angegeben. 




30.9 Test für mehrere verbundene Stichproben 

Analog zu den Tests für zwei verbundene Stichproben können Sie auch mehrere 

verbundene Stichproben daraufhin untersuchen, ob sie derselben Grundgesamtheit 

entstammen. Mit dem Friedman-Test können Sie für ordinalskalierte Variablen die 

mittleren Ränge der Variablen vergleichen. Kendalls W wird häufig verwendet, 

um die Zuverlässigkeit von Gutachtern oder Tests zu überprüfen. Der Test untersucht 

die Übereinstimmung zwischen verschiedenen Bewertungen. Die Verteilung 

mehrerer dichotomer Variablen können Sie mit Cochrans Q auf Gleichheit untersuchen. 

Die Interpretation der Testergebnisse erfolgt dabei ganz analog zu den 

Tests für zwei verbundene Stichproben. 

Um nichtparametrische Tests für mehrere verbundene Stichproben durchzuführen, 

wählen Sie den folgenden Befehl, der das Dialogfeld aus Abbildung 30.23 öffnet: 

STATISTIK 


K VERBUNDENE STICHPROBEN... 


METRISCHE TESTS, K VERBUNDENE STICHPROBEN 

¾ Variablen: Verschieben Sie die Variablen, die die einzelnen verbundenen 

Stichproben repräsentieren, in das Feld Testvariablen. Es müssen mindestens 

zwei Variablen angegeben werden. Die Angabe dieser Variablen genügt, um 

die Prozedur auszuführen. 

¾ Tests: Kreuzen Sie in der Gruppe Welche Tests durchführen? die gewünschten 

Tests an (s.u.). 

¾ Statistik: Sie können für die Testvariablen zusätzlichen deskriptive Maßzahlen 

anfordern (s.u.). 



30.9 Test für mehrere verbundene Stichproben 775 


¾ Friedman: Nullhypothese: Die Stichproben entstammen derselben Grundgesamtheit. 

Betrachtet werden jeweils die Werte der Testvariablen in demselben 

Fall. Für diese Werte eines Falles wird eine Rangordnung erstellt. Anschließend 

werden die mittleren Rangzahlen der einzelnen Testvariablen ermittelt. 

Anhand eines annähernd χ 2 -verteilten Testwertes wird der Signifikanzwert 

für die Nullhypothese berechnet. Der χ 2 -Wert, die Anzahl der Freiheitsgrade 

sowie die Signifikanz werden im Output mitgeteilt, ebenso wie die 

Anzahl der Fälle sowie die mittleren Rangzahlen der einzelnen Variablen. 

¾ Kendall-W: Nullhypothese: Die Stichproben entstammen derselben Grundgesamtheit. 

Der Test interpretiert die einzelnen Variablen als verschiedene zu 

bewertende Sachverhalte und die einzelnen Fälle als unterschiedliche Prüfer 

oder Tests. Der Test mißt die Übereinstimmung zwischen den Prüfern. Für jeden 

Fall werden die Werte der Variablen dabei in eine Rangordnung gebracht. 

Anschließend werden die mittleren Ränge der Variablen ermittelt. Daraus wird 

Kendalls W sowie ein χ 2 -Wert berechnet. Kendalls W liegt zwischen 0 und 1 

und gibt die Stärke der Übereinstimmung an. Bei einem Wert von 0 besteht gar 

keine, bei einem Wert von 1 perfekte Übereinstimmung. Zu dem χ 2 -Wert wird 

die Signifikanz mitgeteilt. Neben dem χ 2 -Wert, der Anzahl der Freiheitsgrade 

und der Signifikanz und Kendalls W werden die Anzahl der Fälle sowie die 

mittleren Ränge der einzelnen Testvariablen mitgeteilt. 

¾ Cochran-Q: Nullhypothese: Die verschiedenen dichotomen Variablen haben 

dieselbe Verteilung. Bei dichotomen Variablen läuft diese Hypothese darauf 

hinaus, daß sie denselben Mittelwert haben. Der Test zählt jeweils die Häufigkeiten 

der einzelnen Werte in den Variablen und berechnet den annähernd χ 2 - 

verteilten Testwert Q. Cochrans Q, die Anzahl der Freiheitsgrade sowie die Signifikanz 

werden im Output angegeben. Zusätzlich werden die Anzahl der 

Fälle und die Häufigkeiten der einzelnen Werte in den Testvariablen mitgeteilt. 

Statistik 

Die Schaltfläche Statistik öffnet das Dialogfeld aus Abbildung 30.24. 

Abbildung 30.24: Dialogfeld der Schaltfläche „Statistik“ 




In diesem Dialogfeld können Sie folgende ergänzende Maßzahlen anfordern können: 

¾ Deskriptive Statistik: Berechnet für die Testvariablen auf der Basis der in die 

Tests einbezogenen Fälle den Mittelwert und die Standardabweichung. Zusätzlich 

werden das Minimum und das Maximum sowie die Anzahl der Fälle 

mitgeteilt. 

¾ Quartile: Für die in die Prozedur einbezogenen Fälle werden die 25%-, 50%- 

und 75%-Perzentile der Testvariablen angegeben.

Kapitel 30 Nichtparametrische Tests

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?