Lassen sich Signifikanztests auf Vollerhebungen ... - SpringerLink
Lassen sich Signifikanztests auf Vollerhebungen ... - SpringerLink
Lassen sich Signifikanztests auf Vollerhebungen ... - SpringerLink
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
O-2 Joachim Behnke<br />
dass die zu Grunde liegende Datenmenge eine Stichprobe darstellt. Das heißt, es wird<br />
damit vorausgesetzt, dass diese Daten durch einen Prozess generiert worden sind, der<br />
als zufällige Auswahl einzelner Elemente aus einer weit größeren Anzahl von Elementen,<br />
der Grundgesamtheit, modelliert werden kann. Sinn der Inferenzstatistik ist es<br />
nun, mit Hilfe des Wirklichkeitsausschnitts, den uns die Stichprobe gibt, <strong>auf</strong> die<br />
Struktur der „ganzen“ Wirklichkeit, also der Grundgesamtheit, zu schließen. Dieser<br />
Schluss mit Hilfe der inferenzstatistischen Methoden kann nur unter bestimmten Vorbehalten<br />
und mit bestimmten Einschränkungen gemacht werden. D.h. <strong>auf</strong>grund der<br />
durch den Zufallsprozess bedingten Un<strong>sich</strong>erheit können die Aussagen über die<br />
Grundgesamtheit nur mit einer gewissen Unschärfe getroffen werden, die ihren <strong>sich</strong>tbaren<br />
statistischen Ausdruck in der Angabe des Standardfehlers bzw. in der Formulierung<br />
von Konfidenzintervallen findet, wobei die Festlegung des Bereichs der Konfidenzintervalle<br />
<strong>auf</strong> dem Standardfehler beruht. Die Zulässigkeit des inferenzstatistischen<br />
Schlusses selbst aber beruht <strong>auf</strong> dem grundsätzlichen Vorbehalt, dass die Stichprobe<br />
tatsächlich als Zufallsauswahl der Grundgesamtheit zustande gekommen ist. So paradox<br />
<strong>sich</strong> dies vielleicht auch anhören mag: Die „un<strong>sich</strong>eren“ Aussagen, die wir mit inferenzstatistischen<br />
Methoden gewinnen, sind nur insoweit aussagekräftig, wie wir uns<br />
über das Vorliegen der Ursache der Un<strong>sich</strong>erheit, d.h. des Zufalls, <strong>sich</strong>er sein können.<br />
Der Unterschied zwischen inferenzstatistischen Tests und Schätzverfahren besteht<br />
nun darin, inwiefern der Zufall als Erklärung für bestimmte Eigenschaften der Beobachtungsdaten<br />
angenommen werden kann bzw. soll. Bei einem Test gehen wir von einer<br />
Art stochastischer Fiktion aus, d.h. wir unterstellen, dass bestimmte beobachtete Unterschiede<br />
allein durch zufällige Schwankungen zu erklären sind, die durch den Auswahlprozess<br />
entstanden sind. Diese beobachteten Unterschiede werden erst dadurch<br />
<strong>sich</strong>tbar, dass wir unsere Stichprobe <strong>auf</strong> systematische Weise in Untergruppen eingeteilt<br />
haben. Z.B. können wir aus einer Stichprobe von 1000 zufällig ausgewählten Personen<br />
zwei Untergruppen von Männern und Frauen bilden und anschließend feststellen, dass<br />
die durchschnittliche Körpergröße der Männer um einige Zentimeter höher ausfällt als<br />
die der Frauen. Wenn wir nun aber feststellen, dass diese Unterschiede weit über das<br />
Ausmaß hinausgehen, das wir allein <strong>auf</strong>grund des Wirkens des Zufalls erwarten würden,<br />
dann schließen wir daraus, dass diese Unterschiede im Ganzen nur durch die Annahme<br />
einer zusätzlichen Ursache erklärt werden können. Dieses nicht-zufällige Element<br />
muss aber durch die Form der Gruppierung in die Beobachtungsdaten gelangt<br />
sein. Die systematische Ursache des Größenunterschieds muss daher das Geschlecht der<br />
Personen sein. Das Ziel des Tests besteht also in der Demonstration, dass die stochastische<br />
Fiktion nicht <strong>auf</strong>recht erhalten werden kann: Bestimmte Merkmale der Struktur<br />
der Beobachtungsdaten können nicht allein <strong>auf</strong> Zufälligkeiten beim Auswahlprozess zurückgeführt<br />
werden. Die Gefahr, dass uns die Annahme, dass bestimmte Eigenschaften<br />
unserer Beobachtungsdaten <strong>auf</strong> der stochastischen Struktur des Datengenerierungsprozesses<br />
beruhen, zu falschen, d.h. unberechtigten, Schlussfolgerungen verleitet, ist beim<br />
statistischen Test insofern eher gering, als der Test selbst dar<strong>auf</strong> abzielt, diese Annahme<br />
als unbegründet zu entlarven. Das substanzielle Ergebnis eines wie oben beschriebenen<br />
Tests in der Tradition von R.A. Fisher besteht ja in der Zurückweisung des Zufalls als<br />
alleinige Ursache bestimmter Beobachtungen. Misslingt diese Zurückweisung, darf daraus<br />
keineswegs geschlossen werden, dass alle Unterschiede tatsächlich nur zufällig be-