Lassen sich Signifikanztests auf Vollerhebungen ... - SpringerLink
Lassen sich Signifikanztests auf Vollerhebungen ... - SpringerLink
Lassen sich Signifikanztests auf Vollerhebungen ... - SpringerLink
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
O-8 Joachim Behnke<br />
sie durch stochastische Prozesse zu Stande gekommen wäre. 1 Die stochastische Varianz,<br />
<strong>auf</strong> die <strong>sich</strong> der Signifikanztest gründet, wird also überschätzt. Bevor wir einen Signifikanztest<br />
durchführen, müssen wir daher eine Varianzdekomposition in eine substanzielle<br />
und eine Messfehlervarianz vornehmen. Um die durch den Messfehler verursachte<br />
Varianz zu bestimmen, können wir dabei unter Umständen <strong>auf</strong> Messwiederholungen<br />
zurückgreifen (soweit dies ohne systematische Verzerrung der Messwerte möglich<br />
ist). Dann ist es möglich, einen Signifikanztest auch für eine Vollerhebung durchzuführen,<br />
wenn wir die ursprüngliche Varianz um den substanziellen Anteil bereinigt haben,<br />
so dass nur noch die Messfehlervarianz für die Streuung der Werte in den Gruppen<br />
verantwortlich ist.<br />
3.2 Ein Anwendungsbeispiel aus der Politikwissenschaft: Wahlwerbung<br />
Ich will die erwähnten Aspekte an einem konkreten Problem aus der Politikwissenschaft<br />
illustrieren. Nehmen wir an, wir hätten eine Vollerhebung aller bisherigen Wahlanzeigen<br />
der Parteien unternommen. Der Einfachheit halber beschränken wir unser<br />
Beispiel <strong>auf</strong> zwei Parteien, die wir „SPD“ und „CDU“ nennen. Als Untersuchungsvariable<br />
nehmen wir lediglich das Thema der Anzeigen, wobei es insgesamt nur zwei<br />
Themen, nämlich „Wirtschaft“ und „Soziales“, gibt. Dieses sehr beschränkte und vereinfachte<br />
Beispiel genügt vollkommen, um die Problematik von <strong>Signifikanztests</strong> bei<br />
<strong>Vollerhebungen</strong> zu verdeutlichen. Die uns interessierende Fragestellung lautet, ob die<br />
Themenschwerpunkte der beiden Parteien <strong>sich</strong> voneinander unterscheiden. Dazu ermitteln<br />
wir die relative Häufigkeit der Themen und stellen fest, dass der Anteil von<br />
Anzeigen zu „Soziales“ bei der SPD 60 Prozent beträgt, bei der CDU hingegen nur 40<br />
Prozent. Die entscheidende Frage lautet nun: Ist es sinnvoll, zur Untersuchung des Unterschieds<br />
der Anteile einen Signifikanztest einzusetzen? Die Antwort lautet wieder wie<br />
oben: Es kommt dar<strong>auf</strong> an, was wir genau ermitteln wollen.<br />
Wir wollen zuerst davon ausgehen, dass keine Messfehler <strong>auf</strong>treten. Wenn wir dann<br />
einen Signifikanztest einsetzen, dann sagt uns das Ergebnis lediglich, wie wahrscheinlich<br />
die beobachtete Verteilung der Themen ist, wenn wir davon ausgehen, dass beide<br />
Parteien die jeweiligen Themen mit derselben a-priori-Wahrscheinlichkeit wählen, die<br />
z.B. bei einem Chi²-Test durch die Randverteilung des Merkmals in der Stichprobe geschätzt<br />
wird. Nehmen wir an, die Anzahl aller Anzeigen von SPD und CDU sei gleich<br />
groß, dann wäre in unserem speziellen Fall diese a-priori-Wahrscheinlichkeit gleich 0,5.<br />
Die Unterschiede können dann als Ergebnis eines stochastischen Prozesses bei der Generierung<br />
der Daten, d.h. der Themenwahl, interpretiert werden. Wenn der Unterschied<br />
statistisch signifikant ausfällt, dann heißt dies lediglich, dass wir auch hier einen<br />
„Designeffekt“ vorliegen haben, d.h. dass die Parteien ihre Themen nicht zufällig, sondern<br />
bewusst wählen. Dies scheint aber theoretisch keine besonders gehaltvolle Aussage<br />
zu sein, denn natürlich gehen wir davon aus, dass Parteien ihre Themen bewusst wäh-<br />
1 Auch bei normalen Schlüssen von Stichproben <strong>auf</strong> die Grundgesamtheit gehen wir davon aus,<br />
dass die Varianz des untersuchten Merkmals in der Grundgesamtheit substanzieller Art ist.<br />
Nicht die Variable selbst ist zufällig verteilt, sondern der Stichprobenmittelwert, der durch die<br />
zufällige Auswahl einer Menge von Werten der Variable aus der Grundgesamtheit gebildet wurde.