20.06.2014 Aufrufe

Kapitel 15 Explorative Datenanalyse

Kapitel 15 Explorative Datenanalyse

Kapitel 15 Explorative Datenanalyse

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

378 <strong>Kapitel</strong> <strong>15</strong> <strong>Explorative</strong> <strong>Datenanalyse</strong><br />

Schätzer, bei dem sämtliche Werte mit einem Gewicht größer null berücksichtigt<br />

werden. Da bei der Einkommensverteilung vor allem sehr große und nur in geringerem<br />

Ausmaß sehr kleine Werte aufgetreten sind, liefert dies ein höheres Ergebnis<br />

als die anderen Schätzer.<br />

Ausreißer<br />

Mit der Option Ausreißer aus der Dialogfeld Statistik können Sie sich für die betrachteten<br />

Variablen, ggf. getrennt nach einzelnen Untergruppen, eine Liste von<br />

Ausreißern ausgeben lassen. Ausreißer sind Werte, die im Verhältnis zu den meisten<br />

übrigen Werten der jeweiligen Verteilung auffallend deutlich nach oben oder<br />

nach unten abweichen, die also sehr groß oder sehr klein sind. Wann genau ein<br />

Wert als Ausreißer bezeichnet wird, hängt sowohl von der Lage als auch von der<br />

Verteilung der Werte in der betrachteten Stichprobe ab. Hierbei gibt es keine allgemein<br />

gültige Definition von Ausreißern in dem Sinne, daß bei bekannter Lage<br />

und Verteilung die Grenze, von der an ein Wert als Ausreißer bezeichnet wird,<br />

eindeutig bestimmt werden könnte. Eine solche allgemeine Definition wäre auch<br />

nicht sehr sinnvoll, da es stets von der inhaltlichen Bedeutung der Werte sowie<br />

von der einer statistischen Analyse zugrundeliegenden Fragestellung und Zielsetzung<br />

abhängt, wann ein Wert sinnvollerweise als Ausreißer betrachtet werden<br />

sollte.<br />

Auch innerhalb von SPSS kommen unterschiedliche Definitionen von Ausreißern<br />

zur Anwendung. So werden die Ausreißer in einem Boxplot in Abhängigkeit von<br />

ihrer relativen Entfernung zu dem Bereich der 50% mittleren Werte (Bereich zwischen<br />

dem 25%-Perzentil und dem 75%-Perzentil) bestimmt. Werte, deren Entfernung<br />

von diesem Bereich mindestens 1,5mal so groß ist wie die Breite des Bereichs<br />

selbst, werden dort als Ausreißer gekennzeichnet. 174 Der Liste von Ausreißern,<br />

die durch die Prozedur EXPLORATIVE DATENANALYSE ausgegeben wird,<br />

liegt dagegen eine andere Definition zugrunde. Diese Liste gibt für jede Stichprobe<br />

(also für jede Variable, ggf. getrennt nach Fallgruppen) lediglich jeweils die<br />

fünf größten und fünf kleinsten Werte wieder. Abbildung <strong>15</strong>.5 zeigt diese Liste für<br />

die Variable v261 (Nettoeinkommen) jeweils getrennt für die neuen und die alten<br />

Bundesländer.<br />

Wir haben bereits mehrfach festgestellt, daß die großen Werte in der Einkommensverteilung<br />

wesentlich stärker streuen als die kleinen Werte. Dies zeigt sich<br />

auch wieder in der Liste der Ausreißer, da die fünf größten Werte in beiden Erhebungsgebieten<br />

wesentlich weiter vom jeweiligen Mittelwert sowie von den M-<br />

Schätzern (s.o.) entfernt liegen als die fünf kleinsten Werte. Weiterhin ist zu erkennen,<br />

daß sich die fünf kleinsten Werte in den alten Bundesländern nicht wesentlich<br />

von den entsprechenden Werten der neuen Bundesländer unterscheiden.<br />

Dies stellt sich bei den fünf größten Werten dagegen anders dar: Hier liegen die<br />

Ausreißer in den alten Bundesländern deutlich über den entsprechenden Werten<br />

der neuen Bundesländer. Für den fünften Ausreißer nach oben in den alten Bun-<br />

174 Siehe hierzu auch den folgenden Abschnitt <strong>15</strong>.2.2, Boxplots.<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!