Kapitel 15 Explorative Datenanalyse
Kapitel 15 Explorative Datenanalyse
Kapitel 15 Explorative Datenanalyse
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
378 <strong>Kapitel</strong> <strong>15</strong> <strong>Explorative</strong> <strong>Datenanalyse</strong><br />
Schätzer, bei dem sämtliche Werte mit einem Gewicht größer null berücksichtigt<br />
werden. Da bei der Einkommensverteilung vor allem sehr große und nur in geringerem<br />
Ausmaß sehr kleine Werte aufgetreten sind, liefert dies ein höheres Ergebnis<br />
als die anderen Schätzer.<br />
Ausreißer<br />
Mit der Option Ausreißer aus der Dialogfeld Statistik können Sie sich für die betrachteten<br />
Variablen, ggf. getrennt nach einzelnen Untergruppen, eine Liste von<br />
Ausreißern ausgeben lassen. Ausreißer sind Werte, die im Verhältnis zu den meisten<br />
übrigen Werten der jeweiligen Verteilung auffallend deutlich nach oben oder<br />
nach unten abweichen, die also sehr groß oder sehr klein sind. Wann genau ein<br />
Wert als Ausreißer bezeichnet wird, hängt sowohl von der Lage als auch von der<br />
Verteilung der Werte in der betrachteten Stichprobe ab. Hierbei gibt es keine allgemein<br />
gültige Definition von Ausreißern in dem Sinne, daß bei bekannter Lage<br />
und Verteilung die Grenze, von der an ein Wert als Ausreißer bezeichnet wird,<br />
eindeutig bestimmt werden könnte. Eine solche allgemeine Definition wäre auch<br />
nicht sehr sinnvoll, da es stets von der inhaltlichen Bedeutung der Werte sowie<br />
von der einer statistischen Analyse zugrundeliegenden Fragestellung und Zielsetzung<br />
abhängt, wann ein Wert sinnvollerweise als Ausreißer betrachtet werden<br />
sollte.<br />
Auch innerhalb von SPSS kommen unterschiedliche Definitionen von Ausreißern<br />
zur Anwendung. So werden die Ausreißer in einem Boxplot in Abhängigkeit von<br />
ihrer relativen Entfernung zu dem Bereich der 50% mittleren Werte (Bereich zwischen<br />
dem 25%-Perzentil und dem 75%-Perzentil) bestimmt. Werte, deren Entfernung<br />
von diesem Bereich mindestens 1,5mal so groß ist wie die Breite des Bereichs<br />
selbst, werden dort als Ausreißer gekennzeichnet. 174 Der Liste von Ausreißern,<br />
die durch die Prozedur EXPLORATIVE DATENANALYSE ausgegeben wird,<br />
liegt dagegen eine andere Definition zugrunde. Diese Liste gibt für jede Stichprobe<br />
(also für jede Variable, ggf. getrennt nach Fallgruppen) lediglich jeweils die<br />
fünf größten und fünf kleinsten Werte wieder. Abbildung <strong>15</strong>.5 zeigt diese Liste für<br />
die Variable v261 (Nettoeinkommen) jeweils getrennt für die neuen und die alten<br />
Bundesländer.<br />
Wir haben bereits mehrfach festgestellt, daß die großen Werte in der Einkommensverteilung<br />
wesentlich stärker streuen als die kleinen Werte. Dies zeigt sich<br />
auch wieder in der Liste der Ausreißer, da die fünf größten Werte in beiden Erhebungsgebieten<br />
wesentlich weiter vom jeweiligen Mittelwert sowie von den M-<br />
Schätzern (s.o.) entfernt liegen als die fünf kleinsten Werte. Weiterhin ist zu erkennen,<br />
daß sich die fünf kleinsten Werte in den alten Bundesländern nicht wesentlich<br />
von den entsprechenden Werten der neuen Bundesländer unterscheiden.<br />
Dies stellt sich bei den fünf größten Werten dagegen anders dar: Hier liegen die<br />
Ausreißer in den alten Bundesländern deutlich über den entsprechenden Werten<br />
der neuen Bundesländer. Für den fünften Ausreißer nach oben in den alten Bun-<br />
174 Siehe hierzu auch den folgenden Abschnitt <strong>15</strong>.2.2, Boxplots.<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing