20.08.2012 Aufrufe

7. Maßzahlen zur Analyse von Verteilungen

7. Maßzahlen zur Analyse von Verteilungen

7. Maßzahlen zur Analyse von Verteilungen

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

<strong>7.</strong> <strong>Maßzahlen</strong> <strong>zur</strong> <strong>Analyse</strong> <strong>von</strong> <strong>Verteilungen</strong><br />

Häufigkeitsverteilungen und ihre grafischen Aufbereitungen reichen häufig für die Auswertung des<br />

statistischen Materials nicht aus. Aus dem Material werden deshalb charakteristische Werte,<br />

<strong>Maßzahlen</strong>, herausgearbeitet, die weitergehende Aussagen, <strong>Analyse</strong>n und Vergleiche zulassen.<br />

Wichtige <strong>Maßzahlen</strong> sind Mittelwerte und Streumaße.<br />

<strong>7.</strong>1 Mittelwerte<br />

<strong>7.</strong>1.1. Häufigster Wert<br />

Eine statistische Masse kann gelegentlich dadurch recht gut gekennzeichnet werden, dass man die<br />

Merkmalsausprägung benennt, die am häufigsten in der Verteilung vorkommt. So kann aus der<br />

Tabelle 3.2 auf Seite 17 (Ausgangsbeispiel) abgelesen werden, dass die Merkmalsausprägung 40<br />

fünfzehnmal aufgetreten ist; d. h. die Gruppe der 40-Jährigen ist in der Großhandlung Anton Müller<br />

die größte Altersgruppe.<br />

Die Merkmalsausprägung mit der größten Häufigkeit in einer statistischen Masse<br />

(oder in einer Häufigkeitsverteilung) bezeichnet man als häufigsten Wert.<br />

In der Tabelle 3.3 auf Seite 19 (Mitarbeiter je Abteilung) kann der häufigste Wert als die am stärksten<br />

besetzte Abteilung interpretiert werden (im Beispiel also die Abteilung Verkauf). Bei den Ergebnissen<br />

der Kaufmannsgehilfenprüfung in Tabelle 3.5 auf Seite 19 ist die Note „3” der häufigste Wert.<br />

Bei klassiertem Material genügt es, wenn die Häufigkeit der am dichtesten besetzten Klasse als<br />

häufigster Wert angenommen wird. So ist z. B. in der Aufbereitung des Ausgangsbeispiels die 4.<br />

Klasse am dichtesten besetzt, der häufigste Wert ist 41 (vgl. Tabelle 3.10 auf Seite 23).<br />

Bei bestimmten qualitativen Merkmalen ist der häufigste Wert der einzige sinnvolle Mittelwert. Zur<br />

Verdeutlichung ein Beispiel: Nach einem Fachwirtelehrgang werden die 20 Teilnehmer danach<br />

gefragt, ob ihre Erwartung mehr oder weniger gut oder nicht erfüllt wurde. Antworten:<br />

gut erfüllt – 11,<br />

teilweise erfüllt – 6,<br />

nicht erfüllt – 3.<br />

Häufigster Wert also 11.<br />

<strong>7.</strong>1.2 Median (zentraler Wert)<br />

Ein weiterer Mittelwert <strong>zur</strong> Kennzeichnung einer statistischen Masse ist der sog. Median. Er gibt<br />

für Merkmalsausprägungen, die sich sinnvoll in einer Reihe ordnen lassen, den zentralen Wert an.<br />

Der Median ist also in einer Reihe <strong>von</strong> Merkmalsausprägungen die Ausprägung, die in der Mitte<br />

dieser Reihe liegt; er teilt die Reihe in zwei Hälften, beide Teile enthalten die gleiche Anzahl <strong>von</strong><br />

Merkmalsausprägungen.


Zur Verdeutlichung zwei Beispiele:<br />

Die fünf Mitglieder einer Gruppe geben ihr Alter wie folgt an:<br />

Mitglieder<br />

Alter in Jahren:<br />

<strong>7.</strong> <strong>Maßzahlen</strong> <strong>zur</strong> <strong>Analyse</strong> <strong>von</strong> <strong>Verteilungen</strong><br />

In dieser geordneten Reihe der Altersangaben gibt die Merkmalsausprägung 31 den zentralen Wert<br />

an. Der Wert 31 teilt die Reihe in zwei gleiche Teile.<br />

Die Ergebnisse der Kaufmannsgehilfenprüfung – Großhandel – (vgl. Tabelle 3.5) zeigen in einer<br />

geordneten Reihe folgendes Bild:<br />

Reihenfolge Note<br />

1<br />

2<br />

3<br />

4<br />

5<br />

6<br />

7<br />

8<br />

9<br />

10<br />

11<br />

12<br />

Es ist unschwer zu erkennen, dass der zentrale Wert zwischen dem 12. und dem 13. Wert liegen muss.<br />

Der zentrale Wert oder Median ist der Wert, der eine geordnete Reihe <strong>von</strong><br />

Merkmalsausprägungen in zwei Teile teilt, die jeweils die gleiche Anzahl <strong>von</strong><br />

Merkmalsausprägungen enthalten.<br />

Der zentrale Wert wird mit folgender Formel errechnet:<br />

x n + 1<br />

<strong>7.</strong>1.3 Arithmetisches Mittel<br />

1<br />

2<br />

2<br />

3<br />

3<br />

3<br />

3<br />

3<br />

3<br />

3<br />

3<br />

4<br />

A<br />

25<br />

Das arithmetische Mittel ist der gebräuchlichste Mittelwert, er wird häufig auch als Durchschnitt<br />

bezeichnet.<br />

Zwei Beispiele sollen das Problem verdeutlichen. Für seine 122 Mitarbeiter zahlte der Großhändler<br />

Anton Müller im April 20.. Löhne <strong>von</strong> insgesamt 262.300,- €; im Durchschnitt verdiente ein<br />

Mitarbeiter<br />

B<br />

30<br />

1<br />

zW = bzw. zW = (xn<br />

2<br />

2<br />

2<br />

C<br />

31<br />

D<br />

50<br />

E<br />

52<br />

Reihenfolge Note<br />

13<br />

14<br />

15<br />

16<br />

17<br />

18<br />

19<br />

20<br />

21<br />

22<br />

23<br />

24<br />

+ x n<br />

2<br />

+ 1)<br />

4<br />

4<br />

4<br />

4<br />

4<br />

5<br />

5<br />

5<br />

5<br />

5<br />

6<br />

6


<strong>7.</strong>1 Mittelwerte<br />

262.300<br />

122<br />

2.150,- €.<br />

= 2.150<br />

Die fünf Mitglieder einer Gruppe sind 25, 30, 31, 50 und 52 Jahre als. Das Durchschnittsalter (37,6<br />

Jahre) ergibt sich durch folgende Berechnung:<br />

25 + 30 + 31 + 50 + 52<br />

5<br />

= 188<br />

5<br />

= 37,6 Jahre<br />

In diesen Beispielen wurde das sog. einfache arithmetische Mittel (der einfache Durchschnitt)<br />

ermittelt. Das einfache arithmetische Mittel wird errechnet, wenn die einzelnen Merkmalsausprägungen<br />

einer Reihe addiert und die sich ergebende Summe durch die Zahl der Merkmalsausprägungen<br />

(d. h. durch die Gesamtheit) dividiert wird.<br />

Formel für die Errechnung des einfachen arithmetischen Mittels:<br />

x =<br />

n<br />

∑<br />

i=1<br />

N<br />

Das folgende Beispiel zeigt, wie das arithmetische Mittel errechnet wird, wenn einzelne Merkmalsausprägungen<br />

mehrfach auftreten.<br />

Als Grundlage für Vergleiche soll die Durchschnittsnote für das Ergebnis der Kaufmannsgehilfenprüfung<br />

(Industrie) ermittelt werden. Diese Note ergibt sich durch folgende Berechnung:<br />

3 · 1 + 4 · 2 + 11 · 3 + 8 · 4 + 4 · 5 96<br />

= = 3,2<br />

30<br />

30<br />

oder in der Tabelle (vgl. Tabelle <strong>7.</strong>1)<br />

Tab. <strong>7.</strong>1: Gewogenes arithmetisches Mittel (nach Tab. 3.8)<br />

x i<br />

1<br />

2<br />

3<br />

4<br />

5<br />

6<br />

h i<br />

x i<br />

x i · h i<br />

3 3<br />

4 8<br />

11 33<br />

8 32<br />

4 20<br />

– –<br />

30 96<br />

x = 96<br />

= 3,2<br />

30


<strong>7.</strong> <strong>Maßzahlen</strong> <strong>zur</strong> <strong>Analyse</strong> <strong>von</strong> <strong>Verteilungen</strong><br />

In diesem Beispiel wurde das sog. gewogene arithmetische Mittel errechnet. Bei der Ermittlung des<br />

gewogenen arithmetischen Mittels werden die Merkmalsausprägungen mit ihren Häufigkeiten<br />

multipliziert, die so gewichteten Ausprägungen werden addiert und das Ergebnis durch die<br />

Gesamtheit der Ausprägungen dividiert.<br />

Formel für die Errechnung des gewogenen arithmetischen Mittels:<br />

x =<br />

n<br />

∑<br />

i=1<br />

(x i · h i )<br />

N<br />

Auch für klassierte Merkmalsausprägungen lässt sich das arithmetische Mittel berechnen. Dazu<br />

gewichtet man die jeweiligen Klassenmitteln mit den Häufigkeiten der Ausprägungen in den<br />

entsprechenden Klassen. Zur Verdeutlichung wird das Ausgangsbeispiel herangezogen (vgl. dazu<br />

Tabelle 3.10).<br />

Tab. <strong>7.</strong>2: Gewogenes arithmetisches Mittel bei klassierten Merkmalsausprägungen (nach Tab. 3.10)<br />

Das Durchschnittsalter der Mitarbeiter ist 41,4 Jahre.<br />

i<br />

1<br />

2<br />

3<br />

4<br />

5<br />

6<br />

km i<br />

17,9<br />

25<br />

35<br />

45<br />

55<br />

62,5<br />

Formel für die Errechnung des gewogenen arithmetischen Mittels bei klassiertem Material<br />

h i<br />

n<br />

∑ (kmi · xi )<br />

i=1<br />

x =<br />

N<br />

7<br />

24<br />

18<br />

41<br />

20<br />

12<br />

122<br />

x = 5.050,3 = 41,4<br />

122<br />

Hier zeigt sich ein Problem. Bei Berechnung des Durchschnitts aus dem noch nicht klassierten<br />

Material ergibt sich folgender Wert:<br />

4.695<br />

x = = 38,5.<br />

122<br />

km i · h i<br />

125,3<br />

600<br />

630<br />

1.845<br />

1.100<br />

750<br />

5.050,3


<strong>7.</strong>2 Streumaße<br />

Die unterschiedlichen Werte ergeben sich dadurch, dass sich die Merkmalsausprägungen in den<br />

Klassen nicht gleichmäßig um die Klassenmitte verteilen. Die Klassenmitte ist nicht das Mittel der<br />

Ausprägungen in der Klasse.<br />

In manchen Fällen ist es nicht zweckmäßig, das arithmetische Mittel zu berechnen. Wenn etwa in<br />

einer Gruppe 90 % der Mitglieder zwischen 20 und 30 Jahren, die anderen 60 Jahre und älter sind,<br />

würde das arithmetische Mittel den Sachverhalt verzerrt darstellen. Hier erscheint es sinnvoll, den<br />

häufigsten Wert zu ermitteln.<br />

Häufigster Wert<br />

<strong>7.</strong>2 Streumaße<br />

Mittelwerte<br />

Median<br />

(zentraler Wert)<br />

einfaches<br />

arithmetisches<br />

Mittel<br />

Sehr häufig sagen Mittelwerte nicht genug über eine Häufigkeitsverteilung oder über eine Reihe <strong>von</strong><br />

beobachteten Werten aus. Wichtig ist die weitergehende Information, wie weit Häufigkeiten bzw.<br />

beobachtete Werte vom Mittelwert abweichen, d. h. wie sie streuen.<br />

Streumaße geben also Informationen über Abweichungen <strong>von</strong> errechneten Mittelwerten; sie<br />

messen, wie die Häufigkeiten bzw. die beobachteten Werte um den Mittelwert streuen.<br />

Zur Verdeutlichung der Fragestellung zwei Beispiele:<br />

arithmetisches<br />

Mittel<br />

gewogenes<br />

arithmetisches<br />

Mittel<br />

Bei der Ermittlung des Durchschnittslohns der 122 Arbeitnehmer bei der Großhandlung Anton<br />

Müller ergab sich ein Wert <strong>von</strong> 2.150,- €. Ein vergleichbares Unternehmen in Bremen ermittelte für<br />

seine Mitarbeiter den gleichen Durchschnittslohn. Ein Vergleich ist aber wenig sinnvoll, weil man<br />

nicht weiß, wie weit die Löhne einzelner Mitarbeiter vom Durchschnitt abweichen. So könnte z. B.<br />

bei der Firma Müller eine relativ große Gruppe <strong>von</strong> Mitarbeitern erheblich weniger verdienen als<br />

2.150,- €.<br />

„Der Kongressabgeordnete John Jennigs führte am 06.06.1946 vor dem Amerikanischen Kongress<br />

aus, dass die durchschnittliche Tiefe des Tombigbee River zu gewissen Zeiten nur ein Fuß betrage.<br />

Mit anderen Worten, man kann den Fluß <strong>von</strong> der Mündung bis <strong>zur</strong> Quelle durchwaten. Ein Fluss mit<br />

einer durchschnittlichen Tiefe <strong>von</strong> 1 Fuß kann in Wirklichkeit an manchen Stellen sehr tief sein. Die<br />

durchschnittliche Tiefe sagt darüber, ob man den Fluss durchwaten kann, gar nichts”. 1<br />

1 Vgl. J. Pfanzagl, Allgemeine Methodenlehre der Statistik, Bd. I, Berlin 1964, S. 29


<strong>7.</strong> <strong>Maßzahlen</strong> <strong>zur</strong> <strong>Analyse</strong> <strong>von</strong> <strong>Verteilungen</strong><br />

Im Folgenden sollen einige Streumaße besprochen und an einfachen Beispielen verdeutlicht werden.<br />

<strong>7.</strong>2.1 Spannweite<br />

Das einfachste Maß <strong>zur</strong> Angabe einer Streuung ist die Spannweite. Sie gibt die Spanne zwischen den<br />

beiden äußersten Beobachtungswerten an, d. h. den Unterschied zwischen dem größten und dem<br />

kleinsten Beobachtungswert.<br />

Die Spannweite ist die Differenz zwischen dem größten und dem kleinsten<br />

Beobachtungswert.<br />

Sp = x n – x 1<br />

Im Ausgangsbeispiel ist der größte Wert 65, der kleinste Wert 17 (vgl. Tabelle 3.2 auf Seite 17); die<br />

Spannweite beträgt also 65 – 17 = 48. Bei klassierten Merkmalen gibt die Differenz zwischen der<br />

obersten und der untersten Klassengrenze die Spannweite an.<br />

Die Spannweite ist ein grobes und darum wenig aussagefähiges Streumaß. Sie berücksichtigt nur die<br />

beiden äußeren Werte (bzw. äußeren Grenzen) einer Verteilung, die dazwischenliegenden Werte<br />

werden vernachlässigt.<br />

<strong>7.</strong>2.2 Mittlere lineare Abweichung<br />

Mit der mittleren linearen Abweichung, die gelegentlich auch lineare Streuung genannt wird,<br />

ermittelt man, wie die Ausprägungen einer Reihe <strong>von</strong> beobachteten Werten <strong>von</strong> ihrem Mittelwert<br />

durchschnittlich abweichen. Der Mittelwert kann das arithmetische Mittel, aber auch der Median<br />

sein. Für die Berechnung der linearen Streuung (mittlere lineare Abweichung) ist also zunächst<br />

die Ermittlung des Mittelwerts erforderlich; sodann wird festgestellt, wie die einzelnen Werte <strong>von</strong><br />

diesem Mittelwert abweichen; schließlich wird aus diesen einzelnen Abweichungen der Durchschnitt<br />

errechnet.<br />

Zur Veranschaulichung ein einfaches Beispiel: Die 5 Reisenden der Großhandlung Anton Müller<br />

haben im April 20.. die in der Tabelle angegebenen Umsätze erzielt. Hieraus werden das arithmetische<br />

Mittel und die mittlere lineare Abweichung errechnet.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!