29.01.2015 Aufrufe

Auswertung univariater Datenmengen - deskriptiv

Auswertung univariater Datenmengen - deskriptiv

Auswertung univariater Datenmengen - deskriptiv

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

<strong>Auswertung</strong> <strong>univariater</strong><br />

<strong>Datenmengen</strong> - <strong>deskriptiv</strong><br />

Prof. Kück / R. Bernitz / Dr. Ricabal<br />

Lehrstuhl Statistik<br />

Lage- und Streuungsparameter II<br />

1<br />

Bibliografie<br />

‣ Prof. Dr. Kück;<br />

Statistik, Vorlesungsskript<br />

Abschnitt 6.1.1<br />

‣ Bleymüller/Gehlert/Gülicher;<br />

Statistik für Wirtschaftswissenschaftler<br />

Verlag Vahlen<br />

‣ Bleymüller/Gehlert;<br />

Formeln, Tabellen und Programme<br />

Verlag Vahlen<br />

Prof. Kück / R. Bernitz / Dr. Ricabal<br />

Lehrstuhl Statistik<br />

Lage- und Streuungsparameter II<br />

2<br />

1


Typen von Mittelwerten<br />

Die im Abschnitt 6.1.1 vermittelten Mittelwerte sind:<br />

‣Häufigster Wert (Modus)<br />

‣Zentralwert (Median)<br />

‣Arithmetisches Mittel<br />

‣Harmonisches Mittel<br />

‣Chronologisches Mittel<br />

‣Geometrisches Mittel<br />

Prof. Kück / R. Bernitz / Dr. Ricabal<br />

Lehrstuhl Statistik<br />

Lage- und Streuungsparameter II<br />

3<br />

Arithmetisches Mittel - Beispiel<br />

Beispiel: Aus den Erwerbsquoten der fünf Bundesländer soll die Erwerbsquote für<br />

Norddeutschland berechnet werden (Klausuraufgabe 3 vom Februar 2003).<br />

Bundesland Bevölkerungsanteil<br />

(%)<br />

Erwerbstätige<br />

(Tsd.)<br />

Erwerbsquote<br />

(%)<br />

BIP<br />

(Mrd.€)<br />

Bremen 4,8 385 53,5 23,4<br />

Hamburg 11,6 1.048 60,2 75,5<br />

Mecklenburg-V. 11,8 730 41,2 29,7<br />

Niedersachsen 53,0 3.482 43,8 180,4<br />

Schleswig-Holst. 18,8 1.230 43,6 66,0<br />

k<br />

µ = ∑ x<br />

if<br />

i=<br />

1<br />

i<br />

µ = 53,5 ⋅ 0,048 + 60,2 ⋅ 0,116 + 41,2 ⋅ 0,118 + 43,8 ⋅ 0,53 + 43,6 ⋅ 0,188<br />

µ = 45,82<br />

Die Erwerbsquote für Norddeutschland beträgt 45,82 %.<br />

Für diese Berechnung benötigt man die Länderwerte des Merkmals<br />

(Erwerbsquote) und die Länderanteile (Bevölkerungsanteil) als Gewichte.<br />

Prof. Kück / R. Bernitz / Dr. Ricabal<br />

Lehrstuhl Statistik<br />

Lage- und Streuungsparameter II<br />

4<br />

2


Eigenschaften des arithmetischen Mittels<br />

Null-Eigenschaft: Die Summe der Abweichungen der<br />

Beobachtungswerte vom arithmetischen Mittel ist Null.<br />

Quadratische Minimumeigenschaft: Die Summe der<br />

quadrierten Abweichungen zwischen Beobachtungswerten<br />

und einem beliebigen Wert erreicht das Minimum für das<br />

arithmetische Mittel.<br />

Die Lineare Transformation der Beobachtungswerte<br />

bewirkt die analoge Transformation des arithmetischen<br />

Mittels.<br />

Das arithmetische Mittel einer Gesamtmasse aggregiert die<br />

arithmetischen Mittel von Teilmassen in gewogener Form.<br />

Prof. Kück / R. Bernitz / Dr. Ricabal<br />

Lehrstuhl Statistik<br />

Lage- und Streuungsparameter II<br />

5<br />

Null-Eigenschaft des arithmetischen Mittels<br />

Die Summe der Abweichungen der Beobachtungswerte vom<br />

arithmetischen Mittel ist Null.<br />

N<br />

∑<br />

i=<br />

1<br />

(a<br />

i<br />

− µ) = 0<br />

mit<br />

µ<br />

=<br />

N<br />

∑<br />

i = 1<br />

N<br />

a<br />

i<br />

Beweis:<br />

N<br />

N<br />

N<br />

∑ ∑ ∑ ∑ ∑<br />

(a<br />

i<br />

− µ) = a<br />

i<br />

− µ = a<br />

i<br />

− N⋅<br />

µ = a<br />

i<br />

− a<br />

i<br />

= 0<br />

i= 1<br />

i=<br />

1 i=<br />

1 i= 1<br />

i=<br />

1<br />

N<br />

N<br />

N<br />

∑<br />

i=<br />

1<br />

Prof. Kück / R. Bernitz / Dr. Ricabal<br />

Lehrstuhl Statistik<br />

Lage- und Streuungsparameter II<br />

6<br />

3


Null-Eigenschaft des arithmetischen Mittels<br />

-Beispiel-<br />

Beispiel: Körpergewicht in kg von 10 Personen.<br />

Das arithmetische Mittel des Gewichtes der 10 betrachteten Personen beträgt 65 kg.<br />

120<br />

100<br />

80<br />

60<br />

40<br />

20<br />

0<br />

µ<br />

Lisa<br />

Anna<br />

Antje<br />

Marie<br />

Dörte<br />

Sven<br />

Uwe<br />

Kai<br />

Jan<br />

Nils<br />

Einige Abweichungen der Einzelwerte zum arithmetischen Mittel sind positiv<br />

die anderen negativ. Ihre Summe ist gleich null.<br />

Prof. Kück / R. Bernitz / Dr. Ricabal<br />

Lehrstuhl Statistik<br />

Lage- und Streuungsparameter II<br />

7<br />

Quadratische Minimumeigenschaft<br />

des arithmetischen Mittels<br />

SQ(x) =<br />

Beweis:<br />

N<br />

∑<br />

i=<br />

1<br />

(a i<br />

− x)<br />

2<br />

erreicht ein Minimum an der Stelle x=µ<br />

dSQ(x)<br />

dx<br />

N<br />

= −2<br />

N<br />

∑<br />

i=<br />

1<br />

− 2∑(a<br />

i<br />

− x) = 0<br />

N<br />

∑<br />

i=<br />

1<br />

i=<br />

1<br />

(a<br />

i<br />

− x) = 0<br />

(a i<br />

− x)<br />

Erste Ableitung der Funktion SQ(x)<br />

Notwendige Bedingung<br />

N<br />

∑<br />

i=<br />

1<br />

a<br />

i<br />

− N⋅<br />

x = 0<br />

x =<br />

N<br />

∑<br />

i=<br />

1<br />

N<br />

a<br />

i<br />

= µ<br />

2<br />

d SQ(x)<br />

= + 2 > 0<br />

SQ(x) hat ein Minimum an der Stelle x= µ<br />

2<br />

dx<br />

Prof. Kück / R. Bernitz / Dr. Ricabal<br />

Lehrstuhl Statistik<br />

Lage- und Streuungsparameter II<br />

8<br />

4


Quadratische Minimumeigenschaft des<br />

arithmetischen Mittels - Beispiel<br />

Beispiel: Vergleich der Abweichungsquadrate beim arithmetischen Mittel<br />

65 kg und zwei anderen Werten (75, 55) :<br />

(44-65)² (44-75)² (44-55)²<br />

+ (46-65)² + (46-75)² + (46-55)²<br />

+ (50-65)² + (50-75)² + (50-55)²<br />

+ (54-65)² + (54-75)² + (54-55)²<br />

+ (56-65)² + (56-75)² + (56-55)²<br />

+ (69-65)² + (69-75)² + (69-55)²<br />

+ (72-65)² + (72-75)² + (72-55)²<br />

+ (78-65)² + (78-75)² + (78-55)²<br />

+ (80-65)² + (80-75)² + (80-55)²<br />

+ (101-65)² + (101-75)² + (101-55)²<br />

= 2.984 = 3.984 = 3.984<br />

Prof. Kück / R. Bernitz / Dr. Ricabal<br />

Lehrstuhl Statistik<br />

Lage- und Streuungsparameter II<br />

9<br />

Lineare Eigenschaft des arithmetischen Mittels<br />

Sei µ 1<br />

das arithmetische Mittel der N Beobachtungen eines Merkmals X.<br />

Sei Y eine lineare Transformation von X, d. h.<br />

y<br />

= ax b für alle i=1, 2, . . . , N<br />

i i<br />

+<br />

Dann gilt für das arithmetische Mittel µ 2<br />

von Y: µ 2<br />

=aµ 1<br />

+b<br />

Beweis:<br />

N<br />

∑<br />

N<br />

∑<br />

y<br />

i<br />

ax<br />

i<br />

+ b a x<br />

i<br />

+ N⋅<br />

b<br />

i=<br />

1 i=<br />

1<br />

i=<br />

1<br />

µ = = =<br />

= aµ<br />

1<br />

N N<br />

N<br />

2<br />

+<br />

N<br />

∑<br />

b<br />

Prof. Kück / R. Bernitz / Dr. Ricabal<br />

Lehrstuhl Statistik<br />

Lage- und Streuungsparameter II<br />

10<br />

5


Lineare Eigenschaft des arithmetischen Mittel<br />

-Beispiel -<br />

Beispiel: Wäre das Gewicht aller erfassten Personen in Pfund statt in Kilogramm<br />

angegeben, würde sich das arithmetische Mittel entsprechend verdoppeln. Das<br />

arithmetische Mittel ist äquivariant gegenüber dieser Transformation.<br />

Gewicht<br />

200<br />

175<br />

150<br />

125<br />

100<br />

75<br />

50<br />

25<br />

0<br />

Lisa<br />

Anna<br />

Prof. Kück / R. Bernitz / Dr. Ricabal<br />

Lehrstuhl Statistik<br />

Lineare Transformation<br />

Andje<br />

Marie<br />

Dörte<br />

Sven<br />

Uwe<br />

Kai<br />

Jan<br />

Nils<br />

Kilogramm<br />

Pfund<br />

Lage- und Streuungsparameter II<br />

Mittelwert aus<br />

transformierten Daten<br />

Y=2X (Gewicht in Pfund)<br />

µ y<br />

= 130<br />

Mittelwert aus<br />

ursprünglichen Daten<br />

X (Gewicht in kg)<br />

µ x<br />

= 65<br />

µ = 2 ⋅<br />

y<br />

µ x<br />

11<br />

Aggregierbarkeit des arithmetischen Mittels<br />

Seien T 1 , T 2 , …, T k k Teilgesamtheiten jeweils mit<br />

N 1 , N 2 , …, N k Merkmalsträgern. Seien µ 1 , µ 2 , …, µ k<br />

die entsprechenden arithmetischen Mittel in der<br />

Teilgesamtheiten. Für das arithmetische Mittel µ der<br />

Grundgesamtheit G gilt:<br />

µ k<br />

N k<br />

µ 2<br />

µ 1 N 2<br />

N 1<br />

N1<br />

N<br />

2<br />

µ = ⋅ µ<br />

1+<br />

⋅ µ<br />

2<br />

+ L+<br />

N N<br />

N<br />

k<br />

N<br />

⋅ µ<br />

k<br />

=<br />

k<br />

∑<br />

i=<br />

1<br />

N<br />

i<br />

N<br />

⋅µ<br />

i<br />

mit<br />

N = N L+<br />

1+<br />

N<br />

2<br />

+ N<br />

k<br />

Prof. Kück / R. Bernitz / Dr. Ricabal<br />

Lehrstuhl Statistik<br />

Lage- und Streuungsparameter II<br />

12<br />

6


µ<br />

Aggregierbarkeit des arithmetischen Mittels<br />

-Beweis-<br />

=<br />

k<br />

∑<br />

i=<br />

i<br />

N<br />

i<br />

⋅µ<br />

i<br />

N<br />

und<br />

Prof. Kück / R. Bernitz / Dr. Ricabal<br />

Lehrstuhl Statistik<br />

µ k<br />

N k<br />

µ 2<br />

µ 1 N 2<br />

N 1<br />

folgen:<br />

N<br />

∑<br />

j=<br />

1<br />

N<br />

∑<br />

j=<br />

1<br />

N<br />

x<br />

x<br />

Aus<br />

=<br />

Lage- und Streuungsparameter II<br />

j<br />

j<br />

N<br />

∑<br />

j=<br />

1<br />

µ<br />

i<br />

=<br />

N<br />

i<br />

∑<br />

+<br />

j=<br />

1<br />

x<br />

j<br />

⇒ N<br />

i⋅<br />

µ<br />

i<br />

=<br />

N<br />

i<br />

und<br />

1 N<br />

N<br />

x<br />

j<br />

2<br />

∑<br />

j=<br />

1<br />

N1⋅<br />

µ<br />

1<br />

N<br />

2⋅<br />

µ<br />

2<br />

N<br />

k<br />

⋅µ<br />

µ = + + L+<br />

N N N<br />

N<br />

x<br />

k<br />

j<br />

+ L+<br />

x<br />

j<br />

x<br />

j<br />

=<br />

j=<br />

1 j=<br />

1<br />

+<br />

N N<br />

+ L+<br />

=<br />

k<br />

∑<br />

i=<br />

i<br />

N<br />

i<br />

∑<br />

j=<br />

1<br />

k<br />

∑<br />

j=<br />

1<br />

1 N2<br />

Nk<br />

∑<br />

∑<br />

∑<br />

j=<br />

1<br />

N<br />

13<br />

x<br />

x<br />

x<br />

N<br />

i<br />

⋅ µ<br />

i<br />

N<br />

j<br />

j<br />

j<br />

Aggregierbarkeit des arithmetischen Mittels<br />

-Beispiel -<br />

Beispiel: Für die 250 nach Karosserieform gruppierten<br />

Autos ergeben sich folgende Mittelwerte:<br />

Karosserieform<br />

Großraumlimousine<br />

Kombi<br />

Schräghecklimousine<br />

Stufenhecklimousine<br />

Mittelwert<br />

108,06<br />

110,15<br />

93,97<br />

169,25<br />

Gruppenumfang<br />

16<br />

20<br />

117<br />

97<br />

µ<br />

µ<br />

Gesamt<br />

Gesamt<br />

16<br />

= 108,06 ⋅ + 110,15⋅<br />

250<br />

= 125,37 PS<br />

20<br />

250<br />

117<br />

+ 93,97 ⋅ + 169,25⋅<br />

250<br />

97<br />

250<br />

Prof. Kück / R. Bernitz / Dr. Ricabal<br />

Lehrstuhl Statistik<br />

Lage- und Streuungsparameter II<br />

14<br />

7


Beurteilung des arithmetischen Mittels<br />

‣ Das arithmetische Mittel ist der in der Praxis am<br />

häufigsten verwendete Mittelwert.<br />

‣ Für Verteilungen, die stärker von den<br />

Eigenschaften der Symmetrie und Eingipfeligkeit<br />

abweichen, eignet sich das arithmetische Mittel<br />

nicht, da der berechnete Mittelwert nicht das<br />

Zentrum der Verteilung repräsentiert.<br />

Prof. Kück / R. Bernitz / Dr. Ricabal<br />

Lehrstuhl Statistik<br />

Lage- und Streuungsparameter II<br />

15<br />

Beurteilung des arithmetischen Mittels -Beispiel<br />

Es sei folgende empirische Häufigkeitsverteilung gegeben:<br />

f(x i<br />

)<br />

Der numerische Wert für das arithmetische Mittel ist „richtig“.<br />

Sachlich ist dieser Mittelwert jedoch ungeeignet, da er eine falsche<br />

Vorstellung vom Zentrum der Verteilung vermittelt. Denken sie an die Kuh!<br />

x i<br />

Prof. Kück / R. Bernitz / Dr. Ricabal<br />

Lehrstuhl Statistik<br />

Lage- und Streuungsparameter II<br />

16<br />

8


Geometrisches Mittel<br />

Das geometrische Mittel ist dann anzuwenden, wenn<br />

Wachstumsfaktoren, Indexzahlen, die für mehrere<br />

Zeitperioden vorliegen, gemittelt werden sollen.<br />

Für eine Reihe einzelner Werte (Wachstumsfaktoren,<br />

Indexzahlen) a 1 , a 2 , . . . a N ermittelt man das ungewogene<br />

geometrische Mittel G wie folgt:<br />

Anzahl der multiplikativ<br />

verknüpften Faktoren<br />

G<br />

=<br />

N<br />

a<br />

1⋅<br />

a<br />

2⋅...<br />

⋅ a<br />

N<br />

Wachstumsfaktor, Indexzahl<br />

als Verhältnis zweier<br />

Bestandsdaten<br />

Prof. Kück / R. Bernitz / Dr. Ricabal<br />

Lehrstuhl Statistik<br />

Lage- und Streuungsparameter II<br />

17<br />

Geometrisches Mittel - Beispiel<br />

Beispiel: Der Zinsplan einer 5-jährigen Festgeldanlage sieht folgende<br />

Verzinsung vor:<br />

Im 1. Jahr: 4,5%<br />

Im 2. Jahr: 5,0%<br />

Im 3. Jahr: 5,5%<br />

Im 4. Jahr: 6,0%<br />

Im 5. Jahr: 6,5%<br />

Wie hoch ist die durchschnittliche Verzinsung G der 5 Jahre Verwenden Sie in<br />

der Formel die Indexzahlen und nicht die ausgewiesenen Prozentwerte!<br />

G =<br />

N<br />

a<br />

1⋅<br />

a<br />

2⋅...<br />

⋅ a<br />

N<br />

G =<br />

5<br />

G = 1,055<br />

1,045⋅1,05⋅1,055⋅1,06<br />

⋅1,065<br />

Verzinsung durchschnittlich<br />

pro Jahr 5,5%<br />

Prof. Kück / R. Bernitz / Dr. Ricabal<br />

Lehrstuhl Statistik<br />

Lage- und Streuungsparameter II<br />

18<br />

9


Geometrisches Mittel - Beispiel<br />

Beispiel: Der Zinsplan einer 5-jährigen Festgeldanlage A sieht folgende Verzinsung<br />

vor:<br />

Im 1. Jahr: 4,5% Im 4. Jahr: 6,0%<br />

Im 2. Jahr: 5,0% Im 5. Jahr: 6,5%<br />

Im 3. Jahr: 5,5%<br />

Wie hoch ist die durchschnittliche Verzinsung G der 5 Jahre Verwenden Sie in der<br />

Formel die Indexzahlen und nicht die ausgewiesenen Prozentwerte!<br />

Lösung:<br />

Nach 5 Jahren hat die Anlage einen Wert von:<br />

Wenn G die durchschnittliche Verzinsung der 5 Jahre ist, dann muss folgendes gelten:<br />

5<br />

G⋅<br />

G⋅<br />

G⋅<br />

G⋅<br />

G⋅<br />

A = G ⋅ A = 1,045⋅1,05⋅1,055⋅1,06<br />

⋅1,065⋅<br />

A<br />

Daraus folgt:<br />

G =<br />

5 1,045⋅1,05⋅1,055⋅1,06<br />

⋅1,065<br />

= 1,055<br />

Prof. Kück / R. Bernitz / Dr. Ricabal<br />

Lehrstuhl Statistik<br />

Lage- und Streuungsparameter II<br />

1,045⋅1,05⋅1,055⋅1,06<br />

⋅1,065⋅<br />

A<br />

Verzinsung<br />

durchschnittlich<br />

pro Jahr 5,5%<br />

19<br />

Geometrisches Mittel für gehäufte Daten<br />

Treten Wachstumsfaktoren gehäuft auf, so gilt:<br />

Wachstumsfaktor h(a i )<br />

a 1<br />

h 1<br />

a 2 h 2<br />

.<br />

.<br />

.<br />

.<br />

G<br />

=<br />

N<br />

Wachstumsfaktor<br />

a<br />

h<br />

1<br />

1 2<br />

⋅ a ⋅...<br />

⋅ a<br />

h<br />

2<br />

h<br />

k<br />

k<br />

.<br />

a k<br />

Summe<br />

.<br />

h k<br />

N<br />

Anzahl des Auftretens des<br />

jeweiligen Wachstumsfaktors<br />

Prof. Kück / R. Bernitz / Dr. Ricabal<br />

Lehrstuhl Statistik<br />

Lage- und Streuungsparameter II<br />

20<br />

10


Geometrisches Mittel für gehäufte Daten<br />

-Beispiel -<br />

Beispiel: Berechnen Sie den durchschnittlichen Wachstumsfaktor<br />

Wachstumsfaktoren<br />

1,10<br />

1,15<br />

1,20<br />

1,25<br />

1,30<br />

1,35<br />

Summe<br />

h(a i )<br />

4<br />

1<br />

3<br />

2<br />

5<br />

3<br />

18<br />

6<br />

h(a i<br />

)<br />

4<br />

2<br />

0<br />

1,1 1,15 1,2 1,25 1,3 1,35<br />

G =<br />

=<br />

18<br />

1,10<br />

1 3<br />

⋅1,15<br />

⋅1,20<br />

41,528898 = 1,23<br />

⋅1,25<br />

⋅1,30<br />

⋅1,35<br />

18 4<br />

2 5 3<br />

Prof. Kück / R. Bernitz / Dr. Ricabal<br />

Lehrstuhl Statistik<br />

Lage- und Streuungsparameter II<br />

21<br />

Geometrisches Mittel für gehäufte Daten - Beispiel<br />

Beispiel: Russlands Präsident Putin hat angekündigt, Russland werde den<br />

wirtschaftlichen Output binnen 10 Jahre verdoppeln. Mit welcher Rate muss das<br />

Inlandsprodukt durchschnittlich pro Jahr wachsen, damit das Ziel erreicht wird<br />

Für die Entwicklung des Inlandsproduktes (Bestandsdaten B 0<br />

) nach<br />

10 Jahren mit durchschnittlichem Wachstum G pro Jahr gelten:<br />

B<br />

G<br />

= 2 ⋅<br />

10<br />

B 0<br />

10<br />

⋅ B<br />

Prof. Kück / R. Bernitz / Dr. Ricabal<br />

Lehrstuhl Statistik<br />

0<br />

= 2 ⋅ B<br />

0<br />

Lage- und Streuungsparameter II<br />

G =<br />

10 2<br />

G = 1,0718<br />

Soll das ehrgeizige Ziel erreicht werden, muss das Inlandsprodukt im Durchschnitt<br />

um 7,18% p. a. steigen.<br />

Es gilt für die Entwicklung des Inlandsproduktes (Bestandsdaten B 0<br />

) in den<br />

Perioden 0,1,…,N<br />

B N<br />

= B 0<br />

* G N<br />

22<br />

11


Beurteilung des geometrischen Mittels<br />

‣ Das geometrische Mittel ist das Analog0n zum<br />

arithmetischen Mittel, bei dem jede Rechenoperation um<br />

eine Stufe erhöht ist.<br />

‣ Abweichend zum arithmetischen Mittel müssen zur<br />

Anwendung des geometrischen Mittels ausschließlich<br />

positive Merkmalswerte vorliegen.<br />

‣ Aussage des geometrischen Mittels: Würde eine Größe mit<br />

dem geometrischen Mittel wachsen, so käme der selbe<br />

Endwert zustande, wenn die Größe um die jeweiligen<br />

Wachstumsfaktoren wachsen würde.<br />

In diesem Sinne ist das geometrische Mittel der<br />

durchschnittliche Wachstumsfaktor.<br />

Prof. Kück / R. Bernitz / Dr. Ricabal<br />

Lehrstuhl Statistik<br />

Lage- und Streuungsparameter II<br />

23<br />

Eigenschaften des geometrischen Mittels<br />

‣ Das geometrische Mittel hat anstelle der Null-<br />

Eigenschaft die Eins-Eigenschaft. Es gilt:<br />

N<br />

∏<br />

a<br />

i<br />

G<br />

= 1<br />

i= 1<br />

Geometrisches Mittel<br />

Das Produkt der Verhältniszahlen zwischen<br />

Einzelwerten und geometrischem Mittel ist Eins.<br />

‣Der Logarithmus des geometrischen Mittels ist das<br />

arithmetische Mittel der logarithmierten Einzelwerte.<br />

G =<br />

N<br />

a<br />

1⋅<br />

a<br />

2⋅...<br />

⋅ a<br />

N<br />

lnG =<br />

N<br />

∑<br />

i=<br />

1<br />

lna<br />

N<br />

i<br />

Prof. Kück / R. Bernitz / Dr. Ricabal<br />

Lehrstuhl Statistik<br />

Lage- und Streuungsparameter II<br />

24<br />

12


Eins-Eigenschaften des geometrischen Mittels<br />

- Beweis -<br />

N<br />

∏<br />

i=<br />

1<br />

a<br />

i<br />

G<br />

= 1<br />

Das Produkt der Verhältniszahlen zwischen<br />

Einzelwerten und geometrischem Mittel ist Eins.<br />

Geometrisches Mittel<br />

N<br />

∏<br />

i=<br />

1<br />

a<br />

i<br />

G<br />

a1<br />

a<br />

2<br />

a<br />

N<br />

a<br />

= ⋅ L =<br />

G G G<br />

=<br />

a<br />

1<br />

⋅ a<br />

La<br />

(<br />

N<br />

a ⋅ a La<br />

)<br />

1<br />

2<br />

2<br />

N<br />

N<br />

N<br />

1<br />

⋅ a<br />

=<br />

2<br />

N<br />

G<br />

a<br />

a<br />

La<br />

1<br />

1<br />

⋅ a<br />

⋅ a<br />

2<br />

2<br />

N<br />

La<br />

La<br />

N<br />

N<br />

= 1<br />

Prof. Kück / R. Bernitz / Dr. Ricabal<br />

Lehrstuhl Statistik<br />

Lage- und Streuungsparameter II<br />

25<br />

Harmonisches Mittel<br />

Das harmonische Mittel wird angewendet, wenn die<br />

Merkmalsausprägungen als Quotienten gegeben sind, deren<br />

Nennergrößen nicht vorliegen.<br />

Man unterscheidet:<br />

1.) Ungewogenes harmonisches Mittel<br />

2.) Gewogenes harmonisches Mittel.<br />

Ungewogenes harmonisches Mittel:<br />

= N 1<br />

H =<br />

N<br />

1 1<br />

N<br />

∑<br />

∑<br />

1<br />

i=<br />

1 a<br />

i<br />

N i=<br />

1 a<br />

i<br />

Quotient, über dessen Zähler Angaben<br />

vorliegen, über dessen Nenner jedoch nicht.<br />

Prof. Kück / R. Bernitz / Dr. Ricabal<br />

Lehrstuhl Statistik<br />

Lage- und Streuungsparameter II<br />

26<br />

13


Ungewogenes harmonisches Mittel - Beispiel<br />

Beispiel: Ein Fahrzeug fährt auf vier gleich langen Teilstrecken folgende<br />

Geschwindigkeiten:<br />

1.) v 1<br />

=40 km/h → t 1<br />

=L/v 1<br />

2.) v 2<br />

=50 km/h → t 2<br />

=L/v 2<br />

3.) v 3<br />

=80 km/h → t 3<br />

=L/v 3<br />

4.) v 4<br />

=100 km/h → t 4<br />

=L/v 4<br />

Ein falsches Ergebnis liefert die einfache arithmetische Mittelung<br />

der vier Geschwindigkeiten. Dieser Mittelwert beträgt 67,5 km/h.<br />

Prof. Kück / R. Bernitz / Dr. Ricabal<br />

Lehrstuhl Statistik<br />

L<br />

Lage- und Streuungsparameter II<br />

L<br />

L<br />

L<br />

t 1 t 2<br />

t 3<br />

t 4<br />

Der Zähler des Verhältnisses, die Länge der Strecke, ist ausreichend spezifiziert<br />

(gleichlange Teilstrecken), über den Nenner, die dafür benötigte Zeit, liegen keine<br />

direkten Angaben vor. Die Zeit für die jeweiligen Teilstrecken lässt sich aus der<br />

Geschwindigkeit und der Länge der Strecke berechen.<br />

Weg<br />

4 L<br />

4<br />

Durchschni tt_V = =<br />

=<br />

= 59,26km/h<br />

Fahrzeit L L L L 1 1 1 1<br />

+ + + + + +<br />

40 50 80 100 40 50 80 100<br />

27<br />

Ungewogenes harmonisches Mittel - Beispiel<br />

Erweitern wir das Beispiel und nehmen an, dass jede Teilstrecke 10 km lang ist.<br />

Dann ergibt sich eine Gesamtstrecke von 40 km, eine Gesamtfahrzeit von 0,675<br />

Stunden und eine durchschnittliche Geschwindigkeit von 59,26 km/h.<br />

L L L L<br />

t 1 t 2<br />

t 3<br />

t 4<br />

10 + 10 + 10 + 10<br />

V =<br />

= 59,26 km/h<br />

0,25 + 0,20 + 0,125 + 0,10<br />

Im Nenner des harmonischen Mittels wird die zurückgelegte Fahrzeit<br />

ausgewiesen. Sie wird aus dem Verhältnis Weg/Geschwindigkeit berechnet.<br />

Man erhält das gleiche Ergebnis. Das heißt, die Durchschnittgeschwindigkeit<br />

ist vom konkreten Wert der Strecke unabhängig.<br />

Prof. Kück / R. Bernitz / Dr. Ricabal<br />

Lehrstuhl Statistik<br />

Lage- und Streuungsparameter II<br />

28<br />

14


Gewogenes harmonisches Mittel<br />

Das harmonische Mittel ist unter Verwendung<br />

gehäufter bzw. klassierter Daten zu berechnen:<br />

H<br />

= k<br />

∑<br />

i=<br />

1<br />

Klassenanzahl<br />

1<br />

1<br />

x<br />

i<br />

f<br />

i<br />

Relative Häufigkeit des Merkmals<br />

Merkmal (Verhältnis), über dessen Zähler Angaben<br />

vorliegen, über dessen Nenner jedoch nicht<br />

Prof. Kück / R. Bernitz / Dr. Ricabal<br />

Lehrstuhl Statistik<br />

Lage- und Streuungsparameter II<br />

29<br />

Gewogenes harmonisches Mittel - Beispiel<br />

Beispiel: Es liegen die Arbeitslosenquoten nach Gebieten vor, aus denen die<br />

Arbeitslosenquote für Deutschland gesamt berechnet werden soll:<br />

Neue Länder<br />

Alte Länder<br />

Deutschland<br />

Anzahl der Arbeitslosen<br />

1.047.015<br />

2.564.906<br />

3.611.921<br />

Arbeitslosenquote in %<br />

14,9<br />

9,3<br />

Aus den Zahlen der Arbeitslosen wird die relative Häufigkeit f i<br />

ermittelt:<br />

1.047.015 2.564.906 = 0,28988<br />

= 0,71012<br />

3.611.921<br />

3.611.921<br />

1<br />

H 1<br />

H =<br />

= 10,44%<br />

1<br />

1<br />

1<br />

∑ f<br />

i<br />

⋅ 0,28988 + ⋅ 0,71012<br />

x<br />

14,9 9,3<br />

= k<br />

i=<br />

1<br />

i<br />

Prof. Kück / R. Bernitz / Dr. Ricabal<br />

Lehrstuhl Statistik<br />

Lage- und Streuungsparameter II<br />

30<br />

15


Beurteilung des harmonischen Mittels<br />

‣ Analog zum arithmetischen Mittel setzt die Ermittlung ebenfalls<br />

kardinalskalierte Merkmale voraus.<br />

‣ Eine zweite Anwendungsvoraussetzung sind positive<br />

Merkmalswerte.<br />

‣ Das harmonische Mittel wird für Fälle umgekehrter<br />

Proportionalität verwendet.<br />

‣ Bedeutung hat das harmonische Mittel, wenn die Einzelwerte<br />

Verhältniszahlen sind.<br />

‣ Bei der Gewichtung der Verhältniszahlen ist nicht die Nenner-,<br />

sondern die Zählergröße zu verwenden.<br />

Prof. Kück / R. Bernitz / Dr. Ricabal<br />

Lehrstuhl Statistik<br />

Lage- und Streuungsparameter II<br />

31<br />

Das chronologische Mittel ist eine spezielle Maßzahl, welche zur statistischen<br />

Beschreibung von Beständen (B) gebraucht wird. Aus methodischer Sicht ist<br />

die Unterscheidung von Bestands-, Bewegungs- und korrespondierenden<br />

Massen notwendig (Abschnitt 2.1.2). Bestandsmassen verweilen über einen<br />

bestimmten Zeitraum hinweg, sie werden zu diskreten Zeitpunkten gemessen.<br />

1<br />

= ⎢ ∑ − 0<br />

k ⎣<br />

i=<br />

k 1<br />

⎡<br />

⎤<br />

( ; t ) 0,5 ⋅ B + B + 0,5 ⋅ B ⎥ ⎦<br />

B t<br />

Chronologisches Mittel<br />

Liegen Bestandsmessungen zu möglichst äquidistanten Zeitpunkten vor, dann<br />

liefert das chronologische Mittel eine Aussage über den Durchschnittsbestand<br />

für einen Zeitraum. Es verwendet dazu die mittleren Bestände aller<br />

Zeitintervalle k. Es gilt:<br />

a<br />

e<br />

Durch die Verwendung der mittleren Bestände je Zeitintervall [t i<br />

, t i+1<br />

] gehen<br />

die Randwerte nur mit halbem Gewicht in die Durchschnittsberechnung ein.<br />

1<br />

i<br />

k<br />

Prof. Kück / R. Bernitz / Dr. Ricabal<br />

Lehrstuhl Statistik<br />

Lage- und Streuungsparameter II<br />

32<br />

16


Chronologisches Mittel<br />

Beispiel: Aus folgenden Stichtagsbeständen je Zeitintervall (Monat) ist der<br />

Durchschnittsbestand für das erste Quartal zu berechnen:<br />

Stichtag<br />

01.01.<br />

31.01.<br />

Bevölkerungsbestand<br />

1000<br />

1010<br />

Bevölkerungsbestand<br />

pro Monat<br />

1005<br />

Bevölkerungsbestand<br />

pro Quartal<br />

01.02.<br />

28.02.<br />

1010<br />

1020<br />

1015<br />

1015<br />

01.03.<br />

31.03.<br />

1020<br />

1030<br />

1025<br />

Prof. Kück / R. Bernitz / Dr. Ricabal<br />

Lehrstuhl Statistik<br />

( 1000 + 1010) ( 1010 + 1020) ( 1020 1030)<br />

⎡ +<br />

⎢<br />

+<br />

+<br />

⎣ 2<br />

2<br />

2<br />

Schrittweise Berechnung:<br />

3<br />

500 + 1010 + 1020 + 515<br />

Direkte Berechnung:<br />

= 1015<br />

3<br />

Lage- und Streuungsparameter II<br />

⎤<br />

⎥<br />

⎦<br />

= 1015<br />

33<br />

Beispiel: Für sieben aufeinander folgende Tage weist die Kasse eines<br />

Unternehmens am Geschäftsschluss (18 Uhr) folgende Bestände auf:<br />

Werktag<br />

01.03.<br />

02.03.<br />

03.03.<br />

04.03.<br />

05.03.<br />

06.03<br />

07.03.<br />

Chronologisches Mittel - Beispiel<br />

Kassenbestand (€)<br />

18.00 Uhr<br />

3.211,56<br />

2.831,11<br />

3.760,30<br />

2.928,89<br />

2.438,71<br />

3.461,96<br />

4.023,44<br />

4500<br />

4000<br />

3500<br />

3000<br />

2500<br />

2000<br />

1500<br />

1000<br />

500<br />

Durchschnittlicher Kassenbestand<br />

0<br />

1 2 3 4 5 6 7<br />

B = (1605,78 + 15420,97 + 2011,72) / 6 = 3173,08<br />

Der tagesdurchschnittliche Kassenbestand in der ersten Märzwoche<br />

beträgt 3.173,08 Euro.<br />

Prof. Kück / R. Bernitz / Dr. Ricabal<br />

Lehrstuhl Statistik<br />

Lage- und Streuungsparameter II<br />

34<br />

17


Zusammenfassung Mittelwerte<br />

‣ Eignung nach Skalierung:<br />

Kardinalskala<br />

Ordinalskala<br />

Nominalskala<br />

Arithmetisches Mittel<br />

X<br />

Median<br />

X<br />

X<br />

Modus<br />

X<br />

X<br />

X<br />

‣ Der Median und der Modus sind Lageparameter, deren Werte bei<br />

diskreten Merkmalen i. Allg. mit realen Merkmalsausprägungen<br />

übereinstimmt.<br />

‣ Berechnete Mittelwerte sind arithmetisches, geometrisches,<br />

harmonisches und chronologisches Mittel. Die Eignung des jeweiligen<br />

Mittelwertes hängt von Spezifika der Daten ab. In jedem Fall müssen<br />

die Merkmale jedoch kardinalskaliert sein.<br />

Prof. Kück / R. Bernitz / Dr. Ricabal<br />

Lehrstuhl Statistik<br />

Lage- und Streuungsparameter II<br />

35<br />

Zusammenfassung Mittelwerte<br />

Symmetrieregeln geben die Größenbeziehung<br />

zwischen den Mittelwerten an.<br />

Für metrisch skalierte Merkmale können das arithmetische<br />

Mittel, der Median und der Modus auch dazu verwendet<br />

werden, um Symmetrie oder Schiefe einer Verteilung<br />

beurteilen zu können. Der Vergleich der numerischen Werte<br />

liefert Vorstellungen über die Verteilungsform.<br />

f(x)<br />

• Bei symetrischer Verteilung gilt:<br />

AM=Me=Mo<br />

bzw. angeschwächt:<br />

AM~Me~Mo<br />

µ = Me = Mo<br />

x<br />

Prof. Kück / R. Bernitz / Dr. Ricabal<br />

Lehrstuhl Statistik<br />

Lage- und Streuungsparameter II<br />

36<br />

18


Zusammenfassung Mittelwerte<br />

f(x)<br />

• Bei linkssteiler (rechtsschiefer)<br />

Verteilung gilt:<br />

AM>Me>Mo<br />

Mo<br />

Me<br />

µ<br />

x<br />

f(x)<br />

• Bei rechtssteiler (linksschiefer)<br />

Verteilung gilt:<br />

AM


Vorsicht bei Mittelwerten!<br />

„Sollen wir das arithmetische<br />

Mittel als durchschnittliche<br />

Körpergröße nehmen und den<br />

Gegner erschrecken, oder<br />

wollen wir ihn einlullen und<br />

nehmen den Median“<br />

Entnommen aus Krämer, W. So lügt man mit Statistik.<br />

Prof. Kück / R. Bernitz / Dr. Ricabal<br />

Lehrstuhl Statistik<br />

Lage- und Streuungsparameter II<br />

39<br />

Vorsicht bei Mittelwerten!<br />

Median oder arithmetisches Mittel<br />

(Aus Krämer: So lügt man mit Statistik)<br />

...Wenn z.B. der Präsident der Bundesärztekammer vom<br />

mittleren Einkommen der deutschen Ärzte spricht, meint er<br />

i.d.R. nicht das arithmetische Mittel sondern den Median. Wann<br />

immer im deutschen Ärzteblatt von Geld die Rede ist, erinnert<br />

man sich gern daran, dass es außer dem arithmetische Mittel<br />

noch andere Mittelwerte gibt.<br />

Auf der anderen Seite rufen Kritiker, die meinen, deutsche Ärzte<br />

verdienen viel zu viel, gern das arithmetische Mittel in den<br />

Zeugenstand. Dieses ist wie bei allen rechtsschiefen Verteilungen<br />

immer größer als der von den Ärzten bevorzugte Median.<br />

Z. B. Laborarzt: Arithmetische Mittel: 700.000 DM p.a.<br />

Median: 500.000 DM p.a.<br />

Prof. Kück / R. Bernitz / Dr. Ricabal<br />

Lehrstuhl Statistik<br />

Lage- und Streuungsparameter II<br />

40<br />

20


Vorsicht bei Mittelwerten!<br />

Das durchschnittliche Einkommen im Sultanat Brunei beträgt nach<br />

dem arithmetischen Mittel berechnet 54.000 DM, für Deutschland<br />

dagegen 46.000 DM.<br />

Zu beachten ist jedoch, dass die Einkommensverteilung in Brunei<br />

erheblich schiefer ist als die von Deutschland. Lässt man den Sultan,<br />

der als reichster Mensch der Erde gilt, und seine Familie weg, sieht das<br />

Bild schon ganz anders aus.<br />

Solche „Ausreißer“, wie die Statistiker sagen, ziehen das arithmetische<br />

Mittel an sich heran wie ein Magnet.<br />

Aus Krämer, W. So lügt man mit Statistik.<br />

Prof. Kück / R. Bernitz / Dr. Ricabal<br />

Lehrstuhl Statistik<br />

Lage- und Streuungsparameter II<br />

41<br />

Überlegen Sie selbst!<br />

Berechnen Sie für die<br />

ausgewiesenen Jahre die<br />

durchschnittliche<br />

Kinderzahl, die<br />

Akademikerinnen in<br />

West- und in<br />

Ostdeutschland haben.<br />

Wie müsste man vorgehen,<br />

wenn aus diesen Daten ein<br />

„Durchschnittswert“ für<br />

Deutschland über<br />

Kinderlosigkeit bei<br />

Akademikerinnen<br />

ausgewiesen werden soll<br />

Quelle: http://www.spiegel.de/unispiegel/jobundberuf/0,1518,373449,00.html<br />

Prof. Kück / R. Bernitz / Dr. Ricabal<br />

42<br />

Lehrstuhl Statistik<br />

Lage- und Streuungsparameter II<br />

21

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!