Auswertung univariater Datenmengen - deskriptiv
Auswertung univariater Datenmengen - deskriptiv
Auswertung univariater Datenmengen - deskriptiv
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
<strong>Auswertung</strong> <strong>univariater</strong><br />
<strong>Datenmengen</strong> - <strong>deskriptiv</strong><br />
Prof. Kück / R. Bernitz / Dr. Ricabal<br />
Lehrstuhl Statistik<br />
Lage- und Streuungsparameter II<br />
1<br />
Bibliografie<br />
‣ Prof. Dr. Kück;<br />
Statistik, Vorlesungsskript<br />
Abschnitt 6.1.1<br />
‣ Bleymüller/Gehlert/Gülicher;<br />
Statistik für Wirtschaftswissenschaftler<br />
Verlag Vahlen<br />
‣ Bleymüller/Gehlert;<br />
Formeln, Tabellen und Programme<br />
Verlag Vahlen<br />
Prof. Kück / R. Bernitz / Dr. Ricabal<br />
Lehrstuhl Statistik<br />
Lage- und Streuungsparameter II<br />
2<br />
1
Typen von Mittelwerten<br />
Die im Abschnitt 6.1.1 vermittelten Mittelwerte sind:<br />
‣Häufigster Wert (Modus)<br />
‣Zentralwert (Median)<br />
‣Arithmetisches Mittel<br />
‣Harmonisches Mittel<br />
‣Chronologisches Mittel<br />
‣Geometrisches Mittel<br />
Prof. Kück / R. Bernitz / Dr. Ricabal<br />
Lehrstuhl Statistik<br />
Lage- und Streuungsparameter II<br />
3<br />
Arithmetisches Mittel - Beispiel<br />
Beispiel: Aus den Erwerbsquoten der fünf Bundesländer soll die Erwerbsquote für<br />
Norddeutschland berechnet werden (Klausuraufgabe 3 vom Februar 2003).<br />
Bundesland Bevölkerungsanteil<br />
(%)<br />
Erwerbstätige<br />
(Tsd.)<br />
Erwerbsquote<br />
(%)<br />
BIP<br />
(Mrd.€)<br />
Bremen 4,8 385 53,5 23,4<br />
Hamburg 11,6 1.048 60,2 75,5<br />
Mecklenburg-V. 11,8 730 41,2 29,7<br />
Niedersachsen 53,0 3.482 43,8 180,4<br />
Schleswig-Holst. 18,8 1.230 43,6 66,0<br />
k<br />
µ = ∑ x<br />
if<br />
i=<br />
1<br />
i<br />
µ = 53,5 ⋅ 0,048 + 60,2 ⋅ 0,116 + 41,2 ⋅ 0,118 + 43,8 ⋅ 0,53 + 43,6 ⋅ 0,188<br />
µ = 45,82<br />
Die Erwerbsquote für Norddeutschland beträgt 45,82 %.<br />
Für diese Berechnung benötigt man die Länderwerte des Merkmals<br />
(Erwerbsquote) und die Länderanteile (Bevölkerungsanteil) als Gewichte.<br />
Prof. Kück / R. Bernitz / Dr. Ricabal<br />
Lehrstuhl Statistik<br />
Lage- und Streuungsparameter II<br />
4<br />
2
Eigenschaften des arithmetischen Mittels<br />
Null-Eigenschaft: Die Summe der Abweichungen der<br />
Beobachtungswerte vom arithmetischen Mittel ist Null.<br />
Quadratische Minimumeigenschaft: Die Summe der<br />
quadrierten Abweichungen zwischen Beobachtungswerten<br />
und einem beliebigen Wert erreicht das Minimum für das<br />
arithmetische Mittel.<br />
Die Lineare Transformation der Beobachtungswerte<br />
bewirkt die analoge Transformation des arithmetischen<br />
Mittels.<br />
Das arithmetische Mittel einer Gesamtmasse aggregiert die<br />
arithmetischen Mittel von Teilmassen in gewogener Form.<br />
Prof. Kück / R. Bernitz / Dr. Ricabal<br />
Lehrstuhl Statistik<br />
Lage- und Streuungsparameter II<br />
5<br />
Null-Eigenschaft des arithmetischen Mittels<br />
Die Summe der Abweichungen der Beobachtungswerte vom<br />
arithmetischen Mittel ist Null.<br />
N<br />
∑<br />
i=<br />
1<br />
(a<br />
i<br />
− µ) = 0<br />
mit<br />
µ<br />
=<br />
N<br />
∑<br />
i = 1<br />
N<br />
a<br />
i<br />
Beweis:<br />
N<br />
N<br />
N<br />
∑ ∑ ∑ ∑ ∑<br />
(a<br />
i<br />
− µ) = a<br />
i<br />
− µ = a<br />
i<br />
− N⋅<br />
µ = a<br />
i<br />
− a<br />
i<br />
= 0<br />
i= 1<br />
i=<br />
1 i=<br />
1 i= 1<br />
i=<br />
1<br />
N<br />
N<br />
N<br />
∑<br />
i=<br />
1<br />
Prof. Kück / R. Bernitz / Dr. Ricabal<br />
Lehrstuhl Statistik<br />
Lage- und Streuungsparameter II<br />
6<br />
3
Null-Eigenschaft des arithmetischen Mittels<br />
-Beispiel-<br />
Beispiel: Körpergewicht in kg von 10 Personen.<br />
Das arithmetische Mittel des Gewichtes der 10 betrachteten Personen beträgt 65 kg.<br />
120<br />
100<br />
80<br />
60<br />
40<br />
20<br />
0<br />
µ<br />
Lisa<br />
Anna<br />
Antje<br />
Marie<br />
Dörte<br />
Sven<br />
Uwe<br />
Kai<br />
Jan<br />
Nils<br />
Einige Abweichungen der Einzelwerte zum arithmetischen Mittel sind positiv<br />
die anderen negativ. Ihre Summe ist gleich null.<br />
Prof. Kück / R. Bernitz / Dr. Ricabal<br />
Lehrstuhl Statistik<br />
Lage- und Streuungsparameter II<br />
7<br />
Quadratische Minimumeigenschaft<br />
des arithmetischen Mittels<br />
SQ(x) =<br />
Beweis:<br />
N<br />
∑<br />
i=<br />
1<br />
(a i<br />
− x)<br />
2<br />
erreicht ein Minimum an der Stelle x=µ<br />
dSQ(x)<br />
dx<br />
N<br />
= −2<br />
N<br />
∑<br />
i=<br />
1<br />
− 2∑(a<br />
i<br />
− x) = 0<br />
N<br />
∑<br />
i=<br />
1<br />
i=<br />
1<br />
(a<br />
i<br />
− x) = 0<br />
(a i<br />
− x)<br />
Erste Ableitung der Funktion SQ(x)<br />
Notwendige Bedingung<br />
N<br />
∑<br />
i=<br />
1<br />
a<br />
i<br />
− N⋅<br />
x = 0<br />
x =<br />
N<br />
∑<br />
i=<br />
1<br />
N<br />
a<br />
i<br />
= µ<br />
2<br />
d SQ(x)<br />
= + 2 > 0<br />
SQ(x) hat ein Minimum an der Stelle x= µ<br />
2<br />
dx<br />
Prof. Kück / R. Bernitz / Dr. Ricabal<br />
Lehrstuhl Statistik<br />
Lage- und Streuungsparameter II<br />
8<br />
4
Quadratische Minimumeigenschaft des<br />
arithmetischen Mittels - Beispiel<br />
Beispiel: Vergleich der Abweichungsquadrate beim arithmetischen Mittel<br />
65 kg und zwei anderen Werten (75, 55) :<br />
(44-65)² (44-75)² (44-55)²<br />
+ (46-65)² + (46-75)² + (46-55)²<br />
+ (50-65)² + (50-75)² + (50-55)²<br />
+ (54-65)² + (54-75)² + (54-55)²<br />
+ (56-65)² + (56-75)² + (56-55)²<br />
+ (69-65)² + (69-75)² + (69-55)²<br />
+ (72-65)² + (72-75)² + (72-55)²<br />
+ (78-65)² + (78-75)² + (78-55)²<br />
+ (80-65)² + (80-75)² + (80-55)²<br />
+ (101-65)² + (101-75)² + (101-55)²<br />
= 2.984 = 3.984 = 3.984<br />
Prof. Kück / R. Bernitz / Dr. Ricabal<br />
Lehrstuhl Statistik<br />
Lage- und Streuungsparameter II<br />
9<br />
Lineare Eigenschaft des arithmetischen Mittels<br />
Sei µ 1<br />
das arithmetische Mittel der N Beobachtungen eines Merkmals X.<br />
Sei Y eine lineare Transformation von X, d. h.<br />
y<br />
= ax b für alle i=1, 2, . . . , N<br />
i i<br />
+<br />
Dann gilt für das arithmetische Mittel µ 2<br />
von Y: µ 2<br />
=aµ 1<br />
+b<br />
Beweis:<br />
N<br />
∑<br />
N<br />
∑<br />
y<br />
i<br />
ax<br />
i<br />
+ b a x<br />
i<br />
+ N⋅<br />
b<br />
i=<br />
1 i=<br />
1<br />
i=<br />
1<br />
µ = = =<br />
= aµ<br />
1<br />
N N<br />
N<br />
2<br />
+<br />
N<br />
∑<br />
b<br />
Prof. Kück / R. Bernitz / Dr. Ricabal<br />
Lehrstuhl Statistik<br />
Lage- und Streuungsparameter II<br />
10<br />
5
Lineare Eigenschaft des arithmetischen Mittel<br />
-Beispiel -<br />
Beispiel: Wäre das Gewicht aller erfassten Personen in Pfund statt in Kilogramm<br />
angegeben, würde sich das arithmetische Mittel entsprechend verdoppeln. Das<br />
arithmetische Mittel ist äquivariant gegenüber dieser Transformation.<br />
Gewicht<br />
200<br />
175<br />
150<br />
125<br />
100<br />
75<br />
50<br />
25<br />
0<br />
Lisa<br />
Anna<br />
Prof. Kück / R. Bernitz / Dr. Ricabal<br />
Lehrstuhl Statistik<br />
Lineare Transformation<br />
Andje<br />
Marie<br />
Dörte<br />
Sven<br />
Uwe<br />
Kai<br />
Jan<br />
Nils<br />
Kilogramm<br />
Pfund<br />
Lage- und Streuungsparameter II<br />
Mittelwert aus<br />
transformierten Daten<br />
Y=2X (Gewicht in Pfund)<br />
µ y<br />
= 130<br />
Mittelwert aus<br />
ursprünglichen Daten<br />
X (Gewicht in kg)<br />
µ x<br />
= 65<br />
µ = 2 ⋅<br />
y<br />
µ x<br />
11<br />
Aggregierbarkeit des arithmetischen Mittels<br />
Seien T 1 , T 2 , …, T k k Teilgesamtheiten jeweils mit<br />
N 1 , N 2 , …, N k Merkmalsträgern. Seien µ 1 , µ 2 , …, µ k<br />
die entsprechenden arithmetischen Mittel in der<br />
Teilgesamtheiten. Für das arithmetische Mittel µ der<br />
Grundgesamtheit G gilt:<br />
µ k<br />
N k<br />
µ 2<br />
µ 1 N 2<br />
N 1<br />
N1<br />
N<br />
2<br />
µ = ⋅ µ<br />
1+<br />
⋅ µ<br />
2<br />
+ L+<br />
N N<br />
N<br />
k<br />
N<br />
⋅ µ<br />
k<br />
=<br />
k<br />
∑<br />
i=<br />
1<br />
N<br />
i<br />
N<br />
⋅µ<br />
i<br />
mit<br />
N = N L+<br />
1+<br />
N<br />
2<br />
+ N<br />
k<br />
Prof. Kück / R. Bernitz / Dr. Ricabal<br />
Lehrstuhl Statistik<br />
Lage- und Streuungsparameter II<br />
12<br />
6
µ<br />
Aggregierbarkeit des arithmetischen Mittels<br />
-Beweis-<br />
=<br />
k<br />
∑<br />
i=<br />
i<br />
N<br />
i<br />
⋅µ<br />
i<br />
N<br />
und<br />
Prof. Kück / R. Bernitz / Dr. Ricabal<br />
Lehrstuhl Statistik<br />
µ k<br />
N k<br />
µ 2<br />
µ 1 N 2<br />
N 1<br />
folgen:<br />
N<br />
∑<br />
j=<br />
1<br />
N<br />
∑<br />
j=<br />
1<br />
N<br />
x<br />
x<br />
Aus<br />
=<br />
Lage- und Streuungsparameter II<br />
j<br />
j<br />
N<br />
∑<br />
j=<br />
1<br />
µ<br />
i<br />
=<br />
N<br />
i<br />
∑<br />
+<br />
j=<br />
1<br />
x<br />
j<br />
⇒ N<br />
i⋅<br />
µ<br />
i<br />
=<br />
N<br />
i<br />
und<br />
1 N<br />
N<br />
x<br />
j<br />
2<br />
∑<br />
j=<br />
1<br />
N1⋅<br />
µ<br />
1<br />
N<br />
2⋅<br />
µ<br />
2<br />
N<br />
k<br />
⋅µ<br />
µ = + + L+<br />
N N N<br />
N<br />
x<br />
k<br />
j<br />
+ L+<br />
x<br />
j<br />
x<br />
j<br />
=<br />
j=<br />
1 j=<br />
1<br />
+<br />
N N<br />
+ L+<br />
=<br />
k<br />
∑<br />
i=<br />
i<br />
N<br />
i<br />
∑<br />
j=<br />
1<br />
k<br />
∑<br />
j=<br />
1<br />
1 N2<br />
Nk<br />
∑<br />
∑<br />
∑<br />
j=<br />
1<br />
N<br />
13<br />
x<br />
x<br />
x<br />
N<br />
i<br />
⋅ µ<br />
i<br />
N<br />
j<br />
j<br />
j<br />
Aggregierbarkeit des arithmetischen Mittels<br />
-Beispiel -<br />
Beispiel: Für die 250 nach Karosserieform gruppierten<br />
Autos ergeben sich folgende Mittelwerte:<br />
Karosserieform<br />
Großraumlimousine<br />
Kombi<br />
Schräghecklimousine<br />
Stufenhecklimousine<br />
Mittelwert<br />
108,06<br />
110,15<br />
93,97<br />
169,25<br />
Gruppenumfang<br />
16<br />
20<br />
117<br />
97<br />
µ<br />
µ<br />
Gesamt<br />
Gesamt<br />
16<br />
= 108,06 ⋅ + 110,15⋅<br />
250<br />
= 125,37 PS<br />
20<br />
250<br />
117<br />
+ 93,97 ⋅ + 169,25⋅<br />
250<br />
97<br />
250<br />
Prof. Kück / R. Bernitz / Dr. Ricabal<br />
Lehrstuhl Statistik<br />
Lage- und Streuungsparameter II<br />
14<br />
7
Beurteilung des arithmetischen Mittels<br />
‣ Das arithmetische Mittel ist der in der Praxis am<br />
häufigsten verwendete Mittelwert.<br />
‣ Für Verteilungen, die stärker von den<br />
Eigenschaften der Symmetrie und Eingipfeligkeit<br />
abweichen, eignet sich das arithmetische Mittel<br />
nicht, da der berechnete Mittelwert nicht das<br />
Zentrum der Verteilung repräsentiert.<br />
Prof. Kück / R. Bernitz / Dr. Ricabal<br />
Lehrstuhl Statistik<br />
Lage- und Streuungsparameter II<br />
15<br />
Beurteilung des arithmetischen Mittels -Beispiel<br />
Es sei folgende empirische Häufigkeitsverteilung gegeben:<br />
f(x i<br />
)<br />
Der numerische Wert für das arithmetische Mittel ist „richtig“.<br />
Sachlich ist dieser Mittelwert jedoch ungeeignet, da er eine falsche<br />
Vorstellung vom Zentrum der Verteilung vermittelt. Denken sie an die Kuh!<br />
x i<br />
Prof. Kück / R. Bernitz / Dr. Ricabal<br />
Lehrstuhl Statistik<br />
Lage- und Streuungsparameter II<br />
16<br />
8
Geometrisches Mittel<br />
Das geometrische Mittel ist dann anzuwenden, wenn<br />
Wachstumsfaktoren, Indexzahlen, die für mehrere<br />
Zeitperioden vorliegen, gemittelt werden sollen.<br />
Für eine Reihe einzelner Werte (Wachstumsfaktoren,<br />
Indexzahlen) a 1 , a 2 , . . . a N ermittelt man das ungewogene<br />
geometrische Mittel G wie folgt:<br />
Anzahl der multiplikativ<br />
verknüpften Faktoren<br />
G<br />
=<br />
N<br />
a<br />
1⋅<br />
a<br />
2⋅...<br />
⋅ a<br />
N<br />
Wachstumsfaktor, Indexzahl<br />
als Verhältnis zweier<br />
Bestandsdaten<br />
Prof. Kück / R. Bernitz / Dr. Ricabal<br />
Lehrstuhl Statistik<br />
Lage- und Streuungsparameter II<br />
17<br />
Geometrisches Mittel - Beispiel<br />
Beispiel: Der Zinsplan einer 5-jährigen Festgeldanlage sieht folgende<br />
Verzinsung vor:<br />
Im 1. Jahr: 4,5%<br />
Im 2. Jahr: 5,0%<br />
Im 3. Jahr: 5,5%<br />
Im 4. Jahr: 6,0%<br />
Im 5. Jahr: 6,5%<br />
Wie hoch ist die durchschnittliche Verzinsung G der 5 Jahre Verwenden Sie in<br />
der Formel die Indexzahlen und nicht die ausgewiesenen Prozentwerte!<br />
G =<br />
N<br />
a<br />
1⋅<br />
a<br />
2⋅...<br />
⋅ a<br />
N<br />
G =<br />
5<br />
G = 1,055<br />
1,045⋅1,05⋅1,055⋅1,06<br />
⋅1,065<br />
Verzinsung durchschnittlich<br />
pro Jahr 5,5%<br />
Prof. Kück / R. Bernitz / Dr. Ricabal<br />
Lehrstuhl Statistik<br />
Lage- und Streuungsparameter II<br />
18<br />
9
Geometrisches Mittel - Beispiel<br />
Beispiel: Der Zinsplan einer 5-jährigen Festgeldanlage A sieht folgende Verzinsung<br />
vor:<br />
Im 1. Jahr: 4,5% Im 4. Jahr: 6,0%<br />
Im 2. Jahr: 5,0% Im 5. Jahr: 6,5%<br />
Im 3. Jahr: 5,5%<br />
Wie hoch ist die durchschnittliche Verzinsung G der 5 Jahre Verwenden Sie in der<br />
Formel die Indexzahlen und nicht die ausgewiesenen Prozentwerte!<br />
Lösung:<br />
Nach 5 Jahren hat die Anlage einen Wert von:<br />
Wenn G die durchschnittliche Verzinsung der 5 Jahre ist, dann muss folgendes gelten:<br />
5<br />
G⋅<br />
G⋅<br />
G⋅<br />
G⋅<br />
G⋅<br />
A = G ⋅ A = 1,045⋅1,05⋅1,055⋅1,06<br />
⋅1,065⋅<br />
A<br />
Daraus folgt:<br />
G =<br />
5 1,045⋅1,05⋅1,055⋅1,06<br />
⋅1,065<br />
= 1,055<br />
Prof. Kück / R. Bernitz / Dr. Ricabal<br />
Lehrstuhl Statistik<br />
Lage- und Streuungsparameter II<br />
1,045⋅1,05⋅1,055⋅1,06<br />
⋅1,065⋅<br />
A<br />
Verzinsung<br />
durchschnittlich<br />
pro Jahr 5,5%<br />
19<br />
Geometrisches Mittel für gehäufte Daten<br />
Treten Wachstumsfaktoren gehäuft auf, so gilt:<br />
Wachstumsfaktor h(a i )<br />
a 1<br />
h 1<br />
a 2 h 2<br />
.<br />
.<br />
.<br />
.<br />
G<br />
=<br />
N<br />
Wachstumsfaktor<br />
a<br />
h<br />
1<br />
1 2<br />
⋅ a ⋅...<br />
⋅ a<br />
h<br />
2<br />
h<br />
k<br />
k<br />
.<br />
a k<br />
Summe<br />
.<br />
h k<br />
N<br />
Anzahl des Auftretens des<br />
jeweiligen Wachstumsfaktors<br />
Prof. Kück / R. Bernitz / Dr. Ricabal<br />
Lehrstuhl Statistik<br />
Lage- und Streuungsparameter II<br />
20<br />
10
Geometrisches Mittel für gehäufte Daten<br />
-Beispiel -<br />
Beispiel: Berechnen Sie den durchschnittlichen Wachstumsfaktor<br />
Wachstumsfaktoren<br />
1,10<br />
1,15<br />
1,20<br />
1,25<br />
1,30<br />
1,35<br />
Summe<br />
h(a i )<br />
4<br />
1<br />
3<br />
2<br />
5<br />
3<br />
18<br />
6<br />
h(a i<br />
)<br />
4<br />
2<br />
0<br />
1,1 1,15 1,2 1,25 1,3 1,35<br />
G =<br />
=<br />
18<br />
1,10<br />
1 3<br />
⋅1,15<br />
⋅1,20<br />
41,528898 = 1,23<br />
⋅1,25<br />
⋅1,30<br />
⋅1,35<br />
18 4<br />
2 5 3<br />
Prof. Kück / R. Bernitz / Dr. Ricabal<br />
Lehrstuhl Statistik<br />
Lage- und Streuungsparameter II<br />
21<br />
Geometrisches Mittel für gehäufte Daten - Beispiel<br />
Beispiel: Russlands Präsident Putin hat angekündigt, Russland werde den<br />
wirtschaftlichen Output binnen 10 Jahre verdoppeln. Mit welcher Rate muss das<br />
Inlandsprodukt durchschnittlich pro Jahr wachsen, damit das Ziel erreicht wird<br />
Für die Entwicklung des Inlandsproduktes (Bestandsdaten B 0<br />
) nach<br />
10 Jahren mit durchschnittlichem Wachstum G pro Jahr gelten:<br />
B<br />
G<br />
= 2 ⋅<br />
10<br />
B 0<br />
10<br />
⋅ B<br />
Prof. Kück / R. Bernitz / Dr. Ricabal<br />
Lehrstuhl Statistik<br />
0<br />
= 2 ⋅ B<br />
0<br />
Lage- und Streuungsparameter II<br />
G =<br />
10 2<br />
G = 1,0718<br />
Soll das ehrgeizige Ziel erreicht werden, muss das Inlandsprodukt im Durchschnitt<br />
um 7,18% p. a. steigen.<br />
Es gilt für die Entwicklung des Inlandsproduktes (Bestandsdaten B 0<br />
) in den<br />
Perioden 0,1,…,N<br />
B N<br />
= B 0<br />
* G N<br />
22<br />
11
Beurteilung des geometrischen Mittels<br />
‣ Das geometrische Mittel ist das Analog0n zum<br />
arithmetischen Mittel, bei dem jede Rechenoperation um<br />
eine Stufe erhöht ist.<br />
‣ Abweichend zum arithmetischen Mittel müssen zur<br />
Anwendung des geometrischen Mittels ausschließlich<br />
positive Merkmalswerte vorliegen.<br />
‣ Aussage des geometrischen Mittels: Würde eine Größe mit<br />
dem geometrischen Mittel wachsen, so käme der selbe<br />
Endwert zustande, wenn die Größe um die jeweiligen<br />
Wachstumsfaktoren wachsen würde.<br />
In diesem Sinne ist das geometrische Mittel der<br />
durchschnittliche Wachstumsfaktor.<br />
Prof. Kück / R. Bernitz / Dr. Ricabal<br />
Lehrstuhl Statistik<br />
Lage- und Streuungsparameter II<br />
23<br />
Eigenschaften des geometrischen Mittels<br />
‣ Das geometrische Mittel hat anstelle der Null-<br />
Eigenschaft die Eins-Eigenschaft. Es gilt:<br />
N<br />
∏<br />
a<br />
i<br />
G<br />
= 1<br />
i= 1<br />
Geometrisches Mittel<br />
Das Produkt der Verhältniszahlen zwischen<br />
Einzelwerten und geometrischem Mittel ist Eins.<br />
‣Der Logarithmus des geometrischen Mittels ist das<br />
arithmetische Mittel der logarithmierten Einzelwerte.<br />
G =<br />
N<br />
a<br />
1⋅<br />
a<br />
2⋅...<br />
⋅ a<br />
N<br />
lnG =<br />
N<br />
∑<br />
i=<br />
1<br />
lna<br />
N<br />
i<br />
Prof. Kück / R. Bernitz / Dr. Ricabal<br />
Lehrstuhl Statistik<br />
Lage- und Streuungsparameter II<br />
24<br />
12
Eins-Eigenschaften des geometrischen Mittels<br />
- Beweis -<br />
N<br />
∏<br />
i=<br />
1<br />
a<br />
i<br />
G<br />
= 1<br />
Das Produkt der Verhältniszahlen zwischen<br />
Einzelwerten und geometrischem Mittel ist Eins.<br />
Geometrisches Mittel<br />
N<br />
∏<br />
i=<br />
1<br />
a<br />
i<br />
G<br />
a1<br />
a<br />
2<br />
a<br />
N<br />
a<br />
= ⋅ L =<br />
G G G<br />
=<br />
a<br />
1<br />
⋅ a<br />
La<br />
(<br />
N<br />
a ⋅ a La<br />
)<br />
1<br />
2<br />
2<br />
N<br />
N<br />
N<br />
1<br />
⋅ a<br />
=<br />
2<br />
N<br />
G<br />
a<br />
a<br />
La<br />
1<br />
1<br />
⋅ a<br />
⋅ a<br />
2<br />
2<br />
N<br />
La<br />
La<br />
N<br />
N<br />
= 1<br />
Prof. Kück / R. Bernitz / Dr. Ricabal<br />
Lehrstuhl Statistik<br />
Lage- und Streuungsparameter II<br />
25<br />
Harmonisches Mittel<br />
Das harmonische Mittel wird angewendet, wenn die<br />
Merkmalsausprägungen als Quotienten gegeben sind, deren<br />
Nennergrößen nicht vorliegen.<br />
Man unterscheidet:<br />
1.) Ungewogenes harmonisches Mittel<br />
2.) Gewogenes harmonisches Mittel.<br />
Ungewogenes harmonisches Mittel:<br />
= N 1<br />
H =<br />
N<br />
1 1<br />
N<br />
∑<br />
∑<br />
1<br />
i=<br />
1 a<br />
i<br />
N i=<br />
1 a<br />
i<br />
Quotient, über dessen Zähler Angaben<br />
vorliegen, über dessen Nenner jedoch nicht.<br />
Prof. Kück / R. Bernitz / Dr. Ricabal<br />
Lehrstuhl Statistik<br />
Lage- und Streuungsparameter II<br />
26<br />
13
Ungewogenes harmonisches Mittel - Beispiel<br />
Beispiel: Ein Fahrzeug fährt auf vier gleich langen Teilstrecken folgende<br />
Geschwindigkeiten:<br />
1.) v 1<br />
=40 km/h → t 1<br />
=L/v 1<br />
2.) v 2<br />
=50 km/h → t 2<br />
=L/v 2<br />
3.) v 3<br />
=80 km/h → t 3<br />
=L/v 3<br />
4.) v 4<br />
=100 km/h → t 4<br />
=L/v 4<br />
Ein falsches Ergebnis liefert die einfache arithmetische Mittelung<br />
der vier Geschwindigkeiten. Dieser Mittelwert beträgt 67,5 km/h.<br />
Prof. Kück / R. Bernitz / Dr. Ricabal<br />
Lehrstuhl Statistik<br />
L<br />
Lage- und Streuungsparameter II<br />
L<br />
L<br />
L<br />
t 1 t 2<br />
t 3<br />
t 4<br />
Der Zähler des Verhältnisses, die Länge der Strecke, ist ausreichend spezifiziert<br />
(gleichlange Teilstrecken), über den Nenner, die dafür benötigte Zeit, liegen keine<br />
direkten Angaben vor. Die Zeit für die jeweiligen Teilstrecken lässt sich aus der<br />
Geschwindigkeit und der Länge der Strecke berechen.<br />
Weg<br />
4 L<br />
4<br />
Durchschni tt_V = =<br />
=<br />
= 59,26km/h<br />
Fahrzeit L L L L 1 1 1 1<br />
+ + + + + +<br />
40 50 80 100 40 50 80 100<br />
27<br />
Ungewogenes harmonisches Mittel - Beispiel<br />
Erweitern wir das Beispiel und nehmen an, dass jede Teilstrecke 10 km lang ist.<br />
Dann ergibt sich eine Gesamtstrecke von 40 km, eine Gesamtfahrzeit von 0,675<br />
Stunden und eine durchschnittliche Geschwindigkeit von 59,26 km/h.<br />
L L L L<br />
t 1 t 2<br />
t 3<br />
t 4<br />
10 + 10 + 10 + 10<br />
V =<br />
= 59,26 km/h<br />
0,25 + 0,20 + 0,125 + 0,10<br />
Im Nenner des harmonischen Mittels wird die zurückgelegte Fahrzeit<br />
ausgewiesen. Sie wird aus dem Verhältnis Weg/Geschwindigkeit berechnet.<br />
Man erhält das gleiche Ergebnis. Das heißt, die Durchschnittgeschwindigkeit<br />
ist vom konkreten Wert der Strecke unabhängig.<br />
Prof. Kück / R. Bernitz / Dr. Ricabal<br />
Lehrstuhl Statistik<br />
Lage- und Streuungsparameter II<br />
28<br />
14
Gewogenes harmonisches Mittel<br />
Das harmonische Mittel ist unter Verwendung<br />
gehäufter bzw. klassierter Daten zu berechnen:<br />
H<br />
= k<br />
∑<br />
i=<br />
1<br />
Klassenanzahl<br />
1<br />
1<br />
x<br />
i<br />
f<br />
i<br />
Relative Häufigkeit des Merkmals<br />
Merkmal (Verhältnis), über dessen Zähler Angaben<br />
vorliegen, über dessen Nenner jedoch nicht<br />
Prof. Kück / R. Bernitz / Dr. Ricabal<br />
Lehrstuhl Statistik<br />
Lage- und Streuungsparameter II<br />
29<br />
Gewogenes harmonisches Mittel - Beispiel<br />
Beispiel: Es liegen die Arbeitslosenquoten nach Gebieten vor, aus denen die<br />
Arbeitslosenquote für Deutschland gesamt berechnet werden soll:<br />
Neue Länder<br />
Alte Länder<br />
Deutschland<br />
Anzahl der Arbeitslosen<br />
1.047.015<br />
2.564.906<br />
3.611.921<br />
Arbeitslosenquote in %<br />
14,9<br />
9,3<br />
Aus den Zahlen der Arbeitslosen wird die relative Häufigkeit f i<br />
ermittelt:<br />
1.047.015 2.564.906 = 0,28988<br />
= 0,71012<br />
3.611.921<br />
3.611.921<br />
1<br />
H 1<br />
H =<br />
= 10,44%<br />
1<br />
1<br />
1<br />
∑ f<br />
i<br />
⋅ 0,28988 + ⋅ 0,71012<br />
x<br />
14,9 9,3<br />
= k<br />
i=<br />
1<br />
i<br />
Prof. Kück / R. Bernitz / Dr. Ricabal<br />
Lehrstuhl Statistik<br />
Lage- und Streuungsparameter II<br />
30<br />
15
Beurteilung des harmonischen Mittels<br />
‣ Analog zum arithmetischen Mittel setzt die Ermittlung ebenfalls<br />
kardinalskalierte Merkmale voraus.<br />
‣ Eine zweite Anwendungsvoraussetzung sind positive<br />
Merkmalswerte.<br />
‣ Das harmonische Mittel wird für Fälle umgekehrter<br />
Proportionalität verwendet.<br />
‣ Bedeutung hat das harmonische Mittel, wenn die Einzelwerte<br />
Verhältniszahlen sind.<br />
‣ Bei der Gewichtung der Verhältniszahlen ist nicht die Nenner-,<br />
sondern die Zählergröße zu verwenden.<br />
Prof. Kück / R. Bernitz / Dr. Ricabal<br />
Lehrstuhl Statistik<br />
Lage- und Streuungsparameter II<br />
31<br />
Das chronologische Mittel ist eine spezielle Maßzahl, welche zur statistischen<br />
Beschreibung von Beständen (B) gebraucht wird. Aus methodischer Sicht ist<br />
die Unterscheidung von Bestands-, Bewegungs- und korrespondierenden<br />
Massen notwendig (Abschnitt 2.1.2). Bestandsmassen verweilen über einen<br />
bestimmten Zeitraum hinweg, sie werden zu diskreten Zeitpunkten gemessen.<br />
1<br />
= ⎢ ∑ − 0<br />
k ⎣<br />
i=<br />
k 1<br />
⎡<br />
⎤<br />
( ; t ) 0,5 ⋅ B + B + 0,5 ⋅ B ⎥ ⎦<br />
B t<br />
Chronologisches Mittel<br />
Liegen Bestandsmessungen zu möglichst äquidistanten Zeitpunkten vor, dann<br />
liefert das chronologische Mittel eine Aussage über den Durchschnittsbestand<br />
für einen Zeitraum. Es verwendet dazu die mittleren Bestände aller<br />
Zeitintervalle k. Es gilt:<br />
a<br />
e<br />
Durch die Verwendung der mittleren Bestände je Zeitintervall [t i<br />
, t i+1<br />
] gehen<br />
die Randwerte nur mit halbem Gewicht in die Durchschnittsberechnung ein.<br />
1<br />
i<br />
k<br />
Prof. Kück / R. Bernitz / Dr. Ricabal<br />
Lehrstuhl Statistik<br />
Lage- und Streuungsparameter II<br />
32<br />
16
Chronologisches Mittel<br />
Beispiel: Aus folgenden Stichtagsbeständen je Zeitintervall (Monat) ist der<br />
Durchschnittsbestand für das erste Quartal zu berechnen:<br />
Stichtag<br />
01.01.<br />
31.01.<br />
Bevölkerungsbestand<br />
1000<br />
1010<br />
Bevölkerungsbestand<br />
pro Monat<br />
1005<br />
Bevölkerungsbestand<br />
pro Quartal<br />
01.02.<br />
28.02.<br />
1010<br />
1020<br />
1015<br />
1015<br />
01.03.<br />
31.03.<br />
1020<br />
1030<br />
1025<br />
Prof. Kück / R. Bernitz / Dr. Ricabal<br />
Lehrstuhl Statistik<br />
( 1000 + 1010) ( 1010 + 1020) ( 1020 1030)<br />
⎡ +<br />
⎢<br />
+<br />
+<br />
⎣ 2<br />
2<br />
2<br />
Schrittweise Berechnung:<br />
3<br />
500 + 1010 + 1020 + 515<br />
Direkte Berechnung:<br />
= 1015<br />
3<br />
Lage- und Streuungsparameter II<br />
⎤<br />
⎥<br />
⎦<br />
= 1015<br />
33<br />
Beispiel: Für sieben aufeinander folgende Tage weist die Kasse eines<br />
Unternehmens am Geschäftsschluss (18 Uhr) folgende Bestände auf:<br />
Werktag<br />
01.03.<br />
02.03.<br />
03.03.<br />
04.03.<br />
05.03.<br />
06.03<br />
07.03.<br />
Chronologisches Mittel - Beispiel<br />
Kassenbestand (€)<br />
18.00 Uhr<br />
3.211,56<br />
2.831,11<br />
3.760,30<br />
2.928,89<br />
2.438,71<br />
3.461,96<br />
4.023,44<br />
4500<br />
4000<br />
3500<br />
3000<br />
2500<br />
2000<br />
1500<br />
1000<br />
500<br />
Durchschnittlicher Kassenbestand<br />
0<br />
1 2 3 4 5 6 7<br />
B = (1605,78 + 15420,97 + 2011,72) / 6 = 3173,08<br />
Der tagesdurchschnittliche Kassenbestand in der ersten Märzwoche<br />
beträgt 3.173,08 Euro.<br />
Prof. Kück / R. Bernitz / Dr. Ricabal<br />
Lehrstuhl Statistik<br />
Lage- und Streuungsparameter II<br />
34<br />
17
Zusammenfassung Mittelwerte<br />
‣ Eignung nach Skalierung:<br />
Kardinalskala<br />
Ordinalskala<br />
Nominalskala<br />
Arithmetisches Mittel<br />
X<br />
Median<br />
X<br />
X<br />
Modus<br />
X<br />
X<br />
X<br />
‣ Der Median und der Modus sind Lageparameter, deren Werte bei<br />
diskreten Merkmalen i. Allg. mit realen Merkmalsausprägungen<br />
übereinstimmt.<br />
‣ Berechnete Mittelwerte sind arithmetisches, geometrisches,<br />
harmonisches und chronologisches Mittel. Die Eignung des jeweiligen<br />
Mittelwertes hängt von Spezifika der Daten ab. In jedem Fall müssen<br />
die Merkmale jedoch kardinalskaliert sein.<br />
Prof. Kück / R. Bernitz / Dr. Ricabal<br />
Lehrstuhl Statistik<br />
Lage- und Streuungsparameter II<br />
35<br />
Zusammenfassung Mittelwerte<br />
Symmetrieregeln geben die Größenbeziehung<br />
zwischen den Mittelwerten an.<br />
Für metrisch skalierte Merkmale können das arithmetische<br />
Mittel, der Median und der Modus auch dazu verwendet<br />
werden, um Symmetrie oder Schiefe einer Verteilung<br />
beurteilen zu können. Der Vergleich der numerischen Werte<br />
liefert Vorstellungen über die Verteilungsform.<br />
f(x)<br />
• Bei symetrischer Verteilung gilt:<br />
AM=Me=Mo<br />
bzw. angeschwächt:<br />
AM~Me~Mo<br />
µ = Me = Mo<br />
x<br />
Prof. Kück / R. Bernitz / Dr. Ricabal<br />
Lehrstuhl Statistik<br />
Lage- und Streuungsparameter II<br />
36<br />
18
Zusammenfassung Mittelwerte<br />
f(x)<br />
• Bei linkssteiler (rechtsschiefer)<br />
Verteilung gilt:<br />
AM>Me>Mo<br />
Mo<br />
Me<br />
µ<br />
x<br />
f(x)<br />
• Bei rechtssteiler (linksschiefer)<br />
Verteilung gilt:<br />
AM
Vorsicht bei Mittelwerten!<br />
„Sollen wir das arithmetische<br />
Mittel als durchschnittliche<br />
Körpergröße nehmen und den<br />
Gegner erschrecken, oder<br />
wollen wir ihn einlullen und<br />
nehmen den Median“<br />
Entnommen aus Krämer, W. So lügt man mit Statistik.<br />
Prof. Kück / R. Bernitz / Dr. Ricabal<br />
Lehrstuhl Statistik<br />
Lage- und Streuungsparameter II<br />
39<br />
Vorsicht bei Mittelwerten!<br />
Median oder arithmetisches Mittel<br />
(Aus Krämer: So lügt man mit Statistik)<br />
...Wenn z.B. der Präsident der Bundesärztekammer vom<br />
mittleren Einkommen der deutschen Ärzte spricht, meint er<br />
i.d.R. nicht das arithmetische Mittel sondern den Median. Wann<br />
immer im deutschen Ärzteblatt von Geld die Rede ist, erinnert<br />
man sich gern daran, dass es außer dem arithmetische Mittel<br />
noch andere Mittelwerte gibt.<br />
Auf der anderen Seite rufen Kritiker, die meinen, deutsche Ärzte<br />
verdienen viel zu viel, gern das arithmetische Mittel in den<br />
Zeugenstand. Dieses ist wie bei allen rechtsschiefen Verteilungen<br />
immer größer als der von den Ärzten bevorzugte Median.<br />
Z. B. Laborarzt: Arithmetische Mittel: 700.000 DM p.a.<br />
Median: 500.000 DM p.a.<br />
Prof. Kück / R. Bernitz / Dr. Ricabal<br />
Lehrstuhl Statistik<br />
Lage- und Streuungsparameter II<br />
40<br />
20
Vorsicht bei Mittelwerten!<br />
Das durchschnittliche Einkommen im Sultanat Brunei beträgt nach<br />
dem arithmetischen Mittel berechnet 54.000 DM, für Deutschland<br />
dagegen 46.000 DM.<br />
Zu beachten ist jedoch, dass die Einkommensverteilung in Brunei<br />
erheblich schiefer ist als die von Deutschland. Lässt man den Sultan,<br />
der als reichster Mensch der Erde gilt, und seine Familie weg, sieht das<br />
Bild schon ganz anders aus.<br />
Solche „Ausreißer“, wie die Statistiker sagen, ziehen das arithmetische<br />
Mittel an sich heran wie ein Magnet.<br />
Aus Krämer, W. So lügt man mit Statistik.<br />
Prof. Kück / R. Bernitz / Dr. Ricabal<br />
Lehrstuhl Statistik<br />
Lage- und Streuungsparameter II<br />
41<br />
Überlegen Sie selbst!<br />
Berechnen Sie für die<br />
ausgewiesenen Jahre die<br />
durchschnittliche<br />
Kinderzahl, die<br />
Akademikerinnen in<br />
West- und in<br />
Ostdeutschland haben.<br />
Wie müsste man vorgehen,<br />
wenn aus diesen Daten ein<br />
„Durchschnittswert“ für<br />
Deutschland über<br />
Kinderlosigkeit bei<br />
Akademikerinnen<br />
ausgewiesen werden soll<br />
Quelle: http://www.spiegel.de/unispiegel/jobundberuf/0,1518,373449,00.html<br />
Prof. Kück / R. Bernitz / Dr. Ricabal<br />
42<br />
Lehrstuhl Statistik<br />
Lage- und Streuungsparameter II<br />
21