Statistik Schülerversion - WIHOGA Dortmund
Statistik Schülerversion - WIHOGA Dortmund
Statistik Schülerversion - WIHOGA Dortmund
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
<strong>Statistik</strong><br />
Definition: Entwicklung und Anwendung von Methoden zur Erhebung,<br />
Aufbereitung, Analyse und Interpretation von Daten.<br />
Teilgebiete der <strong>Statistik</strong>:<br />
- Beschreibende (deskriptive) <strong>Statistik</strong><br />
- Wahrscheinlichkeitsrechnung<br />
- Schließende (induktive) <strong>Statistik</strong><br />
Phasen für statistische Untersuchungen:<br />
1. Vorbereitung / Planung<br />
- präzise Formulierung der Ziele<br />
- detaillierte Definition des Untersuchungsgegenstandes<br />
2. Datenerhebung<br />
- Primärerhebung: Befragung, Beobachtung und Experiment<br />
- Sekundärerhebung: Verwendung von bereits vorhandenen Daten<br />
3. Datenaufbereitung und Darstellung<br />
Beispiel: 15 Schüler werden nach ihrer Mathematiknote befragt<br />
Urdaten (Urliste): 2, 1, 5, 4, 2, 3, 2, 3, 5, 4, 4, 4, 1, 2, 5<br />
geordnete Daten (Reihe): 1, 1, 2, 2, 2, 2, 3, 3, 4, 4, 4, 4, 5, 5, 5<br />
Häufigkeitstabelle: Diagramm:<br />
Note<br />
1 2 3 4 5<br />
Häufigkeit 2 4 2 4 3<br />
5<br />
4<br />
3<br />
2<br />
1<br />
0<br />
1 2 3 4 5<br />
4. Datenauswertung (Analyse) und Interpretation<br />
- Häufigkeitsverteilung: die Berechnung von Mittelwerten, Streuungsmaßen und<br />
Konzentrationsmessung<br />
- Zusammenhang zwischen Merkmalen: Methoden der Korrelationsanalyse<br />
- Zeitreihenanalyse: Ermittlung von Schwankungen und Trendermittlung<br />
- Relationen von Zahlen: Verhältnis- und Indexzahlen<br />
5. Ergebnispräsentation<br />
- adressatengerechte Präsentation der Ergebnisse<br />
- grafisch, tabellarisch oder über Einzelwerte<br />
- ergänzt durch erläuternde Kommentare<br />
Häufigkeit<br />
Note<br />
1
Manipulationen in der <strong>Statistik</strong><br />
- Manipulation durch grafische Verzerrungen<br />
Tsd. Euro<br />
70<br />
60<br />
50<br />
40<br />
30<br />
20<br />
10<br />
0<br />
Umsatzentwicklung<br />
1 2 3 4 5 6 7<br />
Zeit<br />
Umsatzentwicklung<br />
70<br />
60<br />
50<br />
40<br />
30<br />
20<br />
10<br />
0<br />
1 2 3 4 5 6 7<br />
- Täuschung durch falsche Angaben<br />
z.B. bewusst falsche Angaben ( bei Kriegsstatistiken über Feindverluste) oder das<br />
bewusste Nichtbeachten von relevanten Daten.<br />
- Nicht-Angabe unüblicher Definitionen oder erklärender Informationen<br />
z.B. werden die Lohnnebenkosten üblicher Weise ins Verhältnis zum Bruttolohn<br />
gesetzt und nicht ins Verhältnis zum Nettolohn. Letzteres müsste sehr deutlich<br />
gekennzeichnet werden.<br />
- Nicht repräsentative Stichprobe<br />
z.B. werden zur Belegung einer These nur Personen befragt, die die gleichen<br />
Interessen verfolgen.<br />
- Irreführende Auswahl der Untersuchungsmerkmale<br />
z.B. werden Personen nur zu bestimmten ausgewählten Merkmalen befragt, die das<br />
wahre Ergebnis verfälschen.<br />
- Die Antwort beeinflussende Fragestellungen<br />
z.B. wenn dem Befragten die gewünschte Antwort suggeriert wird.<br />
- Manipulierende Auswahl der Bezugsgröße<br />
z.B. kann die Preissteigerung ins Verhältnis zum Vormonat oder zum Vorjahresmonat<br />
gesetzt werden, oder an einer Fakultät mit 2.500 Studenten nehmen 50 Studenten an<br />
einer Klausur in <strong>Statistik</strong> teil. Von den 50 Studenten besteht keiner die Klausur. Der<br />
Dozent behauptet, die Durchfallquote bei seiner Klausur sei 2 % gewesen.<br />
- Vortäuschen von Zusammenhängen (fehlende Kausalität)<br />
z.B. der Zusammenhang von Geburten und Storchenpopulation<br />
Tsd. Euro<br />
Zeit<br />
2
Statistische Grundbegriffe<br />
Merkmalsträger:<br />
Der Merkmalsträger (statistische Einheit) ist das Subjekt oder Objekt der statistischen<br />
Untersuchung und der Träger der interessierenden statistischen Information (Träger der<br />
Information).<br />
Grundgesamtheit:<br />
Die Grundgesamtheit (statistische Masse) ist die Menge aller Merkmalsträger, die übereinstimmende<br />
Abgrenzungsmerkmale besitzen.<br />
- sachliche Abgrenzung: Es muss festgelegt werden, wer oder was zu einem<br />
Merkmalsträger gehört.<br />
- räumliche Abgrenzung: In welchen Grenzen (in welchem Gebiet) liegen die<br />
Merkmalsträger.<br />
- zeitliche Abgrenzung: Es ist der Zeitpunkt (Bestandsmasse) oder der Zeitraum der<br />
einzubeziehenden Merkmalsträger zu bestimmen. Die Ereignisse während eines<br />
bestimmten Zeitraumes (Zugänge oder Abgänge) bilden die Bewegungsmasse<br />
(Ereignismasse). Sie führen zu Bewegungen in der korrespondierenden Bestandsmasse.<br />
Merkmal:<br />
Die Eigenschaft des Merkmalsträgers, die bei der statistischen Untersuchung von Interesse ist,<br />
wird als Merkmal (Untersuchungsvariable) bezeichnet.<br />
Merkmalsausprägung:<br />
Alle möglichen Werte, die das Merkmal beim Merkmalsträger annehmen kann, werden als<br />
Merkmalsausprägung bezeichnet.<br />
Merkmalswert:<br />
Der Wert, der beim Merkmalsträger festgestellt wurde heißt Merkmalswert<br />
(Beobachtungswert).<br />
Für die Aufbereitung der Merkmalswerte ist die Art des Merkmals von Bedeutung. Die<br />
folgenden Merkmalsarten werden unterschieden:<br />
- qualitatives Merkmal:<br />
Ein qualitatives Merkmal liegt vor, wenn den möglichen Merkmalswerten lediglich<br />
Namen (artmäßige Merkmale, z.B. Farben) oder Klassenbezeichnungen (intensitätsmäßige<br />
Merkmale, z.B. Noten) zugeordnet werden können.<br />
- quantitatives Merkmal:<br />
Ein Merkmal, das eine messbare Dimension besitzt (z.B. Anzahl der Mitarbeiter im<br />
Betrieb) oder in Mengeneinheiten ausgedrückt werden kann (z.B. Verbrauch in Litern),<br />
wird als quantitativ bezeichnet.<br />
- diskretes Merkmal:<br />
ein quantitatives Merkmal, das abzählbar viele Werte annehmen kann, wird als diskret<br />
bezeichnet (z.B. Einwohnerzahl einer Stadt).<br />
3
- stetiges Merkmal:<br />
ein quantitatives Merkmal, das überabzählbar viele Werte annehmen kann, wird als stetig<br />
bezeichnet (z.B. Füllmengen). Um ein stetiges Merkmal wie ein diskretes behandeln zu<br />
können, muss eine Einheit hinzugefügt werden (z.B. Füllmengen in Litern).<br />
- häufbares Merkmal:<br />
Ein Merkmal, von dem ein Merkmalsträger mehr als einen Merkmalswert annehmen<br />
kann, heißt häufbares Merkmal (z.B. Hobbys).<br />
- nicht häufbares Merkmal:<br />
Ein Merkmal, von dem ein Merkmalsträger nur genau einen Merkmalswert besitzen kann,<br />
heißt nicht häufbares Merkmal (z.B. Alter).<br />
Vollerhebung:<br />
Bei einer Vollerhebung (Totalerhebung) werden die Merkmale bei allen statistischen<br />
Einheiten erhoben.<br />
Stichprobe:<br />
Wird nur ein Teil der Grundgesamtheit untersucht, so handelt es sich um eine Stichprobe.<br />
Diese kommt zu Anwendung, wenn eine Vollerhebung zu kostenaufwendig ist, mit einem<br />
erheblichen Zeitaufwand verbunden ist, oder überhaupt nicht durchgeführt werden kann, da<br />
die statistischen Einheiten bei der Untersuchung zerstört werden (z.B. Crash-Tests), nicht alle<br />
bekannt sind (z.B. die Kunden eines Supermarktes), zu einer Erhebung nicht bereit sind<br />
(z.B. Befragung nach dem Einkommen), oder im vorgegebenen Zeitraum nicht untersucht<br />
werden können.<br />
repräsentative Stichprobe:<br />
Eine Stichprobe gilt als repräsentativ, wenn die aus der Grundgesamtheit ausgewählten,<br />
statistischen Einheiten hinsichtlich aller Kriterien, anteilig alle statistischen Einheiten der<br />
Grundgesamtheit wiederspiegeln (repräsentieren).<br />
Auswahlverfahren:<br />
Erstreckt sich die statistische Untersuchung nur auf einen Teil der Grundgesamtheit, so<br />
kommt ein Auswahlverfahren zur Stichprobenuntersuchung zur Anwendung:<br />
- willkürliche Auswahl: Bei dieser nicht repräsentativen Auswahl gibt es keine konkreten<br />
Vorgaben (z.B. werden Kunden im Supermarkt nach einem bestimmten Produkt befragt).<br />
- Zufallsauswahl: Da jede statistische Einheit der Grundgesamtheit mit einer berechneten<br />
Wahrscheinlichkeit in die Stichprobe gelangt, ist eine repräsentative Erhebung<br />
sichergestellt (z.B. Telefonbefragung, wenn die Telefonnummern zufällig ausgewählt<br />
werden).<br />
- Bewusste Auswahl: Bei der bewussten Auswahl (Beurteilungsstichprobe) erfolgt die<br />
Auswahl der statistischen Einheiten gezielt nach bestimmten Merkmalen und ist<br />
annähernd repräsentativ (z.B. das Quotenverfahren, wenn die jeweiligen Anteile an der<br />
Grundgesamtheit bekannt sind, das Konzentrationsverfahren, wenn die wichtigsten der<br />
statistischen Einheiten der Grundgesamtheit befragt werden oder die typische Auswahl,<br />
bei der nur die statistischen Einheiten befragt werden, die hinsichtlich eines Merkmals als<br />
besonders typisch gelten).<br />
4
Zeitreihe:<br />
Eine statistische Reihe von Beobachtungswerten, die für aufeinander folgende Zeitpunkte<br />
oder Zeitintervalle erhoben werden, heißt Zeitreihe.<br />
Statistische Skalen:<br />
Auf einer Skala (Messskala) werden die möglichen Merkmalswerte nach einem bestimmten<br />
Ordnungsprinzip als Skalenwerte abgetragen. Die Skala (bzw. das Ordnungsprinzip) ist<br />
entscheidend zum einen für das Informationsniveau und den Aussagegehalt des Merkmalswertes<br />
und zum anderen für die statistischen Verfahren, die angewendet werden dürfen.<br />
Nominalskala:<br />
Eine Skala, deren Skalenwerte nur nach dem Kriterium gleich oder verschieden geordnet<br />
werden können heißt Nominalskala (z.B. Farben oder Bundesländer).<br />
Rangskala:<br />
Eine Skala, deren Skalenwerte nicht nur nach dem Kriterium gleich oder verschieden, sondern<br />
außerdem in einer natürlichen Reihenfolge geordnet werden können, heißt Rangskala oder<br />
Ordinalskala (z.B. Noten oder Güteklassen).<br />
metrische Skala:<br />
Eine Skala, deren Skalenwerte reelle Zahlen sind und die alle Ordnungseigenschaften der<br />
reellen Zahlen besitzt, d.h. die Werte lassen sich in eine Rangfolge bringen und es sind zudem<br />
auch Abstände messbar, heißt metrische Skala oder Kardinalskala (z.B. Einkommen oder<br />
Stückzahlen).<br />
Die drei Skalen sind durch ein steigendes Informationsniveau gekennzeichnet. Je höher das<br />
Informationsniveau, desto höher und objektiver ist auch die Aussagekraft und das<br />
Analysepotential. Daher sollte bei einer statistischen Untersuchung möglichst nach<br />
Merkmalen mit einem hohen Skalenniveau gesucht werden (z.B. kann die Sorgfalt eines<br />
Akkordarbeiters unter Verwendung einer Ordinalskala von „sorgfältig“ stufenweise bis<br />
„unachtsam“ gemessen werden, oder aber auf einer metrischen Skala mit der Anzahl an<br />
Fehlern pro 100 Mengeneinheiten).<br />
Hat der Skalenwert bei einer metrischen Skala keinen natürlichen Nullpunkt (Intervallskala),<br />
z.B. Temperatur in Celsius, so darf nur der absolute aber nicht der relative Abstand gemessen<br />
werden (z.B. beträgt der absolute Abstand von 12 Grad und 36 Grad Celsius gleich 24 Grad<br />
Celsius. Der relative Wert 36 / 12 = 3 ist ohne Aussagekraft, da es bei 36 Grad nicht 3 mal so<br />
warm ist wie bei 12 Grad Celsius).<br />
Besitzt der Skalenwert bei einer metrischen Skala einen natürlichen Nullpunkt<br />
(Verhältnisskala), z.B. Lebensalter in Jahren, oder zusätzlich auch noch eine natürliche<br />
Einheit (Absolutskala), z.B. Stückzahlen, so darf der absolute und der relative Abstand<br />
gemessen werden (z.B. beträgt der absolute Abstand zwischen 2.000,00 € und 6.000,00 €<br />
gleich 4.000,00 € und 6.000 / 2.000 = 3 bedeutet, dass es dreimal soviel ist).<br />
Unter einer Skalentransformation versteht man die Übertragung von Skalenwerten in Werte<br />
einer anderen Skala, wobei die Ordnungseigenschaften der Skala erhalten bleiben müssen.<br />
Nach der Transformation ist auf die korrekte Interpretation der Daten zu achten (z.B. nach der<br />
Transformation der qualitativen Merkmalsausprägungen „männlich“ und „weiblich“ in „0“<br />
und „1“ (Pseudokardinalskalen) darf mit diesen Werten nicht gerechnet werden).<br />
5
Beispiel: Es soll die durchschnittliche <strong>Statistik</strong>note ermittelt werden.<br />
Zur Grundgesamtheit gehören alle Studierenden (Merkmalsträger), die im dritten Semester<br />
sind (sachlich), an der <strong>WIHOGA</strong> in <strong>Dortmund</strong> eingeschrieben waren (räumlich), im Zeitraum<br />
vom ... bis ... (zeitlich). Zu einem bestimmten Zeitpunkt (Bestandsmasse). Bei Abmeldungen<br />
während des Semesters (Ereignismasse / Bewegungsmasse). Es ist festzulegen, welche<br />
Subjekte mit einbezogen werden sollen und dies ist eindeutig kenntlich zu machen.<br />
Bei den Studenten (statistische Einheiten) soll die Note (Merkmal) festgestellt werden.<br />
Möglich wären die Noten 1, 2, 3, 4, 5 oder 6 (Merkmalsausprägungen). Die tatsächliche Note<br />
der jeweiligen statistischen Einheit ist der Merkmalswert (Beobachtungswert).<br />
Bei den Noten handelt es sich um ein qualitatives, intensitätsmäßiges Merkmal, das auf einer<br />
Rangskala gemessen wird, da es wohl eine Rangfolge der Noten gibt, jedoch keine Abstände<br />
gemessen werden können. So ist die Note 2 zwar besser als die Note 4, jedoch nicht doppelt<br />
so gut und es gibt auch keine Zwischenwerte (z.B. Note 2,5). Da das Merkmal nicht<br />
quantitativ ist lässt es sich auch nicht als diskret oder stetig klassifizieren. Da jeder Student<br />
(im abgegrenzten Zeitraum) nur eine Note bekommt, handelt es sich um ein nicht häufbares<br />
Merkmal. Da die Noten aller Studenten mit in die statistische Untersuchung einbezogen<br />
werden, liegt eine Vollerhebung vor.<br />
Abkürzungen:<br />
i = Laufindex<br />
n = Gesamtzahl der Merkmalsträger<br />
x = Merkmal<br />
v = Anzahl der verschiedenen Merkmalswerte<br />
xi = Merkmalsausprägung der i-ten Stelle<br />
hi = absolute Häufigkeit<br />
fi = relative Häufigkeit<br />
Hi = absolute Summenhäufigkeit<br />
Fi = relative Summenhäufigkeit<br />
HRi = absolute Resthäufigkeit<br />
FRi = relative Resthäufigkeit<br />
Formeln:<br />
Tabellarische Darstellung von Daten<br />
h1 + h2 + ... + hv = n ∑<br />
i=<br />
1<br />
f<br />
h i<br />
n<br />
i = ∑<br />
i=<br />
1<br />
v<br />
v<br />
h<br />
i<br />
i<br />
= n<br />
f<br />
= 1<br />
6
Häufigkeitsverteilung des Merkmals:<br />
Die tabellarische oder grafische Darstellung der geordneten Merkmalsausprägungen mit den<br />
ihnen zugeordneten absoluten oder relativen Häufigkeiten heißt Häufigkeitsverteilung des<br />
Merkmals.<br />
Häufigkeitstabelle:<br />
Laufindex (i)<br />
Merkmalsausprägung<br />
(xi)<br />
absolute Häufigkeit<br />
(hi)<br />
relative Häufigkeit<br />
(fi)<br />
1 x1 h1 f1<br />
2 x2 h2 f2<br />
3 x3 h3 f3<br />
.<br />
.<br />
.<br />
.<br />
.<br />
.<br />
n-1 xn-1 hn-1 fn-1<br />
n xn hn fn<br />
Laufindex (i) 1 2 ... n-1 n<br />
Merkmalsausprägung (xi) x1 x2 … xn-1 xn<br />
absolute Häufigkeit (hi) h1 h2 ... hn-1 hn<br />
relative Häufigkeit (fi) f1 f2 … fn-1 fn<br />
Aufgabe 1: Es ist die Anzahl der Kinder von den Beschäftigten einer Firma gegeben.<br />
xi 0 1 2 3 4<br />
hi 7 6 4 2 1<br />
a) Bestimmen Sie: Merkmalsträger, Merkmal, Merkmalsausprägungen und Merkmalswerte<br />
b) Erstellen Sie eine Häufigkeitstabelle mit den absoluten und relativen Häufigkeiten, sowie<br />
den absoluten und relativen Summen- und Resthäufigkeiten<br />
c) Erläutern Sie aus der Tabelle: x2 ; h2 ; h4 ; f3 ; H2 ; F4 ; HR3 und FR2<br />
Aufgabe 2: In einer Gaststätte wird bei 150 Gästen die Wartezeit (in Minuten) festgehalten,<br />
von dem Moment an, wo diese am Tisch Platz nehmen bis zu dem Zeitpunkt, wo ein Kellner<br />
an den Tisch kommt.<br />
Wartezeit 0 1 2 3 4 5 6 7 8 9 10 11 12<br />
Anzahl<br />
der Gäste<br />
0 3 9 18 30 24 21 12 9 3 6 9 6<br />
a) Bestimmen Sie Merkmalsträger, Merkmal, Merkmalsausprägungen und Merkmalswerte,<br />
b) erstellen Sie eine Häufigkeitstabelle mit den absoluten und relativen Häufigkeiten,<br />
sowie den absoluten und relativen Summen- und Resthäufigkeiten und<br />
c) interpretieren Sie die Häufigkeitstabelle.<br />
.<br />
.<br />
.<br />
.<br />
.<br />
.<br />
7
Klassierte Häufigkeitsverteilung<br />
Bei vielen Untersuchungen ist die Erfassung und Auszählung aller einzelnen Merkmalsausprägungen<br />
nicht sinnvoll oder nicht möglich, weil:<br />
• die Anzahl der Merkmalsausprägungen zu groß ist,<br />
• das Merkmal stetig ist, oder<br />
• die Übersichtlichkeit bei Darstellung und Aufbereitung verloren geht.<br />
(z.B.: Untersuchung der Einkommensverteilung. Hier werden die Einkommen nicht auf den<br />
Cent genau erfasst, sondern in Klassen zusammengefasst.)<br />
Klassierung:<br />
Die Merkmalsausprägungen werden in Klassen (Bereiche) zusammengefasst. Eine<br />
Klassierung (Klassenbildung) dient der anschaulichen Darstellung, wenn ein Merkmal sehr<br />
viele Merkmalsausprägungen besitzt. Da durch die Verdichtung der Merkmalsausprägungen<br />
zu Klassen Informationen verloren gehen, ist hier ein Kompromiss zu finden, zwischen dem<br />
Gewinn an Übersichtlichkeit und dem Verlust an Informationen. Die Entscheidung über<br />
Anzahl und Breite der Klassen ist am Untersuchungsziel auszurichten.<br />
Abkürzungen:<br />
j = Laufindex für die Klasse (Klassenindex), j = 1, ..., v<br />
xj u = Untergrenze der Klasse j<br />
xj o = Obergrenze der Klasse j<br />
xj * = Klassenmitte der klassierten Merkmalsausprägungen<br />
hj = absolute (einfache) Klassenhäufigkeit. Anzahl der Merkmalsträger mit einem Merkmalswert<br />
xi, der in die j-te Klasse fällt, also xj u ≤ xi < xj o<br />
Hj = absolute kumulierte Klassenhäufigkeit<br />
Klassenmitte:<br />
Die Klassenmitte (xj * ) repräsentiert im Allgemeinen die jeweilige Klasse bei der Auswertung<br />
des statistischen Datenmaterials.<br />
Klassenbreite:<br />
Die Differenz zweier aufeinander folgender Klassengrenzen (xj o – xj u ) heißt Klassenbreite.<br />
Für die eindeutige Zuordnung ist nur eine der Klassengrenzen mit zuzurechnen:<br />
also nicht: sondern: oder:<br />
10 bis 11 über 10 bis 11 10 bis unter 11<br />
11 bis 12 über 11 bis 12 11 bis unter 12<br />
12 bis 13 über 12 bis 13 12 bis unter 13<br />
Festlegung der Klassenbreite:<br />
Alle Klassenbreiten sollten gleich groß sein, sofern das zu behandelnde Problem dies zulässt.<br />
Fallen wie z.B. bei den Einkommen nur sehr wenige Beobachtungswerte in die oberen<br />
Klassen, können diese auch größer ausfallen. Die Festlegung der Klassenbreite (xj o – xj u )<br />
sollte möglichst so erfolgen, dass der Wert in der Klassenmitte ein typischer Stellvertreter für<br />
die ganze Klasse ist, denn es wird im Allgemeinen davon ausgegangen, dass sich alle<br />
Beobachtungswerte einer Klasse gleichmäßig über diese verteilen (Gleichverteilungsannahme).<br />
8
offene Randklassen:<br />
Bei offenen Randklassen gibt es drei Möglichkeiten, die Klassenmitte zu bestimmen:<br />
• der Wert, der sich bei gleichen Abständen aller Klassenmitten ergibt,<br />
• einen geschätzten, bzw. vermuteten Wert, oder<br />
• den sich aus den Beobachtungswerten berechneten tatsächlichen Mittelwert der Klasse.<br />
Beispiel:<br />
Klassen:<br />
u<br />
o<br />
≤ x x<br />
j j j<br />
x <<br />
Klassenmitten:<br />
x<br />
*<br />
j<br />
200 bis<br />
unter 300<br />
300 bis<br />
unter 400<br />
400 bis<br />
unter 500<br />
500 bis<br />
unter 600<br />
600 und<br />
mehr<br />
250 350 450 550 650<br />
Für die letzte Klassenmitte kann der Wert 650 verwendet werden (gleicher Abstand<br />
entsprechend den anderen Klassenmitten), ein Wert geschätzt oder (wenn möglich) der<br />
tatsächliche berechnet werden.<br />
Näherungsweise Häufigkeitsberechnungen:<br />
Liegen bei einer klassierten Häufigkeitsverteilung die Urwerte nicht mehr vor, dann können<br />
den Merkmalswerten, unter der Annahme einer Gleichverteilung innerhalb der jeweiligen<br />
Klassen, die Häufigkeiten näherungsweise mittels linearer Interpolation zugeordnet werden.<br />
Aufgabe 3: 140 Kunden haben Rechnungsbeträge von unter 120,00 Euro. Ergänzen Sie die<br />
Häufigkeitstabelle und erläutern Sie die folgenden Werte: x2 * ; h2 ; f3 ; H2 ; F4 ; HR3 ; FR2 und<br />
F(75).<br />
j<br />
Rechnungsbetrag (€)<br />
von … bis unter …<br />
0 – 20 10<br />
20 – 40 20<br />
40 – 60 60<br />
60 – 80 35<br />
80 – 100 10<br />
100 – 120 5<br />
(relative Werte in Prozent)<br />
*<br />
x j hj fj Hj Fj HRj FRj<br />
9
Mehrdimensionale Häufigkeitsverteilung<br />
Tabelle:<br />
Eine Tabelle dient der systematischen und übersichtlichen Zusammenstellung von Daten.<br />
xi<br />
yk<br />
Vorspalte<br />
v<br />
∑ hik<br />
i = 1<br />
Tabellenkopf<br />
Tabellenfeld Tabellenfeld Tabellenfeld<br />
Tabellenfeld Tabellenfeld Tabellenfeld<br />
Tabellenfeld<br />
w<br />
∑ hik<br />
k = 1<br />
Summen-<br />
spalte<br />
Summenzeile n<br />
Spalten<br />
Zeilen<br />
bis unter 25 Jahre 25 Jahre und älter Insgesamt<br />
m w m w<br />
(1)+(2) (4)+(5) (1)+(4) (2)+(5) (7)+(8)<br />
Sem. (1) (2) = (3) (4) (5) = (6) = (7) = (8) = (9)<br />
1<br />
2<br />
3<br />
4<br />
∑<br />
10
45<br />
40<br />
35<br />
30<br />
25<br />
20<br />
15<br />
10<br />
50<br />
45<br />
40<br />
35<br />
30<br />
25<br />
20<br />
15<br />
10<br />
5<br />
0<br />
5<br />
0<br />
100%<br />
90%<br />
80%<br />
70%<br />
60%<br />
50%<br />
40%<br />
30%<br />
20%<br />
10%<br />
0%<br />
Kreisdiagramm<br />
20<br />
30<br />
15<br />
Grafische Darstellung von Daten<br />
35<br />
40<br />
Säulendiagramm<br />
1 2 3 4 5<br />
1 2 3 4 5<br />
1 2 3 4 5<br />
Reihe3<br />
Reihe2<br />
Reihe1<br />
5<br />
4<br />
3<br />
2<br />
1<br />
4<br />
14%<br />
40<br />
35<br />
30<br />
25<br />
20<br />
15<br />
10<br />
5<br />
0<br />
3<br />
21%<br />
5<br />
11%<br />
Umsatz<br />
2<br />
25%<br />
1<br />
29%<br />
1 2 3 4 5<br />
Balkendiagramm<br />
0% 20% 40% 60% 80% 100%<br />
45<br />
40<br />
35<br />
30<br />
25<br />
20<br />
15<br />
10<br />
5<br />
0<br />
1 2 3 4 5<br />
1<br />
2<br />
3<br />
4<br />
5<br />
11
45<br />
40<br />
35<br />
30<br />
25<br />
20<br />
15<br />
10<br />
5<br />
0<br />
Anzahl<br />
Histogramm mit gleicher<br />
Klassenbreite<br />
Histogramm mit<br />
unterschiedlicher<br />
Klassenbreite und<br />
Polygonzug<br />
20<br />
15<br />
10<br />
5<br />
0<br />
30<br />
20<br />
10<br />
Treppenfunktion<br />
Reihe1<br />
Reihe2<br />
Reihe3<br />
Reihe4<br />
Reihe5<br />
0 1 2 3 4 5 6<br />
0<br />
Note<br />
Linien- / Kurvendiagramm<br />
1 2 3 4 5 6 7 8<br />
Reihe1<br />
Reihe2<br />
Reihe3<br />
1<br />
0,8<br />
0,6<br />
0,4<br />
0,2<br />
0<br />
30<br />
25<br />
20<br />
15<br />
10<br />
5<br />
Polygonzug<br />
Liniendiagramm (Summenpolygon)<br />
1 2 3 4 5 6 7<br />
Gebirge<br />
0<br />
Jahr 3<br />
1 2 3 4 5 6 7 8<br />
Jahr 1<br />
Jahr 1<br />
Jahr 2<br />
Jahr 3<br />
12
Aufgabe 4:<br />
Ein Unternehmer hat noch 245 offene Forderungen in unterschiedlicher Höhe, wie in der<br />
folgenden Tabelle dargestellt:<br />
a) Erstellen Sie dazu ein Histogramm,<br />
b) zeichnen Sie die relative Summenhäufigkeit in ein Diagramm,<br />
c) bestimmen Sie die relative Summenhäufigkeit für Forderungen bis unter 550,00 € und<br />
d) bestimmen Sie den Forderungswert in Euro, auf den bis zu 87,76 % der Forderungen<br />
entfallen.<br />
j<br />
1<br />
2<br />
3<br />
4<br />
5<br />
6<br />
Forderungen (in Euro)<br />
von ... bis unter ...<br />
50 100<br />
100 200<br />
200 300<br />
300 400<br />
400 600<br />
600 1000<br />
(relative Werte in Prozent)<br />
hj dj Hj Fj<br />
15<br />
50<br />
80<br />
40<br />
40<br />
20<br />
13
Aufgaben zur Wiederholung:<br />
1) Beschreiben Sie in groben Zügen die einzelnen Phasen der statistischen Untersuchung und<br />
ihre jeweiligen Aufgaben.<br />
2) Erläutern Sie die Bedeutung der Konkretisierung des Untersuchungszieles.<br />
3) Erklären Sie den Unterschied zwischen Primär- und Sekundärforschung. Worin liegen<br />
jeweils die Vor- und Nachteile?<br />
4) Erklären Sie den Unterschied zwischen Befragung und Beobachtung. Worin liegen jeweils<br />
die Vor- und Nachteile?<br />
5) Erläutern Sie das Problem der grafischen Verzerrungen und gehen Sie auch auf andere<br />
Manipulationen ein.<br />
6) Erläutern Sie die folgenden Begriffe: Merkmalsträger, statistische Einheit, Grundgesamtheit,<br />
statistische Masse, Merkmal, Merkmalsausprägung, Merkmalswert, Beobachtungswert,<br />
Merkmalsarten, qualitatives und quantitatives Merkmal, diskretes und stetiges<br />
Merkmal, häufbares und nicht häufbares Merkmal.<br />
7) Erläutern Sie die Begriffe „Vollerhebung, Totalerhebung, Stichprobe und repräsentative<br />
Stichprobe“. Erklären Sie den Unterschied zwischen Voll- und Teilerhebung und<br />
beschreiben Sie jeweils deren Vor- und Nachteile.<br />
8) Beschreiben Sie die folgenden Auswahlverfahren: willkürliche Auswahl, Zufallsauswahl<br />
und bewusste Auswahl.<br />
9) Erläutern Sie die verschiedenen Skalen (allgemein und anhand eines selbst gewählten<br />
Beispiels) und erläutern Sie die Skalentransformation.<br />
10) Beschreiben Sie den Aufbau einer Häufigkeitstabelle und erklären Sie den Unterschied<br />
zwischen der einfachen und der kumulierten Häufigkeitsverteilung.<br />
11) Wann ist es erforderlich, eine klassierte Häufigkeitsverteilung zu erstellen. Welcher<br />
Zielkonflikt ist bei der Klassenbildung zu lösen?<br />
12) Erläutern Sie die verschiedenen Diagrammarten und deren Anwendbarkeit.<br />
14
Aufgaben:<br />
1. Geben Sie für die folgenden Fragestellungen Merkmalsträger, Merkmal und Merkmalsausprägungen<br />
an:<br />
a) Bei einer Befragung von Studenten wird u.a. das Fachsemester erfragt.<br />
b) Es soll die Qualität einer Lieferung Tomaten untersucht werden.<br />
c) Es soll der Kakaogehalt einer Schokoladensorte untersucht werden.<br />
2. Welche der folgenden Merkmale sind diskret und welche sind stetig?<br />
a) Füllmenge von Cola-Flaschen.<br />
b) Anzahl der Orangen in einer Kiste.<br />
c) Einkommen von Managern.<br />
d) Temperatur in einem Gefrierschrank.<br />
e) monatlicher Stromverbrauch<br />
f) Sitzplatzkapazität in einem Restaurant<br />
g) Anzahl der Mitarbeiter in einem Betrieb<br />
3. Geben Sie zu den folgenden Merkmalen jeweils eine geeignete Messskala an und<br />
begründen Sie Ihre Entscheidung:<br />
a) Hobby von Studenten<br />
b) Dienstgrad von Beamten<br />
c) Benzinverbrauch einer Pkws<br />
d) Noten einer Prüfung<br />
e) Uhrzeit<br />
f) Hotelklassifizierung, gemessen in Sternen<br />
g) Bundesländer<br />
h) Anzahl der Gäste in einem Restaurant<br />
4. Geben Sie zu den folgenden Merkmalen an, auf welcher Skala die Ausprägungen geordnet<br />
werden können und ob sie häufbar sind oder nicht:<br />
a) Religionszugehörigkeit<br />
b) Ursache von Verkehrsunfällen<br />
c) Güteklasse von Hotels<br />
d) Körpergewicht von Studenten<br />
e) Kinderzahl von Personen<br />
f) Geburtsdatum<br />
g) Hobby von Studenten<br />
h) Berufsausbildungen<br />
15
5. In einer Prüfung haben 16 Studenten die folgenden Noten erzielt:<br />
3, 1, 2, 2, 1, 4, 5, 4, 3, 5, 2, 5, 6, 2, 3, 2<br />
a) Bestimmen Sie die Häufigkeitsverteilung.<br />
b) Stellen Sie die Häufigkeitsverteilung grafisch dar.<br />
c) Bestimmen Sie die Summenhäufigkeitsverteilung.<br />
d) Stellen Sie die Summenhäufigkeitsverteilung grafisch dar.<br />
6. Fünfzig Studenten wurden danach befragt, wie oft Sie in der vergangenen Woche im Bistro<br />
waren. Die folgenden Urdaten wurden erhoben:<br />
0, 1, 0, 5, 4, 3, 1, 7, 9, 3, 2, 1, 0, 4, 2, 6, 7, 5, 0, 1, 4, 1, 1, 3, 4, 8, 6, 2,<br />
6, 1, 0, 0, 1, 4, 3, 1, 2, 6, 3, 5, 4, 7, 4, 2, 3, 1, 1, 5, 6, 3<br />
a) Bestimmen Sie die absoluten und relativen Häufigkeiten.<br />
b) Bestimmen Sie die absoluten und relativen Summenhäufigkeiten.<br />
c) Bestimmen Sie die absoluten und relativen Resthäufigkeiten.<br />
d) Zeichnen Sie die Häufigkeitsverteilung als Säulendiagramm.<br />
e) Zeichnen Sie die Summenhäufigkeitsverteilung.<br />
f) Zeichnen Sie die Verteilung der Resthäufigkeiten.<br />
7. Zwanzig Teilnehmer einer Klausur haben folgende Punktzahlen erzielt:<br />
25, 74, 87, 43, 60, 72, 56, 36, 75, 49, 83, 52, 71, 67, 78, 50, 76, 64, 77, 69<br />
a) Bestimmen Sie für die erzielten Punktzahlen die Häufigkeitsverteilung und die<br />
Summenhäufigkeitsverteilung mit den Klassen:<br />
von ... bis unter ; 20 – 40, 40 – 60, 60 – 80, 80 – 100.<br />
b) Stellen Sie die Häufigkeitsverteilung als Histogramm dar und zeichnen Sie den<br />
Polygonzug.<br />
c) Stellen Sie die Summenhäufigkeitsverteilung grafisch dar.<br />
16
8. Es liegt Ihnen die folgende relative Summenhäufigkeitsverteilung einer Unternehmung mit<br />
2000 Mitarbeitern vor:<br />
Fj 100<br />
90<br />
80<br />
70<br />
60<br />
50<br />
40<br />
30<br />
20<br />
10<br />
0<br />
1000<br />
0<br />
1250<br />
3<br />
1500<br />
8<br />
1750<br />
15<br />
Bruttomonatseinkommen<br />
2000<br />
25<br />
2250<br />
35<br />
2500<br />
50<br />
2750<br />
62<br />
3000<br />
72<br />
3250<br />
80<br />
3500<br />
85<br />
3750<br />
90<br />
4000<br />
93<br />
4250<br />
96<br />
4500<br />
98 99 100<br />
a) Wie viele Mitarbeiter (absolut und prozentual) verdienen: unter 2.000,00 €, über<br />
3.250,00 €, weniger als 2.750,00 €, nicht mehr als 4.500,00 €, mindestens 1.250,00 €,<br />
höchstens 3.000,00 €, zwischen 2.250,00 € und 4.250,00 € ?<br />
b) Wie viel Euro verdienen: bis zu 15 % der Mitarbeiter die am wenigsten verdienen,<br />
die 10 % der am meisten Verdienenden, ein Viertel der unteren Einkommensbezieher,<br />
die besserverdienende Hälfte mindestens, 4/5 der Geringverdiener höchstens ?<br />
c) Wie viel Prozent der Mitarbeiter verdienen höchstens 2.400,00 € ?<br />
d) Wie viel Euro verdienen höchsten 70 % der Mitarbeiter ?<br />
e) Wie viel Prozent der Mitarbeiter verdienen mindestens 3.100,00 € ?<br />
f) Wie viel Euro verdient das obere Viertel der Mitarbeiter mindestens?<br />
g) Erstellen Sie eine Häufigkeitstabelle mit den absoluten und relativen Häufigkeiten,<br />
Summen- und Resthäufigkeiten.<br />
4750<br />
5000<br />
x j<br />
17
9. Ein Student arbeitet in seiner Freizeit auf<br />
einer Hühnerfarm. Um die<br />
Legefreundlichkeit der Hennen zu ermitteln,<br />
zeichnet er die relative<br />
Summenhäufigkeitsverteilung für die in einer<br />
Woche von den einzelnen Hühnern gelegten<br />
Eier. Welche Fehler hat er gemacht?<br />
10. Gegeben ist die folgende Häufigkeitsverteilung:<br />
prozentualer Anteil<br />
120<br />
100<br />
80<br />
60<br />
40<br />
20<br />
0<br />
-1 0 1 2 3 4 5 6 7<br />
Anzahl Eier<br />
xj u ≤ x < xj o 10 – 20 20 – 30 30 – 60 60 – 80<br />
hj 30 30 30 30<br />
a) Bestimmen Sie die Summenhäufigkeitsverteilung.<br />
b) Stellen Sie die absolute Häufigkeits- und Summenhäufigkeitsverteilung grafisch dar.<br />
c) Zeichnen Sie den Polygonzug über die jeweiligen Klassenmitten.<br />
11. Die folgende Grafik gibt die relative<br />
Summenhäufigkeit eines Merkmals an.<br />
a) Zeichnen Sie den Polygonzug der relativen<br />
Häufigkeiten über die jeweiligen<br />
Klassenmitten, ohne diesen mit der x-Achse<br />
zu verbinden und<br />
b) ergänzen Sie den Polygonzug mit der<br />
Darstellung eines Histogramms.<br />
12. Gegeben sind die folgenden Beobachtungswerte eines diskreten Merkmals:<br />
5, 3, 1, 3, 3, 2, 1, 5, 4, 1, 5, 4, 2, 4, 2, 1, 4, 5, 1, 2<br />
a) Geben Sie die Häufigkeitsverteilung für die absoluten und für die relativen<br />
Häufigkeiten an. Bestimmen Sie die Summenhäufigkeitsverteilung für die relativen<br />
Häufigkeiten.<br />
b) Stellen Sie die Verteilung der relativen Häufigkeiten und der relativen Summenhäufigkeiten<br />
grafisch dar.<br />
c) Rekonstruieren Sie aus Ihrer relativen Summenhäufigkeitsverteilung die Häufigkeitstabelle.<br />
F j<br />
1<br />
0,8<br />
0,6<br />
0,4<br />
0,2<br />
0<br />
0 2 4 6 8 10 12<br />
x j<br />
18
Parameter und Maßzahlen<br />
Die typischen Eigenschaften einer Häufigkeitsverteilung können mit Hilfe von Kenngrößen<br />
(Parametern) oder Maßzahlen beschrieben werden, um so viele Einzelinformationen zu<br />
wenigen, aussagekräftigen Größen zu verdichten und damit einen raschen Einblick in die<br />
typischen Eigenschaften der Häufigkeitsverteilung zu erhalten und den Vergleich mit anderen<br />
Gesamtheiten zu ermöglichen.<br />
Lageparameter:<br />
• Modus (x¯ D)<br />
• Median (x¯ Z) und Quantile (Q)<br />
• arithmetisches Mittel ( x¯ )<br />
• harmonisches Mittel (x¯ H)<br />
• geometrisches Mittel (x¯ G)<br />
Konzentrationsmaße:<br />
• absolute und relative Konzentrationsmessung<br />
• Lorenzkurve und Gini-Koeffizient (GK)<br />
Lageparameter<br />
Streuungsmaße:<br />
• Spannweite (R) und Quartilsabstand<br />
• mittlere absolute Abweichung (d)<br />
• Varianz (s²)<br />
• Standardabweichung (s)<br />
• Variationskoeffizient (V)<br />
Modus:<br />
Der Modus (Modalwert, häufigster Wert, dichtester Wert) ist derjenige Merkmalswert, der am<br />
häufigsten beobachtet wurde.<br />
Aufgabe: Die folgenden Häufigkeitsverteilungen zeigen die geleisteten Überstunden (xi) von<br />
zwei Unternehmen. Bestimmen Sie den Modus.<br />
Unternehmen A:<br />
Unternehmen B:<br />
xi 0 1 2 3 4 12<br />
hi 3 10 4 3 2 1<br />
xi 0 1 2 3 4<br />
hi 3 5 4 4 4<br />
19
Median:<br />
Der Median (Zentralwert) ist derjenige Merkmalswert, dessen Merkmalsträger in der<br />
Rangordnung aller Merkmalsträger genau die mittlere Position einnimmt.<br />
Aufgabe 1: Für 23 Beschäftigte einer Firma wurden die Fehlzeiten (in Tagen) für das letzte<br />
Jahr berechnet. Ermitteln Sie den Median.<br />
xi 0 3 4 7 8 9 12 13 59<br />
hi 3 1 2 3 5 4 2 2 1<br />
Hi 3 4 6 9 14 18 20 22 23<br />
Aufgabe 2: Für 20 Beschäftigte einer Firma wurden die Fehlzeiten (in Tagen) für das letzte<br />
Jahr berechnet. Ermitteln Sie den Median.<br />
xi 0 2 5 6 7 11 12 14<br />
hi 4 2 2 2 4 3 2 1<br />
Hi 4 6 8 10 14 17 19 20<br />
20
Aufgabe 3: Berechnen Sie den Median aus der folgenden, klassierten Verteilung.<br />
j<br />
Forderungen (in Euro)<br />
von ... bis unter ...<br />
hj Hj fj Fj<br />
1 50 100 15 15 0,0612 0,0612<br />
2 100 200 50 65 0,2041 0,2653<br />
3 200 300 80 145 0,3265 0,5918<br />
4 300 400 40 185 0,1633 0,7551<br />
5 400 600 40 225 0,1633 0,9184<br />
6 600 1000 20 245 0,0816 1<br />
Quantile:<br />
Quantile sind eine Sonderform des Median, die eine Gesamtheit in zwei Teile zerlegen,<br />
jedoch nicht zwangsläufig in der Mitte (dem 50 % Wert), da bei Untersuchungen häufig auch<br />
Randwerte von Interesse sind, z.B. 25 % oder 95 %.<br />
Spezielle Quantile:<br />
Art des Quantils Symbolik Anzahl der Intervalle<br />
Perzentile x0,01 ; x0,02 ; … ; x0,99<br />
Dezile x0,1 ; x0,2 ; … ; x0,9<br />
Quintile x0,2 ; x0,4 ; x0,6 ; x0,8<br />
Quartile x0,25 ; x0,5 ; x0,75<br />
Terzile x0,33 ; x0,67<br />
Aufgabe 1: Für 100 Beschäftigte einer Firma wurden die Fehlzeiten (in Tagen) für das letzte<br />
Jahr berechnet. Bestimmen Sie die drei Quartile.<br />
xi 0 1 2 3 4 5 6 7 8<br />
hi ; fi 10 15 25 15 10 5 10 5 5<br />
Hi ; Fi<br />
HRi ; FRi<br />
21
Aufgabe 2: Bestimmen Sie a) das 1. Dezil und b) das 4. Quintil.<br />
xi 0 1 2 3 4 5 6 7 8<br />
hi ; fi 10 15 25 15 10 5 10 5 5<br />
Hi ; Fi 10 25 50 65 75 80 90 95 100<br />
HRi ; FRi 90 75 50 35 25 20 10 5 0<br />
Aufgabe 3: Berechnen Sie das 3. Quartil aus der klassierten Verteilung:<br />
j<br />
Forderungen (in Euro)<br />
von ... bis unter ...<br />
hj Hj fj Fj<br />
1 50 100 15 15 0,0612 0,0612<br />
2 100 200 50 65 0,2041 0,2653<br />
3 200 300 80 145 0,3265 0,5918<br />
4 300 400 40 185 0,1633 0,7551<br />
5 400 600 40 225 0,1633 0,9184<br />
6 600 1000 20 245 0,0816 1<br />
Aufgabe 4:<br />
Bestimmen Sie a) das 1. Quartil und b) das 3. Quintil der Forderungen.<br />
22
arithmetisches Mittel:<br />
Das arithmetische Mittel ( x¯ ) ist ein Durchschnittswert, bei dem die Summe aller<br />
beobachteten Merkmalswerte auf die Anzahl der Merkmalsträger bezogen wird. Das<br />
arithmetische Mittel setzt ein metrisches Skalenniveau voraus.<br />
Aufgabe 1: Es soll der Durchschnittspreis für eine Tasse Kaffee ermittelt werden. Die fünf<br />
Cafes in der Region nehmen pro Tasse Kaffee die folgenden Preise:<br />
Cafe 1 2 3 4 5<br />
Preis (in Euro) 2,50 2,10 1,80 2,30 2,00<br />
Bei dem gewogenen arithmetischen Mittel werden die Merkmalsausprägungen mit<br />
Häufigkeiten gewichtet.<br />
Aufgabe 2: Ein Urlauber kauft im Laufe seiner Reise 20 Tassen Kaffee in fünf verschiedenen<br />
Cafes der Region. Es soll der Durchschnittspreis ermittelt werden, den der Urlauber pro Tasse<br />
Kaffee bezahlt hat:<br />
Cafe 1 2 3 4 5 ∑<br />
Preis (in Euro) 2,50 2,10 1,80 2,30 2,00 -<br />
Anzahl (in Tassen) 5 3 2 4 6 20<br />
Aufgabe 3: In einem Dorf mit 50 Erwerbstätigen sind 49 Arbeiter mit einem monatlichen<br />
Nettoeinkommen von je 2.000,00 € und ein Millionär mit einem monatlichen Nettoeinkommen<br />
von 102.000,00 €. Ermitteln Sie das durchschnittliche Einkommen der Erwerbstätigen<br />
und beurteilen Sie das Ergebnis.<br />
Für klassierte Häufigkeitsverteilungen kann das arithmetische Mittel nur näherungsweise<br />
bestimmt werden. Anstelle der Merkmalswerte xi werden dann die Klassenmitten xj *<br />
verwendet. Dabei wird unterstellt, dass innerhalb jeder Klasse eine Gleich- oder symmetrische<br />
Verteilung vorliegt.<br />
23
harmonisches Mittel:<br />
Bei dem harmonischen Mittel (x¯ H) werden die relativen Entfernungen berechnet. Dazu<br />
müssen aus den Merkmalswerten Quotienten gebildet werden. Bei konstanter Zählergröße<br />
und variabler Nennergröße muss das harmonische Mittel angewendet werden. Allgemein:<br />
Aufgabe 1: Ein Spediteur fährt 150 km um eine Ware auszuliefern. Auf dem Hinweg fährt er<br />
150 km/h. Auf dem Rückweg kann er aufgrund eines Staus nur 50 km/h fahren. Wie hoch war<br />
die durchschnittliche Geschwindigkeit?<br />
Aufgabe 2: Der Spediteur tankt auf seiner Fahrt zweimal. Beim ersten Mal<br />
20 Liter zum Preis von 1,40 €/l und beim zweiten Mal 30 Liter zum Preis von 1,50 €/l. Wie<br />
groß ist der mittlere Benzinpreis?<br />
Aufgabe 3: Der Spediteur tankt auf seiner Fahrt dreimal die gleiche Menge Benzin. Beim<br />
ersten Mal zum Preis von 1,40 €/l und beim zweiten und dritten Mal zum Preis von 1,70 €/l.<br />
a) Wie viel Euro beträgt der mittlere Benzinpreis pro Liter und b) wie groß ist der mittlere<br />
Benzinpreis, wenn er zu den angegebenen Preisen jeweils für den gleichen Geldbetrag tankt?<br />
Aufgabe 4:<br />
a) Ein Gastwirt kauft im Großmarkt jeweils 10 kg Schweine- und Rindfleisch. Das Schweinefleisch<br />
kostet 20,00 €/kg und das Rindfleisch 22,00 €/kg. Berechnen Sie den Durchschnittspreis<br />
für ein Kilogramm Fleisch.<br />
b) Ein Gastwirt kauft im Großmarkt Fleisch für 420,00 €, davon sind 200,00 € für Schweinefleisch<br />
und 220,00 € für Rindfleisch. Das Schweinefleisch kostet 20,00 €/kg und das Rindfleisch<br />
22,00 €/kg. Berechnen Sie den Durchschnittspreis für ein Kilogramm Fleisch.<br />
Aufgabe 5: Der Spediteur fährt pro Tag 8 Stunden. Am ersten Tag schafft er durchschnittlich<br />
150 km/h und am 2. Tag 50 km/h. Welche Strecke hat er an den beiden Tagen<br />
durchschnittlich pro Stunde zurückgelegt?<br />
Aufgabe 6: Zum reinigen einer Etage benötigt eine Putzfrau 3 Stunden, während eine andere,<br />
routiniertere Putzfrau die gleiche Etage auch in 2 Stunden putzen kann. Wie lange dauert die<br />
Reinigung der Etage, wenn beide Putzfrauen zusammen arbeiten?<br />
24
geometrisches Mittel:<br />
Das geometrische Mittel ( x¯ G ) ist der Wert, der mehrere aufeinanderfolgende Vervielfachungen<br />
einer Größe als durchschnittliche Vervielfachung wiedergibt.<br />
Aufgabe 1: Die Gewinnentwicklung der vergangenen 5 Jahren stellt sich für eine<br />
Unternehmung wie folgt dar. Berechnen Sie die durchschnittliche Gewinnsteigerung pro Jahr.<br />
Jahr 0 1 2 3 4 5<br />
Gewinn (in €) 120.000 138.000 165.600 157.320 188.784 235.980<br />
Bei dem gewogenen geometrischen Mittel werden die Wachstumsfaktoren hoch deren<br />
Häufigkeiten gewichtet.<br />
Aufgabe 2: Ein Kapital von 1.200,00 € wird für sieben Jahre auf ein Sparbuch eingezahlt. In<br />
den ersten beiden Jahren verzinst sich das Kapital mit 3 % p.a., danach steigt der Zinssatz für<br />
4 Jahre auf 3,5 % p.a. und im letzten Jahr auf 4 % p.a. Wie hoch ist die durchschnittliche<br />
Verzinsung?<br />
25
Aufgaben<br />
1. Geben Sie zu den folgenden Fragestellungen einen geeigneten Mittelwert an:<br />
a) Aus Schulnoten verschiedener Fächer soll eine Durchschnittsnote ermittelt werden.<br />
b) Es ist das Durchschnittsgewicht von Personen zu ermitteln.<br />
c) Ein Pkw fährt auf Teilstrecken einer Route verschiedene Geschwindigkeiten. Es soll die<br />
Durchschnittsgeschwindigkeit ermittelt werden.<br />
d) An verschiedenen Fleischstücken soll der Gewichtsverlust durch das Braten ermittelt<br />
werden.<br />
2. Elf Studenten nehmen an einem Elfmeterschießen teil. Sie erzielen die folgenden<br />
Trefferzahlen bei 10 Schuss: 4, 6, 3, 1, 2, 8, 4, 5, 2, 0, 2. Bestimmen Sie a) den Zentralwert,<br />
b) die Quartile und c) das arithmetische Mittel.<br />
3. Bei einer Untersuchung über den täglichen Wasserverbrauch (in l pro Tag) von privaten<br />
Haushalten in einer Großstadt ergab sich die folgende Häufigkeitsverteilung:<br />
xj 0 bis 200 über 200 bis 400 über 400 bis 600 über 600 bis 1000<br />
fj 0,2 0,5 0,2 0,1<br />
Bestimmen Sie a) den Zentralwert und b) das arithmetische Mittel.<br />
4. Die Produktion an Kartoffeln hat sich in einer Region in den Jahren 2007 bis 2010 wie<br />
folgt gegenüber dem Vorjahr verändert:<br />
Jahr 2007 2008 2009 2010<br />
Änderung + 20 % + 40 % + 10 % – 30 %<br />
Wie groß ist die durchschnittliche Änderungsrate?<br />
5. Für die Kaufkraft einer Währung wurden für 6 aufeinander folgende Jahre nachstehende<br />
Werte ermittelt: 100; 95; 85; 80; 78; 70. Bestimmen Sie den durchschnittlichen prozentualen,<br />
jährlichen Kaufkraftschwund.<br />
6. Ein Pkw legt vier gleichlange Teilstrecken einer Gesamtstrecke mit den Geschwindigkeiten<br />
40 km/h, 50 km/h, 80 km/h und 100 km/h zurück. Durch welche konstante Geschwindigkeit<br />
hätte er die Gesamtstrecke in der gleichen Zeit bewältigt?<br />
7. Ein Privatanleger kauft 10 Aktien zu je 100,00 €. Einen Monat später kauft er noch einmal<br />
15 Aktien zum Preis von 150 € pro Aktie. Ermitteln Sie den Durchschnittspreis pro Aktie.<br />
8. Ein Privatanleger kauft für 1.000,00 € Aktien der Firma X AG zum Stückpreis von<br />
100,00 €. Einen Monat später kauft es noch einmal für 2.250,00 € Aktien der gleichen Firma<br />
zum Stückpreis von 150,00 € pro Aktie. Ermitteln Sie den Durchschnittspreis pro Aktie.<br />
26
9. Bei zwei Umfragen unter Studenten haben sich einmal 60 % von 100 Hörern einer<br />
Vorlesung und zum anderen 38 % von 1000 vor der Mensa befragten Studenten für die<br />
Abschaffung der <strong>Statistik</strong> ausgesprochen. Wie viel Prozent der Befragten haben sich im<br />
Durchschnitt für die Abschaffung der <strong>Statistik</strong> ausgesprochen?<br />
10. Ein Reisender braucht für das erste Viertel einer Strecke von 1.000 km<br />
2 Stunden. Für die folgende Teilstrecke, die genau halb so lang wie die Gesamtstrecke ist,<br />
braucht er 5 Stunde und für den Rest 3 Stunden. Welche Durchschnittsgeschwindigkeit ergibt<br />
sich für die Gesamtstrecke?<br />
11. Ein Pkw-Fahrer legt von einer Gesamtstrecke 1/6 mit einer Geschwindigkeit von<br />
100 km/h, 1/3 mit einer Geschwindigkeit von 80 km/h und 1/2 mit einer Geschwindigkeit von<br />
50 km/h zurück. Mit welcher (konstanten) Geschwindigkeit würde er die gesamte Strecke in<br />
der gleichen Zeit bewältigen?<br />
12. Von 11 getesteten Hundepensionen erhielten 5 Pensionen drei Sterne, 2 Pensionen zwei<br />
Sterne und 3 Pensionen einen Stern. Eine Pension erhielt keinen Stern. Wie viele Sterne<br />
haben die getesteten Pensionen im Durchschnitt erhalten?<br />
13. Der Erdölverbrauch eines Landes hat in zwei aufeinander folgenden Jahren um 20 % und<br />
um 38,75 % zugenommen. Um wie viel Prozent hat der Erdölverbrauch durchschnittlich pro<br />
Jahr zugenommen?<br />
14. Ein Amateurradrennfahrer fährt in der ersten Stunde 50 km/h. Danach eine Stunde und<br />
15 Minuten mit 40 km/h. Welche Durchschnittsgeschwindigkeit hat der Radrennfahrer<br />
erzielt?<br />
15. Jemand fährt 100 km, davon die 1. Hälfte mit 50 km/h und die 2. Hälfte mit 40 km/h.<br />
Berechnen Sie die Durchschnittsgeschwindigkeit.<br />
16. Ein Fliesenleger verlegt 20 m² Fliesen mit 5 m²/Stunde und 10 m² Fliesen mit<br />
4 m²/Stunde. Wie hoch ist die Durchschnittsleistung?<br />
17. Die Lohnsteigerungen in einem Betrieb betrugen in den letzten Jahren 7 %, 6,5 % und<br />
4,9 %. Gesucht ist die durchschnittliche Steigerungsrate.<br />
18. Eine Hausfrau kauft in drei aufeinander folgenden Monaten ein Waschmittel. Im ersten<br />
Monat für insgesamt 6,00 € bei einem Preis von 2,00 €/kg, im zweiten Monat für 9,00 € bei<br />
3,00 €/kg und im dritten Monat für 16,00 € bei 4,00 €/kg. Welchen durchschnittlichen Preis<br />
hat sie bezahlt?<br />
27
19. Auf einer Baustelle arbeiten 3 Maurer. Der erste benötigt für einen m² Mauerwerk<br />
60 Minuten, der zweite 10 Minuten und der dritte 30 Minuten. Wie lange benötigt ein Maurer<br />
durchschnittlich für einen m² Mauerwerk?<br />
20. Ein Restaurant importiert Froschschenkel aus drei verschiedenen Ländern für je<br />
6.000,00 €/Monat zu folgenden Einkaufspreisen: aus Land A für 100,00 €/kg, aus Land B für<br />
150,00 €/kg und aus Land C für 120,00 €/kg. Welchen durchschnittlichen Preis hat das<br />
Restaurant bezahlt?<br />
21. Zwei Produktionsbereiche eines Unternehmens haben im vergangenen Jahr die folgenden<br />
Umsätze erzielt: A: 2.000.000,00 € und B: 3.000.000,00 €. In diesem Jahr sind die Umsätze<br />
gestiegen; im Produktionsbereich A um 9 % und im Bereich B um 4 %. Wie hoch ist der<br />
durchschnittliche Zuwachs?<br />
22. Ein Autofahrer tankt auf einer Reise dreimal. Beim ersten Mal 20 l zum Preis von 1,20 €/l,<br />
beim zweiten Tankstop 30 l zum Preis von 1,60 €/l und beim dritten Mal 50 l zum Preis von<br />
1,50 €/l. a) Wie viel Euro beträgt der mittlere Benzinpreis pro Liter und b) wie groß ist der<br />
mittlere Benzinpreis, wenn er zu den angegebenen Preisen jeweils für den gleichen<br />
Geldbetrag tankt?<br />
23. In einer Firma beträgt das arithmetische Mittel aller dort gezahlten Gehälter 2.500,00 €.<br />
Aufgrund einer Vereinbarung wird das Gehalt aller leitenden Angestellten um 10 % erhöht.<br />
Auf diese Gruppe entfielen vor der Gehaltserhöhung 30 % der gesamten Gehaltssumme. Wie<br />
hoch ist das arithmetische Mittel aller Gehälter nach der Gehaltserhöhung?<br />
24. Bei einem Unternehmen ist der Umsatz bei Produkt A um 10 % auf 1.100.000,00 € und<br />
bei Produkt B um 15 % auf 575.000,00 € gewachsen. Wie hoch ist die mittlere Zuwachsrate.<br />
25. Zwei Firmen planen den Zusammenschluss. Die erste Firma verfügt über 200.000,00 €<br />
Eigenkapital, die zweite Firma über 300.000,00 € EK. Die Eigenkapitalquoten (EK/GK)<br />
betragen 23,8 % und 43,8 %. Wie groß wäre die Eigenkapitalquote bei einem Zusammenschluss?<br />
Lösungen:<br />
1. a) x Z ; b) x ; c) x H ; d) x<br />
2. a) x Z = 3 b1) x0,25 = 2<br />
b2) x0,75 = 5 c) x =3,36 Treffer<br />
xZ = 320 l /<br />
3. a) Tag<br />
b) x = 350 l / Tag<br />
4. x G = 6,65 %<br />
5. x G = 6,89 %<br />
6. xH = 59,<br />
259 km / h<br />
7. x = 130,00 € / Aktie<br />
8. x H = 130,00 € / Aktie<br />
9. x = 40 %<br />
10. x = 100 km / h<br />
11. x H = 63,158 km / h<br />
12. x Z = 2 Sterne<br />
13. x G = 29,03 %<br />
14. x = 44,44 km / h<br />
15. x H = 44,44 km / h<br />
16. x H = 4,62 m² / h<br />
17. x G = 6,13 %<br />
18. x H = 3,10 € / kg<br />
19. x H = 20 Min. / m²<br />
20. x H = 120 € / kg<br />
21. x = 6 %<br />
22. a) x = 1,47 € / l<br />
b) x H = 1,41 € / l<br />
23. x = 2.575,00 €<br />
24. x H = 11,67 %<br />
25. x H = 32,78 %<br />
28
Streuungsmaße<br />
Streuungsmaße (Streuungsparameter) haben die Aufgabe, die Streuung der Häufigkeitsverteilung<br />
in Form eines einzigen Wertes zu beschreiben. Das Merkmal muss dabei metrisch<br />
messbar sein.<br />
Spannweite:<br />
Die Spannweite (R) ist die Differenz aus dem größten und dem kleinsten beobachteten<br />
Merkmalswert. Es gilt: R = xn – x1<br />
Aufgabe:<br />
Ermitteln Sie die Spanne von Überstunden der Beschäftigten in einem Unternehmen<br />
Überstunde 0 1 2 3 4 12<br />
Beschäftigte 3 10 4 3 2 1<br />
- Die Spannweite ist ein einfaches Streuungsmaß, das lediglich die Länge des Streuungsbereiches<br />
angibt.<br />
- Wie im Beispiel ersichtlich, ist es ausreißerempfindlich.<br />
- Die Spannweite findet praktische Anwendung, wenn nur die Länge des Streuungsbereichs<br />
interessiert. bzw.<br />
- der höchste und tiefste Wert (z.B. bei Börsenkursen) von Bedeutung ist.<br />
- Werden nur die beiden Grenzwerte angegeben, ist auch die Anwendung bei ordinalem<br />
Datenmaterial zulässig (z.B. Noten, die Bereich von 2 bis 4 lagen).<br />
- Bei einer klassierten Häufigkeitsverteilung gilt:<br />
R =<br />
x − x<br />
o<br />
v<br />
u<br />
1<br />
29
Quartilsabstand:<br />
Der Quartilsabstand gibt an, in welchem Bereich sich die mittleren 50 % der geordneten<br />
Merkmalswerte befinden. Q = x¯ 0,75 – x¯ 0,25<br />
Beispiel: Fehlzeiten der Beschäftigten in einem Unternehmen<br />
xi 0 2 5 6 7 11 12 14<br />
hi 4 2 2 2 4 3 2 1<br />
Hi 4 6 8 10 14 17 19 20<br />
x¯ 0,25 = 2 ; x¯ 0,75 = 11 ; x¯ 0,75 – x¯ 0,25 = 11 – 2 = 9 Tage, d.h. die mittleren 50 % der<br />
Beschäftigten haben zwischen 2 und 11 Tagen gefehlt und streuen in einem Intervall mit der<br />
Länge 9 Tage.<br />
- Der Quartilsabstand ist geeignet, wenn der Kernbereich einer Häufigkeitsverteilung von<br />
Interesse ist (z.B. Einkommensverteilung).<br />
- Der Quartilsabstand ist nicht ausreißerempfindlich.<br />
- Analog zum Quartilsabstand lassen sich auch andere Quantile berechnen.<br />
Aufgabe 1:<br />
Berechnen Sie den Quartilsabstand von den Überstunden (xi) der Beschäftigten (hi)<br />
xi 0 1 2 3 4 12<br />
hi 3 10 4 3 2 1<br />
Hi 3 13 17 20 22 23<br />
Aufgabe 2: Berechnen Sie den Quartilsabstand der klassierten Häufigkeitsverteilung<br />
Forderungen (in Euro)<br />
j<br />
von ... bis unter ...<br />
hj Hj fj Fj<br />
1 50 100 15 15 0,0612 0,0612<br />
2 100 200 50 65 0,2041 0,2653<br />
3 200 300 80 145 0,3265 0,5918<br />
4 300 400 40 185 0,1633 0,7551<br />
5 400 600 40 225 0,1633 0,9184<br />
6 600 1000 20 245 0,0816 1<br />
30
Mittlere absolute Abweichung:<br />
Die „mittlere absolute Abweichung“ (d) ist die durchschnittliche Entfernung aller Merkmalswerte<br />
vom arithmetischen Mittel oder vom Median.<br />
Aufgabe 1: Berechnen und interpretieren Sie die mittlere absolute Abweichung von den<br />
Überstunden der Beschäftigten in einem Unternehmen<br />
i<br />
xi<br />
hi<br />
0 3<br />
1 10<br />
2 4<br />
3 3<br />
4 2<br />
12 1<br />
xi * hi x<br />
x i − x i − x * h i<br />
Aufgabe 2: Berechnen Sie die mittlere absolute Abweichung bei der folgenden klassierten<br />
Häufigkeitsverteilung:<br />
j<br />
Forderungen (in Euro)<br />
von ... bis unter ...<br />
50 100 15<br />
100 200 50<br />
200 300 80<br />
300 400 40<br />
400 600 40<br />
600 1000 20<br />
xj * hj xj * * hj x x<br />
*<br />
x − x * h<br />
*<br />
j − j<br />
j<br />
31
Varianz und Standardabweichung:<br />
Die Varianz (s²) ist die Summe der quadrierten Abweichungen der Merkmalswerte vom<br />
arithmetischen Mittel, dividiert durch die Anzahl der Merkmalsträger. Die Standardabweichung<br />
(s) ist die Quadratwurzel aus der Varianz.<br />
Aufgabe 1 : Berechnen Sie die Varianz und die Standardabweichung von den Überstunden<br />
der Beschäftigten in einem Unternehmen<br />
i xi hi xi * hi xi – x¯ ( xi – x¯ )² ( xi – x¯ )² * hi<br />
0 3<br />
1 10<br />
2 4<br />
3 3<br />
4 2<br />
12 1<br />
Aufgabe 2: Berechnen Sie die Varianz und die Standardabweichung der klassierten<br />
Forderungen einer Unternehmung.<br />
j<br />
Forderungen (in Euro)<br />
von ... bis unter ...<br />
50 100 15<br />
100 200 50<br />
200 300 80<br />
300 400 40<br />
400 600 40<br />
600 1000 20<br />
xj * hj xj * * hj (xj * – x¯ )² (xj * – x¯ )² * hj<br />
32
Variationskoeffizient:<br />
Der Variationskoeffizient (V) ist ein Quotient aus einem Streuungsparameter (Standardabweichung<br />
oder mittlere absolute Abweichung) und einem Lageparameter (arithmetischem<br />
Mittel oder Median). Er misst die relative Streuung der Merkmalswerte.<br />
Beispiel: Forderungen<br />
x¯ = 320,92 € s = 188,19 € 188,<br />
19<br />
V = * 100 = 58,<br />
64 %<br />
320,<br />
92<br />
oder:<br />
x¯ = 320,92 € d = 146,19 € 146,<br />
19<br />
V = * 100 = 45,<br />
55 % , d.h. die Forderungsbeträge<br />
320,<br />
92<br />
sind 45,55 % vom durchschnittlichen Forderungsbetrag 320,92 € entfernt. (Je nach verwendetem<br />
Lage- bzw. Streuungsmaß ist das Ergebnis entsprechend zu interpretieren.)<br />
Der Variationskoeffizient ist auch als relative Größe zum Vergleich der Streuung von<br />
Häufigkeitsverteilungen mit unterschiedlichen Mittelwerten geeignet, soweit diese die<br />
gleichen Maßeinheiten besitzen:<br />
Beispiel: Für zwei Güter (A und B) werden Preisuntersuchungen mit den folgenden<br />
Ergebnissen durchgeführt:<br />
2,<br />
80<br />
7,<br />
00<br />
x¯ A = 7,00 € dA = 2,80 € V = * 100 = 40 %<br />
20,<br />
40<br />
750,<br />
00<br />
x¯ B = 750,00 € dB = 20,40 € V = * 100 = 2,<br />
72 %<br />
Neben den relativen Streuungen der Güter A und B kann hier auch festgestellt werden, dass<br />
bei Gut A die durchschnittliche Abweichung 14,7-mal so groß ist, wie bei Gut B.<br />
33
Aufgaben:<br />
1. In 10 Gaststätten wurden die folgenden Preise für ein Glas Wasser (0,2 l) ermittelt: 1,40 ;<br />
1,60 ; 1,70 ; 1,50 ; 1,40 ; 1,80 ; 1,70 ; 1,60 ; 1,50 ; 1,80. Berechnen Sie die a) Spannweite,<br />
b) mittlere absolute Abweichung, c) Varianz, d) Standardabweichung und e) den Variationskoeffizienten<br />
auf Basis der mittleren absoluten Abweichung zum arithmetischen Mittel.<br />
2. Eine Befragung von Studenten nach den monatlichen Ausgaben für Bücher hat folgendes<br />
Ergebnis geliefert:<br />
Ausgaben 30 bis u. 40 40 bis u. 50 50 bis u. 60 60 bis u. 70 70 bis u. 80<br />
fj 0,1 0,2 0,2 0,4 0,1<br />
Berechnen Sie das arithmetische Mittel und die Varianz.<br />
3. Berechnen Sie für die folgende Verteilung die Standardabweichung:<br />
Klasse 10 bis unter 20 20 bis unter 30 30 bis unter 40 40 bis unter 50<br />
hj 12 23 20 5<br />
4. Die folgende Tabelle gibt die Körpergröße von 5 Kindern in cm und Zoll an, wobei der<br />
Einfachheit halber 1 Zoll = 2,5 cm gesetzt wurde.<br />
cm 120 130 125 130 135<br />
Zoll 48 52 50 52 54<br />
Berechnen Sie für beide Messreihen a) das arithmetische Mittel, b) die mittlere absolute<br />
Abweichung und c) den Variationskoeffizient.<br />
5. Eine Untersuchung des verfügbaren Einkommens von Studenten in den USA und in<br />
Deutschland ergab folgende Werte:<br />
USA: x¯ = 470,00 $ s = 160,00 $<br />
Deutschland: x¯ = 520,00 € s = 130,00 €<br />
Vergleichen Sie die relativen Streuungen miteinander.<br />
6. Bei einer Prüfung wurden von 11 Teilnehmern die folgenden Punktzahlen erzielt:<br />
7, 3, 4, 2, 8, 6, 5, 3, 7, 3, 7. Bestimmen Sie a) den Modus, b) den Zentralwert, c) das<br />
arithmetische Mittel, d) die Spannweite, e) die mittlere absolute Abweichung, f) die Varianz<br />
und g) die Standardabweichung.<br />
7. Ordnen Sie die Beobachtungswerte 10,3; 12,4; 11,3; 10,8; 12,1; 12,9; 13,5; 13,1; 10,4 und<br />
12,0 den folgenden Klassen zu: 10 bis unter 11; 11 bis unter 12; 12 bis unter 13; 13 bis unter<br />
14 und berechnen Sie a) das arithmetische Mittel und b) die Varianz für die klassierten Werte.<br />
34
8. Die folgende Häufigkeitsverteilung gibt das Trinkgeld von 10 Gästen wieder:<br />
xj (in €) 1,5 < xj ≤ 2,5 2,5 < xj ≤ 3,5 3,5 < xj ≤ 4,5 4,5 < xj ≤ 5,5<br />
hj 3 3 3 1<br />
Bestimmen Sie a) das arithmetische Mittel, b) die Spannweite und c) den Zentralwert.<br />
9. Bestimmen Sie für die Werte: 8, 6, 7, 6, 9, 11, 10, 7, 6, 10 die folgenden Parameter:<br />
a) Median, b) arithmetisches Mittel, c) mittlere absolute Abweichung, d) Varianz e) Standardabweichung<br />
und f) Variationskoeffizient.<br />
10. In zwei Betriebsrestaurants eines Caterers wird für den vergangenen Monat die Zahl der<br />
täglich verkauften Essen ermittelt:<br />
Berechnen Sie für beide Betriebsrestaurants die durchschnittlich pro Tag verkauften Essen<br />
und ermitteln Sie den Betrieb mit der gleichmäßigeren Auslastung.<br />
Lösungen:<br />
Betrieb A Betrieb B<br />
Anzahl<br />
Essen<br />
Anzahl<br />
Tage<br />
Essen Tage<br />
700 4 500 2<br />
800 7 600 4<br />
900 4 800 8<br />
1000 6 1000 10<br />
1100 9 1100 6<br />
2<br />
2<br />
1. a) R = 0,40 € ; b) x = 1,<br />
60 € ; d = 0,<br />
12 € ; c) s = 0,<br />
02 € ; d) s = 0,<br />
1414 € ; e) V = 7,<br />
5 %<br />
2. x = 57 € ; s² =136 €²<br />
3. s = 8,81<br />
4. a) x 1=<br />
128 cm ; x 2 = 51,2 Zoll ; b) d1 = 4,4 cm ; d2 = 1,76 Zoll ; c) V = 3,44 %<br />
5. V 34 %<br />
USA = ; V 25 %<br />
. Dt =<br />
6. a) x D = 3 u. 7 Punkte ; b) x Z = 5 ; c) x = 5 ; d) R = 6 ; e) d = 1,82 ; f) s² = 4 ; g) s = 2<br />
7. a) x = 12 b) s² =1,25<br />
8. a) x = 3,20 € ; b) R = 4,00 € ; c) x = 3,<br />
17 €<br />
Z<br />
9. a) x Z = 7,5 ; b) x = 8 ; c) d = 1,6 ; d) s² = 3,2 ; e) s = 1,79 ; f) V = 22,<br />
38 %<br />
10. x = 930 ; x A<br />
B = 880 ; dA = 130 ; dB = 168 ; VA = 13,98 % ; VB = 19,09 % Betrieb A<br />
35
Konzentrationsmessung<br />
Die Konzentrationsmessung ermittelt, welcher Anteil der Merkmalswertsumme (z.B. Einkommen)<br />
auf welchen Anteil (= relative Messung), bzw. auf welche Anzahl (= absolute<br />
Messung) der Merkmalsträger (z.B. Haushalte) entfällt.<br />
Aufgabe1a: Wert von 5.000 Lagerpositionen – Welcher Anteil des gesamten Lagerwertes<br />
entfällt auf welchen Anteil der Lagerpositionen?<br />
j<br />
Lagerwert (in €)<br />
von ... bis unter<br />
1 5<br />
5 15<br />
15 25<br />
25 50<br />
50 100<br />
100 395<br />
hj<br />
(Zahl der<br />
Positionen)<br />
2.000<br />
1.200<br />
800<br />
700<br />
200<br />
100<br />
fj<br />
Fj<br />
*<br />
x j<br />
hj ´<br />
(= *<br />
x j *hj)<br />
fj ´ Fj ´<br />
36
Lorenzkurve<br />
Die Lorenzkurve zeigt das Ausmaß der Konzentration in einer grafischen Darstellung.<br />
Besitzen alle Merkmalsträger denselben Merkmalswert, liegt keine Konzentration vor und die<br />
Lorenzkurve ist identisch mit der Gleichverteilungsgeraden. Je größer die Konzentration ist,<br />
desto größer ist die Fläche zwischen der Gleichverteilungsgeraden und der Lorenzkurve.<br />
Aufgabe 1b: Zeichnen Sie die Lorenzkurve<br />
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 Fj<br />
Fj = Lagerposition, Fj´ = Lagerwert<br />
Gini-Koeffizient<br />
Der Gini-Koeffizient (GK) ist ein Maß für die Stärke der Konzentration. Je näher GK gegen<br />
Null geht, desto geringer ist die relative Konzentration, je näher GK gegen Eins geht, desto<br />
größer ist die relative Konzentration. Es gilt: 0 ≤ GK ≤ ( n − 1)<br />
/ n < 1 und F 0<br />
´<br />
Aufgabe 1c: Berechnen und interpretieren Sie den Gini-Koeffizienten<br />
0 =<br />
Fj´ 1<br />
0,9<br />
0,8<br />
0,7<br />
0,6<br />
0,5<br />
0,4<br />
0,3<br />
0,2<br />
0,1<br />
0<br />
37
Aufgaben:<br />
2. Berechnen und interpretieren Sie die absolute Konzentration für das obige Beispiel.<br />
3. Berechnen, zeichnen und interpretieren Sie die relative Konzentration<br />
j<br />
Zimmerpreise (€)<br />
von ...bis unter<br />
hj<br />
1 50 70 50<br />
2 70 90 44<br />
3 90 120 40<br />
4 120 150 38<br />
5 150 190 28<br />
4. Es liegt Ihnen die folgende relative Summenhäufigkeitsverteilung einer Unternehmung mit<br />
2000 Mitarbeitern vor. Berechnen, zeichnen und interpretieren Sie die relative Konzentration.<br />
Fj<br />
100<br />
90<br />
80<br />
70<br />
60<br />
50<br />
40<br />
30<br />
20<br />
10<br />
0<br />
1000<br />
0<br />
1250<br />
3<br />
1500<br />
8<br />
1750<br />
15<br />
Bruttomonatseinkommen<br />
2000<br />
25<br />
2250<br />
35<br />
2500<br />
50<br />
2750<br />
62<br />
3000<br />
72<br />
3250<br />
80<br />
3500<br />
85<br />
3750<br />
90<br />
4000<br />
93<br />
4250<br />
96<br />
4500<br />
98 99 100<br />
4750<br />
5000<br />
xj<br />
38
Abhängigkeit von Merkmalen<br />
Zwei Merkmale sind voneinander statistisch abhängig, wenn der Wert des einen Merkmals<br />
davon abhängt, welchen Wert das andere Merkmal besitzt. Im Falle der Unabhängigkeit<br />
müssen alle Beobachtungswerte den erwateten Werten aus der Randverteilung entsprechen.<br />
Beispiel: absolute Verteilung<br />
Geschlecht<br />
Farbe<br />
blau<br />
(k=1)<br />
grün<br />
(k=2)<br />
rot<br />
(k=3)<br />
weiblich (i=1) 750 450 300<br />
männlich (i=2) 250 150 100<br />
Summe (hk)<br />
Zusammenhang zwischen zwei Merkmalen<br />
Summe<br />
Kontingenzkoeffizient: Der Kontingenzkoeffizient (K) beschreibt die Stärke des Zusammenhangs<br />
zwischen zwei Merkmalen.<br />
Aufgabe: Die 400 Beschäftigten eines Betriebes wurden nach ihrer Einstellung zu einer<br />
unbezahlten Verlängerung der Mittagspause von bisher 30 Minuten auf 45 Minuten befragt.<br />
Von den 100 Beschäftigten in der Verwaltung waren 40 dafür und 32 dagegen. Die Restlichen<br />
waren unentschieden. In der Produktion stimmten 140 dafür und 88 dagegen. Überprüfen Sie,<br />
ob ein Zusammenhang zwischen dem Tätigkeitsbereich (Merkmal X) und der Einstellung zur<br />
Pausenregelung (Merkmal Y) besteht.<br />
Berechnung des Zusammenhangs:<br />
X<br />
Verwaltung<br />
Produktion<br />
∑<br />
Y<br />
positiv negativ unentschieden ∑<br />
(hi)<br />
39
Rangkorrelationskoeffizient<br />
Zur Messung der Stärke des Zusammenhangs von zwei Merkmalen, die mindestens ordinal<br />
skaliert sind, wird der Rangkorrelationskoeffizient (ρ) verwendet.<br />
Aufgabe: Es soll untersucht werden, ob ein Zusammenhang zwischen der Qualität von<br />
6 Champagnermarken (Merkmal x) und deren Verkaufspreisen (Merkmal y) besteht.<br />
These: „Je besser die Qualität, desto teurer der Champagner“<br />
i Qualitätsurteil (xi) Preis (yi) Rang (xi) Rang (yi) Di Di 2<br />
1 gut 20,10<br />
2 sehr gut 19,35<br />
3 befriedigend 21,20<br />
4 gut 20,99<br />
5 mangelhaft 19,80<br />
6 ausreichend 18,40<br />
• die Reihenfolge der Ränge richtet sich nach der These<br />
• bei gleichen Rängen wird das arithmetische Mittel verwendet<br />
• ρ =<br />
• der Wertebereich ist -1 ≤ ρ ≤ 1 und gibt die Richtung und die Stärke des Zusammenhangs<br />
an.<br />
• der Rangkorrelationskoeffizient prüft allein die Stärke der Gleich- oder Gegenläufigkeit<br />
der Rangordnungen<br />
40
Regressionsanalyse<br />
Die Regressionsanalyse beschreibt einen Zusammenhang durch eine mathematische Funktion,<br />
die sogenannte Regressionsfunktion. Um die Abstände zwischen den Merkmalswerten<br />
messen zu können, müssen die Merkmale metrisch skaliert sein.<br />
Das Streuungsdiagramm (Punktwolke) ergibt sich aus den beobachteten Wertkombinationen<br />
(xi,yi). Die Regressionsgerade beschreibt den durchschnittlichen Verlauf der Abhängigkeit der<br />
Merkmale x und y.<br />
Aufgabe: Es soll untersucht werden, ob ein Zusammenhang zwischen den Werbeausgaben<br />
(Merkmal x) und dem Umsatz (Merkmal y) besteht.<br />
i xi (in<br />
100 €)<br />
yi (in<br />
1.000 €)<br />
1 2 10<br />
2 4 14<br />
3 1 6<br />
4 3 8<br />
5 5 12<br />
∑ 15 50<br />
( x i − x)<br />
( yi<br />
− y)<br />
x − x)(<br />
y − y)<br />
( i<br />
i<br />
( x −<br />
i<br />
x)<br />
2<br />
( y −<br />
i<br />
y)<br />
2<br />
41
Aufgaben:<br />
1. Ein Hotelier möchte mittels Unabhängigkeitstest überprüfen, ob der Zusammenhang<br />
zwischen den Umsätzen in seinem Biergarten und der Zimmerauslastung in seinem Hotel als<br />
statistisch signifikant angesehen werden kann. Aus den vergangenen 100 Tagen liegen die<br />
folgenden Daten vor:<br />
Umsätze<br />
bis 1500,- € / Tag über 1500,- € / Tag<br />
Zimmerauslastung in %<br />
bis 50 % 40 25<br />
über 50 % 20 15<br />
2. Die Fluktuation der Mitarbeiter war in den vergangenen Jahren recht hoch. Da die Einarbeitung<br />
neuer Mitarbeiter mit erheblichen Kosten verbunden ist, soll anhand der Herkunft und<br />
der Dauer der Betriebszugehörigkeit überprüft werden, ob hier ein statistischer Zusammenhang<br />
besteht um so die Fluktuation in Zukunft geringer zu halten. Es liegen die<br />
folgenden Daten vor:<br />
Betriebszugehörigkeit<br />
in Jahren<br />
Entfernung des bisherigen<br />
Wohnsitzes<br />
Mitarbeiter aus einer Entfernung<br />
von bis zu 100 km<br />
42<br />
Mitarbeiter aus einer Entfernung<br />
von über 100 km<br />
1 bis 2 Jahre 6 13<br />
3 bis 4 Jahre 13 12<br />
5 bis 6 Jahre 10 7<br />
7 Jahre und länger 14 5<br />
Berechnen Sie das Chi-Quadrat mittels Testverfahren in einer geeigneten, übersichtlich<br />
strukturierten Tabelle, ermitteln Sie den korrigierten Kontingenzkoeffizienten und<br />
interpretieren Sie Ihr Ergebnis.<br />
3: Die folgende Tabelle enthält die Noten von 10 Studierenden in BWL und <strong>Statistik</strong>:<br />
BWL 1,6 3,4 3,8 2,7 2,4 4,2 5,0 3,7 3,1 3,5<br />
<strong>Statistik</strong> 1,7 3,2 3,6 2,2 2,5 4,3 5,0 4,4 3,7 2,6<br />
Berechnen Sie den Rangkorrelationskoeffizienten und überprüfen Sie in wieweit hier ein<br />
Zusammenhang besteht.<br />
4. Zeichen Sie aus den folgenden Daten das Streuungsdiagramm und bestimmen Sie die<br />
Regressionsfunktion y-x , x-y , das Bestimmtheitsmaß und den Korrelationskoeffizienten:<br />
( 1 ; 2 ) , ( 2 ; 3 ) , ( 3 ; 5 ) , ( 4 ; 4 ) , ( 4 ; 6 ) , ( 5 ; 4 ) , ( 6 ; 8 ) , ( 7 ; 7 ) , ( 9 ; 8 )
5. Bestimmen Sie die Regressionsfunktion y-x, mit x = Werbeausgaben (in Tsd. €) und<br />
y = Umsatz (in Tsd. €) und n = 5 Jahren:<br />
( 10 ; 400 ) , ( 12 ; 430 ) , ( 9 ; 380 ) , ( 11 ; 390 ) , ( 14 ; 450 )<br />
6. Ein Hotelier möchte überprüfen, ob die Umsätze in seinem Biergarten (Y) von der<br />
Zimmerauslastung (X) in seinem Hotel garni abhängen. In den vergangenen Wochen ergab<br />
sich folgende Verteilung:<br />
X (in %) 40 60 70 50 50<br />
Y (in 100 €) 10 15 20 14 17<br />
a) Berechnen Sie die arithmetischen Mittel von X und Y,<br />
b) zeichnen Sie das Streuungsdiagramm,<br />
c) stellen Sie die Regressionsfunktion auf,<br />
d) berechnen und erläutern Sie das Bestimmtheitsmaß.<br />
7. Es wurden 200 Personen nach ihrem Berufsstand und dem Berufsstand ihres Vaters gefragt.<br />
Die Ergebnisse enthält die folgende Tabelle:<br />
Kind<br />
Vater<br />
Arbeiter Angestellter Beamter Selbstständiger<br />
Arbeiter 40 10 0 0<br />
Angestellter 40 25 5 10<br />
Beamter 10 25 25 0<br />
Selbstständiger 0 0 0 10<br />
Überprüfen Sie mit einem geeigneten Verfahren, ob hier ein statistischer Zusammenhang<br />
besteht.<br />
8. Ein Unternehmen möchte den Zusammenhang zwischen dem Preis pro Stück und der<br />
Absatzmenge eines Produktes erkunden. Hierzu wurden die folgenden Daten ermittelt:<br />
Preis pro<br />
Stück (€)<br />
Absatzmenge<br />
(Stück)<br />
Analysieren Sie die Tabelle<br />
0,70 0,80 0,90 1,00 1,10 1,20 1,30 1,35 1,40 1,70<br />
280 230 220 200 199 188 134 110 110 102<br />
9. In einem Land wurden die Angaben von 50 Personen bezüglich der Berufsgruppe und der<br />
Nationalität erfasst. Dabei ergab sich, dass von 30 Inländern 20 Angestellte waren und von<br />
den Ausländern 15 Arbeiter. Überprüfen Sie, ob hier ein statistischer Zusammenhang besteht.<br />
43
10. Einige Bürger wurden nach ihrem ausgabefähigen monatlichen Einkommen in Euro und<br />
nach ihrem Sparverhalten befragt:<br />
Einkommen 1.450,00 972,00 2.600,00 1.300,00 2.990,00 2.230,00<br />
Sparbeitrag 89,00 48,00 309,00 82,00 308,00 220,00<br />
Analysieren Sie die Tabelle<br />
11. Eine Befragung von 1.000 Personen nach Familienstand und Religionszugehörigkeit hat<br />
das folgendes Ergebnis geliefert:<br />
ledig verheiratet geschieden<br />
katholisch 80 400 20<br />
evangelisch 100 250 50<br />
sonstiges 20 50 30<br />
Analysieren Sie die Tabelle.<br />
Lösungen:<br />
1. Chi² = 0,1832 ; Ckorr = 0,0605<br />
2. Chi² = 7 ; Ckorr = 0,4012<br />
2<br />
3. ∑ D = 24 ; ρ = 0,855<br />
i<br />
4. yˆ = 1,7854 + 0,7544 x ; r = 0,8724 ; B = r² = 0,7611 =ˆ 76,11 %<br />
5. yˆ = 251,08 + 14,19 x ; r = 0,9362 ; B = r² = 0,8764<br />
6. x = 54 ; y = 15,2 ; yˆ = 1 / 26 + 73 / 260 x ; r = 0,8649 ; B = r² = 5329 / 7124<br />
7. Chi² = 170,72 ; Ckorr = 0,784<br />
8. yˆ = 391,39 – 186,98 x ; r = – 0,9468 ; B = r² = 0,8963<br />
9. Chi² = 8,33 ; Ckorr = 0,5345<br />
10. x = 5771 / 3 ; y = 176 ; yˆ = – 103,39 + 0,1452 x ; r = 0,9843 ; B = r² = 0,9688<br />
11. Chi² = 85,57 ; Ckorr = 0,3439<br />
44
x<br />
x<br />
+ x<br />
u o<br />
*<br />
j =<br />
j j d j<br />
j<br />
o u<br />
x j − x j<br />
2<br />
Formelsammlung <strong>Statistik</strong><br />
u<br />
h<br />
x − x j<br />
= F( x)<br />
= Fj−1<br />
+ * ( Fj<br />
− Fj<br />
1)<br />
o u<br />
−<br />
x − x<br />
o u<br />
o u<br />
x j − x j n<br />
x<br />
u<br />
j − x<br />
u<br />
j<br />
= x j + * ( − H j−<br />
) x Z = x j + * ( 0,<br />
5 − Fj−1<br />
)<br />
h 2<br />
f<br />
x Z<br />
1<br />
s ²<br />
x<br />
j<br />
v<br />
n<br />
1<br />
x = ∑ xi<br />
* h<br />
x G = n<br />
i<br />
∏<br />
n i=<br />
1<br />
i=<br />
v<br />
∑<br />
i<br />
i=<br />
1<br />
H = =<br />
v<br />
v h i<br />
∑<br />
i=<br />
1<br />
h<br />
x<br />
i<br />
∑<br />
i=<br />
1<br />
n<br />
h<br />
x<br />
i<br />
i<br />
R = xn – x1<br />
d<br />
z<br />
=<br />
1<br />
n<br />
j<br />
j<br />
d =<br />
v<br />
1<br />
1<br />
n<br />
∑ x −<br />
i= 1<br />
j<br />
x<br />
v<br />
i<br />
h<br />
i<br />
∑ x −<br />
i= 1<br />
i x * hi<br />
1 v<br />
( x x ) ²<br />
1 v<br />
= ∑ − * h<br />
s² =<br />
2<br />
∑ x * h − x ²<br />
n i=<br />
1 i i<br />
n i=<br />
1 i i<br />
z<br />
i x * hi<br />
v<br />
s<br />
´ ´<br />
s = s²<br />
V = * 100<br />
GK = 1−<br />
∑ f j * ( Fj−<br />
1 + Fj<br />
)<br />
x<br />
j=<br />
1<br />
χ<br />
2<br />
=<br />
v<br />
w<br />
∑ ∑<br />
⎛<br />
⎜h<br />
⎝<br />
ik<br />
h i * h<br />
−<br />
n<br />
h * h<br />
n<br />
i=<br />
1 k= 1<br />
i k<br />
2<br />
6 Di<br />
= 1−<br />
n(<br />
n²<br />
−1)<br />
k<br />
2<br />
⎞<br />
⎟<br />
⎠<br />
ρ ∑<br />
xy = ∑∑<br />
∑<br />
∑<br />
K korr = 2<br />
2<br />
χ K´<br />
*<br />
χ + n K´<br />
− 1<br />
mit K´<br />
= min<br />
45<br />
{ v,<br />
w }<br />
v w 1<br />
s ( x i − x)<br />
⋅ ( yk<br />
− y)<br />
⋅ h yˆ = a + bx<br />
ik<br />
n i=<br />
1 k=<br />
1<br />
∑ x iy<br />
i − ∑ x<br />
2<br />
n ⋅ ∑ x i − ( ∑<br />
( x i − x)(<br />
yi<br />
− y)<br />
n ⋅<br />
i ⋅ yi<br />
b = =<br />
2<br />
2<br />
a = y − bx<br />
( x − x)<br />
x )<br />
r =<br />
∑<br />
(<br />
i<br />
∑ ( x − x)(<br />
y − y)<br />
s<br />
i<br />
i<br />
xy<br />
= ˆ<br />
B = r²<br />
2<br />
2<br />
x − x)<br />
* ( y − y)<br />
s ⋅ s<br />
i<br />
i<br />
x y<br />
∑<br />
i<br />
∑