14.04.2013 Aufrufe

Statistik Schülerversion - WIHOGA Dortmund

Statistik Schülerversion - WIHOGA Dortmund

Statistik Schülerversion - WIHOGA Dortmund

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

<strong>Statistik</strong><br />

Definition: Entwicklung und Anwendung von Methoden zur Erhebung,<br />

Aufbereitung, Analyse und Interpretation von Daten.<br />

Teilgebiete der <strong>Statistik</strong>:<br />

- Beschreibende (deskriptive) <strong>Statistik</strong><br />

- Wahrscheinlichkeitsrechnung<br />

- Schließende (induktive) <strong>Statistik</strong><br />

Phasen für statistische Untersuchungen:<br />

1. Vorbereitung / Planung<br />

- präzise Formulierung der Ziele<br />

- detaillierte Definition des Untersuchungsgegenstandes<br />

2. Datenerhebung<br />

- Primärerhebung: Befragung, Beobachtung und Experiment<br />

- Sekundärerhebung: Verwendung von bereits vorhandenen Daten<br />

3. Datenaufbereitung und Darstellung<br />

Beispiel: 15 Schüler werden nach ihrer Mathematiknote befragt<br />

Urdaten (Urliste): 2, 1, 5, 4, 2, 3, 2, 3, 5, 4, 4, 4, 1, 2, 5<br />

geordnete Daten (Reihe): 1, 1, 2, 2, 2, 2, 3, 3, 4, 4, 4, 4, 5, 5, 5<br />

Häufigkeitstabelle: Diagramm:<br />

Note<br />

1 2 3 4 5<br />

Häufigkeit 2 4 2 4 3<br />

5<br />

4<br />

3<br />

2<br />

1<br />

0<br />

1 2 3 4 5<br />

4. Datenauswertung (Analyse) und Interpretation<br />

- Häufigkeitsverteilung: die Berechnung von Mittelwerten, Streuungsmaßen und<br />

Konzentrationsmessung<br />

- Zusammenhang zwischen Merkmalen: Methoden der Korrelationsanalyse<br />

- Zeitreihenanalyse: Ermittlung von Schwankungen und Trendermittlung<br />

- Relationen von Zahlen: Verhältnis- und Indexzahlen<br />

5. Ergebnispräsentation<br />

- adressatengerechte Präsentation der Ergebnisse<br />

- grafisch, tabellarisch oder über Einzelwerte<br />

- ergänzt durch erläuternde Kommentare<br />

Häufigkeit<br />

Note<br />

1


Manipulationen in der <strong>Statistik</strong><br />

- Manipulation durch grafische Verzerrungen<br />

Tsd. Euro<br />

70<br />

60<br />

50<br />

40<br />

30<br />

20<br />

10<br />

0<br />

Umsatzentwicklung<br />

1 2 3 4 5 6 7<br />

Zeit<br />

Umsatzentwicklung<br />

70<br />

60<br />

50<br />

40<br />

30<br />

20<br />

10<br />

0<br />

1 2 3 4 5 6 7<br />

- Täuschung durch falsche Angaben<br />

z.B. bewusst falsche Angaben ( bei Kriegsstatistiken über Feindverluste) oder das<br />

bewusste Nichtbeachten von relevanten Daten.<br />

- Nicht-Angabe unüblicher Definitionen oder erklärender Informationen<br />

z.B. werden die Lohnnebenkosten üblicher Weise ins Verhältnis zum Bruttolohn<br />

gesetzt und nicht ins Verhältnis zum Nettolohn. Letzteres müsste sehr deutlich<br />

gekennzeichnet werden.<br />

- Nicht repräsentative Stichprobe<br />

z.B. werden zur Belegung einer These nur Personen befragt, die die gleichen<br />

Interessen verfolgen.<br />

- Irreführende Auswahl der Untersuchungsmerkmale<br />

z.B. werden Personen nur zu bestimmten ausgewählten Merkmalen befragt, die das<br />

wahre Ergebnis verfälschen.<br />

- Die Antwort beeinflussende Fragestellungen<br />

z.B. wenn dem Befragten die gewünschte Antwort suggeriert wird.<br />

- Manipulierende Auswahl der Bezugsgröße<br />

z.B. kann die Preissteigerung ins Verhältnis zum Vormonat oder zum Vorjahresmonat<br />

gesetzt werden, oder an einer Fakultät mit 2.500 Studenten nehmen 50 Studenten an<br />

einer Klausur in <strong>Statistik</strong> teil. Von den 50 Studenten besteht keiner die Klausur. Der<br />

Dozent behauptet, die Durchfallquote bei seiner Klausur sei 2 % gewesen.<br />

- Vortäuschen von Zusammenhängen (fehlende Kausalität)<br />

z.B. der Zusammenhang von Geburten und Storchenpopulation<br />

Tsd. Euro<br />

Zeit<br />

2


Statistische Grundbegriffe<br />

Merkmalsträger:<br />

Der Merkmalsträger (statistische Einheit) ist das Subjekt oder Objekt der statistischen<br />

Untersuchung und der Träger der interessierenden statistischen Information (Träger der<br />

Information).<br />

Grundgesamtheit:<br />

Die Grundgesamtheit (statistische Masse) ist die Menge aller Merkmalsträger, die übereinstimmende<br />

Abgrenzungsmerkmale besitzen.<br />

- sachliche Abgrenzung: Es muss festgelegt werden, wer oder was zu einem<br />

Merkmalsträger gehört.<br />

- räumliche Abgrenzung: In welchen Grenzen (in welchem Gebiet) liegen die<br />

Merkmalsträger.<br />

- zeitliche Abgrenzung: Es ist der Zeitpunkt (Bestandsmasse) oder der Zeitraum der<br />

einzubeziehenden Merkmalsträger zu bestimmen. Die Ereignisse während eines<br />

bestimmten Zeitraumes (Zugänge oder Abgänge) bilden die Bewegungsmasse<br />

(Ereignismasse). Sie führen zu Bewegungen in der korrespondierenden Bestandsmasse.<br />

Merkmal:<br />

Die Eigenschaft des Merkmalsträgers, die bei der statistischen Untersuchung von Interesse ist,<br />

wird als Merkmal (Untersuchungsvariable) bezeichnet.<br />

Merkmalsausprägung:<br />

Alle möglichen Werte, die das Merkmal beim Merkmalsträger annehmen kann, werden als<br />

Merkmalsausprägung bezeichnet.<br />

Merkmalswert:<br />

Der Wert, der beim Merkmalsträger festgestellt wurde heißt Merkmalswert<br />

(Beobachtungswert).<br />

Für die Aufbereitung der Merkmalswerte ist die Art des Merkmals von Bedeutung. Die<br />

folgenden Merkmalsarten werden unterschieden:<br />

- qualitatives Merkmal:<br />

Ein qualitatives Merkmal liegt vor, wenn den möglichen Merkmalswerten lediglich<br />

Namen (artmäßige Merkmale, z.B. Farben) oder Klassenbezeichnungen (intensitätsmäßige<br />

Merkmale, z.B. Noten) zugeordnet werden können.<br />

- quantitatives Merkmal:<br />

Ein Merkmal, das eine messbare Dimension besitzt (z.B. Anzahl der Mitarbeiter im<br />

Betrieb) oder in Mengeneinheiten ausgedrückt werden kann (z.B. Verbrauch in Litern),<br />

wird als quantitativ bezeichnet.<br />

- diskretes Merkmal:<br />

ein quantitatives Merkmal, das abzählbar viele Werte annehmen kann, wird als diskret<br />

bezeichnet (z.B. Einwohnerzahl einer Stadt).<br />

3


- stetiges Merkmal:<br />

ein quantitatives Merkmal, das überabzählbar viele Werte annehmen kann, wird als stetig<br />

bezeichnet (z.B. Füllmengen). Um ein stetiges Merkmal wie ein diskretes behandeln zu<br />

können, muss eine Einheit hinzugefügt werden (z.B. Füllmengen in Litern).<br />

- häufbares Merkmal:<br />

Ein Merkmal, von dem ein Merkmalsträger mehr als einen Merkmalswert annehmen<br />

kann, heißt häufbares Merkmal (z.B. Hobbys).<br />

- nicht häufbares Merkmal:<br />

Ein Merkmal, von dem ein Merkmalsträger nur genau einen Merkmalswert besitzen kann,<br />

heißt nicht häufbares Merkmal (z.B. Alter).<br />

Vollerhebung:<br />

Bei einer Vollerhebung (Totalerhebung) werden die Merkmale bei allen statistischen<br />

Einheiten erhoben.<br />

Stichprobe:<br />

Wird nur ein Teil der Grundgesamtheit untersucht, so handelt es sich um eine Stichprobe.<br />

Diese kommt zu Anwendung, wenn eine Vollerhebung zu kostenaufwendig ist, mit einem<br />

erheblichen Zeitaufwand verbunden ist, oder überhaupt nicht durchgeführt werden kann, da<br />

die statistischen Einheiten bei der Untersuchung zerstört werden (z.B. Crash-Tests), nicht alle<br />

bekannt sind (z.B. die Kunden eines Supermarktes), zu einer Erhebung nicht bereit sind<br />

(z.B. Befragung nach dem Einkommen), oder im vorgegebenen Zeitraum nicht untersucht<br />

werden können.<br />

repräsentative Stichprobe:<br />

Eine Stichprobe gilt als repräsentativ, wenn die aus der Grundgesamtheit ausgewählten,<br />

statistischen Einheiten hinsichtlich aller Kriterien, anteilig alle statistischen Einheiten der<br />

Grundgesamtheit wiederspiegeln (repräsentieren).<br />

Auswahlverfahren:<br />

Erstreckt sich die statistische Untersuchung nur auf einen Teil der Grundgesamtheit, so<br />

kommt ein Auswahlverfahren zur Stichprobenuntersuchung zur Anwendung:<br />

- willkürliche Auswahl: Bei dieser nicht repräsentativen Auswahl gibt es keine konkreten<br />

Vorgaben (z.B. werden Kunden im Supermarkt nach einem bestimmten Produkt befragt).<br />

- Zufallsauswahl: Da jede statistische Einheit der Grundgesamtheit mit einer berechneten<br />

Wahrscheinlichkeit in die Stichprobe gelangt, ist eine repräsentative Erhebung<br />

sichergestellt (z.B. Telefonbefragung, wenn die Telefonnummern zufällig ausgewählt<br />

werden).<br />

- Bewusste Auswahl: Bei der bewussten Auswahl (Beurteilungsstichprobe) erfolgt die<br />

Auswahl der statistischen Einheiten gezielt nach bestimmten Merkmalen und ist<br />

annähernd repräsentativ (z.B. das Quotenverfahren, wenn die jeweiligen Anteile an der<br />

Grundgesamtheit bekannt sind, das Konzentrationsverfahren, wenn die wichtigsten der<br />

statistischen Einheiten der Grundgesamtheit befragt werden oder die typische Auswahl,<br />

bei der nur die statistischen Einheiten befragt werden, die hinsichtlich eines Merkmals als<br />

besonders typisch gelten).<br />

4


Zeitreihe:<br />

Eine statistische Reihe von Beobachtungswerten, die für aufeinander folgende Zeitpunkte<br />

oder Zeitintervalle erhoben werden, heißt Zeitreihe.<br />

Statistische Skalen:<br />

Auf einer Skala (Messskala) werden die möglichen Merkmalswerte nach einem bestimmten<br />

Ordnungsprinzip als Skalenwerte abgetragen. Die Skala (bzw. das Ordnungsprinzip) ist<br />

entscheidend zum einen für das Informationsniveau und den Aussagegehalt des Merkmalswertes<br />

und zum anderen für die statistischen Verfahren, die angewendet werden dürfen.<br />

Nominalskala:<br />

Eine Skala, deren Skalenwerte nur nach dem Kriterium gleich oder verschieden geordnet<br />

werden können heißt Nominalskala (z.B. Farben oder Bundesländer).<br />

Rangskala:<br />

Eine Skala, deren Skalenwerte nicht nur nach dem Kriterium gleich oder verschieden, sondern<br />

außerdem in einer natürlichen Reihenfolge geordnet werden können, heißt Rangskala oder<br />

Ordinalskala (z.B. Noten oder Güteklassen).<br />

metrische Skala:<br />

Eine Skala, deren Skalenwerte reelle Zahlen sind und die alle Ordnungseigenschaften der<br />

reellen Zahlen besitzt, d.h. die Werte lassen sich in eine Rangfolge bringen und es sind zudem<br />

auch Abstände messbar, heißt metrische Skala oder Kardinalskala (z.B. Einkommen oder<br />

Stückzahlen).<br />

Die drei Skalen sind durch ein steigendes Informationsniveau gekennzeichnet. Je höher das<br />

Informationsniveau, desto höher und objektiver ist auch die Aussagekraft und das<br />

Analysepotential. Daher sollte bei einer statistischen Untersuchung möglichst nach<br />

Merkmalen mit einem hohen Skalenniveau gesucht werden (z.B. kann die Sorgfalt eines<br />

Akkordarbeiters unter Verwendung einer Ordinalskala von „sorgfältig“ stufenweise bis<br />

„unachtsam“ gemessen werden, oder aber auf einer metrischen Skala mit der Anzahl an<br />

Fehlern pro 100 Mengeneinheiten).<br />

Hat der Skalenwert bei einer metrischen Skala keinen natürlichen Nullpunkt (Intervallskala),<br />

z.B. Temperatur in Celsius, so darf nur der absolute aber nicht der relative Abstand gemessen<br />

werden (z.B. beträgt der absolute Abstand von 12 Grad und 36 Grad Celsius gleich 24 Grad<br />

Celsius. Der relative Wert 36 / 12 = 3 ist ohne Aussagekraft, da es bei 36 Grad nicht 3 mal so<br />

warm ist wie bei 12 Grad Celsius).<br />

Besitzt der Skalenwert bei einer metrischen Skala einen natürlichen Nullpunkt<br />

(Verhältnisskala), z.B. Lebensalter in Jahren, oder zusätzlich auch noch eine natürliche<br />

Einheit (Absolutskala), z.B. Stückzahlen, so darf der absolute und der relative Abstand<br />

gemessen werden (z.B. beträgt der absolute Abstand zwischen 2.000,00 € und 6.000,00 €<br />

gleich 4.000,00 € und 6.000 / 2.000 = 3 bedeutet, dass es dreimal soviel ist).<br />

Unter einer Skalentransformation versteht man die Übertragung von Skalenwerten in Werte<br />

einer anderen Skala, wobei die Ordnungseigenschaften der Skala erhalten bleiben müssen.<br />

Nach der Transformation ist auf die korrekte Interpretation der Daten zu achten (z.B. nach der<br />

Transformation der qualitativen Merkmalsausprägungen „männlich“ und „weiblich“ in „0“<br />

und „1“ (Pseudokardinalskalen) darf mit diesen Werten nicht gerechnet werden).<br />

5


Beispiel: Es soll die durchschnittliche <strong>Statistik</strong>note ermittelt werden.<br />

Zur Grundgesamtheit gehören alle Studierenden (Merkmalsträger), die im dritten Semester<br />

sind (sachlich), an der <strong>WIHOGA</strong> in <strong>Dortmund</strong> eingeschrieben waren (räumlich), im Zeitraum<br />

vom ... bis ... (zeitlich). Zu einem bestimmten Zeitpunkt (Bestandsmasse). Bei Abmeldungen<br />

während des Semesters (Ereignismasse / Bewegungsmasse). Es ist festzulegen, welche<br />

Subjekte mit einbezogen werden sollen und dies ist eindeutig kenntlich zu machen.<br />

Bei den Studenten (statistische Einheiten) soll die Note (Merkmal) festgestellt werden.<br />

Möglich wären die Noten 1, 2, 3, 4, 5 oder 6 (Merkmalsausprägungen). Die tatsächliche Note<br />

der jeweiligen statistischen Einheit ist der Merkmalswert (Beobachtungswert).<br />

Bei den Noten handelt es sich um ein qualitatives, intensitätsmäßiges Merkmal, das auf einer<br />

Rangskala gemessen wird, da es wohl eine Rangfolge der Noten gibt, jedoch keine Abstände<br />

gemessen werden können. So ist die Note 2 zwar besser als die Note 4, jedoch nicht doppelt<br />

so gut und es gibt auch keine Zwischenwerte (z.B. Note 2,5). Da das Merkmal nicht<br />

quantitativ ist lässt es sich auch nicht als diskret oder stetig klassifizieren. Da jeder Student<br />

(im abgegrenzten Zeitraum) nur eine Note bekommt, handelt es sich um ein nicht häufbares<br />

Merkmal. Da die Noten aller Studenten mit in die statistische Untersuchung einbezogen<br />

werden, liegt eine Vollerhebung vor.<br />

Abkürzungen:<br />

i = Laufindex<br />

n = Gesamtzahl der Merkmalsträger<br />

x = Merkmal<br />

v = Anzahl der verschiedenen Merkmalswerte<br />

xi = Merkmalsausprägung der i-ten Stelle<br />

hi = absolute Häufigkeit<br />

fi = relative Häufigkeit<br />

Hi = absolute Summenhäufigkeit<br />

Fi = relative Summenhäufigkeit<br />

HRi = absolute Resthäufigkeit<br />

FRi = relative Resthäufigkeit<br />

Formeln:<br />

Tabellarische Darstellung von Daten<br />

h1 + h2 + ... + hv = n ∑<br />

i=<br />

1<br />

f<br />

h i<br />

n<br />

i = ∑<br />

i=<br />

1<br />

v<br />

v<br />

h<br />

i<br />

i<br />

= n<br />

f<br />

= 1<br />

6


Häufigkeitsverteilung des Merkmals:<br />

Die tabellarische oder grafische Darstellung der geordneten Merkmalsausprägungen mit den<br />

ihnen zugeordneten absoluten oder relativen Häufigkeiten heißt Häufigkeitsverteilung des<br />

Merkmals.<br />

Häufigkeitstabelle:<br />

Laufindex (i)<br />

Merkmalsausprägung<br />

(xi)<br />

absolute Häufigkeit<br />

(hi)<br />

relative Häufigkeit<br />

(fi)<br />

1 x1 h1 f1<br />

2 x2 h2 f2<br />

3 x3 h3 f3<br />

.<br />

.<br />

.<br />

.<br />

.<br />

.<br />

n-1 xn-1 hn-1 fn-1<br />

n xn hn fn<br />

Laufindex (i) 1 2 ... n-1 n<br />

Merkmalsausprägung (xi) x1 x2 … xn-1 xn<br />

absolute Häufigkeit (hi) h1 h2 ... hn-1 hn<br />

relative Häufigkeit (fi) f1 f2 … fn-1 fn<br />

Aufgabe 1: Es ist die Anzahl der Kinder von den Beschäftigten einer Firma gegeben.<br />

xi 0 1 2 3 4<br />

hi 7 6 4 2 1<br />

a) Bestimmen Sie: Merkmalsträger, Merkmal, Merkmalsausprägungen und Merkmalswerte<br />

b) Erstellen Sie eine Häufigkeitstabelle mit den absoluten und relativen Häufigkeiten, sowie<br />

den absoluten und relativen Summen- und Resthäufigkeiten<br />

c) Erläutern Sie aus der Tabelle: x2 ; h2 ; h4 ; f3 ; H2 ; F4 ; HR3 und FR2<br />

Aufgabe 2: In einer Gaststätte wird bei 150 Gästen die Wartezeit (in Minuten) festgehalten,<br />

von dem Moment an, wo diese am Tisch Platz nehmen bis zu dem Zeitpunkt, wo ein Kellner<br />

an den Tisch kommt.<br />

Wartezeit 0 1 2 3 4 5 6 7 8 9 10 11 12<br />

Anzahl<br />

der Gäste<br />

0 3 9 18 30 24 21 12 9 3 6 9 6<br />

a) Bestimmen Sie Merkmalsträger, Merkmal, Merkmalsausprägungen und Merkmalswerte,<br />

b) erstellen Sie eine Häufigkeitstabelle mit den absoluten und relativen Häufigkeiten,<br />

sowie den absoluten und relativen Summen- und Resthäufigkeiten und<br />

c) interpretieren Sie die Häufigkeitstabelle.<br />

.<br />

.<br />

.<br />

.<br />

.<br />

.<br />

7


Klassierte Häufigkeitsverteilung<br />

Bei vielen Untersuchungen ist die Erfassung und Auszählung aller einzelnen Merkmalsausprägungen<br />

nicht sinnvoll oder nicht möglich, weil:<br />

• die Anzahl der Merkmalsausprägungen zu groß ist,<br />

• das Merkmal stetig ist, oder<br />

• die Übersichtlichkeit bei Darstellung und Aufbereitung verloren geht.<br />

(z.B.: Untersuchung der Einkommensverteilung. Hier werden die Einkommen nicht auf den<br />

Cent genau erfasst, sondern in Klassen zusammengefasst.)<br />

Klassierung:<br />

Die Merkmalsausprägungen werden in Klassen (Bereiche) zusammengefasst. Eine<br />

Klassierung (Klassenbildung) dient der anschaulichen Darstellung, wenn ein Merkmal sehr<br />

viele Merkmalsausprägungen besitzt. Da durch die Verdichtung der Merkmalsausprägungen<br />

zu Klassen Informationen verloren gehen, ist hier ein Kompromiss zu finden, zwischen dem<br />

Gewinn an Übersichtlichkeit und dem Verlust an Informationen. Die Entscheidung über<br />

Anzahl und Breite der Klassen ist am Untersuchungsziel auszurichten.<br />

Abkürzungen:<br />

j = Laufindex für die Klasse (Klassenindex), j = 1, ..., v<br />

xj u = Untergrenze der Klasse j<br />

xj o = Obergrenze der Klasse j<br />

xj * = Klassenmitte der klassierten Merkmalsausprägungen<br />

hj = absolute (einfache) Klassenhäufigkeit. Anzahl der Merkmalsträger mit einem Merkmalswert<br />

xi, der in die j-te Klasse fällt, also xj u ≤ xi < xj o<br />

Hj = absolute kumulierte Klassenhäufigkeit<br />

Klassenmitte:<br />

Die Klassenmitte (xj * ) repräsentiert im Allgemeinen die jeweilige Klasse bei der Auswertung<br />

des statistischen Datenmaterials.<br />

Klassenbreite:<br />

Die Differenz zweier aufeinander folgender Klassengrenzen (xj o – xj u ) heißt Klassenbreite.<br />

Für die eindeutige Zuordnung ist nur eine der Klassengrenzen mit zuzurechnen:<br />

also nicht: sondern: oder:<br />

10 bis 11 über 10 bis 11 10 bis unter 11<br />

11 bis 12 über 11 bis 12 11 bis unter 12<br />

12 bis 13 über 12 bis 13 12 bis unter 13<br />

Festlegung der Klassenbreite:<br />

Alle Klassenbreiten sollten gleich groß sein, sofern das zu behandelnde Problem dies zulässt.<br />

Fallen wie z.B. bei den Einkommen nur sehr wenige Beobachtungswerte in die oberen<br />

Klassen, können diese auch größer ausfallen. Die Festlegung der Klassenbreite (xj o – xj u )<br />

sollte möglichst so erfolgen, dass der Wert in der Klassenmitte ein typischer Stellvertreter für<br />

die ganze Klasse ist, denn es wird im Allgemeinen davon ausgegangen, dass sich alle<br />

Beobachtungswerte einer Klasse gleichmäßig über diese verteilen (Gleichverteilungsannahme).<br />

8


offene Randklassen:<br />

Bei offenen Randklassen gibt es drei Möglichkeiten, die Klassenmitte zu bestimmen:<br />

• der Wert, der sich bei gleichen Abständen aller Klassenmitten ergibt,<br />

• einen geschätzten, bzw. vermuteten Wert, oder<br />

• den sich aus den Beobachtungswerten berechneten tatsächlichen Mittelwert der Klasse.<br />

Beispiel:<br />

Klassen:<br />

u<br />

o<br />

≤ x x<br />

j j j<br />

x <<br />

Klassenmitten:<br />

x<br />

*<br />

j<br />

200 bis<br />

unter 300<br />

300 bis<br />

unter 400<br />

400 bis<br />

unter 500<br />

500 bis<br />

unter 600<br />

600 und<br />

mehr<br />

250 350 450 550 650<br />

Für die letzte Klassenmitte kann der Wert 650 verwendet werden (gleicher Abstand<br />

entsprechend den anderen Klassenmitten), ein Wert geschätzt oder (wenn möglich) der<br />

tatsächliche berechnet werden.<br />

Näherungsweise Häufigkeitsberechnungen:<br />

Liegen bei einer klassierten Häufigkeitsverteilung die Urwerte nicht mehr vor, dann können<br />

den Merkmalswerten, unter der Annahme einer Gleichverteilung innerhalb der jeweiligen<br />

Klassen, die Häufigkeiten näherungsweise mittels linearer Interpolation zugeordnet werden.<br />

Aufgabe 3: 140 Kunden haben Rechnungsbeträge von unter 120,00 Euro. Ergänzen Sie die<br />

Häufigkeitstabelle und erläutern Sie die folgenden Werte: x2 * ; h2 ; f3 ; H2 ; F4 ; HR3 ; FR2 und<br />

F(75).<br />

j<br />

Rechnungsbetrag (€)<br />

von … bis unter …<br />

0 – 20 10<br />

20 – 40 20<br />

40 – 60 60<br />

60 – 80 35<br />

80 – 100 10<br />

100 – 120 5<br />

(relative Werte in Prozent)<br />

*<br />

x j hj fj Hj Fj HRj FRj<br />

9


Mehrdimensionale Häufigkeitsverteilung<br />

Tabelle:<br />

Eine Tabelle dient der systematischen und übersichtlichen Zusammenstellung von Daten.<br />

xi<br />

yk<br />

Vorspalte<br />

v<br />

∑ hik<br />

i = 1<br />

Tabellenkopf<br />

Tabellenfeld Tabellenfeld Tabellenfeld<br />

Tabellenfeld Tabellenfeld Tabellenfeld<br />

Tabellenfeld<br />

w<br />

∑ hik<br />

k = 1<br />

Summen-<br />

spalte<br />

Summenzeile n<br />

Spalten<br />

Zeilen<br />

bis unter 25 Jahre 25 Jahre und älter Insgesamt<br />

m w m w<br />

(1)+(2) (4)+(5) (1)+(4) (2)+(5) (7)+(8)<br />

Sem. (1) (2) = (3) (4) (5) = (6) = (7) = (8) = (9)<br />

1<br />

2<br />

3<br />

4<br />

∑<br />

10


45<br />

40<br />

35<br />

30<br />

25<br />

20<br />

15<br />

10<br />

50<br />

45<br />

40<br />

35<br />

30<br />

25<br />

20<br />

15<br />

10<br />

5<br />

0<br />

5<br />

0<br />

100%<br />

90%<br />

80%<br />

70%<br />

60%<br />

50%<br />

40%<br />

30%<br />

20%<br />

10%<br />

0%<br />

Kreisdiagramm<br />

20<br />

30<br />

15<br />

Grafische Darstellung von Daten<br />

35<br />

40<br />

Säulendiagramm<br />

1 2 3 4 5<br />

1 2 3 4 5<br />

1 2 3 4 5<br />

Reihe3<br />

Reihe2<br />

Reihe1<br />

5<br />

4<br />

3<br />

2<br />

1<br />

4<br />

14%<br />

40<br />

35<br />

30<br />

25<br />

20<br />

15<br />

10<br />

5<br />

0<br />

3<br />

21%<br />

5<br />

11%<br />

Umsatz<br />

2<br />

25%<br />

1<br />

29%<br />

1 2 3 4 5<br />

Balkendiagramm<br />

0% 20% 40% 60% 80% 100%<br />

45<br />

40<br />

35<br />

30<br />

25<br />

20<br />

15<br />

10<br />

5<br />

0<br />

1 2 3 4 5<br />

1<br />

2<br />

3<br />

4<br />

5<br />

11


45<br />

40<br />

35<br />

30<br />

25<br />

20<br />

15<br />

10<br />

5<br />

0<br />

Anzahl<br />

Histogramm mit gleicher<br />

Klassenbreite<br />

Histogramm mit<br />

unterschiedlicher<br />

Klassenbreite und<br />

Polygonzug<br />

20<br />

15<br />

10<br />

5<br />

0<br />

30<br />

20<br />

10<br />

Treppenfunktion<br />

Reihe1<br />

Reihe2<br />

Reihe3<br />

Reihe4<br />

Reihe5<br />

0 1 2 3 4 5 6<br />

0<br />

Note<br />

Linien- / Kurvendiagramm<br />

1 2 3 4 5 6 7 8<br />

Reihe1<br />

Reihe2<br />

Reihe3<br />

1<br />

0,8<br />

0,6<br />

0,4<br />

0,2<br />

0<br />

30<br />

25<br />

20<br />

15<br />

10<br />

5<br />

Polygonzug<br />

Liniendiagramm (Summenpolygon)<br />

1 2 3 4 5 6 7<br />

Gebirge<br />

0<br />

Jahr 3<br />

1 2 3 4 5 6 7 8<br />

Jahr 1<br />

Jahr 1<br />

Jahr 2<br />

Jahr 3<br />

12


Aufgabe 4:<br />

Ein Unternehmer hat noch 245 offene Forderungen in unterschiedlicher Höhe, wie in der<br />

folgenden Tabelle dargestellt:<br />

a) Erstellen Sie dazu ein Histogramm,<br />

b) zeichnen Sie die relative Summenhäufigkeit in ein Diagramm,<br />

c) bestimmen Sie die relative Summenhäufigkeit für Forderungen bis unter 550,00 € und<br />

d) bestimmen Sie den Forderungswert in Euro, auf den bis zu 87,76 % der Forderungen<br />

entfallen.<br />

j<br />

1<br />

2<br />

3<br />

4<br />

5<br />

6<br />

Forderungen (in Euro)<br />

von ... bis unter ...<br />

50 100<br />

100 200<br />

200 300<br />

300 400<br />

400 600<br />

600 1000<br />

(relative Werte in Prozent)<br />

hj dj Hj Fj<br />

15<br />

50<br />

80<br />

40<br />

40<br />

20<br />

13


Aufgaben zur Wiederholung:<br />

1) Beschreiben Sie in groben Zügen die einzelnen Phasen der statistischen Untersuchung und<br />

ihre jeweiligen Aufgaben.<br />

2) Erläutern Sie die Bedeutung der Konkretisierung des Untersuchungszieles.<br />

3) Erklären Sie den Unterschied zwischen Primär- und Sekundärforschung. Worin liegen<br />

jeweils die Vor- und Nachteile?<br />

4) Erklären Sie den Unterschied zwischen Befragung und Beobachtung. Worin liegen jeweils<br />

die Vor- und Nachteile?<br />

5) Erläutern Sie das Problem der grafischen Verzerrungen und gehen Sie auch auf andere<br />

Manipulationen ein.<br />

6) Erläutern Sie die folgenden Begriffe: Merkmalsträger, statistische Einheit, Grundgesamtheit,<br />

statistische Masse, Merkmal, Merkmalsausprägung, Merkmalswert, Beobachtungswert,<br />

Merkmalsarten, qualitatives und quantitatives Merkmal, diskretes und stetiges<br />

Merkmal, häufbares und nicht häufbares Merkmal.<br />

7) Erläutern Sie die Begriffe „Vollerhebung, Totalerhebung, Stichprobe und repräsentative<br />

Stichprobe“. Erklären Sie den Unterschied zwischen Voll- und Teilerhebung und<br />

beschreiben Sie jeweils deren Vor- und Nachteile.<br />

8) Beschreiben Sie die folgenden Auswahlverfahren: willkürliche Auswahl, Zufallsauswahl<br />

und bewusste Auswahl.<br />

9) Erläutern Sie die verschiedenen Skalen (allgemein und anhand eines selbst gewählten<br />

Beispiels) und erläutern Sie die Skalentransformation.<br />

10) Beschreiben Sie den Aufbau einer Häufigkeitstabelle und erklären Sie den Unterschied<br />

zwischen der einfachen und der kumulierten Häufigkeitsverteilung.<br />

11) Wann ist es erforderlich, eine klassierte Häufigkeitsverteilung zu erstellen. Welcher<br />

Zielkonflikt ist bei der Klassenbildung zu lösen?<br />

12) Erläutern Sie die verschiedenen Diagrammarten und deren Anwendbarkeit.<br />

14


Aufgaben:<br />

1. Geben Sie für die folgenden Fragestellungen Merkmalsträger, Merkmal und Merkmalsausprägungen<br />

an:<br />

a) Bei einer Befragung von Studenten wird u.a. das Fachsemester erfragt.<br />

b) Es soll die Qualität einer Lieferung Tomaten untersucht werden.<br />

c) Es soll der Kakaogehalt einer Schokoladensorte untersucht werden.<br />

2. Welche der folgenden Merkmale sind diskret und welche sind stetig?<br />

a) Füllmenge von Cola-Flaschen.<br />

b) Anzahl der Orangen in einer Kiste.<br />

c) Einkommen von Managern.<br />

d) Temperatur in einem Gefrierschrank.<br />

e) monatlicher Stromverbrauch<br />

f) Sitzplatzkapazität in einem Restaurant<br />

g) Anzahl der Mitarbeiter in einem Betrieb<br />

3. Geben Sie zu den folgenden Merkmalen jeweils eine geeignete Messskala an und<br />

begründen Sie Ihre Entscheidung:<br />

a) Hobby von Studenten<br />

b) Dienstgrad von Beamten<br />

c) Benzinverbrauch einer Pkws<br />

d) Noten einer Prüfung<br />

e) Uhrzeit<br />

f) Hotelklassifizierung, gemessen in Sternen<br />

g) Bundesländer<br />

h) Anzahl der Gäste in einem Restaurant<br />

4. Geben Sie zu den folgenden Merkmalen an, auf welcher Skala die Ausprägungen geordnet<br />

werden können und ob sie häufbar sind oder nicht:<br />

a) Religionszugehörigkeit<br />

b) Ursache von Verkehrsunfällen<br />

c) Güteklasse von Hotels<br />

d) Körpergewicht von Studenten<br />

e) Kinderzahl von Personen<br />

f) Geburtsdatum<br />

g) Hobby von Studenten<br />

h) Berufsausbildungen<br />

15


5. In einer Prüfung haben 16 Studenten die folgenden Noten erzielt:<br />

3, 1, 2, 2, 1, 4, 5, 4, 3, 5, 2, 5, 6, 2, 3, 2<br />

a) Bestimmen Sie die Häufigkeitsverteilung.<br />

b) Stellen Sie die Häufigkeitsverteilung grafisch dar.<br />

c) Bestimmen Sie die Summenhäufigkeitsverteilung.<br />

d) Stellen Sie die Summenhäufigkeitsverteilung grafisch dar.<br />

6. Fünfzig Studenten wurden danach befragt, wie oft Sie in der vergangenen Woche im Bistro<br />

waren. Die folgenden Urdaten wurden erhoben:<br />

0, 1, 0, 5, 4, 3, 1, 7, 9, 3, 2, 1, 0, 4, 2, 6, 7, 5, 0, 1, 4, 1, 1, 3, 4, 8, 6, 2,<br />

6, 1, 0, 0, 1, 4, 3, 1, 2, 6, 3, 5, 4, 7, 4, 2, 3, 1, 1, 5, 6, 3<br />

a) Bestimmen Sie die absoluten und relativen Häufigkeiten.<br />

b) Bestimmen Sie die absoluten und relativen Summenhäufigkeiten.<br />

c) Bestimmen Sie die absoluten und relativen Resthäufigkeiten.<br />

d) Zeichnen Sie die Häufigkeitsverteilung als Säulendiagramm.<br />

e) Zeichnen Sie die Summenhäufigkeitsverteilung.<br />

f) Zeichnen Sie die Verteilung der Resthäufigkeiten.<br />

7. Zwanzig Teilnehmer einer Klausur haben folgende Punktzahlen erzielt:<br />

25, 74, 87, 43, 60, 72, 56, 36, 75, 49, 83, 52, 71, 67, 78, 50, 76, 64, 77, 69<br />

a) Bestimmen Sie für die erzielten Punktzahlen die Häufigkeitsverteilung und die<br />

Summenhäufigkeitsverteilung mit den Klassen:<br />

von ... bis unter ; 20 – 40, 40 – 60, 60 – 80, 80 – 100.<br />

b) Stellen Sie die Häufigkeitsverteilung als Histogramm dar und zeichnen Sie den<br />

Polygonzug.<br />

c) Stellen Sie die Summenhäufigkeitsverteilung grafisch dar.<br />

16


8. Es liegt Ihnen die folgende relative Summenhäufigkeitsverteilung einer Unternehmung mit<br />

2000 Mitarbeitern vor:<br />

Fj 100<br />

90<br />

80<br />

70<br />

60<br />

50<br />

40<br />

30<br />

20<br />

10<br />

0<br />

1000<br />

0<br />

1250<br />

3<br />

1500<br />

8<br />

1750<br />

15<br />

Bruttomonatseinkommen<br />

2000<br />

25<br />

2250<br />

35<br />

2500<br />

50<br />

2750<br />

62<br />

3000<br />

72<br />

3250<br />

80<br />

3500<br />

85<br />

3750<br />

90<br />

4000<br />

93<br />

4250<br />

96<br />

4500<br />

98 99 100<br />

a) Wie viele Mitarbeiter (absolut und prozentual) verdienen: unter 2.000,00 €, über<br />

3.250,00 €, weniger als 2.750,00 €, nicht mehr als 4.500,00 €, mindestens 1.250,00 €,<br />

höchstens 3.000,00 €, zwischen 2.250,00 € und 4.250,00 € ?<br />

b) Wie viel Euro verdienen: bis zu 15 % der Mitarbeiter die am wenigsten verdienen,<br />

die 10 % der am meisten Verdienenden, ein Viertel der unteren Einkommensbezieher,<br />

die besserverdienende Hälfte mindestens, 4/5 der Geringverdiener höchstens ?<br />

c) Wie viel Prozent der Mitarbeiter verdienen höchstens 2.400,00 € ?<br />

d) Wie viel Euro verdienen höchsten 70 % der Mitarbeiter ?<br />

e) Wie viel Prozent der Mitarbeiter verdienen mindestens 3.100,00 € ?<br />

f) Wie viel Euro verdient das obere Viertel der Mitarbeiter mindestens?<br />

g) Erstellen Sie eine Häufigkeitstabelle mit den absoluten und relativen Häufigkeiten,<br />

Summen- und Resthäufigkeiten.<br />

4750<br />

5000<br />

x j<br />

17


9. Ein Student arbeitet in seiner Freizeit auf<br />

einer Hühnerfarm. Um die<br />

Legefreundlichkeit der Hennen zu ermitteln,<br />

zeichnet er die relative<br />

Summenhäufigkeitsverteilung für die in einer<br />

Woche von den einzelnen Hühnern gelegten<br />

Eier. Welche Fehler hat er gemacht?<br />

10. Gegeben ist die folgende Häufigkeitsverteilung:<br />

prozentualer Anteil<br />

120<br />

100<br />

80<br />

60<br />

40<br />

20<br />

0<br />

-1 0 1 2 3 4 5 6 7<br />

Anzahl Eier<br />

xj u ≤ x < xj o 10 – 20 20 – 30 30 – 60 60 – 80<br />

hj 30 30 30 30<br />

a) Bestimmen Sie die Summenhäufigkeitsverteilung.<br />

b) Stellen Sie die absolute Häufigkeits- und Summenhäufigkeitsverteilung grafisch dar.<br />

c) Zeichnen Sie den Polygonzug über die jeweiligen Klassenmitten.<br />

11. Die folgende Grafik gibt die relative<br />

Summenhäufigkeit eines Merkmals an.<br />

a) Zeichnen Sie den Polygonzug der relativen<br />

Häufigkeiten über die jeweiligen<br />

Klassenmitten, ohne diesen mit der x-Achse<br />

zu verbinden und<br />

b) ergänzen Sie den Polygonzug mit der<br />

Darstellung eines Histogramms.<br />

12. Gegeben sind die folgenden Beobachtungswerte eines diskreten Merkmals:<br />

5, 3, 1, 3, 3, 2, 1, 5, 4, 1, 5, 4, 2, 4, 2, 1, 4, 5, 1, 2<br />

a) Geben Sie die Häufigkeitsverteilung für die absoluten und für die relativen<br />

Häufigkeiten an. Bestimmen Sie die Summenhäufigkeitsverteilung für die relativen<br />

Häufigkeiten.<br />

b) Stellen Sie die Verteilung der relativen Häufigkeiten und der relativen Summenhäufigkeiten<br />

grafisch dar.<br />

c) Rekonstruieren Sie aus Ihrer relativen Summenhäufigkeitsverteilung die Häufigkeitstabelle.<br />

F j<br />

1<br />

0,8<br />

0,6<br />

0,4<br />

0,2<br />

0<br />

0 2 4 6 8 10 12<br />

x j<br />

18


Parameter und Maßzahlen<br />

Die typischen Eigenschaften einer Häufigkeitsverteilung können mit Hilfe von Kenngrößen<br />

(Parametern) oder Maßzahlen beschrieben werden, um so viele Einzelinformationen zu<br />

wenigen, aussagekräftigen Größen zu verdichten und damit einen raschen Einblick in die<br />

typischen Eigenschaften der Häufigkeitsverteilung zu erhalten und den Vergleich mit anderen<br />

Gesamtheiten zu ermöglichen.<br />

Lageparameter:<br />

• Modus (x¯ D)<br />

• Median (x¯ Z) und Quantile (Q)<br />

• arithmetisches Mittel ( x¯ )<br />

• harmonisches Mittel (x¯ H)<br />

• geometrisches Mittel (x¯ G)<br />

Konzentrationsmaße:<br />

• absolute und relative Konzentrationsmessung<br />

• Lorenzkurve und Gini-Koeffizient (GK)<br />

Lageparameter<br />

Streuungsmaße:<br />

• Spannweite (R) und Quartilsabstand<br />

• mittlere absolute Abweichung (d)<br />

• Varianz (s²)<br />

• Standardabweichung (s)<br />

• Variationskoeffizient (V)<br />

Modus:<br />

Der Modus (Modalwert, häufigster Wert, dichtester Wert) ist derjenige Merkmalswert, der am<br />

häufigsten beobachtet wurde.<br />

Aufgabe: Die folgenden Häufigkeitsverteilungen zeigen die geleisteten Überstunden (xi) von<br />

zwei Unternehmen. Bestimmen Sie den Modus.<br />

Unternehmen A:<br />

Unternehmen B:<br />

xi 0 1 2 3 4 12<br />

hi 3 10 4 3 2 1<br />

xi 0 1 2 3 4<br />

hi 3 5 4 4 4<br />

19


Median:<br />

Der Median (Zentralwert) ist derjenige Merkmalswert, dessen Merkmalsträger in der<br />

Rangordnung aller Merkmalsträger genau die mittlere Position einnimmt.<br />

Aufgabe 1: Für 23 Beschäftigte einer Firma wurden die Fehlzeiten (in Tagen) für das letzte<br />

Jahr berechnet. Ermitteln Sie den Median.<br />

xi 0 3 4 7 8 9 12 13 59<br />

hi 3 1 2 3 5 4 2 2 1<br />

Hi 3 4 6 9 14 18 20 22 23<br />

Aufgabe 2: Für 20 Beschäftigte einer Firma wurden die Fehlzeiten (in Tagen) für das letzte<br />

Jahr berechnet. Ermitteln Sie den Median.<br />

xi 0 2 5 6 7 11 12 14<br />

hi 4 2 2 2 4 3 2 1<br />

Hi 4 6 8 10 14 17 19 20<br />

20


Aufgabe 3: Berechnen Sie den Median aus der folgenden, klassierten Verteilung.<br />

j<br />

Forderungen (in Euro)<br />

von ... bis unter ...<br />

hj Hj fj Fj<br />

1 50 100 15 15 0,0612 0,0612<br />

2 100 200 50 65 0,2041 0,2653<br />

3 200 300 80 145 0,3265 0,5918<br />

4 300 400 40 185 0,1633 0,7551<br />

5 400 600 40 225 0,1633 0,9184<br />

6 600 1000 20 245 0,0816 1<br />

Quantile:<br />

Quantile sind eine Sonderform des Median, die eine Gesamtheit in zwei Teile zerlegen,<br />

jedoch nicht zwangsläufig in der Mitte (dem 50 % Wert), da bei Untersuchungen häufig auch<br />

Randwerte von Interesse sind, z.B. 25 % oder 95 %.<br />

Spezielle Quantile:<br />

Art des Quantils Symbolik Anzahl der Intervalle<br />

Perzentile x0,01 ; x0,02 ; … ; x0,99<br />

Dezile x0,1 ; x0,2 ; … ; x0,9<br />

Quintile x0,2 ; x0,4 ; x0,6 ; x0,8<br />

Quartile x0,25 ; x0,5 ; x0,75<br />

Terzile x0,33 ; x0,67<br />

Aufgabe 1: Für 100 Beschäftigte einer Firma wurden die Fehlzeiten (in Tagen) für das letzte<br />

Jahr berechnet. Bestimmen Sie die drei Quartile.<br />

xi 0 1 2 3 4 5 6 7 8<br />

hi ; fi 10 15 25 15 10 5 10 5 5<br />

Hi ; Fi<br />

HRi ; FRi<br />

21


Aufgabe 2: Bestimmen Sie a) das 1. Dezil und b) das 4. Quintil.<br />

xi 0 1 2 3 4 5 6 7 8<br />

hi ; fi 10 15 25 15 10 5 10 5 5<br />

Hi ; Fi 10 25 50 65 75 80 90 95 100<br />

HRi ; FRi 90 75 50 35 25 20 10 5 0<br />

Aufgabe 3: Berechnen Sie das 3. Quartil aus der klassierten Verteilung:<br />

j<br />

Forderungen (in Euro)<br />

von ... bis unter ...<br />

hj Hj fj Fj<br />

1 50 100 15 15 0,0612 0,0612<br />

2 100 200 50 65 0,2041 0,2653<br />

3 200 300 80 145 0,3265 0,5918<br />

4 300 400 40 185 0,1633 0,7551<br />

5 400 600 40 225 0,1633 0,9184<br />

6 600 1000 20 245 0,0816 1<br />

Aufgabe 4:<br />

Bestimmen Sie a) das 1. Quartil und b) das 3. Quintil der Forderungen.<br />

22


arithmetisches Mittel:<br />

Das arithmetische Mittel ( x¯ ) ist ein Durchschnittswert, bei dem die Summe aller<br />

beobachteten Merkmalswerte auf die Anzahl der Merkmalsträger bezogen wird. Das<br />

arithmetische Mittel setzt ein metrisches Skalenniveau voraus.<br />

Aufgabe 1: Es soll der Durchschnittspreis für eine Tasse Kaffee ermittelt werden. Die fünf<br />

Cafes in der Region nehmen pro Tasse Kaffee die folgenden Preise:<br />

Cafe 1 2 3 4 5<br />

Preis (in Euro) 2,50 2,10 1,80 2,30 2,00<br />

Bei dem gewogenen arithmetischen Mittel werden die Merkmalsausprägungen mit<br />

Häufigkeiten gewichtet.<br />

Aufgabe 2: Ein Urlauber kauft im Laufe seiner Reise 20 Tassen Kaffee in fünf verschiedenen<br />

Cafes der Region. Es soll der Durchschnittspreis ermittelt werden, den der Urlauber pro Tasse<br />

Kaffee bezahlt hat:<br />

Cafe 1 2 3 4 5 ∑<br />

Preis (in Euro) 2,50 2,10 1,80 2,30 2,00 -<br />

Anzahl (in Tassen) 5 3 2 4 6 20<br />

Aufgabe 3: In einem Dorf mit 50 Erwerbstätigen sind 49 Arbeiter mit einem monatlichen<br />

Nettoeinkommen von je 2.000,00 € und ein Millionär mit einem monatlichen Nettoeinkommen<br />

von 102.000,00 €. Ermitteln Sie das durchschnittliche Einkommen der Erwerbstätigen<br />

und beurteilen Sie das Ergebnis.<br />

Für klassierte Häufigkeitsverteilungen kann das arithmetische Mittel nur näherungsweise<br />

bestimmt werden. Anstelle der Merkmalswerte xi werden dann die Klassenmitten xj *<br />

verwendet. Dabei wird unterstellt, dass innerhalb jeder Klasse eine Gleich- oder symmetrische<br />

Verteilung vorliegt.<br />

23


harmonisches Mittel:<br />

Bei dem harmonischen Mittel (x¯ H) werden die relativen Entfernungen berechnet. Dazu<br />

müssen aus den Merkmalswerten Quotienten gebildet werden. Bei konstanter Zählergröße<br />

und variabler Nennergröße muss das harmonische Mittel angewendet werden. Allgemein:<br />

Aufgabe 1: Ein Spediteur fährt 150 km um eine Ware auszuliefern. Auf dem Hinweg fährt er<br />

150 km/h. Auf dem Rückweg kann er aufgrund eines Staus nur 50 km/h fahren. Wie hoch war<br />

die durchschnittliche Geschwindigkeit?<br />

Aufgabe 2: Der Spediteur tankt auf seiner Fahrt zweimal. Beim ersten Mal<br />

20 Liter zum Preis von 1,40 €/l und beim zweiten Mal 30 Liter zum Preis von 1,50 €/l. Wie<br />

groß ist der mittlere Benzinpreis?<br />

Aufgabe 3: Der Spediteur tankt auf seiner Fahrt dreimal die gleiche Menge Benzin. Beim<br />

ersten Mal zum Preis von 1,40 €/l und beim zweiten und dritten Mal zum Preis von 1,70 €/l.<br />

a) Wie viel Euro beträgt der mittlere Benzinpreis pro Liter und b) wie groß ist der mittlere<br />

Benzinpreis, wenn er zu den angegebenen Preisen jeweils für den gleichen Geldbetrag tankt?<br />

Aufgabe 4:<br />

a) Ein Gastwirt kauft im Großmarkt jeweils 10 kg Schweine- und Rindfleisch. Das Schweinefleisch<br />

kostet 20,00 €/kg und das Rindfleisch 22,00 €/kg. Berechnen Sie den Durchschnittspreis<br />

für ein Kilogramm Fleisch.<br />

b) Ein Gastwirt kauft im Großmarkt Fleisch für 420,00 €, davon sind 200,00 € für Schweinefleisch<br />

und 220,00 € für Rindfleisch. Das Schweinefleisch kostet 20,00 €/kg und das Rindfleisch<br />

22,00 €/kg. Berechnen Sie den Durchschnittspreis für ein Kilogramm Fleisch.<br />

Aufgabe 5: Der Spediteur fährt pro Tag 8 Stunden. Am ersten Tag schafft er durchschnittlich<br />

150 km/h und am 2. Tag 50 km/h. Welche Strecke hat er an den beiden Tagen<br />

durchschnittlich pro Stunde zurückgelegt?<br />

Aufgabe 6: Zum reinigen einer Etage benötigt eine Putzfrau 3 Stunden, während eine andere,<br />

routiniertere Putzfrau die gleiche Etage auch in 2 Stunden putzen kann. Wie lange dauert die<br />

Reinigung der Etage, wenn beide Putzfrauen zusammen arbeiten?<br />

24


geometrisches Mittel:<br />

Das geometrische Mittel ( x¯ G ) ist der Wert, der mehrere aufeinanderfolgende Vervielfachungen<br />

einer Größe als durchschnittliche Vervielfachung wiedergibt.<br />

Aufgabe 1: Die Gewinnentwicklung der vergangenen 5 Jahren stellt sich für eine<br />

Unternehmung wie folgt dar. Berechnen Sie die durchschnittliche Gewinnsteigerung pro Jahr.<br />

Jahr 0 1 2 3 4 5<br />

Gewinn (in €) 120.000 138.000 165.600 157.320 188.784 235.980<br />

Bei dem gewogenen geometrischen Mittel werden die Wachstumsfaktoren hoch deren<br />

Häufigkeiten gewichtet.<br />

Aufgabe 2: Ein Kapital von 1.200,00 € wird für sieben Jahre auf ein Sparbuch eingezahlt. In<br />

den ersten beiden Jahren verzinst sich das Kapital mit 3 % p.a., danach steigt der Zinssatz für<br />

4 Jahre auf 3,5 % p.a. und im letzten Jahr auf 4 % p.a. Wie hoch ist die durchschnittliche<br />

Verzinsung?<br />

25


Aufgaben<br />

1. Geben Sie zu den folgenden Fragestellungen einen geeigneten Mittelwert an:<br />

a) Aus Schulnoten verschiedener Fächer soll eine Durchschnittsnote ermittelt werden.<br />

b) Es ist das Durchschnittsgewicht von Personen zu ermitteln.<br />

c) Ein Pkw fährt auf Teilstrecken einer Route verschiedene Geschwindigkeiten. Es soll die<br />

Durchschnittsgeschwindigkeit ermittelt werden.<br />

d) An verschiedenen Fleischstücken soll der Gewichtsverlust durch das Braten ermittelt<br />

werden.<br />

2. Elf Studenten nehmen an einem Elfmeterschießen teil. Sie erzielen die folgenden<br />

Trefferzahlen bei 10 Schuss: 4, 6, 3, 1, 2, 8, 4, 5, 2, 0, 2. Bestimmen Sie a) den Zentralwert,<br />

b) die Quartile und c) das arithmetische Mittel.<br />

3. Bei einer Untersuchung über den täglichen Wasserverbrauch (in l pro Tag) von privaten<br />

Haushalten in einer Großstadt ergab sich die folgende Häufigkeitsverteilung:<br />

xj 0 bis 200 über 200 bis 400 über 400 bis 600 über 600 bis 1000<br />

fj 0,2 0,5 0,2 0,1<br />

Bestimmen Sie a) den Zentralwert und b) das arithmetische Mittel.<br />

4. Die Produktion an Kartoffeln hat sich in einer Region in den Jahren 2007 bis 2010 wie<br />

folgt gegenüber dem Vorjahr verändert:<br />

Jahr 2007 2008 2009 2010<br />

Änderung + 20 % + 40 % + 10 % – 30 %<br />

Wie groß ist die durchschnittliche Änderungsrate?<br />

5. Für die Kaufkraft einer Währung wurden für 6 aufeinander folgende Jahre nachstehende<br />

Werte ermittelt: 100; 95; 85; 80; 78; 70. Bestimmen Sie den durchschnittlichen prozentualen,<br />

jährlichen Kaufkraftschwund.<br />

6. Ein Pkw legt vier gleichlange Teilstrecken einer Gesamtstrecke mit den Geschwindigkeiten<br />

40 km/h, 50 km/h, 80 km/h und 100 km/h zurück. Durch welche konstante Geschwindigkeit<br />

hätte er die Gesamtstrecke in der gleichen Zeit bewältigt?<br />

7. Ein Privatanleger kauft 10 Aktien zu je 100,00 €. Einen Monat später kauft er noch einmal<br />

15 Aktien zum Preis von 150 € pro Aktie. Ermitteln Sie den Durchschnittspreis pro Aktie.<br />

8. Ein Privatanleger kauft für 1.000,00 € Aktien der Firma X AG zum Stückpreis von<br />

100,00 €. Einen Monat später kauft es noch einmal für 2.250,00 € Aktien der gleichen Firma<br />

zum Stückpreis von 150,00 € pro Aktie. Ermitteln Sie den Durchschnittspreis pro Aktie.<br />

26


9. Bei zwei Umfragen unter Studenten haben sich einmal 60 % von 100 Hörern einer<br />

Vorlesung und zum anderen 38 % von 1000 vor der Mensa befragten Studenten für die<br />

Abschaffung der <strong>Statistik</strong> ausgesprochen. Wie viel Prozent der Befragten haben sich im<br />

Durchschnitt für die Abschaffung der <strong>Statistik</strong> ausgesprochen?<br />

10. Ein Reisender braucht für das erste Viertel einer Strecke von 1.000 km<br />

2 Stunden. Für die folgende Teilstrecke, die genau halb so lang wie die Gesamtstrecke ist,<br />

braucht er 5 Stunde und für den Rest 3 Stunden. Welche Durchschnittsgeschwindigkeit ergibt<br />

sich für die Gesamtstrecke?<br />

11. Ein Pkw-Fahrer legt von einer Gesamtstrecke 1/6 mit einer Geschwindigkeit von<br />

100 km/h, 1/3 mit einer Geschwindigkeit von 80 km/h und 1/2 mit einer Geschwindigkeit von<br />

50 km/h zurück. Mit welcher (konstanten) Geschwindigkeit würde er die gesamte Strecke in<br />

der gleichen Zeit bewältigen?<br />

12. Von 11 getesteten Hundepensionen erhielten 5 Pensionen drei Sterne, 2 Pensionen zwei<br />

Sterne und 3 Pensionen einen Stern. Eine Pension erhielt keinen Stern. Wie viele Sterne<br />

haben die getesteten Pensionen im Durchschnitt erhalten?<br />

13. Der Erdölverbrauch eines Landes hat in zwei aufeinander folgenden Jahren um 20 % und<br />

um 38,75 % zugenommen. Um wie viel Prozent hat der Erdölverbrauch durchschnittlich pro<br />

Jahr zugenommen?<br />

14. Ein Amateurradrennfahrer fährt in der ersten Stunde 50 km/h. Danach eine Stunde und<br />

15 Minuten mit 40 km/h. Welche Durchschnittsgeschwindigkeit hat der Radrennfahrer<br />

erzielt?<br />

15. Jemand fährt 100 km, davon die 1. Hälfte mit 50 km/h und die 2. Hälfte mit 40 km/h.<br />

Berechnen Sie die Durchschnittsgeschwindigkeit.<br />

16. Ein Fliesenleger verlegt 20 m² Fliesen mit 5 m²/Stunde und 10 m² Fliesen mit<br />

4 m²/Stunde. Wie hoch ist die Durchschnittsleistung?<br />

17. Die Lohnsteigerungen in einem Betrieb betrugen in den letzten Jahren 7 %, 6,5 % und<br />

4,9 %. Gesucht ist die durchschnittliche Steigerungsrate.<br />

18. Eine Hausfrau kauft in drei aufeinander folgenden Monaten ein Waschmittel. Im ersten<br />

Monat für insgesamt 6,00 € bei einem Preis von 2,00 €/kg, im zweiten Monat für 9,00 € bei<br />

3,00 €/kg und im dritten Monat für 16,00 € bei 4,00 €/kg. Welchen durchschnittlichen Preis<br />

hat sie bezahlt?<br />

27


19. Auf einer Baustelle arbeiten 3 Maurer. Der erste benötigt für einen m² Mauerwerk<br />

60 Minuten, der zweite 10 Minuten und der dritte 30 Minuten. Wie lange benötigt ein Maurer<br />

durchschnittlich für einen m² Mauerwerk?<br />

20. Ein Restaurant importiert Froschschenkel aus drei verschiedenen Ländern für je<br />

6.000,00 €/Monat zu folgenden Einkaufspreisen: aus Land A für 100,00 €/kg, aus Land B für<br />

150,00 €/kg und aus Land C für 120,00 €/kg. Welchen durchschnittlichen Preis hat das<br />

Restaurant bezahlt?<br />

21. Zwei Produktionsbereiche eines Unternehmens haben im vergangenen Jahr die folgenden<br />

Umsätze erzielt: A: 2.000.000,00 € und B: 3.000.000,00 €. In diesem Jahr sind die Umsätze<br />

gestiegen; im Produktionsbereich A um 9 % und im Bereich B um 4 %. Wie hoch ist der<br />

durchschnittliche Zuwachs?<br />

22. Ein Autofahrer tankt auf einer Reise dreimal. Beim ersten Mal 20 l zum Preis von 1,20 €/l,<br />

beim zweiten Tankstop 30 l zum Preis von 1,60 €/l und beim dritten Mal 50 l zum Preis von<br />

1,50 €/l. a) Wie viel Euro beträgt der mittlere Benzinpreis pro Liter und b) wie groß ist der<br />

mittlere Benzinpreis, wenn er zu den angegebenen Preisen jeweils für den gleichen<br />

Geldbetrag tankt?<br />

23. In einer Firma beträgt das arithmetische Mittel aller dort gezahlten Gehälter 2.500,00 €.<br />

Aufgrund einer Vereinbarung wird das Gehalt aller leitenden Angestellten um 10 % erhöht.<br />

Auf diese Gruppe entfielen vor der Gehaltserhöhung 30 % der gesamten Gehaltssumme. Wie<br />

hoch ist das arithmetische Mittel aller Gehälter nach der Gehaltserhöhung?<br />

24. Bei einem Unternehmen ist der Umsatz bei Produkt A um 10 % auf 1.100.000,00 € und<br />

bei Produkt B um 15 % auf 575.000,00 € gewachsen. Wie hoch ist die mittlere Zuwachsrate.<br />

25. Zwei Firmen planen den Zusammenschluss. Die erste Firma verfügt über 200.000,00 €<br />

Eigenkapital, die zweite Firma über 300.000,00 € EK. Die Eigenkapitalquoten (EK/GK)<br />

betragen 23,8 % und 43,8 %. Wie groß wäre die Eigenkapitalquote bei einem Zusammenschluss?<br />

Lösungen:<br />

1. a) x Z ; b) x ; c) x H ; d) x<br />

2. a) x Z = 3 b1) x0,25 = 2<br />

b2) x0,75 = 5 c) x =3,36 Treffer<br />

xZ = 320 l /<br />

3. a) Tag<br />

b) x = 350 l / Tag<br />

4. x G = 6,65 %<br />

5. x G = 6,89 %<br />

6. xH = 59,<br />

259 km / h<br />

7. x = 130,00 € / Aktie<br />

8. x H = 130,00 € / Aktie<br />

9. x = 40 %<br />

10. x = 100 km / h<br />

11. x H = 63,158 km / h<br />

12. x Z = 2 Sterne<br />

13. x G = 29,03 %<br />

14. x = 44,44 km / h<br />

15. x H = 44,44 km / h<br />

16. x H = 4,62 m² / h<br />

17. x G = 6,13 %<br />

18. x H = 3,10 € / kg<br />

19. x H = 20 Min. / m²<br />

20. x H = 120 € / kg<br />

21. x = 6 %<br />

22. a) x = 1,47 € / l<br />

b) x H = 1,41 € / l<br />

23. x = 2.575,00 €<br />

24. x H = 11,67 %<br />

25. x H = 32,78 %<br />

28


Streuungsmaße<br />

Streuungsmaße (Streuungsparameter) haben die Aufgabe, die Streuung der Häufigkeitsverteilung<br />

in Form eines einzigen Wertes zu beschreiben. Das Merkmal muss dabei metrisch<br />

messbar sein.<br />

Spannweite:<br />

Die Spannweite (R) ist die Differenz aus dem größten und dem kleinsten beobachteten<br />

Merkmalswert. Es gilt: R = xn – x1<br />

Aufgabe:<br />

Ermitteln Sie die Spanne von Überstunden der Beschäftigten in einem Unternehmen<br />

Überstunde 0 1 2 3 4 12<br />

Beschäftigte 3 10 4 3 2 1<br />

- Die Spannweite ist ein einfaches Streuungsmaß, das lediglich die Länge des Streuungsbereiches<br />

angibt.<br />

- Wie im Beispiel ersichtlich, ist es ausreißerempfindlich.<br />

- Die Spannweite findet praktische Anwendung, wenn nur die Länge des Streuungsbereichs<br />

interessiert. bzw.<br />

- der höchste und tiefste Wert (z.B. bei Börsenkursen) von Bedeutung ist.<br />

- Werden nur die beiden Grenzwerte angegeben, ist auch die Anwendung bei ordinalem<br />

Datenmaterial zulässig (z.B. Noten, die Bereich von 2 bis 4 lagen).<br />

- Bei einer klassierten Häufigkeitsverteilung gilt:<br />

R =<br />

x − x<br />

o<br />

v<br />

u<br />

1<br />

29


Quartilsabstand:<br />

Der Quartilsabstand gibt an, in welchem Bereich sich die mittleren 50 % der geordneten<br />

Merkmalswerte befinden. Q = x¯ 0,75 – x¯ 0,25<br />

Beispiel: Fehlzeiten der Beschäftigten in einem Unternehmen<br />

xi 0 2 5 6 7 11 12 14<br />

hi 4 2 2 2 4 3 2 1<br />

Hi 4 6 8 10 14 17 19 20<br />

x¯ 0,25 = 2 ; x¯ 0,75 = 11 ; x¯ 0,75 – x¯ 0,25 = 11 – 2 = 9 Tage, d.h. die mittleren 50 % der<br />

Beschäftigten haben zwischen 2 und 11 Tagen gefehlt und streuen in einem Intervall mit der<br />

Länge 9 Tage.<br />

- Der Quartilsabstand ist geeignet, wenn der Kernbereich einer Häufigkeitsverteilung von<br />

Interesse ist (z.B. Einkommensverteilung).<br />

- Der Quartilsabstand ist nicht ausreißerempfindlich.<br />

- Analog zum Quartilsabstand lassen sich auch andere Quantile berechnen.<br />

Aufgabe 1:<br />

Berechnen Sie den Quartilsabstand von den Überstunden (xi) der Beschäftigten (hi)<br />

xi 0 1 2 3 4 12<br />

hi 3 10 4 3 2 1<br />

Hi 3 13 17 20 22 23<br />

Aufgabe 2: Berechnen Sie den Quartilsabstand der klassierten Häufigkeitsverteilung<br />

Forderungen (in Euro)<br />

j<br />

von ... bis unter ...<br />

hj Hj fj Fj<br />

1 50 100 15 15 0,0612 0,0612<br />

2 100 200 50 65 0,2041 0,2653<br />

3 200 300 80 145 0,3265 0,5918<br />

4 300 400 40 185 0,1633 0,7551<br />

5 400 600 40 225 0,1633 0,9184<br />

6 600 1000 20 245 0,0816 1<br />

30


Mittlere absolute Abweichung:<br />

Die „mittlere absolute Abweichung“ (d) ist die durchschnittliche Entfernung aller Merkmalswerte<br />

vom arithmetischen Mittel oder vom Median.<br />

Aufgabe 1: Berechnen und interpretieren Sie die mittlere absolute Abweichung von den<br />

Überstunden der Beschäftigten in einem Unternehmen<br />

i<br />

xi<br />

hi<br />

0 3<br />

1 10<br />

2 4<br />

3 3<br />

4 2<br />

12 1<br />

xi * hi x<br />

x i − x i − x * h i<br />

Aufgabe 2: Berechnen Sie die mittlere absolute Abweichung bei der folgenden klassierten<br />

Häufigkeitsverteilung:<br />

j<br />

Forderungen (in Euro)<br />

von ... bis unter ...<br />

50 100 15<br />

100 200 50<br />

200 300 80<br />

300 400 40<br />

400 600 40<br />

600 1000 20<br />

xj * hj xj * * hj x x<br />

*<br />

x − x * h<br />

*<br />

j − j<br />

j<br />

31


Varianz und Standardabweichung:<br />

Die Varianz (s²) ist die Summe der quadrierten Abweichungen der Merkmalswerte vom<br />

arithmetischen Mittel, dividiert durch die Anzahl der Merkmalsträger. Die Standardabweichung<br />

(s) ist die Quadratwurzel aus der Varianz.<br />

Aufgabe 1 : Berechnen Sie die Varianz und die Standardabweichung von den Überstunden<br />

der Beschäftigten in einem Unternehmen<br />

i xi hi xi * hi xi – x¯ ( xi – x¯ )² ( xi – x¯ )² * hi<br />

0 3<br />

1 10<br />

2 4<br />

3 3<br />

4 2<br />

12 1<br />

Aufgabe 2: Berechnen Sie die Varianz und die Standardabweichung der klassierten<br />

Forderungen einer Unternehmung.<br />

j<br />

Forderungen (in Euro)<br />

von ... bis unter ...<br />

50 100 15<br />

100 200 50<br />

200 300 80<br />

300 400 40<br />

400 600 40<br />

600 1000 20<br />

xj * hj xj * * hj (xj * – x¯ )² (xj * – x¯ )² * hj<br />

32


Variationskoeffizient:<br />

Der Variationskoeffizient (V) ist ein Quotient aus einem Streuungsparameter (Standardabweichung<br />

oder mittlere absolute Abweichung) und einem Lageparameter (arithmetischem<br />

Mittel oder Median). Er misst die relative Streuung der Merkmalswerte.<br />

Beispiel: Forderungen<br />

x¯ = 320,92 € s = 188,19 € 188,<br />

19<br />

V = * 100 = 58,<br />

64 %<br />

320,<br />

92<br />

oder:<br />

x¯ = 320,92 € d = 146,19 € 146,<br />

19<br />

V = * 100 = 45,<br />

55 % , d.h. die Forderungsbeträge<br />

320,<br />

92<br />

sind 45,55 % vom durchschnittlichen Forderungsbetrag 320,92 € entfernt. (Je nach verwendetem<br />

Lage- bzw. Streuungsmaß ist das Ergebnis entsprechend zu interpretieren.)<br />

Der Variationskoeffizient ist auch als relative Größe zum Vergleich der Streuung von<br />

Häufigkeitsverteilungen mit unterschiedlichen Mittelwerten geeignet, soweit diese die<br />

gleichen Maßeinheiten besitzen:<br />

Beispiel: Für zwei Güter (A und B) werden Preisuntersuchungen mit den folgenden<br />

Ergebnissen durchgeführt:<br />

2,<br />

80<br />

7,<br />

00<br />

x¯ A = 7,00 € dA = 2,80 € V = * 100 = 40 %<br />

20,<br />

40<br />

750,<br />

00<br />

x¯ B = 750,00 € dB = 20,40 € V = * 100 = 2,<br />

72 %<br />

Neben den relativen Streuungen der Güter A und B kann hier auch festgestellt werden, dass<br />

bei Gut A die durchschnittliche Abweichung 14,7-mal so groß ist, wie bei Gut B.<br />

33


Aufgaben:<br />

1. In 10 Gaststätten wurden die folgenden Preise für ein Glas Wasser (0,2 l) ermittelt: 1,40 ;<br />

1,60 ; 1,70 ; 1,50 ; 1,40 ; 1,80 ; 1,70 ; 1,60 ; 1,50 ; 1,80. Berechnen Sie die a) Spannweite,<br />

b) mittlere absolute Abweichung, c) Varianz, d) Standardabweichung und e) den Variationskoeffizienten<br />

auf Basis der mittleren absoluten Abweichung zum arithmetischen Mittel.<br />

2. Eine Befragung von Studenten nach den monatlichen Ausgaben für Bücher hat folgendes<br />

Ergebnis geliefert:<br />

Ausgaben 30 bis u. 40 40 bis u. 50 50 bis u. 60 60 bis u. 70 70 bis u. 80<br />

fj 0,1 0,2 0,2 0,4 0,1<br />

Berechnen Sie das arithmetische Mittel und die Varianz.<br />

3. Berechnen Sie für die folgende Verteilung die Standardabweichung:<br />

Klasse 10 bis unter 20 20 bis unter 30 30 bis unter 40 40 bis unter 50<br />

hj 12 23 20 5<br />

4. Die folgende Tabelle gibt die Körpergröße von 5 Kindern in cm und Zoll an, wobei der<br />

Einfachheit halber 1 Zoll = 2,5 cm gesetzt wurde.<br />

cm 120 130 125 130 135<br />

Zoll 48 52 50 52 54<br />

Berechnen Sie für beide Messreihen a) das arithmetische Mittel, b) die mittlere absolute<br />

Abweichung und c) den Variationskoeffizient.<br />

5. Eine Untersuchung des verfügbaren Einkommens von Studenten in den USA und in<br />

Deutschland ergab folgende Werte:<br />

USA: x¯ = 470,00 $ s = 160,00 $<br />

Deutschland: x¯ = 520,00 € s = 130,00 €<br />

Vergleichen Sie die relativen Streuungen miteinander.<br />

6. Bei einer Prüfung wurden von 11 Teilnehmern die folgenden Punktzahlen erzielt:<br />

7, 3, 4, 2, 8, 6, 5, 3, 7, 3, 7. Bestimmen Sie a) den Modus, b) den Zentralwert, c) das<br />

arithmetische Mittel, d) die Spannweite, e) die mittlere absolute Abweichung, f) die Varianz<br />

und g) die Standardabweichung.<br />

7. Ordnen Sie die Beobachtungswerte 10,3; 12,4; 11,3; 10,8; 12,1; 12,9; 13,5; 13,1; 10,4 und<br />

12,0 den folgenden Klassen zu: 10 bis unter 11; 11 bis unter 12; 12 bis unter 13; 13 bis unter<br />

14 und berechnen Sie a) das arithmetische Mittel und b) die Varianz für die klassierten Werte.<br />

34


8. Die folgende Häufigkeitsverteilung gibt das Trinkgeld von 10 Gästen wieder:<br />

xj (in €) 1,5 < xj ≤ 2,5 2,5 < xj ≤ 3,5 3,5 < xj ≤ 4,5 4,5 < xj ≤ 5,5<br />

hj 3 3 3 1<br />

Bestimmen Sie a) das arithmetische Mittel, b) die Spannweite und c) den Zentralwert.<br />

9. Bestimmen Sie für die Werte: 8, 6, 7, 6, 9, 11, 10, 7, 6, 10 die folgenden Parameter:<br />

a) Median, b) arithmetisches Mittel, c) mittlere absolute Abweichung, d) Varianz e) Standardabweichung<br />

und f) Variationskoeffizient.<br />

10. In zwei Betriebsrestaurants eines Caterers wird für den vergangenen Monat die Zahl der<br />

täglich verkauften Essen ermittelt:<br />

Berechnen Sie für beide Betriebsrestaurants die durchschnittlich pro Tag verkauften Essen<br />

und ermitteln Sie den Betrieb mit der gleichmäßigeren Auslastung.<br />

Lösungen:<br />

Betrieb A Betrieb B<br />

Anzahl<br />

Essen<br />

Anzahl<br />

Tage<br />

Essen Tage<br />

700 4 500 2<br />

800 7 600 4<br />

900 4 800 8<br />

1000 6 1000 10<br />

1100 9 1100 6<br />

2<br />

2<br />

1. a) R = 0,40 € ; b) x = 1,<br />

60 € ; d = 0,<br />

12 € ; c) s = 0,<br />

02 € ; d) s = 0,<br />

1414 € ; e) V = 7,<br />

5 %<br />

2. x = 57 € ; s² =136 €²<br />

3. s = 8,81<br />

4. a) x 1=<br />

128 cm ; x 2 = 51,2 Zoll ; b) d1 = 4,4 cm ; d2 = 1,76 Zoll ; c) V = 3,44 %<br />

5. V 34 %<br />

USA = ; V 25 %<br />

. Dt =<br />

6. a) x D = 3 u. 7 Punkte ; b) x Z = 5 ; c) x = 5 ; d) R = 6 ; e) d = 1,82 ; f) s² = 4 ; g) s = 2<br />

7. a) x = 12 b) s² =1,25<br />

8. a) x = 3,20 € ; b) R = 4,00 € ; c) x = 3,<br />

17 €<br />

Z<br />

9. a) x Z = 7,5 ; b) x = 8 ; c) d = 1,6 ; d) s² = 3,2 ; e) s = 1,79 ; f) V = 22,<br />

38 %<br />

10. x = 930 ; x A<br />

B = 880 ; dA = 130 ; dB = 168 ; VA = 13,98 % ; VB = 19,09 % Betrieb A<br />

35


Konzentrationsmessung<br />

Die Konzentrationsmessung ermittelt, welcher Anteil der Merkmalswertsumme (z.B. Einkommen)<br />

auf welchen Anteil (= relative Messung), bzw. auf welche Anzahl (= absolute<br />

Messung) der Merkmalsträger (z.B. Haushalte) entfällt.<br />

Aufgabe1a: Wert von 5.000 Lagerpositionen – Welcher Anteil des gesamten Lagerwertes<br />

entfällt auf welchen Anteil der Lagerpositionen?<br />

j<br />

Lagerwert (in €)<br />

von ... bis unter<br />

1 5<br />

5 15<br />

15 25<br />

25 50<br />

50 100<br />

100 395<br />

hj<br />

(Zahl der<br />

Positionen)<br />

2.000<br />

1.200<br />

800<br />

700<br />

200<br />

100<br />

fj<br />

Fj<br />

*<br />

x j<br />

hj ´<br />

(= *<br />

x j *hj)<br />

fj ´ Fj ´<br />

36


Lorenzkurve<br />

Die Lorenzkurve zeigt das Ausmaß der Konzentration in einer grafischen Darstellung.<br />

Besitzen alle Merkmalsträger denselben Merkmalswert, liegt keine Konzentration vor und die<br />

Lorenzkurve ist identisch mit der Gleichverteilungsgeraden. Je größer die Konzentration ist,<br />

desto größer ist die Fläche zwischen der Gleichverteilungsgeraden und der Lorenzkurve.<br />

Aufgabe 1b: Zeichnen Sie die Lorenzkurve<br />

0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 Fj<br />

Fj = Lagerposition, Fj´ = Lagerwert<br />

Gini-Koeffizient<br />

Der Gini-Koeffizient (GK) ist ein Maß für die Stärke der Konzentration. Je näher GK gegen<br />

Null geht, desto geringer ist die relative Konzentration, je näher GK gegen Eins geht, desto<br />

größer ist die relative Konzentration. Es gilt: 0 ≤ GK ≤ ( n − 1)<br />

/ n < 1 und F 0<br />

´<br />

Aufgabe 1c: Berechnen und interpretieren Sie den Gini-Koeffizienten<br />

0 =<br />

Fj´ 1<br />

0,9<br />

0,8<br />

0,7<br />

0,6<br />

0,5<br />

0,4<br />

0,3<br />

0,2<br />

0,1<br />

0<br />

37


Aufgaben:<br />

2. Berechnen und interpretieren Sie die absolute Konzentration für das obige Beispiel.<br />

3. Berechnen, zeichnen und interpretieren Sie die relative Konzentration<br />

j<br />

Zimmerpreise (€)<br />

von ...bis unter<br />

hj<br />

1 50 70 50<br />

2 70 90 44<br />

3 90 120 40<br />

4 120 150 38<br />

5 150 190 28<br />

4. Es liegt Ihnen die folgende relative Summenhäufigkeitsverteilung einer Unternehmung mit<br />

2000 Mitarbeitern vor. Berechnen, zeichnen und interpretieren Sie die relative Konzentration.<br />

Fj<br />

100<br />

90<br />

80<br />

70<br />

60<br />

50<br />

40<br />

30<br />

20<br />

10<br />

0<br />

1000<br />

0<br />

1250<br />

3<br />

1500<br />

8<br />

1750<br />

15<br />

Bruttomonatseinkommen<br />

2000<br />

25<br />

2250<br />

35<br />

2500<br />

50<br />

2750<br />

62<br />

3000<br />

72<br />

3250<br />

80<br />

3500<br />

85<br />

3750<br />

90<br />

4000<br />

93<br />

4250<br />

96<br />

4500<br />

98 99 100<br />

4750<br />

5000<br />

xj<br />

38


Abhängigkeit von Merkmalen<br />

Zwei Merkmale sind voneinander statistisch abhängig, wenn der Wert des einen Merkmals<br />

davon abhängt, welchen Wert das andere Merkmal besitzt. Im Falle der Unabhängigkeit<br />

müssen alle Beobachtungswerte den erwateten Werten aus der Randverteilung entsprechen.<br />

Beispiel: absolute Verteilung<br />

Geschlecht<br />

Farbe<br />

blau<br />

(k=1)<br />

grün<br />

(k=2)<br />

rot<br />

(k=3)<br />

weiblich (i=1) 750 450 300<br />

männlich (i=2) 250 150 100<br />

Summe (hk)<br />

Zusammenhang zwischen zwei Merkmalen<br />

Summe<br />

Kontingenzkoeffizient: Der Kontingenzkoeffizient (K) beschreibt die Stärke des Zusammenhangs<br />

zwischen zwei Merkmalen.<br />

Aufgabe: Die 400 Beschäftigten eines Betriebes wurden nach ihrer Einstellung zu einer<br />

unbezahlten Verlängerung der Mittagspause von bisher 30 Minuten auf 45 Minuten befragt.<br />

Von den 100 Beschäftigten in der Verwaltung waren 40 dafür und 32 dagegen. Die Restlichen<br />

waren unentschieden. In der Produktion stimmten 140 dafür und 88 dagegen. Überprüfen Sie,<br />

ob ein Zusammenhang zwischen dem Tätigkeitsbereich (Merkmal X) und der Einstellung zur<br />

Pausenregelung (Merkmal Y) besteht.<br />

Berechnung des Zusammenhangs:<br />

X<br />

Verwaltung<br />

Produktion<br />

∑<br />

Y<br />

positiv negativ unentschieden ∑<br />

(hi)<br />

39


Rangkorrelationskoeffizient<br />

Zur Messung der Stärke des Zusammenhangs von zwei Merkmalen, die mindestens ordinal<br />

skaliert sind, wird der Rangkorrelationskoeffizient (ρ) verwendet.<br />

Aufgabe: Es soll untersucht werden, ob ein Zusammenhang zwischen der Qualität von<br />

6 Champagnermarken (Merkmal x) und deren Verkaufspreisen (Merkmal y) besteht.<br />

These: „Je besser die Qualität, desto teurer der Champagner“<br />

i Qualitätsurteil (xi) Preis (yi) Rang (xi) Rang (yi) Di Di 2<br />

1 gut 20,10<br />

2 sehr gut 19,35<br />

3 befriedigend 21,20<br />

4 gut 20,99<br />

5 mangelhaft 19,80<br />

6 ausreichend 18,40<br />

• die Reihenfolge der Ränge richtet sich nach der These<br />

• bei gleichen Rängen wird das arithmetische Mittel verwendet<br />

• ρ =<br />

• der Wertebereich ist -1 ≤ ρ ≤ 1 und gibt die Richtung und die Stärke des Zusammenhangs<br />

an.<br />

• der Rangkorrelationskoeffizient prüft allein die Stärke der Gleich- oder Gegenläufigkeit<br />

der Rangordnungen<br />

40


Regressionsanalyse<br />

Die Regressionsanalyse beschreibt einen Zusammenhang durch eine mathematische Funktion,<br />

die sogenannte Regressionsfunktion. Um die Abstände zwischen den Merkmalswerten<br />

messen zu können, müssen die Merkmale metrisch skaliert sein.<br />

Das Streuungsdiagramm (Punktwolke) ergibt sich aus den beobachteten Wertkombinationen<br />

(xi,yi). Die Regressionsgerade beschreibt den durchschnittlichen Verlauf der Abhängigkeit der<br />

Merkmale x und y.<br />

Aufgabe: Es soll untersucht werden, ob ein Zusammenhang zwischen den Werbeausgaben<br />

(Merkmal x) und dem Umsatz (Merkmal y) besteht.<br />

i xi (in<br />

100 €)<br />

yi (in<br />

1.000 €)<br />

1 2 10<br />

2 4 14<br />

3 1 6<br />

4 3 8<br />

5 5 12<br />

∑ 15 50<br />

( x i − x)<br />

( yi<br />

− y)<br />

x − x)(<br />

y − y)<br />

( i<br />

i<br />

( x −<br />

i<br />

x)<br />

2<br />

( y −<br />

i<br />

y)<br />

2<br />

41


Aufgaben:<br />

1. Ein Hotelier möchte mittels Unabhängigkeitstest überprüfen, ob der Zusammenhang<br />

zwischen den Umsätzen in seinem Biergarten und der Zimmerauslastung in seinem Hotel als<br />

statistisch signifikant angesehen werden kann. Aus den vergangenen 100 Tagen liegen die<br />

folgenden Daten vor:<br />

Umsätze<br />

bis 1500,- € / Tag über 1500,- € / Tag<br />

Zimmerauslastung in %<br />

bis 50 % 40 25<br />

über 50 % 20 15<br />

2. Die Fluktuation der Mitarbeiter war in den vergangenen Jahren recht hoch. Da die Einarbeitung<br />

neuer Mitarbeiter mit erheblichen Kosten verbunden ist, soll anhand der Herkunft und<br />

der Dauer der Betriebszugehörigkeit überprüft werden, ob hier ein statistischer Zusammenhang<br />

besteht um so die Fluktuation in Zukunft geringer zu halten. Es liegen die<br />

folgenden Daten vor:<br />

Betriebszugehörigkeit<br />

in Jahren<br />

Entfernung des bisherigen<br />

Wohnsitzes<br />

Mitarbeiter aus einer Entfernung<br />

von bis zu 100 km<br />

42<br />

Mitarbeiter aus einer Entfernung<br />

von über 100 km<br />

1 bis 2 Jahre 6 13<br />

3 bis 4 Jahre 13 12<br />

5 bis 6 Jahre 10 7<br />

7 Jahre und länger 14 5<br />

Berechnen Sie das Chi-Quadrat mittels Testverfahren in einer geeigneten, übersichtlich<br />

strukturierten Tabelle, ermitteln Sie den korrigierten Kontingenzkoeffizienten und<br />

interpretieren Sie Ihr Ergebnis.<br />

3: Die folgende Tabelle enthält die Noten von 10 Studierenden in BWL und <strong>Statistik</strong>:<br />

BWL 1,6 3,4 3,8 2,7 2,4 4,2 5,0 3,7 3,1 3,5<br />

<strong>Statistik</strong> 1,7 3,2 3,6 2,2 2,5 4,3 5,0 4,4 3,7 2,6<br />

Berechnen Sie den Rangkorrelationskoeffizienten und überprüfen Sie in wieweit hier ein<br />

Zusammenhang besteht.<br />

4. Zeichen Sie aus den folgenden Daten das Streuungsdiagramm und bestimmen Sie die<br />

Regressionsfunktion y-x , x-y , das Bestimmtheitsmaß und den Korrelationskoeffizienten:<br />

( 1 ; 2 ) , ( 2 ; 3 ) , ( 3 ; 5 ) , ( 4 ; 4 ) , ( 4 ; 6 ) , ( 5 ; 4 ) , ( 6 ; 8 ) , ( 7 ; 7 ) , ( 9 ; 8 )


5. Bestimmen Sie die Regressionsfunktion y-x, mit x = Werbeausgaben (in Tsd. €) und<br />

y = Umsatz (in Tsd. €) und n = 5 Jahren:<br />

( 10 ; 400 ) , ( 12 ; 430 ) , ( 9 ; 380 ) , ( 11 ; 390 ) , ( 14 ; 450 )<br />

6. Ein Hotelier möchte überprüfen, ob die Umsätze in seinem Biergarten (Y) von der<br />

Zimmerauslastung (X) in seinem Hotel garni abhängen. In den vergangenen Wochen ergab<br />

sich folgende Verteilung:<br />

X (in %) 40 60 70 50 50<br />

Y (in 100 €) 10 15 20 14 17<br />

a) Berechnen Sie die arithmetischen Mittel von X und Y,<br />

b) zeichnen Sie das Streuungsdiagramm,<br />

c) stellen Sie die Regressionsfunktion auf,<br />

d) berechnen und erläutern Sie das Bestimmtheitsmaß.<br />

7. Es wurden 200 Personen nach ihrem Berufsstand und dem Berufsstand ihres Vaters gefragt.<br />

Die Ergebnisse enthält die folgende Tabelle:<br />

Kind<br />

Vater<br />

Arbeiter Angestellter Beamter Selbstständiger<br />

Arbeiter 40 10 0 0<br />

Angestellter 40 25 5 10<br />

Beamter 10 25 25 0<br />

Selbstständiger 0 0 0 10<br />

Überprüfen Sie mit einem geeigneten Verfahren, ob hier ein statistischer Zusammenhang<br />

besteht.<br />

8. Ein Unternehmen möchte den Zusammenhang zwischen dem Preis pro Stück und der<br />

Absatzmenge eines Produktes erkunden. Hierzu wurden die folgenden Daten ermittelt:<br />

Preis pro<br />

Stück (€)<br />

Absatzmenge<br />

(Stück)<br />

Analysieren Sie die Tabelle<br />

0,70 0,80 0,90 1,00 1,10 1,20 1,30 1,35 1,40 1,70<br />

280 230 220 200 199 188 134 110 110 102<br />

9. In einem Land wurden die Angaben von 50 Personen bezüglich der Berufsgruppe und der<br />

Nationalität erfasst. Dabei ergab sich, dass von 30 Inländern 20 Angestellte waren und von<br />

den Ausländern 15 Arbeiter. Überprüfen Sie, ob hier ein statistischer Zusammenhang besteht.<br />

43


10. Einige Bürger wurden nach ihrem ausgabefähigen monatlichen Einkommen in Euro und<br />

nach ihrem Sparverhalten befragt:<br />

Einkommen 1.450,00 972,00 2.600,00 1.300,00 2.990,00 2.230,00<br />

Sparbeitrag 89,00 48,00 309,00 82,00 308,00 220,00<br />

Analysieren Sie die Tabelle<br />

11. Eine Befragung von 1.000 Personen nach Familienstand und Religionszugehörigkeit hat<br />

das folgendes Ergebnis geliefert:<br />

ledig verheiratet geschieden<br />

katholisch 80 400 20<br />

evangelisch 100 250 50<br />

sonstiges 20 50 30<br />

Analysieren Sie die Tabelle.<br />

Lösungen:<br />

1. Chi² = 0,1832 ; Ckorr = 0,0605<br />

2. Chi² = 7 ; Ckorr = 0,4012<br />

2<br />

3. ∑ D = 24 ; ρ = 0,855<br />

i<br />

4. yˆ = 1,7854 + 0,7544 x ; r = 0,8724 ; B = r² = 0,7611 =ˆ 76,11 %<br />

5. yˆ = 251,08 + 14,19 x ; r = 0,9362 ; B = r² = 0,8764<br />

6. x = 54 ; y = 15,2 ; yˆ = 1 / 26 + 73 / 260 x ; r = 0,8649 ; B = r² = 5329 / 7124<br />

7. Chi² = 170,72 ; Ckorr = 0,784<br />

8. yˆ = 391,39 – 186,98 x ; r = – 0,9468 ; B = r² = 0,8963<br />

9. Chi² = 8,33 ; Ckorr = 0,5345<br />

10. x = 5771 / 3 ; y = 176 ; yˆ = – 103,39 + 0,1452 x ; r = 0,9843 ; B = r² = 0,9688<br />

11. Chi² = 85,57 ; Ckorr = 0,3439<br />

44


x<br />

x<br />

+ x<br />

u o<br />

*<br />

j =<br />

j j d j<br />

j<br />

o u<br />

x j − x j<br />

2<br />

Formelsammlung <strong>Statistik</strong><br />

u<br />

h<br />

x − x j<br />

= F( x)<br />

= Fj−1<br />

+ * ( Fj<br />

− Fj<br />

1)<br />

o u<br />

−<br />

x − x<br />

o u<br />

o u<br />

x j − x j n<br />

x<br />

u<br />

j − x<br />

u<br />

j<br />

= x j + * ( − H j−<br />

) x Z = x j + * ( 0,<br />

5 − Fj−1<br />

)<br />

h 2<br />

f<br />

x Z<br />

1<br />

s ²<br />

x<br />

j<br />

v<br />

n<br />

1<br />

x = ∑ xi<br />

* h<br />

x G = n<br />

i<br />

∏<br />

n i=<br />

1<br />

i=<br />

v<br />

∑<br />

i<br />

i=<br />

1<br />

H = =<br />

v<br />

v h i<br />

∑<br />

i=<br />

1<br />

h<br />

x<br />

i<br />

∑<br />

i=<br />

1<br />

n<br />

h<br />

x<br />

i<br />

i<br />

R = xn – x1<br />

d<br />

z<br />

=<br />

1<br />

n<br />

j<br />

j<br />

d =<br />

v<br />

1<br />

1<br />

n<br />

∑ x −<br />

i= 1<br />

j<br />

x<br />

v<br />

i<br />

h<br />

i<br />

∑ x −<br />

i= 1<br />

i x * hi<br />

1 v<br />

( x x ) ²<br />

1 v<br />

= ∑ − * h<br />

s² =<br />

2<br />

∑ x * h − x ²<br />

n i=<br />

1 i i<br />

n i=<br />

1 i i<br />

z<br />

i x * hi<br />

v<br />

s<br />

´ ´<br />

s = s²<br />

V = * 100<br />

GK = 1−<br />

∑ f j * ( Fj−<br />

1 + Fj<br />

)<br />

x<br />

j=<br />

1<br />

χ<br />

2<br />

=<br />

v<br />

w<br />

∑ ∑<br />

⎛<br />

⎜h<br />

⎝<br />

ik<br />

h i * h<br />

−<br />

n<br />

h * h<br />

n<br />

i=<br />

1 k= 1<br />

i k<br />

2<br />

6 Di<br />

= 1−<br />

n(<br />

n²<br />

−1)<br />

k<br />

2<br />

⎞<br />

⎟<br />

⎠<br />

ρ ∑<br />

xy = ∑∑<br />

∑<br />

∑<br />

K korr = 2<br />

2<br />

χ K´<br />

*<br />

χ + n K´<br />

− 1<br />

mit K´<br />

= min<br />

45<br />

{ v,<br />

w }<br />

v w 1<br />

s ( x i − x)<br />

⋅ ( yk<br />

− y)<br />

⋅ h yˆ = a + bx<br />

ik<br />

n i=<br />

1 k=<br />

1<br />

∑ x iy<br />

i − ∑ x<br />

2<br />

n ⋅ ∑ x i − ( ∑<br />

( x i − x)(<br />

yi<br />

− y)<br />

n ⋅<br />

i ⋅ yi<br />

b = =<br />

2<br />

2<br />

a = y − bx<br />

( x − x)<br />

x )<br />

r =<br />

∑<br />

(<br />

i<br />

∑ ( x − x)(<br />

y − y)<br />

s<br />

i<br />

i<br />

xy<br />

= ˆ<br />

B = r²<br />

2<br />

2<br />

x − x)<br />

* ( y − y)<br />

s ⋅ s<br />

i<br />

i<br />

x y<br />

∑<br />

i<br />

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!