Hypothesen und Stichprobentheorie

Repräsentativ ? 

Statistiktutorat 

Stichprobentheorie und 

Hypothesenbildung

Ablauf 

1. Beispiel einer hypergeometrischen Verteilung 

2. Wiederholung: Standardfehler 

3. Stichprobentheorie 

4. Schätzungen (Bedingungen) 

5. Hypothesenprüfung 

6. Abschluss

Hypergeometrische Verteilung 

= unterschiedliche Teilstichproben, ohne Zurücklegen 

Wie groß ist die Wahrscheinlichkeit, bei 10 Zügen aus 

einer Gruppe von 45 Kugeln (davon 20 rote) genau 

vier rote Kugeln zu ziehen ?

Wiederholung: Standardfehler

Aufgabe 1 

Was ist der Standardfehler des Mittelwerts? 

(a) Definieren sie den Begriff und 

(b) geben Sie die entsprechende Formel an. 

Der Standardfehler des Mittelwerts ist die 

Standardabweichung der 

Stichprobenkennwerteverteilung 

des Mittelwerts.

Aufgabe 2 

Was ist ein Konfidenzintervall? 

(a) Definieren sie den Begriff und 

(b) geben Sie die entsprechende Formel für 

das 95%-Konfidenzintervall des Mittelwerts 

an. 

Das Konfidenzintervall(hier: Mutungsintervall) 

gibt an, in welchem Bereich um den 

Stichprobenkennwert sich der 

Populationskennwert mit einer festgelegten 

Wahrscheinlichkeit befindet. 

Das 95%ige 

Konfidenzintervall des 

Mittelwerts ist:

Berechnen Sie den 

Standardfehler des Mittelwerts, 

des Medians und der 

Standardabweichung für die 

in der Tabelle angegebene 

Verteilung. Geben Sie für alle 

Kennwerte auch das 95%- 

Konfidenzintervall an. 

Aufgabe 3 

Versuchsperson Wert 

1 2 

2 3 

3 5 

4 4 

5 3 

6 2 

7 2 

8 3 

9 2 

10 3

0 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

1 

2 

4 

8 

21 

29 

18 

9 

5 

3 

0 

Aufgabe 4 

Wert Häufigkeit Berechnet für die 

Zufriedenheit der 

Freiburger Psychologie- 

Bachelorstudenten den 

Standardfehler des 

Mittelwerts, des Medians 

und der Standardabweichung. 

Gebt für alle drei 

Kennwerte das 99%- 

Konfidenzintervall an.

Standardfehler für andere Kennwerte 

Kennwert Standardfehler 

Geschätzter 

Standardfehler 

Standardfehler für andere 1 25 ⋅σKennwerte 1 25 ⋅σˆ 

99% Konfidenzintervall: 2,57 Abweichungs-Einheiten Median σ = Md laut z-Tabelle. Geschätzter σˆ = Md 

Kennwert Standardfehler N N 

x x 

Standardfehler 

2 2 

Standardfehler Mittelwert: 0,172 

1 25 σ ⋅σ σ 

Geschätzter 1 25 σˆ 

⋅σˆ σˆ 

Arithmetisches Mittel x x 

x 

Kennwert Standardfehler 

x 

Median σ σ = = x x 

x σˆ σˆ 

= = 

x 

Md 

Mittelwert: 5,01 

N Md 

N N Standardfehler N N 

1 25 

σ 

⋅σ 

σˆ 

2 x 2 

Standardfehler Median: 0,215 

x 1 25 ⋅σˆ x 

Standardabweichung σσ 

x 

Median σ σ= = σ σˆ 

Md σˆ σˆ σ = = σˆ 

Arithmetisches Mittel x x σ = = 2 Md 

Median: 5 

N 

N x x 

σˆ = = 2 N 

x x 

N N N N N 

Standardabweichung (SD): 1,72 

Standardabweichung Arithmetisches Mittel 

Standardfehler SD: 0,12 

2 σ σ x x x σ σσ = = = x 

N 2 N N 

2 σˆ σˆ σˆ x x 

σˆ σˆ σ = = 

x 

N 2 N N 

σ x 

Standardabweichung σσ = 

99% Konfidenzintervall des Mittelwerts: 4,57 < µ < 5,45 2 N 

99% Konfidenzintervall des Medians: 4,45 < MDpop < 5,55 

99% Konfidenzintervall der SD: 1,41 < SDpop < 2,01 

σˆ σ 

σˆ 

x 

= 

2 N

Aufgabe 5 

Die Schulleistung in der Oberstufe in Bayern ist insgesamt 

normalverteilt. Eine Verordnung des Schulministeriums fordert 

die Lehrer auf, ihre besten Schüler der Bayerischen 

Landesbegabtenförderung zu melden. Im Kleingedruckten 

heißt es, Schüler mit einem Prozentrang von 99% oder größer 

in Bezug auf die Variable Schulleistung, also die besten 1%, 

sollten vorgeschlagen werden. Der Mittelwert der Schulnoten 

liegt bei 8.8, die Standardabweichung bei 2.6 (Notensystem 

0-15). Welche Note muss ein Schüler mindestens erreichen, 

damit er hier in Frage kommt? 

xalt 

x z 

Nur mit 15 Punkten erreicht man 

nach der z-Transformation einen 

PR von 99. 

2, 

2 

... 

x 

neu 

x 

x 

alt 

14, 

52 

2, 

6 

8, 

8

Aufgabe 6 

Ein Lehrer aus einer kleinen und sehr alternativen 

Privatschule möchte gerne einen seiner Schüler für die 

Förderung vorschlagen. Der Notendurchschnitt in seiner 

Klasse beträgt 14.3, die Standardabweichung liegt bei 

0.5. Welches Problem taucht hier aus eurer Sicht auf? 

Die Leistung in dieser Klasse ist nicht annähernd 

normalverteilt und damit nicht mit der durchschnittlichen 

Schulleistung vergleichbar. Würde man die hier z- 

Transformieren, so könnte auch mit einer Leistung von 

15 Punkten kein PR von 99 erreicht werden.

Vorgehen beim t-Test 

o Grundfrage: Welcher Test ist geeignet?* 

Synonym: 

t-Test für 

unabhängige 

Stichproben

Weiteres Vorgehen 

o Formulierung der Hypothesen (gerichtet oder 

ungerichtet). 

o Berechnung der Mittelwertsdifferenz und des 

zugehörigen Standardfehlers. 

→ empirischer t-Wert 

o Vergleich von empirischem mit dem von den 

Freiheitsgraden und Art der Hypothese 

abhängigen kritischen t-Wert aus der t-Tabelle. 

→ Entscheidung für H0 bzw. H1. 

Erläuterung der Hypothesen folgt später!

Verteilungsfunktion der t- 

Verteilungen (t-Tabelle). 

t-Tabelle

Z-Werte - Aufgabe 

Ein Persönlichkeitstest hat 

einen Mittelwert von 50 und 

eine Standardabweichung 

von 10. 

Tragen Sie jeweils den 

zugehörigen z-Wert, die 

Wahrscheinlichkeit einen 

Wert kleiner oder gleich x 

zu erreichen, sowie den 

zugehörigen Prozentrang in 

die Tabelle ein.

z Fläche z Fläche z Fläche z Fläche 

-3.00 0.00 -1.50 0.07 0.00 0.50 1.50 0.93 

-2.90 0.00 -1.40 0.08 0.10 0.54 1.60 0.95 

-2.80 0.00 -1.30 0.10 0.20 0.58 1.70 0.96 

-2.70 0.00 -1.20 0.12 0.30 0.62 1.80 0.96 

-2.60 0.00 -1.10 0.14 0.40 0.66 1.90 0.97 

-2.50 0.01 -1.00 0.16 0.50 0.69 2.00 0.98 

-2.40 0.01 -0.90 0.18 0.60 0.73 2.10 0.98 

-2.30 0.01 -0.80 0.21 0.70 0.76 2.20 0.99 

-2.20 0.01 -0.70 0.24 0.80 0.79 2.30 0.99 

-2.10 0.02 -0.60 0.27 0.90 0.82 2.40 0.99 

-2.00 0.02 -0.50 0.31 1.00 0.84 2.50 0.99 

-1.90 0.03 -0.40 0.34 1.10 0.86 2.60 1.00 

-1.80 0.04 -0.30 0.38 1.20 0.88 2.70 1.00

x z p PR 

25 -2.5 .01 1% 

55 0.5 .69 69% 

40 -1 .16 16% 

60 1 .84 84% 

50 0 .5 50% 

70 2 .98 98% 

82 3.2 1 100% 

45 -0.5 0.31 31% 

51 0.1 0.54 54%

Stichprobentheorie

Stichprobentheorie 

Welche Wirkung/Bedeutung hat die Auswahl der 

Probanden auf/für eine Studie ? 

Kosten ? 

Nutzen ? 

Relevanz ? 

Validität ? 

Signifikanz ? 

Inferenzen ? 

etc.

Stichprobenauswahl 

Welche zufallsgesteuerten Verfahren kennt ihr? 

Uneingeschränkte Zufallsauswahl 

Geschichtete Zufallsauswahl 

→ Zufallsauswahl in Teilpopulation 

Mehrstufige Zufallsauswahl 

→ Hierachische Zufallsauswahl 

Klumpenauswahl 

→ Hierachische Zufallsauswahl mit vollständiger 

Erhebung der ermittelten Teilpopulation


Welche nicht-zufallsgesteuerten Verfahren kennt ihr? 

Ad Hoc Auswahl 

→ unsystematische Auswahl; z.B. Telefonvotings 

(Vorteil: geringer Aufwand) 

Quotenauswahl 

→ unproblematisch, wenn Quoten repräsentativ und 

Vpn innerhalb der Quoten zufällig ausgewählt 

Theoriegeleitete Auswahl 

→ auch unproblematisch, wenn die Vpn der 

interessierenden Population wieder durch den Zufall 

ausgewählt werden

Zufallsgesteuerte Auswahlverfahren 

1. uneingeschränkte Zufallsauswahl: 

→ Repräsentativität gewährleistet! 

Gleich große Chance auf Auswahl, ABER 

Zentralregister von Nöten 

(Kenntnis der Gesamtpopulation)!


2. geschichtete Zufallsauswahl: 

→ ohne Register(repräsentative 

Teilpopulation) 

Schichtung analog zur 

Stichprobenverteilung 

Bei homogenen Merkmalen: kleiner 

Standardfehler → präzisere Schätzung!


3. mehrstufige Zufallsauswahl: 

→ „Teilpopulationen“ von Teilpopulationen 

(≠ geschichtet: keine systematischen 

Unterschiede zw. den Populationen) 

+ reduziert Kosten und Organisation 

- vernachlässigt mögliche Unterschiede 

zwischen Teil-und Gesamtpopulation 

(→ Standardfehlererhöhung möglich!)


4. Klumpenauswahl: 

→ Spezialfall der mehrstufigen Auswahl 

(Klumpen als finale Teilpopulation) 

Vollständige Erhebung der letzten 

Teilpopulation 

Mehrere Klumpen möglich

Nichtzufallsgesteuerte Auswahlverfahren 

1. Quotenauswahl: 

→ Stichprobe entspricht der 

Populationskonstellation 

+ relevante Merkmale(Alter, Status etc.) 

- keine wissenschaftliche Grundlage!


2. Ad-hoc-Auswahl: 

→ Gelegenheitsstichprobe 

Die ersten, verfügbare Personen werden 

als Stichprobe aufgenommen 

(Bsp. Die Ersten im Hörsaal)


3. Theoriegeleitete Auswahl: 

→ theoretische Vorüberlegungen gestalten 

Stichprobenerhebung 

Sehr typische/ untypische Fälle 

→ stat. Signifikanz wird leichter erreicht! 

Hilfreich bei Generierung neuer Ideen

FAZIT 

Die nichtzufallsgesteuerten Auswahlverfahren 

entbehren der Grundlagen für die 

Berechnung des Standardfehlers. 

Inferenzstatistische Aussagen sind daher für 

diese Fälle kaum möglich! 

Insgesamt verzerrt Probandenschwund die 

Stichprobe, so dass eine Einschränkung der 

Validität (Gültigkeit) unvermeidbar ist!


Was ist der zentrale inhaltliche Unterschied 

zwischen beiden Typen der 

Stichprobengewinnung? 

Zufallsgesteuerte Verfahren garantieren, dass 

die Stichprobe eine repräsentative Auswahl 

der interessierenden Population darstellt. Nur 

unter dieser Voraussetzung ist ein Schluß von 

der Stichprobe auf die zugrunde liegende 

Population – der Zweck der Inferenzstatistik – 

valide (gültig).

Schätzungen

Anforderungen an ein Schätzmaß 

- Erwartungstreue 

nicht-verzerrte Schätzung der Parameter (unbiased estimation) 

- Konsistenz 

Präzision der Schätzung steigt mit steigendem N 

- Effizienz 

Möglichst kleine/r Standardfehler/Streuung 

- Exhaustivität 

Die Daten aller Versuchspersonen müssen in die Berechnung 

des Schätzers mit eingehen 

Wie eignen sich die bekannten Kennwerte als Schätzer?

Intervallschätzung 

Konfidenzintervalle geben ein Intervall von 

Merkmalsausprägungen an, in dem ein Wert 

mit einer bestimmten Wahrscheinlichkeit liegt. 

Alternative: Punktschätzung 

Bsp. Geschätzte Populationsvarianz 

So kann ich mit Hilfe der Normalverteilung 

leicht sagen, in welchem Bereich eine beliebig 

gezogene Person mit 95%iger WS liegt. 

Oft werden Konfidenzintervalle nicht für 

Einzelpersonen verwendet, sondern für 

bestimmte Populationskennwerte, wie z.B. µ.

Konfidenzintervalle für den 

wahren Populationsmittelwert 

1 1 x x x x p 

 

2 x 2 x x x p 

 

,1 96x 

,1 96x 

x x p 

 

x p 

,2 57x 

,2 57x 

x 

 

 

. 68 

. 96 

9. 

9.

Mutungs- und Vertrauensintervall 

Bei der Schätzung eines Populationsparameters 

von einem Stichprobenparameter aus wird von 

einem Mutungsinvervall (Vermutungsintervall) 

gesprochen (Beispiel: Schätzung des wahren 

Mittelwertes anhand des Populationsmittelwerts) 

Bei einer Schätzung von einem Populationsparameter 

auf Stichprobenparameter wird ein 

Vertrauensintervall geschätzt. (Beispiel: 

Schätzung eines Einzelwertes, oder dem 

Mittelwert einer Stichprobe von 10 Personen) 

Manche Autoren unterscheiden auch nicht und 

nennen beides Konfidenzintervalle.

Hypothesenprüfung

Grundlegende Idee 

Anhand von Stichprobenkennwerten werden 

Hypothesen für die Population getestet 

Zwei Stichproben aus einer Population? Oder 

aus zwei verschiedenen Populationen? 

Bedeutsamkeit einer Mittelwertsdifferenz oder 

Relevanz eines Zusammenhangs, einer 

Korrelation soll getestet werden! 

Wie groß muss mein gefundener 

Mittelwertunterschied sein, damit keiner sagen 

kann, er sei zufällig entstanden? 

Ab wann ist er statistisch bedeutsam?

Vorgehen bei statistischen Tests: 

1. Formulierung der Hypothesen (gerichtet oder 

ungerichtet). 

heute! 

2. Berechnung eine empirischen Werts (z.B. t, r,…) 

3. Vergleich von empirischem Wert mit kritischem 

Wert (Tabelle) 

• Der kritische Wert hängt ab von den Freiheitsgraden 

und der Art der Hypothese 

• Je nachdem ob der emprische über oder unter 

dem kritischen Wert liegt wird die H0 

aufrechterhalten oder verworfen (=H1 

angenommen)

Nullhypothese & Alternativhypothese 

Nullhypothese (H 0): 

Diese “Negativhypothese” behauptet immer, dass es 

keine Mittelwertsunterschiede, beziehungsweise keine 

Zusammenhänge in der Population gibt. 

Alternativhypothese (H 1): 

Diese besagt, dass ein Unterschied oder ein 

Zusammenhang in der Population existiert. Die 

Alternativhypothese sollte immer aus einem 

Theoriegebäude, aus Vorstudien und der Literatur 

abgeleitet sein.

Statistische Formulierung von 

Hypothesen 

Es sei μ1 die mittlere (…) in der Population 

der(...) und es sei μ2 die mittlere (...) in der 

Population der (...). 

Dann gilt: 

H0 : μ1 = μ2 und 

H1 : μ1 = μ2 

bei einem alpha-Niveau von 5%. 

(ODER bei α = 0,05)

Fehler beim Hypothesentesten 

Aufgrund von Unsicherheiten bei der 

Stichprobenziehung besteht die Gefahr eines 

falschen Schlusses auf die Population. 

Es wird zwischen zwei möglichen Fehlern bei 

der Testung einer Hypothese unterschieden.

Zwei mögliche Fehler: 

alpha-Fehler: Ablehnung der “richtigen” 

Nullhypothese bei gültiger Nullhypothese 

(Fehler erster Art). 

beta-Fehler: Beibehaltung der “falschen” 

Nullhypothese bei gültiger Alternativhypothese 

(Fehler zweiter Art).

Beispiel: α-/β- Fehler 

!Feueralarm! 

Ein Hund jault, eine Frau schreit, die Sirene springt 

mit ohrenbetäubendem Getöse an, von fern 

klingen Martinshorn und quietschende Reifen. 

Aber es ist nirgends ein Feuer zu finden. 

Fehlalarm? 

α - Fehler 

Die Scheune brennt lichterloh. Das unbarmherzige 

Feuer frisst sich unaufhaltsam durch die Stockwerke, 

schlängelt sich die Treppen hinauf, bis vor die Haustür. 

Die Anwohner schlafen seelenruhig, unwissend, 

ungeweckt. 

Fehlender Alarm? β - Fehler

Zur Übersicht: 

? 

?

Teststärke 

Die Teststärke ist die Wahrscheinlichkeit, dass 

ein in der Population vorhandener Unterschied 

bei statistischer Testung entdeckt wird. Sie 

berechnet sich mit 1 - 

Die Teststärke ist für das experimentelle Design 

wichtig und erlaubt Beurteilungen der Qualität 

erhobener Daten bzw. durchgeführter 

statistischer Untersuchungen.

Einfluss des β-Fehlers

Alpha-Fehler

α – Fehler (zwei Stichproben)

Einfluss des β-Fehlers (4:1)

Das war's für heute. 

Bis nächste Woche! 

Fragen an: 

S.Tomczyk@gmx.net

Hypothesen und Stichprobentheorie

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?