11.04.2013 Aufrufe

Hypothesen und Stichprobentheorie

Hypothesen und Stichprobentheorie

Hypothesen und Stichprobentheorie

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Repräsentativ ?<br />

Statistiktutorat<br />

<strong>Stichprobentheorie</strong> <strong>und</strong><br />

<strong>Hypothesen</strong>bildung


Ablauf<br />

1. Beispiel einer hypergeometrischen Verteilung<br />

2. Wiederholung: Standardfehler<br />

3. <strong>Stichprobentheorie</strong><br />

4. Schätzungen (Bedingungen)<br />

5. <strong>Hypothesen</strong>prüfung<br />

6. Abschluss


Hypergeometrische Verteilung<br />

= unterschiedliche Teilstichproben, ohne Zurücklegen<br />

Wie groß ist die Wahrscheinlichkeit, bei 10 Zügen aus<br />

einer Gruppe von 45 Kugeln (davon 20 rote) genau<br />

vier rote Kugeln zu ziehen ?


Wiederholung: Standardfehler


Aufgabe 1<br />

Was ist der Standardfehler des Mittelwerts?<br />

(a) Definieren sie den Begriff <strong>und</strong><br />

(b) geben Sie die entsprechende Formel an.<br />

Der Standardfehler des Mittelwerts ist die<br />

Standardabweichung der<br />

Stichprobenkennwerteverteilung<br />

des Mittelwerts.


Aufgabe 2<br />

Was ist ein Konfidenzintervall?<br />

(a) Definieren sie den Begriff <strong>und</strong><br />

(b) geben Sie die entsprechende Formel für<br />

das 95%-Konfidenzintervall des Mittelwerts<br />

an.<br />

Das Konfidenzintervall(hier: Mutungsintervall)<br />

gibt an, in welchem Bereich um den<br />

Stichprobenkennwert sich der<br />

Populationskennwert mit einer festgelegten<br />

Wahrscheinlichkeit befindet.<br />

Das 95%ige<br />

Konfidenzintervall des<br />

Mittelwerts ist:


Berechnen Sie den<br />

Standardfehler des Mittelwerts,<br />

des Medians <strong>und</strong> der<br />

Standardabweichung für die<br />

in der Tabelle angegebene<br />

Verteilung. Geben Sie für alle<br />

Kennwerte auch das 95%-<br />

Konfidenzintervall an.<br />

Aufgabe 3<br />

Versuchsperson Wert<br />

1 2<br />

2 3<br />

3 5<br />

4 4<br />

5 3<br />

6 2<br />

7 2<br />

8 3<br />

9 2<br />

10 3


0<br />

1<br />

2<br />

3<br />

4<br />

5<br />

6<br />

7<br />

8<br />

9<br />

10<br />

1<br />

2<br />

4<br />

8<br />

21<br />

29<br />

18<br />

9<br />

5<br />

3<br />

0<br />

Aufgabe 4<br />

Wert Häufigkeit Berechnet für die<br />

Zufriedenheit der<br />

Freiburger Psychologie-<br />

Bachelorstudenten den<br />

Standardfehler des<br />

Mittelwerts, des Medians<br />

<strong>und</strong> der Standardabweichung.<br />

Gebt für alle drei<br />

Kennwerte das 99%-<br />

Konfidenzintervall an.


Standardfehler für andere Kennwerte<br />

Kennwert Standardfehler<br />

Geschätzter<br />

Standardfehler<br />

Standardfehler für andere 1 25 ⋅σKennwerte 1 25 ⋅σˆ<br />

99% Konfidenzintervall: 2,57 Abweichungs-Einheiten Median σ = Md laut z-Tabelle. Geschätzter σˆ = Md<br />

Kennwert Standardfehler N N<br />

x x<br />

Standardfehler<br />

2 2<br />

Standardfehler Mittelwert: 0,172<br />

1 25 σ ⋅σ σ<br />

Geschätzter 1 25 σˆ<br />

⋅σˆ σˆ<br />

Arithmetisches Mittel x x<br />

x<br />

Kennwert Standardfehler<br />

x<br />

Median σ σ = = x x<br />

x σˆ σˆ<br />

= =<br />

x<br />

Md<br />

Mittelwert: 5,01<br />

N Md<br />

N N Standardfehler N N<br />

1 25<br />

σ<br />

⋅σ<br />

σˆ<br />

2 x 2<br />

Standardfehler Median: 0,215<br />

x 1 25 ⋅σˆ x<br />

Standardabweichung σσ<br />

x<br />

Median σ σ= = σ σˆ<br />

Md σˆ σˆ σ = = σˆ<br />

Arithmetisches Mittel x x σ = = 2 Md<br />

Median: 5<br />

N<br />

N x x<br />

σˆ = = 2 N<br />

x x<br />

N N N N N<br />

Standardabweichung (SD): 1,72<br />

Standardabweichung Arithmetisches Mittel<br />

Standardfehler SD: 0,12<br />

2 σ σ x x x σ σσ = = = x<br />

N 2 N N<br />

2 σˆ σˆ σˆ x x<br />

σˆ σˆ σ = =<br />

x<br />

N 2 N N<br />

σ x<br />

Standardabweichung σσ =<br />

99% Konfidenzintervall des Mittelwerts: 4,57 < µ < 5,45 2 N<br />

99% Konfidenzintervall des Medians: 4,45 < MDpop < 5,55<br />

99% Konfidenzintervall der SD: 1,41 < SDpop < 2,01<br />

σˆ σ<br />

σˆ<br />

x<br />

=<br />

2 N


Aufgabe 5<br />

Die Schulleistung in der Oberstufe in Bayern ist insgesamt<br />

normalverteilt. Eine Verordnung des Schulministeriums fordert<br />

die Lehrer auf, ihre besten Schüler der Bayerischen<br />

Landesbegabtenförderung zu melden. Im Kleingedruckten<br />

heißt es, Schüler mit einem Prozentrang von 99% oder größer<br />

in Bezug auf die Variable Schulleistung, also die besten 1%,<br />

sollten vorgeschlagen werden. Der Mittelwert der Schulnoten<br />

liegt bei 8.8, die Standardabweichung bei 2.6 (Notensystem<br />

0-15). Welche Note muss ein Schüler mindestens erreichen,<br />

damit er hier in Frage kommt?<br />

xalt<br />

x z<br />

Nur mit 15 Punkten erreicht man<br />

nach der z-Transformation einen<br />

PR von 99.<br />

2,<br />

2<br />

...<br />

x<br />

neu<br />

x<br />

x<br />

alt<br />

14,<br />

52<br />

2,<br />

6<br />

8,<br />

8


Aufgabe 6<br />

Ein Lehrer aus einer kleinen <strong>und</strong> sehr alternativen<br />

Privatschule möchte gerne einen seiner Schüler für die<br />

Förderung vorschlagen. Der Notendurchschnitt in seiner<br />

Klasse beträgt 14.3, die Standardabweichung liegt bei<br />

0.5. Welches Problem taucht hier aus eurer Sicht auf?<br />

Die Leistung in dieser Klasse ist nicht annähernd<br />

normalverteilt <strong>und</strong> damit nicht mit der durchschnittlichen<br />

Schulleistung vergleichbar. Würde man die hier z-<br />

Transformieren, so könnte auch mit einer Leistung von<br />

15 Punkten kein PR von 99 erreicht werden.


Vorgehen beim t-Test<br />

o Gr<strong>und</strong>frage: Welcher Test ist geeignet?*<br />

Synonym:<br />

t-Test für<br />

unabhängige<br />

Stichproben


Weiteres Vorgehen<br />

o Formulierung der <strong>Hypothesen</strong> (gerichtet oder<br />

ungerichtet).<br />

o Berechnung der Mittelwertsdifferenz <strong>und</strong> des<br />

zugehörigen Standardfehlers.<br />

→ empirischer t-Wert<br />

o Vergleich von empirischem mit dem von den<br />

Freiheitsgraden <strong>und</strong> Art der Hypothese<br />

abhängigen kritischen t-Wert aus der t-Tabelle.<br />

→ Entscheidung für H0 bzw. H1.<br />

Erläuterung der <strong>Hypothesen</strong> folgt später!


Verteilungsfunktion der t-<br />

Verteilungen (t-Tabelle).<br />

t-Tabelle


Z-Werte - Aufgabe<br />

Ein Persönlichkeitstest hat<br />

einen Mittelwert von 50 <strong>und</strong><br />

eine Standardabweichung<br />

von 10.<br />

Tragen Sie jeweils den<br />

zugehörigen z-Wert, die<br />

Wahrscheinlichkeit einen<br />

Wert kleiner oder gleich x<br />

zu erreichen, sowie den<br />

zugehörigen Prozentrang in<br />

die Tabelle ein.


z Fläche z Fläche z Fläche z Fläche<br />

-3.00 0.00 -1.50 0.07 0.00 0.50 1.50 0.93<br />

-2.90 0.00 -1.40 0.08 0.10 0.54 1.60 0.95<br />

-2.80 0.00 -1.30 0.10 0.20 0.58 1.70 0.96<br />

-2.70 0.00 -1.20 0.12 0.30 0.62 1.80 0.96<br />

-2.60 0.00 -1.10 0.14 0.40 0.66 1.90 0.97<br />

-2.50 0.01 -1.00 0.16 0.50 0.69 2.00 0.98<br />

-2.40 0.01 -0.90 0.18 0.60 0.73 2.10 0.98<br />

-2.30 0.01 -0.80 0.21 0.70 0.76 2.20 0.99<br />

-2.20 0.01 -0.70 0.24 0.80 0.79 2.30 0.99<br />

-2.10 0.02 -0.60 0.27 0.90 0.82 2.40 0.99<br />

-2.00 0.02 -0.50 0.31 1.00 0.84 2.50 0.99<br />

-1.90 0.03 -0.40 0.34 1.10 0.86 2.60 1.00<br />

-1.80 0.04 -0.30 0.38 1.20 0.88 2.70 1.00


x z p PR<br />

25 -2.5 .01 1%<br />

55 0.5 .69 69%<br />

40 -1 .16 16%<br />

60 1 .84 84%<br />

50 0 .5 50%<br />

70 2 .98 98%<br />

82 3.2 1 100%<br />

45 -0.5 0.31 31%<br />

51 0.1 0.54 54%


<strong>Stichprobentheorie</strong>


<strong>Stichprobentheorie</strong><br />

Welche Wirkung/Bedeutung hat die Auswahl der<br />

Probanden auf/für eine Studie ?<br />

Kosten ?<br />

Nutzen ?<br />

Relevanz ?<br />

Validität ?<br />

Signifikanz ?<br />

Inferenzen ?<br />

etc.


Stichprobenauswahl<br />

Welche zufallsgesteuerten Verfahren kennt ihr?<br />

Uneingeschränkte Zufallsauswahl<br />

Geschichtete Zufallsauswahl<br />

→ Zufallsauswahl in Teilpopulation<br />

Mehrstufige Zufallsauswahl<br />

→ Hierachische Zufallsauswahl<br />

Klumpenauswahl<br />

→ Hierachische Zufallsauswahl mit vollständiger<br />

Erhebung der ermittelten Teilpopulation


Stichprobenauswahl<br />

Welche nicht-zufallsgesteuerten Verfahren kennt ihr?<br />

Ad Hoc Auswahl<br />

→ unsystematische Auswahl; z.B. Telefonvotings<br />

(Vorteil: geringer Aufwand)<br />

Quotenauswahl<br />

→ unproblematisch, wenn Quoten repräsentativ <strong>und</strong><br />

Vpn innerhalb der Quoten zufällig ausgewählt<br />

Theoriegeleitete Auswahl<br />

→ auch unproblematisch, wenn die Vpn der<br />

interessierenden Population wieder durch den Zufall<br />

ausgewählt werden


Zufallsgesteuerte Auswahlverfahren<br />

1. uneingeschränkte Zufallsauswahl:<br />

→ Repräsentativität gewährleistet!<br />

Gleich große Chance auf Auswahl, ABER<br />

Zentralregister von Nöten<br />

(Kenntnis der Gesamtpopulation)!


Zufallsgesteuerte Auswahlverfahren<br />

2. geschichtete Zufallsauswahl:<br />

→ ohne Register(repräsentative<br />

Teilpopulation)<br />

Schichtung analog zur<br />

Stichprobenverteilung<br />

Bei homogenen Merkmalen: kleiner<br />

Standardfehler → präzisere Schätzung!


Zufallsgesteuerte Auswahlverfahren<br />

3. mehrstufige Zufallsauswahl:<br />

→ „Teilpopulationen“ von Teilpopulationen<br />

(≠ geschichtet: keine systematischen<br />

Unterschiede zw. den Populationen)<br />

+ reduziert Kosten <strong>und</strong> Organisation<br />

- vernachlässigt mögliche Unterschiede<br />

zwischen Teil-<strong>und</strong> Gesamtpopulation<br />

(→ Standardfehlererhöhung möglich!)


Zufallsgesteuerte Auswahlverfahren<br />

4. Klumpenauswahl:<br />

→ Spezialfall der mehrstufigen Auswahl<br />

(Klumpen als finale Teilpopulation)<br />

Vollständige Erhebung der letzten<br />

Teilpopulation<br />

Mehrere Klumpen möglich


Nichtzufallsgesteuerte Auswahlverfahren<br />

1. Quotenauswahl:<br />

→ Stichprobe entspricht der<br />

Populationskonstellation<br />

+ relevante Merkmale(Alter, Status etc.)<br />

- keine wissenschaftliche Gr<strong>und</strong>lage!


Nichtzufallsgesteuerte Auswahlverfahren<br />

2. Ad-hoc-Auswahl:<br />

→ Gelegenheitsstichprobe<br />

Die ersten, verfügbare Personen werden<br />

als Stichprobe aufgenommen<br />

(Bsp. Die Ersten im Hörsaal)


Nichtzufallsgesteuerte Auswahlverfahren<br />

3. Theoriegeleitete Auswahl:<br />

→ theoretische Vorüberlegungen gestalten<br />

Stichprobenerhebung<br />

Sehr typische/ untypische Fälle<br />

→ stat. Signifikanz wird leichter erreicht!<br />

Hilfreich bei Generierung neuer Ideen


FAZIT<br />

Die nichtzufallsgesteuerten Auswahlverfahren<br />

entbehren der Gr<strong>und</strong>lagen für die<br />

Berechnung des Standardfehlers.<br />

Inferenzstatistische Aussagen sind daher für<br />

diese Fälle kaum möglich!<br />

Insgesamt verzerrt Probandenschw<strong>und</strong> die<br />

Stichprobe, so dass eine Einschränkung der<br />

Validität (Gültigkeit) unvermeidbar ist!


Stichprobenauswahl<br />

Was ist der zentrale inhaltliche Unterschied<br />

zwischen beiden Typen der<br />

Stichprobengewinnung?<br />

Zufallsgesteuerte Verfahren garantieren, dass<br />

die Stichprobe eine repräsentative Auswahl<br />

der interessierenden Population darstellt. Nur<br />

unter dieser Voraussetzung ist ein Schluß von<br />

der Stichprobe auf die zugr<strong>und</strong>e liegende<br />

Population – der Zweck der Inferenzstatistik –<br />

valide (gültig).


Schätzungen


Anforderungen an ein Schätzmaß<br />

- Erwartungstreue<br />

nicht-verzerrte Schätzung der Parameter (unbiased estimation)<br />

- Konsistenz<br />

Präzision der Schätzung steigt mit steigendem N<br />

- Effizienz<br />

Möglichst kleine/r Standardfehler/Streuung<br />

- Exhaustivität<br />

Die Daten aller Versuchspersonen müssen in die Berechnung<br />

des Schätzers mit eingehen<br />

Wie eignen sich die bekannten Kennwerte als Schätzer?


Intervallschätzung<br />

Konfidenzintervalle geben ein Intervall von<br />

Merkmalsausprägungen an, in dem ein Wert<br />

mit einer bestimmten Wahrscheinlichkeit liegt.<br />

Alternative: Punktschätzung<br />

Bsp. Geschätzte Populationsvarianz<br />

So kann ich mit Hilfe der Normalverteilung<br />

leicht sagen, in welchem Bereich eine beliebig<br />

gezogene Person mit 95%iger WS liegt.<br />

Oft werden Konfidenzintervalle nicht für<br />

Einzelpersonen verwendet, sondern für<br />

bestimmte Populationskennwerte, wie z.B. µ.


Konfidenzintervalle für den<br />

wahren Populationsmittelwert<br />

1 1 x x x x p<br />

<br />

2 x 2 x x x p<br />

<br />

,1 96x<br />

,1 96x<br />

x x p<br />

<br />

x p<br />

,2 57x<br />

,2 57x<br />

x<br />

<br />

<br />

. 68<br />

. 96<br />

9.<br />

9.


Mutungs- <strong>und</strong> Vertrauensintervall<br />

Bei der Schätzung eines Populationsparameters<br />

von einem Stichprobenparameter aus wird von<br />

einem Mutungsinvervall (Vermutungsintervall)<br />

gesprochen (Beispiel: Schätzung des wahren<br />

Mittelwertes anhand des Populationsmittelwerts)<br />

Bei einer Schätzung von einem Populationsparameter<br />

auf Stichprobenparameter wird ein<br />

Vertrauensintervall geschätzt. (Beispiel:<br />

Schätzung eines Einzelwertes, oder dem<br />

Mittelwert einer Stichprobe von 10 Personen)<br />

Manche Autoren unterscheiden auch nicht <strong>und</strong><br />

nennen beides Konfidenzintervalle.


<strong>Hypothesen</strong>prüfung


Gr<strong>und</strong>legende Idee<br />

Anhand von Stichprobenkennwerten werden<br />

<strong>Hypothesen</strong> für die Population getestet<br />

Zwei Stichproben aus einer Population? Oder<br />

aus zwei verschiedenen Populationen?<br />

Bedeutsamkeit einer Mittelwertsdifferenz oder<br />

Relevanz eines Zusammenhangs, einer<br />

Korrelation soll getestet werden!<br />

Wie groß muss mein gef<strong>und</strong>ener<br />

Mittelwertunterschied sein, damit keiner sagen<br />

kann, er sei zufällig entstanden?<br />

Ab wann ist er statistisch bedeutsam?


Vorgehen bei statistischen Tests:<br />

1. Formulierung der <strong>Hypothesen</strong> (gerichtet oder<br />

ungerichtet).<br />

heute!<br />

2. Berechnung eine empirischen Werts (z.B. t, r,…)<br />

3. Vergleich von empirischem Wert mit kritischem<br />

Wert (Tabelle)<br />

• Der kritische Wert hängt ab von den Freiheitsgraden<br />

<strong>und</strong> der Art der Hypothese<br />

• Je nachdem ob der emprische über oder unter<br />

dem kritischen Wert liegt wird die H0<br />

aufrechterhalten oder verworfen (=H1<br />

angenommen)


Nullhypothese & Alternativhypothese<br />

Nullhypothese (H 0):<br />

Diese “Negativhypothese” behauptet immer, dass es<br />

keine Mittelwertsunterschiede, beziehungsweise keine<br />

Zusammenhänge in der Population gibt.<br />

Alternativhypothese (H 1):<br />

Diese besagt, dass ein Unterschied oder ein<br />

Zusammenhang in der Population existiert. Die<br />

Alternativhypothese sollte immer aus einem<br />

Theoriegebäude, aus Vorstudien <strong>und</strong> der Literatur<br />

abgeleitet sein.


Statistische Formulierung von<br />

<strong>Hypothesen</strong><br />

Es sei μ1 die mittlere (…) in der Population<br />

der(...) <strong>und</strong> es sei μ2 die mittlere (...) in der<br />

Population der (...).<br />

Dann gilt:<br />

H0 : μ1 = μ2 <strong>und</strong><br />

H1 : μ1 = μ2<br />

bei einem alpha-Niveau von 5%.<br />

(ODER bei α = 0,05)


Fehler beim <strong>Hypothesen</strong>testen<br />

Aufgr<strong>und</strong> von Unsicherheiten bei der<br />

Stichprobenziehung besteht die Gefahr eines<br />

falschen Schlusses auf die Population.<br />

Es wird zwischen zwei möglichen Fehlern bei<br />

der Testung einer Hypothese unterschieden.


Zwei mögliche Fehler:<br />

alpha-Fehler: Ablehnung der “richtigen”<br />

Nullhypothese bei gültiger Nullhypothese<br />

(Fehler erster Art).<br />

beta-Fehler: Beibehaltung der “falschen”<br />

Nullhypothese bei gültiger Alternativhypothese<br />

(Fehler zweiter Art).


Beispiel: α-/β- Fehler<br />

!Feueralarm!<br />

Ein H<strong>und</strong> jault, eine Frau schreit, die Sirene springt<br />

mit ohrenbetäubendem Getöse an, von fern<br />

klingen Martinshorn <strong>und</strong> quietschende Reifen.<br />

Aber es ist nirgends ein Feuer zu finden.<br />

Fehlalarm?<br />

α - Fehler<br />

Die Scheune brennt lichterloh. Das unbarmherzige<br />

Feuer frisst sich unaufhaltsam durch die Stockwerke,<br />

schlängelt sich die Treppen hinauf, bis vor die Haustür.<br />

Die Anwohner schlafen seelenruhig, unwissend,<br />

ungeweckt.<br />

Fehlender Alarm? β - Fehler


Zur Übersicht:<br />

?<br />

?


Teststärke<br />

Die Teststärke ist die Wahrscheinlichkeit, dass<br />

ein in der Population vorhandener Unterschied<br />

bei statistischer Testung entdeckt wird. Sie<br />

berechnet sich mit 1 -<br />

Die Teststärke ist für das experimentelle Design<br />

wichtig <strong>und</strong> erlaubt Beurteilungen der Qualität<br />

erhobener Daten bzw. durchgeführter<br />

statistischer Untersuchungen.


Einfluss des β-Fehlers


Alpha-Fehler


α – Fehler (zwei Stichproben)


Einfluss des β-Fehlers (4:1)


Das war's für heute.<br />

Bis nächste Woche!<br />

Fragen an:<br />

S.Tomczyk@gmx.net

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!