Hypothesen und Stichprobentheorie
Hypothesen und Stichprobentheorie
Hypothesen und Stichprobentheorie
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Repräsentativ ?<br />
Statistiktutorat<br />
<strong>Stichprobentheorie</strong> <strong>und</strong><br />
<strong>Hypothesen</strong>bildung
Ablauf<br />
1. Beispiel einer hypergeometrischen Verteilung<br />
2. Wiederholung: Standardfehler<br />
3. <strong>Stichprobentheorie</strong><br />
4. Schätzungen (Bedingungen)<br />
5. <strong>Hypothesen</strong>prüfung<br />
6. Abschluss
Hypergeometrische Verteilung<br />
= unterschiedliche Teilstichproben, ohne Zurücklegen<br />
Wie groß ist die Wahrscheinlichkeit, bei 10 Zügen aus<br />
einer Gruppe von 45 Kugeln (davon 20 rote) genau<br />
vier rote Kugeln zu ziehen ?
Wiederholung: Standardfehler
Aufgabe 1<br />
Was ist der Standardfehler des Mittelwerts?<br />
(a) Definieren sie den Begriff <strong>und</strong><br />
(b) geben Sie die entsprechende Formel an.<br />
Der Standardfehler des Mittelwerts ist die<br />
Standardabweichung der<br />
Stichprobenkennwerteverteilung<br />
des Mittelwerts.
Aufgabe 2<br />
Was ist ein Konfidenzintervall?<br />
(a) Definieren sie den Begriff <strong>und</strong><br />
(b) geben Sie die entsprechende Formel für<br />
das 95%-Konfidenzintervall des Mittelwerts<br />
an.<br />
Das Konfidenzintervall(hier: Mutungsintervall)<br />
gibt an, in welchem Bereich um den<br />
Stichprobenkennwert sich der<br />
Populationskennwert mit einer festgelegten<br />
Wahrscheinlichkeit befindet.<br />
Das 95%ige<br />
Konfidenzintervall des<br />
Mittelwerts ist:
Berechnen Sie den<br />
Standardfehler des Mittelwerts,<br />
des Medians <strong>und</strong> der<br />
Standardabweichung für die<br />
in der Tabelle angegebene<br />
Verteilung. Geben Sie für alle<br />
Kennwerte auch das 95%-<br />
Konfidenzintervall an.<br />
Aufgabe 3<br />
Versuchsperson Wert<br />
1 2<br />
2 3<br />
3 5<br />
4 4<br />
5 3<br />
6 2<br />
7 2<br />
8 3<br />
9 2<br />
10 3
0<br />
1<br />
2<br />
3<br />
4<br />
5<br />
6<br />
7<br />
8<br />
9<br />
10<br />
1<br />
2<br />
4<br />
8<br />
21<br />
29<br />
18<br />
9<br />
5<br />
3<br />
0<br />
Aufgabe 4<br />
Wert Häufigkeit Berechnet für die<br />
Zufriedenheit der<br />
Freiburger Psychologie-<br />
Bachelorstudenten den<br />
Standardfehler des<br />
Mittelwerts, des Medians<br />
<strong>und</strong> der Standardabweichung.<br />
Gebt für alle drei<br />
Kennwerte das 99%-<br />
Konfidenzintervall an.
Standardfehler für andere Kennwerte<br />
Kennwert Standardfehler<br />
Geschätzter<br />
Standardfehler<br />
Standardfehler für andere 1 25 ⋅σKennwerte 1 25 ⋅σˆ<br />
99% Konfidenzintervall: 2,57 Abweichungs-Einheiten Median σ = Md laut z-Tabelle. Geschätzter σˆ = Md<br />
Kennwert Standardfehler N N<br />
x x<br />
Standardfehler<br />
2 2<br />
Standardfehler Mittelwert: 0,172<br />
1 25 σ ⋅σ σ<br />
Geschätzter 1 25 σˆ<br />
⋅σˆ σˆ<br />
Arithmetisches Mittel x x<br />
x<br />
Kennwert Standardfehler<br />
x<br />
Median σ σ = = x x<br />
x σˆ σˆ<br />
= =<br />
x<br />
Md<br />
Mittelwert: 5,01<br />
N Md<br />
N N Standardfehler N N<br />
1 25<br />
σ<br />
⋅σ<br />
σˆ<br />
2 x 2<br />
Standardfehler Median: 0,215<br />
x 1 25 ⋅σˆ x<br />
Standardabweichung σσ<br />
x<br />
Median σ σ= = σ σˆ<br />
Md σˆ σˆ σ = = σˆ<br />
Arithmetisches Mittel x x σ = = 2 Md<br />
Median: 5<br />
N<br />
N x x<br />
σˆ = = 2 N<br />
x x<br />
N N N N N<br />
Standardabweichung (SD): 1,72<br />
Standardabweichung Arithmetisches Mittel<br />
Standardfehler SD: 0,12<br />
2 σ σ x x x σ σσ = = = x<br />
N 2 N N<br />
2 σˆ σˆ σˆ x x<br />
σˆ σˆ σ = =<br />
x<br />
N 2 N N<br />
σ x<br />
Standardabweichung σσ =<br />
99% Konfidenzintervall des Mittelwerts: 4,57 < µ < 5,45 2 N<br />
99% Konfidenzintervall des Medians: 4,45 < MDpop < 5,55<br />
99% Konfidenzintervall der SD: 1,41 < SDpop < 2,01<br />
σˆ σ<br />
σˆ<br />
x<br />
=<br />
2 N
Aufgabe 5<br />
Die Schulleistung in der Oberstufe in Bayern ist insgesamt<br />
normalverteilt. Eine Verordnung des Schulministeriums fordert<br />
die Lehrer auf, ihre besten Schüler der Bayerischen<br />
Landesbegabtenförderung zu melden. Im Kleingedruckten<br />
heißt es, Schüler mit einem Prozentrang von 99% oder größer<br />
in Bezug auf die Variable Schulleistung, also die besten 1%,<br />
sollten vorgeschlagen werden. Der Mittelwert der Schulnoten<br />
liegt bei 8.8, die Standardabweichung bei 2.6 (Notensystem<br />
0-15). Welche Note muss ein Schüler mindestens erreichen,<br />
damit er hier in Frage kommt?<br />
xalt<br />
x z<br />
Nur mit 15 Punkten erreicht man<br />
nach der z-Transformation einen<br />
PR von 99.<br />
2,<br />
2<br />
...<br />
x<br />
neu<br />
x<br />
x<br />
alt<br />
14,<br />
52<br />
2,<br />
6<br />
8,<br />
8
Aufgabe 6<br />
Ein Lehrer aus einer kleinen <strong>und</strong> sehr alternativen<br />
Privatschule möchte gerne einen seiner Schüler für die<br />
Förderung vorschlagen. Der Notendurchschnitt in seiner<br />
Klasse beträgt 14.3, die Standardabweichung liegt bei<br />
0.5. Welches Problem taucht hier aus eurer Sicht auf?<br />
Die Leistung in dieser Klasse ist nicht annähernd<br />
normalverteilt <strong>und</strong> damit nicht mit der durchschnittlichen<br />
Schulleistung vergleichbar. Würde man die hier z-<br />
Transformieren, so könnte auch mit einer Leistung von<br />
15 Punkten kein PR von 99 erreicht werden.
Vorgehen beim t-Test<br />
o Gr<strong>und</strong>frage: Welcher Test ist geeignet?*<br />
Synonym:<br />
t-Test für<br />
unabhängige<br />
Stichproben
Weiteres Vorgehen<br />
o Formulierung der <strong>Hypothesen</strong> (gerichtet oder<br />
ungerichtet).<br />
o Berechnung der Mittelwertsdifferenz <strong>und</strong> des<br />
zugehörigen Standardfehlers.<br />
→ empirischer t-Wert<br />
o Vergleich von empirischem mit dem von den<br />
Freiheitsgraden <strong>und</strong> Art der Hypothese<br />
abhängigen kritischen t-Wert aus der t-Tabelle.<br />
→ Entscheidung für H0 bzw. H1.<br />
Erläuterung der <strong>Hypothesen</strong> folgt später!
Verteilungsfunktion der t-<br />
Verteilungen (t-Tabelle).<br />
t-Tabelle
Z-Werte - Aufgabe<br />
Ein Persönlichkeitstest hat<br />
einen Mittelwert von 50 <strong>und</strong><br />
eine Standardabweichung<br />
von 10.<br />
Tragen Sie jeweils den<br />
zugehörigen z-Wert, die<br />
Wahrscheinlichkeit einen<br />
Wert kleiner oder gleich x<br />
zu erreichen, sowie den<br />
zugehörigen Prozentrang in<br />
die Tabelle ein.
z Fläche z Fläche z Fläche z Fläche<br />
-3.00 0.00 -1.50 0.07 0.00 0.50 1.50 0.93<br />
-2.90 0.00 -1.40 0.08 0.10 0.54 1.60 0.95<br />
-2.80 0.00 -1.30 0.10 0.20 0.58 1.70 0.96<br />
-2.70 0.00 -1.20 0.12 0.30 0.62 1.80 0.96<br />
-2.60 0.00 -1.10 0.14 0.40 0.66 1.90 0.97<br />
-2.50 0.01 -1.00 0.16 0.50 0.69 2.00 0.98<br />
-2.40 0.01 -0.90 0.18 0.60 0.73 2.10 0.98<br />
-2.30 0.01 -0.80 0.21 0.70 0.76 2.20 0.99<br />
-2.20 0.01 -0.70 0.24 0.80 0.79 2.30 0.99<br />
-2.10 0.02 -0.60 0.27 0.90 0.82 2.40 0.99<br />
-2.00 0.02 -0.50 0.31 1.00 0.84 2.50 0.99<br />
-1.90 0.03 -0.40 0.34 1.10 0.86 2.60 1.00<br />
-1.80 0.04 -0.30 0.38 1.20 0.88 2.70 1.00
x z p PR<br />
25 -2.5 .01 1%<br />
55 0.5 .69 69%<br />
40 -1 .16 16%<br />
60 1 .84 84%<br />
50 0 .5 50%<br />
70 2 .98 98%<br />
82 3.2 1 100%<br />
45 -0.5 0.31 31%<br />
51 0.1 0.54 54%
<strong>Stichprobentheorie</strong>
<strong>Stichprobentheorie</strong><br />
Welche Wirkung/Bedeutung hat die Auswahl der<br />
Probanden auf/für eine Studie ?<br />
Kosten ?<br />
Nutzen ?<br />
Relevanz ?<br />
Validität ?<br />
Signifikanz ?<br />
Inferenzen ?<br />
etc.
Stichprobenauswahl<br />
Welche zufallsgesteuerten Verfahren kennt ihr?<br />
Uneingeschränkte Zufallsauswahl<br />
Geschichtete Zufallsauswahl<br />
→ Zufallsauswahl in Teilpopulation<br />
Mehrstufige Zufallsauswahl<br />
→ Hierachische Zufallsauswahl<br />
Klumpenauswahl<br />
→ Hierachische Zufallsauswahl mit vollständiger<br />
Erhebung der ermittelten Teilpopulation
Stichprobenauswahl<br />
Welche nicht-zufallsgesteuerten Verfahren kennt ihr?<br />
Ad Hoc Auswahl<br />
→ unsystematische Auswahl; z.B. Telefonvotings<br />
(Vorteil: geringer Aufwand)<br />
Quotenauswahl<br />
→ unproblematisch, wenn Quoten repräsentativ <strong>und</strong><br />
Vpn innerhalb der Quoten zufällig ausgewählt<br />
Theoriegeleitete Auswahl<br />
→ auch unproblematisch, wenn die Vpn der<br />
interessierenden Population wieder durch den Zufall<br />
ausgewählt werden
Zufallsgesteuerte Auswahlverfahren<br />
1. uneingeschränkte Zufallsauswahl:<br />
→ Repräsentativität gewährleistet!<br />
Gleich große Chance auf Auswahl, ABER<br />
Zentralregister von Nöten<br />
(Kenntnis der Gesamtpopulation)!
Zufallsgesteuerte Auswahlverfahren<br />
2. geschichtete Zufallsauswahl:<br />
→ ohne Register(repräsentative<br />
Teilpopulation)<br />
Schichtung analog zur<br />
Stichprobenverteilung<br />
Bei homogenen Merkmalen: kleiner<br />
Standardfehler → präzisere Schätzung!
Zufallsgesteuerte Auswahlverfahren<br />
3. mehrstufige Zufallsauswahl:<br />
→ „Teilpopulationen“ von Teilpopulationen<br />
(≠ geschichtet: keine systematischen<br />
Unterschiede zw. den Populationen)<br />
+ reduziert Kosten <strong>und</strong> Organisation<br />
- vernachlässigt mögliche Unterschiede<br />
zwischen Teil-<strong>und</strong> Gesamtpopulation<br />
(→ Standardfehlererhöhung möglich!)
Zufallsgesteuerte Auswahlverfahren<br />
4. Klumpenauswahl:<br />
→ Spezialfall der mehrstufigen Auswahl<br />
(Klumpen als finale Teilpopulation)<br />
Vollständige Erhebung der letzten<br />
Teilpopulation<br />
Mehrere Klumpen möglich
Nichtzufallsgesteuerte Auswahlverfahren<br />
1. Quotenauswahl:<br />
→ Stichprobe entspricht der<br />
Populationskonstellation<br />
+ relevante Merkmale(Alter, Status etc.)<br />
- keine wissenschaftliche Gr<strong>und</strong>lage!
Nichtzufallsgesteuerte Auswahlverfahren<br />
2. Ad-hoc-Auswahl:<br />
→ Gelegenheitsstichprobe<br />
Die ersten, verfügbare Personen werden<br />
als Stichprobe aufgenommen<br />
(Bsp. Die Ersten im Hörsaal)
Nichtzufallsgesteuerte Auswahlverfahren<br />
3. Theoriegeleitete Auswahl:<br />
→ theoretische Vorüberlegungen gestalten<br />
Stichprobenerhebung<br />
Sehr typische/ untypische Fälle<br />
→ stat. Signifikanz wird leichter erreicht!<br />
Hilfreich bei Generierung neuer Ideen
FAZIT<br />
Die nichtzufallsgesteuerten Auswahlverfahren<br />
entbehren der Gr<strong>und</strong>lagen für die<br />
Berechnung des Standardfehlers.<br />
Inferenzstatistische Aussagen sind daher für<br />
diese Fälle kaum möglich!<br />
Insgesamt verzerrt Probandenschw<strong>und</strong> die<br />
Stichprobe, so dass eine Einschränkung der<br />
Validität (Gültigkeit) unvermeidbar ist!
Stichprobenauswahl<br />
Was ist der zentrale inhaltliche Unterschied<br />
zwischen beiden Typen der<br />
Stichprobengewinnung?<br />
Zufallsgesteuerte Verfahren garantieren, dass<br />
die Stichprobe eine repräsentative Auswahl<br />
der interessierenden Population darstellt. Nur<br />
unter dieser Voraussetzung ist ein Schluß von<br />
der Stichprobe auf die zugr<strong>und</strong>e liegende<br />
Population – der Zweck der Inferenzstatistik –<br />
valide (gültig).
Schätzungen
Anforderungen an ein Schätzmaß<br />
- Erwartungstreue<br />
nicht-verzerrte Schätzung der Parameter (unbiased estimation)<br />
- Konsistenz<br />
Präzision der Schätzung steigt mit steigendem N<br />
- Effizienz<br />
Möglichst kleine/r Standardfehler/Streuung<br />
- Exhaustivität<br />
Die Daten aller Versuchspersonen müssen in die Berechnung<br />
des Schätzers mit eingehen<br />
Wie eignen sich die bekannten Kennwerte als Schätzer?
Intervallschätzung<br />
Konfidenzintervalle geben ein Intervall von<br />
Merkmalsausprägungen an, in dem ein Wert<br />
mit einer bestimmten Wahrscheinlichkeit liegt.<br />
Alternative: Punktschätzung<br />
Bsp. Geschätzte Populationsvarianz<br />
So kann ich mit Hilfe der Normalverteilung<br />
leicht sagen, in welchem Bereich eine beliebig<br />
gezogene Person mit 95%iger WS liegt.<br />
Oft werden Konfidenzintervalle nicht für<br />
Einzelpersonen verwendet, sondern für<br />
bestimmte Populationskennwerte, wie z.B. µ.
Konfidenzintervalle für den<br />
wahren Populationsmittelwert<br />
1 1 x x x x p<br />
<br />
2 x 2 x x x p<br />
<br />
,1 96x<br />
,1 96x<br />
x x p<br />
<br />
x p<br />
,2 57x<br />
,2 57x<br />
x<br />
<br />
<br />
. 68<br />
. 96<br />
9.<br />
9.
Mutungs- <strong>und</strong> Vertrauensintervall<br />
Bei der Schätzung eines Populationsparameters<br />
von einem Stichprobenparameter aus wird von<br />
einem Mutungsinvervall (Vermutungsintervall)<br />
gesprochen (Beispiel: Schätzung des wahren<br />
Mittelwertes anhand des Populationsmittelwerts)<br />
Bei einer Schätzung von einem Populationsparameter<br />
auf Stichprobenparameter wird ein<br />
Vertrauensintervall geschätzt. (Beispiel:<br />
Schätzung eines Einzelwertes, oder dem<br />
Mittelwert einer Stichprobe von 10 Personen)<br />
Manche Autoren unterscheiden auch nicht <strong>und</strong><br />
nennen beides Konfidenzintervalle.
<strong>Hypothesen</strong>prüfung
Gr<strong>und</strong>legende Idee<br />
Anhand von Stichprobenkennwerten werden<br />
<strong>Hypothesen</strong> für die Population getestet<br />
Zwei Stichproben aus einer Population? Oder<br />
aus zwei verschiedenen Populationen?<br />
Bedeutsamkeit einer Mittelwertsdifferenz oder<br />
Relevanz eines Zusammenhangs, einer<br />
Korrelation soll getestet werden!<br />
Wie groß muss mein gef<strong>und</strong>ener<br />
Mittelwertunterschied sein, damit keiner sagen<br />
kann, er sei zufällig entstanden?<br />
Ab wann ist er statistisch bedeutsam?
Vorgehen bei statistischen Tests:<br />
1. Formulierung der <strong>Hypothesen</strong> (gerichtet oder<br />
ungerichtet).<br />
heute!<br />
2. Berechnung eine empirischen Werts (z.B. t, r,…)<br />
3. Vergleich von empirischem Wert mit kritischem<br />
Wert (Tabelle)<br />
• Der kritische Wert hängt ab von den Freiheitsgraden<br />
<strong>und</strong> der Art der Hypothese<br />
• Je nachdem ob der emprische über oder unter<br />
dem kritischen Wert liegt wird die H0<br />
aufrechterhalten oder verworfen (=H1<br />
angenommen)
Nullhypothese & Alternativhypothese<br />
Nullhypothese (H 0):<br />
Diese “Negativhypothese” behauptet immer, dass es<br />
keine Mittelwertsunterschiede, beziehungsweise keine<br />
Zusammenhänge in der Population gibt.<br />
Alternativhypothese (H 1):<br />
Diese besagt, dass ein Unterschied oder ein<br />
Zusammenhang in der Population existiert. Die<br />
Alternativhypothese sollte immer aus einem<br />
Theoriegebäude, aus Vorstudien <strong>und</strong> der Literatur<br />
abgeleitet sein.
Statistische Formulierung von<br />
<strong>Hypothesen</strong><br />
Es sei μ1 die mittlere (…) in der Population<br />
der(...) <strong>und</strong> es sei μ2 die mittlere (...) in der<br />
Population der (...).<br />
Dann gilt:<br />
H0 : μ1 = μ2 <strong>und</strong><br />
H1 : μ1 = μ2<br />
bei einem alpha-Niveau von 5%.<br />
(ODER bei α = 0,05)
Fehler beim <strong>Hypothesen</strong>testen<br />
Aufgr<strong>und</strong> von Unsicherheiten bei der<br />
Stichprobenziehung besteht die Gefahr eines<br />
falschen Schlusses auf die Population.<br />
Es wird zwischen zwei möglichen Fehlern bei<br />
der Testung einer Hypothese unterschieden.
Zwei mögliche Fehler:<br />
alpha-Fehler: Ablehnung der “richtigen”<br />
Nullhypothese bei gültiger Nullhypothese<br />
(Fehler erster Art).<br />
beta-Fehler: Beibehaltung der “falschen”<br />
Nullhypothese bei gültiger Alternativhypothese<br />
(Fehler zweiter Art).
Beispiel: α-/β- Fehler<br />
!Feueralarm!<br />
Ein H<strong>und</strong> jault, eine Frau schreit, die Sirene springt<br />
mit ohrenbetäubendem Getöse an, von fern<br />
klingen Martinshorn <strong>und</strong> quietschende Reifen.<br />
Aber es ist nirgends ein Feuer zu finden.<br />
Fehlalarm?<br />
α - Fehler<br />
Die Scheune brennt lichterloh. Das unbarmherzige<br />
Feuer frisst sich unaufhaltsam durch die Stockwerke,<br />
schlängelt sich die Treppen hinauf, bis vor die Haustür.<br />
Die Anwohner schlafen seelenruhig, unwissend,<br />
ungeweckt.<br />
Fehlender Alarm? β - Fehler
Zur Übersicht:<br />
?<br />
?
Teststärke<br />
Die Teststärke ist die Wahrscheinlichkeit, dass<br />
ein in der Population vorhandener Unterschied<br />
bei statistischer Testung entdeckt wird. Sie<br />
berechnet sich mit 1 -<br />
Die Teststärke ist für das experimentelle Design<br />
wichtig <strong>und</strong> erlaubt Beurteilungen der Qualität<br />
erhobener Daten bzw. durchgeführter<br />
statistischer Untersuchungen.
Einfluss des β-Fehlers
Alpha-Fehler
α – Fehler (zwei Stichproben)
Einfluss des β-Fehlers (4:1)
Das war's für heute.<br />
Bis nächste Woche!<br />
Fragen an:<br />
S.Tomczyk@gmx.net