13.07.2015 Aufrufe

Von den Daten zu Wahrscheinlichkeiten

Von den Daten zu Wahrscheinlichkeiten

Von den Daten zu Wahrscheinlichkeiten

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Teil IIDer Weg <strong>zu</strong>r schließen<strong>den</strong> Statistik:<strong>Von</strong> <strong>den</strong> <strong>Daten</strong> <strong>zu</strong><strong>Wahrscheinlichkeiten</strong>StatSoz 127


6 Zufallsstichprobe und Parameter6.1 Parameter einer Grundgesamtheit6.2 Zufallsstichprobe und Bias6.3 Stichprobenfehler und Stichprobenverteilung desMittelwertes6.1 Parameter einer GrundgesamtheitWürde man alle Werte der Merkmalsträgereiner Grundgesamtheit beobachten (Vollerhebung),so könnte man diese <strong>Daten</strong> mit deskriptivenMetho<strong>den</strong> (Häufigkeitsverteilung, statistischeMaßzahlen) auswerten. Man bestimmtaber damit statistische Maßzahlen einer Populationund nicht einer Stichprobe. Deshalb heißensie Populations–Mittelwert (µ), Populations–Standardabweichung (σ), etc.StatSoz 128


Maßzahlen einer Population (Grundgesamtheit)wer<strong>den</strong> als Parameter bezeichnet.Symbolisch wer<strong>den</strong> sie üblicherweise durch griechischeBuchstaben dargestellt.Bezeichnungen:N Anzahl der Merkmalsträger einer Grundgesamtheity 1 , . . . , y N Ausprägungen der von 1 bis Ndurchnummerierten Merkmalsträgern Stichprobenumfangx 1 , . . . , x n StichprobeDie wichtigsten Parameter und ihre empirischenGegenstücke sind in der folgen<strong>den</strong> Tabelle <strong>zu</strong>sammengefasst.StatSoz 129


Tabelle 6–1 Wichtige Parameter und ihreempirischen GegenstückeGrundgesamtheit(Populations–)MittelwertStichprobe (<strong>Daten</strong>)Stichprobenmittelµ = 1 N∑ Nj=1 y j ¯x = 1 n∑ ni=1 x i(Populations–)Varianz Stichprobenvarianzσ 2 = 1 ∑ NN j=1 (y j − µ) 2 s 2 = 1 ∑ nn−1 i=1 (x i − ¯x n ) 2(Populations–)Stichproben–Standardabweichung standardabweichungσ = √ σ 2 s = √ s 2(Populations–)Median Stichproben–Mediany (N+1), N ungerade x2( n+12), n ungerade(y( N2) + y ) ( )( N /2,2 +1) x( n2) + x (n2+1) /2,N gera<strong>den</strong> geradeStatSoz 130


Bemerkung: Zwischen Maßzahlen einer Stichprobeund Maßzahlen einer Population (<strong>den</strong> sogenanntenParametern) besteht ein wesentlichergedanklicher Unterschied:Maßzahlen einer Population sind nichtvariabel, sondern fest und daher vom,,Zufall” nicht beeinflussbar.Man bezeichnet sie auch als theoretische Maßzahlen(µ, σ, ...) im Unterschied <strong>zu</strong> <strong>den</strong> empirischenMaßzahlen (¯x, s, ...), die sich auf eineStichprobe beziehen. Mit ,,theoretisch” ist nichtgemeint, dass diese Zahlen nur theoretisch exisitieren;sie existieren real, sind aber meistensnicht bekannt und müssen durch empirische Untersuchungenbestimmt (,,geschätzt”) wer<strong>den</strong>.Die Variabilität steckt in <strong>den</strong> <strong>Daten</strong> (Stichproben)und somit auch in <strong>den</strong> empirischenKenngrößen! (vgl. Tab. 6–2 in Abschnitt 6.3)StatSoz 131


6.2 Zufallsstichprobe und BiasUm von einer Stichprobe auf Eigenschaften einerGrundgesamtheit schließen <strong>zu</strong> können, muss dieStichprobe einedarstellen.ZufallsauswahlBei einer <strong>zu</strong>fälligen Stichprobe darf man am ehestenannehmen, dass sie auch repräsentativ ist,die tatsächliche Situation in einer Grundgesamtheitalso am besten widerspiegelt.Zufallsauswahl: Jeder Merkmalsträger gelangtmit einer berechenbaren Chance (Wahrscheinlichkeit)in die Stichprobe.Eine Zufallsauswahl ist keine willkürliche Auswahl.Die Merkmalsträger wer<strong>den</strong> auch nichtbewusst (gezielt) gezogen. Auf keinen Fall darfStatSoz 132


das Auswahlprinzip im Zusammenhang mitdem <strong>zu</strong> untersuchen<strong>den</strong> Merkmal stehen!Grundlegende statistische Verfahren setzen einfacheStichproben voraus! Einfache Zufallsstichprobe(simple random sample) bedeutet1. Uneingeschränktheit: Jeder Merkmalsträgerbesitzt die gleiche Chance (Wahrscheinlichkeit),in die Stichprobe aufgenommen <strong>zu</strong> wer<strong>den</strong>.2. Unabhängigkeit: Die Ziehungen erfolgenunabhängig. Die Wahrscheinlichkeit ausgewählt<strong>zu</strong> wer<strong>den</strong> ist bei jeder Ziehung gleich.Bei homogenen Grundgesamtheiten erhält manuneingeschränkte Stichproben durch die bei<strong>den</strong>folgen<strong>den</strong> Auswahlmodelle:StatSoz 133


• Ziehen mit Zurücklegen(sampling with replacement)• Ziehen ohne Zurücklegen(sampling without replacement)Für beide Auswahlmodelle gilt: Die Chance einesMerkmalsträgers, in eine Stichprobe vomUmfang n aus einer Grundgesamtheit mit NMerkmalsträgern aufgenommen <strong>zu</strong> wer<strong>den</strong>, beträgtnNAuswahlmodell ,,Ziehen mit Zurücklegen”:Nachteil: Mehrfachziehung eines Merkmalsträgersist möglich.Vorteil: Unabhängigkeit, d. h. ,,Ziehen mitZurücklegen” führt <strong>zu</strong> einer einfachen Stichprobe.StatSoz 134


Bemerkung: Wenn die Grundgesamtheit imVerhältnis <strong>zu</strong>m Stichprobenumfang sehr großist, wenn also N wesentlich größer als n ist(was in der Praxis überwiegend der Fall ist), sobesteht zwischen ,,Ziehen mit Zurücklegen” und,,Ziehen ohne Zurücklegen” kein bedeutenderUnterschied. Eine durch ,,Ziehen ohne Zurücklegen”resultierende (uneingeschränkte) Stichprobelässt sich dann näherungsweise als eineeinfache Stichprobe auffassen.In der Praxis wird eine durch ,,Ziehen ohneZurücklegen” gewonnene Stichprobe als einfachangesehen, falls folgende Faustregel erfüllt ist:nN ≤ 0.05Der Quotient n/N heißt Auswahlsatz.StatSoz 135


BiasDas Schließen von einer Stichprobe auf eineGrundgesamtheit ist nur dann <strong>zu</strong>lässig, wennnur <strong>zu</strong>fällige Fehler vorkommen (Stichprobenfehler).In diesem Fall gilt die Stichprobe als repräsentativim Sinne von ,,kein systematischerFehler”. Treten in einer Stichprobe systematischeFehler auf, wer<strong>den</strong> Resultate bzw. statistischeAussagen als verfälscht, verzerrt (biased)bezeichnet.Systematische Fehler beeinflussen die Validität(Gültigkeit, Rechtskräftigkeit) statistischerAuswertungen. Zufällige Fehlerhingegen beeinflussen wohl die Genauigkeitstatistischer Ergebnisse und die daraus resultieren<strong>den</strong>Schlußfolgerungen, nicht aberderen Validität!StatSoz 136


Man unterscheidet drei allgemeine Kategorienvon Bias–Fehlern:• Bias durch die Auswahl der Merkmalsträgerin einer Stichprobe (sampling bias), wenn z. B.bestimmte Merkmalsträger eine größere Chancebesitzen in die Stichprobe aufgenommen <strong>zu</strong>wer<strong>den</strong>,• Bias durch Vermengung, wenn einflussreicheFaktoren (Alter, Geschlecht, soziale Indikatoren)nicht berücksichtigt wer<strong>den</strong>,• Bias durch Falschinformation, verursacht etwadurch systematisch verfälschte Messungenoder Antworten bei Umfragen.Bemerkung: Bias–Fehler können nur durch andere,vergleichende Untersuchungen entdecktwer<strong>den</strong>.StatSoz 137


6.3 Stichprobenfehler und Stichprobenverteilungdes MittelwertesFrage: Welcher Zusammenhang besteht zwischendem Populations–Mittelwert µ und demStichprobenmittel ¯x?Eine Antwort auf diese Frage geben die folgen<strong>den</strong>Überlegungen:Hinweis: Es handelt sich im Folgen<strong>den</strong> umeinen theoretischen Gedankengang – ein Gedankenexperiment– nicht um eine Anleitung<strong>zu</strong>r praktischen Vorgehensweise. Erst aus diesentheoretischen Überlegungen heraus wird klar,warum theoretische Verteilungen ins Spiel kommen(müssen) und welche statistische Aussagen<strong>zu</strong> erwarten sind.Zunächst ein Zahlenbeispiel 6.1:StatSoz 138


Grundgesamtheit mit N = 5 MerkmalsträgernEinheit WertA 2.2B 2.0C 1.6D 2.4E 1.8Populations–Mittelwert:µ = 1 5· (2.2 + 2.0 + 1.6 + 2.4 + 1.8) = 2Populations–Varianz:σ 2 = 1 5 · ((2.2− 2) 2 + . . . + (1.8 − 2) 2) = 0.08Betrachtet wer<strong>den</strong> Zufallsstichproben vom Umfangn = 3. Auswahlprinzip ist ,,Ziehen ohneZurücklegen”. Es soll dabei nicht auf die Reihenfolgeder <strong>Daten</strong>erhebung ankommen. DannStatSoz 139


gibt es( Nn)=( 53)= 5!2! · 3! = 10mögliche Stichproben.Tab. 6–2: Mögliche Stichproben vom Umfang 3mit ihren Kennwerten ¯x und s 2Stichprobe <strong>Daten</strong> ¯x s 2Nr. 1: ABC 2.2, 2.0, 1.6 ¯x 1 = 1.93 s 2 1 = 0.013Nr. 2: ABD 2.2, 2.0, 2.4 ¯x 2 = 2.20 s 2 2 = 0.040Nr. 3: ABE 2.2, 2.0, 1.8 ¯x 3 = 2.00 s 2 3 = 0.040Nr. 4: ACD 2.2, 1.6, 2.4 ¯x 4 = 2.07 s 2 4 = 0.173Nr. 5: ACE 2.2, 1.6, 1.8 ¯x 5 = 1.87 s 2 5 = 0.093Nr. 6: ADE 2.2, 2.4, 1.8 ¯x 6 = 2.13 s 2 6 = 0.093Nr. 7: BCD 2.0, 1.6, 2.4 ¯x 7 = 2.00 s 2 7 = 0.160Nr. 8: BCE 2.0, 1.6, 1.8 ¯x 8 = 1.80 s 2 8 = 0.040Nr. 9: BDE 2.0, 2.4, 1.8 ¯x 9 = 2.07 s 2 9 = 0.093Nr. 10 CDE 1.6, 2.4, 1.8 ¯x 10 = 1.93 s 2 10 = 0.173StatSoz 140


Beachte: Es muss nicht ¯x = µ sein. In <strong>den</strong>meisten Fällen wird ¯x ≠ µ gelten. Im Zahlenbeispielgilt für 2 (von insgesamt 10) Stichproben¯x = 2 = µ. Alle anderen Stichproben führen <strong>zu</strong>anderen Mittelwerten. Diese Abweichungen vomPopulationsmittelwert µ = 2 sind rein <strong>zu</strong>fälligerNatur, sind also ausschließlich auf die Variabilitätder <strong>Daten</strong> <strong>zu</strong>rück<strong>zu</strong>führen (Stichprobenfehler!).Bildet man in Bsp. 6.1 <strong>den</strong> Mittelwert über alle10 Stichprobenmittelwerte, so gilt110· (1.93 + 2.20 + · · · + 1.93) = 2 = µDieser Zusammenhang gilt ganz allgemein: Sei( ) Nm =ndie Anzahl der möglichen Stichproben vom Umfangn aus einer N–elementigen Grundgesamt-StatSoz 141


heit (Ziehen ohne Zurücklegen, keine Berücksichtigungder Reihenfolge). Bezeichnen¯x 1 , . . . , ¯x mdie Mittelwerte von Stichprobe Nr. 1 bis StichprobeNr. m, so gilt1mm∑i=1¯x i = µ (6.1)In Worten:Arithmetisches Mittel aller Stichprobenmittel<strong>zu</strong>m festen Stichprobenumfang ist gleichdem Mittelwert µ der Grundgesamtheit.(6.1) besagt Folgendes: Der Populationsmittelwertµ wird durch das Stichprobenmittel ¯x wedersystematisch unter– noch überschätzt. ManStatSoz 142


spricht von einer erwartungstreuen oder unverzerrtenSchät<strong>zu</strong>ng (unbiased estimation).Man kann die Streuung der Stichprobenmittel¯x 1 , ¯x 2 , . . . , ¯x mum <strong>den</strong> Populations–Mittelwert µ berechnen:σ 2¯x = 1 mm∑j=1(¯xj − µ ) 2=σ 2n · N − nN − 1(6.2)Verifizierung von Formel (6.2) anhand Bsp. 6.1:Hier ist N = 5, n = 3, µ = 2 und σ 2 = 0.08.Man erhältσ 2n · N − nN − 1 = 0.083 · 5 − 35 − 1 = 0.086 = 0.013StatSoz 143


und gemäß <strong>den</strong> Werten aus Tab. 6–2, vorletzteSpalte, gilt11010∑j=1(¯xj − 2 ) 2= 110 ·((1.93 − 2) 2 + (2.20 − 2) 2+ · · · + (1.93 − 2) 2 )= 0.013Zieht man in (6.2) die Wurzel, so erhält manσ¯x =√ 1 mm∑(¯x j − µ) 2j=1= σ √ n ·√N − nN − 1StatSoz 144


Der Parameter σ¯x (= Stichprobenfehler von ¯x)heißtStandardfehler des Mittelwertes(standard error mean, SEM):SEM = σ √ n ·√N − nN − 1(6.3)Bemerkung: Bei einfachen Stichproben (,,Ziehenmit Zurücklegen”) giltStandardfehler des Mittelwertes:SEM = σ √ n(6.4)Der <strong>zu</strong>sätzliche Faktor in (6.3),√N − nN − 1StatSoz 145


wird häufig als Endlichkeitsfaktor bezeichnet.Ist N im Verhältnis <strong>zu</strong> n groß, so istN − nN − 1 =NN − 1 −nN − 1 ≈ 1 − n N ≈ 1und der Endlichkeitsfaktor kann vernachlässigtwer<strong>den</strong>. Faustregel: n/N ≤ 0.05In Bsp. 6.1 erhält man nach Formel (6.3)SEM = σ √ n ·√N − nN − 1= 0.283 √3 ·√5 − 35 − 1= 0.163 · 0.707= 0.115(nach Formel (6.4) erhält man SEM = 0.163).Formeln (6.3) und (6.4) zeigen Folgendes: MitStatSoz 146


wachsendem Stichprobenumfang n nimmt dieStreuung der Stichprobenmittel um <strong>den</strong> Populationsmittelwertµ ab! Anschaulich gesprochenbedeutet dies Folgendes. Bildet man ein Histogrammbezüglich aller Stichprobenmittel¯x 1 , ¯x 2 , . . . , ¯x mso konzentriert sich das Histogramm mit wachsendemStichprobenumfang n mehr und mehrum die Mitte µ.Die Häufigkeitsverteilung sämtlicher Stichprobenmittel(<strong>zu</strong>m festen Stichprobenumfang)nennt man die Stichprobenverteilungvon ¯x.Genauer spricht man auch von einer Stichprobenkennwertverteilung.StatSoz 147


Aus Tab. 6–2 ergibt sich die folgende Stichprobenverteilungvon ¯x:Tabelle 6–3 Ohne KlassierungWert von ¯x relative Häufigkeit1.80 1/10 = 0.11.87 1/10 = 0.11.93 2/10 = 0.22.00 2/10 = 0.22.07 2/10 = 0.22.13 1/10 = 0.12.20 1/10 = 0.1Tabelle 6–4 Mit KlassierungKlasse Intervall FlächeKlasse 1 [170, 190) F 1 = 0.2Klasse 2 [190, 210) F 2 = 0.6Klasse 3 [210, 230) F 3 = 0.2Im Histogramm wird als Darstellungsmittel dieFläche gewählt, d.h. die Flächen repräsentierendie relativen Klassenhäufigkeiten. (Zur Erinnerung:Gesamtfläche = Summe der relativenKlassenhäufigkeiten = 1)StatSoz 148


Zusammenfassung: Kennwerte der• Verteilung einer Grundgesamtheit:Mittelwert µStandardabweichung σ• Verteilung einer Stichprobe:empirischer Mittelwert ¯xempirische Standardabweichung s• Stichprobenverteilung von ¯x:Mittelwert µ (nach Formel (6.1))Standardabweichung σ¯x = SEMSEM = σ √ n ·√N − nN − 1(nach Formel (6.3))SEM = σ √ n(nach Formel (6.4))StatSoz 149


Bei Bekanntheit der Stichprobenverteilung von ¯xwäre man in der Lage, die Präzision der Parameterschät<strong>zu</strong>ng¯x genau <strong>zu</strong> beschreiben. Erwartetwird, dass die ,,meisten” Stichprobenmittelwerteinnerhalb der Grenzen µ ± SEM liegen:µ − SEM ≤ ¯x ≤ µ + SEM (6.5)In Bsp. 6.1 ergeben sich die Grenzen2 − 0.115 = 1.885 und 2 + 0.115 = 2.115und nach Tab. 6.3 bzw. Tab. 6.4 liegen 60%( ˆ= Flächenanteil F 2 ) der Stichprobenmittel innerhalbdieser bei<strong>den</strong> Grenzen.Frage: Wie lässt sich die Präzision der Parameterschät<strong>zu</strong>ng¯x beurteilen, wenn die Stichprobenverteilungnicht bekannt ist?StatSoz 150


Häufig zeigt das Histogramm der Stichprobenverteilungvon ¯x (wenn die Flächen die relativenKlassenhäufigkeiten repräsentieren) einenglockenkurvenförmigen Verlauf (Dichte der Normalverteilung).Diese empirische Tatsache lässt sich durchein wahrscheinlichkeitstheoretisches Gesetz begrün<strong>den</strong>,der zentrale Grenzwertsatz (Kap.8).Die Stichprobenverteilung des Mittelwertes lässtsich somit annähernd durch eine Normalverteilungbeschreiben. Daran ändert sich auch nichts,wenn man die Stichprobenverteilung des standardisiertenStichprobenmittelsbetrachtet.¯x − µSEMStatSoz 151


Warum? Durch die Standardisierung (dies ist einelineare Transformation) ändert sich die Formder Verteilung nicht, vgl. Abschnitt 4.4. D. h.die Stichprobenverteilung des standardisiertenMittelwertes (¯x − µ)/SEM lässt sich ebenfallsdurch einen glockenkurvenförmigen Verlauf darstellen.Dies ist dann die Dichte der Standard–Normalverteilung ϕ.Dass es sich um eine Standardisierung handeltist klar (vgl. Abschnitt 4.4): Die standardisiertenStichprobenmittelwerte¯z i = ¯x i − µSEM¯x,i = 1, . . . , mhaben die Lage 0 und die Streuung 1:1mm∑i=1¯z i = 0 und SEM¯z = 1StatSoz 152


Zurück <strong>zu</strong>r Beantwortung der Frage: Zunächstist (6.5) gleichbedeutend mit−1 ≤ ¯x − µSEM ≤ 1Folglich ist der Anteil der Stichprobenmittelwerte,die (6.5) erfüllen gleich dem Anteil derstandardisierten Stichprobenmittelwerte, die zwischen−1 und 1 liegen. Und dieser Anteil beträgt60% ( ˆ= Flächenanteil F 2 im Histogramm nachTab. 6.4).Dieser Anteilswert entspricht annährend derFläche zwischen der Dichte der ϕ und dem Achsenabschnitt[−1, 1]. Die Fläche beträgt∫ 1−1ϕ(x) dx = 0.68StatSoz 153


Abbildung 6–1 Fläche zwischen ϕ und demAchsenabschnitt [−1, 1]Schätzen des StandardfehlersDie Bedingung (6.5) ist genau dann erfüllt, wennder Populationsmittelwert µ im Bereich ¯x±SEMliegt:¯x − SEM ≤ µ ≤ ¯x + SEM (6.6)Für die statistische Anwendung ist (6.6) wesentlichinteressanter. Denn µ ist unbekannt undman versucht einen Bereich an<strong>zu</strong>geben, so dassµ mit einer gewissen Wahrscheinlichkeit in diesemBereich liegen wird (Intervallschät<strong>zu</strong>ng).StatSoz 154


Da σ und somit SEM unbekannt ist, verwendetman bei Vorliegen einer konkreten Stichprobex 1 , . . . , x n die Stichprobenstandardabweichungs als Schätzwert für σ und erhält mit Formel(6.4) <strong>den</strong>geschätzten Standardfehler desMittelwertes (estimated standard errormean, ESEM):ESEM =s √ nMan weiß also, in welcher Größenordnung die(<strong>zu</strong>fällige) Abweichung eines Stichprobenmittels¯x vom Populationsmittelwert µ erwartet wer<strong>den</strong>kann!Bemerkung: (i) Formel (6.3) ist <strong>zu</strong>m Schätzendes Standardfehlers nicht geeignet, da N imAllgemeinen nicht bekannt ist.StatSoz 155


(ii) Bei einfachen Stichproben (,,Ziehen mitZurücklegen”) ist die Stichprobenvarianz s 2 eineunverzerrte Schät<strong>zu</strong>ng des Parameters σ 2 .In Bsp. 6.1 giltSEM = σ √ n=√0.08√3= 0.163Bei Vorliegen der Stichprobe Nr. 4 ist s 2 = 0.173und man erhältESEM =s √ n=√0.173√3= 0.240Alle Werte, die nur <strong>zu</strong>fallsbedingt von ¯x abweichen,sind neben der (erwartungstreuen)Schät<strong>zu</strong>ng ¯x ebenfalls plausible Schätzwerte für<strong>den</strong> Parameter µ, also etwa alle Werte im Intervall[¯x −s √ n, ¯x +√ s ]nStatSoz 156


Man spricht von einer Intervallschät<strong>zu</strong>ng(Kap. 9).Beachte: Die Variabilität steckt im Intervall,<strong>den</strong>n die Intervallgrenzen¯x ±s √ nhängen von <strong>den</strong> empirischen Kenngrößen ¯x unds ab. Der Parameter µ ist fest und muss nichtim obigen Intervall liegen.In Bsp. 6.1 führt die Stichprobe Nr. 4 (¯x = 2.07)<strong>zu</strong>m Intervall[2.07 − 0.240, 2.07 + 0.240] = [1.83, 2.31]Der Populationsmittelwert µ = 2 liegt in diesemIntervall. Dies ist sicher. Aber: Diese 100%igeSicherheit ist nur vorhan<strong>den</strong>, weil µ = 2 bekanntist!!!StatSoz 157


Die Crux ist: µ ist i. A. unbekannt!Konsequenz: Es besteht keine 100%ige Sicherheitdarüber, ob der Mittelwert µ im obigenIntervall liegt.Wie bewertet, quantifiziert man diese (Un–) Sicherheit?Rein logisch gesehen gibt es nur zwei Möglichkeiten:Entweder µ liegt in diesem Intervall odernicht. Ad hoc–Lösung: Jede Möglichkeit besitztdie gleiche Wahrscheinlichkeit, also 50%ige Sicherheit.Die Chancen stehen fifty–fifty.Aber: Die Sicherheit darüber, dass µ im Intervall[¯x − s/ √ n, ¯x + s/ √ n]liegt, kann höher bewertet wer<strong>den</strong>! Da<strong>zu</strong> folgendeTabelle:StatSoz 158


Tab. 6–5: Geschätzte Standardfehler und Intervallschät<strong>zu</strong>ngender Stichproben aus Tab. 6–2Stichprobe ESEM = s/ √ n [¯x − s/ √ n, ¯x + s/ √ n]Nr. 1: ABC s 1 / √ 3 = 0.066 [1.864, 1.996]Nr. 2: ABD s 2 / √ 3 = 0.115 [2.085, 2.315]Nr. 3: ABE s 3 / √ 3 = 0.115 [1.885, 2.115]Nr. 4: ACD s 4 / √ 3 = 0.240 [1.830, 2.310]Nr. 5: ACE s 5 / √ 3 = 0.176 [1.694, 2.046]Nr. 6: ADE s 6 / √ 3 = 0.176 [1.954, 2.306]Nr. 7: BCD s 7 / √ 3 = 0.231 [1.769, 2.231]Nr. 8: BCE s 8 / √ 3 = 0.115 [1.685, 1.915]Nr. 9: BDE s 9 / √ 3 = 0.176 [1.894, 2.246]Nr. 10 CDE s 10 / √ 3 = 0.240 [1.690, 2.170]<strong>Von</strong> <strong>den</strong> 10 Stichproben führen nur 3 Stichproben(Nr. 1, 2 und 8) <strong>zu</strong> einer Intervallschät<strong>zu</strong>ng,die <strong>den</strong> Parameter µ = 2 nicht enthalten. DieChance, dass ein konkret vorliegendes Intervall<strong>den</strong> Parameter µ = 2 enthält, wäre also sinn-StatSoz 159


vollerweise mit 7/10, also mit 70% <strong>zu</strong> bewerten.Dies ist ein rein theoretischer Gedankengang, daµ nicht bekannt ist und in der Praxis nur eineStichprobe <strong>zu</strong>r Verfügung steht. Die Stichprobenverteilungvon ¯x ist ebenfalls nicht bekannt.Trotzdem kann die Sicherheit annähernd mit70% quantifiziert wer<strong>den</strong>, wenn man theoretischeVerteilungen (z. B. die Normalverteilung)<strong>zu</strong>lässt!Zunächst:¯x −s √ n≤ µ ≤ ¯x +s √ nist genau dann erfüllt, fallsgilt.−1 ≤ ¯x − µs/ √ n ≤ 1StatSoz 160


Wenn der Stichprobenumfang n ≥ 30 ist, dannlässt sich die Stichprobenverteilung von¯x − µs/ √ ndurch die Diche ϕ der Standard–Normalverteilungbeschreiben (zentraler Grenzwertsatz, Kap. 8).Folglich kann man sagen: Mit einer Wahrscheinlichkeitvon ca. 0.68 liegt der Parameter µ imIntervall [¯x − s/ √ n, ¯x + s/ √ n].Zur Erinnerung:∫ 1−1ϕ(x) dx = 0.68StatSoz 161


Theoretische Verteilungen (man spricht auch vonModellen) beruhen auf dem Begriff der Wahrscheinlichkeit.Dies sind Zahlen, die zwischen 0(völlige Unsicherheit) und 1 (völlige Sicherheit)liegen.Statistische Entscheidungen sind immerEntscheidungen unter Unsicherheit. DurchWahrscheinlichkeitsaussagen wird diese Unsicherheitnicht aufgehoben, wohl aberquantitativ erfassbar!Die statistische Welt liegt zwischen0 und 1StatSoz 162

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!