Stichprobenziehung - Fehler/Fehler - Universität Bielefeld
Stichprobenziehung - Fehler/Fehler - Universität Bielefeld
Stichprobenziehung - Fehler/Fehler - Universität Bielefeld
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
Einleitung<br />
Grundbegriffe<br />
Stichprobe oder Totalerhebung<br />
Grundgesamtheit<br />
Auswahlgesamtheit und Stichprobe<br />
Zufallsstichproben<br />
<strong>Stichprobenziehung</strong><br />
Jost Reinecke<br />
<strong>Universität</strong> <strong>Bielefeld</strong><br />
7. April 2005<br />
Jost Reinecke <strong>Stichprobenziehung</strong>
Einleitung<br />
Grundbegriffe<br />
Einleitung<br />
Grundbegriffe<br />
Stichprobe oder Totalerhebung<br />
Grundgesamtheit<br />
Auswahlgesamtheit und Stichprobe<br />
Zufallsstichproben<br />
Stichprobe oder Totalerhebung<br />
Grundgesamtheit<br />
Auswahlgesamtheit und Stichprobe<br />
Zufallsstichproben<br />
Einfache Zufallsstichproben<br />
Komplexe Zufallsstichproben<br />
Jost Reinecke <strong>Stichprobenziehung</strong>
Einleitung<br />
Einleitung<br />
Grundbegriffe<br />
Stichprobe oder Totalerhebung<br />
Grundgesamtheit<br />
Auswahlgesamtheit und Stichprobe<br />
Zufallsstichproben<br />
Die Berücksichtigung aller Untersuchungseinheiten ist in der Regel<br />
zu kosten- und zeitaufwändig. Daher beschränkt man sich auf eine<br />
gewisse Anzahl von Untersuchungseinheiten, den Stichproben, um<br />
Aussagen über Sachverhalte in der interessierenden Gesamtheit<br />
treffen zu können.<br />
Die <strong>Stichprobenziehung</strong> hängt unmittelbar mit der<br />
Wahrscheinlichkeitstheorie zusammen:<br />
1. Die Wahrscheinlichkeitstheorie läßt Angaben über die<br />
Wahrscheinlichkeit der Zusammensetzung einer Stichprobe zu.<br />
2. Bei der Generalisierung von Stichprobendaten können<br />
Angaben über die Wahrscheinlichkeit getroffen werden, mit<br />
der Kennwerte in der Population abgebildet werden können.<br />
Jost Reinecke <strong>Stichprobenziehung</strong>
Einleitung<br />
Grundbegriffe<br />
Stichprobe oder Totalerhebung<br />
Grundgesamtheit<br />
Auswahlgesamtheit und Stichprobe<br />
Zufallsstichproben<br />
Grundbegriffe<br />
Grundgesamtheit (Population):<br />
Elemente bzw. Personen, auf die sich Aussagen einer statistischen<br />
Analyse beziehen. Die Grundgesamtheit ist sowohl sachlich als<br />
auch räumlich und zeitlich exakt zu definieren. In den meisten<br />
Fällen ist es aus zeitlichen und finanziellen Gründen nicht möglich,<br />
alle Einheiten der Grundgesamtheit zu erheben (Totalerhebung).<br />
Man wird sich daher auf eine Auswahl (Stichprobe) beschränken,<br />
die auch häufig sehr viel intensiver und präziser als eine<br />
Totalerhebung durchgeführt werden kann.<br />
Beispiel: Wählerbefragung - sämtliche Wahlberechtigte der Stadt<br />
Köln / des Landes NRW / der BRD.<br />
Jost Reinecke <strong>Stichprobenziehung</strong>
Einleitung<br />
Grundbegriffe<br />
Stichprobe oder Totalerhebung<br />
Grundgesamtheit<br />
Auswahlgesamtheit und Stichprobe<br />
Zufallsstichproben<br />
Parameter der Grundgesamtheit:<br />
µ: Mittelwert<br />
σ 2 : Varianz<br />
σ: Standardabweichung,<br />
π (manchmal auch θ): Anteilswert<br />
N: Fallzahl in der Grundgesamtheit<br />
Jost Reinecke <strong>Stichprobenziehung</strong>
Einleitung<br />
Grundbegriffe<br />
Stichprobe oder Totalerhebung<br />
Grundgesamtheit<br />
Auswahlgesamtheit und Stichprobe<br />
Zufallsstichproben<br />
Stichprobe (Sample):<br />
Auswahl von Elementen bzw. Personen der Gesamtheit. Eine<br />
Stichprobe soll ein möglichst repräsentatives Bild der<br />
Grundgesamtheit liefern. Handelt es sich um eine Zufallsstichprobe,<br />
bei der die Erhebungseinheiten nach dem Zufallsprinzip ausgewählt<br />
wurden, dann können die Schätzverfahren und Hypothesentests der<br />
schließenden Statistik angewendet werden.<br />
Beispiel: Stichprobe von Wählern.<br />
Jost Reinecke <strong>Stichprobenziehung</strong>
Einleitung<br />
Grundbegriffe<br />
Stichprobe oder Totalerhebung<br />
Grundgesamtheit<br />
Auswahlgesamtheit und Stichprobe<br />
Zufallsstichproben<br />
Parameter der Stichprobe:<br />
x: Mittelwert<br />
s: Standardabweichung<br />
s 2 Varianz<br />
p: Anteilswert<br />
n: Stichprobenumfang<br />
Jost Reinecke <strong>Stichprobenziehung</strong>
Einleitung<br />
Grundbegriffe<br />
Stichprobe oder Totalerhebung<br />
Grundgesamtheit<br />
Auswahlgesamtheit und Stichprobe<br />
Zufallsstichproben<br />
Erhebungseinheiten: Elemente der Population, auf die sich die<br />
Auswahl bezieht und die überhaupt eine Chance haben, in die<br />
Stichprobe aufgenommen zu werden.<br />
Stichprobenverfahren: Vorschrift, die festlegt, in welcher Weise<br />
Elemente der Grundgesamtheit ausgewählt werden.<br />
1. Zufallsauswahl: Resultat einer Zufallsauswahl sind<br />
Zufallsstichproben.<br />
2. Bewußte Auswahl: Quotenstichproben<br />
3. Willkürliche Auswahl: Psychologische Experimente<br />
Stichprobenumfang: Anzahl der ausgewählten Elemente, die in<br />
der Regel mit N bezeichnet werden.<br />
Jost Reinecke <strong>Stichprobenziehung</strong>
Einleitung<br />
Grundbegriffe<br />
Stichprobe oder Totalerhebung<br />
Grundgesamtheit<br />
Auswahlgesamtheit und Stichprobe<br />
Zufallsstichproben<br />
Stichprobe oder Totalerhebung<br />
Uns interessiert ein Kennwert einer Gesamtheit, z.B. das<br />
durchschnittliche Nettoeinkommen der Haushalte in <strong>Bielefeld</strong>.<br />
1. Totalerhebung: Man kann alle <strong>Bielefeld</strong>er Haushalte nach<br />
ihrem Nettoeinkommen fragen und dann den Mittelwert<br />
berechnen.<br />
2. Stichprobe: Man kann einige <strong>Bielefeld</strong>er Haushalte auswählen<br />
und diese über ihr Nettoeinkommen befragen. Wenn die<br />
Haushalte nach bestimmten Regeln ausgewählt werden,<br />
können wir anschließend mit einer gewissen<br />
Wahrscheinlichkeit auf das mittlere Nettoeinkommen aller<br />
<strong>Bielefeld</strong>er Haushalte schließen.<br />
Jost Reinecke <strong>Stichprobenziehung</strong>
Einleitung<br />
Grundbegriffe<br />
Stichprobe oder Totalerhebung<br />
Grundgesamtheit<br />
Auswahlgesamtheit und Stichprobe<br />
Zufallsstichproben<br />
Die Totalerhebung hat den Vorteil, dass die gesuchten Kennwerte<br />
genau angegeben werden können.<br />
Beispiel: Das mittlere Haushaltsnettoeinkommen in <strong>Bielefeld</strong><br />
beträgt X Euro.<br />
Bei einer Stichprobe würde das Ergebnis komplizierter ausfallen.<br />
Beispiel: Mit einer Wahrscheinlichkeit von 95% liegt das<br />
Haushaltsnettoeinkommen in <strong>Bielefeld</strong> in einem Intervall von X<br />
Euro ± Y Euro.<br />
Aufgrund der Stichprobenerhebung weist das Ergebnis ein<br />
Unsicherheitsintervall aus.<br />
Jost Reinecke <strong>Stichprobenziehung</strong>
Einleitung<br />
Grundbegriffe<br />
Stichprobe oder Totalerhebung<br />
Grundgesamtheit<br />
Auswahlgesamtheit und Stichprobe<br />
Zufallsstichproben<br />
Warum wird dann nicht in jedem Fall eine Totalerhebung<br />
durchgeführt?<br />
Vorteile von Stichprobenerhebungen:<br />
◮ Sie sind billiger als Totalerhebungen.<br />
◮ Die Ergebnisse stehen bei Stichprobenerhebungen schneller<br />
zur Verfügung als bei Totalerhebungen.<br />
◮ Bei Stichprobenerhebungen ist eine geringere Größe des<br />
Mitarbeiterstabes notwendig als bei Totalerhebungen. Die<br />
Mitarbeiter können dafür spezieller geschult werden.<br />
◮ Es ist bei Stichprobenerhebungen ein besserer Umgang mit<br />
Ausfällen, z.B. aufgrund von Nichterreichbarkeit der zu<br />
Befragenden, möglich als bei Totalerhebungen.<br />
Jost Reinecke <strong>Stichprobenziehung</strong>
Einleitung<br />
Grundbegriffe<br />
Stichprobe oder Totalerhebung<br />
Grundgesamtheit<br />
Auswahlgesamtheit und Stichprobe<br />
Zufallsstichproben<br />
Nachteile von Stichprobenerhebungen:<br />
◮ Bei verhältnismäßig kleinen Gesamtheiten, zum Beispiel vom<br />
Umfang N = 300, ist es in der Regel wenig sinnvoll, eine<br />
Stichprobe zu ziehen.<br />
◮ Eine Totalerhebung ist vorteilhafter, wenn Aussagen zu<br />
kleinen Subpopulationen innerhalb der Gesamtheit getroffen<br />
werden sollen. Diese sind bei einer Stichprobenerhebung<br />
wesentlich unpräziser als bei einer Totalerhebung.<br />
◮ In gewissen Fällen verbietet sich eine Stichprobenerhebung<br />
und die Totalerhebung ist die einzige Möglichkeit. Dies gilt<br />
z.B. für so genannte Rückrufaktionen bei Autos.<br />
Jost Reinecke <strong>Stichprobenziehung</strong>
Einleitung<br />
Grundbegriffe<br />
Stichprobe oder Totalerhebung<br />
Grundgesamtheit<br />
Auswahlgesamtheit und Stichprobe<br />
Zufallsstichproben<br />
Grundgesamtheit<br />
Die Menge aller Elemente, für die die aus der Stichprobe<br />
gewonnenen Aussagen gültig sein sollen, bezeichnet man als<br />
Grundgesamtheit oder Untersuchungsgesamtheit. Die<br />
Grundgesamtheit muss zu Beginn der Untersuchung sachlich,<br />
räumlich und zeitlich abgegrenzt werden.<br />
Beispiel: In einer Erhebung sollte festgestellt werden, wie sich die<br />
Änderung des Gesetzes über den Erziehungsurlaub aus dem Jahr<br />
1986 auf die Berufsverläufe von Frauen in Deutschland ausgewirkt<br />
hat.<br />
Jost Reinecke <strong>Stichprobenziehung</strong>
Einleitung<br />
Grundbegriffe<br />
Stichprobe oder Totalerhebung<br />
Grundgesamtheit<br />
Auswahlgesamtheit und Stichprobe<br />
Zufallsstichproben<br />
◮ sachliche Abgrenzung: alle deutschsprachigen Frauen außer<br />
Auszubildende, Schülerinnen und Studentinnen.<br />
◮ räumliche Abgrenzung: alle deutschsprachigen Frauen, die in<br />
der Bundesrepublik Deutschland in Privathaushalten leben.<br />
◮ zeitliche Abgrenzung: alle deutschsprachigen Frauen, die seit<br />
dem 01.01.1992 ein Kind bekommen bzw. adoptiert haben.<br />
Jost Reinecke <strong>Stichprobenziehung</strong>
Einleitung<br />
Grundbegriffe<br />
Stichprobe oder Totalerhebung<br />
Grundgesamtheit<br />
Auswahlgesamtheit und Stichprobe<br />
Zufallsstichproben<br />
Existiert eine Liste, auf der die Elemente der Grundgesamtheit<br />
akzeptabel verzeichnet sind:<br />
◮ Hinreichende Aktualität der Liste<br />
Beispiel: Einwohnermelderegister der Gemeinden haben in der<br />
Regel ein timelag, d.h. enthalten <strong>Fehler</strong> in Bezug auf mobile<br />
Personen, Geburten und Sterbefälle. Trotzdem sind die<br />
Register eine häufig verwendete Auswahlgrundlage, da eine<br />
bessere Liste nicht verfügbar ist.<br />
◮ Jedes Mitglied der Grundgesamtheit ist einmal und nur einmal<br />
aufgeführt, d.h. die Liste weist weder overcoverage noch<br />
undercoverage auf:<br />
◮ overcoverage: Es sind Elemente enthalten, die nicht zur<br />
Grundgesamtheit gehören.<br />
◮ undercoverage: Es sind Elemente nicht enthalten, die zur<br />
Grundgesamtheit gehören.<br />
Jost Reinecke <strong>Stichprobenziehung</strong>
Einleitung<br />
Grundbegriffe<br />
Stichprobe oder Totalerhebung<br />
Grundgesamtheit<br />
Auswahlgesamtheit und Stichprobe<br />
Zufallsstichproben<br />
◮ Die Liste ist für die Erhebung zugänglich und ihre Nutzung ist<br />
nicht zu teuer.<br />
Beispiel Einwohnermelderegister:<br />
Die Untersuchung muss im öffentlichen Interesse liegen.<br />
Das Untersuchungsinstitut hat eine gültige<br />
Unbedenklichkeitsbescheinigung.<br />
Die Preise für Stichproben aus Einwohnermelderegistern sind<br />
jeweils von den Bundesländern festgelegt und unterscheiden<br />
sich stark.<br />
Jost Reinecke <strong>Stichprobenziehung</strong>
Einleitung<br />
Grundbegriffe<br />
Stichprobe oder Totalerhebung<br />
Grundgesamtheit<br />
Auswahlgesamtheit und Stichprobe<br />
Zufallsstichproben<br />
Auswahlgesamtheit und Stichprobe<br />
Die Auswahlgesamtheit besteht aus allen Einheiten, aus denen die<br />
Stichprobe tatsächlich ausgewählt wird. Die Auswahlgesamtheit ist<br />
die Grundlage für die <strong>Stichprobenziehung</strong>.<br />
◮ Auswahlgesamtheit und Grundgesamtheit sind selten<br />
identisch.<br />
◮ Existieren systematische Abweichungen zwischen Auswahlund<br />
Grundgesamtheit?<br />
◮ Abschätzung des Umfangs der Grundgesamtheit vor Beginn<br />
der Untersuchung, um beurteilen zu können, ob eine<br />
Stichprobenerhebung überhaupt sinnvoll ist.<br />
◮ Sichtung von Materialien über die Grundgesamtheit (z. B.<br />
Mikrozensusdaten)<br />
Jost Reinecke <strong>Stichprobenziehung</strong>
Einleitung<br />
Grundbegriffe<br />
Stichprobe oder Totalerhebung<br />
Grundgesamtheit<br />
Auswahlgesamtheit und Stichprobe<br />
Zufallsstichproben<br />
Umfrageergebnis und tatsächliches Ergebnis der Bundestagswahl<br />
1994<br />
Partei FG Wahlen Amtl. Ergebnis<br />
CDU/CSU 42.5% 41.5%<br />
SPD 35.5% 36.4%<br />
FDP 7.0% 6.9%<br />
B90/Grüne 8.0% 7.3%<br />
PDS 3.5% 4.4%<br />
REP 2.0% 1.9%<br />
N=1.250 N=42.104.576<br />
Jost Reinecke <strong>Stichprobenziehung</strong>
Zufallsstichproben<br />
Einleitung<br />
Grundbegriffe<br />
Stichprobe oder Totalerhebung<br />
Grundgesamtheit<br />
Auswahlgesamtheit und Stichprobe<br />
Zufallsstichproben<br />
Einfache Zufallsstichproben<br />
Komplexe Zufallsstichproben<br />
Eine <strong>Stichprobenziehung</strong> wird als zufällig bezeichnet, wenn jede<br />
Einheit der Auswahlgesamtheit die gleiche Wahrscheinlichkeit hat,<br />
in die Stichprobe zu gelangen. Ein wesentlicher Vorteil von<br />
Zufallsauswahlen besteht darin, daß sich angeben läßt, wie<br />
Stichprobenergebnisse vom “wahren“ Wert der Auswahlgesamtheit<br />
abweichen. Es werden folgende Verfahren unterschieden:<br />
1. Einfache Zufallsstichproben<br />
1.1 Reine Zufallsstichprobe<br />
1.2 Systematische Zufallsstichprobe<br />
2. Komplexe Zufallsstichproben<br />
2.1 Geschichtete Stichprobe<br />
2.2 Klumpenstichprobe<br />
2.3 Mehrstufige Stichproben<br />
Jost Reinecke <strong>Stichprobenziehung</strong>
Einleitung<br />
Grundbegriffe<br />
Stichprobe oder Totalerhebung<br />
Grundgesamtheit<br />
Auswahlgesamtheit und Stichprobe<br />
Zufallsstichproben<br />
Einfache Zufallsstichproben<br />
Komplexe Zufallsstichproben<br />
Wahl des Designs/Wahl des Erhebungsmodus<br />
Wahl des Designs Wahl des Erhebungsmodus<br />
systematisch schriftlich<br />
geschichtet persönlich-mündlich<br />
- proportional<br />
- disproportional<br />
telefonisch<br />
E-Mail/Internet<br />
Jost Reinecke <strong>Stichprobenziehung</strong>
Einleitung<br />
Grundbegriffe<br />
Stichprobe oder Totalerhebung<br />
Grundgesamtheit<br />
Auswahlgesamtheit und Stichprobe<br />
Zufallsstichproben<br />
Einfache Zufallsstichproben<br />
Komplexe Zufallsstichproben<br />
◮ Wenn eine akzeptable Liste mit den Elementen der<br />
Auswahlgesamtheit vorliegt, wird aus dieser<br />
uneingeschränkt ausgewählt.<br />
◮ Wenn Zusatzinformationen zur Verfügung stehen, kann<br />
auch geschichtet ausgewählt werden. Dabei spielt der<br />
Erhebungsmodus keine Rolle.<br />
◮ Wenn keine Liste vorliegt, die für die Auswahl geeignet<br />
ist, muss auf andere Konstruktionen zurückgegriffen<br />
werden. Diese kann beispielsweise in einer mehrstufigen<br />
Flächenstichprobe mit Random-Route-Elementen<br />
bestehen. Random-Route setzt die Vorgabe von<br />
Startadressen voraus.<br />
Jost Reinecke <strong>Stichprobenziehung</strong>
Einleitung<br />
Grundbegriffe<br />
Stichprobe oder Totalerhebung<br />
Grundgesamtheit<br />
Auswahlgesamtheit und Stichprobe<br />
Zufallsstichproben<br />
Einfache Zufallsstichproben<br />
Komplexe Zufallsstichproben<br />
Beispiel für Random-Route:<br />
Gehen Sie von der Startadresse bis zur nächsten Kreuzung,<br />
dann rechts abbiegen und dann wieder links. Notieren Sie auf<br />
dem Weg jeden sechsten Haushalt.<br />
Adressermittlung und Interviews werden von verschiedenen<br />
Personen durchgeführt: → Adressandom<br />
Jost Reinecke <strong>Stichprobenziehung</strong>
Einleitung<br />
Grundbegriffe<br />
Stichprobe oder Totalerhebung<br />
Grundgesamtheit<br />
Auswahlgesamtheit und Stichprobe<br />
Zufallsstichproben<br />
Einfache Zufallsstichproben<br />
Einfache Zufallsstichproben<br />
Komplexe Zufallsstichproben<br />
◮ Man zieht eine einfache Zufallstichprobe, indem man aus einer<br />
vollständigen Liste aller Objekte der Zielpopulation nach dem<br />
Zufallsprinzip eine Anzahl von Objekten auswählt, wobei die<br />
Auswahlwahrscheinlichkeiten aller Objekte gleich groß sein<br />
müssen.<br />
◮ Bei der Auswahl von Einheiten aus einer Gesamtheit ist es von<br />
Vorteil, wenn diese Einheiten nach einem<br />
Wahrscheinlichkeitsgesetz gezogen werden, da sich dann<br />
statistisch gesicherte Aussagen über interessierende Parameter<br />
der Gesamtheit machen lassen.<br />
Jost Reinecke <strong>Stichprobenziehung</strong>
Reine Zufallsstichprobe<br />
Einleitung<br />
Grundbegriffe<br />
Stichprobe oder Totalerhebung<br />
Grundgesamtheit<br />
Auswahlgesamtheit und Stichprobe<br />
Zufallsstichproben<br />
Ausgangspunkt ist folgenden Situation:<br />
Einfache Zufallsstichproben<br />
Komplexe Zufallsstichproben<br />
◮ Es ist eine Einheit der Grundgesamtheit vom Umfang N<br />
auszuwählen und die Auswahl für jede Einheit ist gleich, d. h.<br />
1/N. Die Durchführung der Ziehung kann über ein<br />
Zufallsexperiment realisiert werden.<br />
◮ Wiederholt man dieses Zufallsexperiment n mal unabhängig<br />
und hält die ausgewählten Einheiten in einem Vektor fest, so<br />
erhält man Ziehungsergebnisse mit der gleichen<br />
Wahrscheinlichkeit. Dieses Stichprobendesign wird auch als<br />
uneingeschränkte Zufallsauswahl mit Zurücklegen bezeichnet.<br />
Jost Reinecke <strong>Stichprobenziehung</strong>
Beispiel:<br />
Einleitung<br />
Grundbegriffe<br />
Stichprobe oder Totalerhebung<br />
Grundgesamtheit<br />
Auswahlgesamtheit und Stichprobe<br />
Zufallsstichproben<br />
Einfache Zufallsstichproben<br />
Komplexe Zufallsstichproben<br />
◮ Es existiert eine Grundgesamtheit mit vier Elementen:<br />
{1, 2, 3, 4}<br />
◮ Es sollen zwei Elemente ausgewählt werden.<br />
◮ Es existieren insgesamt 6 mögliche Stichproben:<br />
4!<br />
2! · (4 − 2)!<br />
◮ Die Wahrscheinlichkeit, daß eine bestimmte Stichprobe<br />
realisiert wird, beträgt ein 1/6.<br />
Jost Reinecke <strong>Stichprobenziehung</strong><br />
(1)
Einleitung<br />
Grundbegriffe<br />
Stichprobe oder Totalerhebung<br />
Grundgesamtheit<br />
Auswahlgesamtheit und Stichprobe<br />
Zufallsstichproben<br />
Systematische Zufallsstichprobe<br />
Einfache Zufallsstichproben<br />
Komplexe Zufallsstichproben<br />
◮ Bei einer systematischen Zufallsstichprobe wird das erste<br />
Element per Zufall ermittelt.<br />
◮ Ausgehend von diesem Element werden alle weiteren Elemente<br />
systematisch ausgewählt. Damit gelangt jedes k-te Element in<br />
die Stichprobe. Mit k wird das Stichprobenintervall<br />
gekennzeichnet.<br />
k = Auswahlgesamtheit<br />
Stichprobe<br />
Jost Reinecke <strong>Stichprobenziehung</strong><br />
(2)
Beispiel:<br />
Einleitung<br />
Grundbegriffe<br />
Stichprobe oder Totalerhebung<br />
Grundgesamtheit<br />
Auswahlgesamtheit und Stichprobe<br />
Zufallsstichproben<br />
Einfache Zufallsstichproben<br />
Komplexe Zufallsstichproben<br />
◮ Es existiert eine Auswahlgesamtheit von 20.000 Personen.<br />
◮ Es soll eine Stichprobe von 500 Personen gezogen werden.<br />
k = 20.000<br />
= 40 (3)<br />
500<br />
◮ Jede 40. Person gelangt in die Stichprobe.<br />
Jost Reinecke <strong>Stichprobenziehung</strong>
Einleitung<br />
Grundbegriffe<br />
Stichprobe oder Totalerhebung<br />
Grundgesamtheit<br />
Auswahlgesamtheit und Stichprobe<br />
Zufallsstichproben<br />
Komplexe Zufallsstichproben<br />
Einfache Zufallsstichproben<br />
Komplexe Zufallsstichproben<br />
◮ Wenn keine Ausflistung der Auswahlgesamtheit vorliegt, dann<br />
verwendet man komplexe Zufallsstichproben.<br />
◮ Hierzu gehören geschichtete Stichproben, die<br />
Klumpenstichprobe und sogenannte mehrstufige<br />
Stichprobenverfahren.<br />
Jost Reinecke <strong>Stichprobenziehung</strong>
Geschichtete Stichprobe<br />
Einleitung<br />
Grundbegriffe<br />
Stichprobe oder Totalerhebung<br />
Grundgesamtheit<br />
Auswahlgesamtheit und Stichprobe<br />
Zufallsstichproben<br />
Einfache Zufallsstichproben<br />
Komplexe Zufallsstichproben<br />
◮ Zur Ziehung einer geschichteten Stichprobe werden die<br />
Elemente der Auswahlgesamtheit bezüglich des<br />
interessierenden Merkmals in Schichten eingeteilt. Aus diesen<br />
Schichten werden dann Zufallstichproben gezogen.<br />
◮ Bezeichnet man mit N(h) den Umfang der Auswahlgesamtheit<br />
und mit n(h) den Umfang der Stichprobe der h-ten Schicht<br />
(h = 1, . . . , H), so wird das gewogene arithmetische Mittel der<br />
Stichprobenmittel ¯y(h) zur Schätzung verwendet:<br />
¯ystr =<br />
H<br />
h=1<br />
N(h)<br />
¯y(h) (4)<br />
N<br />
Jost Reinecke <strong>Stichprobenziehung</strong>
Einleitung<br />
Grundbegriffe<br />
Stichprobe oder Totalerhebung<br />
Grundgesamtheit<br />
Auswahlgesamtheit und Stichprobe<br />
Zufallsstichproben<br />
Einfache Zufallsstichproben<br />
Komplexe Zufallsstichproben<br />
◮ Für die Varianz des geschichteten Schätzers kann folgende<br />
Funktion angegeben werden:<br />
s 2 str =<br />
H<br />
2 N(h) s2 (h)<br />
N n(h)<br />
h=1<br />
<br />
1 −<br />
<br />
n(h) − 1<br />
N(h) − 1<br />
◮ Ein 95%-Konfidenzintervall kann damit für den Mittelwert ¯Y<br />
der Grundgesamtheit angegeben werden:<br />
<br />
¯ystr − 1.96 s2 <br />
str ; ¯ystr + 1.96<br />
(6)<br />
◮ Je größer die Homogenität der Auswahlgesamtheit, desto<br />
kleiner der Stichprobenfehler.<br />
s 2 str<br />
Jost Reinecke <strong>Stichprobenziehung</strong><br />
(5)
Einleitung<br />
Grundbegriffe<br />
Stichprobe oder Totalerhebung<br />
Grundgesamtheit<br />
Auswahlgesamtheit und Stichprobe<br />
Zufallsstichproben<br />
Einfache Zufallsstichproben<br />
Komplexe Zufallsstichproben<br />
◮ Proportional geschichtete Stichprobe: Die Größe der<br />
Stichprobe einer Schicht wird entsprechend ihres Anteils an<br />
der Auswahlgesamtheit ausgewählt.<br />
Beispiel: Die Anteil der Arbeiter in der Stichprobe entspricht dem<br />
Anteil in der Auswahlgesamtheit.<br />
◮ Disproportional geschichtete Stichprobe: Die Größe der<br />
Stichprobe einer Schicht wird überproportional zum Anteil an<br />
der Grundgesamtheit ausgewählt.<br />
Beispiel: Die Anteil der Ostdeutschen in der Stichprobe ist höher<br />
als der Anteil der Westdeutschen.<br />
Jost Reinecke <strong>Stichprobenziehung</strong>
Klumpenstichprobe<br />
Einleitung<br />
Grundbegriffe<br />
Stichprobe oder Totalerhebung<br />
Grundgesamtheit<br />
Auswahlgesamtheit und Stichprobe<br />
Zufallsstichproben<br />
Einfache Zufallsstichproben<br />
Komplexe Zufallsstichproben<br />
Eine Klumpenstichprobe ist möglich, wenn die Grundgesamtheit in<br />
mehrere Teile (auch Klumpen genannt) zerlegt werden kann. Im<br />
einfachsten Fall besteht sie aus zwei Stufen:<br />
1. Aus allen Klumpen werden in einer uneingeschränkten<br />
Zufallsauswahl einzelne ausgewählt. Die Anzahl der<br />
ausgewählten Klumpen ist der erste Stichprobenumfang.<br />
2. Sämtliche Einheiten (Personen) der ausgewählten Klumpen<br />
werden erfasst.<br />
3. Die Anzahl der ausgewählten Einheiten ist der zweite<br />
Stichprobenumfang. Dieser Stichprobenumfang ist der<br />
eigentliche Umfang einer Klunpenstichprobe.<br />
4. Die Auswahl bezieht sich nicht auf Untersuchungseinheiten,<br />
sondern auf Aggregate von Untersuchungseinheiten<br />
(Klumpen).<br />
Jost Reinecke <strong>Stichprobenziehung</strong>
Einleitung<br />
Grundbegriffe<br />
Stichprobe oder Totalerhebung<br />
Grundgesamtheit<br />
Auswahlgesamtheit und Stichprobe<br />
Zufallsstichproben<br />
Vorteil der Klumpenstichprobe:<br />
Einfache Zufallsstichproben<br />
Komplexe Zufallsstichproben<br />
◮ Es ist nur eine umfassende Auswahlgrundlage für die<br />
Klumpen, nicht aber für die Gesamtheit aller<br />
Untersuchungseinheiten erforderlich.<br />
◮ Bei organisatorischen und geographischen Abgrenzungen der<br />
Klumpen ist eine kostengünstige Erhebung der Einheiten<br />
möglich.<br />
◮ Der Idealfall liegt vor, wenn alle Klumpen gleich groß sind und<br />
die Heterogenität der Grundgesamtheit wiedergeben.<br />
Nachteil der Klumpenstichprobe:<br />
◮ Je stärker sich die Klumpen in ihrer Größe unterscheiden und<br />
je homogener sie in Bezug auf das Untersuchungsmerkmal<br />
sind, desto größer ist der Schätzfehler. Dies wird auch als<br />
Klumpeneffekt bezeichnet.<br />
Jost Reinecke <strong>Stichprobenziehung</strong>
Mehrstufige Stichproben<br />
Einleitung<br />
Grundbegriffe<br />
Stichprobe oder Totalerhebung<br />
Grundgesamtheit<br />
Auswahlgesamtheit und Stichprobe<br />
Zufallsstichproben<br />
Einfache Zufallsstichproben<br />
Komplexe Zufallsstichproben<br />
◮ Erstreckt sich eine Zufallsauswahl über mehrere Ebenen, dann<br />
wird von einer mehrstufigen Zufallsauswahl gesprochen.<br />
◮ Mehrstufige Stichproben sind eine Reihe nacheinander<br />
durchgeführte einfache Zufallsauswahlen.<br />
◮ 1. Stufe: Stichprobe von Primäreinheiten (regionale Einheiten)<br />
◮ 2. Stufe: Stichprobe von Sekundäreinheiten aus den<br />
Primäreinheiten<br />
◮ 3. Stufe: Stichprobe von Untersuchungseinheiten aus den<br />
Sekundäreinheiten<br />
◮ Geschichtete Zufallsauswahl und Klumpenauswahl sind zwei<br />
Spezialfälle mehrstufiger Stichproben.<br />
Jost Reinecke <strong>Stichprobenziehung</strong>
Einleitung<br />
Grundbegriffe<br />
Stichprobe oder Totalerhebung<br />
Grundgesamtheit<br />
Auswahlgesamtheit und Stichprobe<br />
Zufallsstichproben<br />
Beispiel: <strong>Stichprobenziehung</strong> des ALLBUS 1998<br />
Einfache Zufallsstichproben<br />
Komplexe Zufallsstichproben<br />
1. 1. Stufe: zufällig ausgewählte Stimmbezirke<br />
2. 2. Stufe: zufällig ausgewählte Haushalten in den jeweiligen<br />
Stimmbezirken (Random-Route)<br />
3. 3. Stufe: zufällig ausgewählte Befragungsperson aus den<br />
ausgewählte Haushalten (Schwedenschlüssel)<br />
Jost Reinecke <strong>Stichprobenziehung</strong>
Einleitung<br />
Grundbegriffe<br />
Stichprobe oder Totalerhebung<br />
Grundgesamtheit<br />
Auswahlgesamtheit und Stichprobe<br />
Zufallsstichproben<br />
Einfache Zufallsstichproben<br />
Komplexe Zufallsstichproben<br />
◮ Die Primäreinheiten (Stimmbezirke) haben bei mehrstufigen<br />
Auswahlverfahren immer unterschiedlich viele Elemente.<br />
Elemente aus größeren Primäreinheiten beitzen damit eine<br />
niedrigere Auswahlwahrscheinlichkeit als Elemente aus<br />
kleineren Primäreinheiten.<br />
◮ Wenn die Primäreinheiten unterschiedlich groß sind, müssen<br />
diese mit einer Wahrscheinlichkeit ausgewählt werden, die<br />
proportional zu ihrer Größe ist.<br />
◮ Hierzu existiert das sogenannte PPS-Design (probability<br />
proportional to size).<br />
Jost Reinecke <strong>Stichprobenziehung</strong>
Einleitung<br />
Grundbegriffe<br />
Stichprobe oder Totalerhebung<br />
Grundgesamtheit<br />
Auswahlgesamtheit und Stichprobe<br />
Zufallsstichproben<br />
Beispiel für ein PPS-Design<br />
Einfache Zufallsstichproben<br />
Komplexe Zufallsstichproben<br />
1. Es werden 200 Blocks mit Auswahlwahrscheinlichkeiten<br />
proportional zu ihrer Größe (Anzahl der Haushalte im Block)<br />
ausgewählt. Die Ziehungswahrscheinlichkeit ist:<br />
nHH/Block p = nBlock<br />
nHH/Stadt nBlock ist die Anzahl der auszuwählenden Blocks, n HH/Block is<br />
die Anzahl der Haushalte im Block und n HH/Stadt als Anzahl<br />
der Haushalte der Stadt. Bei einem Block mit 100 Haushalten<br />
ergibt sich folgende Ziehungswahrscheinlichkeit:<br />
(7)<br />
p = 200 100<br />
= 0.2 (8)<br />
100000<br />
Jost Reinecke <strong>Stichprobenziehung</strong>
Einleitung<br />
Grundbegriffe<br />
Stichprobe oder Totalerhebung<br />
Grundgesamtheit<br />
Auswahlgesamtheit und Stichprobe<br />
Zufallsstichproben<br />
Einfache Zufallsstichproben<br />
Komplexe Zufallsstichproben<br />
Bei einem Block mit 400 Haushalten ergibt sich folgende<br />
Ziehungswahrscheinlichkeit:<br />
p = 200 400<br />
= 0.8 (9)<br />
100000<br />
2. Aus jedem Block werden 5 Haushalte ausgewählt. Bei 100<br />
Haushalten ist die Ziehungswahrscheinlichkeit: 5/100 = 0.05.<br />
Bei 400 Haushalten ist die Ziehungswahrscheinblichkeit:<br />
5/400 = 0.0125.<br />
3. Werden die Wahrscheinlichkeiten aus der 1. Stufe und der 2.<br />
Stufe miteinander multipliziert, dann ergibt sich die<br />
tatsächliche Auswahlwahrscheinlichkeit:<br />
p = 0.2 ∗ 0.05 = 0.8 ∗ 0.0125 = 0.01 (10)<br />
Jost Reinecke <strong>Stichprobenziehung</strong>
ADM-Stichproben-System<br />
Einleitung<br />
Grundbegriffe<br />
Stichprobe oder Totalerhebung<br />
Grundgesamtheit<br />
Auswahlgesamtheit und Stichprobe<br />
Zufallsstichproben<br />
Einfache Zufallsstichproben<br />
Komplexe Zufallsstichproben<br />
Die Arbeitsgemeinschaft Deutscher Markt- und<br />
Sozialforschungsinstitute e.V. (ADM) verwendet für<br />
persönlich-mündliche Bevölkerungsbefragungen der Markt-, Mediaund<br />
Sozialforschung, in der Regel ein speziell entwickeltes Design,<br />
das sogenannte ADM-Design. Es handelt sich dabei um eine<br />
dreistufige, geschichtete Zufallsauswahl, die zur Repräsentation der<br />
Wahlberechtigten, die in Privathaushalten identifiziert werden<br />
können, geeignet ist.<br />
Jost Reinecke <strong>Stichprobenziehung</strong>
Einleitung<br />
Grundbegriffe<br />
Stichprobe oder Totalerhebung<br />
Grundgesamtheit<br />
Auswahlgesamtheit und Stichprobe<br />
Zufallsstichproben<br />
Einfache Zufallsstichproben<br />
Komplexe Zufallsstichproben<br />
◮ 1. Stufe: Die Wahlbezirke werden nach Kreisen und<br />
Gemeindegrößenklassen geschichtet. Dabei entstehen in<br />
Westdeutschland 3280 Zellen, in Ostdeutschland 1120. Aus<br />
dem Schichttableau werden dann mit der Wahrscheinlichkeit<br />
proportional zur (geschätzten) Anzahl der Privathaushalte<br />
Wahlbezirke ausgewählt. Anschließend werden diese in<br />
möglichst überschneidungsfreie und kumulierbare<br />
Teilstichproben (sog. Netze) zerlegt und an die einzelnen<br />
Institute des ADM ausgegeben. Ein Netz umfasst 210 Sample<br />
Points in Westdeutschland und 48 Sample Points in<br />
Ostdeutschland.<br />
Jost Reinecke <strong>Stichprobenziehung</strong>
Einleitung<br />
Grundbegriffe<br />
Stichprobe oder Totalerhebung<br />
Grundgesamtheit<br />
Auswahlgesamtheit und Stichprobe<br />
Zufallsstichproben<br />
Einfache Zufallsstichproben<br />
Komplexe Zufallsstichproben<br />
◮ 2. Stufe: Anschließend werden die Haushalte gesucht, in denen<br />
schließlich die Zielperson zu ermitteln ist. Die Interviewer<br />
erhalten dazu eine vorgegebene Begehungsvorschrift. Ihnen<br />
obliegt es nun, beginnend an einer vorgegebenen Startadresse<br />
eine bestimmte Zahl von Haushalten entlang dieses Weges<br />
aufzulisten. Beim sogenannten Adressvorlaufverfahren erfolgen<br />
Begehung und Befragung getrennt. Hier wird die Liste der<br />
Haushalte dem Institut übergeben, das eine Zufallsauswahl der<br />
Zielhaushalte vornimmt. Der Interviewer bekommt damit die<br />
Haushaltsadressen vorgegeben, bei denen eine Befragung<br />
durchzuführen ist.<br />
◮ 3. Stufe: In der letzten Auswahlstufe werden schließlich die zu<br />
befragenden Personen ermittelt. Diese Auswahl erfolgt erst<br />
während der Feldarbeit. Dazu wird der sogenannte<br />
Schwedenschlüssel verwendet.<br />
Jost Reinecke <strong>Stichprobenziehung</strong>
Einleitung<br />
Grundbegriffe<br />
Stichprobe oder Totalerhebung<br />
Grundgesamtheit<br />
Auswahlgesamtheit und Stichprobe<br />
Zufallsstichproben<br />
Einwohnermeldeamtsstichproben<br />
Einfache Zufallsstichproben<br />
Komplexe Zufallsstichproben<br />
◮ Das derzeitig qualitativ hochwertigste Design für bundesweite<br />
Bevölkerungsumfragen in Deutschland ist die<br />
Einwohnermeldeamtstichprobe, die auf einem geschichteten,<br />
zweistufigem Zufallsverfahren basiert.<br />
◮ Da in Deutschland kein zentrales Einwohnerregister besteht,<br />
sondern die Register auf Gemeindeebene organisiert sind, muss<br />
in einem ersten Schritt eine Auswahl von Gemeinden erfolgen.<br />
Jost Reinecke <strong>Stichprobenziehung</strong>
Einleitung<br />
Grundbegriffe<br />
Stichprobe oder Totalerhebung<br />
Grundgesamtheit<br />
Auswahlgesamtheit und Stichprobe<br />
Zufallsstichproben<br />
Einfache Zufallsstichproben<br />
Komplexe Zufallsstichproben<br />
Beispiel: Konstruktion der Einwohnermeldeamtsstichprobe für den<br />
European Social Survey 2003<br />
◮ Grundgesamtheit dieser Untersuchung waren alle Personen im<br />
Alter von 15 Jahren und älter, die in Deutschland in<br />
Privathaushalten leben.<br />
◮ Für Ost- und Westdeutschland wurde ein disproportionaler<br />
Stichprobenansatz gewählt: 1000 Interviews in Ostdeutschland<br />
und in 2000 Interviews in Westdeutschland.<br />
◮ Zunächst wurden die Gemeinden nach Kreisen und<br />
Gemeindegrößenklassen geschichtet. Dabei ergaben sich 1.085<br />
Schichtzellen in West- und 435 Schichtzellen in<br />
Ostdeutschland.<br />
Jost Reinecke <strong>Stichprobenziehung</strong>
Einleitung<br />
Grundbegriffe<br />
Stichprobe oder Totalerhebung<br />
Grundgesamtheit<br />
Auswahlgesamtheit und Stichprobe<br />
Zufallsstichproben<br />
Einfache Zufallsstichproben<br />
Komplexe Zufallsstichproben<br />
◮ In der ersten Auswahlstufe wurden aus diesen Schichten 100<br />
Gemeinden in West- und 50 Gemeinden in Ostdeutschland<br />
proportional zur Bevölkerungszahl 15 Jahre und älter<br />
ausgewählt. Die Zahl der Sample Points in Westdeutschland<br />
beträgt 108, in Ostdeutschland 55.<br />
◮ In der zweiten Auswahlstufe wird in den entsprechenden<br />
Einwohnermeldeämtern für jeden Sample Point per<br />
systematischer Zufallsauswahl eine feste Zahl von Personen<br />
gezogen.<br />
Jost Reinecke <strong>Stichprobenziehung</strong>