11.04.2013 Aufrufe

Stichprobenziehung - Fehler/Fehler - Universität Bielefeld

Stichprobenziehung - Fehler/Fehler - Universität Bielefeld

Stichprobenziehung - Fehler/Fehler - Universität Bielefeld

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Einleitung<br />

Grundbegriffe<br />

Stichprobe oder Totalerhebung<br />

Grundgesamtheit<br />

Auswahlgesamtheit und Stichprobe<br />

Zufallsstichproben<br />

<strong>Stichprobenziehung</strong><br />

Jost Reinecke<br />

<strong>Universität</strong> <strong>Bielefeld</strong><br />

7. April 2005<br />

Jost Reinecke <strong>Stichprobenziehung</strong>


Einleitung<br />

Grundbegriffe<br />

Einleitung<br />

Grundbegriffe<br />

Stichprobe oder Totalerhebung<br />

Grundgesamtheit<br />

Auswahlgesamtheit und Stichprobe<br />

Zufallsstichproben<br />

Stichprobe oder Totalerhebung<br />

Grundgesamtheit<br />

Auswahlgesamtheit und Stichprobe<br />

Zufallsstichproben<br />

Einfache Zufallsstichproben<br />

Komplexe Zufallsstichproben<br />

Jost Reinecke <strong>Stichprobenziehung</strong>


Einleitung<br />

Einleitung<br />

Grundbegriffe<br />

Stichprobe oder Totalerhebung<br />

Grundgesamtheit<br />

Auswahlgesamtheit und Stichprobe<br />

Zufallsstichproben<br />

Die Berücksichtigung aller Untersuchungseinheiten ist in der Regel<br />

zu kosten- und zeitaufwändig. Daher beschränkt man sich auf eine<br />

gewisse Anzahl von Untersuchungseinheiten, den Stichproben, um<br />

Aussagen über Sachverhalte in der interessierenden Gesamtheit<br />

treffen zu können.<br />

Die <strong>Stichprobenziehung</strong> hängt unmittelbar mit der<br />

Wahrscheinlichkeitstheorie zusammen:<br />

1. Die Wahrscheinlichkeitstheorie läßt Angaben über die<br />

Wahrscheinlichkeit der Zusammensetzung einer Stichprobe zu.<br />

2. Bei der Generalisierung von Stichprobendaten können<br />

Angaben über die Wahrscheinlichkeit getroffen werden, mit<br />

der Kennwerte in der Population abgebildet werden können.<br />

Jost Reinecke <strong>Stichprobenziehung</strong>


Einleitung<br />

Grundbegriffe<br />

Stichprobe oder Totalerhebung<br />

Grundgesamtheit<br />

Auswahlgesamtheit und Stichprobe<br />

Zufallsstichproben<br />

Grundbegriffe<br />

Grundgesamtheit (Population):<br />

Elemente bzw. Personen, auf die sich Aussagen einer statistischen<br />

Analyse beziehen. Die Grundgesamtheit ist sowohl sachlich als<br />

auch räumlich und zeitlich exakt zu definieren. In den meisten<br />

Fällen ist es aus zeitlichen und finanziellen Gründen nicht möglich,<br />

alle Einheiten der Grundgesamtheit zu erheben (Totalerhebung).<br />

Man wird sich daher auf eine Auswahl (Stichprobe) beschränken,<br />

die auch häufig sehr viel intensiver und präziser als eine<br />

Totalerhebung durchgeführt werden kann.<br />

Beispiel: Wählerbefragung - sämtliche Wahlberechtigte der Stadt<br />

Köln / des Landes NRW / der BRD.<br />

Jost Reinecke <strong>Stichprobenziehung</strong>


Einleitung<br />

Grundbegriffe<br />

Stichprobe oder Totalerhebung<br />

Grundgesamtheit<br />

Auswahlgesamtheit und Stichprobe<br />

Zufallsstichproben<br />

Parameter der Grundgesamtheit:<br />

µ: Mittelwert<br />

σ 2 : Varianz<br />

σ: Standardabweichung,<br />

π (manchmal auch θ): Anteilswert<br />

N: Fallzahl in der Grundgesamtheit<br />

Jost Reinecke <strong>Stichprobenziehung</strong>


Einleitung<br />

Grundbegriffe<br />

Stichprobe oder Totalerhebung<br />

Grundgesamtheit<br />

Auswahlgesamtheit und Stichprobe<br />

Zufallsstichproben<br />

Stichprobe (Sample):<br />

Auswahl von Elementen bzw. Personen der Gesamtheit. Eine<br />

Stichprobe soll ein möglichst repräsentatives Bild der<br />

Grundgesamtheit liefern. Handelt es sich um eine Zufallsstichprobe,<br />

bei der die Erhebungseinheiten nach dem Zufallsprinzip ausgewählt<br />

wurden, dann können die Schätzverfahren und Hypothesentests der<br />

schließenden Statistik angewendet werden.<br />

Beispiel: Stichprobe von Wählern.<br />

Jost Reinecke <strong>Stichprobenziehung</strong>


Einleitung<br />

Grundbegriffe<br />

Stichprobe oder Totalerhebung<br />

Grundgesamtheit<br />

Auswahlgesamtheit und Stichprobe<br />

Zufallsstichproben<br />

Parameter der Stichprobe:<br />

x: Mittelwert<br />

s: Standardabweichung<br />

s 2 Varianz<br />

p: Anteilswert<br />

n: Stichprobenumfang<br />

Jost Reinecke <strong>Stichprobenziehung</strong>


Einleitung<br />

Grundbegriffe<br />

Stichprobe oder Totalerhebung<br />

Grundgesamtheit<br />

Auswahlgesamtheit und Stichprobe<br />

Zufallsstichproben<br />

Erhebungseinheiten: Elemente der Population, auf die sich die<br />

Auswahl bezieht und die überhaupt eine Chance haben, in die<br />

Stichprobe aufgenommen zu werden.<br />

Stichprobenverfahren: Vorschrift, die festlegt, in welcher Weise<br />

Elemente der Grundgesamtheit ausgewählt werden.<br />

1. Zufallsauswahl: Resultat einer Zufallsauswahl sind<br />

Zufallsstichproben.<br />

2. Bewußte Auswahl: Quotenstichproben<br />

3. Willkürliche Auswahl: Psychologische Experimente<br />

Stichprobenumfang: Anzahl der ausgewählten Elemente, die in<br />

der Regel mit N bezeichnet werden.<br />

Jost Reinecke <strong>Stichprobenziehung</strong>


Einleitung<br />

Grundbegriffe<br />

Stichprobe oder Totalerhebung<br />

Grundgesamtheit<br />

Auswahlgesamtheit und Stichprobe<br />

Zufallsstichproben<br />

Stichprobe oder Totalerhebung<br />

Uns interessiert ein Kennwert einer Gesamtheit, z.B. das<br />

durchschnittliche Nettoeinkommen der Haushalte in <strong>Bielefeld</strong>.<br />

1. Totalerhebung: Man kann alle <strong>Bielefeld</strong>er Haushalte nach<br />

ihrem Nettoeinkommen fragen und dann den Mittelwert<br />

berechnen.<br />

2. Stichprobe: Man kann einige <strong>Bielefeld</strong>er Haushalte auswählen<br />

und diese über ihr Nettoeinkommen befragen. Wenn die<br />

Haushalte nach bestimmten Regeln ausgewählt werden,<br />

können wir anschließend mit einer gewissen<br />

Wahrscheinlichkeit auf das mittlere Nettoeinkommen aller<br />

<strong>Bielefeld</strong>er Haushalte schließen.<br />

Jost Reinecke <strong>Stichprobenziehung</strong>


Einleitung<br />

Grundbegriffe<br />

Stichprobe oder Totalerhebung<br />

Grundgesamtheit<br />

Auswahlgesamtheit und Stichprobe<br />

Zufallsstichproben<br />

Die Totalerhebung hat den Vorteil, dass die gesuchten Kennwerte<br />

genau angegeben werden können.<br />

Beispiel: Das mittlere Haushaltsnettoeinkommen in <strong>Bielefeld</strong><br />

beträgt X Euro.<br />

Bei einer Stichprobe würde das Ergebnis komplizierter ausfallen.<br />

Beispiel: Mit einer Wahrscheinlichkeit von 95% liegt das<br />

Haushaltsnettoeinkommen in <strong>Bielefeld</strong> in einem Intervall von X<br />

Euro ± Y Euro.<br />

Aufgrund der Stichprobenerhebung weist das Ergebnis ein<br />

Unsicherheitsintervall aus.<br />

Jost Reinecke <strong>Stichprobenziehung</strong>


Einleitung<br />

Grundbegriffe<br />

Stichprobe oder Totalerhebung<br />

Grundgesamtheit<br />

Auswahlgesamtheit und Stichprobe<br />

Zufallsstichproben<br />

Warum wird dann nicht in jedem Fall eine Totalerhebung<br />

durchgeführt?<br />

Vorteile von Stichprobenerhebungen:<br />

◮ Sie sind billiger als Totalerhebungen.<br />

◮ Die Ergebnisse stehen bei Stichprobenerhebungen schneller<br />

zur Verfügung als bei Totalerhebungen.<br />

◮ Bei Stichprobenerhebungen ist eine geringere Größe des<br />

Mitarbeiterstabes notwendig als bei Totalerhebungen. Die<br />

Mitarbeiter können dafür spezieller geschult werden.<br />

◮ Es ist bei Stichprobenerhebungen ein besserer Umgang mit<br />

Ausfällen, z.B. aufgrund von Nichterreichbarkeit der zu<br />

Befragenden, möglich als bei Totalerhebungen.<br />

Jost Reinecke <strong>Stichprobenziehung</strong>


Einleitung<br />

Grundbegriffe<br />

Stichprobe oder Totalerhebung<br />

Grundgesamtheit<br />

Auswahlgesamtheit und Stichprobe<br />

Zufallsstichproben<br />

Nachteile von Stichprobenerhebungen:<br />

◮ Bei verhältnismäßig kleinen Gesamtheiten, zum Beispiel vom<br />

Umfang N = 300, ist es in der Regel wenig sinnvoll, eine<br />

Stichprobe zu ziehen.<br />

◮ Eine Totalerhebung ist vorteilhafter, wenn Aussagen zu<br />

kleinen Subpopulationen innerhalb der Gesamtheit getroffen<br />

werden sollen. Diese sind bei einer Stichprobenerhebung<br />

wesentlich unpräziser als bei einer Totalerhebung.<br />

◮ In gewissen Fällen verbietet sich eine Stichprobenerhebung<br />

und die Totalerhebung ist die einzige Möglichkeit. Dies gilt<br />

z.B. für so genannte Rückrufaktionen bei Autos.<br />

Jost Reinecke <strong>Stichprobenziehung</strong>


Einleitung<br />

Grundbegriffe<br />

Stichprobe oder Totalerhebung<br />

Grundgesamtheit<br />

Auswahlgesamtheit und Stichprobe<br />

Zufallsstichproben<br />

Grundgesamtheit<br />

Die Menge aller Elemente, für die die aus der Stichprobe<br />

gewonnenen Aussagen gültig sein sollen, bezeichnet man als<br />

Grundgesamtheit oder Untersuchungsgesamtheit. Die<br />

Grundgesamtheit muss zu Beginn der Untersuchung sachlich,<br />

räumlich und zeitlich abgegrenzt werden.<br />

Beispiel: In einer Erhebung sollte festgestellt werden, wie sich die<br />

Änderung des Gesetzes über den Erziehungsurlaub aus dem Jahr<br />

1986 auf die Berufsverläufe von Frauen in Deutschland ausgewirkt<br />

hat.<br />

Jost Reinecke <strong>Stichprobenziehung</strong>


Einleitung<br />

Grundbegriffe<br />

Stichprobe oder Totalerhebung<br />

Grundgesamtheit<br />

Auswahlgesamtheit und Stichprobe<br />

Zufallsstichproben<br />

◮ sachliche Abgrenzung: alle deutschsprachigen Frauen außer<br />

Auszubildende, Schülerinnen und Studentinnen.<br />

◮ räumliche Abgrenzung: alle deutschsprachigen Frauen, die in<br />

der Bundesrepublik Deutschland in Privathaushalten leben.<br />

◮ zeitliche Abgrenzung: alle deutschsprachigen Frauen, die seit<br />

dem 01.01.1992 ein Kind bekommen bzw. adoptiert haben.<br />

Jost Reinecke <strong>Stichprobenziehung</strong>


Einleitung<br />

Grundbegriffe<br />

Stichprobe oder Totalerhebung<br />

Grundgesamtheit<br />

Auswahlgesamtheit und Stichprobe<br />

Zufallsstichproben<br />

Existiert eine Liste, auf der die Elemente der Grundgesamtheit<br />

akzeptabel verzeichnet sind:<br />

◮ Hinreichende Aktualität der Liste<br />

Beispiel: Einwohnermelderegister der Gemeinden haben in der<br />

Regel ein timelag, d.h. enthalten <strong>Fehler</strong> in Bezug auf mobile<br />

Personen, Geburten und Sterbefälle. Trotzdem sind die<br />

Register eine häufig verwendete Auswahlgrundlage, da eine<br />

bessere Liste nicht verfügbar ist.<br />

◮ Jedes Mitglied der Grundgesamtheit ist einmal und nur einmal<br />

aufgeführt, d.h. die Liste weist weder overcoverage noch<br />

undercoverage auf:<br />

◮ overcoverage: Es sind Elemente enthalten, die nicht zur<br />

Grundgesamtheit gehören.<br />

◮ undercoverage: Es sind Elemente nicht enthalten, die zur<br />

Grundgesamtheit gehören.<br />

Jost Reinecke <strong>Stichprobenziehung</strong>


Einleitung<br />

Grundbegriffe<br />

Stichprobe oder Totalerhebung<br />

Grundgesamtheit<br />

Auswahlgesamtheit und Stichprobe<br />

Zufallsstichproben<br />

◮ Die Liste ist für die Erhebung zugänglich und ihre Nutzung ist<br />

nicht zu teuer.<br />

Beispiel Einwohnermelderegister:<br />

Die Untersuchung muss im öffentlichen Interesse liegen.<br />

Das Untersuchungsinstitut hat eine gültige<br />

Unbedenklichkeitsbescheinigung.<br />

Die Preise für Stichproben aus Einwohnermelderegistern sind<br />

jeweils von den Bundesländern festgelegt und unterscheiden<br />

sich stark.<br />

Jost Reinecke <strong>Stichprobenziehung</strong>


Einleitung<br />

Grundbegriffe<br />

Stichprobe oder Totalerhebung<br />

Grundgesamtheit<br />

Auswahlgesamtheit und Stichprobe<br />

Zufallsstichproben<br />

Auswahlgesamtheit und Stichprobe<br />

Die Auswahlgesamtheit besteht aus allen Einheiten, aus denen die<br />

Stichprobe tatsächlich ausgewählt wird. Die Auswahlgesamtheit ist<br />

die Grundlage für die <strong>Stichprobenziehung</strong>.<br />

◮ Auswahlgesamtheit und Grundgesamtheit sind selten<br />

identisch.<br />

◮ Existieren systematische Abweichungen zwischen Auswahlund<br />

Grundgesamtheit?<br />

◮ Abschätzung des Umfangs der Grundgesamtheit vor Beginn<br />

der Untersuchung, um beurteilen zu können, ob eine<br />

Stichprobenerhebung überhaupt sinnvoll ist.<br />

◮ Sichtung von Materialien über die Grundgesamtheit (z. B.<br />

Mikrozensusdaten)<br />

Jost Reinecke <strong>Stichprobenziehung</strong>


Einleitung<br />

Grundbegriffe<br />

Stichprobe oder Totalerhebung<br />

Grundgesamtheit<br />

Auswahlgesamtheit und Stichprobe<br />

Zufallsstichproben<br />

Umfrageergebnis und tatsächliches Ergebnis der Bundestagswahl<br />

1994<br />

Partei FG Wahlen Amtl. Ergebnis<br />

CDU/CSU 42.5% 41.5%<br />

SPD 35.5% 36.4%<br />

FDP 7.0% 6.9%<br />

B90/Grüne 8.0% 7.3%<br />

PDS 3.5% 4.4%<br />

REP 2.0% 1.9%<br />

N=1.250 N=42.104.576<br />

Jost Reinecke <strong>Stichprobenziehung</strong>


Zufallsstichproben<br />

Einleitung<br />

Grundbegriffe<br />

Stichprobe oder Totalerhebung<br />

Grundgesamtheit<br />

Auswahlgesamtheit und Stichprobe<br />

Zufallsstichproben<br />

Einfache Zufallsstichproben<br />

Komplexe Zufallsstichproben<br />

Eine <strong>Stichprobenziehung</strong> wird als zufällig bezeichnet, wenn jede<br />

Einheit der Auswahlgesamtheit die gleiche Wahrscheinlichkeit hat,<br />

in die Stichprobe zu gelangen. Ein wesentlicher Vorteil von<br />

Zufallsauswahlen besteht darin, daß sich angeben läßt, wie<br />

Stichprobenergebnisse vom “wahren“ Wert der Auswahlgesamtheit<br />

abweichen. Es werden folgende Verfahren unterschieden:<br />

1. Einfache Zufallsstichproben<br />

1.1 Reine Zufallsstichprobe<br />

1.2 Systematische Zufallsstichprobe<br />

2. Komplexe Zufallsstichproben<br />

2.1 Geschichtete Stichprobe<br />

2.2 Klumpenstichprobe<br />

2.3 Mehrstufige Stichproben<br />

Jost Reinecke <strong>Stichprobenziehung</strong>


Einleitung<br />

Grundbegriffe<br />

Stichprobe oder Totalerhebung<br />

Grundgesamtheit<br />

Auswahlgesamtheit und Stichprobe<br />

Zufallsstichproben<br />

Einfache Zufallsstichproben<br />

Komplexe Zufallsstichproben<br />

Wahl des Designs/Wahl des Erhebungsmodus<br />

Wahl des Designs Wahl des Erhebungsmodus<br />

systematisch schriftlich<br />

geschichtet persönlich-mündlich<br />

- proportional<br />

- disproportional<br />

telefonisch<br />

E-Mail/Internet<br />

Jost Reinecke <strong>Stichprobenziehung</strong>


Einleitung<br />

Grundbegriffe<br />

Stichprobe oder Totalerhebung<br />

Grundgesamtheit<br />

Auswahlgesamtheit und Stichprobe<br />

Zufallsstichproben<br />

Einfache Zufallsstichproben<br />

Komplexe Zufallsstichproben<br />

◮ Wenn eine akzeptable Liste mit den Elementen der<br />

Auswahlgesamtheit vorliegt, wird aus dieser<br />

uneingeschränkt ausgewählt.<br />

◮ Wenn Zusatzinformationen zur Verfügung stehen, kann<br />

auch geschichtet ausgewählt werden. Dabei spielt der<br />

Erhebungsmodus keine Rolle.<br />

◮ Wenn keine Liste vorliegt, die für die Auswahl geeignet<br />

ist, muss auf andere Konstruktionen zurückgegriffen<br />

werden. Diese kann beispielsweise in einer mehrstufigen<br />

Flächenstichprobe mit Random-Route-Elementen<br />

bestehen. Random-Route setzt die Vorgabe von<br />

Startadressen voraus.<br />

Jost Reinecke <strong>Stichprobenziehung</strong>


Einleitung<br />

Grundbegriffe<br />

Stichprobe oder Totalerhebung<br />

Grundgesamtheit<br />

Auswahlgesamtheit und Stichprobe<br />

Zufallsstichproben<br />

Einfache Zufallsstichproben<br />

Komplexe Zufallsstichproben<br />

Beispiel für Random-Route:<br />

Gehen Sie von der Startadresse bis zur nächsten Kreuzung,<br />

dann rechts abbiegen und dann wieder links. Notieren Sie auf<br />

dem Weg jeden sechsten Haushalt.<br />

Adressermittlung und Interviews werden von verschiedenen<br />

Personen durchgeführt: → Adressandom<br />

Jost Reinecke <strong>Stichprobenziehung</strong>


Einleitung<br />

Grundbegriffe<br />

Stichprobe oder Totalerhebung<br />

Grundgesamtheit<br />

Auswahlgesamtheit und Stichprobe<br />

Zufallsstichproben<br />

Einfache Zufallsstichproben<br />

Einfache Zufallsstichproben<br />

Komplexe Zufallsstichproben<br />

◮ Man zieht eine einfache Zufallstichprobe, indem man aus einer<br />

vollständigen Liste aller Objekte der Zielpopulation nach dem<br />

Zufallsprinzip eine Anzahl von Objekten auswählt, wobei die<br />

Auswahlwahrscheinlichkeiten aller Objekte gleich groß sein<br />

müssen.<br />

◮ Bei der Auswahl von Einheiten aus einer Gesamtheit ist es von<br />

Vorteil, wenn diese Einheiten nach einem<br />

Wahrscheinlichkeitsgesetz gezogen werden, da sich dann<br />

statistisch gesicherte Aussagen über interessierende Parameter<br />

der Gesamtheit machen lassen.<br />

Jost Reinecke <strong>Stichprobenziehung</strong>


Reine Zufallsstichprobe<br />

Einleitung<br />

Grundbegriffe<br />

Stichprobe oder Totalerhebung<br />

Grundgesamtheit<br />

Auswahlgesamtheit und Stichprobe<br />

Zufallsstichproben<br />

Ausgangspunkt ist folgenden Situation:<br />

Einfache Zufallsstichproben<br />

Komplexe Zufallsstichproben<br />

◮ Es ist eine Einheit der Grundgesamtheit vom Umfang N<br />

auszuwählen und die Auswahl für jede Einheit ist gleich, d. h.<br />

1/N. Die Durchführung der Ziehung kann über ein<br />

Zufallsexperiment realisiert werden.<br />

◮ Wiederholt man dieses Zufallsexperiment n mal unabhängig<br />

und hält die ausgewählten Einheiten in einem Vektor fest, so<br />

erhält man Ziehungsergebnisse mit der gleichen<br />

Wahrscheinlichkeit. Dieses Stichprobendesign wird auch als<br />

uneingeschränkte Zufallsauswahl mit Zurücklegen bezeichnet.<br />

Jost Reinecke <strong>Stichprobenziehung</strong>


Beispiel:<br />

Einleitung<br />

Grundbegriffe<br />

Stichprobe oder Totalerhebung<br />

Grundgesamtheit<br />

Auswahlgesamtheit und Stichprobe<br />

Zufallsstichproben<br />

Einfache Zufallsstichproben<br />

Komplexe Zufallsstichproben<br />

◮ Es existiert eine Grundgesamtheit mit vier Elementen:<br />

{1, 2, 3, 4}<br />

◮ Es sollen zwei Elemente ausgewählt werden.<br />

◮ Es existieren insgesamt 6 mögliche Stichproben:<br />

4!<br />

2! · (4 − 2)!<br />

◮ Die Wahrscheinlichkeit, daß eine bestimmte Stichprobe<br />

realisiert wird, beträgt ein 1/6.<br />

Jost Reinecke <strong>Stichprobenziehung</strong><br />

(1)


Einleitung<br />

Grundbegriffe<br />

Stichprobe oder Totalerhebung<br />

Grundgesamtheit<br />

Auswahlgesamtheit und Stichprobe<br />

Zufallsstichproben<br />

Systematische Zufallsstichprobe<br />

Einfache Zufallsstichproben<br />

Komplexe Zufallsstichproben<br />

◮ Bei einer systematischen Zufallsstichprobe wird das erste<br />

Element per Zufall ermittelt.<br />

◮ Ausgehend von diesem Element werden alle weiteren Elemente<br />

systematisch ausgewählt. Damit gelangt jedes k-te Element in<br />

die Stichprobe. Mit k wird das Stichprobenintervall<br />

gekennzeichnet.<br />

k = Auswahlgesamtheit<br />

Stichprobe<br />

Jost Reinecke <strong>Stichprobenziehung</strong><br />

(2)


Beispiel:<br />

Einleitung<br />

Grundbegriffe<br />

Stichprobe oder Totalerhebung<br />

Grundgesamtheit<br />

Auswahlgesamtheit und Stichprobe<br />

Zufallsstichproben<br />

Einfache Zufallsstichproben<br />

Komplexe Zufallsstichproben<br />

◮ Es existiert eine Auswahlgesamtheit von 20.000 Personen.<br />

◮ Es soll eine Stichprobe von 500 Personen gezogen werden.<br />

k = 20.000<br />

= 40 (3)<br />

500<br />

◮ Jede 40. Person gelangt in die Stichprobe.<br />

Jost Reinecke <strong>Stichprobenziehung</strong>


Einleitung<br />

Grundbegriffe<br />

Stichprobe oder Totalerhebung<br />

Grundgesamtheit<br />

Auswahlgesamtheit und Stichprobe<br />

Zufallsstichproben<br />

Komplexe Zufallsstichproben<br />

Einfache Zufallsstichproben<br />

Komplexe Zufallsstichproben<br />

◮ Wenn keine Ausflistung der Auswahlgesamtheit vorliegt, dann<br />

verwendet man komplexe Zufallsstichproben.<br />

◮ Hierzu gehören geschichtete Stichproben, die<br />

Klumpenstichprobe und sogenannte mehrstufige<br />

Stichprobenverfahren.<br />

Jost Reinecke <strong>Stichprobenziehung</strong>


Geschichtete Stichprobe<br />

Einleitung<br />

Grundbegriffe<br />

Stichprobe oder Totalerhebung<br />

Grundgesamtheit<br />

Auswahlgesamtheit und Stichprobe<br />

Zufallsstichproben<br />

Einfache Zufallsstichproben<br />

Komplexe Zufallsstichproben<br />

◮ Zur Ziehung einer geschichteten Stichprobe werden die<br />

Elemente der Auswahlgesamtheit bezüglich des<br />

interessierenden Merkmals in Schichten eingeteilt. Aus diesen<br />

Schichten werden dann Zufallstichproben gezogen.<br />

◮ Bezeichnet man mit N(h) den Umfang der Auswahlgesamtheit<br />

und mit n(h) den Umfang der Stichprobe der h-ten Schicht<br />

(h = 1, . . . , H), so wird das gewogene arithmetische Mittel der<br />

Stichprobenmittel ¯y(h) zur Schätzung verwendet:<br />

¯ystr =<br />

H<br />

h=1<br />

N(h)<br />

¯y(h) (4)<br />

N<br />

Jost Reinecke <strong>Stichprobenziehung</strong>


Einleitung<br />

Grundbegriffe<br />

Stichprobe oder Totalerhebung<br />

Grundgesamtheit<br />

Auswahlgesamtheit und Stichprobe<br />

Zufallsstichproben<br />

Einfache Zufallsstichproben<br />

Komplexe Zufallsstichproben<br />

◮ Für die Varianz des geschichteten Schätzers kann folgende<br />

Funktion angegeben werden:<br />

s 2 str =<br />

H<br />

2 N(h) s2 (h)<br />

N n(h)<br />

h=1<br />

<br />

1 −<br />

<br />

n(h) − 1<br />

N(h) − 1<br />

◮ Ein 95%-Konfidenzintervall kann damit für den Mittelwert ¯Y<br />

der Grundgesamtheit angegeben werden:<br />

<br />

¯ystr − 1.96 s2 <br />

str ; ¯ystr + 1.96<br />

(6)<br />

◮ Je größer die Homogenität der Auswahlgesamtheit, desto<br />

kleiner der Stichprobenfehler.<br />

s 2 str<br />

Jost Reinecke <strong>Stichprobenziehung</strong><br />

(5)


Einleitung<br />

Grundbegriffe<br />

Stichprobe oder Totalerhebung<br />

Grundgesamtheit<br />

Auswahlgesamtheit und Stichprobe<br />

Zufallsstichproben<br />

Einfache Zufallsstichproben<br />

Komplexe Zufallsstichproben<br />

◮ Proportional geschichtete Stichprobe: Die Größe der<br />

Stichprobe einer Schicht wird entsprechend ihres Anteils an<br />

der Auswahlgesamtheit ausgewählt.<br />

Beispiel: Die Anteil der Arbeiter in der Stichprobe entspricht dem<br />

Anteil in der Auswahlgesamtheit.<br />

◮ Disproportional geschichtete Stichprobe: Die Größe der<br />

Stichprobe einer Schicht wird überproportional zum Anteil an<br />

der Grundgesamtheit ausgewählt.<br />

Beispiel: Die Anteil der Ostdeutschen in der Stichprobe ist höher<br />

als der Anteil der Westdeutschen.<br />

Jost Reinecke <strong>Stichprobenziehung</strong>


Klumpenstichprobe<br />

Einleitung<br />

Grundbegriffe<br />

Stichprobe oder Totalerhebung<br />

Grundgesamtheit<br />

Auswahlgesamtheit und Stichprobe<br />

Zufallsstichproben<br />

Einfache Zufallsstichproben<br />

Komplexe Zufallsstichproben<br />

Eine Klumpenstichprobe ist möglich, wenn die Grundgesamtheit in<br />

mehrere Teile (auch Klumpen genannt) zerlegt werden kann. Im<br />

einfachsten Fall besteht sie aus zwei Stufen:<br />

1. Aus allen Klumpen werden in einer uneingeschränkten<br />

Zufallsauswahl einzelne ausgewählt. Die Anzahl der<br />

ausgewählten Klumpen ist der erste Stichprobenumfang.<br />

2. Sämtliche Einheiten (Personen) der ausgewählten Klumpen<br />

werden erfasst.<br />

3. Die Anzahl der ausgewählten Einheiten ist der zweite<br />

Stichprobenumfang. Dieser Stichprobenumfang ist der<br />

eigentliche Umfang einer Klunpenstichprobe.<br />

4. Die Auswahl bezieht sich nicht auf Untersuchungseinheiten,<br />

sondern auf Aggregate von Untersuchungseinheiten<br />

(Klumpen).<br />

Jost Reinecke <strong>Stichprobenziehung</strong>


Einleitung<br />

Grundbegriffe<br />

Stichprobe oder Totalerhebung<br />

Grundgesamtheit<br />

Auswahlgesamtheit und Stichprobe<br />

Zufallsstichproben<br />

Vorteil der Klumpenstichprobe:<br />

Einfache Zufallsstichproben<br />

Komplexe Zufallsstichproben<br />

◮ Es ist nur eine umfassende Auswahlgrundlage für die<br />

Klumpen, nicht aber für die Gesamtheit aller<br />

Untersuchungseinheiten erforderlich.<br />

◮ Bei organisatorischen und geographischen Abgrenzungen der<br />

Klumpen ist eine kostengünstige Erhebung der Einheiten<br />

möglich.<br />

◮ Der Idealfall liegt vor, wenn alle Klumpen gleich groß sind und<br />

die Heterogenität der Grundgesamtheit wiedergeben.<br />

Nachteil der Klumpenstichprobe:<br />

◮ Je stärker sich die Klumpen in ihrer Größe unterscheiden und<br />

je homogener sie in Bezug auf das Untersuchungsmerkmal<br />

sind, desto größer ist der Schätzfehler. Dies wird auch als<br />

Klumpeneffekt bezeichnet.<br />

Jost Reinecke <strong>Stichprobenziehung</strong>


Mehrstufige Stichproben<br />

Einleitung<br />

Grundbegriffe<br />

Stichprobe oder Totalerhebung<br />

Grundgesamtheit<br />

Auswahlgesamtheit und Stichprobe<br />

Zufallsstichproben<br />

Einfache Zufallsstichproben<br />

Komplexe Zufallsstichproben<br />

◮ Erstreckt sich eine Zufallsauswahl über mehrere Ebenen, dann<br />

wird von einer mehrstufigen Zufallsauswahl gesprochen.<br />

◮ Mehrstufige Stichproben sind eine Reihe nacheinander<br />

durchgeführte einfache Zufallsauswahlen.<br />

◮ 1. Stufe: Stichprobe von Primäreinheiten (regionale Einheiten)<br />

◮ 2. Stufe: Stichprobe von Sekundäreinheiten aus den<br />

Primäreinheiten<br />

◮ 3. Stufe: Stichprobe von Untersuchungseinheiten aus den<br />

Sekundäreinheiten<br />

◮ Geschichtete Zufallsauswahl und Klumpenauswahl sind zwei<br />

Spezialfälle mehrstufiger Stichproben.<br />

Jost Reinecke <strong>Stichprobenziehung</strong>


Einleitung<br />

Grundbegriffe<br />

Stichprobe oder Totalerhebung<br />

Grundgesamtheit<br />

Auswahlgesamtheit und Stichprobe<br />

Zufallsstichproben<br />

Beispiel: <strong>Stichprobenziehung</strong> des ALLBUS 1998<br />

Einfache Zufallsstichproben<br />

Komplexe Zufallsstichproben<br />

1. 1. Stufe: zufällig ausgewählte Stimmbezirke<br />

2. 2. Stufe: zufällig ausgewählte Haushalten in den jeweiligen<br />

Stimmbezirken (Random-Route)<br />

3. 3. Stufe: zufällig ausgewählte Befragungsperson aus den<br />

ausgewählte Haushalten (Schwedenschlüssel)<br />

Jost Reinecke <strong>Stichprobenziehung</strong>


Einleitung<br />

Grundbegriffe<br />

Stichprobe oder Totalerhebung<br />

Grundgesamtheit<br />

Auswahlgesamtheit und Stichprobe<br />

Zufallsstichproben<br />

Einfache Zufallsstichproben<br />

Komplexe Zufallsstichproben<br />

◮ Die Primäreinheiten (Stimmbezirke) haben bei mehrstufigen<br />

Auswahlverfahren immer unterschiedlich viele Elemente.<br />

Elemente aus größeren Primäreinheiten beitzen damit eine<br />

niedrigere Auswahlwahrscheinlichkeit als Elemente aus<br />

kleineren Primäreinheiten.<br />

◮ Wenn die Primäreinheiten unterschiedlich groß sind, müssen<br />

diese mit einer Wahrscheinlichkeit ausgewählt werden, die<br />

proportional zu ihrer Größe ist.<br />

◮ Hierzu existiert das sogenannte PPS-Design (probability<br />

proportional to size).<br />

Jost Reinecke <strong>Stichprobenziehung</strong>


Einleitung<br />

Grundbegriffe<br />

Stichprobe oder Totalerhebung<br />

Grundgesamtheit<br />

Auswahlgesamtheit und Stichprobe<br />

Zufallsstichproben<br />

Beispiel für ein PPS-Design<br />

Einfache Zufallsstichproben<br />

Komplexe Zufallsstichproben<br />

1. Es werden 200 Blocks mit Auswahlwahrscheinlichkeiten<br />

proportional zu ihrer Größe (Anzahl der Haushalte im Block)<br />

ausgewählt. Die Ziehungswahrscheinlichkeit ist:<br />

nHH/Block p = nBlock<br />

nHH/Stadt nBlock ist die Anzahl der auszuwählenden Blocks, n HH/Block is<br />

die Anzahl der Haushalte im Block und n HH/Stadt als Anzahl<br />

der Haushalte der Stadt. Bei einem Block mit 100 Haushalten<br />

ergibt sich folgende Ziehungswahrscheinlichkeit:<br />

(7)<br />

p = 200 100<br />

= 0.2 (8)<br />

100000<br />

Jost Reinecke <strong>Stichprobenziehung</strong>


Einleitung<br />

Grundbegriffe<br />

Stichprobe oder Totalerhebung<br />

Grundgesamtheit<br />

Auswahlgesamtheit und Stichprobe<br />

Zufallsstichproben<br />

Einfache Zufallsstichproben<br />

Komplexe Zufallsstichproben<br />

Bei einem Block mit 400 Haushalten ergibt sich folgende<br />

Ziehungswahrscheinlichkeit:<br />

p = 200 400<br />

= 0.8 (9)<br />

100000<br />

2. Aus jedem Block werden 5 Haushalte ausgewählt. Bei 100<br />

Haushalten ist die Ziehungswahrscheinlichkeit: 5/100 = 0.05.<br />

Bei 400 Haushalten ist die Ziehungswahrscheinblichkeit:<br />

5/400 = 0.0125.<br />

3. Werden die Wahrscheinlichkeiten aus der 1. Stufe und der 2.<br />

Stufe miteinander multipliziert, dann ergibt sich die<br />

tatsächliche Auswahlwahrscheinlichkeit:<br />

p = 0.2 ∗ 0.05 = 0.8 ∗ 0.0125 = 0.01 (10)<br />

Jost Reinecke <strong>Stichprobenziehung</strong>


ADM-Stichproben-System<br />

Einleitung<br />

Grundbegriffe<br />

Stichprobe oder Totalerhebung<br />

Grundgesamtheit<br />

Auswahlgesamtheit und Stichprobe<br />

Zufallsstichproben<br />

Einfache Zufallsstichproben<br />

Komplexe Zufallsstichproben<br />

Die Arbeitsgemeinschaft Deutscher Markt- und<br />

Sozialforschungsinstitute e.V. (ADM) verwendet für<br />

persönlich-mündliche Bevölkerungsbefragungen der Markt-, Mediaund<br />

Sozialforschung, in der Regel ein speziell entwickeltes Design,<br />

das sogenannte ADM-Design. Es handelt sich dabei um eine<br />

dreistufige, geschichtete Zufallsauswahl, die zur Repräsentation der<br />

Wahlberechtigten, die in Privathaushalten identifiziert werden<br />

können, geeignet ist.<br />

Jost Reinecke <strong>Stichprobenziehung</strong>


Einleitung<br />

Grundbegriffe<br />

Stichprobe oder Totalerhebung<br />

Grundgesamtheit<br />

Auswahlgesamtheit und Stichprobe<br />

Zufallsstichproben<br />

Einfache Zufallsstichproben<br />

Komplexe Zufallsstichproben<br />

◮ 1. Stufe: Die Wahlbezirke werden nach Kreisen und<br />

Gemeindegrößenklassen geschichtet. Dabei entstehen in<br />

Westdeutschland 3280 Zellen, in Ostdeutschland 1120. Aus<br />

dem Schichttableau werden dann mit der Wahrscheinlichkeit<br />

proportional zur (geschätzten) Anzahl der Privathaushalte<br />

Wahlbezirke ausgewählt. Anschließend werden diese in<br />

möglichst überschneidungsfreie und kumulierbare<br />

Teilstichproben (sog. Netze) zerlegt und an die einzelnen<br />

Institute des ADM ausgegeben. Ein Netz umfasst 210 Sample<br />

Points in Westdeutschland und 48 Sample Points in<br />

Ostdeutschland.<br />

Jost Reinecke <strong>Stichprobenziehung</strong>


Einleitung<br />

Grundbegriffe<br />

Stichprobe oder Totalerhebung<br />

Grundgesamtheit<br />

Auswahlgesamtheit und Stichprobe<br />

Zufallsstichproben<br />

Einfache Zufallsstichproben<br />

Komplexe Zufallsstichproben<br />

◮ 2. Stufe: Anschließend werden die Haushalte gesucht, in denen<br />

schließlich die Zielperson zu ermitteln ist. Die Interviewer<br />

erhalten dazu eine vorgegebene Begehungsvorschrift. Ihnen<br />

obliegt es nun, beginnend an einer vorgegebenen Startadresse<br />

eine bestimmte Zahl von Haushalten entlang dieses Weges<br />

aufzulisten. Beim sogenannten Adressvorlaufverfahren erfolgen<br />

Begehung und Befragung getrennt. Hier wird die Liste der<br />

Haushalte dem Institut übergeben, das eine Zufallsauswahl der<br />

Zielhaushalte vornimmt. Der Interviewer bekommt damit die<br />

Haushaltsadressen vorgegeben, bei denen eine Befragung<br />

durchzuführen ist.<br />

◮ 3. Stufe: In der letzten Auswahlstufe werden schließlich die zu<br />

befragenden Personen ermittelt. Diese Auswahl erfolgt erst<br />

während der Feldarbeit. Dazu wird der sogenannte<br />

Schwedenschlüssel verwendet.<br />

Jost Reinecke <strong>Stichprobenziehung</strong>


Einleitung<br />

Grundbegriffe<br />

Stichprobe oder Totalerhebung<br />

Grundgesamtheit<br />

Auswahlgesamtheit und Stichprobe<br />

Zufallsstichproben<br />

Einwohnermeldeamtsstichproben<br />

Einfache Zufallsstichproben<br />

Komplexe Zufallsstichproben<br />

◮ Das derzeitig qualitativ hochwertigste Design für bundesweite<br />

Bevölkerungsumfragen in Deutschland ist die<br />

Einwohnermeldeamtstichprobe, die auf einem geschichteten,<br />

zweistufigem Zufallsverfahren basiert.<br />

◮ Da in Deutschland kein zentrales Einwohnerregister besteht,<br />

sondern die Register auf Gemeindeebene organisiert sind, muss<br />

in einem ersten Schritt eine Auswahl von Gemeinden erfolgen.<br />

Jost Reinecke <strong>Stichprobenziehung</strong>


Einleitung<br />

Grundbegriffe<br />

Stichprobe oder Totalerhebung<br />

Grundgesamtheit<br />

Auswahlgesamtheit und Stichprobe<br />

Zufallsstichproben<br />

Einfache Zufallsstichproben<br />

Komplexe Zufallsstichproben<br />

Beispiel: Konstruktion der Einwohnermeldeamtsstichprobe für den<br />

European Social Survey 2003<br />

◮ Grundgesamtheit dieser Untersuchung waren alle Personen im<br />

Alter von 15 Jahren und älter, die in Deutschland in<br />

Privathaushalten leben.<br />

◮ Für Ost- und Westdeutschland wurde ein disproportionaler<br />

Stichprobenansatz gewählt: 1000 Interviews in Ostdeutschland<br />

und in 2000 Interviews in Westdeutschland.<br />

◮ Zunächst wurden die Gemeinden nach Kreisen und<br />

Gemeindegrößenklassen geschichtet. Dabei ergaben sich 1.085<br />

Schichtzellen in West- und 435 Schichtzellen in<br />

Ostdeutschland.<br />

Jost Reinecke <strong>Stichprobenziehung</strong>


Einleitung<br />

Grundbegriffe<br />

Stichprobe oder Totalerhebung<br />

Grundgesamtheit<br />

Auswahlgesamtheit und Stichprobe<br />

Zufallsstichproben<br />

Einfache Zufallsstichproben<br />

Komplexe Zufallsstichproben<br />

◮ In der ersten Auswahlstufe wurden aus diesen Schichten 100<br />

Gemeinden in West- und 50 Gemeinden in Ostdeutschland<br />

proportional zur Bevölkerungszahl 15 Jahre und älter<br />

ausgewählt. Die Zahl der Sample Points in Westdeutschland<br />

beträgt 108, in Ostdeutschland 55.<br />

◮ In der zweiten Auswahlstufe wird in den entsprechenden<br />

Einwohnermeldeämtern für jeden Sample Point per<br />

systematischer Zufallsauswahl eine feste Zahl von Personen<br />

gezogen.<br />

Jost Reinecke <strong>Stichprobenziehung</strong>

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!