10.10.2013 Aufrufe

Stichproben nach § 42 RSAV - Bundesversicherungsamt

Stichproben nach § 42 RSAV - Bundesversicherungsamt

Stichproben nach § 42 RSAV - Bundesversicherungsamt

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Planung und Hochrechnung einer einfachen Zufallsstichprobe 21<br />

ausgeht, dass der Anteil der Versicherten mit Fehlern in den übermittelten Daten 11 klein<br />

ist und in einer Größenordnung von unter 10% angenommen werden kann, so lässt sich<br />

aber schlussfolgern, dass der Korrekturbetrag als Versichertenmerkmal eine extrem<br />

schiefe Verteilung aufweist, da dann mindestens 90% der Merkmalsausprägungen Null<br />

sind. Damit ist der Median der Verteilung a priori ebenfalls Null und der Mittelwert weist<br />

eine aufgeblähte Varianz auf, die jedenfalls wesentlich größer ist, als man z. B. bei<br />

Messwerten, die einer Normalverteilung genügen, erfahrungsgemäß erwarten kann.<br />

Diese Überlegungen weisen auf ein Grundproblem des Versuchs hin, den mittleren Korrekturbetrag<br />

(oder, was aufs Gleiche hinauskommt, die Summe der Korrekturbeträge)<br />

auf <strong>Stichproben</strong>basis zu ermitteln. Der <strong>Stichproben</strong>umfang, der benötigt wird, um den<br />

mittleren Korrekturbetrag mit vorgegebener Präzision zu schätzen, ist, wie im nächsten<br />

Abschnitt gezeigt wird, näherungsweise proportional zum quadrierten Variationskoeffizienten<br />

12 . Da die aufgeblähte Varianz mit einem aufgeblähten Variationskoeffizienten<br />

einhergeht, werden überdurchschnittlich große <strong>Stichproben</strong>umfänge benötigt, um eine<br />

ausreichende Genauigkeit zu erreichen.<br />

Wie die folgende Überlegung zeigt, kommt es dabei vor allem darauf an, den Anteil der<br />

Versicherten mit Fehlern in den übermittelten Daten genau zu schätzen.<br />

Ist K deren Anzahl (in der Grundgesamtheit) und seien die Versicherten insgesamt so<br />

nummeriert, dass diejenigen mit Datenfehlern die ersten K Plätze einnehmen, dann ist<br />

K 1<br />

(11) YF Yi<br />

K i1 ein mittlerer Korrekturbetrag, der ohne Einbeziehung der vielen Versicherten mit einem<br />

Null-Betrag berechnet wurde, also frei von den oben geschilderten Defiziten ist.<br />

Der Anteil der Versicherten mit Fehlern in den Daten berechnet sich in der Grundgesamtheit<br />

wie folgt:<br />

K<br />

(12) pF<br />

<br />

N<br />

Es besteht nun offenbar folgende Beziehung zwischen dem mittleren Korrekturbetrag<br />

und den Größen aus (11) und (12):<br />

(13) YpF YF,<br />

so dass Fehler bei der Schätzung von pF unmittelbar zu Fehlern in der Schätzung von Y<br />

führen.<br />

11<br />

Diese Versichertengruppe sei im Weiteren unter dem Kürzel VGF angesprochen.<br />

12<br />

Der Variationskoeffizient V ist definiert als Standardabweichung/Mittelwert.<br />

Schäfer <strong>Stichproben</strong> <strong>nach</strong> <strong>§</strong> <strong>42</strong> <strong>RSAV</strong>

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!