Stichproben nach § 42 RSAV - Bundesversicherungsamt
Stichproben nach § 42 RSAV - Bundesversicherungsamt
Stichproben nach § 42 RSAV - Bundesversicherungsamt
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
Planung und Hochrechnung einer einfachen Zufallsstichprobe 21<br />
ausgeht, dass der Anteil der Versicherten mit Fehlern in den übermittelten Daten 11 klein<br />
ist und in einer Größenordnung von unter 10% angenommen werden kann, so lässt sich<br />
aber schlussfolgern, dass der Korrekturbetrag als Versichertenmerkmal eine extrem<br />
schiefe Verteilung aufweist, da dann mindestens 90% der Merkmalsausprägungen Null<br />
sind. Damit ist der Median der Verteilung a priori ebenfalls Null und der Mittelwert weist<br />
eine aufgeblähte Varianz auf, die jedenfalls wesentlich größer ist, als man z. B. bei<br />
Messwerten, die einer Normalverteilung genügen, erfahrungsgemäß erwarten kann.<br />
Diese Überlegungen weisen auf ein Grundproblem des Versuchs hin, den mittleren Korrekturbetrag<br />
(oder, was aufs Gleiche hinauskommt, die Summe der Korrekturbeträge)<br />
auf <strong>Stichproben</strong>basis zu ermitteln. Der <strong>Stichproben</strong>umfang, der benötigt wird, um den<br />
mittleren Korrekturbetrag mit vorgegebener Präzision zu schätzen, ist, wie im nächsten<br />
Abschnitt gezeigt wird, näherungsweise proportional zum quadrierten Variationskoeffizienten<br />
12 . Da die aufgeblähte Varianz mit einem aufgeblähten Variationskoeffizienten<br />
einhergeht, werden überdurchschnittlich große <strong>Stichproben</strong>umfänge benötigt, um eine<br />
ausreichende Genauigkeit zu erreichen.<br />
Wie die folgende Überlegung zeigt, kommt es dabei vor allem darauf an, den Anteil der<br />
Versicherten mit Fehlern in den übermittelten Daten genau zu schätzen.<br />
Ist K deren Anzahl (in der Grundgesamtheit) und seien die Versicherten insgesamt so<br />
nummeriert, dass diejenigen mit Datenfehlern die ersten K Plätze einnehmen, dann ist<br />
K 1<br />
(11) YF Yi<br />
K i1 ein mittlerer Korrekturbetrag, der ohne Einbeziehung der vielen Versicherten mit einem<br />
Null-Betrag berechnet wurde, also frei von den oben geschilderten Defiziten ist.<br />
Der Anteil der Versicherten mit Fehlern in den Daten berechnet sich in der Grundgesamtheit<br />
wie folgt:<br />
K<br />
(12) pF<br />
<br />
N<br />
Es besteht nun offenbar folgende Beziehung zwischen dem mittleren Korrekturbetrag<br />
und den Größen aus (11) und (12):<br />
(13) YpF YF,<br />
so dass Fehler bei der Schätzung von pF unmittelbar zu Fehlern in der Schätzung von Y<br />
führen.<br />
11<br />
Diese Versichertengruppe sei im Weiteren unter dem Kürzel VGF angesprochen.<br />
12<br />
Der Variationskoeffizient V ist definiert als Standardabweichung/Mittelwert.<br />
Schäfer <strong>Stichproben</strong> <strong>nach</strong> <strong>§</strong> <strong>42</strong> <strong>RSAV</strong>