Weiterentwicklung der amtlichen Haushaltsstatistiken - RatSWD
Weiterentwicklung der amtlichen Haushaltsstatistiken - RatSWD
Weiterentwicklung der amtlichen Haushaltsstatistiken - RatSWD
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
tanzen bei zugelassener Mehrfachverwendung zur minimalen Distanzsumme,<br />
wodurch auch Zusammenhänge zwischen den gemeinsamen und den fusionierten<br />
Variablen besser erhalten bleiben. Verfahren mit Distanzsummenoptimierung<br />
wie Optimal Matching (Hansen 2004) sind daher vor allem zu empfehlen,<br />
wenn Donoren- und Rezipientenstichprobe Zufallsstichproben aus <strong>der</strong> gleichen<br />
Grundgesamtheit sind und mehr Donoren als Rezipienten zur Verfügung stehen.<br />
Propensity Score-Matching als ungeeignete Fusionsmethode<br />
Neben den oben genannten Kriterien sollte bei <strong>der</strong> Wahl des Algorithmus vor<br />
allem beachtet werden, dass „Matchingalgorithmus“ nicht mit „Imputationsverfahren“<br />
gleichzusetzen ist. Insbeson<strong>der</strong>e die zunehmende Popularität des<br />
Rubin Causal Model (Rubin 1974) hat Propensity Score-Matching-Verfahren in<br />
den Vor<strong>der</strong>grund gerückt (Rosenbaum und Rubin 1983), die für Datenfusionsproblemstellungen<br />
genutzt werden, aber gänzlich ungeeignet sind, da sie für<br />
den Zweck entwickelt wurden, strukturgleiche Stichproben zu erzeugen. Grob<br />
erklärt wird bei diesen Verfahren zunächst eine Zugehörigkeitswahrscheinlichkeit<br />
(„Propensity“) zu einer Gruppe versus einer zweiten modelliert. Anschließend<br />
werden Beobachtungen aus dieser zweiten Gruppe anhand des Propensity<br />
Scores (typischerweise durch ein binomiales verallgemeinertes lineares Modell<br />
geschätzt) einem nächsten Nachbarn aus <strong>der</strong> ersten Gruppe zugewiesen. In Problemstellungen<br />
zu Kausalinferenz handelt es sich bei den beiden Gruppen um<br />
eine Testgruppe, die ein bestimmtes „Treatment“ erhalten hat und eine Kontrollgruppe.<br />
Da bei Beobachtungsstudien die Zuweisung des „Treatments“ nicht zufällig<br />
erfolgt, versucht man über das Propensity Score Matching den Einfluss von<br />
an<strong>der</strong>en Variablen (so genannten „Confoun<strong>der</strong>s“) zu eliminieren. Würde man das<br />
Verfahren auf Daten aus einem Zufallsexperiment anwenden, hätte das Modell<br />
keinerlei Erklärungskraft und das Propensity Score Matching entspräche einer<br />
zufälligen Zuweisung <strong>der</strong> „Matched Controls“ zu den Rezipienten (mit „Treatment“).<br />
Dies entspricht exakt <strong>der</strong> Situation, wie man sie bei einer Datenfusion<br />
vorfindet, in <strong>der</strong> beide Studien Zufallsstichproben <strong>der</strong> gleichen Grundgesamtheit<br />
sind und <strong>der</strong> Datenausfallmechanismus somit MCAR ist. Die Fälle <strong>der</strong> Donorenstichprobe<br />
nehmen die Rolle <strong>der</strong> Beobachtungen <strong>der</strong> Kontrollgruppe ein, die<br />
Fälle <strong>der</strong> Rezipientenstichprobe die <strong>der</strong> Beobachtungen <strong>der</strong> Testgruppe, und die<br />
gemeinsamen Variablen entsprechen den „Confoun<strong>der</strong>s“ im Propensity Score-<br />
Modell (das auf Grund <strong>der</strong> identischen Stichprobenstrukturen auch hier keinerlei<br />
Erklärungskraft hat). Die zufällige Zuweisung spielt bei einer Kausalanalyse<br />
keine Rolle, aber bei einer Fusion ist sie fatal, da es ja genau die Zusammenhänge<br />
zwischen den spezifischen Merkmalen sind, die von Auswertungsinteresse sind;<br />
bei Verwendung eines Propensity Score Matchings sind Y und Z in einer solchen<br />
Situation jedoch unabhängig voneinan<strong>der</strong>.<br />
91