08.06.2014 Aufrufe

Weiterentwicklung der amtlichen Haushaltsstatistiken - RatSWD

Weiterentwicklung der amtlichen Haushaltsstatistiken - RatSWD

Weiterentwicklung der amtlichen Haushaltsstatistiken - RatSWD

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Zusammenfassung<br />

Datenfusionen wurden in Deutschland zwar bereits in den 1970-er Jahren von<br />

Friedrich Wendt durchgeführt, allerdings hat erst die Verfügbarkeit von notwendiger<br />

Rechenleistung sowie die Verfügbarkeit von Imputations-, Matching- und<br />

Data Mining-Algorithmen zu einem großen Popularitätsschub geführt. Wie in<br />

<strong>der</strong> Einleitung bereits angedeutet, ist <strong>der</strong> Begriff „Datenfusion“ diffus und bezieht<br />

sich bisweilen eher auf die Methode, als dass er <strong>der</strong> eingangs gegebenen Definition<br />

entspricht.<br />

Die nach unserem Wissen ersten größeren, kontinuierlichen Datenfusionsprojekte<br />

in Deutschland stammen aus <strong>der</strong> kommerziellen Medienforschung, da<br />

dort <strong>der</strong> Wunsch nach einer Datenquelle, die alle relevanten Medien abbildet, auf<br />

die Eigenständigkeit <strong>der</strong> einzelnen „Währungsstudien“ 5 sowie medienpolitische<br />

Wi<strong>der</strong>stände trifft.<br />

Auf Grund <strong>der</strong> Methodenvielfalt und unterschiedlichen Auswertungsziele ist<br />

es schwierig, ein Verfahren als universell am geeignetsten zu bezeichnen. In Kapitel<br />

drei wurde erläutert, nach welchen Kriterien eine Einteilung <strong>der</strong> Verfahren<br />

möglich ist. Die seit langem eingesetzten Matchingverfahren werden weiterhin<br />

eine wichtige Rolle spielen, allerdings ist davon auszugehen, dass diese zukünftig<br />

verstärkt aus <strong>der</strong> Perspektive <strong>der</strong> Statistik-Literatur zu fehlenden Daten untersucht<br />

und somit auch die Erkenntnisse im Bereich <strong>der</strong> Inferenz von unvollständigen<br />

Daten zunehmend eine Rolle spielen werden. Ein erster Schritt ist es zu<br />

erkennen, dass Datenfusion eine Datenergänzung und <strong>der</strong> durch die Ergänzung<br />

induzierten Unsicherheit durch größere Konfidenzintervalle Rechnung zu tragen<br />

ist. Wir gehen daher davon aus, dass varianzkorrigierende Verfahren wie Multiple<br />

Imputation zukünftig häufiger in empirischen Datenfusionsprojekten zu finden<br />

sein werden.<br />

Der schwierigste Transfer aus <strong>der</strong> Wissenschaft in die Anwendung ist unserer<br />

Meinung nach <strong>der</strong> Umgang mit <strong>der</strong> Annahme <strong>der</strong> bedingten Unabhängigkeit,<br />

da insbeson<strong>der</strong>e in Surveydaten die Zusammenhänge oft nicht ausreichend sind,<br />

um die Bandbreiten <strong>der</strong> möglichen Korrelationen zwischen Y und Z auf ein für<br />

die Praxis befriedigendes Niveau zu bringen. Hier könnten zukünftig Bayesianische<br />

Ansätze Abhilfe schaffen, über die Hilfsinformation bezüglich <strong>der</strong> gemeinsamen<br />

Verteilung von Y und Z in die Modellierung aufgenommen wird, die in den<br />

Datenmatrizen selbst nicht abbildbar ist.<br />

5 Der Begriff wird typischerweise für die Studie gewählt, auf <strong>der</strong>en Basis Preise für Werbung im jeweiligen<br />

Medium ausgehandelt werden.<br />

97

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!