Weiterentwicklung der amtlichen Haushaltsstatistiken - RatSWD
Weiterentwicklung der amtlichen Haushaltsstatistiken - RatSWD
Weiterentwicklung der amtlichen Haushaltsstatistiken - RatSWD
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Zusammenfassung<br />
Datenfusionen wurden in Deutschland zwar bereits in den 1970-er Jahren von<br />
Friedrich Wendt durchgeführt, allerdings hat erst die Verfügbarkeit von notwendiger<br />
Rechenleistung sowie die Verfügbarkeit von Imputations-, Matching- und<br />
Data Mining-Algorithmen zu einem großen Popularitätsschub geführt. Wie in<br />
<strong>der</strong> Einleitung bereits angedeutet, ist <strong>der</strong> Begriff „Datenfusion“ diffus und bezieht<br />
sich bisweilen eher auf die Methode, als dass er <strong>der</strong> eingangs gegebenen Definition<br />
entspricht.<br />
Die nach unserem Wissen ersten größeren, kontinuierlichen Datenfusionsprojekte<br />
in Deutschland stammen aus <strong>der</strong> kommerziellen Medienforschung, da<br />
dort <strong>der</strong> Wunsch nach einer Datenquelle, die alle relevanten Medien abbildet, auf<br />
die Eigenständigkeit <strong>der</strong> einzelnen „Währungsstudien“ 5 sowie medienpolitische<br />
Wi<strong>der</strong>stände trifft.<br />
Auf Grund <strong>der</strong> Methodenvielfalt und unterschiedlichen Auswertungsziele ist<br />
es schwierig, ein Verfahren als universell am geeignetsten zu bezeichnen. In Kapitel<br />
drei wurde erläutert, nach welchen Kriterien eine Einteilung <strong>der</strong> Verfahren<br />
möglich ist. Die seit langem eingesetzten Matchingverfahren werden weiterhin<br />
eine wichtige Rolle spielen, allerdings ist davon auszugehen, dass diese zukünftig<br />
verstärkt aus <strong>der</strong> Perspektive <strong>der</strong> Statistik-Literatur zu fehlenden Daten untersucht<br />
und somit auch die Erkenntnisse im Bereich <strong>der</strong> Inferenz von unvollständigen<br />
Daten zunehmend eine Rolle spielen werden. Ein erster Schritt ist es zu<br />
erkennen, dass Datenfusion eine Datenergänzung und <strong>der</strong> durch die Ergänzung<br />
induzierten Unsicherheit durch größere Konfidenzintervalle Rechnung zu tragen<br />
ist. Wir gehen daher davon aus, dass varianzkorrigierende Verfahren wie Multiple<br />
Imputation zukünftig häufiger in empirischen Datenfusionsprojekten zu finden<br />
sein werden.<br />
Der schwierigste Transfer aus <strong>der</strong> Wissenschaft in die Anwendung ist unserer<br />
Meinung nach <strong>der</strong> Umgang mit <strong>der</strong> Annahme <strong>der</strong> bedingten Unabhängigkeit,<br />
da insbeson<strong>der</strong>e in Surveydaten die Zusammenhänge oft nicht ausreichend sind,<br />
um die Bandbreiten <strong>der</strong> möglichen Korrelationen zwischen Y und Z auf ein für<br />
die Praxis befriedigendes Niveau zu bringen. Hier könnten zukünftig Bayesianische<br />
Ansätze Abhilfe schaffen, über die Hilfsinformation bezüglich <strong>der</strong> gemeinsamen<br />
Verteilung von Y und Z in die Modellierung aufgenommen wird, die in den<br />
Datenmatrizen selbst nicht abbildbar ist.<br />
5 Der Begriff wird typischerweise für die Studie gewählt, auf <strong>der</strong>en Basis Preise für Werbung im jeweiligen<br />
Medium ausgehandelt werden.<br />
97