Weiterentwicklung der amtlichen Haushaltsstatistiken - RatSWD

tanzen bei zugelassener Mehrfachverwendung zur minimalen Distanzsumme, 

wodurch auch Zusammenhänge zwischen den gemeinsamen und den fusionierten 

Variablen besser erhalten bleiben. Verfahren mit Distanzsummenoptimierung 

wie Optimal Matching (Hansen 2004) sind daher vor allem zu empfehlen, 

wenn Donoren- und Rezipientenstichprobe Zufallsstichproben aus der gleichen 

Grundgesamtheit sind und mehr Donoren als Rezipienten zur Verfügung stehen. 

Propensity Score-Matching als ungeeignete Fusionsmethode 

Neben den oben genannten Kriterien sollte bei der Wahl des Algorithmus vor 

allem beachtet werden, dass „Matchingalgorithmus“ nicht mit „Imputationsverfahren“ 

gleichzusetzen ist. Insbesondere die zunehmende Popularität des 

Rubin Causal Model (Rubin 1974) hat Propensity Score-Matching-Verfahren in 

den Vordergrund gerückt (Rosenbaum und Rubin 1983), die für Datenfusionsproblemstellungen 

genutzt werden, aber gänzlich ungeeignet sind, da sie für 

den Zweck entwickelt wurden, strukturgleiche Stichproben zu erzeugen. Grob 

erklärt wird bei diesen Verfahren zunächst eine Zugehörigkeitswahrscheinlichkeit 

(„Propensity“) zu einer Gruppe versus einer zweiten modelliert. Anschließend 

werden Beobachtungen aus dieser zweiten Gruppe anhand des Propensity 

Scores (typischerweise durch ein binomiales verallgemeinertes lineares Modell 

geschätzt) einem nächsten Nachbarn aus der ersten Gruppe zugewiesen. In Problemstellungen 

zu Kausalinferenz handelt es sich bei den beiden Gruppen um 

eine Testgruppe, die ein bestimmtes „Treatment“ erhalten hat und eine Kontrollgruppe. 

Da bei Beobachtungsstudien die Zuweisung des „Treatments“ nicht zufällig 

erfolgt, versucht man über das Propensity Score Matching den Einfluss von 

anderen Variablen (so genannten „Confounders“) zu eliminieren. Würde man das 

Verfahren auf Daten aus einem Zufallsexperiment anwenden, hätte das Modell 

keinerlei Erklärungskraft und das Propensity Score Matching entspräche einer 

zufälligen Zuweisung der „Matched Controls“ zu den Rezipienten (mit „Treatment“). 

Dies entspricht exakt der Situation, wie man sie bei einer Datenfusion 

vorfindet, in der beide Studien Zufallsstichproben der gleichen Grundgesamtheit 

sind und der Datenausfallmechanismus somit MCAR ist. Die Fälle der Donorenstichprobe 

nehmen die Rolle der Beobachtungen der Kontrollgruppe ein, die 

Fälle der Rezipientenstichprobe die der Beobachtungen der Testgruppe, und die 

gemeinsamen Variablen entsprechen den „Confounders“ im Propensity Score- 

Modell (das auf Grund der identischen Stichprobenstrukturen auch hier keinerlei 

Erklärungskraft hat). Die zufällige Zuweisung spielt bei einer Kausalanalyse 

keine Rolle, aber bei einer Fusion ist sie fatal, da es ja genau die Zusammenhänge 

zwischen den spezifischen Merkmalen sind, die von Auswertungsinteresse sind; 

bei Verwendung eines Propensity Score Matchings sind Y und Z in einer solchen 

Situation jedoch unabhängig voneinander. 

91

Vorherige Seite

Nächste Seite

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

51

52

53

54

55

56

57

58

59

60

61

62

63

64

65

66

67

68

69

70

71

72

73

74

76

77

78

81

82

84

85

86

87

88

89

90

91

92

93

95

96

97

98

99

Weiterentwicklung der amtlichen Haushaltsstatistiken - RatSWD

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?