Design - Kai Arzheimer

kai.arzheimer.com

Design - Kai Arzheimer

Design

■ Koopmans/Olzak untersuchen Aggregate (=Bundesländer)

Design

Modelierung

Count-Data

Signifikanz

- p. 1/4


Design

■ Koopmans/Olzak untersuchen Aggregate (=Bundesländer)

■ Bei den von Koopmans/Olzak untersuchten Fällen handelt

es sich um Kombinationen von Bundesländer×Jahren

Design

Modelierung

Count-Data

Signifikanz

- p. 1/4


Design

■ Koopmans/Olzak untersuchen Aggregate (=Bundesländer)

■ Bei den von Koopmans/Olzak untersuchten Fällen handelt

es sich um Kombinationen von Bundesländer×Jahren

■ Dieses Design ist in der Vergleichenden

Politikwissenschaft als „Time Series Cross Sectional“

bekannt und beliebt

Design

Modelierung

Count-Data

Signifikanz

- p. 1/4


Design

BY 91 BW 91 BR 91

Design

Modelierung

Count-Data

Signifikanz

BY 92 BW 92 BR 92

BY 93 BW 93 BR 93

- p. 1/4


Design

■ Koopmans/Olzak untersuchen Aggregate (=Bundesländer)

■ Bei den von Koopmans/Olzak untersuchten Fällen handelt

es sich um Kombinationen von Bundesländer×Jahren

■ Dieses Design ist in der Vergleichenden

Politikwissenschaft als „Time Series Cross Sectional“

bekannt und beliebt

■ Vorteile: Die Fallzahl ist größer

Design

Modelierung

Count-Data

Signifikanz

- p. 1/4


Design

■ Koopmans/Olzak untersuchen Aggregate (=Bundesländer)

■ Bei den von Koopmans/Olzak untersuchten Fällen handelt

es sich um Kombinationen von Bundesländer×Jahren

■ Dieses Design ist in der Vergleichenden

Politikwissenschaft als „Time Series Cross Sectional“

bekannt und beliebt

■ Vorteile: Die Fallzahl ist größer

Design

Modelierung

Count-Data

Signifikanz

■ Nachteile/Probleme:

◆ Zunächst häufig Irritation (was ist die

Untersuchungseinheit)

◆ Nicht modellierte Störvariablen sind in Zeit und Raum

korreliert – das erfordert besondere Umsicht

- p. 1/4


Modelierung

■ Standardmodell in der Politikwissenschaft ist die lineare

Regression

Design

Modelierung

Count-Data

Signifikanz

- p. 2/4


Modelierung

■ Standardmodell in der Politikwissenschaft ist die lineare

Regression

■ Eine abhängige Variable (y) wird als Funktion von

1. einer Konstanten (a)

2. mehreren unabhängigen Variablen (x 1 , x 2 , . . .) sowie

3. zufälligen Einflüssen (e) aufgefaßt

Design

Modelierung

Count-Data

Signifikanz

- p. 2/4


Modelierung

■ Standardmodell in der Politikwissenschaft ist die lineare

Regression

■ Eine abhängige Variable (y) wird als Funktion von

1. einer Konstanten (a)

2. mehreren unabhängigen Variablen (x 1 , x 2 , . . .) sowie

3. zufälligen Einflüssen (e) aufgefaßt

■ Letztere wird benötigt, weil nie alle relevanten Einflüsse

erfaßt werden können und die realen Werte immer von den

erwarteten Werten abweichen

Design

Modelierung

Count-Data

Signifikanz

- p. 2/4


Modelierung

■ y = a + b 1 × x 1 + b 2 × x 2 . . . + e

Design

Modelierung

Count-Data

Signifikanz

- p. 2/4


Modelierung

■ y = a + b 1 × x 1 + b 2 × x 2 . . . + e

■ die Regresionsgewichte b 1 , b 2 . . . spiegeln das Gewicht der

Einflüsse von x 1 , x 2 , . . . wieder

Design

Modelierung

Count-Data

Signifikanz

- p. 2/4


Modelierung

■ y = a + b 1 × x 1 + b 2 × x 2 . . . + e

■ die Regresionsgewichte b 1 , b 2 . . . spiegeln das Gewicht der

Einflüsse von x 1 , x 2 , . . . wieder

■ Ihre Interpretation ist einfach: Sie entsprechen der

erwarteten Veränderung von y, wenn sich x um eine

Einheit verändert

Design

Modelierung

Count-Data

Signifikanz

- p. 2/4


Modelierung

■ y = a + b 1 × x 1 + b 2 × x 2 . . . + e

■ die Regresionsgewichte b 1 , b 2 . . . spiegeln das Gewicht der

Einflüsse von x 1 , x 2 , . . . wieder

■ Ihre Interpretation ist einfach: Sie entsprechen der

erwarteten Veränderung von y, wenn sich x um eine

Einheit verändert

■ Für die Störgröße wird u. a. angenommen, daß

1. ihr konditionaler Mittelwert (=Mittelewert für eine

bestimmte Konstellation von unabhängigen Variablen)

gleich 0 ist

2. ihre Varianz von der Ausprägung der unabhängigen

Variablen unabhängig und konstant ist

3. ihre Werte normalverteilt sind

Design

Modelierung

Count-Data

Signifikanz

- p. 2/4


Modelierung

■ y = a + b 1 × x 1 + b 2 × x 2 . . . + e

■ die Regresionsgewichte b 1 , b 2 . . . spiegeln das Gewicht der

Einflüsse von x 1 , x 2 , . . . wieder

■ Ihre Interpretation ist einfach: Sie entsprechen der

erwarteten Veränderung von y, wenn sich x um eine

Einheit verändert

■ Für die Störgröße wird u. a. angenommen, daß

1. ihr konditionaler Mittelwert (=Mittelewert für eine

bestimmte Konstellation von unabhängigen Variablen)

gleich 0 ist

2. ihre Varianz von der Ausprägung der unabhängigen

Variablen unabhängig und konstant ist

3. ihre Werte normalverteilt sind

■ y ist eine kontinuierliche Größe und kann Werte zwischen

−∞ und +∞ annehmen

Design

Modelierung

Count-Data

Signifikanz

- p. 2/4


Count-Data

■ Häufigkeiten (z. B.) Gewalttaten

1. haben keine negativen Werte

2. sind nicht kontinuierlich, sondern ganzzahlig

Design

Modelierung

Count-Data

Signifikanz

- p. 3/4


Count-Data

■ Häufigkeiten (z. B.) Gewalttaten

1. haben keine negativen Werte

2. sind nicht kontinuierlich, sondern ganzzahlig

■ Unsinnige Vorhersagewerte bei linearer Regression

Design

Modelierung

Count-Data

Signifikanz

- p. 3/4


Count-Data

■ Häufigkeiten (z. B.) Gewalttaten

1. haben keine negativen Werte

2. sind nicht kontinuierlich, sondern ganzzahlig

■ Unsinnige Vorhersagewerte bei linearer Regression

Design

Modelierung

Count-Data

Signifikanz

■ Die Störgröße kann außerdem nicht normalverteilt sein →

Poisson- und verwandte Modelle

- p. 3/4


Count-Data

■ Häufigkeiten (z. B.) Gewalttaten

1. haben keine negativen Werte

2. sind nicht kontinuierlich, sondern ganzzahlig

■ Unsinnige Vorhersagewerte bei linearer Regression

Design

Modelierung

Count-Data

Signifikanz

■ Die Störgröße kann außerdem nicht normalverteilt sein →

Poisson- und verwandte Modelle

■ Poisson-Verteilung hat nur einen Parameter µ („rate“), der

Mittelwert und Streuung festlegt

- p. 3/4


Count-Data

■ Häufigkeiten (z. B.) Gewalttaten

1. haben keine negativen Werte

2. sind nicht kontinuierlich, sondern ganzzahlig

■ Unsinnige Vorhersagewerte bei linearer Regression

Design

Modelierung

Count-Data

Signifikanz

■ Die Störgröße kann außerdem nicht normalverteilt sein →

Poisson- und verwandte Modelle

■ Poisson-Verteilung hat nur einen Parameter µ („rate“), der

Mittelwert und Streuung festlegt

■ Modelliert wird nicht die Zahl der Gewalttaten selbst,

sondern die rate

- p. 3/4


Count-Data

■ Häufigkeiten (z. B.) Gewalttaten

1. haben keine negativen Werte

2. sind nicht kontinuierlich, sondern ganzzahlig

■ Unsinnige Vorhersagewerte bei linearer Regression

Design

Modelierung

Count-Data

Signifikanz

■ Die Störgröße kann außerdem nicht normalverteilt sein →

Poisson- und verwandte Modelle

■ Poisson-Verteilung hat nur einen Parameter µ („rate“), der

Mittelwert und Streuung festlegt

■ Modelliert wird nicht die Zahl der Gewalttaten selbst,

sondern die rate

■ Zusätzliche Komplikation durch Exponentialform (erzwingt

positive Werte für µ)

- p. 3/4


Count-Data

■ Häufigkeiten (z. B.) Gewalttaten

1. haben keine negativen Werte

2. sind nicht kontinuierlich, sondern ganzzahlig

■ Unsinnige Vorhersagewerte bei linearer Regression

Design

Modelierung

Count-Data

Signifikanz

■ Die Störgröße kann außerdem nicht normalverteilt sein →

Poisson- und verwandte Modelle

■ Poisson-Verteilung hat nur einen Parameter µ („rate“), der

Mittelwert und Streuung festlegt

■ Modelliert wird nicht die Zahl der Gewalttaten selbst,

sondern die rate

■ Zusätzliche Komplikation durch Exponentialform (erzwingt

positive Werte für µ)

■ µ = exp(a + b 1 × x 1 + b 2 × x 2 . . .)

- p. 3/4


Count-Data

■ Häufigkeiten (z. B.) Gewalttaten

1. haben keine negativen Werte

2. sind nicht kontinuierlich, sondern ganzzahlig

■ Unsinnige Vorhersagewerte bei linearer Regression

Design

Modelierung

Count-Data

Signifikanz

■ Die Störgröße kann außerdem nicht normalverteilt sein →

Poisson- und verwandte Modelle

■ Poisson-Verteilung hat nur einen Parameter µ („rate“), der

Mittelwert und Streuung festlegt

■ Modelliert wird nicht die Zahl der Gewalttaten selbst,

sondern die rate

■ Zusätzliche Komplikation durch Exponentialform (erzwingt

positive Werte für µ)

■ µ = exp(a + b 1 × x 1 + b 2 × x 2 . . .)

■ Varianz der Störgröße durch µ festgelegt → paßt oft nicht

gut („overdispersion“), deshalb zusätzlicher Parameter →

„negative binomial model“ (bei Koopmans/Olzak)

- p. 3/4


Signifikanz

■ Ist (unter bestimmten Voraussetzungen) ein Anhaltspunkt

dafür, daß die in der Stichprobe gefundenen Verhältnisse

mit großer Wahrscheinlichkeit auch in der

Grundgesamtheit vorliegen

Design

Modelierung

Count-Data

Signifikanz

- p. 4/4


Signifikanz

■ Ist (unter bestimmten Voraussetzungen) ein Anhaltspunkt

dafür, daß die in der Stichprobe gefundenen Verhältnisse

mit großer Wahrscheinlichkeit auch in der

Grundgesamtheit vorliegen

■ Bedeutung in etwa: „Die Wahrscheinlichkeit, in einer

Stichprobe einen derart hohen (oder höheren)

Koeffizienten zu sehen, wenn der entsprechende

Parameter der Grundgesamtheit tatsächlich gleich null ist,

beträgt weniger als 5/1/0,1 Prozent“

Design

Modelierung

Count-Data

Signifikanz

- p. 4/4


Signifikanz

■ Ist (unter bestimmten Voraussetzungen) ein Anhaltspunkt

dafür, daß die in der Stichprobe gefundenen Verhältnisse

mit großer Wahrscheinlichkeit auch in der

Grundgesamtheit vorliegen

■ Bedeutung in etwa: „Die Wahrscheinlichkeit, in einer

Stichprobe einen derart hohen (oder höheren)

Koeffizienten zu sehen, wenn der entsprechende

Parameter der Grundgesamtheit tatsächlich gleich null ist,

beträgt weniger als 5/1/0,1 Prozent“

■ Wahrscheinlichkeit bedeutet hier: erwartete relative

Häufigkeit, wenn die Stichprobenziehung unter identischen

Bedingungen sehr, sehr, sehr häufig wiederholt wird

Design

Modelierung

Count-Data

Signifikanz

- p. 4/4


Signifikanz

■ Statistische Signifikanz ≠ inhaltliche Bedeutsamkeit

Design

Modelierung

Count-Data

Signifikanz

- p. 4/4


Signifikanz

■ Statistische Signifikanz ≠ inhaltliche Bedeutsamkeit

■ Handelt es sich hier um eine Stichprobe

Design

Modelierung

Count-Data

Signifikanz

- p. 4/4


Signifikanz

■ Statistische Signifikanz ≠ inhaltliche Bedeutsamkeit

■ Handelt es sich hier um eine Stichprobe

■ Sinnvoller als die kaum nachvollziehbare Diskussion der

Auswirkungen der unabhängigen Variablen auf die rate

wäre es, sich für interessante Konstellation die erwarteten

Häufigkeiten von Gewaltakten beziehungsweise deren

Veränderung anzusehen

Design

Modelierung

Count-Data

Signifikanz

- p. 4/4

Weitere Magazine dieses Users
Ähnliche Magazine