07.01.2015 Aufrufe

Probleme mit dem linearen Regressionsmodell Eine Übersicht

Probleme mit dem linearen Regressionsmodell Eine Übersicht

Probleme mit dem linearen Regressionsmodell Eine Übersicht

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

<strong>Probleme</strong> <strong>mit</strong> <strong>dem</strong> <strong>linearen</strong> <strong>Regressionsmodell</strong><br />

<strong>Eine</strong> Übersicht<br />

Bernhard Böhm, TU-Wien


Ökonometrische <strong>Probleme</strong><br />

• Multikollinearität<br />

• Heteroskedastie<br />

• Autokorrelation (serielle Korrelation)<br />

• Verzögerte endogene Variable<br />

• Fehlspezifikation (Spezifikationsfehler)<br />

• Fehler in Variablen<br />

• Parameterkonstanz, variable Koeffizienten, und<br />

Strukturbrüche


ultikollinearität (1)<br />

• Exakte Multikollinearität: Es besteht eine<br />

lineare Abhängigkeit zwischen den<br />

erklärenden Variablen.<br />

• Verletzt A4. (X'X) ist singulär!<br />

Kleinstquadratschätzer existiert nicht!<br />

• Abhilfe: Entferne Variable, die die<br />

Abhängigkeit verursacht.


ultikollinearität (2)<br />

• In Praxis: oft "nahezu"-Multikollinearität<br />

• Überprüfung: durch Korrelationsmatrix der<br />

Regressoren<br />

• Schätzer sind unverzerrt und effizient<br />

• Aber: es ist schwierig Koeffizientenschätzer<br />

<strong>mit</strong> kleinen Standardabweichungen zu<br />

bekommen


ultikollinearität (3)<br />

Ähnlich <strong>dem</strong> Problem einer sehr kleinen<br />

Stichprobe: “micronumerosity”<br />

• insignifikante Koeffizienten,<br />

aber R² kann hoch sein<br />

• Schätzer reagieren sehr sensitiv auf kleine<br />

Änderungen in den Daten


eteroskedastie<br />

• Die Varianzen der Fehler sind nicht konstant über<br />

die Stichprobe.<br />

• Verletzt A2.<br />

• Folgen für Schätzer:<br />

1. Koeffizientenschätzer sind linear unverzerrt,<br />

aber nicht effizient.<br />

2. Geschätzte Varianzen sind verzerrt, daher sind<br />

keine korrekten Test möglich<br />

• Diagnose durch Betrachten von Streudiagrammen,<br />

oder Schätzungen auf Basis von Teilstichproben


Abhilfe für das Heteroskedastieproblem<br />

Verwende heteroskedastie-konsistente Standardfehler (HCSE)<br />

White (1980)).<br />

White-Test auf Heteroskedastie: Schätze eine Hilfsregression der<br />

uadrierten OLS Residuen auf eine Konstante, die Regressoren, ihre<br />

uadrate und Kreuzprodukte. Unter der H0 der Homoskedastie ist<br />

.R² dieser Hilfsregression asymptotisch χ²(q) verteilt, wobei q die<br />

nzahl der Variablen der Hilfsgleichung minus einer ist. Ist der<br />

ritische Wert größer als der geschätzte kann die H0 nicht verworfen<br />

erden.<br />

Weitere Möglichkeiten: Transformation oder Redefinition von<br />

Variablen kann helfen (z.B. Verhältnisse, logarithmische<br />

Transformation von Variablen), Gruppenbildung


Autokorrelation (serielle Korrelation)<br />

• Fehlerterme sind nicht voneinander unabhängig,<br />

d.h. E(u i u j ) ≠ 0 für i ≠ j, für bestimmte i,j=1,...,T<br />

•VerletztA2.<br />

• Folgen für Schätzung:<br />

• unverzerrt und konsistent, aber nicht effiziente<br />

Koeffizientenschätzer<br />

• verzerrte Varianzenschätzer


Durbin-Watson Test (DW-Test) (1)<br />

• Zur Entdeckung von Autokorrelation erster<br />

Ordnung d.h.: E(u t u t-1 ) ≠ 0.<br />

z.B. u t = ρu t-1 + ε t |ρ|


Durbin-Watson Test (DW-Test) (2)<br />

Wie verwendet man den DW-Test


Durbin-Watson Test (DW-Test) (3)<br />

• H0: ρ = 0 gegen H1: ρ ≠ 0,<br />

• DW berechnen und <strong>mit</strong> tabellierten Werten vergleichen:<br />

• Tabelle enthält d u („upper“) und d L („lower“) Schranken<br />

• H0 wird abgelehnt, wenn DW < d L ist (positive<br />

Autokorrelation) oder wenn DW > 4- d L ist (negative<br />

Autokorrelation).<br />

• Liegt d u < DW < 4- d u , kann H0 nicht abgelehnt<br />

werden.<br />

• Liegt d L < DW < d u oder 4- d u < DW < 4- d L<br />

(Unbestimmtheitsbereich), ist der Test nicht schlüssig.


Durbin-Watson test (DW-test) (4)<br />

• Test ist verzerrt wenn verzögerte endogene<br />

Variable unter den Regressoren sind.<br />

Verwende alternative Tests (h-test and M-test (Durbin<br />

1970), LM-tests (Breusch-Godfrey(1978));<br />

• für Tests auf höhere Ordnung betrachte<br />

auch die geschätzte Autokorrelationsfunktion<br />

der Residuen.


Stationäre stochastische Prozesse<br />

•Seix t eine Folge von Zufallsvariablen<br />

{x 1 ,...,x T } (d.h. ein stochastischer Prozess) <strong>mit</strong><br />

• Mittelwert: E(x t ) = µ<br />

• Varianz: var(x t ) = E(x t -µ)² = σ²<br />

• Kovarianz: γ k = E(x t -µ)(x t+k -µ)<br />

• Ist Mittel und Varianz konstant, die Kovarianz<br />

nur eine Funktion von k , dann nennt man x t<br />

einen stationären stochastischen Prozeß


Autokorrelationsfunktion (ACF) (1)<br />

• Die ACF eines stationären stochastischen<br />

Prozesses bei Verzögerung k ist definiert als<br />

ρ k = γ k /γ 0<br />

• Da eine Zeitreihe als eine Realisation eines<br />

stochastischen Prozesses interpretiert wird,<br />

wird das Korrelogramm (die Stichproben<br />

ACF) <strong>mit</strong> den Stichproben Varianzen und<br />

Kovarianzen berechnet.


Autokorrelationsfunktion (ACF) (2)<br />

m die Signifikanz eines Autokorrelationskoeffizienten ρ k zu<br />

esten:<br />

Für die Stichprobenautokorrelation eines stationären<br />

rozesses <strong>mit</strong> normalverteilten Fehlern verwende ein<br />

äherungsweises Konfidenzintervall<br />

(ρ k ± 1.96*1/√T) = 95%.<br />

um alle Koeffizienten bis zur Ordnung m zu testen,<br />

erwende entweder die Box-Pierce Q-statistic:<br />

der die Ljung-Box (LB) statistic:<br />

LB = T<br />

⎛<br />

Q<br />

=<br />

ˆ ρ<br />

T<br />

m<br />

∑<br />

2<br />

ρˆ k<br />

k=<br />

1<br />

m 2<br />

k<br />

2<br />

( T + 2) ∑<br />

⎜ ~ χ<br />

m<br />

k = 1 T k<br />

⎟<br />

−<br />

⎝<br />

⎞<br />


Verzögerte endogene Variable<br />

Hier handelt es sich um den Fall von<br />

stochastischen Regressoren<br />

verletzt A3.<br />

Folgen für die Schätzung:<br />

. Wenn u t A1 und A2 erfüllt, ist der Schätzer konsistent,<br />

asymptotisch unverzerrt und asymptotisch effizient (aber<br />

verzerrt in endlichen Stichproben).<br />

. Ist u t autokorreliert, ist der Schätzer inkonsistent!<br />

Modell muß <strong>mit</strong> anderer Methode geschätzt<br />

werden (GLS, ML,IV)


Misspezifikation (Spezifikationsfehler)<br />

Relativ zum ”wahren” Modell, das <strong>dem</strong><br />

datenerzeugenden Prozeß entspricht, kann<br />

das konkrete Modell<br />

• zu viele Parameter aufweisen (es ist<br />

allgemeiner als notwendig),<br />

• zu wenig Parameter aufweisen (ist zu<br />

restriktiv),<br />

• die falsche funktionale Form aufweisen


Wirkungen von Spezifikationsfehlern<br />

Wahres Modell<br />

y=X 1 β 1 +X 2 β 2 +u<br />

β 2 =0<br />

y=X 1 β 1 +X 2 β 2 +u<br />

β 2 ≠0<br />

Aktuelles<br />

Modell<br />

y=X 1 β 1 +X 2 β 2 +u<br />

β 2 =0<br />

y=X 1 β 1 +X 2 β 2 +u<br />

β 2 ≠0<br />

OLS von β 1 und<br />

σ² unverzerrt<br />

und effizient<br />

OLS von β 1 , β 2<br />

und σ² sind<br />

unverzerrt aber<br />

ineffizient<br />

OLS von β 1 und<br />

σ² sind verzerrt<br />

OLS von β 1 , β 2<br />

und σ² sind<br />

unverzerrt und<br />

effizient


Fehler in Variablen<br />

Werden Variable fehlerhaft gemessen, so führt dies<br />

zu inkonsistenten KQ Schätzern:<br />

z.B. theoretische Beziehung y t =bx t , beobachtete<br />

Variable werden <strong>mit</strong> Fehlern ξ und η gemessen:<br />

y t* = y t + ξ t und x t* = x t + η t<br />

Es folgt, dass die Beziehung zwischen den<br />

beobachteten Variablen<br />

y t* =bx t* + (ξ t -bη t ) stochastisch ist, und Annahme<br />

A3 verletzt.<br />

Falls σ 2 η≠0, ist der KQ Schätzer von b inkonsistent


Parameterkonstanz, variable Koeffizienten, und<br />

Strukturbrüche<br />

• Ziel einer guten Modellspezifikation ist es,<br />

ein Modell <strong>mit</strong> invarianten (konstanten)<br />

Parametern zu finden.<br />

• Tests auf Strukturbrüche, d.h. auf<br />

signifikante Änderungen in den Parameter<br />

Werten, stützen sich entweder auf die<br />

Verwendung von Teilstichproben, oder<br />

verwenden die Beobachtungen rekursiv.


Tests auf Parameterkonstanz<br />

Chow-Test auf Strukturbruch:<br />

(Chow G.C., Tests of Equality between Sets of Coefficients in Two Linear<br />

Regressions, Econmetrica, 52, 1960, 211-22)<br />

• um herauszufinden ob ein Strukturbruch zu<br />

einem bestimmten Zeitpunkt t * stattgefunden hat<br />

• Bilde zwei Regressionsgleichungen<br />

y t = x t b (1) + u<br />

(1)<br />

t für t=1,..., t *<br />

y t = x t b (2) + u<br />

(2)<br />

t für t=t * +1, t * +2, ...,T<br />

<strong>mit</strong> den Dimensionen: y t : (1x1), b (i) : (kx1) x t = (x t1 ,x t2 ,...x tk ): (1xk)<br />

beide Fehlerterme seien unabhängig normalverteilt <strong>mit</strong> Mittel<br />

Null und gleicher konstanter Varianz σ².


Chow - Strukturbruchtest<br />

Unter H 0 : b (1) = b (2) (konstante Struktur) ist die<br />

Teststatistik<br />

Chow =<br />

[ ]<br />

(1) (1) (2) (2)<br />

e'e − (e 'e + e 'e ) / k<br />

[(e<br />

'e e 'e )] (1) (1) (2) (2)<br />

+ /( T − 2k)<br />

~ F (k,T-2k)<br />

e sind die OLS-Residuen im gemeinsamen Modell b (1) = b (2) ,<br />

e (i) sind die OLS-Residuen der getrennten Modelle,<br />

k ist die Anzahl der erklärenden Variablen in Matrix X


Andere Strukturbruchtests<br />

• Prognosetests: Fehlprognosen weisen auf<br />

Strukturveränderungen hin<br />

• Verwende rekursive Residuen (wiederholte<br />

Anwendung der KQ Methode <strong>mit</strong> jeweils<br />

einer Beobachtung mehr)<br />

• CUSUM, CUSUMSQ: kumulierte<br />

Residuen- (quadrat)summen

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!