20.01.2015 Aufrufe

Optimierte lokale Modelle in der nichtlinearen Zeitreihenanalyse

Optimierte lokale Modelle in der nichtlinearen Zeitreihenanalyse

Optimierte lokale Modelle in der nichtlinearen Zeitreihenanalyse

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Kapitel 2. Lokale <strong>Modelle</strong> Seite 29<br />

gegebenem x lässt sich dann schreiben als<br />

E [ (y − f(x)) 2 | x ] = E [ ((y − E [y | x]) + (E [y | x] − f(x))) 2 |x ]<br />

= E [ (y − E[y | x]) 2] + (E [y | x] − f(x)) 2<br />

+ 2E [(y − E [y | x])| x] · (E [y | x] − f(x)) 2<br />

= E [ (y − E[y | x]) 2] + (E [y | x] − f(x)) 2<br />

+ 2 (E [y | x] − E [y | x]) · (E [y | x] − f(x)) 2<br />

= E [ (y − E [y | x]) 2 | x ] + (E [y | x] − f(x)) 2<br />

≥ E [ (y − E[y | x]) 2 | x ] ,<br />

(2.7)<br />

d.h. die Regression E [y | x] ist die beste Schätzung des Ausgabewertes y bei gegebenem<br />

x <strong>in</strong> dem S<strong>in</strong>ne, dass sie den mittleren quadratischen Fehler m<strong>in</strong>imiert.<br />

Ziel <strong>der</strong> Modellierung muss es also se<strong>in</strong>, dass die Funktion f(x) möglichst gut die<br />

Regression approximiert. Doch selbst wenn man erreicht, dass f(x) = E [y | x] ist,<br />

heißt das nicht, dass je<strong>der</strong> Datensatz des Systems perfekt beschrieben werden kann,<br />

da evtl. stochastische E<strong>in</strong>flüsse vorliegen, die aufgrund ihrer Unkorelliertheit nicht<br />

modelliert werden können.<br />

Um dies zu verdeutlichen, betrachtet man zunächst die Funktion f(x) zur Schätzung<br />

<strong>der</strong> Regression an e<strong>in</strong>er konkreten Realisierung Ω = {(x 1 , y 1 ), . . . , (x n , y n )} des Systems;<br />

dies soll im Folgenden durch die Notation f(x; Ω) dargestellt werden. Es wird<br />

nun <strong>der</strong> Erwartungswert des quadratischen Fehlers für diese Realisierung Ω betrachtet.<br />

Dieser lässt sich wie bei (2.7) <strong>in</strong> zwei Terme aufspalten:<br />

E [(y − f(x; Ω)) 2 | x, Ω] = E [(y − E [y | x]) 2 | x, Ω] + (f(x; Ω) − E [y | x]) 2<br />

} {{ } } {{ }<br />

Varianz y Modellierungsfehler<br />

. (2.8)<br />

Der Term E [(y − E [y | x]) 2 | x, Ω] ist die Varianz von y bei gegebenem x und ist<br />

unabhängig von <strong>der</strong> Realisierung Ω und ebenso von <strong>der</strong> Funktion f(x). Als Beispiel<br />

denke man sich e<strong>in</strong>e Zeitreihe, die jedoch durch um Null verteiltes weißes Rauschen<br />

mit Varianz σ 2 gestört wird:<br />

˜s t = s t + ε t , ε ∼ WN(0, σ 2 ) . (2.9)<br />

Die Varianz <strong>in</strong> (2.8) entspricht hierbei genau <strong>der</strong> Varianz des weißen Rauschens. Sie<br />

stellt somit e<strong>in</strong>e untere Schranke für den Erwartungswert des quadratischen Fehlers<br />

dar, auch wenn es natürlich trotzdem möglich ist, bei e<strong>in</strong>em konkreten Datensatz

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!