20.01.2015 Aufrufe

Optimierte lokale Modelle in der nichtlinearen Zeitreihenanalyse

Optimierte lokale Modelle in der nichtlinearen Zeitreihenanalyse

Optimierte lokale Modelle in der nichtlinearen Zeitreihenanalyse

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Kapitel 3. Lokal polynomiale Modellierung Seite 47<br />

ersten Blick verblüffen mag, da dies nichts an<strong>der</strong>es bedeutet, als dass die nächsten<br />

Nachbarn nur auf Basis <strong>der</strong> ersten Komponente gewählt werden.<br />

Setzt man die zweite Gleichung <strong>der</strong> Hénon-Abbildung <strong>in</strong> die erste e<strong>in</strong>, so erhält man<br />

x n+1 = bx n−1 −ax 2 n +1. In den Wert x n+1 fließt somit x n quadratisch und x n−1 l<strong>in</strong>ear<br />

e<strong>in</strong>. Da e<strong>in</strong> l<strong>in</strong>eares Modell verwendet wird, kann <strong>der</strong> l<strong>in</strong>eare Anteil ohneh<strong>in</strong> perfekt<br />

modelliert werden; somit ist <strong>der</strong> quadratische Anteil <strong>der</strong> für die Modellierung wesentliche.<br />

Dementsprechend werden die nächsten Nachbarn nur anhand dieser Komponente<br />

ausgewählt. Für an<strong>der</strong>e Modelltypen wie z.B. e<strong>in</strong> lokal konstantes Modell<br />

ist diese Metrik völlig ungeeignet; die optimale Metrik hängt somit wesentlich von<br />

dem verwendeten Modell ab. Auch unter E<strong>in</strong>fluss von Rauschen ist λ = 0 beim lokal<br />

l<strong>in</strong>earen Modell nicht mehr die optimale Wahl (siehe auch Abschnitt 5.1.1).<br />

3.4 Regularisierung polynomialer <strong>Modelle</strong><br />

Zwar hat man mit (3.11) e<strong>in</strong> mathematisch exaktes Ergebnis für den Koeffizientenvektor<br />

ν gefunden, jedoch stellt sich bei <strong>der</strong> praktischen Berechnung das Problem,<br />

dass die Matrix X häufig schlecht konditioniert ist, d.h. sie ist nahezu s<strong>in</strong>gulär.<br />

Dieses Problem tritt <strong>in</strong>sb. dann auf, wenn nur wenige Punkte zur Berechnung herangezogen<br />

werden und wenn viele dieser Punkte kol<strong>in</strong>ear s<strong>in</strong>d. Dies ist gerade bei<br />

<strong>lokale</strong>n <strong>Modelle</strong>n häufig <strong>der</strong> Fall, wo wenige nächste Nachbarn zur Berechnung des<br />

Modells verwendet werden.<br />

Um auch <strong>in</strong> diesen Fällen vernünftige Werte für den Koeffizientenvektor ν zu erhalten,<br />

ist e<strong>in</strong>e Regularisierung <strong>der</strong> Matrix X notwendig. Hierfür gibt es vor allem<br />

zwei populäre Methoden: die Ridge Regression (RR) und die Pr<strong>in</strong>cipal Component<br />

Regression (PCR).<br />

3.4.1 Pr<strong>in</strong>cipal Component Regression<br />

Der E<strong>in</strong>fachheit halber soll zunächst auf die Wichtung verzichtet werden. Der Koeffizientenvektor<br />

ist somit gegeben durch<br />

ν = X † y = (X T X) −1 X T y = (VS 2 V T ) −1 X T y , (3.23)<br />

wobei hier die S<strong>in</strong>gulärwertzerlegung X = USV T verwendet wurde (siehe Anhang<br />

A). Das Matrixprodukt X T X ist reell und symmetrisch, daher ist VS 2 V T e<strong>in</strong>e Diagonalisierung<br />

des Matrixproduktes mit den quadrierten reellen, positiven Eigenwerten<br />

σ i auf <strong>der</strong> Diagonalen von S 2 . Sortiert man diese <strong>der</strong> Größe nach, so s<strong>in</strong>d die dazugehörigen<br />

Eigenvektoren v i die Hauptachsen (Pr<strong>in</strong>cipal Components) <strong>der</strong> Matrix<br />

XX T . Statistisch können diese als die Vektoren verstanden werden, die die Summe

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!