20.01.2015 Aufrufe

Optimierte lokale Modelle in der nichtlinearen Zeitreihenanalyse

Optimierte lokale Modelle in der nichtlinearen Zeitreihenanalyse

Optimierte lokale Modelle in der nichtlinearen Zeitreihenanalyse

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Seite 48<br />

3.4. Regularisierung polynomialer <strong>Modelle</strong><br />

<strong>der</strong> zweiten Momente des Anfragepunktes q und se<strong>in</strong>er nächsten Nachbarn maximieren,<br />

q T X T Xq =<br />

≈<br />

n∑ k∑<br />

(q i · x j,i ) 2 + 1<br />

i=1<br />

j=1<br />

n∑<br />

k · E [ (q i · x·,i ) 2] + k , (3.24)<br />

i=1<br />

wobei E[·] den Erwartungswert beschreibt und x·,i e<strong>in</strong>e Zufallsvariable ist, die den<br />

i-ten E<strong>in</strong>gabewert des Modells darstellt. Falls diese Zufallsvariable e<strong>in</strong>en Mittelwert<br />

von Null hat, so ist dies identisch mit <strong>der</strong> Maximierung <strong>der</strong> Varianz <strong>der</strong> Datenpunkte,<br />

d.h. <strong>der</strong> Vektor v 1 ist <strong>der</strong> Vektor, <strong>in</strong> dessen Richtung die Punkte maximale Varianz<br />

besitzen.<br />

Das Pr<strong>in</strong>zip <strong>der</strong> Pr<strong>in</strong>cipal Component Regression besteht nun dar<strong>in</strong>, gerade die<br />

Komponenten wegzulassen, <strong>in</strong> <strong>der</strong>en Richtung die Punkte kaum Ausdehnung im<br />

Phasenraum besitzen, d.h. die Komponenten mit m<strong>in</strong>imaler Varianz. Praktisch erfolgt<br />

dies dadurch, die Summe <strong>in</strong> (3.16) nur bis zu e<strong>in</strong>em Index n σ < r laufen zu<br />

lassen. Im gewichteten Fall ergibt sich dann (vgl. [22])<br />

ν = (X W ) † y W =<br />

∑n σ<br />

i=1<br />

1<br />

σ i<br />

〈u T i , y W 〉v i . (3.25)<br />

Dies leuchtet auch ohne Betrachtung <strong>der</strong> statistischen Interpretation sofort e<strong>in</strong>: Ist<br />

die Matrix X schlecht konditioniert, so liegen e<strong>in</strong> o<strong>der</strong> mehrere S<strong>in</strong>gulärwerte dicht<br />

bei Null und die Ausgabe des Modells wird durch die Multiplikation mit 1/σ i beson<strong>der</strong>s<br />

groß. Da die S<strong>in</strong>gulärwerte <strong>der</strong> Größe nach sortiert s<strong>in</strong>d liegt es nah, die Summe<br />

früher abzubrechen. Dies wird auch als Truncated Pr<strong>in</strong>cipal Component Regression<br />

(TPCR) bezeichnet.<br />

Bei <strong>der</strong> bisherigen Betrachtung wurde allerd<strong>in</strong>gs nicht beachtet, dass die Datenpunkte<br />

bei <strong>der</strong> <strong>lokale</strong>n Modellbildung i.A. ke<strong>in</strong>en Mittelwert Null besitzen. Daher zeigt<br />

gerade die erste Hauptachse v 1 meist nicht <strong>in</strong> die Richtung maximaler Varianz, son<strong>der</strong>n<br />

e<strong>in</strong>fach vom Ursprung aus <strong>in</strong> Richtung des Mittelwerts <strong>der</strong> Datenpunkte (siehe<br />

Abbildung 3.4(a)). Es ist daher s<strong>in</strong>nvoll, von den Datenpunkten den Mittelwert<br />

¯x abzuziehen; dies wird als Center<strong>in</strong>g bezeichnet. Das Ergebnis ist <strong>in</strong> Abbildung<br />

3.4(b) zu sehen: die erste Hauptachse zeigt nun <strong>in</strong> Richtung <strong>der</strong> größten Varianz <strong>der</strong><br />

Punktwolke. Die Modellausgabe ist nun gegeben durch<br />

∑n σ<br />

( ) 1<br />

ŷ = ȳ + 〈(q − ¯x) T , v i 〉 〈u T i , y〉 . (3.26)<br />

σ i<br />

i=1

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!