20.01.2015 Aufrufe

Optimierte lokale Modelle in der nichtlinearen Zeitreihenanalyse

Optimierte lokale Modelle in der nichtlinearen Zeitreihenanalyse

Optimierte lokale Modelle in der nichtlinearen Zeitreihenanalyse

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Seite 78<br />

4.1. L<strong>in</strong>eare Support-Vektor-Regression<br />

Um den Support-Vektor-Ansatz vom Problem <strong>der</strong> Klassifikation auf das Problem <strong>der</strong><br />

Regression zu übetragen, verwendet Vapnik <strong>in</strong> [41] die ε-<strong>in</strong>sensitive Kostenfunktion,<br />

{ 0 falls |η| ≤ ε<br />

|η| ε ≡<br />

|η| − ε sonst.<br />

(4.5)<br />

Ihre Wirkung ist, dass nur die Punkte, die e<strong>in</strong>en Abstand größer als ε von <strong>der</strong> Regressionsfunktion<br />

haben, <strong>in</strong> die Kosten e<strong>in</strong>fließen (siehe Abbildung 4.1). Alle an<strong>der</strong>en<br />

Punkte <strong>in</strong> diesem “ε-Schlauch” s<strong>in</strong>d für die Bildung des Modells praktisch ohne<br />

Bedeutung. Das Modell wird dadurch robuster gegenüber dem E<strong>in</strong>fluss von Rauschen<br />

und das Risiko des Overfitt<strong>in</strong>g ist verr<strong>in</strong>gert. Die Punkte, die außerhalb <strong>der</strong><br />

ε-Schranke liegen, s<strong>in</strong>d die Support-Vektoren. Neben (4.5) gibt es an<strong>der</strong>e mögliche<br />

Kostenfunktionen. Dies s<strong>in</strong>d e<strong>in</strong>erseits Variationen <strong>der</strong> ε-<strong>in</strong>sensitiven Funktion, aber<br />

auch stetig differenzierbare Funktionen, die zu herkömmlichen Regressionsverfahren<br />

ohne Support-Vektoren führen (z.B. entspricht L(η) = η 2 dem mittleren quadratischen<br />

Fehler, <strong>der</strong> bislang als Fehlergröße verwendet wurde). Beispiele f<strong>in</strong>den sich<br />

z.B. <strong>in</strong> [35].<br />

y<br />

ξ<br />

ε<br />

ξ∗<br />

|η| ε<br />

ξ ∗<br />

x<br />

ε<br />

ε<br />

η<br />

Abbildung 4.1: Wirkung <strong>der</strong> ε-<strong>in</strong>sensitiven Kostenfunktion<br />

Die Schwierigkeit liegt <strong>in</strong> <strong>der</strong> richtigen Wahl des Parameters ε. Er sollte am Signal-<br />

Rausch-Verhältnis ausgerichtet werden, was aber <strong>in</strong> <strong>der</strong> Praxis meist nicht bekannt<br />

ist. Somit ist e<strong>in</strong>e Optimierung des Parameters nötig, wobei sich bei <strong>lokale</strong>n <strong>Modelle</strong>n<br />

wie<strong>der</strong> die Leave-one-out Cross-Validation als Fehlergröße anbietet.<br />

Die ε-<strong>in</strong>sensitive Kostenfunktion ersetzt allerd<strong>in</strong>gs nicht die Regularisierung des Modells.<br />

Der E<strong>in</strong>fachheit halber soll zunächst von e<strong>in</strong>em l<strong>in</strong>earen Modell<br />

f(x) = 〈w, x〉 + b , x, w ∈ R d , b ∈ R (4.6)

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!