Optimierte lokale Modelle in der nichtlinearen Zeitreihenanalyse
Optimierte lokale Modelle in der nichtlinearen Zeitreihenanalyse
Optimierte lokale Modelle in der nichtlinearen Zeitreihenanalyse
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Seite 78<br />
4.1. L<strong>in</strong>eare Support-Vektor-Regression<br />
Um den Support-Vektor-Ansatz vom Problem <strong>der</strong> Klassifikation auf das Problem <strong>der</strong><br />
Regression zu übetragen, verwendet Vapnik <strong>in</strong> [41] die ε-<strong>in</strong>sensitive Kostenfunktion,<br />
{ 0 falls |η| ≤ ε<br />
|η| ε ≡<br />
|η| − ε sonst.<br />
(4.5)<br />
Ihre Wirkung ist, dass nur die Punkte, die e<strong>in</strong>en Abstand größer als ε von <strong>der</strong> Regressionsfunktion<br />
haben, <strong>in</strong> die Kosten e<strong>in</strong>fließen (siehe Abbildung 4.1). Alle an<strong>der</strong>en<br />
Punkte <strong>in</strong> diesem “ε-Schlauch” s<strong>in</strong>d für die Bildung des Modells praktisch ohne<br />
Bedeutung. Das Modell wird dadurch robuster gegenüber dem E<strong>in</strong>fluss von Rauschen<br />
und das Risiko des Overfitt<strong>in</strong>g ist verr<strong>in</strong>gert. Die Punkte, die außerhalb <strong>der</strong><br />
ε-Schranke liegen, s<strong>in</strong>d die Support-Vektoren. Neben (4.5) gibt es an<strong>der</strong>e mögliche<br />
Kostenfunktionen. Dies s<strong>in</strong>d e<strong>in</strong>erseits Variationen <strong>der</strong> ε-<strong>in</strong>sensitiven Funktion, aber<br />
auch stetig differenzierbare Funktionen, die zu herkömmlichen Regressionsverfahren<br />
ohne Support-Vektoren führen (z.B. entspricht L(η) = η 2 dem mittleren quadratischen<br />
Fehler, <strong>der</strong> bislang als Fehlergröße verwendet wurde). Beispiele f<strong>in</strong>den sich<br />
z.B. <strong>in</strong> [35].<br />
y<br />
ξ<br />
ε<br />
ξ∗<br />
|η| ε<br />
ξ ∗<br />
x<br />
ε<br />
ε<br />
η<br />
Abbildung 4.1: Wirkung <strong>der</strong> ε-<strong>in</strong>sensitiven Kostenfunktion<br />
Die Schwierigkeit liegt <strong>in</strong> <strong>der</strong> richtigen Wahl des Parameters ε. Er sollte am Signal-<br />
Rausch-Verhältnis ausgerichtet werden, was aber <strong>in</strong> <strong>der</strong> Praxis meist nicht bekannt<br />
ist. Somit ist e<strong>in</strong>e Optimierung des Parameters nötig, wobei sich bei <strong>lokale</strong>n <strong>Modelle</strong>n<br />
wie<strong>der</strong> die Leave-one-out Cross-Validation als Fehlergröße anbietet.<br />
Die ε-<strong>in</strong>sensitive Kostenfunktion ersetzt allerd<strong>in</strong>gs nicht die Regularisierung des Modells.<br />
Der E<strong>in</strong>fachheit halber soll zunächst von e<strong>in</strong>em l<strong>in</strong>earen Modell<br />
f(x) = 〈w, x〉 + b , x, w ∈ R d , b ∈ R (4.6)