20.01.2015 Aufrufe

Optimierte lokale Modelle in der nichtlinearen Zeitreihenanalyse

Optimierte lokale Modelle in der nichtlinearen Zeitreihenanalyse

Optimierte lokale Modelle in der nichtlinearen Zeitreihenanalyse

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Seite 28<br />

2.3. Bias, Varianz und Overfitt<strong>in</strong>g<br />

25<br />

25<br />

20<br />

d=10<br />

20<br />

d=3<br />

15<br />

15<br />

d=5<br />

10<br />

d=30<br />

10<br />

d=10<br />

d=50<br />

d=100<br />

d=200<br />

d=300<br />

5<br />

d=50<br />

5<br />

d=100<br />

0<br />

0 0.5 1 1.5 2 2.5<br />

Distanz<br />

(a) Delay-Vektoren von Lorenz-Datensatz<br />

0<br />

0 1 2 3 4 5 6 7 8<br />

Distanz<br />

(b) Gleichverteilte Punkte<br />

Abbildung 2.2: Histogramm <strong>der</strong> mittleren Distanzen <strong>der</strong> 100 nächsten Nachbarn für<br />

Lorenz-Daten (a) und gleichverteilte Datenpunkte (b) für unterschiedliche Dimensionen<br />

d.<br />

Es ist jedoch im wesentlichen die Dimension <strong>der</strong> Punktmenge, die entscheidend ist.<br />

Dies zeigt sich beispielsweise auch bei <strong>der</strong> Laufzeit effizienter Algorithmen zur Suche<br />

nach nächsten Nachbarn (siehe Abschnitt 3.10): auch diese hängen wesentlich von<br />

<strong>der</strong> Dimension <strong>der</strong> Punktmenge ab.<br />

2.3 Bias, Varianz und Overfitt<strong>in</strong>g<br />

Im Abschnitt 2.1 wurde die Betrachtung des Modellierungsproblems als Schätzung<br />

e<strong>in</strong>er Regression E [y | x] vorgestellt. In diesem Abschnitt soll dies nochmals vertieft<br />

werden, um pr<strong>in</strong>zipielle Grenzen <strong>der</strong> Modellierung aufzuzeigen, die sowohl für den<br />

parametrischen wie den nichtparametrischen Ansatz gelten.<br />

Im Folgenden wird e<strong>in</strong>e beliebige Funktion f(x) betrachtet, die die Ausgabe y für<br />

den E<strong>in</strong>gabevektor x modelliert. Der Erwartungswert des quadratischen Fehlers bei

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!