Optimierte lokale Modelle in der nichtlinearen Zeitreihenanalyse
Optimierte lokale Modelle in der nichtlinearen Zeitreihenanalyse
Optimierte lokale Modelle in der nichtlinearen Zeitreihenanalyse
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Seite 28<br />
2.3. Bias, Varianz und Overfitt<strong>in</strong>g<br />
25<br />
25<br />
20<br />
d=10<br />
20<br />
d=3<br />
15<br />
15<br />
d=5<br />
10<br />
d=30<br />
10<br />
d=10<br />
d=50<br />
d=100<br />
d=200<br />
d=300<br />
5<br />
d=50<br />
5<br />
d=100<br />
0<br />
0 0.5 1 1.5 2 2.5<br />
Distanz<br />
(a) Delay-Vektoren von Lorenz-Datensatz<br />
0<br />
0 1 2 3 4 5 6 7 8<br />
Distanz<br />
(b) Gleichverteilte Punkte<br />
Abbildung 2.2: Histogramm <strong>der</strong> mittleren Distanzen <strong>der</strong> 100 nächsten Nachbarn für<br />
Lorenz-Daten (a) und gleichverteilte Datenpunkte (b) für unterschiedliche Dimensionen<br />
d.<br />
Es ist jedoch im wesentlichen die Dimension <strong>der</strong> Punktmenge, die entscheidend ist.<br />
Dies zeigt sich beispielsweise auch bei <strong>der</strong> Laufzeit effizienter Algorithmen zur Suche<br />
nach nächsten Nachbarn (siehe Abschnitt 3.10): auch diese hängen wesentlich von<br />
<strong>der</strong> Dimension <strong>der</strong> Punktmenge ab.<br />
2.3 Bias, Varianz und Overfitt<strong>in</strong>g<br />
Im Abschnitt 2.1 wurde die Betrachtung des Modellierungsproblems als Schätzung<br />
e<strong>in</strong>er Regression E [y | x] vorgestellt. In diesem Abschnitt soll dies nochmals vertieft<br />
werden, um pr<strong>in</strong>zipielle Grenzen <strong>der</strong> Modellierung aufzuzeigen, die sowohl für den<br />
parametrischen wie den nichtparametrischen Ansatz gelten.<br />
Im Folgenden wird e<strong>in</strong>e beliebige Funktion f(x) betrachtet, die die Ausgabe y für<br />
den E<strong>in</strong>gabevektor x modelliert. Der Erwartungswert des quadratischen Fehlers bei