Optimierte lokale Modelle in der nichtlinearen Zeitreihenanalyse

Weitere Magazine

Empfehlungen

Info

Seite 28 2.3. Bias, Varianz und Overfitting 25 25 20 d=10 20 d=3 15 15 d=5 10 d=30 10 d=10 d=50 d=100 d=200 d=300 5 d=50 5 d=100 0 0 0.5 1 1.5 2 2.5 Distanz (a) Delay-Vektoren von Lorenz-Datensatz 0 0 1 2 3 4 5 6 7 8 Distanz (b) Gleichverteilte Punkte Abbildung 2.2: Histogramm der mittleren Distanzen der 100 nächsten Nachbarn für Lorenz-Daten (a) und gleichverteilte Datenpunkte (b) für unterschiedliche Dimensionen d. Es ist jedoch im wesentlichen die Dimension der Punktmenge, die entscheidend ist. Dies zeigt sich beispielsweise auch bei der Laufzeit effizienter Algorithmen zur Suche nach nächsten Nachbarn (siehe Abschnitt 3.10): auch diese hängen wesentlich von der Dimension der Punktmenge ab. 2.3 Bias, Varianz und Overfitting Im Abschnitt 2.1 wurde die Betrachtung des Modellierungsproblems als Schätzung einer Regression E [y | x] vorgestellt. In diesem Abschnitt soll dies nochmals vertieft werden, um prinzipielle Grenzen der Modellierung aufzuzeigen, die sowohl für den parametrischen wie den nichtparametrischen Ansatz gelten. Im Folgenden wird eine beliebige Funktion f(x) betrachtet, die die Ausgabe y für den Eingabevektor x modelliert. Der Erwartungswert des quadratischen Fehlers bei
Kapitel 2. Lokale Modelle Seite 29 gegebenem x lässt sich dann schreiben als E [ (y − f(x)) 2 | x ] = E [ ((y − E [y | x]) + (E [y | x] − f(x))) 2 |x ] = E [ (y − E[y | x]) 2] + (E [y | x] − f(x)) 2 + 2E [(y − E [y | x])| x] · (E [y | x] − f(x)) 2 = E [ (y − E[y | x]) 2] + (E [y | x] − f(x)) 2 + 2 (E [y | x] − E [y | x]) · (E [y | x] − f(x)) 2 = E [ (y − E [y | x]) 2 | x ] + (E [y | x] − f(x)) 2 ≥ E [ (y − E[y | x]) 2 | x ] , (2.7) d.h. die Regression E [y | x] ist die beste Schätzung des Ausgabewertes y bei gegebenem x in dem Sinne, dass sie den mittleren quadratischen Fehler minimiert. Ziel der Modellierung muss es also sein, dass die Funktion f(x) möglichst gut die Regression approximiert. Doch selbst wenn man erreicht, dass f(x) = E [y | x] ist, heißt das nicht, dass jeder Datensatz des Systems perfekt beschrieben werden kann, da evtl. stochastische Einflüsse vorliegen, die aufgrund ihrer Unkorelliertheit nicht modelliert werden können. Um dies zu verdeutlichen, betrachtet man zunächst die Funktion f(x) zur Schätzung der Regression an einer konkreten Realisierung Ω = {(x 1 , y 1 ), . . . , (x n , y n )} des Systems; dies soll im Folgenden durch die Notation f(x; Ω) dargestellt werden. Es wird nun der Erwartungswert des quadratischen Fehlers für diese Realisierung Ω betrachtet. Dieser lässt sich wie bei (2.7) in zwei Terme aufspalten: E [(y − f(x; Ω)) 2 | x, Ω] = E [(y − E [y | x]) 2 | x, Ω] + (f(x; Ω) − E [y | x]) 2 } {{ } } {{ } Varianz y Modellierungsfehler . (2.8) Der Term E [(y − E [y | x]) 2 | x, Ω] ist die Varianz von y bei gegebenem x und ist unabhängig von der Realisierung Ω und ebenso von der Funktion f(x). Als Beispiel denke man sich eine Zeitreihe, die jedoch durch um Null verteiltes weißes Rauschen mit Varianz σ 2 gestört wird: ˜s t = s t + ε t , ε ∼ WN(0, σ 2 ) . (2.9) Die Varianz in (2.8) entspricht hierbei genau der Varianz des weißen Rauschens. Sie stellt somit eine untere Schranke für den Erwartungswert des quadratischen Fehlers dar, auch wenn es natürlich trotzdem möglich ist, bei einem konkreten Datensatz
Seite 1 und 2: Optimierte lokale Modelle in der ni
Seite 3 und 4: Inhaltsverzeichnis Seite 3 3 Lokal
Seite 5 und 6: Einleitung In der Physik hat man me
Seite 7 und 8: Inhaltsverzeichnis Seite 7 worfen.
Seite 9 und 10: Kapitel 1. Grundlagen Seite 9 1.1 D
Seite 11 und 12: Kapitel 1. Grundlagen Seite 11 Das
Seite 13 und 14: Kapitel 1. Grundlagen Seite 13 k Ly
Seite 15 und 16: Kapitel 1. Grundlagen Seite 15 Im F
Seite 17 und 18: Kapitel 1. Grundlagen Seite 17 mit
Seite 19 und 20: Kapitel 1. Grundlagen Seite 19 werd
Seite 21 und 22: Kapitel 2 Lokale Modelle 2.1 Das Mo
Seite 23 und 24: Kapitel 2. Lokale Modelle Seite 23
Seite 27: Kapitel 2. Lokale Modelle Seite 27
Seite 37 und 38: Kapitel 3. Lokal polynomiale Modell
Seite 69 und 70: £¢ £ ¢
Seite 77 und 78: Kapitel 4. Support-Vektor-Regressio
Seite 79 und 80:
Kapitel 4. Support-Vektor-Regressio
Seite 81 und 82:
Seite 83 und 84:
Seite 85 und 86:
Seite 87 und 88:
Kapitel 5 Anwendungen der Modelle I
Seite 89 und 90:
Kapitel 5. Anwendungen der Modelle
Seite 91 und 92:
Seite 93 und 94:
Seite 95 und 96:
Seite 97 und 98:
Seite 99 und 100:
Kapitel 6 Zusammenfassung und Ausbl
Seite 101 und 102:
Anhang A Berechnung der Modellkoeff
Seite 103 und 104:
Anhang B Nichtlineare Optimierung F
Seite 105 und 106:
Anhang B. Nichtlineare Optimierung
Seite 107 und 108:
Literaturverzeichnis [1] J. Argyris
Seite 109 und 110:
Literaturverzeichnis Seite 109 [27]
Alle anzeigen

Optimierte lokale Modelle in der nichtlinearen Zeitreihenanalyse

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?