Optimierte lokale Modelle in der nichtlinearen Zeitreihenanalyse

Weitere Magazine

Empfehlungen

Info

Seite 32 2.4. Validierung lokaler Modelle 2.4 Validierung lokaler Modelle Wie im vorigen Abschnitt erläutert ist es nicht ratsam, ein Modell ausschließlich auf Basis des mittleren quadratischen Fehlers des gegebenen Datensatzes zu optimieren, da es hierbei zu einem Overfitting kommen kann. Eine Möglichkeit ist natürlich, von dem zu untersuchenden System neue Datensätze zu erstellen und das Modell mit diesen neuen Daten zu validieren. Allerdings ist dies häufig nicht möglich und zudem könnten diese Daten ebensogut in den bestehenden Datensatz integriert werden, um so die Genauigkeit des Modells weiter zu verbessern (gerade bei lokalen Modellen ist die Genauigkeit eng mit der Zahl der zur Verfügung stehenden Daten verknüpft). Eine naheliegende Alternative ist, Training und Validierung an Teilmengen des bestehenden Datensatzes vorzunehmen. Diese Strategie wird als Cross-Validation bezeichnet. 2.4.1 Cross-Validation Bei der Cross-Validation (CV) wird der Datensatz in zwei Mengen aufgeteilt: eine • Trainingsmenge, anhand derer das Modell berechnet wird und eine • Testmenge, die zur Validierung des Modells herangezogen wird. Wesentlich für die Cross-Validation ist, dass keinerlei Daten der Testmenge in die Bildung des Modells einfließen. Im Falle lokaler Modelle bedeutet dies, dass bei einem Anfragepunkt aus der Testmenge nur nächste Nachbarn in der Trainingsmenge gesucht werden dürfen. Ein typischer Verlauf einer solchen Cross-Validation ist, dass zunächst der Fehler sowohl auf dem Trainings- wie dem Testdatensatz kleiner wird, der Testfehler jedoch ansteigt, sobald ein Overfitting des Modells auftritt. Das Minimum des Testfehlers entspricht somit dem optimalen Satz der Modellparameter. Nachteil der Cross-Validation ist, dass weniger Punkte für das Training des Modells zur Verfügung stehen. Es bleibt daher immer die Frage offen, ob ein Training auf dem kompletten Datensatz ohne Cross-Validation nicht vielleicht ein besseres Modell liefern würde. Die Cross-Validation führt somit letztlich zu einer Erhöhung des Bias des Modells, was bei komplexen Daten zu einer schlechteren Modellierung führen kann. Es trifft im übrigen auf praktisch alle Verfahren zur Vermeidung von Overfitting zu, dass diese zu einer Erhöhung des Bias führen (für eine ausführliche Diskussion dieses Themas siehe [33]). Man kann diesen Effekt bei der Cross-Validation aber dadurch minimieren, indem man die Testmenge möglichst klein macht. Natürlich verliert dadurch die Validierung des Modells an Aussagekraft, jedoch kann dieser Vorgang für mehrere Realisierungen von Testmengen durchgeführt werden. Dieses Prinzip soll nun näher erläutert werden.
Kapitel 2. Lokale Modelle Seite 33 2.4.2 Leave-one-out Cross-Validation Bei der Leave-one-out Cross-Validation (LOO-CV) wird das Prinzip der Cross- Validation gewissermaßen auf die Spitze getrieben: es wird genau ein Punkt als Testmenge verwendet und die N − 1 restlichen Punkte dienen als Trainingsmenge. Natürlich hat eine Testmenge bestehend aus einem Punkt keine wirkliche Aussagekraft über die Verallgemeinerungsfähigkeit des Modells, daher wird dieser Vorgang für viele verschiedene (am besten alle) Punkte des Datensatzes wiederholt und die Fehler der Vorhersage gemittelt. Die LOO-CV ist ein mächtiges Werkzeug zur Validierung, da das Modell mit Ausnahme eines Punktes auf der gesamten Trainingsmenge gebildet wird und somit der Bias nahezu konstant bleibt. Sie ist überhaupt nur deshalb möglich, weil das konkrete Modell erst bei Kenntnis eines Anfragepunktes berechnet wird; sie ist somit nur mit den sog. Lazy Learnern wie lokalen Modellen möglich. Hier zahlt sich die Flexibilität dieses Ansatzes aus. Bei globalen Modellen muss das Modell bei jeder neuen Teilung des Datensatzes in Test- und Trainingsmenge komplett neu berechnet werden, weshalb hier die LOO-CV in der Praxis kaum durchführbar ist. Bei lokalen Modellen regelt sich dieses Problem praktisch von selbst, indem man einfach nur ausschließen muss, dass bei der Suche nächster Nachbarn der Testpunkt selbst gefunden wird. Bei eng abgetasteten kontinuierlichen Systemen ist zusätzlich sinnvoll, das gesamte Trajektoriensegment des Anfragepunktes aus der Trainingsmenge zu entfernen (siehe den folgenden Abschnitt). Bei der Validierung der Mehrschritt-Vorhersage eines Punktes einer Zeitreihe ist dies in jedem Fall nötig. 2.4.3 Fehlermaße bei Leave-one-out Cross-Validation In dieser Arbeit wird als Fehlermaß ausschließlich der mittlere quadratische Fehler verwendet, der in der einfachsten Form gegeben ist durch MSE 1 = 1 |T ref | ∑ t∈T ref ( yt − f t (x t ) ) 2 , (2.11) wobei über eine genügend große Zahl an Referenzpunkten T ref gemittelt werden muss und f t (x) das Modell bezeichnet, welches unter Auslassen des Punktes x t gebildet wurde. Bei der Vorhersage von Zeitreihen stellt sich allerdings die Frage, welche Schrittweite verwendet werden soll. Mit x t = (s t , s t−1 , . . . s t−(d−1) ) ist die einfachste Wahl durch y t = s t+1 gegeben, also die Vorhersage eines Schrittes in die Zukunft 2 . Gerade bei eng abgetasteten Zeitreihen hat dieser Einschritt-Vorhersagefehler aber wenig 2 Der Einfachheit halber wird hier von einem Delay von Eins ausgegangen.
Seite 1 und 2: Optimierte lokale Modelle in der ni
Seite 3 und 4: Inhaltsverzeichnis Seite 3 3 Lokal
Seite 5 und 6: Einleitung In der Physik hat man me
Seite 7 und 8: Inhaltsverzeichnis Seite 7 worfen.
Seite 9 und 10: Kapitel 1. Grundlagen Seite 9 1.1 D
Seite 11 und 12: Kapitel 1. Grundlagen Seite 11 Das
Seite 13 und 14: Kapitel 1. Grundlagen Seite 13 k Ly
Seite 15 und 16: Kapitel 1. Grundlagen Seite 15 Im F
Seite 17 und 18: Kapitel 1. Grundlagen Seite 17 mit
Seite 19 und 20: Kapitel 1. Grundlagen Seite 19 werd
Seite 21 und 22: Kapitel 2 Lokale Modelle 2.1 Das Mo
Seite 23 und 24: Kapitel 2. Lokale Modelle Seite 23
Seite 31: Kapitel 2. Lokale Modelle Seite 31
Seite 37 und 38: Kapitel 3. Lokal polynomiale Modell
Seite 69 und 70: £¢ £ ¢
Seite 77 und 78: Kapitel 4. Support-Vektor-Regressio
Seite 83 und 84:
Kapitel 4. Support-Vektor-Regressio
Seite 85 und 86:
Kapitel 4. Support-Vektor-Regressio
Seite 87 und 88:
Kapitel 5 Anwendungen der Modelle I
Seite 89 und 90:
Kapitel 5. Anwendungen der Modelle
Seite 91 und 92:
Seite 93 und 94:
Seite 95 und 96:
Seite 97 und 98:
Seite 99 und 100:
Kapitel 6 Zusammenfassung und Ausbl
Seite 101 und 102:
Anhang A Berechnung der Modellkoeff
Seite 103 und 104:
Anhang B Nichtlineare Optimierung F
Seite 105 und 106:
Anhang B. Nichtlineare Optimierung
Seite 107 und 108:
Literaturverzeichnis [1] J. Argyris
Seite 109 und 110:
Literaturverzeichnis Seite 109 [27]
Alle anzeigen

Optimierte lokale Modelle in der nichtlinearen Zeitreihenanalyse

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?