Optimierte lokale Modelle in der nichtlinearen Zeitreihenanalyse

Weitere Magazine

Empfehlungen

Info

Seite 46 3.3. Parameter bei der lokalen Modellbildung daher werden durch diese Metrik die Komponenten stärker gewichtet, die zeitlich näher am gesuchten Schätzer der zeitlichen Entwicklung von q liegen, während die zeitlich weiter entfernten Komponenten an Einfluss verlieren. Diese Metrik kann in bestimmten Fällen zu einer Verbesserung der Vorhersage führen. Manchmal kann es sinnvoll sein, bestimmten Komponenten mehr Gewicht bei der Wahl nächster Nachbarn zu geben als anderen. Gerade bei experimentellen Daten, wo z.B. Messwerte verschiedener Sensoren zu einem Messvektor zusammengefasst werden, kann es vorkommen, dass bestimmte Komponenten keinen oder negativen Einfluss auf die Berechnung des Modells haben, z.B. weil das Signal-Rausch-Verhältnis zu niedrig ist. Hier ist es sinnvoll, diese Komponenten weniger stark oder gar nicht bei der Suche nach nächsten Nachbarn zu berücksichtigen. Hierfür lässt sich die diagonal gewichtete euklidischen Metrik d dwe (x, q) 2 = d∑ λ 2 i (x i − q i ) 2 = (x − q) T Λ 2 (x − q) , Λ = diag(λ), λ ∈ R d (3.21) i=1 verwenden. Noch allgemeiner ist die gewichtete euklidische Metrik, bei der die Wichtungsmatrix Λ keine Diagonalmatrix ist. Hier stellt sich allerdings die Frage, nach welchen Kriterien die Nicht-Diagonalelemente dieser Matrix gewählt werden sollen. Dies ist in der Praxis letztlich nur mit Hilfe eines Optimierungsverfahrens möglich, wobei hier d 2 Parameter zu optimieren sind, was in der Regel zu zeitaufwändig ist. Natürlich gibt es Modellierungsprobleme, wo gänzlich andere Metriken nötig werden. Ein Beispiel ist die Modellierung von DNA Sequenzen, wo bekanntlich nur vier verschiedene Zustände (A,T,G,C) möglich sind. Hier können z.B. Hamming-ähnliche Metriken verwendet werden (für ein Beispiel siehe [28]). Beispiel: Hénon-Abbildung Ein Beispiel für den Nutzen alternativer Metriken zeigt sich bei der lokal linearen Modellierung von Datensätzen der Hénon-Abbildung x n+1 = y n − ax 2 n + 1 y n+1 = bx n (3.22) mit den Parameterwerten a = 1, 4 und b = 0, 3, wobei die x-Variable als Zeitreihe aufgefasst und zweidimensional eingebettet wurde. Hier kann durch Verwendung einer exponentiell gewichteten Metrik (3.19) eine deutliche Verbesserung der Vorhersage erzielt werden. Die beste Vorhersage erhält man mit λ = 0, was auf den
Kapitel 3. Lokal polynomiale Modellierung Seite 47 ersten Blick verblüffen mag, da dies nichts anderes bedeutet, als dass die nächsten Nachbarn nur auf Basis der ersten Komponente gewählt werden. Setzt man die zweite Gleichung der Hénon-Abbildung in die erste ein, so erhält man x n+1 = bx n−1 −ax 2 n +1. In den Wert x n+1 fließt somit x n quadratisch und x n−1 linear ein. Da ein lineares Modell verwendet wird, kann der lineare Anteil ohnehin perfekt modelliert werden; somit ist der quadratische Anteil der für die Modellierung wesentliche. Dementsprechend werden die nächsten Nachbarn nur anhand dieser Komponente ausgewählt. Für andere Modelltypen wie z.B. ein lokal konstantes Modell ist diese Metrik völlig ungeeignet; die optimale Metrik hängt somit wesentlich von dem verwendeten Modell ab. Auch unter Einfluss von Rauschen ist λ = 0 beim lokal linearen Modell nicht mehr die optimale Wahl (siehe auch Abschnitt 5.1.1). 3.4 Regularisierung polynomialer Modelle Zwar hat man mit (3.11) ein mathematisch exaktes Ergebnis für den Koeffizientenvektor ν gefunden, jedoch stellt sich bei der praktischen Berechnung das Problem, dass die Matrix X häufig schlecht konditioniert ist, d.h. sie ist nahezu singulär. Dieses Problem tritt insb. dann auf, wenn nur wenige Punkte zur Berechnung herangezogen werden und wenn viele dieser Punkte kolinear sind. Dies ist gerade bei lokalen Modellen häufig der Fall, wo wenige nächste Nachbarn zur Berechnung des Modells verwendet werden. Um auch in diesen Fällen vernünftige Werte für den Koeffizientenvektor ν zu erhalten, ist eine Regularisierung der Matrix X notwendig. Hierfür gibt es vor allem zwei populäre Methoden: die Ridge Regression (RR) und die Principal Component Regression (PCR). 3.4.1 Principal Component Regression Der Einfachheit halber soll zunächst auf die Wichtung verzichtet werden. Der Koeffizientenvektor ist somit gegeben durch ν = X † y = (X T X) −1 X T y = (VS 2 V T ) −1 X T y , (3.23) wobei hier die Singulärwertzerlegung X = USV T verwendet wurde (siehe Anhang A). Das Matrixprodukt X T X ist reell und symmetrisch, daher ist VS 2 V T eine Diagonalisierung des Matrixproduktes mit den quadrierten reellen, positiven Eigenwerten σ i auf der Diagonalen von S 2 . Sortiert man diese der Größe nach, so sind die dazugehörigen Eigenvektoren v i die Hauptachsen (Principal Components) der Matrix XX T . Statistisch können diese als die Vektoren verstanden werden, die die Summe
Seite 1 und 2: Optimierte lokale Modelle in der ni
Seite 3 und 4: Inhaltsverzeichnis Seite 3 3 Lokal
Seite 5 und 6: Einleitung In der Physik hat man me
Seite 7 und 8: Inhaltsverzeichnis Seite 7 worfen.
Seite 9 und 10: Kapitel 1. Grundlagen Seite 9 1.1 D
Seite 11 und 12: Kapitel 1. Grundlagen Seite 11 Das
Seite 13 und 14: Kapitel 1. Grundlagen Seite 13 k Ly
Seite 15 und 16: Kapitel 1. Grundlagen Seite 15 Im F
Seite 17 und 18: Kapitel 1. Grundlagen Seite 17 mit
Seite 19 und 20: Kapitel 1. Grundlagen Seite 19 werd
Seite 21 und 22: Kapitel 2 Lokale Modelle 2.1 Das Mo
Seite 23 und 24: Kapitel 2. Lokale Modelle Seite 23
Seite 37 und 38: Kapitel 3. Lokal polynomiale Modell
Seite 45: Kapitel 3. Lokal polynomiale Modell
Seite 69 und 70: £¢ £ ¢
Seite 77 und 78: Kapitel 4. Support-Vektor-Regressio
Seite 87 und 88: Kapitel 5 Anwendungen der Modelle I
Seite 89 und 90: Kapitel 5. Anwendungen der Modelle
Seite 97 und 98:
Kapitel 5. Anwendungen der Modelle
Seite 99 und 100:
Kapitel 6 Zusammenfassung und Ausbl
Seite 101 und 102:
Anhang A Berechnung der Modellkoeff
Seite 103 und 104:
Anhang B Nichtlineare Optimierung F
Seite 105 und 106:
Anhang B. Nichtlineare Optimierung
Seite 107 und 108:
Literaturverzeichnis [1] J. Argyris
Seite 109 und 110:
Literaturverzeichnis Seite 109 [27]
Alle anzeigen

Optimierte lokale Modelle in der nichtlinearen Zeitreihenanalyse

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?