Optimierte lokale Modelle in der nichtlinearen Zeitreihenanalyse

Weitere Magazine

Empfehlungen

Info

Seite 70 3.10. Suche nach nächsten Nachbarn derer die Aufteilung des Raumes geschieht. Als natürlichen k-d-Baum bezeichnet man, wenn die Punkte zufällig und für den Diskriminator eine Modulo-Funktion verwendet wird, d.h. D(P ) = i mod k, wobei i die Ebene des Baumes ist, in der sich der Knoten P befindet. Der Diskriminator wird somit in aufsteigender Reihenfolge vergeben, beginnend mit 0 bei der Wurzel bis zur Ebene k, bei der dann der Zyklus erneut mit 0 beginnt. Um einen sog. optimalen k-d-Baum aufzubauen, wird der Punkt im Knoten P und der Diskriminator D(P ) so gewählt, dass in den sich ergebenden Teilmengen etwa gleich viele Punkte liegen [12]. Es gibt noch weitere Verfeinerungen zur Wahl des Punktes und Diskriminators eines k-d-Baumes, die insb. sehr ungleich verteilte Punktmengen berücksichtigen (z.B. das sog. Sliding Midpoint Verfahren; eine Übersicht findet sich in [21]). Unter gewissen Voraussetzungen (für Details siehe [12]) ist die Laufzeit zum Aufbau des k-d-Baumes (Präprozessing) O(k·n log n) und es wird O(n) zusätzlicher Speicher benötigt. Für die Suche nach m nächsten Nachbarn gilt O(log n), also unabhängig von k. Diese letzte Aussage ist aber mit Vorsicht zu genießen, insb. für normalund gleichverteilte Punkte steigt die Zeit zur Suche nächster Nachbarn deutlich mit wachsender Dimension, im hochdimensionalen Fall sogar exponentiell (vgl. [23]). Der Grund hierfür liegt im “Fluch der Dimensionen” (siehe Abschnitt 2.2). Die Größen der Abstände der nächsten Nachbarn nähern sich immer weiter an, weshalb bei der Suche nächster Nachbarn im k-d-Baum immer mehr Knoten aufgesucht werden müssen. Für hohe Dimensionen ist daher ein Brute-Force Ansatz bei gleich- oder normalverteilten Punkten häufig schneller, da hier die Zeit für das Präprozessing entfällt. Glücklicherweise hat man es aber gerade bei der Zeitreihenanalyse häufig mit Daten zu tun, die auf einer Untermannigfaltigkeit des Raumes liegen, deren Dimension meist deutlich geringer als die des Einbettungsraumes ist. Es zeigt sich, dass die meisten Algorithmen zur Suche nächster Nachbarn weitaus stärker von der Dimension dieser Mannigfaltigkeit abhängt als von der Dimension des Einbettungsraumes. Besonders gut skaliert hierbei der sog. ATRIA, der von Merkwirth in [25] vorgestellt wird und der auch für diese Arbeit verwendet wurde. ATRIA Der ATRIA (Advanced Triangle Inequality (Based) Algorithm) erstellt ebenfalls einen binären Suchbaum in einem Präprozessing, der dann später für die Suche nächster Nachbarn verwendet wird. Der Vorteil des ATRIA gegenüber dem k-d- Baum ist, dass er bei der Bildung des Suchbaumes direkt eine Aufteilung der Datenpunkte in sog. Cluster vornimmt, während sich dies beim k-d-Baum mehr als eine indirekte Folge aus der Aufteilung des Datenraumes in Quader ergab. Der ATRIA passt sich so automatisch der gegebenen Verteilung der Datenpunkte an. Jeder Knoten des Suchbaumes repräsentiert einen Cluster, wobei dieser charakte-
Kapitel 3. Lokal polynomiale Modellierung Seite 71 risiert ist durch einen zentralen Punkt c und dem minimalen Radius R, der nötig ist, um alle Punkte des Clusters zu überdecken. Beim Übergang von einer Ebene des Suchbaumes zur nächsten wird jeder Cluster in zwei Subcluster geteilt, die die Söhne der jeweiligen Knoten bilden. Die Teilung eines Clusters erfolgt hierbei nach folgenden Schema: Suche zunächst den Punkt c r mit maximalem Abstand zum zentralen Punkt c (ist der aktuelle Knoten die Wurzel, so wähle einen zufälligen Punkt als zentralen Punkt). Anschließend suche den Punkt c l mit maximalem Abstand zu c r . Diese Punkte c l und c r bilden die zentralen Punkte des linken bzw. rechten Sohnes. Alle weiteren Punkte des momentanen Clusters werden nun dem linken oder rechten Sohn zugesprochen, je nachdem ob sie näher an c l oder näher an c r liegen. Für die beiden Subcluster muss anschließend der minimale Radius R berechnet werden. Die Aufteilung der Knoten wird fortgesetzt, bis die Anzahl der Punkte in einem Cluster eine minimale Punktzahl L unterschreitet. Diese Cluster sind dann die terminalen Knoten des Suchbaums. Für diese terminalen Knoten werden alle Distanzen der Punkten zum zentralen Punkt berechnet und gespeichert. Für die Suche nach nächsten Nachbarn wird wieder eine nach den Distanzen sortierte Liste D = (d 1 , . . . , d m = d max ) eingeführt, die die Distanzen der bislang besten m nächsten Nachbarn speichert. Es wird nun wie beim vorherigen Algorithmus der Suchbaum rekursiv durchlaufen. Ein Cluster i wird ausgeschlossen, falls gilt d max < ˆd min (i) , (3.44) wobei ˆd min eine untere Schranke für die Distanz vom Anfragepunkt zu einem beliebigen Punkt des Clusters ist. Dieser Wert kann nicht exakt berechnet werden, aber es ist möglich, zumindest drei verschiedene untere Schranken für ˆd min zu erhalten, wobei der Cluster-Radius R, der Abstand zwischen Cluster i und seinem Bruderknoten, sowie die Tatsache ausgenutzt wird, dass ˆd min nicht kleiner sein kann als der Wert des Vaterknotens (für Details siehe [26]). Das Maximum dieser drei Werte wird in (3.44) eingesetzt. Trifft man auf einen terminalen Knoten, so werden alle Punkte x ausgeschlossen für die gilt d max < ‖d(c i , q) − d(c i , x)‖ . (3.45) Die hierfür nötigen Distanzen d(c i , x) wurden bereits während des Präprozessings berechnet. Der ATRIA kann ebenfalls durch Verwendung des Partial Distance Search beschleunigt werden. Die Laufzeit hängt wesentlich von der Dimension der Punktmenge ab und ist meist niedriger als bei Algorithmen auf Basis von k-d-Bäumen [26]. Zudem hat der ATRIA den Vorteil, mit beliebigen Metriken arbeiten zu können. So können durch Verwendung von sog. Kernfunktionen, die in Abschnitt 4.1.2 noch näher besprochen werden, auch nächste Nachbarn in hochdimensionalen
Seite 1 und 2:
Optimierte lokale Modelle in der ni
Seite 3 und 4:
Inhaltsverzeichnis Seite 3 3 Lokal
Seite 5 und 6:
Einleitung In der Physik hat man me
Seite 7 und 8:
Inhaltsverzeichnis Seite 7 worfen.
Seite 9 und 10:
Kapitel 1. Grundlagen Seite 9 1.1 D
Seite 11 und 12:
Kapitel 1. Grundlagen Seite 11 Das
Seite 13 und 14:
Kapitel 1. Grundlagen Seite 13 k Ly
Seite 15 und 16:
Kapitel 1. Grundlagen Seite 15 Im F
Seite 17 und 18:
Kapitel 1. Grundlagen Seite 17 mit
Seite 19 und 20: Kapitel 1. Grundlagen Seite 19 werd
Seite 21 und 22: Kapitel 2 Lokale Modelle 2.1 Das Mo
Seite 23 und 24: Kapitel 2. Lokale Modelle Seite 23
Seite 37 und 38: Kapitel 3. Lokal polynomiale Modell
Seite 69: £¢ £ ¢
Seite 77 und 78: Kapitel 4. Support-Vektor-Regressio
Seite 87 und 88: Kapitel 5 Anwendungen der Modelle I
Seite 89 und 90: Kapitel 5. Anwendungen der Modelle
Seite 99 und 100: Kapitel 6 Zusammenfassung und Ausbl
Seite 101 und 102: Anhang A Berechnung der Modellkoeff
Seite 103 und 104: Anhang B Nichtlineare Optimierung F
Seite 105 und 106: Anhang B. Nichtlineare Optimierung
Seite 107 und 108: Literaturverzeichnis [1] J. Argyris
Seite 109 und 110: Literaturverzeichnis Seite 109 [27]
Alle anzeigen

Optimierte lokale Modelle in der nichtlinearen Zeitreihenanalyse

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?