20.01.2015 Aufrufe

Optimierte lokale Modelle in der nichtlinearen Zeitreihenanalyse

Optimierte lokale Modelle in der nichtlinearen Zeitreihenanalyse

Optimierte lokale Modelle in der nichtlinearen Zeitreihenanalyse

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Kapitel 3. Lokal polynomiale Modellierung Seite 71<br />

risiert ist durch e<strong>in</strong>en zentralen Punkt c und dem m<strong>in</strong>imalen Radius R, <strong>der</strong> nötig<br />

ist, um alle Punkte des Clusters zu überdecken. Beim Übergang von e<strong>in</strong>er Ebene<br />

des Suchbaumes zur nächsten wird je<strong>der</strong> Cluster <strong>in</strong> zwei Subcluster geteilt, die die<br />

Söhne <strong>der</strong> jeweiligen Knoten bilden.<br />

Die Teilung e<strong>in</strong>es Clusters erfolgt hierbei nach folgenden Schema: Suche zunächst<br />

den Punkt c r mit maximalem Abstand zum zentralen Punkt c (ist <strong>der</strong> aktuelle<br />

Knoten die Wurzel, so wähle e<strong>in</strong>en zufälligen Punkt als zentralen Punkt). Anschließend<br />

suche den Punkt c l mit maximalem Abstand zu c r . Diese Punkte c l und c r<br />

bilden die zentralen Punkte des l<strong>in</strong>ken bzw. rechten Sohnes. Alle weiteren Punkte<br />

des momentanen Clusters werden nun dem l<strong>in</strong>ken o<strong>der</strong> rechten Sohn zugesprochen,<br />

je nachdem ob sie näher an c l o<strong>der</strong> näher an c r liegen. Für die beiden Subcluster<br />

muss anschließend <strong>der</strong> m<strong>in</strong>imale Radius R berechnet werden. Die Aufteilung <strong>der</strong><br />

Knoten wird fortgesetzt, bis die Anzahl <strong>der</strong> Punkte <strong>in</strong> e<strong>in</strong>em Cluster e<strong>in</strong>e m<strong>in</strong>imale<br />

Punktzahl L unterschreitet. Diese Cluster s<strong>in</strong>d dann die term<strong>in</strong>alen Knoten des<br />

Suchbaums. Für diese term<strong>in</strong>alen Knoten werden alle Distanzen <strong>der</strong> Punkten zum<br />

zentralen Punkt berechnet und gespeichert.<br />

Für die Suche nach nächsten Nachbarn wird wie<strong>der</strong> e<strong>in</strong>e nach den Distanzen sortierte<br />

Liste D = (d 1 , . . . , d m = d max ) e<strong>in</strong>geführt, die die Distanzen <strong>der</strong> bislang besten m<br />

nächsten Nachbarn speichert. Es wird nun wie beim vorherigen Algorithmus <strong>der</strong><br />

Suchbaum rekursiv durchlaufen. E<strong>in</strong> Cluster i wird ausgeschlossen, falls gilt<br />

d max < ˆd m<strong>in</strong> (i) , (3.44)<br />

wobei ˆd m<strong>in</strong> e<strong>in</strong>e untere Schranke für die Distanz vom Anfragepunkt zu e<strong>in</strong>em beliebigen<br />

Punkt des Clusters ist. Dieser Wert kann nicht exakt berechnet werden, aber<br />

es ist möglich, zum<strong>in</strong>dest drei verschiedene untere Schranken für ˆd m<strong>in</strong> zu erhalten,<br />

wobei <strong>der</strong> Cluster-Radius R, <strong>der</strong> Abstand zwischen Cluster i und se<strong>in</strong>em Bru<strong>der</strong>knoten,<br />

sowie die Tatsache ausgenutzt wird, dass ˆd m<strong>in</strong> nicht kle<strong>in</strong>er se<strong>in</strong> kann als <strong>der</strong><br />

Wert des Vaterknotens (für Details siehe [26]). Das Maximum dieser drei Werte wird<br />

<strong>in</strong> (3.44) e<strong>in</strong>gesetzt. Trifft man auf e<strong>in</strong>en term<strong>in</strong>alen Knoten, so werden alle Punkte<br />

x ausgeschlossen für die gilt<br />

d max < ‖d(c i , q) − d(c i , x)‖ . (3.45)<br />

Die hierfür nötigen Distanzen d(c i , x) wurden bereits während des Präprozess<strong>in</strong>gs<br />

berechnet. Der ATRIA kann ebenfalls durch Verwendung des Partial Distance Search<br />

beschleunigt werden. Die Laufzeit hängt wesentlich von <strong>der</strong> Dimension <strong>der</strong> Punktmenge<br />

ab und ist meist niedriger als bei Algorithmen auf Basis von k-d-Bäumen<br />

[26]. Zudem hat <strong>der</strong> ATRIA den Vorteil, mit beliebigen Metriken arbeiten zu<br />

können. So können durch Verwendung von sog. Kernfunktionen, die <strong>in</strong> Abschnitt<br />

4.1.2 noch näher besprochen werden, auch nächste Nachbarn <strong>in</strong> hochdimensionalen

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!