20.01.2015 Aufrufe

Optimierte lokale Modelle in der nichtlinearen Zeitreihenanalyse

Optimierte lokale Modelle in der nichtlinearen Zeitreihenanalyse

Optimierte lokale Modelle in der nichtlinearen Zeitreihenanalyse

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Seite 68<br />

3.10. Suche nach nächsten Nachbarn<br />

k-d-Bäume<br />

Der k-d-Baum ist e<strong>in</strong>e Datenstruktur, die als Verallgeme<strong>in</strong>erung des b<strong>in</strong>ären Suchbaums<br />

1975 von Bentley e<strong>in</strong>geführt wurde (siehe [6]); die Abkürzung “k-d” ist<br />

hierbei als “k-dimensional” zu verstehen 5 .<br />

E<strong>in</strong> k-d-Baum ist zunächst e<strong>in</strong>mal e<strong>in</strong> b<strong>in</strong>ärer Suchbaum: zu jedem Knoten P existieren<br />

maximal zwei Söhne; diese s<strong>in</strong>d als Po<strong>in</strong>ter LS(P ) und RS(P ) im Knoten<br />

von P gespeichert. Hierbei s<strong>in</strong>d diese Po<strong>in</strong>ter so zu verstehen, dass sie den gesamten<br />

Teilbaum l<strong>in</strong>ks bzw. rechts des Knotens P repräsentieren. Im Gegensatz zum<br />

normalen b<strong>in</strong>ären Suchbaum, wo je<strong>der</strong> Knoten genau e<strong>in</strong>en Schlüssel trägt, trägt<br />

beim k-d-Baum je<strong>der</strong> Knoten k verschiedene Schlüssel K 0 (P ), . . . , K k−1 (P ). Weiterh<strong>in</strong><br />

trägt je<strong>der</strong> Knoten e<strong>in</strong>e ganzzahlige Dimensionsangabe D(P ) zwischen 0 und<br />

k − 1, den sog. Diskrim<strong>in</strong>ator. Die Anordnung <strong>der</strong> Knoten erfüllt nun folgende Regel:<br />

Sei j = D(P ) <strong>der</strong> Diskrim<strong>in</strong>ator e<strong>in</strong>es Knotens P im k-d-Baum, dann gilt für<br />

alle Knoten U im Teilbaum LS(P ), dass K j (U) < K j (P ) und für alle Knoten V im<br />

Teilbaum RS(P ) gilt K j (V ) > K j (P ). Sollten zwei Schlüssel gleich se<strong>in</strong>, werden die<br />

restlichen Schlüssel als Vergleichsobjekte herangezogen (für Details siehe [6]).<br />

Für die Anwendung <strong>der</strong> Suche nach nächsten Nachbarn s<strong>in</strong>d die Schlüssel e<strong>in</strong>es<br />

Knotens K 0 (P ), . . . , K k−1 (P ) Komponenten e<strong>in</strong>es k-dimensionalen Vektors; je<strong>der</strong><br />

Knoten im k-d-Baum trägt somit e<strong>in</strong>en Punkt x ∈ R k . Alle Punkte aus Knoten U<br />

im Teilbaum LS(P ) s<strong>in</strong>d somit bezüglich <strong>der</strong> Komponente j = D(P ) kle<strong>in</strong>er als P .<br />

In Abbildung 3.11 ist dies für den Fall des 2-d-Baumes gezeigt, e<strong>in</strong>mal <strong>in</strong> räumlicherund<br />

e<strong>in</strong>mal <strong>in</strong> Graph-Darstellung. Der Knoten A ist die Wurzel des Baumes, für se<strong>in</strong>e<br />

Söhne gelte die x-Komponenten als Vergleichskriterium: Alle Knoten im l<strong>in</strong>ken<br />

Teilbaum von A (also B,D,E und G) liegen l<strong>in</strong>ks von A, die an<strong>der</strong>en rechts. Ausgehend<br />

von den Söhnen von A, nämlich B und C, gilt nun die y-Komponente als<br />

Vergleichskriterium: alle Knoten im l<strong>in</strong>ken Teilbaum von B liegen unterhalb, <strong>der</strong><br />

Knoten E im rechten Teilbaum oberhalb. Analog verhält es sich beim Knoten C,<br />

wo <strong>der</strong> Knoten F im rechten Teilbaum liegt und somit oberhalb von C.<br />

Der eigentliche Trick liegt somit dar<strong>in</strong>, dass mit jedem Knoten nicht nur e<strong>in</strong> Punkt,<br />

son<strong>der</strong>n auch gleichzeitig e<strong>in</strong> k-dimensionaler Qua<strong>der</strong> des Raumes verknüpft ist,<br />

dessen Kanten durch die Vorgängerknoten bestimmt wird. Je<strong>der</strong> nicht-term<strong>in</strong>ale<br />

Knoten e<strong>in</strong>es k-d-Baumes ist somit Wurzel e<strong>in</strong>es Teilbaumes, <strong>der</strong> alle Punkte e<strong>in</strong>es<br />

bestimmten Qua<strong>der</strong>s enthält; die Wurzel des Baumes umfasst als e<strong>in</strong>ziger Knoten<br />

den gesamten Raum. Der k-d-Baum liefert somit e<strong>in</strong>e hierarchische räumliche Aufteilung<br />

<strong>der</strong> Punkte. In <strong>der</strong> Praxis ist es aus Gründen <strong>der</strong> Laufzeit s<strong>in</strong>nvoll, e<strong>in</strong>e<br />

m<strong>in</strong>imale Anzahl L an Punkten vorzugeben, ab <strong>der</strong> ke<strong>in</strong>e Aufteilung mehr vorgenommen<br />

werden soll. Diese Punktmengen mit e<strong>in</strong>er Punktzahl kle<strong>in</strong>er als L laden<br />

<strong>in</strong> den term<strong>in</strong>alen Knoten des Baumes; sie werden meist als Buckets bezeichnet.<br />

5 Um dem Begriff “k-d-Baum” Genüge zu tun, wird <strong>in</strong> diesem Abschnitt die bisherige Notation<br />

fallengelassen, die mit d die Dimension und mit k die Zahl nächster Nachbarn bezeichnet.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!