23.11.2014 Aufrufe

Nichtlineare Dimensionsreduktionsmethoden in der ... - DPI

Nichtlineare Dimensionsreduktionsmethoden in der ... - DPI

Nichtlineare Dimensionsreduktionsmethoden in der ... - DPI

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

42 Isomap<br />

In dem so konstruierten Graphen bestimmt man dann die kürzesten Wege<br />

zwischen allen Knoten, wobei hier <strong>der</strong> Algorithmus von Dijkstra zum E<strong>in</strong>satz<br />

kommt (vgl. Algorithmus A.1). Es ist |V | = N die Anzahl <strong>der</strong> Knoten<br />

<strong>in</strong> G, und für k nächste Nachbarn ist |E| = N · k die Anzahl <strong>der</strong> Kanten<br />

zwischen diesen Knoten. Die Laufzeit des Algorithmus’ lässt sich dann<br />

abschätzen durch O(N 2 (k + log N)). Für zwei beliebige Punkte x i und x j<br />

lässt sich <strong>der</strong>en geodätischer Abstand nun aproximieren durch die Länge des<br />

kürzesten Weges zwischen v i und v j im Graphen G. Die E<strong>in</strong>gabedaten werden<br />

zu e<strong>in</strong>er Matrix X = (x 1 , . . . , x N ) T mit den x i als Zeilen zusammengefasst.<br />

Weiterh<strong>in</strong> bezeichne ∆ G (X) die Matrix mit den Längen <strong>der</strong> kürzesten Wege<br />

zwischen den Daten, wobei wie<strong>der</strong> wie im vorigen Abschnitt δ ij<br />

G<br />

(X) die Länge<br />

des kürzsten Weges zwischen v i und v j bezeichnet. Def<strong>in</strong>iert man außerdem<br />

analog ∆ M (X) als Matrix <strong>der</strong> paarweisen geodätischen Distanzen <strong>der</strong> x i ,<br />

so betrachtet man also ∆ G (X) als e<strong>in</strong>e Näherung an die (unbekannte) Matrix<br />

∆ M (X). Mit Hilfe des klassischen MDS (vgl. Abschnitt 4.1.1) wird nun<br />

durch M<strong>in</strong>imierung des Stra<strong>in</strong> (4.13) e<strong>in</strong>e euklidische E<strong>in</strong>bettung für die approximierten<br />

geodätischen Distanzen ∆ G (X) berechnet. Man wendet also die<br />

doppelte Zentrierung (4.7) auf die Matrix ∆ (2) G mit (∆ (2) G) ij = (δ ij<br />

G )2 an<br />

und erhält die Matrix B ∆G . Der zu m<strong>in</strong>imierende Stra<strong>in</strong> hat dann analog zu<br />

(4.13) die Form<br />

L(Y) = ‖YY T − B ∆G ‖ 2 F . (5.1)<br />

Die Lösung Y ∈ R N×d für e<strong>in</strong>e d-dimensionale E<strong>in</strong>bettung ist nach (4.17)<br />

gerade gegeben durch<br />

Y = V d Λ 1 2<br />

d<br />

, (5.2)<br />

wobei Λ 1/2<br />

d<br />

= diag(λ 1/2<br />

1 , . . . , λ 1/2<br />

d<br />

) die Diagonalmatrix mit den Quadratwurzeln<br />

<strong>der</strong> d größten Eigenwerte λ 1 ≥ . . . ≥ λ d ≥ 0 von B ∆G ist und V d<br />

die N × d-Matrix mit den zugehörigen Eigenvektoren als Spalten bezeichnet.<br />

Isomap verwendet also e<strong>in</strong>en globalen Ansatz, bei dem die geodätischen<br />

Abstände zwischen allen E<strong>in</strong>gabedaten durch Distanzen <strong>in</strong> e<strong>in</strong>em Graphen<br />

approximiert werden und anschließend e<strong>in</strong> globales M<strong>in</strong>imum von (5.1) bestimmt<br />

wird.<br />

In Pseudocode lässt sich <strong>der</strong> Isomap-Algorithmus folgen<strong>der</strong>maßen formulieren:

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!