Nichtlineare Dimensionsreduktionsmethoden in der ... - DPI
Nichtlineare Dimensionsreduktionsmethoden in der ... - DPI
Nichtlineare Dimensionsreduktionsmethoden in der ... - DPI
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
42 Isomap<br />
In dem so konstruierten Graphen bestimmt man dann die kürzesten Wege<br />
zwischen allen Knoten, wobei hier <strong>der</strong> Algorithmus von Dijkstra zum E<strong>in</strong>satz<br />
kommt (vgl. Algorithmus A.1). Es ist |V | = N die Anzahl <strong>der</strong> Knoten<br />
<strong>in</strong> G, und für k nächste Nachbarn ist |E| = N · k die Anzahl <strong>der</strong> Kanten<br />
zwischen diesen Knoten. Die Laufzeit des Algorithmus’ lässt sich dann<br />
abschätzen durch O(N 2 (k + log N)). Für zwei beliebige Punkte x i und x j<br />
lässt sich <strong>der</strong>en geodätischer Abstand nun aproximieren durch die Länge des<br />
kürzesten Weges zwischen v i und v j im Graphen G. Die E<strong>in</strong>gabedaten werden<br />
zu e<strong>in</strong>er Matrix X = (x 1 , . . . , x N ) T mit den x i als Zeilen zusammengefasst.<br />
Weiterh<strong>in</strong> bezeichne ∆ G (X) die Matrix mit den Längen <strong>der</strong> kürzesten Wege<br />
zwischen den Daten, wobei wie<strong>der</strong> wie im vorigen Abschnitt δ ij<br />
G<br />
(X) die Länge<br />
des kürzsten Weges zwischen v i und v j bezeichnet. Def<strong>in</strong>iert man außerdem<br />
analog ∆ M (X) als Matrix <strong>der</strong> paarweisen geodätischen Distanzen <strong>der</strong> x i ,<br />
so betrachtet man also ∆ G (X) als e<strong>in</strong>e Näherung an die (unbekannte) Matrix<br />
∆ M (X). Mit Hilfe des klassischen MDS (vgl. Abschnitt 4.1.1) wird nun<br />
durch M<strong>in</strong>imierung des Stra<strong>in</strong> (4.13) e<strong>in</strong>e euklidische E<strong>in</strong>bettung für die approximierten<br />
geodätischen Distanzen ∆ G (X) berechnet. Man wendet also die<br />
doppelte Zentrierung (4.7) auf die Matrix ∆ (2) G mit (∆ (2) G) ij = (δ ij<br />
G )2 an<br />
und erhält die Matrix B ∆G . Der zu m<strong>in</strong>imierende Stra<strong>in</strong> hat dann analog zu<br />
(4.13) die Form<br />
L(Y) = ‖YY T − B ∆G ‖ 2 F . (5.1)<br />
Die Lösung Y ∈ R N×d für e<strong>in</strong>e d-dimensionale E<strong>in</strong>bettung ist nach (4.17)<br />
gerade gegeben durch<br />
Y = V d Λ 1 2<br />
d<br />
, (5.2)<br />
wobei Λ 1/2<br />
d<br />
= diag(λ 1/2<br />
1 , . . . , λ 1/2<br />
d<br />
) die Diagonalmatrix mit den Quadratwurzeln<br />
<strong>der</strong> d größten Eigenwerte λ 1 ≥ . . . ≥ λ d ≥ 0 von B ∆G ist und V d<br />
die N × d-Matrix mit den zugehörigen Eigenvektoren als Spalten bezeichnet.<br />
Isomap verwendet also e<strong>in</strong>en globalen Ansatz, bei dem die geodätischen<br />
Abstände zwischen allen E<strong>in</strong>gabedaten durch Distanzen <strong>in</strong> e<strong>in</strong>em Graphen<br />
approximiert werden und anschließend e<strong>in</strong> globales M<strong>in</strong>imum von (5.1) bestimmt<br />
wird.<br />
In Pseudocode lässt sich <strong>der</strong> Isomap-Algorithmus folgen<strong>der</strong>maßen formulieren: