Nichtlineare Dimensionsreduktionsmethoden in der ... - DPI

Weitere Magazine

Empfehlungen

Info

42 Isomap In dem so konstruierten Graphen bestimmt man dann die kürzesten Wege zwischen allen Knoten, wobei hier der Algorithmus von Dijkstra zum Einsatz kommt (vgl. Algorithmus A.1). Es ist |V | = N die Anzahl der Knoten in G, und für k nächste Nachbarn ist |E| = N · k die Anzahl der Kanten zwischen diesen Knoten. Die Laufzeit des Algorithmus’ lässt sich dann abschätzen durch O(N 2 (k + log N)). Für zwei beliebige Punkte x i und x j lässt sich deren geodätischer Abstand nun aproximieren durch die Länge des kürzesten Weges zwischen v i und v j im Graphen G. Die Eingabedaten werden zu einer Matrix X = (x 1 , . . . , x N ) T mit den x i als Zeilen zusammengefasst. Weiterhin bezeichne ∆ G (X) die Matrix mit den Längen der kürzesten Wege zwischen den Daten, wobei wieder wie im vorigen Abschnitt δ ij G (X) die Länge des kürzsten Weges zwischen v i und v j bezeichnet. Definiert man außerdem analog ∆ M (X) als Matrix der paarweisen geodätischen Distanzen der x i , so betrachtet man also ∆ G (X) als eine Näherung an die (unbekannte) Matrix ∆ M (X). Mit Hilfe des klassischen MDS (vgl. Abschnitt 4.1.1) wird nun durch Minimierung des Strain (4.13) eine euklidische Einbettung für die approximierten geodätischen Distanzen ∆ G (X) berechnet. Man wendet also die doppelte Zentrierung (4.7) auf die Matrix ∆ (2) G mit (∆ (2) G) ij = (δ ij G )2 an und erhält die Matrix B ∆G . Der zu minimierende Strain hat dann analog zu (4.13) die Form L(Y) = ‖YY T − B ∆G ‖ 2 F . (5.1) Die Lösung Y ∈ R N×d für eine d-dimensionale Einbettung ist nach (4.17) gerade gegeben durch Y = V d Λ 1 2 d , (5.2) wobei Λ 1/2 d = diag(λ 1/2 1 , . . . , λ 1/2 d ) die Diagonalmatrix mit den Quadratwurzeln der d größten Eigenwerte λ 1 ≥ . . . ≥ λ d ≥ 0 von B ∆G ist und V d die N × d-Matrix mit den zugehörigen Eigenvektoren als Spalten bezeichnet. Isomap verwendet also einen globalen Ansatz, bei dem die geodätischen Abstände zwischen allen Eingabedaten durch Distanzen in einem Graphen approximiert werden und anschließend ein globales Minimum von (5.1) bestimmt wird. In Pseudocode lässt sich der Isomap-Algorithmus folgendermaßen formulieren:
5.2 Eine neuere Variante von Isomap 43 Algorithmus 5.1 Der Isomap-Algorithmus Require: Matrix D ∈ R N×N der euklidischen Distanzen zwischen Nachbarn; Graph G = (V, E) mit Knotenmenge V = (v 1 , . . . , v N ); 1: {Initialisierung:} 2: Setze E := ∅; 3: {Schritt 1: Konstruktion des Graphen} 4: for i = 1 to N do 5: for all j ∈ {l|x l ist Nachbar von x i } do 6: if (v i , v j ) ∉ E then 7: füge die Kante (v i , v j ) zur Kantenmenge E hinzu; 8: end if 9: end for 10: end for 11: {Schritt 2: Bestimmung der kürzesten Wege in G} 12: for i = 1 to N do 13: berechne in G die kürzsten Wege von v i zu allen anderen Knoten v j , j = 1, . . . , N, und speichere die Längen in der i-ten Zeile der Matrix ∆ G ∈ R N×N ; 14: end for 15: {Schritt 3: Berechnung der Einbettung} 16: berechne für ∆ G eine d-dimensionale Einbettung Y ∈ R N×d mit dem klassischen MDS; Die Matrix D, die als Input für Isomap dient, muss dabei nicht die paarweisen euklidischen Abstände zwischen allen Eingangsdaten enthalten. Stattdessen bestimmt man zu jedem Punkt x i die nächsten Nachbarn und trägt in D in der i-ten Zeile nur die Distanzen von x i zu dessen nächsten Nachbarn ein. Man kann D deshalb in einer dünnbesetzten (sparse) Matrix speichern, was bei großen Datensätzen zu einer erheblichen Einsparung bezüglich des benötigten Speichers führt. Abb. 5.1(b) zeigt den zu 5.1(a) gehörenden Graph, der sich für einen Datensatz aus 1000 zufälligen Samples der Swiss Roll und k = 7 nächste Nachbarn ergibt, zusammen mit dem kürzesten Weg zwischen den beiden eingekreisten Punkten als Approximation an den geodätischen Abstand. Die zugehörige, von Isomap berechnete 2-dimensionale Einbettung zeigt Abb. 5.1(c). Der Einbettung wurde zusätzlich noch der Distanzgraph zusammen mit dem kürzesten Weg (roter Polygonzug) überlagert. Der euklidische Abstand im Einbettungsraum (Länge der blauen Gerade) dient nun als Approximation an den tatsächlichen geodätischen Abstand.
Seite 1 und 2: Nichtlineare Dimensionsreduktionsme
Seite 3 und 4: INHALTSVERZEICHNIS 3 4 Multidimensi
Seite 5 und 6: Einleitung In Technik und Wissensch
Seite 7 und 8: Kapitel 1 Einführung und Überblic
Seite 9 und 10: 1.2 Warum oder wann ist Dimensionsr
Seite 11 und 12: 1.2 Warum oder wann ist Dimensionsr
Seite 13 und 14: 13 der Kovarianzmatrix der Daten hi
Seite 15 und 16: 2.1 PCA mit Korrelationsmatrizen 15
Seite 17 und 18: 2.2 Die Berechnung der PCA 17 Zusam
Seite 19 und 20: 3.1 PCA im Merkmalsraum 19 3.1 PCA
Seite 21 und 22: 3.2 Die Berechnung von Skalarproduk
Seite 23 und 24: 3.2 Die Berechnung von Skalarproduk
Seite 25 und 26: 3.4 Aufwand zur Berechnung der Kern
Seite 27 und 28: Kapitel 4 Multidimensional Scaling
Seite 29 und 30: 4.1 Metrisches MDS 29 4.1.1 Klassis
Seite 31 und 32: 4.1 Metrisches MDS 31 die auch als
Seite 33 und 34: 4.1 Metrisches MDS 33 u i := ηX T
Seite 35 und 36: 4.1 Metrisches MDS 35 In [21] wird
Seite 37 und 38: 4.2 Nichtmetrisches MDS 37 In solch
Seite 39 und 40: 39 y 2 x 3 x 3 x 2 x 2 x 1 x 1 y 1
Seite 41: 5.2 Eine neuere Variante von Isomap
Seite 45 und 46: 5.2 Eine neuere Variante von Isomap
Seite 47 und 48: Kapitel 6 Locally Linear Embedding
Seite 49 und 50: 6.1 Die Berechnung der Gewichtsmatr
Seite 51 und 52: 6.1 Die Berechnung der Gewichtsmatr
Seite 53 und 54: 6.2 Die Berechnung der Einbettungsk
Seite 55 und 56: 6.2 Die Berechnung der Einbettungsk
Seite 57 und 58: 6.3 Weiteres zum LLE-Algorithmus 57
Seite 59 und 60: 6.3 Weiteres zum LLE-Algorithmus 59
Seite 61 und 62: 7.1 Der Swiss Roll Datensatz 61 tio
Seite 63 und 64: 7.1 Der Swiss Roll Datensatz 63 15
Seite 65 und 66: 7.1 Der Swiss Roll Datensatz 65 Nic
Seite 67 und 68: 7.1 Der Swiss Roll Datensatz 67 ver
Seite 69 und 70: 7.1 Der Swiss Roll Datensatz 69 90
Seite 71 und 72: 7.1 Der Swiss Roll Datensatz 71 0.0
Seite 73 und 74: 7.2 Bildanordnung I: Webcam-Bilder
Seite 79 und 80: 7.3 Bildanordnung II: Kavitationsbl
Seite 87 und 88: 7.4 Einbettung von Sprachsignalen 8
Seite 93 und 94:
Kapitel 8 Zusammenfassung und Ausbl
Seite 95 und 96:
95 fizienten charakterisieren, die
Seite 97 und 98:
A.1 Stochastische Grundlagen 97 A d
Seite 99 und 100:
A.2 Etwas Graphentheorie 99 Norden
Seite 101 und 102:
A.2 Etwas Graphentheorie 101 jeweil
Seite 103 und 104:
A.2 Etwas Graphentheorie 103 als Ve
Seite 105 und 106:
A.2 Etwas Graphentheorie 105 Analog
Seite 107 und 108:
LITERATURVERZEICHNIS 107 [10] Gerd
Seite 109:
Danksagung Zum Abschluss der Arbeit
Alle anzeigen

Nichtlineare Dimensionsreduktionsmethoden in der ... - DPI

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?