Nichtlineare Dimensionsreduktionsmethoden in der ... - DPI

Weitere Magazine

Empfehlungen

Info

32 Multidimensional Scaling zugehörigen Eigenwerten λ 1 ≥ . . . ≥ λ N ≥ 0. Sei Λ k ∈ R k×k die Diagonalmatrix, die nur aus den ersten k Spalten von Λ besteht und V k = (v 1 , . . . , v k ) die Matrix mit den zugehörigen Eigenvektoren. Nach [21] wird für beliebiges k ≤ n (4.13) minimal für Y = V k Λ 1 2 k . (4.17) Bis jetzt wurde immer angenommen, dass ∆ eine euklidische Distanzmatrix ist. Sind die Unähnlichkeiten jedoch nicht-euklidische Distanzen, so ist die Matrix B ∆ = − 1 2 J∆(2) J aus (4.7) i.A. nicht mehr positiv semidefinit und besitzt deshalb negative Eigenwerte. Das bedeutet gleichzeitig, dass sich ∆ (2) nicht mehr als XX T mit einer reellen Matrix X ∈ R N×n schreiben lässt. Beim klassischen MDS, bei dem trotzdem eine euklidische Einbettung gesucht wird, werden solche negativen Eigenwerte als Fehler betrachtet und auf Null gesetzt, d.h. die Matrix Λ k in (4.17) wird ersetzt durch ˜Λ k := diag(λ + 1 , . . . , λ + k ) , λ+ i := max(λ i , 0) ∀i . (4.18) In diesem Fall ist die Einbettung Ỹ, die den Strain (4.13) minimiert, gegeben durch 1 2 Ỹ = V k ˜Λ k . (4.19) Äquivalenz von klassischem MDS und PCA In diesem Abschnitt soll gezeigt werden, dass die Lösung (4.17) des klassischen MDS äquivalent ist zur PCA. Die Kovarianzmatrix (2.1) lässt sich für unzentrierte Daten X ∈ R N×n mit Hilfe der Zentrierungsmatrix (4.6) schreiben als C = 1 N (JX)T (JX) = 1 N XT JJX = 1 N XT JX ∈ R n×n . (4.20) Ensprechend ist die Skalarproduktmatrix der zentrierten Konfiguration JX gegeben durch S = (JX)(JX) T = JXX T J ∈ R N×N , (4.21) und die p ≤ min(n, N) echt positiven Eigenwerte λ 1 ≥ . . . ≥ λ p > 0 beider Matrizen stimmen überein. Im Folgenden werden die Hauptkomponenten von X aus der Eigenwertzerlegung der Skalarproduktmatrix S berechnet. Sei v i Eigenvektor von S zum Eigenwert λ i > 0. Dann folgt aus (2.10), dass wegen (X T JJX)(X T Jv i ) = λ i X T Jv i (4.22)
4.1 Metrisches MDS 33 u i := ηX T Jv i mit η ∈ R \ {0} Eigenvektor von NC zum Eigenwert λ i ist. Mit der Forderung ‖u i ‖ = 1 folgt analog zu (2.13) η = 1/ √ λ i , also u i = 1 √ λi X T Jv i , i = 1, . . . , p . (4.23) Fasst man die größten p Eigenwerte von S zu einer p × p-Matrix Λ p = diag(λ 1 , . . . , λ p ) zusammen und die zugehörigen Eigenvektoren von C bzw. S entsprechend zur N × p-Matrix U p = (u 1 , . . . , u p ) bzw. zur n × p-Matrix V p = (v 1 , . . . , v p ) und setzt Λ −1/2 p := diag(1/ √ λ 1 , . . . , 1/ √ λ p ), so lässt sich U p ausdrücken durch U p = X T JV p Λ − 1 2 p . (4.24) Für die Projektion Y ∈ R N×p der zentrierten Konfiguration JX auf die ersten p Hauptachsen folgt damit Y = JXU p = JXX T JV p Λ − 1 2 p = SV p Λ − 1 2 p = V p Λ p Λ − 1 2 p = V p Λ 1 2 p . (4.25) Dies entspricht aber gerade der Lösung (4.17) des klassischen MDS. Dort wurde zwar die Eigenwertzerlegung nicht von S = JXX T J sondern von XX T berechnet, aber es wurde auch von einer zentrierten Konfiguration X ausgegangen, für die JX = X und damit S = XX T ist. Zusammenfassend gilt also: Wendet man die PCA auf die Eingangsdaten X ∈ R N×n an und bestimmt die Projektion Y ∈ R N×p auf die ersten p Hauptachsen, so erhält man das gleiche Ergebnis wie bei der Berechnung einer p-dimensionalen Einbettung aus der euklidischen Distanzmatrix ∆ der Konfiguration X mittels klassischem MDS. Wie weiter oben bereits angedeutet, findet das klassische MDS die Konfiguration Y so, dass die Skalarprodukte zwischen den Vektoren der Originaldaten bestmöglich (im quadratischen Sinne) durch die Skalarprodukte zwischen den Vektoren der Einbettung Y approximiert werden. Was bedeutet das nun für die paarweisen Abstände der y i im Vergleich zu denen der Eingangskonfiguration X? Wegen der Äquivalenz zur PCA ist Y gegeben durch eine Orthogonalprojektion der zentrierten n-dimensionalen Eingangsdaten X auf den Unterraum R p , der von den ersten p Hauptachsen von X aufgespannt wird. In [19] wird nun gezeigt, dass für p < n unter allen Projektionen der zentrierten Eingangsdaten auf einen p-dimensionalen Unterraum das klassische MDS eine solche Projektion findet, die die Größe Φ = N∑ i=1 N∑ (δij 2 − d 2 ij) (4.26) j=1
Seite 1 und 2: Nichtlineare Dimensionsreduktionsme
Seite 3 und 4: INHALTSVERZEICHNIS 3 4 Multidimensi
Seite 5 und 6: Einleitung In Technik und Wissensch
Seite 7 und 8: Kapitel 1 Einführung und Überblic
Seite 9 und 10: 1.2 Warum oder wann ist Dimensionsr
Seite 11 und 12: 1.2 Warum oder wann ist Dimensionsr
Seite 13 und 14: 13 der Kovarianzmatrix der Daten hi
Seite 15 und 16: 2.1 PCA mit Korrelationsmatrizen 15
Seite 17 und 18: 2.2 Die Berechnung der PCA 17 Zusam
Seite 19 und 20: 3.1 PCA im Merkmalsraum 19 3.1 PCA
Seite 21 und 22: 3.2 Die Berechnung von Skalarproduk
Seite 23 und 24: 3.2 Die Berechnung von Skalarproduk
Seite 25 und 26: 3.4 Aufwand zur Berechnung der Kern
Seite 27 und 28: Kapitel 4 Multidimensional Scaling
Seite 29 und 30: 4.1 Metrisches MDS 29 4.1.1 Klassis
Seite 31: 4.1 Metrisches MDS 31 die auch als
Seite 35 und 36: 4.1 Metrisches MDS 35 In [21] wird
Seite 37 und 38: 4.2 Nichtmetrisches MDS 37 In solch
Seite 39 und 40: 39 y 2 x 3 x 3 x 2 x 2 x 1 x 1 y 1
Seite 41 und 42: 5.2 Eine neuere Variante von Isomap
Seite 47 und 48: Kapitel 6 Locally Linear Embedding
Seite 49 und 50: 6.1 Die Berechnung der Gewichtsmatr
Seite 51 und 52: 6.1 Die Berechnung der Gewichtsmatr
Seite 53 und 54: 6.2 Die Berechnung der Einbettungsk
Seite 55 und 56: 6.2 Die Berechnung der Einbettungsk
Seite 57 und 58: 6.3 Weiteres zum LLE-Algorithmus 57
Seite 59 und 60: 6.3 Weiteres zum LLE-Algorithmus 59
Seite 61 und 62: 7.1 Der Swiss Roll Datensatz 61 tio
Seite 63 und 64: 7.1 Der Swiss Roll Datensatz 63 15
Seite 65 und 66: 7.1 Der Swiss Roll Datensatz 65 Nic
Seite 67 und 68: 7.1 Der Swiss Roll Datensatz 67 ver
Seite 69 und 70: 7.1 Der Swiss Roll Datensatz 69 90
Seite 71 und 72: 7.1 Der Swiss Roll Datensatz 71 0.0
Seite 73 und 74: 7.2 Bildanordnung I: Webcam-Bilder
Seite 79 und 80: 7.3 Bildanordnung II: Kavitationsbl
Seite 81 und 82: 7.3 Bildanordnung II: Kavitationsbl
Seite 83 und 84:
7.3 Bildanordnung II: Kavitationsbl
Seite 85 und 86:
7.3 Bildanordnung II: Kavitationsbl
Seite 87 und 88:
7.4 Einbettung von Sprachsignalen 8
Seite 89 und 90:
Seite 91 und 92:
Seite 93 und 94:
Kapitel 8 Zusammenfassung und Ausbl
Seite 95 und 96:
95 fizienten charakterisieren, die
Seite 97 und 98:
A.1 Stochastische Grundlagen 97 A d
Seite 99 und 100:
A.2 Etwas Graphentheorie 99 Norden
Seite 101 und 102:
A.2 Etwas Graphentheorie 101 jeweil
Seite 103 und 104:
A.2 Etwas Graphentheorie 103 als Ve
Seite 105 und 106:
A.2 Etwas Graphentheorie 105 Analog
Seite 107 und 108:
LITERATURVERZEICHNIS 107 [10] Gerd
Seite 109:
Danksagung Zum Abschluss der Arbeit
Alle anzeigen

Nichtlineare Dimensionsreduktionsmethoden in der ... - DPI

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?