Nichtlineare Dimensionsreduktionsmethoden in der ... - DPI

Weitere Magazine

Empfehlungen

Info

Kapitel 3 Kern-PCA Die Kern-PCA ist eine nichtlineare Verallgemeinerung der linearen PCA. Die dahinter stehende Idee ist bestechend einfach: Man transformiert die Eingangsdaten durch eine nichtlineare Abbildung Φ in einen möglicherweise sehr hochdimensionalen Merkmalsraum F und führt dort eine lineare PCA durch. Die Hoffnung besteht hier darin, dass die Eingangsdaten bei geeigneter Wahl der Abbildung im hochdimensionalen Merkmalsraum entfaltet“ oder ” ausgebreitet“ werden und auf einer linearen Untermannigfaltigkeit sehr viel ” niedrigerer Dimension liegen. Die orthogonalen Richtungen größter Varianz, die durch Anwendung der PCA in F gefunden werden, entsprechen dabei nichtlinearen Richtungen im Eingaberaum 1 . Die eigentliche Nichtlinearität bei der Kern-PCA steckt also nur in der Abbildung in den Merkmalsraum. Was so bestechend einfach klingt, wirft in der Praxis jedoch ein Problem auf: die Dimension von F , die je nach Φ sehr groß, durchaus sogar unendlich groß sein kann. In der Bilderkennung hat es sich z.B. als nützlich erwiesen, Produkte oder Monome d-ter Ordnung von Pixeln eines Bildes zu betrachten, d.h. das Produkt von jeweils d Bildpunkten. Für ein Bild, das aus N Pixeln besteht, gibt es (N + d − 1)! N F = (3.1) d!(N − 1)! verschiedene solcher Monome d-ter Ordnung [27]. Die Abbildung Φ : R N → F des Bildes in den Raum aller möglichen Monome 5-ter Ordnung hat also selbst für Mini-Bilder von 16 × 16 Pixeln eine Dimension von 10 10 , was es unmöglich macht, diese Abbildung explizit zu berechnen. Die Frage ist nun, wie man trotzdem mit vertretbarem Aufwand die Kern-PCA berechnen kann. 1 Sofern die verwendete Abbildung nichtlinear ist.
3.1 PCA im Merkmalsraum 19 3.1 PCA im Merkmalsraum Zunächst soll gezeigt werden, dass man zur Berechnung der PCA im Merkmalsraum die Bilder Φ(x) der Eingangsdaten x gar nicht explizit benötigt, sondern nur Skalarprodukte zwischen diesen Bildern. Dies wird sich später als äußerst nützlich erweisen. Gegeben seien also zentrierte Eingangsdaten x i ∈ R n , i = 1, . . . , N, ∑ N i=1 x i = 0, und die Abbildung Φ : R n → F, x ↦→ x ′ (3.2) der Eingangsdaten in den Merkmalsraum 2 . Zur Vereinfachung der Notation wird angenommen, dass auch die Φ-Bilder zentriert sind: ∑ N i=1 Φ(x i) = 0 3 . Dann ist die Kovarianzmatrix C ′ der Bilder der Eingangsdaten gegeben durch C ′ = 1 N N∑ Φ(x i )Φ(x i ) T . (3.3) Analog zu (2.3) muss man wieder das Eigenwertproblem i=1 C ′ v ′ = λv ′ (3.4) lösen, also Eigenwerte λ ≥ 0 von C ′ und ein zugehöriges Orthonormalsystem aus Eigenvektoren v ′ ∈ F \ {0} finden, die C ′ diagonalisieren. Wegen C ′ v ′ = 1 N N∑ (Φ(x i ) · v ′ ) Φ(x } {{ } i ) (3.5) ∈R i=1 liegen alle Lösungen v ′ mit λ ≠ 0 in span{Φ(x 1 ), . . . , Φ(x N )}. In diesem Fall ist (3.4) äquivalent zu dem Gleichungssystem (Φ(x k ) · C ′ v ′ ) = λ (Φ(x k ) · v ′ ) ∀k = 1, . . . , N . (3.6) Außerdem existieren Koeffizienten α 1 , . . . , α N , mit denen sich die Eigenvektoren als Linearkombinationen der Φ-Bilder darstellen lassen: v ′ = N∑ α i Φ(x i ) . (3.7) i=1 2 Vektoren aus dem Merkmalsraum F werden im Folgenden mit gestrichenen Buchstaben bezeichnet. Für das Skalarprodukt zweier Vektoren x ′ , y ′ ∈ F wird wegen der möglicherweise unendlich großen Dimension von F die Notation (x ′ · y ′ ) benutzt. 3 Der allgemeine Fall wird in Abschnitt 3.2 behandelt.
Seite 1 und 2: Nichtlineare Dimensionsreduktionsme
Seite 3 und 4: INHALTSVERZEICHNIS 3 4 Multidimensi
Seite 5 und 6: Einleitung In Technik und Wissensch
Seite 7 und 8: Kapitel 1 Einführung und Überblic
Seite 9 und 10: 1.2 Warum oder wann ist Dimensionsr
Seite 11 und 12: 1.2 Warum oder wann ist Dimensionsr
Seite 13 und 14: 13 der Kovarianzmatrix der Daten hi
Seite 15 und 16: 2.1 PCA mit Korrelationsmatrizen 15
Seite 17: 2.2 Die Berechnung der PCA 17 Zusam
Seite 21 und 22: 3.2 Die Berechnung von Skalarproduk
Seite 23 und 24: 3.2 Die Berechnung von Skalarproduk
Seite 25 und 26: 3.4 Aufwand zur Berechnung der Kern
Seite 27 und 28: Kapitel 4 Multidimensional Scaling
Seite 29 und 30: 4.1 Metrisches MDS 29 4.1.1 Klassis
Seite 31 und 32: 4.1 Metrisches MDS 31 die auch als
Seite 33 und 34: 4.1 Metrisches MDS 33 u i := ηX T
Seite 35 und 36: 4.1 Metrisches MDS 35 In [21] wird
Seite 37 und 38: 4.2 Nichtmetrisches MDS 37 In solch
Seite 39 und 40: 39 y 2 x 3 x 3 x 2 x 2 x 1 x 1 y 1
Seite 41 und 42: 5.2 Eine neuere Variante von Isomap
Seite 47 und 48: Kapitel 6 Locally Linear Embedding
Seite 49 und 50: 6.1 Die Berechnung der Gewichtsmatr
Seite 51 und 52: 6.1 Die Berechnung der Gewichtsmatr
Seite 53 und 54: 6.2 Die Berechnung der Einbettungsk
Seite 55 und 56: 6.2 Die Berechnung der Einbettungsk
Seite 57 und 58: 6.3 Weiteres zum LLE-Algorithmus 57
Seite 59 und 60: 6.3 Weiteres zum LLE-Algorithmus 59
Seite 61 und 62: 7.1 Der Swiss Roll Datensatz 61 tio
Seite 63 und 64: 7.1 Der Swiss Roll Datensatz 63 15
Seite 65 und 66: 7.1 Der Swiss Roll Datensatz 65 Nic
Seite 67 und 68: 7.1 Der Swiss Roll Datensatz 67 ver
Seite 69 und 70:
7.1 Der Swiss Roll Datensatz 69 90
Seite 71 und 72:
7.1 Der Swiss Roll Datensatz 71 0.0
Seite 73 und 74:
7.2 Bildanordnung I: Webcam-Bilder
Seite 75 und 76:
Seite 77 und 78:
Seite 79 und 80:
7.3 Bildanordnung II: Kavitationsbl
Seite 81 und 82:
Seite 83 und 84:
Seite 85 und 86:
Seite 87 und 88:
7.4 Einbettung von Sprachsignalen 8
Seite 89 und 90:
Seite 91 und 92:
Seite 93 und 94:
Kapitel 8 Zusammenfassung und Ausbl
Seite 95 und 96:
95 fizienten charakterisieren, die
Seite 97 und 98:
A.1 Stochastische Grundlagen 97 A d
Seite 99 und 100:
A.2 Etwas Graphentheorie 99 Norden
Seite 101 und 102:
A.2 Etwas Graphentheorie 101 jeweil
Seite 103 und 104:
A.2 Etwas Graphentheorie 103 als Ve
Seite 105 und 106:
A.2 Etwas Graphentheorie 105 Analog
Seite 107 und 108:
LITERATURVERZEICHNIS 107 [10] Gerd
Seite 109:
Danksagung Zum Abschluss der Arbeit
Alle anzeigen

Nichtlineare Dimensionsreduktionsmethoden in der ... - DPI

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?