Nichtlineare Dimensionsreduktionsmethoden in der ... - DPI

Weitere Magazine

Empfehlungen

Info

Kapitel 2 Principal Component Analysis Die Principal Component Analysis (PCA, Hauptkomponentenanalyse) stellt ein Verfahren zur linearen Dimensionsreduktion dar, das zuerst 1901 von Pearson [23] beschrieben und unabhängig davon 1931 von Hotelling [14] entwickelt wurde. Pearsons Herleitung der PCA löst das geometrische Problem, eine Menge von Punkten x 1 , . . . , x N ∈ R n aus einem n-dimensionalen Raum bestmöglich linear auf einen Unterraum niedrigerer Dimension q < n abzubilden. ” Bestmöglich“ ist dabei im quadratischen Sinne zu verstehen, d.h. die Summe der quadrierten Abstände zwischen den Punkten und ihren jeweiligen Projektionen auf den Unterraum soll minimal werden. Hotelling hingegen suchte in einer Menge von Punkten aus einem hochdimensionalen Raum nach zueinander orthogonalen Richtungen, in denen die Varianz der Daten möglichst groß ist. Man kann zeigen, dass beide Probleme äquivalent sind. Es seien N mittelwertfreie Daten x 1 , . . . , x N ∈ R n der Dimension n gegeben. 1 Diese Vektoren können als Messwerte oder Samples einer Zufallsvariablen x aufgefasst werden. Aus den Samples ergibt sich die geschätzte Kovarianzmatrix C von x zu C = 1 N∑ x i x T i = 1 N N XT X , (2.1) i=1 wobei die Matrix X = (x 1 , . . . , x N ) T ∈ R N×n die Vektoren als Zeilen enthält. Die Lösung der obigen Probleme läuft auf eine Hauptachsentransformation 1 Ist der Mittelwert ¯x = 1/N ∑ N i=1 x i der Daten von Null verschieden, so ersetze man im Folgenden immer x i durch die mittelwertfreie Größe ˜x i = x i − ¯x, i = 1, . . . , N.
13 der Kovarianzmatrix der Daten hinaus. Da C symmetrisch ist, sind alle ihre Eigenwerte reell, und eine solche Hauptachsentransformation ist immer möglich ([10]). Da C außerdem auch noch positiv semidefinit ist, sind alle Eigenwerte zusätzlich nichtnegativ ([34]). Bei der Hauptachsentransformation wird die Kovarianzmatrix durch eine orthogonale Matrix U diagonalisiert: U T C U = D, wobei die Spalten von U aus den Eigenvektoren von C bestehen und D = diag(λ 1 , . . . , λ n ) die Diagonalmatrix mit den Eigenwerten von C ist. Es gilt also C U = U D (2.2) bzw. C u i = λ i u i , i = 1, . . . , n , (2.3) wobei im Folgenden die Eigenwerte o.E.d.A. nach abfallender Größe sortiert seien: λ 1 ≥ . . . ≥ λ n . Es zeigt sich, dass die Richtung größter Varianz gerade durch den Eigenvektor u 1 zum größten Eigenwert λ 1 von C gegeben ist. Entsprechend ist die Richtung größter Varianz im zu u 1 orthogonalen Unterraum gerade durch den Eigenvektor u 2 zum zweitgrößten Eigenwert λ 2 gegeben usw. Die Varianzen in den neuen Richtungen u i stimmen dabei mit den entsprechenden Eigenwerten λ i überein, d.h. die Varianz der auf die Achse u i projizierten Daten ist gerade λ i . Entsprechend heißen die Eigenvektoren u i auch Hauptachsen von C. Hingegen bezeichnet man die Projektion u T k x i des Punktes x i auf die k-te Hauptachse u k als k-te Hauptkomponente (principal component, PC) von x i . Der Punkt x i besitzt im neuen gedrehten Koordinatensystem der u k die Darstellung n∑ x i = (x T i u k )u k . (2.4) k=1 Die eigentliche Dimensionsreduktion besteht nun darin, nur die ersten p ≪ n PCs zur Approximation zu benutzen, d.h. den Punkt x i ∈ R n durch den Punkt y i ∈ R p zu approximieren durch p∑ y i = (x T i u k )u k . (2.5) k=1 Die PCA besitzt folgende Eigenschaften: • Die ersten p Hauptkomponenten (p ∈ {1, . . . , n}) enthalten mehr Varianz der Eingangsdaten x i als irgendwelche p anderen zueinander orthogonalen Richtungen.
Seite 1 und 2: Nichtlineare Dimensionsreduktionsme
Seite 3 und 4: INHALTSVERZEICHNIS 3 4 Multidimensi
Seite 5 und 6: Einleitung In Technik und Wissensch
Seite 7 und 8: Kapitel 1 Einführung und Überblic
Seite 9 und 10: 1.2 Warum oder wann ist Dimensionsr
Seite 11: 1.2 Warum oder wann ist Dimensionsr
Seite 15 und 16: 2.1 PCA mit Korrelationsmatrizen 15
Seite 17 und 18: 2.2 Die Berechnung der PCA 17 Zusam
Seite 19 und 20: 3.1 PCA im Merkmalsraum 19 3.1 PCA
Seite 21 und 22: 3.2 Die Berechnung von Skalarproduk
Seite 23 und 24: 3.2 Die Berechnung von Skalarproduk
Seite 25 und 26: 3.4 Aufwand zur Berechnung der Kern
Seite 27 und 28: Kapitel 4 Multidimensional Scaling
Seite 29 und 30: 4.1 Metrisches MDS 29 4.1.1 Klassis
Seite 31 und 32: 4.1 Metrisches MDS 31 die auch als
Seite 33 und 34: 4.1 Metrisches MDS 33 u i := ηX T
Seite 35 und 36: 4.1 Metrisches MDS 35 In [21] wird
Seite 37 und 38: 4.2 Nichtmetrisches MDS 37 In solch
Seite 39 und 40: 39 y 2 x 3 x 3 x 2 x 2 x 1 x 1 y 1
Seite 41 und 42: 5.2 Eine neuere Variante von Isomap
Seite 47 und 48: Kapitel 6 Locally Linear Embedding
Seite 49 und 50: 6.1 Die Berechnung der Gewichtsmatr
Seite 51 und 52: 6.1 Die Berechnung der Gewichtsmatr
Seite 53 und 54: 6.2 Die Berechnung der Einbettungsk
Seite 55 und 56: 6.2 Die Berechnung der Einbettungsk
Seite 57 und 58: 6.3 Weiteres zum LLE-Algorithmus 57
Seite 59 und 60: 6.3 Weiteres zum LLE-Algorithmus 59
Seite 61 und 62: 7.1 Der Swiss Roll Datensatz 61 tio
Seite 63 und 64:
7.1 Der Swiss Roll Datensatz 63 15
Seite 65 und 66:
7.1 Der Swiss Roll Datensatz 65 Nic
Seite 67 und 68:
7.1 Der Swiss Roll Datensatz 67 ver
Seite 69 und 70:
7.1 Der Swiss Roll Datensatz 69 90
Seite 71 und 72:
7.1 Der Swiss Roll Datensatz 71 0.0
Seite 73 und 74:
7.2 Bildanordnung I: Webcam-Bilder
Seite 75 und 76:
Seite 77 und 78:
Seite 79 und 80:
7.3 Bildanordnung II: Kavitationsbl
Seite 81 und 82:
Seite 83 und 84:
Seite 85 und 86:
Seite 87 und 88:
7.4 Einbettung von Sprachsignalen 8
Seite 89 und 90:
Seite 91 und 92:
Seite 93 und 94:
Kapitel 8 Zusammenfassung und Ausbl
Seite 95 und 96:
95 fizienten charakterisieren, die
Seite 97 und 98:
A.1 Stochastische Grundlagen 97 A d
Seite 99 und 100:
A.2 Etwas Graphentheorie 99 Norden
Seite 101 und 102:
A.2 Etwas Graphentheorie 101 jeweil
Seite 103 und 104:
A.2 Etwas Graphentheorie 103 als Ve
Seite 105 und 106:
A.2 Etwas Graphentheorie 105 Analog
Seite 107 und 108:
LITERATURVERZEICHNIS 107 [10] Gerd
Seite 109:
Danksagung Zum Abschluss der Arbeit
Alle anzeigen

Nichtlineare Dimensionsreduktionsmethoden in der ... - DPI

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?