Nichtlineare Dimensionsreduktionsmethoden in der ... - DPI

Weitere Magazine

Empfehlungen

Info

8 Einführung und Überblick gangsdaten x gebildeten Vorhersagen möglichst gut den richtigen Werten y entsprechen. Die Hoffnung ist dann, dass der Algorithmus auch für andere als die Trainingsdaten richtige Ergebnisse liefert. Beim unsupervised learning hat man keine Trainingsdaten zur Verfügung, anhand derer man die Lernalgorithmen trainieren kann. Es stehen einzig und allein die Eingangsdaten selbst zur Verfügung, aus denen wichtige Merkmale extrahiert werden sollen. Wie diese Merkmale aussehen oder was sie beschreiben, ist je nach Datensatz a priori völlig unbekannt. Das Ziel dabei ist, dass z.B. Maschinen mit sehr vielen Sensoren für unterschiedliche Messgrößen die riesigen Mengen an anfallenden Sensor-Rohdaten verarbeiten können und kompakte Repräsentationen dafür finden, ähnlich wie dies auch (meist unbewusst) der Mensch tut. Die Dimensionsreduktion ist eine Form des unsupervised learning, die automatisch niedrigdimensionale Repräsentationen für hochdimensionale Daten finden soll. Dabei soll eine möglichst starke Reduzierung der Dimension unter gleichzeitiger Erhaltung der wesentlichen Merkmale oder Strukturen erreicht werden, wobei diese Merkmale allein aus den Daten selbst extrahiert werden müssen, also ohne irgendwelche äußeren Informationen oder sonstigen Hilfen. Die Dimensionsreduktion findet also eine Abbildung f vom Raum der Eingangsdaten R D (Eingaberaum oder Input Space) in einen niedrigdimensionalen Merkmalsraum R d (Feature Space), wobei d < D und oft d ≪ D. Jeder Punkt x i ∈ R D aus dem Eingaberaum wird dabei auf einen Punkt y i ∈ R d aus dem Merkmalsraum abgebildet: y i = f(x i ). Die meisten Algorithmen führen diese Abbildung nur implizit aus, d.h. sie berechnen die Bilder der Eingangsdaten, ohne f irgendwie explizit zu bestimmen oder gar zurückzuliefern. Man spricht in diesem Zusammenhang auch von einer Einbettung der Eingangsdaten in den Merkmalsraum. Der Merkmalsraum wird dann oft auch Einbettungsraum genannt. Anwendungen der Dimensionsreduktion sind z.B. die Visualisierung hochdimensionaler Daten, bei der man eine niedrigdimensionale Einbettung der Daten berechnet und diese graphisch darstellt in der Hoffnung, dass in diesem Graphen die wesentliche Struktur der Daten enthalten ist. Weiterhin eignen sich diese Methoden sehr gut als Vorverarbeitung für Algorithmen zur Klassifikation, indem die Daten sinnvoll nach Merkmalen sortiert im Einbettungsraum angeordnet werden, was die Komplexität des Klassifizierungsalgorithmus’ wesentlich reduzieren kann [27]. Andere Anwendungen sind die Kompression von Daten durch Beseitigung von Redundanzen und die Interpolation, Erzeugung und Entrauschung von Daten [24]. Neben den hier vorgestellten Algorithmen existieren noch einige weitere wie z.B. die Self
1.2 Warum oder wann ist Dimensionsreduktion möglich? 9 Organizing Maps (SOM, [17]) oder auf Neuronalen Netzen basierende Algorithmen. Einen Überblick über verschiedene, zum Teil hier nicht behandelte Algorithmen zur Dimensionsreduktion findet man in [6]. 1.2 Warum oder wann ist Dimensionsreduktion möglich? Um diese Frage zu beantworten, ist es günstig, das folgende Beispiel zu betrachten. Abb. 1.1 zeigt eine Ansammlung von Graustufenbildern, die mit dem Computer generiert wurden und einen menschlichen Kopf zeigen, der in verschiedenen Winkeln gedreht und geneigt ist und außerdem aus unterschiedlichen Richtungen beleuchtet wird. 1 Gezeigt ist hier nur ein kleiner Abbildung 1.1: Computergenerierte Graustufenbilder eines in verschiedenen Winkeln gedrehten und geneigten Kopfes, der aus unterschiedlichen Richtungen beleuchtet wird. Ausschnitt; der komplette Datensatz enthält 698 solcher Bilder. Jedes Bild hat eine Größe von 64 × 64 Pixeln. Wie lässt sich ein solches Bild eindeutig beschreiben? Nun, man kann ein Bild auf jeden Fall eindeutig als Punkt in einem 64 2 = 4096-dimensionalen Raum darstellen, indem man jedem Pixel eine Richtung im Raum zuordnet, wobei sich der entsprechende Vektor z.B. durch Aneinanderhängen der Zeilen ergibt. 2 Allerdings unterscheiden sich doch die Bilder nur in den drei oben angesprochenen Parametern: den Drehbzw. Neigungswinkeln und den Richtungen, aus denen der Kopf beleuchtet wird. Es muss also möglich sein, die Vektoren im 4096-dimensionalen Raum 1 Diese Bilder stammen aus [15]. 2 Dabei sei außer Acht gelassen, dass die Bilder nur diskrete Punkte in diesem Raum beschreiben können, da jedes Pixel nur einen aus 256 Werten (Graustufen) annehmen kann.
Seite 1 und 2: Nichtlineare Dimensionsreduktionsme
Seite 3 und 4: INHALTSVERZEICHNIS 3 4 Multidimensi
Seite 5 und 6: Einleitung In Technik und Wissensch
Seite 7: Kapitel 1 Einführung und Überblic
Seite 11 und 12: 1.2 Warum oder wann ist Dimensionsr
Seite 13 und 14: 13 der Kovarianzmatrix der Daten hi
Seite 15 und 16: 2.1 PCA mit Korrelationsmatrizen 15
Seite 17 und 18: 2.2 Die Berechnung der PCA 17 Zusam
Seite 19 und 20: 3.1 PCA im Merkmalsraum 19 3.1 PCA
Seite 21 und 22: 3.2 Die Berechnung von Skalarproduk
Seite 23 und 24: 3.2 Die Berechnung von Skalarproduk
Seite 25 und 26: 3.4 Aufwand zur Berechnung der Kern
Seite 27 und 28: Kapitel 4 Multidimensional Scaling
Seite 29 und 30: 4.1 Metrisches MDS 29 4.1.1 Klassis
Seite 31 und 32: 4.1 Metrisches MDS 31 die auch als
Seite 33 und 34: 4.1 Metrisches MDS 33 u i := ηX T
Seite 35 und 36: 4.1 Metrisches MDS 35 In [21] wird
Seite 37 und 38: 4.2 Nichtmetrisches MDS 37 In solch
Seite 39 und 40: 39 y 2 x 3 x 3 x 2 x 2 x 1 x 1 y 1
Seite 41 und 42: 5.2 Eine neuere Variante von Isomap
Seite 47 und 48: Kapitel 6 Locally Linear Embedding
Seite 49 und 50: 6.1 Die Berechnung der Gewichtsmatr
Seite 51 und 52: 6.1 Die Berechnung der Gewichtsmatr
Seite 53 und 54: 6.2 Die Berechnung der Einbettungsk
Seite 55 und 56: 6.2 Die Berechnung der Einbettungsk
Seite 57 und 58: 6.3 Weiteres zum LLE-Algorithmus 57
Seite 59 und 60:
6.3 Weiteres zum LLE-Algorithmus 59
Seite 61 und 62:
7.1 Der Swiss Roll Datensatz 61 tio
Seite 63 und 64:
7.1 Der Swiss Roll Datensatz 63 15
Seite 65 und 66:
7.1 Der Swiss Roll Datensatz 65 Nic
Seite 67 und 68:
7.1 Der Swiss Roll Datensatz 67 ver
Seite 69 und 70:
7.1 Der Swiss Roll Datensatz 69 90
Seite 71 und 72:
7.1 Der Swiss Roll Datensatz 71 0.0
Seite 73 und 74:
7.2 Bildanordnung I: Webcam-Bilder
Seite 75 und 76:
Seite 77 und 78:
Seite 79 und 80:
7.3 Bildanordnung II: Kavitationsbl
Seite 81 und 82:
Seite 83 und 84:
Seite 85 und 86:
Seite 87 und 88:
7.4 Einbettung von Sprachsignalen 8
Seite 89 und 90:
Seite 91 und 92:
Seite 93 und 94:
Kapitel 8 Zusammenfassung und Ausbl
Seite 95 und 96:
95 fizienten charakterisieren, die
Seite 97 und 98:
A.1 Stochastische Grundlagen 97 A d
Seite 99 und 100:
A.2 Etwas Graphentheorie 99 Norden
Seite 101 und 102:
A.2 Etwas Graphentheorie 101 jeweil
Seite 103 und 104:
A.2 Etwas Graphentheorie 103 als Ve
Seite 105 und 106:
A.2 Etwas Graphentheorie 105 Analog
Seite 107 und 108:
LITERATURVERZEICHNIS 107 [10] Gerd
Seite 109:
Danksagung Zum Abschluss der Arbeit
Alle anzeigen

Nichtlineare Dimensionsreduktionsmethoden in der ... - DPI

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?