Nichtlineare Dimensionsreduktionsmethoden in der ... - DPI
Nichtlineare Dimensionsreduktionsmethoden in der ... - DPI
Nichtlineare Dimensionsreduktionsmethoden in der ... - DPI
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
Kapitel 5<br />
Isomap<br />
Isomap [31], [15] ist e<strong>in</strong>e nichtl<strong>in</strong>eare Erweiterung des klassischen MDS (Abschnitt<br />
4.1.1). Das klassische MDS liefert optimale niedrigdimensionale euklidische<br />
E<strong>in</strong>bettungen nur für E<strong>in</strong>gabedaten, die auf e<strong>in</strong>er l<strong>in</strong>earen Untermannigfaltigkeit<br />
des E<strong>in</strong>gaberaumes liegen. Wenn auch die Ergebnisse des klassischen<br />
MDS für schwach gekrümmte nichtl<strong>in</strong>eare Mannigfaltigkeiten noch<br />
zufriedenstellend se<strong>in</strong> mögen, so versagen diese l<strong>in</strong>earen Verfahren jedoch<br />
völlig bei Mannigfaltigkeiten mit starker Krümmung wie z.B. <strong>der</strong> Swiss Roll<br />
(1.1), von <strong>der</strong> <strong>in</strong> Abbildung 5.1(a) e<strong>in</strong> Datensatz aus 1000 zufälligen Samples<br />
gezeigt ist. MDS würde für diesen Datensatz e<strong>in</strong>e E<strong>in</strong>bettung f<strong>in</strong>den, die<br />
die euklidischen Abstände bestmöglich erhält. Diese unterscheiden sich aber<br />
für e<strong>in</strong>e solche stark gekrümmte Mannigfaltigkeit ganz erheblich von den<br />
tatsächlichen geodätischen Abständen, was man deutlich <strong>in</strong> Abb. 5.1(a) sehen<br />
kann. Die Folge ist, dass e<strong>in</strong>e zweidimensionale E<strong>in</strong>bettung mit MDS die<br />
Nachbarschaftsverhältnisse völlig zerstören würde.<br />
Der Isomap-Algorithmus geht hier e<strong>in</strong>en an<strong>der</strong>en Weg: Anstatt e<strong>in</strong>fach die<br />
paarweisen euklidischen Abstände <strong>der</strong> E<strong>in</strong>gangsdaten als Input zu nehmen<br />
und e<strong>in</strong>e diese Abstände bestmöglich erhaltende niedrigdimensionale E<strong>in</strong>bettung<br />
<strong>in</strong> e<strong>in</strong>en l<strong>in</strong>earen Raum zu bestimmen, versucht Isomap zuerst, die den<br />
Daten zugrunde liegende Geometrie zu ”<br />
lernen“. Was ist damit geme<strong>in</strong>t? E<strong>in</strong>e<br />
(niedrigdimensionale) E<strong>in</strong>bettung <strong>in</strong> e<strong>in</strong>en euklidischen Raum erhält dann<br />
die Merkmale o<strong>der</strong> wesentlichen Strukturen <strong>der</strong> Daten, wenn die Nachbarschaften<br />
<strong>der</strong> Daten erhalten bleiben. Das bedeutet, dass Punkte, die im E<strong>in</strong>gaberaum<br />
e<strong>in</strong>en kle<strong>in</strong>en Abstand vone<strong>in</strong>an<strong>der</strong> haben, auch <strong>in</strong> <strong>der</strong> euklidischen<br />
E<strong>in</strong>bettung dicht benachbart se<strong>in</strong> müssen. Entsprechend müssen aber auch<br />
Punkte mit großem Abstand auf weiter entfernte Punkte im E<strong>in</strong>bettungsraum<br />
abgebildet werden. Von ganz entscheiden<strong>der</strong> Bedeutung ist dabei, dass