Nichtlineare Dimensionsreduktionsmethoden in der ... - DPI
Nichtlineare Dimensionsreduktionsmethoden in der ... - DPI
Nichtlineare Dimensionsreduktionsmethoden in der ... - DPI
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
28 Multidimensional Scal<strong>in</strong>g<br />
Man wählt die Dimension des E<strong>in</strong>bettungsraumes so niedrig wie möglich,<br />
<strong>in</strong>sbeson<strong>der</strong>e möglichst nicht größer als Drei, hofft darauf, dass sich die wesentlichen<br />
Merkmale <strong>der</strong> Daten <strong>in</strong> e<strong>in</strong>em solchen Raum darstellen lassen und<br />
nutzt dann die Fähigkeit des Menschen aus, <strong>in</strong> solchen niedrigdimensionalen<br />
Räumen sehr schnell Strukturen wie Ähnlichkeiten o<strong>der</strong> Clusterungen<br />
erfassen zu können. Auf diese Weise gew<strong>in</strong>nt man sehr viel schneller e<strong>in</strong>en<br />
Überblick über den Datensatz als aus e<strong>in</strong>er großen Zahl paarweiser Beziehungen<br />
zwischen diesen Daten.<br />
Der E<strong>in</strong>fachheit halber wird im Folgenden immer angenommen, dass die Relationen<br />
Unähnlichkeiten entsprechen. Es seien N Objekte gegeben, und die<br />
Unähnlichkeit zwischen dem i-ten und j-ten Objekt sei mit p ij bezeichnet. Die<br />
p ij werden zu e<strong>in</strong>er Unähnlichkeitsmatrix P = (p ij ), i, j = 1, . . . , N, zusammengefasst.<br />
Es sollen N Punkte y 1 , . . . , y N aus dem p-dimensionalen Raum<br />
R p gefunden werden, die die Relationen p ij möglichst gut repräsentieren. Die<br />
Art und Weise, wie die p ij <strong>in</strong> Beziehung zu den euklidischen Abständen <strong>der</strong><br />
y i gesetzt werden, wird durch die Modellfunktion f bestimmt:<br />
f : p ij → d ij (Y) , i, j = 1, . . . , N , (4.1)<br />
wobei die Punkte y i als Zeilen <strong>in</strong> <strong>der</strong> N × p-Matrix Y zusammengefasst s<strong>in</strong>d<br />
und d ij (Y) den euklidischen Abstand ‖y i −y j ‖ zwischen y i und y j bezeichnet.<br />
Die transformierten Unähnlichkeiten werden kurz mit δ ij bezeichnet: δ ij =<br />
f(p ij ). Sie lassen sich zu e<strong>in</strong>er N × N-Matrix ∆ = (δ ij ) zusammenfassen. In<br />
<strong>der</strong> englischen Literatur heißen die δ ij dissimilarities.<br />
Die verschiedenen Varianten von MDS lassen sich je nach verwendeter Modellfunktion<br />
f grob e<strong>in</strong>teilen <strong>in</strong> metric MDS und nonmetric o<strong>der</strong> ord<strong>in</strong>al<br />
MDS. Auf diese Varianten soll im Folgenden näher e<strong>in</strong>gegangen werden.<br />
4.1 Metrisches MDS<br />
Metrisches MDS kommt zum E<strong>in</strong>satz, wenn den Objekten bereits e<strong>in</strong>e räumliche<br />
Struktur unterliegt, die Unähnlichkeiten also Distanzen darstellen bzw.<br />
<strong>in</strong> wohldef<strong>in</strong>ierten Beziehungen zu Distanzen stehen, jedoch fehlerbehaftet<br />
o<strong>der</strong> unvollständig s<strong>in</strong>d. Das Ziel ist es dann, e<strong>in</strong>e E<strong>in</strong>bettung zu f<strong>in</strong>den, die<br />
diese Distanzen <strong>in</strong> e<strong>in</strong>em gewissen S<strong>in</strong>n bestmöglich erhält.