23.11.2014 Aufrufe

Nichtlineare Dimensionsreduktionsmethoden in der ... - DPI

Nichtlineare Dimensionsreduktionsmethoden in der ... - DPI

Nichtlineare Dimensionsreduktionsmethoden in der ... - DPI

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

28 Multidimensional Scal<strong>in</strong>g<br />

Man wählt die Dimension des E<strong>in</strong>bettungsraumes so niedrig wie möglich,<br />

<strong>in</strong>sbeson<strong>der</strong>e möglichst nicht größer als Drei, hofft darauf, dass sich die wesentlichen<br />

Merkmale <strong>der</strong> Daten <strong>in</strong> e<strong>in</strong>em solchen Raum darstellen lassen und<br />

nutzt dann die Fähigkeit des Menschen aus, <strong>in</strong> solchen niedrigdimensionalen<br />

Räumen sehr schnell Strukturen wie Ähnlichkeiten o<strong>der</strong> Clusterungen<br />

erfassen zu können. Auf diese Weise gew<strong>in</strong>nt man sehr viel schneller e<strong>in</strong>en<br />

Überblick über den Datensatz als aus e<strong>in</strong>er großen Zahl paarweiser Beziehungen<br />

zwischen diesen Daten.<br />

Der E<strong>in</strong>fachheit halber wird im Folgenden immer angenommen, dass die Relationen<br />

Unähnlichkeiten entsprechen. Es seien N Objekte gegeben, und die<br />

Unähnlichkeit zwischen dem i-ten und j-ten Objekt sei mit p ij bezeichnet. Die<br />

p ij werden zu e<strong>in</strong>er Unähnlichkeitsmatrix P = (p ij ), i, j = 1, . . . , N, zusammengefasst.<br />

Es sollen N Punkte y 1 , . . . , y N aus dem p-dimensionalen Raum<br />

R p gefunden werden, die die Relationen p ij möglichst gut repräsentieren. Die<br />

Art und Weise, wie die p ij <strong>in</strong> Beziehung zu den euklidischen Abständen <strong>der</strong><br />

y i gesetzt werden, wird durch die Modellfunktion f bestimmt:<br />

f : p ij → d ij (Y) , i, j = 1, . . . , N , (4.1)<br />

wobei die Punkte y i als Zeilen <strong>in</strong> <strong>der</strong> N × p-Matrix Y zusammengefasst s<strong>in</strong>d<br />

und d ij (Y) den euklidischen Abstand ‖y i −y j ‖ zwischen y i und y j bezeichnet.<br />

Die transformierten Unähnlichkeiten werden kurz mit δ ij bezeichnet: δ ij =<br />

f(p ij ). Sie lassen sich zu e<strong>in</strong>er N × N-Matrix ∆ = (δ ij ) zusammenfassen. In<br />

<strong>der</strong> englischen Literatur heißen die δ ij dissimilarities.<br />

Die verschiedenen Varianten von MDS lassen sich je nach verwendeter Modellfunktion<br />

f grob e<strong>in</strong>teilen <strong>in</strong> metric MDS und nonmetric o<strong>der</strong> ord<strong>in</strong>al<br />

MDS. Auf diese Varianten soll im Folgenden näher e<strong>in</strong>gegangen werden.<br />

4.1 Metrisches MDS<br />

Metrisches MDS kommt zum E<strong>in</strong>satz, wenn den Objekten bereits e<strong>in</strong>e räumliche<br />

Struktur unterliegt, die Unähnlichkeiten also Distanzen darstellen bzw.<br />

<strong>in</strong> wohldef<strong>in</strong>ierten Beziehungen zu Distanzen stehen, jedoch fehlerbehaftet<br />

o<strong>der</strong> unvollständig s<strong>in</strong>d. Das Ziel ist es dann, e<strong>in</strong>e E<strong>in</strong>bettung zu f<strong>in</strong>den, die<br />

diese Distanzen <strong>in</strong> e<strong>in</strong>em gewissen S<strong>in</strong>n bestmöglich erhält.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!