25.12.2013 Aufrufe

PDF-Download - Deutsche Geodätische Kommission

PDF-Download - Deutsche Geodätische Kommission

PDF-Download - Deutsche Geodätische Kommission

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

7.8. VERALLGEMEINERUNG AUF QUALITATIVE DATEN 83<br />

(a) Delaunay-Triangulation<br />

der Flächenzentroide<br />

(b) Delaunay-Triangulation<br />

einer Punktmenge abgeleitet<br />

aus a)<br />

(c) Constrained-Delaunay-<br />

Triangulation<br />

der<br />

Flächenpolygone<br />

Abbildung 7.6: Delaunay-Triangulation polygonförmiger Objekte<br />

7.8 Verallgemeinerung auf qualitative Daten<br />

Mit rein qualitativen Daten kann man, wie in Kapitel 5 beschrieben, nicht rechnen“, d.h. man kann nicht aus<br />

”<br />

gegebenen Werten einen neuen Wert ableiten. Angenommen, wir haben die fünf Objekte A, B, C, D und E und<br />

die dazu gehörige 5 × 5-Distanzmatrix (Tabelle 7.1) gegeben, dann können wir sofort den NNG (6.2.5) und den<br />

MST (6.2.7) bestimmen und auf diesen Graphen unser Clusterverfahren anwenden. Mit Hilfe der Gleichungen<br />

6.5 und 6.7 kann man auch den RNG und den GG bestimmen, da beide Gleichungen eine nicht geometrische<br />

Interpretation erlauben, die allein auf den Werten der Distanzmatrix aufbaut. Abbildung 7.7 zeigt die aus<br />

Tabelle 7.1 abgeleiteten Nachbarschaftsgraphen.<br />

Wie jedoch bestimmt man für diese fünf Objekte das für die Delaunay-Triangulation benötigte Umkreiskriterium?<br />

Im Falle eines zweidimensionalen Vektorraums ist z.B. für drei Punkte a, b und c die Gleichung 7.10 zu<br />

prüfen, um festzustellen, ob ein Punkt d innerhalb oder außerhalb des Umkreises von a, b und c liegt (analog zu<br />

Gleichung 7.10 lässt sich für jede Dimension n eine entsprechende (n + 1)-dimensionale Determinante angeben).<br />

Eine solche Determinante existiert jedoch nicht in unserem qualitativen Fall. Selbst wenn wir die Dimension<br />

des Problems kennen würden, so könnten wir trotzdem nicht eine dementsprechende n-dimensionale Sphäre<br />

bestimmen. Was wäre denn der Mittelpunkt dieser Sphäre bzgl. A, B, C, D und E? Im rein qualitativen Fall<br />

ist es nicht einmal möglich, einen Mittelwert zu bestimmen. Es ist jedoch im Falle ordinaler Daten möglich, den<br />

Median anzugeben. Im Falle von Mengen mit gerader Anzahl von Elementen müsste man sich aber für den oberen<br />

oder unteren Median entscheiden, da der Pseudomedian wie der Mittelwert nicht bestimmbar ist. Im qualitativen<br />

Falle sind somit nur solche Cluster-Verfahren anwendbar, die keine Cluster-Repräsentanten (Medoid) benötigen<br />

oder diesen durch Auswahl“ aus den Clusterelementen bestimmen und ihn nicht berechnen“.<br />

” ”<br />

∣<br />

a x a y a 2 x + a 2 y 1<br />

b x b y b 2 x + b2 y 1<br />

c x c y c 2 x + c 2 y 1<br />

d x d y d 2 x + d2 y 1<br />

∣<br />

=<br />

∣<br />

a x − d x a y − d y (a 2 x − d2 x )+(a2 y − d2 y )<br />

b x − d x b y − d y (b 2 x − d2 x )+(b2 y − d2 y )<br />

c x − d x c y − d y (c 2 x − d 2 x)+(c 2 y − d 2 y)<br />

∣<br />

⎧<br />

⎨<br />

⎩<br />

> 0, d innerhalb<br />

=0, d Rand<br />

< 0, d außerhalb<br />

(7.10)<br />

Unser Clusterverfahren kann also auch auf rein qualitative Daten angewendet werden, wenn man auf die<br />

Delaunay-Triangulation verzichtet und für die Berechnung des RNG und GG eine Zeitkomplexität von O(n 3 )<br />

in Kauf nimmt. Da man bei rein qualitativen Daten nur auf der Distanzmatrix (Ähnlichkeitsmatrix) arbeiten<br />

kann, müssen für alle n 2 /2 Distanzwerte, der gegebenen Distanzmatrix, n Vergleiche durchgeführt werden.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!