PDF-Download - Deutsche Geodätische Kommission
PDF-Download - Deutsche Geodätische Kommission
PDF-Download - Deutsche Geodätische Kommission
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
7.8. VERALLGEMEINERUNG AUF QUALITATIVE DATEN 83<br />
(a) Delaunay-Triangulation<br />
der Flächenzentroide<br />
(b) Delaunay-Triangulation<br />
einer Punktmenge abgeleitet<br />
aus a)<br />
(c) Constrained-Delaunay-<br />
Triangulation<br />
der<br />
Flächenpolygone<br />
Abbildung 7.6: Delaunay-Triangulation polygonförmiger Objekte<br />
7.8 Verallgemeinerung auf qualitative Daten<br />
Mit rein qualitativen Daten kann man, wie in Kapitel 5 beschrieben, nicht rechnen“, d.h. man kann nicht aus<br />
”<br />
gegebenen Werten einen neuen Wert ableiten. Angenommen, wir haben die fünf Objekte A, B, C, D und E und<br />
die dazu gehörige 5 × 5-Distanzmatrix (Tabelle 7.1) gegeben, dann können wir sofort den NNG (6.2.5) und den<br />
MST (6.2.7) bestimmen und auf diesen Graphen unser Clusterverfahren anwenden. Mit Hilfe der Gleichungen<br />
6.5 und 6.7 kann man auch den RNG und den GG bestimmen, da beide Gleichungen eine nicht geometrische<br />
Interpretation erlauben, die allein auf den Werten der Distanzmatrix aufbaut. Abbildung 7.7 zeigt die aus<br />
Tabelle 7.1 abgeleiteten Nachbarschaftsgraphen.<br />
Wie jedoch bestimmt man für diese fünf Objekte das für die Delaunay-Triangulation benötigte Umkreiskriterium?<br />
Im Falle eines zweidimensionalen Vektorraums ist z.B. für drei Punkte a, b und c die Gleichung 7.10 zu<br />
prüfen, um festzustellen, ob ein Punkt d innerhalb oder außerhalb des Umkreises von a, b und c liegt (analog zu<br />
Gleichung 7.10 lässt sich für jede Dimension n eine entsprechende (n + 1)-dimensionale Determinante angeben).<br />
Eine solche Determinante existiert jedoch nicht in unserem qualitativen Fall. Selbst wenn wir die Dimension<br />
des Problems kennen würden, so könnten wir trotzdem nicht eine dementsprechende n-dimensionale Sphäre<br />
bestimmen. Was wäre denn der Mittelpunkt dieser Sphäre bzgl. A, B, C, D und E? Im rein qualitativen Fall<br />
ist es nicht einmal möglich, einen Mittelwert zu bestimmen. Es ist jedoch im Falle ordinaler Daten möglich, den<br />
Median anzugeben. Im Falle von Mengen mit gerader Anzahl von Elementen müsste man sich aber für den oberen<br />
oder unteren Median entscheiden, da der Pseudomedian wie der Mittelwert nicht bestimmbar ist. Im qualitativen<br />
Falle sind somit nur solche Cluster-Verfahren anwendbar, die keine Cluster-Repräsentanten (Medoid) benötigen<br />
oder diesen durch Auswahl“ aus den Clusterelementen bestimmen und ihn nicht berechnen“.<br />
” ”<br />
∣<br />
a x a y a 2 x + a 2 y 1<br />
b x b y b 2 x + b2 y 1<br />
c x c y c 2 x + c 2 y 1<br />
d x d y d 2 x + d2 y 1<br />
∣<br />
=<br />
∣<br />
a x − d x a y − d y (a 2 x − d2 x )+(a2 y − d2 y )<br />
b x − d x b y − d y (b 2 x − d2 x )+(b2 y − d2 y )<br />
c x − d x c y − d y (c 2 x − d 2 x)+(c 2 y − d 2 y)<br />
∣<br />
⎧<br />
⎨<br />
⎩<br />
> 0, d innerhalb<br />
=0, d Rand<br />
< 0, d außerhalb<br />
(7.10)<br />
Unser Clusterverfahren kann also auch auf rein qualitative Daten angewendet werden, wenn man auf die<br />
Delaunay-Triangulation verzichtet und für die Berechnung des RNG und GG eine Zeitkomplexität von O(n 3 )<br />
in Kauf nimmt. Da man bei rein qualitativen Daten nur auf der Distanzmatrix (Ähnlichkeitsmatrix) arbeiten<br />
kann, müssen für alle n 2 /2 Distanzwerte, der gegebenen Distanzmatrix, n Vergleiche durchgeführt werden.