PDF-Download - Deutsche Geodätische Kommission
PDF-Download - Deutsche Geodätische Kommission
PDF-Download - Deutsche Geodätische Kommission
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
96 KAPITEL 8. EVALUIERUNG DES HPGCL-ALGORITHMUS<br />
8.3 Ergebnisse für die künstlichen Testdaten<br />
8.3.1 Punktmuster<br />
Im künstlichen Testdatensatz sollte, nach unserer Meinung, ein optimales Cluster-Verfahren neun Cluster erkennen<br />
können. Den Kreisring, die Kreisfläche innerhalb des Kreisringes, das Z“, jede der beiden sich berührenden<br />
”<br />
Kreisflächen unterhalb des Kreisringes, die quadratische und rechteckige Fläche sowie die beiden ineinander<br />
verzahnten Flächen. Diese Referenzzerlegung ist jedoch genau betrachtet nicht eindeutig, besonders unter dem<br />
Aspekt von Punktmengen mit homogenem Abstand als Cluster. Das Z“ besteht genau betrachtet aus vier<br />
”<br />
Linien von denen die oberste und unterste den gleichen Punktabstand besitzen – die Assoziation zu einem Z“ ”<br />
trifft ein menschlicher Operateur aufgrund seines Hintergrundwissens, das unser Verfahren jedoch nicht hat.<br />
Die sich berührenden Kreisflächen muss man nicht zwangsweise als getrennte Cluster auffassen. Rein unter dem<br />
Aspekt des homogenen Punktabstandes und da auch nicht konvexe Formen erkannt werden sollen, sind die<br />
beiden Kreisflächen ein einziger Cluster. Genauso gut kann man die Kreisfläche innerhalb des Kreisringes in elf<br />
einzelne horizontale Linien zerlegen, da der vertikale Punktabstand größer als der horizontale ist.<br />
Die Ergebnisse unseres Verfahrens zu diesem Datensatz sind in Abbildung 8.13 dargestellt. Das Ergebnis für<br />
den Modus 1 (Abb. 8.13a) kommt unserer Vorstellung von einer Referenzzerlegung am nächsten. Es erkennt<br />
den Kreisring als einen Cluster und innerhalb dieses Clusters einen separaten Cluster. Wie man sieht, trennt<br />
unser Verfahren sich berührende Cluster gleicher Dichte nicht, was aufgrund unseres Modells auch zu erwarten<br />
war. Das Z“ wird in fünf Segmente zerlegt und nicht als ein einziges Objekt erfasst. Dieses Ergebnis entspricht<br />
”<br />
vollständig unserem Modell, da ja das Z“ aus vier Linien unterschiedlicher Dichte besteht. Dass die diagonale<br />
”<br />
Linie in zwei Segmente aufgeteilt wurde, ist nach unserem Modell auch korrekt, da unser Modell nur disjunkte<br />
Cluster erkennen kann (jeder Punkt kann nur einem Cluster zugeordnet sein) und im Falle von zwei nicht<br />
disjunkten Clustern immer mindestens einen von beiden Clustern aufteilt. Interessant ist, dass auch beim<br />
iterativen Clustering das Z“ nie zu einem einzigen Cluster zusammengefasst wird. Das lässt auf eine eindeutige<br />
”<br />
dominante Verteilung dieser Cluster schließen. Die Kreisfläche innerhalb des Kreisringes, die aus mehreren<br />
horizontalen Linien besteht, wird im Gegensatz zum Z“ zu einem Cluster zusammengefasst. Dieses Ergebnis<br />
”<br />
stimmt gut mit der menschlichen Wahrnehmung überein. Dieses Ergebnis lässt sich auch mit unserem Modell<br />
begründen, denn im Gegensatz zum Z“ besitzen alle horizontalen Linien die gleiche Dichte und der Abstand<br />
”<br />
zwischen den Linien ist ebenfalls konstant. Wie man an Abbildung 8.15a sieht, werden alle horizontalen Linien als<br />
separate Cluster erfasst, wenn man nur den NNG in unserem Verfahren verwendet. Die Abbildungen 8.15a und<br />
b zeigen auch auf, dass im Falle regelmäßig angeordneter Objekte der NNG die wesentliche Cluster-Information<br />
enthält, da die meisten Cluster, selbst im verrauschten Datensatz schon auf dieser Hierarchiestufe erkannt<br />
wurden. Wie wir noch zeigen werden, ist dies jedoch im Falle allgemein verteilter Objekte nicht der Fall.<br />
Wie man an der Anzahl der Cluster erkennt, bewirkt die Vereinigung eines Clusters immer nur mit seinem<br />
nächsten kompatiblen Cluster (Modus 5, 6, 7 und 8) keinen Unterschied zu der gleichzeitigen Vereinigung<br />
aller kompatiblen Cluster. Die Ergebnisse in den Modi 2, 4, 6 und 8 zeigen, dass die Grenzzerlegung unseres<br />
iterativen Clusterings, gegenüber Standardverfahren, nie ein einziger Cluster aller Punkte ist. Diese Ergebnisse<br />
zeigen jedoch auch, dass im Falle von gleichmäßig verteilten Clustern unser Verfahren ebenfalls zu einem einzigen<br />
Megacluster führen wird, denn in den Modi 2 und 6 sind die unteren vier Cluster und die untere Linie des ”<br />
Z“ zu<br />
einem großen Cluster zusammengefasst worden. Im Modus 4 und 8 wurde dagegen, aufgrund der Maximierung<br />
des äußeren Abstands, die untere Linie des ”<br />
Z“ als eigener Cluster klassifiziert. Die Maximierung des äußeren<br />
Abstands erwirkt somit – wie erwartet – eine strengere Zerlegung. Jedoch führt dies, gegenüber der menschlichen<br />
Wahrnehmung, wie an den Ergebnissen der Modi 3 und 7 zu sehen, zu unerwarteten Ausreißern, wie der einzelne<br />
horizontale Linien-Cluster innerhalb des Kreisringes.<br />
Die Ergebnisse der verrauschten Testdaten (Abb. 8.14) zeigen die Robustheit unseres Verfahrens, da im wesentlichen<br />
die Cluster der nicht verrauschten Daten wiedererkannt wurden. Die verrauschten Daten bestätigen<br />
somit das Modell der benachbarten Objekte mit homogenem Abstand. Einzelne Objekte, die durch das Rauschen<br />
unregelmäßige Abstände, im Gegensatz zu ihren Nachbarn, besitzen, werden nicht zu dem umgebenden<br />
Cluster hinzugefügt. Es wäre somit möglich, singuläre oder relativ kleine Cluster, die innerhalb großer Cluster<br />
liegen, als Rauschen zu modellieren. Wie man an Abbildung 8.15b sieht, ist bei regelmäßigen Clustern schon<br />
allein der NNG sehr robust gegenüber Rauschen. Die Ergebnisse zeigen jedoch auch, dass im Falle einer lokal<br />
gehäuften Störung die Ergebnisse natürlich verfälscht werden (siehe z.B. Abb. 8.14a und e), da in diesen Fällen<br />
eigenständige homogene Cluster entstehen, die vom Modell her nicht als Fehler interpretiert werden können. In<br />
diesen Fällen verbesserte das iterative Clustering, im Sinne der beschriebenen Referenzzerlegung, das Ergebnis,