25.12.2013 Aufrufe

PDF-Download - Deutsche Geodätische Kommission

PDF-Download - Deutsche Geodätische Kommission

PDF-Download - Deutsche Geodätische Kommission

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

96 KAPITEL 8. EVALUIERUNG DES HPGCL-ALGORITHMUS<br />

8.3 Ergebnisse für die künstlichen Testdaten<br />

8.3.1 Punktmuster<br />

Im künstlichen Testdatensatz sollte, nach unserer Meinung, ein optimales Cluster-Verfahren neun Cluster erkennen<br />

können. Den Kreisring, die Kreisfläche innerhalb des Kreisringes, das Z“, jede der beiden sich berührenden<br />

”<br />

Kreisflächen unterhalb des Kreisringes, die quadratische und rechteckige Fläche sowie die beiden ineinander<br />

verzahnten Flächen. Diese Referenzzerlegung ist jedoch genau betrachtet nicht eindeutig, besonders unter dem<br />

Aspekt von Punktmengen mit homogenem Abstand als Cluster. Das Z“ besteht genau betrachtet aus vier<br />

”<br />

Linien von denen die oberste und unterste den gleichen Punktabstand besitzen – die Assoziation zu einem Z“ ”<br />

trifft ein menschlicher Operateur aufgrund seines Hintergrundwissens, das unser Verfahren jedoch nicht hat.<br />

Die sich berührenden Kreisflächen muss man nicht zwangsweise als getrennte Cluster auffassen. Rein unter dem<br />

Aspekt des homogenen Punktabstandes und da auch nicht konvexe Formen erkannt werden sollen, sind die<br />

beiden Kreisflächen ein einziger Cluster. Genauso gut kann man die Kreisfläche innerhalb des Kreisringes in elf<br />

einzelne horizontale Linien zerlegen, da der vertikale Punktabstand größer als der horizontale ist.<br />

Die Ergebnisse unseres Verfahrens zu diesem Datensatz sind in Abbildung 8.13 dargestellt. Das Ergebnis für<br />

den Modus 1 (Abb. 8.13a) kommt unserer Vorstellung von einer Referenzzerlegung am nächsten. Es erkennt<br />

den Kreisring als einen Cluster und innerhalb dieses Clusters einen separaten Cluster. Wie man sieht, trennt<br />

unser Verfahren sich berührende Cluster gleicher Dichte nicht, was aufgrund unseres Modells auch zu erwarten<br />

war. Das Z“ wird in fünf Segmente zerlegt und nicht als ein einziges Objekt erfasst. Dieses Ergebnis entspricht<br />

”<br />

vollständig unserem Modell, da ja das Z“ aus vier Linien unterschiedlicher Dichte besteht. Dass die diagonale<br />

”<br />

Linie in zwei Segmente aufgeteilt wurde, ist nach unserem Modell auch korrekt, da unser Modell nur disjunkte<br />

Cluster erkennen kann (jeder Punkt kann nur einem Cluster zugeordnet sein) und im Falle von zwei nicht<br />

disjunkten Clustern immer mindestens einen von beiden Clustern aufteilt. Interessant ist, dass auch beim<br />

iterativen Clustering das Z“ nie zu einem einzigen Cluster zusammengefasst wird. Das lässt auf eine eindeutige<br />

”<br />

dominante Verteilung dieser Cluster schließen. Die Kreisfläche innerhalb des Kreisringes, die aus mehreren<br />

horizontalen Linien besteht, wird im Gegensatz zum Z“ zu einem Cluster zusammengefasst. Dieses Ergebnis<br />

”<br />

stimmt gut mit der menschlichen Wahrnehmung überein. Dieses Ergebnis lässt sich auch mit unserem Modell<br />

begründen, denn im Gegensatz zum Z“ besitzen alle horizontalen Linien die gleiche Dichte und der Abstand<br />

”<br />

zwischen den Linien ist ebenfalls konstant. Wie man an Abbildung 8.15a sieht, werden alle horizontalen Linien als<br />

separate Cluster erfasst, wenn man nur den NNG in unserem Verfahren verwendet. Die Abbildungen 8.15a und<br />

b zeigen auch auf, dass im Falle regelmäßig angeordneter Objekte der NNG die wesentliche Cluster-Information<br />

enthält, da die meisten Cluster, selbst im verrauschten Datensatz schon auf dieser Hierarchiestufe erkannt<br />

wurden. Wie wir noch zeigen werden, ist dies jedoch im Falle allgemein verteilter Objekte nicht der Fall.<br />

Wie man an der Anzahl der Cluster erkennt, bewirkt die Vereinigung eines Clusters immer nur mit seinem<br />

nächsten kompatiblen Cluster (Modus 5, 6, 7 und 8) keinen Unterschied zu der gleichzeitigen Vereinigung<br />

aller kompatiblen Cluster. Die Ergebnisse in den Modi 2, 4, 6 und 8 zeigen, dass die Grenzzerlegung unseres<br />

iterativen Clusterings, gegenüber Standardverfahren, nie ein einziger Cluster aller Punkte ist. Diese Ergebnisse<br />

zeigen jedoch auch, dass im Falle von gleichmäßig verteilten Clustern unser Verfahren ebenfalls zu einem einzigen<br />

Megacluster führen wird, denn in den Modi 2 und 6 sind die unteren vier Cluster und die untere Linie des ”<br />

Z“ zu<br />

einem großen Cluster zusammengefasst worden. Im Modus 4 und 8 wurde dagegen, aufgrund der Maximierung<br />

des äußeren Abstands, die untere Linie des ”<br />

Z“ als eigener Cluster klassifiziert. Die Maximierung des äußeren<br />

Abstands erwirkt somit – wie erwartet – eine strengere Zerlegung. Jedoch führt dies, gegenüber der menschlichen<br />

Wahrnehmung, wie an den Ergebnissen der Modi 3 und 7 zu sehen, zu unerwarteten Ausreißern, wie der einzelne<br />

horizontale Linien-Cluster innerhalb des Kreisringes.<br />

Die Ergebnisse der verrauschten Testdaten (Abb. 8.14) zeigen die Robustheit unseres Verfahrens, da im wesentlichen<br />

die Cluster der nicht verrauschten Daten wiedererkannt wurden. Die verrauschten Daten bestätigen<br />

somit das Modell der benachbarten Objekte mit homogenem Abstand. Einzelne Objekte, die durch das Rauschen<br />

unregelmäßige Abstände, im Gegensatz zu ihren Nachbarn, besitzen, werden nicht zu dem umgebenden<br />

Cluster hinzugefügt. Es wäre somit möglich, singuläre oder relativ kleine Cluster, die innerhalb großer Cluster<br />

liegen, als Rauschen zu modellieren. Wie man an Abbildung 8.15b sieht, ist bei regelmäßigen Clustern schon<br />

allein der NNG sehr robust gegenüber Rauschen. Die Ergebnisse zeigen jedoch auch, dass im Falle einer lokal<br />

gehäuften Störung die Ergebnisse natürlich verfälscht werden (siehe z.B. Abb. 8.14a und e), da in diesen Fällen<br />

eigenständige homogene Cluster entstehen, die vom Modell her nicht als Fehler interpretiert werden können. In<br />

diesen Fällen verbesserte das iterative Clustering, im Sinne der beschriebenen Referenzzerlegung, das Ergebnis,

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!