25.12.2013 Aufrufe

PDF-Download - Deutsche Geodätische Kommission

PDF-Download - Deutsche Geodätische Kommission

PDF-Download - Deutsche Geodätische Kommission

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

87<br />

Kapitel 8<br />

Evaluierung des HPGCL-Algorithmus<br />

Wie kann man nun die Korrektheit und die Performance eines Clusterverfahrens überprüfen? Die einfache Antwort<br />

lautet durch Testdatensätze, was sich wie folgt begründen lässt: erstens ist der beschriebene Algorithmus<br />

eine Heuristik, die unser Modell der Cluster mit homogener Dichte möglichst gut approximieren soll und eine<br />

Heuristik lässt sich nun einmal nicht beweisen, denn zu einem formalen Beweis müssteaucheineformale<br />

Theorie existieren. Zweitens kann ein Modell der Realität immer nur anhand realer Daten durch den Menschen<br />

verifiziert (bestätigt) werden. Leider ist diese Verifizierung auch nur subjektiv, denn die Gruppierung von<br />

Objekten ist ein kognitiver Prozess, der nicht formal eindeutig definiert, sondern nur so gut wie<br />

”ähnlichen“<br />

möglich beschrieben werden kann. Zu einer solchen Beschreibung gehören immer mehrere Kriterien. Wir haben<br />

in unserem Fall als Kriterien die Nachbarschaft (bzgl. der Nachbarschaftsgraphen) und die Homogenität (der<br />

Abstände) der Objekte eines Clusters gewählt.<br />

8.1 Testdaten<br />

Dass die Einteilung von Punktmengen in homogene Gruppen selbst für den Menschen nicht eindeutig und<br />

einfach ist, wollten wir anhand eines Tests überpüfen. Für diesen Test verwendeten wir die in Abbildung 8.1a<br />

und 8.1b dargestellten Punktmengen und baten 10 Mitarbeiter des Instituts für Photogrammetrie der Universität<br />

Stuttgart (ifp), diese Punktmengen intuitiv in zusammengehörige Gruppen einzuteilen. Die Ergebnisse dieser<br />

10 manuellen Auswertungen sind in der Tabelle 8.1 und im Anhang A dargestellt.<br />

Wie man aus Tabelle 8.1 und den Abbildungen aus Anhang A sofort erkennt, sind für jeden Datensatz jeweils<br />

10 verschiedene Ergebnisse 1 erzielt worden. Einige Datensätze unterscheiden sich nur wenig, andere dagegen<br />

erheblich. Die manuellen Auswertungen liefern uns zwar keine eindeutige Referenzzerlegung, sie bieten jedoch<br />

trotzdem eine sehr gute Vergleichsmöglichkeit. Dabei fällt auf, dass bei den manuellen Auswertungen nicht<br />

nur die homogene Anordnung der Punkte eine Rolle spielte, sondern auch die Form der Cluster. Rechteckige<br />

Formen wurden bevorzugt. Im ersten Datensatz wurden im Mittel zwischen 11 und 15 Cluster erkannt und im<br />

zweiten Datensatz zwischen 11 und 22 Cluster. Die große Varianz im zweiten Datensatz ist umso erstaunlicher,<br />

da er auf den ersten Blick erheblich flächenförmiger wirkt als der erste Datensatz, trotzdem schwankten im<br />

zweiten Datensatz die Auswertungen zwischen stark generalisierend (Abb. A.6a) und detaillierter Zerlegung<br />

(Abb. A.6b).<br />

1 Für alle folgenden Clusterdarstellungen gilt, dass benachbarte Punkte mit gleicher Farbe und gleicher Größe zu einem Cluster<br />

gehören. Schwarze Punkte bei den manuellen Auswertungen gelten als keinem Cluster zugeordnet. Wenn möglich, wurden auch die<br />

inneren Kanten eines Clusters mit der gleichen Farbe dargestellt.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!