PDF-Download - Deutsche Geodätische Kommission
PDF-Download - Deutsche Geodätische Kommission
PDF-Download - Deutsche Geodätische Kommission
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
87<br />
Kapitel 8<br />
Evaluierung des HPGCL-Algorithmus<br />
Wie kann man nun die Korrektheit und die Performance eines Clusterverfahrens überprüfen? Die einfache Antwort<br />
lautet durch Testdatensätze, was sich wie folgt begründen lässt: erstens ist der beschriebene Algorithmus<br />
eine Heuristik, die unser Modell der Cluster mit homogener Dichte möglichst gut approximieren soll und eine<br />
Heuristik lässt sich nun einmal nicht beweisen, denn zu einem formalen Beweis müssteaucheineformale<br />
Theorie existieren. Zweitens kann ein Modell der Realität immer nur anhand realer Daten durch den Menschen<br />
verifiziert (bestätigt) werden. Leider ist diese Verifizierung auch nur subjektiv, denn die Gruppierung von<br />
Objekten ist ein kognitiver Prozess, der nicht formal eindeutig definiert, sondern nur so gut wie<br />
”ähnlichen“<br />
möglich beschrieben werden kann. Zu einer solchen Beschreibung gehören immer mehrere Kriterien. Wir haben<br />
in unserem Fall als Kriterien die Nachbarschaft (bzgl. der Nachbarschaftsgraphen) und die Homogenität (der<br />
Abstände) der Objekte eines Clusters gewählt.<br />
8.1 Testdaten<br />
Dass die Einteilung von Punktmengen in homogene Gruppen selbst für den Menschen nicht eindeutig und<br />
einfach ist, wollten wir anhand eines Tests überpüfen. Für diesen Test verwendeten wir die in Abbildung 8.1a<br />
und 8.1b dargestellten Punktmengen und baten 10 Mitarbeiter des Instituts für Photogrammetrie der Universität<br />
Stuttgart (ifp), diese Punktmengen intuitiv in zusammengehörige Gruppen einzuteilen. Die Ergebnisse dieser<br />
10 manuellen Auswertungen sind in der Tabelle 8.1 und im Anhang A dargestellt.<br />
Wie man aus Tabelle 8.1 und den Abbildungen aus Anhang A sofort erkennt, sind für jeden Datensatz jeweils<br />
10 verschiedene Ergebnisse 1 erzielt worden. Einige Datensätze unterscheiden sich nur wenig, andere dagegen<br />
erheblich. Die manuellen Auswertungen liefern uns zwar keine eindeutige Referenzzerlegung, sie bieten jedoch<br />
trotzdem eine sehr gute Vergleichsmöglichkeit. Dabei fällt auf, dass bei den manuellen Auswertungen nicht<br />
nur die homogene Anordnung der Punkte eine Rolle spielte, sondern auch die Form der Cluster. Rechteckige<br />
Formen wurden bevorzugt. Im ersten Datensatz wurden im Mittel zwischen 11 und 15 Cluster erkannt und im<br />
zweiten Datensatz zwischen 11 und 22 Cluster. Die große Varianz im zweiten Datensatz ist umso erstaunlicher,<br />
da er auf den ersten Blick erheblich flächenförmiger wirkt als der erste Datensatz, trotzdem schwankten im<br />
zweiten Datensatz die Auswertungen zwischen stark generalisierend (Abb. A.6a) und detaillierter Zerlegung<br />
(Abb. A.6b).<br />
1 Für alle folgenden Clusterdarstellungen gilt, dass benachbarte Punkte mit gleicher Farbe und gleicher Größe zu einem Cluster<br />
gehören. Schwarze Punkte bei den manuellen Auswertungen gelten als keinem Cluster zugeordnet. Wenn möglich, wurden auch die<br />
inneren Kanten eines Clusters mit der gleichen Farbe dargestellt.