PDF-Download - Deutsche Geodätische Kommission
PDF-Download - Deutsche Geodätische Kommission
PDF-Download - Deutsche Geodätische Kommission
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
80 KAPITEL 7. HIERARCHISCHES NACHBARSCHAFTSGRAPHEN CLUSTERING<br />
Definition 7.4.4 (Varianz-Kompatibilität)<br />
Zwei Cluster X und Y werden als verträglich (kompatibel) bezüglich ihrer Varianz (Homogenität) betrachtet,<br />
wenn folgende Bedingung erfüllt ist:<br />
V(X ∪ Y) ≤ max {V(X), V(Y)} .<br />
Eine strenge Definition einer optimalen Zerlegung einer Menge in homogene Cluster verlangt auch noch, dass<br />
der Unterschied zwischen den einzelnen Clustern so groß wie möglich wird. Deshalb führen wir als weiteres zum<br />
strengen Ähnlichkeitsvergleich die folgende Definition ein:<br />
Definition 7.4.5 (Inter-Dichte-Kompatibilität)<br />
Zwei Cluster X und Y werden als verträglich (kompatibel) bezüglich ihrer Inter-Dichte (Abstand zu anderen<br />
Clustern) betrachtet, wenn folgende Bedingung erfüllt ist:<br />
D(X ∗ ) ≤ D((X ∪ Y) ∗ ) und D(Y ∗ ) ≤ D((X ∪ Y) ∗ ) .<br />
7.5 HPGCL-Algorithmus<br />
HPGCL steht für Hierarchisches parameterfreies Graph-Clustering. Der HPGCL-Algorithmus besteht aus<br />
zwei Prozeduren. Die erste Prozedur erzeugt die Nachbarschaftsgraphenhierarchie und die zweite Prozedur<br />
führt die Gruppierung (Clustering) der Ecken der Nachbarschaftsgraphenhierarchie durch.<br />
Die Nachbarschaftsgraphenhierarchie wird gemäß Definition 6.12 gebildet. Da die Delaunay Triangulation (DT)<br />
die Gesamtmenge aller Kanten darstellt, wird sie zuerst berechnet oder als gegeben vorausgesetzt. Danach<br />
werden alle Untergraphen in der folgenden Reihenfolge berechnet: Gabriel Graph (GG), Relativer Nachbarschaftsgraph<br />
(RNG), Minimaler spannender Baum (MST) und zuletzt der Nächste-Nachbar-Graph (NNG). Da<br />
sich alle Graphen in linearer Zeit aus ihren Obergraphen bestimmen lassen, besitzt diese Prozedur unseres Algorithmus<br />
die Komplexität der zugehörigen DT (siehe Tabelle 6.2 auf Seite 69). Nachdem die Hierarchie erzeugt<br />
wurde, existiert nun die DT und für jede Kante der DT ist gespeichert, zu welchem Untergraphen sie auch noch<br />
gehört.<br />
Die Erzeugung der Nachbarschaftshierarchie kann als ein Bottom-Up Prozess angesehen werden, da wir mit<br />
der Delaunay-Triangulation beginnen und diese die Grundmenge aller möglichen Nachbarschaftsgraphkanten<br />
darstellt. Die Gruppierung der Knoten erfolgt dagegen in einem Top-Down Prozess vom NNG bis zur DT. Im<br />
folgenden wird nun der Grundalgorithmus unseres Clusterverfahrens und seine iterative Erweiterung beschrieben.<br />
Auf die Berechnung der Nachbarschaftsgraphen gehen wir hier nicht ein und verweisen auf die in Kapitel<br />
6 angegebene Literatur.<br />
7.5.1 Grundalgorithmus<br />
Der Kern unseres HPGCL-Verfahrens kann wie folgt beschrieben werden:<br />
Schritt 1: Zuerst werden die Kanten des NNG als aktiv 3 markiert.DanachwerdenalleEckenderDTalsnicht<br />
reguläre Cluster (Def. 7.2.6) initialisiert und in einer Cluster-Prioritätswarteschlange (CPQ) gespeichert.<br />
Die Cluster-Priorität wird nach folgenden Kriterien bestimmt:<br />
1. Cluster-Varianz: Ein Cluster hat umso größere Priorität, je homogener die Länge seiner inneren<br />
und äußeren Kanten ist (siehe Def. 7.3.3).<br />
2. Cluster-Abstand: Ein Cluster hat umso größere Priorität, je geringer sein äußerer Abstand zu<br />
anderen Clustern ist (siehe Def. 7.3.5).<br />
3 Alle Berechnungen innerhalb des Gruppierungsprozesses (Clusterings) werden nur auf als aktiv markierte Kanten durchgeführt.<br />
Nicht markierte Kanten bleiben unberücksichtigt.