25.12.2013 Aufrufe

PDF-Download - Deutsche Geodätische Kommission

PDF-Download - Deutsche Geodätische Kommission

PDF-Download - Deutsche Geodätische Kommission

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

80 KAPITEL 7. HIERARCHISCHES NACHBARSCHAFTSGRAPHEN CLUSTERING<br />

Definition 7.4.4 (Varianz-Kompatibilität)<br />

Zwei Cluster X und Y werden als verträglich (kompatibel) bezüglich ihrer Varianz (Homogenität) betrachtet,<br />

wenn folgende Bedingung erfüllt ist:<br />

V(X ∪ Y) ≤ max {V(X), V(Y)} .<br />

Eine strenge Definition einer optimalen Zerlegung einer Menge in homogene Cluster verlangt auch noch, dass<br />

der Unterschied zwischen den einzelnen Clustern so groß wie möglich wird. Deshalb führen wir als weiteres zum<br />

strengen Ähnlichkeitsvergleich die folgende Definition ein:<br />

Definition 7.4.5 (Inter-Dichte-Kompatibilität)<br />

Zwei Cluster X und Y werden als verträglich (kompatibel) bezüglich ihrer Inter-Dichte (Abstand zu anderen<br />

Clustern) betrachtet, wenn folgende Bedingung erfüllt ist:<br />

D(X ∗ ) ≤ D((X ∪ Y) ∗ ) und D(Y ∗ ) ≤ D((X ∪ Y) ∗ ) .<br />

7.5 HPGCL-Algorithmus<br />

HPGCL steht für Hierarchisches parameterfreies Graph-Clustering. Der HPGCL-Algorithmus besteht aus<br />

zwei Prozeduren. Die erste Prozedur erzeugt die Nachbarschaftsgraphenhierarchie und die zweite Prozedur<br />

führt die Gruppierung (Clustering) der Ecken der Nachbarschaftsgraphenhierarchie durch.<br />

Die Nachbarschaftsgraphenhierarchie wird gemäß Definition 6.12 gebildet. Da die Delaunay Triangulation (DT)<br />

die Gesamtmenge aller Kanten darstellt, wird sie zuerst berechnet oder als gegeben vorausgesetzt. Danach<br />

werden alle Untergraphen in der folgenden Reihenfolge berechnet: Gabriel Graph (GG), Relativer Nachbarschaftsgraph<br />

(RNG), Minimaler spannender Baum (MST) und zuletzt der Nächste-Nachbar-Graph (NNG). Da<br />

sich alle Graphen in linearer Zeit aus ihren Obergraphen bestimmen lassen, besitzt diese Prozedur unseres Algorithmus<br />

die Komplexität der zugehörigen DT (siehe Tabelle 6.2 auf Seite 69). Nachdem die Hierarchie erzeugt<br />

wurde, existiert nun die DT und für jede Kante der DT ist gespeichert, zu welchem Untergraphen sie auch noch<br />

gehört.<br />

Die Erzeugung der Nachbarschaftshierarchie kann als ein Bottom-Up Prozess angesehen werden, da wir mit<br />

der Delaunay-Triangulation beginnen und diese die Grundmenge aller möglichen Nachbarschaftsgraphkanten<br />

darstellt. Die Gruppierung der Knoten erfolgt dagegen in einem Top-Down Prozess vom NNG bis zur DT. Im<br />

folgenden wird nun der Grundalgorithmus unseres Clusterverfahrens und seine iterative Erweiterung beschrieben.<br />

Auf die Berechnung der Nachbarschaftsgraphen gehen wir hier nicht ein und verweisen auf die in Kapitel<br />

6 angegebene Literatur.<br />

7.5.1 Grundalgorithmus<br />

Der Kern unseres HPGCL-Verfahrens kann wie folgt beschrieben werden:<br />

Schritt 1: Zuerst werden die Kanten des NNG als aktiv 3 markiert.DanachwerdenalleEckenderDTalsnicht<br />

reguläre Cluster (Def. 7.2.6) initialisiert und in einer Cluster-Prioritätswarteschlange (CPQ) gespeichert.<br />

Die Cluster-Priorität wird nach folgenden Kriterien bestimmt:<br />

1. Cluster-Varianz: Ein Cluster hat umso größere Priorität, je homogener die Länge seiner inneren<br />

und äußeren Kanten ist (siehe Def. 7.3.3).<br />

2. Cluster-Abstand: Ein Cluster hat umso größere Priorität, je geringer sein äußerer Abstand zu<br />

anderen Clustern ist (siehe Def. 7.3.5).<br />

3 Alle Berechnungen innerhalb des Gruppierungsprozesses (Clusterings) werden nur auf als aktiv markierte Kanten durchgeführt.<br />

Nicht markierte Kanten bleiben unberücksichtigt.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!