PDF-Download - Deutsche Geodätische Kommission
PDF-Download - Deutsche Geodätische Kommission
PDF-Download - Deutsche Geodätische Kommission
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
32 KAPITEL 4. CLUSTERANALYSE<br />
Clusterverfahren<br />
hierarchisch<br />
Top-down<br />
partitionierend<br />
Bottom-up<br />
agglomerativ (HACM)<br />
divisiv<br />
Single Pass Relocation Clique<br />
Ward<br />
Complete Linkage<br />
Average Linkage<br />
Single Linkage<br />
Abbildung 4.2: Clusterverfahren<br />
PAM (Kaufman & Rousseeuw 1990), CLARANS (Ng & Han 1994), DBSCAN (Ester et al. 1996), CURE<br />
(Guha, Rastogi & Shim 1998) und ROCK (Guha, Rastogi & Shim 1999) basieren darauf, Cluster zu finden,<br />
die einem statistischen Modell genügen. K-means, PAM und CLARANS gehen von der Annahme aus, dass<br />
die Cluster hyperellipsoidisch, bzw. hypersphärisch sind und ähnliche Größen aufweisen. DBSCAN nutzt ein<br />
Dichte-basiertes Maß density reachable, welches alle Punkte eines Clusters erfüllen müssen, wohingegen Punkte,<br />
die zu unterschiedlichen Clustern gehören, diese Eigenschaft nicht aufweisen dürfen.<br />
Alle diese Algorithmen hängen elementar von der Wahl der Parameter im statistischen Modell ab und können<br />
daher fehlschlagen, wenn diese nicht zur zugrundeliegenden Datenmenge passen, oder auch wenn das Modell die<br />
Charakteristika der Cluster (z.B. Form, Größe, Dichte) nicht korrekt beschreibt. Weiterhin müssen oft geeignete<br />
Abbruchkriterien für die Verfahren vorgegeben werden. Das heißt, diese Verfahren sind nicht parameterfrei. Wir<br />
werden im Kapitel 7 ein parameterfreies Verfahren beschreiben.<br />
4.1 Methoden zur Clusteranalyse<br />
Eine detaillierte Einführung in das Gebiet der Clusteranalyse findet man in (Berkhin 2002). Im folgenden wollen<br />
wir eine grobe Übersicht über existierende Clusterverfahren geben (Abb. 4.2). Clustering Algorithmen lassen<br />
sich wie folgt einteilen:<br />
• Hierarchische Methoden<br />
– Agglomerative Verfahren<br />
– Divisive Verfahren<br />
• Partitionierende Methoden<br />
– K-medoids Verfahren<br />
– K-means Verfahren<br />
– Dichte-basierte Verfahren<br />
– Relocation Verfahren