25.12.2013 Aufrufe

PDF-Download - Deutsche Geodätische Kommission

PDF-Download - Deutsche Geodätische Kommission

PDF-Download - Deutsche Geodätische Kommission

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

32 KAPITEL 4. CLUSTERANALYSE<br />

Clusterverfahren<br />

hierarchisch<br />

Top-down<br />

partitionierend<br />

Bottom-up<br />

agglomerativ (HACM)<br />

divisiv<br />

Single Pass Relocation Clique<br />

Ward<br />

Complete Linkage<br />

Average Linkage<br />

Single Linkage<br />

Abbildung 4.2: Clusterverfahren<br />

PAM (Kaufman & Rousseeuw 1990), CLARANS (Ng & Han 1994), DBSCAN (Ester et al. 1996), CURE<br />

(Guha, Rastogi & Shim 1998) und ROCK (Guha, Rastogi & Shim 1999) basieren darauf, Cluster zu finden,<br />

die einem statistischen Modell genügen. K-means, PAM und CLARANS gehen von der Annahme aus, dass<br />

die Cluster hyperellipsoidisch, bzw. hypersphärisch sind und ähnliche Größen aufweisen. DBSCAN nutzt ein<br />

Dichte-basiertes Maß density reachable, welches alle Punkte eines Clusters erfüllen müssen, wohingegen Punkte,<br />

die zu unterschiedlichen Clustern gehören, diese Eigenschaft nicht aufweisen dürfen.<br />

Alle diese Algorithmen hängen elementar von der Wahl der Parameter im statistischen Modell ab und können<br />

daher fehlschlagen, wenn diese nicht zur zugrundeliegenden Datenmenge passen, oder auch wenn das Modell die<br />

Charakteristika der Cluster (z.B. Form, Größe, Dichte) nicht korrekt beschreibt. Weiterhin müssen oft geeignete<br />

Abbruchkriterien für die Verfahren vorgegeben werden. Das heißt, diese Verfahren sind nicht parameterfrei. Wir<br />

werden im Kapitel 7 ein parameterfreies Verfahren beschreiben.<br />

4.1 Methoden zur Clusteranalyse<br />

Eine detaillierte Einführung in das Gebiet der Clusteranalyse findet man in (Berkhin 2002). Im folgenden wollen<br />

wir eine grobe Übersicht über existierende Clusterverfahren geben (Abb. 4.2). Clustering Algorithmen lassen<br />

sich wie folgt einteilen:<br />

• Hierarchische Methoden<br />

– Agglomerative Verfahren<br />

– Divisive Verfahren<br />

• Partitionierende Methoden<br />

– K-medoids Verfahren<br />

– K-means Verfahren<br />

– Dichte-basierte Verfahren<br />

– Relocation Verfahren

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!