12.07.2015 Aufrufe

Neuronale Netze

Neuronale Netze

Neuronale Netze

MEHR ANZEIGEN
WENIGER ANZEIGEN
  • Keine Tags gefunden...

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Anhang A Exkurs: Clusteranalyse und Regional and Online Learnable Fields dkriesel.comClusteringgütemessbarClustern. Dies ist bei sehr variablen Clusterabständenund Punktabständen innerhalbvon Clustern unter Umständen einProblem.Siehe für eine Veranschaulichung den unterenrechten Teil der Abb. A.1.A.4 DerSilhouettenkoeffizientmacht die Güte einesgegebenen ClusteringsmessbarWie wir oben sehen, gibt es keine Patentlösungfür Clusteringprobleme, dennjedes dargestellte Verfahren hat seine ganzspezifischen Nachteile. Insofern ist es wertvoll,ein Kriterium dafür zu haben, wie gutunsere Clustereinteilung ist. Genau dieseMöglichkeit bietet uns der Silhouettenkoeffizientnach [Kau90]. Er misst, wiegut die Cluster voneinander abgegrenztsind, und ist ein Indikator dafür, ob vielleichtPunkte in falsche Cluster einsortiertsind.Sei P eine Punktwolke und sei p ein Punkt∈ P . Sei c ⊆ P ein Cluster in der Punktwolkeund gehöre p in diesen Cluster, alsop ∈ c. Die Menge der Cluster nennen wirC. Zusammengefasst gilt alsop ∈ c ⊆ P.Um den Silhouettenkoeffizient zu errechnen,benötigen wir zunächst den durchschnittlichenAbstand des Punktes p zu allenseinen Clusternachbarn. Diese Größenennen wir a(p) und definieren sie wiefolgt:a(p) = 1|c| − 1∑q∈c,q≠pdist(p, q)(A.1)Sei weiterhin b(p) der durchschnittlicheAbstand unseres Punktes p zu allen Punktendes nächsten anderen Clusters (g läuftüber alle Cluster außer c):b(p) =ming∈C,g≠c1|g|∑dist(p, q)q∈g(A.2)Der Punkt p ist gut klassifiziert, wennder Abstand zum Schwerpunkt des eigenenClusters minimal und der Abstandzu den Schwerpunkten der anderen Clustermaximal ist. Ist dies der Fall, so wirdder folgende Term einen Wert nahe 1 ergeben:s(p) =b(p) − a(p)max{a(p), b(p)}(A.3)Der ganze Term s(p) kann sich offensichtlichnur im Intervall [−1; 1] bewegen. Indikatorfür eine schlechte Klassifikation vonp ist ein Wert nahe -1.Der Silhouettenkoeffizient S(P ) ergibtsich aus dem Durchschnitte aller s(p)-Werte: Es giltS(P ) = 1 ∑s(p).|P |p∈P(A.4)Die Gesamtgüte der Clustereinteilungdrückt sich wie oben durch das Intervall[−1; 1] aus.Nachdem wir nun die Charakteristiken verschiedenerClusteringmethoden sowie ein176 D. Kriesel – Ein kleiner Überblick über <strong>Neuronale</strong> <strong>Netze</strong> (EPSILON-DE)

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!