21.10.2014 • Aufrufe

Clusterbildung, Klassifikation und Mustererkennung (PDF)

ePAPER HERUNTERLADEN

uni.forst.gwdg.de

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

JETZT STARTEN

Preprocessing:

• Datenbereinigung (Behandlung von Fehlwerten

(missing), von verrauschten Daten,

Ausreißerdetektion, Behandlung inkonsistenter

Daten)

• Datenintegration (z.B. Erkennung und Elimination

von Redundanzen; Normierungen)

• Datenreduktion (Komprimierung von Wertebereichen

- Diskretisierung, Merkmalselimination)

Datennormierung für die Clusterung:

Zweck: Merkmale vergleichbar machen (gleicher Wertebereich).

Hauptsächlich 2 Methoden

Intervall-0-1-Normierung:

x ( normiert)

=

i

x

i

max( x

− min( x

j

)

) − min( x

Mittelwert 0 - Varianz 1 - Normierung (Z-Score-Normierung):

xi

− m

xi

( normiert)

= ,

s

wobei m das arithm. Mittel und s die Standardabweichung des

Merkmals ist – das normalisierte Merkmal hat dann Mittelwert 0

und Varianz 1.

Intervall-0-1-Normierung ist der Mittelwert0-Varianz1-Normierung in

vielen Fällen überlegen (Jiang & Bunke 1997).

j

)

271

Teil 6: EntscheidungsbÃ¤ume (PDF) - GWDG

Aussagenlogik: Syntax, Semantik, Normalformen, Horn ... - GWDG

Mathematische Grundlagen fÃ¼r Forstwissenschaften - FakultÃ¤t fÃ¼r ...

KAPITEL 6: GRUNDLAGEN DER INTEGRALRECHNUNG ...

Einleitung; Licht, Sehen, Farbe (1) (PDF) - FakultÃ¤t fÃ¼r ...

Euklidische Abstandstransformation mit Anti-Aliasing

Affine Abbildungen, homogene Koordinaten, Objekttransformationen

Summer School Modelling and Simulation with GroIMP

Preprocessing: • Datenbereinigung (Behandlung von Fehlwerten (missing), von verrauschten Daten, Ausreißerdetektion, Behandlung inkonsistenter Daten) • Datenintegration (z.B. Erkennung und Elimination von Redundanzen; Normierungen) • Datenreduktion (Komprimierung von Wertebereichen - Diskretisierung, Merkmalselimination) Datennormierung für die Clusterung: Zweck: Merkmale vergleichbar machen (gleicher Wertebereich). Hauptsächlich 2 Methoden Intervall-0-1-Normierung: x ( normiert) = i x i max( x − min( x j ) ) − min( x Mittelwert 0 - Varianz 1 - Normierung (Z-Score-Normierung): xi − m xi ( normiert) = , s wobei m das arithm. Mittel und s die Standardabweichung des Merkmals ist – das normalisierte Merkmal hat dann Mittelwert 0 und Varianz 1. Intervall-0-1-Normierung ist der Mittelwert0-Varianz1-Normierung in vielen Fällen überlegen (Jiang & Bunke 1997). j j ) 271

nächster Schritt: Berechnung der Distanzen bzw. Ähnlichkeiten der Objekte • d muss nicht immer eine Metrik im math. Sinne sein (oft verzichtet man auf die Dreiecksungleichung: "Pseudometrik") Beispiele für Ähnlichkeitsmaße: 272

Seite 1 und 2: 9. Clusterbildung, Klassifikation u
Seite 3 und 4: andere Begriffe für Klassifikation
Seite 5 und 6: Merkmal Länge: Histogramm Merkmal
Seite 7 und 8: ⇒ Kompromiss Beispiel mit 3 Merkm
Seite 9 und 10: weiteres Beispiel (aus Bässmann &
Seite 11 und 12: Unüberwachtes Lernen (eigentliche
Seite 13: Auswahl der Merkmale: die Merkmale
Seite 17 und 18: Einteilung der Clustering-Algorithm
Seite 19 und 20: Klassifikationsverfahren Minimum-Di
Seite 21 und 22: Bedingte Wahrscheinlichkeit: P( A |
Seite 23 und 24: Der Satz von Bayes damit lassen sic
Seite 25 und 26: jedoch wird hier die mehrdimensiona
Seite 27 und 28: 2-dim. Fall: Einsatz in der Klassif
Seite 29 und 30: Isolinien der Mahalanobis-Distanz:
Seite 31 und 32: Entscheidungsbaum für die Schrifte
Seite 33: Nächster-Nachbar-Klassifikator Dis

Clusterbildung, Klassifikation und Mustererkennung (PDF)

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?