Bildklassifikation unter Verwendung kompressionsbasierter Methoden

Weitere Magazine

Empfehlungen

Info

Kapitel 4. Klassifikation mit Hilfe verschiedener Ähnlichkeitsmetriken Tatsächlich abgebildete Ziffer Klassifikationsergebnis 0 1 2 3 4 5 6 7 8 9 0 50 0 2 1 0 0 0 0 1 0 1 0 50 1 1 0 0 1 3 1 1 2 0 0 38 1 0 0 0 0 1 0 3 0 0 2 37 0 3 0 0 1 0 4 0 0 0 0 48 1 0 0 0 0 5 0 0 0 8 0 44 0 0 1 0 6 0 0 5 0 0 0 49 0 2 0 7 0 0 2 0 0 1 0 43 0 2 8 0 0 0 0 0 0 0 0 43 2 9 0 0 0 2 2 1 0 4 0 45 Tabelle 4.7: Konfusionsmatrix einer 5-NN-Klassifikation mit Levenshtein-Distanz auf gegenläufig horizontal um 4 Pixel verschobenen Ziffern (Fehlerrate: 10, 6%) 4.2.3 Euklidischer Abstand Der Euklidische Abstand zweier Punkte x, y ∈ R 3 ist anschaulich genau die Streckenlänge zwischen x und y. Für höhere Dimensionen ist das jedoch nicht mehr so plastisch vorstellbar. Im allgemeinen Fall R n entpricht der Euklidische Abstand der 2-Norm 1 des Differenzvektors zwischen x und y. Definition 4.8. Der Euklidische Abstand zwischen zwei Punkten x, y ∈ R n ist ∑ d E (x, y) = ‖ x − y ‖ 2 = √ n (x i − y i ) 2 . (4.12) Die Definition beschränkt sich also wie beim Hammingabstand auf Strings gleicher Länge. Die Erfüllung der Metrikeigenschaften Identität“ und Symmetrie“ ” ” sind leicht einzusehen. Mit ∑ d E (x, x) = √ n (x i − x i ) 2 = 0 (4.13) i=1 ist zunächst die Identitätseigenschaft unmittelbar gezeigt. Wegen (x i − y i ) 2 = (y i −x i ) 2 gilt das auch für die Symmetriebedingung. Bei der Dreiecksungleichung ist das nicht unmittelbar klar. Trotzdem gilt Theorem 4.9. Der Euklidische Abstand erfüllt die Dreicksungleichung. i=1 1 Die 2-Norm wird auch als Euklidische Norm bezeichnet. 42
4.2. Standardmaße Beweis. Dies leiten wir direkt aus der Minkowskischen Ungleichung ab. Sei |x| = |y| = n, dann ist ∑ d E (x, z) = √ n ‖x i − z i ‖ 2 i=1 ∑ = √ n ‖(x i − y i ) + (y i − z i )‖ 2 i=1 ∑ √ n ∑ ‖x i − y i ‖ 2 + √ n ‖y i − z i ‖ 2 i=1 i=1 = d E (x, y) + d E (y, z) Die Dreicksungleichung ist also erfüllt. Daraus folgt dann unmittelbar Satz 4.10. Der Euklidische Abstand ist eine Metrik. In gewisser Weise handelt es sich beim Euklidischen Abstand um eine Verallgemeinerung des Hammingabstands. Die Summanden zur Berechnung nach Definition 4.8 haben bei Binärstrings immer dann den Wert 1, wenn die beiden entsprechenden korrespondierenden Komponenten x i und y i verschieden sind ((0 − 1) 2 = (1 − 0) 2 = 1). Bei Gleichheit ist der Wert des Summanden (0 − 0) 2 = (1 − 1) 2 = 0. Die Summe entspricht also dem Hammingabstand. Seien x 1 , x 2 , y ∈ {0, 1} n , dann gilt d H (x 1 , y) > d H (x 2 , y) ⇔ √ d H (x 1 , y) > √ d H (x 2 , y) ⇔ d E (x 1 , y) > d E (x 2 , y). Im Rahmen der Klassifikation interessieren wir uns weniger für die absoluten Distanzen als für paarweise Vergleiche. Darum ist es für die Klassifikationsgüte bei Binärstrings unerheblich, ob wir den Hammingabstand oder den Euklidischen Abstand verwenden. Das Ergebnis ist identisch. Bei der Anwendung auf die Graubilder zeigen sich jedoch signifikante Unterschiede. Im Gegensatz zum Hammingabstand gewichtet der Euklidische Abstand die absoluten Differenzen der korrespondierenden Pixel implizit, d.h. kleine Differenzen zwischen korrespondierenden Pixeln wirken sich weniger auf den Euklidischen Abstand aus als große Differenzen. Dieser vermeintliche Vorteil bestätigt sich auch im Experiment. Mit k = 3 konnten wir bei der Klassifikation des gesamten MNIST-Datenbestands eine Fehlerrate von 2, 8% erreichen. Alle anderen Werte für k erzielten schlechtere Ergebnisse (siehe Abbildung 4.8). Die zugehörige Konfusionsmatrix ist in Tabelle 4.8 verzeichnet. Wie auch beim Hammingabstand befinden sich die häufigsten Klassifikationsfehler an den Stellen, die man auch intuitiv vermuten würde. So werden wiederum relativ viele Bilder der Ziffer 4 als 9 klassifiziert und Bilder der 7 als 43
Seite 1: Universität zu Lübeck Institut f
Seite 5: Aufgabenstellung v
Seite 8 und 9: Inhaltsverzeichnis 5.1 Adaption aus
Seite 10 und 11: Kapitel 1. Einleitung so doch zumin
Seite 12 und 13: Kapitel 2. Kompressionsbasierte Äh
Seite 28 und 29: Kapitel 3. Grundlagen der maschinel
Seite 36 und 37: Kapitel 4. Klassifikation mit Hilfe
Seite 73 und 74: 5 Negative Selection 5.1 Adaption a
Seite 75 und 76: 5.1. Adaption aus der Immunologie D
Seite 77 und 78: 5.2. Anwendung mit Hammingabstand A
Seite 79 und 80: 5.2. Anwendung mit Hammingabstand d
Seite 81 und 82: 5.2. Anwendung mit Hammingabstand t
Seite 83: 5.2. Anwendung mit Hammingabstand W
Seite 86 und 87: Kapitel 6. Zusammenfassung, Fazit u
Seite 89 und 90: Abbildungsverzeichnis 3.1 Beispiel
Seite 91 und 92: Bibliographie [BGL + 98] Charles H.

Bildklassifikation unter Verwendung kompressionsbasierter Methoden

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?