Bildklassifikation unter Verwendung kompressionsbasierter Methoden

Weitere Magazine

Empfehlungen

Info

Kapitel 4. Klassifikation mit Hilfe verschiedener Ähnlichkeitsmetriken Tatsächlich abgebildete Ziffer Klassifikationsergebnis 0 1 2 3 4 5 6 7 8 9 0 975 0 11 0 1 2 4 0 10 5 1 1 1131 5 2 12 3 3 17 5 7 2 1 2 995 2 0 0 0 4 1 2 3 0 0 4 969 0 13 0 2 18 6 4 0 1 1 1 936 2 0 3 4 7 5 1 0 0 14 0 852 2 0 6 2 6 1 1 1 1 5 12 948 0 4 1 7 1 0 12 10 3 1 0 991 7 7 8 0 0 3 7 0 1 1 0 913 3 9 0 0 0 4 25 6 0 11 6 969 Tabelle 4.2: Konfusionsmatrix der 4-NN-Klassifikation mit Hammingabstand (α = 41) auf dem gesamten MNIST-Datenbestand (Fehlerrate: 3, 2%) 17 Testbilder, die de facto eine 7 darstellen, als 1 klassifiziert. Gerät bei etwas unsauberer Handschrift der eigentlich annähernd diagonal gedachte lange Strich der 7 etwas zu senkrecht und außerdem der wagerechte Strich etwas zu kurz, ist auch der Mensch beim Lesen nicht vor einer Verwechslung gefeit. Ähnliches kann passieren, wenn der <strong>unter</strong>e waagerechte Strich der 2 sehr kurz ist. Eine gewisse Ähnlichkeit zur 7 ist dann leicht einzusehen. 12 mal hat unser Klassifikator eine 2 für eine 7 gehalten. Ganze 25 mal wurde eine 4 als 9 klassifiziert, anders herum ist das 18 mal passiert. In der Tat sehen sich 4 und 9 recht ähnlich. Davon kann man sich mit Hilfe von Abbildung 4.1 leicht noch einmal überzeugen. Im Verlauf dieser Arbeit werden wir noch eine Reihe weiterer Ähnlichkeitsmetriken zur Klassifikation einsetzen. Diese sind jedoch teilweise mit erheblich höherem Rechenaufwand verbunden. Mit den uns zur Verfügung stehenden Kapazitäten würde eine Berechnung auf dem gesamten MNIST-Datenbestand mit 60.000 Trainings- und 10.000 Testbildern für einige dieser Metriken mehrere Tage bis Wochen in Anspruch nehmen. Aus diesem Grund führen wir die Tests auf einem reduzierten Datenbestand durch. Wie bereits bei der Ermittlung des optimalen Grenzwerts α verwenden wir in dazu je Ziffer 300 Bilder als Trainingsund 50 als Testmenge. Die Auswahl der Datensätze für diese reduzierten Mengen erfolgt stets zufällig. Ein repräsentatives Klassifikationsergebnis, welches im Verlauf der Bestimmung des besten Wertes für α auf dem so reduzierten Datenbestand ermittelt wurde, ist als Konfusionsmatrix in Tabelle 4.3 verzeichnet. Wie bereits zuvor erwähnt konnte durchschnittlich eine Fehlerrate von 6, 2% erzielt werden. Aufgrund der deutlichen Verkleinerung der Trainingsmenge war eine Verschlechterung 34
4.2. Standardmaße Tatsächlich abgebildete Ziffer Klassifikationsergebnis 0 1 2 3 4 5 6 7 8 9 0 50 0 2 0 0 0 0 0 0 0 1 0 50 0 0 1 0 0 0 0 0 2 0 0 44 1 0 1 0 0 0 0 3 0 0 1 44 0 1 0 0 0 1 4 0 0 0 0 46 0 0 0 1 0 5 0 0 0 3 0 44 0 0 3 0 6 0 0 0 0 1 1 50 0 0 0 7 0 0 1 0 0 0 0 49 1 2 8 0 0 1 2 0 2 0 0 45 0 9 0 0 1 0 2 1 0 1 0 47 Tabelle 4.3: 4-NN-Klassifikation mit Hammingabstand (α = 41) auf dem reduzierten MNIST-Datenbestand (Fehlerrate: 6, 2%). der Klassifikationsgüte zu erwarten. Beim vollständigen Datenbestand konnten 96, 8% der Bilder korrekt klassifiziert werden. Hier waren es immerhin noch 93, 8%, der Unterschied ist mit gerade einmal 3% nicht signifikant, zumal die Größenverhältnisse der Klassen etwa gleich geblieben sind. Damit haben wir experimentell gezeigt, dass bereits die k-NN-Klassifikation auf dem reduzierten Datenbestand eine Aussage über die Qualität der verwendeten Ähnlichkeitsdistanz zulässt. Durch die Transformation auf Binärstrings verlieren wir offensichtlich Information über das ursprüngliche Graubild. Dieser Informationsverlust könnte sich negativ auf das Klassifikationsergebnis auswirken. Um dies zu überprüfen, erweitern wir zunächst die Definition des Hammingabstands auf Strings eines beliebigen endlichen Alphabets. Definition 4.5. Sei Σ ein endliches Alphabet. Für zwei Strings x, y ∈ Σ ∗ gleicher Länge ist der Hammingabstand d H (x, y) = |{ i | x i ≠ y i , 1 < i < |x|}| . (4.11) Damit können wir nun den Hammingabstand zweier Graubilder ermitteln. Im Experiment zeigt sich jedoch, dass das Ergebnis deutlich hinter der zuvor beschriebenen Klassifikationsgüte auf Binärbildern mit Grenzwert zurück bleibt. In mehreren Testdurchläufen wurden Fehlerraten im Bereich zwischen 30 und 35% ermittelt. Das führen wir darauf zurück, dass es beim Vergleich der Grauwerte in den MNIST-Bildern keine Abstufung der Ähnlichkeiten gibt. So wirkt sich beispielsweise der Unterschied der Grauwerte x 1 = 254 und y 1 = 255 genauso auf den Hammingabstand aus wie bei x 2 = 0 und y 2 = 255. Aufgrund 35
Seite 1: Universität zu Lübeck Institut f
Seite 5: Aufgabenstellung v
Seite 8 und 9: Inhaltsverzeichnis 5.1 Adaption aus
Seite 10 und 11: Kapitel 1. Einleitung so doch zumin
Seite 12 und 13: Kapitel 2. Kompressionsbasierte Äh
Seite 28 und 29: Kapitel 3. Grundlagen der maschinel
Seite 36 und 37: Kapitel 4. Klassifikation mit Hilfe
Seite 73 und 74: 5 Negative Selection 5.1 Adaption a
Seite 75 und 76: 5.1. Adaption aus der Immunologie D
Seite 77 und 78: 5.2. Anwendung mit Hammingabstand A
Seite 79 und 80: 5.2. Anwendung mit Hammingabstand d
Seite 81 und 82: 5.2. Anwendung mit Hammingabstand t
Seite 83: 5.2. Anwendung mit Hammingabstand W
Seite 86 und 87: Kapitel 6. Zusammenfassung, Fazit u
Seite 89 und 90: Abbildungsverzeichnis 3.1 Beispiel
Seite 91 und 92: Bibliographie [BGL + 98] Charles H.

Bildklassifikation unter Verwendung kompressionsbasierter Methoden

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?