30.10.2013 Aufrufe

Bildklassifikation unter Verwendung kompressionsbasierter Methoden

Bildklassifikation unter Verwendung kompressionsbasierter Methoden

Bildklassifikation unter Verwendung kompressionsbasierter Methoden

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

4.2. Standardmaße<br />

Tatsächlich abgebildete Ziffer<br />

Klassifikationsergebnis<br />

0 1 2 3 4 5 6 7 8 9<br />

0 50 0 2 0 0 0 0 0 0 0<br />

1 0 50 0 0 1 0 0 0 0 0<br />

2 0 0 44 1 0 1 0 0 0 0<br />

3 0 0 1 44 0 1 0 0 0 1<br />

4 0 0 0 0 46 0 0 0 1 0<br />

5 0 0 0 3 0 44 0 0 3 0<br />

6 0 0 0 0 1 1 50 0 0 0<br />

7 0 0 1 0 0 0 0 49 1 2<br />

8 0 0 1 2 0 2 0 0 45 0<br />

9 0 0 1 0 2 1 0 1 0 47<br />

Tabelle 4.3: 4-NN-Klassifikation mit Hammingabstand (α = 41) auf dem reduzierten<br />

MNIST-Datenbestand (Fehlerrate: 6, 2%).<br />

der Klassifikationsgüte zu erwarten. Beim vollständigen Datenbestand konnten<br />

96, 8% der Bilder korrekt klassifiziert werden. Hier waren es immerhin noch<br />

93, 8%, der Unterschied ist mit gerade einmal 3% nicht signifikant, zumal die<br />

Größenverhältnisse der Klassen etwa gleich geblieben sind. Damit haben wir<br />

experimentell gezeigt, dass bereits die k-NN-Klassifikation auf dem reduzierten<br />

Datenbestand eine Aussage über die Qualität der verwendeten Ähnlichkeitsdistanz<br />

zulässt.<br />

Durch die Transformation auf Binärstrings verlieren wir offensichtlich Information<br />

über das ursprüngliche Graubild. Dieser Informationsverlust könnte sich<br />

negativ auf das Klassifikationsergebnis auswirken. Um dies zu überprüfen, erweitern<br />

wir zunächst die Definition des Hammingabstands auf Strings eines<br />

beliebigen endlichen Alphabets.<br />

Definition 4.5. Sei Σ ein endliches Alphabet. Für zwei Strings x, y ∈ Σ ∗<br />

gleicher Länge ist der Hammingabstand<br />

d H (x, y) = |{ i | x i ≠ y i , 1 < i < |x|}| . (4.11)<br />

Damit können wir nun den Hammingabstand zweier Graubilder ermitteln. Im<br />

Experiment zeigt sich jedoch, dass das Ergebnis deutlich hinter der zuvor beschriebenen<br />

Klassifikationsgüte auf Binärbildern mit Grenzwert zurück bleibt.<br />

In mehreren Testdurchläufen wurden Fehlerraten im Bereich zwischen 30 und<br />

35% ermittelt. Das führen wir darauf zurück, dass es beim Vergleich der Grauwerte<br />

in den MNIST-Bildern keine Abstufung der Ähnlichkeiten gibt. So wirkt<br />

sich beispielsweise der Unterschied der Grauwerte x 1 = 254 und y 1 = 255 genauso<br />

auf den Hammingabstand aus wie bei x 2 = 0 und y 2 = 255. Aufgrund<br />

35

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!