21.12.2012 Aufrufe

Klassifikation von Mustern

Klassifikation von Mustern

Klassifikation von Mustern

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

3.1. ANLIEGEN UND ALLGEMEINE ANSÄTZE (VA.1.2.2, 15.11.2005) 163<br />

3.1 Anliegen und allgemeine Ansätze (VA.1.2.2, 15.11.2005)<br />

Die Einführung der Stufe „Merkmale“ zwischen Vorverarbeitung und <strong>Klassifikation</strong> in<br />

Bild 1.4.1, S. 26, beruht darauf, dass eine direkte <strong>Klassifikation</strong> der Abtastwerte f eines Musters<br />

f(x) vielfach unmöglich oder unzweckmäßig erscheint. Sie erscheint vielfach unmöglich<br />

wegen der großen Zahl <strong>von</strong> Abtastwerten, die dann vom Klassifikator verarbeitet werden müssten.<br />

So werden z. B. Schriftzeichen mit einer anfänglichen Auflösung bis zu 40 × 30 = 1200<br />

Abtastwerten dargestellt; ein isoliert gesprochenes Wort <strong>von</strong> 1 s Dauer ergibt bei einer Abtastfrequenz<br />

<strong>von</strong> 10 kHz bereits 10.000 Abtastwerte; und ein mit Fernsehqualität aufgenommener<br />

Fingerabdruck liefert etwa 512 × 512 260.000 Abtastwerte. Ein Zweck der Merkmalsgewinnung<br />

ist also die Reduktion der Datenmenge. Die direkte <strong>Klassifikation</strong> der Abtastwerte<br />

erscheint vielfach unzweckmäßig, da die vollständige Darstellung des Musters (im Sinne <strong>von</strong><br />

Satz 2.1, S. 65) für die <strong>Klassifikation</strong> weniger wichtig ist als die Herausarbeitung der „trennscharfen“<br />

Information, welche die Unterscheidung <strong>von</strong> <strong>Mustern</strong> verschiedener Klassen erlaubt.<br />

Zum Beispiel ist für die Unterscheidung der großen Druckbuchstaben O und Q vor allem der<br />

rechte untere Teil wichtig. Merkmale sollten also möglichst die für die <strong>Klassifikation</strong> charakteristischen<br />

Eigenschaften der Muster enthalten, aber auch nicht mehr. Ein weiterer Zweck der<br />

Merkmalsgewinnung ist also die Konzentration auf die für die <strong>Klassifikation</strong> wichtige Information.<br />

Man wird bestrebt sein, solche Merkmale zu finden, welche die „Güte“ des Gesamtsystems<br />

maximieren. Bei der Beurteilung der Güte sollten unter anderem die Kosten des Systems,<br />

die Verarbeitungsgeschwindigkeit und die Fehlerwahrscheinlichkeit bei der <strong>Klassifikation</strong> <strong>von</strong><br />

<strong>Mustern</strong> berücksichtigt werden, bzw. die in (1.8.1), S. 49, genannten Größen. Bisher gibt es<br />

keine Algorithmen, mit denen solche Merkmale systematisch erzeugt werden können. Daher<br />

werden die an sich wünschenswerten Anforderungen an Merkmale reduziert, wobei vor allem<br />

zwei Einschränkungen vorgenommen werden:<br />

1. Als Gütekriterium werden nur die Fehlerwahrscheinlichkeit und die Zahl der Merkmale<br />

betrachtet. Statt der Fehlerwahrscheinlichkeit wird zudem oft ein mathematisch einfacher<br />

zu behandelndes Kriterium gewählt.<br />

2. Es wird nicht das Gesamtsystem betrachtet, sondern nur der Modul Merkmalsgewinnung,<br />

d. h. die Merkmale werden weitgehend unabhängig <strong>von</strong> den Vorverarbeitungsoperationen<br />

und dem Klassifikator ermittelt.<br />

Mit diesen beiden Vereinfachungen wird in praktisch allen Ansätzen zur Merkmalsgewinnung<br />

gearbeitet; eine Ausnahme enthält Abschnitt 3.8.4.<br />

Es lassen sich zwei grundsätzliche Typen <strong>von</strong> Merkmalen unterscheiden, nämlich die durch<br />

reelle Zahlen und die durch Symbole (oder auch nominale Merkmale) gekennzeichneten. Im<br />

ersten Falle wird jedem Muster ϱ f(x) oder dessen Abtastwerten ϱ f mit einer Transformation Tr<br />

ein Merkmalsvektor<br />

ϱ c = Tr{ ϱ f } , ϱ = 1, 2, . . . (3.1.1)<br />

zugeordnet. Im Folgenden wird stets angenommen, dass der Merkmalsvektor ein Spaltenvektor<br />

ϱ c = ( ϱ c1, ϱ c2, . . . , ϱ cν, . . . , ϱ cn) T ,<br />

ϱ cν ∈ R (3.1.2)<br />

mit n reellwertigen Komponenten ϱ cν ist. Der Index T in (3.1.2) kennzeichnet die Transponierung<br />

des Vektors. Falls die Bezeichnung individueller Muster und Merkmalsvektoren unnötig

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!