21.12.2012 Aufrufe

Klassifikation von Mustern

Klassifikation von Mustern

Klassifikation von Mustern

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

244 KAPITEL 3. MERKMALE (VK.2.3.3, 13.04.2004)<br />

3.8.5 Bemerkungen<br />

Die Idee, Merkmale zu bestimmen, welche die Fehlerwahrscheinlichkeit minimieren, ist zunächst<br />

äußerst attraktiv. Der Algorithmus zur Bestimmung solcher Merkmale für den MMA gibt<br />

einen Eindruck <strong>von</strong> dem dafür erforderlichen Rechenaufwand und den daraus resultierenden<br />

praktischen Grenzen. Der Rechenaufwand für lineare Transformationen zur Merkmalsgewinnung<br />

ist für die FOURIER- und WALSH-Transformation in Abschnitt 3.2.2, 3.2.5 am geringsten,<br />

da es schnelle Algorithmen dafür gibt und die Transformationsmatrix für alle Problemkreise<br />

dieselbe ist (bei festem M). Für die Hauptachsentransformation und ähnliche problemabhängige<br />

Verfahren in Abschnitt 3.8.2 gibt es keine schnellen Algorithmen und die Transformationsmatrix<br />

Φ muss für jeden Problemkreis neu berechnet werden. Der Rechenaufwand vergrößert<br />

sich, bleibt aber unproblematisch, solange man einfache Muster klassifizieren will, bei denen<br />

die Zahl der Abtastwerte bei etwa M = 300 bis 3000 liegt. Bei den optimalen Transformationen<br />

<strong>von</strong> Abschnitt 3.8.4 wird die Berechnung der Transformationsmatrix zu einem echten Problem<br />

aufgrund der Rechenzeit, obwohl man diese Berechnung für jedes System nur einmal vorweg<br />

durchzuführen hat.<br />

Ein experimenteller Vergleich <strong>von</strong> verschiedenen Transformationen kann durchgeführt werden,<br />

indem man für eine Stichprobe ω <strong>von</strong> <strong>Mustern</strong> verschiedene Verfahren der Merkmalsgewinnung<br />

realisiert und mit Hilfe eines Klassifikators die Fehlerrate pf, also einen Schätzwert der<br />

Fehlerwahrscheinlichkeit, berechnet. Dieses ist in Bild 3.8.9 für zwei verschiedene Stichproben<br />

dargestellt.<br />

Bild 3.8.9a zeigt das Ergebnis für eine Stichprobe mit etwa 22.000 handgedruckten Ziffern<br />

der Klassen „0“ bis „9“. Die Ziffern wurden in einem 16 × 12 Raster größennormiert dargestellt<br />

und zufällig in eine Lernstichprobe <strong>von</strong> etwa 10.000 und eine Teststichprobe <strong>von</strong> etwa<br />

12.000 <strong>Mustern</strong> zerlegt. In Bild 3.8.9b ist das Ergebnis für eine Stichprobe mit etwa 15.000<br />

isoliert gesprochenen Ziffern der Klassen „null“ bis „neun“ dargestellt. Die gesprochenen Ziffern<br />

waren als 14 × 20 Matrix in vorverarbeiteter Form gegeben, wobei die 14 Zeilen der Matrix<br />

Energieanteile je eines Terz-Bandfilters enthalten und die 20 Spalten eine Unterteilung der<br />

Dauer des Wortes in 20 gleichlange Zeitabschnitte ergeben. Auch hier wurde eine Lernstichprobe<br />

mit etwa 10.000 und eine Teststichprobe mit etwa 5.000 <strong>Mustern</strong> gebildet. Das <strong>Klassifikation</strong>ssystem<br />

wurde mit der Lernstichprobe dimensioniert, Fehlerraten mit der Teststichprobe<br />

ermittelt. Als Klassifikator wurde der in Abschnitt 4.2.5 beschriebene optimale Klassifikator<br />

für normalverteilte Merkmale verwendet. Mit DFT2D bzw. WHT2D werden Merkmale<br />

gemäß (3.2.23) bzw. (3.2.59) bezeichnet, die man aus der zweidimensionalen FOURIERbzw.<br />

WALSH-Transformation erhält. Aus den Koeffizientenmatrizen wurden die ersten n wie in<br />

Bild 3.2.3, S. 174, ausgewählt. Eine Merkmalsbewertung und –auswahl mit den Methoden <strong>von</strong><br />

Abschnitt 3.9 wurde absichtlich nicht vorgenommen. Mit KLT werden in Bild 3.8.9 Merkmale<br />

bezeichnet, die s1 in (3.8.1) maximieren, d. h. es ist die KARHUNEN–LOÈVE-Transformation,<br />

und mit DIV bzw. MMA werden Merkmale bezeichnet, die die mittlere Divergenz (3.9.15)<br />

maximieren bzw. s6 in (3.8.85) minimieren. Bei MMA und DIV Merkmalen wurde, wie in<br />

Abschnitt 3.8.4 erwähnt, eine KL Transformation vorgeschaltet, d. h. statt der Abtastwerte f<br />

wurden in (3.2.2) die ersten 70 Koeffizienten der KL Transformation genommen.<br />

Sicherlich kann ein experimenteller Vergleich keine allgemeine Aussage über die Güte <strong>von</strong><br />

Verfahren zur Merkmalsgewinnung liefern, aber die Ergebnisse an den beiden umfangreichen<br />

Stichproben geben einen Eindruck <strong>von</strong> den Grenzen und relativen Vorteilen der Verfahren.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!