21.12.2012 Aufrufe

Klassifikation von Mustern

Klassifikation von Mustern

Klassifikation von Mustern

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

352 KAPITEL 4. NUMERISCHE KLASSIFIKATION (VK.2.3.3, 07.09.2005)<br />

2. Man versucht, andere Merkmale zu finden, für die die Annahme der Normalverteilung<br />

besser zutrifft.<br />

3. Man untersucht, ob ein anderer Klassifikator, wie die in den folgenden Abschnitten beschriebenen,<br />

bessere Ergebnisse liefert.<br />

Die hier aufgezeigten Möglichkeiten erfordern einen hohen experimentellen Aufwand. Das mag<br />

für den elegante geschlossene Lösungen suchenden Theoretiker unbefriedigend und für den<br />

schnelle Erfolge erwartenden Anwender unrealistisch erscheinen. Es gibt aber nicht einige wenige<br />

mit einer kleinen Stichprobe einfach zu schätzende Parameter, mit denen sich eine Aussage<br />

machen ließe, welche Merkmale und welcher Klassifikator der beste ist; bei der Komplexität<br />

des Problems ist das auch nicht zu erwarten. Sorgfältige und entsprechend aufwendige experimentelle<br />

Untersuchungen sind daher unerlässlich. Natürlich wird man dabei bereits bekannte<br />

experimentelle Ergebnisse berücksichtigen und nicht erneut erarbeiten.<br />

Die Realisierung eines Klassifikators gemäß (4.1.33) und (4.2.116) unter der Annahme normalverteilter<br />

Merkmale ist relativ einfach, vorausgesetzt es steht eine klassifizierte Stichprobe<br />

mit Nκ > n <strong>Mustern</strong> je Klasse zur Verfügung. Auch wenn die Merkmale nur näherungsweise<br />

normalverteilt sind, gibt es erfahrungsgemäß verschiedene praktisch interessante Aufgaben, bei<br />

denen dieser Klassifikator gute Ergebnisse liefert.<br />

4.2.6 Nichtparametrische Schätzung <strong>von</strong> Verteilungsdichten<br />

In Abschnitt 4.2 wurde mit (4.1.1) vorausgesetzt, dass bestimmte statistische Vorkenntnisse in<br />

Form einer parametrischen Familie <strong>von</strong> Verteilungsdichten gegeben sind. Mit Hilfe nichtparametrischer<br />

statistischer Verfahren ist es möglich, Verteilungsdichten zu schätzen, ohne solche<br />

Vorkenntnisse zu verlangen.<br />

Als nichtparametrisches statistisches Verfahren bezeichnet man eines, das für viele,<br />

wenn möglich für alle, Familien <strong>von</strong> Verteilungsdichten gültig ist.<br />

Der Preis dafür ist meistens, wie sich noch zeigen wird, dass die gesamte Stichprobe ω gespeichert<br />

werden muss. Bei den Klassifikatoren <strong>von</strong> Abschnitt 4.2.5 und Abschnitt 4.4 genügt<br />

die Speicherung der Parametervektoren, deren Größe insbesondere unabhängig vom Umfang<br />

der Stichprobe ist. Die praktische Bedeutung dieser nichtparametrischen Schätzungen ist daher<br />

begrenzt, sodass nur kurz auf sie eingegangen wird. Als Beispiele für nichtparametrische<br />

Schätzungen werden die direkte Schätzung und die PARZEN-Schätzung behandelt. Die direkte<br />

Schätzung beruht darauf, dass man einen Schätzwert p(c|Ωκ) für die Verteilungsdichte im<br />

Punkt c erhält aus<br />

p(c|Ωκ) = Pκ<br />

V<br />

, (4.2.132)<br />

wobei V ein bestimmtes Volumen des R n ist und c enthält, und Pκ ist die Wahrscheinlichkeit,<br />

dass Merkmalsvektoren aus Ωκ im Volumen V liegen. Ist eine Stichprobe <strong>von</strong> <strong>Mustern</strong> aus Ωκ<br />

vom Umfang Nκ gegeben und liegen mκ Muster in V , so ist ein Schätzwert für Pκ<br />

Pκ = mκ<br />

Nκ<br />

. (4.2.133)<br />

Als Schätzwert der bedingten Dichte wird nun<br />

p(c|Ωκ) = Pκ<br />

V<br />

= mκ<br />

Nκ V<br />

(4.2.134)

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!