21.12.2012 Aufrufe

Klassifikation von Mustern

Klassifikation von Mustern

Klassifikation von Mustern

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

4.1. STATISTISCHE ENTSCHEIDUNGSTHEORIE (VA.1.2.3, 13.04.2004) 307<br />

p(c|Ωκ) hat. Ergebnis des Zufallsprozesses ist also das Paar (κ, ϱ c), d. h. eine Klassennummer<br />

(Zusatzinformation, s. (1.3.1), S. 19) und eine Beobachtung (Wert einer Zufallsvariablen).<br />

Die BAYES-Regel ist die Basis der statistischen Inferenz, mit der, wie schon in Abschnitt 1.5<br />

erwähnt, die a priori Wahrscheinlichkeit pκ einer Klasse vor Beobachtung eines Merkmalsvektors<br />

c in die a posteriori Wahrscheinlichkeit p(Ωκ|c) nach Beobachtung eines Merkmalsvektors<br />

transformiert wird. Sie bildet eine mathematisch einwandfreie Basis für statistische Inferenzen.<br />

Wenn Muster klassifiziert werden, können Fehlklassifikationen auftreten. Um den Einfluss<br />

<strong>von</strong> Fehlern bei der Beurteilung der Klassifikatorleistung zu erfassen, werden den Fehlern wie<br />

erwähnt Kosten zugeordnet. Mit<br />

rλκ = r(Ωλ |Ωκ) , λ = 0, 1, . . . , k , κ = 1, . . . , k (4.1.4)<br />

werden die Kosten bezeichnet, die entstehen, wenn man ein Muster nach Ωλ klassifiziert, obwohl<br />

es tatsächlich aus Ωκ stammt. Es wird vorausgesetzt, dass die Kosten rλκ bekannt sind und<br />

der Bedingung<br />

0 ≤ rκκ < r0κ < rλκ , λ = κ (4.1.5)<br />

genügen, d. h. Kosten sind nicht negativ und die Kosten einer richtigen Entscheidung sind geringer<br />

als die einer Rückweisung, und diese sind wiederum geringer als die Kosten einer Fehlklassifikation.<br />

Bei geeigneter Wahl der Kosten ergeben sich auch Beziehungen zur Fehlerwahrscheinlichkeit,<br />

wie später noch gezeigt wird.<br />

Die frei wählbare Entscheidungsregel wird mit δ(Ωλ|c) bezeichnet und gibt die Wahrscheinlichkeit<br />

an, mit der man sich für die Klasse Ωλ entscheidet, wenn der Merkmalsvektor c<br />

beobachtet wurde. Eine solche randomisierte Entscheidungsregel wird wegen ihrer größeren<br />

Allgemeinheit hier zunächst zugelassen. Allerdings wird sich zeigen, dass der optimale Klassifikator<br />

eine nicht randomisierte Regel verwendet. Diese ist ein Spezialfall der randomisierten<br />

Regel, bei dem für jeden Merkmalsvektor mit der Wahrscheinlichkeit 1 eine Entscheidung für<br />

genau eine der möglichen Klassen erfolgt und alle anderen die Wahrscheinlichkeit 0 haben. In<br />

der Literatur wird vielfach der optimale Klassifikator bestimmt, wenn <strong>von</strong> vornherein nur eine<br />

nicht randomisierte Regel zugelassen wird. Es wird noch vorausgesetzt, dass<br />

k<br />

δ(Ωλ |c) = 1 oder<br />

λ=1<br />

k<br />

δ(Ωλ |c) = 1 (4.1.6)<br />

λ=0<br />

ist, d. h. auch bei der randomisierten Regel erfolgt immer eine Entscheidung für eine der vorhandenen<br />

Klassen. Der wesentliche Unterschied zwischen nicht randomisierter und randomisierter<br />

Regel ist, dass bei mehrfacher Beobachtung des gleichen Merkmalsvektors <strong>von</strong> ersterer auch<br />

stets für die gleiche Klasse entschieden wird, <strong>von</strong> letzterer dagegen nicht. Intuitiv scheint eine<br />

randomisierte Regel für die Mustererkennung wenig sinnvoll, jedoch ist zunächst offen, ob sich<br />

durch ihre Anwendung nicht ein geringeres Risiko ergibt.<br />

Die wesentlichen Elemente eines Klassifikators sind also:<br />

• Die a priori Wahrscheinlichkeiten pκ der Klassen. Sie sind durch den Problemkreis bestimmt<br />

und müssen gegebenenfalls vom Entwickler eines Klassifikators geschätzt werden.<br />

• Die bedingten Verteilungsdichten p(c|Ωκ) der Merkmalsvektoren. Sie liegen durch den<br />

Problemkreis, die verwendeten Sensoren und die gewählte Vorverarbeitung und Merkmalsgewinnung<br />

fest und müssen vom Entwickler eines Klassifikators geschätzt werden.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!