21.12.2012 Aufrufe

Klassifikation von Mustern

Klassifikation von Mustern

Klassifikation von Mustern

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

28 KAPITEL 1. EINFÜHRUNG (VK.1.3.3, 16.03.2003)<br />

Zwei Behälter<br />

An den Anfang wird ein vereinfachtes Problem gestellt. Gegeben seien zwei äußerlich gleiche<br />

Behälter Ω1 und Ω2. Der Behälter Ω1 enthält 100 rote und 900 blaue Kugeln, der Behälter Ω2<br />

enthält 900 rote und 100 blaue Kugeln. Einer der Behälter wird zufällig herausgegriffen. Offensichtlich<br />

ist die a priori Wahrscheinlichkeit dafür, den Behälter Ω1 zu haben, gleich 0.5.<br />

Nun wird aus dem gewählten Behälter eine Kugel entnommen, d. h. es wird eine Beobachtung<br />

gemacht bzw. der Wert eines Merkmals bestimmt. Die Kugel sei blau, und die Frage ist,<br />

wie groß nun die Wahrscheinlichkeit für den Behälter Ω1 ist. Gesucht ist also die a posteriori<br />

Wahrscheinlichkeit dafür, dass eine bestimmte Alternative vorliegt (Ω1 oder Ω2), nachdem<br />

eine bestimmte Beobachtung gemacht wurde (eine blaue Kugel). Aus bekannten Beziehungen<br />

über bedingte Wahrscheinlichkeiten, insbesondere aus der BAYES-Regel (4.1.3), S. 306, folgt<br />

P (Ω1|b) = P (b|Ω1)P (Ω1)<br />

P (b)<br />

=<br />

P (b|Ω1)P (Ω1)<br />

P (b|Ω1)P (Ω1) + P (b|Ω2)P (Ω2)<br />

= 0, 9 . (1.5.1)<br />

Wir haben damit eine Gleichung, die die a priori Wahrscheinlichkeit P (Ω1) der Urne vor einer<br />

Beobachtung in die a posteriori Wahrscheinlichkeit P (Ω1 |b) nach Beobachtung einer blauen<br />

Kugel transformiert.<br />

Es wird nun eine zweite Kugel entnommen, die ebenfalls blau ist. Wie groß ist danach die<br />

Wahrscheinlichkeit für den Behälter Ω1? Gesucht wird also die Wahrscheinlichkeit P (Ω1|b, b),<br />

die sich ergibt zu<br />

P (Ω1|b, b) =<br />

P (b, b|Ω1)P (Ω1)<br />

P (b, b|Ω1)P (Ω1) + P (b, b|Ω2)P (Ω2) ,<br />

= 0, 988 . (1.5.2)<br />

Daraus ist der wichtige Schluss zu ziehen, dass man unsichere Einzelbeobachtungen (die Farbe<br />

einer Kugel gibt keine Sicherheit über den Behälter) so kombinieren kann, dass das Gesamtereignis<br />

(gewählter Behälter) immer sicherer wird. Weiter ist festzustellen, dass zur Berechnung<br />

der a posteriori Wahrscheinlichkeiten die bedingte Wahrscheinlichkeit der Kugelfarbe<br />

P (b|Ωκ) erforderlich ist.<br />

Die Verallgemeinerungen für das Problem der <strong>Klassifikation</strong> <strong>von</strong> <strong>Mustern</strong> sind:<br />

• Ein Behälter ⇒ eine Musterklasse Ωκ ⇒ eine Folge <strong>von</strong> Klassen Ω;<br />

• eine Kugel ⇒ ein Merkmal cν ⇒ ein Vektor c <strong>von</strong> Merkmalen bzw. eine Folge <strong>von</strong><br />

Attributen;<br />

• die Farbe einer Kugel ⇒ der Wert eines Merkmals ⇒ ein Folge <strong>von</strong> beobachteten Werten;<br />

• berechne P (Ω1 |b, b) ⇒ berechne P (Ωκ|c), κ = 1, . . . , k und wähle die Klasse (den<br />

Behälter) mit größter a posteriori Wahrscheinlichkeit.<br />

In Abschnitt 4.1 wird gezeigt, dass die letztere intuitive Strategie, sich für die Alternative mit<br />

größter a posteriori Wahrscheinlichkeit zu entscheiden, sogar optimal in dem Sinne ist, dass sie<br />

die Fehlerwahrscheinlichkeit minimiert.<br />

Wie erwähnt ist die Basis dieser Vorgehensweise die Berechnung der a posteriori Wahrscheinlichkeiten<br />

aller alternativen Entscheidungen bzw. Klassen. Dieses erfordert ein stocha-

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!