21.12.2012 Aufrufe

Klassifikation von Mustern

Klassifikation von Mustern

Klassifikation von Mustern

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

372 KAPITEL 4. NUMERISCHE KLASSIFIKATION (VK.2.3.3, 07.09.2005)<br />

= (p(Ω1 |c), . . . , p(Ωk |c)) T . (4.4.18)<br />

Die letzte Zeile ergibt sich aus der speziellen Wahl <strong>von</strong> δ gemäß (4.4.8), (4.4.11). Die beste<br />

Trennfunktion d ∗ (c), die für die gewählte ideale Trennfunktion δ(c) in (4.4.8) den mittleren<br />

quadratischen Fehler minimiert, ist also der Vektor der a posteriori Wahrscheinlichkeiten<br />

(4.4.18). Ein Vergleich <strong>von</strong> (4.1.33), (4.1.34) und (4.4.1), (4.4.18) ergibt, dass dieser Klassifikator<br />

mit dem optimalen BAYES-Klassifikator identisch ist. Dieses Ergebnis wird zusammengefasst<br />

in<br />

Satz 4.15 Der BAYES-Klassifikator (4.1.33), der die Fehlerwahrscheinlichkeit minimiert,<br />

und der Polynomklassifikator (4.4.1), der bei uneingeschränkter Trennfunktion die mittlere<br />

quadratische Abweichung <strong>von</strong> der idealen Trennfunktion (4.4.8) minimiert, sind identisch.<br />

Der obige Satz liefert eine theoretische Begründung dafür, dass der gewählte Ansatz gegenüber<br />

anderen möglichen vorgezogen wird. Die Funktion d ∗ (c) in (4.4.17) wird als Regressionsfunktion<br />

bezeichnet. Die einfache geschlossene Form <strong>von</strong> (4.4.17) darf nicht darüber hinwegtäuschen,<br />

dass die Berechnung <strong>von</strong> d ∗ i. Allg. keineswegs einfach ist. Aus (4.4.18) und<br />

(4.1.34) geht hervor, dass dafür vollständige statistische Information, insbesondere die bedingten<br />

Dichten p(c|Ωκ), erforderlich ist. Wenn man jedoch die zulässigen Funktionen d(c) wie in<br />

(4.4.3) einschränkt, ergeben sich numerisch auswertbare Gleichungen für die Berechnung der<br />

Trennfunktionen, wie im Folgenden gezeigt wird. Bei den so eingeschränkten Trennfunktionen<br />

ist, wie erwähnt, nur noch die Parametermatrix A zu berechnen. Dafür eignen sich folgende<br />

Verfahren.<br />

2. Direkte Lösung<br />

Gesucht ist die Matrix A ∗ , welche den Fehler (4.4.14)<br />

ε = E (δ(c) − A T ϕ(c)) 2<br />

minimiert. Als direkte Lösung bezeichnen wir hier die Auswertung der bekannten Bedingung,<br />

dass dann die partiellen Ableitungen <strong>von</strong> ε nach den Elementen aij <strong>von</strong> A verschwinden müssen.<br />

Das Ergebnis ist<br />

Satz 4.16 Die optimale Parametermatrix A ∗ , die (4.4.14) minimiert, erhält man aus<br />

A ∗ = E ϕ(c)ϕ T (c) −1 E ϕ(c)δ T (c) . (4.4.19)<br />

Dabei ist die Existenz der inversen Matrix <strong>von</strong> E{ϕϕ T } vorausgesetzt.<br />

Beweis: Notwendige Bedingung für ein relatives Extremum ist<br />

∂ε<br />

∂A =<br />

<br />

∂ε<br />

= 0 ,<br />

∂ε<br />

∂aij<br />

∂aij<br />

= E ∂(δ − A T ϕ) 2<br />

= E<br />

<br />

2<br />

<br />

∂aij<br />

δj − <br />

ν<br />

aνjϕj<br />

<br />

(−ϕi)<br />

<br />

, (4.4.20)

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!