21.12.2012 Aufrufe

Diplomarbeit von Michael Schindler

Diplomarbeit von Michael Schindler

Diplomarbeit von Michael Schindler

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

1.1 Dichteschätzung mit einer Mischung multivariater Normalverteilungen 15<br />

1<br />

0<br />

p(x)<br />

ˆp(x)<br />

(a)<br />

c1 c2 c3 x<br />

ˆP(1|x)<br />

ˆP(2|x)<br />

ˆP(3|x)<br />

(b)<br />

c1 c2 c3 x<br />

Abbildung 8: (a) Approximation der Verteilungsdichte p (graue Linie) durch eine<br />

Mischung ˆp aus drei Normalverteilungen (durchgezogene Linie). Jede der drei<br />

Glockenkurven (gepunktet eingezeichnet) mittelt Datenpunkte x nur in ihrem<br />

Zuständigkeitsbereich, der entsprechend Gleichung (1-10) in (b) eingezeichnet ist.<br />

Die drei Funktionen in (b) bilden eine unscharfe Partitionierung des Merkmalsraumes.<br />

Sie lassen sich an jeder Stelle zu 1 aufaddieren.<br />

Hier soll als Approximation ˆp eine gewichtete endliche Mischung <strong>von</strong> M multivariaten<br />

Normalverteilungen verwendet werden,<br />

ˆp(x; θ) :=<br />

M�<br />

r=1<br />

ˆPr<br />

(2π) d/2 �<br />

exp −<br />

|Σr| 1/2 1<br />

2 (x − cr) T Σ −1<br />

�<br />

r (x − cr) , (1-3)<br />

die als Parameter einen Satz <strong>von</strong> Zentren cr, <strong>von</strong> Kovarianzmatrizen Σr und Gewichtungen<br />

ˆ Pr hat. Diese sind in der Variablen θ zusammengefasst,<br />

θ := (θ1, . . ., θM),<br />

θr := {cr, Σr, ˆ Pr}.<br />

(1-4)<br />

Es soll also eine parametrische Dichteschätzung durchgeführt werden. Das Ergebnis<br />

einer solchen Schätzung in einer Dimension könnte wie in Abbildung 8a aussehen, in<br />

der mit drei Normalverteilungen approximiert wurde.<br />

Das Maximum-likelihood-Prinzip<br />

Bei der Suche nach dem besten Modell für p handelt es sich um ein Optimierungsproblem<br />

der Parameter θ. Zur Lösung dieser Aufgabe führt das bekannte Maximumlikelihood<br />

(ML)-Kriterium (Duda & Hart, 1973), das im folgenden kurz beschrieben<br />

werden soll. Wäre zur Generierung des Datensatzes X statt der unbekannten Verteilungsdichte<br />

p die Approximation ˆp zugrundeglegt worden, 2 dann wäre die Wahrschein-<br />

2 Wahrscheinlichkeiten und W-Dichten, die geschätzte Modelle sind, tragen im folgenden ein Hütchen<br />

(ˆ). Sie hängen alle parametrisch <strong>von</strong> θ ab. Um die Notation zu vereinfachen, wird θ an den meisten

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!