Diplomarbeit von Michael Schindler
Diplomarbeit von Michael Schindler
Diplomarbeit von Michael Schindler
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
1.1 Dichteschätzung mit einer Mischung multivariater Normalverteilungen 15<br />
1<br />
0<br />
p(x)<br />
ˆp(x)<br />
(a)<br />
c1 c2 c3 x<br />
ˆP(1|x)<br />
ˆP(2|x)<br />
ˆP(3|x)<br />
(b)<br />
c1 c2 c3 x<br />
Abbildung 8: (a) Approximation der Verteilungsdichte p (graue Linie) durch eine<br />
Mischung ˆp aus drei Normalverteilungen (durchgezogene Linie). Jede der drei<br />
Glockenkurven (gepunktet eingezeichnet) mittelt Datenpunkte x nur in ihrem<br />
Zuständigkeitsbereich, der entsprechend Gleichung (1-10) in (b) eingezeichnet ist.<br />
Die drei Funktionen in (b) bilden eine unscharfe Partitionierung des Merkmalsraumes.<br />
Sie lassen sich an jeder Stelle zu 1 aufaddieren.<br />
Hier soll als Approximation ˆp eine gewichtete endliche Mischung <strong>von</strong> M multivariaten<br />
Normalverteilungen verwendet werden,<br />
ˆp(x; θ) :=<br />
M�<br />
r=1<br />
ˆPr<br />
(2π) d/2 �<br />
exp −<br />
|Σr| 1/2 1<br />
2 (x − cr) T Σ −1<br />
�<br />
r (x − cr) , (1-3)<br />
die als Parameter einen Satz <strong>von</strong> Zentren cr, <strong>von</strong> Kovarianzmatrizen Σr und Gewichtungen<br />
ˆ Pr hat. Diese sind in der Variablen θ zusammengefasst,<br />
θ := (θ1, . . ., θM),<br />
θr := {cr, Σr, ˆ Pr}.<br />
(1-4)<br />
Es soll also eine parametrische Dichteschätzung durchgeführt werden. Das Ergebnis<br />
einer solchen Schätzung in einer Dimension könnte wie in Abbildung 8a aussehen, in<br />
der mit drei Normalverteilungen approximiert wurde.<br />
Das Maximum-likelihood-Prinzip<br />
Bei der Suche nach dem besten Modell für p handelt es sich um ein Optimierungsproblem<br />
der Parameter θ. Zur Lösung dieser Aufgabe führt das bekannte Maximumlikelihood<br />
(ML)-Kriterium (Duda & Hart, 1973), das im folgenden kurz beschrieben<br />
werden soll. Wäre zur Generierung des Datensatzes X statt der unbekannten Verteilungsdichte<br />
p die Approximation ˆp zugrundeglegt worden, 2 dann wäre die Wahrschein-<br />
2 Wahrscheinlichkeiten und W-Dichten, die geschätzte Modelle sind, tragen im folgenden ein Hütchen<br />
(ˆ). Sie hängen alle parametrisch <strong>von</strong> θ ab. Um die Notation zu vereinfachen, wird θ an den meisten