Diplomarbeit von Michael Schindler
Diplomarbeit von Michael Schindler
Diplomarbeit von Michael Schindler
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
22 1. Grundlagen<br />
Mit den Eigenwertgleichungen<br />
wri = 1<br />
σ2 Σrwri, σ<br />
ri<br />
2 ri = wT riΣrwri. (1-38)<br />
können aus der Lernregel (1-33) für die Kovarianzmatrizen zwei äquivalente Regeln<br />
gewonnen werden,<br />
∆wri = ˆ �<br />
(xt − cr(t)) (xt − cr(t))<br />
P(r|xt)<br />
Twri(t) σ 2 ri (t)<br />
�<br />
− wri(t) , (1-39)<br />
∆(σ 2 ri) = ˆ ��(xt P(r|xt) − cr(t)) T wri(t) � �<br />
2 2<br />
− σri(t) . (1-40)<br />
Die erste Gleichung hat die Form einer Richtungslernregel. Sie ist an diejenige <strong>von</strong><br />
Oja (1982) angelehnt und führt, unabhängig <strong>von</strong> den Varianzen, eine Hauptachsenbestimmung<br />
durch (siehe dazu Rubner & Tavan, 1989; Albrecht et al. 2000). Um zu<br />
vermeiden, dass alle wri in dieselbe Richtung maximaler Varianz zeigen, müssen die wri<br />
nach jedem Lernschritt orthogonalisiert werden. Lässt man ferner in (1-39) den normierenden<br />
Zerfallsterm (−wri) weg, so muss man nach jedem Lernschritt eine Gram-<br />
Schmidt-Orthonormierung (Fischer & Kaul, 1990) der Vektoren wri durchführen. Wie<br />
<strong>von</strong> Albrecht et al. (2000) gezeigt wurde, diagonalisieren die so gelernten wri die<br />
r-lokalen Kovarianzmatrizen � (x−cr)(x−cr) T�<br />
r,�.<br />
Der multivar-Algorithmus <strong>von</strong> Kloppenburg & Tavan (1997) lautet<br />
(MV-1) Initialisiere die Parameter θ(t=0)<br />
(MV-2) Ziehe einen zufälligen Punkt xt aus dem Datensatz X und berechne die<br />
Zuständigkeiten nach dem Bayes’schen Satz (1-10)<br />
(MV-3) Berechne das neue Codebuch nach den Updateregeln θ(t+1) = θ(t) + ε∆θ,<br />
wobei<br />
∆cr = ˆ P(r|xt) � xt − cr(t) + R �<br />
mit einem kleinen Rauschen R,<br />
∆wri = ˆ P(r|xt)<br />
σ 2 ri (t)<br />
(1-41)<br />
� xt − cr(t) � � xt − cr(t) � T wri(t) (1-42)<br />
und orthonormiere die neuen Hauptachsen wri(t),<br />
(1-43)<br />
∆(σ 2 ri) = ˆ ��(xt P(r|xt) − cr(t)) T wri(t) �2 2<br />
− σri(t) + µ σ2 − σ2 ri<br />
〈 ˆ �<br />
, (1-44)<br />
P(r|x)〉<br />
∆ ˆ �<br />
Pr = ˆP(r|xt) − ˆ �<br />
1<br />
Pr(t) + ν<br />
M − ˆ ��<br />
Pr(t) . (1-45)