Diplomarbeit von Michael Schindler
Diplomarbeit von Michael Schindler
Diplomarbeit von Michael Schindler
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
C.2 Warum selbstreferentielles Lernen die Datenverteilungsdichte abschneidet 109<br />
Da die Funktion Θ�sowohl in Abhängigkeit <strong>von</strong> x als auch <strong>von</strong> A aufgefasst werden<br />
kann, benutze ich im folgenden unterschiedliche Notationen für diese beiden<br />
Bedeutungen,<br />
x ↦→ ωA(x) als Funktion <strong>von</strong> x, und<br />
A(x) ↦→ Θ(ǫA−A(x)) als ” Funktion“ <strong>von</strong> A.<br />
(C-13)<br />
3. Der Anteil α der gelernten Datenpunkte ist<br />
�<br />
α := p ωA. (C-14)<br />
4. Daraus ergibt sich wegen der Definition (C-11) die Verteilungsdichte ˜p aller gelernten<br />
Punkte, Gleichung (4-11),<br />
˜p =<br />
p ωA<br />
� p ωA<br />
= 1<br />
α p ωA. (C-15)<br />
Der Algorithmus (TS-1) bis (TS-6) extremiert das Funktional<br />
�<br />
E[A] = ˜p[A] ln A = 1<br />
�<br />
p Θ�(ǫA−A) ln A (C-16)<br />
α<br />
unter den Nebenbedingungen<br />
M<br />
�<br />
M<br />
˜p = 1<br />
�<br />
α<br />
M<br />
�<br />
M<br />
M<br />
A = 1 (C-17)<br />
p Θ�(ǫA − A) = 1. (C-18)<br />
Wie in (C-3) kann dieses mit Lagrange-Parametern geschrieben werden,<br />
� �<br />
L[A] = E[A] + λ1 A + λ2 p Θ�(ǫA−A). (C-19)<br />
Variation dieses Funktionals und Nullsetzen liefert die Bedingung<br />
0 ! = δL<br />
δA<br />
p Θ�(ǫA−A)<br />
= −<br />
α A<br />
p<br />
α Θ′�(ǫA−A)(ln A + λ2) + λ1, (C-20)<br />
die eine Konsistenzbedingung für den stationären Zustand <strong>von</strong> A ist. Da Θ�im wesentlichen<br />
eine Heavyside-Funktion ist, kann man ohne die genaue Form <strong>von</strong> Θ�zu kennen –<br />
allein an der Differentialgleichung (C-20) – die gesuchten Approximationseigenschaften<br />
des stationären A finden.<br />
In Γo, wo Θ�(ǫA−A)=1 und Θ ′�(ǫA−A)=0 gilt, dort ist auch<br />
p(x)<br />
α = −λ1A(x) für alle x ∈ Γo. (C-21)