21.12.2012 Aufrufe

Diplomarbeit von Michael Schindler

Diplomarbeit von Michael Schindler

Diplomarbeit von Michael Schindler

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

C.2 Warum selbstreferentielles Lernen die Datenverteilungsdichte abschneidet 109<br />

Da die Funktion Θ�sowohl in Abhängigkeit <strong>von</strong> x als auch <strong>von</strong> A aufgefasst werden<br />

kann, benutze ich im folgenden unterschiedliche Notationen für diese beiden<br />

Bedeutungen,<br />

x ↦→ ωA(x) als Funktion <strong>von</strong> x, und<br />

A(x) ↦→ Θ(ǫA−A(x)) als ” Funktion“ <strong>von</strong> A.<br />

(C-13)<br />

3. Der Anteil α der gelernten Datenpunkte ist<br />

�<br />

α := p ωA. (C-14)<br />

4. Daraus ergibt sich wegen der Definition (C-11) die Verteilungsdichte ˜p aller gelernten<br />

Punkte, Gleichung (4-11),<br />

˜p =<br />

p ωA<br />

� p ωA<br />

= 1<br />

α p ωA. (C-15)<br />

Der Algorithmus (TS-1) bis (TS-6) extremiert das Funktional<br />

�<br />

E[A] = ˜p[A] ln A = 1<br />

�<br />

p Θ�(ǫA−A) ln A (C-16)<br />

α<br />

unter den Nebenbedingungen<br />

M<br />

�<br />

M<br />

˜p = 1<br />

�<br />

α<br />

M<br />

�<br />

M<br />

M<br />

A = 1 (C-17)<br />

p Θ�(ǫA − A) = 1. (C-18)<br />

Wie in (C-3) kann dieses mit Lagrange-Parametern geschrieben werden,<br />

� �<br />

L[A] = E[A] + λ1 A + λ2 p Θ�(ǫA−A). (C-19)<br />

Variation dieses Funktionals und Nullsetzen liefert die Bedingung<br />

0 ! = δL<br />

δA<br />

p Θ�(ǫA−A)<br />

= −<br />

α A<br />

p<br />

α Θ′�(ǫA−A)(ln A + λ2) + λ1, (C-20)<br />

die eine Konsistenzbedingung für den stationären Zustand <strong>von</strong> A ist. Da Θ�im wesentlichen<br />

eine Heavyside-Funktion ist, kann man ohne die genaue Form <strong>von</strong> Θ�zu kennen –<br />

allein an der Differentialgleichung (C-20) – die gesuchten Approximationseigenschaften<br />

des stationären A finden.<br />

In Γo, wo Θ�(ǫA−A)=1 und Θ ′�(ǫA−A)=0 gilt, dort ist auch<br />

p(x)<br />

α = −λ1A(x) für alle x ∈ Γo. (C-21)

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!