21.12.2012 Aufrufe

Diplomarbeit von Michael Schindler

Diplomarbeit von Michael Schindler

Diplomarbeit von Michael Schindler

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

80 4. Neuigkeitsorientiertes Lernen<br />

4.1.2 Ein Algorithmus für die Entkopplung <strong>von</strong> Lern- und Systemdynamik<br />

Der ANTS, als selbstreferentiell filternder univar-Algorithmus, lautet nun folgendermaßen:<br />

(TS-1) Initialisiere die Netzwerkparameter wie in (MV-1)<br />

(TS-2) Ziehe den nächsten Punkt xt aus dem Datensatz X. Berechne die Gesamtaktivität<br />

A � xt, θ(t) � als Mischung <strong>von</strong> gleich gewichteten univariaten<br />

�<br />

Normalverteilungen<br />

identischer Varianz σ, sowie die Zuständigkeiten ar xt, θ(t) � durch<br />

globale Normierung nach Gleichung (1-10).<br />

(TS-3) Bestimme die Relevanz des Punktes x,<br />

f � xt, θ(t) � = Θ(ǫA − A(xt)) ∈ {0, 1} (4-6)<br />

und passe die Neuigkeitsschwelle an,<br />

�<br />

η α falls f(xt) = 0,<br />

ln ǫA(t+1) = ln ǫA(t) +<br />

η (α − 1) sonst.<br />

(4-7)<br />

(TS-4) Berechne die neue Schätzung mit der Zentren-Lernregel<br />

cr(t+1) = cr(t) + εf � xt, θ(t) � �<br />

ar xt, θ(t) � � xt − cr(t) � , (4-8)<br />

(TS-5) Setze die Lernparameter ε und σ auf neue Werte, und zwar nach vorgegebenen<br />

Annealing-Schemata ε(t) und σ(t)<br />

(TS-6) Zähle die diskrete Zeit t weiter und gehe zu (TS-2).<br />

Der Algorithmus ist so gemacht, dass die Lernparameter nur im Fall eines relevanten<br />

Datenpunktes abgekühlt werden. Implizit führt man also eine subjektive Zeit tL des<br />

Lerners ein, die nur dann weitergezählt wird, wenn gelernt wird. In seiner eigenen<br />

Zeit verhält sich der Algorithmus also wie im univar-Modus. Wegen f ∈ {0, 1} ist die<br />

subjektive Zeit hier<br />

t�<br />

tL(t) = f(t ′ ). (4-9)<br />

t ′ =0<br />

In dieser Zeit erscheinen langlebige Datencluster nun <strong>von</strong> kürzerer Dauer, und man<br />

erhält, vom Standpunkt des Lerners aus gesehen, neue, verkürzte Systemzeitskalen.<br />

Diese Veränderung des zeitlichen Systemverhaltens ist Ziel und Grund für die Einführung<br />

des Faktors f in die Lernregel.<br />

In der Formulierung des ANTS in (TS-1) bis (TS-6) wurde durchgängig die Notation der<br />

Aktivitäten A und ar verwendet, und nicht, wie im multivar-Algorithmus, diejenigen<br />

der geschätzten Wahrscheinlichkeiten ˆp und ˆ P(r|·). Dies hat den Grund, dass die<br />

Gesamtaktivität A hier kein Modell für die Verteilungsdichte p mehr ist, sondern andere<br />

Approximationseigenschaften hat, wie im folgenden Abschnitt gezeigt wird.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!