21.12.2012 Aufrufe

Diplomarbeit von Michael Schindler

Diplomarbeit von Michael Schindler

Diplomarbeit von Michael Schindler

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

(a)<br />

(b)<br />

E.3 Wie lernen Neuronale Netze in veränderlichen Umwelten? 9<br />

w(t)<br />

0 T<br />

x(t)<br />

0<br />

w<br />

T<br />

′ w<br />

(t)<br />

′′ (t)<br />

Abbildung 6: Gleitende Mittelwerte nach der Lernregel (15), aufgetragen als Funktion der Zeit. In<br />

(a) werden randomisierte Daten gemittelt. Man sieht deutlich die Abweichungen vom globalen Mittelwert<br />

〈x〉 X (gepunktet eingezeichnet), der Parameter w entfernt sich jedoch nie weit <strong>von</strong> ihm. In (b)<br />

sind zwei gleitende Mittelwerte einer on-line Datensequenz eingezeichnet, die sich in der Wahl <strong>von</strong> ε<br />

unterscheiden. Für sehr kleines ε sieht man eine einigermaßen glatte Kurve w ′ (t), die sich wie in (a)<br />

nicht weit <strong>von</strong> 〈x〉 X entfernt. Dazu ist jedoch notwendig, dass ε wesentlich kleiner als in (a) gewählt<br />

wird. Für das gleiche ε wie in (a) ergibt sich im on-line-Fall die stark gezackte Kurve w ′′ (t), die sich<br />

immer wieder weit vom globalen Mittelwert 〈x〉 X entfernt.<br />

Verweildauern in seinen Zuständen. Das ANN vergisst vergangene Zustände erst dann,<br />

wenn neue Systemzustände so lange verweilen, dass sein Gedächtnis die alten nicht<br />

mehr behalten kann. Hier wird also die Dauer des Gedächtnisses mit der Zeitskala des<br />

Systems verglichen. Der Effekt des Lernens auf Kosten <strong>von</strong> vorher Gelerntem tritt also<br />

auf, wenn Lern- und Systemzeitskala <strong>von</strong> derselben Größenordnung sind. Ich möchte<br />

ihn als Kopplung der Lerndynamik an die Systemdynamik bezeichnen.<br />

Die Trajektorie w ′ in Abb. 6b hat einen viel kleineren Lernparameter ε (hier 1/20 des<br />

ursprünglichen Wertes). Dadurch ist ihr Mittelungsfenster länger und kann die verschiedenen<br />

Systemzustände noch gut mitteln. Die Kopplung der Lerndynamik an die<br />

Systemdynamik kann hier nicht stattfinden, da die Lernzeitskala wesentlich größer als<br />

die des Systems ist. Die Trajektorie w ′ weist deshalb wieder ähnlich kleine Abweichungen<br />

vom globalen Mittelwert 〈x〉 X auf wie die des randomisierten Lernens.<br />

Das Problem des on-line Lernens<br />

Jedes Lebewesen befindet sich in einer physikalischen Umwelt, in welcher die Zeit stetig<br />

voranschreitet. Alle Beobachtungen, die es <strong>von</strong> seiner Umgebung macht, müssen notwendigerweise<br />

sequentiell sein. Die Gegenstände der Beobachtung weisen eine gewisse<br />

zeitliche Konstanz auf. Ein einzelner Ton in einem Klavierkonzert <strong>von</strong> Bach hat eine<br />

x(t)

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!