Diplomarbeit von Michael Schindler
Diplomarbeit von Michael Schindler
Diplomarbeit von Michael Schindler
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
(a)<br />
(b)<br />
E.3 Wie lernen Neuronale Netze in veränderlichen Umwelten? 9<br />
w(t)<br />
0 T<br />
x(t)<br />
0<br />
w<br />
T<br />
′ w<br />
(t)<br />
′′ (t)<br />
Abbildung 6: Gleitende Mittelwerte nach der Lernregel (15), aufgetragen als Funktion der Zeit. In<br />
(a) werden randomisierte Daten gemittelt. Man sieht deutlich die Abweichungen vom globalen Mittelwert<br />
〈x〉 X (gepunktet eingezeichnet), der Parameter w entfernt sich jedoch nie weit <strong>von</strong> ihm. In (b)<br />
sind zwei gleitende Mittelwerte einer on-line Datensequenz eingezeichnet, die sich in der Wahl <strong>von</strong> ε<br />
unterscheiden. Für sehr kleines ε sieht man eine einigermaßen glatte Kurve w ′ (t), die sich wie in (a)<br />
nicht weit <strong>von</strong> 〈x〉 X entfernt. Dazu ist jedoch notwendig, dass ε wesentlich kleiner als in (a) gewählt<br />
wird. Für das gleiche ε wie in (a) ergibt sich im on-line-Fall die stark gezackte Kurve w ′′ (t), die sich<br />
immer wieder weit vom globalen Mittelwert 〈x〉 X entfernt.<br />
Verweildauern in seinen Zuständen. Das ANN vergisst vergangene Zustände erst dann,<br />
wenn neue Systemzustände so lange verweilen, dass sein Gedächtnis die alten nicht<br />
mehr behalten kann. Hier wird also die Dauer des Gedächtnisses mit der Zeitskala des<br />
Systems verglichen. Der Effekt des Lernens auf Kosten <strong>von</strong> vorher Gelerntem tritt also<br />
auf, wenn Lern- und Systemzeitskala <strong>von</strong> derselben Größenordnung sind. Ich möchte<br />
ihn als Kopplung der Lerndynamik an die Systemdynamik bezeichnen.<br />
Die Trajektorie w ′ in Abb. 6b hat einen viel kleineren Lernparameter ε (hier 1/20 des<br />
ursprünglichen Wertes). Dadurch ist ihr Mittelungsfenster länger und kann die verschiedenen<br />
Systemzustände noch gut mitteln. Die Kopplung der Lerndynamik an die<br />
Systemdynamik kann hier nicht stattfinden, da die Lernzeitskala wesentlich größer als<br />
die des Systems ist. Die Trajektorie w ′ weist deshalb wieder ähnlich kleine Abweichungen<br />
vom globalen Mittelwert 〈x〉 X auf wie die des randomisierten Lernens.<br />
Das Problem des on-line Lernens<br />
Jedes Lebewesen befindet sich in einer physikalischen Umwelt, in welcher die Zeit stetig<br />
voranschreitet. Alle Beobachtungen, die es <strong>von</strong> seiner Umgebung macht, müssen notwendigerweise<br />
sequentiell sein. Die Gegenstände der Beobachtung weisen eine gewisse<br />
zeitliche Konstanz auf. Ein einzelner Ton in einem Klavierkonzert <strong>von</strong> Bach hat eine<br />
x(t)