Diplomarbeit von Michael Schindler
Diplomarbeit von Michael Schindler
Diplomarbeit von Michael Schindler
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
10 Einleitung<br />
Dauer. Die akustischen Wellen, die im Ohr des Zuhörers ankommen, verändern sich<br />
eine Weile lang nicht, sie sind derart zeitlich korreliert, dass sie zusammen als Ton<br />
gehört werden. Zwischen den einzelnen Tönen des Stückes gibt es natürlich ebenfalls<br />
Korrelationen, die durch die Partitur vorgegeben sind. Das ganze Stück ist also voll<br />
<strong>von</strong> zeitlichen Korrelationen. Insgesamt sind alle Beobachtungen, die ein Lebewesen in<br />
seiner Umwelt macht, zeitlich korreliert. On-line erfahrene – d.h. sequentielle zeitkorrelierte<br />
– Reize bilden also die ursprüngliche und natürliche Umwelt <strong>von</strong> biologischen<br />
lernenden Systemen. Neuronale Netze, die ja als Modelle für biologische Reizverarbeitung<br />
gedacht sind, sollten in der gleichen Weise on-line lernen können.<br />
Ein Mensch, der sich ein Klavierkonzert <strong>von</strong> Bach anhört, mag in der Lage sein, sich<br />
die Tonfolgen zu merken. Je länger er hinhört, umso mehr lernt er. Auch wenn es sich<br />
um die Brandenburgischen Konzerte handelt, die schier endlos sind, muss er trotzdem<br />
nichts <strong>von</strong> dem vergessen, was ihm vorher bekannt war. Er vermag zu lernen, ohne<br />
dabei alles andere zu vergessen.<br />
Das einfachste ANN kann das nicht, wie im letzten Abschnitt vorgeführt wurde. Es<br />
befindet sich im dauernden Widerstreit zwischen Lernen und Vergessen. Je mehr Neues<br />
es lernt, umso mehr Altes muss es vergessen, und zeitliche Korrelationen im Datenstrom<br />
können dazu führen, dass es alles bis auf den aktuellen Systemzustand vergisst. Es<br />
würde also ein ” Experte für die Brandenburgischen Konzerte,“ könnte sich aber sonst<br />
an nichts erinnern. Der Gradientenabstieg in Abb. 4 befindet sich in einem ähnlichen<br />
Dilemma. Geometrisch gesprochen, können zeitliche Korrelationen im Datenstrom<br />
dazu führen, dass sich die sequentielle Trajektorie weit <strong>von</strong> der optimalen glatten batch-<br />
Kurve entfernt. Wenn sie sich so weit entfernt, dass sie schließlich in ein anderes<br />
Minimum der Fehlerfunktion E(W) läuft, muss man das Lernverfahren als gescheitert<br />
betrachten. Besonders bei nichtlinearen Lernverfahren, bei denen sich E(W) stark<br />
mit dem Parameter W verändert, kann eine solche Situation leicht auftreten. Das<br />
Lernverfahren wird somit instabil. Dies ist das Problem des on-line Lernens, dem<br />
jedes bekannte adaptive Neuronale Netzwerk bei sequentieller Parameteranpassung<br />
ausgesetzt ist, denn es ist eine direkte Folge <strong>von</strong> gleitender Mittelwertsbildung. Für<br />
dieses Problem hat die Neuroinformatik bislang keine Lösung gefunden.<br />
Aufgabe der vorliegenden Arbeit ist die Behebung dieses Problems, soweit sie in einer<br />
<strong>Diplomarbeit</strong> durchführbar ist. Zuerst wird das on-line Lernproblem ausführlich<br />
formuliert, anschließend wird ein Ansatz zu seiner Lösung vorgeschlagen.<br />
Alle Untersuchungen werden dabei an einem sehr vielseitigen adaptiven Neuronalen<br />
Netz und dem dazugehörigen Lernverfahren, dem multivar-Algorithmus, durchgeführt.<br />
Dieser Algorithmus wurde <strong>von</strong> Kloppenburg & Tavan (1997) entwickelt und<br />
<strong>von</strong> Albrecht et al. (2000) ausführlich diskutiert. Das zugehörige ANN besitzt eine<br />
durchgängige mathematisch/statistische Interpretation, die es als selbstorganisierten<br />
Maximum-likelihood-Approximator für die Verteilungsdichte des präsentierten Datensatzes<br />
ausweist. Die Dichteschätzung beruht auf lokaler räumlicher Mittelwertsbildung.<br />
Der Algorithmus kann, wie wir sehen werden, ebenfalls als Clusteringalgorithmus aufgefasst<br />
werden, wenn man die Dichteschätzung auf unterschiedlichen räumlichen Skalen<br />
durchführt. Dabei bekommt man einen hierarchischen Aufspaltungsprozess <strong>von</strong> Netz-