21.12.2012 Aufrufe

Diplomarbeit von Michael Schindler

Diplomarbeit von Michael Schindler

Diplomarbeit von Michael Schindler

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

10 Einleitung<br />

Dauer. Die akustischen Wellen, die im Ohr des Zuhörers ankommen, verändern sich<br />

eine Weile lang nicht, sie sind derart zeitlich korreliert, dass sie zusammen als Ton<br />

gehört werden. Zwischen den einzelnen Tönen des Stückes gibt es natürlich ebenfalls<br />

Korrelationen, die durch die Partitur vorgegeben sind. Das ganze Stück ist also voll<br />

<strong>von</strong> zeitlichen Korrelationen. Insgesamt sind alle Beobachtungen, die ein Lebewesen in<br />

seiner Umwelt macht, zeitlich korreliert. On-line erfahrene – d.h. sequentielle zeitkorrelierte<br />

– Reize bilden also die ursprüngliche und natürliche Umwelt <strong>von</strong> biologischen<br />

lernenden Systemen. Neuronale Netze, die ja als Modelle für biologische Reizverarbeitung<br />

gedacht sind, sollten in der gleichen Weise on-line lernen können.<br />

Ein Mensch, der sich ein Klavierkonzert <strong>von</strong> Bach anhört, mag in der Lage sein, sich<br />

die Tonfolgen zu merken. Je länger er hinhört, umso mehr lernt er. Auch wenn es sich<br />

um die Brandenburgischen Konzerte handelt, die schier endlos sind, muss er trotzdem<br />

nichts <strong>von</strong> dem vergessen, was ihm vorher bekannt war. Er vermag zu lernen, ohne<br />

dabei alles andere zu vergessen.<br />

Das einfachste ANN kann das nicht, wie im letzten Abschnitt vorgeführt wurde. Es<br />

befindet sich im dauernden Widerstreit zwischen Lernen und Vergessen. Je mehr Neues<br />

es lernt, umso mehr Altes muss es vergessen, und zeitliche Korrelationen im Datenstrom<br />

können dazu führen, dass es alles bis auf den aktuellen Systemzustand vergisst. Es<br />

würde also ein ” Experte für die Brandenburgischen Konzerte,“ könnte sich aber sonst<br />

an nichts erinnern. Der Gradientenabstieg in Abb. 4 befindet sich in einem ähnlichen<br />

Dilemma. Geometrisch gesprochen, können zeitliche Korrelationen im Datenstrom<br />

dazu führen, dass sich die sequentielle Trajektorie weit <strong>von</strong> der optimalen glatten batch-<br />

Kurve entfernt. Wenn sie sich so weit entfernt, dass sie schließlich in ein anderes<br />

Minimum der Fehlerfunktion E(W) läuft, muss man das Lernverfahren als gescheitert<br />

betrachten. Besonders bei nichtlinearen Lernverfahren, bei denen sich E(W) stark<br />

mit dem Parameter W verändert, kann eine solche Situation leicht auftreten. Das<br />

Lernverfahren wird somit instabil. Dies ist das Problem des on-line Lernens, dem<br />

jedes bekannte adaptive Neuronale Netzwerk bei sequentieller Parameteranpassung<br />

ausgesetzt ist, denn es ist eine direkte Folge <strong>von</strong> gleitender Mittelwertsbildung. Für<br />

dieses Problem hat die Neuroinformatik bislang keine Lösung gefunden.<br />

Aufgabe der vorliegenden Arbeit ist die Behebung dieses Problems, soweit sie in einer<br />

<strong>Diplomarbeit</strong> durchführbar ist. Zuerst wird das on-line Lernproblem ausführlich<br />

formuliert, anschließend wird ein Ansatz zu seiner Lösung vorgeschlagen.<br />

Alle Untersuchungen werden dabei an einem sehr vielseitigen adaptiven Neuronalen<br />

Netz und dem dazugehörigen Lernverfahren, dem multivar-Algorithmus, durchgeführt.<br />

Dieser Algorithmus wurde <strong>von</strong> Kloppenburg & Tavan (1997) entwickelt und<br />

<strong>von</strong> Albrecht et al. (2000) ausführlich diskutiert. Das zugehörige ANN besitzt eine<br />

durchgängige mathematisch/statistische Interpretation, die es als selbstorganisierten<br />

Maximum-likelihood-Approximator für die Verteilungsdichte des präsentierten Datensatzes<br />

ausweist. Die Dichteschätzung beruht auf lokaler räumlicher Mittelwertsbildung.<br />

Der Algorithmus kann, wie wir sehen werden, ebenfalls als Clusteringalgorithmus aufgefasst<br />

werden, wenn man die Dichteschätzung auf unterschiedlichen räumlichen Skalen<br />

durchführt. Dabei bekommt man einen hierarchischen Aufspaltungsprozess <strong>von</strong> Netz-

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!