Diplomarbeit von Michael Schindler

Weitere Magazine

Empfehlungen

Info

10 Einleitung Dauer. Die akustischen Wellen, die im Ohr des Zuhörers ankommen, verändern sich eine Weile lang nicht, sie sind derart zeitlich korreliert, dass sie zusammen als Ton gehört werden. Zwischen den einzelnen Tönen des Stückes gibt es natürlich ebenfalls Korrelationen, die durch die Partitur vorgegeben sind. Das ganze Stück ist also voll von zeitlichen Korrelationen. Insgesamt sind alle Beobachtungen, die ein Lebewesen in seiner Umwelt macht, zeitlich korreliert. On-line erfahrene – d.h. sequentielle zeitkorrelierte – Reize bilden also die ursprüngliche und natürliche Umwelt von biologischen lernenden Systemen. Neuronale Netze, die ja als Modelle für biologische Reizverarbeitung gedacht sind, sollten in der gleichen Weise on-line lernen können. Ein Mensch, der sich ein Klavierkonzert von Bach anhört, mag in der Lage sein, sich die Tonfolgen zu merken. Je länger er hinhört, umso mehr lernt er. Auch wenn es sich um die Brandenburgischen Konzerte handelt, die schier endlos sind, muss er trotzdem nichts von dem vergessen, was ihm vorher bekannt war. Er vermag zu lernen, ohne dabei alles andere zu vergessen. Das einfachste ANN kann das nicht, wie im letzten Abschnitt vorgeführt wurde. Es befindet sich im dauernden Widerstreit zwischen Lernen und Vergessen. Je mehr Neues es lernt, umso mehr Altes muss es vergessen, und zeitliche Korrelationen im Datenstrom können dazu führen, dass es alles bis auf den aktuellen Systemzustand vergisst. Es würde also ein ” Experte für die Brandenburgischen Konzerte,“ könnte sich aber sonst an nichts erinnern. Der Gradientenabstieg in Abb. 4 befindet sich in einem ähnlichen Dilemma. Geometrisch gesprochen, können zeitliche Korrelationen im Datenstrom dazu führen, dass sich die sequentielle Trajektorie weit von der optimalen glatten batch- Kurve entfernt. Wenn sie sich so weit entfernt, dass sie schließlich in ein anderes Minimum der Fehlerfunktion E(W) läuft, muss man das Lernverfahren als gescheitert betrachten. Besonders bei nichtlinearen Lernverfahren, bei denen sich E(W) stark mit dem Parameter W verändert, kann eine solche Situation leicht auftreten. Das Lernverfahren wird somit instabil. Dies ist das Problem des on-line Lernens, dem jedes bekannte adaptive Neuronale Netzwerk bei sequentieller Parameteranpassung ausgesetzt ist, denn es ist eine direkte Folge von gleitender Mittelwertsbildung. Für dieses Problem hat die Neuroinformatik bislang keine Lösung gefunden. Aufgabe der vorliegenden Arbeit ist die Behebung dieses Problems, soweit sie in einer Diplomarbeit durchführbar ist. Zuerst wird das on-line Lernproblem ausführlich formuliert, anschließend wird ein Ansatz zu seiner Lösung vorgeschlagen. Alle Untersuchungen werden dabei an einem sehr vielseitigen adaptiven Neuronalen Netz und dem dazugehörigen Lernverfahren, dem multivar-Algorithmus, durchgeführt. Dieser Algorithmus wurde von Kloppenburg & Tavan (1997) entwickelt und von Albrecht et al. (2000) ausführlich diskutiert. Das zugehörige ANN besitzt eine durchgängige mathematisch/statistische Interpretation, die es als selbstorganisierten Maximum-likelihood-Approximator für die Verteilungsdichte des präsentierten Datensatzes ausweist. Die Dichteschätzung beruht auf lokaler räumlicher Mittelwertsbildung. Der Algorithmus kann, wie wir sehen werden, ebenfalls als Clusteringalgorithmus aufgefasst werden, wenn man die Dichteschätzung auf unterschiedlichen räumlichen Skalen durchführt. Dabei bekommt man einen hierarchischen Aufspaltungsprozess von Netz-
E.3 Wie lernen Neuronale Netze in veränderlichen Umwelten? 11 werkparametern. An diesen Aufspaltungen lässt sich das Problem der on-line Mittelung sehr gut demonstrieren. (x(t))sel w(t) 0 T Abbildung 7: Der Lernprozess aus Abbildung 6b, angewandt auf abgekürzte Datenfolgen. Gezeigt sind die selektierten Daten (x(t))sel, die gelernt werden, und der Parameter w(t) als Funktion der Zeit. Datenpunkte ignorieren Die Idee, die zur Lösung des on-line Problems führt, ist denkbar einfach. In Abb. 6b wird deutlich, dass das Problem der on-line Mittelung auf – im Vergleich zur Dauer des Gedächtnisses des ANN – zu lange Verweildauern des Systems in einem Zustand zurückzuführen ist. Die gelernten Daten sind eine Weile lang quasistationär. Man kann das verhindern, indem man den Lernprozess abbricht, sobald die Daten redundant werden. Dazu ist notwendig, einen Filter für irrelevante Reizdaten einzuführen. Dieser kann aber nicht starr sein, denn ob Daten redundant sind, also für den Lernprozess irrelevant, kann nur am jeweiligen Zustand des Lerners selbst festgestellt werden. Der Filter muss sich also selbst zusammen mit den Netzwerkparametern adaptiv an die präsentierten Daten anpassen. Wie ich in meiner Diplomarbeit zeigen möchte, kann ein solches Modell für einen selbstreferentiellen Selektionsprozess aus einem einfachen Verhaltensmuster der Meeresschnecke Aplysia californica 1 abgeleitet werden. Dieses einfache Lebewesen ignoriert nach einer Weile Reizungen am Kiemen, wenn sie häufig wiederholt werden (Habituation). Wenn sich die Reizumgebung jedoch schnell verändert, beispielsweise durch einen zusätzlichen Schlag auf den Kopf oder Schwanz der Aplysia, wird die Habituation sofort wieder aufgehoben (Sensitivierung). Wenn wir dieses Verhaltensmuster auf das einfache Beispiel in Abb. 6b übertragen, so erhalten wir, ähnlich wie in Abbildung 7, eine Abkürzung der gelernten Datensequenzen. Durch ein noch zu spezifizierendes Kriterium soll der Lernprozess unterbrochen werden, wenn das Verhalten der Datensequenz stagniert. Falls es gelingt, ein solches Kriterium anzugeben, so erwarten wir das in Abb. 7 skizzierte Ergebnis. Wie gewünscht, entfernt sich der Parameter w auch bei kurzer Gedächtnisdauer nicht mehr weit von seinem Optimalwert. Wie ein solches Abbruchkriterium formuliert werden 1 Das Nervensystem der Aplysia ist eines der am besten untersuchten im Tierreich. Für die weitgehende Aufklärung seiner Bestandteile und Funktionsweise wurde im Jahr 2000 der Nobelpreis an Eric Kandel verliehen.
Seite 1: Modelle zur Entkopplung von Lern- u
Seite 4 und 5: iv Inhaltsverzeichnis 3 Neuronale G
Seite 6 und 7: 2 Einleitung a3 a4 a1 a2 Abbildung
Seite 8 und 9: 4 Einleitung Das Auffinden der pass
Seite 10 und 11: 6 Einleitung In der folgenden Gleic
Seite 12 und 13: 8 Einleitung Gleitende Mittelung vo
Seite 16 und 17: 12 Einleitung kann, insbesondere, w
Seite 18 und 19: 14 1. Grundlagen schen Methoden zu
Seite 20 und 21: 16 1. Grundlagen lichkeitsdichte je
Seite 22 und 23: 18 1. Grundlagen Glockenkurve zuord
Seite 24 und 25: 20 1. Grundlagen folgt. Dies ist di
Seite 26 und 27: 22 1. Grundlagen Mit den Eigenwertg
Seite 28 und 29: 24 1. Grundlagen verteilungen, was
Seite 30 und 31: 26 1. Grundlagen kann diese Analogi
Seite 32 und 33: 28 1. Grundlagen Kapitel 2 gewidmet
Seite 34 und 35: 30 1. Grundlagen Eingabeschicht ⏐
Seite 36 und 37: 32 1. Grundlagen h r Sr T −→ x
Seite 38 und 39: 34 1. Grundlagen Die Verarbeitungsa
Seite 40 und 41: 36 1. Grundlagen 1.2.4 Hebb’sches
Seite 42 und 43: 38 1. Grundlagen (a) (b) kleiner Fi
Seite 44 und 45: 40 1. Grundlagen 1.2.6 Dimensionsre
Seite 46 und 47: 42 2. On-line Lernen mit univar Nac
Seite 48 und 49: 44 2. On-line Lernen mit univar 0 t
Seite 50 und 51: 46 2. On-line Lernen mit univar Au
Seite 52 und 53: 48 2. On-line Lernen mit univar x/
Seite 54 und 55: 50 2. On-line Lernen mit univar der
Seite 56 und 57: 52 2. On-line Lernen mit univar vie
Seite 58 und 59: 54 2. On-line Lernen mit univar (a1
Seite 60 und 61: 56 2. On-line Lernen mit univar 2.1
Seite 62 und 63: 58 2. On-line Lernen mit univar (c)
Seite 64 und 65:
60 2. On-line Lernen mit univar Die
Seite 66 und 67:
62 2. On-line Lernen mit univar log
Seite 68 und 69:
64 2. On-line Lernen mit univar imm
Seite 70 und 71:
66 2. On-line Lernen mit univar in
Seite 72 und 73:
68 2. On-line Lernen mit univar und
Seite 74 und 75:
70 2. On-line Lernen mit univar
Seite 76 und 77:
72 3. Neuronale Gewöhnung in Aplys
Seite 78 und 79:
Seite 80 und 81:
Seite 82 und 83:
78 4. Neuigkeitsorientiertes Lernen
Seite 84 und 85:
Seite 86 und 87:
Seite 88 und 89:
Seite 90 und 91:
Seite 92 und 93:
Seite 94 und 95:
Seite 96 und 97:
Seite 98 und 99:
Seite 100 und 101:
96 5. Zusammenfassung und Ergebniss
Seite 102 und 103:
98 A. Gedächtniskerne Man sieht, d
Seite 104 und 105:
Appendix B Einige einfache Modelle
Seite 106 und 107:
102 B. Einige einfache Modelle Nun
Seite 108 und 109:
104 B. Einige einfache Modelle bere
Seite 110 und 111:
Appendix C Ergebnisse der Variation
Seite 112 und 113:
108 C. Ergebnisse der Variationsrec
Seite 114 und 115:
Seite 116 und 117:
Seite 118 und 119:
Literatur Abramowitz, M. & Stegun,
Seite 120 und 121:
116 Literatur Rieke, F., Warland, D
Seite 122 und 123:
118 Notation cr Zentren der Gaußfu
Seite 124 und 125:
120
Alle anzeigen

Diplomarbeit von Michael Schindler

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?