Diplomarbeit von Michael Schindler

Weitere Magazine

Empfehlungen

Info

44 2. On-line Lernen mit univar 0 t ′ −→ t Abbildung 20: Gedächtniskerne gr(t, t ′ ) eines einzelnen Neurons zum aktuellen Zeitpunkt t. Dargestellt sind die in Appendix A auch analytisch bestimmten Kerne für verschiedene Annealing-Schemata: für konstantes ε=ε0 (durchgezogene Linie), zeitlich inverses ε(t)=1/t (gestrichelte Linie) und exponentiell abgekühltes ε(t) = ε0 exp(−t/τ) (gepunktete Linie für τ = 5t, Linie aus Strichpunkten für τ = 0.1t). Die beiden Kerne für konstantes und langsam exponentiell vermindertes ε haben die erwartete exponentielle Form mit der Zerfallsdauer 1/ε(t). Sie gleiten über den Datenstrom, wobei sie ihre Form kaum verändern. Neurons vorgeführt worden. In Appendix A ist die allgemeine Herleitung zu finden, die auch beliebige Annealing-Schemata für den Lernparameter ε(t) erlaubt, der in (2-5) noch als konstant angenommen wurde. Dort wird auch gezeigt, dass der Term kr(t), welcher angibt, wie sehr der Anfangswert cr(0) noch in cr(t) enthalten ist, mit fort- schreitender Zeit immer weiter zerfällt. Die Funktion gr(t, ·), die für jeden Zeitpunkt t ′ die Gewichtung des damals präsentierten Datenpunktes xt ′ in der Berechnung des aktuellen cr(t) liefert, wird Gedächtniskern genannt. Die Gedächtniskerne sind Gewichtungsfunktionen in einem Mittelungsfenster, das über den Datenstrom gleitet.“ ” Formal wird dieser Vorgang durch die Summe in (2-9) ausgedrückt, die nichts anderes als eine diskrete Faltung des Datenstromes � x(t) � t mit dem Faltungskern gr(t, t ′ ) ist. Die Gedächtniskerne der in Appendix A beschriebenen Spezialfälle sind in Abbildung 20 gezeigt. Wie zu erwarten war, sind sie dort Null, wo t ′ > t. Der generische Fall mit konstantem ε fällt zu vergangenen Zeiten hin exponentiell ab. Die Zeitskala dieses exponentiellen Zerfalls ist identisch mit derjenigen, die in (2-5) als Zeitskala der ex- angegeben ist. Was die Be- ponentiellen Annäherung an den konstanten Attraktor c∗ r stimmung einer typischen Zeitskala des lernenden MVNN betrifft, sind also in diesem Fall die beiden Beschreibungsweisen der Codebuchentwicklung durch (2-5) und (2-9) äquivalent. Allerdings setzt die Formulierung mit Gedächtniskern keinen stationären Attraktor c∗ r voraus. Sie darf an dieser Stelle also als zwanglose Verallgemeinerung der einfachen Beschreibung einer Dynamik als exponentielle Konvergenz betrachtet werden. Kopplung der Zeitskalen an die Raumskala An der Definition (2-8) der instantanen Relaxationszeiten Tr(t) sieht man sofort, dass diese sowohl einen räumlichen wie auch einen zeitlichen Anteil haben. Der Term ε ist rein zeitlicher Natur, er beeinflusst die Bewegung aller Codebuchzentren in gleicher
2.1 Die Kopplung von Lern- und Systemdynamik 45 Weise, unabhängig von ihrem Ort. In ar(xt) wird dagegen die räumliche Zuständigkeit des r-ten Neurons ausgedrückt (vgl. die Partitionsfunktionen in Abb. 8b). Ein Codebuchzentrum mit hoher Zuständigkeit kann sich schnell bewegen und hat deshalb eine kürzere instantane Relaxationszeit als ein weniger zuständiges. Je kleiner die Raumskala σ des lernenden MVNN ist, umso unterschiedlicher werden die Zuständigkeiten (Abb. 9). Dadurch, dass ar in der Definition (2-8) verwendet wird, werden die Zeitskalen Tr(t) des lernenden MVNN direkt an seine Raumskala σ gekoppelt. Diese enge Verbindung von Raum- und Zeitskalen ist eine notwendige Eigenschaft jeder Beschreibung des on-line lernenden univar. Die enge Verknüpfung und die Tatsache, dass die Relaxationszeiten in (2-8) nur lokal und instantan sind, machen es schwierig, Aussagen über die effektive Dynamik eines on-line lernenden Codebuchs zu treffen. Aus der Summenformel M� r=1 1 Tr(t) = ε = 1 Tmin (2-10) wird lediglich klar, dass die kleinstmögliche Zeitskala Tmin = 1/ε zu jedem Zeitpunkt kompetitiv unter den einzelnen Codebuchzentren aufgeteilt wird. 1/ε ist ein geeigneter Maßstab, auf dem Zeitskalen Tr(t) gemessen werden können. 2.1.2 Die Systemdynamik Um die Kopplung der Lern- an die Systemdynamik bei einem univar-Training analysieren zu können, benötigen wir Modelle für dynamisch veränderliche Umwelten, deren Eigenschaften bekannt sind. Für diese Modelle bieten sich stochastische Prozesse an, die als Datengeneratoren verwendet werden können. In Abb. 6b in der Einleitung wurde beispielsweise ein Markov-Prozess als Datengenerator verwendet, der zwei mögliche Zustände besitzt. Die beiden Zustände selbst liefern verrauschte Datenpunkte. Die Dynamik eines solchen Markov-Prozesses kann durch die erwarteten Lebensdauern TS,«seiner beiden Zustände α∈{1, 2} charakterisiert werden. Diese sind durch TS,«= 1 1 − P(α|α) (2-11) gegeben, wobei P(α|α) die Übergangswahrscheinlichkeit während eines Zeitschrittes ∆t des Zustandes α in sich selbst ist (Sonner, 1997, Anhang A). Wenn die beiden Zustände dasselbe statistische Gewicht haben, sind die beiden erwarteten Lebensdauern gleich, TS = 1 1 − P(1|1) = 1 . (2-12) 1 − P(2|2) In den folgenden Abschnitten werden hauptsächlich Datengeneratoren mit zwei Zuständen betrachtet. Diese können verrauscht (Abb. 6b) oder punktförmig sein.
Seite 1: Modelle zur Entkopplung von Lern- u
Seite 4 und 5: iv Inhaltsverzeichnis 3 Neuronale G
Seite 6 und 7: 2 Einleitung a3 a4 a1 a2 Abbildung
Seite 8 und 9: 4 Einleitung Das Auffinden der pass
Seite 10 und 11: 6 Einleitung In der folgenden Gleic
Seite 12 und 13: 8 Einleitung Gleitende Mittelung vo
Seite 14 und 15: 10 Einleitung Dauer. Die akustische
Seite 16 und 17: 12 Einleitung kann, insbesondere, w
Seite 18 und 19: 14 1. Grundlagen schen Methoden zu
Seite 20 und 21: 16 1. Grundlagen lichkeitsdichte je
Seite 22 und 23: 18 1. Grundlagen Glockenkurve zuord
Seite 24 und 25: 20 1. Grundlagen folgt. Dies ist di
Seite 26 und 27: 22 1. Grundlagen Mit den Eigenwertg
Seite 28 und 29: 24 1. Grundlagen verteilungen, was
Seite 30 und 31: 26 1. Grundlagen kann diese Analogi
Seite 32 und 33: 28 1. Grundlagen Kapitel 2 gewidmet
Seite 34 und 35: 30 1. Grundlagen Eingabeschicht ⏐
Seite 36 und 37: 32 1. Grundlagen h r Sr T −→ x
Seite 38 und 39: 34 1. Grundlagen Die Verarbeitungsa
Seite 40 und 41: 36 1. Grundlagen 1.2.4 Hebb’sches
Seite 42 und 43: 38 1. Grundlagen (a) (b) kleiner Fi
Seite 44 und 45: 40 1. Grundlagen 1.2.6 Dimensionsre
Seite 46 und 47: 42 2. On-line Lernen mit univar Nac
Seite 50 und 51: 46 2. On-line Lernen mit univar Au
Seite 52 und 53: 48 2. On-line Lernen mit univar x/
Seite 54 und 55: 50 2. On-line Lernen mit univar der
Seite 56 und 57: 52 2. On-line Lernen mit univar vie
Seite 58 und 59: 54 2. On-line Lernen mit univar (a1
Seite 60 und 61: 56 2. On-line Lernen mit univar 2.1
Seite 62 und 63: 58 2. On-line Lernen mit univar (c)
Seite 64 und 65: 60 2. On-line Lernen mit univar Die
Seite 66 und 67: 62 2. On-line Lernen mit univar log
Seite 68 und 69: 64 2. On-line Lernen mit univar imm
Seite 70 und 71: 66 2. On-line Lernen mit univar in
Seite 72 und 73: 68 2. On-line Lernen mit univar und
Seite 74 und 75: 70 2. On-line Lernen mit univar
Seite 76 und 77: 72 3. Neuronale Gewöhnung in Aplys
Seite 82 und 83: 78 4. Neuigkeitsorientiertes Lernen
Seite 98 und 99:
94 4. Neuigkeitsorientiertes Lernen
Seite 100 und 101:
96 5. Zusammenfassung und Ergebniss
Seite 102 und 103:
98 A. Gedächtniskerne Man sieht, d
Seite 104 und 105:
Appendix B Einige einfache Modelle
Seite 106 und 107:
102 B. Einige einfache Modelle Nun
Seite 108 und 109:
104 B. Einige einfache Modelle bere
Seite 110 und 111:
Appendix C Ergebnisse der Variation
Seite 112 und 113:
108 C. Ergebnisse der Variationsrec
Seite 114 und 115:
Seite 116 und 117:
Seite 118 und 119:
Literatur Abramowitz, M. & Stegun,
Seite 120 und 121:
116 Literatur Rieke, F., Warland, D
Seite 122 und 123:
118 Notation cr Zentren der Gaußfu
Seite 124 und 125:
120
Alle anzeigen

Diplomarbeit von Michael Schindler

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?