Diplomarbeit von Michael Schindler

Weitere Magazine

Empfehlungen

Info

92 4. Neuigkeitsorientiertes Lernen x/σS 1 0 −1 (a) σ/σS =1 0.8 0.6 0.4 0.2 t = 0 t −→ t = 10 8 t = 0 t −→ t = 10 7 1 0 −1 � 1 0 −1 (b) α=1 a � σ/σS =1 ε=0.02 0.8 0.015 0.6 0.01 0.4 0.005 0.2 0.0 (c) α=0.5 tL = 0 tL −→ tL = 10 7 Abbildung 50: Die Codebuchentwicklungen (M =6) während drei verschiedener Lernprozesse des Systems aus Abb. 49. In (a) wurde eine randomisierte Datenfolge nach der univar-Methode gelernt. Die Phasenübergänge sind hier das Ergebnis der Raumskalendetektion, wobei nicht sofort die ” eigentliche“ dreiteilige Struktur des Datensatzes entdeckt, sondern zunächst ein Zustand mit zwei Clusterzentren angenommen wurde. In (b) wurde bei dem gleichen σ-Annealing auch ε linear abgekühlt (die σ/σS- und ε-Skalen gelten für (b) und für (c) gleichermaßen). Dadurch kommt es sukzessive zu Phasenübergängen, die aus dem dynamisch gekoppelten Bereich heraus geschehen. Das Aufbrechen des Codebuch findet aufgrund der unterschiedlich starken Dynamikkopplung an die unterschiedlichen Lebensdauern TS,γ bei unterschiedlichen ε-Werten statt, was die Codebuchentwicklung unsymmetrisch werden lässt, obwohl die zugrundeliegende statische Verteilungsdichte aus Abb. 49 symmetrisch ist. Bei dem ersten Phasenübergang zerbricht das Codebuch in zwei Teile mit 2 und 4 Neuronen, wie es die Load-balance verlangt. Der obere Ast bildet ein lokales Modell für die Zustände b und c, also einen schnellen und einen langlebigen (TS,b = 10, TS,c = 1000). In (c) ist ein mit α = 0.5 gelerntes Ergebnis zu sehen. Hier wird die Unsymmetrie wieder aufgehoben, wie in (a) finden hintereinander mehrere symmetrische Phasenübergänge statt. Da hier die abgeschnittene Verteilungsdichte gelernt wird, entdeckt der Lerner bei keinen σ/σS weitere Strukturen in den einzelnen Stümpfen (Abb. 49). In (b) war die Unsymmetrie im Codebuch auf die stark unterschiedlichen Lebensdauern im System zurückzuführen. Hier wurde diese Unsymmetrie vom ANTS behoben. c b a c b c b a
4.2 Das Verhalten des ANTS 93 trie im Aufbrechverhalten auf die zeitliche Struktur des Datensatzes zurückzuführen sein. Insbesondere die dynamische Kopplung, die im kombinierten Modell für b und c stattfindet, zeigt, dass die stark unterschiedlichen Lebensdauern diese Unsymmetrie verursachen. In (c) wurde dasselbe Annealing-Schema für ein ANTS-Training mit 50 Prozent aller Daten wiederholt (vgl. den α-Stumpf in Abb. 49). Bereits diese relativ schwache Datenselektion reicht aus, um die beiden sehr unterschiedlichen Lebensdauern der Daten anzugleichen. Man beobachtet qualitativ wieder das gleiche symmetrische Aufspaltungsmuster wie in (a). Zwar ist, wie am Ende von Kapitel 2 angesprochen, das in Abb. 50b beobachtete Aufbrechverhalten hier nicht vollständig quantifizierbar, doch kann die Aufhebung der unsymmetrischen Aufspaltung – die allein auf die Existenz von zwei sehr unterschiedlichen Zeitskalen im System zurückzuführen ist – als Beweis für die unterschiedliche, an die Daten angepasste Lebensdauerkompression gewertet werden. 4.2.5 Zusammenfassung und Diskussion Mit Einführung der selbstreferentiellen Datenselektion durch f(xt; θ(t)) kann, wie das letzte Beispiel gezeigt hat, selbst ein Datenstrom, in dem sehr unterschiedliche Systemzeitskalen enthalten sind, von einem aufmerksamen MVNN gelernt werden, ohne dass die hierarchischen Aspekte der Dichteschätzung vollständig verlorengehen. Der ANTS passt dabei die statistischen Gewichte im System durch den Mechanismus seiner Aufmerksamkeitsschwelle so an, dass sehr häufig vorkommende Cluster stärker abgeschwächt werden als seltene. Dadurch erscheinen ihm auch ihre Lebensdauern verkürzt, und der on-line Datenstrom wird quasi randomisiert. Diese Quasi-Randomisierung führt dazu, dass in einem wesentlich größeren Parameterbereich dynamisch entkoppelt gelernt werden kann. Mit dem ANTS ist also ein Algorithmus gegeben, der eine wesentliche Fähigkeit zum on-line Lernen besitzt, nämlich selbst auf die Zeitskalen im System zu reagieren. Versucht man, wie in Abb. 36 den Parameterweg des ANTS darzustellen, bekommt man effektiv mehrere Wege. Da die Näherung (4-17) für verschiedene Cluster verschieden gültig ist, bekommen die Neuronen, die für verschiedene Cluster zuständig sind, unterschiedliche effektive Lernraten ε 〈f ar〉 X . Diese Unterschiede in den Lernraten sind der unterschiedlich starken Gewichtskompression äquivalent. Es sind nun Phasenübergänge möglich, die auf sehr unterschiedliche Zeitskalen im System zurückzuführen sind. Der ANTS benötigt dazu nur eine einzige a-priori Annahme über das zeitliche Systemverhalten, nämlich den Anteil α der zu lernenden Daten. Ein großes α schwächt die Möglichkeiten des ANTS zur unterschiedlichen Zeitskalenkompression ab, während bei zu kleinem α eventuell die relevante Struktur in der Datenverteilung nicht mehr sichtbar wird.
Seite 1:
Modelle zur Entkopplung von Lern- u
Seite 4 und 5:
iv Inhaltsverzeichnis 3 Neuronale G
Seite 6 und 7:
2 Einleitung a3 a4 a1 a2 Abbildung
Seite 8 und 9:
4 Einleitung Das Auffinden der pass
Seite 10 und 11:
6 Einleitung In der folgenden Gleic
Seite 12 und 13:
8 Einleitung Gleitende Mittelung vo
Seite 14 und 15:
10 Einleitung Dauer. Die akustische
Seite 16 und 17:
12 Einleitung kann, insbesondere, w
Seite 18 und 19:
14 1. Grundlagen schen Methoden zu
Seite 20 und 21:
16 1. Grundlagen lichkeitsdichte je
Seite 22 und 23:
18 1. Grundlagen Glockenkurve zuord
Seite 24 und 25:
20 1. Grundlagen folgt. Dies ist di
Seite 26 und 27:
22 1. Grundlagen Mit den Eigenwertg
Seite 28 und 29:
24 1. Grundlagen verteilungen, was
Seite 30 und 31:
26 1. Grundlagen kann diese Analogi
Seite 32 und 33:
28 1. Grundlagen Kapitel 2 gewidmet
Seite 34 und 35:
30 1. Grundlagen Eingabeschicht ⏐
Seite 36 und 37:
32 1. Grundlagen h r Sr T −→ x
Seite 38 und 39:
34 1. Grundlagen Die Verarbeitungsa
Seite 40 und 41:
36 1. Grundlagen 1.2.4 Hebb’sches
Seite 42 und 43:
38 1. Grundlagen (a) (b) kleiner Fi
Seite 44 und 45:
40 1. Grundlagen 1.2.6 Dimensionsre
Seite 46 und 47: 42 2. On-line Lernen mit univar Nac
Seite 48 und 49: 44 2. On-line Lernen mit univar 0 t
Seite 50 und 51: 46 2. On-line Lernen mit univar Au
Seite 52 und 53: 48 2. On-line Lernen mit univar x/
Seite 54 und 55: 50 2. On-line Lernen mit univar der
Seite 56 und 57: 52 2. On-line Lernen mit univar vie
Seite 58 und 59: 54 2. On-line Lernen mit univar (a1
Seite 60 und 61: 56 2. On-line Lernen mit univar 2.1
Seite 62 und 63: 58 2. On-line Lernen mit univar (c)
Seite 64 und 65: 60 2. On-line Lernen mit univar Die
Seite 66 und 67: 62 2. On-line Lernen mit univar log
Seite 68 und 69: 64 2. On-line Lernen mit univar imm
Seite 70 und 71: 66 2. On-line Lernen mit univar in
Seite 72 und 73: 68 2. On-line Lernen mit univar und
Seite 74 und 75: 70 2. On-line Lernen mit univar
Seite 76 und 77: 72 3. Neuronale Gewöhnung in Aplys
Seite 82 und 83: 78 4. Neuigkeitsorientiertes Lernen
Seite 100 und 101: 96 5. Zusammenfassung und Ergebniss
Seite 102 und 103: 98 A. Gedächtniskerne Man sieht, d
Seite 104 und 105: Appendix B Einige einfache Modelle
Seite 106 und 107: 102 B. Einige einfache Modelle Nun
Seite 108 und 109: 104 B. Einige einfache Modelle bere
Seite 110 und 111: Appendix C Ergebnisse der Variation
Seite 112 und 113: 108 C. Ergebnisse der Variationsrec
Seite 118 und 119: Literatur Abramowitz, M. & Stegun,
Seite 120 und 121: 116 Literatur Rieke, F., Warland, D
Seite 122 und 123: 118 Notation cr Zentren der Gaußfu
Seite 124 und 125: 120
Alle anzeigen

Diplomarbeit von Michael Schindler

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?