Diplomarbeit von Michael Schindler

Weitere Magazine

Empfehlungen

Info

86 4. Neuigkeitsorientiertes Lernen log 10 τS 2 0 −2 −4 0 α = 1 σS α = 0.35 Abbildung 45: Phasendiagramm des ersten Aufbrechens in einem System, das zwischen zwei verrauschten Zuständen deterministisch schaltet. Der Lerner besteht aus M = 20 Neuronen und wurde nach dem ANTS sowohl mit allen (α=1), als auch mit 35 Prozent der Daten trainiert. Beim selektierenden Lernen ist die Kurve zu größeren σ verschoben. Sie ist noch weiter verschoben als es die Breite σ c S des Verteilungsstumpfes pc erwarten ließe, die etwa auch die Breite des gelernten Datensatzes ist. Die gepunktete Linie nahe den (α=0.35)-Phasenübergängen ist aus der durchgezogenen Kurve links durch Streckung um den Faktor 1.31 in σ-Richtung und Verschieben um log 10(0.45) in τS-Richtung entstanden. ein Datenanteil von α=0.35 gelernt wird, dann wird die Kurve zu größeren σkrit-Werten verschoben, wie zu erwarten war. Bemerkenswert und unerwartet an Abbildung 45 ist dagegen, dass die verschobene Kurve nicht bei σ = σ c S , der Standardabweichung des Stumpfes pc abfällt, sondern bei noch größeren Werten σkrit. Es führt also hier nicht nur die globale Varianz des insgesamt gelernten Datensatzes zum Phasenübergang. Dies kann verstanden werden, wenn man sich die gelernten Punkte aus Sicht der einzelnen Normalkomponenten ansieht. Da die Spitzen der Mischung A(· ; θ) zur Datenselektion führen, also gerade dort weniger gelernt wird, wo sich auch die Zentren der Komponenten befinden, werden verstärkt Punkte an den Flanken der Normalverteilungen gelernt. Dies bedeutet, dass der Datensatz aus Sicht der einzelnen Komponenten eine noch größere lokale Varianz hat als es die globale vermuten ließe. Verschiebung in τS-Richtung Durch die Selektion der Datenpunkte findet die erwünschte Modulierung der Lernrate statt. Beim Weitertrainieren des Lerners im quasi-stationären Zustand bekommt man dadurch, dass bei jedem Punkt x die ursprüngliche Lernrate mit f(x) multipliziert wird, effektiv einen um α skalierten Lernparameter. Denn dann ändern sich Codebuch und Aktivitätswerte ar nur unwesentlich, und man kann den Mittelwert auseinanderziehen, σ c S ε 〈far〉 X ≈ ε 〈f〉 X 〈ar〉 X = εα 〈ar〉. (4-17) ? σ
log 10 (τS) 1 0 −1 α=1.0 0.35 0.1 −2 0 0.5 1 σ/σS 4.2 Das Verhalten des ANTS 87 Abbildung 46: Kritische Parameterkurven für zwei punktförmige Datenquellen. Die Kurven des ANTS mit α=0.35 und 0.1 sind jeweils um | log(α)| verschoben. Wie genau diese Verschiebung ist, wird anhand der gepunkteten Kurven deutlich, die durch Verschiebung der durchgezogenen Kurve um exakt | log(α)| entstanden sind. Dies verschiebt die Kurve der kritischen Parameter in logarithmischer Darstellung um | log α| nach oben. Besonders deutlich ist das an Datensätzen zu sehen, bei denen die Verschiebung der Kurve in σ-Richtung nicht stattfindet, beispielsweise an dem Datensatz aus punktförmigen Quellen, der bereits in Abb. 32 verwendet wurde. Das Ergebnis ist in Abbildung 46 für zwei verschiedene α-Werte gezeigt. Die dort abgebildeten Kurven haben genau den Abstand | log 10(α)| von der ursprünglichen (α=1)-Kurve. Auch in Abb. 45 findet diese Verschiebung in τS-Richtung statt. Dort ist sie wegen der starken σ-Verschiebung schwerer zu sehen, außerdem ist sie nicht so stark ausgeprägt wie sie nach Abb. 46 sein sollte. Der Abstand zwischen den Phasenübergangskurven mit α=1 und α=0.35 ist nur etwa | log 10(0.45)|, und nicht der erwartete | log 10(0.35)|. Hier ist die Näherung (4-17) nicht mehr gültig, denn da die Verteilungsdichte effektiv verändert wird, gibt es nichttriviale Korrelationen zwischen der räumlichen Zuständigkeit ar(x) und dem Datenselektor f(x). Anhand von Abb. 46 wird deutlich, weshalb der ANTS die Kopplung von Lern- und Systemdynamik aufheben oder zumindest abschwächen kann. Durch ε 〈far〉 X < ε 〈ar〉 (4-18) wird die Kurve der kritischen Lernparameter für jedes α < 1 nach oben, zu größeren τS-Werten gestreckt. Der Parameterbereich von ε, in dem der Lernvorgang dynamisch entkoppelt stattfinden kann, wird auf diese Weise vergrößert. In Abb. 46 kann statt bis τS =1 bei α=1 nun bis τS =10 bei α=0.1 entkoppelt gelernt werden. Durch den ANTS ist ist es nun möglich, mit wesentlich flexiblerem Codebuch in weiteren Bereichen der (zunächst ja noch unbekannten) Systemdynamik ungekoppelt zu lernen. Aufmerksame Lerner sind deshalb von Vorteil, weil sie genügend schnell mit einer Aufspaltung auf vorhandene Raumskalen reagieren, bei ihnen tritt die unerwünschte Retardierung durch zu kleines ε nicht auf.
Seite 1:
Modelle zur Entkopplung von Lern- u
Seite 4 und 5:
iv Inhaltsverzeichnis 3 Neuronale G
Seite 6 und 7:
2 Einleitung a3 a4 a1 a2 Abbildung
Seite 8 und 9:
4 Einleitung Das Auffinden der pass
Seite 10 und 11:
6 Einleitung In der folgenden Gleic
Seite 12 und 13:
8 Einleitung Gleitende Mittelung vo
Seite 14 und 15:
10 Einleitung Dauer. Die akustische
Seite 16 und 17:
12 Einleitung kann, insbesondere, w
Seite 18 und 19:
14 1. Grundlagen schen Methoden zu
Seite 20 und 21:
16 1. Grundlagen lichkeitsdichte je
Seite 22 und 23:
18 1. Grundlagen Glockenkurve zuord
Seite 24 und 25:
20 1. Grundlagen folgt. Dies ist di
Seite 26 und 27:
22 1. Grundlagen Mit den Eigenwertg
Seite 28 und 29:
24 1. Grundlagen verteilungen, was
Seite 30 und 31:
26 1. Grundlagen kann diese Analogi
Seite 32 und 33:
28 1. Grundlagen Kapitel 2 gewidmet
Seite 34 und 35:
30 1. Grundlagen Eingabeschicht ⏐
Seite 36 und 37:
32 1. Grundlagen h r Sr T −→ x
Seite 38 und 39:
34 1. Grundlagen Die Verarbeitungsa
Seite 40 und 41: 36 1. Grundlagen 1.2.4 Hebb’sches
Seite 42 und 43: 38 1. Grundlagen (a) (b) kleiner Fi
Seite 44 und 45: 40 1. Grundlagen 1.2.6 Dimensionsre
Seite 46 und 47: 42 2. On-line Lernen mit univar Nac
Seite 48 und 49: 44 2. On-line Lernen mit univar 0 t
Seite 50 und 51: 46 2. On-line Lernen mit univar Au
Seite 52 und 53: 48 2. On-line Lernen mit univar x/
Seite 54 und 55: 50 2. On-line Lernen mit univar der
Seite 56 und 57: 52 2. On-line Lernen mit univar vie
Seite 58 und 59: 54 2. On-line Lernen mit univar (a1
Seite 60 und 61: 56 2. On-line Lernen mit univar 2.1
Seite 62 und 63: 58 2. On-line Lernen mit univar (c)
Seite 64 und 65: 60 2. On-line Lernen mit univar Die
Seite 66 und 67: 62 2. On-line Lernen mit univar log
Seite 68 und 69: 64 2. On-line Lernen mit univar imm
Seite 70 und 71: 66 2. On-line Lernen mit univar in
Seite 72 und 73: 68 2. On-line Lernen mit univar und
Seite 74 und 75: 70 2. On-line Lernen mit univar
Seite 76 und 77: 72 3. Neuronale Gewöhnung in Aplys
Seite 82 und 83: 78 4. Neuigkeitsorientiertes Lernen
Seite 100 und 101: 96 5. Zusammenfassung und Ergebniss
Seite 102 und 103: 98 A. Gedächtniskerne Man sieht, d
Seite 104 und 105: Appendix B Einige einfache Modelle
Seite 106 und 107: 102 B. Einige einfache Modelle Nun
Seite 108 und 109: 104 B. Einige einfache Modelle bere
Seite 110 und 111: Appendix C Ergebnisse der Variation
Seite 112 und 113: 108 C. Ergebnisse der Variationsrec
Seite 118 und 119: Literatur Abramowitz, M. & Stegun,
Seite 120 und 121: 116 Literatur Rieke, F., Warland, D
Seite 122 und 123: 118 Notation cr Zentren der Gaußfu
Seite 124 und 125: 120
Alle anzeigen

Diplomarbeit von Michael Schindler

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?