Diplomarbeit von Michael Schindler

Weitere Magazine

Empfehlungen

Info

80 4. Neuigkeitsorientiertes Lernen 4.1.2 Ein Algorithmus für die Entkopplung von Lern- und Systemdynamik Der ANTS, als selbstreferentiell filternder univar-Algorithmus, lautet nun folgendermaßen: (TS-1) Initialisiere die Netzwerkparameter wie in (MV-1) (TS-2) Ziehe den nächsten Punkt xt aus dem Datensatz X. Berechne die Gesamtaktivität A � xt, θ(t) � als Mischung von gleich gewichteten univariaten � Normalverteilungen identischer Varianz σ, sowie die Zuständigkeiten ar xt, θ(t) � durch globale Normierung nach Gleichung (1-10). (TS-3) Bestimme die Relevanz des Punktes x, f � xt, θ(t) � = Θ(ǫA − A(xt)) ∈ {0, 1} (4-6) und passe die Neuigkeitsschwelle an, � η α falls f(xt) = 0, ln ǫA(t+1) = ln ǫA(t) + η (α − 1) sonst. (4-7) (TS-4) Berechne die neue Schätzung mit der Zentren-Lernregel cr(t+1) = cr(t) + εf � xt, θ(t) � � ar xt, θ(t) � � xt − cr(t) � , (4-8) (TS-5) Setze die Lernparameter ε und σ auf neue Werte, und zwar nach vorgegebenen Annealing-Schemata ε(t) und σ(t) (TS-6) Zähle die diskrete Zeit t weiter und gehe zu (TS-2). Der Algorithmus ist so gemacht, dass die Lernparameter nur im Fall eines relevanten Datenpunktes abgekühlt werden. Implizit führt man also eine subjektive Zeit tL des Lerners ein, die nur dann weitergezählt wird, wenn gelernt wird. In seiner eigenen Zeit verhält sich der Algorithmus also wie im univar-Modus. Wegen f ∈ {0, 1} ist die subjektive Zeit hier t� tL(t) = f(t ′ ). (4-9) t ′ =0 In dieser Zeit erscheinen langlebige Datencluster nun von kürzerer Dauer, und man erhält, vom Standpunkt des Lerners aus gesehen, neue, verkürzte Systemzeitskalen. Diese Veränderung des zeitlichen Systemverhaltens ist Ziel und Grund für die Einführung des Faktors f in die Lernregel. In der Formulierung des ANTS in (TS-1) bis (TS-6) wurde durchgängig die Notation der Aktivitäten A und ar verwendet, und nicht, wie im multivar-Algorithmus, diejenigen der geschätzten Wahrscheinlichkeiten ˆp und ˆ P(r|·). Dies hat den Grund, dass die Gesamtaktivität A hier kein Modell für die Verteilungsdichte p mehr ist, sondern andere Approximationseigenschaften hat, wie im folgenden Abschnitt gezeigt wird.
4.2 Das Verhalten des ANTS 4.2 Das Verhalten des ANTS 81 Die Einführung der modifizierten Lernregel (4-8) und der Aufmerksamkeitsschwelle in Schritt (TS-3) hat nicht nur zeitliche, sondern auch räumliche Auswirkungen. Zunächst sollen ihre Auswirkungen auf die stationären Eigenschaften des ANTS beschrieben werden, anschließend wird beschrieben, wie sie Lern- und Systemdynamik so entkoppelt, dass die Hierarchie in den Phasenübergängen erhalten bleibt. 4.2.1 Stationäre Approximationseigenschaften In Abschnitt 1.1 wurde erklärt, warum der univar-Algorithmus eine Approximation der Verteilungsdichte p des präsentierten Datensatzes durchführt. Die Frage nach der Approximationseigenschaft des ANTS ist wesentlich schwieriger zu beantworten. Die Verteilungsdichte wird, da Datenpunkte nach der Regel (TS-3) ignoriert werden können, ständig selbstreferentiell modifiziert. Deswegen wird nicht eine einfache Loglikelihood-Funktion der ursprünglichen Form � p(x) ln A(x, θ) dx (4-10) M maximiert, sondern es wird p durch die Verteilungsdichte ˜p der tatsächlich gelernten Datenpunkte ersetzt. Diese hängt selbst von den Parametern θ ab. Abbildung 41 zeigt, dass die Codebuchzentren selbst im stationären Endzustand des Lerners ständig hin- und hergezogen werden. Sie weisen dadurch unterschiedliches Selektionsverhalten zu unterschiedlichen Zeitpunkten auf. Datenpunkte an der Stelle x∈M können, je nach Zustand des Lerners, einmal gelernt und zu einem anderen Zeitpunkt ignoriert werden. Beim Versuch, diejenige Menge Ω ⊂ M zu charakterisieren, in der Datenpunkte gelernt werden, stellt man fest, dass die kleinen Bewegungen im Codebuch diese ständig ” verschmieren.“ Man bekommt also nicht eine scharfe Menge Ω, sondern für jeden Punkt x ∈ M eine Wahrscheinlichkeit ωA(x), dass dort gelernt wird. Diese Wahrscheinlichkeiten kann man auch als Zuordnungsfunktion ωA der fuz- (a) At c1 f(xt) = 0 c2 ǫA (b) At+1 c1 f(xt+1) = 1 c2 (c) At+2 c1 f(xt+2) = 1 Abbildung 41: Skizze eines quasistationären Zustands im Lerner aus zwei Neuronen zu drei aufeinanderfolgenden Zeitpunkten. In (a) wird ein Datenpunkt xt ignoriert, da die Aktivierung A(xt; θ(t)) größer als die Schwelle ǫA ist. Der darauffolgende Punkt (b) wird gelernt, die Zentren rutschen leicht nach rechts. In (c) wird zufällig wieder der gleiche Punkt wie in (a) gezeigt, diesmal kann er jedoch gelernt werden. c2 ǫA
Seite 1:
Modelle zur Entkopplung von Lern- u
Seite 4 und 5:
iv Inhaltsverzeichnis 3 Neuronale G
Seite 6 und 7:
2 Einleitung a3 a4 a1 a2 Abbildung
Seite 8 und 9:
4 Einleitung Das Auffinden der pass
Seite 10 und 11:
6 Einleitung In der folgenden Gleic
Seite 12 und 13:
8 Einleitung Gleitende Mittelung vo
Seite 14 und 15:
10 Einleitung Dauer. Die akustische
Seite 16 und 17:
12 Einleitung kann, insbesondere, w
Seite 18 und 19:
14 1. Grundlagen schen Methoden zu
Seite 20 und 21:
16 1. Grundlagen lichkeitsdichte je
Seite 22 und 23:
18 1. Grundlagen Glockenkurve zuord
Seite 24 und 25:
20 1. Grundlagen folgt. Dies ist di
Seite 26 und 27:
22 1. Grundlagen Mit den Eigenwertg
Seite 28 und 29:
24 1. Grundlagen verteilungen, was
Seite 30 und 31:
26 1. Grundlagen kann diese Analogi
Seite 32 und 33:
28 1. Grundlagen Kapitel 2 gewidmet
Seite 34 und 35: 30 1. Grundlagen Eingabeschicht ⏐
Seite 36 und 37: 32 1. Grundlagen h r Sr T −→ x
Seite 38 und 39: 34 1. Grundlagen Die Verarbeitungsa
Seite 40 und 41: 36 1. Grundlagen 1.2.4 Hebb’sches
Seite 42 und 43: 38 1. Grundlagen (a) (b) kleiner Fi
Seite 44 und 45: 40 1. Grundlagen 1.2.6 Dimensionsre
Seite 46 und 47: 42 2. On-line Lernen mit univar Nac
Seite 48 und 49: 44 2. On-line Lernen mit univar 0 t
Seite 50 und 51: 46 2. On-line Lernen mit univar Au
Seite 52 und 53: 48 2. On-line Lernen mit univar x/
Seite 54 und 55: 50 2. On-line Lernen mit univar der
Seite 56 und 57: 52 2. On-line Lernen mit univar vie
Seite 58 und 59: 54 2. On-line Lernen mit univar (a1
Seite 60 und 61: 56 2. On-line Lernen mit univar 2.1
Seite 62 und 63: 58 2. On-line Lernen mit univar (c)
Seite 64 und 65: 60 2. On-line Lernen mit univar Die
Seite 66 und 67: 62 2. On-line Lernen mit univar log
Seite 68 und 69: 64 2. On-line Lernen mit univar imm
Seite 70 und 71: 66 2. On-line Lernen mit univar in
Seite 72 und 73: 68 2. On-line Lernen mit univar und
Seite 74 und 75: 70 2. On-line Lernen mit univar
Seite 76 und 77: 72 3. Neuronale Gewöhnung in Aplys
Seite 82 und 83: 78 4. Neuigkeitsorientiertes Lernen
Seite 100 und 101: 96 5. Zusammenfassung und Ergebniss
Seite 102 und 103: 98 A. Gedächtniskerne Man sieht, d
Seite 104 und 105: Appendix B Einige einfache Modelle
Seite 106 und 107: 102 B. Einige einfache Modelle Nun
Seite 108 und 109: 104 B. Einige einfache Modelle bere
Seite 110 und 111: Appendix C Ergebnisse der Variation
Seite 112 und 113: 108 C. Ergebnisse der Variationsrec
Seite 118 und 119: Literatur Abramowitz, M. & Stegun,
Seite 120 und 121: 116 Literatur Rieke, F., Warland, D
Seite 122 und 123: 118 Notation cr Zentren der Gaußfu
Seite 124 und 125: 120
Alle anzeigen

Diplomarbeit von Michael Schindler

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?