Diplomarbeit von Michael Schindler

Weitere Magazine

Empfehlungen

Info

22 1. Grundlagen Mit den Eigenwertgleichungen wri = 1 σ2 Σrwri, σ ri 2 ri = wT riΣrwri. (1-38) können aus der Lernregel (1-33) für die Kovarianzmatrizen zwei äquivalente Regeln gewonnen werden, ∆wri = ˆ � (xt − cr(t)) (xt − cr(t)) P(r|xt) Twri(t) σ 2 ri (t) � − wri(t) , (1-39) ∆(σ 2 ri) = ˆ ��(xt P(r|xt) − cr(t)) T wri(t) � � 2 2 − σri(t) . (1-40) Die erste Gleichung hat die Form einer Richtungslernregel. Sie ist an diejenige von Oja (1982) angelehnt und führt, unabhängig von den Varianzen, eine Hauptachsenbestimmung durch (siehe dazu Rubner & Tavan, 1989; Albrecht et al. 2000). Um zu vermeiden, dass alle wri in dieselbe Richtung maximaler Varianz zeigen, müssen die wri nach jedem Lernschritt orthogonalisiert werden. Lässt man ferner in (1-39) den normierenden Zerfallsterm (−wri) weg, so muss man nach jedem Lernschritt eine Gram- Schmidt-Orthonormierung (Fischer & Kaul, 1990) der Vektoren wri durchführen. Wie von Albrecht et al. (2000) gezeigt wurde, diagonalisieren die so gelernten wri die r-lokalen Kovarianzmatrizen � (x−cr)(x−cr) T� r,�. Der multivar-Algorithmus von Kloppenburg & Tavan (1997) lautet (MV-1) Initialisiere die Parameter θ(t=0) (MV-2) Ziehe einen zufälligen Punkt xt aus dem Datensatz X und berechne die Zuständigkeiten nach dem Bayes’schen Satz (1-10) (MV-3) Berechne das neue Codebuch nach den Updateregeln θ(t+1) = θ(t) + ε∆θ, wobei ∆cr = ˆ P(r|xt) � xt − cr(t) + R � mit einem kleinen Rauschen R, ∆wri = ˆ P(r|xt) σ 2 ri (t) (1-41) � xt − cr(t) � � xt − cr(t) � T wri(t) (1-42) und orthonormiere die neuen Hauptachsen wri(t), (1-43) ∆(σ 2 ri) = ˆ ��(xt P(r|xt) − cr(t)) T wri(t) �2 2 − σri(t) + µ σ2 − σ2 ri 〈 ˆ � , (1-44) P(r|x)〉 ∆ ˆ � Pr = ˆP(r|xt) − ˆ � 1 Pr(t) + ν M − ˆ �� Pr(t) . (1-45)
1.1 Dichteschätzung mit einer Mischung multivariater Normalverteilungen 23 (MV-4) Setze die Lernparameter ε, σ, µ und ν auf neue Werte, und zwar nach vorgegebenen Funktionen ε(t), σ(t), µ(t) und ν(t) (MV-5) Zähle die diskretisierte Zeit t um eins weiter und gehe nach (MV-2). Die Parameter µ und ν in (1-44) und (1-45) sind Kopplungsparameter, die verhindern, dass sich die Varianzen und die Gewichte beliebig an die Daten anpassen können, und die dafür sorgen, dass sie näherungsweise vorgegebene Werte annehmen. Wie Kloppenburg (1996) zeigte, werden bei großem µ die verschiedenen Varianzen σ 2 ri näherungsweise an den vorgegebenen Wert σ 2 gebunden. Auf die gleiche Weise können sich die Gewichtungen ˆ Pr der Normalverteilungen bei großem ν nicht weit vom Vorgabewert 1/M entfernen. Dies sind die entscheidende Punkte am multivar-Algorithmus, da auf diese Weise die oben beschriebenen Instabilitäten bei der Kompetition behoben werden können. In Schritt (MV-4) werden die Lernparameter neu berechnet. Die Kopplungsterme µ und ν werden verkleinert, wodurch die Kopplung der Varianzen und Gewichtungen schrittweise aufgehoben werden kann. Auch der Vorgabewert σ 2 , der als der wahrscheinlichste aller Varianzen eingeführt wird, muss über einen großen Bereich von Werten verändert werden, wie im folgenden Abschnitt erklärt wird. Der Lernparameter ε wird ebenfalls verkleinert. Beim einfachsten ANN in der Einleitung klang schon an, dass 1/ε etwas mit der Dauer des Gedächtnisses zu tun hat. Durch Verkleinerung des Parameters wird die gleitende Mittelwertsbildung also immer genauer. Durch diese Änderungen am ursprünglichen sequentiellen EM-Algorithmus erreichten Kloppenburg & Tavan (1997), dass der multivar-Algorithmus sowohl die Eigenschaften eines stabilen sequentiellen Dichteschätzers aufweist, als auch diejenigen eines Clusteringalgorithmus. Dieser zweite Aspekt soll im folgenden Abschnitt näher beleuchtet werden, da er für die vorliegende Arbeit von großer Bedeutung ist. 1.1.2 Clustereinteilung und σ-Annealing: Der univar-Algorithmus Das Verfahren zur Dichteschätzung mit multivar kann in zwei Phasen eingeteilt werden. In der ersten Phase, dem sogenannten univar-Schritt, werden die Kopplungsparameter µ und ν groß und konstant gewählt. Ferner wird der Vorgabewert σ 2 für die Varianzen schrittweise, bei großem Anfangswert beginnend, verkleinert. Durch die Bindung der Varianzen σ 2 ri an den Vorgabewert σ 2 gilt für die Kovarianzmatrizen nach (1-37) näherungsweise Σr ≈ σ 2 d� i=1 wriw T ri und wegen der Orthonormalität der Eigenvektoren wri, , (1-46) Σr ≈ σ 2 I, (1-47) wobei I die Einheitsmatrix ist. Nach (1-47) entarten also die Komponenten (1-12) der Mischungsdichte (1-3) zu d-dimensionalen Gaußkugeln, d.h. univariaten Normal-
Seite 1: Modelle zur Entkopplung von Lern- u
Seite 4 und 5: iv Inhaltsverzeichnis 3 Neuronale G
Seite 6 und 7: 2 Einleitung a3 a4 a1 a2 Abbildung
Seite 8 und 9: 4 Einleitung Das Auffinden der pass
Seite 10 und 11: 6 Einleitung In der folgenden Gleic
Seite 12 und 13: 8 Einleitung Gleitende Mittelung vo
Seite 14 und 15: 10 Einleitung Dauer. Die akustische
Seite 16 und 17: 12 Einleitung kann, insbesondere, w
Seite 18 und 19: 14 1. Grundlagen schen Methoden zu
Seite 20 und 21: 16 1. Grundlagen lichkeitsdichte je
Seite 22 und 23: 18 1. Grundlagen Glockenkurve zuord
Seite 24 und 25: 20 1. Grundlagen folgt. Dies ist di
Seite 28 und 29: 24 1. Grundlagen verteilungen, was
Seite 30 und 31: 26 1. Grundlagen kann diese Analogi
Seite 32 und 33: 28 1. Grundlagen Kapitel 2 gewidmet
Seite 34 und 35: 30 1. Grundlagen Eingabeschicht ⏐
Seite 36 und 37: 32 1. Grundlagen h r Sr T −→ x
Seite 38 und 39: 34 1. Grundlagen Die Verarbeitungsa
Seite 40 und 41: 36 1. Grundlagen 1.2.4 Hebb’sches
Seite 42 und 43: 38 1. Grundlagen (a) (b) kleiner Fi
Seite 44 und 45: 40 1. Grundlagen 1.2.6 Dimensionsre
Seite 46 und 47: 42 2. On-line Lernen mit univar Nac
Seite 48 und 49: 44 2. On-line Lernen mit univar 0 t
Seite 50 und 51: 46 2. On-line Lernen mit univar Au
Seite 52 und 53: 48 2. On-line Lernen mit univar x/
Seite 54 und 55: 50 2. On-line Lernen mit univar der
Seite 56 und 57: 52 2. On-line Lernen mit univar vie
Seite 58 und 59: 54 2. On-line Lernen mit univar (a1
Seite 60 und 61: 56 2. On-line Lernen mit univar 2.1
Seite 62 und 63: 58 2. On-line Lernen mit univar (c)
Seite 64 und 65: 60 2. On-line Lernen mit univar Die
Seite 66 und 67: 62 2. On-line Lernen mit univar log
Seite 68 und 69: 64 2. On-line Lernen mit univar imm
Seite 70 und 71: 66 2. On-line Lernen mit univar in
Seite 72 und 73: 68 2. On-line Lernen mit univar und
Seite 74 und 75: 70 2. On-line Lernen mit univar
Seite 76 und 77:
72 3. Neuronale Gewöhnung in Aplys
Seite 78 und 79:
Seite 80 und 81:
Seite 82 und 83:
78 4. Neuigkeitsorientiertes Lernen
Seite 84 und 85:
Seite 86 und 87:
Seite 88 und 89:
Seite 90 und 91:
Seite 92 und 93:
Seite 94 und 95:
Seite 96 und 97:
Seite 98 und 99:
Seite 100 und 101:
96 5. Zusammenfassung und Ergebniss
Seite 102 und 103:
98 A. Gedächtniskerne Man sieht, d
Seite 104 und 105:
Appendix B Einige einfache Modelle
Seite 106 und 107:
102 B. Einige einfache Modelle Nun
Seite 108 und 109:
104 B. Einige einfache Modelle bere
Seite 110 und 111:
Appendix C Ergebnisse der Variation
Seite 112 und 113:
108 C. Ergebnisse der Variationsrec
Seite 114 und 115:
Seite 116 und 117:
Seite 118 und 119:
Literatur Abramowitz, M. & Stegun,
Seite 120 und 121:
116 Literatur Rieke, F., Warland, D
Seite 122 und 123:
118 Notation cr Zentren der Gaußfu
Seite 124 und 125:
120
Alle anzeigen

Diplomarbeit von Michael Schindler

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?