Thesis - RWTH Aachen University

Weitere Magazine

Empfehlungen

Info

210 C.7 Bayesian Belief Networks In dem Beispiel aus Abbildung C.18 ist die Berechnung von p(A|C) ein Fall von diagnostischer Inferenz. Mit dem Bayes-Theorem aus Gleichung C.75 folgt: p(A|C) = p(C|A)p(A) p(C|A)p(A) + p(C|¬A)p(¬A) Die Wahrscheinlichkeiten p(C|A) und p(C|¬A) können durch eine kausale Inferenz bestimmt werden. Die Wahrscheinlichkeiten p(A) und p(¬A) = 1 − p(A) sind als a priori-Wahrscheinlichkeiten bekannt. Damit ist die diagnostische Inferenz auf die kausale Inferenz zurückzuführen. Diese Vorgehensweise lässt sich nur bei Netzen mit einer geringen Knoten- und Zustandsanzahl durchführen. Bei komplexen Graphen würde sie zu einem zu großen, in der Praxis nicht vertretbaren, Rechenaufwand führen. Aus diesem Grund wurde eine Reihe von Inferenzalgorithmen entwickelt, die zuerst das Netz transformieren, um dann eine weniger aufwendige Berechnung durchzuführen. Zu ihnen gehört unter anderem der Junction-Tree Algorithmus nach Spiegelhalter [SDLC93]. Bei diesem Algorithmus erfolgt zunächst eine Transformation des gerichteten BBN Graphes in einen ungerichteten. Anschließend wird der Graph in Gruppen, so genannte Belief Universes, unterteilt, in Form eines Baumes geordnet und initialisiert. Nach dieser einmaligen Transformation können verschiedene Beobachtungen eingetragen und schnell durch den Baum propagiert werden, um eine Zustandswahrscheinlichkeit für einen gewünschten Knoten auszurechnen. Da ein großer Teil der nötigen Gesamtberechnung nur einmal durchgeführt wird und zwar bei der Initialisierung, sind erhebliche Geschwindigkeitsvorteile erzielbar. Dies setzt jedoch voraus, dass der Graph und die cpts nach der Transformation unverändert bleiben. Im Gegensatz zu der beschriebenen exakten Inferenz berechnet die approximierte Inferenz Ergebnisse, welche die tatsächliche Wahrscheinlichkeit nur näherungsweise angeben. Da sie in dieser Arbeit nicht eingesetzt wird, wird sie hier nicht weiter behandelt. Eine Übersicht über vorhandene Algorithmen kann bei Charniak [Cha91] gefunden werden. C.7.2 Lernen eines BBN Der erste Schritt beim Entwurf eines BBN ist die Festlegung der Struktur des Graphen anhand der beobachteten Abhängigkeiten zwischen den Zufallsvariablen. Anschließend werden die Wahrscheinlichkeiten in den cpts durch Befragen eines Experten besetzt. Darüber hinaus ist es jedoch wünschenswert, das BBN mit Hilfe von Lernalgorithmen anzupassen, d.h. zu trainieren. Dies hat den Vorteil, dass das Expertenwissen nicht vorliegen muss, damit das BBN die gewünschten Zusammenhänge modelliert. Generell werden Lernverfahren nach zwei Kriterien unterteilt [Hec95]: Strukturlernen umfasst das Erlernen der Struktur des Graphen, also der Abhängigkeiten zwischen den Zufallsvariablen. Parameterlernen geht von einer bekannten Graphenstruktur aus und erlernt die Wahrscheinlichkeiten der cpts. Beim Parameterlernen wird weiter nach der Beobachtbarkeit der Knoten unterschieden, d.h. ob die Zustände aller Zufallsvariablen bekannt sind oder einige nicht beobachtet werden können.
C.7 Bayesian Belief Networks 211 Im Folgenden wird das Parameterlernen nach Heckerman 17 [Hec95] unter voller Beobachtbarkeit bei bekannter Struktur näher erläutert. Zunächst wird nur ein einzelner Knoten mit r möglichen Zuständen Zk, k = 1, ..., r, betrachtet. Für jeden dieser Zustände existieren unbekannte a priori Wahrscheinlichkeiten ΘZ = {θZ=Z1, . . . , θZ=Zr}, die angeben, mit welcher Wahrscheinlichkeit der jeweilige Zustand Z angenommen wird. Wenn ΘZ bekannt wäre, könnte die Wahrscheinlichkeit dafür, dass ein bestimmter Zustand Z = Zk eintritt, exakt bestimmt werden und ein Lernen wäre unnötig: p(Z = Zk|ΘZ) = θZ=Zk (C.76) Da die Verteilungen ΘZ aber unbekannt sind, kann nur eine Wahrscheinlichkeitsverteilung p(ΘZ) angegeben werden. Somit beträgt die Wahrscheinlichkeit, dass sich der Knoten im Zustand Z = Zk befindet: � � p(Z = Zk) = p(Z = Zk|ΘZ) p(ΘZ) dΘZ = θZ=Zk p(ΘZ) dΘZ ≡ E(θZ=Zk ) (C.77) Die Wahrscheinlichkeit, dass der Zustand Zk beobachtet wird, entspricht also dem Erwartungswert E(θZ=Zk ), der in der cpt eingetragen ist und beim Lernen angepasst wird. Sollen die Wahrscheinlichkeitsverteilungen ΘZ nach Beobachtung eines Falles Z = Zk angepasst werden, ist es notwendig, die a posteriori Wahrscheinlichkeit p(ΘZ|Z = Zk) mit Hilfe des Bayes-Theorem (Gleichung C.75) und der Gleichung C.76 zu berechnen: p(ΘZ|Z = Zk) = c p(Z = Zk|ΘZ) p(ΘZ) = c θZ=Zk p(Θx) (C.78) Der Parameter c ist hierbei eine Normalisierungskonstante. Sei D = {Z1, . . . , Zm} eine Datenmenge von m beobachteten Fällen, wobei jedes Zi einen der r möglichen Zustände darstellt. Falls die Datenmenge D beobachtet wird, ergibt sich analog zu Gleichung C.78: p(ΘZ|D) = c r� k=1 θ Nk Z=Zk p(ΘZ) (C.79) Dabei ist Nk die Anzahl von Fällen, bei denen der Zustand Zk aufgetreten ist. Hiermit ist allgemein eine Formel zur Anpassung der a priori Wahrscheinlichkeit für einen Knoten in einem BBN nach Beobachtung von m Fällen hergeleitet. Für Θx kann eine beliebige Wahrscheinlichkeitsverteilung angenommen werden, in der Praxis wird jedoch häufig die Dirichletverteilung gewählt: p(ΘZ) = Γ(� r r� θ ′ k=1 N k ) �r ′ k=1 Γ(N k ) k=1 ′ N k−1 Z=Zk (C.80) Dabei stellt Γ die Gammafunktion dar und die N ′ k beschreiben die Exponenten der Dirichletfunktion. Nach dem Erlernen der Datenmenge D ergibt sich für die a posteriori Wahrscheinlichkeit nach den Gleichungen C.79 und C.80 mit p(ΘZ|D) = c ′ r� θ k=1 ′ N k +Nk−1 Z=Zk (C.81) 17 Das Parameterlernen nach Heckerman [Hec95] wird auch in dieser Arbeit zur Anpassung der BBNS der Vehaltens- koordination verwendet.
Seite 1:
Bildgestütztes Teach-In eines mobi
Seite 4 und 5:
ii und der Koordinationsmechanismus
Seite 7 und 8:
Inhaltsverzeichnis Abbildungsverzei
Seite 9 und 10:
INHALTSVERZEICHNIS vii 5.3 Verhalte
Seite 11 und 12:
Abbildungsverzeichnis 1.1 Anwendung
Seite 13 und 14:
ABBILDUNGSVERZEICHNIS xi 4.10 Epipo
Seite 15 und 16:
ABBILDUNGSVERZEICHNIS xiii C.11 Rad
Seite 17 und 18:
Tabellenverzeichnis 2.1 Gemeinsamke
Seite 19 und 20:
Kapitel 1 Einleitung In der industr
Seite 21 und 22:
1.2 Mobile Manipulation mit Hindern
Seite 23 und 24:
1.2 Mobile Manipulation mit Hindern
Seite 25 und 26:
1.3 Gliederung der Arbeit 7 Grund d
Seite 27 und 28:
Kapitel 2 Einführung in die mobile
Seite 29 und 30:
2.1 Allgemeine Systemarchitekturen
Seite 31 und 32:
2.2 Reaktive Verhalten für Manipul
Seite 33 und 34:
Seite 35 und 36:
Seite 37 und 38:
Seite 39 und 40:
Seite 41 und 42:
Seite 43 und 44:
Seite 45 und 46:
Seite 47 und 48:
2.3 Verfahren zur Koordination reak
Seite 49 und 50:
Seite 51 und 52:
Seite 53 und 54:
2.4 Planung 35 die Welt, die aus ei
Seite 55 und 56:
2.4 Planung 37 liche Zustand nicht
Seite 57 und 58:
2.4 Planung 39 eine Suche im Graphe
Seite 59 und 60:
2.5 Virtuelle Realität und Robotik
Seite 61 und 62:
2.6 Spezielle Systemarchitekturen f
Seite 63 und 64:
2.6 Spezielle Systemarchitekturen f
Seite 65 und 66:
2.7 Ein Konzept zur mobilen Manipul
Seite 67 und 68:
2.8 Abgrenzung von anderen Arbeiten
Seite 69 und 70:
Kapitel 3 Eine virtuelle Umgebung z
Seite 71 und 72:
3.2 Abgleich der Daten virtueller u
Seite 73 und 74:
Seite 75 und 76:
Seite 77 und 78:
Seite 79 und 80:
Seite 81 und 82:
3.3 Teach-In in virtuellen Umgebung
Seite 83 und 84:
Seite 85 und 86:
Seite 87 und 88:
Seite 89 und 90:
Seite 91 und 92:
Kapitel 4 Bildgestützte reaktive V
Seite 93 und 94:
4.1 Bildgestützte Zielführung 75
Seite 95 und 96:
Seite 97 und 98:
Seite 99 und 100:
Seite 101 und 102:
4.2 Hindernisvermeidung 83 Steuerun
Seite 103 und 104:
4.2 Hindernisvermeidung 85 PSfrag r
Seite 105 und 106:
4.2 Hindernisvermeidung 87 Stochast
Seite 107 und 108:
4.2 Hindernisvermeidung 89 Fünfte
Seite 109 und 110:
4.2 Hindernisvermeidung 91 H 1 ρ
Seite 111 und 112:
4.2 Hindernisvermeidung 93 Ist der
Seite 113 und 114:
4.2 Hindernisvermeidung 95 Aus der
Seite 115 und 116:
4.2 Hindernisvermeidung 97 Nach der
Seite 117 und 118:
4.3 Pfadplanung im lokalen Manipula
Seite 119 und 120:
Seite 121 und 122:
Seite 123 und 124:
Kapitel 5 Verhaltensauswahl und Ver
Seite 125 und 126:
5.2 Verhaltensauswahl 107 Rückmeld
Seite 127 und 128:
5.2 Verhaltensauswahl 109 5.2.2 Abl
Seite 129 und 130:
5.3 Verhaltenskoordination 111 Verh
Seite 131 und 132:
5.3 Verhaltenskoordination 113 Nach
Seite 133 und 134:
5.3 Verhaltenskoordination 115 5.3.
Seite 135 und 136:
PSfrag replacements 5.3 Verhaltensk
Seite 137 und 138:
5.4 Erlernen der Verhaltenskoordina
Seite 139 und 140:
5.5 Resultate des Trainings 121 Nac
Seite 141 und 142:
5.6 Ergebnisse der Verhaltenskoordi
Seite 143 und 144:
5.7 Bewertung und Einordnung des im
Seite 145 und 146:
5.7 Bewertung und Einordnung des im
Seite 147 und 148:
Kapitel 6 Aufgabenplanung Die vermi
Seite 149 und 150:
6.2 High-Level Planer 131 einen Pla
Seite 151 und 152:
6.4 Weltdatenbank 133 der Erfolgsme
Seite 153 und 154:
6.5 Geometrische Planung 135 Root =
Seite 155 und 156:
6.5 Geometrische Planung 137 (a) (b
Seite 157 und 158:
6.6 ComControl 139 ja nein nein nei
Seite 159 und 160:
6.7 Ausführung des Testszenarios 1
Seite 161 und 162:
6.7 Ausführung des Testszenarios 1
Seite 163 und 164:
Kapitel 7 Zusammenfassung und Ausbl
Seite 165 und 166:
schiedliche Greifstrategien für un
Seite 167 und 168:
Literaturverzeichnis [ABD + 98a] N.
Seite 169 und 170:
LITERATURVERZEICHNIS 151 [BAHK95] B
Seite 171 und 172:
LITERATURVERZEICHNIS 153 [BRS99] R.
Seite 173 und 174:
LITERATURVERZEICHNIS 155 [DH55] J.
Seite 175 und 176:
LITERATURVERZEICHNIS 157 [GKG96] R.
Seite 177 und 178: LITERATURVERZEICHNIS 159 [HOB + 04]
Seite 179 und 180: LITERATURVERZEICHNIS 161 [KL94a] L.
Seite 181 und 182: LITERATURVERZEICHNIS 163 [MCB00] E.
Seite 183 und 184: LITERATURVERZEICHNIS 165 [PRG + 03]
Seite 185 und 186: LITERATURVERZEICHNIS 167 [SD98] L.
Seite 187 und 188: LITERATURVERZEICHNIS 169 [Tsa87] R.
Seite 189 und 190: LITERATURVERZEICHNIS 171 [YYW03] Ca
Seite 191 und 192: Anhang A Symbolverzeichnis Allgemei
Seite 193 und 194: Symbol Bedeutung Ij Interner Zustan
Seite 195 und 196: Anhang B Mobiler Service Roboter TA
Seite 197 und 198: B.3 Kalibrierung der Roboterkameras
Seite 199 und 200: Anhang C Theoretische Grundlagen C.
Seite 201 und 202: C.1 Theoretische Grundlagen der Man
Seite 215 und 216: C.2 Epipolare Geometrie 197 und αl
Seite 217 und 218: C.3 Radial Basis Function Netze 199
Seite 219 und 220: C.3 Radial Basis Function Netze 201
Seite 221 und 222: C.4 Fuzzy Logik 203 gemessene Einga
Seite 223 und 224: C.5 Neurofuzzy 205 Maximum einer Zu
Seite 225 und 226: C.6 Temporal Differencing Verfahren
Seite 227: C.7 Bayesian Belief Networks 209 Di
Seite 231 und 232: Anhang D Implementierungsdaten der
Seite 233 und 234: D.2 Steuerungskomponente der Hinder
Seite 241 und 242: Anhang E FSAs und BBNs der vermitte
Seite 243 und 244: E.2 Realisierte Bayesian Belief Net
Seite 249 und 250: Anhang F Deliberative Ebene F.1 S-G
Seite 251 und 252: F.1 S-GOLOG Programm für das Tests
Seite 253: F.2 Weltdatenbank für das Testszen
Alle anzeigen

Thesis - RWTH Aachen University

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?