Thesis - RWTH Aachen University

Weitere Magazine

Empfehlungen

Info

114 5.3 Verhaltenskoordination • Die Abhängigkeit führt von den Verhaltensknoten zu den Merkmalsknoten. Hierbei wird davon ausgegangen, dass eine Anwendbarkeit des Verhaltens vorliegt und aus dieser Aktivierung eine bestimmte Merkmalskombination folgt. Da die Werte der Merkmalsknoten vorliegen, kann man über die so genannte diagnostische Inferenz auf die Anwendbarkeit des Verhaltensknotens schließen [Cha91]. Beide Darstellungen sind, was die Inferenz betrifft, ineinander überführbar. Aus mehreren Gründen wurde hier die zweite Möglichkeit realisiert: • Die nötigen cpts sind für die in dieser Arbeit implementierten BBNs im Fall der diagnostischen Inferenz wesentlich kleiner. Bei beispielsweise vier Merkmalen mit jeweils vier Zuständen und eine Anwendbarkeit mit zehn Zuständen ergibt sich bei der ersten Art eine cpt mit 4 4 ·10 = 2560 Einträgen für den Verhaltensknoten und vier cpts mit vier Einträgen für die Merkmalsknoten. Bei der zweiten Art werden für den Verhaltensknoten zehn und für die vier Merkmalsknote jeweils 4 · 10 = 40 Einträge benötigt. • Aufgrund der kleineren cpts kann das Training des BBNs effizienter und mit einer schnelleren Konvergenz erfolgen. • Das später vorgestellte, für beide Varianten durchgeführte Training zeigt einen geringeren Fehler bei Abhängigkeiten, die von den Verhaltensknoten zu den Merkmalsknoten führen. Dies resultiert zu einer besseren Berechnung der Gewichtung eines Verhaltens. 5.3.3 Bestimmung der Wertbereiche der Eingaben und Ausgaben der BBNs Da die verwendeten Inferenz- und Lernalgorithmen nur für Netze mit rein diskreten Knoten einsetzbar sind, müssen die kontinuierlichen Einträge des Merkmalsvektors �s ′ i, der als Eingabe für das BBN vom i-ten Verhalten dient, mit Hilfe von Schwellwerten kj in diskrete Intervalle eingeteilt werden. Alle Werte innerhalb eines solchen Intervalls (kj, kj+1) werden als gleichwertig angesehen, da sie dem gleichen diskreten Zustand Zj entsprechen. Um auch mit diskreten Merkmalswerten eine ausreichende Genauigkeit zu erzielen,wird die Anzahl der Intervalle hoch gewählt. Außerdem werden nicht äquidistante Abstände, also kj − kj−1 �= kj+1 − kj, verwendet, so dass in kritischen Bereichen die Auflösung höher ist. Neben den Eingabenknoten besitzt auch der die jeweilige Anwendbarkeit des Verhaltens repräsentierende Knoten einen kontinuierlichen Wertebereich. Dieser Bereich wird in zehn diskrete Intervalle bzw. Zustände der Länge 0.1 von 0 bis 1 unterteilt. Nach der Inferenz ergeben sich zu 1 summierende Wahrscheinlichkeitsangaben für alle Zustände des Verhaltensknotens. Die Gewichtung des i-ten Verhaltens errechnet sich dann aus der mit der entsprechenden Wahrscheinlichkeitsangabe gewichteten Summe der Zustandsmittelwerte. Diese Vorgehensweise entspricht der Maximum- Defuzzifizierungsmethode bei der Fuzzy Logik: gi = p(βi(�si)|�s ′ i) = 10� j=1 p(Z = Zj) kj + kj+1 2 Experimente haben gezeigt, dass dies zu einer ausreichenden Genauigkeit in der Berechnung der Anwendbarkeit des Verhaltens führt [Sch02]. (5.3)
5.3 Verhaltenskoordination 115 5.3.4 Modellierung der Unsicherheit von Merkmalswerten Die Elemente der Merkmalsvektoren können nicht immer exakt bestimmt werden, sondern unterliegen Rauschen bzw. Unsicherheiten wegen Überlappungen oder Schattenbildung in den Aufnahmen. Dadurch sind die genauen Werte der Merkmale nicht ermittelbar; sie können nur mit einem ungenauen Mittelwert und einer zugehörigen Standardabweichung angegeben werden. Es ist wünschenswert, diese Unsicherheit auch bei der Inferenz mitwirken zu lassen. So würde normalerweise bei der Eintragung eines Merkmalswertes derjenige Zustand des Merkmalsknotens als beobachtet ausgewählt werden, dessen zugehöriges Intervall den Merkmalswert enthält. Liegt jedoch der beobachtete Wert nahe an einer Intervallsgrenze, ist es sinnvoller, beide Intervalle mit einer entsprechenden Wahrscheinlichkeitsangabe als beobachtet auszuwählen. Dadurch wird die Ungenauigkeit der Merkmalsextraktion bei der Inferenz berücksichtigt und beide Möglichkeiten werden bei der Entscheidungsfindung einbezogen. Aus diesem Grund wird eine gaußsche Wahrscheinlichkeitsverteilung für die Elemente des Merkmalsvektors mit dem als Messwert gegebenen Mittelwert µ und einem empirisch bestimmten Standardabweichungswert σ verwendet. Die Wahrscheinlichkeitsangaben für die einzelnen Intervalle werden aus der durch die jeweiligen Intervallsgrenzen eingeschlossenen Fläche unter der gaußschen Wahrscheinlichkeitsdichtefunktion errechnet. Mit der zugehörigen Verteilungsfunktion Φ(x, µ, σ) und den Intervallgrenzen (k1, ..., kn+1) für n diskrete Intervalle ergibt sich der Wert der Wahrscheinlichkeitsangabe für einen Zustand Zj des Knotens wie folgt: p(Z = Zj) = Φ(kj+1, µ, σ) − Φ(kj, µ, σ) (5.4) 5.3.5 BBN der Hindernisvermeidung des Greifers Situationen, in denen die Hindernisvermeidung angewandt wird, zeichnen sich durch die Abstände des Greifers zu den möglichen Hindernissen sowie durch den Winkel des Bewegungsvektors des Greifers zu den Richtungsvektoren der Hindernisse aus. Kollisionsgefahr besteht beispielsweise bei einem geringen Abstand dGH vom Greifer zum nächsten Hindernis. Weiterhin weist ein in Richtung des Hindernisses deutender Bewegungsvektor des Greifers auf eine potentielle Kollision hin; je kleiner dann der relative Winkel φGH des Bewegungsvektors zum Positionsvektor des Hindernisses im System des Greifers ist, desto größer ist die Kollisionsgefahr. Eine ähnliche Bedeutung hat die Änderung des Abstandes zwischen Greifer und Hindernis ˙ dGZ. Ist sie negativ, bewegt sich der Manipulator auf ein Hindernis zu; ein positiver Wert kennzeichnet einen vom Hindernis abgewandten Pfad. Entsprechende Merkmale werden zur Bestimmung der Kollisionsgefahr mit der Auflageebene benutzt. Zusätzlich zu den beschriebenen Merkmalen ist hier auch der Abstand des Greifers zum Ziel entscheidend. Befindet sich der Greifer nah am Zielobjekt, dann darf trotz geringem Abstand zur Auflageebene keine Hindernisvermeidung angewandt werden. Der Merkmalsvektor �s ′ HG am Eingang beinhaltet Einträge, die die obigen Beziehungen zum Ausdruck bringen: �s ′ HG = (dGZ, dGH, ˙ dGH, φGH, dGT , φGT ) T (5.5) Die Elemente von �s ′ HG sowie die zugehörigen Diskretisierungsintervalle sind in Tabelle 5.3 aufgeführt. Durch eine nicht äquidistante Einteilung der Diskretisierungsintervalle und insbesondere durch die höhere Auflösung der kritischen Bereiche in der Nähe der Hindernisse wird eine ausreichende Ge-
Seite 1:
Bildgestütztes Teach-In eines mobi
Seite 4 und 5:
ii und der Koordinationsmechanismus
Seite 7 und 8:
Inhaltsverzeichnis Abbildungsverzei
Seite 9 und 10:
INHALTSVERZEICHNIS vii 5.3 Verhalte
Seite 11 und 12:
Abbildungsverzeichnis 1.1 Anwendung
Seite 13 und 14:
ABBILDUNGSVERZEICHNIS xi 4.10 Epipo
Seite 15 und 16:
ABBILDUNGSVERZEICHNIS xiii C.11 Rad
Seite 17 und 18:
Tabellenverzeichnis 2.1 Gemeinsamke
Seite 19 und 20:
Kapitel 1 Einleitung In der industr
Seite 21 und 22:
1.2 Mobile Manipulation mit Hindern
Seite 23 und 24:
1.2 Mobile Manipulation mit Hindern
Seite 25 und 26:
1.3 Gliederung der Arbeit 7 Grund d
Seite 27 und 28:
Kapitel 2 Einführung in die mobile
Seite 29 und 30:
2.1 Allgemeine Systemarchitekturen
Seite 31 und 32:
2.2 Reaktive Verhalten für Manipul
Seite 33 und 34:
Seite 35 und 36:
Seite 37 und 38:
Seite 39 und 40:
Seite 41 und 42:
Seite 43 und 44:
Seite 45 und 46:
Seite 47 und 48:
2.3 Verfahren zur Koordination reak
Seite 49 und 50:
Seite 51 und 52:
Seite 53 und 54:
2.4 Planung 35 die Welt, die aus ei
Seite 55 und 56:
2.4 Planung 37 liche Zustand nicht
Seite 57 und 58:
2.4 Planung 39 eine Suche im Graphe
Seite 59 und 60:
2.5 Virtuelle Realität und Robotik
Seite 61 und 62:
2.6 Spezielle Systemarchitekturen f
Seite 63 und 64:
2.6 Spezielle Systemarchitekturen f
Seite 65 und 66:
2.7 Ein Konzept zur mobilen Manipul
Seite 67 und 68:
2.8 Abgrenzung von anderen Arbeiten
Seite 69 und 70:
Kapitel 3 Eine virtuelle Umgebung z
Seite 71 und 72:
3.2 Abgleich der Daten virtueller u
Seite 73 und 74:
Seite 75 und 76:
Seite 77 und 78:
Seite 79 und 80:
Seite 81 und 82: 3.3 Teach-In in virtuellen Umgebung
Seite 91 und 92: Kapitel 4 Bildgestützte reaktive V
Seite 93 und 94: 4.1 Bildgestützte Zielführung 75
Seite 101 und 102: 4.2 Hindernisvermeidung 83 Steuerun
Seite 103 und 104: 4.2 Hindernisvermeidung 85 PSfrag r
Seite 105 und 106: 4.2 Hindernisvermeidung 87 Stochast
Seite 107 und 108: 4.2 Hindernisvermeidung 89 Fünfte
Seite 109 und 110: 4.2 Hindernisvermeidung 91 H 1 ρ
Seite 111 und 112: 4.2 Hindernisvermeidung 93 Ist der
Seite 113 und 114: 4.2 Hindernisvermeidung 95 Aus der
Seite 115 und 116: 4.2 Hindernisvermeidung 97 Nach der
Seite 117 und 118: 4.3 Pfadplanung im lokalen Manipula
Seite 123 und 124: Kapitel 5 Verhaltensauswahl und Ver
Seite 125 und 126: 5.2 Verhaltensauswahl 107 Rückmeld
Seite 127 und 128: 5.2 Verhaltensauswahl 109 5.2.2 Abl
Seite 129 und 130: 5.3 Verhaltenskoordination 111 Verh
Seite 131: 5.3 Verhaltenskoordination 113 Nach
Seite 135 und 136: PSfrag replacements 5.3 Verhaltensk
Seite 137 und 138: 5.4 Erlernen der Verhaltenskoordina
Seite 139 und 140: 5.5 Resultate des Trainings 121 Nac
Seite 141 und 142: 5.6 Ergebnisse der Verhaltenskoordi
Seite 143 und 144: 5.7 Bewertung und Einordnung des im
Seite 145 und 146: 5.7 Bewertung und Einordnung des im
Seite 147 und 148: Kapitel 6 Aufgabenplanung Die vermi
Seite 149 und 150: 6.2 High-Level Planer 131 einen Pla
Seite 151 und 152: 6.4 Weltdatenbank 133 der Erfolgsme
Seite 153 und 154: 6.5 Geometrische Planung 135 Root =
Seite 155 und 156: 6.5 Geometrische Planung 137 (a) (b
Seite 157 und 158: 6.6 ComControl 139 ja nein nein nei
Seite 159 und 160: 6.7 Ausführung des Testszenarios 1
Seite 161 und 162: 6.7 Ausführung des Testszenarios 1
Seite 163 und 164: Kapitel 7 Zusammenfassung und Ausbl
Seite 165 und 166: schiedliche Greifstrategien für un
Seite 167 und 168: Literaturverzeichnis [ABD + 98a] N.
Seite 169 und 170: LITERATURVERZEICHNIS 151 [BAHK95] B
Seite 171 und 172: LITERATURVERZEICHNIS 153 [BRS99] R.
Seite 173 und 174: LITERATURVERZEICHNIS 155 [DH55] J.
Seite 175 und 176: LITERATURVERZEICHNIS 157 [GKG96] R.
Seite 177 und 178: LITERATURVERZEICHNIS 159 [HOB + 04]
Seite 179 und 180: LITERATURVERZEICHNIS 161 [KL94a] L.
Seite 181 und 182: LITERATURVERZEICHNIS 163 [MCB00] E.
Seite 183 und 184:
LITERATURVERZEICHNIS 165 [PRG + 03]
Seite 185 und 186:
LITERATURVERZEICHNIS 167 [SD98] L.
Seite 187 und 188:
LITERATURVERZEICHNIS 169 [Tsa87] R.
Seite 189 und 190:
LITERATURVERZEICHNIS 171 [YYW03] Ca
Seite 191 und 192:
Anhang A Symbolverzeichnis Allgemei
Seite 193 und 194:
Symbol Bedeutung Ij Interner Zustan
Seite 195 und 196:
Anhang B Mobiler Service Roboter TA
Seite 197 und 198:
B.3 Kalibrierung der Roboterkameras
Seite 199 und 200:
Anhang C Theoretische Grundlagen C.
Seite 201 und 202:
C.1 Theoretische Grundlagen der Man
Seite 203 und 204:
Seite 205 und 206:
Seite 207 und 208:
Seite 209 und 210:
Seite 211 und 212:
Seite 213 und 214:
Seite 215 und 216:
C.2 Epipolare Geometrie 197 und αl
Seite 217 und 218:
C.3 Radial Basis Function Netze 199
Seite 219 und 220:
C.3 Radial Basis Function Netze 201
Seite 221 und 222:
C.4 Fuzzy Logik 203 gemessene Einga
Seite 223 und 224:
C.5 Neurofuzzy 205 Maximum einer Zu
Seite 225 und 226:
C.6 Temporal Differencing Verfahren
Seite 227 und 228:
C.7 Bayesian Belief Networks 209 Di
Seite 229 und 230:
C.7 Bayesian Belief Networks 211 Im
Seite 231 und 232:
Anhang D Implementierungsdaten der
Seite 233 und 234:
D.2 Steuerungskomponente der Hinder
Seite 235 und 236:
Seite 237 und 238:
Seite 239 und 240:
Seite 241 und 242:
Anhang E FSAs und BBNs der vermitte
Seite 243 und 244:
E.2 Realisierte Bayesian Belief Net
Seite 245 und 246:
Seite 247 und 248:
Seite 249 und 250:
Anhang F Deliberative Ebene F.1 S-G
Seite 251 und 252:
F.1 S-GOLOG Programm für das Tests
Seite 253:
F.2 Weltdatenbank für das Testszen
Alle anzeigen

Thesis - RWTH Aachen University

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?