Thesis - RWTH Aachen University

Weitere Magazine

Empfehlungen

Info

90 4.2 Hindernisvermeidung PSfrag replacements Bildebene (u ,v ) H i H i Bildhaupt− punkt (u ,v ) 0 0 z Abbildung 4.15: Berechnung des Winkels ϑ des Ausweichvektors mit der x-Achse der Kamera bzw. der u-Achse des Bildes. Pfadgenerierung Die Steuerungskomponente berechnet einen Ausweichvektor pro Hindernis. Der resultierende Bewegungsvektor des Verhaltens wird anschließend durch lineare Kombination der einzelnen Ausweichvektoren bestimmt (Abbildung 4.16). Dabei erhalten die Ausweichvektoren anhand des Abstandes des zugehörigen Hindernisses zur Kamera eine entsprechende Gewichtung. Seien n Hindernisse vorhanden und sei K �ρi der Ausweichvektor für das i-te Hindernis, di der Abstand der Kamera vom i-ten Hindernis und dmin der kleinste dieser Abstände. Dann lässt sich der Bewegungsvektor der Hindernisvermeidung des Greifers K �ρHG wie folgt berechnen: K �ρHG = n� i=1 v, y ϑ dmin di i K �ρi u, x ρ iuv (4.22) Orientierung und Betrag des Vektors stellen dabei die von der Hindernisvermeidung vorgeschlagene Richtung und Geschwindigkeit der nächsten Bewegung des Greifers dar. Da der Bewegungsvektor relativ zur Kamera definiert ist, muss er in das Koordinatensystem der Manipulator-Basis transformieren werden. Sei MB �ρHGkart die Darstellung des Vektors in kartesischen Koordinaten im System der Kamera, dann ist: MB �ρHGkart = MB G T G KT K �ρHGkart (4.23) wobei MB G T aus der Kinematik des Roboterarmes und G KT aus der Kamerakalibrierung bekannt sind. Anschließend wird der Ausweichvektor mit einem geradlinigen Pfad dargestellt. Die Länge des Pfades ist proportional zum Betrag des Vektors, während die Orientierung des Pfades mit der Richtung des Vektors übereinstimmt. Erlernen der Hindernisvermeidung des Greifers Um die Parameter des verwendeten Neurofuzzy-Systems zu ermitteln, die ein robustes Ausweichen der Hindernisse ermöglichen, wurde die Steuerungskomponente in der virtuellen Umgebung mit dem
4.2 Hindernisvermeidung 91 H 1 ρ ρ 2 T Abbildung 4.16: Fusion der Ausweichvektoren bei der Hindernisvermeidung des Greifers. stochastischen Teach-In in 45 unterschiedlichen Lernszenarien trainiert. In jedem Lernszenario muss sich der Greifer von einer zufällig generierten Startposition kollisionsfrei nach vorne bewegen. Dabei soll eine Ausgangssituation mit einem Hindernis 19 bewältigt werden. Nach jeder Bewegung des Manipulators berechnet ein Bewerter aus den aktuellen Aufnahmen der Greiferkamera und der bekannten Position des Greifers zum Hindernis eine Bewertung der Konstellation. Anhand der vergebenen Bewertung wird dann die Steuerungskomponente angepasst. Unterschreitet der minimale Abstand des Objektes von der Kamera einen gesetzten Schwellenwert, wird dies als Kollision interpretiert und der Schritt wird abgebrochen. Das Szenario wird so oft wiederholt, bis der Manipulator am Hindernis kollisionsfrei vorbeikommt. Der Bewerter implementiert die Belohnungsfunktion des Reinforcement Learning (Abbildung 4.17). Er ist hier mit einem Fuzzy System implementiert, das Bewertungen des aktuellen Umgebungszustands in Bezug auf eine Kollisionsgefahr erstellt, und wird nach der Trainingsphase vom System abgekoppelt. Als Eingabe erhält er den minimalen Abstand dHKmin des Hindernisses von der Kamera und den minimalen Abstand des Hindernisses dHSAmin von der Kamerasichtachse (Abbildung 4.18). Jedem Eingang des Bewerters wird eine linguistische Variable mit drei Termen zugeordnet. Die Zugehörigkeitsfunktionen sowie die Regelbasis des Bewerters wurden nicht trainiert, sondern sind vorgegeben; sie sind in Anhang D dargestellt. Die Regelbasis ist auf Basis zweier empirischer Aussagen erstellt worden. Einerseits erhöht eine Annäherung des Greifers an das Hindernis die Kollisionsgefahr; in diesem Fall sollte das Verhalten eine negative Bewertung erhalten. Andererseits gibt es mehr Raum für eine Vorwärtsbewegung, je größer der Abstand des Hindernisses von der Sichtachse wird; deshalb sollte für solche Konstellationen eine positive Bewertung erteilt werden. Somit bestraft der Bewerter Bewegungen, die dem Manipulator in Kollisionsgefahr mit dem Hindernis bringen, belohnt jedoch Bewegungen, die den Greifer möglichst schnell voran führen. Das eigentliche Training setzt den Q-learning Algorithmus [Wat89] ein, der von einem gegebenen Zustand Zi nach der Aktion �ρ sucht, die die akkumulierte zukünftige Belohnung und somit die Ak- 19 Die Dimensionen des Hindernisses variieren pro Lernszenario. T ρ HG ρ 1 H 2
Seite 1:
Bildgestütztes Teach-In eines mobi
Seite 4 und 5:
ii und der Koordinationsmechanismus
Seite 7 und 8:
Inhaltsverzeichnis Abbildungsverzei
Seite 9 und 10:
INHALTSVERZEICHNIS vii 5.3 Verhalte
Seite 11 und 12:
Abbildungsverzeichnis 1.1 Anwendung
Seite 13 und 14:
ABBILDUNGSVERZEICHNIS xi 4.10 Epipo
Seite 15 und 16:
ABBILDUNGSVERZEICHNIS xiii C.11 Rad
Seite 17 und 18:
Tabellenverzeichnis 2.1 Gemeinsamke
Seite 19 und 20:
Kapitel 1 Einleitung In der industr
Seite 21 und 22:
1.2 Mobile Manipulation mit Hindern
Seite 23 und 24:
1.2 Mobile Manipulation mit Hindern
Seite 25 und 26:
1.3 Gliederung der Arbeit 7 Grund d
Seite 27 und 28:
Kapitel 2 Einführung in die mobile
Seite 29 und 30:
2.1 Allgemeine Systemarchitekturen
Seite 31 und 32:
2.2 Reaktive Verhalten für Manipul
Seite 33 und 34:
Seite 35 und 36:
Seite 37 und 38:
Seite 39 und 40:
Seite 41 und 42:
Seite 43 und 44:
Seite 45 und 46:
Seite 47 und 48:
2.3 Verfahren zur Koordination reak
Seite 49 und 50:
Seite 51 und 52:
Seite 53 und 54:
2.4 Planung 35 die Welt, die aus ei
Seite 55 und 56:
2.4 Planung 37 liche Zustand nicht
Seite 57 und 58: 2.4 Planung 39 eine Suche im Graphe
Seite 59 und 60: 2.5 Virtuelle Realität und Robotik
Seite 61 und 62: 2.6 Spezielle Systemarchitekturen f
Seite 63 und 64: 2.6 Spezielle Systemarchitekturen f
Seite 65 und 66: 2.7 Ein Konzept zur mobilen Manipul
Seite 67 und 68: 2.8 Abgrenzung von anderen Arbeiten
Seite 69 und 70: Kapitel 3 Eine virtuelle Umgebung z
Seite 71 und 72: 3.2 Abgleich der Daten virtueller u
Seite 81 und 82: 3.3 Teach-In in virtuellen Umgebung
Seite 91 und 92: Kapitel 4 Bildgestützte reaktive V
Seite 93 und 94: 4.1 Bildgestützte Zielführung 75
Seite 101 und 102: 4.2 Hindernisvermeidung 83 Steuerun
Seite 103 und 104: 4.2 Hindernisvermeidung 85 PSfrag r
Seite 105 und 106: 4.2 Hindernisvermeidung 87 Stochast
Seite 107: 4.2 Hindernisvermeidung 89 Fünfte
Seite 111 und 112: 4.2 Hindernisvermeidung 93 Ist der
Seite 113 und 114: 4.2 Hindernisvermeidung 95 Aus der
Seite 115 und 116: 4.2 Hindernisvermeidung 97 Nach der
Seite 117 und 118: 4.3 Pfadplanung im lokalen Manipula
Seite 123 und 124: Kapitel 5 Verhaltensauswahl und Ver
Seite 125 und 126: 5.2 Verhaltensauswahl 107 Rückmeld
Seite 127 und 128: 5.2 Verhaltensauswahl 109 5.2.2 Abl
Seite 129 und 130: 5.3 Verhaltenskoordination 111 Verh
Seite 131 und 132: 5.3 Verhaltenskoordination 113 Nach
Seite 133 und 134: 5.3 Verhaltenskoordination 115 5.3.
Seite 135 und 136: PSfrag replacements 5.3 Verhaltensk
Seite 137 und 138: 5.4 Erlernen der Verhaltenskoordina
Seite 139 und 140: 5.5 Resultate des Trainings 121 Nac
Seite 141 und 142: 5.6 Ergebnisse der Verhaltenskoordi
Seite 143 und 144: 5.7 Bewertung und Einordnung des im
Seite 145 und 146: 5.7 Bewertung und Einordnung des im
Seite 147 und 148: Kapitel 6 Aufgabenplanung Die vermi
Seite 149 und 150: 6.2 High-Level Planer 131 einen Pla
Seite 151 und 152: 6.4 Weltdatenbank 133 der Erfolgsme
Seite 153 und 154: 6.5 Geometrische Planung 135 Root =
Seite 155 und 156: 6.5 Geometrische Planung 137 (a) (b
Seite 157 und 158: 6.6 ComControl 139 ja nein nein nei
Seite 159 und 160:
6.7 Ausführung des Testszenarios 1
Seite 161 und 162:
6.7 Ausführung des Testszenarios 1
Seite 163 und 164:
Kapitel 7 Zusammenfassung und Ausbl
Seite 165 und 166:
schiedliche Greifstrategien für un
Seite 167 und 168:
Literaturverzeichnis [ABD + 98a] N.
Seite 169 und 170:
LITERATURVERZEICHNIS 151 [BAHK95] B
Seite 171 und 172:
LITERATURVERZEICHNIS 153 [BRS99] R.
Seite 173 und 174:
LITERATURVERZEICHNIS 155 [DH55] J.
Seite 175 und 176:
LITERATURVERZEICHNIS 157 [GKG96] R.
Seite 177 und 178:
LITERATURVERZEICHNIS 159 [HOB + 04]
Seite 179 und 180:
LITERATURVERZEICHNIS 161 [KL94a] L.
Seite 181 und 182:
LITERATURVERZEICHNIS 163 [MCB00] E.
Seite 183 und 184:
LITERATURVERZEICHNIS 165 [PRG + 03]
Seite 185 und 186:
LITERATURVERZEICHNIS 167 [SD98] L.
Seite 187 und 188:
LITERATURVERZEICHNIS 169 [Tsa87] R.
Seite 189 und 190:
LITERATURVERZEICHNIS 171 [YYW03] Ca
Seite 191 und 192:
Anhang A Symbolverzeichnis Allgemei
Seite 193 und 194:
Symbol Bedeutung Ij Interner Zustan
Seite 195 und 196:
Anhang B Mobiler Service Roboter TA
Seite 197 und 198:
B.3 Kalibrierung der Roboterkameras
Seite 199 und 200:
Anhang C Theoretische Grundlagen C.
Seite 201 und 202:
C.1 Theoretische Grundlagen der Man
Seite 203 und 204:
Seite 205 und 206:
Seite 207 und 208:
Seite 209 und 210:
Seite 211 und 212:
Seite 213 und 214:
Seite 215 und 216:
C.2 Epipolare Geometrie 197 und αl
Seite 217 und 218:
C.3 Radial Basis Function Netze 199
Seite 219 und 220:
C.3 Radial Basis Function Netze 201
Seite 221 und 222:
C.4 Fuzzy Logik 203 gemessene Einga
Seite 223 und 224:
C.5 Neurofuzzy 205 Maximum einer Zu
Seite 225 und 226:
C.6 Temporal Differencing Verfahren
Seite 227 und 228:
C.7 Bayesian Belief Networks 209 Di
Seite 229 und 230:
C.7 Bayesian Belief Networks 211 Im
Seite 231 und 232:
Anhang D Implementierungsdaten der
Seite 233 und 234:
D.2 Steuerungskomponente der Hinder
Seite 235 und 236:
Seite 237 und 238:
Seite 239 und 240:
Seite 241 und 242:
Anhang E FSAs und BBNs der vermitte
Seite 243 und 244:
E.2 Realisierte Bayesian Belief Net
Seite 245 und 246:
Seite 247 und 248:
Seite 249 und 250:
Anhang F Deliberative Ebene F.1 S-G
Seite 251 und 252:
F.1 S-GOLOG Programm für das Tests
Seite 253:
F.2 Weltdatenbank für das Testszen
Alle anzeigen

Thesis - RWTH Aachen University

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?