Thesis - RWTH Aachen University
Thesis - RWTH Aachen University
Thesis - RWTH Aachen University
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
70 3.3 Teach-In in virtuellen Umgebungen<br />
W<br />
O T und W P T sind aus der virtuellen Umgebung bekannt, P MBT und G KT sind abhängig von der Platt-<br />
form - Manipulator Konfiguration und müssen aus der Geometrie des Roboters bzw. aus der Kamerakalibrierung<br />
ermittelt werden. MB<br />
G T kann aus der Kinematik des Roboterarmes berechnet werden<br />
(Anhang C.1).<br />
Um den Greifer und dadurch auch die Kamera zum Objekt auszurichten, werden die yaw- und pitch-<br />
Winkel des Greifers angesteuert; der roll-Winkel wird von der Ausrichtung an der Zielposition definiert<br />
und auf konstantem Wert gehalten 14 :<br />
pitch = atan2(t14, t34)<br />
yaw = −atan2(t24 cos(pitch), t34)<br />
(3.25)<br />
Dabei sind ti4, i = 1, 2, 3, die Elemente der vierten Spalte der K O T Matrix und repräsentieren die<br />
Position des Objektes im Koordinatensystem der Kamera.<br />
Um die Trainingsdaten zu sammeln, werden die generierten Pfade durchlaufen und die Aufnahmen<br />
der virtuellen Kameras mit den entsprechenden Positionsdaten des Manipulators gespeichert. Pfade,<br />
die durch die Auflageflächen in der virtuellen Umgebung laufen bzw. Kollisionen des Roboterarms<br />
verursachen, können über Kollisionsmeldungen der Simulationsumgebung erkannt und vom weiteren<br />
Training ausgeschlossen werden.<br />
Sei � P ein 6×1 Vektor, der die erwünschte Position und Orientierung des Greifers auf dem Pfad relativ<br />
zum Objekt repräsentiert. Um einen generierten Pfad Pj, j = 1, .., n, mit n die Anzahl der generierten<br />
Pfade, zu speichern, wird die Position und Orientierung des Greifers � Pji auf dem Pfad in regulären<br />
Abständen in einer Liste gespeichert. � Pji sind auch als Stützstellen des Pfades bekannt. Dadurch kann<br />
ein Pfad als eine Reihenfolge von Stützstellen dargestellt werden:<br />
Pj = { � Pj1, .., � Pji, .., � Pjm} (3.26)<br />
mit m die Anzahl der Stützstellen. Falls auf alle Pfade äquidistante Intervalle verwendet werden,<br />
dann verfügen die Pfade Pj über dieselbe Anzahl von Stützstellen und dadurch dieselbe Länge. Alle<br />
Pfadlisten werden abgespeichert und ihr Index j wird benutzt, um sie zu referenzieren.<br />
3.3.4 Stochastisches Teach-In<br />
Beim algorithmischen Teach-In ist die gewünschte Bewegung des Manipulators bekannt. Es gibt jedoch<br />
Fälle, wo die gewünschte Aktion des Manipulators nicht a priori bekannt oder nur schwer zu<br />
definieren ist. Dies ist beispielsweise der Fall bei der Verhaltenskoordination. Hier ist die Anwendbarkeit<br />
der Verhalten in einer Situation nicht genau bestimmbar, man kann jedoch eine qualitative Bewertung<br />
der Verhaltensanwendung anhand der sich ergebenden Situation machen 15 . Ähnlich ist auch<br />
bei der Hindernisvermeidung die optimale Bewegung des Manipulators in einer gegebenen Situation<br />
nicht genau bekannt. Nach Matarić [Mat94] ist für solche Fälle das Lernen mit Bewerter geeignet.<br />
Das stochastische Teach-In ist ein Verfahren zur Generierung und Akquisition der Trainingsdaten,<br />
um das Lernen mit Bewerter in einer virtuellen Umgebung zu unterstützen. Es generiert mit einem<br />
14 atan2(x, y) entspricht der tan −1 ( x<br />
y ) Funktion, berücksichtigt jedoch die Vorzeichen von x, y, um den Winkel im<br />
Bereich (−180, 180] zu berechnen.<br />
15 Diese Bewertungen können beispielsweise folgende Form haben: “In der gegebenen Situation sollte dieses Verhalten<br />
eine hohe Anwendbarkeit haben, das andere jedoch nicht”.