09.02.2013 Aufrufe

Thesis - RWTH Aachen University

Thesis - RWTH Aachen University

Thesis - RWTH Aachen University

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

70 3.3 Teach-In in virtuellen Umgebungen<br />

W<br />

O T und W P T sind aus der virtuellen Umgebung bekannt, P MBT und G KT sind abhängig von der Platt-<br />

form - Manipulator Konfiguration und müssen aus der Geometrie des Roboters bzw. aus der Kamerakalibrierung<br />

ermittelt werden. MB<br />

G T kann aus der Kinematik des Roboterarmes berechnet werden<br />

(Anhang C.1).<br />

Um den Greifer und dadurch auch die Kamera zum Objekt auszurichten, werden die yaw- und pitch-<br />

Winkel des Greifers angesteuert; der roll-Winkel wird von der Ausrichtung an der Zielposition definiert<br />

und auf konstantem Wert gehalten 14 :<br />

pitch = atan2(t14, t34)<br />

yaw = −atan2(t24 cos(pitch), t34)<br />

(3.25)<br />

Dabei sind ti4, i = 1, 2, 3, die Elemente der vierten Spalte der K O T Matrix und repräsentieren die<br />

Position des Objektes im Koordinatensystem der Kamera.<br />

Um die Trainingsdaten zu sammeln, werden die generierten Pfade durchlaufen und die Aufnahmen<br />

der virtuellen Kameras mit den entsprechenden Positionsdaten des Manipulators gespeichert. Pfade,<br />

die durch die Auflageflächen in der virtuellen Umgebung laufen bzw. Kollisionen des Roboterarms<br />

verursachen, können über Kollisionsmeldungen der Simulationsumgebung erkannt und vom weiteren<br />

Training ausgeschlossen werden.<br />

Sei � P ein 6×1 Vektor, der die erwünschte Position und Orientierung des Greifers auf dem Pfad relativ<br />

zum Objekt repräsentiert. Um einen generierten Pfad Pj, j = 1, .., n, mit n die Anzahl der generierten<br />

Pfade, zu speichern, wird die Position und Orientierung des Greifers � Pji auf dem Pfad in regulären<br />

Abständen in einer Liste gespeichert. � Pji sind auch als Stützstellen des Pfades bekannt. Dadurch kann<br />

ein Pfad als eine Reihenfolge von Stützstellen dargestellt werden:<br />

Pj = { � Pj1, .., � Pji, .., � Pjm} (3.26)<br />

mit m die Anzahl der Stützstellen. Falls auf alle Pfade äquidistante Intervalle verwendet werden,<br />

dann verfügen die Pfade Pj über dieselbe Anzahl von Stützstellen und dadurch dieselbe Länge. Alle<br />

Pfadlisten werden abgespeichert und ihr Index j wird benutzt, um sie zu referenzieren.<br />

3.3.4 Stochastisches Teach-In<br />

Beim algorithmischen Teach-In ist die gewünschte Bewegung des Manipulators bekannt. Es gibt jedoch<br />

Fälle, wo die gewünschte Aktion des Manipulators nicht a priori bekannt oder nur schwer zu<br />

definieren ist. Dies ist beispielsweise der Fall bei der Verhaltenskoordination. Hier ist die Anwendbarkeit<br />

der Verhalten in einer Situation nicht genau bestimmbar, man kann jedoch eine qualitative Bewertung<br />

der Verhaltensanwendung anhand der sich ergebenden Situation machen 15 . Ähnlich ist auch<br />

bei der Hindernisvermeidung die optimale Bewegung des Manipulators in einer gegebenen Situation<br />

nicht genau bekannt. Nach Matarić [Mat94] ist für solche Fälle das Lernen mit Bewerter geeignet.<br />

Das stochastische Teach-In ist ein Verfahren zur Generierung und Akquisition der Trainingsdaten,<br />

um das Lernen mit Bewerter in einer virtuellen Umgebung zu unterstützen. Es generiert mit einem<br />

14 atan2(x, y) entspricht der tan −1 ( x<br />

y ) Funktion, berücksichtigt jedoch die Vorzeichen von x, y, um den Winkel im<br />

Bereich (−180, 180] zu berechnen.<br />

15 Diese Bewertungen können beispielsweise folgende Form haben: “In der gegebenen Situation sollte dieses Verhalten<br />

eine hohe Anwendbarkeit haben, das andere jedoch nicht”.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!