Thesis - RWTH Aachen University
Thesis - RWTH Aachen University
Thesis - RWTH Aachen University
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
5.3 Verhaltenskoordination 111<br />
Verhalten in Abhängigkeit des aktuellen Sensorkontexts zu errechnen oder ihre Struktur durch Lernalgorithmen<br />
an eine gestellte Aufgabe anzupassen. Im Gegensatz dazu bieten BBNs, die im nächsten<br />
Abschnitt beschrieben werden, die Möglichkeit, mit Hilfe von aktuellen Sensorwerten die Anwendbarkeit<br />
eines Verhaltens zu bewerten und durch Training zu erlernen.<br />
5.3 Verhaltenskoordination<br />
Nach Auswahl und Aktivierung der Verhalten sind deren Ausgaben nach dem Command Fusion-<br />
Prinzip zu koordinieren. Hierzu ist die Berechnung der Gewichtungsmatrix G (Gleichung 2.16) notwendig.<br />
G beschreibt, mit welchem Anteil eine Fertigkeit an der Bewegung des Roboters beteiligt<br />
ist. Dies entspricht der Bestimmung der so genannten Anwendbarkeit der Verhalten in einer Situation.<br />
Zu ihrer Berechnung werden in dieser Arbeit Bayesian Belief Networks (BBN) eingesetzt [Cha91].<br />
BBNs sind zur Realisierung des Koordinationsmechanismus ausgewählt worden, da sie leicht um<br />
neue Knoten ergänzt werden können. Wird der Merkmalsvektor um ein zusätzliches Element, eine<br />
zusätzliche Beobachtung oder sogar einen neuen Sensor erweitert, kann einem bestehenden BBN ein<br />
entsprechender Knoten hinzugefügt werden. Die bisherige Struktur bleibt dabei unverändert bestehen.<br />
Desweiteren existieren für BBNs lernfähige Algorithmen. Sie erlauben es, die Anwendbarkeit eines<br />
Verhaltens in einer bestimmten Situation durch Erfahrung zu erlernen und nicht manuell zu bestimmen.<br />
möglich, insbesondere wenn mehrere erlernte Roboterfertigkeiten koordiniert werden müssen.<br />
BBNs erlauben unterschiedlich zu anderen Verfahren die robuste Ermittlung von Entscheidungen,<br />
auch wenn nicht alle Elemente des Merkmalsvektors vorhanden sind. In einem solchen Fall kann der<br />
Wert des betroffenen Knotens nicht angegeben werden. Dafür kommt an dessen Stelle im BBN bei<br />
der Inferenz eine a priori Wahrscheinlichkeit zum Einsatz.<br />
In den nächsten Abschnitten wird zuerst kurz auf die theoretischen Grundlagen von BBNs und auf die<br />
Besonderheiten bei ihrem Entwurf für die Verhaltenskoordinierung eingegangen. Als Beispiel wird<br />
das BBN der Kollisionsvermeidung des Greifers vorgestellt und erläutert 5 . Anschließend wird der<br />
eigentliche Ablauf der Verhaltenskoordination präsentiert.<br />
5.3.1 Bayesian Belief Networks<br />
Ein Bayesian Belief Network (BBN) ist ein gerichteter azyklischer Graph (Directed Acyclic Graph -<br />
DAG), der die Verbundwahrscheinlichkeit eines Ereignisses, das von mehreren Zufallsvariablen abhängt,<br />
effizient repräsentiert [Cha91]. Bestandteile eines BBN sind Knoten, die Zufallsvariablen darstellen,<br />
und gerichtete Kanten, die Abhängigkeiten zwischen den Knoten modellieren. Die Zufallsvariablen<br />
können sowohl unendlich viele Werte mit einer kontinuierlichen Wahrscheinlichkeitsverteilung<br />
oder eine endliche Anzahl von Zuständen mit einer diskreten Wahrscheinlichkeitsverteilung<br />
annehmen. Häufig wird auch der Sonderfall eines boolschen Knotens mit zwei diskreten Zuständen<br />
verwendet.<br />
Eine Zufallsvariable hängt von den Zuständen ihrer Vorgängerknoten im Graphen ab. Besitzt sie keinen<br />
Vorgänger, ist sie stochastisch unabhängig. Die zugehörige bedingte Wahrscheinlichkeitsverteilung<br />
wird im kontinuierlichen Fall als Funktion und im diskreten in der so genannten Conditional<br />
Probability Table (cpt) angegeben. Diese enthält für jede mögliche Kombination der Zustände der<br />
5 Die BBNs der restlichen Verhalten werden in Anhang E präsentiert.