Thesis - RWTH Aachen University
Thesis - RWTH Aachen University
Thesis - RWTH Aachen University
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
114 5.3 Verhaltenskoordination<br />
• Die Abhängigkeit führt von den Verhaltensknoten zu den Merkmalsknoten. Hierbei wird davon<br />
ausgegangen, dass eine Anwendbarkeit des Verhaltens vorliegt und aus dieser Aktivierung eine<br />
bestimmte Merkmalskombination folgt. Da die Werte der Merkmalsknoten vorliegen, kann<br />
man über die so genannte diagnostische Inferenz auf die Anwendbarkeit des Verhaltensknotens<br />
schließen [Cha91].<br />
Beide Darstellungen sind, was die Inferenz betrifft, ineinander überführbar. Aus mehreren Gründen<br />
wurde hier die zweite Möglichkeit realisiert:<br />
• Die nötigen cpts sind für die in dieser Arbeit implementierten BBNs im Fall der diagnostischen<br />
Inferenz wesentlich kleiner. Bei beispielsweise vier Merkmalen mit jeweils vier Zuständen und<br />
eine Anwendbarkeit mit zehn Zuständen ergibt sich bei der ersten Art eine cpt mit 4 4 ·10 = 2560<br />
Einträgen für den Verhaltensknoten und vier cpts mit vier Einträgen für die Merkmalsknoten.<br />
Bei der zweiten Art werden für den Verhaltensknoten zehn und für die vier Merkmalsknote<br />
jeweils 4 · 10 = 40 Einträge benötigt.<br />
• Aufgrund der kleineren cpts kann das Training des BBNs effizienter und mit einer schnelleren<br />
Konvergenz erfolgen.<br />
• Das später vorgestellte, für beide Varianten durchgeführte Training zeigt einen geringeren Fehler<br />
bei Abhängigkeiten, die von den Verhaltensknoten zu den Merkmalsknoten führen. Dies<br />
resultiert zu einer besseren Berechnung der Gewichtung eines Verhaltens.<br />
5.3.3 Bestimmung der Wertbereiche der Eingaben und Ausgaben der BBNs<br />
Da die verwendeten Inferenz- und Lernalgorithmen nur für Netze mit rein diskreten Knoten einsetzbar<br />
sind, müssen die kontinuierlichen Einträge des Merkmalsvektors �s ′ i, der als Eingabe für das BBN<br />
vom i-ten Verhalten dient, mit Hilfe von Schwellwerten kj in diskrete Intervalle eingeteilt werden.<br />
Alle Werte innerhalb eines solchen Intervalls (kj, kj+1) werden als gleichwertig angesehen, da sie<br />
dem gleichen diskreten Zustand Zj entsprechen. Um auch mit diskreten Merkmalswerten eine ausreichende<br />
Genauigkeit zu erzielen,wird die Anzahl der Intervalle hoch gewählt. Außerdem werden nicht<br />
äquidistante Abstände, also kj − kj−1 �= kj+1 − kj, verwendet, so dass in kritischen Bereichen die<br />
Auflösung höher ist.<br />
Neben den Eingabenknoten besitzt auch der die jeweilige Anwendbarkeit des Verhaltens repräsentierende<br />
Knoten einen kontinuierlichen Wertebereich. Dieser Bereich wird in zehn diskrete Intervalle<br />
bzw. Zustände der Länge 0.1 von 0 bis 1 unterteilt. Nach der Inferenz ergeben sich zu 1<br />
summierende Wahrscheinlichkeitsangaben für alle Zustände des Verhaltensknotens. Die Gewichtung<br />
des i-ten Verhaltens errechnet sich dann aus der mit der entsprechenden Wahrscheinlichkeitsangabe<br />
gewichteten Summe der Zustandsmittelwerte. Diese Vorgehensweise entspricht der Maximum-<br />
Defuzzifizierungsmethode bei der Fuzzy Logik:<br />
gi = p(βi(�si)|�s ′ i) =<br />
10�<br />
j=1<br />
p(Z = Zj) kj + kj+1<br />
2<br />
Experimente haben gezeigt, dass dies zu einer ausreichenden Genauigkeit in der Berechnung der<br />
Anwendbarkeit des Verhaltens führt [Sch02].<br />
(5.3)