09.02.2013 Aufrufe

Thesis - RWTH Aachen University

Thesis - RWTH Aachen University

Thesis - RWTH Aachen University

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

114 5.3 Verhaltenskoordination<br />

• Die Abhängigkeit führt von den Verhaltensknoten zu den Merkmalsknoten. Hierbei wird davon<br />

ausgegangen, dass eine Anwendbarkeit des Verhaltens vorliegt und aus dieser Aktivierung eine<br />

bestimmte Merkmalskombination folgt. Da die Werte der Merkmalsknoten vorliegen, kann<br />

man über die so genannte diagnostische Inferenz auf die Anwendbarkeit des Verhaltensknotens<br />

schließen [Cha91].<br />

Beide Darstellungen sind, was die Inferenz betrifft, ineinander überführbar. Aus mehreren Gründen<br />

wurde hier die zweite Möglichkeit realisiert:<br />

• Die nötigen cpts sind für die in dieser Arbeit implementierten BBNs im Fall der diagnostischen<br />

Inferenz wesentlich kleiner. Bei beispielsweise vier Merkmalen mit jeweils vier Zuständen und<br />

eine Anwendbarkeit mit zehn Zuständen ergibt sich bei der ersten Art eine cpt mit 4 4 ·10 = 2560<br />

Einträgen für den Verhaltensknoten und vier cpts mit vier Einträgen für die Merkmalsknoten.<br />

Bei der zweiten Art werden für den Verhaltensknoten zehn und für die vier Merkmalsknote<br />

jeweils 4 · 10 = 40 Einträge benötigt.<br />

• Aufgrund der kleineren cpts kann das Training des BBNs effizienter und mit einer schnelleren<br />

Konvergenz erfolgen.<br />

• Das später vorgestellte, für beide Varianten durchgeführte Training zeigt einen geringeren Fehler<br />

bei Abhängigkeiten, die von den Verhaltensknoten zu den Merkmalsknoten führen. Dies<br />

resultiert zu einer besseren Berechnung der Gewichtung eines Verhaltens.<br />

5.3.3 Bestimmung der Wertbereiche der Eingaben und Ausgaben der BBNs<br />

Da die verwendeten Inferenz- und Lernalgorithmen nur für Netze mit rein diskreten Knoten einsetzbar<br />

sind, müssen die kontinuierlichen Einträge des Merkmalsvektors �s ′ i, der als Eingabe für das BBN<br />

vom i-ten Verhalten dient, mit Hilfe von Schwellwerten kj in diskrete Intervalle eingeteilt werden.<br />

Alle Werte innerhalb eines solchen Intervalls (kj, kj+1) werden als gleichwertig angesehen, da sie<br />

dem gleichen diskreten Zustand Zj entsprechen. Um auch mit diskreten Merkmalswerten eine ausreichende<br />

Genauigkeit zu erzielen,wird die Anzahl der Intervalle hoch gewählt. Außerdem werden nicht<br />

äquidistante Abstände, also kj − kj−1 �= kj+1 − kj, verwendet, so dass in kritischen Bereichen die<br />

Auflösung höher ist.<br />

Neben den Eingabenknoten besitzt auch der die jeweilige Anwendbarkeit des Verhaltens repräsentierende<br />

Knoten einen kontinuierlichen Wertebereich. Dieser Bereich wird in zehn diskrete Intervalle<br />

bzw. Zustände der Länge 0.1 von 0 bis 1 unterteilt. Nach der Inferenz ergeben sich zu 1<br />

summierende Wahrscheinlichkeitsangaben für alle Zustände des Verhaltensknotens. Die Gewichtung<br />

des i-ten Verhaltens errechnet sich dann aus der mit der entsprechenden Wahrscheinlichkeitsangabe<br />

gewichteten Summe der Zustandsmittelwerte. Diese Vorgehensweise entspricht der Maximum-<br />

Defuzzifizierungsmethode bei der Fuzzy Logik:<br />

gi = p(βi(�si)|�s ′ i) =<br />

10�<br />

j=1<br />

p(Z = Zj) kj + kj+1<br />

2<br />

Experimente haben gezeigt, dass dies zu einer ausreichenden Genauigkeit in der Berechnung der<br />

Anwendbarkeit des Verhaltens führt [Sch02].<br />

(5.3)

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!