31.10.2013 Aufrufe

Können Lernalgorithmen interagieren wie im Gehirn? - Intelligent ...

Können Lernalgorithmen interagieren wie im Gehirn? - Intelligent ...

Können Lernalgorithmen interagieren wie im Gehirn? - Intelligent ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

4 Exper<strong>im</strong>entelles Setup<br />

Nachdem nun das Problemszenario in Abschnitt 1.2 beschrieben wurde und in Kapitel 3 alle verwendeten Algorithmen<br />

samt ihrer zu Grunde liegenden Ideen erläutert wurden, beschäftigt sich dieser Abschnitt mit den möglichen Kombinationen<br />

dieser Algorithmen, welche <strong>im</strong> weiteren Rahmen des Exper<strong>im</strong>ents verwendet werden.<br />

Hierbei wurde das Problemszenario in 4 allgemeine Arten von Labyrinthe eingegliedert:<br />

1. klassische Labyrinthe. Diese Labyrinthe weisen eine Vielzahl an Sackgassen auf und sind von ihrer Art der Gänge<br />

sehr eng (1 Zustand weit). Hierbei gibt es oftmals nur einen korrekten Weg zum Ziel.<br />

2. offene Labyrinthe. Diese Art der Labyrinthe dient der Betrachtung des worst-case-Szenarios, da sich kaum Opt<strong>im</strong>ierungsmöglichkeiten<br />

anbieten. In ihnen gibt es nur eine niedrige Anzahl an Mauern und der Weg von Start nach<br />

Ziel ist relativ frei wählbar.<br />

3. freie Labyrinthe. Labyrinthe welche in diese Klasse fallen haben einen breiteren Gang und stellen somit ein Problem<br />

bei der trivialen Auffindung von Sackgassen dar. Außerdem gibt es mehrere Wege zum Ziel.<br />

4. knifflige Labyrinthe. Diese Labyrinthe stellen eine Vereinigung der drei obigen Labyrinth-Arten dar. In ihnen gibt es<br />

mehrere Wege zum Ziel welche nahezu gleich in ihrer Länge sind und außerdem breitere Gänge aufweisen. Auch<br />

können freie Areale <strong>im</strong> Labyrinth enthalten sein.<br />

Anhand dieser vier Arten von Labyrinthen sollten die meisten herkömmlichen Labyrinthe abgedeckt und verschiedene<br />

Hürden vorhanden sein, sodass sich die erzielten Resultate der verschiedenen Kombinationen der <strong>Lernalgorithmen</strong><br />

entsprechend verändern sollte. Den Ausgangspunkt eines jeden Exper<strong>im</strong>ents bildet das Reinforcement Learning (ohne<br />

Erweiterungen) und wird mit den jeweils beschriebenen Verfahren Schrittweite erweitert. Hierbei wurden auf allen Labyrinthen,<br />

mit der jeweils zu untersuchenden Kombination von Lernverfahren, 32 Durchläufe mit je 1.000, oder <strong>im</strong> Falle des<br />

freien 4.000 und des kniffligen Labyrinths 10.000, Episoden ausgeführt und anschließend der Durchschnitt dieser Daten<br />

berechnet. Die verwendeten Parameter in allen Berechnungen waren: α = 0.1, γ = 0.98 so<strong>wie</strong> ε = 0.1. Die Parameter<br />

des vorgestellten Verfahrens Verkapseln erlernten Wissens werden an der nötigen Stelle beschrieben und unterscheiden<br />

sich in den verwendeten Labyrinthen.<br />

Folgende Abbildung liefert zu jeder Art ein Labyrinth dieser Klasse und zeigt zeitgleich die für die kommenden<br />

Untersuchungen verwendeten Labyrinthe. Diese Labyrinthe werden in den kommenden Abschnitten anhand ihrer Arten<br />

benannt, sodass wenn vom klassischen Labyrinth die Rede ist, das Labyrinth links in Abbildung 5.1 gemeint ist, be<strong>im</strong><br />

kniffligen Labyrinth hingegen vom rechten Labyrinth die Rede ist.<br />

Abbildung 4.1: Veranschaulichung der einzelnen Labyrinth-Arten der Reihe nach von links nach rechts.<br />

36

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!