Können Lernalgorithmen interagieren wie im Gehirn? - Intelligent ...
Können Lernalgorithmen interagieren wie im Gehirn? - Intelligent ...
Können Lernalgorithmen interagieren wie im Gehirn? - Intelligent ...
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
4 Exper<strong>im</strong>entelles Setup<br />
Nachdem nun das Problemszenario in Abschnitt 1.2 beschrieben wurde und in Kapitel 3 alle verwendeten Algorithmen<br />
samt ihrer zu Grunde liegenden Ideen erläutert wurden, beschäftigt sich dieser Abschnitt mit den möglichen Kombinationen<br />
dieser Algorithmen, welche <strong>im</strong> weiteren Rahmen des Exper<strong>im</strong>ents verwendet werden.<br />
Hierbei wurde das Problemszenario in 4 allgemeine Arten von Labyrinthe eingegliedert:<br />
1. klassische Labyrinthe. Diese Labyrinthe weisen eine Vielzahl an Sackgassen auf und sind von ihrer Art der Gänge<br />
sehr eng (1 Zustand weit). Hierbei gibt es oftmals nur einen korrekten Weg zum Ziel.<br />
2. offene Labyrinthe. Diese Art der Labyrinthe dient der Betrachtung des worst-case-Szenarios, da sich kaum Opt<strong>im</strong>ierungsmöglichkeiten<br />
anbieten. In ihnen gibt es nur eine niedrige Anzahl an Mauern und der Weg von Start nach<br />
Ziel ist relativ frei wählbar.<br />
3. freie Labyrinthe. Labyrinthe welche in diese Klasse fallen haben einen breiteren Gang und stellen somit ein Problem<br />
bei der trivialen Auffindung von Sackgassen dar. Außerdem gibt es mehrere Wege zum Ziel.<br />
4. knifflige Labyrinthe. Diese Labyrinthe stellen eine Vereinigung der drei obigen Labyrinth-Arten dar. In ihnen gibt es<br />
mehrere Wege zum Ziel welche nahezu gleich in ihrer Länge sind und außerdem breitere Gänge aufweisen. Auch<br />
können freie Areale <strong>im</strong> Labyrinth enthalten sein.<br />
Anhand dieser vier Arten von Labyrinthen sollten die meisten herkömmlichen Labyrinthe abgedeckt und verschiedene<br />
Hürden vorhanden sein, sodass sich die erzielten Resultate der verschiedenen Kombinationen der <strong>Lernalgorithmen</strong><br />
entsprechend verändern sollte. Den Ausgangspunkt eines jeden Exper<strong>im</strong>ents bildet das Reinforcement Learning (ohne<br />
Erweiterungen) und wird mit den jeweils beschriebenen Verfahren Schrittweite erweitert. Hierbei wurden auf allen Labyrinthen,<br />
mit der jeweils zu untersuchenden Kombination von Lernverfahren, 32 Durchläufe mit je 1.000, oder <strong>im</strong> Falle des<br />
freien 4.000 und des kniffligen Labyrinths 10.000, Episoden ausgeführt und anschließend der Durchschnitt dieser Daten<br />
berechnet. Die verwendeten Parameter in allen Berechnungen waren: α = 0.1, γ = 0.98 so<strong>wie</strong> ε = 0.1. Die Parameter<br />
des vorgestellten Verfahrens Verkapseln erlernten Wissens werden an der nötigen Stelle beschrieben und unterscheiden<br />
sich in den verwendeten Labyrinthen.<br />
Folgende Abbildung liefert zu jeder Art ein Labyrinth dieser Klasse und zeigt zeitgleich die für die kommenden<br />
Untersuchungen verwendeten Labyrinthe. Diese Labyrinthe werden in den kommenden Abschnitten anhand ihrer Arten<br />
benannt, sodass wenn vom klassischen Labyrinth die Rede ist, das Labyrinth links in Abbildung 5.1 gemeint ist, be<strong>im</strong><br />
kniffligen Labyrinth hingegen vom rechten Labyrinth die Rede ist.<br />
Abbildung 4.1: Veranschaulichung der einzelnen Labyrinth-Arten der Reihe nach von links nach rechts.<br />
36