Jahresbericht 2009 - Institute of Computer Science - Universität ...
Jahresbericht 2009 - Institute of Computer Science - Universität ...
Jahresbericht 2009 - Institute of Computer Science - Universität ...
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
72 Universität Osnabrück Institut für Informatik <strong>Jahresbericht</strong> <strong>2009</strong> Projekte<br />
Lernen in Multi-Agenten Systemen<br />
Leitung Pr<strong>of</strong>. Dr. Martin Riedmiller<br />
Mitarbeiter Dipl.-Inform. omas Gabel<br />
Laufzeit 1999 - 03/<strong>2009</strong><br />
Förderung Deutsche Forschungsgemeinschaft (DFG)<br />
Stichworte Reinforcement Lernen, Strategielernen, Multi-Agenten Systeme, Scheduling<br />
Die Entscheidungsfindung in verteilten Systemen<br />
erfordert die gezielte Zusammenarbeit individuell<br />
handelnder Agenten, um ein vorgegebenes gemeinsames<br />
Ziel zu erreichen. Hierzu dürfen sich die<br />
Handlungsstrategien der einzelnen Agenten nicht<br />
gegenseitig behindern - eine optimale Abstimmung<br />
der Agentenverhalten aufeinander ist unabdingbar.<br />
Das Forschungsgebiet des Reinforcement Lernens<br />
(optimierendes Lernen) hat sich zum Ziel gesetzt,<br />
allein aus dem Wissen über erfolgreiche oder fehlgeschlagene<br />
Trainingsversuche ein möglichst optimales<br />
Verhalten für einen handelnden Agenten zu erlernen.<br />
Ziel des Forschungsprojekts ist die Entwicklung<br />
und Untersuchung von autonomen Lernverfahren,<br />
die die Idee des Reinforcement Lernens auf Multi-<br />
Agenten-Systeme übertragen. So sollen kooperative<br />
Strategien allein auf Basis der Spezifikation des<br />
gewünschten Gesamtverhaltens des Systems erlernt<br />
werden. Das Vorhandensein mehrerer interagierender<br />
Agenten bedeutet hierbei eine besondere<br />
Herausforderung, denn nicht immer ist unmittelbar<br />
ersichtlich, welche Aktion welches Agenten wie stark<br />
für die Gesamtleistung verantwortlich ist.<br />
Neben dem Entwurf und der Analyse von Algorithmen<br />
zum Erlernen der verteilten Entscheidungsfindung<br />
umfassen die aktuell verfolgten Zielstellungen<br />
auch die Erhöhung der Robustheit der Lernverfahren<br />
gegenüber veränderten Rahmenbedingungen.<br />
Zu den aktuellen Forschungsschwerpunkten gehören<br />
dabei auch der gezielte Einsatz von Kommunikation,<br />
das Erlernen koordinierten Handelns sowie das<br />
direkte Erlernen von agentenspezifischen Handlungsstrategien.<br />
Anwendungsbeispiele verteilter Agenten sind im<br />
Ressourcenmanagement, in der Produktionsreihenfolgeplanung,<br />
bei Energieverteilungsaufgaben, im<br />
Netzwerk-Routing oder in der Robotik zu finden.<br />
Den Anwendungsschwerpunkt im Rahmen dieses<br />
Projektes stellen Probleme aus dem Bereich numerischer<br />
Optimierung und Scheduling dar, bei denen es<br />
Zielstellung ist, einzelne den Verarbeitungsmaschinen<br />
zugeordnete Agenten dazu zu befähigen, die zu<br />
verarbeitenden Aufträge in solch einer Reihenfolge<br />
abzuarbeiten, dass möglichst wenige Randbedingungen<br />
verletzt werden. Ein weiteres Anwendungsgebiet<br />
der von uns untersuchten Methoden ist der Roboterfußball:<br />
Für unser in der Simulationsliga antretendes<br />
Team Brainstormers haben wir verschiedene<br />
Ansätze zum Erlernen von Teamfähigkeit umgesetzt<br />
und erfolgreich im Wettkampf verwendet.<br />
Processing <strong>of</strong> multiple jobs<br />
(by multiple agents)