31.01.2014 Aufrufe

Jahresbericht 2009 - Institute of Computer Science - Universität ...

Jahresbericht 2009 - Institute of Computer Science - Universität ...

Jahresbericht 2009 - Institute of Computer Science - Universität ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

72 Universität Osnabrück Institut für Informatik <strong>Jahresbericht</strong> <strong>2009</strong> Projekte<br />

Lernen in Multi-Agenten Systemen<br />

Leitung Pr<strong>of</strong>. Dr. Martin Riedmiller<br />

Mitarbeiter Dipl.-Inform. omas Gabel<br />

Laufzeit 1999 - 03/<strong>2009</strong><br />

Förderung Deutsche Forschungsgemeinschaft (DFG)<br />

Stichworte Reinforcement Lernen, Strategielernen, Multi-Agenten Systeme, Scheduling<br />

Die Entscheidungsfindung in verteilten Systemen<br />

erfordert die gezielte Zusammenarbeit individuell<br />

handelnder Agenten, um ein vorgegebenes gemeinsames<br />

Ziel zu erreichen. Hierzu dürfen sich die<br />

Handlungsstrategien der einzelnen Agenten nicht<br />

gegenseitig behindern - eine optimale Abstimmung<br />

der Agentenverhalten aufeinander ist unabdingbar.<br />

Das Forschungsgebiet des Reinforcement Lernens<br />

(optimierendes Lernen) hat sich zum Ziel gesetzt,<br />

allein aus dem Wissen über erfolgreiche oder fehlgeschlagene<br />

Trainingsversuche ein möglichst optimales<br />

Verhalten für einen handelnden Agenten zu erlernen.<br />

Ziel des Forschungsprojekts ist die Entwicklung<br />

und Untersuchung von autonomen Lernverfahren,<br />

die die Idee des Reinforcement Lernens auf Multi-<br />

Agenten-Systeme übertragen. So sollen kooperative<br />

Strategien allein auf Basis der Spezifikation des<br />

gewünschten Gesamtverhaltens des Systems erlernt<br />

werden. Das Vorhandensein mehrerer interagierender<br />

Agenten bedeutet hierbei eine besondere<br />

Herausforderung, denn nicht immer ist unmittelbar<br />

ersichtlich, welche Aktion welches Agenten wie stark<br />

für die Gesamtleistung verantwortlich ist.<br />

Neben dem Entwurf und der Analyse von Algorithmen<br />

zum Erlernen der verteilten Entscheidungsfindung<br />

umfassen die aktuell verfolgten Zielstellungen<br />

auch die Erhöhung der Robustheit der Lernverfahren<br />

gegenüber veränderten Rahmenbedingungen.<br />

Zu den aktuellen Forschungsschwerpunkten gehören<br />

dabei auch der gezielte Einsatz von Kommunikation,<br />

das Erlernen koordinierten Handelns sowie das<br />

direkte Erlernen von agentenspezifischen Handlungsstrategien.<br />

Anwendungsbeispiele verteilter Agenten sind im<br />

Ressourcenmanagement, in der Produktionsreihenfolgeplanung,<br />

bei Energieverteilungsaufgaben, im<br />

Netzwerk-Routing oder in der Robotik zu finden.<br />

Den Anwendungsschwerpunkt im Rahmen dieses<br />

Projektes stellen Probleme aus dem Bereich numerischer<br />

Optimierung und Scheduling dar, bei denen es<br />

Zielstellung ist, einzelne den Verarbeitungsmaschinen<br />

zugeordnete Agenten dazu zu befähigen, die zu<br />

verarbeitenden Aufträge in solch einer Reihenfolge<br />

abzuarbeiten, dass möglichst wenige Randbedingungen<br />

verletzt werden. Ein weiteres Anwendungsgebiet<br />

der von uns untersuchten Methoden ist der Roboterfußball:<br />

Für unser in der Simulationsliga antretendes<br />

Team Brainstormers haben wir verschiedene<br />

Ansätze zum Erlernen von Teamfähigkeit umgesetzt<br />

und erfolgreich im Wettkampf verwendet.<br />

Processing <strong>of</strong> multiple jobs<br />

(by multiple agents)

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!