Vorlesungsfolien

Weitere Magazine

Empfehlungen

Info

Jörn Fischer - j.fischer@hs-mannheim.de - Raum 113a - Tel. (0621)292-6767 Reinforcement Learning Modell basierte Verbesserungen Priorized Sweeping (Moore & Atkeson, 1993) ● Funktioniert wie dyna nur statt k-mal Q-update mit zufälligen State-Action Paaren: ● Q- odert V-Value des letzten Zustands wird gespeichert und die Differenz des letzten zum bisherigen Q/V wird als Priorität für das Update benutzt ● Dass bedeutet, dass gerade da wo die Differenz beim Update groß ist, dort wird das nächste mal eher ein Update gemacht.
Seite 1 und 2:
Jörn Fischer j.fischer@hs-mannheim
Seite 3 und 4:
Jörn Fischer - j.fischer@hs-mannhe
Seite 5 und 6:
Seite 7 und 8:
Seite 9 und 10:
Seite 11 und 12:
Seite 13 und 14:
Seite 15 und 16:
Seite 17 und 18:
Seite 19 und 20:
Seite 21 und 22:
Seite 23 und 24:
Seite 25 und 26:
Seite 27 und 28:
Seite 29 und 30:
Seite 31 und 32:
Seite 33 und 34:
Seite 35 und 36:
Seite 37 und 38:
Seite 39 und 40:
Seite 41 und 42:
Seite 43 und 44:
Seite 45 und 46: Jörn Fischer - j.fischer@hs-mannhe
Seite 77 und 78: Evolutionäre Algorithmen Beispiel
Seite 95: Jörn Fischer - j.fischer@hs-mannhe
Alle anzeigen

Vorlesungsfolien

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?