28.09.2013 Aufrufe

Neuronale Netze - D. Kriesel

Neuronale Netze - D. Kriesel

Neuronale Netze - D. Kriesel

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

C.2.3 Montecarlo-Methodik . . . . . . . . . . . . . . . . . . . . . . . . 249<br />

C.2.4 Temporal Difference Learning . . . . . . . . . . . . . . . . . . . . 251<br />

C.2.5 Die Action-Value-Funktion . . . . . . . . . . . . . . . . . . . . . 252<br />

C.2.6 Q-Learning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253<br />

C.3 Beispielanwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254<br />

C.3.1 TD-Gammon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254<br />

C.3.2 Das Auto in der Grube . . . . . . . . . . . . . . . . . . . . . . . 255<br />

C.3.3 Der Pole Balancer . . . . . . . . . . . . . . . . . . . . . . . . . . 255<br />

C.4 Reinforcement Learning im Zusammenhang mit <strong>Neuronale</strong>n <strong>Netze</strong>n . . . 256<br />

Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 257<br />

Literaturverzeichnis 259<br />

Abbildungsverzeichnis 265<br />

Index 269

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!