03.01.2013 Aufrufe

Markov-Ketten - Max-Planck-Institut für Dynamik komplexer ...

Markov-Ketten - Max-Planck-Institut für Dynamik komplexer ...

Markov-Ketten - Max-Planck-Institut für Dynamik komplexer ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

1<br />

1/2 1/2<br />

1/2<br />

1/3<br />

2<br />

1/2 1/3<br />

3 4 5<br />

1/3<br />

Mittelwertsregel <strong>für</strong> Gewinnwahrscheinlichkeit<br />

i : fester Endzustand “Gewinn”<br />

l : andere Endzustände “Verlust”<br />

j, k : beliebige andere Zustände<br />

gk : Gewinnwahrscheinlichkeit bei Start in Zustand k<br />

1<br />

gi = 1 , gl = 0<br />

gk = �<br />

j<br />

pkj · gj<br />

Man kann die Formel als eine Gewichtung der Erfolgsaussichten aller möglichen Nachfolgezustände<br />

ansehen, denn <strong>für</strong> alle k gilt �<br />

j pkj = 1.<br />

Maus-Beispiel Die Endzustände sind 2 und 5.<br />

g1 = 1<br />

2 g3 + 1<br />

2 g2<br />

g2 = 0<br />

g3 = 1<br />

2 g1 + 1<br />

2 g4<br />

g4 = 1<br />

3 g3 + 1<br />

3 g2 + 1<br />

3 g5<br />

g5 = 1<br />

Einsetzen liefert Gewinnwahrscheinlichkeit <strong>für</strong> Start in 3<br />

g3 = 1<br />

�<br />

1<br />

2 2 g3<br />

�<br />

+ 1<br />

�<br />

1<br />

2 3 g3 + 1<br />

�<br />

3<br />

= 5<br />

12 g3 + 1<br />

6<br />

⇔ g3 = 2<br />

≈ 28, 6 %<br />

7<br />

Mittelwertsregel <strong>für</strong> die durchschnittliche Spieldauer<br />

ti = 0 <strong>für</strong> alle Endzustände<br />

tk = 1 + �<br />

j<br />

pkj · tj<br />

Auch dies ist praktisch eine Gewichtung der Nachfolgewartezeiten eines jeden Zustands unter der<br />

Berücksichtigung, dass es einen Zeitschritt dauert, bis man in einem solchen Nachfolgezustand ist.<br />

4<br />

1

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!