Markov-Ketten - Max-Planck-Institut für Dynamik komplexer ...
Markov-Ketten - Max-Planck-Institut für Dynamik komplexer ...
Markov-Ketten - Max-Planck-Institut für Dynamik komplexer ...
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
1<br />
1/2 1/2<br />
1/2<br />
1/3<br />
2<br />
1/2 1/3<br />
3 4 5<br />
1/3<br />
Mittelwertsregel <strong>für</strong> Gewinnwahrscheinlichkeit<br />
i : fester Endzustand “Gewinn”<br />
l : andere Endzustände “Verlust”<br />
j, k : beliebige andere Zustände<br />
gk : Gewinnwahrscheinlichkeit bei Start in Zustand k<br />
1<br />
gi = 1 , gl = 0<br />
gk = �<br />
j<br />
pkj · gj<br />
Man kann die Formel als eine Gewichtung der Erfolgsaussichten aller möglichen Nachfolgezustände<br />
ansehen, denn <strong>für</strong> alle k gilt �<br />
j pkj = 1.<br />
Maus-Beispiel Die Endzustände sind 2 und 5.<br />
g1 = 1<br />
2 g3 + 1<br />
2 g2<br />
g2 = 0<br />
g3 = 1<br />
2 g1 + 1<br />
2 g4<br />
g4 = 1<br />
3 g3 + 1<br />
3 g2 + 1<br />
3 g5<br />
g5 = 1<br />
Einsetzen liefert Gewinnwahrscheinlichkeit <strong>für</strong> Start in 3<br />
g3 = 1<br />
�<br />
1<br />
2 2 g3<br />
�<br />
+ 1<br />
�<br />
1<br />
2 3 g3 + 1<br />
�<br />
3<br />
= 5<br />
12 g3 + 1<br />
6<br />
⇔ g3 = 2<br />
≈ 28, 6 %<br />
7<br />
Mittelwertsregel <strong>für</strong> die durchschnittliche Spieldauer<br />
ti = 0 <strong>für</strong> alle Endzustände<br />
tk = 1 + �<br />
j<br />
pkj · tj<br />
Auch dies ist praktisch eine Gewichtung der Nachfolgewartezeiten eines jeden Zustands unter der<br />
Berücksichtigung, dass es einen Zeitschritt dauert, bis man in einem solchen Nachfolgezustand ist.<br />
4<br />
1