Introduction à la commande stochastique v.0.9 - Jean-Pierre ...
Introduction à la commande stochastique v.0.9 - Jean-Pierre ...
Introduction à la commande stochastique v.0.9 - Jean-Pierre ...
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
5. JEUX DE PILE OU FACE 133<br />
(<strong>la</strong> première équation indique seulement que ν est constant et ne<br />
donne pas d’information sur u). Ces 2 équations peuvent donc se<br />
réécrire en une seule: rechercher <strong>la</strong> constante ν et w tels que<br />
ν + w x =<br />
max<br />
0≤u≤1−ρ ((Mu w) x + xu),∀x .<br />
5. Dans le cas où on a une contrainte de turbinage minimun (u ≥ γ ,<br />
pour γ > 0) est imposée on pourra utiliser l’algorithme de Howard<br />
ou calculer explicitement <strong>la</strong> mesure invariante en utilisant le<br />
caractère bang-bang de <strong>la</strong> stratégie.<br />
5. JEUX DE PILE OU FACE<br />
On considère le jeu de pile ou face dans le cas borné. Le joueur s’arrête<br />
lorsqu’il a perdu une somme donnée <strong>à</strong> l’avance ou lorsqu’il a obtenu un gain<br />
donné. Aprés quelques calculs sur ce problème. On vérifie qu’une politique<br />
d’arrêt optimal du jeu avant sa fin normale ne conduit <strong>à</strong> aucune amélioration<br />
de <strong>la</strong> moyenne des gains. On étudie l’influence d’un biais dans le tirage<br />
sur l’espérance de gain. On estime le biais. On résout le problème d’arrêt<br />
optimal en observation incomplète dans le cas où le biais n’est pas connu<br />
mais doit être estimé pendant le jeu.<br />
5.1. ENONCÉ<br />
5.1.1. ETUDE DE LA CHAÎNE DE MARKOV ASSOCIÉ AU JEU DE PILE OU<br />
FACE. On considère une pièce ayant <strong>la</strong> probabilité p de tomber sur face.<br />
On fait des tirages indépendants de <strong>la</strong> pièce. On commence le jeu avec une<br />
somme x 0 . Lorsque <strong>la</strong> pièce tombe sur face on gagne 1. Lorsque <strong>la</strong> pièce<br />
tombe sur pile on perd 1. Lorsque <strong>la</strong> fortune du joueur a atteint 0 ou F on<br />
n’a plus le droit de jouer. La fortune reste donc <strong>à</strong> <strong>la</strong> valeur atteinte pendant<br />
les étapes suivantes.<br />
1. Donnez <strong>la</strong> matrice de transition de <strong>la</strong> chaîne de Markov représentant<br />
l’évolution de <strong>la</strong> fortune du joueur. On appellera M cette matrice.<br />
2. Donnez l’équation satisfaite par <strong>la</strong> loi marginale p n x pour que <strong>la</strong> fortune<br />
soit au niveau x <strong>à</strong> l’instant n.<br />
3. Decrivez les c<strong>la</strong>sses finales et transitoires de cette chaînedeMarkov.<br />
4. Explicitez les mesures de probabilités invariantes extrêmales de cette<br />
chaîne (voir le paragraphe base du N (A ′ ) du chapitre 1 du polycopié).<br />
5. On s’intéresse aux probabilités de gagner (terminer en F) etde<br />
perdre terminer en 0. Donner les équations permettant de calculer<br />
ces probabilités (voir le paragraphe base du N (A) du chapitre 1 du<br />
polycopié).<br />
6. Calculer explicitement les probabilités de gagner et de perdre dans le<br />
cas p = 1/2.