14.06.2014 Views

Introduction à la commande stochastique v.0.9 - Jean-Pierre ...

Introduction à la commande stochastique v.0.9 - Jean-Pierre ...

Introduction à la commande stochastique v.0.9 - Jean-Pierre ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

5. JEUX DE PILE OU FACE 133<br />

(<strong>la</strong> première équation indique seulement que ν est constant et ne<br />

donne pas d’information sur u). Ces 2 équations peuvent donc se<br />

réécrire en une seule: rechercher <strong>la</strong> constante ν et w tels que<br />

ν + w x =<br />

max<br />

0≤u≤1−ρ ((Mu w) x + xu),∀x .<br />

5. Dans le cas où on a une contrainte de turbinage minimun (u ≥ γ ,<br />

pour γ > 0) est imposée on pourra utiliser l’algorithme de Howard<br />

ou calculer explicitement <strong>la</strong> mesure invariante en utilisant le<br />

caractère bang-bang de <strong>la</strong> stratégie.<br />

5. JEUX DE PILE OU FACE<br />

On considère le jeu de pile ou face dans le cas borné. Le joueur s’arrête<br />

lorsqu’il a perdu une somme donnée <strong>à</strong> l’avance ou lorsqu’il a obtenu un gain<br />

donné. Aprés quelques calculs sur ce problème. On vérifie qu’une politique<br />

d’arrêt optimal du jeu avant sa fin normale ne conduit <strong>à</strong> aucune amélioration<br />

de <strong>la</strong> moyenne des gains. On étudie l’influence d’un biais dans le tirage<br />

sur l’espérance de gain. On estime le biais. On résout le problème d’arrêt<br />

optimal en observation incomplète dans le cas où le biais n’est pas connu<br />

mais doit être estimé pendant le jeu.<br />

5.1. ENONCÉ<br />

5.1.1. ETUDE DE LA CHAÎNE DE MARKOV ASSOCIÉ AU JEU DE PILE OU<br />

FACE. On considère une pièce ayant <strong>la</strong> probabilité p de tomber sur face.<br />

On fait des tirages indépendants de <strong>la</strong> pièce. On commence le jeu avec une<br />

somme x 0 . Lorsque <strong>la</strong> pièce tombe sur face on gagne 1. Lorsque <strong>la</strong> pièce<br />

tombe sur pile on perd 1. Lorsque <strong>la</strong> fortune du joueur a atteint 0 ou F on<br />

n’a plus le droit de jouer. La fortune reste donc <strong>à</strong> <strong>la</strong> valeur atteinte pendant<br />

les étapes suivantes.<br />

1. Donnez <strong>la</strong> matrice de transition de <strong>la</strong> chaîne de Markov représentant<br />

l’évolution de <strong>la</strong> fortune du joueur. On appellera M cette matrice.<br />

2. Donnez l’équation satisfaite par <strong>la</strong> loi marginale p n x pour que <strong>la</strong> fortune<br />

soit au niveau x <strong>à</strong> l’instant n.<br />

3. Decrivez les c<strong>la</strong>sses finales et transitoires de cette chaînedeMarkov.<br />

4. Explicitez les mesures de probabilités invariantes extrêmales de cette<br />

chaîne (voir le paragraphe base du N (A ′ ) du chapitre 1 du polycopié).<br />

5. On s’intéresse aux probabilités de gagner (terminer en F) etde<br />

perdre terminer en 0. Donner les équations permettant de calculer<br />

ces probabilités (voir le paragraphe base du N (A) du chapitre 1 du<br />

polycopié).<br />

6. Calculer explicitement les probabilités de gagner et de perdre dans le<br />

cas p = 1/2.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!