Introduction à la commande stochastique v.0.9 - Jean-Pierre ...
Introduction à la commande stochastique v.0.9 - Jean-Pierre ...
Introduction à la commande stochastique v.0.9 - Jean-Pierre ...
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
130 8. PROBLÈMES<br />
1. Donnez <strong>la</strong> matrice de transition de <strong>la</strong> chaîne de Markov représentant<br />
l’évolution du stock d’eau pour cette politique. On appellera M cette<br />
matrice.<br />
2. Donnez l’équation satisfaite par <strong>la</strong> loi marginale p n x<br />
pour que le stock<br />
soit au niveau x <strong>à</strong> l’instant n. On supposera donnée une loi initiale<br />
p 0 .<br />
3. Lorsque n augmente on suppose que cette loi marginale se stationnarise.<br />
On appelle p cette loi de probabilité enrégime stationnaire.<br />
Quelle équation satisfait elle?<br />
4. Montrez qu’il y a unicitédecerégime stationnaire. On s’aidera de <strong>la</strong><br />
section ”base du N (A ′ )” du chapitre 1 du polycopié.<br />
5. Discutez du support de cette mesure invariante en fonction de u.<br />
6. En cherchant p x sous <strong>la</strong> forme p x = Cβ x (avec C et β deux<br />
constantes positives), dans le cas u > 0, on donnera une formule<br />
explicite pour p.<br />
7. Etant donné un taux d’actualisation λ, donnez l’équation satisfaite<br />
par:<br />
∞∑<br />
v λ x = E{ 1/(1 + λ) n+1 X n U n |X 0 = x},<br />
0<br />
où X n désigne l’état de <strong>la</strong> chaîne de Markov et U n sa <strong>commande</strong> <strong>à</strong><br />
l’instant n.<br />
8. Montrez que λv λ reste borné lorsque λ tend vers 0.<br />
9. On fait un développement de v λ sous <strong>la</strong> forme ν/λ+w 0 +λw 1 +···.<br />
Donnez un système d’équations caractérisant ν.<br />
10. En déduire que ν est un vecteur constant.<br />
11. Quelle est l’interprétation probabiliste de ν?<br />
12. Calculez explicitement ν.<br />
4.1.2. OPTIMISATION DE LA POLITIQUE DE GESTION.<br />
1. Formulez en termes de <strong>commande</strong> optimale <strong>stochastique</strong> le problème<br />
de gestion optimale dans le cas d’un horizon infini avec un taux d’actualisation<br />
λ.<br />
2. Explicitez l’équation de <strong>la</strong> programmation dynamique correspondante?<br />
3. Montrez que <strong>la</strong> stratégie est du type bang-bang. On supposera, dans<br />
<strong>la</strong> suite du problème, avoir démontré qu’en dessous d’un certain<br />
stock α on ne turbine pas et qu’au dessus de ce seuil on turbine au<br />
maximum u = 1 − ρ.<br />
4. On fait tendre <strong>à</strong> nouveau λ vers 0 et on fait <strong>à</strong> nouveau un<br />
développement en λ de <strong>la</strong> fonction valeur. Donnez l’équation<br />
définissant le premier terme du développement de <strong>la</strong> fonction de <strong>la</strong><br />
programmation dynamique.<br />
5. Dans le cas où on a une contrainte de turbinage minimun (u ≥ γ ,<br />
pour γ > 0) est imposée, indiquez une façon de calculer le seuil α<br />
déterminant <strong>la</strong> stratégie optimale.