Introduction à la commande stochastique v.0.9 - Jean-Pierre ...
Introduction à la commande stochastique v.0.9 - Jean-Pierre ...
Introduction à la commande stochastique v.0.9 - Jean-Pierre ...
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
118 8. PROBLÈMES<br />
Supposons f et g bornées et que l’on puisse en déduire que V soit<br />
bornée, démontrez que le <strong>commande</strong> solution de cette équation est optimale<br />
(c.a.d. qu’une autre décision conduirait <strong>à</strong>uncoût supérieur).<br />
1.1.3. QUESTION 3. On se p<strong>la</strong>ce dans <strong>la</strong> situation de <strong>la</strong> première question.<br />
On fait tendre vers l’infini le nombre de périodes de gestion T on aimerait<br />
comprendre le comportement asymptotique de <strong>la</strong> fonction de <strong>la</strong> programmation<br />
dynamique. La solution de l’équation de <strong>la</strong> programmation dynamique<br />
admet des solutions de <strong>la</strong> forme comme −µT + W(x) pour une certaine<br />
condition finale, où µ est un nombre réel positif. µ s’interprète comme le<br />
coût moyen par période. On pourra numéroter les périodes par des nombres<br />
negatifs. On numérotera 0 <strong>la</strong> dernière période.<br />
Quelle est l’équation que doit satisfaire le couple (µ, W)?<br />
Quelle est <strong>la</strong> condition finale qui convient?<br />
Ce couple est-il défini de façon unique?<br />
1.1.4. QUESTION 4. On considère qu’une période de temps a une durée h.<br />
µ s’interprète ici comme un coût par unitédetemps.<br />
A quel cas particulier de l’équation précédente correspond l’équation:<br />
{<br />
}<br />
hµ = min inf [W(x + u − h)] − W(x) + 1, W(x − h) − W(x) + hx 2 ?<br />
u>0<br />
Ecrivez l’équation limite lorsque h → 0.<br />
Résolvez explicitement cette dernière équation dans <strong>la</strong> c<strong>la</strong>sse des W<br />
continues.<br />
Vérifiez que <strong>la</strong> solution W correspondante est C 1 .<br />
Résumez en une phrase <strong>la</strong> stratégie obtenue.<br />
1.2. CORRIGÉ<br />
1.2.1. QUESTION 1.<br />
1. On veut résoudre :<br />
∑T −1<br />
min E [ f (X t ) + g(U t )] ,<br />
U t<br />
t=0,··· ,T −1 t=0<br />
sous les contraintes dynamiques:<br />
X t+1 = X t + U t − V t , t = 0, ··· , T − 1 .<br />
2. La fonction de <strong>la</strong> programmation dynamique est définie par :<br />
{ }<br />
∑ T −1<br />
V (t, x) = min E [ f (X s ) + g(U s )] | X t = x .<br />
U s<br />
s=t,··· ,T −1 s=t