Introduction à la commande stochastique v.0.9 - Jean-Pierre ...
Introduction à la commande stochastique v.0.9 - Jean-Pierre ...
Introduction à la commande stochastique v.0.9 - Jean-Pierre ...
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
154 8. PROBLÈMES<br />
2. Dans <strong>la</strong> suite le vecteur d’état du système sous forme canonique est<br />
noté Z :<br />
Z(t) = (z, ż, ¨z, z (3) )(t) .<br />
En adaptant le théorème correspondant du cours, montrer que <strong>la</strong><br />
fonction :<br />
w(z 0 , z 1 , z 2 , z 3 ) def<br />
= inf {J (v) | Z(0) = (z 0, z 1 , z 2 , z 3 )} ,<br />
v<br />
vérifie l’équation de <strong>la</strong> programmation dynamique :<br />
∂w<br />
∂z 0<br />
z 1 + ∂w<br />
∂z 1<br />
z 2 + ∂w<br />
∂z 2<br />
z 3 − 1 2<br />
( ∂w<br />
∂z 3<br />
) 2<br />
+ γ 2 (z 0) 2 = 0 , (9.2)<br />
w(0, 0, 0, 0) = 0 .<br />
Pour ce<strong>la</strong> on admettra que (9.2) admet une unique solution positive<br />
régulière.<br />
EQUATION DE RICCATI ALGÉBRIQUE. Montrer que <strong>la</strong> solution positive de<br />
l’équation de <strong>la</strong> programmation dynamique (9.2) est quadratique : w(ζ) =<br />
(1/2)ζ ′ Pζ avec P ≥ 0etζ = (z 0 , z 1 , z 2 , z 3 ).<br />
1. Par substitution dans (9.2) donner l’équation — dite de Riccati —<br />
vérifiée par P.<br />
2. Montrer que <strong>la</strong> <strong>commande</strong> optimale est :<br />
v ∗ (z 0 , z 1 , z 2 , z 3 ) =−p 14 z 0 − p 24 z 1 − p 34 z 2 − p 44 z 3 .<br />
3. Montrer que le système dynamique optimal — gouverné par ce feedback<br />
optimal — s’écrit :<br />
Ż = AZ , (9.3)<br />
avec A une matrice — dont les coefficients dépendent de P — que<br />
l’on explicitera .<br />
4. Calculer le polynôme caractéristique de A en fonction des coefficients<br />
de P.<br />
INTERPRÉTATION DES VARIABLES DUALES.<br />
1. Si l’on note<br />
W(t) = grad(w)(Z(t)) ,<br />
et (t) = (Z, W)(t), montrer que satisfait le système hamiltonien<br />
˙ = H, avec<br />
⎛<br />
⎞<br />
0 1 0 0 0 0 0 0<br />
0 0 1 0 0 0 0 0<br />
0 0 0 1 0 0 0 0<br />
0 0 0 0 0 0 0 −1<br />
H =<br />
.<br />
−γ 0 0 0 0 0 0 0<br />
⎜ 0 0 0 0 −1 0 0 0<br />
⎟<br />
⎝<br />
0 0 0 0 0 −1 0 0<br />
⎠<br />
0 0 0 0 0 0 −1 0