Introduction à la commande stochastique v.0.9 - Jean-Pierre ...
Introduction à la commande stochastique v.0.9 - Jean-Pierre ...
Introduction à la commande stochastique v.0.9 - Jean-Pierre ...
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
92 6. LE RÉGULATEUR LQG<br />
ou encore u k est Y k−1 (u) mesurable pour tout k. Cette différence avec (2.2)<br />
ne modifie pas <strong>la</strong> structure du problème.<br />
2.3. LE CRITÈRE<br />
On cherche <strong>à</strong> minimiser pour u ∈ U ad ,lecritère quadratique :<br />
{ }<br />
J (u) = 1 T −1<br />
2 E ∑<br />
x ′ k Qx k + u ′ k Ru k + x ′ T Q T x T<br />
k=0<br />
(2.5)<br />
où <strong>la</strong> matrice Q est semi-définie positive et <strong>la</strong> matrice R est définie positive.<br />
On peut faire dépendre les matrices Q et R du temps. L’horizon T pourra<br />
être infini auquel cas <strong>la</strong> matrice Q T sera nulle.<br />
Rappelons que le produit sca<strong>la</strong>ire d’un espace H k est défini par<br />
〈x, y〉 =E(x ′ y),<br />
de telle sorte que le critère J (u) a<strong>la</strong>forme,<br />
{ }<br />
J (u) = 1 ∑ T −1<br />
〈x k , Qx k 〉+〈u k , Ru k 〉+〈x T , Q T x T 〉 . (2.6)<br />
2<br />
k=0<br />
La situation est donc c<strong>la</strong>ssique : “étant donné unsystème linéaire sur un<br />
espace de Hilbert, minimiser un critère quadratique sur un ensemble de<br />
contrôle formant lui-même un espace de Hilbert”. On va donc écrire les<br />
conditions d’optimalité (principe du minimum de Pontryagin). Et il s’agira<br />
d’interpréter de façon probabiliste ce principe du minimum.<br />
On résoudra ce problème en deux étapes. Dans <strong>la</strong> première étape on se<br />
p<strong>la</strong>cera en observation complète c.a.d. que l’on supposera que y k = x k pour<br />
tout k ≥ 0. Dans <strong>la</strong> deuxième étape on prouvera le théorème de séparation<br />
montrant que <strong>la</strong> <strong>commande</strong> optimale, pour le problème en observation incomplète,<br />
est égal au feedback optimal obtenu dans le cas de l’observation<br />
complète appliqué au meilleur estimé del’état (au lieu d’être appliqué <strong>à</strong><br />
l’état lui même qui n’est pas accessible dans cette situation).<br />
3. LE RÉGULATEUR LQG EN OBSERVATION COMPLÈTE<br />
On suppose dans ce paragraphe que y k = x k pour tout k ≥ 0.<br />
LEMME 3.1. Le critère J (u) est α-convexe sur U ad ,dedérivée :<br />
∑T −1<br />
〈J ′ (u), v − u〉 = 〈B ′ p k+1 (u) + Ru k ,v k − u k 〉 (3.1)<br />
k=0<br />
où p k est solution du système adjoint,<br />
p k (u) = A ′ p k+1 (u) + Qx k (u), p T (u) = Q T x T (u). (3.2)