14.06.2014 Views

Introduction à la commande stochastique v.0.9 - Jean-Pierre ...

Introduction à la commande stochastique v.0.9 - Jean-Pierre ...

Introduction à la commande stochastique v.0.9 - Jean-Pierre ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

92 6. LE RÉGULATEUR LQG<br />

ou encore u k est Y k−1 (u) mesurable pour tout k. Cette différence avec (2.2)<br />

ne modifie pas <strong>la</strong> structure du problème.<br />

2.3. LE CRITÈRE<br />

On cherche <strong>à</strong> minimiser pour u ∈ U ad ,lecritère quadratique :<br />

{ }<br />

J (u) = 1 T −1<br />

2 E ∑<br />

x ′ k Qx k + u ′ k Ru k + x ′ T Q T x T<br />

k=0<br />

(2.5)<br />

où <strong>la</strong> matrice Q est semi-définie positive et <strong>la</strong> matrice R est définie positive.<br />

On peut faire dépendre les matrices Q et R du temps. L’horizon T pourra<br />

être infini auquel cas <strong>la</strong> matrice Q T sera nulle.<br />

Rappelons que le produit sca<strong>la</strong>ire d’un espace H k est défini par<br />

〈x, y〉 =E(x ′ y),<br />

de telle sorte que le critère J (u) a<strong>la</strong>forme,<br />

{ }<br />

J (u) = 1 ∑ T −1<br />

〈x k , Qx k 〉+〈u k , Ru k 〉+〈x T , Q T x T 〉 . (2.6)<br />

2<br />

k=0<br />

La situation est donc c<strong>la</strong>ssique : “étant donné unsystème linéaire sur un<br />

espace de Hilbert, minimiser un critère quadratique sur un ensemble de<br />

contrôle formant lui-même un espace de Hilbert”. On va donc écrire les<br />

conditions d’optimalité (principe du minimum de Pontryagin). Et il s’agira<br />

d’interpréter de façon probabiliste ce principe du minimum.<br />

On résoudra ce problème en deux étapes. Dans <strong>la</strong> première étape on se<br />

p<strong>la</strong>cera en observation complète c.a.d. que l’on supposera que y k = x k pour<br />

tout k ≥ 0. Dans <strong>la</strong> deuxième étape on prouvera le théorème de séparation<br />

montrant que <strong>la</strong> <strong>commande</strong> optimale, pour le problème en observation incomplète,<br />

est égal au feedback optimal obtenu dans le cas de l’observation<br />

complète appliqué au meilleur estimé del’état (au lieu d’être appliqué <strong>à</strong><br />

l’état lui même qui n’est pas accessible dans cette situation).<br />

3. LE RÉGULATEUR LQG EN OBSERVATION COMPLÈTE<br />

On suppose dans ce paragraphe que y k = x k pour tout k ≥ 0.<br />

LEMME 3.1. Le critère J (u) est α-convexe sur U ad ,dedérivée :<br />

∑T −1<br />

〈J ′ (u), v − u〉 = 〈B ′ p k+1 (u) + Ru k ,v k − u k 〉 (3.1)<br />

k=0<br />

où p k est solution du système adjoint,<br />

p k (u) = A ′ p k+1 (u) + Qx k (u), p T (u) = Q T x T (u). (3.2)

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!