Introduction à la commande stochastique v.0.9 - Jean-Pierre ...
Introduction à la commande stochastique v.0.9 - Jean-Pierre ...
Introduction à la commande stochastique v.0.9 - Jean-Pierre ...
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
44 2. CHAÎNES DE BELLMAN<br />
THÉORÈME 4.3. Le coût marginal w n x = C(X n = x) de <strong>la</strong> chaîne de Bellman<br />
est donnépar<br />
w n+1 = w n ⊗ C def<br />
= min<br />
x∈E (wn x + C x.), w 0 = φ.<br />
Le coût d’une chaîne de Bellman est normalisé ce qui signifie que son<br />
infimum sur l’ensemble des trajectoires est 0. Dans certaines applications<br />
on aimerait enlever cette restriction. On peut le faire en introduisant l’analogue<br />
des fonctionnelles multiplicatives des trajectoires d’un processus <strong>stochastique</strong>.<br />
THÉORÈME 4.4. La valeur<br />
}<br />
v n x<br />
def<br />
= M<br />
{<br />
N−1<br />
∑<br />
k=n<br />
f (X k ) + (X N ) | X n = x<br />
avec f, ∈ R E peut être calculée récursivement par<br />
v n = F ⊗ C ⊗ v n+1 = f . + min(C .y + v n+1<br />
y<br />
y<br />
), v N = ,<br />
où F = diag f est définie par F xy = f x si x = y et +∞ sinon.