14.06.2014 Views

Introduction à la commande stochastique v.0.9 - Jean-Pierre ...

Introduction à la commande stochastique v.0.9 - Jean-Pierre ...

Introduction à la commande stochastique v.0.9 - Jean-Pierre ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

148 8. PROBLÈMES<br />

composantes de ν ij sont identiques, dans le cas de deux c<strong>la</strong>sses finales<br />

le coefficient dépend de <strong>la</strong> c<strong>la</strong>sse finale considérée). On obtient<br />

donc :<br />

ν 10 =<br />

) (<br />

1<br />

, ν 01 =<br />

α<br />

(<br />

1<br />

ν 00 =<br />

1<br />

(<br />

(1 + α)ɛ/(1 + ɛ)<br />

(1 + α)ɛ/(1 + ɛ)<br />

)<br />

,<br />

) (<br />

α<br />

, ν 11 =<br />

α<br />

La meilleure politique est donc <strong>la</strong> politique S 10 , c.a.d. que l’on répare<br />

lorsque le système est en panne, mais que l’on n’entretient pas lorsque le<br />

système marche. Ce<strong>la</strong> parait normal puisque le taux de panne est faible par<br />

rapport au prix de l’entretien.<br />

1. L’équation de <strong>la</strong> programmation dynamique du problème actualisé<br />

s’écrit :<br />

(1 + λ)v 0 = min{v 0 + 1,v 1 + 1 + α} ,<br />

(1 + λ)v 1 = min{ɛv 0 + (1 − ɛ)v 1 ,v 1 + α} ,<br />

où v est <strong>la</strong> fonction valeur définie par<br />

{ }<br />

∞<br />

v k = min E ∑<br />

1/(1 + λ) n+1 c U n<br />

X | X U<br />

n 0 = k ,<br />

n=0<br />

U = (U 0 , ··· , U n , ···) et<br />

(<br />

1<br />

c 0 =<br />

0<br />

)<br />

, c 1 =<br />

(<br />

1 + α<br />

α<br />

2. On cherche un développement de v en λ sous <strong>la</strong> forme<br />

v = ν/λ + w + λw 1 ···<br />

On obtient en identifiant les termes de même puissance en λ<br />

ν k = min[M u ν] k ,<br />

u<br />

ν k + w k = min[M u w + c u ] k ,<br />

u∈Uk<br />

∗<br />

avec ( ) ( )<br />

1 0<br />

0 1<br />

M 0 =<br />

, M<br />

ɛ 1 − ɛ<br />

1 = ,<br />

0 1<br />

et Uk ∗ = argmin u [Mu ν] k . Dans le cas où <strong>la</strong> politique optimale conduit<br />

<strong>à</strong> une chaîne de Markov possédant une seule c<strong>la</strong>sse finale, ν k ne<br />

dépend plus de k car le seul vecteur propre <strong>à</strong> droite de <strong>la</strong> chaîne est<br />

( )<br />

1<br />

ν .<br />

1<br />

)<br />

.<br />

)<br />

.<br />

D’autre part U ∗ k<br />

={0, 1}. La condition d’optimalités’écrit alors<br />

ν + w k = min[M u w + c u ] k ,<br />

u∈Uk<br />

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!