Introduction à la commande stochastique v.0.9 - Jean-Pierre ...
Introduction à la commande stochastique v.0.9 - Jean-Pierre ...
Introduction à la commande stochastique v.0.9 - Jean-Pierre ...
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
148 8. PROBLÈMES<br />
composantes de ν ij sont identiques, dans le cas de deux c<strong>la</strong>sses finales<br />
le coefficient dépend de <strong>la</strong> c<strong>la</strong>sse finale considérée). On obtient<br />
donc :<br />
ν 10 =<br />
) (<br />
1<br />
, ν 01 =<br />
α<br />
(<br />
1<br />
ν 00 =<br />
1<br />
(<br />
(1 + α)ɛ/(1 + ɛ)<br />
(1 + α)ɛ/(1 + ɛ)<br />
)<br />
,<br />
) (<br />
α<br />
, ν 11 =<br />
α<br />
La meilleure politique est donc <strong>la</strong> politique S 10 , c.a.d. que l’on répare<br />
lorsque le système est en panne, mais que l’on n’entretient pas lorsque le<br />
système marche. Ce<strong>la</strong> parait normal puisque le taux de panne est faible par<br />
rapport au prix de l’entretien.<br />
1. L’équation de <strong>la</strong> programmation dynamique du problème actualisé<br />
s’écrit :<br />
(1 + λ)v 0 = min{v 0 + 1,v 1 + 1 + α} ,<br />
(1 + λ)v 1 = min{ɛv 0 + (1 − ɛ)v 1 ,v 1 + α} ,<br />
où v est <strong>la</strong> fonction valeur définie par<br />
{ }<br />
∞<br />
v k = min E ∑<br />
1/(1 + λ) n+1 c U n<br />
X | X U<br />
n 0 = k ,<br />
n=0<br />
U = (U 0 , ··· , U n , ···) et<br />
(<br />
1<br />
c 0 =<br />
0<br />
)<br />
, c 1 =<br />
(<br />
1 + α<br />
α<br />
2. On cherche un développement de v en λ sous <strong>la</strong> forme<br />
v = ν/λ + w + λw 1 ···<br />
On obtient en identifiant les termes de même puissance en λ<br />
ν k = min[M u ν] k ,<br />
u<br />
ν k + w k = min[M u w + c u ] k ,<br />
u∈Uk<br />
∗<br />
avec ( ) ( )<br />
1 0<br />
0 1<br />
M 0 =<br />
, M<br />
ɛ 1 − ɛ<br />
1 = ,<br />
0 1<br />
et Uk ∗ = argmin u [Mu ν] k . Dans le cas où <strong>la</strong> politique optimale conduit<br />
<strong>à</strong> une chaîne de Markov possédant une seule c<strong>la</strong>sse finale, ν k ne<br />
dépend plus de k car le seul vecteur propre <strong>à</strong> droite de <strong>la</strong> chaîne est<br />
( )<br />
1<br />
ν .<br />
1<br />
)<br />
.<br />
)<br />
.<br />
D’autre part U ∗ k<br />
={0, 1}. La condition d’optimalités’écrit alors<br />
ν + w k = min[M u w + c u ] k ,<br />
u∈Uk<br />
∗