Introduction à la commande stochastique v.0.9 - Jean-Pierre ...
Introduction à la commande stochastique v.0.9 - Jean-Pierre ...
Introduction à la commande stochastique v.0.9 - Jean-Pierre ...
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
46 3. COMMANDE OPTIMALE STOCHASTIQUE<br />
L’état du système sera <strong>la</strong> variable aléatoire pouvant prendre une des valeurs<br />
M,1,2, ···, N indiquant que le matériel est en panne (M), ou donnant<br />
son âge pouvant prendre les valeurs {1, 2, ··· , N}.<br />
Pour ce système on peut supposer observer l’état 1 .<br />
La <strong>commande</strong> u est <strong>la</strong> décision de remp<strong>la</strong>cement : u = 1 indique le<br />
remp<strong>la</strong>cement, u = 0 le non remp<strong>la</strong>cement.<br />
La matrice de transition de <strong>la</strong> chaînedeMarkovdécrivant l’évolution de<br />
l’état s’écrit alors :<br />
⎛<br />
⎞<br />
0 1 0 · ·<br />
p<br />
M u 1 u q1 u r1 u 0 ·<br />
=<br />
⎜ p2 u q2 u 0 r2 u ·<br />
⎟ ,<br />
⎝ · · · · · ⎠<br />
0 1 0 · ·<br />
où p 0 x = λ x, p 1 x = 0, q0 x = 0, q1 x = 1, ru x = 1 − pu x − qu x .<br />
Et donc <strong>la</strong> matrice de transition dépend du paramètre de <strong>commande</strong> u.<br />
On associe un coût au fonctionnement du système constitué de<strong>la</strong><br />
somme du coût de remp<strong>la</strong>cement du matérieletd’uncoût de défail<strong>la</strong>nce<br />
ayant lieu lorsque le système est <strong>à</strong> l’arrêt:<br />
c u x = cu + d x ,<br />
avec :<br />
{<br />
c u k1 sur u = 1 ,<br />
=<br />
0 ailleurs ,<br />
⎧<br />
⎨ 0 si x = 1, 2, ··· , N − 1 ,<br />
d x = k<br />
⎩ 2 si x = M ,<br />
k 1 si x = N .<br />
Le problème de <strong>commande</strong> consiste alors <strong>à</strong> minimiser, par exemple, le coût<br />
actualisé du fonctionnement du système c.a.d. :<br />
min E<br />
u<br />
+∞∑<br />
n=0<br />
1<br />
(1 + λ) n+1 (cU n + d X n),<br />
λ étant un nombre positif représentant un taux d’actualisation.<br />
2. FORMULATION PRÉCISE DU PROBLÈME<br />
On se donne <strong>la</strong> chaînedeMarkov(T , E, F, G, M uy , p 0 , c uy ) commandée<br />
et observée avec :<br />
• un temps n ∈ T = N ;<br />
• un espace d’état E ={1, 2, ··· , E} ;<br />
• un espace de sorties G ={1, 2, ··· , G} ;<br />
• un espace d’entrée F ={1, 2, ··· , F} ;<br />
1 Ce n’est pas toujours le cas, par exemple, pour un matériel de sécurité qui en général<br />
ne marche pas sauf s’il y a un incident, on est incapable, en dehors des instants de test, de<br />
savoir avec certitude s’il est en état de fonctionnement.