14.06.2014 Views

Introduction à la commande stochastique v.0.9 - Jean-Pierre ...

Introduction à la commande stochastique v.0.9 - Jean-Pierre ...

Introduction à la commande stochastique v.0.9 - Jean-Pierre ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

46 3. COMMANDE OPTIMALE STOCHASTIQUE<br />

L’état du système sera <strong>la</strong> variable aléatoire pouvant prendre une des valeurs<br />

M,1,2, ···, N indiquant que le matériel est en panne (M), ou donnant<br />

son âge pouvant prendre les valeurs {1, 2, ··· , N}.<br />

Pour ce système on peut supposer observer l’état 1 .<br />

La <strong>commande</strong> u est <strong>la</strong> décision de remp<strong>la</strong>cement : u = 1 indique le<br />

remp<strong>la</strong>cement, u = 0 le non remp<strong>la</strong>cement.<br />

La matrice de transition de <strong>la</strong> chaînedeMarkovdécrivant l’évolution de<br />

l’état s’écrit alors :<br />

⎛<br />

⎞<br />

0 1 0 · ·<br />

p<br />

M u 1 u q1 u r1 u 0 ·<br />

=<br />

⎜ p2 u q2 u 0 r2 u ·<br />

⎟ ,<br />

⎝ · · · · · ⎠<br />

0 1 0 · ·<br />

où p 0 x = λ x, p 1 x = 0, q0 x = 0, q1 x = 1, ru x = 1 − pu x − qu x .<br />

Et donc <strong>la</strong> matrice de transition dépend du paramètre de <strong>commande</strong> u.<br />

On associe un coût au fonctionnement du système constitué de<strong>la</strong><br />

somme du coût de remp<strong>la</strong>cement du matérieletd’uncoût de défail<strong>la</strong>nce<br />

ayant lieu lorsque le système est <strong>à</strong> l’arrêt:<br />

c u x = cu + d x ,<br />

avec :<br />

{<br />

c u k1 sur u = 1 ,<br />

=<br />

0 ailleurs ,<br />

⎧<br />

⎨ 0 si x = 1, 2, ··· , N − 1 ,<br />

d x = k<br />

⎩ 2 si x = M ,<br />

k 1 si x = N .<br />

Le problème de <strong>commande</strong> consiste alors <strong>à</strong> minimiser, par exemple, le coût<br />

actualisé du fonctionnement du système c.a.d. :<br />

min E<br />

u<br />

+∞∑<br />

n=0<br />

1<br />

(1 + λ) n+1 (cU n + d X n),<br />

λ étant un nombre positif représentant un taux d’actualisation.<br />

2. FORMULATION PRÉCISE DU PROBLÈME<br />

On se donne <strong>la</strong> chaînedeMarkov(T , E, F, G, M uy , p 0 , c uy ) commandée<br />

et observée avec :<br />

• un temps n ∈ T = N ;<br />

• un espace d’état E ={1, 2, ··· , E} ;<br />

• un espace de sorties G ={1, 2, ··· , G} ;<br />

• un espace d’entrée F ={1, 2, ··· , F} ;<br />

1 Ce n’est pas toujours le cas, par exemple, pour un matériel de sécurité qui en général<br />

ne marche pas sauf s’il y a un incident, on est incapable, en dehors des instants de test, de<br />

savoir avec certitude s’il est en état de fonctionnement.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!