Introduction à la commande stochastique v.0.9 - Jean-Pierre ...
Introduction à la commande stochastique v.0.9 - Jean-Pierre ...
Introduction à la commande stochastique v.0.9 - Jean-Pierre ...
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
CHAPITRE 3<br />
COMMANDE OPTIMALE STOCHASTIQUE<br />
1. INTRODUCTION ET EXEMPLES<br />
Etant donnée une chaîne de Markov de matrice de transition dépendant<br />
d’un paramètre appelé <strong>commande</strong>, une observation ne dépendant que de<br />
l’état de <strong>la</strong> chaîne de manière markovienne, un critère qui est une fonctionnelle<br />
de <strong>la</strong> trajectoire de cette chaîne, le problème consiste <strong>à</strong> rechercher <strong>la</strong><br />
<strong>commande</strong> ne dépendant que des observations passées réalisant le minimum<br />
du critère. Pour illustrer ce type de problèmes prenons quelques exemples.<br />
1.1. GESTION D’UN STOCK D’EAU<br />
Etant donné le barrage décrit au chapitre précédent, on considère <strong>la</strong> politique<br />
de gestion suivante :<br />
{<br />
1 si X<br />
Z n =<br />
n > a ,<br />
0 si X n ≤ a ,<br />
où a est un paramètre ou une fonction du temps <strong>à</strong> optimiser. La matrice de<br />
transition de <strong>la</strong> chaînedeMarkovaalors<strong>la</strong>même structure que précédemment.<br />
Si l’on désigne par c Z n<br />
X l’énergie produite changée de signe, lorsque<br />
n<br />
le stock est dans l’état X n et que l’on a turbiné Z n .Lecritère <strong>à</strong> optimiser<br />
s’écrit :<br />
{ }<br />
∑ N−1<br />
min E c Z n<br />
X n|X 0 = x .<br />
a<br />
n=0<br />
Dans cet exemple :<br />
• l’état est <strong>la</strong> variable aléatoire X n ,<br />
• l’observation est égale <strong>à</strong> X n ,<br />
• <strong>la</strong> <strong>commande</strong> est le paramètre a.<br />
1.2. PROBLÈME DE MAINTENANCE<br />
On considère un matériel susceptible de tomber en panne : L’état de<br />
fonctionnement est noté M, se panne est noté M.<br />
Ce matériel est caractériséparsonâge x — temps passé depuis son dernier<br />
remp<strong>la</strong>cement. On supposera que tout matériel d’âge N est remp<strong>la</strong>cé. A<br />
chaque instant un matériel d’âge x a une probabilité λ x de tomber en panne<br />
croissante avec son âge. A chaque instant on a <strong>la</strong> possibilité de remp<strong>la</strong>cer<br />
ou de conserver ce matériel.<br />
45