Introduction à la commande stochastique v.0.9 - Jean-Pierre ...
Introduction à la commande stochastique v.0.9 - Jean-Pierre ...
Introduction à la commande stochastique v.0.9 - Jean-Pierre ...
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
142 8. PROBLÈMES<br />
5. Supposons que p = p 1 montrer que <strong>la</strong> probabilité conditionnelle<br />
précédente tend vers 1 lorsque le nombre d’observations tend vers<br />
l’infini.<br />
7.1.2. MAINTENANCE. On veut assurer <strong>la</strong> maintenance d’un groupe<br />
électrogène d’une centrale nucléaire servant <strong>à</strong> assurer l’existence d’une<br />
source d’électricité en cas de panne de <strong>la</strong> centrale. En régime normal le<br />
groupe ne fonctionne pas donc on ne sait s’il est en état de fonctionner ou<br />
non. Pour le savoir on doit le tester. A chaque période de temps on doit donc<br />
décider de le tester ou pas. On considère qu’il n’a que deux états possibles<br />
soit il fonctionne soit il ne fonctionne pas. Si on le teste on observe l’état<br />
mais ce<strong>la</strong> coûte le prix du test (k 1 )pluslecoût de remp<strong>la</strong>cement (k 2 )s’il<br />
ne fonctionne pas (remp<strong>la</strong>cement que l’on fait systématiquement en cas de<br />
panne). A <strong>la</strong> suite du remp<strong>la</strong>cement le système fonctionne nécessairement.<br />
Si on ne le remp<strong>la</strong>ce pas le système <strong>à</strong> une probabilité p (0 < p < 1) d’ˆtre<br />
en panne <strong>à</strong> <strong>la</strong> fin du test. On prend donc un risque que l’on voudrait éviter.<br />
Pour ce<strong>la</strong> on affecte un coût k 0 <strong>à</strong>l’état de panne. L’état peut donc prendre 2<br />
valeurs: 1) fonctionne, 2) fonctionne pas. L’observation peut donc prendre<br />
trois valeurs: 1) on n’a pas testé et donc rien observé2) on a testé et observé<br />
que le système ne fonctionne pas, 3) on a testé et observé que le système<br />
fonctionne. Au début de <strong>la</strong> gestion le système est en état de fonctionnement.<br />
1. Donnez les 6 matrices de transitions (de sauter d’un état <strong>à</strong>unautre)<br />
indéxées par l’observation faite et <strong>la</strong> <strong>commande</strong> utilisée.<br />
2. La probabilité conditionnelle q n d’être dans un état sachant le passé<br />
des observations et des <strong>commande</strong>s(où n indique <strong>la</strong> période de<br />
temps) est une chaîne de Markov dont l’état vit sur l’espace des probabilités<br />
chargeant les deux états possibles (q ∈ R 2 , q 1 + q 2 = 1,<br />
q 1 , q 2 ≥ 0). A chaque étape elle saute dans cet ensemble selon <strong>la</strong> valeur<br />
de l’observation. Caractérisez le point d’arrivée en fonction du<br />
point de départ ainsi que <strong>la</strong> probabilité pour que ce saut ait lieu.<br />
3. Exprimez le critère <strong>à</strong> optimiser en terme de cette espérance conditionnelle<br />
lorsque l’on gère le système sur N périodes.<br />
4. Donnez l’équation de <strong>la</strong> programmation dynamique permettant de<br />
déterminer <strong>la</strong> décision optimale de tester ou non le matériel en fonctiondupassé<br />
des observations et des <strong>commande</strong>s (ou ce qui revient<br />
au même en fonction de <strong>la</strong> valeur de l’espérance conditionnelle de<br />
l’état connaissant le passé des observations et des <strong>commande</strong>s).<br />
5. Donnez les grandes lignes d’une méthode effective de calcul de cette<br />
<strong>commande</strong> optimale.<br />
7.2. CORRIGÉ<br />
7.2.1. FILTRAGE.<br />
1. Le problème de filtrage consiste <strong>à</strong> considérer <strong>la</strong> chaîne observé <strong>à</strong>4<br />
états F = {(1, p 1 ), (2, p 1 ), (1, p 2 ), (2, p 2 )} les observations possibles<br />
étant au nombre de 2. L’observation vaut 1 si <strong>la</strong> chaîne est