Introduction à la commande stochastique v.0.9 - Jean-Pierre ...
Introduction à la commande stochastique v.0.9 - Jean-Pierre ...
Introduction à la commande stochastique v.0.9 - Jean-Pierre ...
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
4. GESTION DE RÉSERVOIR 129<br />
2. Considérons <strong>la</strong> matrice D ayant pour coefficient D xx ′ = 0six =<br />
y − 1, y, y + 1 tout x ′ et q ailleurs. A partir de C et de D formons<br />
<strong>la</strong> matrice C ′ dont les coefficients sont obtenus en faisant <strong>la</strong> somme<br />
terme <strong>à</strong>termedeséléments de C et de D. On remarque que <strong>la</strong> matrice<br />
C ′ est tridiagonale au sens de l’algèbre min-plus. L’équation de <strong>la</strong><br />
programmation dynamique actualisée s’écrit alors simplement<br />
v × (1 + α) = C ′ ⊗ (Mv) .<br />
L’opérateur × signifie ici <strong>la</strong> multiplication habituelle au sens de<br />
l’algèbre ordinaire.<br />
On peut écrire cette équation de façon c<strong>la</strong>ssique au prix de beaucoup<br />
plus de lourdeur :<br />
(1 + α)v x = min{a + µv x−2 + (1 − µ − ν)v x−1 + νv x , (3.1)<br />
µv x−1 + (1 − µ − ν)v x + νv x+1 , (3.2)<br />
b + µv x + (1 − µ − ν)v x+1 + νv x2 }+c x , (3.3)<br />
pour tout x, 0≤ x ≤ N. où c x = 0six = y − 1, y, y + 1etq<br />
ailleurs.<br />
On peut résoudre cette équation par l’algorithme de Howard.<br />
4. GESTION DE RÉSERVOIR<br />
On considère <strong>la</strong> gestion d’un barrage destiné <strong>à</strong> produire de l’électricité.<br />
On étudie d’abord l’évolution de l’état pour une <strong>commande</strong> ne dépendant<br />
pas de l’état du barrage. Dans une deuxième partie on optimise <strong>la</strong> politique<br />
de gestion du réservoir de façon <strong>à</strong> maximiser l’énergie produite. On se p<strong>la</strong>ce<br />
dans une situation simple où des calculs explicites peuvent être effectués.<br />
On modélise l’évolution du stock d’eau dans le barrage par une chaîne<br />
de Markov. Chaque état représente un niveau d’eau. On a E niveaux:<br />
{0, 1, ··· , E − 1}. La probabilité depasserdel’état x <strong>à</strong>l’etatx + 1 pour<br />
x = 0, 1, ··· , E − 2 est supposée être indépendante de x et égale <strong>à</strong> ρ. Elle<br />
correspond <strong>à</strong> <strong>la</strong> probabilité d’un apport d’eau. Lorsque le stock est plein<br />
(x = E − 1) un tel apport conduit <strong>à</strong>undébordement et l’état reste <strong>à</strong> E − 1.<br />
La probabilité depasserdel’état x <strong>à</strong> x − 1vautu avec O ≤ u ≤ 1 − ρ<br />
et sera considérée comme une <strong>commande</strong> <strong>à</strong> optimiser dans <strong>la</strong> deuxième<br />
partie. Ce type de transitions correspond aux situations de turbinage du barrage.<br />
Lorsque le barrage est vide on ne peut plus turbiner (u=0). La quantité<br />
d’énergie produite <strong>à</strong> chaque période de temps vaut xu si le niveau d’eau<br />
est x et le turbinage u. On veut maximiser l’énergie produite sachant que<br />
lorsque le stock est plein on risque de déborder et lorsque ce stock est vide<br />
on perd de l’énergie potentielle.<br />
4.1. ENONCÉ<br />
4.1.1. ETUDE DE LA CHAÎNE DE MARKOV POUR UNE STRATÉGIE<br />
CONSTANTE. On suppose ici que <strong>la</strong> stratégie de gestion est constante en<br />
temps et indépendante du niveau d’eau sx n = u, ∀x, n où n désigne le temps.