Introduction à la commande stochastique v.0.9 - Jean-Pierre ...

More documents

Recommendations

Info

128 8. PROBLÈMES µp 1 = νp 0 νp N−1 = µp N . La solution de cette récurrence est : p x = (ν/µ) x (1 − ν/µ)/(1 − (ν/µ) N+1 ). 3.2.2. TRANSPORTS. 1. La matrice des coûts transition (C) delachaîne de Bellman X k est donnée par : ⎛ ⎞ 0 b +∞ · +∞ a 0 b · +∞ C = ⎜ · · · · · ⎟ ⎝+∞ · a 0 b ⎠ +∞ · +∞ a 0 2. Si l’on v k y les coûts optimaux pour que X k = y on a v k+1 = v k ⊗ C, v 0 = (+∞, ··· , +∞, 0, +∞, ··· , +∞) où le 0 est en position x + 1. 3. L’expression, en fonction de C, ducoût minimal de transport en un nombre arbitraire d’étapes, faisant passer le nombre de voitures A de x à y est donnéparCxy ∗ avec C ∗ = E ⊕ C ⊕ C 2 ⊕···C N . où E est la matrice diagonale ayant des 0 sur la diagonale et des +∞ ailleurs. Le calcul de C ∗ se fait facilement on obtient : ⎛ ⎞ 0 b b 2 · b N a 0 b · b N−1 C ∗ = ⎜ · · · · · ⎟ . ⎝a N−1 · a 0 b ⎠ a N · a 2 a 0 Supposons que x > y le coefficient C ∗ xy = ax−y dans l’algèbre minplus soit a(x−y) dans l’algèbre ordinaire qui correspond bien au coût de transport des x − y voitures en trop de A. La politique optimale consistant dans ce cas, bien sûr, à transporter un àunx − y voitures de A vers B puis de ne plus rien transporter. Tout autre politique nécessitera plus de transports. Tout transport ayant un coût positif. Une autre politique ne peut pas être optimale. 3.2.3. DÉPLACEMENT ALÉATOIRES ET TRANSPORTS. 1. On peut utiliser la politique consistant à transporter une voiture de AversBdès que l’état est supérieur à y, ne rien transporter si l’état vaut y, transporter de B vers A si l’état est inférieur ày.Lachaîne de Markov admet alors une seule classe finale dont les états sont {y − 1, y, y + 1}. Son unique mesure invariante a pour support cette classe finale.
4. GESTION DE RÉSERVOIR 129 2. Considérons la matrice D ayant pour coefficient D xx ′ = 0six = y − 1, y, y + 1 tout x ′ et q ailleurs. A partir de C et de D formons la matrice C ′ dont les coefficients sont obtenus en faisant la somme terme àtermedeséléments de C et de D. On remarque que la matrice C ′ est tridiagonale au sens de l’algèbre min-plus. L’équation de la programmation dynamique actualisée s’écrit alors simplement v × (1 + α) = C ′ ⊗ (Mv) . L’opérateur × signifie ici la multiplication habituelle au sens de l’algèbre ordinaire. On peut écrire cette équation de façon classique au prix de beaucoup plus de lourdeur : (1 + α)v x = min{a + µv x−2 + (1 − µ − ν)v x−1 + νv x , (3.1) µv x−1 + (1 − µ − ν)v x + νv x+1 , (3.2) b + µv x + (1 − µ − ν)v x+1 + νv x2 }+c x , (3.3) pour tout x, 0≤ x ≤ N. où c x = 0six = y − 1, y, y + 1etq ailleurs. On peut résoudre cette équation par l’algorithme de Howard. 4. GESTION DE RÉSERVOIR On considère la gestion d’un barrage destiné à produire de l’électricité. On étudie d’abord l’évolution de l’état pour une commande ne dépendant pas de l’état du barrage. Dans une deuxième partie on optimise la politique de gestion du réservoir de façon à maximiser l’énergie produite. On se place dans une situation simple où des calculs explicites peuvent être effectués. On modélise l’évolution du stock d’eau dans le barrage par une chaîne de Markov. Chaque état représente un niveau d’eau. On a E niveaux: {0, 1, ··· , E − 1}. La probabilité depasserdel’état x àl’etatx + 1 pour x = 0, 1, ··· , E − 2 est supposée être indépendante de x et égale à ρ. Elle correspond à la probabilité d’un apport d’eau. Lorsque le stock est plein (x = E − 1) un tel apport conduit àundébordement et l’état reste à E − 1. La probabilité depasserdel’état x à x − 1vautu avec O ≤ u ≤ 1 − ρ et sera considérée comme une commande à optimiser dans la deuxième partie. Ce type de transitions correspond aux situations de turbinage du barrage. Lorsque le barrage est vide on ne peut plus turbiner (u=0). La quantité d’énergie produite à chaque période de temps vaut xu si le niveau d’eau est x et le turbinage u. On veut maximiser l’énergie produite sachant que lorsque le stock est plein on risque de déborder et lorsque ce stock est vide on perd de l’énergie potentielle. 4.1. ENONCÉ 4.1.1. ETUDE DE LA CHAÎNE DE MARKOV POUR UNE STRATÉGIE CONSTANTE. On suppose ici que la stratégie de gestion est constante en temps et indépendante du niveau d’eau sx n = u, ∀x, n où n désigne le temps.
Page 1 and 2:
Introduction à la Commande Stochas
Page 3 and 4:
3 Table des matières Chapitre 1. C
Page 5 and 6:
TABLE DES MATIÈRES 5 Ce cours est
Page 7 and 8:
TABLE DES MATIÈRES 7 de séparatio
Page 9 and 10:
9 CHAPITRE 1 CHAÎNES DE MARKOV 1.
Page 11 and 12:
2. EXEMPLES 11 définissent une pol
Page 13 and 14:
3. EQUATION DE KOLMOGOROV 13 3.2. E
Page 15 and 16:
Soit v solution de (3.4) on a alors
Page 17 and 18:
4. ETUDE ANALYTIQUE DES MATRICES 17
Page 19 and 20:
4. ETUDE ANALYTIQUE DES MATRICES 19
Page 21 and 22:
5. PROBLÈMES ERGODIQUES 21 ce qui
Page 23 and 24:
6. PROPRIÉTÉS COMBINATOIRES 23 un
Page 25 and 26:
7. BASE DE N (A ′ ) 25 mais −p
Page 27 and 28:
8. BASE DE N (A) 27 puisque le chem
Page 29 and 30:
29 CHAPITRE 2 CHAÎNES DE BELLMAN O
Page 31 and 32:
2. MATRICES DANS L’ALGÈBRE MAX-P
Page 33 and 34:
Page 35 and 36:
Page 37 and 38:
Page 39 and 40:
3. DÉCISION OPTIMALE 39 Nous prés
Page 41 and 42:
3. DÉCISION OPTIMALE 41 3.2. TRANS
Page 43 and 44:
4. CHAÎNES DE BELLMAN 43 TABLEAU 1
Page 45 and 46:
CHAPITRE 3 COMMANDE OPTIMALE STOCHA
Page 47 and 48:
2. FORMULATION PRÉCISE DU PROBLÈM
Page 49 and 50:
3. PROGRAMMATION DYNAMIQUE EN HORIZ
Page 51 and 52:
4. PROGRAMMATION DYNAMIQUE COÛT AC
Page 53 and 54:
5. PROGRAMMATION DYNAMIQUE ERGODIQU
Page 55 and 56:
6. COMMANDE EN INFORMATION INCOMPL
Page 57 and 58:
7. RÉALISATION ET IDENTIFICATION 5
Page 59 and 60:
7. RÉALISATION ET IDENTIFICATION 5
Page 61 and 62:
CHAPITRE 4 PERTURBATION ET AGRÉGAT
Page 63 and 64:
2. CHAÎNES DE MARKOV PERTURBÉES 6
Page 65 and 66:
2. CHAÎNES DE MARKOV PERTURBÉES 6
Page 67 and 68:
3. COMMANDE DES CHAÎNES DE MARKOV
Page 69 and 70:
Page 71 and 72:
Page 73 and 74:
73 CHAPITRE 5 DÉCOMPOSITION La mé
Page 75 and 76:
2. FACTORISATION DE LA MESURE INVAR
Page 77 and 78: 2. FACTORISATION DE LA MESURE INVAR
Page 79 and 80: 2. FACTORISATION DE LA MESURE INVAR
Page 81 and 82: 3. FEEDBACKS LOCAUX OPTIMAUX 81 se
Page 83 and 84: 3. FEEDBACKS LOCAUX OPTIMAUX 83 3.2
Page 85 and 86: 85 CHAPITRE 6 LE RÉGULATEUR LQG 1.
Page 87 and 88: 1. LE FILTRE DE KALMAN 87 2. Si on
Page 89 and 90: 1. LE FILTRE DE KALMAN 89 3. LES VA
Page 91 and 92: 2. LE PROBLÈME LQG 91 4. Y k (u),
Page 93 and 94: 3. LE RÉGULATEUR LQG EN OBSERVATIO
Page 95 and 96: 4. LE PROBLÈME LQG EN OBSERVATION
Page 97 and 98: 6. RAPPEL SUR LES VARIABLES ALÉATO
Page 99 and 100: CHAPITRE 7 PROPRIÉTÉS DES RÉGULA
Page 101 and 102: 2. PLACEMENT DE PÔLES PAR LE RÉGU
Page 103 and 104: système 2 J (U) = 1/(2π) 3. APPRO
Page 105 and 106: 4. SYSTÈMES POSITIFS ET ROBUSTESSE
Page 111 and 112: 5. RAPPEL SUR LA STABILITÉ 111 DÉ
Page 113 and 114: 5. RAPPEL SUR LA STABILITÉ 113 5.3
Page 115 and 116: 5. RAPPEL SUR LA STABILITÉ 115 d
Page 117 and 118: CHAPITRE 8 PROBLÈMES 1. UNE GESTIO
Page 119 and 120: 1. UNE GESTION DE STOCK 119 3. L’
Page 121 and 122: 2. MAINTENANCE D’UNE AUTOMOBILE 1
Page 127: 3. TRANSPORT 127 3. Donnez l’expr
Page 131 and 132: 4. GESTION DE RÉSERVOIR 131 4.2. C
Page 133 and 134: 5. JEUX DE PILE OU FACE 133 (la pre
Page 135 and 136: 5. JEUX DE PILE OU FACE 135 5.2. CO
Page 137 and 138: 5.2.4. BIAIS INCONNU. 6. PROCESSUS
Page 139 and 140: 6. PROCESSUS DE CALCUL 139 8. En d
Page 141 and 142: 7. FILTRAGE ET COMMANDE EN OBSERVAT
Page 147 and 148: 8. STRATÉGIES 147 3. Calculez expl
Page 149 and 150: 9. CLOWN ÉQUILIBRISTE 149 avec ν
Page 151 and 152: 9. CLOWN ÉQUILIBRISTE 151 On rappe
Page 153 and 154: 9. CLOWN ÉQUILIBRISTE 153 3. Grâc
Page 155 and 156: 9. CLOWN ÉQUILIBRISTE 155 2. Montr
Page 157 and 158: LES ÉQUATIONS DU MOUVEMENT. 9. CLO
Page 159 and 160: 9. CLOWN ÉQUILIBRISTE 159 1. Pour
Page 161 and 162: 9. CLOWN ÉQUILIBRISTE 161 avec ⎛
Page 163 and 164: 9. CLOWN ÉQUILIBRISTE 163 2. La co
Page 165 and 166: 165 Notations N nombres entiers Z n
Page 167 and 168: NOTATIONS 167 P V,v,W K matrice sym
Page 169 and 170: 169 Bibliographie [1] D. DACUNHA-CA
Page 171 and 172: BIBLIOGRAPHIE 171 [48] J.-P. QUADRA
Page 173 and 174: 173 Index équation affine, 31 éta
Page 175: INDEX 175 coûts, 41 entrée borné
show all

Introduction à la commande stochastique v.0.9 - Jean-Pierre ...

Create successful ePaper yourself

Delete template?

Save as template?