Introduction à la commande stochastique v.0.9 - Jean-Pierre ...

More documents

Recommendations

Info

144 8. PROBLÈMES 4. Si p = p 1 d’aprés la loi des grands nombres on a lim k/N = p 1 N presque sûrement. On peut réécrire α N sous la forme 1 [ ] N . 1 + (p 2 ) k/N (1−p 2 ) (N−k)/N (p 1 ) k/N (1−p 1 ) (N−k)/N Mais ( p 2 ) k/N (1 − p 2 ) (N−k)/N ( p 1 ) k/N (1 − p 1 ) (N−k)/N et presque sûrement aussi voisin de ( p 2 ) p1 (1 − p 2 ) p1 ( p 1 ) p1 (1 − p 1 ) 1−p1 qu’on le veut. La fonction p ↦→ p p′ (1 − p) 1−p′ atteint son maximum au même point que la fonction p ↦→ p ′ log( p) + (1 − p ′ ) log(1 − p) qui est concave. Le maximum est atteint pour p = p ′ et donc [ ( p 2 ) k/N (1 − p 2 ) (N−k)/N tend vers 0 presque sûrement. ( p 1 ) k/N (1 − p 1 ) (N−k)/N ] N 7.2.2. MAINTENANCE. 1. L’espace d’états est E = {1, 2} où x = 1 correspond àl’état de fonctionnement et x = 2àl’état de panne. L’espace des commandes est F ={1, 2} où la commande u = 1 correspond àladécision de ne pas tester et u = 2àladécision de tester. L’espace des observations est G ={0, 1, 2} où y = 0 correspond à l’absence d’observation, y = 1 correspond à l’observation d’un état de panne, y = 2 correspond à l’observation de l’état de marche. Si on note par M uy les 6 matrices de transition on a ( ( ( ) 1 − p p 0 0 0 0 M 10 = 0 1 ( 0 0 M 20 = 0 0 On vérifie que ) , M 11 = ) , M 21 = ∑ x ′ ,y ( 0 0 1 0 ) , M 12 = 0 0 ) , M 22 = M uy xx ′ = 1, ∀x, u . 0 0 ( 1 − p p 0 0 ) , .
7. FILTRAGE ET COMMANDE EN OBSERVATION INCOMPLÈTE 145 2. Si on appelle q la probabilité conditionnelle d’un état connaissant le passé des commandes et des observations jusqu’à l’étape n, laprobabilité conditionnelle (q ′ (u))àl’étape n + 1dépend de la valeur de la commande u prise à l’instant n et prend les valeurs • q ′ (1) = qM 10 avec la probabilité 1 (probabilité pour que y = 0) ; • q ′ (2) = ( 1 0 ) avec la probabilité q2 n (probabilité d’observer une panne compte tenu de l’observation du passé, dans le cas oùonatestélesystème); • q ′ (2) = qM 22 /q 1 avec la probabilité q 1 (probabilité d’observer le système en état de fonctionnement compte tenu des observations passées, dans le cas oùonatestélesystème). 3. Le critère à optimiser min U E [ n ∑ 0 ] c U n X n où U n désigne la suite des décisions prises et X n la suite des états de la chaîne de Markov avec ( ) 0 k1 c = , k 0 k 0 + k 1 + k 2 oùlapremière colonne correspond à la commande 1 et la deuxième colonne à la commande 2. Ce critère se réécrit en utilisant l’ espérance conditionnelle q n calculée à la question précédente [ ] n min E ∑ ∑ q n x U cU n x . 0 x 4. q n étant un processus de Markov l’équation de la programmation dynamique en horizon fini s’écrit v n (q) = min{v n+1 (qM 10 ) + q 2 k 0 , où v n+1 (( 1 0 )) q 2 + v n+1 (qM 22 /q 1 )q 1 + q.c 2 } , v n (q) = min U [ N E ∑ ∑ k x q k x cU k x , | q n = q 5. Pour résoudre ce problème il va falloir se ramener au contrôle d’une chaîne de Markov ayant un nombre fini d’états et donc discretiser l’ensemble q ∈ R 2 , q 1 + q 2 = 1, q 1 , q 2 ≥ 0enunensemblefinià p + 1 valeurs en {[0, 1], [h,(p − 1)h], ··· , [1, 0]} avec h = 1/p et approximer les sauts faits par l’espérance conditionnelle de telle sorte qu’elle reste sur le maillage. On est ensuite ramené à un problème classique de chaînes de Markov àétats finis dans le cas de l’observation complète (l’espérance conditionnelle est en effet observé). ] .
Page 1 and 2:
Introduction à la Commande Stochas
Page 3 and 4:
3 Table des matières Chapitre 1. C
Page 5 and 6:
TABLE DES MATIÈRES 5 Ce cours est
Page 7 and 8:
TABLE DES MATIÈRES 7 de séparatio
Page 9 and 10:
9 CHAPITRE 1 CHAÎNES DE MARKOV 1.
Page 11 and 12:
2. EXEMPLES 11 définissent une pol
Page 13 and 14:
3. EQUATION DE KOLMOGOROV 13 3.2. E
Page 15 and 16:
Soit v solution de (3.4) on a alors
Page 17 and 18:
4. ETUDE ANALYTIQUE DES MATRICES 17
Page 19 and 20:
4. ETUDE ANALYTIQUE DES MATRICES 19
Page 21 and 22:
5. PROBLÈMES ERGODIQUES 21 ce qui
Page 23 and 24:
6. PROPRIÉTÉS COMBINATOIRES 23 un
Page 25 and 26:
7. BASE DE N (A ′ ) 25 mais −p
Page 27 and 28:
8. BASE DE N (A) 27 puisque le chem
Page 29 and 30:
29 CHAPITRE 2 CHAÎNES DE BELLMAN O
Page 31 and 32:
2. MATRICES DANS L’ALGÈBRE MAX-P
Page 33 and 34:
Page 35 and 36:
Page 37 and 38:
Page 39 and 40:
3. DÉCISION OPTIMALE 39 Nous prés
Page 41 and 42:
3. DÉCISION OPTIMALE 41 3.2. TRANS
Page 43 and 44:
4. CHAÎNES DE BELLMAN 43 TABLEAU 1
Page 45 and 46:
CHAPITRE 3 COMMANDE OPTIMALE STOCHA
Page 47 and 48:
2. FORMULATION PRÉCISE DU PROBLÈM
Page 49 and 50:
3. PROGRAMMATION DYNAMIQUE EN HORIZ
Page 51 and 52:
4. PROGRAMMATION DYNAMIQUE COÛT AC
Page 53 and 54:
5. PROGRAMMATION DYNAMIQUE ERGODIQU
Page 55 and 56:
6. COMMANDE EN INFORMATION INCOMPL
Page 57 and 58:
7. RÉALISATION ET IDENTIFICATION 5
Page 59 and 60:
7. RÉALISATION ET IDENTIFICATION 5
Page 61 and 62:
CHAPITRE 4 PERTURBATION ET AGRÉGAT
Page 63 and 64:
2. CHAÎNES DE MARKOV PERTURBÉES 6
Page 65 and 66:
2. CHAÎNES DE MARKOV PERTURBÉES 6
Page 67 and 68:
3. COMMANDE DES CHAÎNES DE MARKOV
Page 69 and 70:
Page 71 and 72:
Page 73 and 74:
73 CHAPITRE 5 DÉCOMPOSITION La mé
Page 75 and 76:
2. FACTORISATION DE LA MESURE INVAR
Page 77 and 78:
Page 79 and 80:
Page 81 and 82:
3. FEEDBACKS LOCAUX OPTIMAUX 81 se
Page 83 and 84:
3. FEEDBACKS LOCAUX OPTIMAUX 83 3.2
Page 85 and 86:
85 CHAPITRE 6 LE RÉGULATEUR LQG 1.
Page 87 and 88:
1. LE FILTRE DE KALMAN 87 2. Si on
Page 89 and 90:
1. LE FILTRE DE KALMAN 89 3. LES VA
Page 91 and 92:
2. LE PROBLÈME LQG 91 4. Y k (u),
Page 93 and 94: 3. LE RÉGULATEUR LQG EN OBSERVATIO
Page 95 and 96: 4. LE PROBLÈME LQG EN OBSERVATION
Page 97 and 98: 6. RAPPEL SUR LES VARIABLES ALÉATO
Page 99 and 100: CHAPITRE 7 PROPRIÉTÉS DES RÉGULA
Page 101 and 102: 2. PLACEMENT DE PÔLES PAR LE RÉGU
Page 103 and 104: système 2 J (U) = 1/(2π) 3. APPRO
Page 105 and 106: 4. SYSTÈMES POSITIFS ET ROBUSTESSE
Page 111 and 112: 5. RAPPEL SUR LA STABILITÉ 111 DÉ
Page 113 and 114: 5. RAPPEL SUR LA STABILITÉ 113 5.3
Page 115 and 116: 5. RAPPEL SUR LA STABILITÉ 115 d
Page 117 and 118: CHAPITRE 8 PROBLÈMES 1. UNE GESTIO
Page 119 and 120: 1. UNE GESTION DE STOCK 119 3. L’
Page 121 and 122: 2. MAINTENANCE D’UNE AUTOMOBILE 1
Page 127 and 128: 3. TRANSPORT 127 3. Donnez l’expr
Page 129 and 130: 4. GESTION DE RÉSERVOIR 129 2. Con
Page 131 and 132: 4. GESTION DE RÉSERVOIR 131 4.2. C
Page 133 and 134: 5. JEUX DE PILE OU FACE 133 (la pre
Page 135 and 136: 5. JEUX DE PILE OU FACE 135 5.2. CO
Page 137 and 138: 5.2.4. BIAIS INCONNU. 6. PROCESSUS
Page 139 and 140: 6. PROCESSUS DE CALCUL 139 8. En d
Page 141 and 142: 7. FILTRAGE ET COMMANDE EN OBSERVAT
Page 143: 7. FILTRAGE ET COMMANDE EN OBSERVAT
Page 147 and 148: 8. STRATÉGIES 147 3. Calculez expl
Page 149 and 150: 9. CLOWN ÉQUILIBRISTE 149 avec ν
Page 151 and 152: 9. CLOWN ÉQUILIBRISTE 151 On rappe
Page 153 and 154: 9. CLOWN ÉQUILIBRISTE 153 3. Grâc
Page 155 and 156: 9. CLOWN ÉQUILIBRISTE 155 2. Montr
Page 157 and 158: LES ÉQUATIONS DU MOUVEMENT. 9. CLO
Page 159 and 160: 9. CLOWN ÉQUILIBRISTE 159 1. Pour
Page 161 and 162: 9. CLOWN ÉQUILIBRISTE 161 avec ⎛
Page 163 and 164: 9. CLOWN ÉQUILIBRISTE 163 2. La co
Page 165 and 166: 165 Notations N nombres entiers Z n
Page 167 and 168: NOTATIONS 167 P V,v,W K matrice sym
Page 169 and 170: 169 Bibliographie [1] D. DACUNHA-CA
Page 171 and 172: BIBLIOGRAPHIE 171 [48] J.-P. QUADRA
Page 173 and 174: 173 Index équation affine, 31 éta
Page 175: INDEX 175 coûts, 41 entrée borné
show all

Introduction à la commande stochastique v.0.9 - Jean-Pierre ...

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?