Introduction à la commande stochastique v.0.9 - Jean-Pierre ...
Introduction à la commande stochastique v.0.9 - Jean-Pierre ...
Introduction à la commande stochastique v.0.9 - Jean-Pierre ...
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
6 TABLE DES MATIÈRES<br />
On parle des chaînes de Markov d’un point de vue ancien, c.a.d plus<br />
analytique que probabiliste. Les probabilités apparaissent surtout au niveau<br />
de <strong>la</strong> modélisation des motivations. Les raisonnements sont analytiques sur<br />
<strong>la</strong> loi de probabilitédéfinie. C’est <strong>la</strong> façon de faire de Pallu De La Barrière<br />
dans son livre d’automatique, ou de Gantmacher dans son livre sur les matrices.<br />
On favorise souvent les manipu<strong>la</strong>tions des matrices au détriment de<br />
l’espérance conditionnelle. La raison est c<strong>la</strong>ire : <strong>la</strong> manipu<strong>la</strong>tion des matrices<br />
est mieux connue que l’espérance conditionnelle — bien que cette<br />
dernière s’applique <strong>à</strong> des situations beaucoup plus générales. De plus, le<br />
point de vue probabiliste est beaucoup plus adapté <strong>à</strong><strong>la</strong>démonstration de<br />
théorèmes limites qu’aux méthodes numériques nécessaires aux calculs effectifs<br />
— dès que l’on sort des quelques cas trés particuliers faisables <strong>à</strong><strong>la</strong><br />
main. Enfin <strong>la</strong> manipu<strong>la</strong>tion matricielle est <strong>à</strong> <strong>la</strong> base de toute l’ingénierie<br />
actuelle. Nous manipulerons, donc, surtout, les matrices <strong>stochastique</strong>s.<br />
L’économie de temps faite par ces deux premiers choix permet d’aller<br />
plus loin dans <strong>la</strong> résolution numérique des problèmes. Privilégier cette<br />
résolution numérique est le troisième choix fait dans cet exposé. Il nous<br />
semble, en effet, sûrement <strong>à</strong> tort, que ces problèmes sont, en fait, re<strong>la</strong>tivement<br />
bien compris au fond. Par contre, il y a de grosses difficultés <strong>à</strong>les<br />
appliquer, dans le cas général, y compris en utilisant de gros ordinateurs, du<br />
fait de <strong>la</strong> complexité exponentielle du calcul avec <strong>la</strong> dimension du système.<br />
Il faut structurer, simplifier, agréger pour diminuer cette complexité. Nous<br />
avons indiqué quelques pistes dans cette direction : -méthodes de perturbations,<br />
-séparation des variables.<br />
Le quatrième choix privilégie l’algèbre <strong>à</strong> l’analyse. Depuis quelques<br />
années, des structures algébriques sous-jacentes aux problèmes d’optimisation<br />
sont apparues. Elles font apparaitre une dualité entre l’optimisation et<br />
les probabilités. Chaque fois que ce<strong>la</strong> a été possible, dans ce cadre introductif,<br />
cette dualitéaété explicitée.<br />
Enfin <strong>la</strong> <strong>commande</strong> des chaînes de Markov est plus développée dans ce<br />
texte que <strong>la</strong> partie LQG. Ce choix a été fait pour deux raisons. Les structures<br />
discrètes sont plus faciles <strong>à</strong> utiliser que les espaces gaussiens. La théorie<br />
des systèmes est peu enseignée en dehors de certaines écoles d’ingénieur,<br />
malgré son grand intérêt pratique et théorique. Nous avons voulu donner,<br />
dans ce cours, seulement une ouverture <strong>à</strong> ce domaine.<br />
Malgré son apparence spécialisée, cet exposé veut avoir une portée trés<br />
générale. Les chaînes de Markov sont <strong>la</strong> meilleure illustration que nous<br />
connaissons de <strong>la</strong> notion d’état.Lanécessitéderétroactions pour faire fonctionner<br />
un système s’est imposée dès l’antiquitéet<strong>la</strong>programmation dynamique<br />
est le seul moyen général de les optimiser. La version détermiste,<br />
temps continue, de l’équation de <strong>la</strong> programmation dynamique n’est autre<br />
que l’équation d’Hamilton-Jacobi qui est centrale en mécanique analytique,<br />
elle même centrale en physique. Les méthodes de perturbations ont acquis<br />
depuis longtemps leurs lettres de noblesse en physique. Quant aux méthodes