14.06.2014 Views

Introduction à la commande stochastique v.0.9 - Jean-Pierre ...

Introduction à la commande stochastique v.0.9 - Jean-Pierre ...

Introduction à la commande stochastique v.0.9 - Jean-Pierre ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

6 TABLE DES MATIÈRES<br />

On parle des chaînes de Markov d’un point de vue ancien, c.a.d plus<br />

analytique que probabiliste. Les probabilités apparaissent surtout au niveau<br />

de <strong>la</strong> modélisation des motivations. Les raisonnements sont analytiques sur<br />

<strong>la</strong> loi de probabilitédéfinie. C’est <strong>la</strong> façon de faire de Pallu De La Barrière<br />

dans son livre d’automatique, ou de Gantmacher dans son livre sur les matrices.<br />

On favorise souvent les manipu<strong>la</strong>tions des matrices au détriment de<br />

l’espérance conditionnelle. La raison est c<strong>la</strong>ire : <strong>la</strong> manipu<strong>la</strong>tion des matrices<br />

est mieux connue que l’espérance conditionnelle — bien que cette<br />

dernière s’applique <strong>à</strong> des situations beaucoup plus générales. De plus, le<br />

point de vue probabiliste est beaucoup plus adapté <strong>à</strong><strong>la</strong>démonstration de<br />

théorèmes limites qu’aux méthodes numériques nécessaires aux calculs effectifs<br />

— dès que l’on sort des quelques cas trés particuliers faisables <strong>à</strong><strong>la</strong><br />

main. Enfin <strong>la</strong> manipu<strong>la</strong>tion matricielle est <strong>à</strong> <strong>la</strong> base de toute l’ingénierie<br />

actuelle. Nous manipulerons, donc, surtout, les matrices <strong>stochastique</strong>s.<br />

L’économie de temps faite par ces deux premiers choix permet d’aller<br />

plus loin dans <strong>la</strong> résolution numérique des problèmes. Privilégier cette<br />

résolution numérique est le troisième choix fait dans cet exposé. Il nous<br />

semble, en effet, sûrement <strong>à</strong> tort, que ces problèmes sont, en fait, re<strong>la</strong>tivement<br />

bien compris au fond. Par contre, il y a de grosses difficultés <strong>à</strong>les<br />

appliquer, dans le cas général, y compris en utilisant de gros ordinateurs, du<br />

fait de <strong>la</strong> complexité exponentielle du calcul avec <strong>la</strong> dimension du système.<br />

Il faut structurer, simplifier, agréger pour diminuer cette complexité. Nous<br />

avons indiqué quelques pistes dans cette direction : -méthodes de perturbations,<br />

-séparation des variables.<br />

Le quatrième choix privilégie l’algèbre <strong>à</strong> l’analyse. Depuis quelques<br />

années, des structures algébriques sous-jacentes aux problèmes d’optimisation<br />

sont apparues. Elles font apparaitre une dualité entre l’optimisation et<br />

les probabilités. Chaque fois que ce<strong>la</strong> a été possible, dans ce cadre introductif,<br />

cette dualitéaété explicitée.<br />

Enfin <strong>la</strong> <strong>commande</strong> des chaînes de Markov est plus développée dans ce<br />

texte que <strong>la</strong> partie LQG. Ce choix a été fait pour deux raisons. Les structures<br />

discrètes sont plus faciles <strong>à</strong> utiliser que les espaces gaussiens. La théorie<br />

des systèmes est peu enseignée en dehors de certaines écoles d’ingénieur,<br />

malgré son grand intérêt pratique et théorique. Nous avons voulu donner,<br />

dans ce cours, seulement une ouverture <strong>à</strong> ce domaine.<br />

Malgré son apparence spécialisée, cet exposé veut avoir une portée trés<br />

générale. Les chaînes de Markov sont <strong>la</strong> meilleure illustration que nous<br />

connaissons de <strong>la</strong> notion d’état.Lanécessitéderétroactions pour faire fonctionner<br />

un système s’est imposée dès l’antiquitéet<strong>la</strong>programmation dynamique<br />

est le seul moyen général de les optimiser. La version détermiste,<br />

temps continue, de l’équation de <strong>la</strong> programmation dynamique n’est autre<br />

que l’équation d’Hamilton-Jacobi qui est centrale en mécanique analytique,<br />

elle même centrale en physique. Les méthodes de perturbations ont acquis<br />

depuis longtemps leurs lettres de noblesse en physique. Quant aux méthodes

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!