Introduction à la commande stochastique v.0.9 - Jean-Pierre ...
Introduction à la commande stochastique v.0.9 - Jean-Pierre ...
Introduction à la commande stochastique v.0.9 - Jean-Pierre ...
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
5.2.4. BIAIS INCONNU.<br />
6. PROCESSUS DE CALCUL 137<br />
1. L’estimateur du maximum de vraisemb<strong>la</strong>nce de p est obtenu en<br />
maximisant par rapport p <strong>la</strong> vraisemb<strong>la</strong>nce C y n py (1 − p) n−y avec<br />
y le nombre de fois où face a été obtenu dans un tirage de longueur<br />
n dans lequel 0 ou F n’ont pas été atteint. On obtient ˆp = y/n.<br />
2. L’équation de <strong>la</strong> programmation dynamique du problème en horizon<br />
fini et en observation incomplète (en supposant que l’estimateur du<br />
maximum de vraisemb<strong>la</strong>nce est égal <strong>à</strong>l’espérance conditionnelle de<br />
p connaissant le passé des observations) est alors :<br />
v n [x, p] = max{x, pv n+1 [x + 1,(np + 1)/(n + 1)]<br />
+ (1 − p)v n+1 [x − 1, np/(n + 1)]},<br />
∀n < N, ∀x ∈ [o, F], ∀ p ∈ [0, 1] ,<br />
v n [0, p] = 0, v n [F, p] = F, ∀ p, ∀n < N,<br />
v N [x, p] = x, ∀x, p.<br />
3. Cette équation n’admet plus x pour solution et donc <strong>la</strong> politique optimale<br />
d’arrêt n’est plus triviale. Il n’est plus indifférent de sarrêter<br />
ou de continuer.<br />
6. PROCESSUS DE CALCUL<br />
On modélise un processus de calcul. On établit le lien avec un problèmes<br />
de contrôle d’une chaîne de Markov. On évalue <strong>la</strong> re<strong>la</strong>tion entre le nombre<br />
entrées et le nombre de sorties par des calculs dans l’algèbre min-plus.<br />
6.1. LE PROCESSUS DE CALCUL<br />
On considère un processeur constitué d’un multiplieur et d’un additionneur<br />
séparépardesmémoires appelées A. Ce processeur est chargédefaire<br />
le calcul ae n + b pour une suite infinie d’entrées e n . On suppose que les e n<br />
peuvent s’accumuler dans des mémoires (appelées B) au fur et <strong>à</strong>mesurede<br />
leurs arrivées avant leurs traitements. Le processus de calcul fonctionne de<br />
<strong>la</strong> façon suivante.<br />
1. Le multiplieur dès qu’il a terminé <strong>la</strong> multiplication précédente regarde<br />
s’il existe une donnée e n <strong>à</strong> traiter et s’il a l’ autorisation de<br />
commencer. Si c’est <strong>la</strong> cas il fait <strong>la</strong> multiplication qui dure 2 tops<br />
d’horloge et il met le résultat dans une des mémoires A. Ce faisant il<br />
a consommé une autorisation de multiplier.<br />
2. L’additionneur dès qu’il a terminé l’addition précédente regarde s’il<br />
y a une donnée dans A. Si c’est le cas il fait l’addition qui dure 1 top<br />
d’horloge, affiche le résultat et envoie une nouvelle autorisation au<br />
multiplieur dés que l’addition est terminée.<br />
3. A l’instant initial le multiplieur dispose de 2 autorisations.