23.06.2013 Views

Thèse Sciences Cognitives - Olivier Nerot

Thèse Sciences Cognitives - Olivier Nerot

Thèse Sciences Cognitives - Olivier Nerot

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Mémorisation par forçage des dynamiques chaotiques dans les modèles connexionnistes récurrents<br />

approche est que l’enfant ne peut pas découvrir les comportements du système bicyclette, loin des<br />

états d’équilibre, puisqu’il est systématiquement ramené à l’équilibre ! Si le forçage est total,<br />

l’enfant ne réalise aucune erreur, et son apprentissage sera faible. Pour éviter ceci, il est possible<br />

de lâcher le vélo de temps à autre, afin que l’enfant, lancé sur une bonne trajectoire, puisse<br />

continuer seul, et apprendre ses erreurs. Dans ce cas, l’enfant apprend à contrôler un système<br />

dynamique simplifié, dont la connaissance est suffisante pour maintenir un vélo en équilibre.<br />

Pour réaliser ce dernier type d’apprentissage, Toomarian et Bahren proposent de contrôler<br />

le degré de forçage en fonction de l’erreur : si le vélo commence à tomber, il faut le retenir<br />

fermement, et si l’enfant apprend bien, on peut le lâcher doucement. Il s’agit là plus d’un forçage<br />

de l’environnement : le but dans ce cas est de faire apprendre au système un environnement<br />

simplifié, dont la connaissance est suffisante pour le maintien de l’équilibre appris.<br />

Nous postulerons dans cette thèse, contrairement à l’approche précédente, que le forçage<br />

est total à l’échelle du neurone : l’information externe remplace l’activité du neurone. Ce que le<br />

réseau cherche à réaliser, c’est simplement d’être seul à l’origine de la modification des<br />

dynamiques durant la perception. Par contre, il peut y avoir simplification de l’environnement.<br />

L’idée du forçage est une idée simple qui, curieusement, n’est utilisé que depuis peu de<br />

temps. Il est pourtant possible de voir et de justifier son rôle sur plusieurs plans : psychologique,<br />

biologique, et théorique. L’ensemble de ces justifications permettent de penser que nos neurones<br />

sont forcés par les dynamiques de notre environnement, et qu’ils tendent à minimiser l’influence<br />

de cette perturbation en cherchant à l’anticiper. Ainsi, le forçage, ou Teacher-Forcing, ne sera pas<br />

vu comme une méthode connexionniste améliorant l’apprentissage dans les réseaux récurrents, ni<br />

comme un principe de simplification de l’environnement, mais comme l’un des principes même de<br />

la perception de notre environnement : l’environnement force nos dynamiques internes.<br />

Nous tenterons de justifier cette hypothèse par les différents résultats suivants, qui portent<br />

à la fois sur des expériences psychologiques, des résultats neurophysiologiques, ou des<br />

considérations théoriques.<br />

1. Complexification des dynamiques<br />

Cette hypothèse du forçage peut permettre de comprendre comment les dynamiques<br />

du système neuronal se complexifient lors de la perception [[218]], ce qui a permis<br />

d’interpréter le chaos neuronal comme un filtre de nouveauté, ou un état de non<br />

reconnaissance (p.53).<br />

Prenons le cas d’un système simple, constitué d’un ressort délivrant une force<br />

restituable non linéaire 34 , et d’une masse (Figure 5-2) : si l’autre extrémité du ressort est<br />

forcée par une dynamique périodique de faible intensité, la masse peut se stabiliser sur<br />

un cycle limite simple, par exemple sur un attracteur de période 1. Si l’on augmente<br />

l’intensité de ce forçage, l’orbite précédente devient instable, amenant le système sur un<br />

attracteur de période 2. En continuant ainsi, et à partir d’une certaine intensité critique de<br />

forçage, les dynamiques du système deviennent chaotiques.<br />

Ainsi, les systèmes ‘ressort+masse’ et ‘signal de forçage’ peuvent être vus comme<br />

des systèmes dont les régimes libres sont simples. Et dès que l’environnement est perçu<br />

(c’est à dire qu’il modifie les dynamiques du système percevant), à partir d’une certaine<br />

34 Signifie que la constante de raideur du ressort est fonction de son allongement.<br />

UN MODELE CONNEXIONNISTE DE LA MEMOIRE 99

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!