29.06.2013 Views

Le plaisir : un effet de bords des mémoires associatives

Le plaisir : un effet de bords des mémoires associatives

Le plaisir : un effet de bords des mémoires associatives

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

To appear in: In Joël Quinqueton et Jean Sallantin (Eds) Autonomie, mémoire et co-évolution.<br />

<strong>Le</strong>s chemins <strong>de</strong> Tr@verse Editions<br />

<strong>Le</strong> <strong>plaisir</strong> : <strong>un</strong> <strong>effet</strong> <strong>de</strong> <strong>bords</strong> <strong>de</strong>s <strong>mémoires</strong> <strong>associatives</strong><br />

Clau<strong>de</strong> Touzet<br />

Lab. Neurosciences Intégratives et Adaptatives<br />

UMR CNRS 7260 - Aix-Marseille Université, F<br />

clau<strong>de</strong>.touzet@<strong>un</strong>iv-amu.fr<br />

Résumé<br />

Mémoire et mise en mémoire sont supputées liées. En vertu du principe <strong>de</strong> causalité "l'<strong>un</strong> ne se<br />

produit jamais sans l'autre, c'est à dire que le fait d'être en mémoire est la conséquence d'<strong>un</strong><br />

processus préalable <strong>de</strong> mise en mémoire" [Appel à proposition, Rochebr<strong>un</strong>e 2012]. Dans cet<br />

article, nous nous attachons à décrire comment les principes <strong>de</strong> fonctionnement d'<strong>un</strong>e mémoire<br />

associative oblitèrent la mise en jeu du principe <strong>de</strong> causalité pour certaines informations stockées.<br />

L'implication qui en découle est que certains comportements que l'on sait "motivés", mais dont<br />

l'origine nous échappe, retrouvent ipso facto <strong>un</strong> support matériel. Ce faisant, ils per<strong>de</strong>nt <strong>de</strong> leur<br />

autonomie pour <strong>de</strong>venir <strong>de</strong>s illusions, c'est le cas du "<strong>plaisir</strong>" et <strong>de</strong>s comportements mis en jeu lors<br />

<strong>de</strong> notre quête <strong>de</strong> <strong>plaisir</strong> individuel.<br />

Introduction<br />

La Science considère que le principe <strong>de</strong> causalité est <strong>un</strong> principe fédérateur et <strong>un</strong>iversel. Ce faisant,<br />

l'objet <strong>de</strong> la Science est <strong>de</strong> trouver les causes <strong>de</strong>s phénomènes. Dans le domaine <strong>de</strong>s sciences<br />

cognitives, ce n'est que récemment 1 que les chercheurs se sont autorisés à rechercher les causes à<br />

l'origine <strong>de</strong> la conscience, <strong>de</strong> l'intelligence ou du libre-arbitre. Pour ces trois phénomènes, les<br />

résultats <strong>de</strong> cette quête ont abouti, non pas à <strong>un</strong>e explication <strong>de</strong>s origines - mais à <strong>un</strong>e disparition<br />

<strong>de</strong>s phénomènes per se, qualifiés d'illusions. Cette position initialement défendue par la thèse du<br />

matérialisme éliminativiste [2], s'est trouvée récemment confirmée par la Théorie neuronale <strong>de</strong> la<br />

Cognition (TnC) [14] qui, en proposant <strong>de</strong>s mécanismes neuronaux explicatifs <strong>de</strong>s comportements<br />

considérés comme "conscient" ou "intelligent", réaffirme leur caractère illusoire.<br />

Dans le contexte précis <strong>de</strong> la mémoire et <strong>de</strong> la mise en mémoire, la TnC énonce que certaines<br />

informations mémorisées n'ont pas fait l'objet d'<strong>un</strong>e mise en mémoire respectant <strong>un</strong> principe <strong>de</strong><br />

causalité "fort" 2 . En bref, ces informations mémorisées ne sont pas - explicitement - mises en<br />

mémoire. L'impact <strong>de</strong> ces éléments mémorisés (à l'insu <strong>de</strong> l'observateur puisque sous le couvert<br />

d'<strong>un</strong>e causalité "faible") est néanmoins considérable et concerne le concept <strong>de</strong> "<strong>plaisir</strong>" et les<br />

comportements associés <strong>de</strong> "recherche du <strong>plaisir</strong>".<br />

La notion <strong>de</strong> <strong>plaisir</strong> est fondamentale, notamment parce qu'elle est l'<strong>un</strong> <strong>de</strong>s rares 3 arguments<br />

avancés par les tenants du libre-arbitre : c'est la recherche du <strong>plaisir</strong> 4 qui motive nos comportements<br />

1 D'autres phénomènes n'ont même pas encore reçu l'accréditation suffisante pour être considérés aujourd'hui comme<br />

<strong>de</strong>s sujets <strong>de</strong> recherche légitimes, comme les phénomènes qualifiés <strong>de</strong> "psi" alors que la réalité <strong>de</strong> certains faits<br />

paranormaux est établie, et que <strong>de</strong>s hypothèses vis à vis <strong>de</strong>s origines <strong>de</strong> tels phénomènes sont proposées [1]. Dans ce<br />

domaine, la recherche française se démarque par ses œillères.<br />

2 Causalité faible : les causes sont connues dans leur généralité - mais ne peuvent pas être clairement i<strong>de</strong>ntifiées par<br />

l'observateur (qui peut être le sujet lui-même).<br />

3 <strong>Le</strong> second argument favorable au libre-arbitre est que la croyance dans le libre-arbitre est "bonne" pour la société<br />

parce qu'elle favorise l'altruisme [8] (sic).<br />

4 Cette quête du bonheur, du <strong>plaisir</strong>, est considérée comme <strong>un</strong> droit. Elle est d’ailleurs inscrite dans la Déclaration<br />

d'indépendance américaine (4 juillet 1776) : "Nous tenons pour évi<strong>de</strong>ntes pour elles-mêmes les vérités suivantes :<br />

tous les hommes sont créés égaux ; ils sont doués par le Créateur <strong>de</strong> certains droits inaliénables; parmi ces droits<br />

se trouvent la vie, la liberté et la recherche du bonheur. <strong>Le</strong>s gouvernements sont établis parmi les hommes pour<br />

garantir ces droits,...".<br />

- 1 -


To appear in: In Joël Quinqueton et Jean Sallantin (Eds) Autonomie, mémoire et co-évolution.<br />

<strong>Le</strong>s chemins <strong>de</strong> Tr@verse Editions<br />

et non pas <strong>un</strong>iquement notre vécu et la situation courante.<br />

Dans <strong>un</strong>e première partie sont présentés quelques éléments <strong>de</strong> l'organisation fonctionnelle du cortex<br />

telle que modélisée par la TnC. La partie suivante montre comment les cartes corticales s'organisent<br />

pour générer <strong>de</strong>s comportements motivés. La troisième partie examine comment les principes <strong>de</strong><br />

fonctionnement <strong>de</strong>s <strong>mémoires</strong> <strong>associatives</strong> expliquent l'existence d'informations mémorisées selon<br />

<strong>un</strong>e causalité faible et en quoi ces éléments mnésiques peuvent être à l'origine du "<strong>plaisir</strong>". La<br />

discussion positionne la TnC et ses explications du <strong>plaisir</strong> vis à vis <strong>de</strong> la "Formal Theory of<br />

Creativity, F<strong>un</strong>, and Intrinsic Motivation" <strong>de</strong> J. Schmidhuber. Enfin, nous concluons sur l'intérêt que<br />

présente nos travaux vis à vis d'<strong>un</strong>e quête individuelle et <strong>un</strong>iverselle <strong>de</strong> <strong>plaisir</strong>.<br />

1. Fonctionnement cortical<br />

1.1 <strong>Le</strong>s cartes corticales sont auto-organisées<br />

<strong>Le</strong> cortex, qui représente 70% du volume du cerveau (chez l'Homme), est constitué <strong>de</strong> cartes<br />

corticales. La Théorie neuronale <strong>de</strong> la Cognition fixe à environ 600 le nombre <strong>de</strong> ces cartes (chez<br />

l'Homme). Nous connaissons la fonction d'environ 80 d'entre elles. <strong>Le</strong>s premières cartes<br />

découvertes sont celles constitutives du cortex primaire (c'est à dire les cartes en relation directe<br />

avec nos sens). Par exemple, certaines cartes sont spécialisées dans le traitement visuel et extraient<br />

<strong>de</strong> l'image rétinienne les contours, les déplacements, les contrastes, les couleurs, les orientations [5].<br />

De la même façon, d'autres cartes traitent les informations provenant <strong>de</strong> nos autres sens.<br />

L'Homoncule [7] est la représentation au niveau du cortex <strong>de</strong> l'ensemble <strong>de</strong>s informations tactiles <strong>de</strong><br />

notre corps, notamment en provenance <strong>de</strong>s capteurs <strong>de</strong> pression localisés dans notre peau. D'autres<br />

cartes sensorielles co<strong>de</strong>nt les informations en provenance <strong>de</strong> notre nez (olfaction), <strong>de</strong> notre langue<br />

(goût), <strong>de</strong> notre ouïe, etc.<br />

Un autre moyen d'approcher la fonction <strong>de</strong> certaines cartes corticales est <strong>de</strong> regar<strong>de</strong>r ce que<br />

leurs disparitions (notamment après acci<strong>de</strong>nt vasculaire cérébral) entraînent comme symptômes.<br />

<strong>Le</strong>s agnosies 5 sont <strong>de</strong>s déficits dans la capacité <strong>de</strong> reconnaître alors même que la perception est tout<br />

à fait normale. On recense aujourd'hui plusieurs dizaines d'agnosies 6 .<br />

<strong>Le</strong>s cartes corticales sont auto-organisées, c'est-à-dire que les comportements individuels <strong>de</strong>s<br />

neurones qui les composent s'ajustent automatiquement, et que le résultat <strong>de</strong> cet ajustement montre<br />

<strong>un</strong>e organisation à l'échelle <strong>de</strong> la carte entière. Cette organisation est inévitable. Il suffit que <strong>de</strong>s<br />

informations du Mon<strong>de</strong> parviennent à nos capteurs sensoriels pour qu'elles soient relayées vers le<br />

cortex. Ces informations modifient le comportement <strong>de</strong>s neurones <strong>de</strong>s colonnes corticales générant<br />

<strong>de</strong> facto <strong>un</strong> ajustement <strong>de</strong>s cartes. Ces cartes sont le résultat d'<strong>un</strong>e projection d'<strong>un</strong> espace<br />

multidimensionnel sur <strong>un</strong> sous-espace <strong>de</strong> dimension 2, laquelle projection respecte fréquence et<br />

similarité [6]. De ce fait, il est possible <strong>de</strong> savoir, rien qu'en regardant l'organisation d'<strong>un</strong>e carte,<br />

quelles ont été les situations (vécues par la personne) les plus fréquentes et celles qui l'étaient<br />

moins. Nous sommes aussi assurés que <strong>de</strong>s situations « similaires » sont représentées par <strong>de</strong>s<br />

colonnes corticales voisines.<br />

1.2 Hiérarchie <strong>de</strong> cartes auto-organisatrices<br />

Nous vivons dans <strong>un</strong> Mon<strong>de</strong> cohérent, constitué <strong>de</strong> régularités. Prenons le cas d'<strong>un</strong>e carte corticale<br />

directement connectée à <strong>un</strong> organe sensoriel. <strong>Le</strong>s régularités les plus fréquentes sont les premières<br />

informations apprises par cette carte. Puis, les régularités <strong>un</strong> peu moins fréquentes trouvent aussi<br />

5 a- privatif et -gnosis connaissance en Grec.<br />

6 <strong>Le</strong>s gran<strong>de</strong>s catégories d'agnosies sont : visuelles, auditives, somatosensorielles, spatiales, etc.<br />

- 2 -


To appear in: In Joël Quinqueton et Jean Sallantin (Eds) Autonomie, mémoire et co-évolution.<br />

<strong>Le</strong>s chemins <strong>de</strong> Tr@verse Editions<br />

leurs places sur celle-ci, et ainsi <strong>de</strong> suite. <strong>Le</strong>s événements peu fréquents ne sont pas mémorisés par<br />

cette carte, ils le seront par d'autres cartes placées plus haut dans la hiérarchie. Ceci sous-entend<br />

qu'il y a <strong>un</strong>e organisation "hiérarchique" <strong>de</strong>s cartes.<br />

Certaines cartes reçoivent <strong>de</strong>s informations en provenance directe <strong>de</strong>s capteurs sensoriels : elles<br />

constituent le "cortex primaire". <strong>Le</strong>s cartes qui reçoivent <strong>de</strong>s entrées en provenance <strong>de</strong>s cartes du<br />

cortex primaire constituent le "cortex secondaire". <strong>Le</strong>s cartes qui reçoivent leurs informations du<br />

cortex secondaire constituent le "cortex associatif". Comme nous ne savons pas aujourd'hui repérer<br />

les différentes fonctions <strong>de</strong>s différentes cartes du cortex associatif, il représente à lui tout seul 70 %<br />

<strong>de</strong> l'ensemble du cortex.<br />

Il y a donc <strong>un</strong>e hiérarchie <strong>de</strong> propagation <strong>de</strong> l'information, <strong>de</strong>puis le cortex primaire vers le<br />

cortex associatif, en passant par le cortex secondaire. A l'intérieur du cortex associatif, il y a <strong>de</strong><br />

nombreux étages <strong>de</strong> traitement au sens où il y a <strong>de</strong> nombreuses cartes échangeant <strong>de</strong> l'information.<br />

Ces cartes sont plus ou moins "loin" (distance évaluée par le nombre <strong>de</strong> neurones intermédiaires qui<br />

les séparent) du cortex secondaire. Nous dirons qu'elles sont plus ou moins "haut" dans la<br />

hiérarchie.<br />

La Théorie neuronale <strong>de</strong> la Cognition estime que 80 % <strong>de</strong>s informations reçues par <strong>un</strong>e carte<br />

participent à son organisation, et que les 20 % restant participent à l'organisation <strong>de</strong>s cartes<br />

suivantes. Ceci sous-entend que l'information reconnue par <strong>un</strong>e carte (parce que mémorisée par<br />

celle-ci) s'arrête là et que l'information non reconnue (parce que non mémorisée à ce niveau)<br />

continue. Ceci fait <strong>de</strong> la carte auto-organisatrice <strong>un</strong> "détecteur <strong>de</strong> nouveauté".<br />

<strong>Le</strong>s corrélations fréquentes sont apprises très vite (et donc très tôt) par les cartes <strong>de</strong>s niveaux les<br />

moins élevés (cortex primaire, puis secondaire). A chaque niveau hiérarchique, les cartes sont<br />

organisées par <strong>de</strong>s informations moins fréquentes que celles dont ont bénéficié les cartes du niveau<br />

précé<strong>de</strong>nt. Comme il faut toujours autant <strong>de</strong> données pour organiser <strong>un</strong>e carte, plus la carte<br />

considérée est haut dans la hiérarchie, plus son auto-organisation prendra longtemps.<br />

1.3 Représentation distribuée sur les cartes auto-organisatrices: <strong>un</strong>e mémoire associative<br />

En combinant plusieurs cartes auto-organisatrices ensemble, il est possible <strong>de</strong> créer <strong>de</strong>s<br />

représentations très précises du Mon<strong>de</strong>. Lorsque <strong>de</strong>ux cartes auto-organisatrices sont placées l'<strong>un</strong>e<br />

après l'autre, la secon<strong>de</strong> carte représente <strong>de</strong>s données plus complexes, par exemple <strong>de</strong>s<br />

combinaisons <strong>de</strong> caractéristiques extraites par la première carte. Si la première carte co<strong>de</strong> les<br />

couleurs apparaissant dans l'image rétinienne, alors la secon<strong>de</strong> carte peut co<strong>de</strong>r les proportions<br />

relatives : « c'est plutôt vert », ou « vert et rouge à parts égales », etc. Avec trois cartes autoorganisatrices,<br />

il <strong>de</strong>vient possible <strong>de</strong> fusionner <strong>de</strong>s données issues <strong>de</strong> modalités différentes comme<br />

la couleur et la forme, ou la vision et l'audition. Par exemple, <strong>un</strong>e carte co<strong>de</strong> les couleurs, <strong>un</strong>e<br />

secon<strong>de</strong> co<strong>de</strong> les formes <strong>de</strong>s objets vus et la troisième carte (qui reçoit les connexions <strong>de</strong>s <strong>de</strong>ux<br />

premières) co<strong>de</strong> pour <strong>de</strong>s formes colorées. Si, dans l'environnement, il existe <strong>de</strong>s objets <strong>de</strong> forme<br />

ron<strong>de</strong> et <strong>de</strong> couleur bleue, d'autres <strong>de</strong> forme triangulaire et rouge, et auc<strong>un</strong> carré vert, alors certaines<br />

colonnes corticales <strong>de</strong> la troisième carte seront actives <strong>un</strong>iquement pour <strong>de</strong>s ronds bleus, d'autres<br />

pour <strong>de</strong>s triangles rouges et auc<strong>un</strong>e ne sera active lorsque l'image d'<strong>un</strong> carré vert sera montrée.<br />

La carte codant les objets d'après leur forme et leur couleur est d'<strong>un</strong> niveau d'abstraction plus<br />

élevé que la carte <strong>de</strong>s couleurs ou la carte <strong>de</strong>s formes. Il est donc possible d'établir <strong>un</strong>e hiérarchie en<br />

fonction du niveau d'abstraction. Pour connaître le niveau d'abstraction d'<strong>un</strong>e carte, il suffit <strong>de</strong><br />

compter le nombre <strong>de</strong> cartes entre celle-ci et les capteurs sensoriels. Dans le cas <strong>de</strong> la lecture d'<strong>un</strong><br />

mot, les recherches actuelles montrent que la carte sur laquelle les mots sont codés est d'<strong>un</strong> niveau<br />

d'abstraction égal à 7 [3, 4].<br />

<strong>Le</strong>s mots écrits, les mots entendus, les o<strong>de</strong>urs, la vision d'objets inanimés ou <strong>de</strong> visages font<br />

- 3 -


To appear in: In Joël Quinqueton et Jean Sallantin (Eds) Autonomie, mémoire et co-évolution.<br />

<strong>Le</strong>s chemins <strong>de</strong> Tr@verse Editions<br />

partie <strong>de</strong> notre quotidien. Ils activent nos sens et sont traités par le cortex. Il existe donc <strong>un</strong>e carte<br />

pour les mots écrits, <strong>un</strong>e autre pour les mots entendus, <strong>un</strong>e troisième pour les o<strong>de</strong>urs, <strong>un</strong>e quatrième<br />

pour les objets inanimés, <strong>un</strong>e cinquième pour les visages, etc. Bref, beaucoup <strong>de</strong> cartes codant<br />

énormément <strong>de</strong> domaines <strong>de</strong> la réalité. Il y a <strong>de</strong>s cartes supplémentaires, <strong>de</strong> niveau d'abstraction<br />

plus élevé, qui reçoivent les informations <strong>de</strong> toutes ces cartes et les fusionnent. <strong>Le</strong>s colonnes<br />

corticales <strong>de</strong> ces cartes <strong>de</strong> niveau supérieur sont activées dans <strong>de</strong>s situations précises. Par exemple,<br />

certaines colonnes corticales sont activées lorsque nous nous trouvons dans <strong>un</strong>e situation où il y a,<br />

en même temps :<br />

le mot « arbre » écrit,<br />

le mot « arbre » entendu,<br />

<strong>un</strong> arbre visible,<br />

<strong>un</strong>e o<strong>de</strong>ur <strong>de</strong> forêt et<br />

le visage <strong>de</strong> la personne qui nous a fait découvrir ce mot-là.<br />

La loi <strong>de</strong> Hebb garantit que cette activation simultanée va créer <strong>de</strong>s connexions entre toutes les<br />

colonnes corticales <strong>de</strong>s différentes cartes codant ces éléments. Si plus tard seul l'arbre est vu,<br />

l'activation du mot "arbre" est néanmoins réalisée. C'est <strong>un</strong>e parfaite illustration <strong>de</strong>s capacités <strong>de</strong>s<br />

<strong>mémoires</strong> <strong>associatives</strong> : <strong>un</strong> morceau <strong>de</strong> l'information apprise suffit à activer l'ensemble <strong>de</strong><br />

l'information mémorisée.<br />

2. Comportements motivés<br />

2.1 Cortex sensoriel et sensori-moteur<br />

Lors d'<strong>un</strong> comportement, les actions réalisées ne sont jamais choisies au hasard, elles peuvent toutes<br />

être justifiées par rapport à <strong>un</strong> but. Si à partir d'<strong>un</strong> certain moment ce n'est plus le cas, c'est que le<br />

comportement a changé et les actions <strong>de</strong>viennent justifiables par rapport à <strong>un</strong> autre (nouveau) but.<br />

Un comportement est donc <strong>un</strong>e succession d'actions qui sont liées les <strong>un</strong>es aux autres par le fait<br />

qu'elles participent à la réalisation d'<strong>un</strong> même but.<br />

Dans le domaine <strong>de</strong> la robotique mobile, il est possible <strong>de</strong> générer - instantanément et avec <strong>un</strong>e<br />

certaine compétence - n'importe quel comportement [16]. De plus, le simple fait <strong>de</strong> "réaliser" le<br />

comportement choisi améliore sa performance. Ceci a été obtenu en utilisant <strong>de</strong>ux cartes autoorganisatrices,<br />

l'<strong>un</strong>e codant pour les situations perçues par le robot et l'autre pour les actions<br />

réalisées et leurs <strong>effet</strong>s (fig. 1). La première carte appartient <strong>de</strong> facto au cortex sensoriel, la secon<strong>de</strong><br />

appartient au cortex sensorimoteur. Au départ, les <strong>de</strong>ux cartes sont vierges <strong>de</strong> toute information et le<br />

robot explore au hasard son environnement pendant quelques minutes. Cet échantillonnage <strong>de</strong><br />

l'environnement permet l'auto-organisation <strong>de</strong> la première carte (qui représente donc les situations<br />

perçues par le robot) et <strong>de</strong> la secon<strong>de</strong> carte représentant à la fois l'action effectuée ET la variation<br />

associée.<br />

2.2 <strong>Le</strong> but définit le comportement<br />

Il suffit ensuite <strong>de</strong> définir <strong>un</strong>e situation comme le but à atteindre pour générer le comportement adhoc.<br />

Par exemple, si le but choisi est : "rien autour" et que le robot se trouve face à <strong>un</strong> obstacle,<br />

alors cette situation courante (face à l'obstacle) active <strong>un</strong>e colonne corticale en particulier. Une autre<br />

colonne corticale est activée par la situation but (rien autour) - qui sera <strong>de</strong> facto <strong>un</strong>e colonne<br />

- 4 -


To appear in: In Joël Quinqueton et Jean Sallantin (Eds) Autonomie, mémoire et co-évolution.<br />

<strong>Le</strong>s chemins <strong>de</strong> Tr@verse Editions<br />

corticale éloignée. La colonne corticale active pour la situation actuelle est entourée <strong>de</strong> quelques<br />

colonnes corticales (ses voisines) qui s'activent pour <strong>de</strong>s situations plus ou moins similaires. L'<strong>un</strong>e<br />

<strong>de</strong> ces "colonnes voisines" est plus proche (en distance sur la carte corticale) que les autres<br />

(voisines) <strong>de</strong> la colonne codant pour le but. C'est <strong>un</strong>e situation intermédiaire par laquelle le robot<br />

doit passer pour parvenir au but.<br />

Cette situation intermédiaire sera atteinte en choisissant comme action à accomplir l'action qui<br />

génère (comme variation <strong>de</strong> situations) la variation nécessaire pour atteindre la situation<br />

intermédiaire. La secon<strong>de</strong> carte contient la réponse à cette question : quelle colonne co<strong>de</strong> pour <strong>un</strong>e<br />

variation <strong>de</strong> situations égale à (situation_actuelle moins situation_intermédiaire) ? Dès que cette<br />

colonne est trouvée, alors l'action qu'elle représente est réalisée. Il y a <strong>de</strong> bonnes probabilités pour<br />

que la situation intermédiaire soit atteinte, mais même si ce n'est pas le cas ce n'est pas grave car le<br />

processus est itéré jusqu'à ce que la situation courante soit celle recherchée (but).<br />

Situation<br />

but<br />

Situation<br />

intermédiaire<br />

Situation<br />

(a)<br />

actuelle<br />

Carte <strong>de</strong>s situations<br />

Fig. 1. Deux cartes corticales coopèrent dans la genèse d'<strong>un</strong>e succession d'action (i.e., <strong>un</strong><br />

comportement) en réponse à <strong>un</strong>e situation courante. Chaque intersection représente <strong>un</strong>e colonne<br />

corticale. La topologie <strong>de</strong> l'espace <strong>de</strong>s situations est conservée par la carte (1). De ce fait, la situation<br />

voisine <strong>de</strong> la situation courante et aussi plus proche <strong>de</strong> la situation-but (a) est <strong>un</strong>e situation<br />

intermédiaire par laquelle le système doit passer pour atteindre le but. La variation entre la situation<br />

courante et la situation intermédiaire est utilisée pour son<strong>de</strong>r la secon<strong>de</strong> carte (2) qui fournira en retour<br />

l'action à accomplir pour observer cette variation.<br />

L'observation <strong>de</strong> cette expérience montre le robot se cogner aux murs, hésiter et ne rien faire <strong>de</strong><br />

construit jusqu'à ce que le but "rien autour" soit spécifié. Dès cet instant, le robot s'éloigne <strong>de</strong>s<br />

obstacles pour gagner <strong>un</strong> endroit où ses capteurs ne détectent plus rien ("rien autour"). Au fur et à<br />

mesure que le temps passe et que les cartes continuent à s'auto-organiser, les mouvements du robot<br />

<strong>de</strong>viennent <strong>de</strong> plus en plus efficaces.<br />

2.3 N'importe quel comportement - instantanément<br />

Question :<br />

Situation intermédiaire<br />

– Situation actuelle<br />

Réponse :<br />

action<br />

(b)<br />

Si <strong>de</strong> la situation "rien autour", le but change pour "proche <strong>de</strong> quelque chose", instantanément le<br />

comportement du robot se transforme. Il recherche les obstacles, s'approche et se "colle" au premier<br />

qu'il détecte. S'il n'y a pas d'obstacle, alors le robot va se lancer à la poursuite <strong>de</strong> la première cible<br />

mouvante qu'il perçoit. Au départ, il sera maladroit dans ses choix d'action et se laissera peut être<br />

facilement distancer ; mais au fur et à mesure que le temps passe, le robot s'améliore.<br />

- 5 -<br />

(c)<br />

Carte <strong>de</strong>s différences <strong>de</strong><br />

situations et actions associées


To appear in: In Joël Quinqueton et Jean Sallantin (Eds) Autonomie, mémoire et co-évolution.<br />

<strong>Le</strong>s chemins <strong>de</strong> Tr@verse Editions<br />

Si la situation-but change à nouveau pour être : "avancer en gardant <strong>un</strong> obstacle à droite", alors<br />

le robot recherche, puis rase les murs (à sa droite). Il ne <strong>de</strong>vrait plus quitter ce mur, jusqu'au<br />

prochain changement <strong>de</strong> but.<br />

Si le but choisi appartient à <strong>un</strong>e carte codant le niveau sonore, alors le comportement généré est<br />

celui <strong>de</strong> trouver et maintenir le niveau sonore désiré, en s'éloignant ou en se rapprochant <strong>de</strong> la<br />

source sonore, tant pour tenir compte <strong>de</strong>s fluctuations <strong>de</strong> la source (selon que l'interlocuteur parle<br />

plus ou moins fort) que <strong>de</strong> celles d'éventuelles sources parasites (les autres conversations).<br />

Si le but choisi appartient à <strong>un</strong>e carte codant les qualificatifs que l'on associe parfois à certaines<br />

situations comme "générosité" ou "avarice", alors le comportement généré est celui <strong>de</strong> quelqu'<strong>un</strong> <strong>de</strong><br />

généreux ou d'avare (selon la localisation du but retenu sur cette carte). Ce comportement est<br />

complexe, car il met en jeu <strong>de</strong>s actions <strong>de</strong> nature très différente : se déplacer, écrire, parler, écouter,<br />

convaincre, etc. En fait chac<strong>un</strong> <strong>de</strong> ces types d'actions est mis en jeu au sein d'<strong>un</strong> véritable<br />

comportement spécifié par <strong>un</strong> (sous) but. <strong>Le</strong> but final (être généreux) implique la définition et la<br />

réalisation <strong>de</strong> multiples sous-buts. Cette organisation hiérarchique <strong>de</strong> sous-buts est à mettre en<br />

regard <strong>de</strong> la structure hiérarchique <strong>de</strong>s cartes auto-organisatrices dans le cortex.<br />

3. Effets <strong>de</strong> <strong>bords</strong> <strong>de</strong>s <strong>mémoires</strong> <strong>associatives</strong><br />

3.1 Plus petit comm<strong>un</strong> dénominateur( PPCD)<br />

<strong>Le</strong>s cartes corticales mémorisent les situations perçues. Mais, comme il y a bien plus <strong>de</strong> situations<br />

vécues que <strong>de</strong> colonnes corticales, les situations similaires sont regroupées sur les mêmes colonnes<br />

corticales - à raison d'<strong>un</strong>e colonne corticale par carte (il y a donc autant <strong>de</strong> cartes impliquées que <strong>de</strong><br />

caractéristiques <strong>de</strong> la situation). Pour chaque groupe <strong>de</strong> situations similaires, les caractéristiques les<br />

plus comm<strong>un</strong>es au groupe (<strong>de</strong> situations) sont efficacement mémorisées et constituent le "plus petit<br />

dénominateur comm<strong>un</strong>" (fig. 2).<br />

A l'inverse, les caractéristiques les moins partagées sont moins bien mémorisées. <strong>Le</strong> plus petit<br />

dénominateur comm<strong>un</strong> est <strong>un</strong> point d'attraction, car les caractéristiques qui le composent sont<br />

toujours toutes actives en même temps - dès lors qu'<strong>un</strong>e partie d'entre-elles est activée. Sachant que<br />

sur chaque carte corticale, du fait <strong>de</strong> la compétition locale, <strong>un</strong>e seule colonne corticale est active à la<br />

fois, alors cette colonne corticale active constitue <strong>un</strong>e situation-but <strong>de</strong> cette carte (carte codant pour<br />

cette caractéristique).<br />

(a) (b)<br />

Fig. 2. (a) <strong>Le</strong>s triangles noirs représentent les niveaux d'activation <strong>de</strong> quelques colonnes corticales sur<br />

trois cartes auto-organisatrices interconnectées en réponse à la situation courante. Ce vecteur<br />

d'activation se réduit à l'activation finale décrite en (b) sur ces trois même cartes. <strong>Le</strong> nombre <strong>de</strong> foyers<br />

d'activation est réduit, mais l'activation individuelle <strong>de</strong>s colonnes est plus forte. <strong>Le</strong> vecteur d'activation<br />

(b) est le PPCD, il n'a peut être jamais été vécu/ressenti en tant que tel, mais il constitue <strong>un</strong> bassin<br />

attracteur pour <strong>de</strong>s situations similaires. Il est donc à l'origine <strong>de</strong> la définition <strong>de</strong> situation-but sur les<br />

cartes auto-organisatrices - et donc à l'origine <strong>de</strong> comportements.<br />

- 6 -


3.2 Plaisir<br />

To appear in: In Joël Quinqueton et Jean Sallantin (Eds) Autonomie, mémoire et co-évolution.<br />

<strong>Le</strong>s chemins <strong>de</strong> Tr@verse Editions<br />

Nous avons vu au §2 que tout comportement se définit par <strong>un</strong>e succession d'actions choisies pour se<br />

rapprocher d'<strong>un</strong>e situation-but. Lorsque ce but n'est pas vu, perçu ou <strong>de</strong>viné par l'observateur (qui<br />

peut être l'individu lui-même), alors nous en déduisons que ce comportement est motivé<br />

(intérieurement) par la recherche <strong>de</strong> <strong>plaisir</strong>.<br />

Pourquoi le <strong>plaisir</strong> ? Parce qu'il y a <strong>un</strong> consensus pour affirmer que si nous ne savons pas ce<br />

qui motive quelqu'<strong>un</strong>, alors c'est qu'il recherche du <strong>plaisir</strong> (certainement pas <strong>un</strong>e recherche <strong>de</strong><br />

dé<strong>plaisir</strong>).<br />

A chaque instant, il y a activation au minimum d'<strong>un</strong> plus petit dénominateur comm<strong>un</strong> en lien<br />

avec la situation perçue actuelle. A défaut <strong>de</strong> but clairement spécifié par ailleurs, ces buts<br />

"implicites" génèrent <strong>un</strong> comportement motivé intérieurement. Lorsque le codage <strong>de</strong> la situation<br />

vécue s'i<strong>de</strong>ntifie avec le codage du plus petit dénominateur comm<strong>un</strong> associé, alors le comportement<br />

cesse (<strong>un</strong> autre commence). La situation qui vient d'être atteinte est facilement mémorisée (du fait<br />

d'<strong>un</strong>e activation forte et localisée), le bassin attracteur (PPCD) se renforce. Ce qui fait "<strong>plaisir</strong>" à <strong>un</strong><br />

instant donné, fera à nouveau "<strong>plaisir</strong>" dans le futur et est, <strong>de</strong> ce fait, re-cherché.<br />

Discussion<br />

Jürgen Schmidhuber développe et teste <strong>de</strong>puis plus <strong>de</strong> 20 ans <strong>un</strong>e théorie sur le fonctionnement du<br />

cerveau [10]. Dans sa thèse, la source <strong>de</strong> la motivation intrinsèque n'est pas le plus petit<br />

dénominateur comm<strong>un</strong>, mais le taux <strong>de</strong> compression <strong>de</strong> l'information traitée [11]. C'est <strong>un</strong> concept<br />

relativement proche puisqu'il prend lui aussi en compte la taille <strong>de</strong> la représentation <strong>de</strong> l'information<br />

au niveau cortical. De plus, il y a arrêt du comportement en cours dès lors que le taux <strong>de</strong><br />

compression ne varie plus, ce qui est à rapprocher <strong>de</strong> l'évolution <strong>de</strong> la représentation <strong>de</strong> la situation<br />

courante vers le codage du PPCD.<br />

La principale critique que nous faisons à la thèse <strong>de</strong> Schmidhuber est que le calcul du taux <strong>de</strong><br />

compression <strong>de</strong> l'information au sein du cerveau n'est pas aisé sans observateur "extérieur" [12],<br />

tandis que celui du PPDC est "gratuit" et automatique, puisque inscrit dans le principe même du<br />

fonctionnement d'<strong>un</strong>e mémoire associative.<br />

La secon<strong>de</strong> critique est que l'apprentissage dans la théorie <strong>de</strong> Schmidhuber est basé sur le<br />

renforcement. Rappelons que la performance comportementale d'<strong>un</strong> robot programmé selon la TnC<br />

[16] est très supérieure en terme d'efficacité à <strong>un</strong>e approche impliquant l'apprentissage par<br />

renforcement, même si l'on optimise le ratio exploration/exploitation [9], et/ou que l'on instancie cet<br />

apprentissage avec <strong>un</strong>e carte auto-organisatrice [15].<br />

Enfin, les concepts <strong>de</strong> "curiosité" et <strong>de</strong> "ennui" tels que décrits par Schmidhuber [7] nécessitent<br />

l'usage d'<strong>un</strong> apprentissage par renforcement, tandis que la TnC propose que ce soit la différence<br />

entre la situation vécue et les situations mémorisées qui soient à l'origine <strong>de</strong>s phénomènes<br />

d'attention, lesquels perdurent tant que la différence entre situation vécue et mémorisées n'est pas<br />

résolue. L'attention ainsi obtenue induit les comportements observés <strong>de</strong> curiosité et aussi d'ennui.<br />

Conclusion<br />

<strong>Le</strong>s représentations minimales (PPCD), bien qu'elles ne soient pas explicitement mises en mémoire<br />

par l'individu, sont toutefois d'<strong>un</strong>e gran<strong>de</strong> importance. En <strong>effet</strong>, dès lors que le comportement n'est<br />

pas dicté par <strong>de</strong>s contingences précises, les PPCD sont à l'origine <strong>de</strong>s comportements. Comme<br />

l'observateur n'a - par définition - pas <strong>de</strong> connaissance sur l'origine <strong>de</strong>s PPCD, ni sur leur exactes<br />

- 7 -


To appear in: In Joël Quinqueton et Jean Sallantin (Eds) Autonomie, mémoire et co-évolution.<br />

<strong>Le</strong>s chemins <strong>de</strong> Tr@verse Editions<br />

représentations en terme <strong>de</strong> situations du mon<strong>de</strong>, il infère l'existence d'<strong>un</strong> "<strong>plaisir</strong>". La répétition <strong>de</strong><br />

l'implication <strong>de</strong>s PPCD dans la vie du sujet est vue comme <strong>un</strong>e recherche récurrente <strong>de</strong> <strong>plaisir</strong>. Nous<br />

avons vu que le <strong>plaisir</strong> est <strong>un</strong> <strong>effet</strong> <strong>de</strong> bord <strong>de</strong> la mémorisation <strong>de</strong> la mémoire associative qu'est<br />

notre cortex. Ce faisant, nous définissons le <strong>plaisir</strong> comme <strong>un</strong>e illusion à ranger dans la même<br />

catégorie que celle <strong>de</strong> la conscience (thèse du matérialisme éliminativiste).<br />

Nous pourrions croire que nous venons <strong>de</strong> perdre beaucoup avec cette explication (le <strong>plaisir</strong> est <strong>un</strong>e<br />

illusion), mais ce n'est pas le cas. Même s'il s'agit d'<strong>un</strong>e illusion, elle est prégnante et doit <strong>de</strong> facto<br />

être recherchée avec efficacité. Une meilleure connaissance <strong>de</strong>s causes à l'origine <strong>de</strong> cette illusion<br />

nous ai<strong>de</strong>. Comme les PPCD dépen<strong>de</strong>nt <strong>un</strong>iquement <strong>de</strong>s expériences vécues par l'individu, alors nos<br />

<strong>plaisir</strong>s nous sont personnels. Comme ils résultent d'<strong>un</strong> processus <strong>de</strong> mémorisation du vécu, il est<br />

tout à fait possible d'envisager <strong>de</strong> biaiser son vécu afin <strong>de</strong> modifier la représentation <strong>de</strong>s PPCD et<br />

qu'ils collent alors plus souvent qu'auparavant à la réalité <strong>de</strong> notre quotidien. Nous bénéficierons<br />

ainsi d'<strong>un</strong>e vie plus"plaisante".<br />

Remerciements<br />

Ces recherches ont bénéficié du soutien <strong>de</strong> l'ANR 2010-CORD-013 (Cognilego).<br />

Références<br />

1. D. J. Bem, "Feeling the Future: Experimental Evi<strong>de</strong>nce for Anomalous Retroactive Influences on<br />

Cognition and Affect", Journal of Personality and Social Psychology, 100, 407-425, 2011<br />

2. P.M. Churchland, A Neurocomputational Perspective: The Nature of Mind and the Structure of Science.<br />

Cambridge, MIT Press, 1992. ISBN 0-262-03151-5.<br />

3. S. Dehaene, L. Cohen, M. Sigman and F. Vinckier, "The neural co<strong>de</strong> for written words: a proposal",<br />

Trends Cogn Sci, 9(7), 335-341, 2005.<br />

4. S. Dufau, B. <strong>Le</strong>te, C. Touzet, H. Glotin, J.C. Ziegler and J. A Grainger, "Developmental Perspective on<br />

Visual Word Recognition: New Evi<strong>de</strong>nce and a Self-Organizing Mo<strong>de</strong>l", European Journal of Cognitive<br />

Psychology, 22: 5, 669 - 694, 2010.<br />

5. D. Hubel, Eye, Brain, and Vision, Freeman, May 1995. ISBN 978-0-7167-6009-2.<br />

6. T. Kohonen, Self-Organizing Maps, Springer Series in Information Sciences, Vol. 30, Third Ed., 501<br />

pages, 2001. ISBN 3-540-67921-9.<br />

7. W. Penfield, T. Rasmussen, The cerebral cortex of man, Macmillan, 1950.<br />

8. R. F. Baumeister, E.J. Masicampo and C. N. DeWall, "Benefits of Feeling Free: Disbelief in Free Will<br />

Increases Aggression and Reduces Helpfulness", Pers Soc Psychol Bull, 35; 260-268, 2009.<br />

9. J. M. Santos and C. Touzet, "Exploration T<strong>un</strong>ed Reinforcement F<strong>un</strong>ction," Neurocomputing, Vol. 28 ,<br />

No. 1-3, September 1999, pp. 93-105.<br />

10. J. Schmidhuber, "Formal Theory of Creativity, F<strong>un</strong>, and Intrinsic Motivation (1990-2010)", IEEE<br />

Transactions on Autonomous Mental Development, 2(3):230-247, 2010.<br />

11. J. Schmidhuber, "Driven by compression progress: A simple principle explains essential aspects of<br />

subjective beauty, novelty, surprise, interestingness, attention, curiosity, creativity, art, science, music,<br />

jokes", In G. Pezzulo, M. V. Butz, O. Sigaud, and G. Baldassarre, editors, Anticipatory Behavior in<br />

Adaptive <strong>Le</strong>arning Systems, from Sensorimotor to Higher-level Cognitive Capabilities, LNAI, Springer,<br />

2009.<br />

12. J. Schmidhuber, "Simple Algorithmic Principles of Discovery, Subjective Beauty, Selective Attention,<br />

Curiosity & Creativity", In V. Corruble, M. Takeda, E. Suzuki, eds., Proc. 10th Intl. Conf. on Discovery<br />

Science (DS 2007) p. 26-38, LNAI 4755, Springer, 2007.<br />

13. J. Schmidhuber, "A possibility for implementing curiosity and boredom in mo<strong>de</strong>l-building neural<br />

- 8 -


To appear in: In Joël Quinqueton et Jean Sallantin (Eds) Autonomie, mémoire et co-évolution.<br />

<strong>Le</strong>s chemins <strong>de</strong> Tr@verse Editions<br />

controllers", in J. A. Meyer and S. W. Wilson, editors, Proc. of the International Conference on<br />

Simulation of Adaptive Behavior: From Animals to Animats, 222-227. MIT Press/Bradford Books, 1991.<br />

14. C. Touzet, Conscience, intelligence, libre-arbitre ? <strong>Le</strong>s réponses <strong>de</strong> la Théorie neuronale <strong>de</strong> la<br />

Cognition, 156 pages, ed. la Machotte, 2010. ISBN: 978-2-919411-00-9<br />

15. C. Touzet, "Q-learning for robots", The Handbook of Brain Theory and Neural Networks (Second<br />

Edition), M. Arbib editor, MIT Press, pp. 934-937, 2003.<br />

16. C. Touzet, "Mo<strong>de</strong>ling and Simulation of Elementary Robot Behaviors using Associative Memories",<br />

International Journal of Advanced Robotic Systems, Vol 3 n° 2, J<strong>un</strong>e 2006.<br />

- 9 -

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!