Thèse Sciences Cognitives - Olivier Nerot

Recommendations

Info

190 Mémorisation par forçage des dynamiques chaotiques dans les modèles connexionnistes récurrents le même principe, la modification du réseau se fera préférentiellement dans la direction des poids forts, mais ici, comme la règle d’apprentissage ne tient pas compte de la valeur des wij, ce phénomène est plutôt dû au fait que les poids forts facilitent l’activité des neurones, et accélèrent donc la modification de leurs poids. On retrouve donc le même principe de modularisation, mais selon un principe différent. La seconde caractéristique est que cette modularisation fonctionnelle ne se fait pas par des modules possédant une hiérarchie simple et localisée autour des entrées du réseau. Il est en effet possible de voir que les zones ayant saturé à 1 ou 0 s’organisent en paysage qualifiable de fractal, fait de méandres plus ou moins fins. Afin de mettre en évidence ce comportement, nous avons réalisé un filtrage passe-bas de l’état du réseau, qui permet de mettre mieux en valeur ces zones connexes de méandres. Un tel résultat est à rapprocher de ceux portant sur les cartes topologiques des spécialisations neuronales. Le premier résultat auquel fait penser cette organisation a été obtenu par Hubel & Wiesel[[100]]. Sur la Figure 8-7 a été tracé la surface du cortex d’un macaque, avec, en noir, l’ensemble des neurones qui répondent spécifiquement à la stimulation d’un même oeil. Il est possible de voir que la spécialisation neuronale observée suit le même type de figure que celles obtenues par un simple apprentissage hebbien. Le second résultat à rapprocher est celui obtenu par Weliky & al. [[212]], qui ont décrit de façon systématique les zones de l’aire 17 du cortex visuel primaire répondant sélectivement à l’orientation du stimulus visuel : il y a, de la même façon, une Figure 8-7 : Paysage des spécificités neuronales interpénétration des zones de réponse préférentielle à chacune des orientations. Nous postulerons donc que ce type d’organisation de la fonctionnalité des neurones suit le même principe d’une segmentation complexe du paysage neuronal, due à l’apprentissage, et non pas causée par une pré-spécialisation neuronale. Nous chercherons donc à utiliser des règles pouvant, de la même façon, ‘fractaliser’ l’organisation fonctionnelle de l’architecture neuronale. Une autre remarque vient s’ajouter à celles ci, qui confirme l’idée de l’utilisation d’une période réfractaire. En effet, l’utilisation d’un w11 de valeur négative, oblige le neurone qui a saturé à 1 à diminuer son coefficient de rétroaction wii , et donc d’évoluer vers un neurone à forte rétroaction négative. Ainsi, un neurone qui sature voit son état diminuer jusqu’à ce que sa sortie soit ramenée à zéro. Ceci peut être interprété sous forme d’une fatigue du neurone, qui peut correspondre d’une certaine façon à une période réfractaire. On peut voir dès lors un lien entre modularisation fonctionnelle ‘fractalisée’, période réfractaire et règle d’apprentissage hebbienne. 8.3 Diffusion de l'erreur dans le réseau Bien que la règle présentée précédemment soit intéressante pour notre approche, car elle permet la diffusion de l’apprentissage dans le réseau, et peut donc permettre une modularisation fonctionnelle en créant des zones aux frontières complexes, elle présente un défaut qui nous limite dans son utilisation : elle ne cherche pas à anticiper le signal forçant, et donc à minimiser TROISIEME PARTIE : RESULTATS
Mémorisation par forçage des dynamiques chaotiques dans les modèles connexionnistes récurrents l’influence de la perturbation induite. Ainsi, il n’est pas possible de mettre en application l’idée d’une reconnaissance par anticipation du signal forçant (5.2 Principes , p.98). Il est donc nécessaire ,dans un premier temps, de se tourner vers les règles à descente de gradient, afin de minimiser l’écart entre la dynamique du réseau et le signal de forçage extérieur. Malheureusement, comme nous l’avons déjà vu, les seules règles développées à ce jour réalisant cette descente de gradient sont soit non on-line, soit non locales, et perdent donc toute plausibilité biologique. Il sera donc nécessaire, dans les règles qui suivent, de perdre la possibilité de calcul d’un gradient exact, en les rendant on-line et locales. 8.3.1 Description La rétropropagation du gradient revient à faire parcourir à l’envers les erreurs réalisées par les sorties du réseau, afin de modifier à posteriori les poids synaptiques. Un tel comportement peut être plausible, puisqu’il existe bien dans le neurone biologique une transmission d’information du soma vers la synapse. Par contre, BPTT mémorise le passé du réseau afin de déterminer le gradient de l’erreur à chaque itération passée : il est donc off-line. Qu’en est-il si cet algorithme est rendu artificiellement on-line ? La première idée proposée fut de ne pas mémoriser les états passés du réseau, de laisser diffuser à l’envers l’erreur dans le réseau, et d’effectuer l’apprentissage sur l’erreur locale ainsi calculée (Figure 8-8). Figure 8-8 : Rétropropagation de l'erreur Cette méthode est similaire à celle utilisée par BPTT, ou par la rétropropagation, qui consiste à faire circuler à l’envers l’erreur des neurones de sortie. Ici, la sortie est représentée par le neurone que l’on veut forcer. La différence principale porte sur la conservation de la valeur des erreurs, à chaque itération. En effet, contrairement à BPTT, où l’apprentissage est réalisé tous les T itérations, et réinitialise à 0 les erreurs du réseau, dans le cas présenté ici, T vaut 1, et les erreurs ne sont par réinitialisées, afin de permettre leur diffusion dans le réseau. A chaque itération, le réseau propage à l’envers cette erreur aux neurones voisins. Dans le cas où il s’agit d’un réseau à mémoire, il est possible de s’inspirer de l’algorithme de Wan [[207]], qui a généralisé l’algorithme de rétropropagation du gradient aux réseaux multicouches feed-forward. Sa méthode consiste à convoluer le vecteur erreur avec le vecteur poids (Figure 8-9). ANTICIPATION DU FORÇAGE DES DYNAMIQUES 191
Page 1:
THESE présentée en vue d’obteni
Page 5 and 6:
Mémorisation par forçage neuronal
Page 7 and 8:
Mémorisation par forçage des dyna
Page 9 and 10:
Page 11 and 12:
Page 13 and 14:
Page 15 and 16:
Page 17 and 18:
Page 19 and 20:
Page 21:
Page 24 and 25:
Page 26 and 27:
26 Mémorisation par forçage des d
Page 28 and 29:
Page 30 and 31:
Page 32 and 33:
Page 34 and 35:
Page 36 and 37:
Page 38 and 39:
Page 40 and 41:
Page 42 and 43:
Page 44 and 45:
Page 46 and 47:
Page 48 and 49:
Page 50 and 51:
Page 52 and 53:
Page 54 and 55:
Page 56 and 57:
Page 58 and 59:
Page 60 and 61:
Page 62 and 63:
Page 65 and 66:
Page 67 and 68:
Page 69 and 70:
Page 71 and 72:
Page 73 and 74:
Page 75 and 76:
Page 77 and 78:
Page 79 and 80:
Page 81 and 82:
Page 83 and 84:
Page 85 and 86:
Page 87 and 88:
Page 89 and 90:
Page 91 and 92:
Page 93 and 94:
Page 95 and 96:
Page 97 and 98:
Page 99 and 100:
Page 101 and 102:
Page 103 and 104:
Page 105 and 106:
Page 107 and 108:
Page 109 and 110:
Page 111 and 112:
Page 113 and 114:
Page 115 and 116:
Page 117 and 118:
Page 119 and 120:
Page 121 and 122:
Page 123 and 124:
Page 125 and 126:
Page 128 and 129:
128 Mémorisation par forçage des
Page 130 and 131:
Page 132 and 133:
Page 134 and 135:
Page 136 and 137:
Page 138 and 139:
Page 140 and 141: Mémorisation par forçage des dyna
Page 189: Mémorisation par forçage des dyna
Page 205: Mémorisation par forçage des dyna
Page 208 and 209: 208 Mémorisation par forçage des
show all

Thèse Sciences Cognitives - Olivier Nerot

Create successful ePaper yourself

Delete template?

Save as template?