Thèse Sciences Cognitives - Olivier Nerot

Recommendations

Info

90 Mémorisation par forçage des dynamiques chaotiques dans les modèles connexionnistes récurrents (RTRL), l’algorithme est bien on-line, c’est à dire qu’un neurone n’a accès qu’à l’état des neurones de l’itération en cours, mais il est non-local. Dans la totalité des recherches réalisées à ce jour, aucune n’a réussi à associer les critères on-line et local dans un seul algorithme pour l’apprentissage de dynamiques dans les réseaux récurrents. Afin de rendre plausibles ces règles, nous proposerons d’effectuer des simplifications extrêmes de BPTT et de RTRL (8.3, p.190 et 8.4,p.195), les rendant tous deux On-line et local. 4.5.2 Faux gradients Dans les calculs aboutissant à RTRL, il existe plusieurs approximations. La première considère que les poids synaptiques ne varient pas au cours du temps. Or le rôle de l’apprentissage consiste bien à faire évoluer les poids. Les auteurs justifient cette hypothèse en supposant le gain d’apprentissage très petit. Or dans ce cas, il est nécessaire d’effectuer un très grand nombre de pas d’apprentissage, ce qui augmente encore les risques d’explosion du réseau (voir ci-dessous). La deuxième approximation considère que les poids sont indépendants entre eux. Or chaque modification de poids dépend de l’état de tous les autres poids du réseau, à k travers le calcul des pij . Ainsi les gradients calculés ne sont pas exacts, et cette inexactitude s’accumulant tout au long de l’apprentissage, il est possible que le réseau ne voit pas ses poids converger. Pour ce qui est de BPTT, celui-ci suppose que la totalité des états précédents soit mémorisée. Cette contrainte étant impossible à vérifier dans le cas de réseaux que l’on souhaite laisser évoluer pendant longtemps, plusieurs méthodes ont été imaginées, limitant ce besoin de mémoire. Toutes sont sources d’erreur pour le calcul du gradient. 4.5.3 Instabilité Dans certains cas, l’algorithme RTRL peut faire diverger les poids, en effet, l’équation : dp dt k ij k () t + p () t = s¢ ( h()) t x () t ij i j k montre bien que les pij peuvent diverger. En effet, il n’y a pas de seuillage par une fonction bornée. Nous avons parfois observé de telles divergences, que nous avons dû éliminer en réalisant un seuillage artificiel, ce qui fausse encore la précision du calcul du gradient. Dans ce k cas, bien souvent les pij saturent, ce qui crée un apprentissage selon une descente de gradient aussi approximative que le sera celle des apprentissages proposés. Ainsi, la nécessité d’un seuillage, ou d’une réinitialisation fréquente, montre que RTRL réalise des approximations qui, en s’accumulant, en limite l’efficacité. 4.6 Conclusion L’ajout de connexions récurrentes dans un réseau pose de nombreux problèmes qu’un algorithme aussi simple que la rétropropagation du gradient ne peut pas résoudre. L’une des principales causes de cette limitation est due au fait que l’état d’un neurone à l’instant t influence la dynamique de l’ensemble du réseau durant le reste de ses itérations , car l’état du réseau n’est PREMIERE PARTIE : ANALYSE
Mémorisation par forçage des dynamiques chaotiques dans les modèles connexionnistes récurrents pas effacé par les nouvelles entrées présentées au réseau, comme c’est le cas dans les architectures feed-forward. Il est donc nécessaire dans le cas des architectures récurrentes de tenir compte de la totalité du passé du réseau. Deux approches peuvent permettre de résoudre ce problème. La première consiste à mémoriser les états passés du réseau pour calculer un gradient exact au temps t, et correspond à l’algorithme de Temporal Back Propagation. La seconde consiste à calculer l’influence qu’aura l’état de chaque neurone sur le futur du réseau entier, c’est l’approche réalisée dans le Real Time Recurrent Learning. Ces deux approches ne sont pas plausibles biologiquement, puisqu’elles contredisent la nature on-line et locale du comportement connu actuellement du cerveau. Il est impossible de croire que chaque neurone mémorise l’ensemble de ses états précédents depuis sa naissance. Et, dans le cas où il existe une mémorisation pendant un temps fini, l’algorithme ne permet plus d’évaluer le gradient exact de l’erreur. D’autre part, il n’existe pas la moindre raison de penser que chaque neurone ait accès à la totalité des états des autres neurones. Ainsi, les deux méthodes utilisées pour calculer le gradient exact de l’erreur dans un réseau récurrent ne peuvent pas être acceptées comme plausibles biologiquement. D’autre part, ces deux types d’algorithmes requièrent tant de puissance de calcul et tant de mémoire, que leur application à de grands réseaux est impossible. Dans notre cas, il n’est pas envisageable de simuler 262144 neurones, avec ces principes d’apprentissage. Il est ainsi nécessaire d’imaginer que le gradient évalué n’est pas exact, et peut-être de chercher dans les règles d’inspiration hebbienne une solution au problème. En effet, les résultats obtenus avec certaines de ces règles semblent être conformes aux principes biologiques [[161]], et leur utilisation dans l’un de nos modèles nous a permis d’obtenir des segmentations de modules neuronaux à contours complexes. 4.7 Bibliographie [[5]] Amir Atiya. Unifying recurrent network trining algorithms. World congress on neural networks. Portland. Vol.3. p 585-588 (1993) [[7]] Alex Aussem (aaussem@eso.org). Training dynamical recurrent neural networks with the temporal recurrent back-propagation algorithm : application to the time series prediction and characterization. [[8]] Alex Aussem (aaussem@eso.org), Fion Murtagh, Marc Sarazin. Dynamical recurrent neural networks- towards environmental time series prediction.[[152]] Barak A. Pearlmutter. Dynamic Recurrent Neural Networks. Technical Report. CMU-CS-90-196. Carnegie Mellon University. Pittsburgh, PA 15213 (1990) [[30]] Thierry Catfolis. A method for improving the real-time recurrent learning algorithm. Neural Networks. p807-821. (1993). [[60]] J. Demongeot, O. Nérot, C. Jezequel. Mémoire de rappel dans les réseaux de neurones. [[77]] Lee Giles (giles@research.nj.nec.com), B.G. Horne, T.Lin. Learning a class of large finite state machines with a recurrent neural network. Technical report. UMIACS-TR-94-94. Institue for advanced computer studies. University of Maryland. (1994) APPRENTISSAGE DANS LES RESEAUX RECURRENTS 91
Page 1:
THESE présentée en vue d’obteni
Page 5 and 6:
Mémorisation par forçage neuronal
Page 7 and 8:
Mémorisation par forçage des dyna
Page 9 and 10:
Page 11 and 12:
Page 13 and 14:
Page 15 and 16:
Page 17 and 18:
Page 19 and 20:
Page 21:
Page 24 and 25:
Page 26 and 27:
26 Mémorisation par forçage des d
Page 28 and 29:
Page 30 and 31:
Page 32 and 33:
Page 34 and 35:
Page 36 and 37:
Page 38 and 39:
Page 40 and 41: 40 Mémorisation par forçage des d
Page 48 and 49: Mémorisation par forçage des dyna
Page 89: Mémorisation par forçage des dyna
Page 128 and 129: 128 Mémorisation par forçage des
Page 140 and 141:
Page 143 and 144:
Page 145 and 146:
Page 147 and 148:
Page 149 and 150:
Page 151 and 152:
Page 153 and 154:
Page 155 and 156:
Page 157 and 158:
Page 159 and 160:
Page 161 and 162:
Page 163 and 164:
Page 165 and 166:
Page 167 and 168:
Page 169 and 170:
Page 171 and 172:
Page 173 and 174:
Page 175 and 176:
Page 177 and 178:
Page 179 and 180:
Page 181 and 182:
Page 183 and 184:
Page 185 and 186:
Page 187 and 188:
Page 189 and 190:
Page 191 and 192:
Page 193 and 194:
Page 195 and 196:
Page 197 and 198:
Page 199 and 200:
Page 201 and 202:
Page 203 and 204:
Page 205:
Page 208 and 209:
208 Mémorisation par forçage des
Page 210 and 211:
Page 212 and 213:
Page 214 and 215:
Page 216 and 217:
Page 218 and 219:
Page 220 and 221:
Page 222 and 223:
Page 224 and 225:
Page 226 and 227:
Page 228 and 229:
show all

Thèse Sciences Cognitives - Olivier Nerot

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?