Thèse Sciences Cognitives - Olivier Nerot

Recommendations

Info

82 Mémorisation par forçage des dynamiques chaotiques dans les modèles connexionnistes récurrents présentons dans cette partie, l’ensemble des algorithmes qui permettent de réaliser l’apprentissage par descente de gradient dans les réseaux récurrents, en espérant ainsi dégager des principes qui peuvent être appliqués à nos réseaux. Dans tous les paragraphes qui suivent, l’ensemble S, de cardinal N, des neurones est séparé en trois sous-ensembles : Se, les neurones d’entrée (ces neurones possédant une entrée additive I t i ()), Sc, les neurones cachés, et Ss, les neurones de sortie (Figure 4-1). Cette partition de l’ensemble des neurones, classique dans le connexionnisme, peut être rapprochée du schéma utilisé pour représenter le système et son environnement (Figure 4-1). Les apprentissages évoqués ici permettent de faire suivre la dynamique désirée à chacun des neurones de sortie. Dans les développements qui suivent, nous définirons : xi(t), la sortie du neurone i au temps t pour i S s Î , x$ () t , la sortie désirée du neurone i i et m p (), t les paramètres du réseau au temps t L’erreur instantanée d’un neurone de sortie est alors définie par : 1 Et () = x$() t -x () t 2 å( i i ) iÎSS La descente de gradient revient à modifier au cours du temps les paramètres du réseau pour minimiser cette erreur. Or, l’évolution de l’erreur au cours du temps est donnée par : Ainsi, si nous posons d m dt p dE dt R dE dm p å dm dt = p= 1 PREMIERE PARTIE : ANALYSE p dE =- h , avec h > 0 , il est garanti que dm dE < 0 dt Dans le cas où les paramètres du réseau sont les poids w ij , soit : La règle d’apprentissage revient à : p { m 1 ,..., m p,..., m R } = { w11 , ,..., wi, j,..., wNN , } dw dt ij dE =-h dw Cette dernière équation montre qu’une des méthodes d’évolution des paramètres du système consiste à évaluer dE dWij , qui peut être calculé à partir des équations de propagation 29 qui sont (avec s, une fonction sigmoïde, appelée aussi fonction neurone) : 29 Il est possible de passer simplement du cas discret au cas continu... ij 2
Mémorisation par forçage des dynamiques chaotiques dans les modèles connexionnistes récurrents ou å ìhi() t = wij () t xj() t ï jÎS í îïxi( t + 1) = s( hi( t)) + Ii() t * ìdhi * * ï () t + hi () t = åwij () t xj() t ídt jÎS ï * * îxi() t = s( hi( t)) + Ii() t 4.4.1 Recurrent back-propagation en temps discret en temps continu Cet apprentissage utilise la descente de gradient pour faire apprendre des points fixes à des réseaux récurrents, en utilisant les règles de dérivation en chaîne. En effet : Ce qui donne, avec xi h i E w E xi hi = x h w ij i = s ¢( hi( t)) ,et hi w E w ij i = x (): t s E = ¢( hi()) t xj() t x ij i Cette dernière équation montre qu’il est possible d’exprimer E en fonction de E , que l’on peut calculer en utilisant la technique de dérivation en chaîne (en déroulant les calculs à partir des neurones de sortie) qui est définie de façon récursive par: Ce qui amène, en posant z i + N + E E E x = + å x x x x i i j = 1 j + E E = et ei = = x$ i - xi : x x i N x N j x j h N j zi = ei + åzj = ei + åzj = e + åz s¢ ( h ) w x h x i i j j ji j= 1 i j= 1 j i j= 1 Les équations d’évolution des poids amènent alors à dw dt ij E =- h =- ¢ h zx w hs ( ) ij j APPRENTISSAGE DANS LES RESEAUX RECURRENTS 83 ij j i i i j Ainsi, cette technique de descente de gradient peut se résumer aux équations suivantes : w ij x i
Page 1:
THESE présentée en vue d’obteni
Page 5 and 6:
Mémorisation par forçage neuronal
Page 7 and 8:
Mémorisation par forçage des dyna
Page 9 and 10:
Page 11 and 12:
Page 13 and 14:
Page 15 and 16:
Page 17 and 18:
Page 19 and 20:
Page 21:
Page 24 and 25:
Page 26 and 27:
26 Mémorisation par forçage des d
Page 28 and 29:
28 Mémorisation par forçage des d
Page 30 and 31:
Page 32 and 33: 32 Mémorisation par forçage des d
Page 48 and 49: Mémorisation par forçage des dyna
Page 81: Mémorisation par forçage des dyna
Page 128 and 129: 128 Mémorisation par forçage des
Page 132 and 133:
132 Mémorisation par forçage des
Page 134 and 135:
Page 136 and 137:
Page 138 and 139:
Page 140 and 141:
Page 143 and 144:
Page 145 and 146:
Page 147 and 148:
Page 149 and 150:
Page 151 and 152:
Page 153 and 154:
Page 155 and 156:
Page 157 and 158:
Page 159 and 160:
Page 161 and 162:
Page 163 and 164:
Page 165 and 166:
Page 167 and 168:
Page 169 and 170:
Page 171 and 172:
Page 173 and 174:
Page 175 and 176:
Page 177 and 178:
Page 179 and 180:
Page 181 and 182:
Page 183 and 184:
Page 185 and 186:
Page 187 and 188:
Page 189 and 190:
Page 191 and 192:
Page 193 and 194:
Page 195 and 196:
Page 197 and 198:
Page 199 and 200:
Page 201 and 202:
Page 203 and 204:
Page 205:
Page 208 and 209:
Page 210 and 211:
Page 212 and 213:
Page 214 and 215:
Page 216 and 217:
Page 218 and 219:
Page 220 and 221:
Page 222 and 223:
Page 224 and 225:
Page 226 and 227:
Page 228 and 229:
show all

Thèse Sciences Cognitives - Olivier Nerot

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?