Thèse Sciences Cognitives - Olivier Nerot

Recommendations

Info

Mémorisation par forçage des dynamiques chaotiques dans les modèles connexionnistes récurrents afin d’en dégager les principes qui peuvent nous orienter dans la mise au point de règles d’apprentissage implantables dans les réseaux récurrents, qui conservent ces critères de plausibilité biologique (4.5 Limites, p.89). Nous tenterons dans ce chapitre de dégager les quelques idées qui nous serons utiles pour la phase d’apprentissage, en nous permettant de dégager un algorithme plus plausible biologiquement que ceux de RTRL ou de BPTT. 4.2 Apprentissage Hebbien Cette règle date de 1949 [[88]], et l’on oublie souvent l’interprétation première de Hebb, qui y voyait l’un des principes permettant le rappel et le renforcement d’une activité cérébrale : 80 Let us assume that the persistence or repetition of a reverbatory activity tends to induce lasting cellular changes that add to its stability [...] When an axon of cell A is near enough to excite a cell B and repeatedly or persistently takes part in firing it, some growth process or metabolic change takes place in one or both cells such that A’s efficiency, as one of the cells firing B, is increased. Ce terme de réverbération revient dans d’autres propos de Hebb : PREMIERE PARTIE : ANALYSE Hebb. The organisation of behaviour. (1949) It seems that short term memory may be a reverberation in the closed loops of the cell assembly and between cell assemblies, whereas long term memory is more structural, a lasting change of synaptic connections. Hebb & Donderi. (1987) Il semble donc que Hebb interprétait ses règles d’apprentissage en terme de dynamique. Pourtant cette règle, dans son formalisme courant, est une règle qui symétrise les poids synaptiques, et qui conduit le réseau vers des dynamiques à point fixe 28 . En effet, la règle hebbienne, telle qu’elle est couramment formalisée suit une loi du type : dwij =axx i j qui vérifie dwij=dwji, ce qui finit par amener wij=wji, et donc à figer les dynamiques du réseau. Un tel phénomène peut se voir sur la Figure 8-2, page 187, où l’attracteur finit par converger vers un point fixe. Il est donc nécessaire. Si l’on souhaite rappeler des dynamiques passées, il s’avère nécessaire de trouver une règle qui puisse modifier les attracteurs du réseau, sans les ramener pour autant à de simples points fixes. 4.3 Maximisation de l'entropie de sortie Ce résultat, dû à Chapeau-Blondeau [[42]], permet de justifier l’approche de l’apprentissage hebbien, par la maximisation de l’entropie de sortie de chaque neurone. En effet, dans le cas d’un neurone possédant une fonction sigmoïde du type : 28 Faut-il voir là un phénomène similaire à celui qui se manifeste chez les personnes agées, qui tendent à réitérer les mêmes comportements ?
Mémorisation par forçage des dynamiques chaotiques dans les modèles connexionnistes récurrents 1 y= f( x) = -b( wx-q) 1+ e Il est possible de définir l’entropie de l’état d’un neurone par ¥ ò -¥ x 2 x H( x) = p ( x).log p ( x). dx La modification de cette entropie, lors du passage par la fonction neurone f, donne : H( y) = H( x) + H ( x) avec H ( x) = p ( x).log f ¢ ( x). dx trans trans ¥ ò -¥ x 2 Si l’on cherche alors à maximiser Htrans, ce qui revient à maximiser H(y) pour un x donné, et donc à maximiser l’entropie de sortie d’un neurone, il est possible de modifier les paramètres q et w de la fonction f, par : Soit, après calculs : d H et dt dw q H a a q dt w = = trans trans d y et dt dw q æ 1 1 ö = 2ab( - 2) = aç + b( x-2 xy) ÷ , avec pour u=f(x), u = u x px x dx dt è w ø ò ( ). ( ). L’intérêt de ce calcul est de faire apparaître dans l’apprentissage sur les poids, un terme en xy, qui rapproche une telle évolution de celle d’un apprentissage hebbien. Ainsi, le rôle d’un apprentissage hebbien peut être de maximiser l’entropie informationnelle de sortie des neurones. 4.4 Descente du gradient de l’erreur L’algorithme de rétropropagation du gradient permet de faire apprendre à un réseau de neurones feed-forward multicouches des associations entrée-sortie. Dans cette architecture, l’information ne se propage que dans un sens, de l’entrée vers la sortie, confortant un peu plus le paradigme de boucle perception-action. Une telle architecture, de type perceptron multicouches, ne peut pas produire de sortie dynamique sans posséder de rétroaction dans son architecture. L’algorithme de rétropropagation du gradient fut ensuite généralisé aux Figure 4-1 : Partition des neurones architectures récurrentes, tout d’abord pour l’apprentissage de points fixes, puis en vue de l’apprentissage de séries temporelles. Nous APPRENTISSAGE DANS LES RESEAUX RECURRENTS 81 ¥ -¥
Page 1:
THESE présentée en vue d’obteni
Page 5 and 6:
Mémorisation par forçage neuronal
Page 7 and 8:
Mémorisation par forçage des dyna
Page 9 and 10:
Page 11 and 12:
Page 13 and 14:
Page 15 and 16:
Page 17 and 18:
Page 19 and 20:
Page 21:
Page 24 and 25:
Page 26 and 27:
26 Mémorisation par forçage des d
Page 28 and 29:
28 Mémorisation par forçage des d
Page 30 and 31: Mémorisation par forçage des dyna
Page 32 and 33: 32 Mémorisation par forçage des d
Page 79: Mémorisation par forçage des dyna
Page 128 and 129: 128 Mémorisation par forçage des
Page 130 and 131:
Page 132 and 133:
132 Mémorisation par forçage des
Page 134 and 135:
Page 136 and 137:
Page 138 and 139:
Page 140 and 141:
Page 143 and 144:
Page 145 and 146:
Page 147 and 148:
Page 149 and 150:
Page 151 and 152:
Page 153 and 154:
Page 155 and 156:
Page 157 and 158:
Page 159 and 160:
Page 161 and 162:
Page 163 and 164:
Page 165 and 166:
Page 167 and 168:
Page 169 and 170:
Page 171 and 172:
Page 173 and 174:
Page 175 and 176:
Page 177 and 178:
Page 179 and 180:
Page 181 and 182:
Page 183 and 184:
Page 185 and 186:
Page 187 and 188:
Page 189 and 190:
Page 191 and 192:
Page 193 and 194:
Page 195 and 196:
Page 197 and 198:
Page 199 and 200:
Page 201 and 202:
Page 203 and 204:
Page 205:
Page 208 and 209:
Page 210 and 211:
Page 212 and 213:
Page 214 and 215:
Page 216 and 217:
Page 218 and 219:
Page 220 and 221:
Page 222 and 223:
Page 224 and 225:
Page 226 and 227:
Page 228 and 229:
show all

Thèse Sciences Cognitives - Olivier Nerot

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?