21.01.2015 Views

Épreuve de contrôle - L2C2 - CNRS

Épreuve de contrôle - L2C2 - CNRS

Épreuve de contrôle - L2C2 - CNRS

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Intelligence artificielle et évolution : modélisation neurobiologique<br />

271<br />

<strong>de</strong> l’individu. Dans la secon<strong>de</strong> expérience, l’AE enco<strong>de</strong> les règles <strong>de</strong> plasticité<br />

synaptique régissant la modification <strong>de</strong>s poids synaptiques, qui peuvent donc<br />

varier au cours <strong>de</strong> la vie <strong>de</strong> l’individu. Les auteurs montrent que la propriété <strong>de</strong><br />

plasticité synaptique, en plus <strong>de</strong> l’adaptation au cours <strong>de</strong>s générations, permet<br />

au robot d’avoir un comportement plus flui<strong>de</strong> et moins stérotypé que dans le<br />

cas où aucune modification n’est possible au cours <strong>de</strong> sa vie. La performance<br />

<strong>de</strong>s individus évolués pour lesquels les poids synaptiques peuvent varier<br />

pendant la vie est alors nettement meilleure. Cette expérience montre que<br />

la plasticité synaptique peut servir, non seulement à stocker les événements<br />

en induisant une forme <strong>de</strong> mémoire (voir section 3.2), mais aussi à réguler<br />

l’activité neuronale.<br />

Nolfi et Floreano cherchent à reproduire les prédictions théoriques <strong>de</strong><br />

Dawkins et Krebs sur le lien entre coévolution et course à l’armement en<br />

biologie. On parle <strong>de</strong> coévolution lorsque l’évolution <strong>de</strong> <strong>de</strong>ux espèces est<br />

interdépendante. C’est par exemple le cas d’un couple prédateur-proie, où la<br />

proie doit échapper au prédateur pour survivre, tandis que le prédateur doit<br />

attraper la proie pour se nourrir. Dawkins et Krebs supposent que l’amélioration<br />

relative <strong>de</strong>s techniques <strong>de</strong> défense et <strong>de</strong> prédation (la course à l’armement) que<br />

l’on trouve chez les espèces animales au cours <strong>de</strong> l’évolution est liée à cette<br />

interaction réciproque entre les proies et les prédateurs. On parle également<br />

<strong>de</strong> l’effet Reine Rouge (van Valen, 1973), en référence à la reine rouge dans le<br />

livre De l’autre côté du miroir, <strong>de</strong> L. Carroll. Dans un passage <strong>de</strong> ce livre, Alice<br />

rencontre une reine rouge, qui doit courir <strong>de</strong> plus en plus vite pour rester sur<br />

place. Ainsi, dans l’évolution, les espèces doivent s’adapter constamment pour<br />

rester à la hauteur <strong>de</strong>s autres espèces avec lesquelles elles coévoluent.<br />

Dans l’expérience <strong>de</strong> Nolfi et Floreano, <strong>de</strong>ux robots aux capacités différentes<br />

sont mis ensemble dans un environnement clos. Le robot prédateur dispose d’un<br />

système <strong>de</strong> vision artifielle et <strong>de</strong> capteurs infrarouge <strong>de</strong> proximité, tandis que<br />

le robot proie ne dispose que <strong>de</strong> capteurs <strong>de</strong> proximité, mais peut se déplacer<br />

<strong>de</strong>ux fois plus rapi<strong>de</strong>ment que le robot prédateur. Les calculs <strong>de</strong> performance<br />

sont partagés entre les <strong>de</strong>ux espèces : si au cours du temps <strong>de</strong> la simulation, le<br />

prédateur touche la proie, le prédateur obtient la valeur <strong>de</strong> performance maximale.<br />

S’il n’y a aucun contact tout au long <strong>de</strong> la simulation, la proie obtient la<br />

valeur <strong>de</strong> performance maximale.<br />

<strong>Épreuve</strong> <strong>de</strong> <strong>contrôle</strong><br />

Les auteurs montrent que la pression <strong>de</strong> sélection est initialement la plus forte<br />

pour le prédateur, afin qu’il arrive à toucher le robot proie. Puis, la pression <strong>de</strong><br />

sélection se reporte sur le robot proie, afin que celui-ci échappe au prédateur. Le<br />

prédateur va alors découvrir une nouvelle stratégie pour contrer la stratégie <strong>de</strong><br />

la proie, et ainsi <strong>de</strong> suite. Un <strong>de</strong>s intérêts <strong>de</strong> cette approche est qu’elle permet<br />

<strong>de</strong> contourner le problème <strong>de</strong> l’amorçage <strong>de</strong> l’évolution (voir section 2.2.1) :<br />

puisque les proies et les prédateurs se partagent la valeur <strong>de</strong> performance, il y<br />

a toujours un vainqueur et un vaincu. Les valeurs <strong>de</strong> performances ne peuvent<br />

être nulles simultanément pour tous les individus.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!