11.07.2015 Views

Simulation de perception humaine limitée : étude de l ... - Pages perso

Simulation de perception humaine limitée : étude de l ... - Pages perso

Simulation de perception humaine limitée : étude de l ... - Pages perso

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

<strong>Simulation</strong> <strong>de</strong> <strong>perception</strong> <strong>humaine</strong> <strong>limitée</strong> :étu<strong>de</strong> <strong>de</strong> l’influence d’un paramètre <strong>de</strong> seuilUtku Görkem Ketenci a,butku.ketenci@ifsttar.frEmmanuelle Grislin-Le Strugeon bemmanuelle.grislin@univ-valenciennes.frJean Michel Auberlet aauberlet@ifsttar.fra Université Paris Est, LEPSIS, IFSTTAR58, boulevard Lefebvre 75732 Paris Ce<strong>de</strong>x 15b Univ. Lille Nord <strong>de</strong> France, UVHC, LAMIH,F-59313 Valenciennes, FranceRoland Brémond aroland.bremond@ifsttar.frRésuméLes Systèmes Multi-Agents constituent désormaisune <strong>de</strong>s approches fréquemment utiliséesdans un objectif <strong>de</strong> modélisation et <strong>de</strong> simulation<strong>de</strong> trafic routier. Des progrès restent toutefoisà accomplir en vue d’améliorer le réalisme<strong>de</strong>s comportements humains simulés, dontle comportement <strong>de</strong>s conducteurs automobiles.En particulier, si le processus <strong>de</strong> décision a faitl’objet <strong>de</strong> nombreux travaux, le processus <strong>de</strong><strong>perception</strong> a été relativement peu approfondi.Notre hypothèse est qu’une amélioration pourraitprovenir <strong>de</strong> la prise en compte <strong>de</strong> la limitation<strong>de</strong> capacité <strong>de</strong> la <strong>perception</strong> simulée. Cetravail vise ainsi à intégrer un seuil <strong>de</strong> <strong>perception</strong>à un modèle d’agent afin d’étudier son influencesur le comportement global du trafic simulé.Mots-clés : agent, <strong>perception</strong>, simulation multiagentsAbstractMulti-Agent Systems are one of the approachesfrequently used to mo<strong>de</strong>l and simulate road traffic.There are still advances to realize yet in or<strong>de</strong>rto improve the realism of the simulated humanbehaviors, including the behavior of thedrivers. While the <strong>de</strong>cision process has been studiedin numerous works, the <strong>perception</strong> processhas been less <strong>de</strong>eply adressed. Our hypothesisis that taking into account the boun<strong>de</strong>d capacityof the simulated <strong>perception</strong> may improve the simulations.This work aims thus to integrate a<strong>perception</strong> threshold to the agent mo<strong>de</strong>l, and tostudy its influence on the global behavior of thesimulated traffic.Keywords: agent, <strong>perception</strong>, multi-agent simulation1 IntroductionLes Systèmes Multi-Agents (SMA) sont utilisés<strong>de</strong>puis plusieurs années en simulation <strong>de</strong> traficroutier [5, 20, 7], en particulier dans le cadre <strong>de</strong>smodélisations dites « microscopiques » du trafic,dans lesquelles le comportement <strong>de</strong> chaqueentité est simulé. Il reste toutefois <strong>de</strong>s progrès àaccomplir en terme <strong>de</strong> réalisme, en particulierconcernant le comportement <strong>de</strong>s conducteurs.La modélisation orientée agent du conducteur aété principalement étudiée du point <strong>de</strong> vue <strong>de</strong> larésolution <strong>de</strong> problème [19]. Or, dans le cadre<strong>de</strong> l’acci<strong>de</strong>ntologie <strong>de</strong>s transports, la simulation<strong>de</strong> la <strong>perception</strong> présente également un intérêtcertain [13].La <strong>perception</strong> a été relativement peu étudiéedans le cadre <strong>de</strong>s SMA. Dans les modèlesd’agents, si le module décisionnel a fait l’objet<strong>de</strong> nombreux travaux, le module <strong>de</strong> <strong>perception</strong>est souvent réduit à un filtre passif. Le processus<strong>de</strong> <strong>perception</strong> est pourtant complexe dès lorsque l’on considère les actions à réaliser pour :– d’une part, passer <strong>de</strong>s données brutes perçuesà leur interprétation ;– d’autre part, prendre en compte le double aspect<strong>de</strong> la <strong>perception</strong>, qui comprend à la foisla réception d’événements et la prise d’information.C’est sur ce <strong>de</strong>rnier point que nous noussommes focalisés. Les <strong>de</strong>ux facettes du processuscorrespon<strong>de</strong>nt respectivement à la <strong>perception</strong>passive, avec la détection <strong>de</strong> signaux parles capteurs (réels ou simulés) pour les agentsartificiels, ce qui correspond à la réception involontaired’évènements sensoriels pour les humains,et la <strong>perception</strong> active, qui est la <strong>perception</strong>dirigée par la décision, dans laquelle l’état<strong>de</strong> certains éléments <strong>de</strong> l’environnement est volontairementdétecté [17]. Cet aspect actif <strong>de</strong> la


<strong>perception</strong> avait été souligné par Ballard [4].En simulation multi-agents, la <strong>perception</strong> passiveconsiste à « capter » dans l’environnementtous les éléments accessibles. De tellesmétho<strong>de</strong>s <strong>de</strong> <strong>perception</strong> limitent généralementla zone d’accessibilité (par une simulation duchamp visuel par exemple), mais permettentune recherche exhaustive dans cette zone, avantd’appliquer un filtrage dépendant <strong>de</strong> l’objectif<strong>de</strong> l’agent. Par exemple, dans le contexte d’unesituation <strong>de</strong> carrefour encombré, cela consiste àpermettre l’accès à toutes les informations surtous les objets présents dans la zone considéréeet susceptibles d’interagir avec l’agent.Or cette approche peut apparaître peu réalistedès lors qu’il s’agit <strong>de</strong> simuler la <strong>perception</strong> <strong>humaine</strong>.Par exemple, dans le contexte d’une situation<strong>de</strong> carrefour encombré, cette procédurepermet l’accès à toutes les informations sur tousles objets présents dans la zone considérée etsusceptibles d’interagir avec l’agent. Or, il a étémontré en psychologie [22] que la charge cognitiveinflue sur les prises <strong>de</strong> décision <strong>de</strong> l’opérateurhumain : celui-ci ne serait capable <strong>de</strong> percevoiret traiter qu’un volume limité d’informationsà la fois [22, 21]. Dans le cadre <strong>de</strong> laconduite automobile, cela pourrait se traduirepar la prise en compte d’une partie seulement<strong>de</strong>s éléments susceptibles d’entrer en interactionavec la trajectoire planifiée du conducteur.C’est l’hypothèse à la base <strong>de</strong>s travaux présentésci-<strong>de</strong>ssous. A terme, l’objectif est <strong>de</strong> montrerque l’introduction d’une <strong>perception</strong> <strong>limitée</strong> permet<strong>de</strong> rendre plus réaliste le comportement <strong>de</strong>sconducteurs simulés. La validation <strong>de</strong> la propositionutilisera <strong>de</strong>s données réelles en carrefour.Le contexte <strong>de</strong> la <strong>perception</strong> agent et <strong>de</strong> sa capacité<strong>limitée</strong> est présenté en partie 2. Un modèle<strong>de</strong> <strong>perception</strong> à capacité <strong>limitée</strong> est proposé enpartie 3. Ce modèle est appliqué dans le cadre<strong>de</strong> la simulation <strong>de</strong> conducteurs automobiles enpartie 4. Les résultats <strong>de</strong>s tests réalisés sur labase <strong>de</strong> données issues d’un carrefour réel sontprésentés en partie 5, avant <strong>de</strong> conclure.2 Modélisation <strong>de</strong> la <strong>perception</strong>agent2.1 Les agents situésLes agents principalement concernés par la modélisation<strong>de</strong> la <strong>perception</strong> sont les agents situésqui sont particulièrement dépendants <strong>de</strong> leur environnement.Un agent situé perçoit son environnementvia <strong>de</strong>s capteurs. Dans un contexte<strong>de</strong> simulation, ces capteurs se situent à l’interfaceentre les entités <strong>de</strong> l’environnement etl’agent. Les données issues <strong>de</strong> ces capteurs sontinterprétées par l’agent en fonction <strong>de</strong> la représentationqu’il a <strong>de</strong> son environnement.Le processus <strong>de</strong> <strong>perception</strong> <strong>de</strong> l’environnementproduit un ensemble <strong>de</strong> percepts, qui seront utiliséspar l’agent pour déci<strong>de</strong>r <strong>de</strong>s prochaines actionsà réaliser. La <strong>perception</strong> est classiquementdivisée en trois phases principales :1. L’acquisition <strong>de</strong> données représente l’étape<strong>de</strong> <strong>perception</strong> « sensorielle » qui consiste àacquérir un ensemble <strong>de</strong> données sur l’environnementà l’ai<strong>de</strong> <strong>de</strong> capteurs, réels (caméraou capteurs infra-rouge pour un robotpar exemple) ou simulés (accès à certainséléments d’une base <strong>de</strong> données pourun agent logiciel par exemple).2. L’interprétation consiste à faire correspondre<strong>de</strong>s représentations d’éléments <strong>de</strong>l’environnement aux données issues <strong>de</strong> laphase d’acquisition. Par exemple, reconnaîtrel’objet « table » pour le robot, ouun véhicule arrivant <strong>de</strong> la droite pour leconducteur simulé.3. Le filtrage a pour but <strong>de</strong> sélectionner unepartie <strong>de</strong>s percepts obtenus, afin <strong>de</strong> fourniruniquement <strong>de</strong>s données pertinentes, potentiellementutiles au processus <strong>de</strong> décision.Dans le contexte <strong>de</strong> la simulation <strong>de</strong> trafic, lemodèle standard <strong>de</strong> <strong>perception</strong> est un modèle<strong>de</strong> <strong>perception</strong> passive, dans lequel l’agent reçoit<strong>de</strong>s stimuli externes. En phase <strong>de</strong> <strong>perception</strong>,l’agent reçoit autant <strong>de</strong> données que possibles,sans qu’il lui soit nécessaire <strong>de</strong> raisonner quant àses besoins en terme <strong>de</strong> percepts. Concrètement,le conducteur simulé perçoit tout ce qui lui estaccessible, avec parfois une restriction sur cetensemble <strong>de</strong> données, restriction liée à la représentationdu champ visuel par exemple.A l’opposé, la <strong>perception</strong> active est une <strong>perception</strong>dirigée par les besoins <strong>de</strong> l’agent. L’agentexplicite les éléments qu’il lui faut percevoirdans son environnement en fonction <strong>de</strong>s besoinsliés à la tâche en cours : par exemple, j’ai besoin<strong>de</strong> savoir si la cellule X est libre avant <strong>de</strong> medéplacer, je capte donc son état actuel.Ces <strong>de</strong>ux mo<strong>de</strong>s <strong>de</strong> <strong>perception</strong>, active et passive,correspon<strong>de</strong>nt aux <strong>de</strong>ux processus d’information<strong>de</strong> la <strong>perception</strong> <strong>humaine</strong> [15, 18], quiest caractérisée par :


– un processus top-down, dirigé par les buts :les humains portent attention à certains élémentsenvironnementaux en fonction <strong>de</strong> leursbuts ou intentions, qui déterminent la pertinence<strong>de</strong>s informations obtenues.– un processus bottom up, dirigé par les données: l’attention est conditionnée par l’attractivité(appelée également « saillance »)<strong>de</strong>s données, à savoir la capacité <strong>de</strong>s items <strong>de</strong>l’environnement à capter, ou retenir, plus oumoins l’attention.Ce double aspect <strong>de</strong> la <strong>perception</strong> est intégrédans différents modèles d’agents.Par exemple, le système <strong>de</strong> <strong>perception</strong> active décritpar Ferber [11] reçoit simultanément l’informationen provenance <strong>de</strong>s capteurs d’une part,les attentes et les buts en fonction <strong>de</strong> l’état interne<strong>de</strong> l’agent d’autre part.Le modèle d’agent <strong>de</strong> dialogue proposé par Chimiret al. [8] intègre un cycle qui prend égalementen compte les <strong>de</strong>ux processus <strong>de</strong> <strong>perception</strong>.Ce cyle, basé sur les travaux <strong>de</strong> Neisser[23] sur la modélisation <strong>de</strong> la <strong>perception</strong> <strong>humaine</strong>,comprend un ensemble <strong>de</strong> schémas d’anticipationqui préparent à la réception d’événementssensoriels et gui<strong>de</strong>nt l’exploration <strong>de</strong>l’environnement (Fig 1). Ce cycle comprendl’actualisation <strong>de</strong> la représentation <strong>de</strong> l’environnementen fonction <strong>de</strong>s changements détectés.Une métho<strong>de</strong> similaire est utilisée dans [25] afin<strong>de</strong> court-circuiter le processus <strong>de</strong> décision et <strong>de</strong>passer directement à l’action suivante lorsqueles changements sont négligeables.Env.ÉvénementssensorielsI<strong>de</strong>ntificationActualisationScript <strong>de</strong> <strong>perception</strong>Schémasd'anticipationFIGURE 1 – Le cycle i<strong>de</strong>ntification / actualisation, d’après [8].Dans l’architecture d’agent situé proposée dans[26], le module <strong>de</strong> <strong>perception</strong> comprend un filtrageréalisé lors <strong>de</strong> la capture <strong>de</strong> données par lebiais d’une sélection <strong>de</strong> l’attention dirigée par lemodule décisionnel (Fig. 2).L'état actuel <strong>de</strong>l'environnementLes loisperceptuellesFocusCapteurAcquisitionrPerceptionInterprétationpSélection <strong>de</strong> FocusDécisionSélection <strong>de</strong> FiltreFiltragePerceptsFIGURE 2 – Modèle <strong>de</strong> <strong>perception</strong> active,d’après Weyns[26].2.2 Aspects <strong>de</strong> la <strong>perception</strong> en science cognitivePuisque notre objectif est d’améliorer le réalisme<strong>de</strong> la simulation <strong>de</strong> certains comportementshumains, il nous est apparu intéressant <strong>de</strong>nous pencher sur les travaux relatifs à la <strong>perception</strong>dans le domaine <strong>de</strong>s sciences cognitives.Perception active et passive. Plusieurs aspects <strong>de</strong>la <strong>perception</strong> active ont été considérés en psychologieet en sciences cognitives.En psychologie cognitive, la boucle standard estla boucle <strong>perception</strong>-cognition-décision-action.Cependant, certains auteurs remet en cause l’aspect« bottom-up » <strong>de</strong> ce processus <strong>de</strong> traitement<strong>de</strong> l’information, et proposent un schémainversé dans lequel c’est l’action qui comman<strong>de</strong>la <strong>perception</strong> [6].La littérature sur l’attention, en psychologie,s’est notamment interessée au concept <strong>de</strong>saillance visuelle, y compris en proposant <strong>de</strong>salgorithmes <strong>de</strong> calcul <strong>de</strong> la « carte saillance », <strong>de</strong>manière à selectionner les éléments qui attirentl’attention dans une scène visuelle [14]. Gibsona proposé une théorie « écologique » <strong>de</strong> la <strong>perception</strong>,dans laquelle les « affordances » <strong>de</strong>s objets<strong>de</strong> l’environnement impactent directementla sélection attentionnelle [12]. Ces affordancesdépen<strong>de</strong>nt fortement <strong>de</strong> la tâche en cours.Perception <strong>limitée</strong>. Un modèle <strong>de</strong> la mémoire<strong>humaine</strong> bien connu est celui proposé par Atkinsonet Shiffrin [2], incluant trois étapes <strong>de</strong>traitement et d’enregistrement <strong>de</strong>s informationspar :– la mémoire sensorielle qui sert à convertir lessignaux en données compréhensibles ;


– la mémoire à court terme qui sert à traiter l’informationcourante ;– la mémoire à long terme qui permet <strong>de</strong> stockerl’information en vue d’une utilisation future.Dans le cadre <strong>de</strong> la simulation <strong>de</strong> la <strong>perception</strong><strong>humaine</strong>, ce sont les <strong>de</strong>ux premières étapes quisont concernées.La première étape fait l’objet <strong>de</strong> travaux, principalementdans les domaines <strong>de</strong> la robotiqueet <strong>de</strong> la réalité virtuelle, portant sur le champvisuel, les occultations d’objets, la fixation <strong>de</strong>l’attention [4].La <strong>de</strong>uxième étape est celle qui nous intéresseplus particulièrement dans le cadre <strong>de</strong>s travauxprésentés ici. Il est couramment admis enpsychologie cognitive que la mémoire à courtterme, ou « mémoire <strong>de</strong> travail », est <strong>limitée</strong> nonseulement en durée, mais également en nombred’unités d’information (« chunks ») pouvant êtretraitées à la fois (une unité d’information pouvantreprésenter un nombre, un mot, une positionaux échecs, un visage, ...). Les auteurs nes’accor<strong>de</strong>nt toutefois pas sur ce nombre d’unitésmaximal, longtemps supposé compris entre5 et 9 [22]. Ce nombre est désormais remis encause, le seuil étant considéré plus faible et variableselon <strong>de</strong> nombreux facteurs [10], notammentla charge mentale.Cette caractéristique — les humains ne peuventtraiter qu’un nombre limité <strong>de</strong> données simultanément— peut être modélisée par un filtragequantitatif intervenant dans le processus <strong>de</strong> <strong>perception</strong>: si le but courant requiert un volume<strong>de</strong> données qui dépasse la capacité <strong>de</strong> l’agent,celui-ci doit sélectionner les percepts les pluspertinents. Les limitations concernent les aspectsséquentiels du traitement <strong>de</strong> l’information,par opposition aux aspects massivementparallèles, automatisés [24]. La sélection attentionnellea pour principale fonction <strong>de</strong> choisirles éléments <strong>de</strong> l’environnement pertinents pourla tâche en cours, sous cette contrainte <strong>de</strong> ressources<strong>limitée</strong>s [3].Perception active et <strong>limitée</strong>. Le souci <strong>de</strong> réalismedans la simulation <strong>de</strong> la <strong>perception</strong> <strong>humaine</strong>,nous conduit ainsi à une modélisation présentant<strong>de</strong>ux caractéristiques qui sont a) l’intégration<strong>de</strong>s <strong>perception</strong>s actives et passives, et b) la limitation<strong>de</strong>s traitements associés. L’intégration<strong>de</strong>s <strong>perception</strong>s actives et passives présente <strong>de</strong>sdifficultés liées à la dépendance du modèle <strong>de</strong>pertinence <strong>de</strong>s informations vis-à-vis <strong>de</strong> la tâcheen cours. C’est pourquoi nous nous sommesintéressés ici à l’influence d’une limitation dunombre d’éléments perçus qui sont traités effectivementpar l’agent, selon un filtrage appliquépar le processus top-down <strong>de</strong> la <strong>perception</strong>.3 Intégration d’une limitation dansle traitement <strong>de</strong>s percepts3.1 PrincipeLe travail présenté ici consiste ainsi à étudierl’influence d’une limitation du nombre d’élémentsperçus qui sont traités effectivement parl’agent, l’objectif étant, à terme, d’améliorerle réalisme <strong>de</strong> la simulation. Cette limitationest réalisée selon une stratégie similaire à cellequi est réalisée par la <strong>perception</strong> <strong>humaine</strong> etconsiste à trier les percepts pour ne retenir queles plus pertinents.La limitation <strong>de</strong> la <strong>perception</strong> peut se concevoir<strong>de</strong> différentes façons, à savoir en tant que :1. limite en nombre d’éléments perçus, chaqueélément étant considéré d’importance équivalente;2. limite quantitative globale, avec répartitionnon uniforme selon la complexité <strong>de</strong> l’interactionavec les éléments perçus.Ces <strong>de</strong>ux points peuvent être considérés commeles étapes, <strong>de</strong> complexité croissante, <strong>de</strong> notretravail. Nous présentons ci-<strong>de</strong>ssous la premièreétape, basée sur le principe d’une capacité <strong>limitée</strong>représentée par le nombre d’éléments perçus,ou percepts.La limitation <strong>de</strong> capacité représente une sélectionparmi les percepts. Selon une approche quiserait uniquement passive <strong>de</strong> la <strong>perception</strong>, lasélection consisterait à simplement arrêter leprocessus <strong>de</strong> <strong>perception</strong> dès lors que le seuil <strong>de</strong>capacité est atteint. Or, nous considérons uneapproche à la fois active et passive, selon laquellel’agent dirige activement le focus <strong>de</strong> <strong>perception</strong>dans son environnement en fonction <strong>de</strong>l’objectif courant. Cela conduit à prendre l’hypothèse<strong>de</strong> l’existence d’un ordre sur l’ensemble<strong>de</strong>s percepts : seul un nombre limité <strong>de</strong> percepts,les premiers par ordre d’importance pour la décision<strong>de</strong> l’agent, est considéré pour le traitement<strong>de</strong> l’information.3.2 PropositionNotre proposition consiste en la mise en œuvred’une <strong>perception</strong> active, réalisée selon un processustop-down qui inclut une limitation en


nombre d’objet perçus. Dans ce but, <strong>de</strong>ux types<strong>de</strong> filtre ont été distingués :– Les filtres top-down sont utilisées pour trierles percepts selon le(s) critère(s) imposé(s)par le module <strong>de</strong> décision. Ce choix <strong>de</strong> critèredépend <strong>de</strong> l’intention courante, commepar exemple, la traversée <strong>de</strong> carrefour par unautomobiliste.– Les filtres <strong>de</strong> limitation permettent <strong>de</strong> limiterle nombre d’objets perçus.La proposition a été développée pour uncontexte <strong>de</strong> prise <strong>de</strong> décision spécifique, qui estcelle du comportement du conducteur en carrefour.Dans ce contexte et sur la base <strong>de</strong>s travaux<strong>de</strong> Mandiau et al. [19] pour une implémentationen SMA, la prise <strong>de</strong> décision consiste à faire unchoix <strong>de</strong> comportement selon une métho<strong>de</strong> issue<strong>de</strong> la théorie <strong>de</strong>s jeux, et consistant à résoudre unensemble <strong>de</strong> conflits sur un ordre d’arrivé <strong>de</strong>svéhicules au carrefour. Notre proposition se situeen amont <strong>de</strong> la résolution du problème, enfournissant la liste <strong>de</strong>s percepts (et <strong>de</strong>s situations<strong>de</strong> conflits associées) qui sont utiles à considérerpour la résolution <strong>de</strong>s conflits.La <strong>perception</strong> commence par la "collecte" d’unensemble <strong>de</strong> percepts selon le processus topdown,c’est-à-dire <strong>de</strong>s percepts volontairementchoisis selon les focus <strong>de</strong> l’agent. Ces perceptsfont ensuite l’objet d’un filtrage, qui ne conserveque certains d’entre eux.Dans notre contexte, la collecte <strong>de</strong>s perceptsconsiste en la détection <strong>de</strong>s autres agentsconducteurs. L’agent estime ensuite les trajectoiresfutures <strong>de</strong>s agents perçus afin <strong>de</strong> détecter<strong>de</strong> possibles intersections avec sa propre trajectoire.Une intersection <strong>de</strong> trajectoires fait apparaîtreun conflit, qui peut provenir <strong>de</strong> l’interaction<strong>de</strong> <strong>de</strong>ux agents ou plus. Dans notre cas, lespercepts sont ainsi regroupés par conflit, un perceptpouvant appartenir à plusieurs conflits. Lasélection <strong>de</strong>s percepts a été réalisée en tant quefiltre dont l’action intervient après la <strong>perception</strong>sensorielle. Elle consiste à sélectionner les σpremiers percepts appartenant aux éléments <strong>de</strong>la liste ordonnée <strong>de</strong>s conflits détectés (voir Algorithme1).L’algorithme prend en entrée la liste <strong>de</strong> tousles conflits (conflictListIn) et fournit en sortiecette liste modifiée (conflictListOut), dans laquellechaque conflit est considéré sous l’angled’un ensemble restreint <strong>de</strong> percepts. La liste<strong>de</strong>s conflits est ordonnée selon la distance avantconflit, qui est interprété comme une estimation<strong>de</strong> la pertinence du conflit en vue <strong>de</strong> la sélectiondu percept. Les percepts <strong>de</strong> chacun <strong>de</strong> cesAlgorithm 1 TopDownProcess()Require: σ : seuil <strong>de</strong> charge (nombre maxi. <strong>de</strong> percepts)Require: conflictListIn : liste <strong>de</strong>s conflits détectésconflictListIn.sort() {ordonne la liste <strong>de</strong>s conflitsselon le temps avant conflit}conflictListOut ← []{liste <strong>de</strong>s conflits à considérer}nbP ercepts ← 0 {nb <strong>de</strong> percepts}conflict ← conflictListIn.first() {conflit courant}while (nbP ercepts < σ) and (conflict) doconflict.percepts.sort(){ordonne les percepts selonla distance au conflit}percept ← conflict.percepts.first()perceptList ← [] {liste <strong>de</strong>s percepts à considérer}while (nbP ercepts < σ) and (percept) doperceptList.add(percept)nbP ercepts ← nbP ercepts + 1percept ← conflict.percepts.next()end whileif (perceptList ≠ []) thenconflict.percepts ← perceptList{modification <strong>de</strong>s percepts}conflictListOut.add(conflict)end ifconflict ← conflictListIn.next()end whilereturn conflictListOutconflits (conflict.percepts) sont examinés séquentiellementtant que le seuil <strong>de</strong> capacité n’estpas atteint.4 Application à la simulation <strong>de</strong>l’agent conducteur4.1 Situation <strong>de</strong> carrefourLa modélisation du comportement <strong>de</strong>s agentsconducteurs comprend <strong>de</strong>ux mo<strong>de</strong>s, l’un pour lasection courante et l’autre pour le carrefour.Concernant le comportement en section courante,la vitesse <strong>de</strong> l’agent tend vers la vitessedésirée, à moins que les autres conducteurs nel’en empêchent. L’interaction entre <strong>de</strong>ux agentsconsécutifs a été implantée selon <strong>de</strong>s « lois<strong>de</strong> poursuite » usuelles en simulation <strong>de</strong> trafic,comme dans [16].Concernant le comportement en carrefour, ils’agit d’un problème ayant précé<strong>de</strong>mment faitl’objet <strong>de</strong> différents travaux dans le domainemulti-agents [9, 19]. L’intérêt du carrefour rési<strong>de</strong>dans la nécessité pour les agents <strong>de</strong> coordonnerleurs actions pour éviter les interblocageset les acci<strong>de</strong>nts en présence <strong>de</strong> situationscompétitives. Nos travaux se basent sur l’algorithme<strong>de</strong> [19] : le conducteur simulé sélec-


tionne un certain nombre <strong>de</strong> joueurs à l’approchedu carrefour, et déci<strong>de</strong> à chaque pas<strong>de</strong> temps d’avancer ou <strong>de</strong> s’arrêter selon sonévaluation <strong>de</strong>s priorités par rapport aux autresjoueurs sélectionnés pour le jeu. La décision GO/ STOP est ensuite traduite en une accélérationgrâce à la loi <strong>de</strong> poursuite.B,C,D,E,F et détecte les zones <strong>de</strong> conflit potentielavec eux (Fig. 4).Afin <strong>de</strong> vali<strong>de</strong>r le modèle, nous avons choisi <strong>de</strong>modéliser un carrefour réel, situé à Reggio Calabriaen Italie, pour lequel <strong>de</strong>s données (débitsd’entrée par axe, pourcentages <strong>de</strong> mouvementstournants) sont disponibles [19].FIGURE 4 – Les conflits potentiels i<strong>de</strong>ntifiésavant application d’un seuil <strong>de</strong> <strong>perception</strong>.La liste triée <strong>de</strong>s conflits pour A sont :– Conflit 1 : avec B,C et F– Conflit 2 : avec D et E– Conflit 3 : avec D,E et FFIGURE 3 – Capture d’écran d’une situation <strong>de</strong>carrefour, simulée avec RePast [1].La capture d’écran illustre le carrefour qui a étémodélisé (Fig 3, les véhicules sont représentéspar <strong>de</strong>s carrés, leurs directions par <strong>de</strong>s flèches).Chaque branche contient une voie vers le carrefouret une voie en sortie du carrefour sauf labranche Est qui possè<strong>de</strong> <strong>de</strong>ux voies entrantes etune voie sortante.Dans le contexte <strong>de</strong> la simulation <strong>de</strong> trafic,la pertinence <strong>de</strong>s percepts (fonctionconflict.percept.sort() <strong>de</strong> l’algorithme 1)a été traduite par un ordre <strong>de</strong>s véhicules perçusselon la distance au point <strong>de</strong> conflit potentiel.Pour mieux expliquer le fonctionnement <strong>de</strong> laprocédure top-down, notre scénario est décritdu point <strong>de</strong> vue <strong>de</strong> l’agent A avec la limitationσ égale à 4. D’abord, l’agent perçoit les véhiculesqui font partie <strong>de</strong> ses focus attentionnels.Les focus (Fig. 2) sont les zones d’intérêt quipeuvent inclure <strong>de</strong>s agents avec lesquels l’agentcourant est potentiellement en conflit. Dans lecontexte <strong>de</strong> la conduite automobile, la zone ducarrefour et les voies arrivantes vers le carrefourcorrespon<strong>de</strong>nt aux focus. Donc, l’agent A perçoitparallèlement (voir section 2.2) les agentsSuite à cette phase <strong>de</strong> détection <strong>de</strong> conflits potentiels,le processus top-down trie les percepts(ici, les autres agents) selon leur distance aupoint <strong>de</strong> conflit, prend en compte les premiersσ et élimine le reste. « Conflit 1 » gar<strong>de</strong> ses 3percepts en laissant une seule ressource disponiblepour traiter « Conflit 2 ». Ensuite, grâce autri effectué, A trouve son principal adversaire aupoint <strong>de</strong> « Conflit 2 » : D. Finalement, puisqu’ilne reste plus <strong>de</strong> ressource disponible, l’agent nepeut pas traiter « Conflit 3 ». A la fin <strong>de</strong> ce processus<strong>de</strong> sélection, L’agent A a la représentation(Fig. 5) :FIGURE 5 – Les conflits potentiels après applicationd’un seuil <strong>de</strong> <strong>perception</strong> σ = 4.


– Conflit 1 : avec B,C et F– Conflit 2 : avec D4.2 <strong>Simulation</strong>s réaliséesLe développement et l’implémentation ont étéréalisés avec l’outil <strong>de</strong> simulation multi-agentRePast [1]. Les simulations ont été exécutéessur une machine Intel(R) Core(TM)2 Duo CPUE6750 @ 2.66GHz 2.67 GHz, avec 1 Go <strong>de</strong>RAM.Dans ce travail, seuls les panneaux <strong>de</strong> signalisation(stop à l’Est et à l’Ouest) et les autres véhiculessont perçus.Chaque scénario a fait l’objet <strong>de</strong> 100 réplications(une heure <strong>de</strong> trafic simulé à chaquefois) et correspond à l’étu<strong>de</strong> du paramètre σ ennombre d’objets perçus. Les débits d’entrée surles 4 branches du carrefour correspon<strong>de</strong>nt à <strong>de</strong>sdonnées réelles mesurées toutes les 5 minutes.Nous avons utilisé les débits et la matrice origine/<strong>de</strong>stination<strong>de</strong> Reggio Calabria pour générerles différentes réplications.Nous avons examiné l’influence du paramètreσ en comparant la moyenne <strong>de</strong>s performancesd’écoulement (débits), le nombre d’acci<strong>de</strong>nts,les temps d’exécution et nombre d’interblocagessur 100 réplications. Les débits ont étécomparés à ce qui a été mesuré sur le carrefour<strong>de</strong> Reggio Calabria.5 Résultats5.1 Ecoulement du trafic# véhicules5905705505305104904704504304103903703503303102905 10 15 20 25 30 35 40 45 50 55 60tps en mn34567100EntreeDisposant <strong>de</strong> peu <strong>de</strong> données pour notre simulation,nous sommes conscients que nous ne pouvonsvali<strong>de</strong>r notre modèle en nous reposant surles seules données <strong>de</strong> débits d’entrée <strong>de</strong> la simulation.Pourtant ces données vont nous servirà tester la consistance <strong>de</strong> notre algorithme, surl’écoulement du trafic au carrefour, en prenantl’hypothèse suivante :Si les débits d’entrée simulés, mesurés en entrée<strong>de</strong> carrefour, sont proches <strong>de</strong> ceux observésalors l’écoulement du trafic (et donc la résolution<strong>de</strong> conflits) est cohérent avec les donnéesdisponibles.Pour mesurer cet écart, nous utilisons l’indicateurRMSE (root mean square error) :RMSE = √ 1 N∑(x simui − x obsi )N2i=1Le RMSE est la racine carré <strong>de</strong> la moyenned’erreur quadratique. Les résultats sont présentésdans la Table 1.σ RMSE Sud Nord Est3 abs. 64,1 37,03 31,02% 7,86 8,65 4,534 abs. 64,46 37,12 31,94% 7,9 8,67 4,665 abs. 65,74 38,43 32,9% 8,06 8,98 4,86 abs. 64,82 37,94 33,79% 7,94 8,86 4,937 abs. 64,7 38,68 33,77% 7,93 9,04 4,93100 abs. 66,31 37,23 34,06% 8,13 8,7 4,97TABLE 1 – Comparaison débit simulé, débit mesuré(RMSE) en fonction <strong>de</strong> σ sur les branchesSud, Nord et Est, pour 100 h simulées On note% = RMSE × 100 / Debit Moyen.FIGURE 6 – Les débits d’entrée sur les voies Estpour différentes valeurs <strong>de</strong> σ (3 à 100) en fonctiondu temps écoulé.Compte tenu du faible débit <strong>de</strong> véhicules sur labranche Ouest, les tests ne sont pas significatifssur cette branche du carrefour. Nous pouvons


# véhicules9108908708508308107907707507307106906706506306105905705505 10 15 20 25 30 35 40 45 50 55 6034567100Entree32,521,510,534567100tps en mn0FIGURE 7 – Les débits d’entrée sur la voie Nordpour différentes valeurs <strong>de</strong> σ (3 à 100) en fonctiondu temps écoulé.FIGURE 8 – Nombre d’acci<strong>de</strong>nts en fonction <strong>de</strong>la limite <strong>de</strong> <strong>perception</strong> σ (en nombre d’acci<strong>de</strong>ntspar réplication).constater que l’algorithme <strong>de</strong> <strong>perception</strong> activene dégra<strong>de</strong> pas les performances <strong>de</strong> la simulationdu point <strong>de</strong> vue <strong>de</strong> l’écoulement (Fig. 6 et7) comparées aux résultats dans [9, 19], puisquel’erreur (RMSE%) est en moyenne inférieure à10 %.On s’attendait à ce que l’écart entre le débitd’entrée réel et le débit d’entrée simulé diminueavec σ. Dans le scénario où l’agent ne perçoitrien (σ = 0), le débit <strong>de</strong> sortie (si on ne tient pascompte <strong>de</strong>s acci<strong>de</strong>nts) est égal au débit d’entrée.On observe (Fig. 8) que cet écart mesuré par lenombre d’acci<strong>de</strong>nt reste limité, ce qui est en faveurdu modèle proposé.Par ailleurs, l’implantation <strong>de</strong> l’algorithme <strong>de</strong><strong>perception</strong> <strong>limitée</strong> pouvait créer un phénomèneémergent où une <strong>de</strong>s branches domine la fluiditédu carrefour. Grâce aux résultats obtenuslors <strong>de</strong>s expérimentations, il s’est confirmé quela performance <strong>de</strong> la simulation n’a pas été impactéenégativement par l’algorithme <strong>de</strong> <strong>perception</strong><strong>limitée</strong>.5.2 Acci<strong>de</strong>ntUn acci<strong>de</strong>nt est détecté lorsque la distance entreles centres <strong>de</strong>s véhicules est inférieure à leurlongueur. Comme on peut s’y attendre et commeon peut le voir sur le graphique (Fig. 8), il y aune forte corrélation entre le nombre <strong>de</strong> perceptset le nombre d’acci<strong>de</strong>nts. Plus l’agent perçoit,plus il a une représentation complète <strong>de</strong> l’environnement,moins il a <strong>de</strong> risque d’avoir un acci<strong>de</strong>nt.Toutefois, l’écart reste faible entre les résultatsobtenus pour <strong>de</strong>s valeurs <strong>de</strong> σ entre 5 et100, alors qu’il se creuse nettement pour les valeurs3 et 4.En cas d’acci<strong>de</strong>nt dans notre simulation, les voiturescontinuent à rouler avec leur vitesse actuelleet la simulation ne s’arrête pas ; ceci afin<strong>de</strong> pouvoir comparer les simulations entre elles.5.3 InterblocageLes agents ne peuvent pas occuper le même espacesauf en cas d’acci<strong>de</strong>nt comme il a été expliquéau paragraphe précé<strong>de</strong>nt. Donc, un agentpeut être bloqué (il n’avance plus) dans le carrefours’il perçoit un agent sur sa trajectoire. Uninterblocage est défini, dans notre contexte, parun blocage mutuel entre plusieurs véhicules. Sile véhicule fait partie d’une chaîne <strong>de</strong> blocages(e.g. A bloque B, B bloque C, C bloque D etD bloque A), l’interblocage est détecté. Dansce cas, la situation est débloquée en permettantaux voitures qui font partie <strong>de</strong> la même chaîned’interblocage <strong>de</strong> rouler les unes sur les autres.Ainsi la simulation ne s’arrête pas ; ceci afin <strong>de</strong>pouvoir comparer les simulations entre elles.On voit une augmentation du nombre d’interblocagesavec le nombre <strong>de</strong> percepts (Fig. 9).Cette concordance entre le nombre <strong>de</strong> perceptset le nombre d’interblocages est probablementliée au temps passé dans le carrefour. On peutpenser que si les agents raisonnent avec plusieurspercepts ils <strong>de</strong>viennent plus pru<strong>de</strong>nts, etpassent plus <strong>de</strong> temps dans le carrefour. Cettepru<strong>de</strong>nce limite les acci<strong>de</strong>nts mais multiplie lenombre d’interblocages.


0,140,120,10,080,060,040,02034567100FIGURE 9 – Nombre d’interblocages en fonction<strong>de</strong> la limite <strong>de</strong> <strong>perception</strong> σ (en nombred’interblocages par réplication).5.4 Temps d’exécutionLe temps d’exécution augmente avec le nombre<strong>de</strong> percepts à considérer par l’agent : s’il y amoins <strong>de</strong> percepts, le raisonnement traite moins<strong>de</strong> données et prend moins <strong>de</strong> temps. Ceci estparticulièrement visible dans la différence, quiintervient dans le temps <strong>de</strong> raisonnement, entreles valeurs 3 et 4 du nombre <strong>de</strong> percepts retenuspour la prise <strong>de</strong> décision (Fig. 10).50049048047046045044043042041034567100FIGURE 10 – Temps d’exécution (en sec.) enfonction <strong>de</strong> la limite <strong>de</strong> <strong>perception</strong> σ.6 Conclusion et PerspectivesAfin <strong>de</strong> créer un comportement simulé plus réaliste,nous avons implanté la partie top-down <strong>de</strong>la <strong>perception</strong>, ce qui nous a permis d’étudier une<strong>perception</strong> <strong>limitée</strong>. En changeant le seuil σ <strong>de</strong>spercepts, on a examiné l’effet <strong>de</strong> ce changementsur les indicateurs (débits, nombre d’acci<strong>de</strong>nts,nombre d’interblocages, temps d’exécution).Nous constatons qu’il n’y a pas <strong>de</strong> différencecomportementale notable concernant le nombred’acci<strong>de</strong>nts jusqu’à un certain seuil <strong>de</strong> capacitéperceptive (autour <strong>de</strong> 5 dans notre contexte). Parcontre, les agents font moins <strong>de</strong> calcul s’ils perçoiventmoins, ce que l’on peut aussi interpréter,psychologiquement, en terme <strong>de</strong> charge mentale.Ces résultats nous confortent dans l’idéequ’il est inutile <strong>de</strong> simuler la <strong>perception</strong> <strong>de</strong> tousles éléments et l’intérêt <strong>de</strong> choisir les perceptspertinents par la <strong>perception</strong> active, cette sélectionpermettant <strong>de</strong> réalisant un gain en tempsd’exécution.Nous avons testé l’impact d’un seuil constant.Cependant, afin d’avoir un modèle plus completet d’augmenter le réalisme du comportement simulé,il faudrait implémenter un seuil qui variepar rapport à la complexité <strong>de</strong> décision et d’actiondu but courant. Par exemple, dans le carrefour,la décision et l’action <strong>de</strong> tourner à droitenécessitent moins <strong>de</strong> ressources cognitives quecelles <strong>de</strong> tourner à gauche. Donc tourner à droiteutilise moins <strong>de</strong> charge cognitive et il reste plus<strong>de</strong> ressource disponible pour traiter plus <strong>de</strong> percepts.Cette notion reste à étudier dans <strong>de</strong> futurstravaux.Les percepts plus saillants attirent l’attention<strong>de</strong>s conducteurs bien qu’ils ne soient pas pertinentsselon le but actuel. Dans ce contexte, lasaillance dépend <strong>de</strong>s caractéristiques visuelles<strong>de</strong> l’objet. Donc la saillance est perçue d’unefaçon ascendante et elle est la notion essentielle<strong>de</strong> la <strong>perception</strong> bottom-up. Dans nos futurstravaux, nous souhaitons intégrer ce processusbottom-up <strong>de</strong> <strong>perception</strong> dans notre modèle.Le processus bottom-up sera modélisé commeun distracteur sur le processus top-down, utile àla simulation <strong>de</strong> la non-détection <strong>de</strong>s piétons et<strong>de</strong> situations acci<strong>de</strong>ntogènes qui consistent ennos objectifs à long terme.Pour vali<strong>de</strong>r notre modèle, il serait utile <strong>de</strong> leconfronter à <strong>de</strong>s ensembles <strong>de</strong> données traficplus riches en information, prenant en comptenotamment les débits <strong>de</strong> sortie et les temps d’attenteaux carrefours.Références[1] Repast "http ://repast.sourceforge.net/",2010.[2] R. Atkinson and R. Shiffrin. Human memory: a proposed system and its control


processes. In K. Spence and J. Spence, editors,the psychology of learning and motivation: advances in research and theory,volume 2. New York : Aca<strong>de</strong>mic Press,1968.[3] E. Awh, K. M. Armstrong, and T. Moore.Visual and oculomotor selection : links,causes and implications for spatial attention.Trends in Cognitive Sciences,10(3) :124 – 130, 2006.[4] D.H. Ballard. Animate vision. ArtificialIntelligence, 48 :57–86, 1991.[5] Ana L. Bazzan. A distributed approach forcoordination of traffic signal agents. AutonomousAgents and Multi-Agent Systems,10 :131–164, January 2005.[6] A. Berthoz, editor. La décision. Odile JacobSciences, 2003.[7] A. Champion, M.Y. Zhang, J.M. Auberlet,and S. Espié. Behavioural simulation towardshigh<strong>de</strong>nsity network traffic studies.Traffic and Transportation Studies (Proceedingsof ICTTS), pages 988–995, January2002.[8] Igor A. Chimir, Waheeb A. Abu-Dawwas,and Mark A. Horney. Neisser’s cycleof <strong>perception</strong> : Formal representation andpractical implementation. Journal of ComputerScience (Special Issue), pages 106–111, 2005.[9] A. Doniec, R. Mandiau, S. Espié, andS. Piechowiak. Comportements anticipatifsdans les systèmes multiagents. applicationà la simulation <strong>de</strong> trafic routier. Revued‘Intelligence Artificielle, 21-2 :185–223,2007.[10] Jeanne Farrington. From the research :Myths worth dispelling - seven plus or minustwo. Performance Improvement Quarterly,23(4) :113–116, 2011.[11] Jacques Ferber. Les systèmes Multi-Agents : Vers une intelligence collective.InterEditions, 1995.[12] J. J. Gibson, editor. The Ecological Approachto Visual Perception. Boston :Houghton Mifflin, 1979.[13] B.L. Hills. Vision, visibility and <strong>perception</strong>in driving. Perception, 9 :183–216,1980.[14] L. Itti and C. Koch. Computational mo<strong>de</strong>llingof visual attention. Nature ReviewsNeuroscience, 2(3) :194–203, 2001.[15] L. Itti, G. Rees, and J. Tsotsos, editors.Neurobiology of attention. New York :Aca<strong>de</strong>mic Press, 2005.[16] A. Kesting, M. Treiber, and D. Helbing.Agents for traffic simulation. In Multi-Agents systems : <strong>Simulation</strong>s and Applications,pages 325–356. Taylor and Francis,2009.[17] U-G. Ketenci, R. Brémond, J-M. Auberlet,and E. Grislin-Le Strugeon. Boun<strong>de</strong>dactive <strong>perception</strong>. In Pre-proceedingsof the 8th European Workshop on Multi-Agent Systems (EUMAS 2010), Paris, <strong>de</strong>c.2010.[18] E. I. Knudsen. Fundamental componentsof attention. Annual Review Neuroscience,30 :57–78, 2007.[19] R. Mandiau, A. Champion, J.-M. Auberlet,S. Espié, and C. Kolski. Behaviour basedon <strong>de</strong>cision matrices for a coordinationbetween agents in a urban traffic simulation.Applied Intelligence, 28(2) :121–138,2008.[20] V. Manikonda, R. Levy, G. Satapathy, D.J.Lovell, Chang P.C., and A. Teittinen. Autonomousagents for traffic simulation andcontrol. Transportation Research Record :Journal of the Transportation ResearchBoard, 1774, 2001.[21] R. Marois and J. Ivanoff. Capacity limitsof information processing in the brain.Trends in Cognitive Sciences, 9(6) :296 –305, 2005.[22] G.A. Miller. The magical number seven,plus or minus two : Some limits on our capacityfor processing information. PsychologicalReview, 63 :81–97, 1956.[23] U. Neisser. Cognition and Reality. W.H.Freeman and Company, 1976.[24] J. Rasmussen. Skills, rules, and knowledge; signals, signs, and symbols, andother distinctions in human performancemo<strong>de</strong>ls. IEEE Press, Piscataway, NJ, USA,1987.[25] L. So, R.and Sonenberg. Situation awarenessas a form of meta-level control. InProc. of the First International Workshopon Metareasoning in Agent-Based Systemsat the Sixth International Joint Conferenceon Autonomous Agents and MultiagentSystems, Honolulu, Hawaii, 2007.[26] D. Weyns, E. Steegmans, and T. Holvoet.Towards active <strong>perception</strong> in situatedmulti-agent systems. Applied ArtificialIntelligence, 18(9-10) :867–883, 2004.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!