Simulation multi-agents basÃ©e sur des mÃ©canismes de marchÃ© pour ...

MOSIM’01 — du 25 au 27 avril 2001 — Troyes (France) 

Simulation multi-agents basée sur des mécanismes de marché 

pour la distribution de ressources 

Jaroslaw Kozlak, Edward Nawarecki 

Yves Demazeau 

Institut d’Informatique 

Académie des Mines et de la Métallurgie 

Al. Mickiewicza 30, 30-059 Kraków, Pologne 

Mél : {kozlak, nawar}@agh.edu.pl 

Jean-Luc Koning 

INPG-ESISAR-LEIBNIZ 

46, avenue Félix Viallet 

38031 Grenoble cedex, France 

Mél : Jean-Luc.Koning@esisar.inpg.fr 

LEIBNIZ-IMAG 

46, avenue Félix Viallet 

38031 Grenoble cedex, France 

Mél : Yves.Demazeau@esisar.inpg.fr 

RÉSUMÉ : Cet article est consacré au problème de la répartition de ressources entre agents dans un système multiagents 

selon une approche de marché. Nous passons rapidement en revue l’utilisation de cette approche et présentons le 

simulateur SMAORR (système multi-agents ouvert à ressources renouvelables), et particulièrement ses trois éléments : 

les agents de tâches, les marchés et les agents contrôleurs de ressources. Nous donnons aussi deux exemples d’expériences 

effectuées à l’aide de ce simulateur. L’article conclut sur les perspectives de travaux futurs. 

MOTS-CLÉS : intelligence artificielle distribuée, systèmes multi-agents, marché, ressources renouvelables 

1. INTRODUCTION 

1.1. Systèmes multi-agents 

Les systèmes auxquels l’homme est confronté aujourd’hui 

peuvent avoir une telle complexité que leur examen analitique 

devient difficile à réaliser. Cependant, classiquement, 

on les aborde sous l’angle de la simulation. L’approche 

multi-agents (dont on peut trouver la description 

dans (Ferber, 1995) par exemple) modélise des systèmes 

constitués d’agents autonomes agissant de façon rationelle. 

Leur architecture est propice pour investiguer tout 

problème composés d’éléments qui agissent en vue de réaliser 

leurs propres buts. 

Les systèmes multi-agents font partie d’un sous-domaine 

de l’intelligence artificielle que l’on appelle intelligence 

artificielle distribuées. Ce qui la différencie de l’intelligence 

artificielle classique, c’est le fait qu’elle s’occupe 

de recherches non sur une entité mais sur plusieurs entités 

intelligentes qui collaborent entre elles, et dont la multiplicité 

engendre du nouvelles fonctionnalités. 

Au niveau de la réalisation, les systèmes multi-agents peuvent 

s’appuyer sur des domaines de l’informatique comme 

les systèmes d’exploitation, les systèmes décentralisés et 

distribués (pour la création des systèmes à base de logiciels) 

et aussi sur des domaines proches comme la robotique 

(dans le cas de création de systèmes à base de robots 

mobiles). 

Il existe plusieurs approches pour concevoir un système 

sous forme multi-agents. Celle que nous avons retenue 

pour nos travaux est l’approche VOYELLES 

(Demazeau, 1995) qui décompose un système multiagents 

selon quatre composantes : les agents, l’environnement, 

l’interaction et l’organisation. Ces éléments génériques 

sont regroupés dans une bibliothèque universelle 

permettant ainsi la construction de différentes sortes de 

systèmes multi-agents. 

Dans cet article, nous présentons le simulateur SMAORR, 

qui est mis à profit pour analyser un système où les éléments 

agissent d’une façon rationelle et executent des 

échanges de ressources. Le transfert peut être effectué sur 

la base des principes de marchés ou par consommation des 

ressources libres de l’environnement. 

1.2. Marchés 

L’utilisation de la notion de marchés dans les systèmes 

multi-agents a été proposé par Wellman (voir par exemple 

(Wellman, 1993, Cheng etWellman, 1997)) et est basée 

sur la notion de marché économique qui détermine le coût 

d’équilibre pour tous les biens (c’est le coût lorsque la demande 

et l’offre sont en équilibre). 

Dans notre système nous distinguons les éléments suivants 

: 

Les agents-producteurs possèdent un ensemble de techniques 

de production (la transformation d’un ensemble 

de ressources d’entrée en un ensemble de 

ressources de sortie) et ils transforment un type de 

ressources donné en un autre en utilisant une technique 

de production qui leurs garantie le gain le plus 

grand.

Les agents-consommateurs informent les agentsproducteurs 

de leur besoins en ressources sur la 

base de leur propre fonction d’utilité. 

Les vendeurs aux enchères aident à la détermination du 

prix des ressources. Ils proposent les prix et les 

changent tant que l’équilibre entre la demande et 

l’offre n’est pas établi. 

Le principe du système consiste en une définition de la 

valeur des ressources pour que le marché soit en équilibre. 

Ci-dessous nous présentons les conditions de base du 

fonctionnement de l’algorithme d’adjudication de prix 

appelé tâtonnement (Sandholm, 1999). 

Le commissaire priseur : 

Répéter 

Envoyer les prix actuels aux producteurs et aux 

consommateurs 

Prendre le plan de production y j de chaque producteur 

j 

Envoyer les plans de production y j aux consommateurs 

Prendre les plans de consommation x i de chaque 

consommateur i 

Calculer les nouveaux prix 

Jusqu’à ce que l’état d’équilibre soit atteint 

Informer les producteurs et les consommateurs que l’état 

d’équilibre a été atteint 

Consommateur i : 

Répéter 

Prendre les prix du commissaire priseur 

Prendre les plans de productions de chaque producteur 

j des vendeurs aux enchères 

Informer du plan de consommation (max px) le 

commissaire priseur 


Effectuer le transfert de biens 

Producteur j : 

Répéter 

Prendre les prix du commissaire priseur 

Informer le commissaire priseur du plan de production 

(max py) 


Effectuer le transfert de biens 

On peut distinguer deux princiales procédures d’établissement 

des prix : 

Procédure de tâtonnement : l’idée est présentée dans 

les algorithmes précédents. La caractéristique essentielle 

est que l’échange de biens se produit seulement 

après l’établissement de l’équilibre. 

Procédure de non-tâtonnement : l’échange de biens ne 

se produit pas seulement quand le prix se trouve en 

état d’équilibre, mais est possible avant l’établissement 

de l’équilibre. 

L’algorithme de marché de WALRAS (qui utilise 

la procédure de tâtonnement) décrit dans 

(Cheng etWellman, 1997) a deux caractéristiques : 

1. il fonctionne de manière asynchrone, 

2. on n’envoie pas aux personnes prenant part aux enchères 

les quantités de biens offertes/obtenues pour 

un prix donné, mais toutes les fonctions de l’offre 

et de la demande dans lesquelles les quantités offertes/obtenues 

sont dépendantes des prix des biens. 

Dans le modèle SMAORR qui sera décrit dans 

la deuxième partie on utilise l’algorithme de nontâtonnement 

pour la définition des prix du marché. Son action 

est synchronisée comme dans les algorithmes de marché 

traditionnels (cf. exemple proposé par Walras). Ceci 

est la conséquence de la construction du modèle complet 

et entre autres du fait que certains types de ressources 

peuvent se renouveler dans un intervalle de temps donné. 

L’algorithme d’équilibre des prix (donné au paragraphe 

3.3.2) qui est utilisé dans le système SMAORR rappelle 

la première version de l’algorithme, cependant l’échange 

de biens survient avant l’établissement de l’équilibre des 

prix (non-tâtonnement). 

2. LES PRINCIPES 

Supposons que nous menions une analyse sur un système 

multi-agents ouverts, c’est-à-dire un système dans lequel 

le nombre d’agents change en fonction de leur entrée ou 

de leur sortie du système. Nous ne prenons pas en compte 

le phénomène de génération d’agents à l’intérieur même 

du système. C’est la population hétérogène d’agents qui 

est étudiée. L’hétérogénéité de la population des agents 

peut se manifester par : 

– différents ensembles d’actions que les agents sont 

en mesure d’effectuer, 

– différents ensembles de buts que les agents peuvent 

réaliser. 

Les agents agissent sur l’environnement en effectuant des 

actions. Les actions consistent en une consommation de 

ressources, en une transformation des ressources, en un 

envoi de ressources entre les agents ou bien en une migration 

de l’agent entre plusieurs systèmes multi-agents 

ouverts. L’agent effectue des actions pour lui-même (actions 

privées), ou bien pour d’autres agents (services). Il 

existe certaines actions spécifiques (que l’on appelle des 

services du système) qui doivent être effectuées pour que

le système fonctionne correctement. La possession de ressources 

adéquates par l’agent peut avoir une influence sur 

leur possibilité d’effectuer une action donnée, de même 

que sur la qualité de leur réalisation. L’agent choisit les 

actions à effectuer qui favorisent la réalisation de ses buts. 

Les buts de l’agent sont présentés comme des fonctions 

dont les prises de valeur dépendent des ressources dont 

l’agent est en possession. 

Pour garantir la réalisation des services du système à un 

niveau acceptable, on introduit deux mécanismes. Le premier 

est le mécanisme de marché, qui règle les relations 

réciproques de coût entre les actions. À cette fin, on introduit 

une ressource particulière, qui joue le rôle de mesure 

des coûts des actions. Le deuxième mécanisme est la limitation 

(ou l’interdiction) d’effectuer certaines actions par 

les agents au moyen de l’introduction de règlements que 

les agents doivent respecter. 

Le modèle analysé dans le travail rapporté ici s’appelle 

SMAORR - Système Multi-Agents Ouvert à Ressources 

Renouvelables. 

Le système est analysé à des intervalles de temps T 

appelés “étapes majeures”. Les étapes majeures sont 

appelées ainsi pour les différencier des “étapes de base” de 

l’analyse en description interne. Au début d’une étape majeure, 

on demande au système de réaliser les services du 

système (SSN), qu’il doit accomplir jusqu’à la fin d’une 

étape donnée. Le système décrit est un système ouvert, 

c’est-à-dire que les agents peuvent à tout moment entrer 

ou quitter le système. Ce système peut gérer des utilisateurs 

connectés. Il peut également être un élément d’un 

système de degré supérieur qui demande à réaliser des services 

du système. 

3. DESCRIPTION DU SYSTÈME 

Cette section contient la présentation du système : 

– la description des états dans lesquels peut se trouver 

le système, 

– la description de l’environnement où se trouvent les 

agents et les ressources, 

– la description des modèles des agents (des agents de 

tâches et des agents–marché) 

On trouvera une description plus détaillée dans 

(Koźlak, 2000a). 

3.1. Dynamique du système 

Le fonctionnement du système basé sur le modèle 

SMAORR consiste en la construction des étapes majeures 

au cours desquelles les agents effectuent des actions (des 

services du système qui ont été demandés). Une étape majeure 

se compose d’un certain nombre d’étapes de base 

(les mêmes pour toutes les étapes majeures). 

Une étape de base se compose des phases suivantes : 

où 

– la phase où les agents entrent dans le système (ps), 

– la phase de publication par les agents de leurs besoins 

en services à d’autres agents où à l’agentmarché 

(ps), 

– la phase d’offre des services, 

– la phase de liaison des agents offrants et des agents 

demandeurs, 

– la phase de réalisation des actions, 

– la phase de négociation, 

– la phase de régénération des ressources et du calcul 

des nouveaux coûts des services, 

– la phase où les agents sortent du système (ds), 

– ps est la première étape de base d’une étape majeure, 

et 

– ds est la dernière étape de base d’une étape majeure. 

3.2. L’environnement et les ressources 

L’environnement a un caractère virtuel et constitue une 

partie du système multi-agents. L’environnement joue les 

rôles suivants : 

– c’est un lieu ou séjournent les agents, 

– il contient les ressources qui peuvent être renouvelables. 

On peut classer les ressources de différentes façons en 

prenant en compte leurs propriétés. Dans l’analyse du 

système, on peut distinguer les ressources privatives ou 

communes, et les ressources libres ou occupées. 

Les ressources peuvent avoir les propriétés suivantes : 

Régénération : si la quantité de ressources donnée 

est supérieure à zéro, on peut avoir une autorégénération. 

Prix du stockage : si l’agent a une ressource donnée, il 

paie le prix de son stockage . 

À chacune des ressources correspondent les paramètres 

suivants : 

– r j (t) – la quantité de la ressource à l’étape t, 

– rj 

max – la quantité maximale de la ressource, 

– rj v – la vitesse de régénération de la ressource, 

– rj c – le prix de stockage de la ressource. 

La quantité de ressource régénérée au cours d’une étape 

( r j ) est exprimée par la formule suivante (appliquée 

dans les recherches environnementales) : 

r j = R(t) rj v (1 r ; j(t) 

)j =1:::N (1) 

rmax où N est le nombre de types de ressources dans le 

système. Cette formule est la plus connue des lois de la 

logistique (Proton et al., 1997).

3.3. Description des modèles d’agents 

Ce paragraphe est consacré aux modèles internes d’agents 

apparaissants dans le système. On présente le modèle 

de l’agent de tâches, le modèle de l’agent-marché et le 

modèle de l’agent contrôleur. 

3.3.1 Agent de tâches 

L’agent contient les éléments suivants : un vecteur des actions/services, 

une base de connaissance, un vecteur de 

connaissance, un état des ressources possédées, un ensemble 

de buts et un ensemble de plans (Koźlak, 2000b). 

Interactions Les interactions avec l’entourage concernent 

les classes d’activités suivantes de l’agent : 

– réalisation des actions (agir en commun avec l’environnement 

ou les autres agents), 

– demande et offre de réalisation d’actions, 

– négociations dans le but d’établir les lois gouvernants 

les agents dans le système. 

Capacités À chaque agent est relié un vecteur de possibilités 

définissant quelles actions un agent donné peut réaliser. 

Le vecteur possibilités de l’agent A i est défini par 

AC i et a la structure suivante : 

AC i =(ac i1 :::ac ij :::ac iJ ) (2) 

où : 

ac ij prend la valeur 

1, si l’agent peut effectuer une action donnée, 

0, si l’agent ne le peut pas. 

J est la quantité d’actions dans le système. 

État des ressources possédées L’agent A i possède une 

certaine configuration de ressources décrite par le vecteur 

ressources R i : 

R i =(r i1 ::::r ij :::r iJ ) (3) 

À chaque ressource sont liées des données (identiques 

pour tous les agents) concernant les coûts de leur stockage 

par l’agent. 

Connaissances La connaissance K i de l’agent A i comprend 

les informations que l’agent possède sur ses propres 

propriétés, celles des autres agents et de l’environnement. 

La connaissance se compose des parties suivantes : 

– Ki d – le connaissance dynamique (variable), 

– Ki s – la connaissance statique (constante pendant 

tout le fonctionnement de l’agent). 

La connaissance de l’agent contient des informations sur : 

– les ressources (Ki d ) : la quantité de ressources 

possédée par un agent donné, par d’autres agents 

ou se trouvant dans l’environnement; la quantité 

maximale de ressources dans l’environnement; la 

vitesse de régénération des ressources dans l’environnement 

; le coût de stockage des ressources par 

les agents 

– les actions : quelles actions sont effectuées ; quels 

sont les prix actuels de leur réalisation par d’autres 

agents (Ki s) 

– les ressources possédées par l’agent et leur état, 

ainsi que les valeurs des fonctions de but (Ki d ). Les 

états sont mémorisés dans chaque étape de base au 

cours de la simulation. (Pour le moment, des mécanismes 

simples d’extractions de résultats sont utilisés 

: seules l’étape de base en cours et la précédente 

sont prises en considération. Les états des 

autres ne sont utilisés qu’a des buts statistiques.). 

L’agent n’a pas une information complète sur la quantité 

générale des ressources, leur nombre maximal dans l’environnement 

et les prix actuels de leur réalisation. 

Les buts Les actions effectuées par les agent doivent les 

conduire à la réalisation de leurs buts. Le but de l’agent A i 

(G i ) est décrit par une expression dépendant de l’état des 

ressources qu’il possède. La réalisation du but de l’agent 

repose sur la maximisation de la valeur de cette expression. 

L’agent peut avoir différents buts g ip . À chaque but 

est attribué sa priorité ij (un nombre réel). On peut donc 

écrire : 

G i =(g i1 g i2 :::g in :::g iP ) (4) 

où 

g ip (avec p 2f1 :::Pg) est une expression décrivant les 

différents buts. 

La valeur de chaque fonction de but g ip dépend de la 

quantité de ressources possédée par l’agent, de la variation 

de cette quantité de ressources et de l’intervalle de temps 

donné. L’un des buts de l’agent doit être la conservation de 

son énergie E i à un niveau élevé. En rapport avec les buts 

partiels de l’agent et leur signification courante on définit 

une fonction décrivant le but principal de l’agent g i : 

g i = 

PX 

p=1 

ip g ip (5)

La valeur de la somme i1 +...+ ip +...+ i:P est 

constante pour tous les agents à chaque instant. On pose 

que ce total est égal à 100. 

Les lois Les lois s’appliquent aux actions de prise de 

ressources. La loi l k est définie par : 

où : 

id – l’identifiant de la loi, 

l k =(id id a val k R p k ) (6) 

id a – l’identifiant de l’action sur laquelle elle s’applique, 

val k – la force admissible de la réalisation de l’action , 

R p k 

– la pénalité en cas de violation de la loi. 

La loi modifie les préférences des agents pour la réalisation 

d’une action. On considère que pour leur réalisation 

l’agent doit subir les coûts exprimés en ressources. La loi 

change donc les opérations sur les ressources liées à l’exécution 

de l’action et en conséquence, change la valeur de 

la fonction de but liée à une action donnée. 

Les lois ont une influence sur le résultat de la réalisation 

de l’action, par la modification de la quantité de ressources 

utilisées par l’agent pendant leur réalisation (en pratique 

ces modifications concernent seulement le prix de la ressource), 

sur l’énergie et sur la pénalité que l’agent paye en 

entravant la loi (rupture du contrat). L’ensemble des lois 

que l’agent A i doit respecter est nommé L i . 

Plan Le plan P i de l’agent A i est une séquence d’actions 

qui mène à la réalisation des buts de l’agent par 

la maximalisation de la valeur g i . L’agent bâtit son plan 

à chaque étape. Les services qu’il doit effectuer doivent 

être marqués dans le plan et l’agent doit posséder les ressources 

nécessaires à la réalisation du plan (c’est-à-dire 

des actions). 

Actuellement le plan a une forme très simplifiée et se compose 

des parties suivantes : 

P =(a real f real a oer f oer a demand f demand ) (7) 

où : 

f demand est la force de l’action a demand . 

Le mécanisme de synchronisation repose sur le marquage 

des ressources nécessaires à la réalisation de l’action que 

l’agent a offert de réaliser. Ces ressources sont marquées 

comme “occupées” jusqu’au moment de la réalisation de 

l’action, ou jusqu’à la fin d’une étape de base donnée et 

du blocage des ressources (l’énergie) en cas de demande 

de réalisation d’action (pendant d’une étape majeure). 

Migration Si l’agent estime que les conditions dans le 

système ne sont pas favorables à la réalisation de ses plans, 

il peut prendre la décision d’émigrer. Les conditions défavorables 

apparaissent quand la valeur du but général diminue 

indépendamment de l’action qu’aurait choisie l’agent. 

Dans cette situation l’agent envoie une demande d’un service 

concret dont il a besoin aux systèmes multi-agents 

voisins. La demande concerne : 

– le prix du service, 

– le besoin demandé en services, 

– les services restants à réaliser. 

L’agent choisit le système en se basant sur les critères suivants 

: 

–ledéficit ou non des offres d’agents-serveurs dans 

la réalisation d’un service donné, 

– le prix. 

La migration intervient si le prix du service permet à 

l’agent la réalisation de sa demande et lui apporte une 

amélioration de la valeur globale de sa fonction de but. 

Description du modèle statique On regroupe ici les 

descriptions des éléments introduits dans les paragraphes 

précédents dans le but de présenter le modèle interne de 

l’agent de tâche. On différencie deux parties dans l’agent : 

M S : le modèle statique. Il contient les éléments qui ne 

changent pas pendant l’action de l’agent 

M D : le modèle dynamique. Il contient les éléments qui 

changent pendant l’action de l’agent. 

Le modèle de l’agent A utilisé dans ce travail est défini 

comme suit : 

M Int (A i )=(M S M D ) (8) 

a real est l’action qu’on a décidé de réaliser au cours 

d’une étape de base donnée, 

f real est la force de l’action a real , 

a oer est l’action qu’on a proposé de réaliser pendant 

une étape majeure donnée, 

f oer est la force de l’action a oer , 

est l’action pour la réalisation de laquelle 

l’agent proclame ses besoins (à réaliser au cours 

d’une étape majeure donnée), 

a demand 

La partie statique de l’agent (M S ) comprend 

M S (A i )=(AC i AA i K s i iG i e i ) (9) 

où : 

AC i est le vecteur connaissance définissant quelles actions 

l’agent peut réaliser, 

AA i est la description de l’action, 

K s i 

est la base de connaissances statique de l’agent,

i est l’ensemble des buts primaires actuels, 

G i est l’ensemble des buts de l’agent, 

e i est le niveau critique d’énergie au dessous duquel 

l’agent meurt. 

La partie dynamique de l’agent M D comprend : 

M D (A i )=(K d i P iL i R i ) (10) 

où : 

Ki d est la base de connaissances dynamique de l’agent, 

P i est le plan de l’agent, 

L i est l’ensemble des lois régissant l’agent, 

Ri est l’ensemble des ressources possédées par l’agent. 

Description du modèle dynamique Comme dans le cas 

du modèle du système multi-agents, le modèle de l’agent 

considéré est dynamique. Le fonctionnement de l’agent 

est rythmé par les étapes de base pendant lesquelles est 

effectuée une suite d’actions qui se répètent. Dans chaque 

étape l’agent A i effectue dans l’ordre chronologique les 

actions suivantes : 

1. observation de l’entourage et actualisation de la 

base des connaissances, 

2. définition de l’état de réalisation des buts et calcul 

de la fonction intégrale de but g i , 

3. analyse des changements de l’ensemble des buts G i 

et de la nouvelle valeur g i du résultat dans le cas 

de la réalisation d’actions (privées ou offertes). Au 

cours de l’analyse des conséquences des actions potentiellement 

effectuées on met en évidence l’influence 

des lois L i . On choisit les actions pour lesquelles 

la nouvelle valeur de g i est la meilleure. 

4. appel en besoin de services (si c’est une étape 

convenable, c’est-à-dire, début d’une étape majeure) 

citation des services que l’agent se propose 

de remplir, 

5. réalisation de services privés et obtention des résultats 

des services réalisés par d’autres agents, 

6. observation de l’environnement et actualisation du 

modèle du monde, 

7. définition du nouvel état de réalisation des buts g i , 

8. changement éventuel des valeurs des éléments décrivant 

l’importance des buts. 

3.3.2 Agent-marché 

Description du modèle L’agent-marché a les propriétés 

suivantes : le service dont s’occupe le marché (S j ), le coût 

actuel du service (s c j ), l’algorithme de liaison des agents 

demandant et offrant des services à effectuer (ALA), l’algorithme 

de définition des prix des services (ADC), la liste 

des propositions de services à effectuer SO j et la liste 

d’appels d’offres de services SN j . On suppose que les 

algorithmes sont identiques pour tous les agents-marchés 

dans le système. 

Méthode de liaison des agents demandant et des agents 

offrant des services (ALA) Chaque agent ayant besoin 

de services envoie au marché les données suivantes : 

– le nombre de services demandés, et 

– le prix maximal qu’il est prêt à payer pour leur réalisation. 

L’agent offrant ses services envoie au marché les données 

suivantes : 

– le nombre requis de services, et 

– le prix minimal auquel il est prêt à les réaliser. 

Le marché lie les agents demandant et offrant de sorte à 

maximiser le nombre d’actions réalisées. De cette façon, 

sur la base des prix offerts par les agents, on choisit un prix 

qui permette de réaliser le plus grand nombre de services. 

Après on trie les offres et les demandes selon la demande 

et on essaie d’abord de repartir la réalisation maximum 

de demandes en services qu’un agent-offrant donné peut 

réaliser. 

Définition du coût des services (ADC) Dans notre travail, 

nous considérons que les coûts de réalisation des services 

seront définis par le marché sur la base des offres. 

Au début du fonctionnement du système on considère la 

première valeur du vecteur coût SC. Le prix des services 

dans le système est établi comme prix d’équilibre entre 

le besoin des agents en services et les services réalisés. 

Les agents envoient leur besoin en services SN et l’offre 

de réalisation des services SO. On élève ensuite le prix des 

services qui n’étaient pas réalisés à un degré suffisant alors 

que ceux dont la réalisation est suffisante sont réduits. 

La croissance des prix pour la réalisation des services 

manquants et la baisse des prix des services en surnombre 

font que les agents doivent montrer un plus grand souhait 

de réaliser les services déficitaires et une moindre envie 

pour réaliser les services excédentaires ce qui conduit en 

définitive à un état d’équilibre entre l’offre et la demande 

en services. Ce mécanisme simple de définition des prix 

est inspiré de la première solution de Walras (cf. description 

de l’algorithme d’équilibre des prix du marché étudié 

au paragraphe 1.2. et dans (Cheng etWellman, 1997)). 

Dans notre travail, nous considérons une fonction qui a 

des caractéristiques utiles : plus la différence entre le besoin 

planifié et réalisé est grande et plus la date limite 

d’exécution des tâches est proche alors plus l’écart de prix 

est grand. 

On peut introduire dans le système des mécanismes supplémentaires 

corrigeant les prix de telle sorte qu’ils assurent 

un bon fonctionnement du système. 

3.3.3 Le contrôleur de ressources 

On peut arriver au contrôle de l’état des ressources dans le 

système par l’introduction d’un type spécial d’agent administrateur 

des ressources qui donne aux autres agents 

l’accès aux ressources. Pour cela on peut introduire un 

agent contrôleur pour gérer l’accessibilité des ressources.

On peut décrire l’agent-contrôleur de la façon suivante : 

ModInt (A cont 

i )=(id a id r f max r max rp) (11) 

où : 

– id a est l’identificateur de l’action, 

– id r est l’identificateur de la ressource, 

– f max est la force maximale actuelle de réalisation 

de l’action tolérée, 

– r max est la quantité maximale de ressources dans 

l’environnement, 

– r est la quantité actuelle de ressources dans l’environnement, 

– p - fonction définissant la grandeur de la pénalité 

(décompté en unité de la ressource différenciée — 

énergie). 

Nous supposons qu’une action ne peut conduire qu’à la 

prise d’un seul type de ressources. 

r 1 

800 

avec ag. contr. 

sans ag. contr. 

750 

700 

650 

600 

r 

r 

r 

r 

r 

r 

r 

r 

r 

 

r r 

 

 

r 

r 

r 

r 

r 

r 

r 

r 

r 

r 

r 

r 

r 

r 

r 

r 

r 

r 

r 

r 

r 

rrr 

r 

r 

r 

r r r 

r 

r 

r 

r 

r 

r 

r 

r 

r 

550 

0 5 10 15 20 25 30 35 40 45 50 

Etapes de base 

Figure 1. Ressource R 1 dans MAS 1 

r 

 

4. QUELQUES RÉSULTATS DE SIMULATION 

La configuration du système est la suivante : 

– trois systèmes multi-agents, chacun offrant un type 

de ressources. 

– quatre types des ressources – R 1 , R 2 , R 3 et énergie 

(e), 

– R 3 est le type de ressource dont est en possession 

l’agent et qui n’est pas accessible dans l’environnement. 

Il limite la force maximale de réalisation des 

actions. 

– cinq types d’actions – deux liées au prélèvement des 

ressources de l’environnement, deux liées au transfert 

des ressources, et une liée à la migration entre 

les systèmes, 

– au début de la simulation ilya22agents de tâche, 2 

agents-marchés et 2 agents-contrôleurs dans chaque 

système. 

Nous analysons les résultats selon que des agentscontrôleurs 

sont présents ou non. 

La figure 1 présente les changements de quantité de ressource 

R 1 dans le système MAS 1 pendant la simulation 

avec agents-contrôleurs et pendant la simulation sans 

agents-contrôleurs. Dans ces deux cas, nous voyons que 

la baisse immédiate au commencement est suivie d’une 

croissance lente et progressive de la quantité des ressources. 

La consommation des ressources a été diminuée : 

– en raison de l’introduction d’une taxe supplémentaire 

pour la consommation des ressources dans le 

cas utilisant des agents-contrôleurs, 

– car les agents ont constaté que la poursuite de la 

consommation n’était pas rentable. 

Des changements visibles de la quantité de ressources apparaissent 

au début des étapes majeures (composées de 

5 étapes de base). Ces changements sont liés à la migration 

et à l’arrivée de nouveaux agents qui augmentent la 

consommation de ressources. 

Il est à noter qu’il y a : 

– une baisse plus importante de la quantité de ressources 

dans le système avec ou sans agentscontrôleurs. 

Ceci est dû au fait qu’après l’augmentation 

du coût de l’action exécutée sur l’environnement 

certains agents se décident à réaliser d’autres 

services, ce qui influe sur le prix de la réalisation 

des services. Ce changement de coûts des services 

fait que dans les étapes suivantes les agents choisissent 

les opérations sur l’environnement. 

– une grande différence entre les comportements des 

deux systèmes MAS 1 (cf. figure 1) et MAS 2 (cf. 

figure 2). Ceci est dû au manque initial d’informations 

sur l’état des ressources accessibles dans les 

systèmes. Les agents ignorent que la ressource R 2 

n’est pas accessible dans le système MAS 1 et la 

ressource R 1 n’est pas accessible dans le système 

MAS 2 . Les agents qui ont les mêmes préférences 

concernant les ressources R 1 et R 2 essaient de 

prendre dans ces deux systèmes la ressource R 1 , 

ce qui n’apporte pas des résultats dans le système 

MAS 2 , ou après une petite baisse initiale, les agents 

contrôleurs n’ont pas agi, ce qui mène à une baisse 

considérable des quantités de ressources dans les 

étapes qui suivent. 

5. CONCLUSIONS ET PERSPECTIVES 

Le modèle présenté permet l’analyse de la distribution des 

ressources dans les systèmes avec des propriétés diffé-

entes (exprimées par la quantité d’agents, les types d’actions 

qu’ils peuvent exécuter, les préférences des agents 

concernant la consommation des ressources, la quantité et 

la qualité des ressources). La version actuelle du système 

SMAORR offre les possibilités de configuration de la population 

des agents et peut servir à la simulation d’une population 

avec des propriétés différentes. La structure organisationnelle 

du marché constitue une limitation majeure, 

mais dans le futur nous prévoyons une généralisation de 

ce modèle. 

r 2 

900 

r 

 

800 

700 

600 

500 

400 

300 

r 

 

r 

 

r r 

r 

avec ag. contr. 

sans ag. contr. 

200 

r rrr rrrrrr rrr rr rrrrrr rrr rr rrrrrr rrr rrr rrrrr r 

100 

 

0 

0 5 10 15 20 25 30 35 40 45 50 

Etapes de base 

Figure 2. Ressource R 2 dans MAS 2 

r 

 

Demazeau Y., 1995. From Interactions to Collective Behavior 

in Agent–Based Systems. In Proceedings of European 

Conference on Cognitive Science, Saint–Malo. 

Ferber J., 1995. Les Systèmes multi-agents. Vers une intelligence 

collective. InterEditions, Paris. 

Koźlak J., 2000a. Maintien de l’intégrité fonctionnelle 

dans les systèmes multi-agents ouverts à ressources renouvelables. 

Thèse de doctorat, Institut National Polytechnique 

de Grenoble. Akademia Górniczo-Hutnicza w 

Krakowie. 

Koźlak J., 2000b. Management of renewable resources 

in the open multi-agent system. In Proceedingd of the 

Second Conference on Management and Control of Production 

and Logistic MACPL’2000, Grenoble. 

Proton H., F. Bousquet, et P. Reitz, 1997. Un outil pour 

observer l’organisation d’une sociét’e d’agents. le cas 

d’une société d’agents chasseurs agriculteurs. In Actes 

des 5e Journées Francophones d’Intelligence Artificielle 

et Systèmes Multi-Agents, pages 143–157, La Colle sur 

Loup, Côte d’Azur. 

Sandholm T. W., 1999. Multiagent Systems. A Modern 

Approach to Distributed Artificial Intelligence, chapitre 

Distributed Rational Decision Making, pages 201–258. 

The MIT Press. 

Wellman M., 1993. A Market-Oriented Programming 

Environment and its Application to Distributed Multicommodity 

Flow Problem. Journal of Artificial Intelligence 

Research, 1 :1–23. 

Les extensions du système SMAORR peuvent s’orienter 

dans plusieurs directions : 

– extension des algorithmes de décision de l’agentmarché 

et de l’agent de tâches, 

– ajout d’un mécanisme de négociation, 

– prise en considération de différentes structures d’organisation 

(en particulier les différents types de 

groupe et de hiérarchie). Ces structures peuvent 

exister dans le système. Il peut simultanément y 

avoir plusieurs structures d’organisation avec des 

caractéristiques différentes. Dans ce cadre, un agent 

doit pouvoir appartenir à différentes structures organisationnelles 

à la fois. 

– examen de l’effet de création de structures d’organisation, 

et des mécanismes d’entrée ou de sortie 

d’agents dans une organisation. 

RÉFÉRENCES 

Cheng J. Q. et M. P. Wellman, 1997. The WALRAS 

algorithm : A convergent distributed implementation of 

general equilibrium outcomes. Computational Economics.

Simulation multi-agents basÃ©e sur des mÃ©canismes de marchÃ© pour ...

Create successful ePaper yourself

Delete template?

Save as template?