12.07.2015 Views

l'Université Paul Sabatier de Toulouse III - UFR Mathématiques et ...

l'Université Paul Sabatier de Toulouse III - UFR Mathématiques et ...

l'Université Paul Sabatier de Toulouse III - UFR Mathématiques et ...

SHOW MORE
SHOW LESS
  • No tags were found...

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

THÈSEprésentée <strong>de</strong>vantl’Université <strong>Paul</strong> <strong>Sabatier</strong> <strong>de</strong> <strong>Toulouse</strong> <strong>III</strong>U.F.R. MATHÉMATIQUES, INFORMATIQUE ET GESTIONpour obtenir le titre <strong>de</strong>DOCTEUR DE L’UNIVERSITÉ PAUL SABATIERMention INFORMATIQUEparELISE BONZONÉcole doctorale :Laboratoire d’accueil :Équipe d’accueil :Informatique <strong>et</strong> TélécommunicationInstitut <strong>de</strong> Recherche en Informatique <strong>de</strong> <strong>Toulouse</strong>Raisonnements Plausibles, Décision, Métho<strong>de</strong>s <strong>de</strong> PreuvesModélisation <strong>de</strong>s interactions entre agents rationnels : les jeuxbooléenssoutenue le 13 Novembre 2007 <strong>de</strong>vant la commission d’examen :Nicholas ASHERAnnie ASTIÉ-VIDALOlivier GASQUETAndreas HERZIGMarie-Christine LAGASQUIE-SCHIEXJérôme LANGPierre MARQUISNicolas MAUDETLeon van <strong>de</strong>r TORREBruno ZANUTTINIDirecteur <strong>de</strong> recherche, Université <strong>Paul</strong> <strong>Sabatier</strong> (membre)Professeur, Université <strong>Paul</strong> <strong>Sabatier</strong> (invité)Professeur, Université <strong>Paul</strong> <strong>Sabatier</strong> (membre)Directeur <strong>de</strong> recherche, Université <strong>Paul</strong> <strong>Sabatier</strong> (invité)Maître <strong>de</strong> conférences, Université <strong>Paul</strong> <strong>Sabatier</strong> (directrice <strong>de</strong> thèse)Chargé <strong>de</strong> recherche, Université <strong>Paul</strong> <strong>Sabatier</strong> (directeur <strong>de</strong> thèse)Professeur, Université d’Artois (rapporteur)Maître <strong>de</strong> conférences, Université Paris Dauphine (membre)Professeur, Université du Luxembourg (rapporteur)Maître <strong>de</strong> conférences, Université <strong>de</strong> Caen (membre)


Elise BonzonMODÉLISATION DES INTERACTIONS ENTRE AGENTS RATIONNELS :LES JEUX BOOLÉENSDirecteurs <strong>de</strong> thèse :Jérôme Lang, CR CNRS, HdRMarie-Christine Lagasquie-Schiex, Maître <strong>de</strong> conférencesUniversité <strong>Paul</strong> <strong>Sabatier</strong>RésuméLes jeux booléens perm<strong>et</strong>tent <strong>de</strong> représenter les jeux stratégiques d’une manière succincte en tirantprofit du pouvoir d’expression <strong>et</strong> <strong>de</strong> la concision <strong>de</strong> la logique propositionnelle. Informellement, unjeu booléen est un jeu à <strong>de</strong>ux joueurs, chacun d’entre eux contrôlant un ensemble <strong>de</strong> variables propositionnelles,<strong>et</strong> à somme nulle. La fonction d’utilité du joueur 1 (<strong>et</strong> donc celle du joueur 2 qui est sonopposé) est représentée par une formule <strong>de</strong> la logique propositionnelle, appelée forme booléenne dujeu. Ainsi, un joueur dans un jeu booléen a <strong>de</strong>s préférences dichotomiques : son but est satisfait ou nel’est pas.Ces trois restrictions (<strong>de</strong>ux joueurs, somme nulle, préférences binaires) limitent fortement l’expressivité<strong>de</strong> ce cadre. Les <strong>de</strong>ux premières restrictions peuvent être facilement résolues en définissantles préférences <strong>de</strong>s agents comme étant un n-upl<strong>et</strong> <strong>de</strong> formules propositionnelles (une pour chaqueagent). Des outils simples issus <strong>de</strong> la logique propositionnelle nous perm<strong>et</strong>tent ainsi <strong>de</strong> caractérisercertaines propriétés du jeu. Deux autres notions ont alors été étudiées : la dépendance entre joueurs(si le but, <strong>et</strong> donc la satisfaction, d’un joueur i dépend <strong>de</strong> variables contrôlées par le joueur j, alors iaura besoin <strong>de</strong> j pour satisfaire son but) <strong>et</strong> les coalitions <strong>de</strong> joueurs (une coalition dans un jeu booléenest efficace si elle peut garantir à tous ses membres que leurs buts sont satisfaits). Dans les <strong>de</strong>ux cas,l’objectif est <strong>de</strong> faciliter le calcul <strong>de</strong>s concepts <strong>de</strong> solution tels que les équilibres <strong>de</strong> Nash en stratégiespures.Lever la troisième restriction consiste à exprimer <strong>de</strong>s préférences (non binaires) dans un cadre propositionnel.Cela est possible en utilisant un langage <strong>de</strong> représentation compacte <strong>de</strong> préférences. Nousavons integré donc <strong>de</strong>ux <strong>de</strong> ces langages aux jeux booléens : tout d’abord, les buts à priorité puis lesCP-n<strong>et</strong>s.Institut <strong>de</strong> Recherche en Informatique <strong>de</strong> <strong>Toulouse</strong> - UMR 5505Université <strong>Paul</strong> <strong>Sabatier</strong>, 118 route <strong>de</strong> Narbonne. 31062 TOULOUSE ce<strong>de</strong>x 9i


Elise BonzonBOOLEAN GAMESSupervisors :Jérôme Lang, CR CNRS, HdRMarie-Christine Lagasquie-Schiex, Maître <strong>de</strong> conférencesUniversité <strong>Paul</strong> <strong>Sabatier</strong>AbstractBoolean games are a logical s<strong>et</strong>ting for representing static games in a succinct way, taking advantageof the expressive power and conciseness of propositional logic. Boolean games allow to express compactlytwo-players zero-sum static games with binary preferences : an agent’s strategy consists of atruth assignment of the propositional variables she controls, and a player’s preferences are expressedby a plain propositional formula.These three restrictions (two-players, zero-sum, binary preferences) strongly limit the expressivityof the framework. The first two can be easily encompassed by <strong>de</strong>fining the agents’ preferences asan arbitrary n-uple of propositional formulas. Two others notions have been studied : <strong>de</strong>pen<strong>de</strong>nciesb<strong>et</strong>ween players (if the goal, and hence the satisfaction, of a player i <strong>de</strong>pends on some variablescontrolled by a player j, then i may need some action of j to see her goal satisfied) and efficientcoalitions (a coalition in a Boolean game is efficient if it has the power to guarantee that all goals ofthe members of the coalition are satisfied). We give simple characterizations of Nash equilibria anddominated strategies, and investigate the computational complexity of the related problems.Then, we relax the last restriction by coupling Boolean games with propositional languages for compactpreference representation ; we consi<strong>de</strong>r generalized Boolean games where players’ preferencesare expressed within the two following languages : propositionalized CP-n<strong>et</strong>s, and then prioritizedgoals.Institut <strong>de</strong> Recherche en Informatique <strong>de</strong> <strong>Toulouse</strong> - UMR 5505Université <strong>Paul</strong> <strong>Sabatier</strong>, 118 route <strong>de</strong> Narbonne. 31062 TOULOUSE ce<strong>de</strong>x 9iii


RemerciementsJe voudrais en premier lieu remercier Jérôme LANG <strong>et</strong> Marie-Christine LAGASQUIE-SCHIEX pourm’avoir aidée, accompagnée, encadrée <strong>et</strong> encouragée tout au long <strong>de</strong> ces trois années. Leur présence,leurs conseils <strong>et</strong> leur complémentarité m’ont permis non seulement <strong>de</strong> mener ce travail à bien, maiségalement <strong>de</strong> découvrir <strong>et</strong> d’aimer le mon<strong>de</strong> <strong>de</strong> la recherche, comme celui <strong>de</strong> l’enseignement.J’aimerais ensuite remercier Pierre MARQUIS <strong>et</strong> Leon van <strong>de</strong>r TORRE pour avoir accepté d’être rapporteurs<strong>de</strong> ma thèse, <strong>et</strong> pour l’avoir lue avec autant d’attention. Merci pour leurs conseils, remarques<strong>et</strong> commentaires, qui m’ont permis d’améliorer ce manuscrit tant sur le fond que sur la forme.Merci également à Nicholas ASHER, Annie ASTIÉ-VIDAL, Olivier GASQUET, Andreas HERZIG,Nicolas MAUDET <strong>et</strong> Bruno ZANUTTINI pour avoir accepté <strong>de</strong> participer à mon jury <strong>de</strong> thèse, <strong>et</strong>pour leurs commentaires qui ouvrent <strong>de</strong> nombreuses pistes <strong>de</strong> recherche. Je tiens particulièrement àremercier Pierre, Leon, Nicolas <strong>et</strong> Bruno qui ont accepté <strong>de</strong> se déplacer à <strong>Toulouse</strong> malgrè les grèves.Merci à Florence BOUÉ <strong>et</strong> Martine LABRUYÈRE qui m’ont permis <strong>de</strong> traverser sans encombres toutesles embûches administratives semées sur le chemin <strong>de</strong> la soutenance. Merci Florence d’avoir été aussiefficace pour gérer tous les problèmes <strong>de</strong> <strong>de</strong>rnières minutes.Merci à Ulle ENDRISS pour m’avoir accueillie 6 semaines au sein <strong>de</strong> l’ILLC à Amsterdam, pourm’avoir ainsi permis <strong>de</strong> découvrir un autre environnement <strong>de</strong> travail, <strong>et</strong> pour m’avoir consacré dutemps <strong>et</strong> <strong>de</strong> l’énergie.Merci à Marie-Christine LAGASQUIE-SCHIEX, Florence BANNAY, Martin STRECKER, <strong>et</strong> tous lesmoniteurs <strong>de</strong> la promo 2004 pour m’avoir accompagné dans les divers enseignements que j’ai accompli.Ils sont pour beaucoup dans le plaisir que j’ai aujourd’hui à enseigner.Merci à Jorge CHAM qui m’a permis <strong>de</strong> découvrir <strong>de</strong> façon ludique les côtés obscurs du milieuacadémique.Merci aux membres du troisième étage <strong>de</strong> l’Irit qui, <strong>de</strong> pauses café en pauses repas, m’ont appris quele milieu <strong>de</strong> la recherche peut être extrêmement convivial.Merci à mes copines <strong>de</strong> bureau, Marie <strong>et</strong> Sihem, pour avoir gran<strong>de</strong>ment contribué à rendre l’ambiance<strong>de</strong> travail très agréable.Merci à Nicolas, Axel, Kevin, Virginie, Alexia, Sylvain, Florian, Mylen, Filou, Caroline, Cédric,Marie, Julie, Amélie, Elodie, Manue, Xavier, Dominique, Marjolaine <strong>et</strong> tant d’autres pour m’avoirpermis <strong>de</strong> ne pas oublier le mon<strong>de</strong> extérieur pendant ces trois ans.Merci à ma famille, mes parents, mes frères <strong>et</strong> sœurs, pour m’avoir soutenue tout au long <strong>de</strong> cesannées, <strong>et</strong> d’avoir toujours été là pour moi.v


Table <strong>de</strong>s matièresRemerciementsvIntroduction 1Notations 71 Eléments <strong>de</strong> théorie <strong>de</strong>s jeux 91.1 Taxonomie partielle <strong>de</strong>s jeux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101.1.1 Jeux statiques <strong>et</strong> dynamiques . . . . . . . . . . . . . . . . . . . . . . . . . . 101.1.1.1 Jeux statiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101.1.1.2 Jeux dynamiques . . . . . . . . . . . . . . . . . . . . . . . . . . 111.1.2 Jeux coopératifs <strong>et</strong> non coopératifs . . . . . . . . . . . . . . . . . . . . . . . 121.1.2.1 Jeux coopératifs . . . . . . . . . . . . . . . . . . . . . . . . . . . 121.1.2.2 Jeux non coopératifs . . . . . . . . . . . . . . . . . . . . . . . . . 141.1.3 Récapitulatif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161.2 Représentation <strong>de</strong>s jeux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161.2.1 Forme extensive . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161.2.2 Forme normale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171.3 Concepts <strong>de</strong> solution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181.3.1 Equilibres <strong>de</strong> Nash . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191.3.1.1 Equilibre <strong>de</strong> Nash en stratégies pures . . . . . . . . . . . . . . . . 191.3.1.2 Equilibres <strong>de</strong> Nash en stratégies mixtes . . . . . . . . . . . . . . . 201.3.2 Stratégies dominées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211.3.3 Cœur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251.3.3.1 Utilités transférables . . . . . . . . . . . . . . . . . . . . . . . . . 251.3.3.2 Utilités non transférables . . . . . . . . . . . . . . . . . . . . . . 261.3.4 Equilibres parfaits <strong>de</strong> Selten . . . . . . . . . . . . . . . . . . . . . . . . . . 27vii


Table <strong>de</strong>s matières1.3.5 Récapitulatif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 292 Jeux booléens 312.1 Introduction aux jeux booléens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 322.2 Jeux booléens à n joueurs : définitions <strong>et</strong> exemples . . . . . . . . . . . . . . . . . . 332.3 Graphe <strong>de</strong> dépendance entre les joueurs . . . . . . . . . . . . . . . . . . . . . . . . 372.4 Concepts <strong>de</strong> solution : équilibres <strong>de</strong> Nash <strong>et</strong> stratégies dominées . . . . . . . . . . . 412.4.1 Equilibres <strong>de</strong> Nash . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 412.4.2 Stratégies dominées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 502.5 Cas particulier : Jeux à <strong>de</strong>ux joueurs <strong>et</strong> à somme nulle . . . . . . . . . . . . . . . . . 552.6 Jeux booléens <strong>et</strong> duopole <strong>de</strong> Stackelberg . . . . . . . . . . . . . . . . . . . . . . . . 602.6.1 2 joueurs, 1 variable chacun . . . . . . . . . . . . . . . . . . . . . . . . . . 602.6.2 2 joueurs, 3 variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 622.6.3 2 joueurs, 2 variables chacun . . . . . . . . . . . . . . . . . . . . . . . . . . 632.6.4 2 joueurs, n variables chacun . . . . . . . . . . . . . . . . . . . . . . . . . . 643 Jeux booléens <strong>et</strong> préférences non dichotomiques 693.1 Préférences ordinales <strong>et</strong> théorie <strong>de</strong>s jeux . . . . . . . . . . . . . . . . . . . . . . . . 713.2 Jeux booléens <strong>et</strong> CP-n<strong>et</strong>s . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 743.2.1 C<strong>et</strong>eris Paribus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 753.2.2 CP-n<strong>et</strong>s . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 753.2.2.1 Définitions générales . . . . . . . . . . . . . . . . . . . . . . . . 753.2.2.2 Sémantique <strong>de</strong>s CP-n<strong>et</strong>s . . . . . . . . . . . . . . . . . . . . . . . 763.2.2.3 Utilisation <strong>de</strong>s CP-n<strong>et</strong>s dans les jeux booléens . . . . . . . . . . . 783.2.3 Propriétés <strong>de</strong>s CP-jeux booléens . . . . . . . . . . . . . . . . . . . . . . . . 823.2.3.1 Stratégies dominées . . . . . . . . . . . . . . . . . . . . . . . . . 823.2.3.2 Equilibres <strong>de</strong> Nash en stratégies pures . . . . . . . . . . . . . . . 833.2.3.3 CP-jeux booléens avec graphe acyclique commun à tous les joueurs 853.2.3.4 CP-n<strong>et</strong> global . . . . . . . . . . . . . . . . . . . . . . . . . . . . 913.2.3.5 Complexité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 943.2.4 Introduction d’une relation d’indifférence . . . . . . . . . . . . . . . . . . . 963.3 Buts à priorité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 993.3.1 Etat <strong>de</strong> l’art . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1003.3.1.1 Ordre Discrimin . . . . . . . . . . . . . . . . . . . . . . . . . . . 1013.3.1.2 Ordre Leximin . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1033.3.1.3 Ordre Best-out . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103viiiElise Bonzon


Table <strong>de</strong>s matières3.3.2 Utilisation <strong>de</strong>s buts à priorité dans les jeux booléens . . . . . . . . . . . . . 1053.3.3 Quelques propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1103.4 Préférences non dichotomiques <strong>et</strong> graphe <strong>de</strong> dépendance . . . . . . . . . . . . . . . 1164 Jeux, logique propositionnelle <strong>et</strong> représentation compacte 1214.1 Jeux <strong>et</strong> programmation logique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1214.1.1 Programmes logiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1214.1.2 Programme logique <strong>de</strong> choix . . . . . . . . . . . . . . . . . . . . . . . . . . 1224.1.3 Programme logique avec <strong>de</strong>s disjonctions ordonnées . . . . . . . . . . . . . 1244.1.3.1 Présentation <strong>et</strong> définitions . . . . . . . . . . . . . . . . . . . . . . 1244.1.3.2 LPOD <strong>et</strong> équilibres <strong>de</strong> Nash . . . . . . . . . . . . . . . . . . . . . 1254.2 Jeux <strong>et</strong> représentation graphique . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1274.2.1 CP-n<strong>et</strong>s <strong>et</strong> équilibres <strong>de</strong> Nash . . . . . . . . . . . . . . . . . . . . . . . . . 1274.2.2 Forme normale graphique . . . . . . . . . . . . . . . . . . . . . . . . . . . 1284.2.2.1 Diagrammes d’influence multi-agents . . . . . . . . . . . . . . . . 1294.2.2.2 Formes normales graphiques <strong>et</strong> restrictions . . . . . . . . . . . . . 1314.2.2.3 G n<strong>et</strong>s . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1334.2.3 Symétries dans les fonctions d’utilité . . . . . . . . . . . . . . . . . . . . . 1334.2.3.1 Jeux <strong>de</strong> congestion . . . . . . . . . . . . . . . . . . . . . . . . . . 1334.2.3.2 Jeux à eff<strong>et</strong>s locaux . . . . . . . . . . . . . . . . . . . . . . . . . 1344.2.3.3 Jeux graphiques d’actions . . . . . . . . . . . . . . . . . . . . . . 1355 Coalitions efficaces dans les jeux booléens 1375.1 Fonctions d’effectivité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1375.2 Coalitions <strong>et</strong> fonctions d’effectivité dans les jeux booléens . . . . . . . . . . . . . . 1385.3 Coalitions efficaces . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1435.3.1 Définition <strong>et</strong> caractérisation . . . . . . . . . . . . . . . . . . . . . . . . . . 1435.3.2 Coalition efficace <strong>et</strong> noyau . . . . . . . . . . . . . . . . . . . . . . . . . . . 1495.3.3 Lien avec les graphes <strong>de</strong> dépendance . . . . . . . . . . . . . . . . . . . . . 1545.4 Travaux connexes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1575.4.1 Graphe <strong>de</strong> dépendance <strong>et</strong> coalitions admissibles . . . . . . . . . . . . . . . . 1575.4.1.1 Graphe <strong>de</strong> dépendance . . . . . . . . . . . . . . . . . . . . . . . . 1575.4.1.2 Coalitions admissibles . . . . . . . . . . . . . . . . . . . . . . . . 1585.4.2 Jeux qualitatifs coalitionnels . . . . . . . . . . . . . . . . . . . . . . . . . . 1615.4.3 Logique <strong>de</strong>s jeux coalitionnels . . . . . . . . . . . . . . . . . . . . . . . . . 163Jeux booléensix


Table <strong>de</strong>s matièresConclusion 165Bibliographie 173In<strong>de</strong>x 183Liste <strong>de</strong>s symboles 185xElise Bonzon


IntroductionContexteL’intelligence artificielle perm<strong>et</strong> à <strong>de</strong>s machines d’effectuer <strong>de</strong>s tâches réputées intelligentes, enconcevant <strong>et</strong> en réalisant <strong>de</strong>s fonctions cognitives artificielles, <strong>et</strong> en utilisant la puissance calculatoire<strong>de</strong>s ordinateurs. Parmi ces tâches se trouvent, entre autres, l’acquisition <strong>et</strong> la représentation <strong>de</strong>sconnaissances, la formalisation <strong>et</strong> la mécanisation <strong>de</strong> différents types <strong>de</strong> raisonnement, l’ai<strong>de</strong> à ladécision collective, la planification, les systèmes multi-agents, <strong>et</strong>c.Obj<strong>et</strong> <strong>de</strong> nombreuses recherches en intelligence artificielle, les systèmes multi-agents s’inspirent <strong>de</strong>ssciences humaines pour modéliser <strong>de</strong>s groupes d’agents. Un système multi-agent est un ensembled’agents situés dans un certain environnement <strong>et</strong> interagissant selon une certaine organisation. Unagent rationnel est une entité caractérisée par le fait qu’elle est, au moins partiellement, autonome. Cepeut être un processus, un robot, un être humain, <strong>et</strong>c. La création <strong>de</strong> systèmes multi-agents conduit àcinq problématiques principales :∗ Problématique <strong>de</strong> l’action : comment plusieurs agents peuvent-ils agir <strong>de</strong> manière simultanéedans un environnement commun, <strong>et</strong> comment c<strong>et</strong> environnement interagit en r<strong>et</strong>our avec lesagents ? Les questions sous-jacentes à celle-ci sont entre autres celles <strong>de</strong> la représentation <strong>de</strong>l’environnement par les agents, <strong>de</strong> la collaboration entre agents <strong>et</strong> <strong>de</strong> la planification multiagents.∗ Problématique <strong>de</strong> l’agent <strong>et</strong> <strong>de</strong> sa relation au mon<strong>de</strong> : <strong>de</strong> quel modèle cognitif dispose l’agentpour représenter le mon<strong>de</strong> ? Comment un agent peut-il m<strong>et</strong>tre en œuvre les actions qui répon<strong>de</strong>ntau mieux à ses objectifs ? C<strong>et</strong>te capacité à la décision est liée à “l’état mental” <strong>de</strong> l’agent, quireflète ses perceptions, ses représentations, ses croyances, ses désirs, ses préférences, <strong>et</strong>c.∗ Problématique <strong>de</strong> l’interaction : quelles formes d’interaction existent entre les agents ? Commentest-elle représentée ? Quels moyens <strong>de</strong> communication existent entre les agents ?∗ Problématique <strong>de</strong> l’adaptation : quelles sont les possibilités <strong>et</strong> les moyens d’adaptation individuelle<strong>et</strong> d’apprentissage pour chaque agent ? Existe-t’il un modèle d’adaptation collective oud’évolution ?∗ Problématique <strong>de</strong> l’implémentation : comment implémenter <strong>de</strong>s systèmes multi-agents ? Et notammentcomment choisir le langage <strong>de</strong> communication entre agents, le langage <strong>de</strong> <strong>de</strong>scription<strong>de</strong>s lois <strong>de</strong> l’environnement, celui <strong>de</strong> représentation <strong>de</strong>s connaissances <strong>de</strong>s agents <strong>et</strong> <strong>de</strong> leurspréférences ?En reprenant ces cinq problématiques, il est possible <strong>de</strong> décrire quelques éléments <strong>de</strong> l’architecture1


Introductiond’un système multi-agent :∗ Les agents doivent être dotés <strong>de</strong> systèmes <strong>de</strong> décision. Les théories <strong>de</strong> la décision sont un domaineà part entière d’étu<strong>de</strong> à ce suj<strong>et</strong> (voir par exemple [Hansson, 1991] pour un aperçu dudomaine).∗ Les agents doivent être dotés d’un modèle cognitif. Là-aussi, plusieurs modèles existent, l’un<strong>de</strong>s plus classiques étant le modèle BDI (Beliefs-Desires-Intentions) [Rao <strong>et</strong> Georgeff, 1991].Ce modèle considère d’une part l’ensemble <strong>de</strong> croyances (Beliefs) <strong>de</strong> l’agent sur son environnement,qui sont le résultat <strong>de</strong> ses connaissances <strong>et</strong> <strong>de</strong> ses perceptions ; l’ensemble <strong>de</strong> ses objectifs(Desires), qui sont les états possibles envers lesquels l’agent peut vouloir s’engager ; <strong>et</strong> enfinl’ensemble <strong>de</strong>s intentions (Intentions) qui regroupe l’ensemble <strong>de</strong>s proj<strong>et</strong>s qu’il a l’intention <strong>de</strong>mener à bien.∗ Les agents doivent être dotés d’un système <strong>de</strong> communication. Plusieurs langages spécialisésont vu le jour à c<strong>et</strong>te fin : le Knowledge Query and Manipulation Language (KQML,[Finin <strong>et</strong> al., 1994; Labrou <strong>et</strong> Finin, 1997]), <strong>et</strong> plus récemment, le standard FIPA-ACL créé parla Foundation for Intelligent Physical Agents FIPA. Ce <strong>de</strong>rnier standard repose en particuliersur la théorie <strong>de</strong>s actes <strong>de</strong> langage [Searle, 1969].∗ La problématique <strong>de</strong> l’adaptation est un suj<strong>et</strong> épineux, obj<strong>et</strong> <strong>de</strong> nombreuses recherches à l’heureactuelle. On pourrait toutefois citer l’exemple <strong>de</strong> certains virus, aussi bien biologiques qu’informatiques,capables <strong>de</strong> s’adapter à leur environnement en mutant.∗ Enfin, l’implémentation effective du système multi-agent, si elle ne fait pas à proprement parlerpartie <strong>de</strong> l’architecture du système, mérite d’être évoquée à travers l’exemple <strong>de</strong>s nombreux langages<strong>de</strong> programmation qui ont été développé à <strong>de</strong>s fins <strong>de</strong> recherche en intelligence artificielle(en particulier le langage LISP). Les langages <strong>de</strong> représentation utiles à ces sytèmes, que ce soitpour représenter les connaissances <strong>de</strong>s agents, leurs préférences, ou encore la façon dont ilscommuniquent, ont également fait l’obj<strong>et</strong> <strong>de</strong> nombreuses recherches en intelligence artificielle.Bien que toutes ces problématiques soient liées, nous avons choisi <strong>de</strong> nous intéresser plus spécifiquementdans ce manuscrit à la problématique <strong>de</strong> l’interaction, <strong>et</strong> à la façon <strong>de</strong> représenter les préférences<strong>de</strong> chacun <strong>de</strong>s agents. Comme nous l’avons évoqué plus haut, les agents d’un système peuvent avoirbesoin <strong>de</strong> communiquer afin <strong>de</strong> résoudre <strong>de</strong>s différences d’opinions <strong>et</strong> <strong>de</strong>s conflits d’intérêts, <strong>de</strong> travaillerensemble afin <strong>de</strong> résoudre <strong>de</strong>s dilemmes, <strong>de</strong> trouver <strong>de</strong>s preuves, ou tout simplement d’échanger<strong>de</strong>s informations. De plus, chaque agent a <strong>de</strong>s préférences au sein d’un système multi-agent, <strong>de</strong>sdésirs sur les états du mon<strong>de</strong> qu’il souhaite atteindre, <strong>et</strong> ceux qu’il souhaite éviter. Le “sort” <strong>de</strong> chacun<strong>de</strong>s agents, c’est-à-dire la satisfaction <strong>de</strong> ses préférences, dépend alors non seulement <strong>de</strong> ses propresdécisions, mais aussi <strong>de</strong>s décisions prises par les autres membres du sytème. La décision “optimale”pour un individu dépend donc généralement <strong>de</strong> ses propres actions, mais également <strong>de</strong> ce que font lesautres agents. Comme chacun n’est pas totalement maître <strong>de</strong> son sort, on dit que les agents sont eninteraction stratégique. Plusieurs cadres <strong>de</strong> travail existent pour traiter c<strong>et</strong>te problématique.Cadre <strong>de</strong> travail choisiLa théorie <strong>de</strong>s jeux est probablement le modèle formel le plus abouti pour l’étu<strong>de</strong> <strong>de</strong>s interactions stratégiquesentre agents. Plusieurs raisons nous ont amené à choisir ce cadre <strong>de</strong> travail. Tout d’abord lesjeux perm<strong>et</strong>tent <strong>de</strong> décrire <strong>de</strong>s situations sociales très différentes : les marchés en économie peuvent2 Elise Bonzon


Introductionêtre vus comme <strong>de</strong>s jeux dans lesquels les participants sont <strong>de</strong>s producteurs ou <strong>de</strong>s consommateurs ;<strong>et</strong>, plus généralement, une partie d’échecs, la formation d’une coalition gouvernementale ou encoreune négociation sont autant <strong>de</strong> jeux différents obéissant à <strong>de</strong>s règles spécifiques. Ensuite, ce cadre <strong>de</strong>travail est, <strong>et</strong> a été, l’obj<strong>et</strong> <strong>de</strong> nombreuses recherches, <strong>et</strong> est très riche en résultats. C’est égalementun cadre <strong>de</strong> travail très intuitif à manipuler : il est en eff<strong>et</strong> facile <strong>de</strong> visualiser les interactions entreagents.Informellement, un jeu consiste en un ensemble d’agents (ou joueurs), <strong>et</strong> pour chaque agent, la donnéed’un ensemble <strong>de</strong> stratégies possibles <strong>et</strong> une fonction d’utilité associant une valeur réelle à chaquecombinaison possible <strong>de</strong> stratégies, représentant ses préférences. Des hypothèses sur les croyances<strong>de</strong> l’agent au cours du jeu doivent être en outre spécifiées pour les jeux dynamiques à informationincomplète.Nous étudierons ici les interactions entre joueurs <strong>et</strong> la représentation <strong>de</strong> leurs préférences en nous plaçantdans un cadre simple : les jeux statiques à information complète. Un jeu est statique si les agentschoisissent leur stratégie en parallèle <strong>et</strong> en une seule étape, sans observer les choix <strong>de</strong>s autres joueurs.Il est à information complète si chaque joueur connaît exactement l’état du mon<strong>de</strong>, les préférences <strong>et</strong>les actions disponibles pour chacun <strong>de</strong>s joueurs.Plusieurs mo<strong>de</strong>s <strong>de</strong> représentation sont utilisés en théorie <strong>de</strong>s jeux, notamment les formes extensives<strong>et</strong> les formes normales qui coïnci<strong>de</strong>nt dans le cas <strong>de</strong>s jeux statiques. Les fonctions d’utilité sont généralementdécrites explicitement dans ces représentations, en énumérant toutes les valeurs pour chaquecombinaison <strong>de</strong> stratégies. Le nombre <strong>de</strong> valeurs numériques à spécifier, c’est-à-dire le nombre <strong>de</strong>combinaisons <strong>de</strong> stratégies possibles, est alors exponentiel en fonction du nombre <strong>de</strong> joueurs, ce quirend c<strong>et</strong>te représentation explicite <strong>de</strong>s préférences <strong>de</strong>s joueurs déraisonnable lorsque le nombre <strong>de</strong>joueurs est grand. Ceci <strong>de</strong>vient encore plus problématique lorsque l’ensemble <strong>de</strong>s stratégies disponiblespour un agent consiste à assigner une valeur à chacune <strong>de</strong> ses variables à partir d’un domainefini donné (ce qui est le cas dans beaucoup <strong>de</strong> domaines réalistes). Dans ce cas, la représentationexplicite <strong>de</strong>s fonctions d’utilité est <strong>de</strong> taille exponentielle en fonction du nombre d’agents (n × 2 nvaleurs pour n agents ayant chacun <strong>de</strong>ux stratégies disponibles) <strong>et</strong> en fonction du nombre <strong>de</strong> variablescontrôlées par les agents (2 × 2 p × 2 p valeurs pour <strong>de</strong>ux agents contrôlant chacun p variables booléennes).Ainsi, spécifier les préférences <strong>de</strong>s joueurs <strong>de</strong> façon explicite est clairement peu raisonnable,tout d’abord car cela nécessiterait une quantité d’espace exponentielle, puis parce qu’étudier ces jeux(en calculant par exemple <strong>de</strong>s concepts <strong>de</strong> solution comme les équilibres <strong>de</strong> Nash en stratégies pures)exigerait d’accé<strong>de</strong>r à toutes ces valeurs d’utilité au moins une fois, <strong>et</strong> serait donc exponentiel en tempsen fonction du nombre d’agents <strong>et</strong> du nombre <strong>de</strong> variables.Une solution pour répondre à ces besoins consiste à utiliser un langage perm<strong>et</strong>tant une représentationconcise <strong>de</strong>s relations <strong>de</strong> préférences, ou <strong>de</strong>s fonctions d’utilité, sur un ensemble <strong>de</strong> conséquences quipossè<strong>de</strong> une structure combinatoire (c’est-à-dire un produit cartésien <strong>de</strong> domaines <strong>de</strong> valeurs finispour un ensemble fini <strong>de</strong> variables). Ces langages ont été activement étudiés ces <strong>de</strong>rnières années,spécialement dans la communauté d’intelligence artificielle. Ils exploitent dans une large mesure<strong>de</strong>s propriétés structurelles <strong>de</strong>s relations <strong>de</strong> préférences (comme l’indépendance préférentielle entrevariables). Partant <strong>de</strong> là, puisque la spécification d’un jeu statique nécessite la <strong>de</strong>scription <strong>de</strong>s préférences<strong>de</strong>s agents, il apparaît naturel <strong>de</strong> représenter <strong>de</strong> tels jeux en utilisant <strong>de</strong>s langages <strong>de</strong> représentationcompacte <strong>de</strong> préférences. Il existe déjà plusieurs cadres répondant aux problèmes que nousavons posés plus haut, notamment les langages graphiques que nous présenterons dans le chapitre 4Jeux booléens 3


Introduction(page 121).Proposition <strong>et</strong> méthodologieComme nous l’avons vu, notre objectif ici est <strong>de</strong> spécifier <strong>de</strong> façon concise <strong>et</strong> efficace les interactionsentre agents rationnels au sein d’un système multi-agents. Pour cela, nous avons choisi <strong>de</strong> nousappuyer sur la théorie <strong>de</strong>s jeux, qui est un modèle formel abouti pour l’étu<strong>de</strong> <strong>de</strong> ces interactions. Pourtant,une <strong>de</strong>s principales lacunes <strong>de</strong> c<strong>et</strong>te théorie est la façon <strong>de</strong> représenter les utilités <strong>de</strong>s joueurs,coûteuse en place mémoire <strong>et</strong> en temps d’exécution. Nous avons vu qu’une solution pour pallier cesproblèmes est d’utiliser un langage <strong>de</strong> représentation compacte <strong>de</strong> préférences. La première étapeconsiste donc à choisir un tel langage, puis d’étudier les jeux pouvant être formalisés dans ce cadre :étu<strong>de</strong> <strong>de</strong>s différents concepts <strong>de</strong> solution <strong>de</strong> ces jeux, étu<strong>de</strong> <strong>de</strong> la complexité <strong>de</strong>s problèmes associés.L’étape suivante consiste à essayer <strong>de</strong> généraliser ces jeux en introduisant <strong>de</strong> nouvelles représentationscompactes <strong>de</strong> préférences.Choix d’un langage <strong>de</strong> représentation compacte <strong>de</strong> préférencesAfin <strong>de</strong> trouver un langage <strong>de</strong> représentation compacte <strong>de</strong> préférence répondant à nos besoins, nous<strong>de</strong>vons commencer par répondre à une question préliminaire : les buts <strong>de</strong>s agents doivent-ils êtreexprimés avec <strong>de</strong>s préférences numériques ou ordinales ? Un langage <strong>de</strong> représentation <strong>de</strong> préférencesdoit être aussi proche que possible <strong>de</strong> la façon dont les individus “connaissent” leurs préférences <strong>et</strong>les expriment en langage naturel. Dans ce cadre, le problème conceptuel <strong>de</strong> l’utilité cardinale est qu’iln’existe pas d’échelle objective <strong>de</strong> la mesure <strong>de</strong> l’utilité, <strong>et</strong> qu’il est donc difficile pour un individud’évaluer numériquement l’utilité apportée par la satisfaction <strong>de</strong> chacun <strong>de</strong> ses désirs. Dans le cadre<strong>de</strong> l’utilité ordinale, il est <strong>de</strong>mandé au consommateur <strong>de</strong> pouvoir classer raisonnablement les mon<strong>de</strong>sdisponibles en fonction <strong>de</strong> l’utilité apportée, ce qui semble a priori plus aisé à effectuer pour <strong>de</strong>nombreux individus.Les notions que nous voulons étudier dans un jeu représentent un autre critère <strong>de</strong> choix entre préférencesnumériques ou ordinales. En eff<strong>et</strong>, quelques notions (telles que équilibres <strong>de</strong> Nash en stratégiespures <strong>et</strong> stratégies dominées) peuvent être définies avec <strong>de</strong>s préférences ordinales, tandis que d’autres(telles que équilibres <strong>de</strong> Nash en stratégies mixtes) ont besoin <strong>de</strong> préférences cardinales. Ici, nousavons choisi <strong>de</strong> nous restreindre aux calculs <strong>de</strong> stratégies pures, <strong>et</strong> nous avons donc choisi <strong>de</strong> représenterles préférences <strong>de</strong>s joueurs <strong>de</strong> façon ordinale.Le langage <strong>de</strong> représentation compacte <strong>de</strong> préférences ordinal le plus simple <strong>et</strong> le plus intuitif paraîtêtre la logique propositionnelle. En eff<strong>et</strong>, utiliser la logique propositionnelle pour représenter lespréférences <strong>de</strong>s joueurs perm<strong>et</strong> non seulement <strong>de</strong> simplifier les jeux, mais aussi d’utiliser les propriétés<strong>et</strong> les outils bien connus <strong>de</strong> c<strong>et</strong>te logique pour étudier les caractéristiques <strong>de</strong> tels jeux. Nousavons donc choisi ici d’étudier le cas où chaque agent contrôle un ensemble fini <strong>de</strong> variables binaires.Ces jeux, appelés jeux booléens, ont été introduits par [Harrenstein <strong>et</strong> al., 2001; Harrenstein, 2004a;Dunne <strong>et</strong> van <strong>de</strong>r Hoek, 2004]. Un jeu booléen est un jeu à <strong>de</strong>ux joueurs, chacun d’entre eux contrôlantun ensemble <strong>de</strong> variables propositionnelles, <strong>et</strong> à somme nulle. La fonction d’utilité du joueur 1(<strong>et</strong> donc celle du joueur 2 qui est son opposé) est représentée par une formule <strong>de</strong> la logique propositionnelle,appelée forme booléenne du jeu, qui doit être satisfaite pour que le joueur soit également4 Elise Bonzon


Introductionsatisfait. Chaque joueur a donc <strong>de</strong>s préférences dichotomiques (soit il est satisfait, soit il ne l’est pas,sans niveau intermédiaire).Ces trois restrictions (<strong>de</strong>ux joueurs, somme nulle, préférences binaires) limitent fortement l’expressivité<strong>de</strong>s jeux booléens. Nous avons donc commencé par généraliser ces jeux en étudiant <strong>de</strong>s jeux à njoueurs <strong>et</strong> à somme non nulle, puis nous avons introduit <strong>de</strong>s préférences non binaires.Etu<strong>de</strong> <strong>de</strong>s jeux booléensLes jeux booléens peuvent être facilement transformés en <strong>de</strong>s jeux à n joueurs à somme non nulleen définissant les préférences <strong>de</strong>s agents comme étant un n-upl<strong>et</strong> <strong>de</strong> formules propositionnelles. Desoutils simples issus <strong>de</strong> la logique propositionnelle nous perm<strong>et</strong>tent alors <strong>de</strong> caractériser certainespropriétés du jeu, comme les équilibres <strong>de</strong> Nash en stratégies pures <strong>et</strong> les stratégies dominées, <strong>et</strong> <strong>de</strong>calculer la complexité <strong>de</strong>s problèmes associés.Deux autres notions ont alors été étudiées : les dépendances entre joueurs (si le but, <strong>et</strong> donc la satisfaction,d’un joueur i dépend <strong>de</strong> variables contrôlées par le joueur j, alors i aura besoin <strong>de</strong> j poursatisfaire son but), <strong>et</strong> les coalitions <strong>de</strong> joueurs (une coalition dans un jeu booléen est efficace si ellepeut garantir à tous ses membres que leurs buts sont satisfaits). Ces <strong>de</strong>ux nouvelles notions nousont permis <strong>de</strong> faciliter encore le calcul <strong>de</strong>s concepts <strong>de</strong> solution tels que les équilibres <strong>de</strong> Nash enstratégies pures.Introduction <strong>de</strong> nouvelles préférencesTandis qu’une simple formule propositionnelle ϕ ne peut pas exprimer plus qu’une relation <strong>de</strong> préférencebinaire sur les interprétations (les modèles <strong>de</strong> ϕ sont strictement meilleurs que les modèles<strong>de</strong> ¬ϕ), exprimer <strong>de</strong>s préférences (non binaires) dans un cadre propositionnel est possible en utilisantun autre langage <strong>de</strong> représentation compacte <strong>de</strong> préférences. Nous avons choisi <strong>de</strong> nous restreindreencore aux préférences ordinales, <strong>et</strong> nous avons integré <strong>de</strong>ux <strong>de</strong> ces langages aux jeux booléens : toutd’abord, les buts à priorité puis les CP-n<strong>et</strong>s.Plan du manuscritAprès avoir donné dans le chapitre 1 quelques éléments sur la théorie <strong>de</strong>s jeux, nous donnerons dansle chapitre 2 une <strong>de</strong>scription (simplifiée) <strong>de</strong>s jeux booléens puis nous montrerons qu’ils peuvent facilementêtre généralisés <strong>de</strong> manière à représenter <strong>de</strong>s jeux avec un nombre arbitraire <strong>de</strong> joueurs <strong>et</strong> àsomme non nulle, mais en gardant l’hypothèse que les préférences <strong>de</strong> chaque joueur sont représentéespar une formule propositionnelle unique, ce qui ne perm<strong>et</strong> <strong>de</strong> représenter que <strong>de</strong>s utilités binaires.Nous verrons comment introduire la notion <strong>de</strong> dépendance entre les joueurs, <strong>et</strong> comment <strong>de</strong>s outilssimples issus <strong>de</strong> la logique propositionnelle perm<strong>et</strong>tent <strong>de</strong> caractériser certaines propriétés du jeu,puis nous donnerons quelques résultats <strong>de</strong> complexité algorithmique. Nous introduirons ensuite dansle chapitre 3 <strong>de</strong>ux langages <strong>de</strong> représentation <strong>de</strong> préférences afin d’enrichir encore les jeux booléensavec <strong>de</strong>s préférences non dichotomiques : les buts à priorité puis les CP-n<strong>et</strong>s. Dans le chapitre 4, nousexposerons quelques-uns <strong>de</strong>s travaux utilisant <strong>de</strong>s langages <strong>de</strong> représentation compacte <strong>de</strong> préférencesdans <strong>de</strong>s jeux, en montrant le lien avec nos solutions. Nous étudierons ensuite dans le chapitre 5 lesJeux booléens 5


Introductioncoalitions efficaces dans les jeux booléens. Nous étudierons tout d’abord les propriétés <strong>de</strong>s fonctionsd’effectivité associées aux jeux booléens, puis la notion <strong>de</strong> coalition efficace : nous donnerons une caractérisationexacte <strong>de</strong>s ensembles <strong>de</strong> coalitions correspondant à <strong>de</strong>s ensembles <strong>de</strong> coalitions efficacesassociées à un jeu booléen, <strong>et</strong> nous ferons le lien entre coalition efficace <strong>et</strong> noyau avant <strong>de</strong> conclure.La figure 1 donne un gui<strong>de</strong> <strong>de</strong> lecture <strong>de</strong>s chapitres : une flèche d’un chapitre vers un autre indiqueque la lecture du premier est nécessaire à la compréhension du second.Chapitre 1Chapitre 2Chapitre 3Chapitre 5Chapitre 4Figure 1 — Gui<strong>de</strong> <strong>de</strong> lecture6 Elise Bonzon


NotationsSoit V = {a,b,...} un ensemble fini <strong>de</strong> variables propositionnelles <strong>et</strong> L V le langage propositionnelconstruit à partir <strong>de</strong> V , <strong>de</strong>s connecteurs habituels <strong>et</strong> <strong>de</strong>s constantes booléennes ⊤ (vrai) <strong>et</strong> ⊥ (faux).Les formules <strong>de</strong> L V seront notées ϕ,ψ <strong>et</strong>c. On note Var(ϕ) l’ensemble <strong>de</strong>s variables présentes dans laformule ϕ.Un littéral est, soit une variable <strong>de</strong> V , soit sa négation. Une conjonction finie <strong>de</strong> littéraux est appelé<strong>et</strong>erme ou cube, <strong>et</strong> une disjonction finie <strong>de</strong> littéraux est appelée une clause. On note Lit(ϕ) l’ensemble<strong>de</strong>s littéraux formant la formule ϕ. Une formule ϕ est en DNF si c’est une disjonction <strong>de</strong> termes.2 V est l’ensemble <strong>de</strong>s interprétations pour V avec la convention suivante : soit M une interprétationpour V <strong>et</strong> pour tout x ∈ V , M donne la valeur vrai à x si x ∈ M <strong>et</strong> faux sinon. Soit M une interprétationpour V <strong>et</strong> ψ ∈ L V , la conséquence logique M |= ψ est définie <strong>de</strong> la manière usuelle.Soit X ⊆ V . 2 X est l’ensemble <strong>de</strong>s X-interprétations. Une interprétation partielle <strong>de</strong> L V est une X-interprétation pour X ⊆ V . Les interprétations partielles sont représentées par une liste <strong>de</strong> variables<strong>de</strong> X, le symbole représentant la négation d’une variable. Par exemple, si X = {a,b,d}, la X-interprétation M = {a,d} sera notée abd. Si Var(ϕ) ⊆ X, alors Mod X (ϕ) représente l’ensemble <strong>de</strong>sX-interpr<strong>et</strong>ations satisfaisant ϕ.Si {V 1 ,...,V p } est une partition <strong>de</strong> V <strong>et</strong> si {M 1 ,...,M p } sont <strong>de</strong>s interprétations partielles, avec M i ∈2 V i, (M 1 ,...,M p ) représente alors l’interprétation M 1 ∪... ∪ M p .Rappellons que, quelle que soit la formule ϕ, une interprétation qui rend ϕ vrai est un modèle <strong>de</strong> ϕ.L’interprétation partielle d’une formule ϕ par une X-interprétation M X sera noté : (ϕ) MX =ϕ v∈MX ←⊤,v∈X\M X ←⊥.Nous aurons également besoin dans ce document <strong>de</strong> plusieurs notions d’impliquants premiers. Lesdéfinitions suivantes sont reprises du rapport <strong>de</strong> synthèse [Marquis, 2000].Intuitivement, un impliquant premier d’une formule propositionnelle ψ est un <strong>de</strong>s plus p<strong>et</strong>its termesdont tous les modèles sont <strong>de</strong>s modèles <strong>de</strong> ψ.Définition 1. Soit ψ une formule propositionnelle.∗ Un terme α est un impliquant <strong>de</strong> ψ ssi α |= ψ.∗ Un terme α est un impliquant premier <strong>de</strong> ψ ssi∗ α est un impliquant <strong>de</strong> ψ, <strong>et</strong>∗ pour chaque impliquant α ′ <strong>de</strong> ψ, si α |= α ′ , alors α ′ |= α.On notera PI(ψ) l’ensemble <strong>de</strong>s impliquants premiers <strong>de</strong> ψ.7


NotationsUn L-impliquant (resp. L-impliquant premier) est un impliquant (resp. impliquant premier) dont tousles littéraux appartiennent à l’ensemble L.Définition 2. Soit L ⊆ V <strong>et</strong> soit ψ une formule propositionnelle <strong>de</strong> L V .∗ Un terme α est un L-impliquant <strong>de</strong> ψ ssi α |= ψ <strong>et</strong> Lit(α) ⊆ L.∗ Un terme α est un L-impliquant premier <strong>de</strong> ψ ssi∗ α est un L-impliquant <strong>de</strong> ψ, <strong>et</strong>∗ pour chaque L-impliquant α ′ <strong>de</strong> ψ, si α |= α ′ , alors α ′ |= α.On notera PI L (ψ) l’ensemble <strong>de</strong>s L-impliquants premiers <strong>de</strong> ψ.La notion <strong>de</strong> projection d’une formule sur un ensemble <strong>de</strong> variables correspond à l’utilisation <strong>de</strong>l’opérateur forg<strong>et</strong>, qui a été étudié par [Lang <strong>et</strong> al., 2002a, 2003].On dit que l’on “oublie complètement” la variable x dans une formule ϕ si <strong>et</strong> seulement si on s’intéresseà la formule (notée ∀x:ϕ) : ϕ x←⊤ ∧ ϕ x←⊥ .On peut aussi “oublier partiellement” x dans ϕ en s’intéressant à la formule (notée ∃x:ϕ) : ϕ x←⊤ ∨ϕ x←⊥ .On note que l’on a :Par exemple, soit la formule ϕ suivante :∀x:ϕ≡¬∃x:¬ϕϕ = (a ∧ ¬b ∧ c) ∨(b ∧ ¬c) ∨(a ∧ b ∧ d)La projection <strong>de</strong> ϕ sur la variable c sera calculée comme suit :∃c:ϕ= [(a ∧ ¬b ∧ ⊤) ∨(b ∧ ⊥) ∨(a ∧ b ∧ d)] ∨[(a ∧ ¬b ∧ ⊥) ∨(b ∧ ⊤) ∨(a ∧ b ∧ d)]= (a ∧ ¬b) ∨ b ∨(a ∧ b ∧ d)∀c:ϕ= [(a ∧ ¬b ∧ ⊤) ∨(b ∧ ⊥) ∨(a ∧ b ∧ d)] ∧[(a ∧ ¬b ∧ ⊥) ∨(b ∧ ⊤) ∨(a ∧ b ∧ d)]= ((a ∧ ¬b) ∨(a ∧ b ∧ d)) ∧(b ∨(a ∧ b ∧ d))= a ∧ b ∧ d8 Elise Bonzon


1Eléments <strong>de</strong> théorie <strong>de</strong>s jeuxLa théorie <strong>de</strong>s jeux est un outil mathématique perm<strong>et</strong>tant d’étudier les comportements - prévus, réels,ou justifiés a posteriori - d’individus face à <strong>de</strong>s situations d’antagonisme.Si ses précurseurs furent Cournot [Cournot, 1838] <strong>et</strong> Edgeworth [Edgeworth, 1897], c’est la parutionen 1944 <strong>de</strong> l’ouvrage <strong>de</strong> John Von Neumann <strong>et</strong> Oskar Morgenstern, The Theory of Games and EconomicBehaviour [von Newmann <strong>et</strong> Morgenstern, 1944], qui instaura véritablement la théorie <strong>de</strong>s jeuxcomme étant une nouvelle discipline. Dans c<strong>et</strong> ouvrage, Von Neumann <strong>et</strong> Morgenstern proposent unesolution dans le cas particulier d’un jeu à somme nulle (ce qui est gagné par l’un est perdu par l’autre,<strong>et</strong> réciproquement). En 1950, John Nash [Nash, 1950] a montré comment les idées développées parCournot dès 1838 pouvaient servir <strong>de</strong> base pour construire une théorie <strong>de</strong> l’équilibre pour <strong>de</strong>s jeux àsomme non nulle, qui généralise la solution proposée par Von Neumann <strong>et</strong> Morgenstern. Les économistes,premiers à s’approprier c<strong>et</strong> outil, ont été <strong>de</strong>puis rejoints par, entre autres, les sociologues, leschercheurs en sciences politiques, les philosophes, ou encore les informaticiens.La théorie <strong>de</strong>s jeux étudie <strong>de</strong>s situations dans lesquelles le sort <strong>de</strong> chaque participant dépend nonseulement <strong>de</strong>s décisions qu’il prend, mais également <strong>de</strong>s décisions prises par d’autres participants.Le choix optimal pour un agent (appelé joueur) dépend donc généralement <strong>de</strong>s choix <strong>de</strong>s autresagents. Comme chaque joueur n’est pas totalement maître <strong>de</strong> son sort, on dit que les agents sont ensituation d’interaction stratégique. On suppose dans un jeu en interaction stratégique que les joueursse connaissent : ils savent combien il y a <strong>de</strong> joueurs, <strong>et</strong> qui ils sont. Du fait que le gain <strong>de</strong> chacundépend en partie <strong>de</strong>s actions <strong>de</strong>s autres, un joueur ne peut pas se contenter <strong>de</strong> choisir ses propresplans d’actions, en négligeant ce que font les autres. Il doit au contraire se faire une idée aussi préciseque possible <strong>de</strong>s stratégies choisies, ou susceptibles d’être choisies, par les autres joueurs. Pour cela,on adm<strong>et</strong> que les agents sont rationnels, c’est-à-dire que chaque joueur s’efforce <strong>de</strong> prendre lesmeilleures décisions pour lui-même, <strong>et</strong> sait que les autres joueurs font <strong>de</strong> même.Notre objectif ici n’est pas <strong>de</strong> donner un état <strong>de</strong> l’art exhaustif sur la théorie <strong>de</strong>s jeux, nous voulonsjuste introduire quelques concepts qui nous seront utiles dans la suite <strong>de</strong> ce manuscrit. Nous allonsdonc tout d’abord présenter une taxonomie partielle <strong>de</strong>s jeux en Section 1.1, puis les types <strong>de</strong> représentation<strong>de</strong>s jeux en Section 1.2, <strong>et</strong> enfin nous présenterons en Section 1.3 quelques concepts <strong>de</strong>solution.9


Eléments <strong>de</strong> théorie <strong>de</strong>s jeux1.1 Taxonomie partielle <strong>de</strong>s jeuxNous allons présenter ici quatre types <strong>de</strong> jeux, les jeux statiques, dynamiques, coopératifs <strong>et</strong> noncoopératifs. Un jeu peut réunir plusieurs <strong>de</strong> ces caractéristiques : il peut être statique <strong>et</strong> coopératif,statique <strong>et</strong> non coopératif, dynamique <strong>et</strong> coopératif ou encore dynamique <strong>et</strong> non coopératif.1.1.1 Jeux statiques <strong>et</strong> dynamiquesLa première distinction que nous allons faire est celle entre jeu statique <strong>et</strong> dynamique. Un jeu eststatique lorsque tous les joueurs jouent simultanément en une seule étape, alors qu’il est dynamiquelorsque le jeu se déroule en plusieurs étapes (un ou plusieurs joueurs peuvent jouer à chaque étape).1.1.1.1 Jeux statiquesUn jeu est dit statique lorsque les joueurs choisissent simultanément leurs actions, <strong>et</strong> reçoiventensuite leurs gains respectifs.Définition 1.1. Un jeu statique est un ensemble <strong>de</strong> règles qui encadre le comportement <strong>de</strong>s joueurs <strong>et</strong>qui détermine les gains <strong>de</strong>s joueurs selon les actions entreprises. Formellement, un jeu G est constitué<strong>de</strong> :∗ un ensemble <strong>de</strong> joueurs N = {1,... ,n},∗ l’ensemble <strong>de</strong>s profils <strong>de</strong> stratégies ou issues du jeu S = S 1 × ... × S n , où S i . représentel’ensemble <strong>de</strong>s choix possibles (stratégies) du joueur i. On suppose dans la suite que les S i sontfinis.∗ ∀i ∈ N, une fonction d’utilité qui représente les gains du joueur en fonction <strong>de</strong> l’issue du jeu :u i : S → IR. Le joueur i préfère strictement l’issue s à l’issue s ′ si u i (s) > u i (s ′ ). Si u i (s) = u i (s ′ ),i est indifférent entre ces <strong>de</strong>ux issues.∀i ∈ N, S i représente toutes les stratégies s i disponibles pour le joueur i. Un profil <strong>de</strong> stratégies,appelé aussi issue du jeu, est une combinaison <strong>de</strong> stratégies individuelles s = (s 1 ,...,s n ) ∈ S 1 ×...×S n .Soit G un jeu statique, avec N = {1,... ,n}, s = (s 1 ,...,s n ) <strong>et</strong> s ′ = (s ′ 1 ,...,s′ n) <strong>de</strong>ux profils<strong>de</strong> stratégies. On note s −i le profil <strong>de</strong> stratégies s privé <strong>de</strong> la stratégie du joueur i : s −i =(s 1 ,s 2 ,...,s i−1 ,s i+1 ,...,s n ). On note (s −i ,s ′ i ) le profil <strong>de</strong> stratégies s dans lequel on a remplacé la stratégiedu joueur i par celle du profil s ′ : (s −i ,s ′ i ) = (s 1,s 2 ,...,s i−1 ,s ′ i ,s i+1,...,s n ). On note S I = × i∈I S il’ensemble <strong>de</strong>s stratégies pour I ⊆ N.Le dilemme du prisonnier, que nous allons présenter maintenant, est un exemple célèbre <strong>de</strong> lathéorie <strong>de</strong>s jeux.Exemple 1.1. Deux suspects sont r<strong>et</strong>enus dans <strong>de</strong>s cellules séparées, <strong>et</strong> ne peuvent donc pas communiquer.La police ne dispose pas d’éléments <strong>de</strong> preuve suffisants pour obtenir leur condamnation,l’aveu d’au moins un <strong>de</strong>s <strong>de</strong>ux est donc indispensable. La police propose à chacun d’entre eux lemarché suivant :∗ si vous avouez <strong>et</strong> que votre complice n’avoue pas, vous aurez une remise <strong>de</strong> peine, tandis quevotre complice aura la peine maximale (10 ans) ;10 Elise Bonzon


1.1. Taxonomie partielle <strong>de</strong>s jeux∗ si vous avouez tous les <strong>de</strong>ux, vous serez condamnés à une peine plus légère (5 ans) ;∗ si aucun <strong>de</strong> vous n’avoue, la peine sera minimale (6 mois), faute d’éléments au dossier.On peut formaliser c<strong>et</strong>te situation par un jeu à 2 joueurs, chaque joueur ayant 2 stratégies possibles :avouer (dénotée par A) ou se taire (dénotée par T ).∗ N = {1,2},∗ le prisonnier 1 a <strong>de</strong>ux stratégies possibles : s 11 = A <strong>et</strong> s 12 = T . Il en est <strong>de</strong> même pour le joueur2 : s 21 = A <strong>et</strong> s 22 = T .∗ Ce jeu a donc 4 profils <strong>de</strong> strategies possibles : AA, AT , TA <strong>et</strong> T T .∗ On peut donc calculer les utilités <strong>de</strong> chacun <strong>de</strong>s joueurs pour chacune <strong>de</strong>s issues possibles dujeu :∗ u 1 (AA) = u 2 (AA) = −5,∗ u 1 (T T) = u 2 (T T) = −0.5,∗ u 1 (AT) = u 2 (TA) = 0,∗ u 2 (AT) = u 1 (TA) = −10.La bataille <strong>de</strong>s sexes est également un jeu célèbre en théorie <strong>de</strong>s jeux :Exemple 1.2. Lucas <strong>et</strong> Elsa veulent aller au cinéma. Ils ont le choix entre un film d’horreur <strong>et</strong> unecomédie romantique. Pour les <strong>de</strong>ux, ce qui compte avant tout, c’est d’être ensemble. Néanmoins, Elsaa une préférence pour le film d’horreur <strong>et</strong> Lucas pour la comédie romantique.On peut formaliser c<strong>et</strong>te situation par un jeu à 2 joueurs, chaque joueur ayant 2 stratégies possibles :aller voir un film d’horreur (dénotée par H) ou une comédie romantique (dénotée par R).∗ N = {1,2},∗ Elsa (1) a 2 stratégies possibles : s 11 = H <strong>et</strong> s 12 = R. Lucas (2) a les même possibilités :s 21 = H <strong>et</strong> s 22 = R.∗ On peut donc calculer les utilités <strong>de</strong> chacun <strong>de</strong>s joueurs pour chacune <strong>de</strong>s issues possibles dujeu :∗ u 1 (H,H) = u 2 (R,R) = 2,∗ u 1 (R,R) = u 2 (H,H) = 1,∗ u 1 (H,R) = u 1 (R,H) = u 2 (H,R) = u 2 (R,H) = 0.1.1.1.2 Jeux dynamiquesUn jeu dynamique est un jeu qui se déroule en plusieurs étapes. On se place ici dans le cadre <strong>de</strong>s jeuxdynamiques en information complète, c’est-à-dire que l’on adm<strong>et</strong> que toutes les actions passéessont observables <strong>et</strong> connues <strong>de</strong> tous les joueurs. Dans ce cadre, en intervenant à <strong>de</strong>s étapes antérieuresdu jeu, certains joueurs ont le pouvoir d’affecter directement les gains d’autres joueurs <strong>de</strong> manièreirréversible.Un jeu est en information parfaite si chaque joueur connaît l’ensemble <strong>de</strong>s actions choisies par tousles joueurs qui sont intervenus avant qu’il ne sélectionne sa stratégie 1 , <strong>et</strong> qu’il connaît toutes leursstratégies possibles. Il est le seul joueur à prendre une décision à c<strong>et</strong>te étape 2 . Si plusieurs joueurs1 Dans le cadre <strong>de</strong>s jeux statiques, la notion d’information parfaite n’a aucun sens : les joueurs jouent simultanément <strong>et</strong>en une seule étape, <strong>et</strong> n’ont donc pas à connaître les actions déjà réalisées.2 Par exemple, le jeu d’échecs est un jeu à information parfaite.Jeux booléens 11


Eléments <strong>de</strong> théorie <strong>de</strong>s jeuxchoisissent leurs actions simultanément à une étape donnée, ou si les joueurs ne connaissent pastoutes les stratégies <strong>de</strong>s autres joueurs 3 , le jeu est dit en information imparfaite. Ces actions ne sontpas connues <strong>et</strong> chacun <strong>de</strong>s joueurs intervenant à c<strong>et</strong>te étape se comporte un peu comme dans un jeustatique, à la différence que dans ce cas, l’histoire du jeu influence le choix <strong>de</strong> chacun.Définissons le cadre conceptuel général <strong>de</strong>s jeux dynamiques. Soit G un jeu dynamique. On désignepar a t le vecteur <strong>de</strong>s actions choisies à l’étape t du jeu par les participants qui interviennent à c<strong>et</strong>teétape (un seul joueur dans le cas d’un jeu en information parfaite). Soit t une étape quelconque dujeu. On définit l’histoire h t = (a 0 ,a 1 ,...,a t−1 ) du jeu à l’étape t par la séquence <strong>de</strong> toutes les décisionsprises par les joueurs intervenant lors <strong>de</strong>s étapes antérieures. On suppose que tous les joueursconnaissent l’histoire du jeu à chaque étape, c’est-à-dire que toutes les actions passées sont observables<strong>et</strong> connues par tous les participants. Le reste du jeu (toutes les étapes r telles que r > t) estappelé sous-jeu <strong>de</strong> G, <strong>et</strong> est noté G(h t ). Puisque l’histoire h t du jeu à chaque étape t est connue,le sous-jeu se déroulant à partir <strong>de</strong> t peut être vu comme un jeu à part entière induit par l’histoireh t . L’histoire h t impose <strong>de</strong>s restrictions sur les choix offerts au joueur i. Soit A i (h t ) l’ensemble <strong>de</strong>sactions auxquelles le joueur i a accès à l’étape t du jeu lorsque l’histoire est donnée par h t . Si A i (h t )est vi<strong>de</strong>, le joueur i n’intervient pas à l’étape considérée 4 . Soit H t l’ensemble <strong>de</strong> toutes les histoirespossibles jusqu’à l’étape t. A i (H t ) = S h t ∈H t A i(h t ) désigne alors l’ensemble <strong>de</strong> toutes les actionspossibles pour le joueur i à l’étape t selon les histoires possibles.Nous pouvons à présent définir une stratégie pure d’un jeu dynamique adm<strong>et</strong>tant T étapes. Une stratégiepure pour le joueur i est définie par une suite <strong>de</strong> T applications S t i <strong>de</strong> H t vers A i (H t ). End’autres termes, une stratégie pure est une suite <strong>de</strong> règles <strong>de</strong> sélection d’une action particulière par lejoueur i à chaque étape du jeu compte tenu <strong>de</strong> l’histoire qui s’est déroulée jusqu’alors. Par exemple,les actions du joueur i à l’étape 0 sont a 0 i = s 0 i (h0 ), celles <strong>de</strong> l’étape 1 sont a 1 i = s 1 i (h1 ), <strong>de</strong> l’étape 2a 2 i = s 2 i (h2 ), <strong>et</strong> ainsi <strong>de</strong> suite.Nous donnerons un exemple <strong>de</strong> jeu dynamique en Section 1.3.4 (page 27).1.1.2 Jeux coopératifs <strong>et</strong> non coopératifsComme nous l’avons vu, une caractéristique fondamentale <strong>de</strong>s jeux est que le gain obtenu par unjoueur dépend <strong>de</strong> ses choix, mais aussi <strong>de</strong>s choix effectués par les autres joueurs. Il convient alors <strong>de</strong>distinguer <strong>de</strong>ux gran<strong>de</strong>s familles <strong>de</strong> jeux : les jeux coopératifs <strong>et</strong> les jeux non coopératifs.Un jeu est coopératif lorsque les joueurs peuvent passer entre eux <strong>de</strong>s accords qui les lient <strong>de</strong> manièrecontraignante. On dit alors qu’ils forment une coalition dont les membres agissent <strong>de</strong> concert. Dansle cas contraire, c’est-à-dire lorsque les joueurs n’ont pas la possibilité <strong>de</strong> former <strong>de</strong>s coalitions, le jeuest non coopératif.1.1.2.1 Jeux coopératifsUn jeu coopératif (appelé aussi jeu coalitionnel) est un jeu dans lequel les joueurs peuvent former <strong>de</strong>scoalitions <strong>et</strong> agir <strong>de</strong> concert.3 Les jeux <strong>de</strong> cartes sont généralement <strong>de</strong>s jeux à information imparfaite : à la belote par exemple, un joueur ne connaîtpas toutes les stratégies possibles <strong>de</strong> ses adversaires, il n’a pas une connaissance parfaite du jeu.4 La <strong>de</strong>scription <strong>de</strong>s ensembles A i (h t ) à chaque étape t pour tout joueur i fait partie <strong>de</strong> la spécification <strong>de</strong>s règles du jeu.12 Elise Bonzon


1.1. Taxonomie partielle <strong>de</strong>s jeuxDéfinition 1.2. Une coalition est un sous-ensemble <strong>de</strong> joueurs : C ⊆ N = {1,... ,N}. Si C est unecoalition d’un seul joueur (C = {i}), C est appelé singl<strong>et</strong>on. Si C est la coalition formée <strong>de</strong> tous lesjoueurs (C = N), C est appelé gran<strong>de</strong> coalition.On dit qu’un jeu coopératif est à utilité non transférable s’il n’est pas possible d’additionner lesutilités <strong>de</strong>s joueurs <strong>et</strong> <strong>de</strong> les redistribuer aux membres d’une coalition. Chaque membre d’une coalitionessaie d’optimiser le montant obtenu par chacun individuellement.Définition 1.3. Un jeu coopératif à utilité non transférable est une paire (N,v) où∗ N est un ensemble <strong>de</strong> joueurs∗ v est une fonction caractéristique qui associe un vecteur v(C) ∈ IR C à chaque coalition C <strong>de</strong>N, chaque élément v i du vecteur v(C) correspondant à l’utilité obtenue par le joueur i dans lacoalition C.La bataille <strong>de</strong>s sexes peut être transformée en un jeu coopératif à utilité non transferable[Luce <strong>et</strong> Raiffa, 1957] :Exemple 1.2 (page 11) – suite : La bataille <strong>de</strong>s sexes peut être formalisée par le jeu coopératif àutilité non transférable à 2 joueurs suivant :∗ N = {1,2}, ⎧⎪⎨ v(12) = {(v 1 ,v 2 );1 ≤ v 1 ≤ 2,1 ≤ v 2 ≤ 2}∗ v définie par : v(1) = {(v 1 );0 ≤ v 1 ≤ 2}⎪⎩v(2) = {(v 2 );0 ≤ v 2 ≤ 2}En eff<strong>et</strong>, si Lucas <strong>et</strong> Elsa se coordonnent, ils sont sûrs d’aller au même endroit, <strong>et</strong> donc auront chacunau moins une utilité <strong>de</strong> 1. Par contre, s’ils ne se coordonnent pas, ils ont toutes les chances <strong>de</strong> nepas être au même endroit, <strong>et</strong> donc <strong>de</strong> n’en r<strong>et</strong>irer aucune satisfaction (même s’ils peuvent avoir <strong>de</strong> lachance <strong>et</strong> que l’un <strong>de</strong>s <strong>de</strong>ux se dévoue, en espérant que l’autre n’ait pas eu la même idée).On dit qu’un jeu coopératif est à utilité transférable s’il est possible d’additionner les utilités <strong>de</strong>sjoueurs <strong>et</strong> <strong>de</strong> les redistribuer aux membres d’une coalition (il existe une “monnaie” commune à tousavec laquelle on peut effectuer <strong>de</strong>s transferts).Définition 1.4. Un jeu coopératif à utilité transférable est une paire (N,v) où∗ N est un ensemble <strong>de</strong> joueurs∗ v est une fonction caractéristique qui associe une valeur v(C) ∈ IR à chaque coalition C <strong>de</strong> N.Pour chaque coalition C, v(C) est le paiement total que peuvent se partager les joueurs appartenant àC, indépendamment du comportement <strong>de</strong>s joueurs n’appartenant pas à C.Un jeu coopératif à utilité transférable est :∗ symétrique si la valeur d’une coalition ne dépend que <strong>de</strong> sa taille : il existe une fonction f telleque ∀C ⊆ N, v(C) = f(|C|) ;∗ monotone si B ⊆ C ⇒ v(B) ≤ v(C) ;∗ superadditif si B ∩C = ∅ ⇒ v(B ∪C) ≥ v(B)+v(C) ;Jeux booléens 13


Eléments <strong>de</strong> théorie <strong>de</strong>s jeux∗ simple si pour toute coalition C, soit v(C) = 1 5 (coalition gagnante), soit v(C) = 0 (coalitionperdante), <strong>et</strong> v(N) = 1.Un joueur i dans un jeu coopératif à utilité transférable :∗ a un droit <strong>de</strong> v<strong>et</strong>o s’il appartient à toutes les coalitions gagnantes (v(C) = 1 ⇒ i ∈ C) ;∗ est un dictateur si une coalition est gagnante si <strong>et</strong> seulement si il en fait partie (v(C) = 1 ⇔ i ∈C).Exemple 1.3. Présentons ici plusieurs jeux coopératifs à utilité transférable à 3 joueurs satisfaisantdifférences propriétés 6 :∗ Majorité simple. Une coalition est gagnante si <strong>et</strong> seulement si elle comprend au moins <strong>de</strong>uxmembres {v(1) = v(2) = v(3) = 0⇒v(1,2) = v(2,3) = v(1,3) = v(1,2,3) = 1∗ Unanimité. { Une coalition est gagnante si <strong>et</strong> seulement si elle comprend tous les membresv(1,2,3) = 1⇒∀C ⊂ N,v(C) = 0∗ Le joueur 2 a un droit <strong>de</strong> v<strong>et</strong>o. Une coalition est gagnante si <strong>et</strong> seulement si elle comprend aumoins <strong>de</strong>ux membres, dont le joueur 2 : 2 peut empêcher une coalition <strong>de</strong> gagner, mais ne peutpas{pour autant gagner seulv(1) = v(2) = v(3) = v(1,3) = 0⇒v(1,2) = v(2,3) = v(1,2,3) = 1∗ Le joueur 2 est dictateur. Une coalition est gagnante si <strong>et</strong> seulement si elle comprend le joueur2 {v(1) = v(3) = v(1,3) = 0⇒v(2) = v(1,2) = v(2,3) = v(1,2,3) = 11.1.2.2 Jeux non coopératifsLes jeux non coopératifs se divisent en <strong>de</strong>ux gran<strong>de</strong>s familles : les jeux à somme nulle, <strong>et</strong> ceux àsomme non nulle. En économie, c<strong>et</strong>te notion simplificatrice <strong>de</strong> jeu à somme nulle est importante : cesjeux correspon<strong>de</strong>nt à l’absence <strong>de</strong> production, ou <strong>de</strong> <strong>de</strong>struction, <strong>de</strong> produits.Les jeux à somme nulle sont tous les jeux où la somme “algébrique” <strong>de</strong>s gains <strong>de</strong>s joueurs estconstante : ce que gagne l’un est nécessairement perdu par un autre. Stricto sensu, il est possibleque les jeux ne soient pas à somme nulle, mais à somme constante, <strong>et</strong> cela n’a aucune importanceen pratique : l’enjeu est <strong>de</strong> répartir entre tous les joueurs un total <strong>de</strong> gains préalablement fixé. Leséchecs, le poker ou encore le jeu matching pennies, présenté ci-<strong>de</strong>ssous, sont <strong>de</strong>s jeux à sommenulle, les gains d’un joueur étant très exactement les pertes d’un autre joueur, tandis que le dilemmedu prisonnier est un jeu non coopératif à somme non nulle 7 .Exemple 1.4. Deux joueurs, Robin <strong>et</strong> Annelise, annoncent simultanément pile ou face.∗ Si les annonces sont i<strong>de</strong>ntiques, Robin donne 15 euros à Annelise.5 La valeur 1 est choisie arbitrairement, il faut juste que ce soit la même pour toutes les coalitions gagnantes.6 Par souci <strong>de</strong> simplifier les notations, on écrira v(i, j) au lieu <strong>de</strong> v({i, j}).7 Les <strong>de</strong>ux prisonniers sont enfermés dans <strong>de</strong>s cellules séparées, ne peuvent pas communiquer, <strong>et</strong> donc ne peuvent paspasser un accord <strong>et</strong> former une coalition, mais ce que gagne l’un n’est pas forcément perdu par l’autre.14 Elise Bonzon


1.1. Taxonomie partielle <strong>de</strong>s jeux∗ Si les annonces ne concor<strong>de</strong>nt pas, c’est Annelise qui doit donner 15 euros à Robin.On peut formaliser c<strong>et</strong>te situation par un jeu à 2 joueurs, chaque joueur ayant 2 stratégies possibles :annoncer pile (dénotée par P) ou face (dénotée par F).∗ N = {1,2},∗ Annelise (1) a 2 stratégies possibles : s 11 = P <strong>et</strong> s 12 = F. Robin (2) a les même possibilités :s 21 = P <strong>et</strong> s 22 = F.∗ On peut donc calculer les utilités <strong>de</strong> chacun <strong>de</strong>s joueurs pour chacune <strong>de</strong>s issues possibles dujeu :∗ u 1 (P,P) = u 1 (F,F) = u 2 (P,F) = u 2 (F,P) = 15, <strong>et</strong>∗ u 1 (P,F) = u 1 (F,P) = u 2 (P,P) = u 2 (F,F) = −15.Ce jeu est bien un jeu à somme nulle : tout ce qui est gagné par Annelise est perdu par Robin, <strong>et</strong>vice-versa.En 1944, John von Neumann <strong>et</strong> Oskar Morgenstern [von Newmann <strong>et</strong> Morgenstern, 1944] ont démontréque tout jeu à somme nulle à n joueurs est une forme généralisée <strong>de</strong>s jeux à somme nulle à2 joueurs, <strong>et</strong> qu’il est possible <strong>de</strong> ramener tout jeu à somme non nulle à n joueurs à un jeu à sommenulle à n+1 joueurs, le n+1 eme joueur représentant le gain ou la perte globale.Les jeux à somme nulle à 2 joueurs constituent donc une partie essentielle <strong>de</strong> la théorie mathématique<strong>de</strong>s jeux.On peut noter ici que si les jeux à somme nulle <strong>et</strong> à <strong>de</strong>ux joueurs sont <strong>de</strong>s jeux non coopératifs, lesjeux à somme nulle <strong>et</strong> à n joueurs peuvent être coopératifs, si par exemple n − 1 joueurs se liguentcontre le n eme joueur pour le faire perdre, <strong>et</strong> se partager les gains.Exemple 1.5. Tristan, Aguirre <strong>et</strong> Matisse jouent à Pile ou Face. Si <strong>de</strong>ux d’entre eux annoncent lamême chose, ils gagnent <strong>et</strong> le troisième perd. Si les trois ont la même annonce, aucun d’entre eux negagne.On peut formaliser c<strong>et</strong>te situation par le jeu à somme nulle <strong>et</strong> à utilités non transférables à 3 joueurssuivant :∗ N = {1,2,3},∗ Tristan (1) a 2 stratégies possibles : s 11 = P <strong>et</strong> s 12 = F. Aguirre (2) <strong>et</strong> Matisse (3) ont lesmêmes possibilités : s 21 = s 31 = P <strong>et</strong> s 22 = s 32 = F.∗ On peut donc calculer les utilités <strong>de</strong> chacun <strong>de</strong>s joueurs pour chacune <strong>de</strong>s issues possibles dujeu :∗ u 1 (P,P,P) = u 1 (F,F,F) = u 2 (P,P,P) = u 2 (F,F,F) = u 3 (P,P,P) = u 3 (F,F,F) = 0,∗ u 1 (P,P,F) = u 2 (P,P,F) = u 1 (P,F,P) = u 3 (P,F,P) = u 2 (F,P,P) = u 3 (F,P,P) =u 1 (F,F,P) = u 2 (F,F,P) = u 1 (F,P,F) = u 3 (F,P,F) = u 2 (P,F,F) = u 3 (P,F,F) = 1.∗ u 3 (P,P,F) = u 2 (P,F,P) = u 1 (F,P,P) = u 3 (F,F,P) = u 2 (F,P,F) = u 1 (P,F,F) = −2.Ce jeu peut être vu comme un jeu coopératif, 2 joueurs ont intér<strong>et</strong> à se m<strong>et</strong>tre d’accord pour avoirune chance <strong>de</strong> battre le 3 eme . Il est à utilités non transférables car si un joueur gagne, il ne peut pasdonner une partie <strong>de</strong> sa victoire, ou <strong>de</strong> ce qu’il a gagné, à un autre joueur.Ce jeu peut aussi être vu comme un jeu à somme nulle <strong>et</strong> à utilités transférables si on suppose parexemple que Tristan, Aguirre <strong>et</strong> Matisse misent à l’origine 25 euros chacun ; que s’ils ont tous lestrois la même annonce ils récupèrent leur mise, mais si l’annonce d’un joueur est différente <strong>de</strong> celle<strong>de</strong>s <strong>de</strong>ux autres, il perd sa mise tandis que les <strong>de</strong>ux autres gagnent 37.5 euros chacun.Jeux booléens 15


Eléments <strong>de</strong> théorie <strong>de</strong>s jeux1.1.3 RécapitulatifNous avons donc vu dans c<strong>et</strong>te section une taxonomie <strong>de</strong> quelques jeux, que nous récapitulons dansle tableau représenté Figure 1.1, dans lequel nous avons placé les quelques exemples déjà étudiés.Somme nulleSomme non nulle¬Coop. Coop. ¬Coop. Coop.Util. transf. Util. ¬transf. Util. transf. Util. ¬transf.Statique Ex. 1.4 Ex. 1.5 Ex. 1.5 Ex. 1.1 Ex. 1.3 Ex. 1.2Dynamique Ex. 1.12Figure 1.1 — Taxonomie <strong>de</strong>s jeuxComme c’est visible sur ce tableau, certains cas ne sont pas illustrés par <strong>de</strong>s exemples. Ces <strong>de</strong>rniersconcernent les jeux dynamiques, que nous n’étudierons pas dans la suite <strong>de</strong> ce rapport. Nous avonsdonc omis <strong>de</strong> présenter exhaustivement c<strong>et</strong>te catégorie <strong>de</strong> jeux.Nous allons à présent voir comment l’on peut représenter ces jeux.1.2 Représentation <strong>de</strong>s jeuxUn jeu stratégique peut être représenté <strong>de</strong> <strong>de</strong>ux façons différentes mais équivalentes : sous formenormale (dite aussi stratégique) <strong>et</strong> sous forme extensive (dite aussi développée).1.2.1 Forme extensiveUn jeu sous forme extensive est défini par un arbre <strong>de</strong> décision décrivant les actions possibles <strong>de</strong>sjoueurs à chaque étape du jeu, la séquence <strong>de</strong> tours <strong>de</strong> jeu <strong>de</strong>s joueurs ainsi que l’information dont ilsdisposent à chaque étape pour prendre leur décision. Chaque nœud <strong>de</strong> l’arbre spécifie le joueur quidoit choisir une action (ou stratégie) à ce moment du jeu, ainsi que l’information dont il dispose. Lesgains que chaque joueur peut réaliser après avoir suivi un <strong>de</strong>s chemins possibles au sein <strong>de</strong> l’arbre,correspondant à chaque profil <strong>de</strong> stratégies, sont associés à chaque feuille <strong>de</strong> l’arbre. Par exemple, laforme extensive du dilemme du prisonnier est représentée Figure 1.2 (page suivante).Exemple 1.1 (page 10) – suite : Une forme extensive du dilemme du prisonnier est la suivante :Chaque nœud <strong>de</strong> c<strong>et</strong> arbre correspond à un joueur, <strong>et</strong> chaque branche partant <strong>de</strong> ce nœud correspondà une stratégie possible <strong>de</strong> ce joueur.Dans les feuilles, le premier élément <strong>de</strong> chaque couple représente l’utilité du prisonnier 1, tandis quele second élément représente celle du prisonnier 2.Le cercle en pointillé entourant les <strong>de</strong>ux occurrences du joueur 2 signifie que ce <strong>de</strong>rnier ne sait pasdans quelle situation il se trouve, il ne sait pas si son complice a choisi d’avouer ou <strong>de</strong> se taire.16 Elise Bonzon


1.2. Représentation <strong>de</strong>s jeux1AT2 2ATAT(-5, -5) (0, -10) (-10, 0) (-0.5, -0.5)Figure 1.2 — Forme extensive du dilemme du prisonnierCe jeu a une secon<strong>de</strong> forme extensive, plaçant le second joueur en haut <strong>de</strong> l’arbre. Ces <strong>de</strong>ux représentationssont équivalentes car les <strong>de</strong>ux joueurs jouent simultanément.La forme extensive perm<strong>et</strong> une <strong>de</strong>scription “dynamique” du jeu parce qu’elle spécifie les séquences <strong>de</strong>décisions prises par les joueurs. Pourtant, lorsqu’un jeu implique <strong>de</strong> multiples joueurs <strong>et</strong> <strong>de</strong> multipleschoix, l’arbre peut <strong>de</strong>venir complexe à représenter. Or, lorsque les stratégies <strong>de</strong>s agents sont choisiesen parallèle, c’est-à-dire sans que l’un <strong>de</strong>s joueurs observe les décisions <strong>de</strong>s autres, comme c’estle cas dans le dilemme du prisonnier, c<strong>et</strong>te construction basée sur un modèle dynamique n’est pasnécessaire. Dans ce cas, on simplifiera la présentation du jeu en utilisant une représentation sousforme normale, absolument équivalente à la forme extensive associée.1.2.2 Forme normaleUn jeu sous forme normale est la donnée <strong>de</strong> l’ensemble <strong>de</strong>s joueurs, <strong>de</strong> l’ensemble <strong>de</strong>s stratégiespour chaque joueur <strong>et</strong> <strong>de</strong>s paiements associés à toute combinaison possible <strong>de</strong> stratégies. On peutalors représenter ces jeux sous forme matricielle, en associant à chaque profil <strong>de</strong> stratégies s un n-upl<strong>et</strong> donnant l’utilité obtenue par chaque joueur dans l’ordre : (u 1 (s),u 2 (s),...,u n (s)). Par exemple,la forme normale du dilemme du prisonnier est représentée Figure 1.3.La forme normale du dilemme du prisonnier est représentée Fi-Exemple 1.1 (page 10) – suite :gure 1.3.❍ ❍❍❍❍❍ 21A TA (-5, -5) (0, -10)T (-10, 0) (-0.5, -0.5)Figure 1.3 — Forme normale du dilemme du prisonnierComme précé<strong>de</strong>mment, le premier élément <strong>de</strong> chaque couple représente l’utilité du prisonnier 1,tandis que le second élément représente celle du prisonnier 2.C<strong>et</strong>te représentation sous forme matricielle perm<strong>et</strong> <strong>de</strong> représenter <strong>de</strong>s jeux ayant un nombre <strong>de</strong> joueurs<strong>et</strong> un nombre <strong>de</strong> stratégies pour chaque joueur raisonnable : la taille <strong>de</strong> la matrice est exponentielleJeux booléens 17


Eléments <strong>de</strong> théorie <strong>de</strong>s jeuxen fonction du nombre d’agents, <strong>et</strong> du nombre <strong>de</strong> choix possible pour chaque agent. Par exemple, si nagents ont chacun le choix entre <strong>de</strong>ux actions possibles, il faudra spécifier n×2 n valeurs numériques.Ces <strong>de</strong>scriptions, sous forme extensive ou normale, supposent que les ensembles d’actions sont finis.A chaque jeu sous forme extensive correspond un jeu sous forme normale dans lequel les joueurschoisissent simultanément les stratégies qu’ils m<strong>et</strong>tront en œuvre. En revanche, un jeu sous formenormale peut correspondre à plusieurs jeux sous forme extensive différente, comme nous l’avons vupour le dilemme du prisonnier.1.3 Concepts <strong>de</strong> solutionEtudions un autre exemple classique <strong>de</strong> jeu statique, qui suit la même logique que le dilemme duprisonnier, le jeu <strong>de</strong> la tirelire :Exemple 1.6. On propose à Jérémie <strong>et</strong> Léonore le jeu suivant : ils ont chacun la possibilité <strong>de</strong> m<strong>et</strong>tre0 ou 100 euros dans une tirelire. Une fois qu’ils ont tous <strong>de</strong>ux pris une décision, sans connaître ladécision <strong>de</strong> l’autre, le contenu <strong>de</strong> la tirelire est multiplié par 1.5 <strong>et</strong> est réparti en part égale entre les<strong>de</strong>ux joueurs.Une fois ce jeu formalisé, si on choisit Jérémie comme étant le joueur 1, Léonore le joueur 2, onobtient la forme normale représentée Figure 1.4.❍ ❍❍❍❍❍ 210 1000 (0, 0) (75, -25)100 (-25, 75) (50, 50)Figure 1.4 — Forme normale du jeu <strong>de</strong> la tirelireDans ce cas <strong>de</strong> figure, que vont faire Jérémie <strong>et</strong> Léonore ? M<strong>et</strong>tons nous à la place <strong>de</strong> Jérémie, quitient le raisonnement suivant : “ Si Léonore ne m<strong>et</strong> rien dans la tirelire, il est optimal pour moi queje ne m<strong>et</strong>te rien, sinon je perdrai 25 euros. Si elle dépose 100 euros, je gagne 75 euros si je ne m<strong>et</strong>srien, <strong>et</strong> 50 si je m<strong>et</strong>s 100 euros. Donc, dans les <strong>de</strong>ux cas <strong>de</strong> figure, j’ai intérêt à ne rien m<strong>et</strong>tre dans latirelire.” Si Léonore tient le même raisonnement, le résultat sera un gain nul pour chacun d’entre eux.Même s’ils se m<strong>et</strong>tent d’accord au début du jeu pour m<strong>et</strong>tre tous les <strong>de</strong>ux 100 euros, il reste “optimal”<strong>de</strong> ne rien m<strong>et</strong>tre dans la tirelire s’ils sont motivés par la recherche <strong>de</strong> leur seul intérêt personnel.La logique qui se trouve <strong>de</strong>rrière ce jeu, <strong>et</strong> qui est la même que celle se trouvant <strong>de</strong>rrière le dilemmedu prisonnier, montre qu’un groupe d’individus ne va pas nécessairement se comporter dans l’intérêtdu groupe si chacun peut obtenir pour lui-même un résultat meilleur en choisissant pour son proprecompte. Sachant cela, nous allons à présent présenter quelques concepts perm<strong>et</strong>tant <strong>de</strong> prédire l’issued’un jeu (ce que l’on appelle <strong>de</strong>s “concepts <strong>de</strong> solution”).L’analyse d’un jeu perm<strong>et</strong> <strong>de</strong> prédire l’équilibre qui émergera si les joueurs sont rationnels. Par équilibre,nous entendons un état ou une situation dans lequel aucun joueur ne souhaite modifier son18 Elise Bonzon


1.3. Concepts <strong>de</strong> solutioncomportement compte tenu du comportement <strong>de</strong>s autres joueurs. De façon plus précise, un équilibreest une combinaison <strong>de</strong> stratégies telle qu’aucun <strong>de</strong>s joueurs n’a d’intérêt à changer sa stratégiecompte tenu <strong>de</strong>s stratégies <strong>de</strong>s autres joueurs. Une fois que l’équilibre a été atteint dans un jeu (<strong>et</strong> peuimporte la manière dont il a été obtenu), il n’y a aucune raison <strong>de</strong> le quitter.Nous allons présenter ici plusieurs concepts <strong>de</strong> solution : les <strong>de</strong>ux premiers, équilibres <strong>de</strong> Nash <strong>et</strong>stratégies dominées, s’appliquent à <strong>de</strong>s jeux statiques non coopératifs ; le concept <strong>de</strong> noyau (core)s’applique à <strong>de</strong>s jeux statiques coopératifs, <strong>et</strong> enfin les équilibres parfaits <strong>de</strong> Selten pour les jeuxdynamiques.1.3.1 Equilibres <strong>de</strong> NashL’équilibre <strong>de</strong> Nash, introduit par John Nash en 1950 [Nash, 1950], est un concept fondamental enthéorie <strong>de</strong>s jeux. Il décrit une issue du jeu dans laquelle aucun joueur ne souhaite modifier sa stratégieétant donnée la stratégie <strong>de</strong> chacun <strong>de</strong> ses rivaux.Les jeux pour lesquels il est possible <strong>de</strong> calculer les équilibres <strong>de</strong> Nash sont représentés Figure 1.5.Somme nulleSomme non nulle¬Coop. Coop. ¬Coop. Coop.Util. transf. Util. ¬transf. Util. transf. Util. ¬transf.Statique Nash NashDynamiqueFigure 1.5 — Taxonomie <strong>de</strong>s jeux : Domaine d’application <strong>de</strong>s équilibres <strong>de</strong> Nash1.3.1.1 Equilibre <strong>de</strong> Nash en stratégies puresDéfinition 1.5. Soit G un jeu non coopératif à n joueurs, avec N = {1,... ,n} l’ensemble <strong>de</strong> joueurs.Un profil <strong>de</strong> stratégie s = (s 1 ,s 2 ,...,s n ) est un équilibre <strong>de</strong> Nash en stratégies pures (PNE) si <strong>et</strong>seulement si∀i ∈ N,∀s ′ i ∈ S i,u i (s) ≥ u i (s ′ i ,s −i)En d’autres termes, un équilibre <strong>de</strong> Nash est un profil <strong>de</strong> stratégie dont aucun joueur n’a intérêt àdévier s’il suppose que les autres joueurs ne dévieront pas non plus.Exemple 1.1 (page 10) – suite : Le profil <strong>de</strong> stratégies AA est un équilibre <strong>de</strong> Nash en stratégiespures du dilemme du prisonnier. En eff<strong>et</strong>, on peut vérifier dans la matrice <strong>de</strong>s paiements représentéeFigure 1.3 (page 17) que l’on a : u 1 (AA) ≥ u 1 (TA) <strong>et</strong> u 2 (AA) ≥ u 2 (AT).AA est le seul équilibre <strong>de</strong> Nash <strong>de</strong> ce jeu. En eff<strong>et</strong>, AT ne peut pas être un PNE car AA est unemeilleure stratégie pour le joueur 2 : u 2 (AA) > u 2 (AT) ; TA non plus car AA est une meilleurestratégie pour le joueur 1 : u 1 (AA) > u 1 (TA) ; <strong>et</strong> <strong>de</strong> même pour T T car AT est une meilleure stratégiepour le joueur 1 : u 1 (T T) < u 1 (AT).Jeux booléens 19


Eléments <strong>de</strong> théorie <strong>de</strong>s jeuxCe jeu n’a qu’un équilibre <strong>de</strong> Nash en stratégies pures. Pourtant, c<strong>et</strong>te unicité n’est pas toujoursgarantie :Exemple 1.2 (page 11) – suite : Le jeu <strong>de</strong> la bataille <strong>de</strong>s sexes a <strong>de</strong>ux équilibres <strong>de</strong> Nash enstratégies pures : HH <strong>et</strong> RR. En eff<strong>et</strong>, on peut vérifier dans la matrice <strong>de</strong>s paiements représentéeFigure 1.6 que l’on a : u 1 (H,H) ≥ u 1 (R,H), u 2 (H,H) ≥ u 2 (H,R) ; u 1 (R,R) ≥ u 1 (H,R) <strong>et</strong> u 2 (R,R) ≥u 2 (R,H).❍ ❍❍❍❍❍ 21HRH (2, 1) (0, 0)R (0, 0) (1, 2)Figure 1.6 — Forme normale <strong>de</strong> la bataille <strong>de</strong>s sexesDe la même façon, l’existence d’un équilibre <strong>de</strong> Nash en stratégies pures n’est pas garantie non plus,comme on peut le constater facilement dans le jeu matching pennies <strong>de</strong> l’exemple 1.4 (page 14).1.3.1.2 Equilibres <strong>de</strong> Nash en stratégies mixtesDans ce genre <strong>de</strong> situation, il existe une autre métho<strong>de</strong> pour obtenir un équilibre <strong>de</strong> Nash, <strong>et</strong> doncun équilibre : il est possible d’élargir la définition d’une stratégie, <strong>et</strong> d’y inclure non seulement lesactions pures (telles qu’annoncer pile ou face), mais aussi les probabilités <strong>de</strong> choisir l’une ou l’autre<strong>de</strong> ces actions. Chaque joueur associe une probabilité p i (positive ou nulle) à la stratégie s i , <strong>et</strong> viseà maximiser ses gains espérés en choisissant la meilleure loterie possible, c’est-à-dire la meilleurestratégie mixte. Une stratégie mixte est donc une stratégie définissant les probabilités avec lesquellesles joueurs choisissent chacune <strong>de</strong> leurs stratégies pures.Définition 1.6. Une stratégie mixte pour le joueur i est une distribution <strong>de</strong> probabilité sur S i . Σ i =∆(S i ) représente l’ensemble <strong>de</strong>s stratégies mixtes du joueur i. La fonction σ i : S i → IR associe à lastratégie pure s i sa probabilité d’être jouée.On peut noter ici qu’une stratégie pure s i correspond à la stratégie mixte s i associée à une probabilité<strong>de</strong> 1.Définition 1.7. Un équilibre <strong>de</strong> Nash en stratégies mixtes est un profil <strong>de</strong> stratégies mixtes σ ∈ Σtel que∀i ∈ N,∀σ ′ i ∈ Σ i ,u i (σ) ≥ u i (σ ′ i,σ −i )Un équilibre en stratégies mixtes est donc une situation dans laquelle tous les joueurs choisissent leurstratégies mixtes <strong>de</strong> façon à rendre leurs adversaires indifférents entre les gains espérés <strong>de</strong> chacune<strong>de</strong> leurs stratégies pures.20 Elise Bonzon


1.3. Concepts <strong>de</strong> solutionExemple 1.4 (page 14) – suite :pures.Le jeu matching pennies n’a aucun équilibre <strong>de</strong> Nash en stratégiesSupposons que la distribution <strong>de</strong> probabilités pour Annelise est la suivante : σ 1 (P) = x <strong>et</strong> σ 1 (F) =1 − x ; <strong>et</strong> que celle <strong>de</strong> Robin est σ 2 (P) = y <strong>et</strong> σ 2 (F) = 1 − y.Dans ce cas, si on suppose que Robin choisit σ 2 (P) = 1 (il choisit toujours P), d’après la Figure 1.7son gain espéré est <strong>de</strong> : 15(1−x)−15x = 15(1−2x). De même, si Robin choisit σ 2 (F) = 1, son gainespéré est <strong>de</strong> : 15(2x − 1). On constate alors que si Annelise choisit une probabilité σ 1 (P) = x = 1(elle jouera toujours P), alors Robin a tout intérêt <strong>de</strong> choisir toujours σ 2 (F) = 1 (y = 0). Par contre,si Robin choisit σ 2 (F) = 1, Annelise choisira σ 1 (F) = 1 (x = 0). C<strong>et</strong>te situation n’est donc pas unéquilibre.En raisonnant <strong>de</strong> c<strong>et</strong>te façon, on constate que pour ne pas influencer le choix <strong>de</strong> Robin, Annelise adonc tout intérêt à choisir x = 1/2. Le gain espéré <strong>de</strong> Robin sera alors toujours 0 ; <strong>et</strong> <strong>de</strong> même, Robina intérêt à choisir y = 1/2.On vérifie que ce jeu est un équilibre <strong>de</strong> Nash en stratégies mixtes : si Annelise choisit σ 1 (P) =x = 1/2, l’utilité espérée <strong>de</strong> Robin est <strong>de</strong> 0 qu’il choisisse σ 2 (P) = 1 (15(1 − 2x)) ou σ 2 (F) = 1(15(2x−1)). Annelise n’a donc pas intérêt à dévier. En effectuant le même raisonnement pour Robin,on constate que s’il choisit y = 1/2, l’utilité espérée d’Annelise est <strong>de</strong> 0 également, <strong>et</strong> Robin n’a pasnon plus intérêt à dévier.Vérifions à présent que c<strong>et</strong> équilibre <strong>de</strong> Nash en stratégies mixtes est le seul : supposons que y = 1/2<strong>et</strong> x ̸= 1/2. Dans ce cas, si x > 1/2, Robin a intérêt à choisir y = 0, <strong>et</strong> si x < 1/2, Robin choisiray = 1. Donc Annelise est sûre que Robin déviera. De même, si x = 1/2 <strong>et</strong> y ̸= 1/2, Annelise auratout intérêt à dévier.Ce jeu a donc un équilibre <strong>de</strong> Nash mixte : σ 1 (F) = σ 1 (P) = 1/2, σ 2 (F) = σ 2 (P) = 1/2.❍ ❍❍❍❍❍ 21PFP (15, -15) (-15, 15)F (-15, 15) (15, -15)Figure 1.7 — Forme normale du jeu matching penniesQuelques propriétés, classiques en théorie <strong>de</strong>s jeux, découlent <strong>de</strong> ces définitions (voir parexemple [Osborne <strong>et</strong> Rubinstein, 1994; Hillas <strong>et</strong> Kohlberg, 2002]) :∗ Tout équilibre <strong>de</strong> Nash en stratégies pures est un équilibre <strong>de</strong> Nash en stratégies mixtes.∗ Tout jeu fini a au moins un équilibre <strong>de</strong> Nash en stratégies mixtes.1.3.2 Stratégies dominéesLes jeux pour lesquels il est possible <strong>de</strong> calculer les stratégies dominées sont représentés Figure 1.8(page suivante).Comme le montre l’exemple suivant, qui présente le jeu <strong>de</strong> la soirée, les conditions d’existence d’unequilibre <strong>de</strong> Nash en stratégies pures sont parfois trop faibles.Jeux booléens 21


Eléments <strong>de</strong> théorie <strong>de</strong>s jeuxSomme nulleSomme non nulle¬Coop. Coop. ¬Coop. Coop.Util. transf. Util. ¬transf. Util. transf. Util. ¬transf.Statique Strat. Dom Strat. DomDynamiqueFigure 1.8 — Taxonomie <strong>de</strong>s jeux : Domaine d’application <strong>de</strong>s stratégies dominéesExemple 1.7. Agathe <strong>et</strong> Iwan sont invités à une soirée. La raison principale qui les motive à y allerest <strong>de</strong> pouvoir se voir là-bas : si l’autre n’y va pas, il leur est indifférent d’y aller (dénoté par A) oupas (dénoté par P).Une fois ce jeu formalisé, si on choisit Agathe comme étant le joueur 1 <strong>et</strong> Iwan le joueur 2, on obtientla forme normale représentée Figure 1.9.❍ ❍❍❍❍❍ 21APA (1, 1) (0, 0)P (0, 0) (0, 0)Figure 1.9 — Forme normale du jeu <strong>de</strong> la soiréeCe jeu a 2 équilibres <strong>de</strong> Nash en stratégies pures : AA <strong>et</strong> PP. Pourtant, un seul <strong>de</strong> ces équilibres estintéressant : si Agathe <strong>et</strong> Iwan veulent se voir, <strong>et</strong> qu’ils ont l’occasion <strong>de</strong> le faire à c<strong>et</strong>te soirée, ilsiront tous les <strong>de</strong>ux.On voit sur c<strong>et</strong> exemple que l’un <strong>de</strong>s équilibres <strong>de</strong> Nash en stratégies pures, PP, n’est pas une stratégieoptimale. En eff<strong>et</strong>, pour chacun <strong>de</strong>s <strong>de</strong>ux joueurs, la stratégie A perm<strong>et</strong> toujours d’obtenir une utilitéau moins aussi bonne que la stratégie P. Il semble alors assez naturel qu’Agathe <strong>et</strong> Iwan choisissentc<strong>et</strong>te stratégie. On dit que A est une stratégie (faiblement) dominante pour chacun <strong>de</strong>s <strong>de</strong>ux joueurs<strong>de</strong> ce jeu.Définissons les notions <strong>de</strong> stratégies strictement <strong>et</strong> faiblement dominées :Définition 1.8. La stratégie s i du joueur i est dite strictement dominée s’il existe une autre stratégies ′ i telle que, quelles que soient les stratégies <strong>de</strong>s autres joueurs, s ′ i assure au joueur i une utilitéstrictement plus gran<strong>de</strong> que s i . Donc :s i ∈ S i est strictement dominée si∃s ′ i ∈ S i telle que ∀s −i ∈ S −i ,u i (s i ,s −i ) < u i (s ′ i,s −i )Définition 1.9. La stratégie s i du joueur i est dite faiblement dominée s’il existe une autre stratégies ′ i telle que, quelles que soient les stratégies <strong>de</strong>s autres joueurs, s′ i assure au joueur i une utilité au22 Elise Bonzon


1.3. Concepts <strong>de</strong> solutionmoins aussi gran<strong>de</strong> que s i , <strong>et</strong> qu’il existe au moins une combinaison <strong>de</strong>s stratégies <strong>de</strong>s autres joueurstelle que l’utilité du joueur i avec s ′ i soit strictement plus gran<strong>de</strong> que celle avec s i. Donc : s i ∈ S i estfaiblement dominée si ∃s ′ i ∈ S i telle que∀s −i ∈ S −i ,u i (s i ,s −i ) ≤ u i (s ′ i,s −i )<strong>et</strong> que∃s ′ −i ∈ S −i telle que u i (s i ,s ′ −i) < u i (s ′ i,s ′ −i)Dans l’exemple 1.7 (page ci-contre), chaque joueur a une stratégie faiblement dominée (P) <strong>et</strong>, Agathe<strong>et</strong> Iwan étant <strong>de</strong>ux joueurs rationnels, il est facile <strong>de</strong> voir qu’ils joueront leur stratégie dominante, àsavoir A. Pourtant, l’existence d’une solution aussi simple est rare. Il est souvent nécessaire <strong>de</strong> faireappel à d’autres manières <strong>de</strong> raisonner dans l’espoir <strong>de</strong> trouver un équilibre au jeu. Par exemple,si le joueur 1 possè<strong>de</strong> une stratégie strictement ou faiblement dominante, on peut s’attendre à cequ’il choisisse c<strong>et</strong>te stratégie. Comme le joueur 2 est capable d’anticiper ce choix, il choisit alors sameilleure stratégie contre la stratégie dominante du premier.Exemple 1.8. Soit un jeu G à <strong>de</strong>ux joueurs, chacun <strong>de</strong>s joueurs ayant 3 stratégies possibles, représentépar la forme normale donnée Figure 1.10.❍ ❍❍❍❍❍ 21G M DH (4, 3) (5, 1) (6, 2)M (2, 1) (8, 4) (3, 6)B (3, 0) (9, 6) (2, 8)Figure 1.10 — Forme normale du jeu présentant l’élimination <strong>de</strong>s stratégies dominéesIl est tout d’abord possible <strong>de</strong> remarquer que M est une stratégie strictement dominée par D pour lejoueur 2. Dans ce cas, il est possible <strong>de</strong> penser que le joueur 2 ne r<strong>et</strong>iendra jamais c<strong>et</strong>te stratégie. Onpeut donc éliminer la stratégie M <strong>de</strong> la matrice.Ceci étant fait, on remarque alors que, dans la matrice résultante, H est “<strong>de</strong>venue” une stratégiestrictement dominante pour le joueur 1. Dès lors, celui-ci <strong>de</strong>vrait jouer H. Le joueur 2 étant rationnel,il est capable d’anticiper ce raisonnement, il sait donc qu’il est optimal pour lui <strong>de</strong> choisir G.En conséquence, une fois que l’on a éliminé toute les stratégies dominées, on obtient un profil <strong>de</strong>stratégies résultat : HG.Le processus d’élimination qui vient d’être appliqué dans c<strong>et</strong> exemple est appelé processus d’élimination<strong>de</strong>s stratégies dominées. Il <strong>de</strong>man<strong>de</strong> un comportement assez sophistiqué, dans la mesure ouchaque joueur doit être capable <strong>de</strong> reconstituer les opérations auxquelles les autres joueurs procè<strong>de</strong>nt<strong>et</strong> d’en déduire <strong>de</strong> nouvelles implications pour lui-même.Toutefois, le processus <strong>de</strong> dominance successive adm<strong>et</strong> également <strong>de</strong>s limites :Exemple 1.9. Soit le jeu G à <strong>de</strong>ux joueurs représenté par la forme normale donnée Figure 1.11 (pagesuivante).Jeux booléens 23


Eléments <strong>de</strong> théorie <strong>de</strong>s jeux❍ ❍❍❍❍❍ 21GDH (3, 6) (7, 1)M (5, 1) (8, 0)B (6, 0) (6, 2)Figure 1.11 — Forme normale du jeu présentant les limites <strong>de</strong> l’élimination <strong>de</strong>s stratégies dominéesDans ce jeu, il est clair que H est strictement dominé par M pour le joueur 1. On élimine donc lastratégie H. On ne peut pas aller plus loin car il n’y a plus <strong>de</strong> stratégie strictement ou faiblementdominée dans la matrice résultante. Cela revient à dire que, dans ce cas, le processus d’élimination<strong>de</strong>s stratégies dominées ne conduit pas à un résultat unique.Nous pouvons énoncer ici quelques propriétés, classiques en théorie <strong>de</strong>s jeux (voir parexemple [Osborne <strong>et</strong> Rubinstein, 1994; Hillas <strong>et</strong> Kohlberg, 2002]) :∗ Comme nous l’avons vu dans l’exemple 1.9 (page précé<strong>de</strong>nte), le processus d’élimination <strong>de</strong>sstratégies dominées ne conduit pas nécessairement à une solution unique ;∗ L’ordre d’élimination <strong>de</strong>s stratégies strictement dominées n’affecte pas le résultat final ;∗ L’ordre d’élimination <strong>de</strong>s stratégies faiblement dominées peut affecter le résultat final ;∗ Une stratégie strictement dominée ne peut jamais être présente dans un équilibre <strong>de</strong> Nash enstratégies pures ;∗ Une stratégie faiblement dominée peut apparaître dans un équilibre <strong>de</strong> Nash en stratégies pures.On a pu constater que le concept <strong>de</strong> stratégies dominées pouvait conduire à <strong>de</strong>s résultats alors quecelui d’équilibre <strong>de</strong> Nash en stratégies pures aboutissait à une impasse. Mais l’inverse peut être vraiaussi : le processus d’élimination <strong>de</strong>s stratégies dominées ne conduit pas forcément à un résultat, alorsque l’on peut obtenir un équilibre <strong>de</strong> Nash, comme le montre l’exemple suivant :Exemple 1.10. Soit le jeu G à <strong>de</strong>ux joueurs représenté par la forme normale donnée Figure 1.12.❍ ❍❍❍❍❍ 21A B CD (2, 3) (1, 2) (0, 2)E (1, 2) (2, 3) (1, 2)F (1, 1) (3, 0) (0, 2)Figure 1.12 — Forme normale du jeu <strong>de</strong> l’exemple 1.10Dans ce jeu, aucun joueur n’a <strong>de</strong> stratégie strictement ou faiblement dominée. Pourtant, il y a unéquilibre <strong>de</strong> Nash : le profil <strong>de</strong> stratégies DA.Etudions à présent <strong>de</strong>s concepts <strong>de</strong> solution pour <strong>de</strong>s jeux coopératifs (notion <strong>de</strong> cœur, appelé aussinoyau ou core).24 Elise Bonzon


Eléments <strong>de</strong> théorie <strong>de</strong>s jeux∗ Le ⎧ joueur 2 a un droit <strong>de</strong> v<strong>et</strong>o. Le profil <strong>de</strong> paiement doit respecter les équations suivantes :∀i,x i ≥ 0⎪⎨x 1 + x 2 + x 3 ≥ 1⇒ Cœur = {(0,1,0)}x 1 + x 2 ≥ 1⎪⎩x 2 + x 3 ≥ 1∗ Le⎧joueur 2 est dictateur. Le profil <strong>de</strong> paiement doit respecter les équations suivantes :∀i,x i ≥ 0⎪⎨ x 1 + x 2 + x 3 ≥ 1x 1 + x 2 ≥ 1 ⇒ Cœur = {(0,1,0)}x 2 + x 3 ≥ 1⎪⎩x 2 ≥ 11.3.3.2 Utilités non transférablesIl existe plusieurs façons <strong>de</strong> définir le noyau d’un jeu coopératif à utilités non transférables : la premièredéfinition est semblable à celle du cœur pour les jeux avec utilités transférables. La secon<strong>de</strong> estla suivante :Un profil <strong>de</strong> stratégies s est dans le noyau d’un jeu coalitionnel si <strong>et</strong> seulement si il n’existe pas<strong>de</strong> coalition C telle que tous les membres <strong>de</strong> c<strong>et</strong>te coalition ont une stratégie commune qui leurperm<strong>et</strong> à tous d’obtenir une meilleure utilité qu’avec s (voir par exemple [Aumann, 1967; Owen,1982; Myerson, 1991]).Définition 1.11. Le cœur (ou noyau) d’un jeu coalitionnel à utilités non transférables est l’ensemble<strong>de</strong>s profils <strong>de</strong> stratégies s = (s 1 ,...,s n ) tels qu’il n’existe pas <strong>de</strong> coalition C ⊂ N <strong>et</strong> <strong>de</strong> s C ∈ S C telsque ∀i ∈ C, ∀s −C ∈ S −C , u i (s C ,s −C ) > u i (s).Exemple 1.11. Soit le jeu G à trois joueurs représenté par la forme normale donnée Figure 1.14.3 : E❍ ❍❍❍❍❍ 21C DA (3, 3, 3) (4, 1, 0)B (5, 0, 0) (2, 5, 2)3 : F❍ ❍❍❍❍❍ 21C DA (3, 2, 1) (1, 3, 2)B (1, 0, 1) (4, 2, 1)Figure 1.14 — Forme normale d’un jeu coopératif à utilités non transférablesOn a ici : Cœur = {(ACE)}. En eff<strong>et</strong>, il n’existe pas <strong>de</strong> coalition qui perm<strong>et</strong>te à tous les joueurs <strong>de</strong>c<strong>et</strong>te coalition d’obtenir une meilleure utilité :∗ C = {1}. Si 1 dévie <strong>et</strong> joue B, il existe un s −C = DE tel que u 1 (ACE) > u 1 (BDE).∗ C = {2}. Si 2 dévie <strong>et</strong> joue D, il existe un s −C = AE tel que u 1 (ACE) > u 1 (ADE).∗ C = {3}. Si 3 dévie <strong>et</strong> joue F, il existe un s −C = AC tel que u 1 (ACE) > u 1 (ACF).∗ On raisonne <strong>de</strong> même pour C = {1,2}, C = {1,3}, C = {2,3} <strong>et</strong> C = {1,2,3}.26 Elise Bonzon


1.3. Concepts <strong>de</strong> solution1.3.4 Equilibres parfaits <strong>de</strong> SeltenLes jeux pour lesquels il est possible <strong>de</strong> calculer l’équilibre parfait <strong>de</strong> Selten sont représentés Figure1.15.Somme nulleSomme non nulle¬Coop. Coop. ¬Coop. Coop.Util. transf. Util. ¬transf. Util. transf. Util. ¬transf.StatiqueDynamique Selten Selten Selten Selten Selten SeltenFigure 1.15 — Taxonomie <strong>de</strong>s jeux : Domaine d’application <strong>de</strong> l’équilibre parfait <strong>de</strong> SeltenExemple 1.12. Soit le jeu dynamique en information parfaite représenté sous forme extensive par laFigure 1.16.1BH2 2BHBH(3, 0) (1, 1) (2, 1) (2, 0)Figure 1.16 — Forme extensive d’un jeu dynamique en information parfaiteLe joueur 2 a <strong>de</strong>ux stratégies possibles : H <strong>et</strong> B. Le joueur 2, qui joue après 1, a 2 stratégies possiblesselon le choix <strong>de</strong> 1 : s 2 = [s 2 (H),s 2 (B)].Comment doit-on jouer ce jeu ? Le principe consiste à raisonner en remontant par induction versl’amont (backward induction) : on raisonne en sens contraire <strong>de</strong> la manière dont le jeu va effectivementse dérouler.Dans l’exemple 1.12, le joueur 1 se dit “si je joue H, alors 2 va jouer B <strong>de</strong> sorte que mon gain sera égalà 2 ; si je joue B, 2 jouera H <strong>et</strong> mon gain sera <strong>de</strong> 1”. Dès lors, si 1 suppose que 2 choisira sa meilleureréponse à la secon<strong>de</strong> étape, il choisira H à la première. On adm<strong>et</strong> que lorsque c’est au tour du joueur2 <strong>de</strong> jouer, il choisit la meilleure réponse pour lui-même, à savoir s 2 (H) = B <strong>et</strong> s 2 (B) = H. Enconséquence, sachant que le joueur 2 se comporte <strong>de</strong> manière optimale à la secon<strong>de</strong> étape, le joueur 1intègre c<strong>et</strong>te information, <strong>et</strong> choisit une action optimale conditionnellement au comportement optimal<strong>de</strong> 2.A chaque étape t, les stratégies du sous-jeu sont définies comme celles du jeu initial. La seule différenceest que l’histoire à considérer pour les étapes précé<strong>de</strong>ntes est donnée par h t : s i |h t est laJeux booléens 27


Eléments <strong>de</strong> théorie <strong>de</strong>s jeuxrestriction <strong>de</strong> s i imposée par l’histoire h t . On dit alors que s = (s 1 ,s 2 ,...,s n ) est un équilibre parfait<strong>de</strong> Selten (ou subgame perfect Nash equilibrium, [Selten, 1965]) si, pour toute histoire h t , larestriction s|h t est un équilibre <strong>de</strong> Nash du sous-jeu G(h t ).Exemple 1.13. Soit le jeu dynamique représenté sous forme extensive par la Figure 1.17.1AB2 2CDEF(3, 0) (3, 1) (4, 1) (3, 2)Figure 1.17 — Forme extensive d’un jeu dynamiqueCe jeu sous forme extensive a trois sous-jeux : le premier est le jeu lui-même, puisque tout jeu est unsous-jeu, le second commence après A, <strong>et</strong> le <strong>de</strong>rnier après B.La forme extensive du sous-jeu commençant après A , <strong>et</strong> sa forme normale associée sont les suivantes :2CD(3, 0) (3, 1)CD(3, 0) (3, 1)Ce sous-jeu a un équilibre <strong>de</strong> Nash : D, que l’on notera D(A), car 2 jouera D si 1 joue A auparavant.La forme extensive du sous-jeu commençant après B , <strong>et</strong> sa forme normale associée sont les suivantes :2EF(4, 1) (3, 2)EF(4, 1) (3, 2)Ce sous-jeu a un équilibre <strong>de</strong> Nash : F(B).Dans le jeu compl<strong>et</strong>, le joueur 1 a 2 stratégies possibles : A <strong>et</strong> B. Par contre, le joueur 2 en a 4 :C(A)E(B) qui signifie que 2 joue C si 1 joue A, <strong>et</strong> E si 1 joue B, C(A)F(B), D(A)E(B) <strong>et</strong> D(A)F(B).La forme normale <strong>de</strong> ce jeu est :❍ ❍❍❍❍❍ 21C(A)E(B) C(A)F(B) D(A)E(B) D(A)F(B)A (3, 0) (3, 0) (3, 1) (3, 1)B (4, 1) (3, 2) (4, 1) (3, 2)Ce jeu a 3 équilibres <strong>de</strong> Nash :28 Elise Bonzon


1.3. Concepts <strong>de</strong> solution∗ (A,D(A)F(B)) est un équilibre parfait <strong>de</strong> Selten : D(A) <strong>et</strong> F(B) sont <strong>de</strong>s équilibres <strong>de</strong> Nash<strong>de</strong>s sous-jeux associés.∗ (B,C(A)F(B)) n’est pas un équilibre parfait <strong>de</strong> Selten : C(A) ne sera pas joué dans le sous jeucommençant après A, ce n’est donc pas un équilibre <strong>de</strong> Nash <strong>de</strong> ce sous-jeu.∗ (B,D(A)F(B)) est un équilibre parfait <strong>de</strong> Selten : D(A) <strong>et</strong> F(B) sont <strong>de</strong>s équilibres <strong>de</strong> Nash<strong>de</strong>s sous-jeux associés.Ce jeu a donc 2 équilibres parfaits <strong>de</strong> Selten : (A,D(A)F(B)) <strong>et</strong> (B,D(A)F(B)).1.3.5 RécapitulatifNous pouvons à présent récapituler les concepts <strong>de</strong> jeu que nous avons vu en fonction <strong>de</strong>s types <strong>de</strong>jeux auxquels ils peuvent être appliqués dans le tableau représenté Figure 1.18.Somme nulleSomme non nulle¬Coop. Coop. ¬Coop. Coop.Util. transf. Util. ¬transf. Util. transf. Util. ¬transf.Statique Nash / Dom cœur cœur Nash / Dom cœur cœurDynamique Selten Selten Selten Selten Selten SeltenFigure 1.18 — Taxonomie <strong>de</strong>s jeux : Domaine d’application <strong>de</strong>s concepts <strong>de</strong> solutionJeux booléens 29


2Jeux booléensComme nous l’avons vu dans la section 1.2 (page 16), les <strong>de</strong>ux mo<strong>de</strong>s <strong>de</strong> représentation usuels <strong>de</strong>sjeux (forme extensive <strong>et</strong> forme normale) coïnci<strong>de</strong>nt pour les jeux statiques. C<strong>et</strong>te représentation ne faitpas l’économie <strong>de</strong> la <strong>de</strong>scription explicite <strong>de</strong> la fonction d’utilité <strong>de</strong> chaque agent. Or, c<strong>et</strong>te <strong>de</strong>scriptionest <strong>de</strong> taille exponentielle en fonction du nombre d’agents : par exemple, si n agents ont chacunun choix entre <strong>de</strong>ux actions possibles, il faudra spécifier n × 2 n valeurs numériques ; si <strong>de</strong>ux agentscontrôlent chacun un ensemble <strong>de</strong> p variables booléennes (il suffit <strong>de</strong> penser à <strong>de</strong> telles variablescomme à <strong>de</strong>s boutons que l’agent peut choisir d’enfoncer ou non), chaque agent a 2 p stratégies possibles<strong>et</strong> il faudra donc expliciter 2 ×(2 p ) 2 = 2 2p+1 valeurs numériques.C<strong>et</strong>te explosion combinatoire est encore plus flagrante lorsqu’à la fois l’ensemble <strong>de</strong>s agents <strong>et</strong> l’ensemble<strong>de</strong>s stratégies pour chacun <strong>de</strong>s agents sont <strong>de</strong> taille importante. Il <strong>de</strong>vient alors déraisonnable<strong>de</strong> spécifier les fonctions d’utilité <strong>de</strong> manière explicite, en listant les valeurs pour chaque combinaison<strong>de</strong> stratégies. Il est tout aussi déraisonnable <strong>de</strong> penser pouvoir calculer <strong>de</strong>s propriétés du jeu en appliquantun algorithme nécessitant une énumération explicite <strong>de</strong>s combinaisons <strong>de</strong> stratégies. Pensonspar exemple au calcul <strong>de</strong>s équilibres <strong>de</strong> Nash en stratégies pures : ce calcul nécessite, dans le cas <strong>de</strong>sjeux précé<strong>de</strong>nts, <strong>et</strong> dans le pire <strong>de</strong>s cas, un temps <strong>de</strong> calcul <strong>de</strong> l’ordre <strong>de</strong> n×2 n (pour le jeu à n joueursavec 2 actions chacun) <strong>et</strong> <strong>de</strong> 2 × 2 p × 2 2p = 2 3p+1 (pour le jeu à <strong>de</strong>ux joueurs contrôlant chacun pvariables booléennes).D’un autre côté, une sous-branche <strong>de</strong> l’intelligence artificielle s’intéresse aux langages <strong>de</strong> représentationcompacte <strong>de</strong> préférences (ordinales ou numériques). Ces langages perm<strong>et</strong>tent une représentationconcise <strong>de</strong> relations <strong>de</strong> préférences, ou <strong>de</strong> fonctions d’utilité, sur un ensemble <strong>de</strong> conséquences quipossè<strong>de</strong> une structure combinatoire (c’est-à-dire un produit cartésien <strong>de</strong> domaines <strong>de</strong> valeurs finispour un ensemble fini <strong>de</strong> variables), en exploitant dans une large mesure <strong>de</strong>s propriétés structurelles<strong>de</strong>s relations <strong>de</strong> préférences (comme l’indépendance préférentielle entre variables). En particulier,lorsque les variables en jeu sont binaires, ces langages sont fondés sur la logique propositionnelle,dont ils héritent l’expressivité <strong>et</strong> les métho<strong>de</strong>s algorithmiques (pour la déduction <strong>et</strong> la recherche <strong>de</strong>modèles, notamment). L’expressivité <strong>et</strong> le pouvoir <strong>de</strong> concision <strong>de</strong>s langages <strong>de</strong> représentation logique<strong>de</strong> préférences sont étudiés dans [Coste-Marquis <strong>et</strong> al., 2004] <strong>et</strong> leur complexité algorithmiquedans [Lang, 2004].Partant <strong>de</strong> là, puisque la spécification d’un jeu statique nécessite la <strong>de</strong>scription <strong>de</strong>s préférences <strong>de</strong>sagents, il apparaît naturel <strong>de</strong> représenter <strong>de</strong> tels jeux en utilisant <strong>de</strong>s langages <strong>de</strong> représentation compacte<strong>de</strong> préférences. Il existe déjà plusieurs cadres répondant aux problèmes que nous avons posésplus haut, notamment les langages graphiques que nous présenterons dans le chapitre 4 (page 121).Nous avons choisi ici d’étudier le cas où chaque agent contrôle un ensemble fini <strong>de</strong> variables binaires :31


Jeux booléensles jeux booléens [Harrenstein <strong>et</strong> al., 2001; Harrenstein, 2004a]. Cela perm<strong>et</strong> non seulement <strong>de</strong> simplifierles jeux, mais aussi d’utiliser un langage logique <strong>de</strong> représentation compacte <strong>de</strong>s préférences.Un jeu booléen est un jeu à <strong>de</strong>ux joueurs <strong>et</strong> à somme nulle, la fonction d’utilité du joueur 1 (<strong>et</strong> donccelle du joueur 2 qui est son opposé) est représentée par une formule <strong>de</strong> la logique propositionnelle,appelée forme booléenne du jeu. Après avoir donné une <strong>de</strong>scription (simplifiée) <strong>de</strong>s jeux booléens,nous montrerons que ces jeux booléens peuvent facilement être généralisés <strong>de</strong> manière à représenter<strong>de</strong>s jeux avec un nombre arbitraire <strong>de</strong> joueurs <strong>et</strong> à somme non nulle, mais en gardant l’hypothèseque les préférences <strong>de</strong> chaque joueur sont représentées par une formule propositionnelle unique, cequi ne perm<strong>et</strong> <strong>de</strong> représenter que <strong>de</strong>s utilités binaires. Nous verrons alors comment <strong>de</strong>s outils simplesissus <strong>de</strong> la logique propositionnelle perm<strong>et</strong>tent <strong>de</strong> caractériser certaines propriétés du jeu, <strong>et</strong> nousdonnerons quelques résultats <strong>de</strong> complexité algorithmique 1 .2.1 Introduction aux jeux booléensDans c<strong>et</strong>te section, nous allons faire un rapi<strong>de</strong> état <strong>de</strong> l’art <strong>de</strong>s jeux booléens tels qu’ils ont été introduitspar Harrenstein, van <strong>de</strong>r Hoek, Meyer <strong>et</strong> Witteveen dans [Harrenstein <strong>et</strong> al., 2001; Harrenstein,2004a].Un jeu booléen sur un ensemble <strong>de</strong> variables propositionnelles V est un jeu à <strong>de</strong>ux joueurs, 1 <strong>et</strong> 2, àsomme nulle, ayant les spécificités suivantes :∗ les actions que peuvent entreprendre les <strong>de</strong>ux joueurs consistent à donner une valeur <strong>de</strong> vérité à<strong>de</strong>s variables <strong>de</strong> V ;∗ les fonctions d’utilité <strong>de</strong>s <strong>de</strong>ux joueurs sont représentées au moyen d’une formule propositionnelleϕ formée sur les variables V , appelée forme booléenne du jeu.ϕ représente le but du joueur 1 : l’utilité <strong>de</strong> celui-ci est +1 2 lorsque ϕ est satisfaite 3 (<strong>et</strong> alors le joueur1 gagne), <strong>et</strong> −1 sinon (<strong>et</strong> c’est alors le joueur 2 qui gagne). Les utilités sont donc binaires : il n’y ena que 2 possibles, 1 <strong>et</strong> −1.Le jeu étant à somme nulle, nous avons u 2 = −u 1 <strong>et</strong> le but du joueur 2 n’est autre que ¬ϕ. Le jeu n’adonc que <strong>de</strong>ux issues possibles : la victoire <strong>de</strong> 1 ou celle <strong>de</strong> 2.Pour construire ces jeux booléens, [Harrenstein <strong>et</strong> al., 2001; Harrenstein, 2004a] commencent pardéfinir <strong>de</strong>ux jeux booléens atomiques, dénotés par 1 <strong>et</strong> 0. Le premier est gagné par 1, tandis quele second est gagné par 2, sans qu’aucun <strong>de</strong>s joueurs n’ait à prendre la moindre décision. Des jeuxbooléens plus complexes sont ensuite construits récursivement à partir <strong>de</strong> ces jeux atomiques <strong>et</strong> d’unensemble <strong>de</strong> variables propositionnelles, que l’on appellera variables <strong>de</strong> décision binaires. Chaquevariable <strong>de</strong> décision est contrôlée <strong>de</strong> manière exclusive par l’un <strong>de</strong>s <strong>de</strong>ux joueurs. Pour tous jeuxbooléens g 0 <strong>et</strong> g 1 , <strong>et</strong> pour toute variable <strong>de</strong> décision a, il existe un autre jeu booléen dénoté a(g 0 ,g 1 ).Dans le jeu a(g 0 ,g 1 ), c’est au joueur qui contrôle la variable a <strong>de</strong> déci<strong>de</strong>r <strong>de</strong> la valeur à laquelle il veutl’assigner. S’il choisit d’assigner a à vrai (resp. faux), alors le jeu continue avec g 1 (resp. g 0 ). Un jeubooléen est alors défini formellement comme suit :1 Les résultats donnés dans ce chapitre ont fait l’obj<strong>et</strong> <strong>de</strong> plusieurs publications : [Bonzon <strong>et</strong> al., 2005, 2006b, 2007a].2 On notera alors u 1 = 1.3 Une formule booléenne est satisfaite si <strong>et</strong> seulement si la formule est vraie.32 Elise Bonzon


2.2. Jeux booléens à n joueurs : définitions <strong>et</strong> exemplesDéfinition 2.1. Soit A un ensemble fini <strong>de</strong> variables propositionnlles, <strong>et</strong> {0,1} les <strong>de</strong>ux joueurs.L’ensemble <strong>de</strong>s formes booléennes sur A est le plus p<strong>et</strong>it ensemble B(A) tel que :∗ {0,1} ⊆ B(A)∗ si a ∈ A <strong>et</strong> g,h ∈ B(A), alors a(g,h) ∈ B(A).Un jeu booléen sur A est un couple (g,π), où g est une forme booléenne, <strong>et</strong> π est une fonctiond’affectation <strong>de</strong> contrôle (π : A → {0,1}), qui associe à chaque variable le joueur qui la contrôle(chaque variable étant contrôlée par un <strong>et</strong> un seul joueur).Exemple 2.1. Soit V = {a,b,c} un ensemble <strong>de</strong> variables propositionnelles. Soit 1 <strong>et</strong> 2 <strong>de</strong>ux joueursayant pour buts : ϕ 1 = (a ↔ b) ∨(¬a ∧ b ∧ ¬c), ϕ 2 = ¬ϕ 1 = (¬a ∧ b ∧ c) ∨(a ∧ ¬b).Le joueur 1 contrôle les variables a <strong>et</strong> c, tandis que 2 contrôle la variable b.La représentation proposée par Harrenstein dans [Harrenstein, 2004a] <strong>de</strong> ce jeu booléen est donnéeen figure 2.1. Sur c<strong>et</strong>te figure, la flèche gauche partant du nœud x représente la mise à faux <strong>de</strong> x,tandis que la flèche droite représente la mise à vrai <strong>de</strong> x.ab1 cb0 11 0Figure 2.1 — Jeu booléen (a,(b(1,c(1,0)),b(0,1)))Comme l’ont constaté Dunne <strong>et</strong> Van <strong>de</strong>r Hoek [Dunne <strong>et</strong> van <strong>de</strong>r Hoek, 2004], c<strong>et</strong>te constructionbasée sur un modèle dynamique n’est pas nécessaire. En eff<strong>et</strong>, l’hypothèse disant que les stratégies<strong>de</strong>s agents sont choisies en parallèle (c’est-à-dire sans que l’un observe la décision <strong>de</strong> l’autre) estimplicite. C<strong>et</strong>te forme extensive, sous forme d’arbre, est donc inutile. La représentation sous formenormale, qui correspond à celle d’un jeu statique, est ici plus simple, <strong>et</strong> a l’avantage <strong>de</strong> montrerclairement quel joueur gagnera à chaque issue du jeu .Exemple 2.1 – suite La forme normale du jeu booléen (a,(b(1,c(1,0)),b(0,1))) est représentéeFigure 2.2 (page suivante).[Harrenstein, 2004a, Section 8.4 (page 191)] introduit également <strong>de</strong>s “jeux d’évaluation distribués”qui généralisent les jeux booléens en introduisant un nombre quelconque <strong>de</strong> joueurs <strong>et</strong> <strong>de</strong>s préférencesnon binaires représentées par <strong>de</strong>s ensembles <strong>de</strong> formules. Nous ne considèrerons pas c<strong>et</strong>tegénéralisation dans ce chapitre, mais elle sera étudiée plus en avant dans le chapitre 3 (page 69).2.2 Jeux booléens à n joueurs : définitions <strong>et</strong> exemplesAvant <strong>de</strong> revenir plus en détail aux jeux booléens tels qu’ils ont été définis dans [Harrenstein <strong>et</strong> al.,2001; Harrenstein, 2004a], nous allons d’abord les généraliser en nous intéressant à <strong>de</strong>s jeux à nJeux booléens 33


Jeux booléens❍ ❍❍❍❍❍ 21bbac (1, 0) (0, 1)ac (1, 0) (0, 1)ac (0, 1) (1, 0)ac (1, 0) (1, 0)Figure 2.2 — Forme normale du jeu booléen (a,(b(1,c(1,0)),b(0,1)))joueurs <strong>et</strong> à somme non nulle. Nous verrons ensuite que le cadre étudié par [Harrenstein <strong>et</strong> al., 2001;Harrenstein, 2004a] est un cas particulier <strong>de</strong> ce cadre plus général.Commençons par formaliser la notion <strong>de</strong> jeu booléen à n joueurs. Etant donné un ensemble <strong>de</strong> variablespropositionnelles V , un jeu booléen sur V est un jeu à n joueurs pour lequel les actionsdisponibles <strong>de</strong> chaque joueur consistent à assigner une valeur <strong>de</strong> vérité à toutes les variables d’unsous-ensemble donné <strong>de</strong> V . Les préférences <strong>de</strong> chaque joueur i sont représentées par une formulepropositionnelle ϕ i formée sur les variables <strong>de</strong> V .Définition 2.2. Un jeu booléen à n joueurs est un 5-upl<strong>et</strong> (N,V,π,Γ,Φ), avec∗ N = {1,2,... ,n} l’ensemble <strong>de</strong>s joueurs (appelés aussi agents) ;∗ V un ensemble <strong>de</strong> variables propositionnelles ;∗ π:N ↦→ V une fonction d’affectation <strong>de</strong> contrôle ;∗ Γ = {γ 1 ,...,γ n } l’ensemble <strong>de</strong>s contraintes, chaque γ i étant une formule propositionnelle <strong>de</strong>L π(i) satisfiable ;∗ Φ = {ϕ 1 ,...,ϕ n } l’ensemble <strong>de</strong>s buts, chaque ϕ i étant une formule <strong>de</strong> L V satisfiable.Un 4-upl<strong>et</strong> (N,V ,π,Γ), avec N,V,π,Γ <strong>de</strong>finis comme ci-<strong>de</strong>ssus est appelé un pré-jeu booléen.La fonction d’affectation <strong>de</strong> contrôle π associe à chaque joueur les variables qu’il contrôle. On noteπ i l’ensemble <strong>de</strong>s variables contrôlées par le joueur i. Chaque variable est contrôlée par un <strong>et</strong> un seuljoueur. Ainsi, {π 1 ,...,π n } forme une partition <strong>de</strong> V .Chaque γ i représente ici les contraintes d’un agent sur l’ensemble <strong>de</strong>s variables qu’il contrôle. Cechoix <strong>de</strong> représentation est assez intuitif : en règle générale, les contraintes d’une personne reposentsur les actions qu’il lui est possible d’effectuer. Si une <strong>de</strong> mes contraintes pèse sur une action d’unautre joueur, je ne peux pas être assurée <strong>de</strong> la respecter, ce n’est pas <strong>de</strong> mon ressort. Ainsi, c<strong>et</strong>tereprésentation <strong>de</strong>s contraintes perm<strong>et</strong> <strong>de</strong> respecter l’indépendance <strong>de</strong>s agents : chaque agent gère sesvariables, <strong>et</strong> les contraintes qui y pèsent, sans être tributaire d’un autre agent pour cela.L’utilisation <strong>de</strong>s jeux booléens perm<strong>et</strong> d’avoir une représentation compacte du problème. Pour illustrerce propos, nous allons utiliser une variante <strong>de</strong> l’exemple 1.1 (page 10) du dilemne <strong>de</strong>s prisonniers :nous considérons ici n prisonniers qui ne peuvent bénéficier que d’un seul type <strong>de</strong> remise <strong>de</strong> peineafin <strong>de</strong> simplifier le problème.Exemple 2.2. Dans le jeu simplifié du prisonnier à n joueurs, n détenus (notés 1,...,n) sont emprisonnésdans <strong>de</strong>s cellules séparées. La police fait à chacun d’eux le même marché :34 Elise Bonzon


2.2. Jeux booléens à n joueurs : définitions <strong>et</strong> exemples"Tu as le choix entre couvrir tes complices en te taisant (noté T i , i = 1,...,n) ou les trahiren les dénonçant (noté ¬T i , i = 1,...,n). Si tu les dénonces, tu auras une remise <strong>de</strong> peine<strong>et</strong> tes partenaires purgeront le maximum (sauf si l’un d’eux t’a dénoncé aussi, auquel casil bénéficiera comme toi d’une remise <strong>de</strong> peine). Mais si vous vous couvrez mutuellement,vous aurez tous une remise <strong>de</strong> peine 4 ."La représentation <strong>de</strong> ce jeu en forme normale pour n = 3 est la suivante :❍ ❍❍❍❍❍ 213 : T 3T 2 ¬T 23 : ¬T 3❍ ❍❍❍❍❍ 21T 2 ¬T 2T 1 (1, 1, 1) (0, 1, 0)¬T 1 (1, 0, 0) (1, 1, 0)T 1 (0, 0, 1) (0, 1, 1)¬T 1 (1, 0, 1) (1, 1, 1)Dans c<strong>et</strong>te forme normale, les n-upl<strong>et</strong>s (ici <strong>de</strong>s tripl<strong>et</strong>s) donnent le résultat obtenu par les n joueursdans l’ordre : (résultat joueur 1, résultat joueur 2, . . . ). Le 0 (resp. 1) signifie que le joueur concernéperd (resp. gagne).On constate ici que pour n prisonniers, on aura une matrice à n dimensions, chaque dimension étantégale à 2, donc 2 n n-upl<strong>et</strong>s à spécifier 5 .Or, ce jeu peut être traduit très simplement par le jeu booléen G = (N,V,π,Γ,Φ) suivant :∗ N = {1,2,... ,n},∗ V = {T 1 ,...,T n },∗ ∀i ∈ {1,... ,n},π i = {T i },∗ ∀i ∈ {1,... ,n},γ i = ⊤, <strong>et</strong>∗ ∀i ∈ {1,... ,n},ϕ i = (T 1 ∧ T 2 ∧... ∧ T n ) ∨ ¬T i .L’utilisation <strong>de</strong>s jeux booléens perm<strong>et</strong> donc <strong>de</strong> réduire <strong>de</strong> manière très significative la taille <strong>de</strong> lareprésentation du problème.Définition 2.3. Soit G = (N,V ,π,Γ,Φ) un jeu booléen. Une stratégie s i pour un joueur i <strong>de</strong> G estune π i -interprétation satisfaisant γ i . L’ensemble <strong>de</strong>s stratégies du joueur i est représenté par S i ={s i ∈ 2 π i|s i |= γ i }.Un profil <strong>de</strong> stratégies s pour G est un n-upl<strong>et</strong> s = (s 1 ,...,s n ), avec pour tout i, s i ∈ S i . S = S 1 ×... × S n est l’ensemble <strong>de</strong> tous les profils <strong>de</strong> stratégies.En d’autres mots, une stratégie pour le joueur i est une affectation à vrai ou faux <strong>de</strong>s variables qu’ilcontrôle. Pour chaque joueur i, γ i est l’ensemble <strong>de</strong>s contraintes restreignant l’ensemble <strong>de</strong>s profils<strong>de</strong> stratégies possibles pour ce joueur.Pour tout ensemble non vi<strong>de</strong> <strong>de</strong> joueurs (appelé coalition) I ⊆ N, la projection <strong>de</strong> s sur I est définiepar s I = (s i ) i∈I . Si I = {i}, la projection <strong>de</strong> s sur {i} est dénotée par s i au lieu <strong>de</strong> s {i} .4 L’emploi <strong>de</strong> préférences binaires ne nous perm<strong>et</strong> pas ici d’exprimer le fait qu’un prisonnier préfère la situation danslaquelle il dénonce ses complices tandis que les autres le couvrent à la situation dans laquelle tout le mon<strong>de</strong> couvre toutle mon<strong>de</strong>, elle-même préférée à la situation dans laquelle tout le mon<strong>de</strong> dénonce. Pour faire cela, nous aurons besoin d’unlangage plus sophistiqué, cf. Chapitre 3 (page 69).5 Ou un arbre binaire à 2 n feuilles si on utilise une représentation sous forme extensive.Jeux booléens 35


Jeux booléensComme décrit en section 1.1.1.1 (page 10), les notations suivantes sont usuelles en théorie <strong>de</strong>s jeux.Soit s = (s 1 ,...,s n ) <strong>et</strong> s ′ = (s ′ 1 ,...,s′ n) <strong>de</strong>ux profils <strong>de</strong> stratégies.On note s −i le profil <strong>de</strong> stratégies s privé <strong>de</strong> la stratégie du joueur i : s −i = (s 1 ,s 2 ,...,s i−1 ,s i+1 ,...,s n ).On note (s −i ,s ′ i ) le profil <strong>de</strong> stratégies s dans lequel on a remplacé la stratégie du joueur i par celledu profil s ′ : (s −i ,s ′ i ) = (s 1,s 2 ,...,s i−1 ,s ′ i ,s i+1,...,s n ). Similairement, si I ⊆ N, on note s −I = s N\I .π I représente l’ensemble <strong>de</strong>s variables contrôlées par I, <strong>et</strong> π −I = π N\I . Si I = {i}, on note π −i l’ensemble<strong>de</strong>s variables contrôlées par tous les joueurs sauf le joueur i : π −i = V \ π i . {π 1 ,...,π n }formant une partition <strong>de</strong> V , un profil <strong>de</strong> stratégies s est une interpr<strong>et</strong>ation pour V , i.e. s ∈ 2 V . π −1représente la fonction inverse <strong>de</strong> π.L’ensemble <strong>de</strong>s stratégies <strong>de</strong> I ⊆ N est dénoté par S I = × i∈I S i , <strong>et</strong> l’ensemble <strong>de</strong>s buts <strong>de</strong> I ⊆ N parΦ I = V i∈I ϕ i .Etudions l’exemple suivant pour illustrer ces notions.Exemple 2.3. Soit G = (N,V ,π,Γ,Φ) un jeu booléen, avec∗ V = {a,b,c}, N = {1,2},∗ π 1 = {a,b} <strong>et</strong> π 2 = {c}.∗ γ 1 = ¬a ∨ ¬b, γ 2 = ⊤∗ ϕ 1 = (a ↔ b) ∨(¬a ∧ b ∧ ¬c),∗ ϕ 2 = (¬a ∧ b ∧ c) ∨(a ∧ ¬b),Le joueur 1 a trois stratégies possibles : s 11 = ab, s 12 = ab, s 13 = ab. La stratégie ab ne satisfait pasles contraintes du joueur 1, <strong>et</strong> donc n’est pas une stratégie acceptable.Le joueur 2 a <strong>de</strong>ux stratégies possibles : s 21 = c ou s 22 = c.G possè<strong>de</strong> donc 6 profils <strong>de</strong> stratégies : S = {abc,abc,abc,abc,abc,abc}.Les profils <strong>de</strong> stratégies abc, abc <strong>et</strong> abc donnent la victoire à 1, tandis que abc, abc <strong>et</strong> abc perm<strong>et</strong>tentà 2 <strong>de</strong> gagner.Le but ϕ i du joueur i est une relation <strong>de</strong> préférence dichotomique <strong>et</strong> compacte, correspondant donc àune fonction d’utilité binaire 6 : un joueur i est satisfait, <strong>et</strong> a une utilité <strong>de</strong> 1, si <strong>et</strong> seulement si son butϕ i est satisfait. Il a une utilité <strong>de</strong> 0 sinon. Les buts {ϕ i ,i = 1,...,n} jouent donc le rôle <strong>de</strong>s fonctionsd’utilité.Définition 2.4. Pour chaque joueur i, la fonction d’utilité induite par le but <strong>de</strong> ce joueur est lafonction u i : S → {0,1} telle que :{0 si s |= ¬ϕu i (s) =i1 si s |= ϕ iNous avons :∗ s est au moins aussi bon que s ′ pour i, dénoté par s ≽ i s ′ , si u i (s) ≥ u i (s ′ ), ou <strong>de</strong> façon équivalentesi s |= ¬ϕ i implique s ′ |= ¬ϕ i ;∗ s est strictement meilleur que s ′ pour i, dénoté par s ≻ i s ′ , si u i (s) > u i (s ′ ), ou, <strong>de</strong> façon équivalente,s |= ϕ i <strong>et</strong> s ′ |= ¬ϕ i .6 Nous verrons comment lever c<strong>et</strong>te contrainte dans le chapitre 3 (page 69).36 Elise Bonzon


2.3. Graphe <strong>de</strong> dépendance entre les joueurs∗ i est indifferent entre s <strong>et</strong> s ′ , dénoté par s ∼ i s ′ , si s ≥ i s ′ <strong>et</strong> s ′ ≥ i s, ou <strong>de</strong> façon équivalente sis |= ϕ i si <strong>et</strong> seulement si s ′ |= ϕ i .Définissons à présent la notion <strong>de</strong> stratégie gagnante pour un joueur.Définition 2.5. Soit G = (N,V ,π,Γ,Φ) un jeu booléen, avec Φ = {ϕ 1 ,...,ϕ n }, <strong>et</strong> N = {1,...,n}. Lastratégie s i est une stratégie gagnante pour le joueur i si, quels que soient les choix effectués par sesadversaires, i est sûr <strong>de</strong> gagner en choisissant c<strong>et</strong>te stratégie.∀s −i ∈ S −i ,(s −i ,s i ) |= ϕ i2.3 Graphe <strong>de</strong> dépendance entre les joueursDe nombreuses structures graphiques sont cachées dans un jeu booléen : la satisfaction <strong>de</strong> chaquejoueur i dépend <strong>de</strong>s joueurs qui contrôlent <strong>de</strong>s variables <strong>de</strong> ϕ i . Il est donc possible <strong>de</strong> représentergraphiquement les dépendances entre joueurs en utilisant la nature syntactique <strong>de</strong>s buts. Intuitivement,si le but d’un joueur i ne dépend d’aucune variable contrôlée par le joueur j, alors la satisfaction <strong>de</strong>i ne dépendra pas directement <strong>de</strong> j. Toutefois, ce n’est qu’une condition suffisante : il se peut quel’expression syntactique <strong>de</strong> ϕ i contienne une variable contrôlée par j , mais que c<strong>et</strong>te variable ne joueaucun rôle dans la satisfaction <strong>de</strong> ϕ i , comme c’est le cas pour la variable y dans ϕ i = x ∧ (y ∨ ¬y).Nous utiliserons donc une notion plus forte d’indépendance entre une formule <strong>et</strong> une variable que lasimple notion d’indépendance syntactique [Lang <strong>et</strong> Marquis, 1998a; Lang <strong>et</strong> al., 2003].Définition 2.6. Une formule propositionnelle ϕ est indépendante d’une variable propositionnelle xs’il existe une fornule ψ logiquement équivalente à ϕ <strong>et</strong> dans laquelle x n’apparaît pas 7 .Définition 2.7. Soit G = (N,V,Γ,π,Φ) un jeu booléen. L’ensemble <strong>de</strong>s variables utiles pour unjoueur i, dénoté par RV G (i), est l’ensemble <strong>de</strong> toutes les variables v ∈ V telles que ϕ i n’est pasindépendante <strong>de</strong> v.Pour faciliter les notations, l’ensemble <strong>de</strong>s variables utiles pour un joueur i dans un jeu booléen Gsera noté RV i au lieu <strong>de</strong> RV G (i). On peut à présent facilement définir l’ensemble <strong>de</strong>s joueurs utilespour un joueur i comme étant l’ensemble <strong>de</strong>s joueurs contrôlant au moins une variable <strong>de</strong> RV i .Définition 2.8. Soit G = (N,V ,Γ,π,Φ) un jeu booléen. L’ensemble <strong>de</strong>s joueurs utiles pour un joueuri, dénoté par 8 RP i , est l’ensemble <strong>de</strong>s joueurs j ∈ N tels que j contrôle au moins une variable utile<strong>de</strong> i : RP i = S v∈RV iπ −1 (v).Exemple 2.4. Axel, Kevin <strong>et</strong> Virginie sont invités à une fête. Axel veut y aller. Kevin aussi, mais si <strong>et</strong>seulement si Axel y va. Quant à Virginie, elle voudrait y aller, que Kevin y aille mais pas Axel. C<strong>et</strong>tesituation peut être modélisée par le jeu booléen G = (N,V,Γ,π,Φ), défini par∗ N = {1,2,3}, Axel étant le joueur 1, Kevin le 2 <strong>et</strong> Virginie 3 ;7 Il existe une caractérisation sémantique équivalente <strong>de</strong> l’indépendance entre une formule <strong>et</strong> une variable [Lang <strong>et</strong> al.,2003] : ϕ est indépendante <strong>de</strong> x s’il existe une interprétation s telle que s |= ϕ <strong>et</strong> switch(s,x) |= ϕ, où switch(s,x) est obtenueen changeant la valeur <strong>de</strong> x dans s, <strong>et</strong> en laissant les valeurs <strong>de</strong>s autres variables inchangées.8 Comme précé<strong>de</strong>mment, l’ensemble <strong>de</strong>s joueurs utiles pour un joueur i dans un jeu booléen G <strong>de</strong>vrait être noté RP G (i).Pour faciliter les notations nous écrirons simplement RP i .Jeux booléens 37


Jeux booléens∗ V = {a,b,c}, où a signifie “1 va à la fête”, <strong>et</strong> <strong>de</strong> même pour b <strong>et</strong> 2, <strong>et</strong> pour c <strong>et</strong> 3 ;∗ pour chaque i, γ i = ⊤ ;∗ π 1 = {a}, π 2 = {b}, π 3 = {c} ;∗ ϕ 1 = a,∗ ϕ 2 = a ↔ b <strong>et</strong>∗ ϕ 3 = ¬a ∧ b ∧ c.On peut voir que la satisfaction d’Axel ne dépend que <strong>de</strong> lui-même, celle <strong>de</strong> Kevin <strong>de</strong>pend <strong>de</strong> ladécision d’Axel <strong>et</strong> <strong>de</strong> la sienne, tandis que celle <strong>de</strong> Virginie dépend <strong>de</strong>s décisions <strong>de</strong> tous les joueurs.On a : RV 1 = {a}, RV 2 = {a,b}, RV 3 = {a,b,c}, RP 1 = {1}, RP 2 = {1,2}, RP 3 = {1,2,3}.C<strong>et</strong>te relation entre les joueurs peut être vue comme un graphe orienté contenant un nœud pour chaquejoueur, <strong>et</strong> un arc <strong>de</strong> i à j si j ∈ RP i , c’est-à-dire si j est un joueur utile pour i.Définition 2.9. Le graphe <strong>de</strong> dépendance d’un jeu booléen G = (N,V,Γ,π,Φ) est un grapheorientéP = 〈N,R〉, avec ∀i, j ∈ N, (i, j) ∈ R (dénoté par R(i, j)) si j ∈ RP i .R(i) est donc l’ensemble <strong>de</strong>s joueurs nécessaires à i pour satisfaire son but : j ∈ R(i) si <strong>et</strong> seulementsi j ∈ RP i . Il faut pourtant remarquer que j ∈ R(i) n’implique pas que i a besoin <strong>de</strong> j pour que sonbut soit satisfait. Par exemple, si π 1 = {a}, π 2 = {b} <strong>et</strong> ϕ 1 = a ∨ b, alors 2 ∈ R(1). Pourtant, 1 a unestratégie lui perm<strong>et</strong>tant <strong>de</strong> satisfaire son but (en m<strong>et</strong>tant a à vrai) <strong>et</strong> n’a donc pas besoin <strong>de</strong> 2.La ferm<strong>et</strong>ure transitive <strong>de</strong> R est notée R ∗ . R ∗ (i, j) représente le chemin <strong>de</strong> i à j dans R. R ∗ (i) représentedonc tous les joueurs qui ont une influence directe ou indirecte sur i. R ∗−1 (i) représente tous lesjoueurs sur lesquels i a une influence directe ou indirecte.Exemple 2.4 (page précé<strong>de</strong>nte), suite : Le graphe <strong>de</strong> dépendance P induit par G est représentéfigure 2.3.1 23Figure 2.3 — Graphe <strong>de</strong> dépendance du jeu <strong>de</strong> la fête∗ R −1 (1) = {1,2,3}, R −1 (2) = {2,3}, R −1 (3) = {3}.∗ R ∗ (1) = {1}, R ∗ (2) = {1,2} <strong>et</strong> R ∗ (3) = {1,2,3}.∗ R ∗−1 (1) = {1,2,3}, R ∗−1 (2) = {2,3} <strong>et</strong> R ∗−1 (3) = {3}.Propriété 2.1. Tout graphe <strong>de</strong> dépendance P = 〈N,R〉 représente au moins un jeu booléen G =(N,V,Γ,π,Φ).Preuve :SoitP = 〈N,R〉 un graphe <strong>de</strong> dépendance. Soit G = (N,V,Γ,π,Φ) un jeu booléen,avec V = {v 1 ,...,v n }, ∀i ∈ N, π i = {v i }, <strong>et</strong> pour tout i, γ i = ⊤.Les buts <strong>de</strong> G sont construits comme suit : ∀i ∈ N, ∀ j tel que j ∈ R(i), alors ϕ i =38 Elise Bonzon


2.3. Graphe <strong>de</strong> dépendance entre les joueursVj v j . Si ̸ ∃ j tel que j ∈ R(i), alors ϕ i = ⊤.Le jeu construit <strong>de</strong> c<strong>et</strong>te façon est un jeu booléen.On introduit à présent la notion d’ensemble stable afin d’exploiter au mieux ce graphe <strong>de</strong> dépendance.Un ensemble <strong>de</strong> nœuds B est stable pour une relation R si tous les arcs <strong>de</strong> R partant d’un nœud <strong>de</strong> Batteignent un autre nœud <strong>de</strong> B. L’ensemble <strong>de</strong>s joueurs utiles d’un ensemble stable B sont les joueursdans B.Définition 2.10. Soit G = (N,V ,π,Γ,Φ) un jeu booléen. B ⊆ N est stable 9 pour R si <strong>et</strong> seulement siR(B) ⊆ B, c’est-à-dire ∀ j ∈ B, ∀i tels que i ∈ R( j), alors i ∈ B.On remarque facilement que ∅ <strong>et</strong> N sont <strong>de</strong>s ensembles stables, <strong>et</strong> que l’ensemble <strong>de</strong>s ensemblesstables pour un jeu booléen est fermé pour l’union <strong>et</strong> l’intersection. Ces quatre propriétés caractérisentcomplètement l’ensemble <strong>de</strong>s coalitions stables pour un jeu booléen.Propriété 2.2. SoitC ⊂ 2 N . Il existe un jeu booléen G tel queC est l’ensemble <strong>de</strong>s ensembles stables<strong>de</strong> G si <strong>et</strong> seulement siC satisfait les quatre propriétés suivantes :1. ∅ ∈C ;2. N ∈C ;3. Si B, B ′ ∈C alors B ∪ B ′ ∈C ;4. Si B, B ′ ∈C alors B ∩ B ′ ∈C.Preuve : Grâce à la propriété 2.1 (page ci-contre), il suffit <strong>de</strong> montrer qu’il existeune relation R sur N telle que C est l’ensemble <strong>de</strong>s ensembles stables pour R si <strong>et</strong>seulement siC satisfait (1)–(4).⇒ ∅ <strong>et</strong> N sont évi<strong>de</strong>mment stables pour R.Si B <strong>et</strong> B ′ sont stables, alors R(B) ⊆ B <strong>et</strong> R(B ′ ) ⊆ B ′ . Donc, R(B) ∪ R(B ′ ) ⊆B ∪ B ′ . Par définition, R(B) = { j|∃i ∈ B : j ∈ RP i } <strong>et</strong> R(B ′ ) = { j|∃i ∈ B ′ :j ∈ RP i }. Donc, R(B) ∪ R(B ′ ) = { j|∃i ∈ B ∪ B ′ : j ∈ RP i } = R(B ∪ B ′ ). Alors,R(B ∪ B ′ ) ⊆ B ∪ B ′ , <strong>et</strong> B ∪ B ′ est un ensemble stable.Si B <strong>et</strong> B ′ sont stables, alors R(B) ⊆ B <strong>et</strong> R(B ′ ) ⊆ B ′ . Donc, R(B) ∩ R(B ′ ) ⊆B ∩ B ′ . Par définition, R(B) = { j|∃i ∈ B : j ∈ RP i } <strong>et</strong> R(B ′ ) = { j|∃i ∈ B ′ :j ∈ RP i }. Donc, R(B) ∩ R(B ′ ) = { j|∃i ∈ B ∩ B ′ : j ∈ RP i } = R(B ∩ B ′ ). Alors,R(B ∩ B ′ ) ⊆ B ∩ B ′ , <strong>et</strong> B ∩ B ′ est un ensemble stable.⇐ SoitC un ensemble <strong>de</strong> coalitions satisfaisant (1)–(4). Pour tout i ∈ N, soit X i leplus p<strong>et</strong>it ensemble <strong>de</strong> C contenant i : X i = T {B ∈C|i ∈ B} (puisque C estfermé pour ∩, nous avons X i ∈C). Construisons à présent R tel que pour touti, j ∈ N, (i, j) ∈ R si <strong>et</strong> seulement si j ∈ X i .On veut à présent vérifier que pour tout B ∈C, B est stable pour R. Supposonsque B ∈C <strong>et</strong> que B ne soit pas stable (il existe un i ∈ B tel qu’il existe un9 La notion d’ensemble stable que nous définissons ici n’est pas la même que celle utilisée en théorie <strong>de</strong> graphe : nousne parlons pas ici <strong>de</strong>s ensembles <strong>de</strong> somm<strong>et</strong>s <strong>de</strong>ux-à-<strong>de</strong>ux non adjacents.Jeux booléens 39


Jeux booléensj ∈ R(i) <strong>et</strong> j ∉ B). Comme j ∈ R(i), on sait par construction <strong>de</strong> R que j ∈ X i ,<strong>et</strong> donc j ∈ T {B ∈C|i ∈ B}, donc j ∈ B, <strong>et</strong> donc B est stable pour R, ce qui esten contradiction avec l’hypothèse effectuée.On montre ensuite que si B ∉C, alors B n’est pas stable pour R. PuisqueC estfermé pour ∪, S i∈B X i ̸= B. Donc il existe un i ∈ B tel qu’il existe k ∈ X i <strong>et</strong> quek ∉ B. Par construction <strong>de</strong> R, R(B) ⊈ B, <strong>et</strong> B n’est pas stable pour R.On définit à présent la projection d’un jeu booléen G sur un ensemble stable <strong>de</strong> joueurs B ⊆ N, afin<strong>de</strong> pouvoir décomposer un jeu booléen en plusieurs jeux :Définition 2.11. Soit G = (N,V,π,Γ,Φ) un jeu booléen, <strong>et</strong> B ⊆ N un ensemble stable pour R. Laprojection <strong>de</strong> G sur B est définie par G B = (B,V B ,π B ,Γ B ,Φ B ), où V B = ∪ i∈B π i , π B : B → V B telle queπ B (i) = {v|v ∈ π i }, Γ B = {γ i |i ∈ B}, <strong>et</strong> Φ B = {ϕ i |i ∈ B}.Propriété 2.3. Si B est un ensemble stable, G B = (B,V B ,π B ,Γ B ,Φ B ) est un jeu booléen.Preuve : Soit G B = (B,V B ,π B ,Γ B ,Φ B ).∗ B ⊆ N est l’ensemble <strong>de</strong>s joueurs,∗ V B = ∪ i∈B π i . Nous avons évi<strong>de</strong>mment V B ⊆ V , <strong>et</strong> donc V B est l’ensemble <strong>de</strong>svariables.∗ Nous <strong>de</strong>vons vérifier que chaque but ϕ i pour i ∈ B est une formule <strong>de</strong> L VB , ouest logiquement équivalente à une formule <strong>de</strong> L VB .Supposons que ∃i ∈ B, ∃v ∈ Var(ϕ i ) tel que v ∉ V B . Donc, ∀ j ∈ B, v ∉ π j . Soitk ∈ N \ B tel que v ∈ π k . Nous savons que v ∈ Var(ϕ i ), donc soit ϕ i est indépendant<strong>de</strong> v, <strong>et</strong> est donc logiquement équivalente à une formule dans laquellev n’apparaît pas, soit ϕ i n’est pas indépendante <strong>de</strong> v, <strong>et</strong> dans ce cas v ∈ RV i , <strong>et</strong>par définition k ∈ RP i . Donc, k ∈ R(i), mais k ∉ B : c’est en contradiction avecle fait que B est stable.∗ π B : B → V B tel que π B (i) = {v|v ∈ π i } est l’ensemble <strong>de</strong>s fonctions d’affectation<strong>de</strong> contrôle <strong>de</strong>s joueurs <strong>de</strong> B.∗ Γ B = {γ i |i ∈ B} est l’ensemble <strong>de</strong>s contraintes <strong>de</strong>s joueurs <strong>de</strong> B. Commechaque γ i est une formule propositionnelle <strong>de</strong> L πi , Γ B est bien défini pour lejeu G B .Exemple 2.5. Soit G = (N,V ,π,Γ,Φ) le jeu booléen défini par V = {a,b,c}, N = {1,2,3}, π 1 = {a},π 2 = {b}, π 3 = {c}, pour chaque i, γ i = ⊤, ϕ 1 = a ↔ b, ϕ 2 = a ↔ ¬b <strong>et</strong> ϕ 3 = ¬c.Nous avons : RV 1 = {a,b}, RV 2 = {a,b}, RV 3 = {c}, RP 1 = {1,2}, RP 2 = {1,2}, RP 3 = {3}.Le graphe <strong>de</strong> dépendance P <strong>de</strong> G est représenté figure 2.4 (page ci-contre).Les ensembles <strong>de</strong> joueurs B = {1,2} <strong>et</strong> C = {3} sont stables. On peut décomposer G en 2 jeuxbooléens :40 Elise Bonzon


2.4. Concepts <strong>de</strong> solution : équilibres <strong>de</strong> Nash <strong>et</strong> stratégies dominées1 2 3Figure 2.4 — Graphe <strong>de</strong> dépendance <strong>de</strong> l’exemple 2.5∗ G B = (B,V B ,π B ,Γ B ,Φ B ), avec B = {1,2}, V B = {a,b}, π 1 = a, π 2 = b, γ 1 = γ 2 = ⊤, ϕ 1 = a ↔ b,ϕ 2 = a ↔ ¬b.∗ G C = (C,V C ,π C ,Γ C ,Φ C ), avec C = {3}, V C = {c}, π 3 = c, γ 3 = ⊤, ϕ 3 = ¬c.C<strong>et</strong>te décomposition nous perm<strong>et</strong> ainsi d’étudier <strong>de</strong>ux jeux plus simples, G B <strong>et</strong> G C , plutôt que d’étudierle jeu G. Nous verrons dans la suite que nous pouvons ainsi calculer les équilibres <strong>de</strong> Nash surles sous-jeux plutôt que sur le jeu compl<strong>et</strong>.2.4 Concepts <strong>de</strong> solution : équilibres <strong>de</strong> Nash <strong>et</strong> stratégies dominées 102.4.1 Equilibres <strong>de</strong> NashLa définition <strong>de</strong>s équilibres <strong>de</strong> Nash en stratégie pures (PNE) pour les jeux booléens à n joueurs estla même que la définition classique en théorie <strong>de</strong>s jeux (voir Chapitre 1, Définition 1.5 (page 19)), enayant à l’esprit que les fonctions d’utilité sont induites par les buts <strong>de</strong>s joueurs ϕ 1 ,...,ϕ n .Rappelons qu’un équilibre <strong>de</strong> Nash est un profil <strong>de</strong> stratégies tel que la stratégie <strong>de</strong> chaque joueur estune réponse optimale aux stratégies <strong>de</strong>s autres joueurs, <strong>et</strong> étudions un exemple simple.Exemple 2.6. Soit G = (N,V,π,Γ,Φ) un jeu booléen avec∗ V = {a,b,c}, N = {1,2,3}, pour tout i, γ i = ⊤,∗ π 1 = {a}, π 2 = {b}, π 3 = {c},∗ ϕ 1 = (¬a ∨(a ∧ b ∧ ¬c)),∗ ϕ 2 = (a ↔ (b ↔ c)) <strong>et</strong>∗ ϕ 3 = ((a ∧ ¬b ∧ ¬c) ∨(¬a ∧ b ∧ c)).On peut à présent construire la forme normale <strong>de</strong> G :stratégie <strong>de</strong> 3 : c❍ ❍❍❍❍❍ 21b ba (1, 1, 0) (1, 0, 1)a (0, 0, 0) (0, 1, 0)stratégie <strong>de</strong> 3 : c❍ ❍❍❍❍❍ 21b ba (1, 0, 0) (1, 1, 0)a (0, 1, 1) (1, 0, 0)On constate tout d’abord que le joueur 1 a une stratégie gagnante. En eff<strong>et</strong>, s’il choisit d’instancierla variable a à faux, alors il est sûr <strong>de</strong> gagner quels que soient les choix <strong>de</strong> 2 <strong>et</strong> 3.10 Certains <strong>de</strong>s résultats <strong>de</strong> c<strong>et</strong>te section ont été obtenus en collaboration avec Bruno Zanuttini.Jeux booléens 41


Jeux booléensEtudions à présent les équilibres <strong>de</strong> Nash. Pour cela, il faut étudier chaque profil <strong>de</strong> stratégies.abc : 1, qui contrôle a, préfère abcabc : 2, qui contrôle b, préfère abcabc : 2 , qui contrôle b, préfère abcabc : 2, qui contrôle b, préfère abcabc : 1, qui contrôle a, préfère abcabc : 3, qui contrôle c, préfère abcabc : Equilibre <strong>de</strong> Nash (aucun joueur ne préfère un autre profil)abc : 2, qui contrôle b, préfère abcLe profil <strong>de</strong> stratégies abc est donc le seul équilibre <strong>de</strong> Nash du jeu G.Donnons à présent une caractérisation simple <strong>de</strong>s équilibres <strong>de</strong> Nash aux stratégies pures.Propriété 2.4. Soit s ∈ S. s est un équilibre <strong>de</strong> Nash en stratégies pures <strong>de</strong> G si <strong>et</strong> seulement si pourtout i ∈ N, on a :∗ soit s |= ϕ i ,∗ soit s −i |= ¬ϕ i .C<strong>et</strong>te caractérisation, simple, perm<strong>et</strong> <strong>de</strong> calculer plus facilement les équilibres <strong>de</strong> Nash en stratégiespures <strong>de</strong>s jeux booléens. Ainsi, un profil <strong>de</strong> stratégies s sera un PNE si <strong>et</strong> seulement si, pour chacun<strong>de</strong>s joueurs i, soit s perm<strong>et</strong> d’obtenir le but du joueur i, soit le joueur i ne peut obtenir son but si lesautres joueurs maintiennent leurs stratégies.Preuve : s est un équilibre <strong>de</strong> Nash en stratégies pures <strong>de</strong> G si <strong>et</strong> seulement si pourtout i ∈ N <strong>et</strong> pour tout s ′ i ∈ S i on a u i (s) ≥ u i (s −i ,s ′ i ). Or, puisque u i(s) <strong>et</strong> u i (s −i ,s ′ i )ne peuvent prendre que <strong>de</strong>ux valeurs, c<strong>et</strong>te inégalité est équivalente àc’est-à-dire∀i ∈ N <strong>et</strong> ∀s ′ i ∈ S i,u i (s) = 1 ou u i (s −i ,s ′ i) = 0∀i ∈ N soit u i (s) = 1 (2.1)soit ∀s ′ i ∈ S i ,u i (s −i ,s ′ i) = 0 (2.2)2.1 est équivalente à s |= ϕ i .2.2 est équivalente à ∀s ′ i ∈ S i, (s −i ,s ′ i ) |= ¬ϕ i, donc s −i |= ¬ϕ i .Exemple 2.6 (page précé<strong>de</strong>nte), suite :s = abc. En eff<strong>et</strong>, nous avons :∗ s = abc |= ϕ 1 = (¬a ∨(a ∧ b ∧ ¬c))∗ s = abc |= ϕ 2 = (a ↔ (b ↔ c))∗ s −3 = ab |= ¬ϕ 3 = ((¬a ∨ b ∨ c) ∧(a ∨ ¬b ∨ ¬c))Nous avons vu que le seul équilibre <strong>de</strong> Nash <strong>de</strong> ce jeu estOn peut vérifier qu’aucun autre profil <strong>de</strong> stratégies ne satisfait l’une ou l’autre <strong>de</strong> ces conditions.42 Elise Bonzon


2.4. Concepts <strong>de</strong> solution : équilibres <strong>de</strong> Nash <strong>et</strong> stratégies dominéesC<strong>et</strong>te caractérisation <strong>de</strong>s équilibres <strong>de</strong> Nash en stratégies pures peut être encore simplifiée. En eff<strong>et</strong>,vérifier que s −i |= ¬ϕ i revient à vérifier que s −i peut inférer ¬ϕ i quelles que soient les valeurs prisespar les variables contrôlées par le joueur i. Cela évoque la notion <strong>de</strong> projection d’une formule sur unensemble <strong>de</strong> variables, qui correspond à l’utilisation <strong>de</strong> l’opérateur forg<strong>et</strong>, notion qui a été étudiéepar [Lin <strong>et</strong> Reiter, 1994; Lang <strong>et</strong> al., 2002a, 2003], <strong>et</strong> qui est rappelée dans le chapitre <strong>de</strong> notations(page 7).On généralise ici c<strong>et</strong>te notion d’oubli en utilisant la notation suivante : ∀i:ϕ ≡ ¬∃i:¬ϕ qui représentel’oubli <strong>de</strong> toutes les variables contrôlées par le joueur i.Si l’on revient à la secon<strong>de</strong> équation <strong>de</strong> la propriété 2.4 (page précé<strong>de</strong>nte), on voit que l’on a :s −i |= ¬ϕ i ⇔ s −i |= ∀i:¬ϕ i (2.3)⇔ (s i ,s −i ) |= ∀i:¬ϕ i (2.4)⇔ s |= ∀i: ¬ϕ i (2.5)L’équation 2.3 est équivalente à l’équation 2.4 car les variables contrôlées par le joueur i ont disparu<strong>de</strong> ∀i:¬ϕ i .Cela nous perm<strong>et</strong> d’établir le corollaire suivant, qui simplifie la caractérisation <strong>de</strong>s PNE que nousavons donnée dans la propriété 2.4 (page ci-contre) :Corollaire 2.1. Soit s ∈ S. Alors s est un équilibre <strong>de</strong> Nash en stratégies pures pour G si <strong>et</strong> seulementsi :s |= ^(ϕ i ∨(∀i:¬ϕ i ))i∈NPreuve :∀i ∈ N,s |= ϕ i ou s −i |= ¬ϕ i⇔ ∀i ∈ N,s |= ϕ i ou s |= ∀i:¬ϕ i⇔ ∀i ∈ N,s |= ϕ i ∨(∀i: ¬ϕ i )⇔ s |= V i∈N(ϕ i ∨(∀i:¬ϕ i ))Exemple 2.6 (page 41), suite :Calculons ∀3:¬ϕ 3 :Comme précé<strong>de</strong>mment, le seul équilibre <strong>de</strong> Nash <strong>de</strong> ce jeu est abc.∀3:¬ϕ 3= ¬ϕ 3c←⊤ ∧ ¬ϕ 3c←⊥= ((¬a ∨ b ∨ ⊤) ∧(a ∨ ¬b ∨ ⊥)) ∧((¬a ∨ b ∨ ⊥) ∧(a ∨ ¬b ∨ ⊤))= (a ∨ ¬b) ∧(¬a ∨ b)On a donc bien :abc |= ϕ 1 ∧ ϕ 2 ∧ ∀3: ¬ϕ 3Le graphe <strong>de</strong> dépendance entraîne également quelques propriétés sur les équilibres <strong>de</strong> Nash.Jeux booléens 43


Jeux booléensPropriété 2.5. Soit G un jeu booléen. Si ∀i ∈ N, i ∉ RP i alors tout s ∈ S est un PNE.Si un joueur ne contrôle aucune <strong>de</strong>s variables qui lui sont utiles, il n’a pas d’influence sur son proprebut, <strong>et</strong> donc aucune préférence pour une ou l’autre <strong>de</strong> ses stratégies. Si c’est le cas pour tous lesagents, aucun profil <strong>de</strong> stratégies n’est préféré, <strong>et</strong> tous sont donc <strong>de</strong>s équilibres <strong>de</strong> Nash en stratégiespures.Preuve : Puisque ∀i ∈ N, i ∉ RP i , aucun joueur i n’a d’influence sur son propre but :∀s i ∈ S i , (s i ,s −i ) |= ϕ i ou s −i |= ¬ϕ i . Donc, ∀i ∈ N, soit s −i |= ϕ i , soit s −i |= ¬ϕ i .La propriété 2.4 (page 42) s’applique pour tout s, <strong>et</strong> s est donc un PNE.Propriété 2.6. Soit G un jeu booléen tel que ∀i ∈ N, |RP i | = 1, <strong>et</strong> ∃i ∈ N tel que RP i = {i}.s est un PNE si <strong>et</strong> seulement si ∀i ∈ N tels que RP i = {i}, s |= ϕ i .Si chaque joueur d’un jeu booléen ne dépend que d’un seul joueur, <strong>et</strong> qu’au moins un joueur nedépend que <strong>de</strong> lui-même, les joueurs tels que RP i = {i} seront les seuls à avoir une influence sur leursbuts, <strong>et</strong> donc à pouvoir s’assurer que ces <strong>de</strong>rniers sont satisfaits. Un profil <strong>de</strong> stratégies s sera donc unPNE si <strong>et</strong> seulement s’il satisfait les buts <strong>de</strong> ces joueurs.Preuve :⇒ Supposons que s est un PNE <strong>et</strong> ∃i tel que RP i = {i} <strong>et</strong> s |= ¬ϕ i .Par définition d’un PNE, nous avons s −i |= ¬ϕ i . Mais nous savons que RP i ={i}, donc ∀v ∈ Var(s −i ), v ∉ Var(ϕ i ). s −i |= ¬ϕ i n’est alors pas possible. Nousavons une contradiction.⇐ Supposons à présent que pour tout i tel que RP i = {i} alors s |= ϕ i , <strong>et</strong> s n’estpas un PNE.Si s n’est pas un PNE, alors ∃i ∈ N tel que s |= ¬ϕ i <strong>et</strong> s −i |= ϕ i . Sachant ques |= ¬ϕ i , on a donc RP i ̸= {i}. ∀v ∈ π i , v¬ ∈ Var(ϕ i ). Donc si s |= ¬ϕ i , alorss −i |= ¬ϕ i <strong>et</strong> s est un PNE ; nous avons une contradiction.Exemple 2.7. Soit G = (N,V ,Γ,π,Φ) un jeu booléen défini par :∗ V = {a,b,c}, N = {1,2,3},∗ pour tout i, γ i = ⊤,∗ π 1 = {a}, π 2 = {b}, π 3 = {c},∗ ϕ 1 = a, ϕ 2 = ¬a <strong>et</strong> ϕ 3 = b.Nous avons : RV 1 = {a}, RV 2 = {a}, RV 3 = {b}, RP 1 = {1}, RP 2 = {1} <strong>et</strong> RP 3 = {2}.1 2 3Ce jeu a 4 PNEs : {abc,abc,abc,abc}. s est un PNE si <strong>et</strong> seulement si s |= ϕ 1 .44 Elise Bonzon


2.4. Concepts <strong>de</strong> solution : équilibres <strong>de</strong> Nash <strong>et</strong> stratégies dominéesPropriété 2.7. Soit G un jeu booléen tel que les buts <strong>de</strong>s joueurs soient tous <strong>de</strong>s clauses. Alors G atoujours un équilibre <strong>de</strong> Nash en stratégies pures.De plus, s est un PNE si <strong>et</strong> seulement si pour tout i ∈ N tel que Lit(ϕ i ) ∩ π i ̸= ∅, s |= ϕ i .Si les buts <strong>de</strong>s joueurs sont tous <strong>de</strong>s clauses, un joueur peut donc soit satisfaire son but seul, s’ilcontrôle une variable <strong>de</strong> son but, soit il n’a aucune influence sur sa satisfaction. Tout profil <strong>de</strong> stratégiesqui satisfait tous les joueurs contrôlant une variable <strong>de</strong> leur but est donc un équilibre <strong>de</strong> Nash enstratégies pures.Preuve : Soit i ∈ N. Si les buts <strong>de</strong> tous les joueurs sont <strong>de</strong>s clauses, <strong>de</strong>ux cas sontpossibles :∗ Lit(ϕ i ) ∩ π i ̸= ∅. Dans ce cas, i est sûr <strong>de</strong> pouvoir satisfaire son but, en affectantcomme il le souhaite une <strong>de</strong>s variables qu’il contrôle.∗ Lit(ϕ i ) ∩ π i = ∅. i ne peut rien faire pour satisfaire son but, il est totalementdépendant <strong>de</strong>s autres joueurs.Il existe donc s ∈ S tel qu’on ait pour tout i ∈ N soit s |= ϕ i , soit s −i |= ¬ϕ i . s estdonc un PNE, <strong>et</strong> il satisfait pour tout i ∈ N tel que Lit(ϕ i ) ∩ π i ̸= ∅, s |= ϕ i .Supposons qu’il existe i ∈ N tel que Lit(ϕ i ) ∩ π i ̸= ∅ <strong>et</strong> s |= ¬ϕ i . Dans ce cas lejoueur i a intér<strong>et</strong> à changer sa stratégie pour satisfaire son but, s n’est donc pas unPNE.Propriété 2.8. Soit G un jeu booléen tel que les buts <strong>de</strong>s joueurs soient tous <strong>de</strong>s cubes. G a toujoursalors un équilibre <strong>de</strong> Nash en stratégies pures.Si les buts <strong>de</strong>s joueurs sont tous <strong>de</strong>s cubes, un joueur peut instancier les variables qu’il contrôle <strong>de</strong>façon à satisfaire son but au mieux, <strong>et</strong> il n’a pas d’influence sur le reste. Le profil <strong>de</strong> stratégies construit<strong>de</strong> c<strong>et</strong>te façon est un PNE.Preuve : Soit s ∈ S tel que pour tout i ∈ N, s |= (ϕ i ) πi . On a alors pour tout i ∈ N,soit s |= ϕ i , soit s −i |= ¬ϕ i . En eff<strong>et</strong>, si un joueur i a instancié toutes ses variablesau mieux <strong>et</strong> que son but n’est quand même pas satisfait, c’est qu’un autre joueurcontrôle une variable <strong>de</strong> son but, <strong>et</strong> l’instancie d’une façon non satisfaisante pour i.Si pour un jeu G, la partie irréflexive d’un graphe <strong>de</strong> dépendance P est acyclique (c’est-à-dire qu’iln’y a pas <strong>de</strong> cycles <strong>de</strong> longueur ≥ 2), nous pouvons utiliser une procédure inspirée <strong>de</strong> la “forwardsweep procedure” (procédure <strong>de</strong> recherche en avant) [Boutilier <strong>et</strong> al., 1999] pour trouver un équilibre<strong>de</strong> Nash en stratégies pures. Regardons comment procé<strong>de</strong>r sur un exemple.Exemple 2.4 (page 37), suite : La partie irréflexive du graphe <strong>de</strong> dépendance P <strong>de</strong> G, représentéfigure 2.3 (page 38), est acyclique.RP 1 = {1}, <strong>et</strong> donc un profil <strong>de</strong> stratégies s = (s 1 ,s 2 ,s 3 ) sera un PNE seulement si le but du joueur 1est satisfait, <strong>et</strong> donc si s 1 = a.Jeux booléens 45


Jeux booléens2 peut alors choisir sa stratégie, car son but dépend seulement <strong>de</strong> 1 <strong>et</strong> <strong>de</strong> lui-même (RP 2 = {1,2}).Donc s sera un PNE seulement si (s 1 ,s 2 ) |= (ϕ 2 ) s1 , c’est-à-dire si s 2 = b.Enfin, le joueur 3 a fait le même raisonnement que 1 <strong>et</strong> 2, <strong>et</strong> donc sait que son but ne sera jamaissatisfait quoiqu’il fasse.Donc G a 2 PNEs : {abc,abc}.Propriété 2.9. Soit G un jeu booléen tel que la partie irréflexive du graphe <strong>de</strong> dépendance P <strong>de</strong> Gsoit acyclique. On sait alors que :1. G a un PNE.2. s est un PNE <strong>de</strong> G si <strong>et</strong> seulement si pour tout i ∈ N,∗ soit (s R∗ (i)\{i},s i ) |= ϕ i ,∗ soit s R∗ (i)\{i} |= ¬ϕ i .Preuve :1. On peut supposer sans perte <strong>de</strong> généralité que les joueurs sont numérotés <strong>de</strong>sorte que pour tout i ∈ N, si i dépend <strong>de</strong> j, alors j < i. Soit s = (s 1 ,...,s N ) définiinductivement comme suit : pour i = 1,...,N, si (ϕ i ) s1 ,....s i−1est satisfiable,alors on prend s i tel que (s 1 ,...,s i ) |= ϕ i . Un tel s i existe car i ne dépend pas<strong>de</strong> k pour tout k > i. Si (ϕ i ) s1 ,....s i−1n’est pas satisfiable, on prend alors un s iquelconque.On a donc construit un profil <strong>de</strong> stratégies s tel que pour tout i, s |= ϕ i ous −i |= ¬ϕ i . D’après la propriété 2.4 (page 42), s est donc un PNE.2. Il nous reste à prouver que s est un PNE si <strong>et</strong> seulement si ∀i ∈ N, soit(s R∗ (i)\{i},s i ) |= ϕ i , soit s R∗ (i)\{i} |= ¬ϕ i .⇒ Supposons que s est un PNE <strong>et</strong> qu’il existe un joueur i ∈ N tel que(s R ∗ (i)\{i},s i ) ̸|= ϕ i <strong>et</strong> s R ∗ (i)\{i} ̸|= ¬ϕ i .Nous avons alors s |= ¬ϕ i , <strong>et</strong>, comme ∀k ∉ R ∗ (i), (ϕ i ) sk = ϕ i , nous avonss −i ̸|= ¬ϕ i . D’après la propriété 2.4 (page 42), s n’est pas un PNE.⇐ Suposons à présent que (s R∗ (i)\{i},s i ) |= ϕ i ou s R∗ (i)\{i} |= ¬ϕ i .Si i est un joueur tel que (s R∗ (i)\{i},s i ) |= ϕ i , on a évi<strong>de</strong>mment s |= ϕ i .Si s R ∗ (i)\{i} |= ¬ϕ i , alors, comme ∀k ∉ RP i ,(ϕ i ) sk = ϕ i , on a s −i |= ¬ϕ i .Comme ∀i ∈ N, soit s |= ϕ i , soit s −i |= ¬ϕ i , s est un PNE.Exemple 2.4 (page 37), suite : Dans c<strong>et</strong> exemple, nous avons R ∗ (1) = {1}, R ∗ (2) = {1,2},R ∗ (3) = {1,2,3}. Pour s = abc, on a bien∗ (s R∗ (1)\{1},s 1 ) = s 1 |= ϕ 1 = a∗ (s R ∗ (2)\{2},s 2 ) = (s 1 ,s 2 ) |= ϕ 2 = a ↔ b∗ s R∗ (3)\{3} = (s 1 ,s 2 ) |= ¬ϕ 3 = a ∨ ¬b ∨ ¬cLe raisonnement est le même pour s = abc.Quand la partie irréflexive du graphe <strong>de</strong> dépendance P <strong>de</strong> G n’est pas acyclique, l’existence d’unéquilibre <strong>de</strong> Nash en stratégies pures n’est plus garanti, comme le montre l’exemple suivant.46 Elise Bonzon


2.4. Concepts <strong>de</strong> solution : équilibres <strong>de</strong> Nash <strong>et</strong> stratégies dominéesExemple 2.8. Soit G = (N,V,π,Γ,Φ) un jeu booléen défini par :∗ V = {a,b}, N = {1,2},∗ π 1 = {a}, π 2 = {b},∗ ∀i, γ i = ⊤,∗ ϕ 1 = a ↔ b,∗ ϕ 2 = (a ∧ ¬b) ∨(¬a ∧ b).On a RV 1 = {a,b}, RV 2 = {a,b}, RP 1 = {1,2}, RP 2 = {1,2}.Le graphe <strong>de</strong> dépendance P <strong>de</strong> G est le suivant :1 2Ce jeu n’a aucun PNE.La propriété 2.9 (page ci-contre) entraîne le corollaire suivant :Corollaire 2.2. Si G est un jeu booléen tel qu’il existe un j ∈ N tel que pour tous les i ∈ N, RP i = { j},alors s est un PNE si <strong>et</strong> seulement si s |= ϕ j .Si tous les joueurs ne dépen<strong>de</strong>nt que d’un <strong>et</strong> un seul joueur j, tous les joueurs (sauf j) nont aucuneinfluence sur leurs buts. Seul j, qui contrôle son but, a une préférence sur ses stratégies, <strong>et</strong> donc uneinfluence sur le choix <strong>de</strong>s PNEs.Preuve : Soit G est un jeu booléen tel que ∃ j ∈ N tel que ∀i ∈ N RP i = { j}.⇒ Soit s un PNE <strong>de</strong> G. Comme, ∀i ∈ N, RP i = { j}, alors ∀i ∈ N, R ∗ (i) = { j}.D’après la propriété 2.9 (page précé<strong>de</strong>nte), on doit avoir s j |= ϕ j , <strong>et</strong> pour touti ̸= j, on peut avoir soit (s j ,s i ) |= ϕ i , soit s j |= ¬ϕ i . La seule condition est doncque s |= ϕ j .⇐ Soit s |= ϕ j . Si ∀i, RP i = { j}, on sait que i n’a aucun pouvoir sur son but, <strong>et</strong>donc que s est équivalent à s j . Donc, on a pour tout i, soit s |= ϕ i , soit s −i |= ¬ϕ i ,<strong>et</strong> s est un PNE.Propriété 2.10. Soit G = (N,V,π,Γ,Φ) un jeu booléen, B ⊆ N un ensemble stable pour R, <strong>et</strong> G B =(B,V B ,π B ,Γ B ,Φ B ) la projection <strong>de</strong> G sur B.Si s est un PNE pour G, alors s B est un PNE pour G B .Preuve : Soit s un PNE <strong>de</strong> G. Alors, ∀i ∈ N, soit s |= ϕ i , soit s −i |= ¬ϕ i .Nous savons que s = (s B ,s −B ), <strong>et</strong> nous voulons vérifier que s B est un PNE <strong>de</strong> G B ,c’est-à-dire que ∀i ∈ B, soit s B |= ϕ i , soit s B−i |= ¬ϕ i . Soit i ∈ B.– s = (s B ,s −B ) |= ϕ i . Comme i ∈ B, <strong>et</strong> que B est stable, nous savons que ∀ j ∈ R(i),j ∈ B. Donc tous les joueurs qui ont une influence sur i sont dans B, <strong>et</strong> donc s −Bn’a aucune influence sur ϕ i : on a s B |= ϕ i .– s −i |= ¬ϕ i . Comme précé<strong>de</strong>mment, on sait que seuls les joueurs <strong>de</strong> B ont uneinfluence sur ϕ i . On a donc s (B\{i}) |= ¬ϕ i , ce qui correspond à s B−i |= ¬ϕ i .Jeux booléens 47


Jeux booléensExemple 2.9. Soit G = (N,V ,π,Γ,Φ) un jeu booléen défini par∗ V = {a,b,c,d}, N = {1,2,3,4},∗ π 1 = {a}, π 2 = {b}, π 3 = {c}, π 4 = {d},∗ ∀i, γ i = ⊤,∗ ϕ 1 = a ↔ b, ϕ 2 = b ↔ c, ϕ 3 = ¬d, <strong>et</strong> ϕ 4 = d ↔ (b ∧ c).On a : RP 1 = {1,2}, RP 2 = {2,3}, RP 3 = {4}, RP 4 = {2,3,4}.Le graphe <strong>de</strong> dépendance P <strong>de</strong> G est représenté figure 2.5.1 23 4Figure 2.5 — Graphe <strong>de</strong> dépendance <strong>de</strong> l’exemple 2.9L’ensemble <strong>de</strong> joueurs B = {2,3,4} est stable. G B = (B,V B ,Γ B ,π B ,Φ B ) est un jeu booléen, avec∗ V B = {b,c,d},∗ π 2 = b, π 3 = c, π 4 = d,∗ γ 2 = γ 3 = γ 4 = ⊤,∗ ϕ 2 = b ↔ c, ϕ 3 = ¬d, <strong>et</strong> ϕ 4 = d ↔ (b ∧ c).G a 2 PNEs : {abcd,abcd}, <strong>et</strong> {bcd,bcd} sont les 2 PNEs <strong>de</strong> G B (<strong>et</strong> dans c<strong>et</strong> exemple, G B n’a aucunautre PNE).Comme il est possible <strong>de</strong> le voir dans l’exemple 2.5 (page 40), la réciproque n’est pas toujours vraie :C = {3} est stable, <strong>et</strong> le jeu booléen G C = (C,V C ,π C ,Γ C ,Φ C ) a un équilibre <strong>de</strong> Nash en stratégiespures : {c}, mais pourtant le jeu G n’a aucun PNE.Toutefois, il existe <strong>de</strong>s cas simples pour lesquels la réciproque est vraie.Propriété 2.11. Soit B <strong>et</strong> C <strong>de</strong>ux ensembles stables <strong>de</strong> joueurs, <strong>et</strong> soit G B <strong>et</strong> G C <strong>de</strong>ux jeux booléensassociés.Si s B est un PNE pour G B <strong>et</strong> s C un PNE pour G C tels que 11 ∀i ∈ B ∩C, s B,i = s C,i , alors s B∪C est unPNE pour le jeu G B∪C .Preuve : B <strong>et</strong> C sont stables, donc d’après la propriété 2.2 (page 39), B ∪C est unensemble stable, <strong>et</strong> d’après la propriété 2.3 (page 40), G B∪C est un jeu booléen.Soit i ∈ B ∪C. 3 cas sont possibles (2 étant symétriques) :∗ i ∈ B \C (ou i ∈ C \ B). s B est un PNE pour G B , donc on a :∗ soit s B |= ϕ i , <strong>et</strong> comme i ∉ C, on a (s B ,s C ) |= ϕ i ;∗ soit s B−i |= ¬ϕ i . Comme i ∉ C, on a également (s B−i ,s C ) |= ¬ϕ i , ce quicorrespond à s B∪C−i |= ¬ϕ i .11 s B,i représente la stratégie du joueur i pour le jeu G B .48 Elise Bonzon


2.4. Concepts <strong>de</strong> solution : équilibres <strong>de</strong> Nash <strong>et</strong> stratégies dominées∗ i ∈ B ∩C. On a alors ∀k ∈ B ∩C, s B,k = s C,k . Plusieurs cas sont possibles :∗ s B |= ϕ i <strong>et</strong> s C |= ϕ i . Puisque ∀k ∈ B ∩C, s B,k = s C,k , on a (s B ,s C ) |= ϕ i ,donc s B∪C |= ϕ i .∗ s B−i |= ¬ϕ i <strong>et</strong> s C−i |= ¬ϕ i . Pour les mêmes raisons que précé<strong>de</strong>mment,on a (s B−i ,s C−i ) |= ¬ϕ i , <strong>et</strong> donc s B∪C−i |= ¬ϕ i .∗ s B |= ϕ i <strong>et</strong> s C−i |= ¬ϕ i (ou vice versa). On sait que ∀k ∈ B∩C, s B,k = s C,k ,<strong>et</strong> puisque les résultats obtenus par B <strong>et</strong> C sont différents, ces stratégiesn’interviennent pas dans ϕ i . Les joueurs dans B∩C ne contrôlent aucunevariable <strong>de</strong> ϕ i : ∀v ∈ Var(ϕ i ), ∀k ∈ B ∩C, v ∉ RV k . Dans ce cas, puisques B |= ϕ i , on sait que toutes les variables <strong>de</strong> ϕ i sont contrôlées par <strong>de</strong>sjoueurs dans B\C ; <strong>et</strong> puisque s C−i |= ¬ϕ i , on sait que toutes les variables<strong>de</strong> ϕ i sont contrôlées par <strong>de</strong>s joueurs dans C \B. Comme chaque variableest contrôlée par un <strong>et</strong> un seul joueur, c’est impossible.On sait donc que soit s B∪C |= ϕ i , soit s B∪C−i |= ¬ϕ i . s B∪C est un équilibre <strong>de</strong>Nash <strong>de</strong> G B∪C .Exemple 2.10. Soit G = (N,V ,π,Γ,Φ) un jeu booléen défini par∗ V = {a,b,c}, N = {1,2,3},∗ π 1 = {a}, π 2 = {b}, π 3 = {c},∗ ∀i, γ i = ⊤,∗ ϕ 1 = a ↔ c, ϕ 2 = b ↔ ¬c, <strong>et</strong> ϕ 3 = c.On a RP 1 = {1,3}, RP 2 = {2,3}, RP 3 = {3}. Le graphe <strong>de</strong> dépendance P <strong>de</strong> G est représenté figure2.6.12 3Figure 2.6 — Graphe <strong>de</strong> dépendance <strong>de</strong> l’exemple 2.10L’ensemble <strong>de</strong>s joueurs A = {1,3} <strong>et</strong> B = {2,3} sont stables. On a <strong>de</strong>ux nouveaux jeux booléens :∗ G A = (A,V A ,Γ A ,π A ,Φ A ), avec∗ A = {1,3}, V A = {a,c},∗ π 1 = a, π 3 = c,∗ γ 1 = γ 3 = ⊤,∗ ϕ 1 = a ↔ c <strong>et</strong> ϕ 3 = c.G A a un PNE : {ac} (dénoté par s A = (s A,1 ,s A,3 )).∗ G B = (B,V B ,π B ,Γ B ,Φ B ), avec∗ B = {2,3}, V B = {b,c},Jeux booléens 49


Jeux booléens∗ π 2 = b, π 3 = c,∗ γ 1 = γ 3 = ⊤,∗ ϕ 2 = b ↔ ¬c, ϕ 3 = c.G B a un PNE : {bc} (dénoté par s B = (s B,2 ,s B,3 )).A ∩ B = {3}. Mais nous avons s A,3 = s B,3 = c : G A∪B a un PNE : {abc}.On peut facilement généraliser la propriété 2.11 (page 48), avec p ensembles stables couvrant l’ensemble<strong>de</strong> tous les joueurs :Propriété 2.12. Soit G = (N,V,π,Γ,Φ) un jeu booléen, <strong>et</strong> soit B 1 ...B p p ensembles stables <strong>de</strong>joueurs, tels que B 1 ∪... ∪ B p = N. Soit G B1 ,...,G Bp les p jeux booléens associés.Si ∃s B1 ...s Bp <strong>de</strong>s PNEs <strong>de</strong> G B1 ,...,G Bp tels que ∀i, j ∈ {1,... p}, ∀k ∈ B i ∩ B j , s Bi ,k = s B j ,k, alorss = (s B1 ,...,s Bp ) est un PNE <strong>de</strong> G.Preuve : Soit B 1 <strong>et</strong> B 2 les <strong>de</strong>ux premiers ensembles stables, <strong>et</strong> G B1 <strong>et</strong> G B2 les <strong>de</strong>uxjeux booléens associés. On peut appliquer la propriété 2.11 (page 48), <strong>et</strong> montrerainsi que B 1 ∪ B 2 est un ensemble stable, que G B1 ∪B 2est un jeu booléen, <strong>et</strong> ques B1 ∪B 2est un PNE <strong>de</strong> G B1 ∪B 2.On peut faire <strong>de</strong> même pour B 1 ∪B 2 <strong>et</strong> B 3 , <strong>et</strong> ainsi <strong>de</strong> suite, jusqu’à trouver le résultatvoulu.Comme montré dans l’exemple 2.10 (page précé<strong>de</strong>nte), diviser un jeu booléen perm<strong>et</strong> <strong>de</strong> faciliter lecalcul <strong>de</strong>s équilibres <strong>de</strong> Nash.Si on essaie <strong>de</strong> calculer les équilibres <strong>de</strong> Nash dans le jeu original, nous <strong>de</strong>vons vérifier soit s |= ϕ i ,soit s −i |= ¬ϕ i pour chacun <strong>de</strong>s 8 profils <strong>de</strong> stratégies s, <strong>et</strong> pour chacun <strong>de</strong>s 3 joueurs i. Il faut doncfaire 12 vérifications par joueur (8 pour chaque profil <strong>de</strong> stratégies pour vérifier s |= ϕ i , <strong>et</strong> 4 pourchaque s −i pour vérifier s −i |= ¬ϕ i ), <strong>et</strong> donc 36 pour le jeu dans le pire <strong>de</strong>s cas.Le calcul <strong>de</strong>s équilibres <strong>de</strong> Nash une fois le jeu divisé est beaucoup plus facile : d’après la propriété 2.9(page 46), le calcul du PNE <strong>de</strong> G B nécessite 6 vérifications pour le joueur 1 (4 pour calculer (s 1 ,s 3 ) |=ϕ 1 , <strong>et</strong> 2 pour calculer s 3 |= ¬ϕ 1 ) ; <strong>et</strong> seulement 2 pour le joueur 3 (car R ∗ (3) \ {3} = ∅). On a donc àfaire seulement 8 vérifications dans le pire <strong>de</strong>s cas pour trouver les PNEs <strong>de</strong> G B , <strong>et</strong> il en est <strong>de</strong> mêmepour G C , qui a une configuration équivalente. Comme il faut également vérifier que l’instanciation<strong>de</strong>s variables du joueur 3 sont les mêmes pour les 2 jeux, il faut faire 17 vérifications pour calculerles PNEs du jeu G.2.4.2 Stratégies dominéesComme nous l’avons vu dans le chapitre 1, section 1.3.2 (page 21), il arrive parfois que le calcul<strong>de</strong>s équilibres <strong>de</strong> Nash donne <strong>de</strong>s résultats mal adaptés. Nous allons donc étudier ici le principe <strong>de</strong>dominance. Dans le cadre <strong>de</strong>s jeux booléens, la définition <strong>de</strong>s stratégies dominées est la même quedans la littérature (Définitions 1.8 <strong>et</strong> 1.9 (page 22)).50 Elise Bonzon


2.4. Concepts <strong>de</strong> solution : équilibres <strong>de</strong> Nash <strong>et</strong> stratégies dominéesL’idée principale <strong>de</strong> ce concept est que les stratégies dominées ne sont pas utiles <strong>et</strong> peuvent êtreéliminées itérativement, jusqu’à ce qu’un point fixe soit atteint. Ce processus repose sur l’hypothèseque chaque joueur se comporte <strong>de</strong> manière rationnelle <strong>et</strong> sait que les autres joueurs sont rationnels.Comme nous l’avons vu dans la section 1.3.2 (page 21), une stratégie strictement dominée ne peutjamais être présente dans un équilibre <strong>de</strong> Nash, tandis qu’une stratégie faiblement dominée peut apparaitredans un équilibre <strong>de</strong> Nash. Ce résultat reste valable dans le cas simple <strong>de</strong>s jeux booléens.Propriété 2.13.∗ Une stratégie strictement dominée n’est présente dans aucun équilibre <strong>de</strong> Nash.∗ Une stratégie faiblement dominée peut être présente dans un équilibre <strong>de</strong> Nash.Preuve :∗ Montrons qu’une stratégie strictement dominée n’est présente dans aucunéquilibre <strong>de</strong> Nash. Soit s i une stratégie du joueur i strictement dominée. Alors∃s ′ i ∈ S i telle que ∀s −i ∈ S −i ,u i (s i ,s −i ) < u i (s ′ i,s −i )Donc, pour tout profil <strong>de</strong> stratégies s = {s 1 ,...,s i ,...,s n }, on aura : u i (s) u i (s ′ i,s −i )ce qui est en contradiction avec l’hypothèse précé<strong>de</strong>nte. s i ne peut donc pasappartenir à un équilibre <strong>de</strong> Nash.∗ Montrons à présent sur un contre-exemple qu’une stratégie faiblement dominéepeut être présente dans un équilibre <strong>de</strong> Nash. Pour cela, étudions le jeubooléen G = (N,V,π,Γ,Φ) avec V = {a,b}, N = {1,2}, pour tout i, γ i = ⊤,π 1 = {a}, π 2 = {b} <strong>et</strong> ϕ 1 = ϕ 2 = a ∧ ¬b.Ce jeu a <strong>de</strong>ux équilibres <strong>de</strong> Nash : les profils <strong>de</strong> stratégies ab <strong>et</strong> ab. Or, lastratégie ¬a, présente dans l’équilibre <strong>de</strong> Nash ab, est faiblement dominée parla stratégie a.La propriété suivante est également issue <strong>de</strong> la théorie classique <strong>de</strong>s jeux.Propriété 2.14.∗ L’ordre d’élimination <strong>de</strong>s stratégies strictement dominées n’affecte pas le résultat final.∗ L’ordre d’élimination <strong>de</strong>s stratégies faiblement dominées peut affecter le résultat final.Le premier point <strong>de</strong> c<strong>et</strong>te propriété, sur la dominance stricte, est évi<strong>de</strong>mment applicable dans le cassimple <strong>de</strong>s jeux booléens [Hillas <strong>et</strong> Kohlberg, 2002].On aurait pu croire que l’ordre d’élimination <strong>de</strong>s stratégies faiblement dominées dans le cas simple<strong>de</strong>s jeux booléens n’affecte pas le résultat final, mais il n’en n’est rien. Nous en donnons ici un contreexemple.Jeux booléens 51


Jeux booléensExemple 2.11. Soit G = (N,V,π,Γ,Φ) un jeu booléen avec∗ V = {a,b}, N = {1,2},∗ pour tout i, γ i = ⊤,∗ π 1 = {a}, π 2 = {b},∗ ϕ 1 = a ∧ b <strong>et</strong>∗ ϕ 2 = a ∧ ¬bOn peut à présent construire la forme normale <strong>de</strong> G :❍ ❍❍❍❍❍ 21bbEtudions les stratégies dominées <strong>de</strong> ce jeu :a (0, 0) (0, 0)a (0, 1) (1, 0)∗ Pour le joueur 1, la stratégie a domine faiblement la stratégie a.∗ Pour le joueur 2, la stratégie b domine faiblement la stratégie b.Eliminons dans un premier temps la stratégie dominée du joueur 1. On élimine donc a. Après c<strong>et</strong>teélimination, la stratégie b du joueur 2 domine faiblement la stratégie b. On obtient donc une seulestratégie résultat : ab.Eliminons à présent la stratégie dominée du joueur 2 en premier. On élimine donc la stratégie b.Après c<strong>et</strong>te élimination, le joueur 1 n’a plus <strong>de</strong> stratégie dominée. On obtient donc <strong>de</strong>ux stratégiesrésultat : ab <strong>et</strong> ab.On voit ici que nous n’avons pas obtenu le même résultat suivant l’ordre d’élimination <strong>de</strong>s stratégiesfaiblement dominées.Reprenons l’exemple 2.6 (page 41) pour calculer l’élimination <strong>de</strong>s stratégies dominées après avoircalculé les équilibres <strong>de</strong> Nash.Exemple 2.6 – suite Etudions les stratégies dominées <strong>de</strong> ce jeu :∗ Pour le joueur 1, la stratégie a domine faiblement la stratégie a. Eliminons c<strong>et</strong>te stratégie.∗ Une fois c<strong>et</strong>te stratégie éliminée, la stratégie c du joueur 3 domine faiblement sa stratégie c. Onélimine donc c<strong>et</strong>te <strong>de</strong>rnière.∗ Enfin, pour le joueur 2, la stratégie b domine faiblement la stratégie b. On élimine égalementc<strong>et</strong>te stratégie.On obtient ainsi un seul profil <strong>de</strong> stratégies résultat, abc qui perm<strong>et</strong> aux joueurs 1 <strong>et</strong> 2 <strong>de</strong> gagner.Nous avons vu que l’ordre d’élimination <strong>de</strong>s stratégies faiblement dominées a un impact sur le résultat.On est donc en droit <strong>de</strong> se <strong>de</strong>man<strong>de</strong>r si on aurait pu trouver un autre résultat en éliminant lesstratégies <strong>de</strong>s joueurs dans un ordre différent.Ici, c’est le seul ordre d’élimination possible. En eff<strong>et</strong>, le joueur 1 est le seul joueur qui a une stratégiedominante avant élimination d’autres stratégies. Et, une fois la stratégie dominée du joueur 1éliminée, le joueur 3 est également le seul à avoir une stratégie dominante.Une secon<strong>de</strong> propriété se dégage immédiatement :52 Elise Bonzon


2.4. Concepts <strong>de</strong> solution : équilibres <strong>de</strong> Nash <strong>et</strong> stratégies dominéesPropriété 2.15. Dans un jeu booléen, si la stratégie s i du joueur i domine strictement une autrestratégie s ′ i , alors s i est une stratégie gagnante pour ce joueur.Preuve : s i domine strictement s ′ i . Donc,∀s −i ∈ S −i ,u i (s i ,s −i ) > u i (s ′ i ,s −i)⇔ ∀s −i ∈ S −i ,u i (s i ,s −i ) = 1 <strong>et</strong> u i (s ′ i ,s −i) = 0⇒ ∀s −i ∈ S −i ,(s i ,s −i ) |= ϕ i⇒ s i est une stratégie gagnante pour le joueur i.L’utilisation <strong>de</strong> la notion <strong>de</strong> projection (voir le chapitre Notations (page 7)) nous perm<strong>et</strong> ici aussi <strong>de</strong>donner une caractérisation logique <strong>de</strong>s stratégies strictement dominées.Propriété 2.16. Soit G un jeu booléen. La stratégie s i du joueur i domine strictement la stratégie s ′ isi <strong>et</strong> seulement si :s i |= (∀ − i:ϕ i ) <strong>et</strong> s ′ i |= (∀ − i:¬ϕ i )Preuve : Supposons que la stratégie s i du joueur i domine strictement s ′ i .∀s −i ∈ S −i ,u i (s i ,s −i ) > u i (s ′ i ,s −i)⇔ ∀s −i ∈ S −i ,u i (s i ,s −i ) = 1 <strong>et</strong> u i (s ′ i ,s −i) = 0⇔ ∀s −i ∈ S −i ,(s i ,s −i ) |= ϕ i <strong>et</strong> (s ′ i ,s −i) |= ¬ϕ i⇔ s i |= (∀ − i:ϕ i ) <strong>et</strong> s ′ i |= (∀ − i:¬ϕ i)Etudions c<strong>et</strong>te caractérisation sur un exemple.Exemple 2.12. Soit G = (N,V ,π,Γ,Φ) un jeu booléen. On donne∗ V = {a,b,c}, N = {1,2},∗ pour tout i, γ i = ⊤,∗ π 1 = {a,b}, π 2 = {c},∗ ϕ 1 = (¬a ∧ ¬b ∧ c) ∨(a ∧ b), <strong>et</strong>∗ ϕ 2 = (a ∧ c) ∨(¬b ∧ ¬c)On peut à présent construire la forme normale <strong>de</strong> G :❍ ❍❍❍❍❍ 21ab (0, 1) (1, 0)ab (0, 1) (0, 1)ab (0, 0) (0, 0)ab (1, 0) (1, 1)ccJeux booléens 53


Jeux booléensEtudions les stratégies dominées du joueur 1 en utilisant les caractérisations <strong>de</strong> la propriété 2.16.Pour cela, commençons par calculer les formules qui nous seront utiles.∗ ϕ 1 = (¬a ∧ ¬b ∧ c) ∨(a ∧ b)∗ ¬ϕ 1 = (a ∨ b ∨ ¬c) ∧(¬a ∨ ¬b)∗ ∀ − 1:ϕ 1 = a ∧ b = ϕ ′ 1∗ ∀ − 1:¬ϕ 1 = (a ∨ b) ∧(¬a ∨ ¬b) = ϕ ′′1Nous <strong>de</strong>vons ensuite étudier chaque stratégie du joueur 1 pour voir si elle perm<strong>et</strong> d’inférer ϕ ′ 1∗ ab ̸|= ϕ ′ 1 <strong>et</strong> ab ̸|= ϕ′′ 1∗ ab ̸|= ϕ ′ 1 <strong>et</strong> ab |= ϕ′′ 1∗ ab ̸|= ϕ ′ 1 <strong>et</strong> ab |= ϕ′′ 1∗ ab |= ϕ ′ 1 <strong>et</strong> ab ̸|= ϕ′′ 1On peut à présent calculer les stratégies strictement dominées <strong>de</strong> 1.ab domine strictement ab <strong>et</strong> ab. En eff<strong>et</strong>, on a bien :∗ pour ab : ab |= ϕ ′ 1∗ pour ab : ab |= ϕ ′ 1<strong>et</strong> ab |= ϕ′′ 1<strong>et</strong> ab |= ϕ′′ 1ou ϕ′′ 1 .Essayons à présent <strong>de</strong> caractériser les stratégies faiblement dominées. C<strong>et</strong>te fois ce n’est pas la notion<strong>de</strong> projection qui est utilisée mais celle d’interprétation partielle.Propriété 2.17. Soit G un jeu booléen. La stratégie s i du joueur i domine faiblement la stratégie s ′ i si<strong>et</strong> seulement si :(ϕ i ) s ′i|= (ϕ i ) si <strong>et</strong> (ϕ i ) si ̸|= (ϕ i ) s ′i(ϕ i ) s ′i|= (ϕ i ) si signifie que ∀s −i , si l’instanciation partielle <strong>de</strong> ϕ i par s ′ i est satisfaite, alors il en est <strong>de</strong>même pour celle <strong>de</strong> ϕ i par s i . Donc, si ∀s −i , (s ′ i ,s −i) perm<strong>et</strong> <strong>de</strong> satisfaire ϕ i , alors (s i ,s −i ) également.(ϕ i ) si ̸|= (ϕ i ) s ′isignifie que ∃s −i tel que (s i ,s −i ) satisfait ϕ i , tandis (s ′ i ,s −i) non.Preuve : La stratégie s i du joueur i domine faiblement s ′ i si <strong>et</strong> seulement si :∀s −i ∈ S −i ,u i (s i ,s −i ) ≥ u i (s ′ i ,s −i) (2.6)<strong>et</strong> ∃s−i ∈ S −i ,u i (s i ,s −i ) > u i (s ′ i ,s −i) (2.7)L’équation 2.6 nous perm<strong>et</strong> d’obtenir les équivalences suivantes :2.6 ⇔ ∀s −i ∈ S −i ,(u i (s i ,s −i ) = 1 ou u i (s ′ i ,s −i) = 0)⇔ ∀s −i ∈ S −i ,(s i ,s −i ) |= ϕ i ou (s ′ i ,s −i) |= ¬ϕ i⇔ ∀s−i ∈ S −i , si (s ′ i ,s −i) |= ϕ i alors (s i ,s −i ) |= ϕ i⇔ ∀s−i ∈ S −i , si s −i |= (ϕ i ) s ′ialors s −i |= (ϕ i ) si⇔ (ϕ i ) s ′i|= (ϕ i ) siEnsuite, il est possible <strong>de</strong> remarquer que l’on a : (2.7) ⇔ ¬(2.6) si l’on intervertit s i<strong>et</strong> s ′ i . Donc : 2.7 ⇔ (ϕ i ) si ̸|= (ϕ i ) s ′i54 Elise Bonzon


2.5. Cas particulier : Jeux à <strong>de</strong>ux joueurs <strong>et</strong> à somme nulle2.5 Cas particulier : Jeux à <strong>de</strong>ux joueurs <strong>et</strong> à somme nulleDans c<strong>et</strong>te section, on montre que les jeux booléens étudiés dans [Harrenstein <strong>et</strong> al., 2001;Harrenstein, 2004a] qui nous ont inspirés au départ, sont un cas particulier <strong>de</strong>s jeux booléens à njoueurs présentés dans la section 2.2 (page 33). Les définitions sont les mêmes, mis à part la notion<strong>de</strong> coalition qui n’a aucun sens ici.Certains paramètres sont simplifiés. En eff<strong>et</strong>, comme chaque variable <strong>de</strong> décision <strong>de</strong> V ne peut êtrecontrôlée que par un seul <strong>de</strong>s <strong>de</strong>ux joueurs, on a π 2 = V \ π 1 . D’autre part, on a ϕ 2 ≡ ¬ϕ 1 <strong>et</strong> γ 1 =γ 2 = ⊤.Etudions à présent un exemple simple.Exemple 2.13. Soit V = {a,b,c,d}, N = {1,2}, π 1 = {a,c} <strong>et</strong> ϕ 1 = (a ∧ ¬b) ∨(b ∧ d).Le jeu booléen G = (N,V,π 1 ,Γ,Φ) est totalement défini.En eff<strong>et</strong>, on sait que π 2 = V \ π 1 , que ϕ 2 = ¬ϕ 1 = (¬a ∨ b) ∧(¬b ∨ ¬d), <strong>et</strong> que γ 1 = γ 2 = ⊤.On peut à présent construire la forme normale <strong>de</strong> G 12 :❍ ❍❍❍❍❍ 21bd bd bd bdac 0 0 0 1ac 1 0 1 1ac 0 0 0 1ac 1 0 1 1On constate ici que le joueur 2, qui contrôle les variables b <strong>et</strong> d, a une stratégie gagnante. En eff<strong>et</strong>,s’il choisit <strong>de</strong> m<strong>et</strong>tre b à vrai <strong>et</strong> d à faux, il est sûr <strong>de</strong> gagner quels que soient les choix <strong>de</strong> 1.La propriété suivante donne une caractérisation simple <strong>de</strong>s équilibres <strong>de</strong> Nash en stratégies pures dansles jeux booléens à <strong>de</strong>ux joueurs <strong>et</strong> à somme nulle qui est obtenue par une simple transposition <strong>de</strong>résultats issus <strong>de</strong> la théorie <strong>de</strong>s jeux à somme nulle.Propriété 2.18. Si G est un jeu booléen à <strong>de</strong>ux joueurs <strong>et</strong> à somme nulle, s = (s 1 ,s 2 ) est un équilibre<strong>de</strong> Nash en stratégies pures si <strong>et</strong> seulement si s 1 est une stratégie gagnante pour le joueur 1, ou s 2 estune stratégie gagnante pour le joueur 2.Preuve :1. Soit s = (s 1 ,s 2 ) un équilibre <strong>de</strong> Nash en stratégies pures.∗ Supposons que l’on a u 1 (s) = 1. Le jeu étant à somme nulle, on au 2 (s) = 0. Comme s est un équilibre <strong>de</strong> Nash, ∀s ′ 2 ,u 2(s) ≥ u 2 (s 1 ,s ′ 2 )ce qui entraîne ∀s ′ 2 ,u 2(s 1 ,s ′ 2 ) = 0. Donc, ∀s′ 2 ,(s 1,s ′ 2 ) |= ¬ϕ 2, ce qui impliqueque ∀s ′ 2 ,(s 1,s ′ 2 ) |= ϕ 1. s 1 est donc une stratégie gagnante pour lejoueur 1.12 1 signifie que 1 gagne <strong>et</strong> 2 perd, <strong>et</strong> vice-versa pour 0Jeux booléens 55


Jeux booléens∗ On a u 1 (s) = 0 <strong>et</strong> u 2 (s) = 1. En faisant le même raisonnement que précé<strong>de</strong>mment,on montre que s 2 est donc une stratégie gagnante pour lejoueur 2.2. Supposons que s 1 est une stratégie gagnante pour le joueur 1. On a donc :∀s 2 ,u 1 (s 1 ,s 2 ) = 1 <strong>et</strong> ∀s 2 ,u 2 (s 1 ,s 2 ) = 0. Posons s = (s 1 ,s 2 ). On a bien∀s ′ 1 ,u 1(s) ≥ u 1 (s ′ 1 ,s 2) <strong>et</strong> ∀s ′ 2 ,u 2(s) ≥ u 2 (s 1 ,s ′ 2 ). s est donc bien un équilibre<strong>de</strong> Nash.On raisonne <strong>de</strong> la même façon si l’on suppose que s 2 est une stratégie gagnantepour le joueur 2.Par conséquent, dans un jeu booléen à <strong>de</strong>ux joueurs <strong>et</strong> à somme nulle, il existe un équilibre <strong>de</strong> Nashen stratégies pures si <strong>et</strong> seulement si l’un <strong>de</strong>s <strong>de</strong>ux joueurs a une stratégie gagnante.La propriété 2.18 (page précé<strong>de</strong>nte) perm<strong>et</strong> <strong>de</strong> déterminer facilement la complexité algorithmique duproblème d’existence d’un équilibre <strong>de</strong> Nash en stratégies pures. On rappelle que Σ p 2 = NPNP est laclasse <strong>de</strong>s langages reconnaissables en temps polynomial par une machine <strong>de</strong> Turing non-déterministemunie d’oracles NP (voir [Papadimitriou, 1994a]). Les résultats <strong>de</strong> complexité suivants ont été trouvésavec l’ai<strong>de</strong> <strong>de</strong> Bruno Zanuttini.Propriété 2.19. Le problème <strong>de</strong> l’existence d’un équilibre <strong>de</strong> Nash en stratégies pures dans un jeubooléen à <strong>de</strong>ux joueurs <strong>et</strong> à somme nulle est Σ p 2 -compl<strong>et</strong>.Preuve : L’appartenance à Σ p 2est immédiate. La difficulté est obtenue par la réductiondu problème consistant à déci<strong>de</strong>r la validité <strong>de</strong> QBF 2,∃ . Etant donné une formuleQ = ∃A,∀BΦ, où A <strong>et</strong> B sont <strong>de</strong>s ensembles disjoints <strong>de</strong> variables <strong>et</strong> Φ est une formulepropositionnelle <strong>de</strong> L A∪B , on définit le jeu booléen à 2 joueurs <strong>et</strong> à somme nullesuivant : ϕ 1 = Φ ∨ (x ↔ y), où x,y sont <strong>de</strong>s nouvelles variables (i.e. x,y /∈ A ∪ B),ϕ 2 = ¬ϕ 1 , π 1 = A ∪ {x}, π 2 = B ∪ {y} <strong>et</strong> γ 1 = γ 2 = ⊤. Ce jeu peut être évi<strong>de</strong>mmentconstruit en temps polynomial étant donné Q. D’après la propriété 2.18 (page précé<strong>de</strong>nte),ce jeu a un équilibre <strong>de</strong> Nash si <strong>et</strong> seulement si un <strong>de</strong>s joueurs 1 ou 2 aune stratégie gagnante.Supposons que Q est vali<strong>de</strong>. Soit M A ∈ 2 A un modèle <strong>de</strong> Q. Alors, (M A ,x) <strong>et</strong> (M A ,x)sont <strong>de</strong>s stratégies gagnantes pour 1.Supposons maintenant que Q n’est pas vali<strong>de</strong> ; alors quel que soit M A ∈ 2 A que 1choisit <strong>de</strong> jouer, 2 peut jouer M B ∈ 2 B tel que (M A ,M B ) ̸|= Φ. De plus, si 1 joue x(resp. x), alors 2 peut jouer y (resp. y), avec dans les <strong>de</strong>ux cas la victoire <strong>de</strong> 2. D’autrepart, 2 n’a pas non plus <strong>de</strong> stratégie gagnante puisque 1 peut toujours rendre x ↔ yvrai, <strong>et</strong> donc gagner.Il existe donc une stratégie gagnante pour 1 (ou 2, au choix) si <strong>et</strong> seulement si Q estvali<strong>de</strong>.On en tire le corollaire suivant, concernant c<strong>et</strong>te fois les jeux booléens à n joueurs.56 Elise Bonzon


2.5. Cas particulier : Jeux à <strong>de</strong>ux joueurs <strong>et</strong> à somme nulleCorollaire 2.3. Le problème <strong>de</strong> l’existence d’un équilibre <strong>de</strong> Nash en stratégies pures dans un jeubooléen à n joueurs est Σ p 2 -compl<strong>et</strong>.Preuve : L’appartenance à Σ p 2est immédiate ; la difficulté est obtenue, dès que n = 2<strong>et</strong> que le jeu est à somme nulle par le théorème 2.19 (page précé<strong>de</strong>nte).Ce résultat est à rapprocher <strong>de</strong> la complexité <strong>de</strong> la contrôlabilité – également un problème Σ p 2 -compl<strong>et</strong>[Lang <strong>et</strong> Marquis, 1998b]. Or, le problème <strong>de</strong> l’existence d’un équilibre <strong>de</strong> Nash dans un jeu à plusieursjoueurs <strong>et</strong> à somme non nulle étant bien plus général que la contrôlabilité, le fait qu’il ne soitpas situé plus haut dans la hiérarchie <strong>de</strong>s classes <strong>de</strong> complexité est plutôt une bonne nouvelle.On peut expliquer intuitivement le fait que le problème <strong>de</strong> l’existence d’un équilibre <strong>de</strong> Nash soitau second niveau <strong>de</strong> la hiérarchie polynomiale par le fait que la résolution <strong>de</strong> ce problème comporte<strong>de</strong>ux sources indépendantes <strong>de</strong> complexité NP-difficiles : la recherche du “bon” profil <strong>de</strong> stratégies,<strong>et</strong> la vérification qu’il constitue un équilibre <strong>de</strong> Nash en stratégies pures. Par comparaison, l’existenced’un profil <strong>de</strong> stratégies dont l’utilité cumulée est supérieure à une borne donnée est seulement unproblème NP-compl<strong>et</strong>.Nous allons à présent essayer <strong>de</strong> simplifier le problème en étudiant les restrictions syntaxiques sur lesformules représentant les buts <strong>de</strong>s joueurs. Nous nous intéressons particulièrement aux formules enforme normale disjonctive (DNF). Rappelons que toute formule booléenne peut être mise en DNF, <strong>et</strong>que c’est donc une restriction syntaxique <strong>et</strong> non sémantique.Tant que l’on considère <strong>de</strong>s jeux à 2 joueurs <strong>et</strong> à somme nulle, <strong>et</strong> sachant que déci<strong>de</strong>r la validité<strong>de</strong> ∃A,∀B,Φ, une formule QBF 2,∃ , est Σ P 2 -compl<strong>et</strong> même si Φ est en DNF, la propriété 2.19 (pageci-contre) reste correcte même si le but du joueur 1 est en DNF (le but du joueur 2 étant implicite).Toutefois, lorsque nous représentons explicitement les buts <strong>de</strong> chaque joueur en DNF, la complexitédu problème <strong>de</strong>scend en NP, comme le montre la propriété suivante :Propriété 2.20. Soit G un jeu booléen. Si ∀i ∈ N, ϕ i est en DNF, alors le problème <strong>de</strong> l’existence d’unéquilibre <strong>de</strong> Nash en stratégie pure est NP-compl<strong>et</strong>.Preuve :Si ϕ i est en DNF, alors ∃i:ϕ i peut être calculé en temps linéaire [Lang <strong>et</strong> al., 2003,Propositions 17–18]. Alors, si chaque ϕ i est en DNF, la formule ψ ≡ V i(ϕ i ∨(¬∃i:ϕ i )) peut être calculée en temps linéaire. Comme la propriété 2.4 (page 42) perm<strong>et</strong><strong>de</strong> trouver un profil <strong>de</strong> stratégies s <strong>et</strong> <strong>de</strong> vérifier que s |= ψ, le problème est en NP.La difficulté est obtenue par la réduction du complément du problème consistant àdéci<strong>de</strong>r si une DNF Φ = W ki=1 T i est une tautologie, ce qui est un problème coNPcompl<strong>et</strong>bien connu. Soit X l’ensemble <strong>de</strong>s variables <strong>de</strong> Φ <strong>et</strong> soit x,y /∈ X. On définitun jeu G à <strong>de</strong>ux joueurs par :∗ ϕ 1 = W ki=1 (T i ∧ x ∧ ¬y) ∨(T i ∧ ¬x ∧ y),∗ ϕ 2 = (x ∧ y) ∨(¬x ∧ ¬y),∗ π 1 = {y},∗ π 2 = X ∪ {x}.Jeux booléens 57


Jeux booléensG peut être construit en temps linéaire <strong>et</strong> ϕ 1 ,ϕ 2 sont en DNF.On a ϕ 1 ≡ Φ ∧(x ̸= y) <strong>et</strong> ϕ 2 ≡ (x = y). Grâce à la propriété 2.4 (page 42) <strong>et</strong> à soncorollaire 2.1 (page 43), nous savons que G a un équilibre <strong>de</strong> Nash si <strong>et</strong> seulementsi ((Φ ∧(x ̸= y)) ∨ ¬Φ) ∧(x = y) est satisfiable.En eff<strong>et</strong>, comme y n’apparaît pas dans Φ, nous avons¬∃y:(Φ ∧ x ̸= y) ≡ ¬(Φ ∧ ∃y:x̸= y) ≡ ¬(Φ ∧ ⊤) ≡ ¬Φ<strong>et</strong> nous avons aussi¬∃X ∪ {x}:(x = y) ≡⊥Comme Φ ∧(x ̸= y) ∧(x = y) n’est pas satisfiable, le jeu G a un équilibre <strong>de</strong> Nashsi <strong>et</strong> seulement si ¬Φ ∧(x = y) est satisfiable, c’est-à-dire si <strong>et</strong> seulement si ¬Φ estsatisfiable, étant donné que x <strong>et</strong> y n’apparaissent pas dans Φ.Donc, G a un équilibre <strong>de</strong> Nash si <strong>et</strong> seulement si Φ n’est pas une tautologie.Lorsqu’on considère uniquement <strong>de</strong>s jeux à <strong>de</strong>ux joueurs, la complexité <strong>de</strong> ce problème peut <strong>de</strong>scendreà P pour quelques classes non triviales <strong>de</strong> formules : si les buts <strong>de</strong>s joueurs sont représentéspar <strong>de</strong>s formules en DNF renommables en Horn, affines, 2CNF ou CNF monotones.On ne développe pas ces démonstrations ici, car la résolution <strong>de</strong> la projection en est le résultat principal,<strong>et</strong> que les détails sont en gran<strong>de</strong> partie les mêmes que dans [Zanuttini, 2003, Section 6].Nous pouvons également déterminer la complexité algorithmique du problème <strong>de</strong> la dominance faibledans un jeu booléen.Propriété 2.21. Déci<strong>de</strong>r si une stratégie s ′ i donnée est faiblement dominée est Σp 2-compl<strong>et</strong>. La difficultéreste valable même si ϕ i est restreint aux DNF.Preuve : L’appartenance à Σ p 2est immédiate. La difficulté est obtenue c<strong>et</strong>te foisencore par la réduction du problème consistant à déci<strong>de</strong>r la validité <strong>de</strong> QBF 2,∃ .Soit Q = ∃A∀BΦ, <strong>et</strong> a,b <strong>de</strong>ux nouvelles variables. On définit :∗ ϕ 1 = (a ∧ Φ) ∨(¬a ∧ b), π 1 = A ∪ {a},∗ π 2 = B ∪ {b} (ϕ 2 est quelconque <strong>et</strong> n’est pas définie ici car sa valeur n’intervientpas dans la démonstration).Soit M A ′ une A-interprétation, <strong>et</strong> soit s′ 1 = (M′ A ,a). On a (ϕ 1) s ′1≡ (b).Supposons que Q est vali<strong>de</strong>, avec M A ∈ 2 A un modèle <strong>de</strong> A, <strong>et</strong> s 1 = (M A ,a). s 1 estalors une stratégie gagnante pour 1, contrairement à s ′ 1 . Donc s 1 domine faiblements ′ 1 .Supposons à présent que Q n’est pas vali<strong>de</strong>. Soit M A ∈ 2 A , <strong>et</strong> s 1 = (M A ,a). Alors,(ϕ 1 ) s1 ≡ (b) ≡ (ϕ 1 ) s ′1, donc, d’après la propriété 2.17 (page 54), s 1 ne domine pasfaiblement s ′ 1 .À présent, soit s 1 = (M A ,a). Comme Q n’est pas vali<strong>de</strong>, il existe M B ∈ 2 B tel que(M A ,M B ) ̸|= Φ. Donc (M B ,b) |= (ϕ 1 ) s ′1mais (M B ,b) ̸|= (ϕ 1 ) s1 , <strong>et</strong> d’après la propriété2.17 (page 54), s 1 ne domine pas faiblement s ′ 1 .58 Elise Bonzon


2.5. Cas particulier : Jeux à <strong>de</strong>ux joueurs <strong>et</strong> à somme nulleDonc, s ′ 1 est faiblement dominée si <strong>et</strong> seulement si Q est vali<strong>de</strong>.On peut remarquer que si Φ est en DNF, alors ∃A,∀B,Φ est toujours Σ p 2-compl<strong>et</strong> <strong>et</strong>que ϕ 1 peut être transformée en DNF efficacement.Le problème <strong>de</strong> l’existence d’un équilibre <strong>de</strong> Nash, <strong>et</strong> son calcul, dans un jeu donné est unequestion importante, qui a attiré un grand nombre <strong>de</strong> chercheurs (par exemple [Deng <strong>et</strong> al., 2002;McKelvey <strong>et</strong> McLennan, 1996; Koller <strong>et</strong> al., 1996]). La plupart <strong>de</strong> ces travaux ont consisté à étudier<strong>de</strong>s problèmes concernant les équilibres <strong>de</strong> Nash en stratégies mixtes. Dans ce contexte, l’existenced’un tel équilibre est toujours garantie, mais le problème <strong>de</strong> savoir s’il est possible <strong>de</strong> le calculer entemps polynomial est toujours ouvert [Papadimitriou, 2001].Les premiers résultats <strong>de</strong> complexité ont été donnés par [Gilboa <strong>et</strong> Zemel, 1989], qui ont notammentmontré que le problème consistant à trouver plus d’un équilibre <strong>de</strong> Nash en stratégiesmixtes dans un jeu en forme normale est NP-difficile, ou encore que prouver l’existence d’unéquilibre <strong>de</strong> Nash en stratégies mixtes satisfiant certaines propriétés dans un jeu à <strong>de</strong>ux joueursen forme normale est NP-difficile. Une réduction plus simple pour ce problème a été trouvéedans [Conitzer <strong>et</strong> Sandholm, 2003]. Des extensions <strong>de</strong> ces résultats à <strong>de</strong>s jeux plus généraux ontété trouvés par [Meggido <strong>et</strong> Papadimitriou, 1991], <strong>et</strong> par [Papadimitriou, 1994b].D’autres travaux étudient <strong>de</strong>s problèmes plus proches <strong>de</strong>s nôtres, à savoir l’existence d’un équilibre<strong>de</strong> Nash en stratégies pures. Par exemple, les jeux étudiés dans [Gottlob <strong>et</strong> al., 2005] sont <strong>de</strong>s jeuxstratégiques sur lesquels il est imposé <strong>de</strong>s limitations quantitatives <strong>et</strong>/ou qualitatives sur l’influenced’un agent sur les décisions <strong>de</strong>s autres agents : par exemple, restreindre le nombre <strong>de</strong> joueurs ayant uneinfluence sur un joueur donné à k (ce qui correspondrait dans nos jeux booléens à RP i ≤ k) ; ou encoredéfinir un graphe <strong>de</strong> dépendance, <strong>et</strong> étudier le cas particulier où il est acyclique. Nous étudierons pluslonguement ces cas particuliers, <strong>et</strong> nous les comparerons avec les nôtres dans le chapitre 4 (page 121).Dans ce contexte, le problème consistant à déci<strong>de</strong>r s’il existe un équilibre <strong>de</strong> Nash en stratégies puresest NP-compl<strong>et</strong> pour chacune <strong>de</strong>s <strong>de</strong>ux restrictions décrites plus haut.Le problème <strong>de</strong> l’existence d’un équilibre <strong>de</strong> Nash en stratégies pures pour plusieurs classes plus spécifiques<strong>de</strong> jeux a également été étudié. Par exemple, trouver un équilibre <strong>de</strong> Nash en stratégies pures aété montré polynomial pour quatre notions <strong>de</strong> jeux symétriques ayant un nombre constant d’actions,mais non-polynomial si le nombre d’actions est linéaire dans le nombre <strong>de</strong> joueurs [Brandt <strong>et</strong> al.,2007] (voir chapitre 4 (page 121)).D’autre part, les jeux graphiques d’actions (action graph games, AGGs, voir chapitre 4 (page 121))sont <strong>de</strong>s jeux totalement expressifs (tout jeu peut être représenté par un AGG) représentés par <strong>de</strong>sgraphes dont les nœuds correspon<strong>de</strong>nt à <strong>de</strong>s actions, <strong>et</strong> les arcs aux dépendances entre les utilités<strong>de</strong>s agents effectuant ces actions [Bhat <strong>et</strong> Leyton-Brown, 2004; Jiang <strong>et</strong> Leyton-Brown, 2006]. Si leproblème consistant à déci<strong>de</strong>r s’il existe un équilibre <strong>de</strong> Nash en stratégies pures dans un AGG estNP-compl<strong>et</strong> [Jiang <strong>et</strong> Leyton-Brown, 2006], il existe <strong>de</strong>s classes <strong>de</strong> jeu pour lesquels ce problème estpolynomial [Jiang <strong>et</strong> Leyton-Brown, 2007]. C’est le cas pour les AGGs ayant un nombre d’actions,<strong>et</strong> donc <strong>de</strong> nœuds, limité à k.Les jeux <strong>de</strong> congestion (congestion games, voir chapitre 4 (page 121)) [Rosenthal, 1973], sont<strong>de</strong>s jeux dans lesquels les actions disponibles consistent en un ensemble <strong>de</strong> ressources, <strong>et</strong> l’uti-Jeux booléens 59


Jeux booléenslité <strong>de</strong> chaque joueur dépend du nombre <strong>de</strong> joueurs ayant sélectionné les mêmes ressources(c’est-à-dire ayant joué la même action). Les jeux <strong>de</strong> congestion ont toujours un équilibre <strong>de</strong> Nash enstratégies pures [Rosenthal, 1973], <strong>et</strong> il est montré dans [Fabrikant <strong>et</strong> al., 2004] qu’un PNE peut êtrecalculé en temps polynomial dans le cas où le réseau <strong>de</strong> ce jeu (c’est-à-dire le graphe dont les nœudssont les actions possibles, <strong>et</strong> les arcs les ressources) est symétrique.2.6 Jeux booléens <strong>et</strong> duopole <strong>de</strong> StackelbergVon Stackelberg a imaginé en 1934 une situation à <strong>de</strong>ux joueurs dans laquelle un <strong>de</strong>s <strong>de</strong>ux joueurs aune idée précise du comportement <strong>de</strong> son concurrent : il connaît parfaitement sa fonction <strong>de</strong> réaction<strong>et</strong> il l’intègre dans son processus <strong>de</strong> décision. On appelle alors ce joueur le lea<strong>de</strong>r ou le meneur.Suite à sa décision, son concurrent réagit en maximisant son profit <strong>et</strong> donc en suivant sa fonction<strong>de</strong> réaction ; il se contente <strong>de</strong> “suivre” le comportement du lea<strong>de</strong>r <strong>et</strong> pour c<strong>et</strong>te raison, on l’appellele suiveur (follower). Dans ce cas, le suiveur considère que ses décisions n’ont aucun impact sur lecomportement du meneur (voir par exemple [Osborne <strong>et</strong> Rubinstein, 1994]).Une idée est alors d’étudier la dynamicité dans les jeux booléens à <strong>de</strong>ux joueurs en suivant ce principe<strong>de</strong> “meneur-suiveur”. C<strong>et</strong>te ébauche <strong>de</strong> travail a été effectuée au laboratoire ILLC à Amsterdam avecUlle Endriss.Dans c<strong>et</strong>te section, nous allons procé<strong>de</strong>r par étapes : nous allons commencer par étudier les jeux <strong>de</strong>type Stackelberg à <strong>de</strong>ux joueurs <strong>et</strong> une variable par joueur, puis nous chercherons empiriquement lespropriétés que doivent respecter les stratégies du meneur <strong>et</strong> du receveur pour être optimales. Nousgénéraliserons ensuite ces résultats à <strong>de</strong>s jeux à <strong>de</strong>ux joueurs <strong>et</strong> 3 variables, puis ainsi <strong>de</strong> suite jusqu’àprouver ce résultat, trouvé empiriquement, pour <strong>de</strong>s jeux à <strong>de</strong>ux joueurs <strong>et</strong> n variables par joueur.2.6.1 2 joueurs, 1 variable chacunDans c<strong>et</strong>te section, nous allons étudier <strong>de</strong>s jeux booléens G = (N,V,Γ,π,Φ) tels que N = {1,2},V = {a,b}, γ 1 = γ 2 = ⊤, π 1 = {a}, π 2 = {b}, les buts <strong>de</strong>s joueurs étant quelconques. Supposons quele joueur 1 est le meneur, <strong>et</strong> donc joue en premier. La liste <strong>de</strong> toutes les issues possibles <strong>de</strong> ce type <strong>de</strong>jeux une fois que le joueur 1 a joué la stratégie s 1 (s 1 = a ou s 1 = a) est représentée sur la figure 2.7(page suivante).Chaque paire <strong>de</strong> couples du type (x,y)(z,t) apparaissant dans la première colonne <strong>de</strong> ce tableaureprésente les issues du jeu pour le joueur 1 s’il joue s 1 selon la stratégie choisie par le joueur 2. Doncsi le joueur 1 joue s 1 <strong>et</strong> que le joueur 2 joue s 2 (s 2 = b ou s 2 = b), l’issue du jeu sera 13 (x,y) ; si lejoueur 2 joue s 2 (si s 2 = b, alors s 2 = b <strong>et</strong> vice-versa), l’issue du jeu sera (z,t). Dans ces couples, lanotation _ signifie “0 ou 1”.La secon<strong>de</strong> colonne du tableau représente l’intérêt <strong>de</strong> s 1 pour le joueur 1 : c’est soit une stratégiegagnante (si l’issue est (1,_)(1,_) par exemple, quel que soit le choix <strong>de</strong> 2, 1 est sûr <strong>de</strong> gagner s’iljoue s 1 ), soit une stratégie perdante (si l’issue est (0,_)(0,_) par exemple, 1 est sûr <strong>de</strong> perdre s’il joues 1 ), soit le joueur 1 ne peut pas prévoir quelle sera son utilité (si l’issue est (0,1)(1,1) par exemple, 1ne sait pas quelle stratégie jouera 2).13 Comme précé<strong>de</strong>mment, cela signifie que le joueur 1 aura l’utilité x, <strong>et</strong> le joueur 2 l’utilité y.60 Elise Bonzon


2.6. Jeux booléens <strong>et</strong> duopole <strong>de</strong> Stackelberg(1,_)(1,_) stratégie gagnante s 1 |= ϕ 1(0,0)(1,1) stratégie gagnante s 1 |= ϕ 1 ↔ ϕ 2(1,1)(0,0) stratégie gagnante s 1 |= ϕ 1 ↔ ϕ 2(0,_)(0,_) stratégie perdante s 1 |= ¬ϕ 1(1,0)(0,1) stratégie perdante s 1 |= ¬(ϕ 1 ↔ ϕ 2 )(0,1)(1,0) stratégie perdante s 1 |= ¬(ϕ 1 ↔ ϕ 2 )(1,0)(0,0) imprévisible s 1 |= ¬ϕ 2(0,0)(1,0) imprévisible s 1 |= ¬ϕ 2(0,1)(1,1) imprévisible s 1 |= ϕ 2(1,1)(0,1) imprévisible s 1 |= ϕ 2Figure 2.7 — Issues possibles du jeu <strong>de</strong> type Stackelberg à 2 joueurs <strong>et</strong> 1 variable chacunEnfin, dans la troisième colonne se trouve une <strong>de</strong>scription <strong>de</strong>s eff<strong>et</strong>s <strong>de</strong> s 1 sur les buts <strong>de</strong>s joueurs (parexemple, si l’issue est (1,_)(1,_), on sait que s 1 |= ϕ 1 ).A partir <strong>de</strong> ce tableau, qui couvre tous les cas possibles, on déduit que la stratégie s 1 est optimale pourle joueur 1 si <strong>et</strong> seulement si∗ soit c’est une stratégie gagnante,∗ soit 14 s 1 est une stratégie perdante (auquel cas s 1 est forcément meilleure),∗ soit il est impossible <strong>de</strong> choisir entre s 1 <strong>et</strong> s 1 , les <strong>de</strong>ux étant imprévisibles (dans ce cas, les <strong>de</strong>uxstratégies sont optimales).Une fois que le joueur 1 a joué, le joueur 2 peut en toute connaissance <strong>de</strong> cause jouer à son tour, <strong>et</strong> ilchoisira une stratégie qui ne le satisfait pas uniquement s’il ne peut pas être satisfait.On obtient donc l’assertion suivante :Assertion 2.1. Soit un jeu booléen G = (N,V ,Γ,π,Φ) tel que N = {1,2}, V = {a,b}, γ 1 = γ 2 = ⊤,π 1 = {a}, π 2 = {b} du type Stackelberg.∗ La stratégie s 1 est optimale pour le meneur <strong>de</strong> G si <strong>et</strong> seulement si :ouou∃s 2 tq s 1 |= ϕ 1 ∨((ϕ 1 ↔ ϕ 2 ) ∧(ϕ 1 ) s2 )(stratégie gagnante)∃s 2 tq s 1 |= ¬ϕ 1 ∨(¬(ϕ 1 ↔ ϕ 2 ) ∧(ϕ 2 ) s2 ) (stratégie non perdante)⎛⎜⎝⎞s 1 |= ϕ 2⎟ous 1 |= ¬ϕ 2⎠ <strong>et</strong>⎛⎜⎝⎞s 1 |= ϕ 2⎟ou ⎠s 1 |= ¬ϕ 2(peu importe)∗ Si le joueur 1 joue s 1 , la stratégie s 2 est optimale pour le suiveur si <strong>et</strong> seulement sis 2 |= ¬(ϕ 2 ) s1 ⇒ s 2 |= ¬(ϕ 2 ) s114 Si s 1 = a, alors s 1 = a, <strong>et</strong> vice-versa.Jeux booléens 61


Jeux booléens2.6.2 2 joueurs, 3 variablesOn étudie à présent <strong>de</strong>s jeux booléens G = (N,V ,Γ,π,Φ) tels que N = {1,2}, V = {a,b,c}, γ 1 = γ 2 =⊤, π 1 = {a,c}, π 2 = {b}. Supposons que le joueur 1 est le meneur, <strong>et</strong> donc qu’il joue en premier. Lejoueur 2 répond en instanciant b, <strong>et</strong> c’est ensuite encore au joueur 1 <strong>de</strong> jouer.Le joueur 2 se r<strong>et</strong>rouve donc ici dans la même position que le joueur 1 dans la section précé<strong>de</strong>nte :il est meneur d’un jeu booléen <strong>de</strong> type Stackelberg à <strong>de</strong>ux joueurs ayant une variable chacune. Sastratégie optimale est donc donnée par l’assertion 2.1 (page précé<strong>de</strong>nte). Il nous reste donc à définirla stratégie optimale du premier joueur pour l’instanciation <strong>de</strong> sa première variable.En effectuant le même raisonnement que précé<strong>de</strong>mment, nous trouvons donc l’assertion suivante :Assertion 2.2. Une fois la première variable du meneur instanciée, une stratégie optimale pourle joueur 2 est donnée dans l’assertion 2.1 (page précé<strong>de</strong>nte), ce joueur se r<strong>et</strong>rouvant meneur dusous-jeu à <strong>de</strong>ux joueurs <strong>et</strong> <strong>de</strong>ux variables restant. Soit s 11 l’instanciation <strong>de</strong> la première variable dujoueur 1 dans la stratégie s 1 (puisque s 11 , s 12 <strong>et</strong> s 2 correspon<strong>de</strong>nt chacun à l’instanciation d’une seulevariable, on peut écrire comme précé<strong>de</strong>mment s 11 , s 12 <strong>et</strong> s 2 ).∗ La stratégie s 2 est optimale pour le suiveur si <strong>et</strong> seulement siouou∃s 12 tq s 2 |= (ϕ 2 ) s11 ∨(((ϕ 1 ) s11 ↔ (ϕ 2 ) s11 ) ∧(ϕ 2 ) s11 s 12)(stratégie gagnante)∃s 12 tq s 2 |= ¬(ϕ 2 ) s11 ∨(¬((ϕ 1 ) s11 ↔ (ϕ 2 ) s11 ) ∧(ϕ 1 ) s11 s 12) (stratégie non perdante)⎛⎜⎝s 2 |= (ϕ 1 ) s11ous 2 |= ¬(ϕ 1 ) s11⎞⎟⎠ <strong>et</strong>⎛⎜⎝s 2 |= (ϕ 1 ) s11ous 2 |= ¬(ϕ 1 ) s11⎞⎟⎠(peu importe)∗ Le joueur 1 sait que 2 choisira une stratégie s 2 optimale suivant l’instanciation <strong>de</strong> sa premièrevariable, c’est-à-dire s 11 . Il peut donc choisir sa stratégie suivant s 2 . La stratégie s 1 est optimalepour le meneur si <strong>et</strong> seulement siou∀s 2 optimale pour 2 :⎛⎜⎝∃s 12 tq (s 11 ,s 12 ) |= (ϕ 1 ) s2ous 11 |= ¬(ϕ 1 ) s2si ∀s 12 optimale pour 1, 1 est indifférent :⎛⎜⎝(stratégie gagnante)∃s 12 tq s 21 |= ¬(ϕ 2 ) s12<strong>et</strong>∃s 12 tq s 21 |= ¬(ϕ 2 ) s12(stratégie non perdante)⎞⎞⎟⎠⎟⎠ (peu importe)Exemple 2.14. Soit G = (N,V,Γ,π,Φ) un jeu booléen tel que N = {1,2}, V = {a,b,c}, γ 1 = γ 2 = ⊤,π 1 = {a,c}, π 2 = {b}, ϕ 1 = (a ∧ b) ∨(c ↔ b) <strong>et</strong> ϕ 2 = (¬a ∧ ¬b) ∨ c.Le joueur 1 commence par jouer la variable a, <strong>et</strong> doit tout d’abord calculer les stratégies optimalesdu joueur 2 pour chacune <strong>de</strong>s instanciations <strong>de</strong> a.Soit s 11 = a. On a alors (ϕ 2 ) s11 = c, (ϕ 1 ) s11 = b ∨(c ↔ b).62 Elise Bonzon


2.6. Jeux booléens <strong>et</strong> duopole <strong>de</strong> StackelbergOn a ¬b |= ¬((ϕ 1 ) s11 ↔ (ϕ 2 ) s11 ), ce qui est une stratégie perdante pour 2, <strong>et</strong> b |= (ϕ 1 ) s11 ce qui estune stratégie non perdante pour 2, <strong>et</strong> donc sa stratégie optimale.Une fois que 1 a fait ce calcul, il n’a plus besoin <strong>de</strong> calculer la stratégie optimale <strong>de</strong> 2 pour s 11 = ¬acar il sait déjà qu’il a une stratégie gagnante s’il choisit a : 2 étant rationnel va choisir b, <strong>et</strong> alorsab |= ϕ 1 .2.6.3 2 joueurs, 2 variables chacunNous étudions à présent <strong>de</strong>s jeux booléens G = (N,V,Γ,π,Φ) tels que N = {1,2}, V = {a,b,c,d},γ 1 = γ 2 = ⊤, π 1 = {a,c}, π 2 = {b,d}. Supposons que le joueur 1 commence par instancier la variablea, puis que 2 instancie b, <strong>et</strong> ainsi <strong>de</strong> suite.Nous connaissons déjà la stratégie optimale <strong>de</strong> 2 une fois que 1 a instancié a, ainsi que la stratégieoptimale <strong>de</strong> 1 pour la variable c une fois que a <strong>et</strong> b sont instanciées. Il nous manque donc à connaîtrel’instanciation optimale <strong>de</strong> a pour le premier joueur.s 11 est une stratégie optimale <strong>de</strong> 1 si <strong>et</strong> seulement si ∀s 21 optimales pour 15 2 :1. ∃s 12 une stratégie gagnante pour 1, donc telle que :2. ou, s 11 est une stratégie perdante :∃s 22 tq (s 11 ,s 12 ) |= (ϕ 1 ) s21 ∨(((ϕ 1 ) s21 ↔ (ϕ 2 ) s21 ) ∧(ϕ 1 ) s21 s 22)∃s 22 tq s 11 |= ¬(ϕ 1 ) s21 ∨(¬((ϕ 1 ) s21 ↔ (ϕ 2 ) s21 ) ∧(ϕ 2 ) s21 s 22)3. ou, 1 est indifférent :⎛<strong>et</strong>⎜⎝⎛⎜⎝⎞(s 11 ,s 12 ) |= (ϕ 2 ) s21⎟ou ⎠(s 11 ,s 12 ) |= ¬(ϕ 2 ) s21⎞(s 11 ,s 12 ) |= (ϕ 2 ) s21⎟ou ⎠(s 11 ,s 12 ) |= ¬(ϕ 2 ) s21<strong>et</strong><strong>et</strong>⎛⎜⎝⎛⎜⎝⎞(s 11 ,s 12 ) |= (ϕ 2 ) s21⎟ou ⎠(s 11 ,s 12 ) |= ¬(ϕ 2 ) s21⎞(s 11 ,s 12 ) |= (ϕ 2 ) s21⎟ou ⎠(s 11 ,s 12 ) |= ¬(ϕ 2 ) s21Assertion 2.3.∗ La stratégie s 21 est optimale pour le suiveur si <strong>et</strong> seulement si⎛⎞∃s 22 tq (s 21 ,s 22 ) |= (ϕ 2 ) s11 ,s 12(stratégie gagnante)⎜⎟∀s 12 optimale pour 1 : ⎝ou⎠s 21 |= ¬(ϕ 2 ) s11 ,s 12(stratégie non perdante)ou⎛⎞∃s 12 tq s 21 |= ¬(ϕ 2 ) s12⎜⎟si ∀s 12 optimale, 1 est indifférent : ⎝ <strong>et</strong> ⎠ (peu importe)∃s 12 tq s 21 |= ¬(ϕ 2 ) s1215 De nouveau, quels que soient i ∈ {1,2} <strong>et</strong> j ∈ {1,2}, chaque s i jcorrespondant à l’instanciation d’une seule variable, ilest possible d’écrire s i j.Jeux booléens 63


Jeux booléens∗ La stratégie s 11 est optimale pour le meneur si <strong>et</strong> seulement si pour toute stratégie s 21 optimalepour 2, soit il existe s 12 optimale pour 1, soit s 11 est une stratégie perdante, soit 1 est indifférent.Donc s 11 est une stratégie optimale pour 1 si <strong>et</strong> seulement si ∀s 21 optimale pour 2 :∃s 12 ,s 22 tq (s 11 ,s 12 ) |= ((ϕ 1 ) s21 ∨((ϕ 1 ) s21 ↔ (ϕ 2 ) s21 ) ∧(ϕ 1 ) s21 s 22) (stratégie gagnante)ou∃s 22 tq s 11 |= ¬(ϕ 1 ) s21 ∨(¬((ϕ 1 ) s21 ↔ (ϕ 2 ) s21 ) ∧(ϕ 2 ) s21 s 22) (stratégie non perdante)⎛⎞ou⎛⎞(s 11 ,s 12 ) |= (ϕ 2 ) s21 (s 11 ,s 12 ) |= (ϕ 2 ) s21⎜⎟ ⎜⎟⎝ ou ⎠ <strong>et</strong> ⎝ ou ⎠(s 11 ,s 12 ) |= ¬(ϕ 2 ) s21 (s 11 ,s 12 ) |= ¬(ϕ 2 ) s21⎛⎞<strong>et</strong>⎛⎞(s 11 ,s 12 ) |= (ϕ 2 ) s21 (s 11 ,s 12 ) |= (ϕ 2 ) s21⎜⎟ ⎜⎟⎝ ou ⎠ <strong>et</strong> ⎝ ou ⎠(s 11 ,s 12 ) |= ¬(ϕ 2 ) s21 (s 11 ,s 12 ) |= ¬(ϕ 2 ) s21(peu importe)2.6.4 2 joueurs, n variables chacunEtudions à présent <strong>de</strong>s jeux booléens G = (N,V,Γ,π,Φ) tels que N = {1,2}, V = {v 1 ,...v 2n }, γ 1 =γ 2 = ⊤, π 1 = {v 1 ,...,v n }, π 2 = {v n+1 ,...v 2n }. Chaque joueur contrôle donc exactement n variables.Supposons que le joueur 1 est le meneur, <strong>et</strong> qu’il commence par jouer la variable v 1 . Le joueur 2 joueensuite la variable v n+1 , <strong>et</strong> ainsi <strong>de</strong> suite.Propriété 2.22.∗ La stratégie s 11 est optimale pour le meneur si <strong>et</strong> seulement si ∀s 21 ,...,s 2n−1 optimales 16 pour2 :ouou∃s 12 ,...,s 1n ,s 2n tq(s 11 ,...,s 1n ) |= (ϕ 1 ) s21 ...s 2n−1∨(((ϕ 1 ) s21 ...s 2n−1↔ (ϕ 2 ) s21 ...s 2n−1) ∧(ϕ 1 ) s21 ...s 2n) (1)∃s 2n tq s 11 |= ¬(ϕ 1 ) s21 ...s 2n−1∨(¬((ϕ 1 ) s21 ...s 2n−1↔ (ϕ 2 ) s21 ...s 2n−1) ∧(ϕ 2 ) s21 ...s 2n) (2)⎛⎜∀s 1 ∈ S 1 , ⎝s 1 |= (ϕ 2 ) s21 ...s 2n−1ous 1 |= ¬(ϕ 2 ) s21 ...s 2n−1∗ La stratégie s 21 est optimale pour le suiveur si <strong>et</strong> seulement si⎛∀s 12 ,...,s 1n optimales pour 1 :ou⎜⎝⎞si ∀s 12 ,...,s 1n optimales, 1 est indifférent :⎟⎠ (3)∃s 22 ,...,s 2n tq (s 21 ,...,s 2n ) |= (ϕ 2 ) s11 ,...,s 1n(1)ous 21 |= ¬(ϕ 2 ) s11 ,...,s 1n(2)⎛⎜⎝∃s 1 ∈ S 1 tq s 21 |= ¬(ϕ 2 ) s1<strong>et</strong>∃s 1 ∈ S 1 tq s 21 |= ¬(ϕ 2 ) s1⎞⎟⎠ (3)16 De nouveau, quels que soient i ∈ {1,2} <strong>et</strong> j ∈ {1,...,n}, chaque s i jcorrespondant à l’instanciation d’une seule variable,il est possible d’écrire s i j.⎞⎟⎠64 Elise Bonzon


2.6. Jeux booléens <strong>et</strong> duopole <strong>de</strong> StackelbergPreuve :∗ Joueur 1.⇒ L’optimalité n’est pas exclusive (s 11 <strong>et</strong> s 11 peuvent être optimales). Nousvoulons donc montrer que si s 11 ne respecte pas les équations (1), (2) <strong>et</strong>(3), alors s 11 est optimale.(1) ∀s 12 ,...,s 1n ,(s 11 ,s 12 ,...,s 1n ) ̸|= (ϕ 1 ) s21 ...s 2n−1∨ (((ϕ 1 ) s21 ...s 2n−1↔(ϕ 2 ) s21 ...s 2n−1) ∧(∃s 2n tq (ϕ 1 ) s21 ...s 2n)).Les possibilités <strong>de</strong> satisfaire c<strong>et</strong>te formule dépen<strong>de</strong>nt <strong>de</strong> la valeur<strong>de</strong> s 2n , qui est la seule variable dont on ne connaît pas encorel’instanciation. On obtient les possibilités suivantes :∀s 12 ,...,s 1n <strong>et</strong>∀s 21 ,...,s 2n−1 stratégies optimales pour 2, après un chemin contenants 11 ,s 12 ,...,s 1n ,s 21 ,...,s 2n−1 :2(1,_) (0,1) [(1,1) → 1 est indifférent ; (1,0) → 1 perd]s 2n s 2n(0,1) (1,_) [(1,1) → 1 est indifférent ; (1,0) → 1 perd](0,_) (0,_)[1 perd]En eff<strong>et</strong>, si (1) n’est pas satisfaite, on ne peut pas avoir, une foiss 11 ,s 12 ,...,s 1n ,s 21 ,...,s 2n−1 instanciées, ϕ 1 satisfaite pour tout s 2n . Onne peut pas avoir non plus pour tout s 2n , ϕ 1 ↔ ϕ 2 <strong>et</strong> pour un s 2n ,ϕ 1 satisfaite. Les seules options disponibles sont donc celles décritesplus haut.(2) s 11 ̸|= ¬(ϕ 1 ) s21 ...s 2n−1∨ (¬((ϕ 1 ) s21 ...s 2n−1↔ (ϕ 2 ) s21 ...s 2n−1) ∧(∃s 2n tq (ϕ 2 ) s21 ...s 2n)).Les possibilités <strong>de</strong> satisfaire c<strong>et</strong>te formule dépen<strong>de</strong>nt une foisencore <strong>de</strong> la valeur <strong>de</strong> s 2n . Nous obtenons les possibilités suivantes :∀s 21 ,...,s 2n−1 stratégies optimales pour 2, ∃s 12 ,...,s 1n telles que lechemin contenant s 11 ,s 12 ,...,s 1n ,s 21 ,...,s 2n−1 satisfait les conditionssuivantes pour s 2n :2(0,_) (1,1) [(0,1) → 1 est indifférent ; (0,0) → 1 gagne]s 2n s 2n(1,1) (0,_) [(0,1) → 1 est indifférent ; (0,0) → 1 gagne](1,0) (0,0) [1 est indifférent](0,0) (1,0) [1 est indifférent](1,_) (1,_) [1 gagne]⎛⎜(3) ∃s 1 ∈ S 1 , ⎝s 1 ̸|= (ϕ 2 ) s21 ...s 2n−1<strong>et</strong>s 1 ̸|= ¬(ϕ 2 ) s21 ...s 2n−1⎞⎟⎠Jeux booléens 65


Jeux booléensUne fois encore, les possibilités <strong>de</strong> satisfaire c<strong>et</strong>te formule dépen<strong>de</strong>nt<strong>de</strong> la valeur <strong>de</strong> s 2n . Nous obtenons les possibilités suivantes :∀s 21 ,...,s 2n−1 stratégies optimales pour 2, ∃s 11 ,s 12 ,...,s 1n telles quele chemin contenant s 11 ,s 12 ,...,s 1n ,s 21 ,...,s 2n−1 satisfait les conditionssuivantes pour s 2n :2(_,0) (_,1) [(_,0)(0,1) → 1 perd ; (_,0)(1,1) → 1 gagne]s 2n s 2n(_,1) (_,0) [(0,1)(_,0) → 1 perd ; (1,1)(_,0) → 1 gagne]Plusieurs cas sont à envisager :∗ À partir <strong>de</strong> (1) : Si ∀s 12 ,...,s 1n <strong>et</strong> ∀s 21 ,...,s 2n−1 , le résultat obtenupar le joueur 1 est [(0,1) <strong>et</strong> (1,0)] ou [(1,0) <strong>et</strong> (0,1)] ou [(0,_) <strong>et</strong>(0,_)], alors s 11 est une stratégie perdante, <strong>et</strong> s 11 est une stratégieoptimale.Si ∀s 12 ,...,s 1n <strong>et</strong> ∀s 21 ,...,s 2n−1 , le résultat obtenu par le joueur 1est [(1,1) <strong>et</strong> (0,1)] ou [(0,1) <strong>et</strong> (1,1)], on sait d’après (2) que lejoueur 1 peut obtenir les mêmes résultats en jouant s 11 , auquel casil est indifférent entre ces <strong>de</strong>ux stratégies (<strong>et</strong> s 11 est une stratégieoptimale) ; ou alors la stratégie s 11 est une stratégie gagnante.∗ À partir <strong>de</strong> (2) : Si ∃s 12 ,...,s 1n <strong>et</strong> ∀s 21 ,...,s 2n−1 , le résultat obtenupar le joueur 1 est [(0,0) <strong>et</strong> (1,1)] ou [(1,1) <strong>et</strong> (0,0)] ou [(1,_) <strong>et</strong>(1,_)], alors s 11 est une stratégie gagnante, donc est une stratégieoptimale.D’après (1), on sait que soit s 11 est une stratégie perdante, soit lejoueur 1 est indifférent. Donc si ∃s 12 ,...,s 1n <strong>et</strong> ∀s 21 ,...,s 2n−1 telsque le résultat obtenu par le joueur 1 est [(0,1) <strong>et</strong> (1,1)] ou [(1,1) <strong>et</strong>(0,1)] ou [(1,0) <strong>et</strong> (0,0)], ou [(0,0) <strong>et</strong> (1,0)], s 11 est une stratégieoptimale (puisque soit s 11 est une stratégie perdante, soit le joueur1 est indifférent entre s 11 <strong>et</strong> s 11 ).∗ À partir <strong>de</strong> (1), (2) <strong>et</strong> (3) : Si la stratégie s 1 obtenue par (3) entraîneun résultat pour le joueur 1 <strong>de</strong> la forme [(_,0) <strong>et</strong> (1,1)] ou [(1,1)<strong>et</strong> (_,0)], alors d’après (1) <strong>et</strong> (2), nous savons que s 1 contient s 11 , <strong>et</strong>que s 1 est une stratégie gagnante, donc s 11 est optimale.∗ À partir <strong>de</strong> (1), (2) <strong>et</strong> (3) : Si la stratégie s 1 obtenue par (3) entraîneun résultat pour le joueur 1 <strong>de</strong> la forme [(_,0) <strong>et</strong> (0,1)] ou [(0,1)<strong>et</strong> (_,0)], alors d’après (1) <strong>et</strong> (2), nous savons que s 1 contient s 11 .Dans ce cas, soit s 11 est une stratégie perdante pour tout s 1i , i ∈ [1,n]<strong>et</strong> s 11 est optimale ; soit le joueur 1 est indifférent entre s 11 <strong>et</strong> s 11 ,auquel cas s 11 est optimale.⇐ Supposons à présent que s 11 satisfait les équations (1), (2) <strong>et</strong> (3), <strong>et</strong> prouvonsalors que s 11 est optimale.66 Elise Bonzon


2.6. Jeux booléens <strong>et</strong> duopole <strong>de</strong> Stackelberg(1) ∀s 21 ,...,s 2n−1 optimales pour 2, ∃s 12 ,...,s 1n ,s 2n telles que(s 11 ,...,s 1n ) |= (ϕ 1 ) s21 ...s 2n−1∨} {{ }ϕ i est satisfaite ∀s 2n(((ϕ 1 ) s21 ...s 2n−1↔ (ϕ 2 ) s21 ...s 2n−1) ∧(ϕ 1 ) s21 ...s 2n)} {{ }(∗)(∗) : 2 jouant <strong>de</strong> façon rationnelle, ce joueur choisira s 2n telle ques 2n |= (ϕ 2 ) s11 ,...,s 1n ,s 21 ...s 2n−1, <strong>et</strong> alors s 2n |= (ϕ 1 ) s11 ,...,s 1n ,s 21 ...s 2n−1.s 11 est donc optimale.(2) ∀s 21 ,...,s 2n−1 optimales pour 2, ∃s 2n telle que ∀s 12 ,...,s 1n ,s 2n ,s 11 |=¬(ϕ 1 ) s21 ...s 2n−1∨} {{ }ϕ i n’est pas satisfaite ∀s 2n∗ Joueur 2.(¬((ϕ 1 ) s21 ...s 2n−1↔ (ϕ 2 ) s21 ...s 2n−1) ∧(ϕ 2 ) s21 ...s 2n)} {{ }(∗)(∗) : 2 jouant <strong>de</strong> façon rationnelle, ce joueur choisira s 2n telle ques 2n |= (ϕ 2 ) s11 ,...,s 1n ,s 21 ...s 2n−1, <strong>et</strong> alors s 2n |= ¬(ϕ 1 ) s11 ,...,s 1n ,s 21 ...s 2n−1.s 11 est donc optimale.(3) ∀s 21 ,...,s 2n−1 optimales pour 2, ∀s 1 ∈ S 1 ,⎛⎜⎝s 1 |= (ϕ 2 ) s21 ...s 2n−1ous 1 |= ¬(ϕ 2 ) s21 ...s 2n−1∀s 1 ∈ S 1 , 1 ne connaît donc pas le choix <strong>de</strong> 2, <strong>et</strong> donc ne peut paschoisir. s 11 <strong>et</strong> s 11 sont donc optimales.⇒ L’optimalité n’est pas exclusive (s 21 <strong>et</strong> s 21 peuvent être optimales). Nousvoulons donc montrer que si s 21 ne respecte pas les équations (1), (2) <strong>et</strong>(3), alors s 21 est optimale.(1) ∃s 12 ,...,s 1n optimales pour 1 telles que ∀s 22 ,...,s 2n telles que(s 21 ,...,s 2n ) ̸|= (ϕ 2 ) s11 ,...,s 1n, donc (s 21 ,...,s 2n ) |= ¬(ϕ 2 ) s11 ,...,s 1n,donc s 21 est une stratégie perdante, <strong>et</strong> donc s 21 est optimale.(2) ∃s 12 ,...,s 1n optimales pour 1 telles que s 21 ̸|= ¬(ϕ 2 ) s11 ,...,s 1n. Donc,∃s 22 ,...,s 2n telles que s 21 ,...,s 2n |= (ϕ 2 ) s11 ,...,s 1n. Donc il existe unestratégie gagnante contenant s 21 , <strong>et</strong> donc c<strong>et</strong>te stratégie est optimale.(3) si ∀s 12 ,...,s 1n optimales pour 1, 1 est indifférent :⎞⎟⎠Jeux booléens 67


Jeux booléens⎛⎜⎝∀s 1 ∈ S 1 ,s 21 ̸|= ¬(ϕ 2 ) s1ou∀s 1 ∈ S 1 ,s 21 ̸|= ¬(ϕ 2 ) s1Donc,⎛⎜⎝⎞⎟⎠.∀s 1 ∈ S 1 ,∃s 22 ,...,s 2n telles que s 21 |= (ϕ 2 ) s1 (4)or∀s 1 ∈ S 1 ,∃s 22 ,...,s 2n telles que s 21 |= (ϕ 2 ) s1 (5)⎞⎟⎠.Nous savons d’après (1) que (4) n’est pas possible. (5) est donc vrai,<strong>et</strong> s 21 est optimale.⇐ Supposons à présent que s 21 satisfait les équations (1), (2) <strong>et</strong> (3), <strong>et</strong> prouvonsque s 21 est optimale.(1) ∀s 12 ,...,s 1n optimales pour 1 : ∃s 22 ,...,s 2n telles que (s 21 ,...,s 2n ) |=(ϕ 2 ) s11 ,...,s 1n. ϕ 2 est satisfaite, <strong>et</strong> donc s 21 est optimale.(2) ∀s 12 ,...,s 1n optimales pour 1 : s 21 |= ¬(ϕ 2 ) s11 ,...,s 1n. ϕ 2 n’est pas satisfaite,<strong>et</strong> donc s 21 est optimale.(3) si ⎛ ∀s 12 ,...,s 1n optimales ⎞pour 1, 1 est indifférent :∃s 1 ∈ S 1 st s 21 |= ¬(ϕ 2 ) s1⎜⎟⎝<strong>et</strong> ⎠.∃s 1 ∈ S 1 st s 21 |= ¬(ϕ 2 ) s1Dans ce cas, 2 ne peut pas prévoir les choix <strong>de</strong> 1, <strong>et</strong> peut donctoujours avoir une stratégie perdante. Ce joueur est donc indifférententre ses <strong>de</strong>ux choix, <strong>et</strong> s 11 est optimale.68 Elise Bonzon


3Jeux booléens <strong>et</strong> préférences nondichotomiquesCe choix d’utilités binaires (pour lequel les agents peuvent seulement exprimer leur totale satisfactionou leur total mécontentement, sans niveaux intermédiaires) est une vraie perte <strong>de</strong> généralité. En eff<strong>et</strong>,on ne peut par exemple pas exprimer dans un jeu booléen classique <strong>de</strong>s préférences du type “Jepréfèrerais boire un café, si je ne peux pas un thé, <strong>et</strong> si ce n’est pas possible non plus je prendrai unchocolat chaud”, qui nécessite 3 niveaux d’utilité ; tout comme on ne peut pas exprimer le dilemmedu prisonnier classique (présenté exemple 1.1 (page 10)), qui lui nécessite 4 niveaux d’utilité.On aimerait donc incorporer <strong>de</strong>s préférences non dichotomiques aux jeux booléens afin que chaquejoueur puisse représenter ses préférences <strong>de</strong> manière plus souple. Nous voudrions pouvoir associerune relation <strong>de</strong> préférence quelconque à l’ensemble <strong>de</strong>s profils <strong>de</strong> stratégies S.Définition 3.1. Une relation <strong>de</strong> préférence ≽ est une relation binaire reflexive <strong>et</strong> transitive (nonnécessairement totale 1 ) sur S. La relation <strong>de</strong> préférence stricte ≻ associée à ≽ est définie pars 1 ≻ s 2 si <strong>et</strong> seulement si s 1 ≽ s 2 <strong>et</strong> non(s 2 ≽ s 1 ).Ces préférences peuvent être <strong>de</strong> différents types : elles peuvent être numériques (on parlera alors<strong>de</strong> préférences cardinales), ou encore ordinales. Les préférences cardinales consistent à associer àchaque issue du jeu (ou profil <strong>de</strong> stratégies) une valeur numérique, <strong>et</strong> sont donc <strong>de</strong>s relations complètes.Les préférences ordinales consistent à associer directement un pré-ordre sur l’ensemble <strong>de</strong>sissues du jeu, <strong>et</strong> peuvent être partielles.Le choix entre ces <strong>de</strong>ux représentations dépend <strong>de</strong>s notions que l’on veut étudier : certaines notions(comme par exemple les équilibres <strong>de</strong> Nash en stratégies mixtes) nécessitent <strong>de</strong>s préférencescardinales, tandis que d’autres (comme les équilibres <strong>de</strong> Nash en stratégies pures ou les stratégies dominées)peuvent être définies dans un contexte purement ordinal. Les notions qui nous intéressent icipouvant être définies avec <strong>de</strong>s préférences ordinales, nous choisissons d’étudier tout particulièrementces <strong>de</strong>rnières.Il nous faut donc choisir à présent une représentation perm<strong>et</strong>tant d’éviter la <strong>de</strong>scription explicite <strong>de</strong>la fonction d’utilité <strong>de</strong> chaque agent, qui est, comme nous l’avons déjà vu, <strong>de</strong> taille exponentielleen fonction du nombre d’agents. Pour les préférences dichotomiques, nous avons utilisé la logiquepropositionnelle, qui est le langage <strong>de</strong> représentation compacte le plus naturel pour ces préférences.Pour les préférences non dichotomiques, il nous faut donc trouver un langage perm<strong>et</strong>tant d’expri-1 Une relation <strong>de</strong> préférence totale est une relation transitive, reflexive <strong>et</strong> qui vérifie : ∀x,y:x≽y ou y ≽ x69


Jeux booléens <strong>et</strong> préférences non dichotomiquesmer les préférences <strong>de</strong> chacun <strong>de</strong>s joueurs <strong>de</strong> façon aussi concise, ou compacte, que possible. Ceslangages sont appelés langages <strong>de</strong> représentation compacte. On définit formellement un langage <strong>de</strong>représentation <strong>de</strong> préférences [Lang, 2006] :Définition 3.2. Un langage <strong>de</strong> représentation <strong>de</strong> préférences est un couple 〈L,Ind〉 où∗ L est un langage propositionnel formé sur V ,∗ Ind est une fonction <strong>de</strong> L dans Pre f , Pre f étant l’ensemble <strong>de</strong>s relations <strong>de</strong> préférence sur 2 V ,qui associe à chaque élément <strong>de</strong> L la relation <strong>de</strong> préférence induite. Dans le cas <strong>de</strong>s préférencescardinales, la relation <strong>de</strong> préférence est obtenue par l’intermédiaire d’une fonction d’utilité u.Exemple 3.1. Soit V = {a,b,c,d} un ensemble <strong>de</strong> variables propositionnelles. Nous pouvons définirle langage <strong>de</strong> représentation <strong>de</strong> préférences dichotomique <strong>de</strong> la façon suivante :∗ L dicho est le langage formé sur V ,∗ u dicho est définie comme suit : pour toute formule ϕ ∈ L dicho , <strong>et</strong> pour tout ensemble w ⊆ V ,∗ u ϕ dicho(w) = 1 si w |= ϕ,∗ u ϕ dicho(w) = 0 sinon.Ce langage est celui que nous avons utilisé pour définir les jeux booléens tout au long du chapitre 2(page 31).Il existe <strong>de</strong> nombreux langages <strong>de</strong> représentation compacte <strong>de</strong> préférences. On peut citer parexemple :∗ Logique <strong>de</strong>s pondérations [Pinkas, 1991; Haddawy <strong>et</strong> Hanks, 1992; Dupin <strong>de</strong> Saint Cyr <strong>et</strong> al.,1992; Benferhat <strong>et</strong> al., 2001]. Le principe <strong>de</strong> c<strong>et</strong>te famille <strong>de</strong> langage <strong>de</strong> représentation <strong>de</strong> préférencesest d’associer <strong>de</strong>s pondérations numériques à <strong>de</strong>s formules propositionnelles. Il n’est pasnécessaire que les poids soient numériques : il est possible d’utiliser une échelle plus ou moinsqualitative munie d’une fonction d’agrégation, comme par exemple la logique possibiliste.∗ Logique <strong>de</strong>s priorités. C<strong>et</strong>te famille <strong>de</strong> langage <strong>de</strong> représentations est la contrepartie ordinale<strong>de</strong>s logiques à pondérations. Nous la présenterons plus longuement en section 3.3 (page 99).∗ Logique <strong>de</strong>s distances [Katsuno <strong>et</strong> Men<strong>de</strong>lzon, 1991, 1992; Lafage <strong>et</strong> Lang, 2000, 2001;Benferhat <strong>et</strong> al., 2002]. L’idée est d’utiliser <strong>de</strong>s distances entre interprétations propositionnelles: si un agent doit satisfaire un but G, plus l’interprétation est “loin” <strong>de</strong> G, moins elleest satisfaisante.∗ Logique <strong>de</strong>s préférences du type “c<strong>et</strong>eris paribus”. C<strong>et</strong>te famille <strong>de</strong> logiques <strong>de</strong>s préférencesest construite sur le principe <strong>de</strong> l’interprétation c<strong>et</strong>eris paribus, ou encore toutes choses étantégales par ailleurs, ou plus généralement toutes choses non pertinentes étant égales. Le principeconsistant à interpréter <strong>de</strong>s préférences c<strong>et</strong>eris paribus est dû à [von Wright, 1963], <strong>et</strong> a été revupar [Hansson, 1989, 2001]. Un langage <strong>de</strong> représentation graphique, les CP-n<strong>et</strong>s, est fondé surle critère <strong>de</strong> comparaison c<strong>et</strong>eris paribus. Nous présentons les CP-n<strong>et</strong>s en section 3.2 (page 74).∗ Logique <strong>de</strong>s conditionnels. L’idée est ici d’utiliser la logique <strong>de</strong>s conditionnels [Lewis, 1973]pour représenter <strong>de</strong>s préférences, <strong>et</strong> perm<strong>et</strong>tre <strong>de</strong> réviser ces préférences [Boutilier, 1994; Lang,1996; Lang <strong>et</strong> al., 2002b].Mis à part le langage <strong>de</strong> représentation dichotomique présenté au chapitre 2 (page 31), il existed’autres travaux dans le cadre <strong>de</strong>s jeux booléens : <strong>de</strong>s préférences non dichotomiques ont déjà été introduitesdans ces jeux. Il s’agit <strong>de</strong>s jeux d’évaluation distribués, introduits par [Harrenstein, 2004a],70 Elise Bonzon


3.1. Préférences ordinales <strong>et</strong> théorie <strong>de</strong>s jeuxqui sont <strong>de</strong>s jeux booléens à n joueurs dont les préférences sont représentées par <strong>de</strong>s ensembles <strong>de</strong>formules propositionnelles : plus le nombre <strong>de</strong> formules satisfaites pour un agent est grand, plus c<strong>et</strong>agent est satisfait. C<strong>et</strong>te relation <strong>de</strong> préférences simple est pourtant déjà assez sophistiquée : elle perm<strong>et</strong><strong>de</strong> représenter <strong>de</strong>s jeux plus complexes avec <strong>de</strong>s jeux booléens, comme par exemple le dilemmeclassique du prisonnier.Nous allons donc continuer ici dans c<strong>et</strong>te voie, <strong>et</strong> étudier <strong>de</strong>ux nouveaux langages <strong>de</strong> représentation<strong>de</strong> préférences : les CP-n<strong>et</strong>s <strong>et</strong> les logiques <strong>de</strong>s priorités 2 qui perm<strong>et</strong>tront eux aussi <strong>de</strong> traiter <strong>de</strong>spréférences non dichotomiques.Nous pouvons à présent définir un jeu booléen ayant <strong>de</strong>s préférences ordinales.Définition 3.3. Soit un langage propositionnel L pour une représentation compacte <strong>de</strong> préférences.Un L-jeu booléen est défini par un 5-uple G = (N,V ,π,Γ,Φ), avec∗ N = {1,...,n}, V , π <strong>et</strong> Γ étant définis comme précé<strong>de</strong>mment, <strong>et</strong>∗ Φ = 〈Φ 1 ,...,Φ n 〉. Pour chaque i, Φ i est une représentation compacte, dans L, <strong>de</strong> la relation <strong>de</strong>préférences 3 <strong>de</strong> ≽ i <strong>de</strong> l’agent i sur 4 S. On note Pre f G = 〈≽ 1 ,...,≽ n 〉.3.1 Préférences ordinales <strong>et</strong> théorie <strong>de</strong>s jeuxNous <strong>de</strong>vons redéfinir ici les équilibres <strong>de</strong> Nash en utilisant <strong>de</strong>s préférences ordinales. En eff<strong>et</strong>, leséquilibres <strong>de</strong> Nash sont classiquement définis pour <strong>de</strong>s jeux avec <strong>de</strong>s préférences totales, ce qui n’estplus nécessairement le cas ici, les préférences ordinales pouvant être partielles. L’introduction <strong>de</strong> cespréférences partielles peut être justifiée <strong>de</strong> façon épistémique : il se peut qu’un agent ne puisse pasdonner ses préférences sur <strong>de</strong>ux états, car il n’a pas toutes les informations nécessaires pour le faire.Par exemple, supposons que Mylen doive réserver un bill<strong>et</strong> d’avion pour Florian. Un avion part à10h, l’autre à 21h. Si Mylen ne connaît pas les disponibilités <strong>de</strong> Florian, elle est dans l’incapacité <strong>de</strong>comparer, <strong>et</strong> <strong>de</strong> choisir, entre ces <strong>de</strong>ux vols. Ces <strong>de</strong>ux états sont donc incomparables. Un autre typed’incomparabilité est l’incomparabilité intrinsèque : <strong>de</strong>ux états peuvent être incomparables du fait <strong>de</strong>leur nature. Par exemple la majorité <strong>de</strong>s gens sont incapables <strong>de</strong> répondre à la question “Préférez-vousavoir sur votre ordinateur un virus qui efface tous vos messages électroniques, ou un virus qui envoi<strong>et</strong>ous ces messages à tout vos contacts ?”Nous allons donc définir <strong>de</strong>ux notions d’équilibre <strong>de</strong> Nash, une forte <strong>et</strong> une faible (elles sont équivalentesaux notions d’équilibre maximal <strong>et</strong> maximum dans [Harrenstein, 2004a]).On rappelle qu’un équilibre <strong>de</strong> Nash en stratégies pures est un profil <strong>de</strong> stratégies tel que la stratégie<strong>de</strong> chaque joueur est une réponse optimale aux stratégies <strong>de</strong>s autres joueurs.Définition 3.4. Soit G = (N,V,Γ,π,Φ) un jeu booléen, avec N = {1,...,n} l’ensemble <strong>de</strong>s joueurs,Φ = 〈Φ 1 ,...,Φ n 〉 l’ensemble <strong>de</strong>s buts <strong>de</strong>s joueurs, <strong>et</strong> Pre f G = 〈≽ 1 ,...,≽ n 〉 l’ensemble <strong>de</strong>s préférences<strong>de</strong> chaque joueur. Deux définitions, une faible <strong>et</strong> une forte, peuvent ici caractériser les équilibres<strong>de</strong> Nash.2 Les résultats donnés dans ce chapitre ont fait l’obj<strong>et</strong> <strong>de</strong> plusieurs publications : [Bonzon <strong>et</strong> al., 2006a, 2007a]3 La définition <strong>de</strong>s buts Φ correspond à la définition <strong>de</strong> Ind dans la définition 3.2 (page ci-contre).4 On rappelle que dans un jeu booléen, S i = {s i ∈ 2 π i|s i |= γ i }, <strong>et</strong> que S = S 1 ×... × S n .Jeux booléens 71


Jeux booléens <strong>et</strong> préférences non dichotomiquess = (s 1 ,...,s n ) est un équilibre <strong>de</strong> Nash faible en stratégies pures si <strong>et</strong> seulement si :∀i ∈ {1,...,n},∀s ′ i ∈ S i,(s ′ i ,s −i) ⊁ i (s i ,s −i ) (3.1)s = (s 1 ,...,s n ) est un équilibre <strong>de</strong> Nash fort en stratégies pures si <strong>et</strong> seulement si :∀i ∈ {1,...,n},∀s ′ i ∈ S i ,(s ′ i,s −i ) ≼ i (s i ,s −i ) (3.2)L’ensemble <strong>de</strong>s équilibres <strong>de</strong> Nash forts (resp. faibles) en stratégie pure sera noté NE f ort (resp.NE f aible ).Un équilibre <strong>de</strong> Nash fort en stratégies pures est donc un profil <strong>de</strong> stratégies dont on a la certitu<strong>de</strong> qu’ilest une réponse optimale aux stratégies <strong>de</strong>s autres joueurs. Un équilibre <strong>de</strong> Nash faible en stratégiespures est lui un profil <strong>de</strong> stratégies qui peut être une réponse optimale aux stratégies <strong>de</strong>s autres joueurs.Il est clair que tout équilibre <strong>de</strong> Nash fort est un équilibre <strong>de</strong> Nash faible. On a donc NE f ort (G) ⊆NE f aible (G).Exemple 3.2. Soit le L-jeu booléen G = (N,V,Γ,π,Φ) suivant :∗ N = {1,2},∗ V = {a,b},∗ γ 1 = γ 2 = ⊤,∗ π 1 = {a}, π 2 = {b},∗ ≽ 1 est défini par : ab ≻ 1 ab ≻ 1 ab <strong>et</strong> ab ≻ 1 ab ≻ 1 ab (les profils <strong>de</strong> stratégies ab <strong>et</strong> ab sontincomparables pour le joueur 1), <strong>et</strong>∗ ≽ 2 est défini par : ab ≻ 2 ab ≻ 2 ab ≻ 2 ab.Ce jeu a un équilibre <strong>de</strong> Nash fort : NE f ort (G) = {ab} <strong>et</strong> <strong>de</strong>ux équilibres <strong>de</strong> Nash faibles :NE f aible (G) = {ab,ab}.Nous <strong>de</strong>vons également raffiner la notion <strong>de</strong> stratégies dominées, définies initialement à partir <strong>de</strong>spréférences totales (définitions 1.8 <strong>et</strong> 1.9 (page 22)). L’introduction <strong>de</strong> préférences partielles, <strong>et</strong> donc<strong>de</strong> la notion d’incomparabilité, nous perm<strong>et</strong> d’introduire un nouveau cas <strong>de</strong> stratégie dominée. C<strong>et</strong>tenouvelle notion est très faible : toutes les stratégies peuvent être partiellement dominées.Définition 3.5. Soit i un joueur <strong>et</strong> ≽ i sa relation <strong>de</strong> préférence sur S. La stratégie s i du joueur i estdite strictement dominée s’il existe une autre stratégie s ′ i telle que, quelles que soient les stratégies<strong>de</strong>s autres joueurs, s ′ i est strictement préférée à s i pour ≽ i . Donc, s i ∈ S i est strictement dominée si<strong>et</strong> seulement si :∃s ′ i ∈ S i telle que ∀s −i ∈ S −i ,(s i ,s −i ) ≺ i (s ′ i ,s −i)Soit i un joueur <strong>et</strong> ≽ i sa relation <strong>de</strong> préférence sur S. La stratégie s i du joueur i est dite faiblementdominée s’il existe une autre stratégie s ′ i telle que, quelles que soient les stratégies <strong>de</strong>s autres joueurs,s ′ i est préférée à s i pour ≽ i , <strong>et</strong> qu’il existe au moins une combinaison <strong>de</strong>s stratégies <strong>de</strong>s autres joueurstelle que s ′ i soit strictement préférée à s i pour ≽ i . Donc, s i ∈ S i est faiblement dominée si ∃s ′ i ∈ S itelle que :∀s −i ∈ S −i ,(s i ,s −i ) ≼ i (s ′ i ,s −i) <strong>et</strong> que ∃s −i ∈ S −i telle que (s i ,s −i ) ≺ i (s ′ i ,s −i)72 Elise Bonzon


3.1. Préférences ordinales <strong>et</strong> théorie <strong>de</strong>s jeuxSoit i un joueur <strong>et</strong> ≽ i sa relation <strong>de</strong> préférence sur S. La stratégie s i du joueur i est dite partiellementdominée s’il existe une autre stratégie s ′ i telle que, quelles que soient les stratégies <strong>de</strong>s autres joueurs,s i n’est pas strictement préférée à s ′ i pour ≽ i, <strong>et</strong> qu’il existe au moins une combinaison <strong>de</strong>s stratégies<strong>de</strong>s autres joueurs telle que s ′ i soit strictement préférée à s i pour ≽ i . Donc, s i ∈ S i est partiellementdominée si ∃s ′ i ∈ S i telle que :∀s −i ∈ S −i ,(s i ,s −i ) ⊁ i (s ′ i,s −i ) <strong>et</strong> que ∃s −i ∈ S −i telle que (s i ,s −i ) ≺ i (s ′ i,s −i )Toute stratégie strictement dominée est faiblement dominée ; <strong>et</strong> toute stratégie faiblement dominée estpartiellement dominée. Lorsque la relation ≽ i est un pré-ordre total, il y a équivalence entre stratégiesfaiblement <strong>et</strong> partiellement dominées.Exemple 3.3. Soit le L-jeu booléen G = (N,V,Γ,π,Φ) suivant :∗ N = {1,2},∗ V = {a,b},∗ γ 1 = γ 2 = ⊤,∗ π 1 = {a}, π 2 = {b},∗ ≽ 1 est défini par : ab ≻ 1 ab ≻ 1 ab <strong>et</strong> ab ≻ 1 ab ≻ 1 ab (les profils <strong>de</strong> stratégies ab <strong>et</strong> ab sontincomparables pour le joueur 1), <strong>et</strong>∗ ≽ 2 est défini par : ab ≽ 2 ab ≽ 2 ab ≻ 2 ab.Etudions les stratégies dominées <strong>de</strong> ce jeu :∗ Joueur 1 : La stratégie a du joueur 1 domine partiellement sa stratégie a. En eff<strong>et</strong>, ab ≻ 1 ab, <strong>et</strong>ab ⊁ 1 ab.∗ Joueur 2 : La stratégie b du joueur 2 domine faiblement (<strong>et</strong> partiellement) sa stratégie b. Eneff<strong>et</strong>, par transitivité <strong>de</strong> ≽ 2 , ab ≽ 2 ab, <strong>et</strong> ab ≻ 2 ab.La propriété 2.14 (page 51), issue <strong>de</strong> la théorie <strong>de</strong>s jeux, reste valable ici :Propriété 3.1.∗ l’ordre d’élimination <strong>de</strong>s stratégies strictement dominées n’affecte pas le résultat final.∗ Par contre, l’ordre d’élimination <strong>de</strong>s stratégies faiblement (<strong>et</strong> donc partiellement) dominéesaffecte le résultat final.Preuve :∗ Montrons que l’ordre d’élimination <strong>de</strong>s stratégies strictement dominées n’affectepas le résultat final. Supposons que nous sommes en présence d’un jeuG ayant au moins <strong>de</strong>ux stratégies strictement dominées. Ces <strong>de</strong>ux stratégiespeuvent être :∗ <strong>de</strong>ux stratégies d’un joueur donné.Dans ce cas, on suppose que la stratégie s i1 du joueur i est dominée strictementpar la stratégie s ′ i , <strong>et</strong> que s i 2est dominée strictement par s ′′i . On a alors3 possibilités, 2 d’entre elles étant équivalentes :∗ s i2 = s ′ i (ou s i1 = s ′′i ) : la stratégie s i 1est strictement dominée par s i2 .Comme s ′′i domine strictement s i2 , alors s ′′i domine strictement s i1 . Eneff<strong>et</strong> si on a : ∀s −i ∈ S −i ,(s i2 ,s −i ) ≻ i s i1 ,s −i ) <strong>et</strong> (s ′′i ,s −i) ≻ i (s i2 ,s −i ) alorsJeux booléens 73


Jeux booléens <strong>et</strong> préférences non dichotomiqueson a, par transitivité <strong>de</strong> ≻ : ∀s −i ∈ S −i ,s ′′i ,s −i ≻ i s i1 ,s −i . Dans ce cas, si onélimine s i1 en premier, s i2 sera toujours strictement dominée par s ′′i : <strong>et</strong> sion élimine s i2 en premier, s i1 sera toujours strictement dominée par s ′′i .∗ s i2 ̸= s ′ i <strong>et</strong> s i 1 ̸= s ′′i : dans ce cas, l’élimination <strong>de</strong> l’une <strong>de</strong> ces stratégiesn’influe pas sur l’élimination <strong>de</strong> l’autre.∗ <strong>de</strong>s stratégies <strong>de</strong> <strong>de</strong>ux joueurs différents.Nous supposons ici que la stratégie s i du joueur i est dominée strictement parla stratégie s ′ i , <strong>et</strong> que la stratégie s j du joueur j est dominée strictement pars ′ j . On a alors : ∀s −i ∈ S −i ,(s ′ i,s −i ) ≻ i (s i ,s −i )∀s − j ∈ S − j ,(s ′ j,s − j ) ≻ j (s j ,s − j )Si on élimine s i en premier, la stratégie s j sera toujours strictement dominéepar s ′ j . En eff<strong>et</strong>, on aura toujours ∀s − j ∈ S − j ,(s ′ j ,s − j) ≻ j (s j ,s − j ) carl’ensemble <strong>de</strong>s s − j ∈ S − j diminue après la suppression <strong>de</strong> s i .On raisonne <strong>de</strong> même si on élimine s j en premier.∗ On montre sur l’exemple suivant que l’ordre d’élimination <strong>de</strong>s stratégies faiblementdominées affecte le résultat final :Soit un L-jeu booléen tel que N = {1,2}, V = {a,b}, γ 1 = γ 2 = ⊤, π 1 = {a},π 2 = {b}, ≽ 1 définie par : ab ≽ 1 ab ≽ 1 ab ≻ 1 ab, <strong>et</strong> ≽ 2 définie par : ab ≽ 2 ab ≽ 2ab ≻ 2 ab.∗ Pour le joueur 1, a domine faiblement a. En eff<strong>et</strong>, on a ab ≽ 1 ab <strong>et</strong> ab ≻ 1 ab.Eliminons c<strong>et</strong>te stratégie. On obtient alors 2 états, ab <strong>et</strong> ab, <strong>et</strong> 2 n’a aucunestratégie dominée.∗ Pour le joueur 2, b domine faiblement b. En eff<strong>et</strong>, on a ab ≽ 2 ab <strong>et</strong> ab ≻ 2 ab.Eliminons c<strong>et</strong>te sratégie. On obtient alors 2 états, ab <strong>et</strong> ab, <strong>et</strong> 1 n’a aucunestratégie dominée.On voit ici que si l’on élimine a ou b en premier, on obtient <strong>de</strong>s résultats différents.Comme toute stratégie faiblement dominée est partiellement dominée, ce contreexempleest valable pour les stratégies partiellement dominées.Nous pouvons à présent étudier <strong>de</strong>s langages <strong>de</strong> représentation compacte <strong>de</strong> préférences <strong>et</strong> essayer<strong>de</strong> les adapter à notre modèle. Nous étudierons dans un premier temps un langage <strong>de</strong> représentationdit “graphique”, les CP-n<strong>et</strong>s ; puis un langage fondé sur la représentation <strong>de</strong> préférences en logiquepropositionnelle, les buts à priorité.3.2 Jeux booléens <strong>et</strong> CP-n<strong>et</strong>sLes CP-n<strong>et</strong>s appartiennent à une famille <strong>de</strong> langages <strong>de</strong> représentation dit “graphiques”. Ce langageest fondé sur le critère <strong>de</strong> comparaison C<strong>et</strong>eris Paribus que nous allons présenter dans la section74 Elise Bonzon


3.2. Jeux booléens <strong>et</strong> CP-n<strong>et</strong>ssuivante.3.2.1 C<strong>et</strong>eris ParibusQuand un agent exprime en langage naturel une préférence telle que “une table ron<strong>de</strong> sera mieuxdans le salon qu’une table carrée”, il ne veut sans doute pas dire que n’importe quelle table ron<strong>de</strong>sera préférée à n’importe quelle table carrée. Il veut exprimer le fait qu’il préfèrera une table ron<strong>de</strong> àune table carrée si ces <strong>de</strong>ux tables ne diffèrent pas significativement dans leurs autres caractéristiques(la taille, la couleur, le bois utilisé, les finitions ou encore le prix). Le principe qui est à l’œuvre dansl’interprétation <strong>de</strong> telles préférences est que les alternatives doivent être comparées toutes choses étantégales par ailleurs, ou encore C<strong>et</strong>eris Paribus. Les préférences C<strong>et</strong>eris Paribus ont été tout d’abordétudiées par von Wright dans [von Wright, 1963], puis ont été considérablement revues par Hansson[Hansson, 1989, 2001], qui en a proposé une généralisation fondée sur les fonctions <strong>de</strong> représentation<strong>et</strong> qui en a étudié les propriétés logiques. Ces préférences ont été indépendamment redécouvertesdans la communauté IA par [Doyle <strong>et</strong> Wellman, 1991; Doyle <strong>et</strong> al., 1991], <strong>et</strong> étudiées notamment par[Boutilier <strong>et</strong> al., 1999].Soit V = {X 1 ,...,X n } un ensemble <strong>de</strong> variables, chaque variable X i étant associée à un domaine D(X i ).Si {X 1 ,...,X p } est contenu dans V , alors D({X 1 ...X p }) = D(X 1 )×...×D(X p ), produit cartésien <strong>de</strong>sdomaines <strong>de</strong> chaque variable.Définition 3.6. Un sous-ensemble <strong>de</strong> variables X est préférentiellement indépendant à son complémentY = V \ X si <strong>et</strong> seulement si ∀x 1 ,x 2 ∈ D(X) <strong>et</strong> ∀y 1 ,y 2 ∈ D(Y) on a :On dit que x 1 est préférée à x 2 c<strong>et</strong>eris paribus.x 1 y 1 ≽ x 2 y 1 si <strong>et</strong> seulement si x 1 y 2 ≽ x 2 y 2En d’autres mots, la relation <strong>de</strong> préférence sur les instanciations <strong>de</strong> X, quand toutes les autres variablessont fixées, est la même quelles que soient les valeurs <strong>de</strong> ces autres variables.Définition 3.7. Soit X, Y <strong>et</strong> Z trois ensembles non vi<strong>de</strong>s disjoints formant une partition <strong>de</strong> V . X<strong>et</strong> Y sont conditionnellement préférentiellement indépendants étant donné Z si <strong>et</strong> seulement si∀z ∈ D(Z), ∀x 1 ,x 2 ∈ D(X) <strong>et</strong> ∀y 1 ,y 2 ∈ D(Y) on a :x 1 y 1 z ≽ x 2 y 1 z si <strong>et</strong> seulement si x 1 y 2 z ≽ x 2 y 2 zPour une valeur <strong>de</strong> Z fixée, la relation <strong>de</strong> préférence sur les instanciations <strong>de</strong> X est la même quellesque soient les valeurs <strong>de</strong>s instanciations <strong>de</strong> Y .3.2.2 CP-n<strong>et</strong>s3.2.2.1 Définitions généralesLes CP-n<strong>et</strong>s ont été introduits dans [Boutilier <strong>et</strong> al., 1999] comme un outil pour représenter compactementles relations <strong>de</strong> préférences qualitatives. Ce modèle graphique utilise l’indépendance préférentielleconditionnelle pour structurer les préférences d’un agent sous l’hypothèse C<strong>et</strong>eris Paribus.Ils ont été principalement étudiés dans [Domshlak, 2002], [Boutilier <strong>et</strong> al., 2004a] ou encore[Boutilier <strong>et</strong> al., 2004b].Jeux booléens 75


Jeux booléens <strong>et</strong> préférences non dichotomiquesLes CP-n<strong>et</strong>s peuvent être utilisés dans le cadre <strong>de</strong>s jeux booléens <strong>de</strong> façon à représenter les préférences<strong>de</strong> chaque joueur. On ne considèrera plus que les buts <strong>de</strong>s joueurs sont représentés par uneformule logique, mais directement par un CP-n<strong>et</strong> propositionnel (pour lequel les domaines <strong>de</strong>s variablessont binaires). Dans ce contexte, ∀x i ∈ V ,D(x i ) = {x i ,x i } = 2 x i<strong>et</strong> D({x 1 ...x p }) = 2 {x 1,...,x p } .Ainsi, un élément <strong>de</strong> D(x i ) correspond à une {x i }-interprétation, <strong>et</strong> un élément <strong>de</strong> D({x 1 ...x p }) estune {x 1 ...x p }-interprétation.Définition 3.8. Pour chaque variable X ∈ V , un ensemble <strong>de</strong> variables parents, noté Pa(X), est spécifié.Ces variables sont celles qui influent sur les préférences <strong>de</strong> l’agent entre les différentes valeurs<strong>de</strong> X. Formellement, X <strong>et</strong> V \ ({X} ∪ Pa(X)) sont conditionnellement préférentiellement indépendantesétant donné Pa(X).La table <strong>de</strong> préférence conditionnelle (notée CPT) décrit les préférences <strong>de</strong> l’agent sur les valeurs<strong>de</strong> la variable X, étant données toutes les combinaisons <strong>de</strong>s valeurs <strong>de</strong>s variables parents.Pour chaque instanciation <strong>de</strong> Pa(X), CPT(X) spécifie un ordre total sur D(X) tel que ∀x i ,x j ∈ D(X)on ait soit x i ≻ x j , soit x j ≻ x i .Soit V = {X 1 ,...,X n } un ensemble <strong>de</strong> variables.N = 〈G,T 〉 est un CP-n<strong>et</strong> sur V,G étant un grapheorienté sur V , <strong>et</strong>T étant un ensemble <strong>de</strong> tables <strong>de</strong> préférences conditionnelles CPT(X i ) pour chaqueX i ∈ V . Chaque table <strong>de</strong> préférence conditionnelle CPT(X i ) est associée à un ordre total ≻ i p , selonchaque instanciation p ∈ D(Pa(X i )).Illustrons ces définitions avec un exemple simple :Exemple 3.4. Soit le CP-n<strong>et</strong> présenté sur la figure 3.1 qui exprime mes préférences sur le menu dudîner. Ce CP-n<strong>et</strong> est composé <strong>de</strong> <strong>de</strong>ux variables, S <strong>et</strong> V qui correspon<strong>de</strong>nt respectivement à la soupe<strong>et</strong> au vin. Je préfère strictement manger une soupe <strong>de</strong> poisson (S p ) plutôt qu’une soupe <strong>de</strong> légumes(S l ), tandis que mes préférences sur le vin rouge (V r ) ou blanc (V b ) dépen<strong>de</strong>nt <strong>de</strong> la soupe que jemangerai. En eff<strong>et</strong> je préfère du vin rouge avec une soupe <strong>de</strong> légumes, mais du blanc avec une soupe<strong>de</strong> poisson. On a donc D(S) = {S p ,S l } <strong>et</strong> D(V) = {V r ,V b }.SS p ≻ S lVS pS lV b ≻ V rV r ≻ V bFigure 3.1 — CP-n<strong>et</strong> “Mon dîner simple”3.2.2.2 Sémantique <strong>de</strong>s CP-n<strong>et</strong>sLa sémantique <strong>de</strong>s CP-n<strong>et</strong>s a été principalement étudiée dans [Domshlak, 2002], [Boutilier <strong>et</strong> al.,2004a] ou encore [Boutilier <strong>et</strong> al., 2004b].Informellement, un CP-n<strong>et</strong>N est satisfait par ≻ si ≻ satisfait chacune <strong>de</strong>s préférences conditionnellesexprimées dans les CPTs <strong>de</strong>N sous l’interprétation c<strong>et</strong>eris paribus.76 Elise Bonzon


3.2. Jeux booléens <strong>et</strong> CP-n<strong>et</strong>sDéfinition 3.9. SoitN un CP-n<strong>et</strong> sur les variables V . Soit X ∈ V une variable, U ⊆ V les parents <strong>de</strong>X dans N , <strong>et</strong> Y = V \(U ∪ {X}). Soit ≻ u une relation d’ordre sur D(X) dictée par CPT(X) pourl’instanciation u ∈ D(U) <strong>de</strong>s parents <strong>de</strong> X. Soit enfin ≻ une relation <strong>de</strong> préférence sur D(V).1. Une relation <strong>de</strong> préférence ≻ satisfait ≻ u si <strong>et</strong> seulement si yux i ≻ yux j , pour tout y ∈ D(Y), àchaque fois que x i ≻ u x j .2. Une relation <strong>de</strong> préférence ≻ satisfait CPT(X) si <strong>et</strong> seulement si ≻ satisfait ≻ u pour chaqueu ∈ D(U).3. Une relation <strong>de</strong> préférence ≻ satisfait le CP-n<strong>et</strong>N si <strong>et</strong> seulement si elle satisfait CPT(X) pourchaque variable X.Un CP-n<strong>et</strong>N est satisfiable si <strong>et</strong> seulement si il existe une relation ≻ qui le satisfait.Définition 3.10. Soit N un CP-n<strong>et</strong> sur les variables V , <strong>et</strong> o,o ′ ∈ D(V) <strong>de</strong>ux états quelconques. Nentraîne o ≻ o ′ (i.e. l’état o est préféré à o ′ ), notéN |= o ≻ o ′ , si <strong>et</strong> seulement si o ≻ o ′ dans chaquerelation <strong>de</strong> préférence qui satisfaitN.On dit alors que o ≻ o ′ est une conséquence <strong>de</strong>N.L’ensemble <strong>de</strong>s conséquences o ≻ o ′ d’un CP-n<strong>et</strong> constitue un ordre partiel sur les états : o est préferréà o ′ dans c<strong>et</strong>te relation d’ordre si <strong>et</strong> seulement si N |= o ≻ o ′ . C<strong>et</strong> ordre partiel peut être représentépar un graphe orienté, que l’on appelera graphe <strong>de</strong> préférences induit, ou pré-ordre associé àN :1. Les nœuds du graphe <strong>de</strong> préférences correspon<strong>de</strong>nt à l’affectation <strong>de</strong> toutes les variables duCP-n<strong>et</strong>,2. il y a un arc du nœud o au nœud o ′ si <strong>et</strong> seulement si les affectations <strong>de</strong> o <strong>et</strong> o ′ ne diffèrent quepour la valeur d’une seule variable X, <strong>et</strong> si, étant donné Pa(X), la valeur assignée par o à X estpréférée à la valeur assignée par o ′ à X 5 .La ferm<strong>et</strong>ure transitive <strong>de</strong> ce graphe spécifie les ordres partiels sur les états induits par le CP-n<strong>et</strong>. Plusprécisément, nous avonsN |= o ≻ o ′ si <strong>et</strong> seulement si il existe un chemin <strong>de</strong> o à o ′ dans le graphe <strong>de</strong>préférences induit parN.Formellement, la relation <strong>de</strong> préférence induite parN , représentée par le graphe <strong>de</strong> préférences induit,est définie comme suit :Définition 3.11. La relation <strong>de</strong> préférence sur les états induite par un CP-n<strong>et</strong> N est dénotée par≻ N , <strong>et</strong> est définie par ∀o,o ′ ∈ D(V), o ≻ N o ′ si <strong>et</strong> seulement siN |= o ≻ o ′ .Exemple 3.4 (page précé<strong>de</strong>nte), suite : La figure 3.2 (page suivante) représente la relation <strong>de</strong> préférenceinduite par ce CP-n<strong>et</strong>. L’élément du bas (S l ∧V b ) représente le pire état tandis que l’élémentdu haut (S p ∧V b ) est le meilleur état possible.Nous remarquons ici que nous avons une flèche entre les nœuds (S l ∧ V b ) <strong>et</strong> (S p ∧ V b ) car nouscomparons les états 2 par 2, toutes choses étant égales par ailleurs.Nous pouvons donc ordonner totalement les états possibles (du plus préféré au moins préféré) :(S p ∧V b ) ≻ (S p ∧V r ) ≻ (S l ∧V r ) ≻ (S l ∧V b )5 La représentation graphique <strong>de</strong>s préférences que nous utilisons ici dans le cadre <strong>de</strong>s CP-n<strong>et</strong>s est contraire à la représentationutilisée dans la littérature [Boutilier <strong>et</strong> al., 2004a,b] : dans c<strong>et</strong>te <strong>de</strong>rnière les flèches vont <strong>de</strong> l’état le moins préférévers le plus préféré. Afin d’homogénéiser c<strong>et</strong>te section avec la section 3.3 (page 99) nous choisissons ici d’orienter lesflèches <strong>de</strong> l’état le plus préféré vers l’état le moins préféré.Jeux booléens 77


Jeux booléens <strong>et</strong> préférences non dichotomiquesS p ∧V bS p ∧V rS l ∧V rS l ∧V bFigure 3.2 — Graphe <strong>de</strong> préférences induit par le CP-n<strong>et</strong> “Mon dîner simple”C<strong>et</strong>te relation ≻ est la seule relation <strong>de</strong> préférence qui satisfasse ce CP-n<strong>et</strong>.Théorème 3.1 ([Boutilier <strong>et</strong> al., 2004a]). Tout CP-n<strong>et</strong> acyclique est satisfiable.Lemme 3.1 ([Boutilier <strong>et</strong> al., 2004a]). La conséquence préférentielle en ce qui concerne un CP-n<strong>et</strong>est transitive. Donc, si o ≻ N o ′ <strong>et</strong> o ′ ≻ N o ′′ alors o ≻ N o ′′ .Ce lemme nous perm<strong>et</strong> <strong>de</strong> simplifier les futurs schémas. Par exemple, sur la figure 3.2 <strong>de</strong>l’exemple 3.4, nous pouvons supprimer la flèche entre les nœuds (S l ∧V b ) <strong>et</strong> (S p ∧V b ) car elle estdéductible par transitivité.Définition 3.12. SoitN un CP-n<strong>et</strong> sur les variables V . D(V) dénote l’ensemble <strong>de</strong> toutes les instanciations<strong>de</strong> V .On appelle ensemble <strong>de</strong>s résultats optimaux <strong>de</strong>N l’ensemble d’états O tel que ∀o ∈ O,N |= o ≻ o ′pour tout o ′ ∈ D(V)\ O.Chercher le résultat optimal d’un CP-n<strong>et</strong> N consiste intuitivement à parcourir le graphe <strong>de</strong> haut enbas (c’est-à-dire <strong>de</strong>s parents aux <strong>de</strong>scendants), en instanciant chaque variable à sa valeur préféréeselon l’instanciation <strong>de</strong> ses parents. C<strong>et</strong>te procédure est appelée recherche avant (forward sweep).Par exemple, sur la figure 3.2 <strong>de</strong> l’exemple 3.4, le résultat optimal sera (S p ∧V b ).Dans [Boutilier <strong>et</strong> al., 1999], il est montré que si le CP-n<strong>et</strong> N est acyclique, le résultat sera unique.Par contre, en cas d’un graphe cyclique, il peut y avoir plusieurs résultats optimaux, comme il peutn’y en avoir aucun.Lemme 3.2. [Boutilier <strong>et</strong> al., 1999] SoitN un CP-n<strong>et</strong> acyclique sur un ensemble <strong>de</strong> variables V . Laprocédure <strong>de</strong> recherche en avant (forward sweep procedure) construit le résultat optimal dans D(V).Les CP-n<strong>et</strong>s sont utilisés dans [Apt <strong>et</strong> al., 2005], pour représenter <strong>de</strong>s jeux : les CP-n<strong>et</strong>s sont vuscomme <strong>de</strong>s jeux en forme normale <strong>et</strong> vice versa. Il est alors montré dans [Apt <strong>et</strong> al., 2005] qu’unprofil <strong>de</strong> stratégies est un équilibre <strong>de</strong> Nash du jeu G si <strong>et</strong> seulement si c’est un résultat optimal duCP-n<strong>et</strong> N (G). De même, dans la traduction inverse, il est montré qu’un profil <strong>de</strong> stratégies est unrésultat optimal d’un CP-n<strong>et</strong> si <strong>et</strong> seulement si c’est un équilibre <strong>de</strong> Nash du jeu associé. Nous enparlerons plus longuement dans la section 4.2.1 (page 127).3.2.2.3 Utilisation <strong>de</strong>s CP-n<strong>et</strong>s dans les jeux booléensLes définitions classiques <strong>de</strong>s CP-n<strong>et</strong>s doivent être adaptées pour pouvoir être appliquées à <strong>de</strong>s jeuxbooléens. En eff<strong>et</strong>, nous sommes ici dans un contexte particulier où les variables que nous manipulons78 Elise Bonzon


3.2. Jeux booléens <strong>et</strong> CP-n<strong>et</strong>ssont booléennes, <strong>et</strong> où nous avons plusieurs joueurs. Dans ce contexte, chaque joueur doit pouvoirchoisir la stratégie qui lui perm<strong>et</strong>tra d’obtenir le “meilleur résultat possible”. Pour ce faire, nouspouvons utiliser les notions définies en section 3.1 (page 71) pour calculer les équilibres <strong>de</strong> Nash <strong>et</strong>les stratégies dominées, à condition <strong>de</strong> disposer d’une relation <strong>de</strong> préférence pour chaque joueur surl’ensemble <strong>de</strong>s profils <strong>de</strong> stratégies. Les CP-n<strong>et</strong>s interviennent ici puisqu’ils constituent un outil <strong>de</strong>représentation <strong>de</strong>s préférences <strong>et</strong> fourniront ainsi les relations <strong>de</strong> préférences <strong>de</strong> chaque joueur.Définition 3.13. La table <strong>de</strong> préférence conditionnelle pour un jeu booléen (notée CPT i (X)) décritles préférences du joueur i sur les valeurs <strong>de</strong> la variable X, étant données toutes les combinaisons<strong>de</strong>s valeurs <strong>de</strong>s variables parents.Pour chaque instanciation p <strong>de</strong> Pa i (X), CPT i (X) spécifie un ordre total tel que l’on ait soit x ≻ i,p x,soit x ≻ i,p x.Définition 3.14. Un CP-jeu booléen est un 5-tuple G = (N,V,Γ,π,Φ), où N = {1,... ,n} est unensemble <strong>de</strong> joueurs, V = {x 1 ,...,x n } est un ensemble <strong>de</strong> variables, Φ = 〈N 1 ,...,N n 〉, chaque N iétant un CP-n<strong>et</strong> sur V <strong>et</strong>, pour tout i ∈ N, ≽ i =≽ Ni.La gran<strong>de</strong> différence entre les CP-n<strong>et</strong>s classiques <strong>et</strong> ceux que nous introduisons dans les jeux booléensest l’introduction <strong>de</strong> contraintes. Les CP-n<strong>et</strong>s avec contraintes ont été étudiés parallèlement dans[Boutilier <strong>et</strong> al., 2004b] <strong>et</strong> [Prestwich <strong>et</strong> al., 2004].Dans [Prestwich <strong>et</strong> al., 2004], les préférences sont exprimées sur toutes les issues du jeu, les états nerespectant pas les contraintes étant considérés comme inaccessibles. S’il existe un état accessible <strong>et</strong>non dominé, ce <strong>de</strong>rnier est le résultat optimal.Dans [Boutilier <strong>et</strong> al., 2004b], les préférences exprimées dans les CPTs du CP-n<strong>et</strong> doivent respecterles contraintes : si par exemple une contrainte est du type a ↔ b, <strong>et</strong> que a ∈ P(b), les préférencessur b seront i<strong>de</strong>ntiques à celles sur a (si a est indépendant <strong>et</strong> que a ≻ a, alors on aura b ≻ b ′ ). Unalgorithme, appelé Search-CP, perm<strong>et</strong> alors <strong>de</strong> trouver l’ensemble <strong>de</strong> résultats optimaux qui sontaccessibles (c’est-à-dire qui respectent les contraintes), <strong>et</strong> qui ne sont pas dominés par un autre étataccessible. Nous choisissons ici d’utiliser c<strong>et</strong>te métho<strong>de</strong>.Exemple 3.5. Soit le jeu G = (N,V ,Γ,π,Φ) suivant :∗ N = {1,2,3}∗ V = {a,b,c}, avec D(a) = {a,a}, D(b) = {b,b} <strong>et</strong> D(c) = {c,c}.∗ γ 1 = γ 2 = γ 3 = ⊤,∗ π 1 = {a}, π 2 = {b}, π 3 = {c},∗ Le but du joueur 1 est représenté par le CP-n<strong>et</strong> <strong>et</strong> la relation <strong>de</strong> préférence induite figure 3.3(page suivante),∗ Le but du joueur 2 est représenté par le CP-n<strong>et</strong> <strong>et</strong> la relation <strong>de</strong> préférence induite figure 3.4(page suivante),∗ Le but du joueur 3 est représenté par le CP-n<strong>et</strong> <strong>et</strong> la relation <strong>de</strong> préférence induite figure 3.5(page 81).Pour calculer facilement les équilibres <strong>de</strong> Nash <strong>de</strong> ce jeu, nous m<strong>et</strong>tons en exergue les relations quinous intéressent pour chaque joueur. Ces relations apparaissent sous la forme <strong>de</strong> flèches en pointillésur la figure 3.3 (page suivante).En eff<strong>et</strong>, pour le joueur 1, qui contrôle la variable a, nous comparons les états abc <strong>et</strong> abc, les étatsabc, abc, les états abc <strong>et</strong> abc, <strong>et</strong> enfin les états abc <strong>et</strong> abc.Jeux booléens 79


Jeux booléens <strong>et</strong> préférences non dichotomiquesa ≻ aAb ≻ babcBabcCabc abca ∧ b c ≻ ca ∧ b c ≻ cabc abc abca ∧ b c ≻ cabca ∧ b c ≻ c(a)(b)Figure 3.3 — CP-n<strong>et</strong> <strong>de</strong>s préférences <strong>et</strong> le pré-ordre associé du joueur 1Cela revient à comparer pour chaque joueur uniquement les stratégies <strong>de</strong> ce <strong>de</strong>rnier pour chaquecombinaison <strong>de</strong> stratégies <strong>de</strong>s autres joueurs. Notons que ces flèches en pointillé représentent unerelation d’ordre transitive.a ≻ aAa ∧ ba ∧ ba ∧ bCc ≻ cc ≻ cc ≻ ca ∧ b c ≻ c(a)b ≻ bBabcabcabcabcabcabcFigure 3.4 — CP-n<strong>et</strong> <strong>de</strong>s préférences <strong>et</strong> le pré-ordre associé du joueur 2Le calcul <strong>de</strong>s équilibres <strong>de</strong> Nash faibles <strong>et</strong> forts nous donne ici comme résultat :NE f aible = NE f ort = {abc}(b)abcabcEtudions à présent les stratégies dominées <strong>de</strong> ce jeu :∗ Joueur 1 : Il est possible d’éliminer la stratégie a <strong>de</strong> ce joueur, qui est strictement dominée parla stratégie a.∗ Joueur 2 : Une fois la stratégie a du joueur 1 éliminée, la stratégie b du joueur 2 dominestrictement sa stratégie b. On élimine c<strong>et</strong>te <strong>de</strong>rnière.∗ Joueur 3 : Après élimination <strong>de</strong> ces 2 stratégies, c domine c pour le joueur 3.En éliminant itérativement les stratégies strictement dominées, on obtient donc un profil <strong>de</strong> stratégiesrésultat : {abc}, qui se trouve être aussi l’équilibre <strong>de</strong> Nash faible <strong>et</strong> fort. De plus, ce sont ici <strong>de</strong>sstratégies strictement dominées. L’ordre d’élimination <strong>de</strong> ces stratégies n’affecte donc pas le résultat.80 Elise Bonzon


3.2. Jeux booléens <strong>et</strong> CP-n<strong>et</strong>sabcAa ≻ aabcabcCaac ≻ cc ≻ cabcabcabcBccb ≻ bb ≻ babc(a)(b)abcFigure 3.5 — CP-n<strong>et</strong> <strong>de</strong>s préférences <strong>et</strong> le pré-ordre associé du joueur 3Etudions à présent un exemple avec <strong>de</strong>s contraintes, en choisissant la métho<strong>de</strong> introduite dans[Boutilier <strong>et</strong> al., 2004b] : nous ne représenterons que les préférences respectant les contraintes données.Exemple 3.6. Soit le jeu G = (N,V ,Γ,π,Φ) suivant :∗ N = {1,2}∗ V = {a,b,c}, avec D(a) = {a,a}, D(b) = {b,b} <strong>et</strong> D(c) = {c,c}.∗ γ 1 = {a ↔ b}, γ 2 = ⊤,∗ π 1 = {a,b}, π 2 = {c},∗ Le but du joueur 1 est représenté par le CP-n<strong>et</strong> <strong>et</strong> la relation <strong>de</strong> préférence induite figure 3.6,∗ Le but du joueur 2 est représenté par le CP-n<strong>et</strong> <strong>et</strong> la relation <strong>de</strong> préférence induite figure 3.7(page suivante),a ≻ aACb ≻ bBabcabcabca ∧ ba ∧ bc ≻ cc ≻ cabc(a)Figure 3.6 — CP-n<strong>et</strong> <strong>de</strong>s préférences <strong>et</strong> le pré-ordre associé du joueur 1On remarque que le joueur 1 n’exprime pas ses préférences sur c s’il choisit ab ou ab, ces <strong>de</strong>uxétats étant inaccessibles. Il est cependant possible <strong>de</strong> construire la relation <strong>de</strong> préférence associée en(b)Jeux booléens 81


Jeux booléens <strong>et</strong> préférences non dichotomiquesutilisant la relation <strong>de</strong> transitivité (lemme 3.1 (page 78)) : nous savons ici que les états contenant abseront toujours préférés aux états contenant ab.abcAa ≻ aabcabcCaac ≻ cc ≻ cabcabcabcBccb ≻ bb ≻ babc(a)(b)abcFigure 3.7 — CP-n<strong>et</strong> <strong>de</strong>s préférences <strong>et</strong> le pré-ordre associé du joueur 2Pour calculer les équilibres <strong>de</strong> Nash <strong>de</strong> ce jeu, on ne s’occupe que <strong>de</strong>s profils <strong>de</strong> stratégies présentsdans les relations <strong>de</strong> préférence <strong>de</strong>s <strong>de</strong>ux joueurs : par exemple, le profil <strong>de</strong> stratégies abc viole lescontraintes du joueur 1 <strong>et</strong> ne peut donc pas être un PNE. Le calcul <strong>de</strong>s équilibres <strong>de</strong> Nash faibles <strong>et</strong>forts nous donne ainsi ici comme résultat :NE f aible = NE f ort = {abc}L’élimination <strong>de</strong>s stratégies dominées fournit le même résultat.3.2.3 Propriétés <strong>de</strong>s CP-jeux booléens3.2.3.1 Stratégies dominéesIl faut tout d’abord remarquer que, dans ce cadre <strong>de</strong> travail, il ne peut y avoir “égalité” entre <strong>de</strong>uxprofils <strong>de</strong> stratégies, les CP-n<strong>et</strong>s ne perm<strong>et</strong>tant pas <strong>de</strong> modéliser l’indifférence 6 . On sait donc alorsque les stratégies faiblement <strong>et</strong> strictement dominées sont i<strong>de</strong>ntiques. Plusieurs propriétés découlent<strong>de</strong> c<strong>et</strong>te constatation.Propriété 3.2. Soit G un CP-jeu booléen tel que le graphe G i pour le joueur i est acyclique. i aune stratégie dominée si <strong>et</strong> seulement si i contrôle une variable indépendante (pour ≽ i ) <strong>de</strong> toutes lesautres variables, c’est-à-dire si <strong>et</strong> seulement si il existe une variable v ∈ π i telle que Pa(v) = ∅.Dans ce cas, s i domine s ′ i si <strong>et</strong> seulement si (s i) v ≻ i (s ′ i ) v.Preuve :⇒ Supposons que ∀v ∈ π i , Pa(v) ̸= ∅. Comme le graphe G i est acyclique, noussavons qu’il existe v ∈ π i telle que Pa(v) ⊆ π −i . Il existe donc une instanciation6 Hypothèse que nous relaxerons dans la section 3.2.4 (page 96)82 Elise Bonzon


3.2. Jeux booléens <strong>et</strong> CP-n<strong>et</strong>su v <strong>de</strong> tous les parents <strong>de</strong> v telle que v ≻ i,uv v ; <strong>et</strong> il existe une autre instanciationu ′ v <strong>de</strong> tous les parents <strong>de</strong> v telle que v ≻ i,u ′ vv (sinon le graphe pourrait êtresimplifié <strong>de</strong> façon à avoir Pa(v) = ∅). Pour tout s i ∈ S i , il existe s ′ i ∈ S i <strong>et</strong> ilexiste s −i ∈ S −i tels que soit (s i ,s −i ) ≺ i,uv (s ′ i ,s −i), soit (s i ,s −i ) ≺ i,u ′ v(s ′ i ,s −i).i n’a donc aucune stratégie dominée.⇐ Supposons que i est un joueur, <strong>et</strong> qu’il existe v ∈ π i tel que Pa(v) = ∅.On a donc soit v ≻ i v, soit v ≻ i v. La stratégie s i , définie en assignant lameilleure valeur à v (i.e. v dans le premier cas), est préférée par i à tous lesautres s ′ i définies en assignant l’autre valeur à v (i.e. v dans le premier cas).Comme Pa(v) = ∅, nous savons que ∀s −i ∈ S −i , (s i ,s −i ) ≻ i (s ′ i ,s −i).SiG i n’est pas acyclique, i peut avoir une stratégie dominée même si ̸ ∃v ∈ π i tel que Pa(v) = ∅.Exemple 3.7. Soit G = (N,V ,π,Γ,Φ), avec N = {1,2}, V = {a,b,c,d}, π 1 = {a,b}, π 2 = {c,d},γ 1 = γ 2 = ⊤,N 1 <strong>et</strong>N 2 sont représentés sur la figure suivante :bba ≻ aa ≻ aACc ≻ ca ≻ aACddc ≻ cc ≻ caab ≻ bb ≻ bBDd ≻ db ≻ bBDccd ≻ dd ≻ dN 1N 2La stratégie ab domine toutes les autres stratégies du joueur 1, même si Pa(a) = b <strong>et</strong> Pa(b) = a.DansN 1 , la configuration <strong>de</strong> a <strong>et</strong> b, contrôlées par le joueur 1, est la même que la configuration <strong>de</strong> c<strong>et</strong> d dansN 2 , qui sont contrôlés par le joueur 2. Pourtant, 2 n’a aucune stratégie dominée.3.2.3.2 Equilibres <strong>de</strong> Nash en stratégies puresLemme 3.3. Soit G = (N,V ,π,Γ,Φ) un CP-jeu booléen tel que les graphes G i sont tous acycliques,<strong>et</strong> soit i ∈ N. Pour tout s −i ∈ S −i il existe une meilleure réponse pour i, c’est-à-dire, une stratégies ∗ i ∈ S i telle que pour tout s ′ i ̸= s∗ i , (s∗ i ,s −i) ≻ i (s ′ i ,s −i).Preuve du lemme : Supposons que s ∗ i n’existe pas. Dans ce cas, ∃s −i ∈ S −i telque ∀s i ∈ S i , ∃s ′ i ̸= s i tel que (s ′ i ,s −i) ≻ i (s i ,s −i ). Puis, il existe un s ′′i ̸= s ′ i tel que(s ′′i ,s −i) ≻ i (s ′ i ,s −i), <strong>et</strong> ainsi <strong>de</strong> suite. Comme chaque joueur a un nombre fini <strong>de</strong>stratégies, <strong>et</strong> que ≻ i est transitive, ∃s i ,s ′ i ∈ S i tels que (s ′ i ,s −i) ≻ i (s i ,s −i ), (s ′′i ,s −i) ≻ i(s ′ i ,s −i) <strong>et</strong> (s i ,s −i ) ≻ i (s ′′i ,s −i), ce qui est en contradiction avec le fait que G i estacyclique.Jeux booléens 83


Jeux booléens <strong>et</strong> préférences non dichotomiquesComme s ∗ i ne dépend que <strong>de</strong> s −i , la meilleure réponse <strong>de</strong> i à s −i peut être notée par r i (s −i ). Alors :Lemme 3.4. s est un équilibre <strong>de</strong> Nash fort en stratégies pures si <strong>et</strong> seulement si pour tout i, s i =r i (s −i ).Preuve du lemme :⇒ Soit s = (s 1 ,...,s n ) un équilibre <strong>de</strong> Nash fort en stratégies pures : ∀i ∈ N,∀s ′ i ∈ S i, (s i ,s −i ) ≽ i (s ′ i ,s −i). Mais, par définition d’un CP-n<strong>et</strong>, nous ne pouvonspas avoir d’égalité entre <strong>de</strong>ux profils <strong>de</strong> stratégies. Nous savons donc que(s i ,s −i ) ̸= i (s ′ i ,s −i) si s i ̸= s ′ i . Donc, ∀i ∈ N, ∀s′ i ̸= s i ∈ S i , (s i ,s −i ) ≻ i (s ′ i ,s −i),<strong>et</strong> alors ∀i ∈ N, s i = r i (s −i ).⇐ ∀i ∈ N, soit s i = r i (s −i ). Par définition, nous avons ∀s ′ i ̸= s i ∈ S i , (s i ,s −i ) ≻ i(s ′ i ,s −i). Alors, ∀i ∈ N, ∀s ′ i ∈ S i, (s i ,s −i ) ≽ i (s ′ i ,s −i) : s est un équilibre <strong>de</strong>Nash fort en stratégies pures.Propriété 3.3. Dans un CP-jeu booléen acyclique, les équilibres <strong>de</strong> Nash faibles <strong>et</strong> forts sont i<strong>de</strong>ntiques.Preuve : Il est évi<strong>de</strong>nt que NE f ort ⊆ NE f aible . Vérifions que NE f aible ⊆ NE f ort .Supposons que s est un équilibre <strong>de</strong> Nash faible, mais pas un équilibre <strong>de</strong> Nashfort. D’après le Lemme 3.4, il existe alors un i ∈ N tel que s i ̸= r i (s −i ). Mais,(r i (s −i ),s −i ) ≻ i (s ′ i ,s −i) pour tout s ′ i , <strong>et</strong> en particulier pour s′ i = s i. s ne peut doncpas être un équilibre <strong>de</strong> Nash faible en stratégies pures.Si les graphes ne sont pas tous acycliques, c<strong>et</strong>te propriété n’est plus garantie :Exemple 3.8. Soit G = (N,V,π,Γ,Φ) un CP-jeu booléen, avec N = {1,2}, V = {a,b}, π 1 = {a},π 2 = {b}, γ 1 = γ 2 = ⊤. Les CP-n<strong>et</strong>s <strong>de</strong>s joueurs sont représentés sur la figure suivante :Joueur 1Joueur 2Baab ≻ bb ≻ bAa ≻ aAbba ≻ aa ≻ aBb ≻ bLes équilibres <strong>de</strong> Nash sont les suivants : NE f ort = ∅, NE f aible = {ab,ab}.En conséquence, on parlera dans la suite d’équilibres <strong>de</strong> Nash en stratégies pures (au lieu d’équilibresforts ou faibles) aussitôt que le graphe associé à chaque joueur est acyclique.84 Elise Bonzon


3.2. Jeux booléens <strong>et</strong> CP-n<strong>et</strong>s3.2.3.3 CP-jeux booléens avec graphe acyclique commun à tous les joueursExaminons à présent ce qui se passe lorsque tous les joueurs ont le même graphe, ce <strong>de</strong>rnier étantacyclique.Exemple 3.9. Soit le jeu G = (N,V ,π,Γ,ϕ) suivant :∗ N = {1,2,3}∗ V = {a,b,c,d,e}, avec D(a) = {a,a}, D(b) = {b,b}, D(c) = {c,c}, D(d) = {d,d}, D(e) ={e,e}∗ γ 1 = γ 2 = γ 3 = ⊤,∗ π 1 = {a,d}, π 2 = {b}, π 3 = {c,e},∗ Les buts <strong>de</strong>s trois joueurs sont représentés par un même graphe acyclique. Par contre, lesjoueurs n’ont pas les mêmes tables <strong>de</strong> préférences conditionnelles (représentées figure 3.8 pourle joueur 1, figure 3.9 pour le joueur 2 <strong>et</strong> figure 3.10 (page suivante) pour le joueur 3).a ≻ aADa ∧ ca ∧ cd ≻ dd ≻ da ∧ bc ≻ ca ∧ cd ≻ da ∧ ba ∧ bc ≻ cc ≻ cCa ∧ cd ≻ da ∧ b c ≻ cd e ≻ eb ≻ b BEd e ≻ eFigure 3.8 — CP-n<strong>et</strong> <strong>de</strong>s préférences du joueur 1a ≻ aADa ∧ ca ∧ cd ≻ dd ≻ da ∧ bc ≻ ca ∧ cd ≻ da ∧ ba ∧ bc ≻ cc ≻ cCa ∧ cd ≻ da ∧ b c ≻ cd e ≻ eb ≻ b BEd e ≻ eFigure 3.9 — CP-n<strong>et</strong> <strong>de</strong>s préférences du joueur 2Jeux booléens 85


Jeux booléens <strong>et</strong> préférences non dichotomiquesa ≻ aADa ∧ ca ∧ cd ≻ dd ≻ da ∧ bc ≻ ca ∧ cd ≻ da ∧ ba ∧ bc ≻ cc ≻ cCa ∧ cd ≻ da ∧ bb ≻ bc ≻ cBFigure 3.10 — CP-n<strong>et</strong> <strong>de</strong>s préférences du joueur 3Ed<strong>de</strong> ≻ ee ≻ eEn étudiant ce jeu, on constate tout d’abord que le joueur 1 va instancier la variable a, qui est indépendantepréférentiellement, <strong>de</strong> façon à satisfaire au mieux ses préférences. a sera donc instanciée àvrai. De même, le joueur 2 instanciera b à vrai.Le joueur 3 sait que les joueurs 1 <strong>et</strong> 2 ont instancié leurs variables a <strong>et</strong> b <strong>de</strong> c<strong>et</strong>te façon : il connaîtleurs préférences <strong>et</strong> sait que ce sont <strong>de</strong>s joueurs rationnels. La variable c <strong>de</strong>vient donc indépendantepréférentiellement selon l’instanciation <strong>de</strong> a <strong>et</strong> b. Il va donc instancier la variable c à vrai.L’instanciation <strong>de</strong> la variable c par le joueur 3 perm<strong>et</strong> à 1 d’instancier d à faux, ce qui perm<strong>et</strong> enfinà 3 d’instancier e à faux.On obtient donc le profil <strong>de</strong> stratégies s = abc<strong>de</strong>. s est le seul équilibre <strong>de</strong> Nash <strong>de</strong> ce jeu.En suivant le raisonnement donné par c<strong>et</strong> exemple, nous obtenons ainsi la propriété suivante :Propriété 3.4. Soit G = (N,V,π,Γ,Φ) un CP-jeu booléen tel que les graphesG i sont tous i<strong>de</strong>ntiques(∀i, j,G i =G j ) <strong>et</strong> acycliques.Ce jeu G ainsi défini aura alors un <strong>et</strong> un seul équilibre <strong>de</strong> Nash en stratégie pure.La preuve <strong>de</strong> c<strong>et</strong>te propriété utilise la notion <strong>de</strong> recherche du résultat optimal (Outcome optimizationqueries) introduite par [Boutilier <strong>et</strong> al., 1999, 2004a] (voir définition 3.12 (page 78)), qui consisteintuitivement à parcourir le graphe <strong>de</strong>s parents aux <strong>de</strong>scendants, en instanciant chaque variable àsa valeur préférée selon l’instanciation <strong>de</strong> ses parents. C<strong>et</strong>te procédure est appelée recherche avant(forward sweep).C’est exactement c<strong>et</strong>te procédure que nous appliquons pour prouver la propriété précé<strong>de</strong>nte, <strong>et</strong> quinous perm<strong>et</strong> <strong>de</strong> déterminer l’unique équilibre <strong>de</strong> Nash d’un jeu dont les CP-n<strong>et</strong>s représentant les buts<strong>de</strong>s joueurs forment tous le même graphe acyclique.Preuve : Nous allons faire c<strong>et</strong>te démonstration en <strong>de</strong>ux temps : tout d’abord nousdémontrerons l’existence <strong>de</strong> c<strong>et</strong> équilibre <strong>de</strong> Nash, puis nous en démontrerons l’unicité.∗ Existence :Soit (x 1 ,...,x k ) un ordre topologique sur V respectant G i (pour tout i puisqueles graphes sont i<strong>de</strong>ntiques). On définit un équilibre <strong>de</strong> Nash en stratégies86 Elise Bonzon


3.2. Jeux booléens <strong>et</strong> CP-n<strong>et</strong>spures s comme suit.Soit a le joueur contrôlant la variable x 1 . Par contruction, nous avons Pa(x 1 ) =∅, <strong>et</strong> soit x 1 ≻ a x 1 , soit x 1 ≻ a x 1 . Soit la stratégie s a assignant la meilleurevaleur à x 1 (i.e. x 1 dans le premier cas, x 1 dans le second). Il est possible <strong>de</strong>procé<strong>de</strong>r <strong>de</strong> même pour toutes les variables selon l’ordre topologique, puisquepar définition lorsque l’on doit instancier la variable x i , les valeurs <strong>de</strong> tous sesparents ont été auparavant fixées. On obtient donc un profil <strong>de</strong> stratégies s.Nous allons à présent montrer que ce profil <strong>de</strong> stratégies s = s 1 ...s n est unéquilibre <strong>de</strong> Nash en stratégies pures. Supposons qu’il n’en est pas un. Dansce cas, soit un joueur i <strong>et</strong> une stratégie s ′ i tels que (s′ i ,s −i) ≻ i (s i ,s −i ). Soit xla première variable dans π i , en respectant l’odre topologique défini ci-<strong>de</strong>ssus,telle que s i [x] ̸= s ′ i [x]. Alors, par construction <strong>de</strong> s i, nous avons s i [x] ≻ i,ux s ′ i [x],où u x est l’instanciation <strong>de</strong> tous les parents <strong>de</strong> x. Nous savons que c<strong>et</strong>te instanciationest la même dans (s i ,s −i ) <strong>et</strong> (s ′ i ,s −i) car nous avons choisi la premièrevariable qui est différente dans s ′ i <strong>et</strong> s i selon l’ordre topologique. Donc, si l’onremplace s ′ i [x] par s i[x] dans s ′ i , nous obtiendrons une meilleure stratégie pouri. Le même raisonnement montre que remplacer toutes les s ′ i [x] par s i[x] dans s ′ iperm<strong>et</strong> d’obtenir une meilleure stratégie, s i . On a donc (s i ,s −i ) ≻ i (s ′ i ,s −i), <strong>et</strong>(s ′ i ,s −i) ≻ i (s i ,s −i ), ce qui est en contradiction avec le fait que tous les CP-n<strong>et</strong>sacycliques sont satisfiables.∗ Unicité :L’unicité peut se déduire facilement grâce à la construction ci-<strong>de</strong>ssus. Supposonsque G a <strong>de</strong>ux équilibres <strong>de</strong> Nash différents, <strong>et</strong> que (x 1 ,...,x k ) est l’ordr<strong>et</strong>opologique sur V respectant tous les G i . Une fois que c<strong>et</strong> ordre est fixé, laconstruction décrite ci-<strong>de</strong>ssus est déterministe, <strong>et</strong> on obtient un unique s c . Ilexiste donc au moins un équilibre <strong>de</strong> Nash s qui n’est pas construit selon c<strong>et</strong>temétho<strong>de</strong>.Soit x la première variable, selon l’ordre topologique, qui n’a pas la mêmevaleur dans s <strong>et</strong> s c . Soit i le joueur qui contrôle x, <strong>et</strong> soit u l’instanciation <strong>de</strong>toutes les variables précédant x selon l’ordre topologique. Par contruction, uest i<strong>de</strong>ntique dans s <strong>et</strong> s c , <strong>et</strong> donne l’instanciation <strong>de</strong> toutes les variables <strong>de</strong>Pa(x), Supposons que x ≻ i,u x (le cas symétrique est i<strong>de</strong>ntique). Alors, parconstruction, s c assigne x à x, <strong>et</strong> donc s lui assigne x. Donc, si l’on remplace xpar x dans s, on obtient une stratégie (strictement) meilleure que s, ce qui esten contradiction avec le fait que s est un équilibre <strong>de</strong> Nash en stratégies purespour G.Si les graphes sont acycliques, mais ne sont pas i<strong>de</strong>ntiques, ni l’existence ni l’unicité ne sont garanties:Exemple 3.10. Soit G = (N,V ,π,Γ,Φ) un CP-jeu booléen, avec N = {1,2,3}, V = {a,b,c}, π 1 ={a}, π 2 = {b}, π 3 = {c}, γ 1 = γ 2 = γ 3 = ⊤. Les CP-n<strong>et</strong>s <strong>de</strong>s joueurs sont représentés sur la figuresuivante :Jeux booléens 87


Jeux booléens <strong>et</strong> préférences non dichotomiquesCc ≻ ca ≻ ac ≻ ca ≻ ab ≻ bABN 1 N 2a ∧ c b ≻ ba ∧ b c ≻ cA C A Ba ≻ aBCa ∧ c b ≻ ba ∧ b c ≻ ca b ≻ ba ∧ c b ≻ ba ∧ b c ≻ ca b ≻ ba ∧ c b ≻ ba ∧ b c ≻ cN 3G n’a aucun équilibre <strong>de</strong> Nash en stratégies pures.Exemple 3.11. Soit G = (N,V ,π,Γ,Φ) un CP-jeu booléen, avec N = {1,2}, V = {a,b}, π 1 = {a},π 2 = {b}, γ 1 = γ 2 = ⊤. Les CP-n<strong>et</strong>s <strong>de</strong>s joueurs sont représentés sur la figure suivante :Joueur 1Joueur 2Bb ≻ bAa ≻ aAbba ≻ aa ≻ aBaab ≻ bb ≻ bCe jeu a 2 équilibres <strong>de</strong> Nash en stratégies pures : NE = {ab,ab}En général, les graphes G i pour i ∈ {1,... ,n} ne sont pas i<strong>de</strong>ntiques. Pourtant il est possible <strong>de</strong> lesrendre i<strong>de</strong>ntiques une fois que l’on a remarqué qu’un CP-n<strong>et</strong> 〈G,T 〉 peut être exprimé par un CP-n<strong>et</strong>〈G ′ ,T ′ 〉 si l’ensemble <strong>de</strong>s arcs dans G est contenu dans l’ensemble <strong>de</strong>s arcs dans G ′ . On peut alorsprendre comme graphe commun G à tous les joueurs le graphe dont l’ensemble <strong>de</strong>s arcs est l’union<strong>de</strong>s ensembles d’arcs <strong>de</strong> G 1 ,...,G n . Il se peut alors que le graphe résultant ne soit pas acyclique,auquel cas la propriété 3.4 (page 86) n’est pas applicable. Formellement :Définition 3.15. Soit G = (N,V,π,Γ,Φ) un CP-jeu booléen tel que ∀i ∈ N, les graphes G i sont tousacycliques.Pour chaque joueur i,G i = 〈V ,Arc i 〉, V étant l’ensemble <strong>de</strong>s nœuds du graphe 7 , <strong>et</strong> Arc i représentantl’ensemble <strong>de</strong>s arcs orientés du graphe représentant le CP-n<strong>et</strong> <strong>de</strong> i.L’union <strong>de</strong>s graphes <strong>de</strong> G sera le grapheG = 〈V ,Arc 1 ∪... ∪ Arc n 〉.Définition 3.16. Soit G = (N,V,π,Γ,Φ) un CP-jeu booléen tel que ∀i ∈ N, les graphes G i sont tousacycliques.On appelle G ∗ = (N,V,π,Γ,Φ ∗ ) le jeu équivalent par réécriture <strong>de</strong> G dans lequel on a remplacéle graphe issu du CP-n<strong>et</strong> représentant le but <strong>de</strong> chacun <strong>de</strong>s joueurs par l’union <strong>de</strong> tous les graphes<strong>de</strong>s joueurs.7 ici i<strong>de</strong>ntique pour chacun <strong>de</strong>s joueurs puisque c’est l’ensemble <strong>de</strong>s variables du jeu.88 Elise Bonzon


3.2. Jeux booléens <strong>et</strong> CP-n<strong>et</strong>sLes tables <strong>de</strong> préférences conditionnelles sont modifiées <strong>de</strong> façon à correspondre avec le nouveaugraphe, tout en donnant les mêmes préférences qu’avant : si l’arc (X,Y) est ajouté au graphe, latable <strong>de</strong> préférence conditionnelle <strong>de</strong> la variable Y sera la même que précé<strong>de</strong>mment pour chaqueinstanciation x ∈ D(X). Plus formellement, si on note ≻ y i la relation associée à la table <strong>de</strong> préférenceconditionnelle CPT i (Y) pour le CP-n<strong>et</strong> du joueur i dans le jeu G, on a pour le jeu G ∗ :∀x ∈ D(X),≻ y i,x =≻y i,x =≻y i .Propriété 3.5. Soit G = (N,V,π,Γ,Φ) un CP-jeu booléen tel que ∀i ∈ N, les graphes G i sont tousacycliques. Soit G ∗ = (N,V,π,Γ,Φ ∗ ) le jeu équivalent par réecriture <strong>de</strong> G.Le jeu G ∗ perm<strong>et</strong> d’obtenir les mêmes pré-ordres sur les profils <strong>de</strong> stratégies que le jeu G. On dit queG <strong>et</strong> G ∗ sont équivalents.Preuve : Soit, pour chaque joueur i ∈ N, ≽ i la relation <strong>de</strong> préférences qui satisfaitle CP-n<strong>et</strong> du joueur i pour le jeu G. Montrons que ≽ i satisfait le CP-n<strong>et</strong> du joueur ipour le jeu G ∗ .∀X ∈ V , <strong>de</strong>ux cas se présentent :1. X a les mêmes parents dans les CP-n<strong>et</strong>s <strong>de</strong> G ∗ <strong>et</strong> <strong>de</strong> G. Dans ce cas là, larelation ≽ x i est la même ∀x ∈ D(X).2. X n’a pas les mêmes parents dans le CP-n<strong>et</strong> du jeu G ∗ que dans le CPn<strong>et</strong>du jeu G. Un arc a été ajouté. Notons 〈Y ,X〉 c<strong>et</strong> arc. On a alors ∀y ∈D(Y),≽ x i,y =≽x i . On a donc bien la même relation.La relation ≽ i satisfait donc bien le CP-n<strong>et</strong> du joueur i pour le jeu G ∗ .Remarque : Si le graphe du jeu G ∗ est acyclique, la propriété 3.4 (page 86) peut s’appliquer, <strong>et</strong>donc G ∗ a un <strong>et</strong> un seul équilibre <strong>de</strong> Nash en stratégies pures. Comme G <strong>et</strong> G ∗ définissent les mêmesrelations <strong>de</strong> préférences, ce <strong>de</strong>rnier est également le seul équilibre <strong>de</strong> Nash en stratégies pures <strong>de</strong> G(par contre, si le graphe <strong>de</strong> G ∗ est cyclique, ni l’existence ni l’unicité <strong>de</strong>s équilibres <strong>de</strong> Nash ne sontgaranties comme on peut le voir sur les exemples 3.10 (page 87) <strong>et</strong> 3.11 (page précé<strong>de</strong>nte)).Exemple 3.12. Soit le jeu G = (N,V,π,Γ,Φ) suivant :∗ N = {1,2}∗ V = {a,b,c}, avec D(a) = {a,a}, D(b) = {b,b} <strong>et</strong> D(c) = {c,c}.∗ γ 1 = γ 2 = ⊤,∗ π 1 = {a,b}, π 2 = {c},∗ Le but du joueur 1 est représenté sur la figure 3.11 (page suivante),∗ Le but du joueur 2 est représenté sur la figure 3.12 (page suivante).On calcule à présent l’union <strong>de</strong>s graphes issus <strong>de</strong>s CP-n<strong>et</strong>s représentant les buts <strong>de</strong> ces <strong>de</strong>ux joueurs,<strong>et</strong> l’on crée ainsi le jeu G ∗ équivalent par réecriture au jeu G. Les buts <strong>de</strong>s <strong>de</strong>ux joueurs sont alorsreprésentés par les CP-n<strong>et</strong>s représentés figure 3.13 (page suivante) <strong>et</strong> 3.14 (page 91).On constate sur la figure 3.13 (page suivante) que pour calculer les équilibres <strong>de</strong> Nash <strong>de</strong> ce jeu,il faudrait comparer les profils <strong>de</strong> stratégies abc, abc, abc <strong>et</strong> abc pour le joueur 1, pourtant abc <strong>et</strong>abc sont incomparables. C<strong>et</strong>te “incomparabilité” est représentée sur la figure par une ligne avec <strong>de</strong>spointillés plus larges.Jeux booléens 89


Jeux booléens <strong>et</strong> préférences non dichotomiquesa ≻ aAb ≻ bBCa ∧ ba ∧ ba ∧ ba ∧ bc ≻ cc ≻ cc ≻ cc ≻ cFigure 3.11 — CP-n<strong>et</strong> <strong>de</strong>s préférences du joueur 1a ≻ aaab ≻ bb ≻ bbbc ≻ cc ≻ cA B CFigure 3.12 — CP-n<strong>et</strong> <strong>de</strong>s préférences du joueur 2a ≻ aAa ∧ ba ∧ bCc ≻ cc ≻ caab ≻ bb ≻ bBa ∧ b c ≻ cabca ∧ b c ≻ c(b)(a)Figure 3.13 — CP-n<strong>et</strong> <strong>de</strong>s préférences <strong>et</strong> le pré-ordre associé du joueur 1 pour le jeu G ∗ équivalentpar réécriture <strong>de</strong> Gabcabcabcabcabcabcabc90 Elise Bonzon


3.2. Jeux booléens <strong>et</strong> CP-n<strong>et</strong>sa ≻ aAa ∧ ba ∧ ba ∧ ba ∧ bC(a)c ≻ cc ≻ cc ≻ cc ≻ caab ≻ bb ≻ bFigure 3.14 — CP-n<strong>et</strong> <strong>de</strong>s préférences <strong>et</strong> le pré-ordre associé du joueur 2 pour le jeu G ∗ équivalentpar réécriture <strong>de</strong> GBabcabcabcabcabc(b)abcabcabcL’union <strong>de</strong>s graphes donne ici un graphe acyclique. On peut donc appliquer la propriété 3.4(page 86) : le jeu G a un <strong>et</strong> un seul équilibre <strong>de</strong> Nash : NE = {abc}Une <strong>de</strong>rnière condition (moins intéressante en pratique car assez forte) garantit l’existence <strong>et</strong> l’unicitéd’un équilibre <strong>de</strong> Nash en stratégies pures. C<strong>et</strong>te condition établit que si toutes les variables contrôléespar un joueur sont indépendantes <strong>de</strong>s variables contrôlées par les autres joueurs (en d’autres termes,les variables parents <strong>de</strong>s variables contrôlées par le joueur i sont contrôlées par i), <strong>et</strong> les CP-n<strong>et</strong>s <strong>de</strong>sjoueurs sont acycliques, alors chaque joueur est capable d’instancier ses variables <strong>de</strong> façon optimale.Propriété 3.6. Soit G = (N,V,π,Γ,Φ) un CP-jeu booléen tel que tous les graphes sont acycliques,<strong>et</strong> pour chaque joueur i ∈ N, pour tout v ∈ π i , nous avons Pa(v) ∈ π i . G possè<strong>de</strong> alors un <strong>et</strong> un seuléquilibre <strong>de</strong> Nash en stratégies pures.La preuve <strong>de</strong> c<strong>et</strong>te propriété est également donnée par la procédure <strong>de</strong> recherche en avant (forwardsweep procedure), <strong>et</strong> suit le même raisonnement que la preuve <strong>de</strong> la propriété 3.4 (page 86).3.2.3.4 CP-n<strong>et</strong> globalDans le cadre <strong>de</strong>s CP-jeux booléens, les préférences <strong>de</strong> chaque agent sont données par un CP-n<strong>et</strong>.Pourtant, pour calculer les équilibres <strong>de</strong> Nash nous nous intéressons aux variables contrôlées par unjoueur donné sur le CP-n<strong>et</strong> représentant ses préférences. L’idée ici est d’introduire un nouveau CPn<strong>et</strong>,que l’on appellera CP-n<strong>et</strong> global <strong>de</strong> G, unique pour l’ensemble <strong>de</strong>s joueurs, rassemblant pourchaque joueur les variables qu’il contrôle. Comme l’ensemble {π 1 ,...,π n } forme une partition sur V ,chaque variable sera présente une <strong>et</strong> une seule fois dans ce CP-n<strong>et</strong>.Définition 3.17. Soit G = (N,V,π,Γ,Φ) un CP-jeu booléen.On appelle CP-n<strong>et</strong> global <strong>de</strong> G le CP-n<strong>et</strong>N + = 〈G + ,T + 〉 défini par :∗ ∀i ∈ N, ∀v ∈ π i , CPT i (v) ∈T + .Jeux booléens 91


Jeux booléens <strong>et</strong> préférences non dichotomiques∗ G + = 〈V ,Arc + 1 ∪... ∪ Arc+ n 〉, avec chaque Arc + idéfini paroù Arc i est l’ensemble <strong>de</strong>s arcs dansG i .Arc + i = {(w,v) ∈ Arc i |v ∈ π i }Exemple 3.13. Considérons le CP-jeu booléen G = (N,V ,π,Γ,Φ) avec N = {1,2}, V = {a,b,c},π 1 = {a,b}, π 2 = {c}, γ 1 = γ 2 = ⊤.N 1 <strong>et</strong>N 2 sont représentés sur la figure suivante. Sur c<strong>et</strong>te figure,chaque boite contient les variables contrôlées par le joueur concerné, <strong>et</strong> donc contient les CPTs duCP-n<strong>et</strong> global <strong>de</strong> G.Aa ≻ aAa ≻ aBb ≻ ba ∧ b c ≻ cBaab ≻ bb ≻ bCa ∧ ba ∧ bc ≻ cc ≻ cCbbc ≻ cc ≻ ca ∧ bc ≻ cN 1N 2Le CP-n<strong>et</strong> global N + <strong>de</strong> G est représenté sur la figure suivante (on conserve les boites, les arcsentrants dans chaque boite, <strong>et</strong> les arcs internes à chaque boite).Aa ≻ aabcBb ≻ babcabcabcabcCbbc ≻ cc ≻ cabcabcabcPuisque calculer le CP-n<strong>et</strong> global d’un jeu perm<strong>et</strong> d’avoir un CP-n<strong>et</strong> unique, calculer le résultat optimal<strong>de</strong> ce CP-n<strong>et</strong>, s’il est acyclique, peut donner <strong>de</strong>s résultats intéressants.Propriété 3.7. 8 Soit G un CP-jeu booléen tel que tous les graphes G i sont acycliques, <strong>et</strong> N + leCP-n<strong>et</strong> global <strong>de</strong> G. Soit s un profil <strong>de</strong> stratégies. SiN + est un CP-n<strong>et</strong> acyclique, on a l’équivalencesuivante :s est un équilibre <strong>de</strong> Nash si <strong>et</strong> seulement si S est une solution optimale <strong>de</strong>N + .8 Merci à Nic Wilson <strong>de</strong> nous avoir donné c<strong>et</strong>te idée.92 Elise Bonzon


3.2. Jeux booléens <strong>et</strong> CP-n<strong>et</strong>sC<strong>et</strong>te propriété perm<strong>et</strong> <strong>de</strong> calculer plus simplement l’équilibre <strong>de</strong> Nash d’un CP-jeu booléen en utilisantla procédure <strong>de</strong> recherche en avant (forward sweep procedure).Pour montrer c<strong>et</strong>te propriété, nous aurons besoin du lemme suivant :Lemme 3.5. Soit G un CP-jeu booléen, N un CP-n<strong>et</strong> acyclique <strong>de</strong> G, <strong>et</strong> s un profil<strong>de</strong> stratégies.S’il existe s ′ : s ′ ≻ s, alors il existe s ′′ : s ′′ ≻ s tel que s <strong>et</strong> s ′′ ne diffèrent que d’unevariable.Preuve du lemme :Soit s <strong>et</strong> s ′ <strong>de</strong>ux profils <strong>de</strong> stratégies tels que s ′ ≻ s. Supposons qu’il n’existe pas <strong>de</strong>s ′′ ≻ s tel que s <strong>et</strong> s ′′ ne diffèrent que d’une variable. Dans ce cas, comme l’indifférenceest impossible, nous avons s ≻ s ′′ pour tous s ′′ <strong>de</strong> ce type.Soit s = v 1 v 2 ...v k v k+1 ...v p , avec v 1 ,...,v p ∈ V , <strong>et</strong> ∀v j ∈ V , soit u j les affectations<strong>de</strong>s parents <strong>de</strong> v j . Considérons alors tous les s ′′ possibles :s ≻ v 1 v 2 ...v k v k+1 ...v p ⇒ v 1 ≻ u1 v 1s ≻ v 1 v 2 ...v k v k+1 ...v p ⇒ v 2 ≻ u2 v 2.s ≻ v 1 v 2 ...v k v k+1 ...v p⇒ v k ≻ uk v ks ≻ v 1 v 2 ...v k v k+1 ...v p ⇒ v k+1 ≻ uk+1 v k+1.s ≻ v 1 v 2 ...v k v k+1 ...v p⇒ v p ≻ up v pChaque variable est donc instanciée à sa meilleure valeur en fonction <strong>de</strong> l’instanciation<strong>de</strong> ses parents. C<strong>et</strong>te instanciation correspond à la procédure <strong>de</strong> recherche enavant. Selon le Lemme 3.2 (page 78), s est donc un résultat optimal pourN,ce quiest en contradiction avec l’hypothèse : ∃s ′ tel que s ′ ≻ s. Donc, ∃s ′′ qui ne diffère <strong>de</strong>s que d’une seule variable <strong>et</strong> tel que s ′′ ≻ s.Revenons à présent à la propriété 3.7 (page ci-contre).Preuve :⇒ Soit s un équilibre <strong>de</strong> Nash en stratégies pures. Supposons que s n’est pas unesolution optimale <strong>de</strong>N + .Alors, d’après la définition 3.12 (page 78), ∃s ′ ∈ S tel que N + ̸|= s ≻ + s ′ .Il existe donc une relation <strong>de</strong> préférence telle que s ′ ≻ + s qui satisfait N + .D’après le lemme 3.5, ∃s ′′ ≻ + s tel que s <strong>et</strong> s ′′ ne diffèrent que d’une seulevariable : il existe un seul v ∈ V tel que v s ′′ ≻ + u v s , u étant l’instanciation danss <strong>et</strong> s ′ <strong>de</strong> Pa(v). Soit i le joueur tel que v ∈ π i . On a alors (s ′′i ,s −i) ≻ + (s i ,s −i ).s ′′ ≻ + s satisfait CPT + (v) pour tout v ∈V. Or, par construction <strong>de</strong>N + à partirJeux booléens 93


Jeux booléens <strong>et</strong> préférences non dichotomiques<strong>de</strong> G, ∀i ∈ N, ∀v ∈ π i , CPT i (v) = CPT + (v). Donc, pour le joueur i dans G,on a v s ′′ ≻ i v s , <strong>et</strong> ∀w ∈ V \ {v}, ∀ j ∈ N tel que w ∈ π j , w s ′′ = j w s . Alors :(s ′′i ,s −i) ≻ i (s i ,s −i ).s n’est donc pas un équilibre <strong>de</strong> Nash en stratégie pure.⇐ Soit s une solution optimale <strong>de</strong> N + . Supposons que s n’est pas un équilibre<strong>de</strong> Nash en stratégie pure. Alors, ∃i ∈ {1,... ,n}, ∃s ′ i ∈ S i tel que (s ′ i ,s −i) ≻ i(s i ,s −i ). Donc, ∃W ⊆ π i tel que ∀w ∈ W, ∀p ∈ 2 Pa(w) , w s ′ ≻ i,p w s , <strong>et</strong> ∀x ∈π i \W, ∀q ∈ 2 Pa(x) , x s ′ = i x s .Par construction <strong>de</strong> N + à partir <strong>de</strong> G, ∀i ∈ N, ∀v ∈ π i , CPT i (v) = CPT + (v).On aura donc toujours ∀w ∈ W, ∀p ∈ 2 Pa(w) , w s ′ ≻ + p w s , <strong>et</strong> ∀x ∈ π i \W, ∀q ∈2 Pa(x) , x s ′ = + q x s . On a alors (s ′ i ,s −i) ≻ + (s i ,s −i ). Donc s ′ ≻ + s, soit N + ̸|=s ≻ + s ′ .s n’est donc pas une solution optimale <strong>de</strong>N + .3.2.3.5 ComplexitéLes résultats <strong>de</strong> c<strong>et</strong>te section ont été obtenus avec Bruno Zanuttini.Les lemmes 3.3 (page 83) <strong>et</strong> 3.4 (page 84) nous perm<strong>et</strong>tent <strong>de</strong> montrer la propriété suivante :Propriété 3.8. Soit G = (N,V,π,Γ,Φ) un CP-jeu booléen tel que les graphesG i sont tous acycliques.Déci<strong>de</strong>r si un profil <strong>de</strong> stratégies s donné est un équilibre <strong>de</strong> Nash fort en stratégies pures est polynomial.Preuve : D’après le Lemme 3.4 (page 84), nous savons que s est un équilibre <strong>de</strong>Nash fort en stratégies pures si <strong>et</strong> seulement si s i est une meilleure réponse pourchaque joueur i. On sait également d’après le Lemme 3.3 (page 83) que c<strong>et</strong>te vérificationest polynomiale.Propriété 3.9. Déci<strong>de</strong>r si un CP-jeu booléen acyclique G = (N,V,π,Γ,Φ) (i.e., dans lequel tousles CP-n<strong>et</strong>s N i ∈ Φ sont acycliques) a un équilibre <strong>de</strong> Nash en stratégies pures est un problèmeNP-compl<strong>et</strong>. Le problème est NP-difficile même si le nombre <strong>de</strong> joueurs est restreint à 2.Preuve : Grâce à la propriété 3.8, nous savons que ce problème est dans NP.Pour la difficulté, nous donnons une réduction à partir du problème <strong>de</strong> la satisfiabilité<strong>de</strong>s formules en CNF (conjonction normal form) dans lesquelles chaqueclause contient au plus trois litéraux <strong>et</strong> chaque variable apparait au plus dans troisclauses [Garey <strong>et</strong> Johnson, 1979, comments for problem LO1].L’intuition <strong>de</strong>rrière c<strong>et</strong>te réduction est la suivante : étant donné une formule en CNFϕ définie comme décrit ci-<strong>de</strong>ssus, un joueur 1 essaiera <strong>de</strong> satisfaire ϕ en instanciantses variables. Plus précisemment, il sera content seulement si toutes les clauses sontsatisfaites, <strong>et</strong> si ce n’est pas le cas, il préfèrera changer la valeur d’au moins une94 Elise Bonzon


3.2. Jeux booléens <strong>et</strong> CP-n<strong>et</strong>s<strong>de</strong> ses variables dans l’instanciation courante. Un autre joueur 2 associera à chaquevariable x i un litéral (¬)p i disant si x i est positive ou non dans la stratégie du joueur1.La construction exacte est la suivante : soit une formule ϕ = V ki=1 C i dans laquellechaque clause contient au plus trois litéraux <strong>et</strong> chaque variable apparaîtdans au plus trois clauses, <strong>et</strong> soit <strong>de</strong>ux joueurs 1,2. Soit {x 1 ,...,x n } l’ensemble<strong>de</strong>s variables <strong>de</strong> ϕ. Pour chaque clause C i <strong>de</strong> ϕ, soit δ i une nouvelle variable (signifiantintuitivement que C i est satisfaite). Enfin, pour chaque variable x i apparaissantdans ϕ, soit p i une nouvelle variable. On construit un CP-jeu booléenG = (N,V ,π,Γ,Φ) avec N = {1,2}, V = {x 1 ,...,x n } ∪ {δ 1 ,...,δ k } ∪ {p 1 ,..., p n },π 1 = {x 1 ,...,x n } ∪ {δ 1 ,...,δ k }, π 2 = {p 1 ,..., p n }, <strong>et</strong> γ 1 = γ 2 = ⊤ ; le CP-n<strong>et</strong> <strong>de</strong>chaque joueur est défini <strong>de</strong> la manière suivante : pour chaque variable x i <strong>de</strong> ϕ, si x iapparaît (positif ou négatif) dans trois clauses C i1 ,C i2 ,C i3 alors le CPT suivant estajouté au CP-n<strong>et</strong> du joueur 1.δ i1 δ i2 δ i3 p iδ i1 δ i2 δ i3 p iδ i1 δ i2 δ i3 p iδ i1 δ i2 δ i3 p iδ i1 δ i2 δ i3 p iδ i1 δ i2 δ i3 p i...δ i1 δ i2 δ i3 p iδ i1 δ i2 δ i3 p ix i ≻ x ix i ≻ x ix i ≻ x ix i ≻ x ix i ≻ x ix i ≻ x ix i ≻ x ix i ≻ x iSi x i apparaît dans une ou <strong>de</strong>ux clauses seulement, un CPT similaire est ajouté, avecseulement une ou <strong>de</strong>ux δ-variable(s) apparaissant dans la table. En d’autres mots, 1préfère changer la valeur <strong>de</strong> x i (<strong>et</strong> donc ce que 2 rapporte à propos <strong>de</strong> c<strong>et</strong>te valeur)aussitôt qu’au moins une clause contenant x i n’est pas satisfaite.À présent, on ajoute le CPT suivant à chaque C i dans ϕ, par exemple C i = (x 1 ∨¬x 2 ∨ ¬x 3 ).p 1 p 2 p 3 δ i ≻ δ ip 1 p 2 p 3 δ i ≻ δ i...p 1 p 2 p 3 δ i ≻ δ ip 1 p 2 p 3 δ i ≻ δ iEn d’autres mots, 1 préfère δ i si C i est satisfaite, <strong>et</strong> and δ i sinon. On a donc :(1) dans tout équilibre <strong>de</strong> Nash en stratégies pures <strong>de</strong> G, δ i est vrai si <strong>et</strong> seulementsi la clause C i est satisfaite.(sinon le joueur 1 aurait une meilleure stratégie, puisqu’il contrôle δ i ).Le CP-n<strong>et</strong> du joueur 1 est alors défini <strong>de</strong> façon à être l’ensemble <strong>de</strong> toutes ces tables,avec <strong>de</strong>s préférences quelconques sur les valeurs <strong>de</strong>s variables p i (qui n’ont pas <strong>de</strong>parent). La construction n’est pas ambigüe puisque une seule table est construitepour x i ou δ i , <strong>et</strong> le graphe est acyclique puisque les seules dépendances partent <strong>de</strong>Jeux booléens 95


Jeux booléens <strong>et</strong> préférences non dichotomiquesp j vers δ i , <strong>et</strong> <strong>de</strong> δ k <strong>et</strong> p j vers x i .Enfin, le CP-n<strong>et</strong> <strong>de</strong> 2 est construit comme suit. Pour chaque variable x i , le CPTsuivant est ajouté :x i p i ≻ p ix i p i ≻ p iLe CP-n<strong>et</strong> du joueur 2 est acyclique, <strong>et</strong>(2) dans tout équilibre <strong>de</strong> Nash en stratégies pures <strong>de</strong> G, pour tout i, p i est vrai si<strong>et</strong> seulement si x i est vraie.(sinon le joueur 2 aurait une meilleure stratégie, puisqu’il contrôle p i ).Nous avons à présent :(3) dans tout équilibre <strong>de</strong> Nash en stratégies pures <strong>de</strong> G, si pour un i, C i est faux,alors il existe un j tel que x j ≡ ¬p j .Supposons que C i est faux. Alors, d’après (1), δ i est faux. Supposons à présentque x j est une variable <strong>de</strong> C i . Le CPT <strong>de</strong> 1 attaché à x j contient <strong>de</strong>ux préférencesconditionnelles <strong>de</strong> la forme δ i (...)p j : x j ≻ x j <strong>et</strong> δ i (...)p j : x j ≻ x j . Puisque δ i estfaux <strong>et</strong> que 1 contrôle x j , x j aura la valeur opposée à celle <strong>de</strong> p j dans un équilibre<strong>de</strong> Nash en stratégies pures <strong>de</strong> G .A partir <strong>de</strong> (2) <strong>et</strong> (3), on sait que dans un équilibre <strong>de</strong> Nash en stratégies pures <strong>de</strong>G, chaque clause C i est satisfaite. Et donc, si G a un équilibre <strong>de</strong> Nash en stratégiespures, alors ϕ est satisfiable.Réciproquement, supposons que ϕ est satisfiable, <strong>et</strong> posons ⃗x = (x 1 ,...,x n ) |= ϕ.Considérons le profil <strong>de</strong> stratégies défini en instanciant chaque x i à la même valeurque dans ⃗x, chaque p i comme x i , <strong>et</strong> chaque δ i à vrai. On vérifie facilement que ceprofil <strong>de</strong> stratégies est un équilibre <strong>de</strong> Nash en stratégies pures <strong>de</strong> G. Et donc, si ϕest satisfiable, alors G a un équilibre <strong>de</strong> Nash en stratégies pures.On peut observer que si l’union <strong>de</strong>s graphes du CP-jeu booléen construit dans la preuve est cyclique,le joueur 1 peut alors obtenir <strong>de</strong>s informations sur ses propres variables à partir <strong>de</strong> 2, <strong>et</strong> donc êtreinfluencé sur “comment jouer”. Par exemple, il peut déci<strong>de</strong>r <strong>de</strong> jouer x 3 (x 3 ) si x 3 est faux (vrai), <strong>et</strong>qu’une clause qui le contient n’est pas satisfaite. Ses décisions sur la variable x 3 sont donc en partiebasées sur la valeur <strong>de</strong> x 3 elle-même, ce qui est évité grâce à l’acyclicité.Nous n’avons malheureusement pas réussi à calculer la complexité du problème consistant à déci<strong>de</strong>rsi un CP-jeu booléen quelconque a un équilibre <strong>de</strong> Nash en stratégies pures.3.2.4 Introduction d’une relation d’indifférenceNous supposons à présent que les relations d’ordre qui décrivent les préférences <strong>de</strong>s joueurs dans lestables <strong>de</strong> préférences conditionnelles ne sont plus strictes. Il peut y avoir <strong>de</strong>s relations d’indifférenceentre <strong>de</strong>ux valeurs pour une variable donnée.On redéfinit alors dans ce cadre les tables <strong>de</strong> préférences conditionnelles <strong>et</strong> les CP-n<strong>et</strong>s.96 Elise Bonzon


3.2. Jeux booléens <strong>et</strong> CP-n<strong>et</strong>sDéfinition 3.18. La table <strong>de</strong> préférence conditionnelle avec indifférence (notée ICPT i (X)) décritles préférences du joueur i sur les valeurs <strong>de</strong> la variable X, étant données toutes les combinaisons<strong>de</strong>s valeurs <strong>de</strong>s variables parents.Pour chaque instanciation p <strong>de</strong> Pa i (X), ICPT i (X) spécifie un préordre total tel que l’on ait soitx ≻ i,p x, soit x ≻ i,p x, soit x ∼ i,p x.Définition 3.19. Un ICP-n<strong>et</strong> pour le joueur i sur les variables V = {X 1 ,...,X n } est un graphe orientéG sur X 1 ,...,X n . Chaque nœud X j est annoté avec la table <strong>de</strong> préférence conditionnelle avec indifférenceICPT i (X j ) correspondante. Chaque table <strong>de</strong> préférence conditionnelle avec indifférenceICPT i (X j ) est associée à un préordre total ≻ ji,p , selon chaque instanciation p ∈ D(Pa(X j)).Les ICP-jeux booléens sont donc <strong>de</strong>s jeux booléens dont les buts sont donnés par <strong>de</strong>s ICP-n<strong>et</strong>s.Exemple 3.14. Soit le ICP-jeu booléen G = (N,V,π,Γ,Φ) suivant :∗ N = {1,2}∗ V = {a,b,c}, avec D(a) = {a,a}, D(b) = {b,b} <strong>et</strong> D(c) = {c,c}.∗ π 1 = {a,b}, π 2 = {c},∗ γ 1 = γ 2 = ⊤,∗ Le but du joueur 1, <strong>et</strong> le pré-ordre associé sur les profils <strong>de</strong> stratégies, sont représentés par lafigure 3.15,∗ Le but du joueur 2, <strong>et</strong> le pré-ordre associé sur les profils <strong>de</strong> stratégies, sont représentés par lafigure 3.16 (page suivante),a ∼ ab ≻ bABabcabcCabcabca ∧ ba ∧ ba ∧ bc ≻ cc ≻ cc ≻ cabcabcabcabca ∧ b c ≻ c(b)(a)Figure 3.15 — ICP-n<strong>et</strong> <strong>de</strong>s préférences <strong>et</strong> le pré-ordre associé du joueur 1Le calcul <strong>de</strong>s équilibres <strong>de</strong> Nash faibles <strong>et</strong> forts nous donne ici comme résultat :NE f aible = NE f ort = {abc,abc,abc,abc}Etudions maintenant sur un exemple ce qu’il se passe lorsque tous les joueurs ont un graphe communacyclique.Exemple 3.15. Soit le ICP-jeu booléen G = (N,V,π,Γ,Φ) suivant :Jeux booléens 97


Jeux booléens <strong>et</strong> préférences non dichotomiquesAa ≻ aabcabcBaab ≻ bb ≻ babcabcabcabcCbbc ∼ cc ≻ cabcabc(a)(b)Figure 3.16 — ICP-n<strong>et</strong> <strong>de</strong>s préférences <strong>et</strong> le pré-ordre associé du joueur 2∗ N = {1,2,3}∗ V = {a,b,c}, avec D(a) = {a,a}, D(b) = {b,b} <strong>et</strong> D(c) = {c,c}.∗ π 1 = {a}, π 2 = {b}, π 3 = {c},∗ γ 1 = γ 2 = γ 3 = ⊤,∗ Le but du joueur 1, <strong>et</strong> le pré-ordre associé sur les profils <strong>de</strong> stratégies, sont représentés par lafigure 3.17,∗ Le but du joueur 2, <strong>et</strong> le pré-ordre associé sur les profils <strong>de</strong> stratégies, sont représentés par lafigure 3.18 (page ci-contre),∗ Le but du joueur 3, <strong>et</strong> le pré-ordre associé sur les profils <strong>de</strong> stratégies, sont représentés par lafigure 3.19 (page suivante).a ≻ aAabcabc abc abcabcBCabcabcaab ∼ bb ≻ baac ∼ cc ≻ cabc(a)(b)Figure 3.17 — ICP-n<strong>et</strong> <strong>de</strong>s préférences <strong>et</strong> le pré-ordre associé du joueur 1Le calcul <strong>de</strong>s équilibres <strong>de</strong> Nash faibles <strong>et</strong> forts nous donne ici comme résultat :NE f aible = NE f ort = {abc,abc}C<strong>et</strong> exemple nous montre que l’unicité <strong>de</strong>s équilibres <strong>de</strong> Nash faibles <strong>et</strong> forts n’est plus assurée. Parcontre, l’existence l’est toujours.Propriété 3.10. Soit G = (N,V,π,Γ,Φ) un ICP-jeu booléen tel que les graphes G i sont tous i<strong>de</strong>ntiques(∀i, j,G i =G j ) <strong>et</strong> acycliques, avec <strong>de</strong>s préférences conditionnelles.Ce jeu G ainsi défini aura alors au moins un équilibre <strong>de</strong> Nash fort en stratégie pure.98 Elise Bonzon


3.3. Buts à prioritéa ∼ aAabcabcBCabcabcabcabcaab ≻ bb ≻ baac ≻ cc ≻ cabcabc(a)(b)Figure 3.18 — ICP-n<strong>et</strong> <strong>de</strong>s préférences <strong>et</strong> le pré-ordre associé du joueur 2abca ≻ aabcabcAabcBCabcabcaab ≻ bb ≻ baac ∼ cc ≻ cabcabc(a)(b)Figure 3.19 — ICP-n<strong>et</strong> <strong>de</strong>s préférences <strong>et</strong> le pré-ordre associé du joueur 3Preuve : La démonstration <strong>de</strong> c<strong>et</strong>te propriété est exactement la même que celle <strong>de</strong>la propriété 3.4 (page 86). En eff<strong>et</strong>, c<strong>et</strong>te partie <strong>de</strong> la démonstration n’utilise pas lefait que les préférences conditionnelles sont totales.Remarque : Nous pouvons ici comme dans la section 3.2.3 (page 82) calculer le jeu G ∗ équivalentpar réécriture <strong>de</strong> G en faisant l’union <strong>de</strong>s graphes.Si l’union <strong>de</strong>s graphes <strong>de</strong>s joueurs d’un jeu G perm<strong>et</strong> d’obtenir un graphe acyclique, la propriété 3.10(page précé<strong>de</strong>nte) est applicable sur le jeu G ∗ équivalent par réécriture à G. Comme ces <strong>de</strong>ux jeuxsont équivalents, le jeu G aura au moins un équilibre <strong>de</strong> Nash en stratégie pure.3.3 Buts à prioritéLes CP-n<strong>et</strong>s ne perm<strong>et</strong>tent pas <strong>de</strong> représenter toutes les préférences, ce langage n’est pas totalementexpressif. Il est par exemple impossible <strong>de</strong> dire avec un CP-n<strong>et</strong> “Mes préférences sont, par ordredécroissant, <strong>de</strong>s vacances à la mer en été, puis <strong>de</strong>s vacances à la montagne en hiver, <strong>de</strong>s vacances à lamontagne en été, <strong>et</strong> enfin <strong>de</strong>s vacances à la mer en hiver”. C<strong>et</strong>te relation <strong>de</strong> préférences est en eff<strong>et</strong>du type xy ≻ xy ≻ xy ≻ xy, c’est-à-dire qu’elle compare <strong>de</strong>ux à <strong>de</strong>ux <strong>de</strong>s états n’étant pas i<strong>de</strong>ntiques“toutes choses étant égales par ailleurs”.Jeux booléens 99


Jeux booléens <strong>et</strong> préférences non dichotomiquesPour c<strong>et</strong>te raison, nous choisissons ici d’étudier un autre langage <strong>de</strong> représentation <strong>de</strong> préférences :les buts à priorité.3.3.1 Etat <strong>de</strong> l’artDans <strong>de</strong>s buts à priorité, les préférences d’un joueur sont exprimées par un ensemble <strong>de</strong> buts ordonnésselon une relation <strong>de</strong> priorité :Définition 3.20. Une base <strong>de</strong> buts à priorité Σ est une collection 〈Σ 1 ; . . . ; Σ p 〉 d’ensembles <strong>de</strong>formules propositionnelles.Σ j représente l’ensemble <strong>de</strong>s buts <strong>de</strong> priorité j, avec la convention suivante : plus j est p<strong>et</strong>it, plus lesformules dans Σ j sont prioritaires.Tout au long <strong>de</strong> c<strong>et</strong>te section, nous allons utiliser un exemple unique représenté par une base propositionnellestratifiée (Σ,


3.3. Buts à prioritéDans le contexte <strong>de</strong>s jeux booléens, nous aurons à comparer <strong>de</strong>s profils <strong>de</strong> stratégies (donc <strong>de</strong>s interprétations)<strong>et</strong> non plus <strong>de</strong>s sous-bases consistantes, chaque joueur <strong>de</strong>vant pouvoir choisir la stratégie,<strong>et</strong> donc les profils <strong>de</strong> stratégies, lui perm<strong>et</strong>tant d’obtenir le “meilleur résultat possible”.Soit s ∈ S, on poseSat(s,Σ j ) = {ϕ ∈ Σ j | s |= ϕ}3.3.1.1 Ordre DiscriminDéfinition 3.21. Les sous-bases consistantes A d’une base stratifiée Σ sont les sous-ensembles <strong>de</strong> Σconsistants au sens <strong>de</strong> la logique classique.Une sous-base A est une sous-base consistante maximale pour l’inclusion <strong>de</strong> Σ si <strong>et</strong> seulement si :∗ A est une sous-base consistante,∗ il n’existe pas <strong>de</strong> sous-base consistante <strong>de</strong> Σ contenant strictement A.Les sous-bases <strong>de</strong> Σ consistantes maximales sont aussi appelées thèses <strong>de</strong> Σ.Les thèses correspondant à l’exemple présenté page 99 sont i<strong>de</strong>ntiques, quelle que soit la stratificationchoisie. Elles sont représentées figure 3.22.Thèse 1 Thèse 2 Thèse 3 Thèse 4 Thèse 5→ P → P → P → P P → LP → L P → L P → L P → ¬V P → ¬VP → ¬V P → ¬V L → V L → V L → VL → A A → V L → A L → A L → AA → V A → V A → VFigure 3.22 — Thèses <strong>de</strong>s bases stratifiéesLe calcul <strong>de</strong> sous-théories préférées a été introduit par [Brewka, 1989a,b].Définition 3.22. Soit Σ une base stratifiée. Une sous-théorie préférée est un ensemble A = A 1 ∪...∪A n tel que ∀k ∈ [1,n],A 1 ∪... ∪ A k est un sous-ensemble maximal consistant <strong>de</strong> Σ 1 ∪... ∪ Σ k .Par définition, les sous-théories préférées <strong>de</strong> Brewka sont <strong>de</strong>s thèses <strong>de</strong> Σ.∗ Soit Σ la base stratifiée présentée figure 3.20 (page ci-contre). En appliquant la métho<strong>de</strong> <strong>de</strong>Brewka on obtient une seule sous-théorie préférée présentée figure 3.23.∗ Soit Σ la base stratifiée présentée figure 3.21 (page précé<strong>de</strong>nte). En appliquant le métho<strong>de</strong> <strong>de</strong>Brewka on obtient 3 sous-théories préférées présentées figure 3.24.Une relation <strong>de</strong> préférence appelée “discrimin”, découle <strong>de</strong> c<strong>et</strong>te définition [Brewka, 1989b;Dubois <strong>et</strong> al., 1992; Geffner, 1992; Benferhat <strong>et</strong> al., 1993].Définition 3.23. s ≻ disc s ′ si <strong>et</strong> seulement si ∃k ∈ {1,... , p} tel que :Jeux booléens 101


Jeux booléens <strong>et</strong> préférences non dichotomiques→ PP → LP → ¬VL → AFigure 3.23 — Sous-théorie préférée pour la stratification n°1→ P → P → PP → L P → L P → LP → ¬V P → ¬V L → VL → A A → V L → AA → VFigure 3.24 — Sous-théories préférées pour la stratification n°21. Sat(s,Σ k ) ⊃ Sat(s ′ ,Σ k ), <strong>et</strong>2. ∀ j < k, Sat(s,Σ j ) = Sat(s ′ ,Σ j )Ordonnons les thèses trouvées pour chaque stratification selon le critère discrimin :∗ Soit Σ la base stratifiée présentée figure 3.20 (page 100). En appliquant l’ordre discrimin, onobtient l’ordonnancement suivant <strong>de</strong>s thèses données en figure 3.22 (page précé<strong>de</strong>nte) :Thèse 1 ≻ discr Thèse 2 ≻ discr Thèse 3 ≻ discr Thèse 4 ≻ discr Thèse 5∗ Soit Σ la base stratifiée présentée figure 3.21 (page 100). En appliquant l’ordre discrimin, onobtient l’ordonnancement suivant <strong>de</strong>s thèses données en figure 3.22 (page précé<strong>de</strong>nte) :Thèse 1 ≻ discr Thèse 4Thèse 1 ≻ discr Thèse 5Thèse 2 ≻ discr Thèse 4Thèse 2 ≻ discr Thèse 5Thèse 3 ≻ discr Thèse 4Thèse 3 ≻ discr Thèse 5Les thèses 1, 2 <strong>et</strong> 3 sont incomparables, tout comme les thèses 4 <strong>et</strong> 5.D’autres travaux ont conduit à <strong>de</strong>s définitions proches (l’ordre démocratique <strong>de</strong> [Cayrol <strong>et</strong> al., 1993],<strong>et</strong> les sous-bases fortement maximales consistantes <strong>de</strong> [Dubois <strong>et</strong> al., 1992]). Dans le cas d’une basestratifiée, tous ces travaux se rejoignent. Nous ne présenterons pas en détail ces autres métho<strong>de</strong>s ici.102 Elise Bonzon


3.3. Buts à priorité3.3.1.2 Ordre LeximinLe critère “leximin” consiste à sélectionner <strong>de</strong>s sous-bases consistantes maximales pour la cardinalitéen respectant la stratification. La définition <strong>de</strong> base (ordre basé sur la cardinalité) correspondant au casd’une base <strong>de</strong> croyances non ordonnée est donnée dans [Dubois <strong>et</strong> al., 1992; Benferhat <strong>et</strong> al., 1993;Lehmann, 1995] :Définition 3.24. s ≻ lex s ′ si <strong>et</strong> seulement si ∃k ∈ {1,... , p} tel que :1. |Sat(s,Σ k )| > |Sat(s ′ ,Σ k )|, <strong>et</strong>2. ∀ j < k, |Sat(s,Σ j )| = |Sat(s ′ ,Σ j )|.Ce critère consiste donc à comparer <strong>de</strong>ux sous-bases consistantes en i<strong>de</strong>ntifiant d’abord le plus hautniveau <strong>de</strong> priorité pour lequel elles ne satisfont pas le même nombre <strong>de</strong> buts, puis à préférer celle quisatisfait le plus grand nombre <strong>de</strong> buts à ce niveau.Notation : On introduit le symbole suivant : ≡ lex qui représente la relation d’équivalence issue <strong>de</strong>l’ordre ≽ lex : soit A <strong>et</strong> B <strong>de</strong>ux sous-bases d’une base Σ stratifiée. A ≡ lex B si <strong>et</strong> seulement si ∀i =1...n,|A i | = |B i |, avec n = le nombre <strong>de</strong> strates <strong>de</strong> Σ.Le pré-ordre ainsi obtenu est un pré-ordre total.Ordonnons les thèses trouvées pour chaque stratification selon le critère leximin :∗ Soit Σ la base stratifiée correspondant à la stratification numéro 1 présentée figure 3.20(page 100). En appliquant le critère leximin, on obtient l’ordonnancement suivant <strong>de</strong>s thèses<strong>de</strong> la figure 3.22 (page 101) :Thèse 5 ≼ lex Thèse 4 ≼ lex Thèse 3 ≼ lex Thèse 2 ≼ lex Thèse 1∗ Soit Σ la base stratifiée correspondant à la stratification numéro 2 présentée figure 3.21(page 100). En appliquant le critère leximin, on obtient l’ordonnancement suivant <strong>de</strong>s thèses<strong>de</strong> la figure 3.22 (page 101) :Thèse 5 ≡ lex Thèse 4 ≼ lex Thèse 2 ≡ lex Thèse 1 ≼ lex Thèse 33.3.1.3 Ordre Best-outL’idée est ici <strong>de</strong> repérer la strate la plus prioritaire amenant une inconsistance, <strong>et</strong> <strong>de</strong> ne prendre alorsen compte que les formules <strong>de</strong> priorité supérieure à c<strong>et</strong>te strate fatidique.L’ordre “Best Out” décrit dans [Benferhat <strong>et</strong> al., 1993] <strong>et</strong> [Dubois <strong>et</strong> al., 1992] est défini à partir <strong>de</strong>ssous bases consistantes <strong>et</strong> non à partir <strong>de</strong>s thèses.Définition 3.25. Soit a(s) = min{ j tel que ∃ϕ ∈ Σ j ,s ̸|= ϕ}, avec la convention min(∅) = +∞.Alors, s ≽ bo s ′ si <strong>et</strong> seulement si a(s) ≥ a(s ′ ).Nous obtenons également ici un pré-ordre total. De plus, les éléments maximaux <strong>de</strong> l’ordre Best Outne sont pas forcément <strong>de</strong>s éléments maximaux pour l’inclusion ensembliste.Jeux booléens 103


Jeux booléens <strong>et</strong> préférences non dichotomiquesPour l’exemple précé<strong>de</strong>nt nous avons donc 2 6 −2 possibilités à explorer (on ne tient pas compte <strong>de</strong> labase vi<strong>de</strong>, ni <strong>de</strong> la base initiale supposée inconsistante), ce qui fait au plus 62 sous-bases consistantesqu’il faudrait comparer 2 à 2 pour pouvoir les ordonner. Une fois c<strong>et</strong>te comparaison effectuée, noustrouvons les éléments maximaux suivants :∗ stratification 1 : les éléments maximaux sont toutes les sous-bases contenant{P,P → L,P → ¬V }∗ stratification 2 : les éléments maximaux sont toutes les sous-bases contenant{P,P → L}On note que ≽ bo <strong>et</strong> ≽ lex sont <strong>de</strong>s relations <strong>de</strong> préférence totales, tandis que ≽ disc est en général unerelation <strong>de</strong> préférence partielle.Comme cela a déjà été prouvé par [Benferhat <strong>et</strong> al., 1993], les critères discrimin, leximin <strong>et</strong> best-outne sont pas totalement indépendants. La propriété suivante est toujours valable dans le cadre <strong>de</strong>s jeuxbooléens (donc quand on étudie <strong>de</strong>s interprétations <strong>et</strong> non pas <strong>de</strong>s sous-bases) :Propriété 3.11.(s ≻ bo s ′ ) ⇒ (s ≻ discr s ′ ) ⇒ (s ≻ lex s ′ ) (3.3)Preuve :∗ (s ≻ bo s ′ ) ⇒ (s ≻ discr s ′ ) ⇒ (s ≻ lex s ′ )(s ≻ bo s ′ ) ⇔ a(s) > a(s ′ )(s ≽ discr s ′ ) ⇒ (s ≽ lex s ′ ) ⇒ (s ≽ bo s ′ ) (3.4)⇔ min{ j | ∃ϕ i ∈ Σ j ,s ̸|= ϕ i }} {{ }noté x> min{ j | ∃ϕ i ∈ Σ j ,s ′ ̸|= ϕ i }} {{ }noté yOn sait donc que :∗ ∀ j < y,∀ϕ i ∈ Σ j ,s |= ϕ i ,s ′ |= ϕ i∗ pour la strate y, ∀ϕ i ∈ Σ y ,s |= ϕ i ,s ′ ̸|= ϕ i∗ pour la strate x, ∀ϕ i ∈ Σ x ,s ̸|= ϕ iOn en déduit que :– Sat(s,Σ y ) ⊃ Sat(s ′ ,Σ y )– ∀ j < y,Sat(s,Σ y ) = Sat(s ′ ,Σ y ).On a donc : s ≻ discr s ′Et donc :∗ | Sat(s,Σ y ) |>| Sat(s ′ ,Σ y ) |∗ ∀ j < y,| Sat(s,Σ y ) |=| Sat(s ′ ,Σ y ) |.Donc : s ≻ lex s ′104 Elise Bonzon


3.3. Buts à priorité∗ (s ≽ discr s ′ ) ⇒ (s ≽ lex s ′ ) ⇒ (s ≽ bo s ′ )(s ≽ discr s ′ ) ⇔ s ≻ discr s ′ ou ∀k ∈ {1,... p},Sat(s,Σ k ) = Sat(s ′ ,Σ k )⇒ s ≻ lex s ′ ou ∀k ∈ {1,... p},| Sat(s,Σ k ) |=| Sat(s ′ ,Σ k ) |⇒ (s ≽ lex s ′ )⇔ ∃k tel que | Sat(s,Σ k ) |≥| Sat(s ′ ,Σ k ) |<strong>et</strong> ∀ j < k,| Sat(s,Σ j ) |=| Sat(s ′ ,Σ j ) |⇒ a(s) ≥ a(s ′ )⇔ (s ≽ bo s ′ )3.3.2 Utilisation <strong>de</strong>s buts à priorité dans les jeux booléensNous pouvons à présent définir les BP-jeux booléens.Définition 3.26. Un BP-jeu booléen est un 5-uple G = (N,V ,π,Γ,Φ), où Φ = (Σ 1 ,...,Σ n ) est unecollection <strong>de</strong> bases <strong>de</strong> buts à priorité.On note Σ i = 〈Σ 1 i ;...;Σp i 〉, Σ ji représentant la strate j <strong>de</strong> Σ i (l’ensemble <strong>de</strong> buts <strong>de</strong> priorité j pour lejoueur i).L’hypothèse que le nombre <strong>de</strong> niveaux <strong>de</strong> priorité est le même (p) pour chaque joueur n’entraîne pas<strong>de</strong> perte <strong>de</strong> généralité. En eff<strong>et</strong>, ajouter <strong>de</strong>s strates vi<strong>de</strong>s à une base <strong>de</strong> buts à priorité ne modifie pasla relation <strong>de</strong> préférence induite.Nous utiliserons les notations suivantes :∗ Si G est un BP-jeu booléen <strong>et</strong> que c ∈ {disc,lex,bo}, alors Pre fG c = 〈≽c 1 ,...,≽c n〉.∗ NE discf aible(G) (resp. NEdiscf ort(G)) représente l’ensemble <strong>de</strong>s équilibres <strong>de</strong> Nash faibles (resp. forts)pour Pre fGdisc.Comme ≽bo <strong>et</strong> ≽ lex sont <strong>de</strong>s relations <strong>de</strong> préférence totales, la différence entreéquilibres <strong>de</strong> Nash faible <strong>et</strong> fort n’est pas pertinente.Exemple 3.16. Soit G = (N,V ,π,Γ,Φ) un jeu booléen, avec :∗ N = {1,2},∗ V = {a,b,c},∗ π 1 = {a,c}, π 2 = {b},∗ γ 1 = γ 2 = ⊤,∗ Σ 1 = 〈a;(¬b,c)〉,∗ Σ 2 = 〈(¬b,¬c);¬a〉Nous allons maintenant appliquer chacun <strong>de</strong>s trois critères présentés plus haut afin d’obtenir unpré-ordre sur les profils <strong>de</strong> stratégies.Discrimin Pour chacun <strong>de</strong>s joueurs, appliquons le critère discrimin (cf. définition 3.23 (page 101)).Nous trouvons les relations <strong>de</strong> préférences suivantes pour le joueur 1 :abc ≻ disc1 abc ≻ disc1 abc ≻ disc1 abc ≻ disc1 abc ≻ disc1 abcJeux booléens 105


Jeux booléens <strong>et</strong> préférences non dichotomiquesabc ≻ disc1 abc ≻ disc1 abc ≻ disc1 abc ≻ disc1 abc ≻ disc1 abcabc ≻ disc1 abc ≻ disc1 abc ≻ disc1 abc ≻ disc1 abc ≻ disc1 abcabc ≻ disc1 abc ≻ disc1 abc ≻ disc1 abc ≻ disc1 abc ≻ disc1 abcAfin <strong>de</strong> pouvoir exploiter plus facilement ce résultat, nous le traduisons sous forme graphique.Ainsi, nous trouvons pour chacun <strong>de</strong>s joueurs les relations partielles 9 représentées figure 3.25.Les flèches vont du profil <strong>de</strong> stratégies le plus préféré vers le profil <strong>de</strong> stratégies le moins préféré.Joueur 1 abcJoueur 2 abcabcabcabcabcabcabcabcabcabcabcabcabcabcFigure 3.25 — Relations partielles sur les profils <strong>de</strong> stratégies calculées à partir du critère DiscriminNous pouvons à présent calculer les équilibres <strong>de</strong> Nash faibles <strong>et</strong> forts <strong>de</strong> ce jeu pour le critèrediscrimin :NE discf aible = {abc}NE discf ort = {abc}Etudions à présent les stratégies dominées <strong>de</strong> ce jeu :∗ Joueur 1 : Il est possible d’éliminer itérativement 3 <strong>de</strong>s 4 stratégies <strong>de</strong> ce joueur. En eff<strong>et</strong> :∗ La stratégie ac est strictement dominée par la stratégie ac. On l’élimine.∗ Après c<strong>et</strong>te élimination, la stratégie ac est strictement dominée par la stratégie ac.On l’élimine.∗ De nouveau, après c<strong>et</strong>te élimination, la stratégie ac est strictement dominée par lastratégie ac. Il ne nous reste donc plus que la stratégie ac.∗ Joueur 2 : Après élimination <strong>de</strong>s 3 stratégies du joueur 1, la stratégie b est strictementdominée par la stratégie b. On ne conserve donc que c<strong>et</strong>te <strong>de</strong>rnière.En éliminant itérativement les stratégies strictement dominées, on obtient donc un profil <strong>de</strong> stratégiesrésultat : {abc}, qui se trouve être aussi l’équilibre <strong>de</strong> Nash faible <strong>et</strong> fort. De plus, ce sontici <strong>de</strong>s stratégies strictement dominées. L’ordre d’élimination <strong>de</strong> ces stratégies n’affecte doncpas le résultat.Leximin On applique ici <strong>de</strong> la même manière que précé<strong>de</strong>mment le critère leximin (cf. définition 3.24(page 103)) à chacun <strong>de</strong>s joueurs. Nous trouvons ainsi les relations totales suivantes données enfigure 3.26, <strong>et</strong> nous pouvons calculer les équilibres <strong>de</strong> Nash faibles <strong>et</strong> forts <strong>de</strong> jeu pour le critèreleximin.9 Pour calculer facilement les équilibres <strong>de</strong> Nash <strong>de</strong> ce jeu, nous m<strong>et</strong>tons en exergue les relations qui nous intéressentpour chaque joueur. Ces relations apparaissent sous la forme <strong>de</strong> flèches en pointillé sur la figure.abc106 Elise Bonzon


3.3. Buts à prioritéJoueur 1abcJoueur 2abcabcabcabcabcabcabcabcabcabcabcabcabcabcabcFigure 3.26 — Relations totales sur les profils <strong>de</strong> stratégies calculées à partir du critère LeximinNE lex = {abc}L’élimination <strong>de</strong>s stratégies dominées se déroule selon le même schéma que précé<strong>de</strong>mment, <strong>et</strong>nous fournit le même unique résultat : {abc}.Best out Si l’on applique l’ordre Best out (cf. définition 3.25) à chacun <strong>de</strong>s joueurs, nous trouvons lesrelations totales décrites en figure 3.27 10 à partir <strong>de</strong>squelles nous pouvons calculer les équilibres<strong>de</strong> Nash faibles <strong>et</strong> forts <strong>de</strong> ce jeu pour le critère best out :Joueur 1abcJoueur 2abcabc abc abcabcabc abc abc abcabcabc abc abcabcabcFigure 3.27 — Relations totales sur les stratégies calculées à partir <strong>de</strong> l’ordre Best outNE bo = {abc,abc}L’élimination <strong>de</strong>s stratégies dominées donne ici un résultat différent :∗ Joueur 1 : Il est possible d’éliminer itérativement 3 <strong>de</strong>s 4 stratégies <strong>de</strong> ce joueur. En eff<strong>et</strong> :∗ La stratégie ac est strictement dominée par la stratégie ac. On l’élimine.∗ La stratégie ac est strictement dominée par la stratégie ac. On l’élimine.∗ La stratégie ac est partiellement dominée par la stratégie ac, on l’élimine donc également.∗ Joueur 2 : Après élimination <strong>de</strong>s 3 stratégies du joueur 1, aucune <strong>de</strong>s <strong>de</strong>ux stratégies b oub ne domine partiellement, faiblement ou strictement l’autre.10 Pour le joueur 2, les nœuds du bas sont tous reliés les uns aux autres, mais nous n’indiquons pas toutes les flèches afin<strong>de</strong> ne pas alourdir le <strong>de</strong>ssin. Comme c<strong>et</strong>te relation <strong>de</strong> préférence est transitive, le résultat n’en est pas affecté. Nous faisons<strong>de</strong> même pour le joueur 1.Jeux booléens 107


Jeux booléens <strong>et</strong> préférences non dichotomiquesEn éliminant itérativement les stratégies dominées, on obtient donc <strong>de</strong>ux profils <strong>de</strong> stratégiesrésultat : {abc} <strong>et</strong> {abc}. On obtient donc le même résultat qu’avec les équilibres <strong>de</strong> Nashfaibles <strong>et</strong> forts.Comme ici <strong>de</strong>ux stratégies sur 3 sont strictement dominées, l’ordre d’élimination choisi n’affectepas les résultats obtenus.Reprenons l’exemple 2.2 (page 34) du jeu du prisonnier, mais c<strong>et</strong>te fois-ci dans sa forme classique.Exemple 3.17. Dans c<strong>et</strong>te version du dilemme du prisonnier, 2 détenus sont emprisonnés dans <strong>de</strong>scellules séparées. La police fait à chacun d’eux le même marché :"Tu as le choix entre couvrir ton complice en te taisont (noté T i , i = 1,2), ou le trahir en ledénonçant (noté ¬T i , i = 1,2). Si tu le dénonces, <strong>et</strong> qu’il ne te dénonce pas, tu seras remisen liberté <strong>et</strong> lui écopera <strong>de</strong> 10 ans <strong>de</strong> prison. Si vous vous dénoncez mutuellement, vousécoperez tous les <strong>de</strong>ux <strong>de</strong> 5 ans <strong>de</strong> prison. Si aucun <strong>de</strong> vous ne dénonce l’autre, vous aureztous les <strong>de</strong>ux 6 mois <strong>de</strong> prison."Voila la forme normale <strong>de</strong> ce jeu, avec 2 prisonniers :❍ ❍❍❍❍❍ 21T 2 T 2T 1 (-1/2, -1/2) (-10, 0)T 1 (0, -10) (-5, -5)Si l’on calcule l’équilibre <strong>de</strong> Nash en stratégies pures <strong>de</strong> ce jeu à partir <strong>de</strong> c<strong>et</strong>te forme normale, ontrouve :NE = {T 1 T 2 }Nous pouvons traduire ce jeu par le BP-jeu booléen G = (N,V,π,Γ,Φ) suivant :∗ N = {1,2},∗ V = {T 1 ,T 2 },∗ π 1 = {T 1 }, π 2 = {T 2 },∗ γ 1 = γ 2 = ⊤,∗ Σ 1 = 〈T 2 ;¬T 1 〉,∗ Σ 2 = 〈T 1 ;¬T 2 〉Discrimin Si l’on applique le critère discrimin à chacun <strong>de</strong>s joueurs, nous trouvons les relationstotales décrites en figure 3.28 (page ci-contre).On constate que ces relations totales, même si elles ne sont qu’ordinales, respectent bien l’ordredonné par la forme normale du jeu.Le calcul <strong>de</strong>s équilibres <strong>de</strong> Nash faibles <strong>et</strong> forts nous donne les résultats suivants :NE discf aible = NEdisc f ort = {T 1 T 2 }Ce jeu n’a pas <strong>de</strong> stratégie dominée, on ne peut donc pas en éliminer.108 Elise Bonzon


3.3. Buts à prioritéJoueur 1T 1 T 2Joueur 2 T 1 T 2T 1 T 2T 1 T 2T 1 T 2T 1 T 2T 1 T 2T 1 T 2Figure 3.28 — Relations partielles calculées à partir du critère DiscriminJoueur 1T 1 T 2Joueur 2 T 1 T 2T 1 T 2T 1 T 2T 1 T 2T 1 T 2T 1 T 2T 1 T 2Figure 3.29 — Relations partielles calculées à partir du critère LeximinLeximin Si l’on applique le critère leximin à chacun <strong>de</strong>s joueurs, nous trouvons les relations totalesdécrites en figure 3.29. On constate que ce sont exactement les mêmes que celles trouvées enfigure 3.28.Ce jeu n’a toujours pas <strong>de</strong> stratégie dominée, <strong>et</strong> on obtient le même équilibre <strong>de</strong> Nash faible <strong>et</strong>fort :NE lex = {T 1 T 2 }Best out Si l’on applique l’ordre best out à chacun <strong>de</strong>s joueurs, nous trouvons les relations totalesdécrites sur la figure 3.30 <strong>et</strong> partir <strong>de</strong>squelles nous pouvons calculer les équilibres <strong>de</strong> Nashfaibles <strong>et</strong> forts <strong>de</strong> ce jeu.Joueur 1T 1 T 2Joueur 2 T 1 T 2T 1 T 2T 1 T 2T 1 T 2T 1 T 2 T 1 T 2T 1 T 2Figure 3.30 — Relations totales calculées à partir <strong>de</strong> l’ordre best outOn trouve :NE bo = {T 1 T 2 ,T 1 T 2 ,T 1 T 2 }Etudions à présent les stratégies dominées <strong>de</strong> ce jeu :∗ Joueur 1 : la stratégie T 1 domine faiblement la stratégie T 1 . On élimine donc c<strong>et</strong>te <strong>de</strong>rnière.∗ Joueur 2 : Une fois la stratégie T 1 éliminée, le joueur 2 n’a plus <strong>de</strong> stratégie dominée.Jeux booléens 109


Jeux booléens <strong>et</strong> préférences non dichotomiquesEn éliminant les stratégies dominées, on obtient donc <strong>de</strong>ux profils <strong>de</strong> stratégies résultats :{T 1 T 2 ,T 1 T 2 }, ce qui raffine les résultats trouvés avec les équilibres <strong>de</strong> Nash.Les stratégies ne sont pas ici strictement dominées, l’ordre d’élimination affecte donc les résultats.Etudions donc ce qui se passe si on élimine d’abord les stratégies dominées du joueur2 :∗ Joueur 2 : la stratégie T 2 domine faiblement la stratégie T 2 . On élimine donc c<strong>et</strong>te <strong>de</strong>rnière.∗ Joueur 1 : Une fois la stratégie T 2 éliminée, le joueur 1 n’a plus <strong>de</strong> stratégie dominée.En éliminant les stratégies dominées, on obtient <strong>de</strong>ux autres profils <strong>de</strong> stratégies résultats :{T 1 T 2 ,T 1 T 2 }, ce qui raffine les résultats trouvés avec les équilibres <strong>de</strong> Nash, mais <strong>de</strong> manièredifférente que celle obtenue avec l’ordre d’élimination précé<strong>de</strong>nt.3.3.3 Quelques propriétésTout d’abord, il est possible <strong>de</strong> noter que les BP-jeux booléens avec le critère leximin <strong>et</strong> une seulestrate par joueur correspon<strong>de</strong>nt aux jeux d’évaluation distribués introduits par [Harrenstein, 2004a].Lemme 3.6. Soit ≽= 〈≽ 1 ,...,≽ n 〉 <strong>et</strong> ≽ ′ = 〈≽ ′ 1 ,...,≽′ n〉 <strong>de</strong>ux collections <strong>de</strong> relations <strong>de</strong> préférences,<strong>et</strong> soit s un profil <strong>de</strong> stratégies.1. Si ≽ est contenu dans ≽ ′ <strong>et</strong> si s est un équilibre <strong>de</strong> Nash fort en stratégies pures pour ≽, alors sest un équilibre <strong>de</strong> Nash fort en stratégies pures pour ≽ ′ .2. Si ≻ est contenu dans ≻ ′ <strong>et</strong> si s est un équilibre <strong>de</strong> Nash faible en stratégies pures pour ≻ ′ , alorss est un équilibre <strong>de</strong> Nash faible en stratégies pures pour ≻.Preuve du lemme :1. Soit s = (s 1 ,...,s n ) un équilibre <strong>de</strong> Nash fort en stratégies pures pour ≽= 〈≽ 1,...,≽ n 〉. On a alors :∀i ∈ {1,...,n},∀s ′ i ∈ S i,(s ′ i ,s −i) ≼ i (s i ,s −i ) (3.5)Or, nous savons que ≽ est contenu dans ≽ ′ , i.e. ∀i = 1... n, ≽ i est contenudans ≽ ′ i . On a donc, d’après l’équation 3.5,∀i ∈ {1,...,n},∀s ′ i ∈ S i ,(s ′ i,s −i ) ≼ ′ i (s i ,s −i )Le profil <strong>de</strong> stratégies s est donc bien un équilibre <strong>de</strong> Nash fort pour ≽ ′ = 〈≽ ′ 1,...,≽ ′ n〉.2. Soit s = (s 1 ,...,s n ) un équilibre <strong>de</strong> Nash faible en stratégies pures pour ≻ ′ =〈≻ ′ 1 ,...,≻′ n 〉. On a alors :∀i ∈ {1,...,n},∀s ′ i ∈ S i ,(s ′ i,s −i ) ⊁ ′ i (s i ,s −i ) (3.6)Or, nous savons que ≻ est contenu dans ≻ ′ , donc ⊁ ′ est contenu dans ⊁, i.e.∀i = 1...n, ⊁ ′ i est contenu dans ⊁ i. On a donc, d’après l’équation 3.6,∀i ∈ {1,...,n},∀s ′ i ∈ S i,(s ′ i ,s −i) ⊁ i (s i ,s −i )110 Elise Bonzon


3.3. Buts à prioritéLe profil <strong>de</strong> stratégies s est donc bien un équilibre <strong>de</strong> Nash faible pour ≽ ′ =〈≽ ′ 1 ,...,≽′ n〉.De la propriété 3.11 (page 104) <strong>et</strong> du lemme 3.6 (page ci-contre) on déduit la propriété suivante :Propriété 3.12. Soit G = (N,V ,π,Γ,Φ) un BP-jeu booléen <strong>et</strong> Pre fG c = 〈≽c 1 ,...,≽c n 〉 l’ensemble <strong>de</strong>srelations <strong>de</strong> préférences sur G à partir du critère c ∈ {disc,lex,bo}.1. NE discf ort (G) ⊆ NElex (G) ⊆ NE bo (G)2. NE lex (G) ⊆ NE discf aible (G) ⊆ NEbo (G)Preuve :1. La suite d’implications “s ∈ NE discf ort ⇒ s ∈ NElex ⇒ s ∈ NE bo ” est une conséquencedirecte <strong>de</strong> l’équation 3.4 (page 104) : ∀i ∈ {1,...,n},∀s ′ i ∈ S i :(s i ,s −i ) ≽ discri (s ′ i,s −i ) ⇒ (s i ,s −i ) ≽ lexi (s ′ i,s −i ) (3.7)(s i ,s −i ) ≽ lexi (s ′ i,s −i ) ⇒ (s i ,s −i ) ≽ boi (s ′ i,s −i ) (3.8)L’équation 3.7 nous montre que ≽ discri est contenu dans ≽ lexi . Donc, d’après lelemme 3.6 (page précé<strong>de</strong>nte), si s ∈ NE discf ort , alors s ∈ NElex .L’équation 3.8 nous montre que ≽ lexi est contenu dans ≽ boi . Donc, d’après lelemme 3.6 (page précé<strong>de</strong>nte), si s ∈ NE lex , alors s ∈ NE bo .2. La suite d’implications “s ∈ NE lex ⇒ s ∈ NE discrf aible ⇒ s ∈ NEbo ” est une conséquencedirecte <strong>de</strong> l’équation 3.3 (page 104) : ∀i ∈ {1,...,n},∀s ′ i ∈ S i :(s i ,s −i ) ≻ boi (s ′ i ,s −i) ⇒ (s i ,s −i ) ≻ discri (s ′ i ,s −i) (3.9)(s i ,s −i ) ≻ discri (s ′ i ,s −i) ⇒ (s i ,s −i ) ≻ lexi (s ′ i ,s −i) (3.10)L’équation 3.9 nous montre que ≻ boile lemme 3.6 (page ci-contre), ⊁ discriNE discf aible , alors s ∈ NEbo .L’équation 3.10 nous montre que ≻ discrilemme 3.6 (page ci-contre), ⊁ lexialors s ∈ NE discrf aible .est contenu dans ≻ discriest contenu dans ⊁ boiest contenu dans ≻ lexiest contenu dans ⊁ discr. Donc, d’après, <strong>et</strong> donc si s ∈. Donc, d’après lei , <strong>et</strong> donc si s ∈ NE lex ,Nous pouvons nous <strong>de</strong>man<strong>de</strong>r si un BP-jeu booléen peut être approximé en ne considérant que lesk-premières strates <strong>de</strong> chaque joueur. L’objectif est double : obtenir un jeu plus simple (pour le calcul<strong>de</strong>s équilibres <strong>de</strong> Nash en stratégies pures), <strong>et</strong> augmenter la possibilité <strong>de</strong> trouver un équilibre <strong>de</strong> Nashen stratégies pures significatif qui tient compte <strong>de</strong>s strates les plus prioritaires.Définition 3.27. Soit G = (N = {1,... ,n},V ,π,Γ,Φ) un BP-jeu booléen. Soit k ∈ {1, p}.G [1→k] = (N,V ,π,Γ,Φ [1→k] ) représente le jeu booléen k-réduit <strong>de</strong> G dans lequel les buts <strong>de</strong> chaquejoueur sont réduits à leurs k premières strates : Φ [1→k] = 〈Σ [1→k]1,...,Σ n [1→k] 〉.Jeux booléens 111


Jeux booléens <strong>et</strong> préférences non dichotomiquesLemme 3.7. Soit G un BP-jeu booléen. ∀k ≤ p, ∀c ∈ {discr,lex,bo} <strong>et</strong> ∀i ∈ N, on a :s ≽ c,[1→k]is ⊁ c,[1→k]is ′ ⇒ s ≽ c,[1→k−1]i s ′ (3.11)s ′ ⇒ s ⊁ c,[1→k−1]i s ′ (3.12)Preuve du lemme :1. Démontrons les implications s ≽ c,[1→k]i s ′ ⇒ s ≽ c,[1→k−1]i s ′ une par une.(a) Discrimins ≽ discr,[1→k]i s ′ ⇔ ∃l ∈ {1,... ,k} tel que :Sat(s,Σ l i) ⊇ Sat(s ′ ,Σ l i) <strong>et</strong> ∀ j < l,Sat(s,Σ ji ) = Sat(s′ ,Σ ji )2 cas sont maintenant possibles.i. l = k.Donc,∀ j, j < k, <strong>et</strong> donc ∀ j ∈ {1,...,k − 1}, Sat(s,Σ ji ) = Sat(s′ ,Σ ji ).Ce qui nous donne bien s ≽ discr,[1→k−1]i s ′ .ii. l < k, donc l ≤ k − 1.Dans ce cas, on a l ∈ {1,...,k −1}. Et on a donc bien s ≽ discr,[1→k−1]is ′ .(b) Leximins ≽ lex,[1→k]is ′ ⇔ ∃l ∈ {1,... ,k} tel que|Sat(s,Σ l i)| ≥ |Sat(s ′ ,Σ l i)| <strong>et</strong> ∀ j < l,|Sat(s,Σ ji )| = |Sat(s′ ,Σ ji )|2 cas sont maintenant possibles.i. l = k.Donc, ∀ j, j < k, <strong>et</strong> donc ∀ j ≤ k − 1, |Sat(s,Σ ji )| = |Sat(s′ ,Σ ji )|.Ce qui nous donne bien s ≽ lex,[1→k−1]i s ′ .ii. l < k, donc l ≤ k − 1.Dans ce cas, on a l ∈ {1,...,k−1}. Et on a donc bien s ≽ lex,[1→k−1]i s ′ .(c) Best-outs ≽ bo,[1→k]i s ′ ⇔ a [1→k]i (s) ≥ a [1→k]i (s ′ )min({ j ∈ [1,k] tel que ∃ϕ l ∈ Σ ji : s ̸|= ϕ l })} {{ }noté A⇔ ≥min({ j ∈ [1,k] tel que ∃ϕ l ∈ Σ ji : s ′ ̸|= ϕ l })} {{ }noté B3 cas sont maintenant possibles.i. A < k, <strong>et</strong> B ≤ A < k.Alors, on a : A ≤ k − 1, <strong>et</strong> B ≤ A ≤ k − 1.112 Elise Bonzon


3.3. Buts à prioritéEt donc, a [1→k−1]i (s) ≥ a [1→k−1]i (s ′ ).ii. A = k, <strong>et</strong> B ≤ A = k.Dans ce cas, min({ j ∈ [1,k − 1] tel que ∃ϕ l ∈ Σ ji : s ̸|= ϕ l}) = ∞.Donc B ≤ A = ∞.On a encore bien a [1→k−1]i (s) ≥ a [1→k−1]i (s ′ ).iii. A = ∞.On aura alors toujours min({ j ∈ [1,k − 1] tel que ∃ϕ l ∈ Σ ji : s ̸|=ϕ l }) = ∞.Et donc B ≤ A = ∞, <strong>et</strong> a [1→k−1]i (s) ≥ a [1→k−1]i (s ′ ).Pour chacun <strong>de</strong> ces cas possibles, on a bien s ≽ bo,[1→k−1]i s ′ .2. Démontrons les implications s ⊁ c,[1→k]icela, on remarque que :(s ⊁ c,[1→k]i(a) Discrimins ≻ discr,[1→k−1]is ′ ⇒ s ⊁ c,[1→k−1]is ′ ⇒ s ⊁ c,[1→k−1]is ′ ) ⇔ (s ≻ c,[1→k−1]is ′ ⇔ ∃l ∈ {1,...,k − 1} tel ques ′ une par une. Pours ′ ⇒ s ≻ c,[1→k]i s ′ )Sat(s,Σ l i) ⊃ Sat(s ′ ,Σ l i) <strong>et</strong> ∀ j < l,Sat(s,Σ ji ) = Sat(s′ ,Σ ji )On a donc bien :∃l ∈ {1,...,k} tel que Sat(s,Σ l i) ⊃ Sat(s ′ ,Σ l i) <strong>et</strong> ∀ j < l,Sat(s,Σ ji ) = Sat(s′ ,Σ ji )Donc, s ≻ discr,[1→k]i s ′(b) Leximins ≻ lex,[1→k−1]is ′ ⇔ ∃l ∈ {1,...,k − 1} tel que|Sat(s,Σ l i)| > |Sat(s ′ ,Σ l i)| <strong>et</strong> ∀ j < l,|Sat(s,Σ ji )| = |Sat(s′ ,Σ ji )|On a donc bien : ∃l ∈ {1,...,k} tel que∃l ∈ {1,...,k}:|Sat(s,Σ l i)|>|Sat(s ′ ,Σ l i)| <strong>et</strong> ∀ j < l,|Sat(s,Σ ji )|=|Sat(s′ ,Σ ji )|Donc, s ≻ lex,[1→k]i s ′(c) Best-outs ≻ bo,[1→k−1]i s ′ ⇔ a [1→k−1]i (s) > a [1→k−1]i (s ′ ) ⇔ A > Bavec∗ A = min({ j ∈ [1,k − 1] tel que ∃ϕ l ∈ Σ ji : s ̸|= ϕ l }),∗ B = min({ j ∈ [1,k − 1] tel que ∃ϕ l ∈ Σ ji : s ′ ̸|= ϕ l }).Jeux booléens 113


Jeux booléens <strong>et</strong> préférences non dichotomiquesCes equations sont évi<strong>de</strong>mment toujours vraies pour j ∈ [1,k].On a donc bien s ≻ bo,[1→k]i s ′ .Propriété 3.13. Soit G un BP-jeu booléen, <strong>et</strong> soit c ∈ {discr,lex,bo}.Si s est un équilibre <strong>de</strong> Nash fort (resp. faible) en stratégies pures pour Pre f c G [1→k] , alors s est aussi unéquilibre <strong>de</strong> Nash fort (resp. faible) pour Pre f c G [1→k−1] .Preuve :1. Equilibres <strong>de</strong> Nash forts en stratégies pures :Soit s = (s 1 ,...,s n ) un équilibre <strong>de</strong> Nash fort en stratégies pures pourPre f c G [1→k] . Alors :∀i ∈ {1,... n},∀s ′ i ∈ S i ,(s ′ i,s −i ) ≼ [1→k]i (s i ,s −i )Or, d’après le lemme 3.7, quel que soit le critère utilisé, s ≽ [1→k]is ≽ [1→k−1]i s ′ .On a donc :s ′ ⇒∀i ∈ {1,...n},∀s ′ i ∈ S i,(s ′ i ,s −i) ≼ [1→k−1]i (s i ,s −i )s est donc un équilibre <strong>de</strong> Nash fort en stratégies pures pour Pre f c G [1→k] .2. Equilibres <strong>de</strong> Nash faibles en stratégies pures :Soit s = (s 1 ,...,s n ) un équilibre <strong>de</strong> Nash faible en stratégies pures pourPre f c G [1→k] . Alors :∀i ∈ {1,... n},∀s ′ i ∈ S i ,(s ′ i,s −i ) ⊁ [1→k]i (s i ,s −i )Or, d’après le lemme 3.7, quel que soit le critère utilisé, s ⊁ [1→k]is ⊁ [1→k−1]i s ′ .On a donc :s ′ ⇒∀i ∈ {1,...n},∀s ′ i ∈ S i ,(s ′ i,s −i ) ⊁ [1→k−1]i (s i ,s −i )s est donc un équilibre <strong>de</strong> Nash faible en stratégies pures pour Pre f c G [1→k] .Lemme 3.8. Soit G un BP-jeu booléen, <strong>et</strong> soit G [1] le jeu booléen 1-réduit associé à G.Si, quel que soit le critère utilisé (discrimin, leximin ou best-out), le jeu G [1] n’a pas d’équilibre <strong>de</strong>Nash en stratégies pures, alors le jeu G n’en a pas non plus.Preuve du lemme : Supposons que le jeu G a un équilibre <strong>de</strong> Nash. Sachant que G =G [1→p] , d’après la propriété 3.13, le jeu G [1→p−1] aura aussi un équilibre <strong>de</strong> Nash.Puis, en appliquant la même propriété, il en sera <strong>de</strong> même pour les jeux G [1→p−2] ,114 Elise Bonzon


3.3. Buts à prioritéG [1→p−3] , jusqu’au jeu G [1] .Donc, si G a un équilibre <strong>de</strong> Nash, alors G [1] a un équilibre <strong>de</strong> Nash.Et donc, si G [1] n’a pas d’équilibre <strong>de</strong> Nash, alors G n’aura pas d’équilibre <strong>de</strong> Nash.La réciproque est fausse : le jeu G [1] peut avoir un équilibre <strong>de</strong> Nash, alors que le jeu G n’en a pas.Voici un contre-exemple :Exemple 3.18. Soit G = (N,V ,π,Γ,Φ) un jeu booléen, avec :∗ N = {1,2},∗ V = {a,b},∗ π 1 = {a}, π 2 = {b},∗ Σ 1 = 〈a → b;b → a〉,∗ γ 1 = γ 2 = ⊤,∗ Σ 2 = 〈a ↔ ¬b;¬b〉Si l’on applique l’ordre best out à chacun <strong>de</strong>s joueurs, nous trouvons les relations totales donnéesdans la figure 3.31.Joueur 1Joueur 2ab abababababababFigure 3.31 — Relations totales calculées à partir <strong>de</strong> l’ordre best outCe jeu n’a pas d’équilibre <strong>de</strong> Nash.Si on étudie à présent le jeu booléen G [1] associé dans lequel les buts <strong>de</strong>s joueurs sont réduits à lapremière strate <strong>de</strong> leur but dans G, on obtient le jeu suivant : G [1] = {N,V ,π,Γ,Φ [1] } un jeu booléen,avec :∗ N = {1,2},∗ V = {a,b},∗ π 1 = {a}, π 2 = {b},∗ γ 1 = γ 2 = ⊤,∗ Σ [1]1= {a → b},∗ Σ [1]2= {a ↔ ¬b}On peut à présent construire la forme normale <strong>de</strong> G [1] :❍ ❍❍❍❍❍ 21bba (1, 0) (1, 1)a (0, 1) (1, 0)Ce jeu a un équilibre <strong>de</strong> Nash : ab.Jeux booléens 115


Jeux booléens <strong>et</strong> préférences non dichotomiquesC<strong>et</strong> exemple prouve que la propriété 3.13 peut être utilisée pour trouver le bon niveau d’approximationpour un BP-jeu booléen. Par exemple, nous pouvons nous focaliser sur le plus grand k tel que G [1→k]a un équilibre <strong>de</strong> Nash fort en stratégies pures, <strong>et</strong> faire <strong>de</strong> même pour les équilibres <strong>de</strong> Nash faibles.D’autre part, c<strong>et</strong>te propriété pourrait être utilisée pour i<strong>de</strong>ntifier un équilibre <strong>de</strong> Nash “approché”, enmaximisant le nombre <strong>de</strong> strates pour lesquelles un équilibre <strong>de</strong> Nash existe. Par exemple, soit G unBP-jeu booléen. Nous avons déjà vu que si G [1] n’a aucun équilibre <strong>de</strong> Nash faible ou fort, G nonplus. Mais si G [1] en a un, alors nous pouvons vérifier s’il existe toujours pour G [1→2] . Si ce n’estpas le cas, nous savons que G n’a aucun équilibre <strong>de</strong> Nash ; mais dans le cas contraire, il est possible<strong>de</strong> vérifier G [1→3] , <strong>et</strong> ainsi <strong>de</strong> suite. Si le nombre <strong>de</strong> strates est important, continuer c<strong>et</strong>te vérificationjusqu’à la strate p perm<strong>et</strong> d’avoir ainsi une approximation <strong>de</strong> l’équilibre <strong>de</strong> Nash <strong>de</strong> G.3.4 Préférences non dichotomiques <strong>et</strong> graphe <strong>de</strong> dépendanceNous pouvons à présent généraliser le graphe <strong>de</strong> dépendance entre joueurs d’un jeu booléen à un L-jeu booléen, pour un langage L quelconque. Rappelons que, dans la section 2.3 (page 37), un joueuri était dépendant d’un joueur j si son but propositionnel ϕ i était dépendant d’une variable contrôléepar j. Nous <strong>de</strong>vons donc commencer par généraliser la dépendance entre une formule <strong>et</strong> une variablepar une notion <strong>de</strong> dépendance entre une relation <strong>de</strong> préférence (ou une entrée syntactique dans unlangage <strong>de</strong> représentation compacte <strong>de</strong> préférences à partir <strong>de</strong> laquelle il est possible <strong>de</strong> déduire c<strong>et</strong>terelation <strong>de</strong> préférence) <strong>et</strong> une variable. Plusieurs définitions ont été étudiées dans [Besnard <strong>et</strong> al.,2006] dans le cas général où les relations <strong>de</strong> préférences sont <strong>de</strong>s pré-ordres partiels. Dans le casspécifique où les relations <strong>de</strong> préférences sont <strong>de</strong>s pré-ordres compl<strong>et</strong>s, il semble n’y avoir qu’unedéfinition appropriée : une relation <strong>de</strong> préférence ≽ est indépendante d’une variable propositionnellex si pour tous les états l’agent est indifférent entre c<strong>et</strong> état, <strong>et</strong> l’état obtenu en changeant la valeur <strong>de</strong>x (voir [Besnard <strong>et</strong> al., 2006]).Définition 3.28. Une relation <strong>de</strong> préférence ≽ sur S est indépendante <strong>de</strong> la variable propositionnellex ∈ V si <strong>et</strong> seulement si pour tout s ∈ S, switch(s,x) ∼ s.Le but Φ est indépendant <strong>de</strong> x ∈ V si <strong>et</strong> seulement si la relation <strong>de</strong> préférence induite par Φ estindépendante <strong>de</strong> x.On peut alors introduire le lemme suivant :Lemme 3.9. Soit G un L-jeu booéen.Le but Φ i est indépendant d’une variable propositionnelle x ∈ V si <strong>et</strong> seulement si il existe Φ ′ i tel quex n’apparaît pas dans Φ ′ i , <strong>et</strong> que Φ i <strong>et</strong> Φ ′ i induisent la même relation <strong>de</strong> préférence.Preuve du lemme : On introduit la notation S −x , qui est définie par : pour tout j ∈ N,S −xj = {s j ∈ 2 V \{x} |s j |= γ j }, <strong>et</strong> S −x = S1 −x ×... × S−x n .⇒ Φ i est indépendant <strong>de</strong> x, donc, si on note ≻ i la relation <strong>de</strong> préférence induite parΦ i , on a pour tout s ∈ S, switch(s,x) ∼ i s. C<strong>et</strong>te relation <strong>de</strong> préférence est donci<strong>de</strong>ntique à celle définie sur S −x . Il existe donc Φ ′ i défini sur V \ {x} qui induitc<strong>et</strong>te relation <strong>de</strong> préférence.⇐ Soit Φ ′ i défini sur V \ {x}. La relation <strong>de</strong> préférence induite par Φ ′ i est donc116 Elise Bonzon


3.4. Préférences non dichotomiques <strong>et</strong> graphe <strong>de</strong> dépendancedéfinie sur S −x . Si c<strong>et</strong>te relation <strong>de</strong> préférence est équivalente à celle induitepar Φ i , on a pour tout s ∈ S, switch(s,x) ∼ i s. Φ i est donc indépendant <strong>de</strong> x.Il est à présent possible <strong>de</strong> définir l’ensemble <strong>de</strong>s variables <strong>et</strong> joueurs utiles d’un L-jeu booléen :Définition 3.29. Soit G = (N,V,Γ,π,Φ) un L-jeu booléen. L’ensemble <strong>de</strong>s variables utiles pour unjoueur i, noté RV i , est l’ensemble <strong>de</strong>s variables v ∈ V telles que Φ i n’est pas indépendant <strong>de</strong> v.L’ensemble <strong>de</strong>s joueurs utiles pour un joueur i, noté RP i , est l’ensemble <strong>de</strong>s joueurs j ∈ N tels que jcontrôle au moins une variable utile <strong>de</strong> i : RP i = S v∈RV iπ −1 (v).La définition du graphe <strong>de</strong> dépendance d’un L-jeu booléen est exactement celle donnée définition 2.9(page 38).Ces définitions ne dépen<strong>de</strong>nt pas du langage <strong>de</strong> représentation <strong>de</strong> préférences choisi. Pour illustrerces concepts, nous donnons un exemple dans lequel les préférences sont représentées par <strong>de</strong>s buts àpriorité, en utilisant le critère leximin.Exemple 3.19. Soit G = (N,V ,π,Γ,Φ) un BP-jeu booléen, avec∗ N = {1,2,3},∗ V = {a,b,c},∗ π 1 = {a}, π 2 = {b}, π 3 = {c},∗ γ 1 = γ 2 = γ 3 = ⊤,∗ Σ 1 = 〈a〉,∗ Σ 2 = 〈(b ∨ ¬a);a〉, <strong>et</strong>∗ Σ 3 = 〈(c ∨ ¬a);a〉.Les relations <strong>de</strong> préférences Pre f lexG= 〈≽lex 1 ,≽lex 2 ,≽lex 3〉 sont décrites ci-<strong>de</strong>ssous :abcJoueur 1abc abcabcabcabcJoueur 2abcabcabcabcabcabcJoueur 3abcabcabcabcabcabcabcabcabcabcabcabcNous avons : RV 1 = {a}, RV 2 = {a,b}, RV 3 = {a,c}, RP 1 = {1}, RP 2 = {1,2}, RP 3 = {1,3}.3 1 2La définition <strong>de</strong> la projection d’un L-jeu booléen sur un ensemble stable est également la même quela définition 2.11 (page 40).Il est possible <strong>de</strong> généraliser quelques propriétés qui étaient valables pour les préférences dichotomiques.Par exemple, la propriété 2.3 (page 40) est généralisable dans ce cadre :Jeux booléens 117


Jeux booléens <strong>et</strong> préférences non dichotomiquesPropriété 3.14. Si B est un ensemble stable, G B = (B,V B ,π B ,Γ B ,Φ ′ B ), avec Φ′ B étant équivalent à Φ B<strong>et</strong> ne contenant que <strong>de</strong>s variables <strong>de</strong> V B , est un L-jeu booléen.Preuve : La seule différence entre c<strong>et</strong>te preuve <strong>et</strong> celle <strong>de</strong> la propriété 2.3 (page 40)est l’étape consistant à vérifier que toutes les variables utilisées par les joueurs dansB appartiennent à V B . Nous <strong>de</strong>vons vérifier que toutes les variables utilisées par lesjoueurs dans B appartiennent à V B .Supposons tout d’abord qu’il existe un i ∈ B tel que Φ i n’est pas indépendant <strong>de</strong>V −B = V \V B . Donc, il existe x ∈V −B , il existe un s ∈ S tel que switch(s,x) ∼ i s. Dansce cas, d’après la définition 3.29 (page précé<strong>de</strong>nte), x ∈ RV i . Comme x ∈ V −B , <strong>et</strong> queB est stable, pour tout j ∈ B, x ∉ π j . Soit k ∈ N \ B tel que x ∈ π k . Comme x ∈ RV i ,on a par définition k ∈ RP i . Donc, k ∈ R(i), mais k ∉ B : c’est en contradiction avecle fait que B est stable.Φ i est donc indépendant <strong>de</strong> V −B . D’après le lemme 3.9 (page 116), il existe Φ ′ i quiinduit la même relation <strong>de</strong> préférences que Φ i <strong>et</strong> qui ne contient aucune variable <strong>de</strong>V −B .Il en est <strong>de</strong> même pour la première assertion <strong>de</strong> la propriété 2.9 (page 46) :Propriété 3.15. Soit G un L-jeu booléen tel que la partie irréflexive du graphe <strong>de</strong> dépendance P <strong>de</strong>G soit acyclique. Alors G a un équilibre <strong>de</strong> Nash fort en stratégies pures.Preuve :On peut supposer sans perte <strong>de</strong> généralité que les joueurs sont numérotés <strong>de</strong> sorteque pour tout i ∈ N, si i dépend <strong>de</strong> j, alors j < i. Soit s = (s 1 ,...,s N ) définiinductivement comme suit : pour i = 1,...,N, on prend s i tel que pour tout s ′ i ,(s 1 ,...,s i ) ≽ i (s 1 ,...,s ′ i ). Un tel s i existe car i ne dépend pas <strong>de</strong> k pour tout k > i.On a donc construit un profil <strong>de</strong> stratégies s tel que pour tout i, pour tout s ′ i ,(s i ,s −i ) ≽ i (s ′ i ,s −i). s est donc un équilibre <strong>de</strong> Nash fort en stratégies pures.La propriété 2.10 (page 47) est également généralisable dans ce cadre :Propriété 3.16. Soit G = (N,V ,π,Γ,Φ) un L-jeu booléen, B ⊆ N un ensemble stable pour R, <strong>et</strong>G B = (B,V B ,π B ,Γ B ,Φ ′ B ) la projection <strong>de</strong> G sur B.Si s est un équilibre <strong>de</strong> Nash fort pour G, alors s B est un équilibre <strong>de</strong> Nash fort pour G B .Preuve : Soit s un équilibre <strong>de</strong> Nash fort pour G : ∀i ∈ N, ∀s ′ i ∈ S i, (s ′ i ,s −i) ≼ i(s i ,s −i ).Nous savons que s = (s B ,s −B ), <strong>et</strong> nous voulons vérifier que s B est un équilibre <strong>de</strong>Nash fort pour G B .Soit i ∈ B. Supposons que s B n’est pas un équilibre <strong>de</strong> Nash fort pour G B , i.e. ∃s ′ i ∈ S itel que (s ′ i ,s B−i) ⋠ i (s i ,s B−i ).Comme i ∈ B, <strong>et</strong> que B est stable, nous savons que les seuls joueurs qui ont une118 Elise Bonzon


3.4. Préférences non dichotomiques <strong>et</strong> graphe <strong>de</strong> dépendanceinfluence sur i sont dans B, <strong>et</strong> que donc s −B n’a aucune influence sur les préférences<strong>de</strong> i. On a donc (s ′ i ,s B−i,s −B ) ⋠ i (s i ,s B−i ,s −B ), ce qui est en contradiction avec lefait que s est un équilibre <strong>de</strong> Nash fort pour G.Reprenons à présent la propriété 2.11 (page 48) :Propriété 3.17. Soit B <strong>et</strong> C <strong>de</strong>ux ensembles stables <strong>de</strong> joueurs, <strong>et</strong> soit G B <strong>et</strong> G C <strong>de</strong>ux L-jeux booléensassociés.Si s B est un équilibre <strong>de</strong> Nash fort pour G B <strong>et</strong> s C un équilibre <strong>de</strong> Nash fort pour G C tels que ∀i ∈ B∩C,s B,i = s C,i 11 , alors s B∪C est un équilibre <strong>de</strong> Nash fort pour le jeu G B∪C .Preuve : B <strong>et</strong> C sont stables, donc d’après la propriété 2.2 (page 39), B ∪C estun ensemble stable, <strong>et</strong> d’après la propriété 3.14 (page précé<strong>de</strong>nte), G B∪C est un jeubooléen.Soit i ∈ B ∪C. 3 cas sont possibles (2 étant symétriques) :∗ i ∈ B \ C (ou i ∈ C \ B). s B est un équilibre <strong>de</strong> Nash fort pour G B , doncon a ∀s ′ i ∈ S i,(s ′ i ,s B−i) ≼ i (s i ,s B−i ). Puisque i ∉ C, nous pouvons écrire∀s ′ i ∈ S i,(s ′ i ,s B−i,s C ) ≼ i (s i ,s B−i ,s C ), ce qui revient à ∀s ′ i ∈ S i,(s ′ i ,s B∪C−i) ≼ i(s i ,s B∪C−i ).∗ i ∈ B ∩ C. On a alors ∀k ∈ B ∩ C, s B,k = s C,k . s B est un équilibre <strong>de</strong> Nashfort pour G B , donc on a ∀s ′ i ∈ S i,(s ′ i ,s B−i) ≼ i (s i ,s B−i ) ; s C est un équilibre<strong>de</strong> Nash fort pour G C , donc on a ∀s ′ i ∈ S i,(s ′ i ,s C−i) ≼ i (s i ,s C−i ). Puisque∀k ∈ B ∩C, s B,k = s C,k , nous avons ∀s ′ i ∈ S i,(s ′ i ,s B−i,s C−i ) ≼ i (s i ,s B−i ,s C−i ),c’est-à-dire ∀s ′ i ∈ S i,(s ′ i ,s B∪C−i) ≼ i (s i ,s B∪C−i ).s B∪C est donc bien un équilibre <strong>de</strong> Nash fort pour G B∪C .On peut alors généraliser la propriété 2.12 (page 50) exactement <strong>de</strong> la même façon que dans le chapitre2 (page 31) :Propriété 3.18. Soit G = (N,V,π,Γ,Φ) un L-jeu booléen, <strong>et</strong> soit B 1 ...B p p ensembles stables <strong>de</strong>joueurs, tels que B 1 ∪... ∪ B p = N. Soit G B1 ,...,G Bp les p L-jeux booléens associés.Si ∃s B1 ...s Bp <strong>de</strong>s équilibres <strong>de</strong> Nash fort pour G B1 ,...,G Bp tels que ∀i, j ∈ {1,... p}, ∀k ∈ B i ∩ B j ,s Bi ,k = s B j ,k, alors s = (s B1 ,...,s Bp ) est un équilibre <strong>de</strong> Nash fort pour G.Exemple 3.19, suite : Les ensembles <strong>de</strong> joueurs B = {1,2} <strong>et</strong> C = {1,3} sont stables. Nous obtenonsainsi <strong>de</strong>ux nouveaux BP-jeux booléens :∗ G B = (B,V B ,Γ B ,π B ,Φ B ), avec B = {1,2}, V B = {a,b}, π 1 = a, π 2 = b, γ 1 = γ 3 = ⊤, Σ 1 = 〈a〉,<strong>et</strong> Σ 2 = 〈(b ∨ ¬a);a〉. Les relations <strong>de</strong> préférences Pre fGlex = 〈≽lex 1 ,≽lex 2 〉 sont représentées surla figure suivante :G B a un équilibre <strong>de</strong> Nash (faible <strong>et</strong> fort) : {ab} (noté s B = (s B,1 ,s B,2 )).11 s B,i représente la stratégie du joueur i pour le jeu G B .Jeux booléens 119


Jeux booléens <strong>et</strong> préférences non dichotomiquesJoueur 1ab abab abJoueur 2abab abab∗ G C = (C,V C ,π C ,Γ C ,Φ C ), avec C = {1,3}, V C = {a,c}, π 1 = a, π 3 = c, γ 1 = γ 3 = ⊤, Σ 1 = 〈a〉<strong>et</strong> Σ 3 = 〈(c ∨ ¬a);a〉. Les relations <strong>de</strong> préférences Pre fGlex = 〈≽lex 1 ,≽lex 3〉 sont représentées surla figure suivante :ababJoueur 1ababJoueur 3acG C a un équilibre <strong>de</strong> Nash (faible <strong>et</strong> fort) : {ac} (noté s C = (s C,1 ,s C,3 )).B ∩C = {1}. Comme nous avons s B,1 = s C,1 = a : G B∪C a un équilibre <strong>de</strong> Nash en stratégies pures :{abc}.On remarque ici que les <strong>de</strong>ux jeux que nous venons d’étudier ici, G B <strong>et</strong> G C , sont beaucoup plus p<strong>et</strong>its,<strong>et</strong> donc faciles à étudier, que le jeu original présenté sur la figure 3.19 (page 117).acacac120 Elise Bonzon


4Jeux, logique propositionnelle <strong>et</strong>représentation compacteNous ne sommes pas les premiers à étudier <strong>de</strong>s concepts tels que les équilibres <strong>de</strong> Nash <strong>et</strong> les stratégiesdominées d’un point <strong>de</strong> vue logique. Mis à part les jeux booléens [Harrenstein <strong>et</strong> al., 2001;Harrenstein, 2004a; Dunne <strong>et</strong> van <strong>de</strong>r Hoek, 2004], il existe un certain nombre d’autres travaux surl’étu<strong>de</strong> <strong>de</strong>s jeux statiques dans une perspective logique <strong>et</strong> IA, qui perm<strong>et</strong>tent <strong>de</strong> représenter <strong>de</strong> telsjeux en utilisant <strong>de</strong>s langages <strong>de</strong> représentation compacte <strong>de</strong> préférences.4.1 Jeux <strong>et</strong> programmation logiqueQuelques lignes récentes <strong>de</strong> travail perm<strong>et</strong>tent d’exprimer <strong>de</strong>s jeux avec <strong>de</strong>s préférences ordinalesdans <strong>de</strong>s cadres bien connus en intelligence artificielle. Une façon, parmi d’autres, <strong>de</strong> représenterces préférences est d’utiliser <strong>de</strong>s programmes logiques, comme cela est fait dans [De Vos <strong>et</strong> Vermeir,1999; Foo <strong>et</strong> al., 2004].Nous allons tout d’abord présenter ces programmes logiques, puis nous introduirons les travaux <strong>de</strong>[De Vos <strong>et</strong> Vermeir, 1999] <strong>et</strong> <strong>de</strong> [Foo <strong>et</strong> al., 2004].4.1.1 Programmes logiquesNous allons ici donner rapi<strong>de</strong>ment le vocabulaire <strong>et</strong> les définitions utiles pour les programmes logiques.On considère ici <strong>de</strong>s programmes logiques étendus propositionnels avec <strong>de</strong>ux sortes <strong>de</strong> négation, lanégation classique ¬ <strong>et</strong> la négation <strong>de</strong> défaut not [Gelfond <strong>et</strong> Lifschitz, 1991]. Intuitivement, not aest vrai quand il n’y a aucune raison <strong>de</strong> croire a, tandis que ¬a est vrai lorsqu’il y a une preuve que aest faux. Un programme logique étendu P est une collection finie <strong>de</strong> règles <strong>de</strong> la forme :dans laquelle c, a j <strong>et</strong> b l sont <strong>de</strong>s littéraux.c ← a 1 ,...,a m ,not b 1 ,...,not b kLe littéral c forme la tête <strong>de</strong> la règle r, que l’on pourra noter t<strong>et</strong>e(r). Le corps <strong>de</strong> la règle r, notécorps(r), représente les littéraux a 1 ...a m ,not b 1 ,...,not b k . a 1 ,...,a m constituent les prérequis <strong>de</strong> larègle r <strong>et</strong> sont notés pre(r)← est oublié quand m = 0 <strong>et</strong> k = 0, <strong>et</strong> dans ce cas c<strong>et</strong>te règle sera appelée un fait.121


Jeux, logique propositionnelle <strong>et</strong> représentation compacteDéfinition 4.1. Une règle r est entravée par un littéral d s’il existe un i ∈ {1,...,k} tel que d = b i .r est entravée par un ensemble <strong>de</strong> littéraux X si X contient un littéral qui entrave r.Une règle r est applicable dans X, noté X |= corps(r), quand elle n’est pas entravée par X <strong>et</strong> queses prérequis appartiennent à X.Une règle r est satisfiable par X, noté X |= r, si t<strong>et</strong>e(r) ∈ X ou si X ̸|= corps(r).Un ensemble <strong>de</strong> littéraux X est consistant si, pour tous les atomes a, si a ∈ X alors ¬a ∉ X.Il est à présent possible <strong>de</strong> définir l’ensemble <strong>de</strong>s réponses d’un programme logique.Définition 4.2. Un ensemble <strong>de</strong> réponses d’un programme logique P est un ensemble <strong>de</strong> littéraux Xsatisfiant <strong>de</strong>ux conditions :1. Si r ∈ P est une règle applicable alors elle est appliquée, <strong>et</strong> t<strong>et</strong>e(r) ∈ X,2. Les seules règles utilisées sont celles qui ne sont pas entravées par X.4.1.2 Programme logique <strong>de</strong> choixDans [De Vos <strong>et</strong> Vermeir, 1999], un jeu est représenté par un programme logique <strong>de</strong> choix (choice logicprogram), dans lequel un ensemble <strong>de</strong> règles exprime que le joueur a choisi la “meilleure réponse”étant donnés les choix <strong>de</strong>s autres joueurs.Un programme logique <strong>de</strong> choix est un programme logique semi-négatif dans la mesure où il n’utilisepas <strong>de</strong> négation dans le corps <strong>de</strong>s règles. L’opérateur ⊕ est interprété comme un ou-exclusif. p ⊕ qsignifie donc “p ou q, mais pas les <strong>de</strong>ux”.Définition 4.3 ([De Vos <strong>et</strong> Vermeir, 1999]). Un programme logique <strong>de</strong> choix est un ensemble fini<strong>de</strong> règles <strong>de</strong> la formeA ← Boù A <strong>et</strong> B sont <strong>de</strong>s ensembles finis d’atomes.Intuitivement, les atomes <strong>de</strong> A sont supposés être séparés par ⊕, tandis que B est une conjonctiond’atomes (séparés par “,”).Un jeu sous forme normale est alors représenté par un programme logique <strong>de</strong> choix <strong>de</strong> la façonsuivante :Définition 4.4 ([De Vos <strong>et</strong> Vermeir, 1999]). Soit G = (N,S,(≥ i ) i∈N ) un jeu stratégique. Le programmelogique <strong>de</strong> choix P G associé à G contient les règles suivantes :∗ Pour chaque joueur i, P G contient la règle S i ←, qui assure que chaque joueur choisit exactementune stratégie <strong>de</strong> S i .∗ Pour chaque joueur i <strong>et</strong> pour tout s −i ∈ S −i , P G contient une règle B i (s −i ) ← s −i , où B i (s −i )représente la meilleure réponse du joueur i si les autres joueurs jouent s −i . C<strong>et</strong>te règle modélisele fait que chaque joueur choisira la meilleure réponse possible étant donnés les choix <strong>de</strong>sautres joueurs.Exemple 4.1. De nouveau, les stratégies du joueur 1 (resp. 2) sont dénotées A 1 , T 1 (resp. A 2 , T 2 ). Ledilemme du prisonnier peut être représenté par le programme logique <strong>de</strong> choix suivant :122 Elise Bonzon


4.1. Jeux <strong>et</strong> programmation logiqueA 1 ⊕ T 1 ← (4.1)A 2 ⊕ T 2 ← (4.2)A 1 ← T 2 (4.3)A 1 ← A 2 (4.4)A 2 ← T 1 (4.5)A 2 ← A 1 (4.6)L’équation 4.1 signifie que le joueur 1 a le choix entre jouer A 1 <strong>et</strong> T 1 . L’équation 4.3 signifie que si lejoueur 2 joue T 2 , le joueur 1 préfère A 1 , <strong>et</strong>c.Définition 4.5 ([De Vos <strong>et</strong> Vermeir, 1999]). Soit P un programme logique <strong>de</strong> choix. La base <strong>de</strong> Herbrand<strong>de</strong> P, dénotée B P , est l’ensemble <strong>de</strong> tous les atomes apparaissant dans les règles <strong>de</strong> P. Toutsous-ensemble <strong>de</strong>B P est une interprétation.Une interprétation I est un modèle <strong>de</strong> P si pour toute règle A ← B, si B ⊆ I alors I ∩A est un singl<strong>et</strong>on.Un modèle <strong>de</strong> P minimal pour l’inclusion est dit stable.De Vos <strong>et</strong> Vermeir ont alors montré qu’il existe pour chaque jeu un programme logique <strong>de</strong> choix telque l’ensemble <strong>de</strong>s modèles stables du programme coïnci<strong>de</strong> avec l’ensemble <strong>de</strong>s équilibres <strong>de</strong> Nashdu jeu.Exemple 4.1 (page précé<strong>de</strong>nte) – suite Etudions les différentes interprétations <strong>de</strong> ce jeu. On saittout d’abord que les interprétations <strong>de</strong> B P comprenant {A 1 ,T 1 } ou {A 2 ,T 2 } ne peuvent pas être <strong>de</strong>smodèles <strong>de</strong> P, car les <strong>de</strong>ux premières règles seraient alors violées.Les interprétations composées d’un singl<strong>et</strong>on ne sont pas non plus <strong>de</strong>s modèles. Etudions par exemplel’interprétation {A 1 }. On a pour la règle 4.6 B ⊆ {A 1 },<strong>et</strong> {A 1 } ∩ A qui n’est pas un singl<strong>et</strong>on.Etudions à présent {A 1 ,A 2 }, {A 1 ,T 2 }, {T 1 ,A 2 } <strong>et</strong> {T 1 ,T 2 } :∗ {A 1 ,A 2 } est un modèle, {A 1 ,A 2 } ∩ A est un singl<strong>et</strong>on pour toutes les règles telle que B ⊆{A 1 ,A 2 }.∗ {A 1 ,T 2 } n’est pas un modèle : on a pour la règle 4.6 B ⊆ {A 1 ,T 2 }, <strong>et</strong> {A 1 ,T 2 } ∩ A qui n’est pasun singl<strong>et</strong>on.∗ {T 1 ,A 2 } n’est pas un modèle : on a pour la règle 4.4 B ⊆ {T 1 ,A 2 }, <strong>et</strong> {T 1 ,A 2 } ∩ A qui n’est pasun singl<strong>et</strong>on.∗ {T 1 ,T 2 } n’est pas un modèle : on a pour la règle 4.3 B ⊆ {T 1 ,T 2 }, <strong>et</strong> {T 1 ,T 2 } ∩ A qui n’est pasun singl<strong>et</strong>on.Ce programme logique <strong>de</strong> choix a donc un seul modèle : {A 1 ,A 2 }, qui est donc un modèle stable <strong>et</strong>qui est bien l’équilibre <strong>de</strong> Nash <strong>de</strong> ce jeu.C<strong>et</strong>te propriété fournit une métho<strong>de</strong> systématique perm<strong>et</strong>tant <strong>de</strong> calculer les équilibres <strong>de</strong> Nash dansles jeux finis. C<strong>et</strong>te traduction a une limitation : sa taille. Un programme logique <strong>de</strong> choix a la mêm<strong>et</strong>aille que la forme normale d’un jeu.Jeux booléens 123


Jeux, logique propositionnelle <strong>et</strong> représentation compacte4.1.3 Programme logique avec <strong>de</strong>s disjonctions ordonnées4.1.3.1 Présentation <strong>et</strong> définitionsLes programmes logiques avec <strong>de</strong>s disjonctions ordonnées (logic program with or<strong>de</strong>red disjunction -LPOD) ont été introduits dans [Brewka, 2002]. Ces programmes logiques sont <strong>de</strong>s extensions <strong>de</strong> programmeslogiques avec <strong>de</strong>ux sortes <strong>de</strong> négation, <strong>et</strong> utilisent le connecteur × introduit dans la logiquepropositionnelle qualitative (Qualitative Choice Logic - QCL) par [Brewka <strong>et</strong> al., 2002]. Intuitivement,a × b signifie “si a est possible, alors je préfère a, sinon, je veux b”.Définition 4.6 ([Brewka, 2002; Gelfond <strong>et</strong> Lifschitz, 1991]). Un LPOD est constitué <strong>de</strong> règles r <strong>de</strong>la forme :c 1 ×... × c n ← a 1 ,...,a m ,not b 1 ,...,not b kdans laquelle c i , a j <strong>et</strong> b l sont <strong>de</strong>s littéraux. Intuitivement, la tête d’une règle <strong>de</strong> ce type se lit “si c’estpossible je veux avoir c 1 , si je ne peux pas avoir c 1 je préfère c 2 , ..., si je ne peux avoir aucun <strong>de</strong>s c i ,i ∈ {1,... ,n − 1}, alors je veux c n ”.Les littéraux c 1 ,...,c n sont appelés les choix <strong>de</strong> la règle r.Exemple 4.2 ([Brewka, 2002]). Marjolaine a un après-midi <strong>de</strong> libre. Elle a le choix entre aller à laplage ou au cinéma. Elle préfère habituellement aller au cinéma qu’à la plage, excepté lorsqu’il faitchaud, auquel cas elle préfère aller à la plage. Il fait normalement chaud en été, mais il peut y avoir<strong>de</strong>s exceptions, <strong>et</strong> s’il pleut elle ne veut absolument pas aller à la plage. Ces informations peuventêtre représentées par le LPOD suivant :1. cinema × plage ← not chaud2. plage × cinema ← chaud3. chaud ← <strong>et</strong>e,not ¬chaud4. ¬plage ← pluieQuelques définitions supplémentaires sont nécessaires pour définir les ensembles <strong>de</strong> réponses (answers<strong>et</strong>s) <strong>de</strong> ces programmes logiques particuliers.Définition 4.7 ([Brewka, 2002]). Soit r = c 1 ×... × c n ← corps une règle. Pour k ≤ n, on définit lak eme option <strong>de</strong> r parr k = c k ← corps,not c 1 ,...,not c k−1Définition 4.8. Soit P un LPOD. P ′ est une partie <strong>de</strong> programme <strong>de</strong> P (split program) s’il est obtenuen remplaçant chaque règle <strong>de</strong> P par une <strong>de</strong> ses options.Exemple 4.3 ([Brewka, 2002]). Soit P un LPOD formé par les règlesOn obtient 4 parties <strong>de</strong> programmes :1. a × b ← not c2. b × c ← not dP 1 a ← not c P 2 a ← not cb ← not dc ← not d,not bP 3 b ← not c,not a P 4 b ← not c,not ab ← not dc ← not d,not b124 Elise Bonzon


4.1. Jeux <strong>et</strong> programmation logiqueDéfinition 4.9. Soit P un LPOD. Un ensemble <strong>de</strong> littéraux R est un ensemble <strong>de</strong> réponses <strong>de</strong> P si Rest un ensemble <strong>de</strong> réponses consistant d’une partie <strong>de</strong> programme P ′ <strong>de</strong> P.Exemple 4.3 (page ci-contre) – suite Les ensembles <strong>de</strong> réponses pour chacune <strong>de</strong>s parties <strong>de</strong> Psont : P 1 : {a,b}, P 2 : {c}, P 3 : {b}, <strong>et</strong> P 4 : ∅.Le LPOD <strong>de</strong> c<strong>et</strong> exemple a donc 4 ensembles <strong>de</strong> réponses : {a,b}, {b}, {c} <strong>et</strong> ∅.Tous ces ensembles <strong>de</strong> réponses ne nous donnent pas la même satisfaction. {a,b} donne la meilleureréponse pour chacune <strong>de</strong>s <strong>de</strong>ux règles, ce qui n’est pas le cas pour les <strong>de</strong>ux autres règles. Pour fairela distinction entre les ensembles <strong>de</strong> réponses plus ou moins satisfaisants, [Brewka, 2002] introduitun <strong>de</strong>gré <strong>de</strong> satisfaction d’une règle dans un ensemble <strong>de</strong> réponses, qui perm<strong>et</strong> ensuite <strong>de</strong> trouver lesensembles <strong>de</strong> réponses préférés.Définition 4.10 ([Brewka, 2002]). Soit R un ensemble <strong>de</strong> réponses d’un LPOD P. R satisfait la règlec 1 ×... × c n ← a 1 ,...,a m ,not b 1 ,...,not b k∗ avec le <strong>de</strong>gré 1 s’il existe i tel que a i ∉ R, ou s’il existe l tel que b l ∈ R ;∗ avec le <strong>de</strong>gré j, (1 ≤ j ≤ n), si pour tout i, a i ∈ R, pour tout l, b l ∉ R, <strong>et</strong> j = min{p|c p ∈ R}.Définition 4.11 ([Brewka, 2002]). Soit un ensemble <strong>de</strong> littéraux R. R i (P) représente l’ensemble <strong>de</strong>règles <strong>de</strong> P satisfaites par R au <strong>de</strong>gré i.Soit R 1 <strong>et</strong> R 2 <strong>de</strong>ux ensembles <strong>de</strong> réponses d’un LPOD P. R 1 est préféré à R 2 , noté R 1 > R 2 , si <strong>et</strong>seulement s’il existe un i tel que R i 2 (P) ⊂ Ri 1 (P) <strong>et</strong> que pour tout j < i, R j 2 (P) = R j 1 (P).Définition 4.12 ([Brewka, 2002]). Un ensemble <strong>de</strong> littéraux R est un ensemble <strong>de</strong> réponses préféréd’un LPOD P si <strong>et</strong> seulement si R est un ensemble <strong>de</strong> réponses <strong>de</strong> P <strong>et</strong> qu’il n’existe pas d’ensemble<strong>de</strong> réponses R ′ <strong>de</strong> P tel que R ′ > R.Exemple 4.3 (page précé<strong>de</strong>nte) – suite Comme nous l’avons vu, ce LPOD a 3 ensembles <strong>de</strong> réponses: R 1 = {a,b}, R 2 = {b} <strong>et</strong> R 3 = {c}.R 1 satisfait les règles 1. <strong>et</strong> 2. avec un <strong>de</strong>gré 1 ; R 2 satisfait 1. avec un <strong>de</strong>gré 1, mais 2. avec un <strong>de</strong>gré2 ; <strong>et</strong> R 3 satisfait 1. avec un <strong>de</strong>gré 2, <strong>et</strong> 2. avec un <strong>de</strong>gré 1.P a donc un seul ensemble <strong>de</strong> réponses préféré, R 1 .Nous allons à présent présenter le lien, tel qu’il a été étudié par [Foo <strong>et</strong> al., 2004], entre LPOD <strong>et</strong>équilibre <strong>de</strong> Nash.4.1.3.2 LPOD <strong>et</strong> équilibres <strong>de</strong> NashDans [Foo <strong>et</strong> al., 2004], un jeu en forme normale est traduit par un LPOD dans lequel un ensemble<strong>de</strong> clauses représente les préférences <strong>de</strong> chaque joueur sur ses actions possibles, étant donnés tous lesprofils <strong>de</strong> stratégies <strong>de</strong>s autres joueurs.Exemple 4.4 ([Foo <strong>et</strong> al., 2004]). Si les stratégies du joueur 1 (resp. 2) sont dénotées A 1 , T 1 (resp.A 2 , T 2 ), le dilemme du prisonnier peut être représenté par l’ensemble <strong>de</strong> clauses suivant :Jeux booléens 125


Jeux, logique propositionnelle <strong>et</strong> représentation compacteClauses du joueur 1 :A 1 × T 1 ← T 2 (4.7)A 1 × T 1 ← A 2 (4.8)L’équation 4.7 signifie que si le joueur 2 choisit <strong>de</strong> se taire (T 2 ), le joueur 1 préfère, s’il a lechoix, avouer (A 1 ) que se taire (T 1 ). Ses préférences sont les mêmes si le joueur 2 avoue (cf.équation 4.8).Clauses du joueur 2 :A 2 × T 2 ← T 1 (4.9)A 2 × T 2 ← A 1 (4.10)Clauses <strong>de</strong> mouvement :A 1 ∨ T 1 (4.11)A 2 ∨ T 2 (4.12)Les clauses <strong>de</strong> mouvement représentent les choix possibles <strong>de</strong> chacun <strong>de</strong>s joueurs.Il est alors démontré que les équilibres <strong>de</strong> Nash en stratégies pures correspon<strong>de</strong>nt exactement auxensembles <strong>de</strong>s réponses préférés.Exemple 4.4 (page précé<strong>de</strong>nte) – suite On cherche à présent les <strong>de</strong>gré <strong>de</strong> satisfaction <strong>de</strong> chacun<strong>de</strong>s ensembles <strong>de</strong> réponses <strong>de</strong> ce jeu pour chacun <strong>de</strong>s joueurs. Le <strong>de</strong>gré <strong>de</strong> satisfaction <strong>de</strong> l’ensemble<strong>de</strong> réponses (A 1 ,A 2 ) est 1 (1,1) ; le <strong>de</strong>gré <strong>de</strong> satisfaction <strong>de</strong> (A 1 ,T 2 ) est (1,2) ; le <strong>de</strong>gré <strong>de</strong> satisfaction<strong>de</strong> (T 1 ,A 2 ) est (2,1) ; <strong>et</strong> le <strong>de</strong>gré <strong>de</strong> satisfaction <strong>de</strong> (T 1 ,T 2 ) est (2,2).Ce programme a donc un ensemble <strong>de</strong> réponses préféreées, (A 1 ,A 2 ), qui correspond bien à l’équilibre<strong>de</strong> Nash du dilemme du prisonnier.Comme pour les programmes logiques <strong>de</strong> choix, c<strong>et</strong>te traduction a une limitation : sa taille. LesLPODs ont la même taille que les formes normales du jeu (chaque joueur a besoin d’un nombre<strong>de</strong> clauses égal au nombre <strong>de</strong> profils <strong>de</strong> stratégies <strong>de</strong>s autres joueurs). Cependant, c<strong>et</strong>te limitationvient <strong>de</strong> la façon dont les LPODs sont construits à partir <strong>de</strong>s jeux, <strong>et</strong> peut être corrigée en perm<strong>et</strong>tantaux joueurs d’exprimer leurs préférences par <strong>de</strong>s LPODs (<strong>et</strong> <strong>de</strong>s buts à priorité) quelconques, ce quiperm<strong>et</strong>trait d’avoir une représentation beaucoup plus compacte.Une différence importante avec notre cadre <strong>de</strong> travail, qui est valable aussi bien avec Foo <strong>et</strong> al[Foo <strong>et</strong> al., 2004] qu’avec De Vos <strong>et</strong> Vermeir [De Vos <strong>et</strong> Vermeir, 1999], est que dans un jeu booléenles joueurs peuvent exprimer <strong>de</strong>s préférences binaires arbitraires, jusqu’au cas extrême où lasatisfaction du but d’un joueur dépend uniquement <strong>de</strong> variables contrôlées par d’autres joueurs.1 (joueur 1, joueur 2)126 Elise Bonzon


4.2. Jeux <strong>et</strong> représentation graphique4.2 Jeux <strong>et</strong> représentation graphique4.2.1 CP-n<strong>et</strong>s <strong>et</strong> équilibres <strong>de</strong> NashLes CP-n<strong>et</strong>s, que nous avons présentés dans le chapitre 3 (page 69), sont un autre langage <strong>de</strong> représentationcompacte, <strong>et</strong> sont utilisés dans [Apt <strong>et</strong> al., 2005], pour représenter <strong>de</strong>s jeux : les CP-n<strong>et</strong>ssont vus comme <strong>de</strong>s jeux en forme normale <strong>et</strong> vice versa 2 . Chaque joueur i est associé à une variableX i du CP-n<strong>et</strong>, dont le domaine est l’ensemble <strong>de</strong>s actions possibles du joueur. Les préférences sur lesactions d’un joueur étant données les stratégies <strong>de</strong>s autres joueurs sont exprimées dans une table <strong>de</strong>préférences conditionnelles.Afin <strong>de</strong> pouvoir exprimer les préférences d’un joueur dans <strong>de</strong>s tables <strong>de</strong> préférences conditionnelles,les relations <strong>de</strong> préférences dans un jeu stratégiques sont paramétrées par les stratégies <strong>de</strong>s autresjoueurs.Définition 4.13 ([Apt <strong>et</strong> al., 2005]). Un jeu stratégique avec préférences paramétrées est un tupleG = (N,S 1 ,...,S n ,≻(s −1 ),...,≻(s −n )), où chaque s −i ∈ S −i .Dans ce contexte, un profil <strong>de</strong> stratégies s est un équilibre <strong>de</strong> Nash d’un jeu stratégique avec préférencesparamétrées G si <strong>et</strong> seulement si pour tout i ∈ {1,... ,n}, pour tout s ′ i ∈ S i, s i ≽(s −i )s ′ i.Exemple 4.5 ([Apt <strong>et</strong> al., 2005]). Si les stratégies du joueur 1 (resp. 2) sont dénotées H 1 , R 1 (resp.H 2 , R 2 ), la bataille <strong>de</strong>s sexes (que nous avons présentée dans l’exemple 1.2 (page 11)) peut êtrereprésentée par les préférences paramétrées suivantes :≻(H 2 ) : H 1 ≻ R 1≻(R 2 ) : R 1 ≻ H 1≻(H 1 ) : H 2 ≻ R 2≻(R 1 ) : R 2 ≻ H 2Il est montré dans [Apt <strong>et</strong> al., 2005] que tous les CP-n<strong>et</strong>s peuvent être traduits par un jeu stratégique ;<strong>et</strong> que tout jeu stratégique peut être traduit par un CP-n<strong>et</strong>. Nous allons présenter ici la traduction d’unjeu vers un CP-n<strong>et</strong>, la traduction réciproque étant quasiment symétrique.Soit un jeu stratégique avec préférences paramétrées G = (N,S 1 ,...,S n ,≻(s −1 ),...,≻(s −n )). Ce jeupeut être associé à un CP-n<strong>et</strong>N(G) <strong>de</strong> la façon suivante :∗ chaque joueur i correspond à une variable X i ,∗ les éléments du domaine D(X i ) <strong>de</strong> la variable X i consistent en les stratégies du joueur i.∗ Pa(X i ) = {X 1 ,...,X i−1 ,X i+1 ,...,X n } l’ensemble <strong>de</strong>s parents <strong>de</strong> la variable X i .∗ pour chaque s −i , la préférence conditionnelle X −i = s −i :≻(s −i ) est ajoutée, où ≻(s −i ) est larelation <strong>de</strong> préférence sur l’ensemble <strong>de</strong>s stratégies du joueur i si ses opposants jouent s −i .Exemple 4.5 – suite La bataille <strong>de</strong>s sexes avec préférences paramétrées peut être ainsi représentéepar un CP-n<strong>et</strong> à <strong>de</strong>ux variables, X 1 <strong>et</strong> X 2 , correspondant aux joueurs 1 <strong>et</strong> 2, <strong>et</strong> telles que D(X 1 ) ={H 1 ,R 1 } <strong>et</strong> D(X 2 ) = {H 2 ,R 2 }. Ce CP-n<strong>et</strong> est représenté sur la figure 4.1 (page suivante).2 Il ne s’agit donc pas ici d’utiliser les CP-n<strong>et</strong>s pour exprimer les préférences <strong>de</strong> chaque joueur comme nous l’avons faitdans la section 3.2.2 (page 75) du chapitre 3.Jeux booléens 127


Jeux, logique propositionnelle <strong>et</strong> représentation compacteX 2H 2 H 1 ≻ R 1R 2 R 1 ≻ H 1X 1H 1 H 2 ≻ R 2R 1 R 2 ≻ H 2Figure 4.1 — CP-n<strong>et</strong> <strong>de</strong> la bataille <strong>de</strong>s sexesCe CP-n<strong>et</strong> a <strong>de</strong>ux résultats optimaux : {H 1 ,H 2 } <strong>et</strong> {R 1 ,R 2 }, qui sont bien les équilibres <strong>de</strong> Nash dujeu.Il est montré dans [Apt <strong>et</strong> al., 2005] qu’un profil <strong>de</strong> stratégies est un équilibre <strong>de</strong> Nash du jeu G si<strong>et</strong> seulement si c’est un résultat optimal du CP-n<strong>et</strong> N (G). De même, dans la traduction inverse, ilest montré qu’un profil <strong>de</strong> stratégies est un résultat optimal d’un CP-n<strong>et</strong> si <strong>et</strong> seulement si c’est unéquilibre <strong>de</strong> Nash du jeu associé.Exprimer un jeu avec <strong>de</strong>s CP-n<strong>et</strong>s peut être parfois plus compact que la forme normale explicite dujeu, pourvu que les préférences <strong>de</strong> certains joueurs ne dépen<strong>de</strong>nt pas <strong>de</strong> tous les autres joueurs.Une différence importante avec notre cadre <strong>de</strong> travail est que nous perm<strong>et</strong>tons aux joueurs <strong>de</strong> contrôlerun ensemble arbitraire <strong>de</strong> variables : nous ne voyons donc pas les joueurs comme étant <strong>de</strong>s variables.La seule façon d’exprimer dans un CP-n<strong>et</strong> qu’un joueur contrôle plusieurs variables consisterait àintroduire une nouvelle variable dont le domaine serait l’ensemble <strong>de</strong> toutes les combinaisons <strong>de</strong>valeurs pour ces variables. La taille du CP-n<strong>et</strong> serait alors exponentielle en fonction du nombre <strong>de</strong>variables.Une autre différence (moins technique <strong>et</strong> plus fondamentale) entre ces <strong>de</strong>ux lignes <strong>de</strong> travail,qui explique en fait les différences avec [Apt <strong>et</strong> al., 2005], mais aussi avec [Foo <strong>et</strong> al., 2004] <strong>et</strong>[De Vos <strong>et</strong> Vermeir, 1999], est que nous ne traduisons pas <strong>de</strong>s jeux en forme normale en autre chose,mais que nous exprimons <strong>de</strong>s jeux en utilisant un langage logique.4.2.2 Forme normale graphiqueLa plupart <strong>de</strong>s travaux perm<strong>et</strong>tant <strong>de</strong> représenter <strong>de</strong>s jeux <strong>de</strong> façon compacte utilisent la notion <strong>de</strong>dépendance entre les joueurs <strong>et</strong>/ou les actions. Certains d’entre eux, dont [Koller <strong>et</strong> Milch, 2003;Kearns <strong>et</strong> al., 2001; La Mura, 2000], partagent le mo<strong>de</strong> <strong>de</strong> représentation <strong>de</strong>s utilités <strong>de</strong>s joueurssuivant : l’utilité du joueur i est décrite par une table associant une valeur numérique à chaque combinaison<strong>de</strong> valeurs <strong>de</strong> chacun <strong>de</strong>s ensembles <strong>de</strong> variables utiles à i. La représentation <strong>de</strong>s jeux avec<strong>de</strong> telles tables d’utilité est appelée forme normale graphique (graphical normal form, GNF) dans[Gottlob <strong>et</strong> al., 2005]. Les dépendances entre joueurs <strong>et</strong> variables entraînent naturellement une relation<strong>de</strong> dépendance entre joueurs, i<strong>de</strong>ntique à notre notion <strong>de</strong> dépendance : i dépend <strong>de</strong> j si la tabled’utilité <strong>de</strong> i fait référence à une variable contrôlée par le joueur j. Dans [Koller <strong>et</strong> Milch, 2003;Gottlob <strong>et</strong> al., 2005] les nœuds d’un graphe représentent les agents du jeu, <strong>et</strong> il y a un arc <strong>de</strong> i à j sii dépend <strong>de</strong> j. C<strong>et</strong>te représentation est plus compacte que la forme normale du jeu si le graphe n’est128 Elise Bonzon


4.2. Jeux <strong>et</strong> représentation graphiquepas une clique 3 .La notion <strong>de</strong> dépendance entre joueurs <strong>et</strong> variables dans les jeux graphiques est utilisée pour exactementla même raison que notre graphe <strong>de</strong> dépendance, à savoir fractionner un jeu en un ensemble <strong>de</strong>plus p<strong>et</strong>its jeux en interaction, <strong>et</strong> pouvant être résolus plus ou moins indépendamment.4.2.2.1 Diagrammes d’influence multi-agents[Koller <strong>et</strong> Milch, 2003] ont développé une représentation graphique pour les jeux dynamiques àconnaissance incomplète : multi-agent influence diagrams (MAIDs). Ces MAIDs perm<strong>et</strong>tent <strong>de</strong> représenter<strong>de</strong>s jeux <strong>de</strong> façon compacte, <strong>et</strong> ainsi d’étudier le calcul <strong>de</strong>s équilibres <strong>de</strong> Nash en stratégiesmixtes.Les MAIDs distinguent trois types <strong>de</strong> variables : les variables <strong>de</strong> chance (perm<strong>et</strong>tant <strong>de</strong> prendre encompte les connaissances incomplètes sur l’état <strong>de</strong> mon<strong>de</strong>), les variables <strong>de</strong> décision <strong>et</strong> les variablesd’utilité, perm<strong>et</strong>tant <strong>de</strong> représenter l’utilité <strong>de</strong> chaque joueur.Mis à part le fait que les MAIDs perm<strong>et</strong>tent <strong>de</strong> représenter la dynamicité <strong>et</strong> les connaissances incomplètes,la principale différence entre les MAIDs <strong>et</strong> les jeux booléens est la façon <strong>de</strong> représenterles préférences. Comme décrit précé<strong>de</strong>mment, les préférences dans les MAIDs sont représentées par<strong>de</strong>s tables d’utilité : l’utilité d’un joueur est la somme <strong>de</strong>s fonctions d’utilité locales, dont la tailleest exponentielle dans le nombre <strong>de</strong> variables (<strong>de</strong> chance ou <strong>de</strong> décision) dont elles dépen<strong>de</strong>nt. Lestables d’utilité ne peuvent pas exprimer en espace polynomial les informations contenues dans uneformule propositionnelle, ce qui implique que même la simple représentation propositionnelle quenous avons présentée dans le chapitre 2 (page 31) peut être parfois exponentiellement plus compacteque la représentation par tables d’utilité 4 .Par exemple, la représentation logique <strong>de</strong> la version à n joueurs du dilemme du prisonnier, que nousavons étudiée dans l’exemple 2.2 (page 34), est exponentiellement plus compacte que sa représentationutilisant un MAID. En eff<strong>et</strong>, les fonctions d’utilité <strong>de</strong> chaque joueur dépen<strong>de</strong>nt <strong>de</strong> toutes lesvariables du jeu, comme nous le montrons dans l’exemple suivant :Exemple 4.6. Soit le jeu booléen G = (N,V,π,Γ,Φ), avec∗ N = {1,2,3},∗ V = {C 1 ,C 2 ,C 3 },∗ π 1 = {C 1 }, π 2 = {C 2 }, π 3 = {C 3 },∗ γ 1 = γ 2 = γ 3 = ⊤,∗ ϕ 1 = (C 1 ∧C 2 ∧C 3 ) ∨ ¬C 1 ,∗ ϕ 2 = (C 1 ∧C 2 ∧C 3 ) ∨ ¬C 2 <strong>et</strong>∗ ϕ 3 = (C 1 ∧C 2 ∧C 3 ) ∨ ¬C 3 .Ce jeu peut également être représenté par le MAID suivant, qui nécessite 3 variables <strong>de</strong> décision,aucune variable <strong>de</strong> chance <strong>et</strong> 3 tables d’utilités :3 Un graphe est une clique si tous les somm<strong>et</strong>s sont <strong>de</strong>ux-à-<strong>de</strong>ux adjacents.4 Plus précisément, la représentation <strong>de</strong>s fonctions d’utilité par la somme <strong>de</strong>s utilités locales, chacune d’entre elles étantreprésentée par une table d’utilité, est polynomiale si <strong>et</strong> seulement si il existe une constante K limitant le nombre <strong>de</strong> variablesapparaissant dans chaque table, c’est-à-dire si <strong>et</strong> seulement si les utilités <strong>de</strong>s joueurs sont K-additives. Les fonctions d’utilitéque l’on peut représenter par une formule propositionnelle sont K-additives si <strong>et</strong> seulement si la taille <strong>de</strong>s formules utiliséesdans la représentation sont limitées à K (voir par exemple [Chevaleyre <strong>et</strong> al., 2006]).Jeux booléens 129


Jeux, logique propositionnelle <strong>et</strong> représentation compacteS u 1 u 2 u 3 S u 1 u 2 u 3C 1 C 2 C 3C 1 C 2 C 3 0 1 0 C 1 C 2 C 3 1 1 0u 1 u 2 u 3C 1 C 2 C 3 0 1 1 C 1 C 2 C 3 1 1 1C 1 C 2 C 3 1 1 1 C 1 C 2 C 3 1 0 0C 1 C 2 C 3 0 0 1 C 1 C 2 C 3 1 0 1Quand le nombre n <strong>de</strong> joueurs varie, c<strong>et</strong>te représentation grossit exponentiellement en n, alors qu’ilreste polynomial pour un jeu booléen.On peut remarquer que ces tables d’utilités peuvent être représentées en taille polynomiale par unarbre <strong>de</strong> décision, comme le montre l’arbre du joueur 1 :C 1 C 1C 2 C 21C 3 C 301 0Ce n’est cependant plus le cas dans l’exemple suivant :Exemple 4.7. Soit G = (N,V,π,Γ,Φ), un jeu booléen avec N = {1,2,... n}, V = {C 1 ,...,C n }, ∀i ∈N,π i = {C i }, ∀i ∈ N,γ i = ⊤, ∀i ∈ N,ϕ i = C i ↔ ( V jiC k ).Ce jeu peut être représenté par le MAID suivant :C 1 C 2 C 3u 1 u 2 u 3Les tables d’utilités sont les suivantes :Profils <strong>de</strong> stratégies u 1 u 2 u 3C 1 C 2 C 3 1 0 0C 1 C 2 C 3 0 0 1C 1 C 2 C 3 0 1 0C 1 C 2 C 3 0 0 1C 1 C 2 C 3 0 1 0C 1 C 2 C 3 1 0 1C 1 C 2 C 3 1 0 1C 1 C 2 C 3 1 1 0130 Elise Bonzon


4.2. Jeux <strong>et</strong> représentation graphiqueC<strong>et</strong>te représentation est exponentielle en nombre d’agents, tout comme la représentation par un arbre<strong>de</strong> décision. Nous représentons ici celui du joueur 1 :C 1 C 1C 2 C 2 C 2 C 2C013 C 3 C 3 C 31 00 1C<strong>et</strong>te représentation graphique <strong>de</strong>s jeux est utilisée dans [Vickrey <strong>et</strong> Koller, 2002] pour trouver <strong>de</strong>salgorithmes perm<strong>et</strong>tant <strong>de</strong> donner <strong>de</strong>s équilibres approximatifs 5 <strong>de</strong> ces jeux.Les jeux à n joueurs <strong>et</strong> <strong>de</strong>ux-actions 6 sont représentés <strong>de</strong> la même façon dans [Kearns <strong>et</strong> al., 2001],c’est-à-dire par un graphe <strong>et</strong> un ensemble <strong>de</strong> matrices perm<strong>et</strong>tant <strong>de</strong> représenter les utilités <strong>de</strong>sjoueurs. Un algorithme perm<strong>et</strong> alors <strong>de</strong> calculer les équilibres <strong>de</strong> Nash (mixtes) à partir <strong>de</strong> ces jeux.Une faille <strong>de</strong> c<strong>et</strong> algorithme a été trouvée, <strong>et</strong> corrigée, dans [Elkind <strong>et</strong> al., 2006].4.2.2.2 Formes normales graphiques <strong>et</strong> restrictionsLes jeux sous forme normale graphique sont également étudiés dans [Gottlob <strong>et</strong> al., 2005], qui ontutilisé la notion <strong>de</strong> voisins pour les définir : les voisins d’un joueur i dans un jeu graphique sont lesjoueurs pouvant influer sur l’utilité <strong>de</strong> i.Définition 4.14 ([Gottlob <strong>et</strong> al., 2005]). L’ensemble <strong>de</strong>s voisins d’un joueur i, noté V (i), est l’ensemble<strong>de</strong>s joueurs qui ont une influence sur i : si j ∉V(i), alors la fonction d’utilité <strong>de</strong> i ne dépendpas directement <strong>de</strong>s actions <strong>de</strong> j.L’ensemble <strong>de</strong>s voisins <strong>de</strong>s joueurs perm<strong>et</strong> <strong>de</strong> définir le graphe <strong>de</strong> dépendance <strong>de</strong> la même façon quecelui défini par [Koller <strong>et</strong> Milch, 2003]. [Gottlob <strong>et</strong> al., 2005] introduit également un hypergraphe <strong>de</strong>dépendance d’un jeu <strong>de</strong> la façon suivante :Définition 4.15 ([Gottlob <strong>et</strong> al., 2005]). Soit un jeu stratégique G, <strong>et</strong> N l’ensemble <strong>de</strong>s joueurs <strong>de</strong> cejeu.Le graphe <strong>de</strong> dépendance <strong>de</strong> G est un graphe non orienté G(G) dont l’ensemble <strong>de</strong>s nœuds est N,<strong>et</strong> l’ensemble <strong>de</strong>s arcs est défini par :{{i, j}| j ∈ N ∧ i ∈V( j)}L’hypergraphe <strong>de</strong> dépendance <strong>de</strong> G est un graphe non orienté H(G) dont l’ensemble <strong>de</strong>s nœuds estN, <strong>et</strong> l’ensemble <strong>de</strong>s hyperarcs est défini par :{{i} ∪V (i)|i ∈ N}5 Un équilibre est dit approximatif si la possibilité que chaque agent a <strong>de</strong> dévier est plus p<strong>et</strong>it qu’un ε donné.6 Une généralisation à <strong>de</strong>s jeux avec p actions est donnée dans [Kearns <strong>et</strong> al., 2001].Jeux booléens 131


Jeux, logique propositionnelle <strong>et</strong> représentation compacteComme dans les MAIDs, la forme normale graphique (GNF) d’un jeu est définie en associant un<strong>et</strong>able d’utilités à chaque joueur.L’exemple que nous allons présenter maintenant est une généralisation <strong>de</strong> la bataille <strong>de</strong>s sexes, quenous avons présentée dans l’exemple 1.2 (page 11), avec 4 joueurs.Exemple 4.8 ([Gottlob <strong>et</strong> al., 2005]). 4 amis, Alexia, Sylvain, Nicolas <strong>et</strong> Filou, doivent déci<strong>de</strong>r commentils souhaitent passer leur soirée. Ils ont le choix entre regar<strong>de</strong>r une comédie romantique ou unfilm d’horreur. Alexia a envie <strong>de</strong> passer la soirée avec Sylvain <strong>et</strong> Nicolas, peu importe le film. Sylvaina envie <strong>de</strong> voir un film d’horreur avec Alexia, mais sans Nicolas. Ce <strong>de</strong>rnier veut voir une comédieromantique, avec Alexia mais sans Sylvain. Quant à Filou, il préfèrerait voir une comédie romantiqueavec Nicolas.Soit G un jeu stratégique tel que N = {1,2,3,4}, Alexia étant le joueur 1, Sylvain le joueur 2, Nicolasle joueur 3 <strong>et</strong> Filou le joueur 4. V = {h 1 ,h 2 ,h 3 ,h 4 }, h 1 (resp. h 2 , h 3 <strong>et</strong> h 4 ) signifiant que le joueur 1(resp. 2, 3 <strong>et</strong> 4) va voir un film d’horreur, <strong>et</strong> ¬h 1 signifiant qu’il va voir une comédie romantique.On aV (1) = {2,3}, V (2) = {1,3}, V (3) = {1,2} <strong>et</strong> V (4) = {3}. Le graphe <strong>et</strong> l’hypergraphe <strong>de</strong>dépendance <strong>de</strong> ce jeu sont représentés sur la figure 4.2.12 312 3H(G)4G(G)4Figure 4.2 — Hypergraphe <strong>et</strong> graphe <strong>de</strong> dépendance du jeu GLes fonctions d’utilité 7 <strong>de</strong> ce jeu sont représentées sur la figure 4.3.1 h 2 h 3 h 2 h 3 h 2 h 3 h 2 h 3 2 h 1 h 3 h 1 h 3 h 1 h 3 h 1 h 3h 1 2 1 1 0 h 2 2 3 1 2h 1 0 1 1 2 h 2 1 2 0 13 h 1 h 2 h 1 h 2 h 1 h 2 h 1 h 2 4 h 3 h 3h 3 1 2 0 1 h 4 1 0h 3 2 3 1 2 h 4 1 2Figure 4.3 — Fonctions d’utilité pour la forme normale graphique <strong>de</strong> G[Gottlob <strong>et</strong> al., 2005] ont étudié <strong>de</strong>s restrictions specifiques sur ces jeux graphiques, en limitant lenombre <strong>de</strong> voisins <strong>de</strong> chacun <strong>de</strong>s joueurs, ou en imposant à la relation <strong>de</strong> dépendance d’être acyclique.Ils étudient l’impact <strong>de</strong> telles restrictions sur la complexité du problème consistant à vérifierl’existence d’un équilibre <strong>de</strong> Nash, <strong>et</strong>/ou sur le calcul <strong>de</strong> ces équilibres. Ils ont ainsi montré que leproblème <strong>de</strong> l’existence d’un équilibre <strong>de</strong> Nash en stratégies pures dans un GNF qui a un voisinage limité(c’est-à-dire que pour tous les joueurs i, |V (i)| ≤ k), est NP-compl<strong>et</strong>. La complexité est la mêmepour les jeux dont le graphe ou l’hypergraphe <strong>de</strong> dépendance est acyclique.7 Par exemple, u 2 (h 1 h 2 h 3 ) = 2, car Sylvain est content <strong>de</strong> voir un film d’horreur (+1), <strong>et</strong> <strong>de</strong> le voir avec Alexia (+1).u 2 (h 1 h 2 h 3 ) = 3, car Sylvain est content <strong>de</strong> voir un film d’horreur (+1), <strong>de</strong> le voir avec Alexia (+1), <strong>et</strong> que Nicolas aillevoir un autre film (+1).132 Elise Bonzon


4.2. Jeux <strong>et</strong> représentation graphiqueLa notion <strong>de</strong> voisin introduite dans [Gottlob <strong>et</strong> al., 2005] est similaire à notre notion <strong>de</strong> joueur utile.La principale différence entre le graphe <strong>de</strong> dépendance <strong>de</strong> [Gottlob <strong>et</strong> al., 2005] <strong>et</strong> le nôtre est quece <strong>de</strong>rnier est orienté, ce qui n’est pas le cas dans les GNFs. De plus, comme pour les MAIDs, lareprésentation <strong>de</strong>s jeux par tables d’utilité est parfois beaucoup moins compacte que celle utilisant unjeu booléen.4.2.2.3 G n<strong>et</strong>sLes G n<strong>et</strong>s, introduits par [La Mura, 2000], sont une autre représentation compacte <strong>de</strong>s jeux qui pren<strong>de</strong>n compte la notion <strong>de</strong> causalité. Un G n<strong>et</strong> est représenté par un graphe, dont les nœuds correspon<strong>de</strong>ntchacun aux variables du jeu, chaque nœud étant contrôlé par un <strong>et</strong> un seul agent (ou la nature 8 ). Deuxquantités sont associés à chaque nœud : sa probabilité, <strong>et</strong> l’utilité potentielle <strong>de</strong> ce nœud en fonction <strong>de</strong>ses voisins dans le graphe. Les arcs sont <strong>de</strong> <strong>de</strong>ux types : <strong>de</strong>s arcs orientés représentent les dépendancescausales (c’est-à-dire les dépendances issues <strong>de</strong>s probabilités), <strong>et</strong> les dépendances préférentielles sontreprésentés par <strong>de</strong>s arcs non-orientés (c’est-à-dire les influences <strong>de</strong>s utilités d’un nœud sur l’autre).Comme les MAIDs, c<strong>et</strong>te représentation est compacte si les utilités sont indépendantes, mais ne l’estplus si ce n’est pas le cas. Dans ce cas, la représentation par un jeu booléen peut être exponentiellementplus compacte que celle par un G n<strong>et</strong>.4.2.3 Symétries dans les fonctions d’utilitéUne autre approche pour représenter <strong>de</strong>s jeux <strong>de</strong> façon compacte est <strong>de</strong> s’intéresser à l’indépendance<strong>de</strong>s fonctions d’utilité, c’est-à-dire aux possibilités qu’un agent a d’affecter les autres agents, selon lesactions dont il dispose, <strong>et</strong> donc souvent aussi selon les symétries dans les fonctions d’utilité <strong>de</strong>s agents[Rosenthal, 1973; Mon<strong>de</strong>rer <strong>et</strong> Shapley, 1996; Kearns <strong>et</strong> Mansour, 2002; Roughgar<strong>de</strong>n <strong>et</strong> Tardos,2001]. C<strong>et</strong>te approche est très différente <strong>de</strong> celle utilisée dans les jeux booléens, nous la présentonsnéanmoins rapi<strong>de</strong>ment ici.4.2.3.1 Jeux <strong>de</strong> congestionLes jeux <strong>de</strong> congestion (congestion games) [Rosenthal, 1973], sont <strong>de</strong>s jeux dans lesquels les actionsdisponibles consistent en un ensemble <strong>de</strong> ressources, <strong>et</strong> l’utilité <strong>de</strong> chaque joueur dépend du nombre<strong>de</strong> joueurs ayant sélectionné les mêmes ressources (c’est-à-dire ayant joué la même action).Définition 4.16. Un jeu <strong>de</strong> congestion est constitué d’un ensemble N <strong>de</strong> joueurs, d’un ensemble finiR <strong>de</strong> ressources, d’un ensemble d’actions S i pour chaque joueur i tel que S i ⊆ 2 R , <strong>et</strong> une fonction <strong>de</strong>coût d : R × N → IN telle que d r ( j) n’est pas décroissant en j.Soit s = (s 1 ,...,s n ) un profil <strong>de</strong> stratégies, r ∈ R une ressource, <strong>et</strong> n s (r) le nombre <strong>de</strong> joueurs ayantchoisi la ressource r : n s (r) = |{i|r ∈ s i }|. On a alorsc i (s) = −u i (s) = ∑r∈s id r (n s (r))8 Les choix pris par la nature dénotent ceux qui relèvent du hasard.Jeux booléens 133


Jeux, logique propositionnelle <strong>et</strong> représentation compacteIntuitivement, chaque joueur choisit un ensemble <strong>de</strong> ressources (à partir <strong>de</strong>s ensembles qui lui sontdisponibles). Pour calculer les coûts que ces ressources <strong>de</strong>man<strong>de</strong>nt au joueur i (c’est-à-dire l’inverse<strong>de</strong> son utilité), on ajoute le coût <strong>de</strong> chaque ressource utilisée par i, en sachant que le coût d’uneressource r dépend du nombre <strong>de</strong> joueurs utilisant c<strong>et</strong>te ressource (n s (r)).Définition 4.17. Dans un réseau d’un jeu <strong>de</strong> congestion, les familles d’ensembles S i sont implicitementprésentées comme <strong>de</strong>s chemins dans un graphe. Soit un graphe orienté (V ,R), <strong>de</strong>ux nœudsd i ,a i ∈ V pour chaque joueur i. Les arcs du graphe représentent les ressources du jeu, <strong>et</strong> une fonction<strong>de</strong> coût est associée à ces arcs. Le sous ensemble <strong>de</strong> R représentant les actions disponibles pour i estl’ensemble <strong>de</strong> tous les chemins allant <strong>de</strong> d i à a i .Exemple 4.9 ([Fabrikant <strong>et</strong> al., 2004]). Soit le jeu <strong>de</strong> congestion suivant : trois joueurs, {1,2,3}doivent se déplacer du point S au point T , représentés sur la figure 4.4.Les arcs <strong>de</strong> ce graphe représentent les chemins possibles pour chacun <strong>de</strong>s joueurs. Ces arcs sontétiqu<strong>et</strong>és par la fonction coût qui dépend du nombre <strong>de</strong> joueurs empruntant c<strong>et</strong> arc : le premier chiffrecorrespond au coût <strong>de</strong> c<strong>et</strong> arc si un seul joueur l’emprunte, le second si <strong>de</strong>ux joueurs l’empruntent,<strong>et</strong> le troisième si les trois joueurs y passent.X1, 2, 32/3/5S4/6/71/2/82/3/6T1/5/61, 2, 3YFigure 4.4 — Le réseau d’un jeu <strong>de</strong> congestion : trois joueurs doivent aller <strong>de</strong> S à T . Chaque arc estétiqu<strong>et</strong>é avec les coûts pour chaque joueur suivant si le chemin est parcouru par 1, 2 ou 3 joueursPar exemple, si le joueur 1 emprunte le chemin SXY T , le joueur 2 le chemin SXT <strong>et</strong> le joueur 3 lechemin SY T , on aura c 1 (s) = 9, c 2 (s) = 5 <strong>et</strong> c 3 (s) = 9.Rosenthal a prouvé dans [Rosenthal, 1973] que tous les jeux <strong>de</strong> congestion ont un équilibre <strong>de</strong> Nashen stratégies pures. D’autre part, il est montré dans [Fabrikant <strong>et</strong> al., 2004] qu’il existe un algorithmepolynomial pour trouver un équilibre <strong>de</strong> Nash en stratégies pures dans le cas où le réseau du jeu <strong>de</strong>congestion est symétrique.L’utilité d’un joueur dans les jeux <strong>de</strong> congestion est liée au nombre <strong>de</strong> joueurs utilisant les mêmesressources, <strong>et</strong> donc effectuant les mêmes actions que lui. La principale différence entre jeux booléens<strong>et</strong> jeux <strong>de</strong> congestion est que dans les jeux booléens, <strong>de</strong>ux joueurs, qui contrôlent par définition <strong>de</strong>uxensembles <strong>de</strong> variables propositionnelles disjoints, ne peuvent donc pas effectuer la même action. Lanotion <strong>de</strong> coût d’une ressource ne peut donc être introduite dans un jeu booléen.4.2.3.2 Jeux à eff<strong>et</strong>s locauxLes jeux à eff<strong>et</strong>s locaux (local-effect games, LEGs) [Leyton-Brown <strong>et</strong> Tennenholtz, 2003] perm<strong>et</strong>tent<strong>de</strong> modéliser <strong>de</strong>s situations dans lesquelles les eff<strong>et</strong>s <strong>de</strong>s agents les uns sur les autres peuvent êtreasymétriques.134 Elise Bonzon


4.2. Jeux <strong>et</strong> représentation graphiqueDéfinition 4.18 ([Leyton-Brown <strong>et</strong> Tennenholtz, 2003]). Soit G = 〈A,F ,n〉 un jeu à eff<strong>et</strong>s locauxà n joueurs. A est l’ensemble <strong>de</strong>s actions disponibles pour les joueurs. Soit D la distribution <strong>de</strong>sjoueurs sur les actions. D(a) représente le nombre <strong>de</strong> joueurs ayant choisi l’action a ∈A.Pour chaque couple d’actions a,a ′ ∈A,F a,a ′: Z + → R + est la fonction <strong>de</strong> coût, strictement monotone,qui donne le coût <strong>de</strong>s eff<strong>et</strong>s locaux <strong>de</strong> l’action a à l’action a ′ qui dépend du nombre <strong>de</strong> joueursqui choisissent l’action a. À partir <strong>de</strong> ces définitions, il est possible <strong>de</strong> construire la fonction c d’unagent i qui choisit une action a ∈A :c(i) =F a,a (D(a))+∑b∈A,b̸=aF b,a (D(b))Un LEG peut être représenté par un graphe dont les nœuds représentent les actions <strong>de</strong>s joueurs, <strong>et</strong>les arcs représentent les dépendances d’utilité spécifiques au contexte entre les actions : il existe unnœud pour chaque action, <strong>et</strong> un arc du nœud a au nœud b si ∀x, F a,b (x) ̸= 0. Les fonctions <strong>de</strong> laformeF a,a (x) seront appelées fonctions <strong>de</strong> nœuds, tandis que les fonctions <strong>de</strong> la formeF a,b (x) serontappelées fonctions d’arcs.SoitV(a) l’ensemble <strong>de</strong>s nœuds tel qu’il y ait un arc partant <strong>de</strong> a <strong>et</strong> arrivant sur ce nœud. L’hypothèsesuivante est faite :∀a,b ∈A,b ∈V(a) → a ∈V(b)Ces préconditions nécessaires aux LEGs (tous les agents contrôlent le même ensemble d’actions ;l’utilité <strong>de</strong> chacun se décompose en la somme <strong>de</strong>s effects locaux pour les actions individuelles : <strong>et</strong>l’indépendance <strong>de</strong>s utilités est toujours bidirectionnelle) montrent que les LEGs ne perm<strong>et</strong>tent pas <strong>de</strong>représenter tous les jeux.Si tous les jeux à eff<strong>et</strong>s locaux n’ont pas d’équilibres <strong>de</strong> Nash en stratégies pures, <strong>de</strong> nombreuxcas particuliers, possedant <strong>de</strong>s PNEs car satisfaisant certaines caractéristiques particulières, ont étéi<strong>de</strong>ntifiés dans [Leyton-Brown <strong>et</strong> Tennenholtz, 2003].Comme pour les jeux <strong>de</strong> congestion, la fonction <strong>de</strong> coût existant dans un LEG, qui dépend du nombre<strong>de</strong> joueurs ayant choisi une action, ne peut être introduite dans un jeu booléen. D’autre part, l’indépendance<strong>de</strong>s fonctions d’utilité peut ne pas être bidirectionnelle dans un jeu booléen.4.2.3.3 Jeux graphiques d’actionsLes jeux graphiques d’action (action graph games, AGGs), introduits dans [Bhat <strong>et</strong> Leyton-Brown,2004], peuvent être vus comme <strong>de</strong>s LEGs non restreints. Ils peuvent représenter tous les jeux, notamment<strong>de</strong>s jeux graphiques comme ceux <strong>de</strong> [Koller <strong>et</strong> Milch, 2003]. Comme les LEGs, un AGG estun graphe tel qu’il y a un nœud pour chaque action du jeu, <strong>et</strong> un arc entre <strong>de</strong>ux nœuds s <strong>et</strong> s ′ si <strong>et</strong>seulement si s est dépendant <strong>de</strong> s ′ dans ce jeu, c’est-à-dire si les utilités <strong>de</strong>s joueurs choisissant s sontdépendantes <strong>de</strong>s joueurs choisissant s ′ .Définition 4.19 ([Bhat <strong>et</strong> Leyton-Brown, 2004]). Un jeu graphique d’actions est un tuple〈N,S,V ,u〉, où N = {1,...,n} est l’ensemble <strong>de</strong>s joueurs, S est l’ensemble <strong>de</strong>s profils <strong>de</strong> stratégies, S iétant les actions disponibles pour un joueur i ∈ N. Les agents peuvent avoir <strong>de</strong>s actions communes,on note doncA = S i∈N S i l’ensemble <strong>de</strong>s actions du jeu.∆ représente l’ensemble <strong>de</strong>s distributions possibles <strong>de</strong>s agents sur les actions, où une distributionconsiste en le nombre d’agents choisissant une action donnée. Pour une distribution donnée D ∈ ∆,Jeux booléens 135


Jeux, logique propositionnelle <strong>et</strong> représentation compacteD(a) est le nombre d’agents ayant choisi l’action a. D: S → N |A| est une fonction qui associe àchaque profil <strong>de</strong> stratégies s une distribution d’agents D.Soit G le graphe d’actions. G contient un nœud pour chaque action a ∈A. La relation <strong>de</strong> voisinageest donnée par V : A → 2 A . Il y a alors un arc <strong>de</strong> a à a ′ dans G si <strong>et</strong> seulement si a ′ ∈V (a). Il estpossible d’avoir a ∈V(a).La fonction d’utilité est la même pour tous les joueurs. Elle associe une valeur numérique à uneaction a <strong>et</strong> une distribution d’agents D : u: A × ∆ → R.Le problème <strong>de</strong> l’existence d’un équilibre <strong>de</strong> Nash en stratégies pures a été étudiédans [Jiang <strong>et</strong> Leyton-Brown, 2007]. Il a été ainsi montré que dans le cas général, le problème consistantà déci<strong>de</strong>r s’il existe un équilibre <strong>de</strong> Nash en stratégies pures dans un AGG est NP-compl<strong>et</strong>.Pourtant, il existe <strong>de</strong>s classes <strong>de</strong> ce jeu pour lesquelles ce problème est polynomial, par exemple siles AGGs ayant un nombre d’actions, <strong>et</strong> donc <strong>de</strong> nœuds, limité à k.Comme dans les jeux <strong>de</strong> congestion <strong>et</strong> les LEGs, l’utilité d’un joueur dans un AGG dépend du nombre<strong>de</strong> joueurs ayant choisi chaque action, <strong>et</strong> donc ne peut être introduite dans un jeu booléen.136 Elise Bonzon


5Coalitions efficaces dans les jeuxbooléensNous nous situons ici <strong>de</strong> nouveau dans le cadre <strong>de</strong> préférences dichotomiques. Comme nous l’avonsvu dans le chapitre 2 (page 31), les jeux booléens perm<strong>et</strong>tent <strong>de</strong> représenter <strong>de</strong>s jeux stratégiques <strong>de</strong>manière compacte, en utilisant le pouvoir d’expression <strong>et</strong> la concision <strong>de</strong> la logique propositionnelle.Les joueurs d’un jeu booléen ayant <strong>de</strong>s préférences dichotomiques, la notion suivante émerge naturellement: une coalition dans un jeu booléen est efficace si elle peut garantir à tous ses membres queleurs buts sont satisfaits. Notre objectif dans ce chapitre est <strong>de</strong> définir <strong>et</strong> <strong>de</strong> caractériser ces coalitionsefficaces, <strong>et</strong> <strong>de</strong> voir comment elles sont liées à la notion <strong>de</strong> noyau dans un jeu coalitionnel (voir ladéfinition 1.11 (page 26)).Après avoir présenté les fonctions d’effectivité en section 5.1, nous allons étudier les propriétés <strong>de</strong> cesfonctions d’effectivité associées aux jeux booléens en section 5.2. Dans la section 5.3, nous étudieronsen détail la notion <strong>de</strong> coalition efficace : nous donnerons une caractérisation exacte <strong>de</strong>s ensembles <strong>de</strong>coalitions correspondant à <strong>de</strong>s ensembles <strong>de</strong> coalitions efficaces associées à un jeu booléen, <strong>et</strong> nousferons le lien entre coalition efficace <strong>et</strong> noyau 1 .5.1 Fonctions d’effectivitéLes fonctions d’effectivité ont été développées en choix social afin <strong>de</strong> modéliser le pouvoir <strong>de</strong>s coalitions[Moulin, 1983; Abdou <strong>et</strong> Keiding, 1991]. On rappelle qu’une coalition C est un sous-ensemblequelconque <strong>de</strong> l’ensemble <strong>de</strong>s agents N. N est appelée la gran<strong>de</strong> coalition. Etant donné un ensembled’alternatives S parmi lesquelles un ensemble d’individus N doit choisir, une fonction d’effectivitéEff: 2 N → 2 2S associe un sous-ensemble <strong>de</strong> S à chaque coalition. X ∈ Eff(C) est interprété par “lacoalition C est effective 2 pour X”.Définition 5.1. Une fonction d’effectivité coalitionnelle est une fonction Eff: 2 N → 2 2S monotone :pour toute coalition C ⊆ N, X ∈ Eff(C) implique Y ∈ Eff(C) quand X ⊆ Y ⊆ S.La fonction Eff associe à chaque groupe <strong>de</strong> joueurs l’ensemble <strong>de</strong>s issues 3 du jeu que ce groupe a1 Les résultats donnés dans ce chapitre ont fait l’obj<strong>et</strong> <strong>de</strong> plusieurs publications : [Bonzon <strong>et</strong> al., 2008, 2007b]2 La définition “coalition efficace” pourrait mieux convenir à la traduction <strong>de</strong> “effective coalition”, mais nous utiliseronsce terme plus tard (voir définition 5.4 (page 143)), <strong>et</strong> donc nous conservons ici le terme “effectif”.3 Dans un jeu booléen, une issue du jeu correspond à un profil <strong>de</strong> stratégies. Mais, dans un cadre plus général, une issuedu jeu peut correspondre à un plan d’actions, ou à l’utilité obtenue par chaque joueur.137


Coalitions efficaces dans les jeux booléensle pouvoir d’atteindre. On interprète habituellement X ∈ Eff(C) comme “les joueurs dans C ont unestratégie commune leur perm<strong>et</strong>tant d’obtenir une issue dans X”.Les fonctions d’effectivité peuvent satisfaire quelques propriétés additionnelles ([<strong>Paul</strong>y, 2001]) :Coalition-monotone : Eff est coalition-monotone si pour tout C ⊆ C ′ ⊆ N, Eff(C) ⊆ Eff(C ′ ).Régularité : Eff est C-régulière si pour tout X, si X ∈ Eff(C), alors X ∉ Eff(C) 4 . Eff est régulière siEff est C-régulière pour toute coalition C.Maximalité : Eff est C-maximale si pour tout X, si X ∉ Eff(C), alors X ∈ Eff(C). Eff est maximalesi Eff est C-maximale pour toute coalition C.Supperaditivité : Eff est superadditive si pour tout C,C ′ ⊆ N <strong>et</strong> X,Y ⊆ S, si X ∈ Eff(C) <strong>et</strong> Y ∈Eff(C ′ ) alors X ∩Y ∈ Eff(C ∪C ′ ).<strong>Paul</strong>y (2001) a précisé le sens du mot “effectif” dans le cadre <strong>de</strong>s jeux stratégiques en définissantl’α-effectivité : une coalition C ⊆ N est dite α-effective pour X ⊆ S si <strong>et</strong> seulement si les joueurs<strong>de</strong> c<strong>et</strong>te coalition ont une stratégie commune leur perm<strong>et</strong>tant d’obtenir une issue dans X, quelles quesoient les stratégies <strong>de</strong>s autres joueurs.Définition 5.2. Pour un jeu stratégique G non vi<strong>de</strong>, une fonction d’α-effectivité coalitionnelle estune fonction Eff α G : 2N → 2 2S définie comme suit : X ∈ Eff α G (C) si <strong>et</strong> seulement si ∃s C ∀s −C , (s C ,s −C ) ∈X.5.2 Coalitions <strong>et</strong> fonctions d’effectivité dans les jeux booléensNous voulons à présent définir les fonctions d’effectivité correspondant au cas particulier <strong>de</strong>s jeuxbooléens. Une <strong>de</strong>s particularités <strong>de</strong>s jeux booléens est la définition <strong>de</strong>s stratégies individuelles commeétant l’attribution <strong>de</strong> valeurs <strong>de</strong> vérité sur un ensemble donné <strong>de</strong> variables propositionnelles. On peutse <strong>de</strong>man<strong>de</strong>r à quel point c<strong>et</strong>te spécificité est restrictive. Clairement, la définition <strong>de</strong> S i comme étantMod πi (γ i ) entraîne quelques contraintes sur le pouvoir <strong>de</strong>s joueurs. Notre but est <strong>de</strong> donner une caractérisationexacte <strong>de</strong>s fonctions d’effectivité induites par les jeux booléens. Puisque dans un jeubooléen le pouvoir d’un agent i est indépendant <strong>de</strong> son but ϕ i , il suffira <strong>de</strong> considérer les pré-jeuxbooléens 5 pour étudier les fonctions d’effectivité.À partir d’un pré-jeu booléen G, on obtient une fonction d’α-effectivité Eff α G , qui caractérise lescoalitions composées <strong>de</strong> joueurs indépendants <strong>de</strong>s joueurs n’appartenant pas à c<strong>et</strong>te coalition pourobtenir une issue X quelconque.Définition 5.3. Soit G = (N,V,π,Γ) un pré-jeu booléen. La fonction d’α-effectivité coalitionnelleinduite par G est la fonction Eff α G : 2N → 2 2S définie par : pour tout X ⊆ S <strong>et</strong> tout C ⊆ N, X ∈ Eff α G (C)s’il existe s C ∈ S C tel que pour tout s −C ∈ S −C , (s C ,s −C ) ∈ X.On peut remarquer que les fonctions d’α-effectivité induites par <strong>de</strong>s pré-jeux booléens peuvent êtreexprimées <strong>de</strong> façon équivalente par <strong>de</strong>s fonctions 6 Eff G : 2 N → 2 L Vassociant à <strong>de</strong>s coalitions <strong>de</strong>s4 X représente S \ X, <strong>et</strong> C représente N \C.5 Rappelons qu’un pré-jeu booléen est un jeu booléen dans lequel on ne considère pas les buts <strong>de</strong>s joueurs, soit le 4-upl<strong>et</strong>(N,V ,π,Γ) (voir définition 2.2 (page 34)).6 Pour simplifier les notations, les fonctions d’α-effectivité induites par un pré-jeu booléen G seront notées Eff G au lieu<strong>de</strong> Eff α G .138 Elise Bonzon


5.2. Coalitions <strong>et</strong> fonctions d’effectivité dans les jeux booléensensembles <strong>de</strong> formules logiques : ϕ ∈ Eff G (I) si Mod πI (ϕ) ∈ Eff G (I). C<strong>et</strong>te définition entraîne évi<strong>de</strong>mmentune indépendance <strong>de</strong> syntaxe, c’est-à-dire si ϕ ≡ ψ alors ϕ ∈ Eff G (I) si <strong>et</strong> seulement siψ ∈ Eff G (I).C<strong>et</strong>te définition est un cas particulier <strong>de</strong> la fonction d’α-effectivité induite par un jeu stratégique(voir [<strong>Paul</strong>y, 2001], Chapitre 2), puisqu’un pré-jeu booléen est une forme stratégique spécifique. Parconséquent, c<strong>et</strong>te fonction satisfait les propriétés suivantes (cf. [<strong>Paul</strong>y, 2001], Theorème 2.27) :1. ∀C ⊆ N, ∅ ∉ Eff G (C) ;2. ∀C ⊆ N, S ∈ Eff G (C) ;3. pour tout X ⊆ S, si ¯X ∉ Eff G (∅) alors X ∈ Eff G (N) ;4. Eff G est superadditive.Une fonction d’α-effectivité qui satisfait ces quatre propriétés est dite fortement jouable. On peut noterque la propriété “fortement jouable” implique les propriétés <strong>de</strong> régularité <strong>et</strong> <strong>de</strong> coalition-monotonie([<strong>Paul</strong>y, 2001], Lemme 2.26).Pourtant, nous aimerions avoir une caractérisation encore plus précise <strong>de</strong> ces fonctions d’α-effectivitécorrespondant à un pré-jeu booléen. Pour cela, nous <strong>de</strong>vons tout d’abord définir <strong>de</strong>ux propriétés <strong>de</strong>plus, en utilisant la notation suivante : At(C) dénotera les ensembles minimaux <strong>de</strong> Eff(C), c’est-àdireque At(C) = {X ∈ Eff(C)| il n’existe pas <strong>de</strong> Y ∈ Eff(C) tel que Y ⊆ X}.Atomicité : Eff satisfait l’atomicité si pour tout C ⊆ N, At(C) forme une partition <strong>de</strong> S.Décomposabilité : Eff satisfait la décomposabilité si pour tout I,J ⊆ N <strong>et</strong> pour tout X ⊆ S, X ∈Eff(I ∪ J) si <strong>et</strong> seulement s’il existe Y ∈ Eff(I) <strong>et</strong> Z ∈ Eff(J) tels que X = Y ∩ Z.On peut noter que la décomposabilité est une propriété forte qui entraîne la superadditivité.Propriété 5.1. Une fonction d’α-effectivité coalitionnelle Eff satisfait1. la jouabilité forte,2. l’atomicité,3. la décomposabilité, <strong>et</strong>4. Eff(N) = 2 S \∅.si <strong>et</strong> seulement s’il existe un pré-jeu booléen G = (N,V,π,Γ) <strong>et</strong> une fonction injective µ: S → 2 V telsque pour tout C ⊆ N : Eff G (C) = {µ(X)|X ∈ Eff(C)}.La preuve <strong>de</strong> c<strong>et</strong>te propriété est assez longue. Elle repose sur les lemmes 5.1 à 5.5(page 142).Si G est un pré-jeu booléen, l’ensemble <strong>de</strong>s ensembles minimaux (appelés atomes)pour la fonction d’effectivité Eff G sera noté par At G .Commençons par montrer la direction (⇐) <strong>de</strong> la propriété 5.1.Lemme 5.1. Pour tout pré-jeu booléen G, Eff G est fortement jouable, <strong>et</strong> satisfaitl’atomicité, la décomposabilité <strong>et</strong> Eff G (N) = 2 S \∅.Jeux booléens 139


Coalitions efficaces dans les jeux booléensPreuve du lemme : Eff G est une fonction (spécifique) d’α-effectivité. Le Theorème2.27 dans [<strong>Paul</strong>y, 2001] prouve donc que Eff G est fortement jouable (<strong>et</strong>, a fortiori,superadditive).Pour l’atomicité, remarquons tout d’abord que X ∈ At G (C) si <strong>et</strong> seulement si X estl’ensemble <strong>de</strong> toutes les π C -interprétations satisfaisant γ C = V i γ i , ce qui impliqueclairement que tous les ensembles distincts <strong>de</strong> At G (C) sont disjoints. Remarquonsensuite que S s C ∈S C{s | s ⊃ s C } = S. Donc, At G (C) forme une partition <strong>de</strong> S.Pour la décomposabilité, <strong>de</strong> gauche à droite : Soit X ∈ Eff G (I ∪J). Alors il existe unestratégie commune s I∪J telle que si W = {s ∈ S|s ⊇ s I∪J }, alors W ⊆ X. Considéronsà présent Y = {s ∈ S|s ⊇ s I } <strong>et</strong> Z = {s ∈ S|s ⊇ s J }. Nous avons Y ∈ Eff G (I), Z ∈Eff G (J) <strong>et</strong> X = Y ∩ Z. De droite à gauche : soit Y ∈ Eff G (I) <strong>et</strong> Z ∈ Eff G (J), alorsgrâce à la superaddivité, Y ∩ Z ∈ Eff G (I ∪ J).Enfin, on peut facilement vérifier que Eff G (N) = 2 S \∅.Lemme 5.2. S’il existe un pré-jeu booléen G = (N,V,π,Γ) <strong>et</strong> une fonction injectiveµ: S → 2 V telle que pour tout C ⊆ N : Eff G (C) = {µ(X)|X ∈ Eff(C)}, alors Eff estfortement jouable, <strong>et</strong> satisfait l’atomicité, la décomposabilité <strong>et</strong> Eff(N) = 2 S \∅.Preuve du lemme : Comme Eff G satisfait ces propriétés, <strong>et</strong> que µ est une bijectionentre S <strong>et</strong> µ(S), ces propriétés sont transférées à Eff.Prouvons à présent la direction (⇒) <strong>de</strong> la propriété 5.1 (page précé<strong>de</strong>nte).Lemme 5.3. Soit G un pré-jeu booléen <strong>et</strong> T i un sous-ensemble minimal <strong>de</strong> Eff G (i).Alors, T i = {s|s ⊇ s i } pour tout s i ∈ S i .Preuve du lemme : X ∈ Eff G (i) si X contient S 1 ×...×S i−1 ×S ∗ i ×S i+1 ×...S n pourcertains S ∗ i ⊆ S i . Donc, les sous-ensembles minimaux <strong>de</strong> Eff G (i) sont exactementceux <strong>de</strong> la forme S 1 ×...×S i−1 ×{s i }×S i+1 ×...S n , c’est-à-dire <strong>de</strong> la forme {s|s ⊇s i }.À partir <strong>de</strong> maintenant, soit Eff une fonction d’effectivité coalitionnelle, étant fortementjouable, <strong>et</strong> satisfaisant l’atomicité, la décomposabilité <strong>et</strong> Eff(N) = 2 S \∅.Remarquons tout d’abord que la décomposabilité implique que Eff est entièrementdéterminée par {At(i),i ∈ N}.Lemme 5.4. Pour chaque s ∈ S il existe un unique (Z 1 ,...,Z n ) tel que pour tout i,Z i ∈ At(i) <strong>et</strong> Z 1 ∩... ∩ Z n = {s}.Preuve du lemme : Soit s ∈ S. Comme Eff(N) = 2 S \{∅}, on a {s} ∈ Eff(N), <strong>et</strong> pardécomposabilité, il existe (T 1 ,...,T n ) tel que pour tout i, T i ∈ Eff(i) <strong>et</strong> T 1 ∩...∩T n =140 Elise Bonzon


5.2. Coalitions <strong>et</strong> fonctions d’effectivité dans les jeux booléens{s}.Soit i ∈ N. Par définition <strong>de</strong> At(i), il existe Z i ∈ At(i) tel que s ∈ Z i <strong>et</strong> Z i ⊆ T i .Supposons qu’il existe Z i ′ ∈ At(i) tel que s ∈ Z′ i <strong>et</strong> Z′ i ⊆ T i. Z i ∩ Z i ′ ̸= ∅, puisque sappartient à Z i <strong>et</strong> à Z i ′. Donc, par atomicité, Z i = Z i ′ , <strong>et</strong> cela vaut pour tout i.Le lemme 5.4 nous perm<strong>et</strong> d’écrire que, pour chaque s <strong>et</strong> i, Z i (s) est le seul sousensemble<strong>de</strong> At(i) contenant s. Pour toute coalition non vi<strong>de</strong> C, nous écrirons Z C (s) =Ti∈C Z i (s).Ensuite, nous construisons G ∗ à partir <strong>de</strong> Eff comme suit :∗ Pour chaque i, on numérote At(i) : soit r i une fonction bijective <strong>de</strong> At(i) dans{0,1,... , |At(i)| − 1}. Ensuite, on crée p i = ⌈log 2 |At(i)|⌉ variables propositionnellesx 1 i ,...,xp ii . Enfin, on pose V = {x ji |i ∈ N,1 ≤ j ≤ p i} ;∗ Pour chaque i : π i = {x 1 i ,...,xp ii } ;∗ Pour chaque i <strong>et</strong> chaque j ≤ p i , soit ε i, j le jème chiffre dans la représentationbinaire <strong>de</strong> i. On note que ε i,pi = 1 par définition <strong>de</strong> p i . Si x est une variablepropositionnelle, nous utiliserons alors la notation suivante : 0.x = ¬x <strong>et</strong> 1.x = x.On définit ensuite)γ i =^j∈{2,...,p i },ε i, j =0(^1≤k≤ j−1ε i, j .x k i → ¬x ji∗ Enfin, pour chaque s ∈ S, soit µ(s) ∈ 2 V défini par : x ji ∈ µ(s) si <strong>et</strong> seulement sile jème chiffre <strong>de</strong> la représentation binaire <strong>de</strong> r i (Z i (s)) est 1.Pour chaque i ∈ N <strong>et</strong> chaque Z ∈ At(i), soit k = r i (Z) <strong>et</strong> s i (Z) la stratégie du joueur idans G correspondant à la représentation binaire <strong>de</strong> k utilisant {x 1 i ,...,xp ii }, x 1 i étant lebit le plus significatif. Par exemple, si p i = 3 <strong>et</strong> r i (Z i ) = 6 alors s i (Z) = (x 1 i ,x2 i ,¬x3 i ).S G ∗ dénote l’ensemble <strong>de</strong>s états associés à G ∗ , eux-mêmes dénotés par s G ∗. L’ensemble<strong>de</strong>s atomes <strong>de</strong> Eff G ∗ est noté At G ∗(i).Remarque : Pour suivre c<strong>et</strong>te construction, il peut être utile <strong>de</strong> voir comment ellefonctionne sur un exemple. Soit N = {1,2,3}, S = {1,2,3,4,5,6,7,8,9,A,B,C},At(1) = {1234,5678, 9ABC}, At(2) = {13579B,2468AC}, At(3) ={12569C,3478AB} 7 .Par décomposabilité, on a At(12) = {13,24,57,68,9B,AC}, At(13) ={12,34,56,78,9C,AB}, <strong>et</strong> At(23) = {159,37B,26C,48A}.|At(1)| = 3, donc p 1 = 2. |At(2)| = |At(3)| = 2, donc p 2 = p 3 = 1. Alors, V ={x 1 1 ,x2 1 ,x1 2 ,x1 3 }.Soit At(1) = {Z 0 ,Z 1 ,Z 2 }, c’est-à-dire r 1 (1234) = 0, r 1 (5678) = 1 <strong>et</strong> r 1 (9ABC) = 2.De même, r 2 (13579B) = 0, r 2 (2468AC) = 1, r 3 (12569C) = 0 <strong>et</strong> r 3 (3478AB) = 1.7 On om<strong>et</strong> les parenthèses pour les sous-ensembles <strong>de</strong> S : 1234 représente {1,2,3,4} <strong>et</strong> ainsi <strong>de</strong> suite.Jeux booléens 141


Coalitions efficaces dans les jeux booléensEtudions s = 6. Nous avons s = 5678 ∩ 2468AC ∩ 12569C, <strong>et</strong> donc s G ∗ = µ(s) =(¬x 1 1 ,x2 1 ,x1 2 ,¬x1 3 ). Les contraintes sont γ 1 = (x 1 1 → ¬x2 1 ), γ 2 = γ 3 = ⊤.On aura donc G ∗ = (N,V,π,Γ) défini par N = {1,2,3}, V = {x 1 1 ,x2 1 ,x1 2 ,x1 3 }, π 1 ={x 1 1 ,x2 1 }, π 2 = {x 1 2 }, π 3 = {x 1 3 }, γ 1 = (x 1 1 → ¬x2 1 ) <strong>et</strong> γ 2 = γ 3 = ⊤.Lemme 5.5. Pour tout i ∈ N <strong>et</strong> Z ∈ At(i) : µ(Z) = {s G ∗ ∈ S G ∗|s G ∗ ⊇ s i (Z)}Preuve du lemme : Soit i ∈ N <strong>et</strong> Z ∈ At(i). Soit s G ∗ ∈ µ(Z) ; par définition <strong>de</strong> µ(Z),il existe un s ∈ S tel que µ(s) = s G ∗. Considérons la décomposition <strong>de</strong> s en atomes,c’est-à-dire {s} = Z 1 (s) ∩ ... ∩ Z n (s) (cf. Lemme 5.4). Par construction <strong>de</strong> µ, laprojection <strong>de</strong> µ(s) sur {x 1 i ,...,xp ii } correspond à la représentation binaire <strong>de</strong> r i (s).Donc µ(s) = s G ∗ étend s i (Z).Réciproquement, soit s G ∗ tel que s G ∗ ⊇ s i (Z). Pour tout j ≤ n, soit k j le nombre dontla représentation binaire dans {x 1 j ,...,xp jj } est la projection <strong>de</strong> s G ∗ sur {x 1 j ,...,xp jj }.Soit s défini par {s} = Z 1 (k 1 ) ∩ ... ∩ Z n (k n ). Par construction <strong>de</strong> µ, nous avonsµ(s) = s G ∗. De plus, Z i (k i ) = Z par atomicité, c’est-à-dire s ∈ Z. Donc s G ∗ ∈ µ(Z).Preuve : (Propriété 5.1, fin)Nous <strong>de</strong>vons encore prouver que pour tout C ⊆ N <strong>et</strong> tout X ⊆ S, X ∈ Eff(C) est vraisi <strong>et</strong> seulement si µ(X) ∈ Eff G ∗(C).La décomposabilité <strong>de</strong> Eff <strong>et</strong> Eff G ∗ implique qu’il suffit <strong>de</strong> montrer que pour tout i<strong>et</strong> tout X ⊆ S, X ∈ Eff(i) si <strong>et</strong> seulement si µ(X) ∈ Eff G ∗(i). Puisque Eff <strong>et</strong> Eff G ∗satisfont la propriété <strong>de</strong> coalition-monotonie, il suffit <strong>de</strong> montrer que pour tout i,Z i ∈ At G ∗(i) implique µ(Z i ) ∈ Eff G ∗(i) <strong>et</strong> T i ∈ At G ∗(i) implique µ −1 (T i ) ∈ Eff(i).Soit Z i ∈ At(i). Puisque r(Z i ) ≤ p i , nous avons s i (Z i ) |= γ i , <strong>et</strong> donc s i (Z i ) ∈ Eff G ∗(i).Le lemme 5.5, montre que µ(Z i ) = {s G ∗|s G ∗ ⊇ s i (Z i )}. Donc, µ(Z i ) ∈ Eff G ∗(i). Réciproquement,soit T i ∈ At G ∗(i). Le lemme 5.3 montre que T i = {s|s ⊇ s i } pour touts i ∈ S i . Soit s i = (ε i,1 .x 1 1 ,...,ε i,p i.x p ii ) <strong>et</strong> q(s i ) = ∑ p ik=1 2pi−k .ε i,k . Remarquons queq(s i ) ≤ p i , car s i ∈ S i implique s i |= γ i . À présent, considérons j = ri−1 (q(s i )). SoitZ ji ∈ At(i) tel que r i (Z jji ) = j. Nous avons µ(Zi ) = {s|s ⊇ s i} = T i . Maintenant,Z ji ∈ Eff(i), car Z ji ∈ At(i). Donc, µ −1 (T i ) ∈ Eff(i).Nous avons à présent prouvé que pour C ⊆ N <strong>et</strong> tout X ⊆ S, X ∈ Eff(C) est vraisi <strong>et</strong> seulement si µ(X) ∈ Eff G ∗(C). Donc, si Eff est fortement jouable, <strong>et</strong> satisfaitl’atomicité, la décomposabilité <strong>et</strong> Eff(N) = 2 S \∅, alors il existe un jeu G(= G ∗ ) <strong>et</strong>une fonction injective µ: S → 2 V telle que pour tout C ⊆ N : Eff G (C) = {µ(X)|X ∈Eff(C)}.Nous avons donc caractérisé les fonctions d’α-effectivité correspondant à un pré-jeu booléen. Nousvoulons à présent définir <strong>et</strong> caractériser les coalitions efficaces dans un jeu booléen.142 Elise Bonzon


5.3. Coalitions efficaces5.3 Coalitions efficacesNous considérons à présent les jeux booléens compl<strong>et</strong>s, <strong>et</strong> nous allons définir la notion <strong>de</strong> coalitionefficace. Informellement, une coalition est efficace dans un jeu booléen si <strong>et</strong> seulement si tous lesjoueurs <strong>de</strong> c<strong>et</strong>te coalition ont ensemble la possibilité <strong>de</strong> satisfaire tous leurs buts.5.3.1 Définition <strong>et</strong> caractérisationDéfinition 5.4. Soit G = (N,V,π,Γ,Φ) un jeu booléen. Une coalition C ⊆ N est efficace si <strong>et</strong> seulements’il existe s C ∈ S C tel que pour tout s −C , (s C ,s −C ) |= V i∈C ϕ i . On dénote par EC(G) l’ensemble<strong>de</strong> toutes les coalitions efficaces d’un jeu G. On considère que la coalition vi<strong>de</strong> ∅ est efficace, carϕ ∅ = V i∈∅ ϕ i ≡ ⊤ est toujours satisfait.Une coalition C ⊆ N est efficace minimale s’il n’existe pas <strong>de</strong> coalition B ⊂ C efficace.On peut penser que dire que la coalition vi<strong>de</strong> est efficace n’a pas grand sens. Quoi qu’il en soit, il seraitpossible <strong>de</strong> changer la définition d’une coalition efficace en excluant ∅ sans qu’il soit nécessaire <strong>de</strong>changer les autres notions <strong>et</strong> résultats.Exemple 5.1. Soit G = (N,V,Γ,π,Φ), avec V = {a,b,c}, N = {1,2,3}, γ i = ⊤ pour tout i, π 1 = {a},π 2 = {b}, π 3 = {c}, ϕ 1 = (¬a ∧ b), ϕ 2 = (¬a ∨ ¬c) <strong>et</strong> ϕ 3 = (¬b ∧ ¬c).Remarquons tout d’abord que ϕ 1 ∧ ϕ 3 est inconsistant. Aucune coalition contenant {1,3} ne peutdonc être efficace. {1} n’est pas efficace car ϕ 1 ne peut pas être satisfaite en fixant uniquement lavaleur <strong>de</strong> a. Similairement, {2} <strong>et</strong> {3} ne sont pas efficaces non plus. {1,2} est efficace : les joueurs 1<strong>et</strong> 2 ont une stratégie commune leur perm<strong>et</strong>tant <strong>de</strong> satisfaire leurs buts : s {1,2} = ab |= ϕ 1 ∧ϕ 2 . {2,3}est efficace car s {2,3} = bc |= ϕ 2 ∧ ϕ 3 . On a donc EC(G) = {∅,{1,2},{2,3}}.On peut déjà voir à partir <strong>de</strong> c<strong>et</strong> exemple simple que EC n’est fermé “ni par le bas, ni par le haut” :en eff<strong>et</strong>, si C est efficace, un sous-ensemble ou sur-ensemble <strong>de</strong> C peut ne pas être efficace. On peutégalement voir que EC n’est fermé ni par intersection, ni par union : {1,2} <strong>et</strong> {2,3} sont efficaces,mais ni {1,2} ∩ {2,3}, ni {1,2} ∪ {2,3} ne le sont.Exemple 5.2 (Echange <strong>de</strong> rein, d’après [Abraham <strong>et</strong> al., 2007]). Soit n couples d’individus, chacund’entre eux étant constitué d’un receveur R i , en attente d’un nouveau rein, <strong>et</strong> d’un donneur D i , qui estprêt à donner un <strong>de</strong> ses reins pour sauver R i . Comme le rein du donneur D i n’est pas nécessairementcompatible avec celui <strong>de</strong> R i , une stratégie pour sauver le plus <strong>de</strong> gens possible consiste à considérerle graphe 〈{1,... ,n},E〉 qui contient un nœud i ∈ 1,...,n pour chaque couple (D i ,R i ), <strong>et</strong> un arc (i, j)si le rein <strong>de</strong> D i est compatible avec celui <strong>de</strong> R j . Une solution <strong>de</strong> ce problème consiste à i<strong>de</strong>ntifier dansle graphe <strong>de</strong>s cycles disjoints : D i accepte <strong>de</strong> donner son rein si <strong>et</strong> seulement si R i en reçoit un. Unesolution optimale (qui sauve le plus <strong>de</strong> gens possible) <strong>de</strong> ce problème serait d’obtenir une couvertureoptimale du graphe par <strong>de</strong>s cycles disjoints. Ce problème peut être vu comme le jeu booléen Gsuivant :∗ N = {1,...,n} ;∗ V = {g i j |i, j ∈ {1,... ,n}} ; si g i j est mis à vrai, alors D i donne un <strong>de</strong> ses reins à R j .∗ π i = {g i j ;1 ≤ j ≤ n} ;Jeux booléens 143


Coalitions efficaces dans les jeux booléens∗ pour tout i, γ i = { V j̸=k ¬(g i j ∧g ik )∧( W i g i j ) → ( W k g ki )}. La première condition exprime le faitqu’un donneur peut donner au plus un rein, tandis que la secon<strong>de</strong> exprime le fait qu’un donneuraccepte <strong>de</strong> ne donner un rein que s’il en reçoit un.∗ pour tout i, ϕ i = W ( j,i)∈E g ji exprime le fait que le but <strong>de</strong> i est <strong>de</strong> recevoir un rein compatibleavec R i .La secon<strong>de</strong> condition exprimée dans les contraintes <strong>de</strong> chacun <strong>de</strong>s joueurs est inutile. En eff<strong>et</strong>, lecalcul <strong>de</strong>s coalitions efficace perm<strong>et</strong> <strong>de</strong> s’assurer que chaque membre d’une telle coalition satisferason but, <strong>et</strong> donc recevra un rein compatible. Il est donc possible <strong>de</strong> simplifier la <strong>de</strong>scription <strong>de</strong> c<strong>et</strong>tesituation par le jeu booléen G suivant :∗ N = {1,... ,n} ;∗ V = {g i j |i, j ∈ {1,... ,n}} ; si g i j est mis à vrai, alors D i donne un <strong>de</strong> ses reins à R j .∗ π i = {g i j ;1 ≤ j ≤ n} ;∗ pour tout i, γ i = V j̸=k ¬(g i j ∧ g ik ) exprime le fait qu’un donneur peut donner au plus un rein.∗ pour tout i, ϕ i = W ( j,i)∈E g ji exprime le fait que le but <strong>de</strong> i est <strong>de</strong> recevoir un rein compatibleavec R i .Par exemple, soit n = 5 <strong>et</strong> E = {(1,1),(1,2),(2,3),(2,4), (2,5),(3,1),(4,2),(5,4)}. Alors, on a :G = (N,V,Γ,π,Φ), avec∗ N = {1,2,3,4,5}∗ V = {g i j | 1 ≤ i, j ≤ 5} ;∗ ∀i, γ i = V j̸=k ¬(g i j ∧ g ik )∗ π 1 = {g 11 ,g 12 ,g 13 ,g 14 ,g 15 }, <strong>et</strong> <strong>de</strong> même pour π 2 , <strong>et</strong>c.∗ ϕ 1 = g 11 ∨ g 31 ; ϕ 2 = g 12 ∨ g 42 ; ϕ 3 = g 23 ; ϕ 4 = g 24 ∨ g 54 ; ϕ 5 = g 25 .Le graphe correspondant est le suivant :1 23 4On voit clairement que les coalitions efficaces correspon<strong>de</strong>nt aux solutions <strong>de</strong> ce problème. Dansnotre exemple, les coalitions efficaces sont ∅, {1}, {2,4}, {1,2,4}, {1,2,3}, {2,4,5} <strong>et</strong> {1,2,4,5}.Une caractérisation possible <strong>de</strong>s coalitions efficaces dans un jeu booléen est la suivante :Propriété 5.2. Soit N = {1,... ,n} un ensemble d’agents, <strong>et</strong> SC ∈ 2 2N un ensemble <strong>de</strong> coalitions. Ilexiste un jeu booléen G sur N tel que l’ensemble <strong>de</strong>s coalitions efficaces <strong>de</strong> G estSC (i.e. EC(G) =SC) si <strong>et</strong> seulement siSC satisfait ces <strong>de</strong>ux propriétés :(1) ∅ ∈SC.(2) pour tout I,J ∈SC tel que I ∩ J = ∅ alors I ∪ J ∈SC .5144 Elise Bonzon


5.3. Coalitions efficacesAinsi un ensemble <strong>de</strong> coalitions correspond à l’ensemble <strong>de</strong>s coalitions efficaces d’un jeu booléensi <strong>et</strong> seulement si (a) il contient l’ensemble vi<strong>de</strong> <strong>et</strong> (b) il est fermé par l’union pour les coalitionsdisjointes.La preuve <strong>de</strong> c<strong>et</strong>te propriété est également longue. Elle repose sur les lemmes 5.6à 5.9 (page suivante).Lemme 5.6. Soit I <strong>et</strong> J <strong>de</strong>ux coalitions d’un jeu booléen G. Si I <strong>et</strong> J sont efficaces <strong>et</strong>que I ∩ J = ∅, alors I ∪ J est efficace.Preuve du lemme : Si I est efficace, alors nous savons que ∃s I ∈ S I tel que s I |=Vi∈I ϕ i . Il en est <strong>de</strong>-même pour J : ∃s J ∈ S J tel que s J |= V j∈J ϕ j . De plus, commeI ∩ J = ∅, nous avons (s I ,s J ) |= V i∈I∪J ϕ i , donc I ∪ J est une coalition efficace.Le lemme 5.6 prouve la direction (⇒) <strong>de</strong> la Propriété 5.2. La direction (⇐) <strong>de</strong> c<strong>et</strong>tepreuve est plus complexe, <strong>et</strong> nécessite <strong>de</strong> construire le jeu booléen G suivant pourchaque ensemble <strong>de</strong> coalitions SC satisfaisant (1) <strong>et</strong> (2) :∗ V = {connect(i, j)|i, j ∈ N} (toutes les connexions possibles entre joueurs) ;∗ ∀i, γ i = ⊤ ;∗ π i = {connect(i, j)| j ∈ N} (toutes les connexions à partir du joueur i) ;∗ ϕ i = W I∈SC ,i∈I F I , où( ) )^^(^F I = connect( j,k)¬connect( j,k)j,k∈Ij∈I,k∉I(le joueur i veut que tous les joueurs <strong>de</strong> sa coalition soient interconnectés, <strong>et</strong>qu’il n’y ait pas <strong>de</strong> connexion “sortant” <strong>de</strong> c<strong>et</strong>te coalition).Nous voulons montrer que l’ensemble EC G =SC (EC G étant l’ensemble <strong>de</strong>s coalitionsefficaces pour G).Commençons par montrer que SC ⊆ EC G . Soit I ∈SC. Si chaque agent i ∈ I joue(Vj∈I connect(i, j) ) V (Vk∉I ¬connect(i,k) ) , alors ϕ i est satisfait pour tout i ∈ I. Iest alors une coalition efficace pour G, <strong>et</strong>SC est inclus dans EC(G).Afin <strong>de</strong> prouver que EC G ⊆SC, établissons les lemmes suivants :Lemme 5.7. Pour toute collection SC = {C i ,i = 1,...,q} ⊆ 2 2N , V 1≤i≤q F Ci est satisfiablesi <strong>et</strong> seulement si pour tout i, j ∈ {1,... ,q}, soit C i = C j , soit C i ∩C j = ∅.Preuve du lemme :(a) Si C 1 = ... = C q = C alors V 1≤i≤q F Ci ≡ F C . Comme F C est satisfait partoute interprétation assignant chaque connect(i, j) tel que i, j ∈ C à vrai, <strong>et</strong>chaque connect(i, j) tel que i ∈ C <strong>et</strong> j ∉ C à faux (l’instanciation <strong>de</strong>s variablesconnect(i, j) tel que i, j ∉ C est indifférente), F C est consistant.(b) Supposons à présent que pour tout i, j ∈ {1,...,q}, soit C i = C j , soit C i ∩C j =∅.Jeux booléens 145


Coalitions efficaces dans les jeux booléensAlors, V 1≤i≤q F Ci est équivalent à(V V1≤i≤q j,k∈C iconnect( j,k) ) V(V V1≤i≤q j∈C i ,k∉C i¬connect( j,k) )V<strong>et</strong> 1≤i≤q F Ci est satisfait par toute interprétation assignant chaqueconnect( j,k) tel que j,k appartiennent au même C i à vrai, <strong>et</strong> chaqueconnect( j,k) tel que j ∈ C i pour chaque i <strong>et</strong> k ∉ C i à faux. V 1≤i≤q F Ci est doncsatisfiable.(c) Supposons que pout tout i, j ∈ {1,... ,q}, nous avons C i ∩ C j ̸= ∅ <strong>et</strong> C i ̸=C j . Soit k ∈ C i ∩ C j <strong>et</strong> (sans perte <strong>de</strong> généralité) l ∈ C i \ C j . Alors, F Ci |=connect(k,l) <strong>et</strong> F Cj |= ¬connect(k,l), donc F Ci ∧ F Cj n’est pas satisfiable, <strong>et</strong>a fortiori, V 1≤i≤q F Ci non plus.On définit à présent la couverture d’une coalition I par un sous-ensemble disjoint<strong>de</strong> SC comme un tuple ⃗C = 〈C i |i ∈ I〉 <strong>de</strong> coalitions tel que : (i) pour chaque k ∈ I,C k ∈SC ; (ii) pour tout C j ,C k ∈ ⃗C, soit C j = C k , soit C j ∩C k = ∅ ; (iii) pour chaquei ∈ I, i ∈ C i . Soit Cov(SC ,I) l’ensemble <strong>de</strong> toutes les couvertures <strong>de</strong> I par un sousensembledisjoint <strong>de</strong>SC.Par exemple, siSC = {∅,1,24,123,124} alors Cov(SC ,12) = {〈1,24〉, 〈123,123〉,〈124,124〉} 8 , Cov(SC ,123) = {〈123,123,123〉}, Cov(SC ,124) = {〈1,1,24〉,〈1,24,24〉, 〈124,124,124〉} <strong>et</strong> Cov(SC ,234) = Cov(SC ,1234) = ∅.Lemme 5.8. Pour tout I ̸= ∅, Φ I est équivalent à W V⃗C∈Cov(SC ,I) i∈I F Ci .Preuve du lemme :Φ I ≡ V i∈I ϕ i≡ V i∈I( W I∈SC ,i∈I F I )≡W 〈C i ,i∈I〉 tel que C i ∈SC( V i∈I F Ci )<strong>et</strong> i∈C i pour tout i∈ILe lemme 5.7 montre que V i∈I F Ci est satisfiable si <strong>et</strong> seulement si pour tout i, j ∈ I,soit C i = C j , soit C i ∩C j = ∅. Donc, Φ I ≡ W V⃗C∈Cov(SC ,I) i∈I F Ci .Par exemple, siSC = {1,24,123,124} alors Φ 12 ≡ (F 1 ∧ F 24 ) ∨ F 123 ∨ F 124 ; Φ 123 ≡F 123 ; Φ 124 ≡ (F 1 ∧ F 24 ) ∨ F 124 ; Φ 234 ≡ ⊥.Lemme 5.9. Soit I ⊆ 2 A <strong>et</strong> sachant que ∀I,J ∈SC , I ∩ J = ∅ ⇒ I ∪ J ∈SC, Φ I estsatisfiable si <strong>et</strong> seulement s’il existe J ∈SC tel que I ⊆ J.Preuve du lemme : Le cas I = ∅ est simple : Φ ≡ ⊤ est satisfiable, <strong>et</strong> ∅ ∈SC parhypothèse, donc il existe J ∈SC (J = ∅) tel que I ⊆ J.8 Il y a 2 joueurs dans I = {1,2}, donc chaque ⃗C dans Cov(SC,12) contient 2 coalitions, une pour chaque joueur,satisfaisant les conditions (i), (ii) <strong>et</strong> (iii).146 Elise Bonzon


5.3. Coalitions efficacesSupposons à présent que I ̸= ∅.⇒ Supposons que Φ I est satisfiable. Le lemme 5.8 montre que si Φ I est équivalentà W V⃗C∈Cov(SC ,I) i∈I F Ci , alors il existe un ⃗C dans Cov(SC ,I) tel que V i∈I F Ci estsatisfiable, <strong>et</strong> donc Cov(SC ,I) n’est pas vi<strong>de</strong>. ⃗C ∈ Cov(SC ,I) implique que :(i) Pour tout i ∈ I, C i ∈SC ;(ii) pour tout i, j ∈ I, soit C i = C j , soit C i ∩C j = ∅.(iii) I ⊆ S i∈I C iA partir <strong>de</strong> (i), (ii) <strong>et</strong> sachant que ∀I,J ∈SC , I ∩ J = ∅ ⇒ I ∪ J ∈ SC, onprouve que S i∈I C i ∈SC. (iii) perm<strong>et</strong> alors <strong>de</strong> montrer qu’il existe un J ∈SC(J = S i∈I C i ) tel que I ⊆ J.⇐ Supposons maintenant qu’il existe un J ∈ SC tel que I ⊆ J. Alors Φ J |=Φ I , <strong>et</strong> Φ J est consistant (en considérant l’interprétation assignant chaqueconnect(i, j) tel que i, j ∈ J à vrai).Preuve : (Propriété 5.2, fin)Il reste à prouver que EC G ⊆SC. Soit I une coalition efficace telle que I ∉SC (cequi implique I ̸= ∅, à cause <strong>de</strong> l’hypothèse ∅ ∈SC ).∗ Si I = N alors il n’existe pas <strong>de</strong> J ∈SC tel que I ⊆ J (car I ∉SC ), <strong>et</strong> alorsle lemme 5.9 implique que Φ I n’est pas satisfiable. I ne peut donc pas êtreefficace pour G.∗ Supposons à présent que I ̸= N <strong>et</strong> définissons la Ī-strategie suivante S Ī (Ī = N \I) : pour chaque i ∈ Ī, s i = {¬connect(i, j)| j ∈ I} (peu importe l’instanciation<strong>de</strong>s variables connect(i, j) telles que j ∉ I). Soit ⃗C = 〈C i ,i ∈ I〉 ∈ Cov(SC ,I).Nous affirmons tout d’abord qu’il existe un i ∗ ∈ I tel que C i ∗ n’est pas contenuedans I. En eff<strong>et</strong>, supposons que pour tout i ∈ I, C i ⊆ I. Puisque i ∈ C i est vraipour tout i, nous avons S i∈I C i = I. À présent, C i ∈SC pour tout i, <strong>et</strong> toutesles C i ,C j distinctes sont disjointes <strong>de</strong>ux à <strong>de</strong>ux. La propriété amène I ∈SC ,ce qui est faux par hypothèse.Soit k ∈ C i ∗ \ I (un tel k existe car C i ∗ n’est pas inclus dans I). Il faut queconnect(k,i ∗ ) soit vrai pour satisfaire F Ci car i <strong>et</strong> k sont dans C i . On a doncs k |= ¬F Ci , <strong>et</strong> a fortiori s Ī |= ¬F Ci , ce qui entraîne s Ī |= ¬ V i∈I F Ci .Ceci étant vrai pour tout ⃗C ∈ Cov(SC ,I), nous avons s Ī |=V⃗C∈Cov(SC ,I) ¬ V i∈I F Ci , c’est-à-dire s Ī |= ¬ W V⃗C∈Cov(SC ,I) i∈I F Ci . Avec lelemme 5.8, ceci entraîne s Ī |= ¬Φ I . Donc I ne contrôle pas Φ I <strong>et</strong> I ne peutpas être efficace pour G.La notion <strong>de</strong> coalition efficace que nous introduisons est la même que celle <strong>de</strong> coalitionJeux booléens 147


Coalitions efficaces dans les jeux booléensfructueuse (successful coalition) dans un jeu coalitionnel qualitatif (QCG 9 , notion introduitedans [Wooldridge <strong>et</strong> Dunne, 2004]). En eff<strong>et</strong>, une coalition fructueuse dans un QCG est une coalitionayant une stratégie (ou une possibilité) <strong>de</strong> satisfaire tous les membres <strong>de</strong> c<strong>et</strong>te coalition.Il est naturel d’utiliser ici la notion <strong>de</strong> stratégie gagnante (similaire celle <strong>de</strong> coalition efficace, à la différenceprès qu’elle s’intéresse à <strong>de</strong>s singl<strong>et</strong>ons <strong>de</strong> joueurs (voir définition 2.5 (page 37))), <strong>et</strong> d’étudierles propriétés <strong>de</strong> ces stratégies gagnantes pour un joueur ou pour une coalition <strong>de</strong> joueurs. Pour cela,nous utiliserons la notion d’impliquant premier (voir définition 2 (page 8)).Propriété 5.3. Soit G = (N,V,π,Γ,Φ) un jeu booléen.1. ∀i ∈ N, i a une stratégie gagnante si <strong>et</strong> seulement si ∃α ∈ PI πi (ϕ i ) tel que α |= γ i2. Une coalition <strong>de</strong> joueurs I ⊆ N est efficace si <strong>et</strong> seulement si ∃α ∈ PI S i∈I π i( V i∈I ϕ i ) tel queα |= V i∈I γ iIntuitivement, si le but qu’un joueur (resp. un ensemble <strong>de</strong> joueurs noté I) cherche à satisfaire contientun terme (donc une conjonction <strong>de</strong> littéraux) α dont tous les littéraux sont contrôlés par le joueur, alorsle joueur (resp. I) a une stratégie gagnante. En eff<strong>et</strong>, ce terme α peut être satisfait, donc le but qui lecontient est aussi satisfait, <strong>et</strong> le joueur (resp. l’ensemble <strong>de</strong>s joueurs I) gagne.Preuve :1. Pour un joueur.⇐ D’après la définition 2 (page 8), si ∃α ∈ PI πi (ϕ i ), alors α |= ϕ i <strong>et</strong>Lit(α) ⊆ π i .Comme α |= γ i , i possè<strong>de</strong> une stratégie s i ∈ S i telle que :∀s −i ∈ S −i , (s −i ,s i ) |= ϕ i .⇒ D’après la définition 2.5 (page 37), i possè<strong>de</strong> une stratégie gagnante si <strong>et</strong>seulement si :∃s i ∈ S i ,∀s −i ∈ S −i (s −i ,s i ) |= ϕ iLe joueur i peut donc satisfaire son but quels que soient les choix <strong>de</strong> sesadversaires. Il existe donc α ∈ S i tel que : α |= ϕ i <strong>et</strong> Lit(α) ⊆ π i . α est unπ i -impliquant <strong>de</strong> ϕ i . Soit α est un π i -impliquant premier <strong>de</strong> ϕ i , <strong>et</strong> doncα |= γ i (car α ∈ S i ) ; soit il existe α ′ π i -impliquant premier <strong>de</strong> ϕ i tel queα |= α ′ <strong>et</strong> α ′ |= α |= γ i .2. Pour une coalition <strong>de</strong> joueurs, la preuve est i<strong>de</strong>ntique en remplaçant π i parSi∈I π i , γ i par V i∈I γ i <strong>et</strong> ϕ i par V i∈I ϕ i .Une coalition <strong>de</strong> joueurs aura donc une stratégie gagnante (<strong>et</strong> sera donc efficace) si <strong>et</strong> seulementsi il existe un impliquant premier <strong>de</strong> la conjonction <strong>de</strong> tous les buts <strong>de</strong>s membres <strong>de</strong> la coalition, c<strong>et</strong>impliquant premier étant composé uniquement <strong>de</strong> variables contrôlées par les membres <strong>de</strong> la coalition.Etudions ce problème sur un exemple simple.Exemple 5.3. Soit G = (N,V ,π,Γ,Φ) un jeu booléen. On donne9 Nous introduirons plus longuement les QCGs dans la section 5.4.2 (page 161).148 Elise Bonzon


5.3. Coalitions efficaces∗ V = {a,b,c}, N = {1,2,3},∗ γ 1 = ¬a, γ 2 = γ 3 = ⊤,∗ π 1 = {a}, π 2 = {b}, π 3 = {c},∗ ϕ 1 = (a ↔ (b ∧ c)),∗ ϕ 2 = (¬a ∨ ¬c) <strong>et</strong>∗ ϕ 3 = (a ∧ ¬b).On constate tout d’abord qu’aucun joueur isolé n’a <strong>de</strong> stratégie gagnante.On remarque ensuite que les trois joueurs ne peuvent pas gagner tous ensemble. En eff<strong>et</strong>, ϕ 1 ∧ ϕ 3 estincohérent. Donc il ne peut pas exister <strong>de</strong> coalition entre 1 <strong>et</strong> 3, <strong>et</strong> les seules coalitions possibles sont{1,2} <strong>et</strong> {2,3}. Etudions-les.∗ {1,2}(ϕ 1 ∧ ϕ 2 ) = (¬a ∧ ¬b) ∨(¬a ∧ ¬c)Il existe un impliquant premier, (¬a ∧ ¬b), qui ne contient que <strong>de</strong>s variables contrôlées par 1<strong>et</strong> 2. <strong>et</strong> qui satisfait les contraintes <strong>de</strong>s <strong>de</strong>ux joueurs ((¬a ∧ ¬b) |= γ 1 ∧ γ 2 ). C<strong>et</strong>te coalition adonc une stratégie gagnante. Comme c’est la plus p<strong>et</strong>ite coalition contenant 1 <strong>et</strong> 2, c’est unecoalition efficace minimale.∗ {2,3}(ϕ 2 ∧ ϕ 3 ) = (a ∧ ¬b ∧ ¬c)C<strong>et</strong>te coalition n’a pas <strong>de</strong> stratégie gagnante car la variable a, qui n’est contrôlée par aucunjoueur <strong>de</strong> c<strong>et</strong>te coalition, appartient au seul impliquant premier. Ce n’est donc pas une coalitionefficace pour le jeu G.Remarquons que <strong>de</strong> façon (presque) équivalente, la recherche d’une stratégie gagnante correspond àune résolution <strong>de</strong> QBF 2,∃ [Stockmeyer, 1977]. En eff<strong>et</strong>, comme on l’a vu dans la propriété 5.3 (pageprécé<strong>de</strong>nte), la recherche d’une stratégie gagnante correspond à la recherche d’un impliquant premier.Or, c<strong>et</strong>te recherche est du type ∃A∀Bϕ(A,B) : pour un but ϕ donné, qui peut être le but d’un joueur oud’une coalition I, on cherche s’il existe un impliquant α <strong>de</strong> ϕ ne contenant que <strong>de</strong>s variables contrôléespar i. Si α existe, on veut que pour tout autre impliquant, α soit le “plus p<strong>et</strong>it”.Par ailleurs, l’existence d’une stratégie gagnante est une instance du problème <strong>de</strong> contrôlabilité enlogique propositionnelle [Boutilier, 1994; Lang <strong>et</strong> Marquis, 1998b] (voir aussi [?] pour une extension<strong>de</strong> la contrôlabilité à un cadre multi-agents).5.3.2 Coalition efficace <strong>et</strong> noyauNous allons à présent faire le lien entre la notion <strong>de</strong> coalition efficace <strong>et</strong> celle, bien connue, <strong>de</strong> noyau(ou cœur) dans un jeu coalitionnel. Dans <strong>de</strong>s jeux coalitionnels avec <strong>de</strong>s préférences ordinales, lenoyau est habituellement défini comme suit (voir par exemple [Aumann, 1967; Owen, 1982; Myerson,1991]) : un profil <strong>de</strong> stratégies s est dans le noyau d’un jeu coalitionnel si <strong>et</strong> seulement s’il n’existepas <strong>de</strong> coalition C telle que tous les membres <strong>de</strong> c<strong>et</strong>te coalition ont une stratégie commune s C qui leurperm<strong>et</strong> à tous d’obtenir une meilleure utilité qu’avec s.Ici, nous considèrerons également une notion <strong>de</strong> noyau plus forte que c<strong>et</strong>te <strong>de</strong>rnière : un profil <strong>de</strong>stratégies s est dans le noyau fort d’un jeu coalitionnel si <strong>et</strong> seulement s’il n’existe pas <strong>de</strong> coalitionC telle que tous les membres <strong>de</strong> c<strong>et</strong>te coalition ont une stratégie commune s C qui leur perm<strong>et</strong> à tousJeux booléens 149


Coalitions efficaces dans les jeux booléensd’obtenir une utilité au moins aussi bonne que celle obtenue avec s, <strong>et</strong> une meilleure utilité pour aumoins un <strong>de</strong>s membres <strong>de</strong> C.Définition 5.5. Soit G un jeu booléen.Le noyau (faible) <strong>de</strong> G, dénoté par Noyau(G), est l’ensemble <strong>de</strong>s profils <strong>de</strong> stratégies s = (s 1 ,...,s n )tels qu’il n’existe pas <strong>de</strong> C ⊂ N <strong>et</strong> pas <strong>de</strong> s C ∈ S C tels que pour tout i ∈C <strong>et</strong> tout s −C ∈ S −C , (s C ,s −C ) ≻ is.Le noyau fort <strong>de</strong> G, dénoté par FNoyau(G), est l’ensemble <strong>de</strong>s profils <strong>de</strong> stratégies s = (s 1 ,...,s n )tels qu’il n’existe pas <strong>de</strong> C ⊂ N <strong>et</strong> pas <strong>de</strong> s C ∈ S C tels que pour tout i ∈C <strong>et</strong> tout s −C ∈ S −C , (s C ,s −C ) ≽ is, <strong>et</strong> qu’il existe un i ∈ C tel que pour tout s −C ∈ S −C , (s C ,s −C ) ≻ i s.Ce concept <strong>de</strong> noyau faible est équivalent à la notion d’équilibre <strong>de</strong> Nash fort introduit par [Aumann,1959] 10 : dans un équilibre <strong>de</strong> Nash fort, les coalitions se forment afin <strong>de</strong> m<strong>et</strong>tre en corrélation lesstratégies <strong>de</strong> leurs membres. C<strong>et</strong>te notion implique, au moins implicitement, l’hypothèse que la coopérationimpose nécessairement que les joueurs soient capables <strong>de</strong> signer <strong>de</strong>s “accords d’engagement” :les joueurs doivent suivre les stratégies sur lesquelles ils se sont engagés, même si certains d’entreeux tireraient profit à dévier <strong>de</strong> c<strong>et</strong>te stratégie. Si les joueurs d’une coalition C s’enten<strong>de</strong>nt sur unestratégie s C , au moins un <strong>de</strong> ces joueurs est satisfait par c<strong>et</strong>te stratégie : ∃i ∈ C tel que s |= ϕ i .Dans le cadre <strong>de</strong>s jeux booléens, la relation entre le noyau (faible) <strong>et</strong> l’ensemble <strong>de</strong> coalitions efficacesest donné par le simple résultat suivant.Propriété 5.4. Soit G = (N,V ,Γ,π,Φ) un jeu booléen. s ∈ Noyau(G) si <strong>et</strong> seulement si s satisfait aumoins un membre <strong>de</strong> chaque coalition efficace, c’est-à-dire, pour tout C ∈ EC(G), s |= W i∈C ϕ i .Preuve : s = (s 1 ,...,s n ) ∈ Noyau(G) si <strong>et</strong> seulement si̸ ∃C ⊂ N tel que ∃s C ∈ S C , ∀i ∈ C, ∀s −C ∈ S −C ,(s C ,s −C ) ≻ i s⇔ ̸ ∃C ⊂ N tel que ∃s C ∈ S C , ∀i ∈ C, ∀s −C ∈ S −C ,((s C ,s −C ) |= ϕ i ) ∧(s |= ¬ϕ i )⇔ ̸ ∃C ⊂ N tel que ∃s C ∈ S C , ∀i ∈ C,(s C |= ϕ i ) ∧(s |= ¬ϕ i )⇔ ̸ ∃C ⊂ N tel que ∃s C ∈ S C ,(s C |= V i∈C ϕ i ) ∧(s |= V i∈C ¬ϕ i )⇔ ̸ ∃C ⊂ N tel que (s |= V i∈C ¬ϕ i ) ∧(∃s C ∈ S C ,s C |= V i∈C ϕ i )⇔ ∀C ⊂ N,(s |= W i∈C ϕ i ) ∨(∀s C ∈ S C ,s C |= W i∈C ¬ϕ i )⇔ ∀C ⊂ N, si ∃s C ∈ S C : s C |= V i∈C ϕ i alors s |= W i∈C ϕ i∃s C ∈ S C : s C |= V i∈C ϕ i signifie que la coalition C est efficace. On a donc s =(s 1 ,...,s n ) ∈ Noyau(G) si <strong>et</strong> seulement si ∀C ⊂ N, si C ∈ EC(G) alors s |= W i∈C ϕ i .En particulier, quand aucune coalition d’un jeu booléen G n’est efficace, alors tous les profils <strong>de</strong>stratégies sont dans Noyau(G). C<strong>et</strong>te propriété entraîne le résultat suivant :Propriété 5.5. Déci<strong>de</strong>r si un profil <strong>de</strong> stratégies s est dans le noyau faible d’un jeu booléen G estΠ p 2 -compl<strong>et</strong>.10 Il est facile <strong>de</strong> montrer c<strong>et</strong>te équivalence : c’est juste une ré-écriture <strong>de</strong> la définition donnée dans [Aumann, 1959].150 Elise Bonzon


5.3. Coalitions efficacesPreuve : L’appartenance à Π p 2est immédiate : le problème <strong>de</strong> déci<strong>de</strong>r si un profil<strong>de</strong> stratégies s n’est pas dans le noyau faible <strong>de</strong> G est dans Σ p 2. En eff<strong>et</strong>, nous <strong>de</strong>vonstout d’abord trouver une coalition C ⊆ N, <strong>et</strong> ensuite <strong>de</strong>viner une stratégie s C ′ ∈ S Cpour c<strong>et</strong>te coalition telle que ∀i ∈ C, (s C ′ ,s −C) ≻ i s. Nous avons donc à vérifier que(s C ′ ,s −C) |= ϕ i <strong>et</strong> s |= ¬ϕ i , ce qui est dans P.Pour montrer la difficulté, nous allons montrer que le problème complémentaireest Σ p 2-compl<strong>et</strong>. C<strong>et</strong>te difficulté est obtenue à partir d’une réduction du problèmeconsistant à déci<strong>de</strong>r <strong>de</strong> la validité d’une instance <strong>de</strong> QBF 2,∃ . Soit Q = ∃A,∀B,Φ, oùA <strong>et</strong> B sont <strong>de</strong>ux ensembles disjoints <strong>de</strong> variables, <strong>et</strong> Φ est une formule <strong>de</strong> L A∪B . Ondéfinit un jeu booléen à <strong>de</strong>ux joueurs par ϕ 1 = x, ϕ 2 = Φ ∧ y, où x <strong>et</strong> y sont <strong>de</strong>uxnouvelles variables (x,y ∉ A ∪ B), π 1 = B ∪ {x} <strong>et</strong> π 2 = A ∪ {y}. Ce jeu peut êtreévi<strong>de</strong>mment construit en temps polynomial étant donné Q.Soit M A une A-interprétation quelconque, M B une B-interprétation quelconque, s 1 =(x,M B ), <strong>et</strong> s 2 = (y,M A ). s = (s 1 ,s 2 ).∗ Supposons que Q est vali<strong>de</strong>. Il existe donc un M A tel que M A |= Φ, <strong>et</strong> s |= ¬ϕ 2 .Il existe donc C = {2} ⊂ N telle que PI π2 (ϕ 2 ) ̸= ∅ (donc {2} est une coalitionefficace d’après la propriété 5.3 (page 148)), <strong>et</strong> pourtant telle que s |= ¬ϕ 2 .D’après la propriété 5.4 (page précé<strong>de</strong>nte), s ∉ Noyau(G).∗ Réciproquement, si Q n’est pas vali<strong>de</strong>, pour tout M A , il existe un M B tel queM A M B |= ¬Φ. Dans ce cas, 2 n’est pas efficace (puisque 2 ne contrôle pastoutes les variables perm<strong>et</strong>tant d’obtenir Φ, cf. propriété 5.3 (page 148)). L’ensemble<strong>de</strong>s coalitions efficaces <strong>de</strong> ce jeu est donc EC(G) = {∅,{1},{1,2}},<strong>et</strong> ∀C ∈ EC(G), il existe i ∈ C tel que s |= ϕ i (puisque s |= ϕ 1 ). Doncs ∈ Noyau(G).On a donc bien s ∉ Noyau(G) si <strong>et</strong> seulement si Q est vali<strong>de</strong>, <strong>et</strong> donc s ∈ Noyau(G)si <strong>et</strong> seulement si Q n’est pas vali<strong>de</strong>, ou <strong>de</strong> façon équivalente ssi ¬Q = ∀A,∃B,¬Φest vali<strong>de</strong>.On prouve également que le noyau faible d’un jeu booléen ne peut pas être vi<strong>de</strong>.Propriété 5.6. Pour tout jeu booléen G, Noyau(G) ̸= ∅.Preuve : On construit l’ensemble <strong>de</strong> coalitions E comme suit. Tout d’abord, oninitialise E à ∅. Ensuite, tant qu’il existe une coalition C dans EC(G) telle queC ∩C ′ = ∅ est vrai pour tout C ′ ∈ E, on ajoute c<strong>et</strong>te coalition C dans E (E :=E ∪ {C}). Une fois c<strong>et</strong> algorithme achevé, E est un ensemble <strong>de</strong> coalitions efficaces{C I ,i ∈ I} toutes disjointes entre elles. Grace à la Propriété 2, on sait que ∪ i∈I C i estefficace.Il existe donc s E ∈ S E tel que s E |= V i∈E ϕ i , <strong>et</strong> E contient au moins un élément <strong>de</strong>chaque coalition efficace (si ce n’était pas le cas, il resterait une coalition efficace Ctelle que l’intersection <strong>de</strong> C <strong>et</strong> <strong>de</strong> tous les C i serait vi<strong>de</strong>, <strong>et</strong> dans ce cas l’algorithmeaurait continué <strong>de</strong> tourner, <strong>et</strong> incorporé C dans E).Soit s un profil <strong>de</strong> stratégies étendant s C . s satisfait au moins un membre <strong>de</strong> chaquecoalition efficace, <strong>et</strong> donc grâce à la Propriété 5.4, Noyau(G) ̸= ∅.Jeux booléens 151


Coalitions efficaces dans les jeux booléensLe noyau fort d’un jeu booléen est plus difficile à caractériser en termes <strong>de</strong> coalitions efficaces. Nousavons seulement l’implication suivante :Propriété 5.7. Soit G = (N,V,Γ,π,Φ) un jeu booléen, <strong>et</strong> s un profil <strong>de</strong> stratégies. Si s ∈ FNoyau(G),alors pour tout C ∈ EC(G) <strong>et</strong> tout i ∈ C, s |= ϕ i .Preuve : Nous allons prouver que s’il existe C ∈ EC(G) <strong>et</strong> s’il existe i ∈ C tel ques |= ¬ϕ i , alors s ∈ FNoyau(G).∃C ∈ EC(G),∃i ∈ C tel que s |= ¬ϕ i⇔ ∃C ⊆ N,∃s C ∈ S c ,∃i ∈ C tel que (s C |= V j∈C ϕ j ) ∧(s |= ¬ϕ i )⇒ ∃C ⊆ N,∃s C ′ ∈ S c,∀s −C ∈ S −C ,∃i ∈ C tel que(((s C ,s −C ) |= ϕ i ) ∧(s |= ¬ϕ i )) ∧(s C |= V j∈C ϕ j )⇒ ∃C ⊆ N,∃s C ∈ S c ,∀s −C ∈ S −C ,∃i ∈ C tel que(((s C ,s −C ) ≻ i S) ∧(∀i ∈ C(s C ,s −C ) ≽ i s)On sait donc que si ∃C ∈ EC(G) <strong>et</strong> ∃i ∈ C tels que s |= ¬ϕ i , alors s ∉ FNoyau(G).Donc, une stratégie présente dans le noyau fort d’un jeu G satisfait les buts <strong>de</strong> tous les membres <strong>de</strong>toutes les coalitions efficaces. L’exemple suivant montre que la réciproque est fausse.Exemple 5.4. Soit G = (N,V ,Γ,π,Φ) un jeu booléen avec∗ V = {a,b,c,d,e, f }, N = {1,2,3,4,5,6},∗ γ i = ⊤ pour tout i,∗ π 1 = {a}, π 2 = {b}, π 3 = {c}, π 4 = {d}, π 5 = {e}, π 6 = { f },∗ ϕ 1 = b ∨ d, ϕ 2 = a ∨ c, ϕ 3 = ¬b ∨ d, ϕ 4 = e, ϕ 5 = ¬a ∧ ¬b ∧ ¬c <strong>et</strong> ϕ 6 = ¬a ∧ ¬c ∧ ¬d.Ce jeu a <strong>de</strong>ux coalitions efficaces : {1,2} <strong>et</strong> {2,3}.Soit s = abc<strong>de</strong> f . Nous avons s |= ϕ 1 ∧ ϕ 2 ∧ ϕ 3 ∧ ¬ϕ 4 ∧ ¬ϕ 5 ∧ ¬ϕ 6 . Donc, ∀C ∈ EC(G), ∀i ∈ C,s |= ϕ i .Pourtant, s ∉ FNoyau(G) : ∃C ′ = {1,2,3,4,5} ⊂ N tel que ∃s C = abc<strong>de</strong> |= ϕ 1 ∧ ϕ 2 ∧ ϕ 3 ∧ ϕ 4 ∧¬ϕ 5 . Donc, ∀s −C , (s C ,s −C ) ≽ 1 s, (s C ,s −C ) ≽ 2 s, (s C ,s −C ) ≽ 3 s, (s C ,s −C ) ≽ 5 s, <strong>et</strong> (s C ,s −C ) ≻ 4 s.s ∉ FNoyau(G).Remarquons que le noyau fort d’un jeu booléen peut être vi<strong>de</strong> : dans l’exemple 5.1, l’ensemble <strong>de</strong>scoalitions efficaces est {∅,{1,2},{2,3}}. Il n’y a donc pas <strong>de</strong> s ∈ S tel que pour tout C ∈ EC(G),pour tout i ∈ C, s |= ϕ i , <strong>et</strong> donc FNoyau(G) = ∅. Pourtant, nous pouvons montrer que la conditionsous laquelle le noyau fort d’un jeu booléen est non vi<strong>de</strong> est équivalente à la suivante sur les coalitionsefficaces.Propriété 5.8. Soit G = (N,V,Γ,π,Φ) un jeu booléen.FNoyau(G) ̸= ∅ si <strong>et</strong> seulement si S {C ⊆ N|C ∈ EC(G)} ∈ EC(G), c’est-à-dire si <strong>et</strong> seulement sil’union <strong>de</strong> toutes les coalitions efficaces est efficace.152 Elise Bonzon


5.3. Coalitions efficacesPreuve : Soit MEC(G) = S C⊆N{C ∈ EC(G)}, MEC signifiant Coalitions EfficacesMaximales.⇐ FNoyau(G) ̸= ∅. Soit s ∈ FNoyau(G). A partir <strong>de</strong> la Propriété 5.7, nous savonsque ∀C ∈ EC(G), ∀i ∈ C, s |= ϕ i . Donc ∀i ∈ MEC(G), s |= ϕ i . DoncMEC(G) ∈ EC(G).⇒ MEC(G) ∈ EC(G). Soit s MEC(G) ∈ S MEC(G) tel que ∀s −MEC(G) , s MEC(G) |=Φ MEC(G) . On cherche s tel que s ∈ FNoyau(G).Soit s −MEC(G) ∈ S −MEC(G) tel que MAX = {i|s = (s MEC(G) ,s −MEC(G) ) |= ϕ i }soit maximal pour ⊆. s −MEC(G) existe, dans le pire <strong>de</strong>s cas s |= Φ MEC(G) .Comme MAX est maximal, on ne peut pas trouver un C ⊆ N tel que ∃s C ∈ S Ctel que ∀s −C ∈ S −C , ∀i ∈ C, (s C ,s −C ) ≽ i s, <strong>et</strong> ∃i ∈ C, (s C ,s −C ) ≻ i s. Si on supposeque C existe, alors ∀i ∈ N tel que s |= ϕ i , on a s C |= ϕ i , <strong>et</strong> ∃i ∈ N tel ques ̸|= ϕ i <strong>et</strong> s C |= ϕ i . Dans ce cas, MAX n’est pas maximal pour ⊆.Nous pouvons à présent i<strong>de</strong>ntifier la complexité <strong>de</strong> quelques problèmes clés concernant les coalitionsefficaces.Propriété 5.9. Déci<strong>de</strong>r s’il existe une coalition efficace non vi<strong>de</strong> dans un jeu booléen est un problèmeΣ p 2 -compl<strong>et</strong>, <strong>et</strong> est Σp 2-difficile même si n = 2.Preuve : L’appartenance à Σ p 2est immédiate. Pour montrer que déci<strong>de</strong>r s’il existeune coalition efficace non vi<strong>de</strong> dans un jeu booléen est un problème Σ p 2 -difficile(même avec 2 agents), considérons la réduction polynomiale à partir <strong>de</strong> QBF 2,∃ suivante: à chaque instance I = ∃a 1 ...a p ∀b 1 ...b q ϕ <strong>de</strong> QBF 2,∃ , considérons le jeubooléen G I = 〈N,V ,π,Γ,Φ〉, avec∗ N = {1,2}, γ 1 = γ 2 = ⊤,∗ V = {a 1 ...a p ,b 1 ...b q ,x},∗ π 1 = {a 1 ,...,a p ,x}, π 2 = {b 1 ,...,b q },∗ ϕ 1 = ϕ <strong>et</strong> ϕ 2 = ¬ϕ ∧ x.Ni {2}, ni {1,2} ne peuvent être efficaces. La seule coalition efficace non vi<strong>de</strong>possible est donc {1}. Or, {1} est efficace si <strong>et</strong> seulement si I est une instancevali<strong>de</strong> <strong>de</strong> QBF 2,∃ .Propriété 5.10.∗ déci<strong>de</strong>r si un agent i appartient à au moins une coalition efficace pour G est un problème Σ p 2 -compl<strong>et</strong>, <strong>et</strong> est Σ p 2-difficile même si n = 2.∗ déci<strong>de</strong>r si un agent i appartient à toute coalition efficace non vi<strong>de</strong> pour G est un problèmeΠ p 2 -compl<strong>et</strong>, <strong>et</strong> est Πp 2-difficile même si n = 2.Preuve : Pour les <strong>de</strong>ux problèmes, l’appartenance est facile à obtenir.Pour montrer que déci<strong>de</strong>r si un agent i appartient à au moins une coalition efficaceJeux booléens 153


Coalitions efficaces dans les jeux booléenspour G est un problème Σ p 2-difficile (même avec <strong>de</strong>ux joueurs) considérons la réductionpolynomiale <strong>de</strong> QBF 2,∃ suivante : à chaque instance I = ∃a 1 ...a p ∀b 1 ...b q ϕ<strong>de</strong> QBF 2,∃ , considérons le jeu booléen G I = 〈N,V ,π,Γ,Φ〉, avec∗ N = {1,2}, γ 1 = γ 2 = ⊤,∗ V = {a 1 ,...,a p ,b 1 ,...,b q },∗ π 1 = {a 1 ,...,a p }, π 2 = {b 1 ,...,b q },∗ ϕ 1 = ϕ <strong>et</strong> ϕ 2 = ¬ϕ.{1} est efficace si <strong>et</strong> seulement s’il existe une stratégie s 1 telle que s 1 |= ϕ, c’est-àdiresi <strong>et</strong> seulement si I est vali<strong>de</strong>. {1,2} ne peut pas être efficace car ϕ 1 ∧ ϕ 2 = ⊤.Donc, 1 appartient à une coalition efficace si <strong>et</strong> seulement si {1} est efficace, c’està-diresi <strong>et</strong> seulement si I est vali<strong>de</strong>.Pour montrer que déci<strong>de</strong>r si un agent i appartient à toute coalition efficace nonvi<strong>de</strong> pour G est un problème Π p 2-difficile, même s’il n’y a que <strong>de</strong>ux agents,considérons la réduction polynomiale <strong>de</strong> QBF 2,∀ suivante : à chaque instance I =∀a 1 ...a p ∃b 1 ...b q ϕ <strong>de</strong> QBF 2,∀ , considérons le jeu booléen G I = 〈N,V ,π,Γ,Φ〉,avec∗ N = {1,2}, γ 1 = γ 2 = ⊤,∗ V = {a 1 ...a p ,b 1 ...b q ,x},∗ π 1 = {a 1 ,...,a p ,x}, π 2 = {b 1 ,...,b q },∗ ϕ 1 = ¬ϕ <strong>et</strong> ϕ 2 = ϕ ∧ x.Ni {2} ni {1,2} ne peuvent être efficaces. Puisque 2 ne peut appartenir à aucunecoalition efficace, 2 appartient à toute coalition efficace non vi<strong>de</strong> si <strong>et</strong> seulementsi aucune coalition n’est efficace. Donc, 2 appartient à toute coalition efficace nonvi<strong>de</strong> si <strong>et</strong> seulement si {1} n’est pas efficace, c’est-à-dire si ∃a 1 ...a p ∀b 1 ...b q ¬ϕn’est pas vali<strong>de</strong>, ou, <strong>de</strong> façon équivalente, si ∀a 1 ...a p ∃b 1 ...b q ϕ est vali<strong>de</strong>.5.3.3 Lien avec les graphes <strong>de</strong> dépendanceLes graphes <strong>de</strong> dépendance entre les joueurs, introduits dans le chapitre 2, définition 2.9 (page 38),nous perm<strong>et</strong>tent <strong>de</strong> trouver quelques propriétés supplémentaires.Nous savons déjà que si <strong>de</strong>ux coalitions disjointes I <strong>et</strong> J sont efficaces, alors leur union sera efficace.La réciproque est fausse dans le cas général : il peut y avoir <strong>de</strong>ux ensembles I <strong>et</strong> J disjoints tels queI ∪ J est efficace, mais ni I ni J ne l’est. Pourtant, c<strong>et</strong>te réciproque est vraie dans ce cas particulier :Propriété 5.11. Soit G = (N,V ,Γ,π,Φ) un jeu booléen, <strong>et</strong> I <strong>et</strong> J <strong>de</strong>ux coalitions telles que 11 :∗ I ∩ J = ∅,∗ I ∪ J est efficace,∗ R(I) ∩ J = ∅, <strong>et</strong>∗ R(J) ∩ I = ∅.I <strong>et</strong> J sont alors toutes <strong>de</strong>ux efficaces.11 R(I) = S i∈I R(i), avec R la relation <strong>de</strong> dépendance sur G donnée par la définition 2.9 (page 38).154 Elise Bonzon


5.3. Coalitions efficacesPreuve : Nous savons que I ∪ J est efficace. Donc, il existe s I∪J ∈ S I∪J tel ques I∪J |= ( V i∈I∪J ϕ i ).Comme I ∩ J = ∅, nous pouvons ecrire que :∃s I ∈ S I ,∃s J ∈ S J : (s I ,s J ) |= ( ^i∈I∪Jϕ i )⇔ ∃s I ∈ S I ,∃s J ∈ S J : (s I ,s J ) |= (^ϕ i ∧ ^ϕ j )⇔ ∃s I ∈ S I ,∃s J ∈ S J : ((s I ,s J ) |= (^ϕ i )) ∧((s I ,s J ) |= (^ϕ j ))i∈Ii∈Ij∈Jj∈JOn sait également que ∀i ∈ I, j ∈ J, j ∉ RP i (resp. i ∉ RP j). Donc, ∀i ∈ I, j ∈ J,∀v ∈ Var(PI(ϕ i )), v ∉ π j (resp. ∀w ∈ Var(PI(ϕ j )), w ∉ π i ). On sait donc qu’aucunjoueur <strong>de</strong> J ne contrôle <strong>de</strong> variable apparaissant dans le but d’un joueur <strong>de</strong> I (<strong>et</strong> viceversa).Comme nous avons ∃s I ∈ S I , ((s I ,s J ) |= ( V i∈I ϕ i )) <strong>et</strong> ∀i ∈ I, j ∈ J, ∀v ∈Var(PI(ϕ i )), v ∉ π j , nous avons : s I |= ( V i∈I ϕ i ) (resp. s J |= ( V j∈J ϕ j ).I <strong>et</strong> J sont donc tous <strong>de</strong>ux efficaces.Propriété 5.12. Soit G = (N,V ,Γ,π,Φ) un jeu booléen. Si B ⊆ N est un ensemble stable pour R,alors B est une coalition efficace <strong>de</strong> G (B ⊆ EC(G)) si <strong>et</strong> seulement si ϕ B = V i∈B ϕ i est consistant.Preuve : Soit B un ensemble stable pour R. Nous avons alors :⇔⇒⇔∀i ∈ B,∀ j tel que j ∈ R(i), j ∈ B∀i ∈ B,RP i ⊆ B∀i ∈ B,∃s B ∈ S B tel que s C |= ϕ i∃s B ∈ S B tel que s B |= V i∈B ϕ i si <strong>et</strong> seulement si V i∈B ϕ i ̸|= ⊥La réciproque n’est pas nécessairement vraie, comme on peut le voir sur l’exemple suivant :Exemple 5.5. Soit G = (N,V,Γ,π,Φ) un jeu booléen défini par :∗ V = {a,b,c},∗ N = {1,2,3},∗ π 1 = {a}, π 2 = {b}, π 3 = {c},∗ ϕ 1 = (a ∨ c) ∧ ¬b, ϕ 2 = a ∧ ¬b <strong>et</strong> ϕ 3 = a ∧ b ∧ c.Le graphe <strong>de</strong> dépendance P <strong>de</strong> G est le suivant :Jeux booléens 155


Coalitions efficaces dans les jeux booléens1 23Nous avons : RV 1 = {a,b,c}, RV 2 = {a,b}, RV 3 = {a,b,c}, RP 1 = {1,2,3}, RP 2 = {1,2}, RP 3 ={1,2,3}.La coalition {1,2} est efficace, mais n’est pas stable pour R : R({1,2}) = {1,2,3} ⊈ {1,2}.Pourtant, c<strong>et</strong>te réciproque peut être vraie sous la condition restrictive disant que la satisfaction <strong>de</strong>sbuts <strong>de</strong>s joueurs dépend uniquement <strong>de</strong>s actions d’un seul joueur, c’est-à-dire si RP i est un singl<strong>et</strong>onpour tout i ∈ B.Propriété 5.13. Soit G = (N,V,Γ,π,Φ) un jeu booléen. Si B ⊆ N est une coalition efficace <strong>de</strong> G(B ⊆ EC(G)) telle que ∀i ∈ B, |RP i | = 1, alors B est stable pour R.Dans ce cas, une coalition B telle que ϕ B = V i∈B ϕ i ̸|= ⊥ est efficace si <strong>et</strong> seulement si B est stablepour R.Preuve : B est une coalition efficace, donc V i∈B ϕ i est consistant, <strong>et</strong> ∃s B ∈ S B telque s B |= V i∈B ϕ i .On sait que ∀i ∈ B, |RP i | = 1. Donc, ∃ j ∈ N tel que RP i = { j}, i.e. ∀v ∈Var(PI(ϕ i )),v ∈ π j . Comme nous avons s B |= ϕ i , avec s B ∈ S B , nous savons que B contrôle aumoins une variable <strong>de</strong> ϕ i . Donc j ∈ B, <strong>et</strong> donc B est stable pour R.Dans ce cas particulier où RP i est un singl<strong>et</strong>on pour tout i ∈ B, nous avons c<strong>et</strong>te caractérisation graphiqueintuitive <strong>de</strong>s coalitions efficaces :Propriété 5.14. Soit G = (N,V ,Γ,π,Φ) un jeu booléen tel que ∀i ∈ N, |RP i | = 1. Pour toute coalitionC ⊆ N, C forme une cycle dans le graphe <strong>de</strong> dépendance si <strong>et</strong> seulement si C est stable pour R <strong>et</strong>constitue une coalition efficace minimale.Preuve :⇒ Comme ∀i, |RP i | = 1, chaque joueur ne peut avoir qu’un arc sortant dans legraphe <strong>de</strong> dépendance. Donc, s’il y un cycle entre p joueurs, <strong>et</strong> si l’on renommeces joueurs en respectant l’ordre topologique, nous avons RP 1 = {2},RP 2 = {3}, ..., RP p−1 = {p}, RP p = {1}. Soit C = {1,... , p}. Comme nousavons évi<strong>de</strong>mment R(C) = C (∀i ∈ C,RP i = {(i + 1)modulo p} ∈ C), C eststable pour R.De plus, nous savons que ∀i, j ∈ C, RP i ̸= RP j , donc ∀i, j ∈ C, ϕ i ∧ ϕ j ̸|= ⊥.D’après la propirété 5.12 (page précé<strong>de</strong>nte), C est efficace.Supposons qu’il existe I ⊂ C qui soit efficace. Il existe donc s I telle que s I |=Vi∈I ϕ i . Comme |RP i | = 1, ∀i ∈ I, RP i ∈ I. Et donc I = C. C est une coalition156 Elise Bonzon


5.4. Travaux connexesefficace minimale.⇐ Si C est stable pour R, alors ∀i ∈ C, ∃ j ∈ C tel que RP i = { j}. Donc, si C ={1,..., p}, on peut renommer ces joueurs <strong>de</strong> façon à avoir RP 1 = {2}, RP 2 ={3}, ..., RP p−1 = {p}, RP p = {1}. C forme alors un cycle dans le graphe <strong>de</strong>dépendance.Un autre problème intéressant est l’étu<strong>de</strong> <strong>de</strong>s coalitions efficaces dans les jeux booléens dont les butsont <strong>de</strong>s structures syntactiques spécifiques. Ainsi, si les buts sont formés <strong>de</strong> clauses positives (resp.termes positifs), c’est-à-dire si les clauses (resp. termes) ne contiennent que <strong>de</strong>s littéraux positifs,nous avons la caractérisation intuitive suivante :Propriété 5.15. Soit G = (N,V,Γ,π,Φ) un jeu booléen.1. si pour tout i ∈ N, ϕ i est un terme positif, alors pour tout B ⊆ N, B est efficace si <strong>et</strong> seulement siB est stable pour R.2. si pour tout i ∈ N, ϕ i est une clause positive, alors pour tout B ⊆ N, B est efficace si <strong>et</strong> seulementsi il existe un cycle dans le graphe <strong>de</strong> dépendance associé à G donc les nœuds sont exactementles membres <strong>de</strong> B.Preuve :1. ⇒ Soit B un ensemble stable pour R. Comme ∀i, ϕ i est un terme positif,nous savons que V i∈B ϕ i est consistant. Donc, d’après la propriété 5.12(page 155), B est une coalition efficace.⇐ Soit B une coalition efficace. Il existe donc s B ∈ S B telle que s B |=Vi∈B ϕ i . Comme ∀i, ϕ i = V v∈Lit(ϕ i ) v, s B |= V v∈ S i∈B Lit(ϕ i ) v. Donc, ∀v ∈Si∈B Lit(ϕ i ), v ∈ π B , <strong>et</strong> donc ∀i ∈ B, RP i ⊆ B. B est strable pour R.2. Soit C = {1,..., p} un cycle entre p joueurs. Donc, ∀i ∈ C, ∃ j ∈ C tel quej ∈ RP i . Comme ∀i ∈ N, ϕ i = W v∈Lit(ϕ) v, nous savons que ∀i ∈ C, ∃ j ∈ C,∃s j ∈ S j telle que s j |= ϕ j .Comme tous les ϕ i sont <strong>de</strong>s clauses positives, on sait également que V i∈N ϕ i ̸|=⊥. Alors, ∃s C ∈ S C telle que s C |= V i∈C ϕ i .5.4 Travaux connexes5.4.1 Graphe <strong>de</strong> dépendance <strong>et</strong> coalitions admissibles5.4.1.1 Graphe <strong>de</strong> dépendanceDans [Sichman <strong>et</strong> Conte, 2002], Sichman <strong>et</strong> Conte ont introduit <strong>de</strong>s graphes <strong>de</strong> dépendance perm<strong>et</strong>tant<strong>de</strong> représenter <strong>de</strong>s dépendances <strong>et</strong>/ou sur les actions nécessaires à un agent pour réaliser son but,<strong>et</strong> sur les agents contrôlant ces actions.Jeux booléens 157


Coalitions efficaces dans les jeux booléensCes graphes <strong>de</strong> dépendance sont donc différents <strong>de</strong> ceux que nous utilisons dans ce manuscrit (définition2.9 (page 38)) : l’ensemble <strong>de</strong>s nœuds <strong>de</strong> ce graphe est formé <strong>de</strong>s agents <strong>et</strong> <strong>de</strong>s actions disponibles,<strong>et</strong> les arcs sont étiqu<strong>et</strong>és selon les buts à exécuter :Définition 5.6 ([Sichman <strong>et</strong> Conte, 2002]). Un graphe <strong>de</strong> dépendance est un tuple 〈N,Ac,Φ,E ⊆[N × Ac × Φ] ∪[Ac × N]〉, où∗ N = {1,... ,n} est l’ensemble <strong>de</strong>s agents,∗ Ac = {a 1 ,...,a p } est l’ensemble <strong>de</strong>s actions disponibles,∗ Φ = {φ 1 ,...,φ q } est l’ensemble <strong>de</strong>s buts, <strong>et</strong>∗ E est un ensemble d’arcs étiqu<strong>et</strong>és tels que si (i,a,φ) ∈ E, alors (a,i) ∉ E.Un arc (i,a,φ) ∈ E représente le fait que φ est un but <strong>de</strong> l’agent i, que l’action a est nécessaire à ipour atteindre ce but, <strong>et</strong> que i n’est pas capable d’effectuer c<strong>et</strong>te action.(a,i) ∈ E signifie que l’agent i est capable d’effectuer l’action a.Nous pouvons à présent définir la dépendance basique, puis les dépendances <strong>et</strong>/ou.Définition 5.7 ([Sichman <strong>et</strong> Conte, 2002]). Soit un graphe <strong>de</strong> dépendance 〈N,Ac,Φ,E〉.∗ Un agent i dépend basiquement d’un agent j pour effectuer une action a, nécessaire pouratteindre le but φ, dénoté par <strong>de</strong>p_basique(i, j,φ,a), si <strong>et</strong> seulement si (i,a,φ) ∈ E <strong>et</strong> (a, j) ∈ E.∗ Un agent i ou-dépend d’un groupe d’agents Q pour effectuer une action a, nécessaire pouratteindre le but φ, dénoté par <strong>de</strong>p_OU(i,Q,φ,a), si <strong>et</strong> seulement si1. |Q| > 1 <strong>et</strong>2. Q = { j ∈ N|<strong>de</strong>p_basique(i, j,φ,a)}.∗ Un agent i <strong>et</strong>-dépend d’un groupe d’agents Q ⊆ [2 N \∅] pour effectuer l’ensemble d’actionsA ⊆ Ac, nécessaires pour atteindre le but φ, dénoté par <strong>de</strong>p_AND(i,Q,φ,A), si <strong>et</strong> seulement si1. |A| > 1,2. A = {a ∈ Ac|(i,a,φ) ∈ E} <strong>et</strong>3. P ∈ Q si <strong>et</strong> seulement si il existe une action a ∈ A telle que P ⊆ {i ∈ N|(a,i) ∈ E}.Exemple 5.6 ([Sauro, 2006]). La figure 5.1 (page suivante) représente les trois types <strong>de</strong> dépendanceque nous venons <strong>de</strong> définir.Le graphe représenté sur la figure (a) représente la dépendance basique. L’agent 1 a besoin d’effectuerl’action a pour accomplir son but φ, <strong>et</strong> pour cela il a besoin <strong>de</strong> l’agent 2.Le graphe représenté sur la figure (b) représente la dépendance OU. L’agent 1 dépend basiquement<strong>de</strong>s agents 2 <strong>et</strong> 3 pour effectuer l’action a lui perm<strong>et</strong>tant d’obtenir son but φ.Le graphe représenté sur la figure (c) représente la dépendance ET. L’agent 1 a besoin d’effectuerles actions a <strong>et</strong> b pour obtenir son but φ. Pour l’action a, il OU-dépend <strong>de</strong>s agents 2 <strong>et</strong> 3 ; <strong>et</strong> pourl’action b il dépend basiquement <strong>de</strong> 4.5.4.1.2 Coalitions admissiblesEn suivant les idées <strong>de</strong> [Sichman <strong>et</strong> Conte, 2002], Boella, Sauro <strong>et</strong> van <strong>de</strong>r Torre [Boella <strong>et</strong> al.,2005b,a; Sauro, 2006; Boella <strong>et</strong> al., 2006] représentent une coalition par un <strong>et</strong>-graphe <strong>de</strong> dépendance158 Elise Bonzon


5.4. Travaux connexesφ1 a 2(a)1φa(b)φa12323φb(c)4Figure 5.1 — Représentation graphique <strong>de</strong> la dépendance basique (a), <strong>de</strong> la dépendance OU (b) <strong>et</strong><strong>de</strong> la dépendance ET (c)entre agents. L’ensemble <strong>de</strong> nœuds ϑ <strong>de</strong> ce graphe est l’ensemble <strong>de</strong>s agents <strong>de</strong> la coalition, <strong>et</strong> lesarcs ξ sont étiqu<strong>et</strong>és. Si on note Φ l’ensemble <strong>de</strong>s buts <strong>de</strong> c<strong>et</strong>te coalition, un <strong>et</strong>-arc étiqu<strong>et</strong>é par φ ∈ Φd’un agent i vers un ensemble d’agents Q signifie que i désire le but φ qui peut être atteint par lesagents <strong>de</strong> Q.Pour représenter une coalition, le graphe construit <strong>de</strong> c<strong>et</strong>te façon doit satisfaire <strong>de</strong>ux conditions. Lapremière est que seuls les agents perm<strong>et</strong>tant d’obtenir un ou plusieurs buts peuvent être représentés.La secon<strong>de</strong> est qu’il ne peut y avoir d’agents pouvant satisfaire leur but seuls.Définition 5.8 ([Boella <strong>et</strong> al., 2006]). Une coalition est représentée par un <strong>et</strong>-graphe G = 〈ϑ,ξ〉, oùϑ est un ensemble fini <strong>de</strong> nœuds <strong>et</strong> ξ ⊆ ϑ ×(2 ϑ \∅) × Φ est un ensemble d’arcs étiqu<strong>et</strong>és.G satisfait <strong>de</strong>ux conditions :1. pour tout nœud i ∈ ϑ, il existe au moins un <strong>et</strong>-arc ( j,Q,φ) tel que i ∈ Q ; <strong>et</strong>2. ξ ne contient aucun <strong>et</strong>-arc <strong>de</strong> la forme (i,{i},φ).Par abus <strong>de</strong> notation, nous écrirons (Q,φ) ∈G s’il existe un i tel que (i,Q,φ) ∈ G. (Q,φ) est unengagement <strong>de</strong>G. Une sous-coalition G ′ est un sous-graphe <strong>de</strong>G dans lequel <strong>de</strong>s engagements <strong>de</strong>Gsont supprimés : il existe (Q,φ) ∈G tel que (Q,φ) ∉G ′ .Boella, Sauro <strong>et</strong> van <strong>de</strong>r Torre ont introduit le critère do-ut-<strong>de</strong>s perm<strong>et</strong>tant <strong>de</strong> former <strong>de</strong>s coalitions enformalisant une notion <strong>de</strong> réciprocité pouvant être décrite informellement par “je donne quelque choseuniquement si je reçois quelque chose en r<strong>et</strong>our”, <strong>et</strong> en perm<strong>et</strong>tant d’assurer qu’aucune sous-coalitionne peut se former indépendamment.Dans [Boella <strong>et</strong> al., 2005b,a; Sauro, 2006] c<strong>et</strong>te propriété est caractérisée au moyen d’une relation<strong>de</strong> préférences <strong>et</strong> d’une notion <strong>de</strong> dominance. Nous allons donner ici une définition basée sur lespropriétés topologiques <strong>de</strong>s chaînes d’échanges issue <strong>de</strong> [Boella <strong>et</strong> al., 2006].Une séquence finie <strong>de</strong> <strong>et</strong>-arcs (i 1 ,Q 1 ,φ 1 )...(i p ,Q p ,φ p ) est un chemin si <strong>et</strong> seulement si pour tout2 ≥ h ≥ p, i h ∈ Q h−1 . Ces chemins formalisent les chaînes d’échange entre agents. On note out(i)Jeux booléens 159


Coalitions efficaces dans les jeux booléensl’ensemble <strong>de</strong>s <strong>et</strong>-arcs partant <strong>de</strong> i : out(i) = {(i,Q,φ)}. out ∗ (i) contient tous les chemins partant <strong>de</strong>i, <strong>et</strong> n’en contient pas d’autres.Définition 5.9 ([Boella <strong>et</strong> al., 2006]). Une coalition G = 〈ϑ,ξ〉 satisfait la propriété do-ut-<strong>de</strong>s si <strong>et</strong>seulement si1. il n’existe pas <strong>de</strong>ux engagements (Q,φ),(Q ′ ,φ) ∈ G tels que Q ̸= Q ′ (pas <strong>de</strong> sous-coalitionindépendante), <strong>et</strong>2. pour tout (i,Q,φ) ∈ ξ <strong>et</strong> pour tout j ∈ Q, (i,Q,φ) ∈ out ∗ ( j) (réciprocité).Exemple 5.7 ([Boella <strong>et</strong> al., 2006]). Les <strong>de</strong>ux coalitions représentées sur la figure 5.2 (a) <strong>et</strong> (b) sontdo-ut-<strong>de</strong>s.2 4φ 1 φ 4φ 1 φ 41 2 3φ 2 φ 3 φ 21(a)3(b)Figure 5.2 — Coalitions satisfaisant le critère do-ut-<strong>de</strong>sφ 3Ces définitions amènent la propriété suivante :Propriété 5.16. Soit G = (N,V,π,Γ,Φ) un jeu booléen, <strong>et</strong> soit C une coalition telle que V i∈C ϕ i estconsistant.Si la coalition G = 〈C,ξ〉 est do-ut-<strong>de</strong>s, avec ξ l’ensemble <strong>de</strong>s arcs (i,RP i ,ϕ i ) pour tout i ∈ C, alorsC est une coalition efficace.Preuve :Comme un <strong>et</strong>-arc dans G relie un joueur à tous les joueurs qui lui sont utiles poursatisfaire son but,G = 〈C,ξ〉 forme un graphe <strong>de</strong> dépendance sur C ⊆ N. (i,RP i ,ϕ i )correspond donc à R(i, j) pour tout j ∈ RP i . Par définition, on a donc out(i) = R(i)<strong>et</strong> out ∗ (i) = R ∗ (i).Soit i ∈ C. D’après la définition 5.8 (page précé<strong>de</strong>nte), nous savons qu’il existe unjoueur j ∈ C tel que ( j,RP j ,ϕ j ) ∈ ξ, <strong>et</strong> j ∈ RP i . D’après la secon<strong>de</strong> condition <strong>de</strong> ladéfinition 5.9, nous savons que ( j,RP j ,ϕ j ) ∈ out ∗ (i) = R ∗ (i). Donc (i,RP i ,ϕ i ) ∈ ξ.On sait donc que pour tout i ∈ C, (i,RP i ,ϕ i ) ∈ ξ, <strong>et</strong> donc que pour tout k ∈ RP i ,k ∈ C. C est donc un ensemble stable, <strong>et</strong> d’après la propriété 5.12 (page 155) C estune coalition efficace.Par contre, la réciproque est fausse, comme le montre l’exemple suivant :Exemple 5.8. G = (N,V ,π,Γ,Φ) un jeu booléen tel que N = {1,2,3}, V = {a,b,c}, π 1 = {a},π 2 = {b}, π 3 = {c}, pour tout i, γ i = ⊤, ϕ 1 = a ∧ c, ϕ 2 = b ↔ c, <strong>et</strong> ϕ 3 = b.La coalition C = {1,2,3} est efficace, <strong>et</strong> pourtant, d’après la définition 5.9, G = 〈C,ξ〉, avecξ = {(1,{1,3},ϕ 1 ),(2,{2,3},ϕ 2 ),(3,{2},ϕ 3 )}, n’est pas do-ut-<strong>de</strong>s car la réciprocité n’est pas respectée: 1 a besoin <strong>de</strong> 3 pour satisfaire son but, mais n’ai<strong>de</strong> personne à satisfaire le sien.160 Elise Bonzon


5.4. Travaux connexesUn second critère est introduit dans [Boella <strong>et</strong> al., 2006] : la propriété it-dud, qui consiste en troisconditions :1. la propriété do-ut-<strong>de</strong>s ;2. pour tout agent i ∈ C, out ∗ (i) = ξ, afin d’empêcher une coalition <strong>de</strong> se séparer en <strong>de</strong>ux sousgraphes,comme c’est le cas dans la figure 5.2 (page ci-contre)(a) ;3. enfin, la troisième condition consiste à empêcher que <strong>de</strong>ux sous-coalitions puissent se formerplutôt que la gran<strong>de</strong>, comme c’est le cas dans la figure 5.2 (page précé<strong>de</strong>nte)(b). Il ne doit doncpas exister un agent i <strong>et</strong> une bipartition O 1 ,O 2 <strong>de</strong> out(i) telle que O ∗ 1 ∩ O∗ 2 est vi<strong>de</strong>.Définition 5.10 ([Boella <strong>et</strong> al., 2006]). Une coalition G = 〈ϑ,ξ〉 satisfait la propriété it-dud si <strong>et</strong>seulement si pour tous les agents i ∈ ϑ1. il n’existe pas <strong>de</strong>ux engagements (Q,φ),(Q ′ ,φ) ∈G tels que Q ̸= Q ′ ,2. out ∗ (i) = ξ, <strong>et</strong>3. il n’existe pas <strong>de</strong> bipartition O 1 ,O 2 <strong>de</strong> out(i) telle que O ∗ 1 ∩ O∗ 2 = ∅.Comme nous l’avons vu, les <strong>de</strong>ux coalitions <strong>de</strong> l’exemple 5.2 (page ci-contre) ne satisfont pas c<strong>et</strong>tepropriété. Par contre, la coalition représentée sur la figure 5.3 est une coalition it-dud.2φ 2φ 31φ 13Figure 5.3 — Coalition satisfiant le critère it-dudUn algorithme perm<strong>et</strong>tant <strong>de</strong> trouver toutes les sous-coalitions d’une coalition C satisfaisant la propriétéit-dud est introduit dans [Boella <strong>et</strong> al., 2006; Sauro, 2006].[Boella <strong>et</strong> al., 2005b,a; Sauro, 2006; Boella <strong>et</strong> al., 2006] utilisent les <strong>et</strong>-graphes <strong>de</strong> dépendance entreagents introduits par [Sichman <strong>et</strong> Conte, 2002] pour introduire <strong>de</strong>ux critères d’admissibilité pour lescoalitions : le critère do-ut-<strong>de</strong>s <strong>et</strong> le critère it-dud. Nous avons montré que le critère do-ut-<strong>de</strong>s, <strong>et</strong> doncpar définition le critère it-dud, est plus restrictif que celui d’efficacité que nous avons introduit dansce chapitre.5.4.2 Jeux qualitatifs coalitionnelsComme les jeux booléens, les jeux qualitatifs coalitionnels (QCG), introduits dans[Wooldridge <strong>et</strong> Dunne, 2004], sont <strong>de</strong>s jeux dans lesquels les agents n’assignent pas <strong>de</strong>s valeursd’utilité à chaque issue du jeu, mais sont satisfaits si leurs buts sont atteints. Un QCG est défini<strong>de</strong> la façon suivante :Définition 5.11 ([Wooldridge <strong>et</strong> Dunne, 2004]). Un jeu coalitionnel qualitatif (QCG) à n joueursest un (n+3)-upl<strong>et</strong> G = (Φ,N,Φ 1 ,...,Φ n ,W), où∗ Φ = {φ 1 ,...,φ m } est l’ensemble <strong>de</strong>s buts possibles,Jeux booléens 161


Coalitions efficaces dans les jeux booléens∗ N = {1,... ,n} est l’ensemble <strong>de</strong>s agents,∗ pour tout i ∈ N, Φ i ⊆ Φ est l’ensemble <strong>de</strong>s buts <strong>de</strong> l’agent i. i est satisfait si un <strong>de</strong> ses buts l’est,mais peu importe lequel.∗ W: 2 N → 2 2Φ est une fonction caractéristique qui associe à chaque coalition C ⊆ N un ensemble<strong>de</strong> choix : si Φ ′ ⊆ W(C), alors la coalition C peut obtenir tous les buts appartenant à Φ ′simultanément.Exemple 5.9. Soit un QCG défini par∗ N = {1,2,3},∗ Φ = {φ 1 ,φ 2 ,φ 3 },∗ pour tout i, Φ i = {φ i }, <strong>et</strong>∗ la fonction caractéristique W définie pour chaque coalition C parW(C) ={{{φ 1 ,φ 2 },{φ 1 ,φ 3 },{φ 2 ,φ 3 }} si |C| ≥ 2∅sinon.Ainsi définis, les QCGs perm<strong>et</strong>tent <strong>de</strong> modéliser <strong>de</strong>s problèmes courants en théorie <strong>de</strong>s jeux coalitionnels,<strong>et</strong> <strong>de</strong> calculer la complexité <strong>de</strong> problèmes associés. Le problème <strong>de</strong> l’existence d’une coalitionfructueuse (c’est-à-dire une coalition ayant la possibilité d’atteindre les objectis <strong>de</strong> tous ses membres),ou celui <strong>de</strong> la vacuité du noyau sont étudiés dans [Wooldridge <strong>et</strong> Dunne, 2004] en utilisant ainsi lesQCGs.Une première différence entre QCG <strong>et</strong> jeux booléens est qu’il n’y a aucune fonction d’affectation <strong>de</strong>contrôle dans les QCG : la fonction caractéristique perm<strong>et</strong> <strong>de</strong> savoir quels buts peut atteindre unecoalition donnée, mais ne donne pas les “capacités” <strong>de</strong> chaque joueur en particulier.Une secon<strong>de</strong> est que chaque agent dans un QCG peut avoir un ensemble <strong>de</strong> buts, <strong>et</strong> être satisfait si aumoins un <strong>de</strong> ses buts est satisfait, tandis que dans un jeu booléen classique chaque agent n’a qu’unseul but. C<strong>et</strong>te différence peut pourtant être contournée : si par exemple les buts d’un joueur i dans unQCG sont Φ i = {φ 1 ,φ 2 }, ils peuvent être représentés par ϕ i = φ 1 ∨ φ 2 dans un jeu booléen. Commedans un QCG, on aura alors que le joueur i est satisfait si le but φ 1 ou le but φ 2 est satisfait, <strong>et</strong> peuimporte lequel.Enfin, les fonctions caractéristiques <strong>de</strong>s QCGs peuvent ne pas être monotones, contrairement auxfonctions d’utilité dans les jeux booléens. Il est cependant possible <strong>de</strong> représenter un QCG ayant unefonction caractéristique monotone avec un jeu booléen, comme nous le montrons sur l’exemple 5.9.Exemple 5.9, suite : Ce QCG peut être représenté par un jeu booléen à trois joueurs, tels que lesbuts <strong>de</strong> ces joueurs sont les buts φ 1 , φ 2 <strong>et</strong> φ 3 . Il faut ensuite écrire ces buts sous forme <strong>de</strong> formulespropositionnelles <strong>et</strong> faire en sorte qu’ils respectent la fonction caractéristique du QCG.Ce QCG peut être donc représenté par exemple par le jeu booléen (N,V ,π,Γ,Φ), avec∗ V = {a,b,c,d,e},∗ π 1 = {a,b}, π 2 = {c,d}, π 3 = {e},∗ pour tout i, γ i = ⊤,∗ ϕ 1 = φ 1 = (a ↔ (b ↔ c)) ∨(c ↔ (d ↔ e)) ∨(a ↔ (b ↔ e)),∗ ϕ 2 = φ 2 = (a ∧ b ∧ c) ∨(a¬b ∧ c) ∨(c ∧ d ∧ e) ∨(c¬d ∧ e) ∨(a ∧ b ∧ e) ∨(a¬b ∧ e),162 Elise Bonzon


5.4. Travaux connexes∗ ϕ 3 = φ 3 = (a∧¬b∧c) ∨(¬a∧b∧¬c) ∨(c∧¬d ∧e) ∨(¬c∧d ∧ ¬e) ∨(a∧¬b∧e) ∨(¬a∧b∧¬e).Dans ce jeu, on voit qu’aucun joueur seul ne peut atteindre son but, mais que les coalitions {1,2},{1,3}, {2,3} <strong>et</strong> {1,2,3} peuvent atteindre ensemble les buts φ 1 ∧ φ 2 , φ 1 ∧ φ 3 <strong>et</strong> φ 2 ∧ φ 3 . La fonctioncaractéristique W est donc bien respectée.De même, un jeu booléen peut être représenté par un QCG :Exemple 5.1 (page 143), suite : Le jeu booléen G peut être représenté par un QCG a 3 joueurs. Lafonction caractéristique <strong>de</strong> ce QCG doit associer à chaque groupe <strong>de</strong> joueurs les buts qu’ils peuventatteindre.Ainsi, nous pouvons représenter c<strong>et</strong> exemple par la fonction caractéristique W suivante :∗ W({2}) = ∅,∗ W({1}) = W({3}) = W({1,3}) = {ϕ 2 },∗ W({1,2}) = {ϕ 1 ,ϕ 2 },∗ W({2,3}) = {ϕ 2 ,ϕ 3 },∗ W({1,2,3}) = {{ϕ 1 ,ϕ 2 },{ϕ 2 ,ϕ 3 }}.Les QCGs ont été étendus <strong>de</strong> <strong>de</strong>ux façons distinctes.Dans [Dunne <strong>et</strong> Wooldridge, 2004], une relation <strong>de</strong> préférences est associée aux buts <strong>de</strong> chaquejoueur, perm<strong>et</strong>tant ainsi <strong>de</strong> définir <strong>de</strong>s jeux coalitionnels avec préférences (QCGPs). Ainsi, commedans un QCG, un ensemble <strong>de</strong> buts est associé à chaque joueur, mais, dans un QCGP, ce joueur a<strong>de</strong>s préférences sur ces buts. L’ajout <strong>de</strong> ces préférences perm<strong>et</strong> <strong>de</strong> définir <strong>de</strong>s concepts classiques <strong>de</strong>la théorie <strong>de</strong>s jeux coalitionnels, comme la notion <strong>de</strong> noyau ou d’ensemble stable, <strong>et</strong> <strong>de</strong> trouver <strong>de</strong>spropriétés perm<strong>et</strong>tant <strong>de</strong> caractériser ces concepts dans <strong>de</strong>s QCGPs.D’autre part, il est montré dans [Dunne <strong>et</strong> al., 2007] qu’il est possible <strong>de</strong> raisonner sur les QCGs enutilisant la logique <strong>de</strong>s coalitions <strong>de</strong> [<strong>Paul</strong>y, 2001]. Une relation <strong>de</strong> correspondance entre les QCGs <strong>et</strong>les interprétations <strong>de</strong> la logique <strong>de</strong>s coalitions est introduite, perm<strong>et</strong>tant ainsi <strong>de</strong> définir sous quellescirconstances ces interprétations perm<strong>et</strong>tent <strong>de</strong> caractériser correctement un QCG.Comme les jeux booléens, un QCG est un jeu dans lequel les joueurs sont satisfaits si leur but estatteint. Nous avons montré que si la fonction caractéristique d’un QCG est monotone, il est possible<strong>de</strong> traduire ce QCG en un jeu booléen, <strong>et</strong> vice-versa.5.4.3 Logique <strong>de</strong>s jeux coalitionnelsDans [Agotnes <strong>et</strong> al., 2006], Agotnes, van <strong>de</strong>r Hoek <strong>et</strong> Wooldridge ont développé une logique pourreprésenter <strong>et</strong> raisonner sur les jeux coalitionnels sans utilités transférables. Contrairement à la logique<strong>de</strong>s coalitions [<strong>Paul</strong>y, 2001], la logique <strong>de</strong>s jeux coalitionnels (Coalitional Game Logic - CGL)introduite dans [Agotnes <strong>et</strong> al., 2006] perm<strong>et</strong> <strong>de</strong> représenter les préférences <strong>de</strong>s joueurs, <strong>et</strong> établit unlien direct entre les formules <strong>de</strong> la logique <strong>et</strong> les propriétés <strong>de</strong>s jeux coalitionnels.Définition 5.12 ([Agotnes <strong>et</strong> al., 2006]). Un jeu coalitionnel sans utilités transférables à n joueursest un (n+3)-upl<strong>et</strong> G = (N,Ω,W,≽ 1 ,...,≽ n ), où∗ N = {1,...,n} est un ensemble non vi<strong>de</strong>s d’agents,Jeux booléens 163


Coalitions efficaces dans les jeux booléens∗ Ω = {ω 1 ,...,ω m } est un ensemble non vi<strong>de</strong> d’issues du jeu,∗ W: (2 N \ ∅) → 2 Ω est une fonction caractéristique qui associe à chaque coalition C ⊆ N unensemble <strong>de</strong> choix : si ω ⊆ W(C), alors la coalition C peut atteindre l’issue ω du jeu.∗ pour tout agent i ∈ N, ≽ i ⊆ Ω × Ω est une relation <strong>de</strong> préférences complète, réflexive <strong>et</strong> transitive.Agotnes <strong>et</strong> collègues caractérisent ensuite quelques concepts <strong>de</strong> solution <strong>de</strong> la théorie <strong>de</strong>s jeux coalitionnelsdans leur logique, comme le noyau.Une <strong>de</strong>s principales différences entre jeux coalitionnels <strong>et</strong> jeux booléens est, comme avec les QCGs,le fait que la fonction caractéristique perm<strong>et</strong> <strong>de</strong> savoir quels buts peut atteindre une coalition donnée,mais ne donne pas les “capacités” <strong>de</strong> chaque joueur en particulier. On remarque aussi ici que la fonctioncaratéristique peut être non-monotone, contrairement aux fonctions d’utilité <strong>de</strong>s jeux booléens.En Section 2.2 (page 33), nous avons mentionné un lien avec le problème <strong>de</strong> contrôlabilié en logiquepropositionnelle étudié par Boutilier [Boutilier, 1994] <strong>et</strong> Lang <strong>et</strong> al [Lang <strong>et</strong> Marquis, 1998b].Une récente ligne <strong>de</strong> travail dans ce domaine [van <strong>de</strong>r Hoek <strong>et</strong> Wooldridge, 2005] étudie une logique<strong>de</strong> coopération dans laquelle on suppose que chaque agent contrôle un ensemble <strong>de</strong> variablespropositionnelles. Alors que notre travail a consisté à enrichir les jeux booléens en seconcentrant sur les préférences <strong>et</strong> les concepts <strong>de</strong> solution classiques, van <strong>de</strong>r Hoek <strong>et</strong> Wooldridge[van <strong>de</strong>r Hoek <strong>et</strong> Wooldridge, 2005] s’intéressent au pouvoir réel <strong>de</strong>s agents : ils raisonnent sur l’ensemble<strong>de</strong>s états qu’un groupe d’agents peut atteindre.164 Elise Bonzon


ConclusionDans un système multi-agents, plusieurs agents rationnels interagissent afin <strong>de</strong> satisfaire au mieuxleurs préférences. Notre objectif au long <strong>de</strong> ce travail était <strong>de</strong> spécifier <strong>de</strong> façon concise <strong>et</strong> efficaceles interactions entre agents rationnels dans <strong>de</strong> tels systèmes. Pour cela, nous avons choisi <strong>de</strong> nousappuyer sur la théorie <strong>de</strong>s jeux, qui est un modèle formel abouti pour l’étu<strong>de</strong> <strong>de</strong> ces interactions. Une<strong>de</strong>s principales lacunes <strong>de</strong> c<strong>et</strong>te théorie est la façon <strong>de</strong> représenter les utilités <strong>de</strong>s joueurs, coûteuse enplace mémoire <strong>et</strong> en temps d’exécution. Nous avons vu qu’une solution pour pallier ces problèmes estd’utiliser un langage <strong>de</strong> représentation compacte <strong>de</strong> préférences. Nous avons commencé par choisir <strong>de</strong>représenter les préférences <strong>de</strong>s joueurs <strong>de</strong> façon ordinale, ce qui nous a mené à la logique propositionnelle.En eff<strong>et</strong>, utiliser la logique propositionnelle pour représenter les préférences <strong>de</strong>s joueurs perm<strong>et</strong>non seulement <strong>de</strong> simplifier les jeux, mais aussi d’utiliser les propriétés <strong>et</strong> les outils bien connus <strong>de</strong>c<strong>et</strong>te logique pour étudier les caractéristiques <strong>de</strong> tels jeux. Nous avons donc choisi d’étudier le cas oùchaque agent contrôle un ensemble fini <strong>de</strong> variables binaires. Ces jeux, appelés jeux booléens, ont étéintroduits par [Harrenstein <strong>et</strong> al., 2001; Harrenstein, 2004a; Dunne <strong>et</strong> van <strong>de</strong>r Hoek, 2004].Les jeux booléens perm<strong>et</strong>tent <strong>de</strong> modéliser <strong>de</strong> manière compacte les préférences <strong>de</strong>s joueursdans le cadre <strong>de</strong> jeux statiques. Toutefois, ces jeux booléens, tels qu’ils ont été introduitspar [Harrenstein <strong>et</strong> al., 2001; Harrenstein, 2004a; Dunne <strong>et</strong> van <strong>de</strong>r Hoek, 2004], correspon<strong>de</strong>nt à unespécification très particulière (2 joueurs, jeux à somme nulle, utilités binaires). Nous avons doncétendu ces jeux sur plusieurs points :Jeux booléens à n joueurs <strong>et</strong> somme non nulle : Nous avons tout d’abord généralisé les jeux booléens<strong>de</strong> manière à représenter <strong>de</strong>s jeux avec un nombre arbitraire <strong>de</strong> joueurs <strong>et</strong> à somme nonnulle, mais en gardant l’hypothèse que les préférences <strong>de</strong> chaque joueur sont représentées parune formule propositionnelle unique, ce qui ne perm<strong>et</strong> <strong>de</strong> représenter que <strong>de</strong>s utilités binaires.Nous avons ensuite vu que <strong>de</strong>s outils simples issus <strong>de</strong> la logique propositionnelle perm<strong>et</strong>tent <strong>de</strong>caractériser équilibres <strong>de</strong> Nash en stratégies pures <strong>et</strong> stratégies dominées. Nous avons ainsi établiun lien entre les jeux booléens (étendus ou pas) <strong>et</strong> les notions d’impliquants <strong>et</strong> d’impliquantspremiers (notions bien connues <strong>de</strong> tous ceux qui s’intéressent au problème <strong>de</strong> la satisfiabilitéen logique classique). Nous avons également i<strong>de</strong>ntifié la complexité algorithmique <strong>de</strong> quelquesproblèmes liés aux jeux booléens.Bien entendu, les jeux booléens évoqués dans [Harrenstein <strong>et</strong> al., 2001; Harrenstein, 2004a]peuvent être vus comme <strong>de</strong>s cas particuliers <strong>de</strong> ces “jeux booléens étendus”.Introduction <strong>de</strong> préférences non dichotomiques : Ce choix d’utilités binaires (pour lequel les165


Conclusionagents peuvent seulement exprimer leur totale satisfaction ou leur total mécontentement,sans niveaux intermédiaires) étant une vraie perte <strong>de</strong> généralité, nous avons incorporé <strong>de</strong>spréférences non dichotomiques dans les jeux booléens afin que chaque joueur puisse représenterses préférences <strong>de</strong> manière plus souple. Nous avons vu qu’exprimer <strong>de</strong>s préférences non binairesdans un cadre propositionnel est possible en utilisant un langage <strong>de</strong> représentation compacte<strong>de</strong> préférences. Nous avons choisi <strong>de</strong> nous restreindre aux préférences ordinales, <strong>et</strong> nous avonsintegré <strong>de</strong>ux <strong>de</strong> ces langages aux jeux booléens : les CP-n<strong>et</strong>s <strong>et</strong> les buts à priorité. Nous avonsensuite calculé les propriétés <strong>de</strong>s équilibres <strong>de</strong> Nash en stratégies pures <strong>et</strong> stratégies dominéesdans ces nouveaux jeux, <strong>et</strong> i<strong>de</strong>ntifié la complexité algorithmique <strong>de</strong> quelques problèmes.Graphe <strong>de</strong> dépendances entre joueurs : Nous avons également montré que la notion intuitive <strong>de</strong>dépendance entre joueurs dans un jeu booléen perm<strong>et</strong> <strong>de</strong> donner une caractérisation simple<strong>de</strong>s équilibres <strong>de</strong> Nash en stratégies pures. De plus, nous avons montré que ces propriétés sontvalables non seulement dans le cas <strong>de</strong>s jeux booléens avec <strong>de</strong>s préférences dichotomiques, maisaussi pour <strong>de</strong>s jeux booléens généralisés, dans lesquels les préférences sont représentées par unlangage <strong>de</strong> représentation compacte.Coalitions efficaces : Nous avons prouvé que les jeux booléens peuvent être employés pour représentercompactement <strong>de</strong>s jeux coalitionnels pour lesquels les joueurs ont <strong>de</strong>s préférences dichotomiques.C<strong>et</strong>te spécificité nous a amené à définir la notion intéressante <strong>de</strong>s coalitions efficaces.Nous avons donné une caractérisation exacte <strong>de</strong>s ensembles <strong>de</strong> coalitions qui correspon<strong>de</strong>nt àl’ensemble <strong>de</strong> coalitions efficaces pour un jeu booléen, <strong>et</strong> nous avons donné plusieurs résultatssur le calcul <strong>de</strong> ces coalitions efficaces. Notons que certaines <strong>de</strong> nos notions <strong>et</strong> <strong>de</strong> nos résultatsne s’appuient pas explicitement sur l’utilisation <strong>de</strong> la logique propositionnelle. Par exemple, lescoalitions efficaces peuvent être définies dans un cadre plus général dans lequel les buts sontsimplement exprimés en tant qu’ensembles non vi<strong>de</strong>s d’états. Cependant, beaucoup <strong>de</strong> notions(en particulier, la fonction π d’assignement <strong>de</strong> contrôle) <strong>de</strong>viennent beaucoup moins claires lorsqu’onne prend pas en compte la représentation propositionnelle.Une limitation <strong>de</strong> nos résultats sur les coalitions est qu’ils s’appliquent uniquement à <strong>de</strong>s préférencesdichotomiques. Cependant, comme nous l’avons illustré sur l’exemple 5.2 (page 143), ilexiste <strong>de</strong>s problèmes qui s’expriment avec <strong>de</strong>s buts dichotomiques.Ce travail, encore très préliminaire, ouvre <strong>de</strong> nombreuses perspectives, que nous allons présenter àprésent.Introduction <strong>de</strong> langages d’action <strong>et</strong> partage <strong>de</strong> variablesLes seules actions disponibles dans un jeu booléen consistent à affecter une valeur à un ensemble <strong>de</strong>variables données. C’est une perte <strong>de</strong> généralité : en eff<strong>et</strong> on ne peut représenter <strong>de</strong>s actions ayant <strong>de</strong>spréconditions nécessaires pour pouvoir être accomplies (par exemple, pour pouvoir lire la nuit, il fautque la lumière soit allumée), ou encore <strong>de</strong>s actions ayant un eff<strong>et</strong> sur l’instanciation d’autres variables(par exemple si j’éteins la lumière, alors je ne peux plus lire la nuit). Il serait donc utile d’avoir unlangage perm<strong>et</strong>tant <strong>de</strong> représenter <strong>de</strong>s actions plus sophistiquées.166 Elise Bonzon


ConclusionUne première idée pour cela est <strong>de</strong> modéliser <strong>de</strong>s jeux à l’ai<strong>de</strong> d’un langage d’actions déterministes.Dans ce cas, chaque joueur n’aura plus un ensemble <strong>de</strong> variables propositionnelles à m<strong>et</strong>tre à vraiou à faux, mais un ensemble d’actions déterministes à accomplir, qui modifieront l’instanciation<strong>de</strong>s variables propositionnelles. Un langage d’action sert à décrire les eff<strong>et</strong>s qu’ont les actions surles fluents 12 . Il existe <strong>de</strong> nombreux langages d’action, comme par exemple le langage A, introduitdans [Gelfond <strong>et</strong> Lifschitz, 1993], ou le langage C, introduit dans [Giunchiglia <strong>et</strong> Lifschitz, 1998].Pour pouvoir appliquer <strong>de</strong>s actions dans un jeu booléen, l’état du mon<strong>de</strong> (les valeurs que prennentles variables du jeu) a besoin d’être défini au début du jeu. On doit donc introduire l’état initial dansla définition d’un jeu booléen. De plus, les joueurs ne contrôleront plus les variables du jeu, mais lesactions.Définition 1. Soit un ensemble V <strong>de</strong> variables propositionnelles, N = {1,2,...,n} un ensemble <strong>de</strong>joueurs, Ac un ensemble d’actions, Γ = {γ 1 ,...,γ n } un ensemble <strong>de</strong> contraintes, une fonction d’assignement<strong>de</strong> contrôle π : N → Ac, Φ = {ϕ 1 ,...,ϕ n } l’ensemble <strong>de</strong>s formules représentant les buts<strong>de</strong>s joueurs, où chaque ϕ i est une formule <strong>de</strong> L V , <strong>et</strong> E 0 l’état initial, c’est-à-dire l’instanciation <strong>de</strong>chaque variable <strong>de</strong> V au début du jeu.Le jeu booléen avec actions correspondant est alors représenté par le tuple (N,V,Ac,Γ,π,Φ,E 0 ).Dans le contexte <strong>de</strong>s jeux booléens, l’ensemble <strong>de</strong>s fluents 13 peut être défini comme étant l’ensemble<strong>de</strong>s instantiations possibles <strong>de</strong>s variables <strong>de</strong> V . Les jeux booléens étant statiques, les joueurs jouentsimultanément. Il faut donc étudier l’eff<strong>et</strong> <strong>de</strong>s actions jouées au même instant.Plusieurs cas sont alors possibles : les actions peuvent être déterministes sans problème d’interaction(auquel cas <strong>de</strong>ux actions ne peuvent pas influer sur la même variable) ou déterministes avec problèmesd’interaction (auquel cas <strong>de</strong>ux actions (ou plus) contrôlées par différents joueurs peuvent influer sur lamême variable du jeu). Lorsque les actions sont déterministes sans problème d’interaction, il est possible<strong>de</strong> raisonner exactement comme pour un jeu booléen classique, sous réserve que l’on connaissel’état initial du jeu.Par contre, si les actions sont déterministes avec <strong>de</strong>s problèmes d’interaction, une variable peut êtremodifiée par <strong>de</strong>ux actions différentes. Supposons par exemple qu’une lampe éteinte soit contrôlée par<strong>de</strong>ux interrupteurs. Si l’on active exactement au même instant ces <strong>de</strong>ux interrupteurs, il est impossible<strong>de</strong> prévoir à l’avance quel sera le résultat <strong>de</strong> ces <strong>de</strong>ux actions : la lampe sera-t’elle toujours éteinte,ou sera-t’elle allumée ?C<strong>et</strong>te situation est i<strong>de</strong>ntique à celle consistant à étudier le problème <strong>de</strong> la gestion <strong>de</strong> variables partagées,c’est-à-dire <strong>de</strong> variables contrôlées par plusieurs joueurs dans le cas où les actions ne sont pasnécessairement sophistiquées.Exemple 1. Cédric <strong>et</strong> Caroline sont invités à une soirée chez <strong>de</strong>s amis avec leur fille Ja<strong>de</strong>. Carolineaimerait bien que Cédric aille à c<strong>et</strong>te soirée avec Ja<strong>de</strong> afin <strong>de</strong> profiter d’une soirée tranquille chezelle. Cédric lui aimerait confier Ja<strong>de</strong> à une baby-sitter afin <strong>de</strong> profiter calmement <strong>de</strong> c<strong>et</strong>te soirée avecCaroline <strong>et</strong> leurs amis. Ja<strong>de</strong> n’a qu’un an <strong>et</strong> n’a pas le choix, elle fait ce que ses parents déci<strong>de</strong>ntpour elle.C<strong>et</strong>te situation peut être modélisée par le jeu booléen G = (N,V ,π,Γ,Φ) suivant :12 Un fluent est “quelque chose” qui peut dépendre <strong>de</strong> la situation, comme par exemple l’endroit où se trouve un obj<strong>et</strong>que l’on peut <strong>de</strong>placer. Un fluent propositionnel est une assertion qui peut être vraie ou fausse selon la situation.13 Les fluents utilisés ici sont <strong>de</strong>s fluents propositionnels.Jeux booléens 167


Conclusion∗ N = {1,2}, Caroline étant le joueur 1, <strong>et</strong> Cédric le joueur 2,∗ V = {a,b,c,d}, a signifiant que Caroline va a la fête, b que Cédric y va, c que Ja<strong>de</strong> y accompagneau moins un <strong>de</strong> ses parents, <strong>et</strong> enfin d que Ja<strong>de</strong> est confiée à une babysitter.∗ π 1 = {a,c,d}, π 2 = {b,c,d}, (chacun <strong>de</strong>s parents déci<strong>de</strong> pour lui-même, mais ils peuvent tous<strong>de</strong>ux déci<strong>de</strong>r pour leur fille)∗ pour tout i, γ i = {c → (a ∨ b),(a ∧ b ∧ ¬c) → d} (Ja<strong>de</strong> ne peut aller à la fête que si un <strong>de</strong> sesparents y va, <strong>et</strong> est confiée à une baby-sitter si ses <strong>de</strong>ux parents y vont sans elle.),∗ ϕ 1 = ¬a ∧ b ∧ c¬d <strong>et</strong> ϕ 2 = a ∧ b ∧ ¬c ∧ d.Comment savoir quelle sera l’instanciation <strong>de</strong>s variables c <strong>et</strong> d, c’est-à-dire si Ja<strong>de</strong> ira à la fête ou sielle sera confiée à une baby-sitter ?Le jeu est statique, les joueurs instancient leurs variables en même temps. Comment savoir alorslequel a instancié la variable ? C<strong>et</strong>te question est similaire à celle posée lors <strong>de</strong> l’introduction d’actionsdéterministes avec problèmes d’interaction.Il serait donc intéressant d’étudier quels langages d’actions peuvent être utilisés dans un jeu booléen,<strong>et</strong> comment les introduire dans ces jeux <strong>de</strong> façon formelle. Ensuite, il serait intéressant d’étudier commentraisonner sur <strong>de</strong>s jeux booléens ayant <strong>de</strong>s actions déterministes avec problèmes d’interaction, <strong>et</strong>sur <strong>de</strong>s jeux ayant <strong>de</strong>s variables partagées.Pour cela, une idée à exploiter serait <strong>de</strong> considérer que l’on ne connaît pas la valeur <strong>de</strong>s variablespartagées (ou <strong>de</strong> celles modifiées par plusieurs actions concurrentes), <strong>et</strong> <strong>de</strong> voir les résultats que l’onobtient ainsi. Un secon<strong>de</strong> serait d’introduire un joueur pour chaque variable partagée (modifiée par<strong>de</strong>s actions concurrentes) qui contrôlerait c<strong>et</strong>te variable, <strong>et</strong> dont le but serait la conjonction <strong>de</strong>s buts<strong>de</strong>s joueurs contrôlant c<strong>et</strong>te variable si ces buts sont consistants, <strong>et</strong> leur disjonction sinon.Relations d’inférences <strong>et</strong> jeux booléensUne autre piste <strong>de</strong> travail consiste à voir un jeu booléen comme étant une base <strong>de</strong> connaissances (enassimilant connaissances <strong>et</strong> profils <strong>de</strong> stratégies), <strong>et</strong> d’essayer <strong>de</strong> trouver <strong>de</strong> nouvelles connaissances- ou les connaissances les plus pertinentes <strong>de</strong> ce jeu - à partir d’inférences non monotones. Pour cela,il faut définir <strong>de</strong>s relations d’inférences non monotones à partir <strong>de</strong> ces jeux booléens étendus, sur lemodèle <strong>de</strong> celles définies à partir <strong>de</strong>s jeux booléens classiques par [Harrenstein, 2004b] .Si G = (N,V,π,Γ,Φ) est un jeu booléen, <strong>et</strong> si PNE est l’ensemble <strong>de</strong>s équilibres <strong>de</strong> Nash en stratégiespures <strong>de</strong> G, il est possible <strong>de</strong> définir les relations d’inférence non monotone suivantes :UNI : G |∼ UNI ϕ si <strong>et</strong> seulement si ∀s ∈ PNE, s |= ϕ.EXI : G |∼ EXI ϕ si <strong>et</strong> seulement si ∃s ∈ PNE, s |= ϕ.ARG : G |∼ ARG ϕ si <strong>et</strong> seulement si ∃s ∈ PNE, s |= ϕ <strong>et</strong> ∀s ∈ PNE, s ̸|= ¬ϕ.Exemple 2. Soit G = (N,V,π,Γ,Φ) un jeu booléen tel que :∗ V = {a,b,c}, N = {1,2,3},∗ π 1 = {a}, π 2 = {b}, π 3 = {c},∗ pour tout i, γ i = ⊤,∗ ϕ 1 = ¬a ∨(a ∧ ¬c), ϕ 2 = a ↔ (b ↔ c) <strong>et</strong> ϕ 3 = (a ∧ ¬b ∧ ¬c) ∨(¬a ∧ b ∧ c).168 Elise Bonzon


Conclusionstratégie <strong>de</strong> 3 : c❍ ❍❍❍❍❍ 21b ba (0, 1, 0) (0, 0, 0)a (1, 0, 1) (1, 1, 0)stratégie <strong>de</strong> 3 : c❍ ❍❍❍❍❍ 21b ba (1, 0, 0) (1, 1, 1)a (1, 1, 0) (1, 0, 0)Ce jeu a <strong>de</strong>ux équilibres <strong>de</strong> Nash en stratégies pures : {abc,abc}.On a donc :∗ G|∼ UNI ¬b,∗ G|∼ EXI a, G|∼ EXI ¬a, G|∼ EXI ¬b, G|∼ EXI ¬c, G|∼ EXI c,∗ G|∼ ARG ¬b.Il serait intéressant d’étudier les propriétés <strong>de</strong> déduction [Kraus <strong>et</strong> al., 1990;Gär<strong>de</strong>nfors <strong>et</strong> Markinson, 1994] <strong>de</strong> ces relations d’inférences non monotones, afin <strong>de</strong> voir sielles perm<strong>et</strong>tent d’obtenir <strong>de</strong>s résultats intéressants. Par exemple, ces relations <strong>de</strong> conséquencesperm<strong>et</strong>tent-elles <strong>de</strong> sélectionner un “meilleur” équilibre <strong>de</strong> Nash s’il en existe plusieurs ? Ou une“meilleure” stratégie dominée ?ArgumentationUne autre piste <strong>de</strong> recherche consiste à utiliser les jeux booléens pour résoudre <strong>de</strong>s problèmes d’argumentation,<strong>et</strong> vice versa. La première idée serait <strong>de</strong> concevoir les arguments avancés par les individuscomme étant les “coups” d’un joueur dans un jeu stratégique. C<strong>et</strong>te idée a été introduite par [Dung,1995], <strong>et</strong> a été étudiée par [Rubinstein, 2000] <strong>et</strong> par [Sireyjol, 2004].C<strong>et</strong>te démarche se base sur l’aspect dynamique du jeu. Or, nous avons étudié jusqu‘à présent quasimentexclusivement <strong>de</strong>s jeux statiques. Dans notre cadre <strong>de</strong> travail, il pourrait donc être intéressant<strong>de</strong> raisonner <strong>de</strong> manière statique sur le graphe <strong>de</strong>s arguments d’un système d’argumentation avec<strong>de</strong>s outils <strong>de</strong> la théorie <strong>de</strong>s jeux, <strong>et</strong> notamment ceux spécifiques aux jeux booléens. Pour cela, il fautcommencer par traduire un système d’argumentation en un jeu booléen.Commençons par rappeler comment se compose un système d’argumentation [Simari <strong>et</strong> Loui, 1992;Cayrol, 1995; Dung, 1995]. Une <strong>de</strong>s définitions est la suivante 14 :Définition 2. Un système d’argumentation SA est défini par :∗ K : ensemble <strong>de</strong> connaissances∗ Ass : ensemble d’hypothèses (littéraux)∗ A : ensemble d’arguments, <strong>de</strong> la forme {a 1 ,...,a n }, avec ∀a i , a i = 〈Ξ,ϕ〉, où Ξ est le support<strong>de</strong> a i <strong>et</strong> ϕ sa conclusion, tel que :(1) Ξ ⊆ Ass,(2) K ∪ Ξ ̸|= ⊥,(3) K ∪ Ξ |= ϕ, <strong>et</strong>14 Il existe <strong>de</strong> nombreuses autres manières <strong>de</strong> définir un système d’argumentation.Jeux booléens 169


ConclusionΞ minimal pour l’inclusion parmi les ensembles vérifiant (1), (2) <strong>et</strong> (3)∗ R : A →A une relation d’attaque telle que :∗ soitR = un<strong>de</strong>rcut :〈Ξ 1 ,ϕ 1 〉un<strong>de</strong>rcut〈Ξ 2 ,ϕ 2 〉 si <strong>et</strong> seulement si ∃ϕ ∈ Ξ 2 <strong>et</strong> ϕ 1 ≡ ¬ϕ.∗ soitR = rebut :〈Ξ 1 ,ϕ 1 〉rebut〈Ξ 2 ,ϕ 2 〉 si <strong>et</strong> seulement si ϕ 1 ≡ ¬ϕ 2 (rebut est une relation symétrique).Une idée pour traduire un système d’argumentation en jeu booléen est <strong>de</strong> considérer chaque argumentcomme étant un joueur ayant <strong>de</strong>ux buts : le but principal est la conclusion <strong>de</strong> l’argument, <strong>et</strong> le butsecondaire est le support <strong>de</strong> l’argument. Il va donc falloir utiliser <strong>de</strong>s buts à priorité. Il faut égalementprendre en compte l’ensemble K <strong>de</strong>s connaissances du SA. Pour cela on introduit un ensemble <strong>de</strong>contraintes globales C dans un jeu booléen, telles que :∗ Un profil <strong>de</strong> stratégies s est cohérent si <strong>et</strong> seulement si s ∪C ̸|= ⊥,∗ Un profil <strong>de</strong> stratégies s ne peut être un équilibre <strong>de</strong> Nash fort ou faible en stratégies pures quesi s est cohérent,∗ Un profil <strong>de</strong> stratégies s satisfait une formule ϕ si <strong>et</strong> seulement si s ∪C |= ϕ,Un système d’argumentation SA se traduit alors en un jeu booléen G = (N,V ,π,Γ,C,Φ) <strong>de</strong> la manièresuivante :∗ N = {1,... ,n} avec n = |A| (un joueur dans un jeu booléen pour chaque argument dans unsystème d’argumentation) ;∗ C = K ;∗ V = {v|Var(v) ∈ Ass} (l’ensemble <strong>de</strong>s variables du jeu est l’ensemble <strong>de</strong>s variables contenuesdans l’ensemble <strong>de</strong>s hypothèses du SA (Ass contenant <strong>de</strong>s littéraux)) ;∗ pour tout i, π i = {v|Var(v) ∈ Ξ i } ;∗ pour tout i, γ i = ⊤ <strong>et</strong>∗ Σ i = 〈ϕ i ;Ξ i 〉S’il existe plusieurs arguments (a 1 ,...,a p ) tels qu’il existe une variable v ∈ Ξ 1 ∩ ... ∩ Ξ p , il fautréécrire le SA avant <strong>de</strong> le traduire afin d’éviter qu’une variable ne soit contrôlée par plusieurs joueurs.C<strong>et</strong>te réécriture peut être faite <strong>de</strong> la manière suivante :∗ pour chaque a i , v est renommée en v i ,∗ v est remplacée par v 1 ∧... ∧ v p dans tous les ϕ i dans lesquels v apparaît,∗ les contraintes suivantes sont ajoutées à K : (v 1 ∧... ∧ v p ) ∨(¬v 1 ∧... ∧ ¬v p ) <strong>et</strong> v ↔ (v 1 ∧... ∧v p ).C<strong>et</strong>te transformation perm<strong>et</strong> <strong>de</strong> conserver le fait que chaque variable est contrôlée par un <strong>et</strong> un seuljoueur.Exemple 3. Soit le système d’argumentation SA suivant :∗ K = {(¬ACK ∧ IMP) → PUB,PRIV → ACK},∗ Ass = {¬ACK,IMP,PRIV},∗ A = {a 1 ,a 2 }, avec a 1 = 〈{¬ACK,IMP},PUB〉 <strong>et</strong> a 2 = 〈{PRIV },ACK〉.Ce SA peut être traduit dans le jeu booléen G = (N,V ,π,Γ,C,Φ) suivant :170 Elise Bonzon


Conclusion∗ N = {1,2},∗ C = {(¬ACK ∧ IMP) → PUB,PRIV → ACK},∗ V = {ACK,IMP,PRIV},∗ π 1 = {ACK,IMP},∗ π 2 = {PRIV },∗ pour tout i, γ i = ⊤,∗ Σ 1 = 〈PUB;¬ACK ∧ IMP〉, <strong>et</strong>∗ Σ 2 = 〈ACK;PRIV 〉Il serait intéressant <strong>de</strong> voir par exemple si c<strong>et</strong>te traduction perm<strong>et</strong> <strong>de</strong> r<strong>et</strong>rouver les attaques d’unsystème d’argumentation à partir d’un jeu booléen, ou encore <strong>de</strong> r<strong>et</strong>rouver les extensions d’arguments(cf. [Dung, 1995]) à partir d’un jeu booléen, <strong>et</strong> <strong>de</strong> faire <strong>de</strong>s raisonnements sur la traduction inverse(d’un jeu booléen à un système d’argumentation).Jeux booléens 171


BibliographieJoseph ABDOU <strong>et</strong> Hans KEIDING : Effectivity functions in social choice. Kluwer, 1991.David ABRAHAM, Avrim BLUM <strong>et</strong> Tuomas SANDHOLM : Clearing Algorithms for Barter ExchangeMark<strong>et</strong>s : Enabling Nationwi<strong>de</strong> Kidney Exchange. Dans Proceedings of Conference on ElectronicCommerce (EC’07), 2007.Thomas AGOTNES, Wiebe van <strong>de</strong>r HOEK <strong>et</strong> Michael WOOLDRIDGE : On the Logic of CoalitionalGames. Dans Proceedings of the Fifth International Joint Conference on Autonomous Agents andMulti-Agent Systems (AAMAS’06), pages 153–160. ACM Press, 2006.Krzysztof R. APT, Fancesca ROSSI <strong>et</strong> Kristen Brent VENABLE : CP-n<strong>et</strong>s and Nash equilibria. DansProceedings of Third International Conference on Computational Intelligence, Robotics and AutonomousSystems (CIRAS’05), Singapore, December 13-16 2005. Elsevier.Robert J. AUMANN : Acceptable Points in General n-person Games. Dans A.W. TUCKER <strong>et</strong> R.D.LUCE, éditeurs : Contributions to the Theory of Games IV. Princ<strong>et</strong>on University Press, 1959.Robert J. AUMANN : A Survey of Cooperative games without Si<strong>de</strong> payments. Dans M. SHUBIK,éditeur : Essays in Mathematical Economics in Honour of Oskar Morgenstern. Princ<strong>et</strong>on UniversityPress, 1967.Salem BENFERHAT, Clau<strong>de</strong>tte CAYROL, Didier DUBOIS, Jérôme LANG <strong>et</strong> Henri PRADE : Inconsistencymanagement and prioritized syntax-based entailment. Dans BAJCSY, éditeur : Proceedingsof the 13th International Joint Conference on Artificial Intelligence (IJCAI’93), pages 640–645,Chambéry, France, 1993.Salem BENFERHAT, Didier DUBOIS, Souhila KACI <strong>et</strong> Henri PRADE : Possibilistic representationof preference : Relating prioritized goals and satisfaction levels expressions. Dans Proceedingsof the 8th International Conference on Knowledge Representation and Reasoning (KR’02), pages158–169, 2002.Salem BENFERHAT, Didier DUBOIS <strong>et</strong> Henri PRADE : Towards a possibilistic logic handling ofpreferences. Applied Intelligence, 14:303–317, 2001.Philippe BESNARD, Jérôme LANG <strong>et</strong> Pierre MARQUIS : Variable Forg<strong>et</strong>ting in Preference Relationsover Propositional Domains. Dans Proceedings of the 17th European Conference on ArtificialIntelligence (ECAI’06), pages 763–764. Springer-Verlag, 2006.173


BibliographieNavin BHAT <strong>et</strong> Kevin LEYTON-BROWN : Computing Nash equilibria of Action-Graph Games. DansConference on Uncertainty in Artificial Intelligence (UAI’04), pages 35–42, 2004.Guido BOELLA, Luigi SAURO <strong>et</strong> Leen<strong>de</strong>rt van <strong>de</strong>r TORRE : Admissible agreements among goaldirectedagents. Dans Proceedings of the International Conference on Intelligent Agent Technology(IAT’05), pages 543–554. IEEE, 2005a.Guido BOELLA, Luigi SAURO <strong>et</strong> Leen<strong>de</strong>rt van <strong>de</strong>r TORRE : Reducing Coalition Structure via AgreementSpecification. Dans Proceedings of the Fourth International Conference on AutonomousAgents and Multiagent Systems (AAMAS’05), 2005b. Poster.Guido BOELLA, Luigi SAURO <strong>et</strong> Leen<strong>de</strong>rt van <strong>de</strong>r TORRE : Strengthening Admissible Coalitions.Dans 17th European Conference on Artificial Intelligence (ECAI’06), 2006.Elise BONZON, Marie Christine LAGASQUIE-SCHIEX <strong>et</strong> Jérôme LANG : Jeux booléens statiques<strong>et</strong> représentation compacte <strong>de</strong> préférences : rapport préliminaire. Dans Andreas HERZIG, YvesLESPÉRANCE <strong>et</strong> Ab<strong>de</strong>l-Illah MOUADDIB, éditeurs : Modèles Formels <strong>de</strong> l’Interaction (MFI’05),pages 55–64. Editions Cépaduès, 25-27 mai 2005.Elise BONZON, Marie-Christine LAGASQUIE-SCHIEX <strong>et</strong> Jérôme LANG : Compact preference representationfor Boolean games. Dans Proceedings of the 9th Pacific Rim International Conferenceon Artificial Intelligence (PRICAI’06), volume 4099, pages 41–50. Springer-Verlag, 2006a.Elise BONZON, Marie-Christine LAGASQUIE-SCHIEX <strong>et</strong> Jérôme LANG : Depen<strong>de</strong>ncies b<strong>et</strong>weenplayers in Boolean games. Dans Proceedings of European Conferences on Symbolic and QuantitativeApproaches to Reasoning with Uncertainty (ECSQARU’07), pages 743–754. Springer, 2007a.Elise BONZON, Marie-Christine LAGASQUIE-SCHIEX <strong>et</strong> Jérôme LANG : Efficient coalitions in Booleangames. Research report IRIT/RR–2007-, IRIT, 2007b.Elise BONZON, Marie-Christine LAGASQUIE-SCHIEX <strong>et</strong> Jérôme LANG : Efficient coalitions in Booleangames. Dans Krzysztof APT <strong>et</strong> Robert van ROOIJ, éditeurs : Texts in Logic and Games,volume 5, chapitre New Perspectives on Games and Interaction, pages 283–297. Amsterdam UniversityPress, 2008.Elise BONZON, Marie-Christine LAGASQUIE-SCHIEX, Jérôme LANG <strong>et</strong> Bruno ZANUTTINI : Booleangames revisited. Dans Proceedings of the 17th European Conference on Artificial Intelligence(ECAI’06), pages 265–269. Springer-Verlag, 2006b.Craig BOUTILIER : Toward a logic for qualitative <strong>de</strong>cision theory. Dans Proceedings of InternationalConference on Principles of Knowledge Representation and Reasoning (KR’94), pages 75–86,1994.Craig BOUTILIER, Ronen I. BRAFMAN, Carmel DOMSHLAK, Holger H. HOOS <strong>et</strong> David POOLE :CP-n<strong>et</strong>s : A Tool for Representing and Reasoning with Conditional C<strong>et</strong>eris Paribus PreferenceStatements. Journal of Artificial Intelligence Research, 21:135–191, 2004a.Craig BOUTILIER, Ronen I. BRAFMAN, Carmel DOMSHLAK, Holger H. HOOS <strong>et</strong> David POOLE :Preference-Based Constrained Optimization with CP-n<strong>et</strong>s. Computational Intelligence, 20(2):137–157, 2004b.174 Elise Bonzon


BibliographieCraig BOUTILIER, Ronen I. BRAFMAN, Holger H. HOOS <strong>et</strong> David POOLE : Reasoning with ConditionalC<strong>et</strong>eris Paribus Preference Statements. Dans Proceedings of Uncertainty in Artificial Intelligence(UAI’99), pages 71–80, 1999.Felix BRANDT, Felix FISCHER <strong>et</strong> Markus HOLZER : Symm<strong>et</strong>ries and the Complexity of Pure NashEquilibrium. Dans Proceedings of the 24th International Symposium on Theor<strong>et</strong>ical Aspects ofComputer Science (STACS’07), volume 4393, pages 212–223. Springer-Verlag, 2007.Gerhard BREWKA : Nonmonotonic logics - a brief overview. Artificial Intelligence Communications,2(2):88–97, 1989a.Gerhard BREWKA : Preferred subtheories : An exten<strong>de</strong>d logical framework for <strong>de</strong>fault reasoning.Dans SRIDHARAN, éditeur : Proceedings of the 11th International Joint Conference on ArtificialIntelligence (IJCAI’89), pages 1043–1048, D<strong>et</strong>roit, 1989b.Gerhard BREWKA : Logic Programming with Or<strong>de</strong>red Disjunction. Dans Proceedings of the EighteenthNational Conference on Artificial Intelligence (AAAI’02), 2002.Gerhard BREWKA, Salem BENFERHAT <strong>et</strong> Daniel LE BERRE : Qualitative Choice Logic. DansProceedings of the 8th International Conference on Knowledge Representation and Reasoning(KR’02), pages 158–169, <strong>Toulouse</strong>, France, 2002.Clau<strong>de</strong>tte CAYROL : On the Relation b<strong>et</strong>ween Argumentation and Non-monotonic Coherence-BasedEntailment. Dans Chris S. MELLISH, éditeur : Proc. of the 14 th IJCAI, pages 1443–1448, Montréal,Canada, 1995. Morgan Kaufmann.Clau<strong>de</strong>tte CAYROL, Véronique ROYER <strong>et</strong> Claire SAUREL : Management of preferences inassumption-based reasoning. Dans Proceedings of the International Conference on InformationProcessing and Management of Uncertainty in Knowledge-Based Systems (IPMU’92), pages 13–22, Berlin, janvier 1993. Springer Verlag.Yann CHEVALEYRE, Ulle ENDRISS <strong>et</strong> Jérôme LANG : Expressive Power of Weighted PropositionalFormulas for Cardinal Preference Mo<strong>de</strong>lling. Dans P. DOHERTY, J. MYLOPOULOS <strong>et</strong> C. WELTY,éditeurs : Proceedings of the 10th International Conference on Principles of Knowledge Representationand Reasoning (KR’06), pages 145–152. AAAI Press, June 2006.Vincent CONITZER <strong>et</strong> Tuomas SANDHOLM : Complexity Results about Nash Equilibrium. DansInternational Joint Conferences on Artificial Intelligence (IJCAI’03), pages 765–771, 2003.Sylvie COSTE-MARQUIS, Jérôme LANG, Paolo LIBERATORE <strong>et</strong> Pierre MARQUIS : Expressive powerand succinctness of propositional languages for preference representation. Dans Proceedingsof the 9th International Conference on Principles of Knowledge Representation and Reasoning(KR’04), pages 203–212, 2004.Antoine COURNOT : Recherches sur les Principes Mathematiques <strong>de</strong> la Theorie <strong>de</strong>s Richesses. 1838.Marina DE VOS <strong>et</strong> Dirk VERMEIR : Choice Logic Programs and Nash Equilibria in Strategic Games.Dans Jorg FLUM <strong>et</strong> Mario RODRIGUEZ-ARTALEJO, éditeurs : Computer Science Logic (CSL’99),volume 1683, pages 266–276, 1999.Jeux booléens 175


BibliographieXiaotie DENG, Christos PAPADIMITRIOU <strong>et</strong> Muli SAFRA : Complexity results about Nash equilibria.Dans Proceedings of the ACM Symposium on Theory of Computing (STOC’02), pages 67–71, 2002.Carmel DOMSHLAK : Mo<strong>de</strong>ling And Reasoning About Preferences With CP-n<strong>et</strong>s. Thèse <strong>de</strong> doctorat,Ben-Gurion University of the Negev, Negev, Israel, 2002.Jon DOYLE, Yoav SHOHAM <strong>et</strong> Michael P. WELLMAN : A Logic of Relative Desire (PreliminaryReport). Dans 6th International Symposium for M<strong>et</strong>hodologies for Intelligent Systems (ISMIS’91),pages 16–31, 1991.Jon DOYLE <strong>et</strong> Michael P. WELLMAN : Preferential Semantics for Goals. Dans Proceedings of theNational Conference on Artificial Intelligence (AAAI’91), pages 698–703, 1991.Didier DUBOIS, Jérôme LANG <strong>et</strong> Henri PRADE : Inconsistency in possibilistic knowledge bases : Tolive with it or not live with it. Dans L.A. ZADEH <strong>et</strong> J. KACPRZYK, éditeurs : Fuzzy Logic for theManagement of Uncertainty, pages 335–351. Wiley, New York, 1992.Phan Minh DUNG : On the acceptability of arguments and its fundamental role in nonmonotonicreasoning, logic programming and n-persons games. Artificial Intelligence, 77:321–357, 1995.<strong>Paul</strong> E. DUNNE <strong>et</strong> Wiebe van <strong>de</strong>r HOEK : Representation and Complexity in Boolean Games. DansProceedings of the 9th European Conference on Logics in Artificial Intelligence (JELIA’04), volumeLNCS 3229, pages 347–359. José Júlio Alferes <strong>et</strong> João Alexandre Leite (eds), 2004.<strong>Paul</strong> E. DUNNE, Wiebe van <strong>de</strong>r HOEK <strong>et</strong> Michael WOOLDRIDGE : A Logical Characterisation ofQualitative Coalitional Games. Journal of Applied Non-Classical logics, 17(4):477–509, 2007.<strong>Paul</strong> E. DUNNE <strong>et</strong> Michael WOOLDRIDGE : Preferences in Qualitative Coalitional Games. DansProceedings of the 6th Workshop on Game Theor<strong>et</strong>ic and Decision Theor<strong>et</strong>ic Agents (GTDT’04),pages 29–38. New York, July 2004.Florence Dupin <strong>de</strong> SAINT CYR, Jérôme LANG <strong>et</strong> Thomas SCHIEX : Penalty logic and its link withDempster-Shafer theory. Dans Uncertainty in Artificial Intelligence (UAI’95), pages 204–211,1992.Francis Ysidro EDGEWORTH : La Teoria pura <strong>de</strong>l monopolio. Giornale <strong>de</strong>gli Economisti, pages13–31, 1897.Edith ELKIND, Leslie Ann GOLDBERG <strong>et</strong> <strong>Paul</strong> W. GOLDBERG : Nash Equilibria in Graphical Gameson Trees Revisited. Dans Proceedings of Conference on Electronic Commerce (EC’06), 2006.Alex FABRIKANT, Christos PAPADIMITRIOU <strong>et</strong> Kunal TALWAR : The Complexity of Pure NashEquilibria. Dans Proceedings of the 36th ACM Symposium on Theory of Computing (STOC’04),pages 604–612, 2004.Timothy W. FININ, Richard FRITZSON, Don MCKAY <strong>et</strong> Robin MCENTIRE : KQML As An AgentCommunication Language. Dans Proceedings of the Third International Conference on Informationand Knowledge Management(CIKM’94), pages 456–463, 1994.176 Elise Bonzon


BibliographieNorman FOO, Thomas MEYER <strong>et</strong> Gerhard BREWKA : LPOD Answer S<strong>et</strong>s and Nash Equilibria. DansM. MAHER, éditeur : Proceedings of the 9th Asian Computer Science Conference (ASIAN’04),pages 343–351. Chiang Mai, Thailand, Springer LNCS 3321, 2004.P<strong>et</strong>er GÄRDENFORS <strong>et</strong> David MARKINSON : Nonmonotonic inference based on expectations. ArtificialIntelligence, 65:197–245, 1994.Michael R. GAREY <strong>et</strong> David S. JOHNSON : Computers and Intractability : A Gui<strong>de</strong> to the Theory ofNP-compl<strong>et</strong>eness. W.H. Freeman and Company, New York, 1979.Hector GEFFNER : Default reasoning : causal and conditional theories. MIT Press, 1992.Michael GELFOND <strong>et</strong> Vladimir LIFSCHITZ : Classical negation in logic programs and disjunctivedatabases. New Generation Computing, 9:365–385, 1991.Michael GELFOND <strong>et</strong> Vladimir LIFSCHITZ : Representing Actions and Change by Logic Programs.Journal of Logic Programming, 17(2, 3, 4):301–323, 1993.Itzhak GILBOA <strong>et</strong> Eitan ZEMEL : Nash and correlated equilibria : Some complexity consi<strong>de</strong>rations.Games and Economic Behavior, 1:80–93, 1989.Enrico GIUNCHIGLIA <strong>et</strong> Vladimir LIFSCHITZ : An Action Language Based on Causal Explanation: Preliminary Report. Dans Proceedings of the National Conference on Artificial Intelligence(AAAI’98), pages 623–630, 1998.Georg GOTTLOB, Gianluigi GRECO <strong>et</strong> Francesco SCARCELLO : Pure Nash Equilibria : Hard andEasy Games. Journal of Artificial Intelligence Research, 24:357–406, 2005.P<strong>et</strong>er HADDAWY <strong>et</strong> Steve HANKS : Representations for Decision-Theor<strong>et</strong>ic Planning : Utility Functionsfor Deadline Goals. Dans J.A. ALLEN, R. FIKES <strong>et</strong> E. SANDEWALL, éditeurs : InternationalConference on Knowledge Representation and Reasoning,(KR’92), pages 71–82. Cambridge, MorganKaufmann, 1992.Sven Ove HANSSON : A New Semantical Approach to the Logic of Preference. Erkenntnis, 31:1–42,1989.Sven Ove HANSSON : An overview of <strong>de</strong>cision theory. Rapport technique 41, SKN, 1991.Sven Ove HANSSON : The Structure of Values and Norms. Cambridge University Press, 2001.<strong>Paul</strong> HARRENSTEIN : Logic in Conflict. Thèse <strong>de</strong> doctorat, Utrecht University, 2004a.<strong>Paul</strong> HARRENSTEIN : Logical Consequence and the Theory of Games. Philosophia Scientiae, 8(2):179–193, 2004b. Special issue on logic and games.<strong>Paul</strong> HARRENSTEIN, Wiebe van <strong>de</strong>r HOEK, John-Jules MEYER <strong>et</strong> Cees WITTEVEEN : BooleanGames. Dans J. van BENTHEM, éditeur : Proceedings of the 8th International Conference onTheor<strong>et</strong>ical Aspects of Rationality and Knowledge (TARK’01), volume Theor<strong>et</strong>ical Aspects of Rationalityand Knowledge, pages 287–298. San Francisco, Morgan Kaufmann, 2001.John HILLAS <strong>et</strong> Elon KOHLBERG : Foundations of strategic equilibrium. Dans R. AUMANN <strong>et</strong>S. HART, éditeurs : Handbook of Game Theory, volume 3, pages 1598–1663. North-Holland, 2002.Jeux booléens 177


BibliographieAlbert Xin JIANG <strong>et</strong> Kevin LEYTON-BROWN : A polynomial-time algorithm for Action-GraphGames. Dans American Association for Artificial Intelligence (AAAI’06), pages 679–684, 2006.Albert Xin JIANG <strong>et</strong> Kevin LEYTON-BROWN : Computing Pure Nash Equilibria in Symm<strong>et</strong>ricAction-Graph Games. Dans Association for the Advancement of Artificial Intelligence (AAAI),2007. To Appear.Hirofumi KATSUNO <strong>et</strong> Alberto O. MENDELZON : On the Difference b<strong>et</strong>ween Updating a KnowledgeBase and Revising It. Dans International Conference on Knowledge Representation andReasoning,(KR’92), pages 387–394, 1991.Hirofumi KATSUNO <strong>et</strong> Alberto O. MENDELZON : Propositional Knowledge Base Revision and MinimalChange. Artificial Intelligence, 52:263–294, 1992.Michael KEARNS, Michael L. LITTMAN <strong>et</strong> Satin<strong>de</strong>r SINGH : Graphical Mo<strong>de</strong>ls for Game Theory.Dans Proceedings of Uncertainty in Artificial Intelligence (UAI’01), pages 253–260, 2001.Michael J. KEARNS <strong>et</strong> Yishay MANSOUR : Efficient Nash Computation in Large Population Gameswith Boun<strong>de</strong>d Influence. Dans Proceedings of the 18th Conference in Uncertainty in ArtificialIntelligence (UAI’02), pages 259–266, 2002.Daphne KOLLER, Nimrod MEGGIDO <strong>et</strong> Bernhard von STENGE : Efficient computation of equilibriafor extensive two-person games. Games and Economic Behavior, 14:73–92, 1996.Daphne KOLLER <strong>et</strong> Brian MILCH : Multi-Agent Influence Diagrams for Representing and SolvingGames. Games and Economic Behavior, 45(1):181–221, 2003. Full version of paper in IJCAI ’01.Sarit KRAUS, Daniel J. LEHMANN <strong>et</strong> Menachem MAGIDOR : Nonmonotonic Reasoning, PreferentialMo<strong>de</strong>ls and Cumulative Logics. Artificial Intelligence, 44:167–207, 1990.Pierfrancesco LA MURA : Game N<strong>et</strong>works. Dans Proceedings of Uncertainty in Artificial Intelligence(UAI’00), pages 335–342, 2000.Yannis LABROU <strong>et</strong> Timothy W. FININ : Semantics and Conversations for an Agent CommunicationLanguage. Dans International Joint Conferences on Artificial Intelligence (IJCAI’97), pages 584–591, 1997.Céline LAFAGE <strong>et</strong> Jérôme LANG : Logical representation of preference for group <strong>de</strong>cision making.Dans Proceedings of the Seventh International Conference on Principles of Knowledge Representationand Reasoning (KR’00), pages 457–468, 2000.Céline LAFAGE <strong>et</strong> Jérôme LANG : Propositional distances and preference representation. DansProceedings of European Conferences on Symbolic and Quantitative Approaches to Reasoningwith Uncertainty (ECSQARU’01), pages 48–59, 2001.Jérôme LANG : Conditional <strong>de</strong>sires and utilities – An alternative logical framework for qualitative<strong>de</strong>cision theory. Dans European Conference on Artificial Intelligence (ECAI’96), pages 318–322,1996.Jérôme LANG : Logical preference representation and combinatorial vote. Dans Annals of Mathematicsand Artificial Intelligence, volume 42, pages 37–71. Kluwer, 2004.178 Elise Bonzon


BibliographieJérôme LANG : Représentation logique <strong>de</strong> préférences. Dans Denis BOUYSSOU, Didier DUBOIS,Marc PIRLOT <strong>et</strong> Henri PRADE, éditeurs : Concepts <strong>et</strong> métho<strong>de</strong>s pour l’ai<strong>de</strong> à la décision, volume 1.Lavoisier, 2006.Jérôme LANG, Paolo LIBERATORE <strong>et</strong> Pierre MARQUIS : Conditional in<strong>de</strong>pen<strong>de</strong>nce in propositionallogic. Artificial Intelligence, 141 (1-2):79–121, 2002a.Jérôme LANG, Paolo LIBERATORE <strong>et</strong> Pierre MARQUIS : Propositional In<strong>de</strong>pen<strong>de</strong>nce - Formula-Variable In<strong>de</strong>pen<strong>de</strong>nce and Forg<strong>et</strong>ting. Journal of Artificial Intelligence Research, 18:391–443,2003.Jérôme LANG <strong>et</strong> Pierre MARQUIS : Complexity Results for In<strong>de</strong>pen<strong>de</strong>nce and Definability inPropositional Logic. Dans International Conference on Knowledge Representation and Reasoning,(KR’98),pages 356–367, 1998a.Jérôme LANG <strong>et</strong> Pierre MARQUIS : Two forms of <strong>de</strong>pen<strong>de</strong>nce in propositional logic : controllabilityand <strong>de</strong>finability. Dans Proceedings of the National Conference on Artificial Intelligence (AAAI’98),pages 268–273, 1998b.Jérôme LANG, Leen<strong>de</strong>rt van <strong>de</strong>r TORRE <strong>et</strong> Emil WEYDERT : Utilitarian <strong>de</strong>sires. InternationalJournal of Autonomous Agents and Multi-Agent Systems, 5:329–363, 2002b.Daniel J. LEHMANN : Another Perspective on Default Reasoning. Annals of Mathematics and ArtificialIntelligence, 15:61–82, 1995.David LEWIS : Counterfactuals. Basil Blackwell, 1973.Kevin LEYTON-BROWN <strong>et</strong> Moshe TENNENHOLTZ : Local-Effect Games. Dans International JointConferences on Artificial Intelligence (IJCAI’03), pages 772–777, 2003.Fangzhen LIN <strong>et</strong> Raymond REITER : Forg<strong>et</strong> it. Dans Proceedings of the National Conference onArtificial Intelligence (AAAI’94), pages 154–159, 1994.R. Duncan LUCE <strong>et</strong> Howard RAIFFA : Games and Decisions : Introduction and Critical Survey.Wiley & Sons, 1957.Pierre MARQUIS : Consequence Finding Algorithms, in Handbook on Defeasible Reasoning andUncertainty Management Systems, volume 5 : Algorithms for Defeasible and Uncertain Reasoning,S. Moral and J. Kohlas, chapitre 2, pages 41–145. Kluwer Aca<strong>de</strong>mic Publisher, 2000.Richard D. MCKELVEY <strong>et</strong> Andrew MCLENNAN : Computation of equilibria in finite games, volume1, chapitre Handbook of Computational Economics. Elsevier, 1996.Nimrod MEGGIDO <strong>et</strong> Christos PAPADIMITRIOU : On total functions, existence theorems, and computationelcomplexity. Theor<strong>et</strong>ical Computer Science, 81(2):317–324, 1991.Dov MONDERER <strong>et</strong> Lloyd S. SHAPLEY : Potential games. Games and Economic Behaviour, 14:124–143, 1996.Hervé MOULIN : The strategy of social choice. North-Holland, 1983.Jeux booléens 179


BibliographieRoger B. MYERSON : Game Theory : Analysis of Conflict. Harvard University Press, 1991.John NASH : Equilibrium points in n-person games. Procedings of the National Aca<strong>de</strong>my of Sciences,36:48–49, 1950.Martin J. OSBORNE <strong>et</strong> Aryel RUBINSTEIN : A course in game theory. MIT Press, 1994.Guillermo OWEN : Game Theory. Aca<strong>de</strong>mic Press, 1982.Christos PAPADIMITRIOU : Computational Complexity. Addison-Wesley, 1994a.Christos PAPADIMITRIOU : On the complexity of the parity argument and other inefficient proofs ofexistence. Journal of Computer and System Sciences, 48(3):498–532, 1994b.Christos PAPADIMITRIOU : Algorithms, games, and the intern<strong>et</strong>. Dans Proceedings of the ACMSymposium on Theory of Computing (STOC’04), pages 749–753, 2001.Marc PAULY : Logic for Social Software. Thèse <strong>de</strong> doctorat, Institute for Logic, Language andComputation, Universiteit van Amserdam, Amsterdam, 2001.Gadi PINKAS : Propositional nonmonotonic reasoning and inconsistency in symm<strong>et</strong>ric neutral n<strong>et</strong>works.Dans Proceedings of the International Joint Conference on Artificial Intelligence (IJ-CAI’91), pages 252–530, 1991.Steve PRESTWICH, Francesca ROSSI, Kristen Brent VENABLE <strong>et</strong> Toby WALSH : Constrained CPn<strong>et</strong>s.Dans Italian Conference on Computational Logic, 2004.Anand S. RAO <strong>et</strong> Michael P. GEORGEFF : Mo<strong>de</strong>ling rational agents within a BDI-architecture. DansJames ALLEN, Richard FIKES <strong>et</strong> Erik SANDEWALL, éditeurs : Proceedings of the 2nd InternationalConference on Principles of Knowledge Representation and Reasoning (KR’91), pages 473–484.Morgan Kaufmann publishers, 1991.Robert W. ROSENTHAL : A class of games possessing pure-strategy Nash equilibria. InternationalJournal of Game Theory, 2:65–67, 1973.Tim ROUGHGARDEN <strong>et</strong> Eva TARDOS : Bounding the Inefficiency of Equilibria in NonatomicCongestion Games. Rapport technique TR2002-1866, Cornell, 2001.Aryel RUBINSTEIN : Economics and Language. Cambridge University Press, 2000.Luigi SAURO : Formalizing Admissibility Criteria in Coalition Formation among Goal DirectedAgents. Thèse <strong>de</strong> doctorat, Universita’ Degli Studi di Torino Dipartimento di Informatica, 2006.John SEARLE : Speech Acts. Cambridge University Press, 1969.Reinhard SELTEN : Spieltheor<strong>et</strong>ische Behandlung eines Oligopolmo<strong>de</strong>lls mit Nachfrag<strong>et</strong>ragheit. Zeitschriftfur die gesamte Staatswissenschaft, 121:301–324, 667–689, 1965.Jaime Simão SICHMAN <strong>et</strong> Rosaria CONTE : Multi-Agent Depen<strong>de</strong>nce by Depen<strong>de</strong>nce Graphs. DansProceedings of the International Joint Conference on Autonomous Agents and Multi-Agent Systems(AAMAS’02), pages 483 – 490, 2002.180 Elise Bonzon


BibliographieGuillermo R. SIMARI <strong>et</strong> Ronald P. LOUI : A mathematical treatment of <strong>de</strong>feasible reasoning and itsimplementation. Artificial Intelligence, 53:125–157, 1992.Denis SIREYJOL : Parallèles entre théorie <strong>de</strong> l’argumentation <strong>et</strong> théorie <strong>de</strong>s jeux. Mémoire <strong>de</strong> D.E.A.,DEA RCFR, Université <strong>Toulouse</strong> <strong>III</strong>, 2004.Larry STOCKMEYER : The polynomial-time hierarchy. Theor<strong>et</strong>ical Computer Science, 3:1–22, 1977.Wiebe van <strong>de</strong>r HOEK <strong>et</strong> Michael WOOLDRIDGE : On the Logic of Cooperation and PropositionalControl. Artificial Intelligence, 164(1-2):81–119, 2005.David VICKREY <strong>et</strong> Daphne KOLLER : Multi-Agent Algorithms for Solving Graphical Games. DansProceedings of the Eighteenth National Conference on Artificial Intelligence (AAAI’02), pages345–351, 2002.John von NEWMANN <strong>et</strong> Oskar MORGENSTERN : Theory of Games and Economic Behaviour. Princ<strong>et</strong>onUniversity Press, 1944.Georg Henrik von WRIGHT : The logic of preference. Edinburgh University Press, 1963.Michael WOOLDRIDGE <strong>et</strong> <strong>Paul</strong> E. DUNNE : On the computational complexity of qualitative coalitionalgames. Artificial Intelligence, 158/1:27–73, 2004.Bruno ZANUTTINI : New polynomial classes for logic-based abduction. Journal of Artificial IntelligenceResearch, 19:1–10, 2003.Jeux booléens 181


In<strong>de</strong>xAtomicité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139Base <strong>de</strong> buts à priorité . . . . . . . . . . . . . . . . . . 100Best Out . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103BP-jeu booléen . . . . . . . . . . . . . . . . . . . . . . . . 105C<strong>et</strong>eris Paribus. . . . . . . . . . . . . . . . . . . . . . . . . .75Clause . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7Coalition . . . . . . . . . . . . . . . . . . . . . . . 12, 35, 137Coalition efficace . . . . . . . . . . . . . . . . . . . . . . 143Coalition efficace minimale . . . . . . . . . . . . . 143Coalition gagnante . . . . . . . . . . . . . . . . . . . . . . 14Coalition perdante. . . . . . . . . . . . . . . . . . . . . . .14Coalition-monotone . . . . . . . . . . . . . . . . . . . . 138CP-jeu booléen . . . . . . . . . . . . . . . . . . . . . . . . . 79CP-n<strong>et</strong> . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76CP-n<strong>et</strong> global . . . . . . . . . . . . . . . . . . . . . . . . . . . 91Cube . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7Discrimin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101Duopole <strong>de</strong> Stackelberg. . . . . . . . . . . . . . . . . .60Décomposabilité . . . . . . . . . . . . . . . . . . . . . . . 139Ensemble stable. . . . . . . . . . . . . . . . . . . . . . . . .39Equilibre <strong>de</strong> Nash en stratégies mixtes . . . . 20Equilibre <strong>de</strong> Nash en stratégies pures . . 19, 41Equilibre <strong>de</strong> Nash faible . . . . . . . . . . . . . . . . . 72Equilibre <strong>de</strong> Nash fort . . . . . . . . . . . . . . . . . . . 72Equilibre parfait <strong>de</strong> Selten . . . . . . . . . . . . . . . 27Fonction caractéristique . . . . . . . . . . . . . . . . . 13Fonction d’α-effectivité . . . . . . . . . . . . . . . . 138Fonction d’affectation <strong>de</strong> contrôle . . . . . . . . 34Fonction d’effectivité. . . . . . . . . . . . . . . . . . .137Fonction d’utilité . . . . . . . . . . . . . . . . . . . . 10, 36Forme extensive . . . . . . . . . . . . . . . . . . . . . . . . 16Forme normale . . . . . . . . . . . . . . . . . . . . . . . . . 17Forme normale graphique . . . . . . . . . . . . . . .128Fortement jouable . . . . . . . . . . . . . . . . . . . . . .139Forward sweep procedure . . . . . . . . . . . . . . . . 78Gran<strong>de</strong> coalition. . . . . . . . . . . . . . . . . . . .13, 137Graphe <strong>de</strong> dépendance . . . . . . . . . . . . . . . . . . .38Impliquant, impliquant premier . . . . . . . . . . . . 7Indépendance . . . . . . . . . . . . . . . . . . . . . . 37, 116Indépendance préférentielle . . . . . . . . . . . . . . 75Indépendance préférentielle conditionnelle 75Jeu à somme nulle. . . . . . . . . . . . . . . . . . . . . . .14Jeu booléen à n joueurs . . . . . . . . . . . . . . . . . . 34Jeu coopératif. . . . . . . . . . . . . . . . . . . . . . . . . . .12Jeu dynamique . . . . . . . . . . . . . . . . . . . . . . . . . .11Jeu en information imparfaite . . . . . . . . . . . . 12Jeu en information parfaite . . . . . . . . . . . . . . . 11Jeu non coopératif. . . . . . . . . . . . . . . . . . . . . . .14Jeu statique . . . . . . . . . . . . . . . . . . . . . . . . . . . . .10Joueurs utiles . . . . . . . . . . . . . . . . . . . . . . 37, 117L-impliquant, L-impliquant premier . . . . . . . . 8L-jeu booléen . . . . . . . . . . . . . . . . . . . . . . . . . . .71Langage <strong>de</strong> représentation <strong>de</strong> préférences . .70Leximin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .103Maximalité . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138Meneur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60Noyau, Noyau fort . . . . . . . . . . . . . . 25, 26, 150Oubli total, oubli partiel . . . . . . . . . . . . . . . 8, 43183


In<strong>de</strong>xProfil <strong>de</strong> stratégies . . . . . . . . . . . . . . . . . . . 10, 35Programme logique . . . . . . . . . . . . . . . . . . . . 121Projection d’un jeu . . . . . . . . . . . . . . . . . . . . . . 40Projection d’une formule . . . . . . . . . . . . . . 8, 43Pré-jeu booléen . . . . . . . . . . . . . . . . . . . . . . . . . 34Résultat optimal . . . . . . . . . . . . . . . . . . . . . . . . 78Relation <strong>de</strong> préférence . . . . . . . . . . . . . . . 69, 77Régularité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138Stratégie . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10, 35Stratégie faiblement dominée . . . . . . 22, 51, 72Stratégie gagnante. . . . . . . . . . . . . . . . . . . . . . .37Stratégie mixte. . . . . . . . . . . . . . . . . . . . . . . . . .20Stratégie partiellement dominée . . . . . . . . . . 73Stratégie strictement dominée . . . . . 22, 51, 72Suiveur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60Supperaditivité . . . . . . . . . . . . . . . . . . . . . . . . 138Table <strong>de</strong> préférence conditionnelle . . . . . . . . 76Terme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7Union <strong>de</strong>s graphes . . . . . . . . . . . . . . . . . . . . . . 88Utilité non transférable . . . . . . . . . . . . . . . . . . 13Utilité transférable . . . . . . . . . . . . . . . . . . . . . . 13Variables utiles . . . . . . . . . . . . . . . . . . . . . 37, 117184 Elise Bonzon


Liste <strong>de</strong>s symbolesΣ j : Ensembles <strong>de</strong>s buts <strong>de</strong> priorité j . . . . .100Γ : Ensemble <strong>de</strong>s contraintes . . . . . . . . . . . . 34Φ : Ensembles <strong>de</strong>s buts . . . . . . . . . . . . . . . . . 34Σ p 2: Classe <strong>de</strong>s langages reconnaissables entemps polynomial par une machine<strong>de</strong> Turing non-déterministe munied’oracles NP . . . . . . . . . . . . . . . . . . . 56Σ : Base <strong>de</strong> buts à priorité . . . . . . . . . . . . . . 100∃x:ϕ:Oubli partiel <strong>de</strong> x dans ϕ . . . . . . . 8, 43∀x:ϕ:Oubli compl<strong>et</strong> <strong>de</strong> x dans ϕ . . . . . . 8, 43γ i : Ensembles <strong>de</strong>s contraintes du joueur i 34,35π : Fonction d’affectation <strong>de</strong> contrôle . . . . . 34π i : Ensembles <strong>de</strong>s variables contrôlées par lejoueur i . . . . . . . . . . . . . . . . . . . . . . . . 34π −i : Ensemble <strong>de</strong>s variables contrôlées partous les joueurs sauf i . . . . . . . . . . . 36≻ : Relation <strong>de</strong> préférences stricte . . . . . . . . 69≻ bo : Relation <strong>de</strong> préférence respectant le critèrebest out . . . . . . . . . . . . . . . . . . . 103≻ disc : Relation <strong>de</strong> préférence respectant le critèrediscrimin . . . . . . . . . . . . . . . . . 101≻ lex : Relation <strong>de</strong> préférence respectant le critèreleximin . . . . . . . . . . . . . . . . . . . 103≻ N : Relation <strong>de</strong> préférence induite par le CPn<strong>et</strong>N. . . . . . . . . . . . . . . . . . . . . . . . . 77≽ : Relation <strong>de</strong> préférence . . . . . . . . . . . . . . . 69(ϕ) MX : Interprétation partielle <strong>de</strong> ϕ par M X .7ϕ i : But du joueur i . . . . . . . . . . . . . . . . . . . . . 342 V : Ensemble <strong>de</strong>s interprétations pour V . . . 7At(C) : Ensembles minimaux <strong>de</strong> Eff(C) . .139CNF : Conjonction <strong>de</strong> termes . . . . . . . . . . . . 58CPT : Table <strong>de</strong> préférence conditionnelle . 76D(X i ) : Domaine <strong>de</strong> la variable X i . . . . . . . . 75DNF : Disjonction <strong>de</strong> termes . . . . . . . . . . . . . . 7EC(G) : Ensemble <strong>de</strong>s coalitions efficaces dujeu G . . . . . . . . . . . . . . . . . . . . . . . . . 143Eff : Fonction d’effectivité . . . . . . . . . . . . . . 137FNoyau(G) : Noyau fort du jeu G . . . . . . . 150G B = (B,V B ,π B ,Γ B ,Φ B ) : Projection du jeu Gsur B . . . . . . . . . . . . . . . . . . . . . . . . . . 40L V : Langage propositionnel construit à partir<strong>de</strong> V . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7Lit(ϕ) : Ensemble <strong>de</strong>s littéraux formant la formuleϕ . . . . . . . . . . . . . . . . . . . . . . . . . . 7Mod X (ϕ) : Ensemble <strong>de</strong>s X-interpr<strong>et</strong>ations satisfaisantϕ.. . . . . . . . . . . . . . . . . . . . . .7N : Ensembles <strong>de</strong>s joueurs . . . . . . . . . . . 10, 34Noyau(G) : Noyau (faible) du jeu G . . . . . 150NE f aible : Equilibre <strong>de</strong> Nash faible . . . . . . . . 72NE f ort : Equilibre <strong>de</strong> Nash fort . . . . . . . . . . . 72P = 〈N,R〉 : Graphe <strong>de</strong> dépendance . . . . . . 38Pa(X) : Ensemble <strong>de</strong>s variables parents <strong>de</strong> lavariable X . . . . . . . . . . . . . . . . . . . . . .76PI(ψ) : Ensemble <strong>de</strong>s impliquants premiers <strong>de</strong>ψ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .7PI L ψ : Ensemble <strong>de</strong>s L-impliquants premiers<strong>de</strong> ψ . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8PNE : Équilibres <strong>de</strong> Nash en stratégies pures19, 41185


Liste <strong>de</strong>s symbolesR(i) : Ensemble <strong>de</strong>s joueurs nécessaires à ipour satisfaire son but . . . . . . . . . . . 38R ∗ (i) : Ensemble <strong>de</strong>s joueurs ayant une influencedirecte ou indirecte sur i . . 38RP i : Ensemble <strong>de</strong>s joueurs utiles pour lejoueur i . . . . . . . . . . . . . . . . . . . . . . . . 37RV i : Ensemble <strong>de</strong>s variables utiles pour lejoueur i . . . . . . . . . . . . . . . . . . . . . . . . 37S : Ensemble <strong>de</strong>s profils <strong>de</strong> stratégies. .10, 35S i : Ensemble <strong>de</strong>s stratégies du joueur i10, 35s : Profil <strong>de</strong> stratégies . . . . . . . . . . . . . . . . 10, 35s i : Stratégie du joueur i. . . . . . . . . . . . . .10, 35s −i : Profil <strong>de</strong> stratégies s privé <strong>de</strong> la stratégiedu joueur i . . . . . . . . . . . . . . . . . . 10, 36u i (s) : Utilité obtenue par le joueur i lorsque leprofil <strong>de</strong> stratégies s est joué . . 10, 36V : Ensemble <strong>de</strong> variables propositionnelles7,34Var(ϕ) : Ensemble <strong>de</strong>s variables présentesdans la formule ϕ . . . . . . . . . . . . . . . . 7186 Elise Bonzon

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!