CHAPITRE 3 L2_PX.pdf - EconomiX

economix.fr

CHAPITRE 3 L2_PX.pdf - EconomiX

CHAPITRE 3

DÉFAUTS DE COORDINATION

ET COMPORTEMENTS STRATÉGIQUES

(INTRODUCTION À LA THÉORIE DES JEUX)

Section 1 – la notion de jeu

Section 2 – jeux simultanés en information complète

Section 3 – jeux séquentiels en information complète


La th. de la CPP décrit un contexte avec

échanges anonymes (interactions via les prix)


La th. de la CPP décrit un contexte avec

échanges anonymes (interactions via les prix)

Mais nb situations vie des entreprises

vie des organisations

relations sociales

où le bien-être de chacun dépend de ce que

partenaires ou concurrents vont décider


La th. de la CPP décrit un contexte avec

échanges anonymes (interactions via les prix)

Mais nb situations vie des entreprises

vie des organisations

relations sociales

où le bien-être de chacun dépend de ce que

partenaires ou concurrents vont décider

Pb d’information sur leur comportement

→ Stratégies actives rationnelles

→ Pas simplement adaptation passive aux prix !


« interactions stratégiques »

Idée: chacun peut envisager de prendre

plusieurs décisions,

de façon non concertée


« interactions stratégiques »

Idée: chacun peut envisager de prendre

plusieurs décisions,

de façon non concertée

avec une certaine info. sur les autres


« interactions stratégiques »

Idée: chacun peut envisager de prendre

plusieurs décisions,

de façon non concertée

avec une certaine info. sur les autres

mais le résultat final (gain, utilité) pour

chacun va dépendre de la combinaison des

décisions finalement choisies


« interactions stratégiques »

Idée: chacun peut envisager de prendre

plusieurs décisions,

de façon non concertée

avec une certaine info. sur les autres

mais le résultat final (gain, utilité) pour

chacun va dépendre de la combinaison des

décisions finalement choisies

→ théorie des jeux


Chapitre 3 – section 1 – 1.1

Définition (simple) d’un jeu

→ représentation formelle d’une situation où les

décisions de plusieurs individus sont

interdépendantes


Chapitre 3 – section 1 – 1.1

Définition (simple) d’un jeu

→ représentation formelle d’une situation où les

décisions de plusieurs individus sont

interdépendantes

La description complète d’un jeu suppose de

préciser :

- les joueurs (qui participe ?)


Chapitre 3 – section 1 – 1.1

Définition (simple) d’un jeu

→ représentation formelle d’une situation où les

décisions de plusieurs individus sont

interdépendantes

La description complète d’un jeu suppose de

préciser :

- les joueurs (qui participe ?)

- les règles du jeu (ordre des joueurs ? Information

individuelle ? Actions possibles?)


- les issues/résultats possibles du jeu (que se

passe-t-il ? Quelles conséquences des

combinaisons d’actions individuelles)


- les issues/résultats possibles du jeu (que se

passe-t-il ? Quelles conséquences des

combinaisons d’actions individuelles)

- enfin, les gains individuels (quelles sont les

préférences des différents joueurs sur les issues

possibles du jeu ?)


- les issues/résultats possibles du jeu (que se

passe-t-il ? Quelles conséquences des

combinaisons d’actions individuelles)

- enfin, les gains individuels (quelles sont les

préférences des différents joueurs sur les issues

possibles du jeu ?)

La présentation d’un jeu spécifique peut ainsi se

faire de façon littéraire, ou mathématique


- les issues/résultats possibles du jeu (que se

passe-t-il ? Quelles conséquences des

combinaisons d’actions individuelles)

- enfin, les gains individuels (quelles sont les

préférences des différents joueurs sur les issues

possibles du jeu ?)

La présentation d’un jeu spécifique peut ainsi se

faire de façon littéraire, ou mathématique

Mais pour les commodités de l’analyse (gain de

temps), on utilise par convention des

représentations synthétiques/formelles


Tout jeu peut toujours se décrire sous :

- sa forme normale (tableau lignes/colonnes)


Tout jeu peut toujours se décrire sous :

- sa forme normale (tableau lignes/colonnes)

- sa forme extensive (arborescence, arbre du

jeu)


Tout jeu peut toujours se décrire sous :

- sa forme normale (tableau lignes/colonnes)

- sa forme extensive (arborescence, arbre du

jeu)

NB:

la forme normale est privilégiée pour les jeux

dits simultanés (≈ statiques)

la forme extensive est privilégiée pour les jeux

dits séquentiels (≈ dynamiques)


Tout jeu peut toujours se décrire sous :

- sa forme normale (tableau lignes/colonnes)

- sa forme extensive (arborescence, arbre du

jeu)

NB:

la forme normale est privilégiée pour les jeux

dits simultanés (≈ statiques)

la forme extensive est privilégiée pour les jeux

dits séquentiels (≈ dynamiques)

Attention, ce n’est pas exclusif !!


Ex de jeu sous forme normale

JOUEUR 2

G

D

JOUEUR 1

H

1

2

0

1

B

2

1

1

0


NB: les gains peuvent aussi être présentés ainsi:

JOUEUR 2

G

D

JOUEUR 1 H (1,2) (0,1)

B (2,1) (1,0)


Ex de jeu sous forme extensive

Joueur 1

G

D

Joueur 2 Joueur 2

G D G

D

U 1 = h

U 2 = g

d

c

f

e

b

a


Chapitre 3 – section 1 – 1.2

rôle de l’information dans les contextes

d’interactions stratégiques


Chapitre 3 – section 1 – 1.2

rôle de l’information dans les contextes

d’interactions stratégiques

→ statut informationnel des joueurs et

représentation d’un jeu


Chapitre 3 – section 1 – 1.2

rôle de l’information dans les contextes

d’interactions stratégiques

→ statut informationnel des joueurs et

représentation d’un jeu

Prosaïquement:

- dans un jeu simultané, typiquement, les

différents joueurs ne connaissent pas

(n’observent pas) les décisions prises par les

autres joueurs


Chapitre 3 – section 1 – 1.2

rôle de l’information dans les contextes

d’interactions stratégiques

→ statut informationnel des joueurs et

représentation d’un jeu

Prosaïquement:

- dans un jeu simultané, typiquement, les

différents joueurs ne connaissent pas

(n’observent pas) les décisions prises par les

autres joueurs

→ Jeu en information imparfaite


- dans un contexte séquentiel, on distingue :


un jeu à information parfaite : lorsque

chaque joueur est capable de différencier

chacun de ses nœuds de décision


- dans un contexte séquentiel, on distingue :


un jeu à information parfaite : lorsque

chaque joueur est capable de différencier

chacun de ses nœuds de décision

→ illustre qu’il observe ce que ses prédécesseurs

ont fait (actions réalisées)


- dans un contexte séquentiel, on distingue :


un jeu à information parfaite : lorsque

chaque joueur est capable de différencier

chacun de ses nœuds de décision

→ illustre qu’il observe ce que ses prédécesseurs

ont fait (actions réalisées)

un jeu à information imparfaite : lorsqu’au

moins un joueur est incapable de différencier

certains de ses nœuds de décision

→ il n’observe pas intégralement ce que ses

prédécesseurs ont pu faire


Jeu A : jeu séquentiel avec information parfaite

Joueur 1

G

D

Joueur 2 Joueur 2

G D G

D

U 1 = h

U 2 = g

d

c

f

e

b

a


Jeu B : jeu séquentiel avec information imparfaite

Joueur 1

G

D

Joueur 2 Joueur 2

G D G

D

U 1 = h

U 2 = g

d

c

f

e

b

a


Plus précisément, la notion d’ensemble

d’information des joueurs permet de donner

une définition plus générale


Plus précisément, la notion d’ensemble

d’information des joueurs permet de donner

une définition plus générale

Ensemble d’information d’un joueur

= partition de l’ensemble de ses nœuds de

décision

= collection de ses nœuds de décision qu’il ne

peut distinguer


Plus précisément, la notion d’ensemble

d’information des joueurs permet de donner

une définition plus générale

Ensemble d’information d’un joueur

= partition de l’ensemble de ses nœuds de

décision

= collection de ses nœuds de décision qu’il ne

peut distinguer

Recette : on vérifie qu’un jeu est à information

parfaite ou imparfaite, en contrôlant que

chaque ensemble d’information contient ou

non plus d’un seul nœud de décision


Définition:

- Un jeu est à information parfaite lorsque,

pour tous les joueurs, les ensembles

d’information sont des singletons (i.e. ne

contiennent qu’un seul nœud de décision)

- Sinon, le jeu est à information imparfaite


Application au jeu séquentiel précédent


Application au jeu séquentiel précédent

- Dans ce jeu :

* J1 a un seul nœud de décision (nœud initial)

* J2 a deux nœuds de décision (nœud à gauche

quand J1 a joué « G »; nœud à droite quand J1

a joué « D »


Application au jeu séquentiel précédent

- Dans ce jeu :

* J1 a un seul nœud de décision (nœud initial)

* J2 a deux nœuds de décision (nœud à gauche

quand J1 a joué « G »; nœud à droite quand J1

a joué « D »

→ le jeu A est à information parfaite, car J2 a

deux ensembles d’info. qui sont des

singletons


Application au jeu séquentiel précédent

- Dans ce jeu :

* J1 a un seul nœud de décision (nœud initial)

* J2 a deux nœuds de décision (nœud à gauche

quand J1 a joué « G »; nœud à droite quand J1

a joué « D »

→ le jeu A est à information parfaite, car J2 a

deux ensembles d’info. qui sont des

singletons

→ le jeu B est à information imparfaite, car J2 a

un ensemble d’information qui contient ses

deux nœuds de décision


Mais la source de l’incertitude peut être

extérieure aux joueurs :

- circonstances générales,

- qui résultent de l’action de la Nature,

- qui influencent le déroulement et le résultat

du jeu, inégalement observées par les joueurs


Mais la source de l’incertitude peut être

extérieure aux joueurs :

- circonstances générales,

- qui résultent de l’action de la Nature,

- qui influencent le déroulement et le résultat

du jeu, inégalement observées par les joueurs

→ distinction entre jeu à :

- information complète : tous les joueurs

observent l’action de la Nature

- information incomplète : au moins un joueur

n’observe pas l’action de la Nature


Jeu C : jeu séquentiel avec information complète

Nature

J1 Type L

J1 Type H

Joueur 2 Joueur 2

G D D

G

Joueur 1 Joueur 1

Joueur 1

G D G D G D G D

h

g

d

c

f

e

b

a

k

m

n

p

r

q

z

x


Jeu D : jeu séquentiel avec information incomplète

Nature

J1 Type L

J2Type H

Joueur 2 Joueur 2

G D D

G

Joueur 1 Joueur 1

Joueur 1

G D G D G D G D

h

g

d

c

f

e

b

a

k

m

n

p

r

q

z

x


Chapitre 3 – section 1 – 1.3

concept central de la théorie des jeux : stratégie


Chapitre 3 – section 1 – 1.3

concept central de la théorie des jeux : stratégie

Définition :

Pour un joueur, une stratégie est une description

complète de l’action qu’il pourrait prendre à

chacun de ses ensembles d’information


Chapitre 3 – section 1 – 1.3

concept central de la théorie des jeux : stratégie

Définition :

Pour un joueur, une stratégie est une description

complète de l’action qu’il pourrait prendre à

chacun de ses ensembles d’information

→ littéralement : stratégie

= plan contingent complet

= règle de décision spécifiant de façon

exhaustive ce que fait un joueur, partout dans

le jeu, à chaque occasion où il pourrait jouer


De façon triviale, dans un jeu simultané, les

stratégies possibles pour les différents joueurs

se ramènent à leurs actions

Exemple - jeu simultané précédent

Stratégies de J1 : (H,B)

Stratégies de J2 : (G,D)


Dans un jeu séquentiel, les stratégies

possibles pour les différents joueurs

correspondent (en général) à des

combinaisons de leurs actions

Exemple - jeu A (info parfaite)

Stratégies de J1 : (G,D)

Stratégies de J2 : ({G si J1 joue G, G si J1 joue D},

{G si J1 joue G, D si J1 joue D},

{D si J1 joue G, G si J1 joue D},

{D si J1 joue G, D si J1 joue D})


Intuition : l’information étant parfaite, J2 peut

conditionner sa décision à ce que J1 a

précédemment fait

→ idée de stratégie comme plan contingent


Intuition : l’information étant parfaite, J2 peut

conditionner sa décision à ce que J1 a

précédemment fait

→ idée de stratégie comme plan contingent

Exemple - jeu B (info imparfaite)

Stratégies de J1 : (G,D)

Stratégies de J2 : (G,D)

→ l’information étant imparfaite, J2 ne peut

plus conditionner sa décision à ce que J1 a

précédemment fait

→ les stratégies de J2 sont confondues avec ses

actions (ici)


La notion de stratégie est évidemment

déterminante pour décrire l’issue possible,

probable d’un jeu


La notion de stratégie est évidemment

déterminante pour décrire l’issue possible,

probable d’un jeu

L’analyse d’un jeu peut commencer en

regardant les stratégies dominantes des

différents joueurs


La notion de stratégie est évidemment

déterminante pour décrire l’issue possible,

probable d’un jeu

L’analyse d’un jeu peut commencer en

regardant les stratégies dominantes des

différents joueurs

Définition :

Une stratégie strictement dominante est une

stratégie qui donne l’utilité/gain le plus élevé à

un joueur, indépendamment des décisions des

autres joueurs

= meilleur réponse inconditionnelle


Remarques :

- Si un joueur dispose d’une telle stratégie, on

ne voit pas pourquoi il ne la jouerait pas !


Remarques :

- Si un joueur dispose d’une telle stratégie, on

ne voit pas pourquoi il ne la jouerait pas !

- Et si un joueur dispose d’une stratégie

strictement dominée, on ne voit pas pourquoi

il ne l’éliminerait pas …

→ simplifie l’analyse d’un jeu, mais peu ôter

tout l’attrait d’un contexte d’interaction

stratégique


Exemple d’un jeu simultané

→ stratégies dominantes ?

JOUEUR 2

G

D

JOUEUR 1

H

B

1

2

2

1

0

1

1

0


→ stratégie dominante de J1

JOUEUR 2

G

D

JOUEUR 1

H

B

1

0

2

2 1

1

1

0


→ stratégie dominante de J1

JOUEUR 2

G

D

JOUEUR 1

H

B

1

0

2

2 1

1

1

0

J1 a une stratégie strictement dominante: B


→ stratégie dominante de J2

JOUEUR 2

G

D

JOUEUR 1

1 0

H 2 1

B

2 1

1 0

J2 a une stratégie strictement dominante: G


D’où prédiction sur l’issue probable du jeu

Équilibre en stratégies dominantes

joueur 1 joue B : gain = 2

joueur 2 joue G : gain = 1


D’où prédiction sur l’issue probable du jeu

Équilibre en stratégies dominantes

joueur 1 joue B : gain = 2

joueur 2 joue G : gain = 1

la question de l’interaction stratégique est alors

relativement pauvre:

- ce que fait l’autre n’influence en rien ce que

l’on fait soi-même (décision)

- à la limite, ceci n’a d’effet que sur le résultat

que l’on reçoit


Mais si la meilleure décision de l’un est

conditionnée par ce que l’autre fait ?

JOUEUR 2

G

D

JOUEUR 1

H

2

1

0

0

B

0

0

1

2


Mais si la meilleure décision de l’un est

conditionnée par ce que l’autre fait ?

JOUEUR 2

G

D

JOUEUR 1

H

2

1

0

0

B

0

0

1

2

→ Notion de (fonction de) meilleure réponse


J1 joue H si J2 joue G

mais B si D

JOUEUR 2

G

D

JOUEUR 1

H

B

2

0

1

0

0

1

0

2


J2 joue G si J1 joue H

mais D si B

JOUEUR 2

G

D

JOUEUR 1

H

B

2

0

1

0

0

1

0

2


Dans ce cas, on ne peut pas aller plus loin

dans l’analyse du jeu, même si on constate

qu’il y a deux combinaisons qui sont

particulièrement intéressantes:

- J1 joue H, J2 joue G : résultat (2,1)

- J1 joue B, J2 joue D : résultat (1,2)


Dans ce cas, on ne peut pas aller plus loin

dans l’analyse du jeu, même si on constate

qu’il y a deux combinaisons qui sont

particulièrement intéressantes:

- J1 joue H, J2 joue G : résultat (2,1)

- J1 joue B, J2 joue D : résultat (1,2)

la connaissance de la structure du jeu (et le

présupposé que les joueurs ont aussi cette

connaissance; cf plus loin) ne nous permet

plus de/ne suffit plus à en décrire les issues

possibles


Chapitre 3 – section 2

L’analyse d’un jeu (simultané ou séquentiel)

est basée sur deux postulats :

- les joueurs sont rationnels (acception usuelle)


Chapitre 3 – section 2

L’analyse d’un jeu (simultané ou séquentiel)

est basée sur deux postulats :

- les joueurs sont rationnels (acception usuelle)

- la structure du jeu est de connaissance

commune


Chapitre 3 – section 2

L’analyse d’un jeu (simultané ou séquentiel)

est basée sur deux postulats :

- les joueurs sont rationnels (acception usuelle)

- la structure du jeu est de connaissance

commune

→ l’hypothèse de connaissance commune dote

chaque joueur de la capacité de développer

des raisonnements récursifs du type:

- chaque joueur sait qu’il est rationnel et

connaît la structure du jeu

- que les autres joueurs le savent aussi,

- que les autres savent qu’il le sait etc …


Toutefois, ces postulats ne suffisent pas la

plupart du temps (dans les situations qui vont

nous intéresser) pour préciser l’issue du jeu


Toutefois, ces postulats ne suffisent pas la

plupart du temps (dans les situations qui vont

nous intéresser) pour préciser l’issue du jeu

affiner les prédictions – proposer un concept

d’équilibre :

- Équilibre de NASH : jeux simultanés

- Équilibre Parfait en Sous-Jeu : jeux séquentiels

→ « raffinement » de l’équilibre de Nash


Chapitre 3 – section 2 – 2.1

Définition préliminaire : profil de stratégies

un profil de stratégies est une combinaison de

stratégies individuelles, attribuant une

stratégie à chaque joueur


Chapitre 3 – section 2 – 2.1

Définition préliminaire : profil de stratégies

un profil de stratégies est une combinaison de

stratégies individuelles, attribuant une

stratégie à chaque joueur

Définition : l’Équilibre de NASH

un profil de stratégies est un EN si la stratégie

d’équilibre de chaque joueur est optimale

étant donnée la stratégie d’équilibre de l’autre

NB: optimale = maximise son utilité/gain


Considérons le jeu suivant

JOUEUR 2

G

D

JOUEUR 1

H

B

2

0

1

0

0

1

0

2


Chaque joueur dispose de deux stratégies

- {H,B} pour J1

- {G,D} pour J2


Chaque joueur dispose de deux stratégies

- {H,B} pour J1

- {G,D} pour J2

Notons x une stratégie possible de J1; xЄ{H,B}

y une stratégie possible de J2; yЄ{G,D}


Chaque joueur dispose de deux stratégies

- {H,B} pour J1

- {G,D} pour J2

Notons x une stratégie possible de J1; xЄ{H,B}

y une stratégie possible de J2; yЄ{G,D}

Notons :

u(x,y) l’utilité/gain de J1 s’il joue x et J2 joue y

v(y,x) l’utilité/gain de J2 s’il joue y et J1 joue x


Alors, formellement, un profil de stratégies

(x,y) candidat à être un EN doit vérifier:

- u(x,y) ≥ u(x’,y) pour tout x’ ≠ x

- v(y,x) ≥ v(y’,x) pour tout y’ ≠ y


Alors, formellement, un profil de stratégies

(x,y) candidat à être un EN doit vérifier:

- u(x,y) ≥ u(x’,y) pour tout x’ ≠ x

- v(y,x) ≥ v(y’,x) pour tout y’ ≠ y

En pratique, comment « tester » le/les

équilibres de Nash dans un jeu ?

→ deux « recettes », qui découlent de la

définition même de l’EN


1/ on teste toutes les combinaisons possibles :

(H,G) → utilités/gains (2,1)

(H,D) → utilités/gains (0,0)

(B,G) → utilités/gains (0,0)

(B,D) → utilités/gains (1,2)


1/ on teste toutes les combinaisons possibles :

(H,G) → utilités/gains (2,1)

(H,D) → utilités/gains (0,0)

(B,G) → utilités/gains (0,0)

(B,D) → utilités/gains (1,2)

en regardant si l’un des joueurs a intérêt à

« dévier » (changer sa décision), de façon à

accroître individuellement son utilité/gain


1/ on teste toutes les combinaisons possibles :

(H,G) → utilités/gains (2,1)

(H,D) → utilités/gains (0,0)

(B,G) → utilités/gains (0,0)

(B,D) → utilités/gains (1,2)

en regardant si l’un des joueurs a intérêt à

« dévier » (changer sa décision), de façon à

accroître individuellement son utilité/gain

→ on cherche les incitations à dévier, ou encore

les déviations profitables


Application à notre exemple:

considérons le profil (H,D)

JOUEUR 2

G

D

JOUEUR 1

H

B

2

0

1

0 1

0

0

2


Application à notre exemple:

considérons le profil (H,D) → (0,0)

JOUEUR 2

G

D

JOUEUR 1

H

B

2

0

1

0 1

0

0

2


Application à notre exemple:

considérons le profil (H,D) → (0,0)

JOUEUR 2

G

D

JOUEUR 1

H

B

2

0

1

0 1

0

0

2

On voit que si J2 joue effectivement D, J1 a

intérêt à dévier de H et jouer au contraire B


Conclusion : (H,D) ne peut pas être un EN,

l’un des joueurs ayant une incitation à dévier;


Conclusion : (H,D) ne peut pas être un EN,

l’un des joueurs ayant une incitation à dévier;

vous vérifierez que J2 a aussi une incitation à

dévier si J1 joue H (jouer alors G plutôt que D)

NB : le même raisonnement montre que

(B,G) (→ (0,0)) n’est pas non plus un EN


Conclusion : (H,D) ne peut pas être un EN,

l’un des joueurs ayant une incitation à dévier;

vous vérifierez que J2 a aussi une incitation à

dévier si J1 joue H (jouer alors G plutôt que D)

NB : le même raisonnement montre que

(B,G) (→ (0,0)) n’est pas non plus un EN

Montrons alors que ce jeu a deux EN:

- (H,G) → (2,1)

- (B,D) → (1,2)


JOUEUR 2

G

D

H

2

0

1 0

JOUEUR 1

B

0

0

1

2


JOUEUR 2

G

D

H

2

0

1 0

JOUEUR 1

B

0

0

1

2


2/ littéralement, la définition de l’EN signifie

que la stratégie de Nash de chacun des

joueurs, est la meilleure des réponses à la

stratégies de Nash de l’autre joueur


2/ littéralement, la définition de l’EN signifie

que la stratégie de Nash de chacun des

joueurs, est la meilleure des réponses à la

stratégies de Nash de l’autre joueur

→ en d’autres termes, un profil (x,y) est un EN

→ en d’autres termes, un profil (x,y) est un EN

s’il se situe au point d’intersection des

fonctions de meilleures réponses des deux

joueurs


comme on l’a vu précédemment :

J1 joue H si J2 joue G

mais B si D

JOUEUR 2

G

D

H

2

1

0

0

JOUEUR 1

B

0

0

1

2


et :

J2 joue G si J1 joue H

mais D si B

JOUEUR 2

G

D

H

2

1

0

0

JOUEUR 1

B

0

0

1

2


L’intersection des deux fonctions de meilleures

réponses nous conduit à sélectionner deux

profils de stratégies = EN : (H,G) et (B,D) !

JOUEUR 2

G

D

H

2

1

0

0

JOUEUR 1

B

0

0

1

2


Chapitre 3 – section 2 – 2.2

Pbs avec l’éq de Nash :

- Existence

(stratégies « mixtes », si discrètes;

utilités quasi-concaves si stratégies

continues)


- Existence d’Équilibres Multiples (cf exemple)

J2

G

D

J1

H

2

0

1

0

B

0

0

1

2

coordination sur l’un des EN ?


- Sous optimalité de l’éq. de Nash

→ défaut de coordination (non coopération)

conduit à des échanges inefficaces


- Sous optimalité de l’éq. de Nash

→ défaut de coordination (non coopération)

conduit à des échanges inefficaces

Pb dit du « Dilemme du Prisonnier »

deux individus sont interpelés et suspectés

d’avoir commis ensemble un délit;

la police manque de preuves;

ils sont interrogés séparément :


Représentation sous forme de jeu simultané

ACCUSÉ 2

avouer

nier

ACCUSÉ 1

avouer

-3

-3

0

-6

nier

-6

0

-1

-1


L’unique EN de ce jeu : (avouer , avouer)

ACCUSÉ 2

avouer

nier

ACCUSÉ 1

avouer

-3

-3

0

-6

nier

-6

0

-1

-1


L’unique EN de ce jeu : (avouer , avouer)

ACCUSÉ 2

avouer

nier

ACCUSÉ 1

avouer

-3

-3

0

-6

nier

-6

0

-1

-1


(nier , nier) n’est pas un EN de ce jeu

ACCUSÉ 2

avouer

nier

ACCUSÉ 1

avouer

-3

-3

0

-6

nier

-6

0

-1

-1


(nier , nier) n’est pas un EN de ce jeu

→ si A2 nie, A1 a intérêt à avouer (il dévie)

ACCUSÉ 2

avouer

nier

ACCUSÉ 1

avouer

-3

-3

0

-6

nier

-6

0

-1

-1


(nier , nier) n’est pas un EN de ce jeu

→ si A2 nie, A1 a intérêt à avouer (il dévie)

ACCUSÉ 2

avouer

nier

ACCUSÉ 1

avouer

-3

-3

0

-6

nier

-6

0

-1

-1

NB : mais (avouer, nier) n’est pas un EN


Paradoxe: (nier , nier) domine au sens de

Pareto (avouer , avouer)

ACCUSÉ 2

avouer

nier

avouer

-3

-3

0

-6

ACCUSÉ 1

nier

-6

0

-1

-1


Chapitre 3 – section 3

Le cadre défini par les jeux simultanés

(statiques) est adapté à l’analyse des marchés

ou un nombre finis de firmes sont déjà en

activité (insiders)

grosso modo : analyse de court terme


Chapitre 3 – section 3

Le cadre défini par les jeux simultanés

(statiques) est adapté à l’analyse des marchés

ou un nombre finis de firmes sont déjà en

activité (insiders)

grosso modo : analyse de court terme

Mais les questions de guerre commerciales,

ou comme on l’a vu en CPP, d’entrée de

nouveaux concurrents (outsiders) sont

évidemment importantes

les jeux séquentiels (dynamiques) fournissent

le cadre d’analyse approprié


Chapitre 3 – section 3 – 3.1

Une première idée que l’on va illustrer


Chapitre 3 – section 3 – 3.1

Une première idée que l’on va illustrer

le concept d’équilibre de Nash n’est pas assez

fort (restrictif) lorsqu’on analyse des jeux

séquentiels


Chapitre 3 – section 3 – 3.1

Une première idée que l’on va illustrer

le concept d’équilibre de Nash n’est pas assez

fort (restrictif) lorsqu’on analyse des jeux

séquentiels

→ par exemple, ne permet pas d’éliminer, à

l’équilibre, l’utilisation d’actions représentant

des menaces qui ne sont pas crédibles


Jeu F : jeu séquentiel avec information complète

Outsider

Entrée

Exit

Guerre

Insider

Accommode

0

2

-3

-1

2

1


Représentation sous forme de jeu simultané

→ L’outsider et l’insider ont deux stratégies :


Représentation sous forme de jeu simultané

→ L’outsider et l’insider ont deux stratégies :

Outsider

Exit

Entrée

Insider

Guerre Accom-

si

mode si

Entrée Entrée

0 0

2 2

-3 2

-1 1


→ il existe deux EN (en stratégies pures)

(Exit, Guerre si Entrée )

(Entrée, Accommode si Entrée)

Insider

Outsider

Exit

Entrée

Guerre Accom-

si

mode si

Entrée Entrée

0 0

2 2

-3 2

-1 1


Mais l’EN correspondant à (Exit, Guerre si

Entrée ) n’est pas une prédiction très

pertinente, sensible, pour ce jeu:


Mais l’EN correspondant à (Exit, Guerre si

Entrée ) n’est pas une prédiction très

pertinente, sensible, pour ce jeu:

- Elle autorise que l’Insider utilise une menace

(faire une guerre commerciale) qui n’est pas

crédible (inefficace, non dissuasive) !


Mais l’EN correspondant à (Exit, Guerre si

Entrée ) n’est pas une prédiction très

pertinente, sensible, pour ce jeu:

- Elle autorise que l’Insider utilise une menace

(faire une guerre commerciale) qui n’est pas

crédible (inefficace, non dissuasive) !

- mais sous l’hyp. de connaissance commune,

- mais sous l’hyp. de connaissance commune,

l’Outsider a les moyens de comprendre

qu’une fois qu’il est entré, la meilleur décision

de l’Insider est d’accommoder, et non pas la

guerre


Mais l’EN correspondant à (Exit, Guerre si

Entrée ) n’est pas une prédiction très

pertinente, sensible, pour ce jeu:

- Elle autorise que l’Insider utilise une menace

(faire une guerre commerciale) qui n’est pas

crédible (inefficace, non dissuasive) !

- mais sous l’hyp. de connaissance commune,

l’Outsider a les moyens de comprendre

qu’une fois qu’il est entré, la meilleur décision

de l’Insider est d’accommoder, et non pas la

guerre

→ l’acceptation des menaces non crédibles

entre en conflit avec la connais. commune


Chapitre 3 – section 3 – 3.2

Pour contourner ces difficultés/incohérences,

on utilise un concept d’équilibre qui

requiert/contraint chaque joueur à ne prendre

que des actions efficaces/optimales pour lui-

même, à tout moment du jeu où il doit jouer ,

étant données les stratégies des autres

joueurs


Chapitre 3 – section 3 – 3.2

Pour contourner ces difficultés/incohérences,

on utilise un concept d’équilibre qui

requiert/contraint chaque joueur à ne prendre

que des actions efficaces/optimales pour lui-

même, à tout moment du jeu où il doit jouer,

étant données les stratégies des autres

joueurs

→ idée de rationalité séquentielle


Définition : Notion de Sous Jeu


Définition : Notion de Sous Jeu

Un sous jeu est une sous partie d’un jeu,

qui commence à l’ensemble d’information de

l’un des joueurs, pourvu que ce soit un

singleton (unique nœud de décision),

et qui contient tous les nœuds de décision qui

le suivent


Définition : Notion de Sous Jeu

Un sous jeu est une sous partie d’un jeu,

qui commence à l’ensemble d’information de

l’un des joueurs, pourvu que ce soit un

singleton (unique nœud de décision),

et qui contient tous les nœuds de décision qui

le suivent

NB : ceci implique qu’un ensemble d’info

contenant au moins deux nœuds ne peut pas

initier un sous jeu – on ne peut pas « casser »

un ens d’info


notre Jeu F contient deux sous jeux :

Outsider

Entrée

Exit

Guerre

Insider

Accommode

0

2

-3

-1

2

1


notre Jeu F contient deux sous jeux :

Outsider

Entrée

Exit

Guerre

Insider

Accommode

0

2

-3

-1

2

1


notre Jeu F contient deux sous jeux :

Outsider

Entrée

Exit

Guerre

Insider

Accommode

0

2

-3

-1

2

1


Définition : Équilibre Parfait en Sous Jeu

Un profil de stratégies constitue un EPSJ, s’il

induit un EN dans chacun des sous jeux

associés au jeu complet


Définition : Équilibre Parfait en Sous Jeu

Un profil de stratégies constitue un EPSJ, s’il

induit un EN dans chacun des sous jeux

associés au jeu complet

→ contraint les joueurs à être séquentiellement

rationnels

en jouant des stratégies qui sont Nash, non

seulement dans le jeu complet, mais partout

dans le jeu


étudier le premier des deux sous jeux, revient à un pur

problème de décision individuelle (ici) pour l’insider :

Insider

Entrée

Guerre

Accommode

-3

-1

2

1


étudier le premier des deux sous jeux, revient à un pur

problème de décision individuelle (ici) pour l’insider :

Insider

Entrée

Guerre

Accommode

-3

-1

2

1


étudier le jeu complet (second sous jeu) revient à

étudier un « jeu réduit », et donc la décision de l’outsider :

Outsider

Entrée

Exit

Guerre

Insider

Accommode

0

2

2

1


Sachant qu’il est séquentiellement rationnel pour l’Insiderde

jouer Accommode si l’Outsider entre, l’Outsider joue Entrée

Outsider

Entrée

Exit

Guerre

Insider

Accommode

0

2

-3

-1

2

1


Conséquences:

- En raisonnant en Nash dans le seul jeu

complet, on avait trouvé deux EN


Conséquences:

- En raisonnant en Nash dans le seul jeu

complet, on avait trouvé deux EN

- (Entrée, Accomode si Entrée) est un EPSJ; il

est unique


Conséquences:

- En raisonnant en Nash dans le seul jeu

complet, on avait trouvé deux EN

- (Entrée, Accomode si Entrée) est un EPSJ; il

est unique

- (Exit, Guerre si Entrée) est éliminé; ce n’est

pas un EPSJ

→ la « perfection en sous jeu » permet

d’éliminer la menace non crédible


La deuxième idée que l’on va illustrer est

qu’un EPSJ n’est pas forcément Pareto

Optimal


La deuxième idée que l’on va illustrer est

qu’un EPSJ n’est pas forcément Pareto

Optimal

→ simple : un EPSJ est forcément sélectionné

dans l’ensemble des EN d’un jeu


La deuxième idée que l’on va illustrer est

qu’un EPSJ n’est pas forcément Pareto

Optimal

→ simple : un EPSJ est forcément sélectionné

dans l’ensemble des EN d’un jeu

→ or, un EN n’est pas nécessairement PO !


Chapitre 3 – section 3 – 3.3

Classe de jeux dynamiques spécifiques :

jeux dits « répétés »


Chapitre 3 – section 3 – 3.3

Classe de jeux dynamiques spécifiques :

jeux dits « répétés »

capte des situations où les joueurs se

« rencontrent » régulièrement

interactions répétées


Chapitre 3 – section 3 – 3.3

Classe de jeux dynamiques spécifiques :

jeux dits « répétés »

capte des situations où les joueurs se

« rencontrent » régulièrement

interactions répétées

rôle explicite du temps :

apprentissage,

acquisition d’une réputation,

incitations à coopérer (cadre non coopératif)


Soit le jeu EG de concurrence entre deux firmes :

Firme 1

Entente

Guerre

Firme 2

Entente

Guerre

3

4

3

-1

-1

0

4

0


Situation du type « dilemme du prisonnier

où l’EN (G , G) est Pareto dominé par (E , E) :

Firme 1

Entente

Guerre

Firme 2

Entente

Guerre

3

4

3

-1

-1

0

4

0


Mais admettons que les deux firmes se

« rencontrent » régulièrement ,

avec les mêmes actions possibles à chaque

fois,


Mais admettons que les deux firmes se

« rencontrent » régulièrement ,

avec les mêmes actions possibles à chaque

fois,

par exemple pendant T ≥ 2 périodes

en supposant que chacune observe ce qu’a

fait l’autre à la fin de chaque période


Mais admettons que les deux firmes se

« rencontrent » régulièrement ,

avec les mêmes actions possibles à chaque

fois,

par exemple pendant T ≥ 2 périodes

en supposant que chacune observe ce qu’a

fait l’autre à la fin de chaque période

le jeu simultané EG ne représente qu’une

occurrence (étape) d’un jeu plus long à T

périodes

→ jeu répété, fini (T < ∞ périodes seulement)


Mais admettons que les deux firmes se

« rencontrent » régulièrement ,

avec les mêmes actions possibles à chaque

fois,

par exemple pendant T ≥ 2 périodes

en supposant que chacune observe ce qu’a

fait l’autre à la fin de chaque période

le jeu simultané EG ne représente qu’une

occurrence (étape) d’un jeu plus long à T

périodes

→ jeu répété, fini (T < ∞ périodes seulement)

question : émergence à LT de la coopération ?


problème :

le nombre de stratégies possibles pour

chaque joueur augmente rapidement avec T :


problème :

le nombre de stratégies possibles pour

chaque joueur augmente rapidement avec T :

rappel : une stratégie est un plan contingent

i.e. spécifie ce que fait un joueur à

chacun de ses ensembles d’info.


problème :

le nombre de stratégies possibles pour

chaque joueur augmente rapidement avec T :

rappel : une stratégie est un plan contingent

i.e. spécifie ce que fait un joueur à

chacun de ses ensembles d’info.

Supposons T = 2


Représentation sous forme extensive (sans les gains) :

F1

Etape 1

E

F 2

G

E

G E G

F1

Etape 2

E G E G E G E G

F2


Jeu simultané à l’étape 1

F1

E

G

Etape 1

E

F 2

G

E 3

G 4

3

-1

0

4

E G E G

F1

-1

0

Etape 2

E G E G

E G E G

F2


Idem en chaque sous jeu à l’étape 2

F1

Etape 1

E

F 2

G

E

G E G

F1

Etape 2

E G E G E G E G

F2

E

E 3

G

-1

G 4

3

-1

0

4

0


exemple : nb de stratégies de F1 si T = 2 ?


exemple : nb de stratégies de F1 si T = 2 ?

F1 a 1 nœud de décision en t=1

4 nœuds de décision en t=2

F2 a 1 ensemble d’info. en t=1

4 ensembles d’info. en t=2


exemple : nb de stratégies de F1 si T = 2 ?

F1 a 1 nœud de décision en t=1

4 nœuds de décision en t=2

F2 a 1 ensemble d’info. en t=1

4 ensembles d’info. en t=2

à l’étape 2, F1 a deux actions possibles à

chacun de ses 4 nœuds de décision,


exemple : nb de stratégies de F1 si T = 2 ?

F1 a 1 nœud de décision en t=1

4 nœuds de décision en t=2

F2 a 1 ensemble d’info. en t=1

4 ensembles d’info. en t=2

à l’étape 2, F1 a deux actions possibles à

chacun de ses 4 nœuds de décision,

soit : 4 2 = 16 arrangements possibles

en tenant compte des 2 actions à l’étape 1,

ceci donne : 2 x 4 2 = 32 stratégies pour F1

du type : (E ; E E E E) (E ; G E E E) (E ; E G E E)

… (G ; E E E E) … (G ; G G G G) etc


Si T=3, F1 a 1 nœud de décision en t=1

4 en t=2

16 en t=3

D’où un nb de stratégies = 2 x 4 2 x 16 2 = 8192

conséquence :

quand T devient grand, le nb de stratégies

devient très élevé ( T=20, plusieurs millions) !

Donc potentiellement complexe à analyser …


Néanmoins dans la mesure où le jeu est fini,


Néanmoins dans la mesure où le jeu est fini,

i.e. l’horizon des joueurs est borné (il existe pour

eux une date terminale pour le jeu : T < ∞),

alors un jeu répété fini est très simple à analyser


Néanmoins dans la mesure où le jeu est fini,

i.e. l’horizon des joueurs est borné (il existe pour

eux une date terminale pour le jeu : T < ∞),

alors un jeu répété fini est très simple à analyser

→ l’application du concept d’EPSJ requiert

→ l’application du concept d’EPSJ requiert

qu’une combinaison de stratégies n’est un

EPSJ que s’il induit un équilibre de Nash dans

chacun de ses sous jeux


or, chaque joueur sait :

- qu’à l’étape 2, chaque sous jeu est identique

au jeu statique (peu importe l’histoire passée,

i.e. les gains/pertes antérieures)


or, chaque joueur sait :

- qu’à l’étape 2, chaque sous jeu est identique

au jeu statique (peu importe l’histoire passée,

i.e. les gains/pertes antérieures)

- que le seul EN du jeu statique est (G, G)

→ (G , G) est donc l’unique EN dans chaque sous

jeu


or, chaque joueur sait :

- qu’à l’étape 2, chaque sous jeu est identique

au jeu statique (peu importe l’histoire passée,

i.e. les gains/pertes antérieures)

- que le seul EN du jeu statique est (G, G)

→ (G , G) est donc l’unique EN dans chaque sous

jeu

→ le seul EPSJ du jeu répété à T=2 correspond

donc à une combinaison de stratégies où

chacun des joueurs choisit partout G

→ généralisable à tout T < ∞


en d’autres termes, connaissant la date

terminale T (quelle qu’elle soit : T ≥ 2),


en d’autres termes, connaissant la date

terminale T (quelle qu’elle soit : T ≥ 2),

il est individuellement inutile (irrationnel) de

tenter de se construire une réputation d’agent

coopératif en choisissant unilatéralement

« Entente », quel que soit l’instant du jeu et la

longueur de T


en d’autres termes, connaissant la date

terminale T (quelle qu’elle soit : T ≥ 2),

il est individuellement inutile (irrationnel) de

tenter de se construire une réputation d’agent

coopératif en choisissant unilatéralement

« Entente », quel que soit l’instant du jeu et la

longueur de T

puisqu’à la date terminale, chacun choisira

« Guerre »

par raisonnement inductif à rebours, c’est vrai

à chaque date


en d’autres termes, connaissant la date

terminale T (quelle qu’elle soit : T > 2),

il est individuellement inutile (irrationnel) de

tenter de se construire une réputation d’agent

coopératif en choisissant unilatéralement

« Entente », quel que soit l’instant du jeu et la

longueur de T

puisqu’à la date terminale, chacun choisira

« Guerre »

par raisonnement inductif à rebours, c’est vrai

à chaque date

→ la coopération ne peut pas émerger omme

EPSJ dans un jeu répété fini à info complète


jeu répété infini

→ l’argument d’induction à rebours utilisé

pour le jeu fini (effet dead-line) n’a plus de

pertinence

→ à tout moment, l’avenir du jeu (gains/pertes)

influence les décisions présentes


jeu répété infini

→ l’argument d’induction à rebours utilisé

pour le jeu fini (effet dead-line) n’a plus de

pertinence

→ à tout moment, l’avenir du jeu (gains/pertes)

influence les décisions présentes

→ conséquence : tout est possible !

la coopération, comme la guerre

→multiplicité d’EN et d’EPSJ


Résultat général :

Folk théorèmes

dans un jeu répété à l’infini, où les joueurs ont

un nombre fini d’actions à chaque occurrence,

toute combinaison d’actions répétée sur une

toute combinaison d’actions répétée sur une

séquence finie peut constituer l’unique

résultat d’un équilibre du jeu;


Résultat général :

Folk théorèmes

dans un jeu répété à l’infini, où les joueurs ont

un nombre fini d’actions à chaque occurrence,

toute combinaison d’actions répétée sur une

séquence finie peut constituer l’unique

résultat d’un équilibre du jeu;

condition requise :

une certaine valeur du taux d’actualisation


Argument :

- En horizon fini, il n’est pas possible de se

construire une réputation (coopération) ni

d’inciter l’autre à coopérer (punition) en

raison de la dead-line T


Argument :

- En horizon fini, il n’est pas possible de se

construire une réputation (coopération) ni

d’inciter l’autre à coopérer (punition) en

raison de la dead-line T

- En horizon infini, en revanche, à chaque

occurrence du jeu, il reste toujours à venir un

grand nb de périodes (une infinité de

répétitions du jeu) qui peut inciter un joueur à

user de représailles (punir l’autre, au moins

sur une durée finie) afin d’inciter l’autre à

coopérer


On peut montrer que jouer (E,E) est un EN

(et toujours un EPSJ)

Jouer E à l’infini si l’autre joue aussi E à l’infini,

donne à chaque joueur un gain cumulé égal à :

∑ ∞ t-1 ∞ t-1 t=1 x δ x (3) = 3 x (∑ t=1 x δ )

= 3/(1 – δ)

C’est le gain max, pour tout δ < 1

Donc, forcément EN (et EPSJ)


Mais montrons que (G,G) est aussi un EN du

jeu infini

Jouer G à l’infini si l’autre joue aussi G à l’infini,

donne à chaque joueur un gain cumulé égal à :

∑ t=1


x δ t-1 x 0 = 0

t=1

Donc, une déviation unilatérale E (à la date 1,

par exemple) donnerait un gain négatif

- 1 + ∑ t=2


x δ t-1 x 0 = - 1

Donc, pas d’incitation à dévier (en tout t) !


En fait, il existe beaucoup d’autres types d’EN

(en termes de stratégies) induisant la

coopération (en termes de résultat)

→ stratégies « œil pour œil » :

Jouer E dès le départ, et tant que l’autre joue

E; mais dès que l’autre joue G, jouer G à l’infini

donne à chaque joueur un gain cumulé égal à :

∑ t=1


x δ t-1 x (3) = 3 + 3 δ /(1 – δ)

à l’équilibre (i.e. si l’autre la joue)


inversement, une déviation unilatérale G

(à la date 2, par exemple) donnerait un gain :

3 + 4 δ + ∑ t=3


x δ t-1 x 0 = 3 + 4 δ

Donc, pas d’incitation à dévier si :

3 δ /(1 – δ) > 4 δ

3 > 4 x (1 – δ)

4 x δ > 1

δ > 1/4

→ « œil pour œil » donne 1 EN avec coopération

pour certaines valeurs de δ Є (1/4 , 1)


Idée : les représailles sont crédibles si T→∞,

mais peuvent être coûteuses

punir seulement pour certaines périodes peut

être suffisant

→ Jouer alternativement E puis G dès le départ,

et tant que l’autre joue E; sinon, jouer G à

l’infini

→ Stratégies dites « tit for tat »

jouer E initialement; puis jouer en t ce que

l’autre a joué en t-1


Conclusion :

- Présenter des concepts clés pour analyser le

fonctionnement des marchés, dès que l’on

sort des deux cas polaires que sont la CPP et

le monopole

- Utilisés dans le champ suivant, mais aussi,

suite du cursus: L3, M

→ instruments fondamentaux de l’éco moderne

→ essentiels aussi dans le champ de

l’économie du droit ( Law & Economics)

More magazines by this user
Similar magazines