Cours (0.466 Mo) - Centre d'Économie de la Sorbonne

laep.univ.paris1.fr
  • No tags were found...

Cours (0.466 Mo) - Centre d'Économie de la Sorbonne

Université de Paris I Panthéon-Sorbonne

Année universitaire 2002-2003

DEA Décisions publiques, institutions et

organisations

Economie publique positive

et

Analyse économique de la politique

(notes de cours)

(Professeur Jean-Dominique Lafay)

1


Plan :

Introduction

Chapitre 1: Choix collectifs et origines de l'Etat

- L’équilibre social dans un « état de nature »

- L’entreprise Etat et son développement

Chapitre 2: Analyse économique du vote

- Choix de la règle de vote et paradoxe de la participation

- Le vote à la majorité simple

Chapitre 3: Démocratie représentative et comportement des partis

- Compétition dans un système bipartite

- Analyse des systèmes multipartites

Chapitre 4: Les modèles politico-économiques

- Le comportement des responsables gouvernementaux

- Le comportement de l’administration et des groupes d’intérêt

- Les interactions entre économie et politique

Principales références bibliographiques :

Breton A. (1996), Competitive Governments, Cambridge : Cambridge University Press.

Eggertsson T. (1990), Economic Behavior and Institutions, Cambridge : Cambridge

University Press.

Enelow J.M. et Hinich M.J. (1984), The Theory of Spatial Voting, Cambridge : Cambridge

University Press.

Frey B. (1985), Economie publique moderne, Paris : PUF.

Greffe X. (1994), Economie des politiques publiques, Paris : Dalloz.

Kelly J.S. (1987), Social Choice Theory, An Introduction, Berlin : Springer-Verlag.

Lafay J.D. et Lecaillon J. (1992), L’Economie mixte, Que sais-je n°1045, Paris : PUF.

Lecaillon J. (1998), Economie et Politique, Paris : Cujas.

McLean I. (1987), Public Choice : An Introduction, Oxford : Basil Blackwell

McNutt P.A. (1996), The Economics of Public Choice, Cheltenham : Edward Elgar.

Merrill III S. et Grofman B. (1999), A Unified Theory of Voting : Directional and Proximity

Spatial Models, Cambridge : Cambridge University Press.

Mueller D. (1989), Public Choice II, Cambridge : Cambridge University Press.

Pondaven C. (1994), Economie des décisions publiques, Paris : Vuibert.

Pondaven C. (1995), Economie des administrations publiques, Paris : Cujas.

Riker W.H. (1982), Liberalism Against Populism, A Confrontation Between the Theory of

Democracy and the Theory of Social Choice, San Francisco : W.H. Freeman.

Sandler T. (1992), Collective Action, Ann Arbor : University of Michigan Press.

Stiglitz J. (2000), Economics of the Public Sector, 2 nd Edition, New York : Norton.

Wolfelsperger A. (1995), Economie publique, Paris : Presses Universitaires de France.

2


Introduction :

L'économie publique étudie l'ensemble des problèmes liés aux activités de l’Etat,

marchandes ou non marchandes. Le terme « Etat » est défini ici de façon purement

descriptive : il désigne simplement l’institution qui, dans un pays donné, regroupe les

organismes publics et parapublics ainsi que les entreprises publiques ou contrôlées par le

secteur public. Sans référence particulière aux objectifs ou aux fonctions que doit remplir

cette institution.

Les problèmes d’économie publique ont été abordés pendant longtemps de façon

presque exclusivement normative. Les économistes se fixaient pour but de rechercher des

politiques optimales, c'est-à-dire d’indiquer à l'institution Etat ce qu'elle devait ou devrait

faire. Cette façon de voir, qui revient à se placer dans la position du « conseiller du Prince »,

est tout particulièrement développée en France, où les administrations publiques jouent un

rôle déterminant dans la recherche économique.

Mais, quel que soit leur intérêt intrinsèque, les débats normatifs sont loin d'épuiser

l'ensemble des questions scientifiquement importantes. Ils laissent dans l’ombre tous les

problèmes dits positifs, c'est-à-dire ceux concernant ce que l’Etat fait ou fera réellement.

Exemple de la politique budgétaire : la théorie (keynésienne) traditionnelle permet de

répondre à une question normative du type : « faut-il que le gouvernement diminue, accroisse

ou laisse inchangé le déficit budgétaire ». En revanche, elle ne donne aucune indication

quant à la réponse qu’il convient d’apporter à une question positive du type : « le

gouvernement va-t-il diminuer, accroître ou laisser inchangé le déficit budgétaire ». Or les

questions positives concernant la politique publique (ici le problème de la prévision de la

politique budgétaire à venir) sont au moins aussi importantes que les questions normatives, en

particulier pour les investisseurs privés.

Si l’Etat cherchait à tout moment à maximiser le bien-être collectif ou s’il suivait à la

lettre les politiques optimales définies par les économistes, la théorie normative de l’Etat

serait également une théorie positive. L’Etat ferait exactement ce qu’il doit faire (du moins

3


selon les économistes). Mais cela suppose que cet Etat soit un « despote » omniscient, tout

puissant et bienveillant, selon l’expression célèbre de l’économiste suédois Knut Wicksell. En

réalité, l’Etat est une organisation complexe, où les agents qui prennent et exécutent des

décisions ne sont a priori ni omniscients, ni tout puissants, ni spécialement bienveillants.

L'Etat réel risque donc de ne ressembler que de très loin à l’Etat idéal (celui pour lequel on

pourrait considérer que la théorie normative est aussi une théorie positive - principe

« normative as positive ») :

1 - les décideurs publics ont une information imparfaite sur les structures

économiques. Ils ne connaissent pas le « vrai » modèle de l’économie, les relations estimées à

partir des observations antérieures ont des chances d’être instables dans le futur 10 et les

valeurs des variables exogènes sont mal anticipées ;

2 - les décideurs publics ne sont pas tout puissants. Aucun gouvernement, même le

plus autocratique, ne peut manier librement les instruments de politique économique dont il

dispose. Il doit toujours composer avec l’opinion publique, avec divers groupes d’intérêt et,

surtout, avec son administration (sa « bureaucratie »), c'est-à-dire avec l’organisation chargée

de la mise en œuvre des politiques publiques. La liberté du gouvernement est tout

particulièrement restreinte dans une démocratie, dans la mesure où les contre-pouvoirs font

partie intégrante des institutions et où les préférences des électeurs-pivots, ceux dont le vote

peut faire basculer la majorité, jouent un rôle décisif - au moins quand on se trouve à

proximité des échéances électorales ;

3 - l’hypothèse de bienveillance signifie que la seule préoccupation des

gouvernements est de rendre maximum le bien-être collectif. Dans les faits, « l’Etat », le

« gouvernement », etc., sont des entités institutionnelles abstraites derrière lesquelles se

trouvent des individus, avec leurs fonctions d’utilité propres. Il n’y a aucune raison de

supposer que ces individus cherchent à maximiser à tout moment le bien-être collectif. Ils sont

a priori ni plus ni moins altruistes - ou ni plus ni moins malveillants - que les autres. Par

ailleurs, les aléas des luttes de pouvoir font que leur poids respectif dans les décisions

publiques varie considérablement au cours du temps et selon le type de problème.

Reconnaître que l’Etat n’est ni omniscient ni tout puissant (points 1 et 2 ci-dessus) a

10 Si les anticipations sont « rationnelles », les paramètres estimés à partir des observations antérieures ne

permettent pas de simuler correctement de nouvelles politiques économiques, car les agents modifient leur

comportement en fonction de l’expérience acquise. Cette remise en cause des simulations de politique

économique à partir de modèles estimés est connue sous le nom de « critique de Lucas » (Lucas R. E. Jr (1976),

« Econometric Policy Evaluation : A Critique », Journal of Monetary Economics, 2 (supplement)).

4


toutefois des conséquences limitées. Cela ne remet pas fondamentalement en cause la capacité

explicative de l’analyse normative. A condition de tenir compte des coûts d’information et des

coûts de mise en œuvre des politiques optimales proposées, la théorie économique normative

est parfaitement capable d’expliquer les choix réellement faits par un Etat bienveillant à

information imparfaite et à pouvoir limité. En revanche, l’abandon de l’hypothèse de

« bienveillance » (point 3 ci-dessus) est une source de difficultés beaucoup plus grandes. Si

les différents décideurs publics poursuivent des objectifs personnels, les politiques publiques

qu’ils vont [rationnellement] choisir ne correspondront que par hasard aux politiques

optimales 11 . Trois conséquences en découlent :

1 - le seul remède à la non-bienveillance de l’Etat est d’ordre institutionnel. Il consiste

à mettre en place des « institutions optimales », c'est-à-dire des systèmes d’incitations

rendant compatibles la maximisation du bien-être collectif et la maximisation de l’utilité

personnelle des décideurs publics ;

2 - si les institutions existantes ne sont pas « optimales » au sens précédent, il existera

toujours des défaillances de l’Etat parallèles aux défaillances du marché. Le débat sur le

choix entre le marché et l’Etat ne peut se limiter à l’examen des défaillances du seul marché.

Montrer qu’un marché fonctionne mal (ne correspond pas à un optimum social) n’est plus

suffisant pour justifier une intervention de l’Etat. A partir du moment où les décisions

publiques s’écartent systématiquement de l’optimum, il faut aussi montrer que l’Etat

fonctionne moins mal que le marché qu’il est censé remplacer ou corriger ;

3 - l’ampleur des défaillances de l’Etat dépend du comportement des décideurs publics

et de leur capacité de poursuivre des « objectifs d’intérêt public ». Le choix entre marché et

Etat est fonction du type d’Etat considéré et de la qualité de la « gouvernance » dans le

secteur public (c'est-à-dire de l’efficacité incitative des institutions, de l’histoire et de la

sociologie de sa classe politico-administrative, etc.).

En montrant que le choix entre marché et Etat pose à la fois le problème du

fonctionnement du marché et celui du fonctionnement de l’Etat, l’économie publique positive

a complètement renouvelé les termes du débat.

11

L'idée qu'un responsable politique ou un fonctionnaire puisse avoir des objectifs qui ne coïncident pas

nécessairement avec « l'intérêt de l’Etat » suscite toujours des réticences. En revanche, la même hypothèse

appliquée aux personnes travaillant dans le secteur privé ne fait presque jamais problème. Implicitement, cela

supposer que les membres du secteur public ont des fonctions d’utilité plus « altruistes » (plus dépendantes de

l’utilité des autres) que celles des agents du secteur privé. Pour qu’une telle différenciation soit acceptable, il

faudrait (1) montrer qu’elle a des causes théoriques solides (phénomènes d’autosélection dans les choix de

carrière, processus sociologiques de formation des préférences, etc.) et (2) apporter des arguments empiriques

prouvant qu’elle a une existence réelle.

5


Historiquement, les limites et insuffisances de l'approche normative sont devenues

particulièrement évidentes au cours des années 70, en grande partie sous la pression des

circonstances. Les difficultés conjoncturelles liées aux crises pétrolières ont provoqué des

dysfonctionnements importants dans le secteur public, notamment en matière de transferts

sociaux (par suite de la montée du chômage). Les objectifs sont alors devenus plus

étroitement politiques et de plus court terme, avec l’abandon de fait des techniques de

planification budgétaire à moyen terme.

Face aux difficultés précédentes, le besoin d’une analyse capable d’expliquer

rigoureusement les causes de maux internes du secteur public a été ressentie de façon

croissante. C’est à cette période que l’économie publique positive a réellement pris son essor,

pour devenir, au début des années 80, une discipline à part entière. Certes, de nombreuses

variantes coexistent, comme en témoignent les multiples appellations actuellement en

circulation (économie publique positive, analyse économique de la politique, théorie des

choix publics, économie des décisions publiques, théorie politique positive, économie

institutionnelle… et maintenant [nouvelle] économie politique). Ces analyses ont toutefois

deux points communs :

- 1) elles essaient d’expliciter les objectifs et contraintes des décideurs en tenant

explicitement compte de la dimension politique et administrative dans les choix publics ;

- 2) elles considèrent l’Etat comme une organisation au même titre que les autres et

étudient en priorité les différentes incitations résultant des règles institutionnelles existantes

(pour en déduire parfois, dans une vision plus normative, des réformes souhaitables, sinon

optimales, de ces règles).

L’économie publique positive s’est développée à partir des travaux de Kenneth Arrow

(théorie des « choix sociaux » – 1951), de Duncan Black (théorie des « choix politiques » -

années 40 et 1958) et surtout de Anthony Downs (théorie « économique de la démocratie » -

1957), James Buchanan et Gordon Tullock (théorie des « choix publics » - 1962 ) et Mancur

Olson (théorie de « l’action collective » - 1965). L’idée commune à tous ces auteurs (Arrow

mis à part) a été de construire une théorie microéconomique du comportement des différents

acteurs du secteur public, sur la base de leurs fonctions d’utilité propres et de toutes les

contraintes spécifiques auxquelles ils sont soumis (sans se limiter au domaine économique).

Dans ce cadre, l’Etat devient un agent - ou plutôt un agrégat d’agents -, dont on étudie le

comportement au même titre que celui des consommateurs ou des producteurs privés.

6


Chapitre 1: Choix collectifs et origines de l'Etat

Comment s'établit l'équilibre social dans un "état de nature", c'est-à-dire dans une

société où cette forme d'organisation particulière qu'est l'Etat n'existe pas Pour quelles

raisons et quand les individus sont-ils amenés à définir collectivement des règles

institutionnelles ou à s'en remettre à une organisation étatique Répondre à ces différentes

questions permet de bien comprendre les conditions d'émergence d'une « demande d'Etat ».

Naturellement, la forme que prendra l'Etat effectif dépend aussi des conditions de « l’offre

d'Etat ».

La reconstruction logique à laquelle on procède dans ce chapitre n'a aucune prétention

historique. L'émergence de l'Etat dans la réalité a été un processus autrement complexe et

diversifié. Toutefois, tous les mécanismes que l'on analysera dans ce chapitre ont joué à un

moment ou à un autre un rôle déterminant et il est difficile de comprendre l'évolution et le

fonctionnement des Etats modernes sans y faire référence.

Section I: L'équilibre social dans un « état de nature ».

La volonté de reconstruire logiquement le processus d'émergence des institutions

sociales a été une préoccupation constante de la philosophie politique. Le point de départ a été

en général un « état de nature », c'est-à-dire une société sans Etat. Cet état peut être marqué

par la violence et la "guerre de tous contre tous" (comme dans le Leviathan de Thomas

Hobbes (1656)) ou correspondre à une situation plus pacifique (comme dans les Two Treatise

of Government de John Locke(1689)) 12 . Dans le premier cas, l'Etat est une condition de la

survie sociale, dans le second, il est un simple moyen de remédier à des inconvénients.

Ces questions ont été remises au premier plan de l’analyse économique il y a 25 ans

par deux Robert Nozick (dans Anarchia, State, and Utopia, New York: Basic Books, 1974) et

James Buchanan (dans The Limits of Liberty : Between Anarchy and Leviathan, Chicago:

University of Chicago Press, 1975).

L’analyse part d’une société comprenant deux individus, ou deux groupes homogènes

12 Il peut aussi être initialement paisible puis se dégrader de façon irréversible avec l'accroissement de l'inégalité,

comme dans Sur l’origine de l’inégalité de Jean-Jacques Rousseau(1755).

7


d’individus, et a recours à la théorie des jeux pour mettre en évidence les principaux

problèmes posé par l’action collective dans un « état de nature ». On suppose que les jeux

sont non coopératifs. L’hypothèse est que les joueurs ne peuvent pas passer entre eux des

accords qui les engagent de façon certaine (c'est-à-dire matériellement réalisables et qui ne

peuvent pas être remis en cause ex post par la seule volonté de l’un des joueurs). Chaque

individu recherche alors l’utilité maximale pour lui dans le cadre des contraintes posées, sans

tenter de coordonner ses actions avec celles des autres 13 .

Les jeux sont présentés sous forme normale et non sous forme extensive. En d’autres

termes, l’arborescence des choix n’est pas représentée (on ignore leur « dynamique »). Seule

la matrice des gains est étudiée, c'est-à-dire la matrice représentant des gains respectifs de

chaque joueur à la fin du jeu selon les différents cas de figure.

On suppose par ailleurs, sauf précision contraire, que les jeux sont symétriques :

- tous les joueurs accordent la même valeur aux mêmes résultats. Les résultats

diagonaux sont donc de type (x,x) (se reporter par exemple au tableau 1-2);

- les termes symétriques par rapport à cette diagonale sont des images inverses

(du type (x,y);(y,x)).

La symétrie n’est pas nécessaire mais elle permet souvent de simplifier l'analyse sans

perte de généralité, dans la mesure où les choix auxquels sont confrontés les deux agents sont

exactement les mêmes (toute stratégie d’équilibre pour A l’est alors également pour B).

I) Jeux d’assurance, dilemmes du prisonnier et chicken games.

Dans l’analyse des problèmes d’action collective, on distingue trois grandes classes de

jeux : les jeux d’assurance, les dilemmes du prisonnier et les chicken games 14 .

13 Sur la différence entre jeux coopératifs et jeux non coopératifs, cf. Rasmusen(1989 :29 et suiv.). Comme le

remarque cet auteur, dans la réalité, la véritable différence entre les deux types de jeux « lies in the modelling

approach. Both theories start off with the rules of the game, but they differ in the kinds of solution concepts

employed. Cooperative game theory is axiomatic, frequently appealing to Pareto-optimality, … fairness, and

equity. Non cooperative game theory is economic in flavor, with solution concepts based on players maximizing

their own utility functions subject to stated constraints… In applied economics, the most commonly encountered

use of cooperative games is to model bargaining… Cooperative games often allow players to split the gains from

cooperation by making side-payments… The distinction between cooperative and non-cooperative games does

not lie in conflict or absence of conflict ». Rasmusen E.(1989) Games and Information, An Introduction to Game

Theory, Oxford : Basil Blackwell.

14 On préférera l’expression chicken game à sa traduction française « jeu de la poule mouillée » (selon Atkins

B.L. et al. (1995), Le Robert & Collins, dictionnaire français-anglais, anglais-français, 4 ème édition, Paris :

Dictionnaires le Robert.).

8


a) jeux d’assurance et définition de normes sociales

Soit deux conducteurs, A et B, qui peuvent choisir de circuler soit à droite, soit à

gauche, la société n’ayant pas de règles particulières au départ. La matrice des gains est

donnée dans le tableau 1-1. Il s’agit d’un jeu pur de coordination. Si A et B choisissent de

circuler du même côté de la route, c'est-à-dire s’ils font des choix correspondant soit à la

cellule nord-ouest, soit à la cellule sud-est, chacun en retire un gain important (de 1). Au

contraire, les gains respectifs sont nuls s’ils choisissent des côtés différents (gains de 0 dans

les cellules sud-ouest ou nord-est).

Options de A

Circuler à gauche

Optionsde B

Circuler à gauche Circuler à droite

(1,1)

(eq. Nash)

(Pareto opt.)

(0,0)

Circuler à droite

(0,0)

(1,1)

(eq. Nash)

(Pareto opt.)

Tableau 1-1 : Un jeu pur de coordination, le choix des normes de circulation

Note : (x,y) correspond au gain x pour A et au gain y pour B.

Dans les cas les plus simples, les jeux d’assurance possède une seule « solution

prééminente », ou « point focal », liée à des « croyances communes » homogènes (c'est-à-dire

à des éléments non rationnels). L’exemple le plus célèbre est l’expérience effectuée par

Thomas Schelling (dans Strategy of Conflict, Harvard University Press, 1960), où des

personnes devaient se rencontrer un jour donné « à New York », sans préciser ni le lieu ni

l’heure de rendez-vous. La moitié d’entre elles ont choisi la gare centrale et presque toutes

l’heure de midi 15 .

Dans le cas du tableau 1-1, le problème est compliqué par l’existence de deux

solutions prééminentes (tout le monde circule à droite ou tout le monde circule à gauche). Le

choix de l’une ou de l’autre peut alors s’effectuer soit par communication directe entre les

individus et production de normes sociales, soit par apprentissage, une solution se révélant

plus pratique quand le jeu est « répété » (on a par exemple expliqué le choix de chevaucher à

15 Il faut néanmoins préciser que les participants à l’expérience étaient tous originaires de New Haven et que tous

les trains en provenance de New Haven passent par la gare centrale de New York (Grand Central Station).

9


gauche par le fait que, la plupart des personnes étant droitières, il était de la sorte plus facile

de dégainer son épée et de faire front à un adversaire sur des routes peu sûres).

Dans le tableau 1-1, les deux solutions prééminentes sont des équilibres de Nash (ou

de Cournot-Nash). Cela signifie que, si l’on suppose que chaque joueur considère comme

donnée la stratégie de l'autre (c'est-à-dire si personne n'anticipe une possible réaction de

l’autre à sa propre décision), aucun joueur n’aura intérêt à modifier seul son choix 16 .

Soit x d y d les gains de A et B quand ils circulent tous les deux à droite et x g y g les gains

de A et B quand ils circulent tous les deux à gauche. Ces solutions sont des équilibres de Nash

car, pour la case nord-ouest, ∀ x et y, x g y ≤ x g y g et xy g ≤ x g y g et, pour la case sud-est, ∀ x et y,

x d y ≤ x d y d et xy d ≤ x d y d .

Par ailleurs, aucun des équilibres atteints n’est dominé au sens de Pareto par un autre

choix. (1,1) est un optimum parétien, que l’on se place dans la cellule nord-ouest ou dans la

cellule sud-est).

Certains jeux d’assurance peuvent conduire à des équilibres correspondant à des

répartitions des gains très différentes pour les joueurs. Ainsi, dans la « bataille des sexes », un

couple est en désaccord quant à son programme de sortie. Le mari veut assister à un match de

boxe, la femme veut aller au cinéma. Toutefois, ils préfèrent dans tous les cas être ensemble

que séparés. La matrice des gains, que l’on comparera utilement à la matrice du tableau 1-1,

est alors la suivante :

Options de F (femme)

Match de boxe

Cinéma

Options

de M (mari)

Match de boxe (5,2)

M avantagé

(eq.Nash)

(Pareto opt.)

Cinéma

(1,1)

(1,1)

(2,5)

F avantagé

(eq.Nash)

(Pareto opt.)

Tableau 1-2 : Un jeu de coordination impur, la « bataille des sexes »

Note : (x,y) correspond au gain x pour le mari et au gain y pour la femme.

16 En revanche, si un joueur sait que les autres vont modifier leur choix à une certaine date, il peut avoir intérêt à

modifier également le sien, même si la situation actuelle correspond pour lui à un équilibre de Nash. Exemple :

abandon par la Suède de la circulation à gauche pour la circulation à droite à partir du 01/09/1967.

10


Les deux cellules nord-ouest et sud-est (première diagonale de la matrice) sont à la

fois des équilibres de Nash et des optima parétiens (elles n’ont pas de Pareto-supérieurs).

Toutefois, à la différence de ce qui se passait dans le tableau 1-1, ces deux optima n’ont pas

les mêmes conséquences distributives. On appelle ce jeu est jeu de coordination impur car il

contient à la fois des éléments de coordination (aller ensemble au même endroit) et des

éléments de compétition (aller au cinéma ou aller à un match de boxe).

Par rapport au jeu de coordination pur qui précède, la solution sera vraisemblablement

plus difficile et plus longue à faire émerger, mais, une fois celle-ci choisie, elle présentera les

mêmes qualités (optimalité et équilibre de Nash - personne n’a intérêt à en dévier seul).

En définitive, on voit que, dans tous les jeux d’assurance, l’émergence de normes

sociales suffit à atteindre un équilibre optimal, sans risque de déviance de la part des joueurs.

En pratique, ces normes peuvent être produites par l’expérience, par les connaissances

communes ou par une institution spécialisée (un Etat qui se contente d’édicter des règles que

les individus s’appliqueront en général spontanément à eux-mêmes)

b) Dilemmes du prisonnier et passagers clandestins

La société est toujours composée de deux individus (ou de deux groupes homogènes

d'individus), A et B. Chacun a la possibilité d'utiliser ses ressources, soit pour produire de

nouveaux biens, soit pour modifier à son profit la distribution des biens déjà produits. Si les

biens sont tous des biens agricoles et si la violence armée est le seul instrument de

redistribution, les individus ont le choix entre :

- (1) s’engager dans une activité d'agriculteur, avec une forte capacité de produire et

une faible capacité d'attaque et/ou de se défense ;

- (2) s’engager dans une activité de brigandage, avec une forte capacité de redistribuer

par la force à son profit mais une faible capacité de produire.

La cellule sud-est du tableau I-3 correspond à un équilibre de Nash. Ni A ni B ne

modifieront seuls leurs choix. Si A devient agriculteur, B restant brigand, son gain diminue de

2 à 1. De même, si B devient agriculteur, A restant brigand, son gain diminue de 2 à 1.

En réalité, la cellule sud-est correspond à une forme d’équilibre plus robuste qu’un

11


simple équilibre de Nash. Il s’agit d’un équilibre en stratégie dominante. Cela signifie que,

quoi qu’anticipe chaque joueur (que l’autre soit agriculteur ou qu’il soit brigand), chacun a

intérêt à choisir d’être brigand. Lorsque B choisit d'être agriculteur, A gagne 3 comme

agriculteur et 4 comme brigand. Lorsque B choisit d'être brigand, A gagne 1 comme

agriculteur et 2 comme brigand. Dans les deux cas, A a intérêt à choisir la stratégie de

brigandage. Du fait de la symétrie du jeu, on peut dire qu'il en va de même pour B.

La matrice des gains est la suivante:

Options de A

Agriculture

Brigandage

Agriculture

(3,3)

Compromis

(Pareto opt.)

(4,1)

A avantagé

(Pareto opt.)

Optionsde B

Brigandage

(1,4)

B avantagé

(Pareto opt.)

(2,2)

(Eq. en stratégie

dominante)

Tableau 1-3 : Jeu du dilemme du prisonnier

Note : (x,y) correspond au gain x pour A et au gain y pour B.

Ce jeu simple, dit de dilemme du prisonnier, est le jeu de coordination le plus connu

et il joue un rôle très important dans la théorie des choix sociaux. Il correspond en effet à une

situation où la poursuite de son intérêt personnel par chacun conduit à des équilibres sousoptimaux

au sens de Pareto. Dans l'exemple du tableau 1-3, la position d'équilibre sud-est

(2,2) est dominée au sens de Pareto par la position nord-ouest (3,3). Si les joueurs pouvaient

coordonner efficacement leurs actions, ils atteindraient la position nord-ouest (avec trois pour

A et trois pour B). Mais cette solution n’est pas une situation d’équilibre : A et B ont intérêt

l’un et l’autre à prendre des engagements (à s’engager à être agriculteur et à reconnaître

certains droits de propriété) puis à ne pas les respecter par la suite.

Les cas de dilemme du prisonnier sont fréquents dans les situations d’action collective,

en particulier dans les relations internationales, qui conservent par de nombreux aspects les

caractéristiques d’un « état de nature ». La période de la guerre froide est, par son caractère

bipolaire, celle qui s’est rapprochée le plus du modèle de jeu simple retenu ici. L’impossibilité

d’obtenir des accords de désarmement entre deux superpuissances, qui cependant disposaient

12


chacune de quoi faire exploser près d’une dizaine de fois la planète (alors qu’une seule fois

pouvait raisonnablement sembler un maximum), peut s’interpréter comme un équilibre en

stratégie dominante dans un jeu de dilemme du prisonnier 17 .

La raison principale de la sous-optimalité des équilibres atteints est l’impossibilité de

passer des contrats crédibles. Si, dans le tableau 1-3, un joueur était sûr que l’autre puisse

s’engager de façon irrévocable à être agriculteur, il accepterait lui-même de prendre le même

engagement. L’équilibre s’établirait alors dans la cellule Pareto optimale nord-ouest.

Malheureusement, quand A (resp. B) tient ses engagements (est agriculteur), B (resp. A) a

intérêt à ne pas respecter les siens (à devenir brigand). On dit que B (resp. A) a intérêt à se

comporter en passager clandestin (free-rider). Ce problème du passager clandestin, qui est

inexistant dans les jeux d’assurance, fait qu’il n’est plus suffisant d’édicter des règles ou des

normes sociales. Il faut qu’elles soient respectées. Le problème central devient celui de la

capacité de faire respecter des règles – rule enforcement – et, plus généralement, celui de leur

assurer une crédibilité suffisante.

Origine du terme « dilemme du prisonnier » : le terme provient du contenu du jeu

proposé à l’origine, où un prisonnier accusé d’un crime avec un complice doit choisir entre

avouer et ne pas avouer. Les suspects sont placés dans des cellules séparées. Ils ne peuvent

donc pas communiquer entre eux ni, a fortiori, conclure des accords. Le juge informe chacun

que (1) si seulement l’un des deux avoue, celui qui a avoué est condamné à une peine légère

(2 ans) et celui qui n’a pas avoué à une peine maximum (10 ans), que (2) si aucun n’avoue, les

deux sont condamnés à une peine légère (2 ans) et que (3) si les deux avouent, ils sont

condamnés à une peine intermédiaire (5 ans). Il est facile de montrer qu’avouer est une

stratégie dominante pour chacun des suspects (elle minimise leur condamnation quoi que

fasse l’autre). En revanche, l’équilibre atteint, où les deux avouent, est clairement Paretoinférieur

à ce qu’ils auraient obtenu en n’avouant ni l’un ni l’autre (mais cela aurait nécessité

au minimum une concertation entre eux – exclue par hypothèse – et une crédibilité minimale

des engagements pris par chacun).

17 cette suraccumulation s’explique pour sa part par une « dynamique de la course aux armements », où l’écart

d’armement avec l’adversaire compte plus que son niveau absolu (conformément au modèle célèbre de L.F.

Richarson, publié dans Arms and Insecurity : A Mathematical Study of the Causes and Origins of War,

Pittsburgh: The BoxWood Press, 1960).

13


c) Chicken games

Les situations de dilemme du prisonnier sont socialement coûteuses mais elles ont au

moins le mérite de la stabilité, puisque chaque joueur dispose d'une stratégie dominante

(indépendante du choix de l'autre). Dans la situation dite de "chicken game", présentée dans le

tableau 1-4, même cet avantage de stabilité disparaît. Supposons que la matrice des gains soit

modifiée comme suit:

Options de A

Agriculture

Brigandage

Agriculture

(3,3)

Compromis

(4,2)

A avantagé

Optionsde B

Brigandage

(2,4)

B avantagé

(1,1)

Situation de

désastre

Tableau 1-4: Situation de "chicken game"

Note: (x,y) correspond au gain x pour A et au gain y pour B.

Comme on le vérifie facilement en calculant les gains de A et B quand chacun modifie

unilatéralement son choix, il existe maintenant deux équilibres de Nash (cellule sud-ouest

pour le premier, cellule nord-est pour le second).. A choisit ainsi d'être agriculteur quand il est

sûr que B choisit d'être brigand et réciproquement. Comme B gagne plus dans le cas de

l’équilibre de la cellule sud-ouest, il a un intérêt évident à persuader A que, quoi qu'il arrive, il

choisira la stratégie de brigandage : s’il y parvient, A décidera effectivement de devenir

agriculteur, pour le plus grand bénéfice de B. Le problème est que A va effectuer exactement

le même raisonnement. Il sait que, s’il parvient à persuader B qu’il sera quoi qu’il arrive

brigand, alors B décidera d’être agriculteur. Le drame du chicken game est que, si chacun

maintient effectivement ses positions (si personne ne veut céder), on aboutira à la cellule sudest,

c'est-à-dire à la pire des quatre situations représentées dans le tableau 1-4.

A l’origine, le chicken game est un « jeu » où deux automobiles roulent en sens

inverse dans une rue étroite et où le premier qui monte sur le trottoir a perdu. La variante la

14


plus célèbre est celle du film de James Dean, La fureur de vivre 18 , où les deux automobilistes

roulent en direction d’un ravin en sachant que le vainqueur est le dernier qui freine.

Le chicken game offre une bonne représentation des situations de crise, notamment en

matière internationale. La crise de missiles de Cuba, en octobre 1962, est un cas type, avec un

problème très spécifique de crédibilité des menaces nucléaires proférées par les protagonistes

(J.F.Kennedy et N.Kroutchev). Chaque chef d’Etat pouvait en effet croire que la menace de

l’autre d’utiliser l’arme nucléaire n’était pas crédible, qu’il ne prendrait la responsabilité de

faire exploser la planète et n’appuierait donc pas sur le bouton au dernier moment. Or, c’est

justement à cause de ce manque de crédibilité de la menace nucléaire que la situation est

devenue particulièrement dangereuse.

Par rapport à un jeu de dilemme du prisonnier, le chicken game présente des équilibres

multiples et moins stables. La moindre stabilité vient de ce que les équilibres sont seulement

des équilibres de Nash et non des équilibres en stratégie dominante. La multiplicité des

équilibres est de son côté la source d’un conflit distributif entre les joueurs. Cela les incite à

s’engager – à se « précommettre » (precommit) - de la façon la plus crédible (la plus

irrévocable) possible. Le risque est d’aboutir alors à la situation de la cellule sud-est, c'est-àdire

aux gains, positifs ou négatifs, les plus faibles pour tous. Dans les situations de chicken

game, le problème central n’est donc pas celui de la sous-optimalité, comme dans un dilemme

du prisonnier, mais la nécessité d’éviter que le conflit distributif n’aboutisse à une situation de

« désastre ».

II L'émergence de la coordination

Dilemme du prisonnier et chicken game sont deux modèles essentiels pour l'analyse

des choix politiques et sociaux car ils incitent à penser que l'allocation des ressources dans

« l’état de nature » sera très inefficace. Les individus ont tendance à investir beaucoup trop en

moyens de protection de leurs avoirs et/ou en moyens d'appropriation des avoirs des autres.

Toutefois, la vie des individus dans l’état de nature n’est pas nécessairement aussi « solitaire,

pauvre, pénible, bestiale et brève » (« solitary, poore, nasty, brutish, and short ») que le pense

Thomas Hobbes dans le Leviathan. En particulier, si le coût des investissements militaires

défensifs est inférieur à celui des investissements militaires offensifs, la société sera

18 Rebel Without a Cause pour le titre américain original.

15


elativement pacifique. Par ailleurs, une certaine propriété de fait sera respectée si les

individus peuvent dissuader les prédateurs potentiels en les menaçant de coûts très supérieurs

aux avantages nets qu'ils peuvent espérer. Des échanges volontaires entre individus et groupes

peuvent alors parfaitement s’instaurer. En d’autres termes, une institution de type étatique

n'est pas, comme on le prétend parfois, une condition nécessaire de l’émergence du marché

(même s’il s’agit vraisemblablement d’un passage obligé pour son expansion au-delà d'un

certain seuil).

Dans le cas de dilemme du prisonnier comme dans celui de "chicken game", les

individus cherchent à passer à des situations Pareto-supérieures en instaurant un certain degré

de « coopération » entre eux. A ne peut en effet choisir d'être agriculteur que si B s'engage à

l'être également et s’il y a une probabilité suffisante pour que B tienne son engagement. Le

même raisonnement vaut pour B.

En pratique, les individus sont rarement totalement ignorants quant à la capacité des

autres joueurs de respecter leurs engagements ou des règles socialement imposées. Soit a 11 , le

gain de A dans la cellule nord-ouest du tableau 3-1, a 21 son gain dans la cellule nord-est et a 22

son gain dans la cellule sud-est. A doit choisir entre être agriculteur en passant un accord avec

B ou rester brigand. Si A choisit l’accord, il se retrouvera dans la cellule nord-ouest (solution

coopérative) si B tient ses engagements et dans la cellule nord-est si B ne tient pas ses

engagements. En supposant pour simplifier que les individus sont neutres par rapport au

risque, ce choix dépend de la valeur espérée de l’accord avec B pour A.

Soit E(V A ) = p eB . (a 11 - a 22 ) + (1-p eB ) . (a 21 - a 22 ), où :

- p eB représente la probabilité que l’engagement pris par B soit tenu,

- (a 11 - a 22 ) est le gain net apporté par la solution coopérative quand B

respecte ses engagements,

- (a 22 - a 21 ), négatif, correspond au coût supporté par A quand B ne respecte

pas ses engagements.

En reprenant les valeurs retenues dans la matrice des gains du tableau 1-3, on vérifie

facilement que E(V A ) = 2 . p eB – 1. A accepte de signer l’accord si p eB > 0,5. Dans le cas

contraire, il préfère l’équilibre en stratégie dominante (cellule sud-est). De même, on obtient

pour B, E(V B ) = p eA . (b 11 - b 22 ) + (1-p eA ) . (b 12 - b 22 ) = 2 . p eA – 1. B accepte de signer l’accord

si p eA > 0,5. Il y a donc accord si min (p eA, p eB ) > 0,5.

De façon générale, les individus peuvent sortir d’une situation de dilemme du

prisonnier pour trois raisons : (1) parce qu’ils détiennent une information qu’ils jugent

suffisante sur les autres joueurs (information qui peut avoir été accumulée au cours de jeux

16


antérieurs), (2) parce qu’ils sont en mesure de limiter leurs pertes si les événements se passent

mal en changeant de comportement au cours de phases ultérieures du jeu (ce qui suppose que

le jeu soit « répété »), (3) parce que des interventions externes viennent modifier la structure

des gains des différentes options (des pénalités imposées par « l’Etat » peuvent par exemple

augmenter considérablement le coût espéré de l’option « brigandage »).

Expérimentalement, on observe que les situations de dilemme du prisonnier ou de

"chicken game" conduisent habituellement à la solution coopérative (cellule nord-ouest)

lorsque le jeu est joué plusieurs fois par les mêmes joueurs (lorsque le jeu est répété, c'est-àdire

correspond à un superjeu). La raison en est simple: si B ne joue pas « agriculteur » quand

A a joué « agriculteur », A peut toujours lui « rendre la pareille » (redevenir « brigand ») lors

de la partie suivante (stratégie de tit for tat). De façon générale, la solution coopérative

apparaîtra chaque fois que les joueurs peuvent effectuer des menaces crédibles de représailles

pour tout joueur qui n’adopterait pas le comportement auquel il s’est engagé.

Dans les communautés de faible taille et homogènes, l’information sur les punitions

encourues par les individus qui n'adoptent pas un comportement coopératif est facile à

diffuser et il est peu coûteux de détecter ceux qui ne respectent pas les règles posées (les

« passagers clandestins » ou « déviants » - free riders). Le marché pour les activités de

punition et de protection n'est pas suffisamment large pour justifier une division du travail

(une production d'ordre par des spécialistes).

Dans les sociétés nombreuses et hétérogènes, au contraire, les coûts associés au

problème de la non-coopération sont beaucoup plus importants. Il n'est possible de sortir de

situations initiales de dilemme du prisonnier ou de "chicken game" que par l'instauration:

- de règles formelles définissant le "bon" comportement;

- d'un système associant pénalités et récompenses au respect ou au non-respect des

règles précédentes;

- d'une organisation chargée de l'application des pénalités et récompenses;

Les deux dernières conditions sont liées à la possibilité que des agents se comportent

en "passager clandestin". Fondamentalement, l'Etat apparaît comme une organisation

permettant de produire des comportements coopératifs en édictant des règles et en ayant

recours à la coercition pour imposer leur respect.

17


Section II L'entreprise Etat et son développement

On vient de voir que, si l’on excepte les situations correspondant à des jeux

d'assurance, l’impossibilité de coordonner les actions individuelles peut conduire soit à des

situations sous optimales (jeu de "dilemme du prisonnier"), soit à des situations de désastre

(« chicken game »). La demande de garantie des contrats passés, autrement dit la demande

d'ordre, est l’une des principales causes de la création de cette entreprise originale de services

qu'est l'Etat.

L’instauration de l’institution étatique va avoir de profondes conséquences. Tout

d'abord, les incitations à investir en moyens d’attaque ou de défense disparaissent. Aucun

individu ne peut plus obtenir des redistributions par la force et il devient ainsi inutile de se

protéger. En conséquence, un montant important de ressources devient disponible pour la

production. De plus, parce que les engagements pris deviennent crédibles, les possibilités

d'échange s'élargissent considérablement. La spécialisation productive devient alors possible

sur une large échelle : pour un même montant de ressources, il est possible de produire

beaucoup plus. L'Etat, même si, comme on l’a vu, n’est pas la condition de l’émergence du

marché, devient clairement l’une des causes de son développement. La possibilité de

contraindre les individus a aussi une autre conséquence : l’Etat peut financer par la fiscalité un

volume plus adéquat de biens publics (par comparaison avec une situation de « provision

volontaire » de ces biens) ainsi que différentes interventions correctrices.

I) La production des biens publics

Soit une collectivité qui doit se protéger contre les inondations en construisant une

digue de sable. Plus la digue est haute et mieux la collectivité est protégée. Il s'agit ici

clairement d'un bien public pur (à consommation indivisible).

Supposons d'abord que chaque individu i contribue librement à la fourniture de ce bien

public en amenant le nombre gi de sacs de sable qu'il désire. La valeur totale de la protection

apportée et donc du service dont bénéficie chaque membre de la collectivité dépend de la

hauteur de la digue, donc de G = gi + ∑ gj, avec j≠i.

L'individu i a une fonction d'utilité Ui=Ui(xi,G), continue, dérivable à l’ordre deux et

concave, où xi est la quantité de bien privé consommé par i. Pour un revenu yi et des prix p x

(prix du bien privé) et p g (prix du bien public), la contrainte budgétaire s'écrit:

18


yi= p x .xi + p g .gi = p x .xi + p g .(G-∑ gj).

On suppose que i adopte un comportement de type Nash, c'est-à-dire que les quantités

apportées par les autres sont données : gj = constante pour tout j≠i. Donc, ∑ gj= constante.

La maximisation de Ui sous contrainte de yi conduit à:

L = Ui(xi,G) + λ. (yi - p x .xi - p g .(G-∑ gj)

Conditions de premier ordre.

δUi/δG -λ.p g =0

δUi/δxi - λ.p x =0

soit: (δUi/δG)/(δUi/δxi)= p g /p x

(C1)

L’individu i apporte volontairement des sacs de sable jusqu’à ce que le taux marginal

de substitution pour lui entre bien public et bien privé soit égal au rapport des prix.

Examinons maintenant les conditions correspondant à un optimum parétien (c'est-àdire

à dire au comportement d’un décideur central bienveillant).

Il s’agit de maximiser Ui(xi,G) sous une contrainte générale de ressources

(Y= p x .(xi+∑xj)+p g .G) et pour des valeurs fixées des niveaux d’utilité des autres individus

(Uj(xj,G) =⎺Uj pour tout j≠i).

L = Ui(xi,G) + λ. (Y-p x .(xi+∑xj)-p g .G) + ∑ µj. (Uj(Xj,G)- ⎺Uj)

Conditions de premier ordre :

δUi/δxi-λ.p x =0

µj.δUj/δxj-λ.p x =0 pour tout j≠i

δUi/δG+ ∑ µj.δUj/δG - λ.p g =0

En combinant on obtient:

(δUi/δG)/(δUi/δxi) + ∑ (δUj/δG)/(δUj/δxj) = p g /p x

(C2)

ce qui correspond à la condition traditionnelle d'optimalité en cas de biens publics (condition

de Samuelson) : la somme des taux marginaux de substitution entre bien public et bien privé

doit être égale au prix relatif du bien public et du bien privé.

La comparaison de C1 et de C2 permet de voir que la quantité de bien public produite

par provision volontaire (C1) sera vraisemblablement très inférieure à l'optimum (C2). En

d’autres termes, l’individu i apportera volontairement un nombre de sac de sables beaucoup

plus faible que celui qu’un décideur central bienveillant lui indiquerait d’apporter à

l’optimum. Si x et G sont des biens normaux, les tms (δUi/δG)/(δUi/δxi) et

19


(δUj/δG)/(δUj/δxj) sont positifs et décroissants.

C2 peut s’écrire : (δUi/δG)/(δUi/δxi) = p g /p x - ∑ (δUj/δG)/(δUj/δxj) < p g /p x

Le TMS à l’optimum (δUi/δG)/(δUi/δxi) est inférieur à sa valeur de provision

volontaire (C1). Il correspond donc à un montant G* supérieur à ce que l’individu apporte

spontanément : la provision volontaire bien public correspond à une sous-provision. Cette

sous-provision augmente avec la taille de la collectivité (∑ (δUj/δG)/(δUj/δxj) étant d’autant

plus élevé que n, le nombre d’individus, est élevé). En d’autres termes, les bénéfices anticipés

de la coordination des contributions individuelles sont croissants.

Remarques terminales :

1) Si la provision centralisée peut permettre d’atteindre l’optimum, rien n’assure

qu’elle l’atteindra réellement. Tout d’abord, cette méthode d’allocation des ressources

implique de connaître les conditions de demande, c'est-à-dire l’ensemble des taux marginaux

de substitution entre bien privé et bien public pour tous les membres de la collectivité. Non

seulement cette information est très coûteuse à rassembler mais elle risque également d’être

manipulée (les individus ayant intérêt à ne pas révéler leurs véritables TMS). Par ailleurs, les

responsables politiques et administratifs peuvent avoir intérêt à biaiser systématiquement la

révélation et l’agrégation des préférences individuelles. Enfin, rien ne garantit que les

décideurs centralisés souhaitent véritablement parvenir à une allocation efficace des

ressources. Si l’on tient compte de ces coûts et biais spécifiques de l’allocation centralisée, la

provision volontaire de biens publics sera, au moins dans certains cas, beaucoup moins

dominée que l’analyse précédente le laisse supposer.

2) On a supposé, dans l’exemple présenté, que le bien public était de type

"sommation", c'est-à-dire que la quantité disponible pour tous était la somme des

contributions individuelles. Il existe deux autres grands types de biens publics : (a) les biens

de type "maillon faible" (weakest link), où la quantité disponible pour tous dépend de la

contribution de celui qui apporte le moins (voir encadré ci-dessous) et (b), à l'autre extrême,

les biens de type "meilleur tireur" (best shot), où la quantité disponible du bien public est

égale à la contribution de celui qui apporte la quantité la plus forte. Les analyses d’économie

expérimentale tendent à montrer que, au moins pour les collectivités de petite taille, l'écart

entre la provision volontaire et l'optimum est plus faible pour les biens publics de type

weakest link qu’avec les biens publics de type sommation et, a fortiori, avec ceux de type best

shot.

20


3) Les biens publics sont en un certain sens un cas limite d’effets externes, c'est-à-dire

de situations où la consommation ou la production d’un agent économique a des

conséquences non voulues et non prises en compte par lui dans ses décisions sur la production

ou la consommation des autres. Ce qui vient d’être dit pour les biens publics vaut en général

pour l’ensemble des effets externes. Les seules différences viennent de ce que : (a) l’effet

externe peut être autant la source d’un « bien » que celle d’un « mal », (b) tous les membres

de la collectivité concernée ne consomment pas nécessairement le bien (ou le mal) en quantité

égale, (c) la production volontaire d’effets externes (notamment de déséconomies externes)

est beaucoup plus fréquente que celle de biens publics (dans la mesure où l’individu qui en est

responsable ne se préoccupe que des coûts ou des avantages pour lui de sa décision).

Biens publics de type « maillon faible » et « meilleur tireur »

L’exemple type de bien public weakest link (maillon faible) est celui d’un groupe

d’agriculteurs qui construisent une clôture pour protéger leurs cultures de l’intrusion des

animaux. On suppose que chacun possède un des quatre terrains A, B, C, D de sur la figure cidessous.

Chacun est censé construire volontairement la partie de clôture correspondant aux

deux côtés extérieurs de sa propriété (tracés en trait plein gras). Il est clair que la protection

apportée au groupe dépend de la barrière la plus basse (du « maillon faible »). L’incitation à

adopter un comportement de passager clandestin (free rider) est limitée par le risque d’être le

maillon le plus faible et donc de décider du niveau final de protection apporté à tous (et donc

à soi-même).

Terrain de A

Terrain de D

Terrain de B

Terrain de C

Dans le cas de biens publics de type best shot (meilleur tireur), le problème est

exactement inverse. L’incitation à être passager clandestin (à faire peu d’effort dans la

fourniture volontaire du bien) est très forte car (a) la probabilité d’être celui qui fournit

effectivement le bien en tant que « meilleur tireur » est faible (au moins dès qu’un groupe un

tant soit peu nombreux est concerné) et (b) la probabilité qu’un autre fasse au moins aussi

bien que vous est très élevée. Le meilleur moyen de résoudre le problème de fourniture des

biens publics best shot (la production de découvertes scientifiques par exemple) est de fournir

des incitations personnelles fortes à un effort efficace pour les fournisseurs potentiels

(monétaires et/ou non monétaires).

21


II La définition optimale des droits de propriété

L’existence d’un Etat permet de supprimer les inefficacités liées à ce que l’on appelle

la « propriété commune » en instaurant un système de droits de propriété, c'est-à-dire de

droits exclusifs d’usage et de transfert de la propriété de différents biens.

Soit une ressource naturelle appropriée en commun et dont l’offre est fixe ; un lac où

des pêcheurs peuvent venir librement pêcher par exemple. On suppose que tous les pêcheurs

sont identiques et que le coût d’opportunité de leur activité est constant : le salaire qu’ils

peuvent obtenir en travaillant ailleurs est w. La quantité totale de poissons pêchés est Q =

Q(L), où L est le nombre de pêcheurs. La productivité moyenne, Q/L, représente le nombre de

poissons pêchés par chaque pêcheur. La productivité marginale, dQ/dL, représente la

contribution d’un pêcheur supplémentaire à la quantité totale. Pour simplifier, on fait

l’hypothèse que (a) les courbes de productivité sont linéairement décroissantes et que (b) le

prix du poisson est normalisé à 1 : les quantités physiques sont donc identiques aux quantités

monétaires et les productivités en volume ne diffèrent pas des productivités en valeur.

Les pêcheurs vont entrer jusqu’à ce que la productivité moyenne (ce que leur rapporte

la pêche à chacun) soit égale au taux de salaire (w=OW). Cela correspond au point Z sur la

figure 1. En ce point, la ressource naturelle (le lac) est exploitée jusqu’au point où la « rente »

que procure cette ressource est nulle : la valeur totale de la pêche (ZWOL z ) est égale à son

coût d’opportunité. Le point qui maximise la rente est celui pour lequel la productivité

marginale (la contribution à la pêche globale du dernier pêche entré) est égale au taux de

salaire. La rente est égale à la différence entre la valeur globale de la pêche (YUOL y ) et le

coût d’opportunité global (XWOL y ).

Le libre accès à la ressource naturelle (au lac) est donc une source de surexploitation

de cette ressource. La raison de ce phénomène est simple. En Z, le pêcheur obtient pour lui

une quantité L z Z (égale à son coût d’opportunité privé, OW), mais il n’accroît la quantité

totale que de L z T (du montant de sa productivité marginale). Le montant TZ, qui a été pêché

au détriment des pêcheurs inframarginaux (c'est-à-dire déjà présents sur le lac), correspond à

un pur gaspillage de facteur travail (il aurait été pêché de toute manière).

Le phénomène de surexploitation qui précède est connu sous le nom de « Tragedy of

the Commons » (« tragédie de la propriété commune »). Le fait d’instaurer un droit de

propriété individuel apporte une solution simple, dans la mesure où c’est maintenant le

propriétaire unique qui décide de l’entrée : aussi longtemps qu’il cherche à maximiser la rente

que lui procure la ressource naturelle, le nombre de pêcheurs qu’il emploiera (au salaire w)

22


pour pêcher dans le lac sera de L y (point où la productivité marginale du dernier pêcheur est

égale au salaire w payé).

Il est parfois possible d’estimer directement la valeur de certains droits de propriété,

quand , par exemple, l’Etat décide de vendre au secteur privé des terres auparavant laissées en

libre accès ou quand il met aux enchères des licences d’utilisation exclusive de nouvelles

fréquences radio. Le prix que les acheteurs acceptent de payer est une bonne mesure de la

somme actualisée des rentes qu’ils anticipent.

Remarque : l’émergence de la rente est due au caractère exclusif du droit de propriété

(à l’existence d’un seul décideur quant à la quantité de travail à employer pour exploiter la

ressource naturelle) et non au fait que la propriété soit publique ou privée. Si le droit de

propriété est privé, l’Etat pourra toujours reprendre une partie de la rente par une fiscalité

adéquate, de préférence proportionnelle et suffisamment faible pour préserver les incitations à

maximiser. Dans le cas d’un droit de propriété public, le résultat dépendra des objectifs du

décideur. Si celui-ci cherche à maximiser les recettes fiscales de l’Etat, son choix sera le

même que celui d’un décideur privé. S’il est guidé par des objectifs plus « socio-politiques »

(de maximisation du volume de l’emploi à court terme par exemple), il aura alors plutôt

tendance à se rapprocher du point Z (tout en sachant que le coût d’opportunité de cette

politique se mesure par le montant de la rente « gaspillée » en ne se plaçant pas en Y).

23


Pté moyenne

Pté marginale

Tx de salaire

U

Y

W

X

Z

T

O

Ly

Lz

L (travail)

Figure 1-1 : Surexploitation en cas de propriété commune

Les résultats précédents permettent de mettre en évidence une partie des effets de la

définition de droits de propriété. Toutefois, ils sont fondés sur des hypothèses très

simplificatrices (travail homogène, absence d’avantages comparatifs dans l’utilisation de la

ressource naturelle, technique de production simple, pas de barrières à l’entrée, etc.). Dans la

réalité, définir et faire respecter les conditions d’exclusivité de l’usage et du transfert de la

propriété peut se révéler très coûteux.

Selon les cas, la comparaison des coûts aux avantages espérés (somme actualisée des

rentes anticipées) pourra conduire soit à maintenir une propriété commune (à ne pas définir de

droits de propriété), soit à définir des droits incomplets, soit à définir des droits complets mais

à ne les faire que partiellement respecter. Dans ce dernier cas, on retrouve une logique proche

de la « demande de crime » dans la théorie du crime de G. Becker : la société « accepte » un

certain taux de « criminalité » car réduire ce taux à zéro serait plus coûteux que les avantages

espérés.

Sur la figure 1-2, la valeur actuelle des rentes anticipées est une fonction croissante du

degré de certitude ρ des droits de propriété (indicateur tenant compte à la fois de la précision

et de la probabilité de respect des droits existants). Il en va de même pour la valeur actualisée

des coûts associés à la définition et au respect de ces droits (plus le droit est précis et bien

24


especté, plus les coûts sont élevés). On remarquera que ρ dépend fortement de la stabilité

anticipée des règles définissant la propriété, et donc de facteurs comme l’instabilité politique

ou le caractère plus ou moins discrétionnaire de la politique publique. Dans une étude récente,

S. Borner, A.Brunetti et B.Weder (1995, Political Credibility and Economic Development,

New York : St Martin’s Press) ont montré que cet aspect des droits de propriété jouait un rôle

central dans les choix des investisseurs internationaux.

Coûts et

avantages

actualisés de

l’instauration

de droits de

propriété

Coûts

actualisés

Avantages

actualisés

0

ρ∗ (degré

optimal)

1

Degré de précision et

de certitude des

droits de propriété

Figure 1-2 : degré optimal de précision et de certitude des droits de propriété

Dans le cas de la figure 1-2, l’optimum correspond à des droits de propriété

imparfaitement définis (ou respectés de façon seulement partielle). Selon la forme des

courbes, l’optimum pourra conduire soit à laisser le bien en propriété commune, soit à

produire des droits mal définis ou dont le respect est mal assuré, soit établir des droits

parfaitement définis et certains (dont le respect est pleinement assuré). Dans les sociétés

modernes, la propriété totalement commune est relativement rare mais il existe de nombreux

cas où le degré de précision et de certitude des droits demeure sensiblement éloigné de 1.

L’instauration de droits de propriété privés ne correspond pas nécessairement à une

amélioration parétienne, comme le montre la figue 1-3. Il se peut que l’augmentation

25


d’efficacité (le non-gaspillage des rentes) s’accompagne d’une augmentation très forte des

inégalités. Dans ce cas, et au moins en l’absence de transferts permettant de corriger la

distribution pour se rapprocher du nouvel optimum optimorum (point R sur la figure 1-3), le

bien-être social peut diminuer (sans que l’on puisse estimer la probabilité pour qu’une telle

situation se produise effectivement).

U i

Courbes

d’indifférence

sociale

Frontière initiale des

possibilités de production

A

R

Frontière des possibilités de

production avec droits de

propriété

P

Figure 1-3 : Instauration des droits de propriété et bien-être social

U n-i

On suppose dans la figure 1-3 que la société est divisée en deux groupes, l’individu i

d’une part (fonction d’utilité U i ), et tous les autres individus d’autre part (fonction d’utilité

individuelle représentative notée U n-i ). L’équilibre de l’état de nature est A tandis que

l’équilibre après instauration des droits de propriété est P. Compte tenu de la forme des

courbes sociales d’indifférence, on voit que, si la frontière des possibilités de production après

droits de propriété domine la frontière initiale, l’accroissement de l’inégalité de la distribution

des ressources fait plus que compenser cet avantage : l’équilibre P correspond à une courbe

d’indifférence sociale plus basse que celle qui passe par A. Il est toutefois évident que, si des

transferts forfaitaires sont possibles, l’économie peut atteindre le point R, c'est-à-dire un point

correspondant à un niveau de bien-être nettement plus élevé que dans l’état de nature.

La propriété commune correspond à une situation particulière d’interdépendances non

prises en compte (génératrices d’effets externes). Plus généralement, chaque fois que la

législation publique laisse un droit de propriété non défini ou mal défini, pour des motifs de

26


coût ou pour toute autre raison, la collectivité est potentiellement confrontée des problèmes

d’effets externes. Face à une telle situation, trois solutions sont envisageables :

- l’Etat définit, précise et/ou assure un meilleur respect des droits de propriété

concernés. Les individus peuvent alors régler le problème « spontanément », mais pas

nécessairement sans coût, selon une logique de négociation à la Coase (voir ci-dessous) ;

- l’Etat modifier l’environnement pour faire en sorte que les agents internalisent les

effets externes, soit à l’aide d’incitations positives – en modifiant la structure de prix à la

Pigou, soit en s’appuyant sur des incitations négatives – en réglementant ou en instaurant des

pénalités suffisamment élevées et suffisamment crédibles pour dissuader les agents de ne pas

respecter la réglementation ;

- l’Etat n’intervient pas, le statu quo ayant pour avantage de n’avoir aucun coût de

mise en œuvre (no implementation costs).

Pour chaque objectif d’internalisation donné, le choix d’une solution particulière

dépendra de son coût comparé à celui des deux autres. Le résultat dépendra fortement du type

d’effet externe concerné et de son ampleur.

III Accords volontaires et clubs

a) Théorème de Coase

Enoncé initial du théorème in Ronald Coase (1960), « The Problem of Social Cost », Journal

of Law and Economics, 3 (Oct.) :1-44.

Voir également C.G. Veljanovski (1982), « The Coase Theorem and the Economic Theory of

Markets and Law », Kyklos, 35 (1) :53-74.

Depuis A.C. Pigou, l’économie publique normative traditionnelle admet que, en cas

d’effets externes, seule une intervention discrétionnaire de l’Etat, en général sous forme de

taxe ou de subvention, est capable de rétablir l’équilibre. Aucune action volontaire ne serait

en mesure de corriger la sous-optimalité du marché en réconciliant les coûts et avantages

« privés » avec les coûts et avantages « sociaux » (c'est-à-dire en internalisant d’un commun

accord les effets externes).

Le « théorème de Coase » montre, au contraire que, sous réserve que les coûts de

transaction soient nuls, les agents concernés par un effet externe peuvent se mettre d’accord

sur une allocation parétienne des ressources, quelle que soit la structure initiale des droits

de propriété – mais à la condition que cette structure soit clairement définie (que ce soit

par la loi, par la coutume ou par suite d’un commun accord entre les parties concernées).

27


Coûts marginaux

Coût marginal de

la dépollution

Coût marginal

social de la

pollution

E

O

Q E

(pollution

optimale)

Q M

(pollution

« naturelle »)

Q (niveau

de pollution)

Figure 1-4 : Internalisation des effets externes par négociation

Dans la figure 1-4, une entreprise pollue l’environnement, avec un coût social

marginal croissant pour la population environnante. Parallèlement, la réduction de la pollution

implique des coûts marginaux qui sont d’autant plus élevées que l’on s’éloigne du point Q M

de pollution « naturelle » (c'est-à-dire de la pollution que l’on observerait sans système de

dépollution) et que l’on se rapproche du point de pollution zéro.

Si les droits sur l’air appartiennent aux pollueurs (ici à l’entreprise), le point de départ

est Q M : l’entreprise n’effectue aucune dépense susceptible de réduire la pollution que subit la

population. L’initiative viendra de la population. Celle-ci proposera de payer les coûts de

dépollution à l’entreprise jusqu’en E, point au-delà duquel le coût marginal social de la

pollution devient inférieur au coût marginal de la dépollution.

Si les droits sur l’air appartiennent maintenant à la population, le point de départ est

une pollution nulle. L’initiative vient alors de l’entreprise. Jusqu’au point E, celle-ci préférera

dédommager la population (payer le coût marginal social de la pollution dont elle est

responsable) plutôt que de supporter le coût marginal plus élevé de la dépollution. Au-delà du

point E, en revanche, l’entreprise préférera payer le coût de la dépollution plutôt que de

dédommager la population. On voit donc que, dans tous les cas, que les droits de propriété sur

28


l’air soient attribués à l’entreprise ou à la population environnante, on aboutit en E. Or, en ce

point, le coût marginal de la dépollution est égal au coût marginal de la pollution, ce qui

correspond exactement aux conditions de correction optimale de l’effet externe.

Le théorème de Coase montre que la correction des effets externes n’implique

pas nécessairement une modification par l’Etat de la structure des prix (taxes – ou subventions

- à la Pigou) ni a fortiori une suppression du marché (avec fourniture du bien par une

entreprise publique en monopole et censée produire au prix « optimal »). Les agents

concernés par un effet externe peuvent parfaitement internaliser cet effet s’ils se mettent

d’accord sur une structure contractuelle de « droits » de propriété non définis au départ (règles

de bon voisinage par exemple) ou si l’Etat se contente de préciser ou d’établir ces droits

(utilisation des fréquences radio par exemple).

Mais le théorème de Coase présente un autre intérêt, celui de mettre en

évidence, a contrario, les raisons susceptibles de justifier une intervention publique lorsque les

hypothèses posées par Coase ne sont pas vérifiées :

1- Hypothèse de droits de propriété définis : comme on l’a vu, la définition de droits

de propriété peut être plus coûteuse que la somme actualisée des avantages anticipés de cette

définition. Dans ces conditions, on préférera, selon le montant des coûts et avantages, soit

recourir à d’autres modes de correction (taxation à la Pigou, réglementation du marché, etc.)

soit ne pas intervenir du tout (ne pas chercher à corriger les effets externes, c'est-à-dire les

laisser en « propriété commune »).

2 – Hypothèse de coûts de transaction nuls : cette hypothèse est intenable dès que le

nombre des individus concernés par l’effet externe dépasse un certain seuil. Dans le cas de

l’entreprise polluante, ce problème est inexistant du côté du pollueur (l’entreprise est seule). Il

se pose en revanche de façon aiguë pour les milliers d’individus qui subissent la pollution.

Leurs coûts d’information et de coordination sont en général très importants. Dans ce cas, il

est souvent plus intéressant pour eux de s’en remettre à une institution spécialisée pour

bénéficier à la fois d’économies d’échelle et d’économies d’envergure. De plus, le nombre

favorise les comportements de passager clandestin (du fait d’un coût marginal de détection

habituellement croissant). Ce qui a pour effet de diminuer fortement la crédibilité des

engagements qui pourraient être pris.

Si le théorème de Coase vaut dans le cas de deux agents, la conclusion est beaucoup

moins évidente quand le nombre des parties concernées est supérieur à deux. Les études

d’économie expérimentale ont tendance à montrer que l’optimum est presque toujours atteint

29


en cas de marchandage, sous réserve que (1) les marchandages ne soient pas eux-mêmes

interdépendants (chaque externalité doit pouvoir être résolue séparément) et que (2) les coûts

de transaction demeurent nuls.

b) Théorie des clubs

Article fondateur de la théorie des clubs : J.Buchanan (1965), « An Economic Theory of

Clubs », Economica, 32 (Feb.) : 1-14.

De nombreux biens publics sont à la fois « impurs » (au-delà d’un certain seuil, on

observe un phénomène d’encombrement tel que la qualité décroît avec le nombre des

consommateurs du bien) et « locaux » (la consommation est indivisible sur une certaine zone,

mais il est possible (1) d’exclure un individu en lui interdisant l’entrée dans la zone de

consommation et (2) de s’exclure soi-même de cette zone en la quittant). Les biens qui

répondent à ces deux caractéristiques peuvent alors être fournis par des associations

volontaires ou « clubs ». Le terme est ici utilisé en un sens purement technique.

1 – Equilibre et optimalité du club

On suppose que (1) le bien club est un bien de capital acquis une fois pour toutes (une

piscine par exemple), dont l’usure et les coûts d’entretien sont négligeables comparés au coût

d’acquisition, que (2) tous les individus susceptibles d’entrer dans le club sont semblables,

c'est-à-dire qu’ils ont tous la même fonction d’utilité et le même revenu, et que (3) les coûts

sont répartis de façon égalitaire. Pour accéder au club, il faut donc acquitter un droit d’entrée,

t, égal à CT/n, avec CT coût total du club et n nombre de membres.

L’avantage marginal de l’arrivée d’un nouveau membre pour ceux qui sont déjà

membres du club est égal à la part du coût qu’il prend en charge, c'est-à-dire au droit d’entrée

qu’il paie, avec t = CT/n = CM. La courbe d’avantage marginal se confond donc avec la

courbe de coût moyen. De plus, comme CT est fixe, cette courbe est une hyperbole équilatère

(cf. figure 1-5).

Le coût marginal dû à l’arrivée d’un nouveau membre peut être négatif au départ,

c'est-à-dire correspondre à un avantage, comme dans le cas de la figure 1-5. Dans l’exemple

retenu, celui d’une piscine, des individus peu nombreux peuvent s’ennuyer, et donc voir

l’arrivée d’un nouveau membre comme un événement positif. En revanche, au fur et à mesure

30


de l’accroissement du nombre des utilisateurs de la piscine, les phénomènes de congestion (ou

encombrement) vont devenir de plus en plus importants. Sur la figure 1-5, ils l’emportent sur

les bénéfices de convivialité à partir de n C . La comparaison des avantages marginaux et des

coûts marginaux permet de déterminer le nombre optimal de membres du club, soit n E tel que

l’avantage marginal pour les membres existants de l’entrée d’un membre supplémentaire soit

égal au coût marginal qu’implique cette entrée pour eux.

Avantages et

coûts moyens

et marginaux

.

O

Am (avantage

marginal d’un

nouveau

membre) =

CM (coût

moyen

d’entrée)

.

Cm (coût

marginal de

l’entrée d’un

nouveau

membre)

. .

E

n C n E (nombre de

membres à

l’équilibre)

n (nombre de

membres du

‘club’)

Figure 1-5 : Equilibre du bien club

Remarque : l’inclinaison de la courbe de coût marginal est un indicateur du caractère

plus ou moins privatif du bien club considéré. Si cette courbe est horizontale et confondue

avec l’axe des abscisses, le bien club est un bien collectif pur (un membre supplémentaire

n’implique aucun coût pour les autres). En revanche, plus la courbe se rapproche de la

verticale, plus la « rivalité » des nouveaux membres est élevée (plus un consommateur

supplémentaire diminue la quantité disponible pour les autres). A la limite, pour un bien privé,

la courbe sera quasiment verticale et confondue avec l’axe des ordonnées, de telle sorte que la

taille optimale du club soit de 1 (le club optimal pour un bien purement privé est un « club »

où l’individu sera tout seul).

Soit un individu représentatif dont la fonction d’utilité est U=U(x,g,n) et dont la

contrainte budgétaire est y = p x .x+ t, où t est le droit d’entrée dans le club.

31


L’équilibre budgétaire du club implique : t . n = p g .g., soit y = p x .x+ p g .g/n

Y : revenu de l’individu, x : quantité de bien privé qu’il consomme (prix p x ), g :

quantité du bien public local fourni par le club (prix p g ), n : nombre de membres du club, t :

droit d’entrée dans le club.

La maximisation de U sous contrainte de revenu par l’individu représentatif conduit au

lagrangien suivant : L = U(x,g,n) + λ.( y - p x .x - p g .g/n)

Conditions du premier ordre :

∂U

∂x

∂U

∂g

∂U

∂n

− λ.

p

p

− λ.

n

+ λ.

p

x

g

g

= 0

= 0

g

.

n

2 =

0

D’où :

∂U

∂g

pg

n.

=

(1)

∂U

px

∂x

et:

∂U

∂U

n pg.

g

+ ⋅ . = 0

2

∂n

∂g

pg

n

ou:

∂U

∂g

n = − ⋅ g (2)

∂U

∂n

L’équation (1) correspond à la condition de fourniture optimale des biens publics. En

effet, le théorème de Samuelson implique dans ce cas que la somme des TMS bien

public/bien privé individuels soit égale au prix relatif de ces deux biens. Dans la mesure où

l’on a fait l’hypothèse que tous les TMS individuels étaient égaux, la somme des TMS est

égale à n fois le TMS du l’individu représentatif. Ce résultat est permet de dire que la libre

32


entrée et la libre sortie du club, pour le droit d’entrée défini, conduit à un équilibre optimal

(sans intervention d’un planificateur central bienveillant et omniscient).

L’équation (2) permet de calculer le nombre de membres du club à l’équilibre. On

notera que, comme δU/δg est positif, il est nécessaire que δU/δn soit négatif pour que la

valeur d’équilibre de n soit positive. Cela signifie que l’on doit se trouver dans la zone où

chaque membre supplémentaire est une source d’encombrement et non de convivialité (c'està-dire

au-delà du point n C sur la figure 1-5).

L’hypothèse d’identité des fonctions d’utilité et des revenus peut évidemment être

levée. En général, on aboutit à la conclusion qu’il est inefficace de réunir des individus ayant

des préférences ou des revenus différents dans un seul club. Cela permet d’expliquer soit la

création de plusieurs clubs offrant des biens et services similaires, soit l’instauration de tarifs

différenciés à l’intérieur d’un même club (dans le cas d’une piscine, certains catégories de

population bénéficieront par exemple de tarifs plus faibles car elles sont en général présentes

à des moments moins encombrés).

L’existence de plusieurs clubs garantit à chaque individu qu’il ne lui sera pas appliqué

des tarifs discriminatoires et/ou qu’il ne devra pas payer une part disproportionnée des coûts

fixes en tant que nouvel arrivant.

Dans un club, les préférences des individus sont révélées par les mouvements d’entrée

et de sortie. Quelles que soient les règles interne de décision collective, c’est ce « mécanisme

de vote avec les pieds » qui sera déterminant (comme l’a montré C.Tiebout dans un article

célèbre intitulé « A Pure Theory of Local Expenditures », Journal of Political Economy

Octobre 1956, vol 64, pp.416-424). Dans une certaine mesure, une municipalité (ou toute

autre collectivité locale) peut être assimilée à un club, le droit d'entrée correspondant aux

impôts payés. Supposons que la majorité de la population vote en faveur d’un grand

programme de redistribution (comme certaines grandes villes l’ont fait parfois fait dans

différents pays industrialisés). Si le coût de départ de la municipalité est faible, toutes les

personnes qui doivent payer pour financer les transferts auront tendance à aller habiter

ailleurs. En sens inverse, toutes les personnes susceptibles de bénéficier des transferts seront

incitées à venir habiter dans la municipalité concernée. La politique suivie, bien que votée à la

majorité, n’est vraisemblablement pas « soutenable » en longue période. Elle sera une source

de déficit structurel, avec réduction du nombre des personnes qui contribuent au financement

et augmentation du nombre des personnes ayant droit aux transferts. Le vote avec les pieds

l’emporte ici sur le vote tout court – sauf à accroître artificiellement les coûts d’entrée et de

33


sortie par des systèmes autoritaires de contrôle (ce qui, dans le cas des municipalités, n’est pas

envisageable mais a souvent existé dans le cas de ces clubs particuliers que sont les nations).

Au moins dans les cas les plus simples et sous réserve que les coûts d’entrée et de

sortie soient nuls, les processus de migration (de vote avec les pieds) permettent d'atteindre

l'optimalité parétienne en groupant les individus ayant des goûts et des revenus homogènes.

Les processus de « vote avec les pieds » sont des mécanismes spécifiques de révélation des

préférences. Ils s’imposent à tous les dirigeants de « club », qui sont contraints de choisir des

politiques correspondant à l'unanimité, quelle que soit la règle formelle de décision (majorité

simple, majorité relative, majorité renforcée, etc.). Dans le cas contraire, les individus opposés

à la décision retenue quitteraient le club et ce jusqu'à ce que l'unanimité soit rétablie).

Lorsque les coûts d’entrée et de sortie sont non nuls, les responsables des clubs

retrouvent une certaine marge manœuvre. Des décisions non unanimes pourront être mises en

œuvre sans nécessairement provoquer le départ de tous opposants. Les dirigeants du club vont

alors mettre en regard l'avantage marginal pour eux d'une décision non unanime et le coût

associé à la probabilité de départ d'un certain nombre de membres.

Par ailleurs, des problèmes peuvent se poser lorsque des indivisiblilités ou des

économies d'échelle existent. Comme sur un marché, la maximisation indépendante de leur

utilité par les individus conduira à des résultats sous-optimaux. Les membres d'un club

peuvent aussi posséder une ressource unique (richesse du sous-sol, patrimoine culturel, etc.)

qui leur donne la possibilité de se comporter en monopole discriminant, en sélectionnant les

nouveaux arrivants à l’entrée à l’aide de barrières non monétaires, par exemple selon

l'élasticité de la demande du bien public fourni par le club par rapport au revenu. Comme dans

le cas du marché (avec les market failures), le processus de vote avec les pieds peut présenter

un certain nombre de défaillances.

2- Equilibre de clubs multiples avec contrainte de répartition d’une population globale

L’analyse précédente concernait un seul club en équilibre partiel, sans contrainte

globale d’insertion de la totalité d’une population dans au moins un club. Supposons

maintenant que le problème soit d’expliquer la répartition d’une collectivité de taille n (et

dont les individus sont identiques) entre deux « clubs » préexistants, deux régions A cet B

34


d’un même pays par exemple (mais il pourrait tout aussi bien s’agir de deux villes ou de deux

pays). AM i est l’avantage moyen d’être dans une région i (avec i=A,B.). AM i croît d’abord en

fonction du nombre de personnes présentes dans la région i, passe par un maximum puis

décroît (figure 1-6). L’avantage marginal pour un individu de A (Am A ) d’émigrer en B est

égal à l’avantage moyen des habitants de B (AM B ). Le coût marginal pour un individu de A

(Cm A ) d’émigrer en B est égal à l’avantage moyen d’être en A (AM A ). Am A =AM B et

Cm A =AM A . De même, pour B, Am B =AM A et Cm B =AM B .

Sur la figure 1-6, le point E est un point d’équilibre mais pas nécessairement un

optimum. Une répartition différente de la population permettrait vraisemblablement de mieux

exploiter les économies d’échelle en augmentant la taille soit de A soit de B (en se

rapprochant soit du maximum d’avantage moyen de A, M A , soit de celui de B, M B ).

Par ailleurs, le point E ne correspond pas à un équilibre stable. Supposons que, pour

des raisons exogènes, un certain nombre d’individus migrent de B vers A (déplacement à

partir de E vers la droite). L’avantage moyen d’être en A devient supérieur à l’avantage

moyen d’être en B, ce qui provoque une nouvelle de migration de B vers A, c'est-à-dire un

nouveau déplacement vers la droite. Comme AM A reste supérieur à AM B , on aboutit à une

solution de coin, en F, où toute la population a migré en A. De la même manière, on

montrerait qu’un déplacement exogène de population vers la gauche (migration de A vers B)

enclenche un processus cumulatif (AM B reste supérieur à AM A ) aboutissant à la solution de

coin G, où toute la population a migré dans la région (le club) B.

AM B

AM A

M B

E

M A

G

F

O

n

n B (population dans B)

n A (population dans A)

n

O

Figure 1-6 : Répartition d’une population donnée entre deux « clubs »

35


L’instabilité observée dans la figure 1-6 provient de ce que la taille optimale pour

chaque club est supérieure à la taille atteinte au point d’équilibre E (M A est à droite de E et

M B est à gauche). Lorsque ce n’est pas le cas, des équilibres stables sont possibles, même si

ces équilibres ne sont plus nécessairement uniques. Dans la figure 1-7, E1, E2 et E3 sont les

équilibres possibles. On vérifiera que E2 est stable et que E1 et E3 ne le sont pas.

La figure 1-7 correspond à une situation où tout déplacement exogène autour de E2 est

stable, sauf si son ampleur est telle que l’on se retrouve soit à gauche de E1, soit à droite de

E3. Ce cas de figure peut servir à représenter par exemple le rapport des forces entre un parti

au pouvoir et son opposition. En tant normal l’équilibre E2 prévaut, avec une répartition des

forces pas trop inégale. Cet équilibre résiste à des chocs exogènes aussi longtemps que leur

ampleur ne fait pas passer au-dede E1 ou de E3. Dans le cas contraire, on observe un

phénomène de radicalisation, avec le basculement de la quasi-totalité de la population dans

l’un ou l’autre camp (phénomène fréquent pendant les périodes de « révolution »).

AM A

AM B

M A

E 2

M B

G

E 1 E 3

F

O

n

n B (population dans B)

n A (population dans A)

n

O

Figure 1-7 : Equilibres multiples, les uns stables, les autres instables

Jusqu'à maintenant, on a supposé que le nombre de clubs était fixe (égal à deux dans

les figures 1-6 et 1-7). Lorsque ce n'est plus le cas, les créations de clubs nouveaux et les

migrations qui en découlent font que l'on aboutit à un ensemble de clubs de taille optimale, du

moins aussi longtemps qu'il n'y a pas d'indivisibilités majeures, c'est-à-dire que la taille

36


optimale demeure suffisamment faible par rapport à la population totale pour l'on puisse

considérer que le nombre de clubs est une variable continue.

Illustration : supposons que la population totale soit de 10000 et que la taille optimale

d’un club soit de 500. L’optimum est atteint si l’on crée 20 clubs. Si maintenant la population

totale augmente de 250, il faudrait 20,5 clubs pour atteindre la taille optimale, ce qui n’a

aucun sens (le nombre doit être soit 20, soit 21). On est confronté à un problème de

« programmation en nombres entiers », pour lequel plusieurs techniques spécifiques sont

disponibles. Toutefois, il est clair que le recours à ces techniques, s’il est indispensable

lorsque le nombre optimal de clubs est compris, par exemple, entre 2 et 3, se justifie rarement

quand il s’agit de choisir, par exemple, entre 72 et 73 clubs (le gain en précision est

généralement très inférieur au coût en complexité analytique)

Courbes

d’avantage

moyen

O

n/4

n/2

3n/4

n

Population

Figure 1-8 : Production optimale quand le nombre de clubs est variable

Dans la figure 1-8, la taille de la population est n. La courbe d’avantage moyen du

club indique un maximum pour n/4. Quatre clubs de cette taille sont alors créés. Le premier

37


pour le premier quart de la population, le deuxième pour le deuxième quart (entre n/4 et n/2),

etc. En conséquence, tous les membres de la population se trouvent des clubs procurant un

avantage moyen maximum.

III - Développement et organisation de l'Etat.

La demande de sécurité publique est en général la cause première de l’émergence des

Etats. Dans une collectivité peu importante, cette demande n’est pas suffisante pour justifier

une production par des offreurs spécialisés et à plein temps. Des milices ou des gardes

nationales, mobilisables chaque fois que nécessaire dans le cadre d’un accord coopératif, où

chaque membre de la collectivité est donc à la fois offreur et demandeur, sont des instruments

beaucoup moins coûteux. L’apparition d’un Etat n’a lieu qu’au-delà d’un certain seuil 19 .

Quand ce seuil est atteint, un certain nombre de problèmes apparaissent, liés à la nature

spécifique de ce bien public particulier qu’est la sécurité (sous-section a).

Une fois l’Etat instauré, il convient d’analyser les grands principes de son

fonctionnement et les principaux facteurs de son évolution (sous-section b).

Le comportement des Etats dépend enfin beaucoup des règles institutionnelles qui les

régissent. Cette question des « formes d’Etat » est brièvement abordée dans de la dernière

partie de cette section (sous-section c).

a) les particularités de la production de sécurité publique.

La production de sécurité publique fait référence à l’ensemble des biens et services

destinés à protéger les personnes et les biens et à garantir le respect des contrats passés. Dans

le secteur public, cette production concerne principalement les activités de justice, de police

(sécurité publique intérieure) et de défense (sécurité publique extérieure).

19 Situé, selon R.Auster et M.Silver (The State as a Firm, Boston : Kluwer), entre 15000 et 20000 habitants, sur

la base d’une étude des cités italiennes des XIIe et XIIIe siècles.

38


Les déterminants de la demande de sécurité publique

Même dans les Etats les plus développés, une part significative de la production de

sécurité publique reste parfois le fait du secteur privé, notamment dans le cas de la sécurité

domestique (systèmes d’alarme, vigiles, sociétés de surveillance, etc.), du transport de fonds

(convoyeurs) ou de la protection personnelle directe (gardes du corps). Mais les activités de ce

type restent marginales quand on les compare à la production publique, à l’exception d’Etats

qui connaissent des désordres particuliers, pour cause de guerre civile par exemple. De plus,

ces activités privées de sécurité publique sont étroitement soumises au contrôle de la

puissance publique. Pour ces deux raisons, et même si les conditions de substitution de la

production privée et de la production publique de sécurité posent des problèmes intéressants,

l’analyse se limitera ici à la production publique de sécurité publique.

La demande de sécurité publique dépend de plusieurs facteurs, et notamment :

- du degré d’hostilité de l'environnement géographique;

- de l’histoire propre des populations (l’insistance de Thomas Hobbes dans le

Léviathan sur la nécessité de préserver l'ordre est une conséquence directe de l'expérience

vécue par cet auteur lors de la première révolution anglaise, la Civil War – 1642-1649);

- de la taille et de la densité de la population. Lorsque la population augmente,

la criminalité est plus forte, les coûts de recherche des criminels sont plus élevés et les

problèmes de passager clandestin sont plus nombreux. L'accroissement de population a aussi

un effet sur la demande de sécurité publique extérieure (défense nationale) mais cet effet peut

s’exercer dans des directions opposées. Une population plus nombreuse a un effet dissuasif

plus fort pour les agresseurs potentiels. Mais une population plus nombreuse peut aussi inciter

un pays à faire usage de sa force supérieure pour accroître ses gains au détriment des pays

voisins (en les menaçant ou en les agressant effectivement dans une optique de conquête).

L’augmentation de la densité peut aussi donner lieu à tout un ensemble d’effets externes

négatifs, en particulier accroître le nombre et la gravité des agressions et des conflits

interpersonnels;

39


- de l'accroissement de la richesse du pays. Il y a plus de biens à protéger. Les

risques d'invasion par les voisins augmentent. Les individus ayant la possibilité de vivre de

plus en plus isolés, la force des pressions psychosociales - le "sens de la faute" - tend à

diminuer.

Une production publique en monopole et pas seulement d’une fourniture publique

Lorsque la demande dépasse le seuil justifiant la création d’un Etat, c'est-à-dire d’un

offreur spécialisé de sécurité (voir note 10 supra), cet Etat ne peut pas se contenter de fournir

la sécurité publique, il doit aussi le produire lui-même. La sécurité collective est en effet l’un

des rares biens publics dont la production (et pas seulement la fourniture) doit presque

obligatoirement être effectuée en monopole 20 , ou du moins par des oligopoleurs coopérant

entre eux 21 , ce qui revient au même en pratique. Plusieurs « entreprises de sécurité publique »

en concurrence sur une même zone géographique - des milices privées par exemple -

entreraient en conflit entre elles, et produiraient non de la sécurité mais de l’insécurité et du

désordre.

Le problème devient alors de savoir comment est sélectionné ce « propriétaire » plus

ou moins temporaire de l’Etat, cet offreur unique auquel sera confié le monopole de la force.

Il est important de noter que la nécessité d'instaurer un monopole, d'interdire une concurrence

"sur le terrain" (no competition « on the field »), n’exclut pas évidemment l’existence d’une

concurrence "pour le terrain" (competition « for the field » 22 ), c'est-à-dire d’une concurrence

pour l’attribution des droits de propriété sur l’Etat entre les différents offreurs potentiels de

sécurité publique (et, plus largement, de politiques publiques).

Il y a de grandes chances pour que le nombre des candidats pour l’attribution du

monopole de la force soit élevé et que la concurrence entre eux soit sévère. La rente anticipée

associée au monopole de la force est en effet extrêmement forte, au moins en termes de

« revenu complet », c'est-à-dire en tenant compte aussi bien du revenu monétaire que du

revenu psychologique qu'apporte la détention du "pouvoir". En effet, une fois ce monopole de

la force attribué, celui qui en est le titulaire peut facilement l’utiliser pour réduire la

"contestabilité" du marché politique (dissuader ses concurrents potentiels for the field) en

20 L’Etat étant, selon la célèbre définition de Max Weber, l’institution qui détient « le monopole de la violence

légitime ».

21 Comme dans le cas de la police nationale et des polices municipales.

22 On reprend ici la distinction célèbre de Demsetz entre « competition on the field » et « competition for the

field ».

40


instaurant des barrières à l'entrée ou en renforçant celles qui existent. Il peut également

augmenter ses gains par des redistributions forcées et des politiques publiques orientées

exclusivement en fonction de ses intérêts propres.

On a là une illustration d’un problème d’agence de type politique, c'est-à-dire où la

supériorité de l'agent (du monopoleur politique) sur le principal (la population qui demande

de la sécurité publique) est ici moins lié à une asymétrie d’information (comme dans le

modèle principal/agent habituel des économistes) qu’à une asymétrie dans le pouvoir de

contraindre et de menacer.

L'attribution du monopole de la force et d’un droit de propriété sur l’Etat à un offreur

particulier de politiques publiques est une (la ) question sociale centrale 23 . Dans certains cas,

fréquents dans l’histoire, le principal (la population) n'a pas eu à choisir : un individu ou un

groupe s’est approprié le monopole de la force sans demander quoi que ce soit à qui que ce

soit (un envahisseur plus fort, un soldat vainqueur face à l'ennemi, la conjuration réussie d'une

minorité, etc.). Dans d'autres cas, l'attribution du monopole a fait appel à un processus plus ou

moins consensuel, conduisant à la définition d’un contrat social, matérialisé par un ensemble

de règles institutionnelles (écrites ou non écrites). Selon les cas, on aboutit soit à des règles

d'attribution automatique (succession héréditaire par exemple), soit à une constitution limitant

la durée et la capacité d'utilisation du droit de propriété sur l’Etat et soumettant la désignation

et le renouvellement du mandat des propriétaires temporaires à une règle précise de choix

collectif (démocratie représentative). Certains systèmes ont même essayé de combiner les

deux principes (la monarchie constitutionnelle à l’anglaise par exemple).

Si la force a été une variable décisive dans l’émergence historique des Etats, le

consensus a aussi joué un rôle non négligeable, du moins tant que les individus ont conservé

la possibilité d’émigrer (de « voter avec leurs pieds » à la Tiebout). Dans ce cas, en effet,

même les Etats les plus oppresseurs ne peuvent pas totalement ignorer les préférences de leurs

citoyens. En revanche, dès qu’un Etat a la possibilité d’instaurer des barrières efficaces à la

sortie pour ses citoyens, sa capacité d’oppression (sa capacité d’utiliser à son profit le

monopole de la force) s’accroît considérablement.

b) Fonctionnement et évolution de l’organisation étatique

23 En plaçant au premier plan le problème économique de l’appropriation privée des moyens de production,

l’analyse marxiste a fortement contribué à occulter le problème politique de l’appropriation publique des moyens

de production de sécurité.

41


Une fois l’Etat « approprié », pour une période plus ou moins longue, son

fonctionnement dépend du comportement de ses « propriétaires » et du comportement des

agents choisis par eux (de l’administration). On retrouve ici l’ensemble des questions posées

par la science politique à propos du comportement de la « classe dirigeante », avec l’idée que

la classe politiquement dirigeante n’est pas nécessairement la classe économiquement

dirigeante – bien que le monopole de la force puisse y conduire 24 .

La théorie économique de la politique s’attache alors à expliquer le comportement des

dirigeants politiques, des « bureaucrates », des citoyens-électeurs, des groupes d’intérêt

susceptibles de faire pression sur l’Etat, en intégrant parfois d’autres agents comme les

gouvernements étrangers ou les organisations internationales. Pour cela, elle cherchera,

comme pour les agents « économiques » (ménages et entreprises), à préciser les fonctions

d’utilité et leurs contraintes, ainsi que les interdépendances existant entre eux.

Dans une première étape, on supposera cependant que l’Etat est une entité homogène

cherchant simplement à maximiser son profit de monopole – égal à l’écart entre le montant

des recettes fiscales qu’il perçoit et les biens et services publics qu’il fournit à sa population 25 .

Efficacité du monopole public dans un Etat autocratique – Théorème de Buchanan

En un sens, le fait d’avoir fait preuve de son aptitude à éliminer ses concurrents ou à

emporter la victoire (pour obtenir un droit de propriété sur l’Etat) est un signal de la capacité

de l’autocrate d’utiliser la force (et donc d’assurer l’ordre). Mais c’est aussi le signal qu’il est

capable d’abuser de son pouvoir pour maximiser sa rente. S’il est le plus efficace ex ante, il

est aussi celui qui risque de poser le plus sévère problème d’agence (le moins contrôlable ex

post – problème classique de hasard moral).

En fait, si l’autocrate est rationnel, il va chercher à exploiter efficacement sa

population, c’est-à-dire à lui fournir le minimum de services (g) pour le montant des impôts

prélevés. Toutefois, à la différence d’un monopole privé, l’Etat n’est pas confronté à une

courbe de demande mais à une contrainte de soutien politique minimal, en dessous duquel le

24 « C’est la force qui domine le capital et non l’inverse » (Auster et Silver(1979), op.cit.), contrairement à l’idée

marxiste sommairement résumée dans le Manifeste communiste que l’Etat n’est qu’un « comité de gestion des

affaires communes de la bourgeoisie ».

25 Par la suite, on cherchera à expliquer le comportement des dirigeants politiques, de l’administration (des

« bureaucrates »), des citoyens-électeurs et des groupes d’intérêt susceptibles de faire pression sur l’Etat, en

intégrant parfois d’autres agents comme les gouvernements étrangers ou les organisations internationales.

Comme pour les agents « économiques » (ménages et entreprises), l’objectif sera de définir leurs fonctions

d’utilité et leurs contraintes respectives, ainsi que les interdépendances pouvant exister entre elles.

42


gouvernement en place perd le pouvoir (du fait d’un échec électoral, d’une révolte

incontrôlable de la population, d'un coup d'Etat, etc.).

La collectivité comprend n individus. La fonction d’utilité de l’individu représentatif

est U=U(x,g), où x est le montant de bien privé et g le montant de bien public. Pour simplifier,

on suppose que les prix p x et p g sont normalisés à 1. La contrainte budgétaire est donc : y = x

+ t, (avec y revenu moyen et t impôt moyen payé par chaque contribuable), soit x = y – t.

x*, g* et t* sont les valeurs que les citoyens estiment possible d’atteindre en changeant

de gouvernement, avec x* = y - t*. Si α mesure le coût de transaction associé à ce changement

(mesuré en termes d’utilité), la contrainte de soutien politique implique que :

U(y – t, g) ≥ U(y - t*, g*) - α (3)

On suppose que l’Etat cherche à maximiser son budget discrétionnaire, c'est-à-dire

l’écart entre ses recettes fiscales totales, t, et les dépenses publiques, g, sous sa contrainte de

soutien politique (3). L’écart ainsi obtenu permet de financer des dépenses qui ne sont source

d’utilité que pour les responsables de l’Etat (et non pour les membres de la collectivité).

Le lagrangien s’écrit :

L = n.t - g + λ.(U(y – t, g) - U(y - t*, g*) + α)

Les conditions de premier ordre sont :

∂L

∂U

∂x

= n + λ ⋅ . = 0

∂t

∂x

∂t

∂L

∂U

= −1+ λ ⋅ = 0

∂g

∂g

avec x = y - t, d' où :

∂U

∂U

∂g

1 ∂g

= = − (4)

∂U

n ∂U

∂x

∂t

La relation (4) indique que l’équilibre d’un Etat qui maximise son budget

discrétionnaire est un optimum pour les individus (sous réserve de considérer "l'Etat", ou le

"propriétaire" de l'Etat, comme un "individu" au même titre que les autres). Au point

correspondant, en effet, les conditions d’optimalité parétienne sont remplies : le taux marginal

de substitution entre le bien public g et le bien privé x est égal à leur prix relatif (1/n). En

effet, l’individu représentatif paie le bien privé dans sa totalité (en rappelant que p x = 1 par

hypothèse) tandis qu’il ne paie que le n ème du bien public (dont le prix total p g est aussi par

hypothèse de 1).

43


On voit ici que le monopole public, sous réserve qu’il fournisse des biens selon une

logique politique (c'est-à-dire en étant soumis à une contrainte de soutien minimal), produit de

façon optimale. Ce résultat est connu sous le nom du « théorème de Buchanan ».

On sait que, sur un marché économique, un monopole qui maximise son profit (c'est-àdire

qui se comporte selon une logique économique et non politique) produit une quantité

inférieure à l’optimum (à un prix trop élevé) et provoque de la sorte une perte sociale sèche.

Ici, au contraire, l’équilibre atteint ici par le monopole public est allocativement efficace. Cela

ne signifie évidemment pas que l’équilibre soit distributivement juste. Au contraire, l’Etat

prélève un budget discrétionnaire indu. Simplement, la perte des citoyens n’est pas supérieure

au gain de l’Etat : le jeu est à somme nulle et non à somme négative, comme dans le cas d’un

marché économique en monopole. En d’autres termes, le monopole n’est pas nécessairement

une forme d’organisation aussi inefficace pour la production politique de biens publics que

pour la production économique de biens privatifs.

Remarque : dans le modèle précédent, on a fait l’hypothèse que le revenu du citoyen

représentatif était indépendant du montant des dépenses publiques, g. Si les dépenses

publiques augmentent la productivité générale de l’économie (cas des investissements en

infrastructure par exemple), alors δy/δg>0 et l’Etat ne produit pas suffisamment. Au contraire,

si les dépenses publiques tendent à multiplier les règlements et les distorsions allocatives,

alors δy/δg


propriété ne soient pas respectés – et donc de la capacité du gouvernement à combattre la

« vulnérabilité de la possession » et « l’insécurité transactionnelle). De plus, le manque de

crédibilité politique influence fortement le comportement d’investissement du secteur privé,

national et étranger, et a des coûts importants en termes de croissance (op. cit. 16-36).

- la primauté des objectifs politiques sur les objectifs économiques et donc une

faible compétence technique, la multiplication des redistributions à caractère politique pour

obtenir des soutiens (l’Etat a une forte activité de producteur de rente – de « rent-setter »).

Dans les autocraties faibles, celles qui ne s’appuient pas sur une base large (souvent

parce qu’elles n’ont pas les moyens de la constituer) ou qui n’ont pas les moyens ou hésitent

à un emploi extensif et permanent de hauts niveaux de violence ou de menace, vient s’ajouter

le problème de la menace permanente de renversement, par coup d’Etat ou par révolution ou

par les deux combinés. Pour cette raison, l’horizon des autocraties faibles est en général à

court terme (et à un terme beaucoup plus court que celui des démocraties).

Par ailleurs, les autocraties ont un problème spécifique de succession. Elles n’ont pas,

contrairement aux démocraties, la capacité de changer de gouvernement sans changer de

régime. Quand ils perdent, les responsables politiques perdent tout. Ils sont donc prêts à payer

un prix élevé pour conserver le pouvoir. De plus, une fois le pouvoir devenu vacant, les

autocraties doivent subir la lutte entre les successeurs potentiels. Ces coûts élevés de

succession expliquent par exemple la tentation monarchique que l’on observe par exemple

dans certains régimes communistes du Tiers-monde (la bureaucratie dirigeante préfère une

transmission héréditaire du pouvoir – c'est-à-dire prendre le fils, plutôt que de devoir risquer

un conflit interne pour la succession).

La taille optimale des Etats

En longue période, les gouvernements vont essayer soit d’accroître leur rente

budgétaire (la différence entre les recettes fiscales et les dépenses publiques effectuées en

échange). Pour cela, ils peuvent agir sur la disposition à payer des contribuables pour ses

services (pour les dépenses publiques) en déplaçant vers le bas, grâce à une propagande

adéquate, la courbe de soutien minimal pour rester au pouvoir (U(y - t*, g*) - α dans

l’équation 3 ci-dessus). Une autre possibilité est de modifier la taille de l’Etat pour réduire ses

coûts de fonctionnement. Ce second type de comportement peut servir de base à une théorie

de l’émergence de frontières d’équilibre entre les différents Etats.

45


Pour David Friedman 26 , le facteur déterminant de la taille des Etats est le montant des

recettes fiscales net de leur coût de collecte. Si le commerce est la principale source des

recettes fiscales, on aura des pays de grande taille. S’il s’agit au contraire de rente (liée à

l'exploitation de ressources naturelles par exemple), les pays seront plutôt de petite taille (afin

de partager cette rente entre un plus petit nombre). Enfin, si le travail est la source principale

de recettes, l’objectif sera d’avoir d’accroître la disposition à payer des contribuables en

augmentant le coût de sortie du pays. Cela se manifestera par des frontières fermées et une

langue et une culture homogènes et très différentes de celles des pays environnants.

Sans nier l'importance des facteurs sociologiques, historiques et géographiques,

D. Auster et M. Silver (1979 op.cit.) considèrent pour leur part que les facteurs

démographiques sont prédominants. L’augmentation de la densité de population fait diminuer

les coûts de transport, les coûts de communication et, plus généralement, l’ensemble des coûts

de transaction, ce qui incitera à constituer des Etats de grande taille. De même, les

accroissements de population sont une source d’économie d’échelle car ils réduisent les coûts

techniques de production de sécurité, extérieure et intérieure. En sens inverse, l’isolement

croissant des individus (lié à une plus grande mobilité) et la multiplication des idées

concurrentes (baisse des coûts de communication) rendent plus difficile le contrôle des

comportements de passager clandestin. Au moins à partir d’une certaine taille, ces coûts de

monitoring des comportements deviennent fortement croissants.

Coûts moyens

Coûts de contrôle

+ coûts

techniques

Coûts moyens de

contrôle (monitoring)

Coûts techniques

moyens de production

de sécurité

Taille

optimale

Population

Figure 1-9 : Taille optimale d’un pays en équilibre partiel

26 Friedman D. (1977), « The Size and Shape of Nations », Journal of Political Economy, 85 (Feb.).

46


La figure 1-9 montre comment, en équilibre partiel, les influences contraires de

ces différents facteurs permettent de déterminer la taille optimale d’un Etat. On pourrait

évidemment poursuivre l’analyse dans un cadre d’équilibre général, et aboutir à tout un

ensemble de frontières d’équilibre, selon les informations dont dispose chaque pays sur les

dotations en ressources des autres et selon les hypothèses qu’il fait sur leurs comportements

(notamment en ce qui concerne ses voisins proches).

Le degré optimal de décentralisation

La taille optimale pour la fourniture des biens publics varie fortement d’un bien à

l’autre, notamment du fait de l’importance des économies d’échelle potentielles. La taille

optimale pour la collecte des ordures ménagères est faible : ce sont en général les

municipalités qui en assumeront en général la responsabilité. Inversement, la sécurité

extérieure sera fournie au niveau national : non seulement les économies d’échelle sont fortes

mais il est souvent préférable de coordonner étroitement les décisions dans ce domaine.

On suppose dans la figure 1-10 qu’il existe deux biens publics de taille optimale très

différente : la sécurité intérieure (taille optimale : 50 millions d’habitants) et la sécurité

extérieure (taille optimale : 250 millions d’habitants). Si le pays considéré compte 250

millions d’habitants, il organisera sa défense au niveau national et sa police au niveau régional

(situation proche de celle des Etats-Unis – avec une armée fédérale et des polices

décentralisées par « Etat »). Si le pays compte au contraire uniquement 50 millions

d’habitants (situation proche de la France), les deux biens publics seront fournis au niveau

national : la police parce que cela correspond à la taille optimale et la défense parce que la

faible dimension du pays n’offre pas d’autre solution 27 .

On peut donc s’attendre à la présence d’une corrélation négative entre la taille d’un

pays et son degré de décentralisation. C’est effectivement ce que l’on observe dans les faits :

toutes choses égales, la place du gouvernement central est plus faible dans les grands pays.

27 Un pays dont la taille est trop faible peut partiellement résoudre ce problème en passant des alliances. Dans la

mesure où c’est en matière de défense que les économies d’échelle sont généralement les plus fortes, il n’est pas

surprenant que les alliances de type militaire soient les plus fréquentes. Sur la théorie des alliances, cf. Olson M.

et Zeckhauser R. (1966), An Economic Theory of Alliances, Review of Economics and Statistics, 48 (August):

266-279.

47


Avantage net

par tête

Pmax

Dmax

Défense

Police

50 millions

250 millions

Population

Figure 1-10 : Différences dans les tailles optimales et décentralisation

c) les formes d’Etat

L’existence d’un monopole de la force pose deux types de problèmes : un problème

d’efficacité et un problème d’équité. Comme on l’a vu (théorème de Buchanan), le monopole

public, quand il est soumis à une logique politique, ne pose pas de problème particulier

d’efficacité (à la différence des monopoles soumis à une logique économique). En revanche,

une partie des rentes obtenues est appropriée, d’une façon que l’on peut trouver non justifiée,

par les responsables de l’Etat. La démocratie représentative cherche fondamentalement à

résoudre ce problème d’équité en proposant un mode spécifique d’appropriation de l’Etat,

matérialisé par un droit de vote égal et universel (un homme, une voix). L’objectif est de

transformer les formes de type entreprise individuelle (autocratie) ou à actionnariat limité

(aristocratie, systèmes de suffrage censitaire) en une sorte de coopérative avec des droits de

propriété non transférables et également répartis entre les citoyens « propriétaires ».

Le problème central de la démocratie représentative est que ses efforts en termes

d’équité sont susceptibles d’avoir des conséquences en termes d’efficacité. En théorie, la

concurrence « for the field » entre les différents partis politiques devrait conduire, au moins

en longue période, à une offre de politiques publiques optimales : tout programme sousoptimal

doit en effet être battu à un moment ou à un autre par un programme Pareto-supérieur

(offrant au moins la même chose que lui à au moins n-1 électeurs et plus au n ème électeur).

Mais, en pratique, de nombreuses sources potentielles d’inefficacité ont été avancées :

48


- l’information des électeurs ne serait pas symétrique ;

- les compensations monétaires nécessaires pour atteindre un optimum ne seraient pas

toutes techniquement réalisables et les engagements de compensations monétaires à terme ne

seraient en général pas crédibles ;

- comme toute règle de choix collectif, le vote majoritaire conduirait une agrégation

imparfaite des préférences individuelles (théorème d’impossibilité de K.Arrow) ;

- les contraintes électorales inciteraient les électeurs à la myopie (leur taux

d’actualisation politique serait plus fort que leur taux d’actualisation économique) ;

- les candidats, surtout s’ils sont peu nombreux, auraient intérêt à la collusion afin de

ne pas se faire concurrence quant aux rentes obtenues grâce au monopole étatique ;

- le contrôle des principaux (des électeurs) sur les agents (les responsables politiques

et les « bureaucrates ») serait très peu efficace, si bien que, dans leur ensemble, les dirigeants

politiques et les bureaucrates seraient les propriétaires de fait de l’Etat.

Toutes ces sources d’inefficacité (ces democratic government failures) ont eu tendance

à faire considérer les démocraties représentatives comme des producteurs de biens publics

certes plus équitables mais peu efficaces. Pour certains auteurs, cette inefficacité expliquerait

aussi la durée de vie plus courte de ce type de régime politique au cours de l’histoire.

Toutefois, la question qui a eu le plus d’importance après-guerre est moins celle de

l’inefficacité de la démocratie représentative que celle du régime politique le mieux adapté au

développement. Un certain nombre d’auteurs ont en effet défendu l’idée que la démocratie

représentative était un « bien de luxe », impliquant un revenu par tête élevé pour pouvoir

fonctionner de façon satisfaisante.

Selon cette logique, les PVD avaient intérêt à opter pour un système de parti unique,

sinon pour un système autocratique, même si cela risquait de sacrifier quelque peu l’équité (et

les libertés individuelles) à un impératif catégorique d’efficacité. Ce type d’analyse oubliait

toutefois deux faits, maintenant bien établis empiriquement :

a) les autocraties sont également très inefficaces. 1- La menace permanente de

renversement (par coup d’Etat notamment) fait que l’horizon est encore plus court (et surtout

plus incertain) que dans une démocratie à élections périodiques, même rapprochées. 2 – les

choix des différents responsables économiques sont plus guidés par des critères de soutien

politique que par des critères de compétence économique. 3- L’économie en régime

autocratique est généralement plus contrôlée (le marché est moins développé), plus fermée

49


(les échanges avec l’extérieur sont plus faibles) et la primauté des objectifs économiques est

une source importante d’inefficacité ;

b) les études empiriques montrent qu’il existe une relation étroite entre démocratie et

développement. Certes, la causalité est en partie dans le sens développement → démocratie,

ce qui pourrait indirectement confirmer l’idée de la démocratie « bien de luxe », mais elle

s’exerce également et significativement dans l’autre sens, dans le sens démocratie →

développement. Les libertés politiques favorisant les libertés et les initiatives économiques, le

développement du marché, l’ouverture sur l’extérieur, l’entrée d’investisseurs étrangers, etc.

Le débat sur les institutions les mieux adaptées au développement a repris à la fin des

années 1980, (1) avec les interrogations sur l’efficacité des programmes d’ajustement et sur

les « conditionalités » que les institutions internationales doivent ou ne doivent pas imposer

lors de leurs prêts aux PVD et (2) avec les recherches sur la bonne « gouvernance » et l’intérêt

accru pour « l’analyse économique des institutions ».

Les difficultés rencontrées dans certains pays ont également conduit à s’interroger sur

les causes des dysfonctionnements chroniques des Etats, et éventuellement sur les moyens d’y

remédier. Les Etats peuvent entrer en régression pour plusieurs raisons.

Erreurs des dirigeants. Certains gouvernements peuvent sous-estimer les risques

d’une politique. L’exemple type est celui des militaires argentins lors de la guerre des

Malouines, engagée en grande partie pour faire oublier leurs échec de politique intérieure.

Corruption des dirigeants. Les gouvernements sont autant des rent-setters que des

rent-seekers. Ils pratiquent de nombreuses redistributions à caractère politique. Cela peut

faciliter les choses à court terme et créer des coalitions capables d’assurer leur maintien au

pouvoir. Mais les effets à long terme sont souvent catastrophique en démocratie. Ce type de

politique fait baisser la crédibilité et la légitimité des gouvernements. Leur capacité

d’influencer (de « manipuler ») les anticipations des agents économiques et politiques

s’amenuise. Le stock de capital de confiance, et plus largement de « capital social » dans la

société diminue rapidement. Les échanges se rétractent, la croissance baisse et, par voie de

conséquence, le montant des rentes distribuables. Le conflit entre les « rentiers » et les autres

(qui ne veulent pas payer plus) s’envenime. Si le groupe des bénéficiaires de « rentes » est

suffisamment fort, l’affrontement peut aller jusqu’au conflit civil.

Incompétence des dirigeants. La population remet en cause le mécanisme de sélection

des responsables politiques. Cela se produit en général à la suite de chocs (crise économique,

guerre perdue). Dans les autocraties, cette situation donne lieu à des coups d’Etat, des

50


émeutes, des révolutions, des dissidences armées. Dans les démocraties, elle conduit à la

montée des partis extrémistes, à une abstention croissante par « aliénation » et désintérêt pour

la politique. En général, la critique s’exerce plus à l’encontre du système que des dirigeants.

Instabilité politique. Celle-ci peut provenir de la configuration des préférences des

différents groupes sociaux qui conduisent à des « majorités cycliques » (toute décision

majoritaire peut être remise en cause par une séquence d’autres votes), avec des conflits

redistributifs intenses entre les différents groupes sociaux et politiques. Ce genre de situation

se produit notamment à la suite de la découverte de richesses naturelles dans un pays.

L’instabilité est une source de mouvements de rue, d’atmosphère de complot permanent,

d’activisme révolutionnaire et antiparlementaire.

Perte de crédibilité financière. Certains Etats n’ont plus de ressources financières et ne

peuvent plus s’endetter. Ils ne peuvent plus assurer les tâches de base mais ils continuent à

prélever suffisamment de ressources pour contrôler la situation politique (en distribuant des

rentes et en ayant recours à leur monopole de la violence « légitime »). La population ou des

groupes maffieux tendent à se substituent à l’Etat défaillant en assurant une certaine

« sécurité » (Albanie, Colombie). Une rébellion peut apparaître dans certaines régions du

pays. Les Etats restent assez forts pour préserver leurs rentes mais pas pour contrôler la

rébellion. Celle-ci n’est, pour sa part, pas assez forte pour prendre le pouvoir central.

L’implosion étatique peut se produire par étape : il peut initialement y avoir un large

accord pour renverser le pouvoir en place mais seulement pour le remplacer par un pouvoir

faible et peu cohérent. Ce nouveau pouvoir ne peut alors faire face à une sécession par

exemple (cas de la Tchécoslovaquie, divisée en Tchéquie et Slovaquie). Mais il existe des

contre-exemples, notamment lorsque les pertes anticipées pour certains sont élevées (Biafra-

Nigéria). Dans d’autres cas, le problème suscitera des interventions étrangères (République du

Congo - ex-Zaïre).

51


Chapitre 2: Analyse économique du vote

Section I : Choix de la règle de vote et paradoxe de la participation

Toute société doit prendre des décisions collectives, c'est-à-dire des décisions qui

s'imposent à tous ses membres (on dira de façon équivalente qu’elle doit effectuer des choix

sociaux). Le problème est relativement simple quand il s'agit de se prononcer sur des projets

permettant des améliorations parétiennes par rapport au statu quo. Par définition, personne ne

perd: les conflits potentiels sont limités au partage du gain commun. Malheureusement, la

plupart des décisions collectives ne sont pas de cette nature: elles ont des effets redistributifs

importants. Au moins à court terme, il y a presque toujours des perdants nets (la décision

collective, quelle qu’elle soit, fera baisser le bien-être de certaines personnes).

Sur le marché, les conflits redistributifs de ce type sont rares car les coûts de sortie

demeurent généralement faibles 28 . Ceux qui anticipent qu’ils vont être perdants ont toujours la

possibilité de refuser l'échange 29 , y compris sur le marché du travail. La redistribution à

laquelle les "dominants" peuvent contraindre les "dominés" est limitée, au moins en longue

période. Dans le cas des décisions collectives, au contraire, les pertes que peut subir un

individu sont multiples et importantes. Cela signifie qu’il existe de nombreux conflits

redistributifs potentiels. Ces conflits sont résolus en pratique soit par la domination d'une

coalition particulière (pacifiquement ou après un conflit ouvert), soit par des règles

institutionnelles préétablies (du moins aussi longtemps que ces règles demeurent largement

acceptées).

Ce chapitre est consacré à une règle institutionnelle spécifique, le vote. On notera que:

- même dans les pays où cette règle joue un rôle essentiel, elle est loin d'être la

seule (certaines garanties individuelles ne peuvent être changées par un vote);

- le vote n'est jamais le seul moyen pour un individu de faire prendre en compte

ses préférences dans les choix sociaux. Parallèlement, un individu a, comme on vient de le

28 Les termes de coût, d'avantage, de gagnant, de perdant, etc., font référence à des variations d'utilité (ou de

« revenu complet »), et pas seulement à des modifications de revenu ou de richesse strictement monétaires.

29 Toute personne qui accepte de participer à un échange (sous-entendu « libre ») estime, au moment de la

transaction, que son utilité va s’accroître. Cela ne signifie pas qu’elle sera nécessairement satisfaite du résultat

de cette transaction (que ce qu’elle estime sera avéré). Se reporter sur ce point à J.Stiglitz (2000), Principes

d’Economie moderne, Louvain la Neuve : De Boeck Université.

52


voir, la possibilité de "voter avec ses pieds" 30 , de manifester dans un cadre légal ou toléré,

d'adopter un comportement illégal (de ne pas respecter les décisions collectives) ou même de

se révolter. L'analyse positive du choix entre ces différents modes d'action dépend de leurs

avantages et coûts respectifs (tout comme un consommateur choisit entre différents biens ou

un producteur entre différentes techniques de production);

- le terme de vote recouvre de nombreux systèmes de choix social. On se limite

ici aux mécanismes de type "un homme, une voix", c'est-à-dire où les conditions individuelles

de participation à la décision collective sont égales et où les préférences révélées sont de type

« pour », « contre », ou indifférent 31 . Les problèmes de discrimination dans les conditions

d'accès, de suffrage censitaire ou de révélation d'une information sur l'intensité des

préférences (sous forme de classement entre plusieurs options ou de somme monétaire que

l'individu serait disposé à payer) ne seront pas abordés.

A: Choix de la règle de vote

Même si l'on suppose qu'un accord social s'est dégagé en faveur d'un système "un

homme, une voix", il reste à définir la règle de vote.

Pour simplifier, on limite la discussion au choix entre un projet donné et le statu quo.

A priori, c'est-à-dire sans information particulière sur le comportement des autres membres de

la collectivité, les individus souhaitent éviter tout choix social susceptible de réduire de façon

incontrôlable leur utilité personnelle. La règle la plus sûre de ce point de vue est la règle

d'unanimité: les seuls projets adoptés seront ceux pour lesquels a) personne n'est contre et b)

au moins une personne est pour. En d'autres termes, tous les projets qui ne procurent pas des

"améliorations parétiennes" seront refusés.

Le raisonnement précédent suppose que les coûts d'information et de transaction

associés à la règle d'unanimité sont nuls. Or, dans la réalité, ces coûts peuvent être très élevés:

- les projets correspondant à des améliorations parétiennes sont en général

difficiles à définir techniquement et ils impliquent la plupart du temps des systèmes

complexes de compensation (une mesure qui fait gagner 10 à A et perdre 4 à B est

30 Les coûts du "vote avec les pieds" sont très différents selon les collectivités considérées. Ainsi, il est moins

coûteux de refuser les choix sociaux effectués par une collectivité locale que ceux effectués par une nation, ou de

refuser les choix sociaux d’un pays qui a des voisins culturellement proches que ceux effectués par un pays

replié sur lui-même.

31 Pour simplifier, on regroupe dans la catégorie "indifférent" (1) les électeurs qui ne participent pas au vote, (2)

les électeurs qui mettent un bulletin blanc dans l’urne et (3) les électeurs qui mettent un bulletin nul. Selon les

53


potentiellement supérieure en termes parétiens s’il est possible d’effectuer un transfert

forfaitaire d'au moins 4 de A vers B);

- même si un projet permet une amélioration parétienne, il reste à définir

comment doit être distribué le surplus social qui en découle (dans l'exemple précédent, le

surplus de social est de 6 [10-4] et le transfert de A vers B peut être compris entre 4 et 10).

Pour maximiser leur part, les individus ont intérêt à se comporter stratégiquement, en

conservant l'information dont ils disposent, notamment celle qui concerne leurs préférences.

Ce type de comportement pourra évidemment conduire à des choix sociaux sous-optimaux (à

une « perte sociale sèche » - a social deadweight loss). De plus, même si un accord

« optimal » est finalement obtenu, le temps nécessaire pour l’obtenir sera plus important. En

d’autres termes, les coûts de négociation seront plus élevés et le surplus social net distribuable

sera donc plus faible.

L'intensité des problèmes précédents dépend de deux grands facteurs: (1) de

l'homogénéité des comportements individuels et (2) de la taille de la collectivité concernée.

(1) homogénéité des comportements. Par définition, une décision collective est une

agrégation de choix individuels. Le problème est du même ordre que celui qui consiste, par

exemple, à établir un indice de prix unique à partir de milliers de prix particuliers. Plus les

« unités de base » réagissent de façon similaire et plus on obtient des règles d’agrégation

acceptables. A la limite, si toutes les préférences sont identiques et si tous les individus

perçoivent l'environnement de façon semblable, l'accord est immédiat et la décision collective

devient indépendante de la règle de décision utilisée. Le coût des décisions collectives dépend

donc (1) de l’existence de valeurs culturelles et de codes de conduite sociale largement

acceptés (altruisme, sens du sacrifice à un "bien commun" reconnu, communauté de vues et

de préférences, etc.) et (2) du degré de décentralisation des structures politiques (avec une

large part des décisions collectives prises au niveau de sous-groupes géographiques

homogènes) 32 .

(2) Taille de la collectivité. Le coût des décisions collectives est une fonction

croissante du nombre des individus appelés à y participer. En ce sens, la décentralisation

politique n'est pas seulement un mode d'homogénéisation. Elle contribue aussi, par les

partitions qu'elle autorise, à réduire le coût des décisions collectives.

règles pratiques de vote, ces trois attitudes n'ont pas toujours les mêmes effets sur le calcul des majorités. De

plus, elles peuvent révéler des préférences différentes et/ou correspondre à des « signaux » différents.

32 Argument avancé notamment dans l’article célèbre de W.A. Lewis « La chose publique en Afrique

occidentale » (Analyse et Prévision, 1966, I : 111-132 et 207-218).

54


Une solution radicale pour abaisser les coûts de décision est de lever la contrainte

d'« opposition zéro » qu'implique l'unanimité. La collectivité accepte de passer outre le

désaccord d'un certain nombre d'individus sous réserve que le nombre de personnes qui

approuvent soit supérieur à un minimum institutionnellement défini (p≥p*). Pour simplifier,

on suppose que (a) n est impair et que (b) les électeurs ne peuvent pas s’abstenir. Ils

doivent uniquement exprimer des préférences strictes entre un projet (X) et le maintien du

statu quo (S). Les votes sont soit « pour » (p) soit « contre » (c) : p+c=n 33 .

La figure 2-1, qui reprend un graphique célèbre de Buchanan et Tullock(1962), montre

comment la règle de décision optimale est déterminée. D’un côté, les "coûts de décision" (Cd)

sont une fonction croissante du nombre minimum de voix « pour » requises (de p m ). D’un

autre côté, plus p m est élevé, plus la probabilité pour un électeur de se voir imposer une

décision qui diminue son bien-être (et donc à laquelle il est opposé) est faible : les coûts

externes (Ce) d’une règle de décision collective qui exige un minimum de voix « pour » (p m )

sont une fonction décroissante de ce minimum : Ce=Ce(p m ). Dans le cas de l’unanimité, p m = n

et Ce(n) = 0 (puisque toute personne qui s’oppose à X peut obtenir le rejet du projet en votant

« contre », le risque de coûts externes dus à la règle d’unanimité est nul).

Coûts

totaux

Cd+Ce

(somme verticale

de Cd et de Ce)

M

Ce

(coûts

externes)

Cd

(coûts de

décision)

p m

=n/2

p m *

n (nombre

total

d’électeurs

Nombre minimal de

voix pour X

Figure 2-1: Choix de la règle de décision

Cependant, l'acceptation d'une règle plus faible que l'unanimité ne réduit pas

seulement les coûts de décision. Elle implique aussi pour chaque individu la perte de son droit

33 La possibilité d’indifférence entre X et S – et donc d’abstention – ne change pas le problème sur le fond mais

complique quelque peu sa formulation.

55


de veto 34 . Les autres électeurs sont maintenant en mesure de lui imposer des pertes d'utilité -

des "coûts externes" (Ce). Ces coûts dépendent de la taille de la coalition qu'un opposant doit

constituer avec les autres pour s'opposer victorieusement: ils sont donc d'autant plus forts que

le minimum p m est faible. Sur la figure 2-1, Ce(p m ) est représenté comme une fonction

décroissante, pour n donné.

La somme des deux coûts (Cd+Ce) est minimale en M, pour la règle de décision

correspondant au point p m *. C'est par conséquent cette règle qui sera retenue par un individu

représentatif rationnel. A priori, p m * peut se situer n'importe où entre 1 (une personne décide

seul) et n (unanimité).

En fait, les points situés à gauche de n/2 ne sont pas possibles, car une règle qui

n'exige pas plus que la moitié des voix permet l'adoption simultanée de décisions contraires.

En d'autres termes, si l’on définit une règle de majorité à p m /n % comme une règle exigeant un

pourcentage de votes favorables strictement supérieur à p m /n, seules les règles à 50% et plus

sont admissibles (la zone à gauche de la verticale d’abscisse n/2 sur la figure 2-1 est exclue

pour des raisons de cohérence).

Exemple : supposons que la règle de choix d’une assemblée exige au moins à 40% des

votes et que l'on vote pour ou contre la construction d'un pont. On peut parfaitement avoir

55% des électeurs pour la construction du pont et 45% contre. Dans les deux cas, la barre des

40% a été dépassée : donc l’assemblée peut adopter à la fois une motion « pour » et une

motion « contre » la construction du point.

La règle de majorité simple (c'est-à-dire telle que p m /n = 50%) est la règle de décision

collective cohérente pour laquelle les coûts de décision sont minimaux (et les coûts externes

maximaux). Cette conclusion ne vaut évidemment que pour des systèmes "un homme, une

voix", c'est-à-dire pour des conditions égales d'accès au vote. Dans le cas contraire, des sousgroupes

comprenant des personnes préalablement désignées peuvent parfaitement décider de

façon cohérente (mais à condition que la règle de décision à l’intérieur du sous-groupe

demeure au moins une règle de majorité simple).

Lorsque les coûts externes sont particulièrement élevés, la courbe Cd se situe plus vers

la droite sur la figure et la collectivité tend à recourir à des majorités renforcées (2/3, 3/4, etc.)

de préférence à la majorité à 50% (cas du point M sur la figure 2-1).

34 Avec la règle d'unanimité (au sens de personne contre), l'individu est en position de "dictateur faible", avec un

"pouvoir d'inclusion". Il peut obliger les autres à tenir compte de ses options. En revanche, il n'est pas "dictateur

fort": il n'a pas de "pouvoir d'exclusion" des options des autres.

56


B) Le choix de représentants

Le choix de règles plus faibles que l'unanimité n'est pas le seul moyen de réduire les

coûts de décision. On peut également élire des représentants chargés de décider dans un

Parlement à la place de la collectivité dans son ensemble. Cette solution de "démocratie

représentative" s'impose notamment lorsque le point p m (règle de majorité optimale en

"démocratie directe" sans tenir compte de la contrainte de cohérence) est situé très à gauche

de la majorité à 50% (du point p m =n/2). Certes, la contrainte de cohérence implique de se

situer en p m =n/2 mais les coûts totaux en ce point sont très supérieurs à ce qu'ils auraient été

en l’absence de cette contrainte (figure 2-2).

Coûts

totaux

Cd + Ce

(somme verticale

de Cd et de Ce)

Ce

(coûts

externes)

M

Cd

(coûts de

décision)

p m *

p m

=n/2

n (nombre

total

d’électeurs)

Nombre minimal de

voix pour X

Figure 2-2 : Coût de la contrainte de cohérence quand les coûts de décision sont élevés

Supposons que par une méthode adéquate (tirage au sort ou élections selon des

modalités à préciser) on puisse choisir un échantillon de r représentants (r


derniers. Au fur et à mesure que r diminue, la courbe de coûts externes pour l'individu

représentatif se déplace vers la droite, à partir de sa valeur en démocratie directe (courbe Ce

lorsque r=n). Pour chaque valeur de r, on peut calculer des courbes Cd(r)+Ce(r) et déterminer

à partir de leur minimum la règle de décision optimale. La valeur de r qui correspond au plus

petit minimum de Cd(r)+Ce(r) est celle qui correspond à la taille optimale du parlement. La

valeur correspondante de p m * (vraisemblablement très à gauche de p m =n/2) n’est évidemment

pas la règle de décision qu’il convient d’appliquer à l’intérieur du parlement (celui-ci est tenu

de respecter la contrainte de cohérence). Elle indique simplement que tout se passe comme si

les choix parlementaires pouvaient s’interpréter comme des choix en démocratie directe où

l’électorat ne serait pas soumis à la contrainte de cohérence (mais qui resteraient cohérents

puisque le parlement serait lui soumis à cette contrainte). Le gain social du système

parlementaire optimal peut alors facilement se calculer en comparant les coûts Ce+Cd d’un

vote de l’électorat à la majorité simple et les coûts Ce(r*)+Cd(r*) de décision collective par le

système de démocratie représentative.

La réduction des coûts des décisions collectives n’est que l’un des avantages de la

démocratie représentative par rapport à la démocratie directe, et vraisemblablement pas le

plus déterminant. En démocratie directe, toutes les décisions sont prises par un vote, c'est-àdire

par agrégation des préférences individuelles en un choix unique. Cela signifie que l'on est

confronté, comme on le verra, à des risques d'instabilité et d'incohérence dans les choix

successifs. Dans la démocratie représentative, au contraire, la fonction première du vote n'est

pas de décider des choix collectifs mais de sélectionner des représentants parlementaires et

des dirigeants politiques auxquels ces choix seront délégués, puis de les contrôler (en faisant

peser sur eux la menace de non-réélection et, dans le cas des dirigeants politiques, la menace

de censure par le Parlement).

La fonction du vote change alors profondément. Le problème devient moins de savoir

comment agréger au mieux les préférences individuelles afin de faire apparaître une « volonté

générale » cohérente et pertinente, mais d’utiliser le vote à la fois pour sélectionner au mieux

les nouveaux « agents » politiques lors des élections (un gouvernement et un parlement) et

pour contrôler les agents actuellement en place par la menace de non-réélection. Le problème

devient d’abord un problème d’agence, avec une particularité liée à la présence de

"principaux" multiples (les citoyens-électeurs) 35 . W.Riker(1982) a particulièrement insisté sur

35 Pour une application récente de la théorie dite de l'« agent » (mandataire) et du « principal » (mandant) aux

relations entre un élu et ses électeurs, cf.Davis et Porter(1989).

58


cet aspect de la démocratie représentative, en opposant ce qu’il appelle le « populisme » et le

« libéralisme » . Historiquement, les parlements, au moins en Europe, sont d’abord le résultat

d’une volonté de contrôle de l'utilisation des impôts payés aux monarques. Il ne s’est jamais

agi de réduire les coûts de décision d'une hypothétique démocratie directe (cf. Ardant(1976)

sur ce point).

C) Le paradoxe de la participation

Jusqu'à maintenant, nous avons supposé que tous les individus votaient. Ce qui n’est

manifestement pas le cas.

Si le vote est purement instrumental, ce à quoi on s’attend a priori de la part

d’individus rationnels, ceux-ci n’iront voter que si l'accroissement d'utilité qu'ils anticipent est

supérieur aux coûts qu'ils doivent supporter pour effectuer leur "devoir" électoral.

Soit une compétition entre deux projets P1 et P2. Les utilités de P1 et de P2 pour un

électeur i sont respectivement de U(P1) et de U(P2) avec U(P1)>U(P2). On suppose que ces

utilités sont connues avec certitude et mesurées en termes monétaires: elles représentent les

dispositions à payer de i pour avoir P1 ou P2. Si le vote exprimé par i est décisif (si, étant en

position de pivot, cet électeur peut faire basculer la majorité), l’avantage associé au vote est:

B = U(P1)-U(P2). Dans le cas contraire, cet avantage est nul. Si p est la probabilité d'émettre

un vote décisif et si C sont les coûts du vote (coûts d'information et de déplacement au bureau

de vote), l'avantage net espéré du vote pour i (E(Bn)) est 36 :

E(Bn) = p.B – C = p.(U(P1)-U(P2)) - C. (2-1)

La probabilité p pour un individu i d'émettre un vote décisif (de changer le résultat par

son vote) dépend à la fois de la taille de l'électorat et des anticipations sur le caractère plus ou

moins serré du scrutin. Cependant, dès que le nombre des participants au vote est un peu

élevé, p devient extrêmement faible, même dans le cas le plus favorable (c'est-à-dire où i

anticipe un partage égal des voix entre P1 et P2). Pour un électorat comportant 100 millions

d’électeurs, p est par exemple de 0,00006 (Mueller(1989 :350)) 37 . Dans ces conditions, la

moindre valeur positive de C (ne serait-ce que le coût associé au risque d'être renversé par une

voiture en allant au bureau de vote) fait que l’avantage net pour i (E(Bn) = p.B – C) est

presque toujours négatif. Par conséquent, un individu "rationnel" a très peu de chances d’aller

36 L'individu rationnel face au risque maximise son espérance d'utilité. Compte tenu des simplifications faites,

cela revient ici à simplement maximiser le bénéfice net espéré.

37 Et si P1 et P2 ont des chances différentes de gagner, la valeur de p est encore bien plus faible !

59


voter. Il s’agit du paradoxe de la participation, aussi appelé « paradoxe du vote » (ou

« paradoxe du (non) vote »).

Le défaut principal du résultat précédent est qu'il est totalement en contradiction avec

les faits observés, puisque de nombreux individus votent. En France, par exemple, la

participation dépasse régulièrement 70% pour les élections nationales (législatives et

présidentielles). Et même si elle est plus faible dans un pays comme les Etats-Unis (en

descendant couramment en dessous de 50%), elle demeure nettement plus importante que

l'implique la "rationalité". La théorie et les faits peuvent être réconciliés de plusieurs

manières:

1. Introduction d'une "préférence pour le vote", D. Le fait même d'aller au bureau de

vote et d'exprimer son opinion peut procurer des bénéfices psychologiques. On retrouve ici la

même logique que celle qui conduit certains individus à répondre à des enquêtes d'opinion,

dont l'avantage espéré est strictement nul mais le coût en temps est toujours significatif.

L'électeur peut aussi avoir conscience d'accomplir un devoir civique ou de contribuer à

renforcer la légitimité des futurs élus. Si p.B - C est presque toujours négatif, p.B + D - C sera

en revanche positif pour un nombre significatif d'individus. Tout en reconnaissant qu'elle rend

compte dans certains cas de l'abstention, certains critiques reprochent à cette explication de

représenter le type même de l'hypothèse ad hoc, celle que l'on introduit pour sauver une

théorie menacée par une réfutation particulière.

2. Prise en compte des comportements stratégiques. Le paradoxe de la participation

suppose une rationalité simple. Il ne tient pas compte des réactions anticipées des autres à sa

propre décision. Dans la réalité, si i anticipe que tous les autres font le même raisonnement

que lui, il en déduit que la participation sera très faible. Sa probabilité d'émettre un vote

décisif s'accroît donc fortement. Sous certaines hypothèses, on peut alors montrer que le vote,

vu comme une forme particulière de jeu non coopératif à n personnes, conduit à un taux de

participation positif (Ledyard(1984)). Toutefois, les analyses expérimentales indiquent que ce

type d’explication ne peut rendre compte que d’un pourcentage de participation limité (de

l’ordre de 20%).

3. Probabilité subjective d’être décisif. L’argument concernant la très faible valeur de

p s’appuie sur un calcul de la probabilité objective d’être décisif, c'est-à-dire sur le rapport

60


entre le nombre de cas « favorables » (où i est décisif) et le nombre des cas « possibles ».

Mais la variable sur laquelle se fonde la décision de voter est la probabilité subjective d’être

décisif, l’idée que l’électeur se fait de l’impact de son vote sur le résultat final. La plupart des

médias et des responsables et partis politiques cherchent souvent à convaincre les électeurs

que les scrutins sont serrés et que « chaque vote compte », c'est-à-dire à accroître leur

probabilité subjective d’être décisifs. Empiriquement, Tollison, Crain et Paultner(1975) ont

montré (en corrélant notamment la participation électorale et la consommation de papier

journal dans les différents Etats américains) comment les médias modifiaient les anticipations

des électeurs dans le sens d'une surestimation de leur probabilité d'être décisif. Toutefois, la

portée de la distinction probabilité objective/probabilité subjective doit être relativisée : si les

électeurs ont un minimum de rationalité dans leurs anticipations, il y a peu de chances que

l’on puisse, selon l’expression célèbre d’Abraham Lincoln, « tromper tout le monde tout le

temps ».

4. Caractère de « signal » du vote. Pour l’électeur, le vote n’est pas seulement un

instrument permettant de choisir entre des programmes. Il a aussi un aspect dit expressif,

c'est-à-dire qu’il procure une satisfaction directe à l’électeur en lui permettant de manifester

son soutien à un candidat ou à un parti. De plus, il est aussi un moyen de signaler une opinion

ou une logique de comportement aux différents acteurs politiques (en envoyant par exemple

un avertissement à certains partis lors d’élections de moindre importance). Chaque vote

comporte à la fois une composante instrumentale, une composante expressive et une

composante de signal. Seule la composante instrumentale fait intervenir la (très faible)

probabilité d’être décisif. Ce que démontre en fin de compte le paradoxe de la participation,

c’est que les électeurs qui vont voter le font surtout pour des raisons expressives et de signal.

L’aspect signal, qui est vraisemblablement le plus important, sera d’autant plus marqué que

les résultats seront comptabilisés au niveau de bureaux concernant un petit nombre

d’électeurs. Comme le note Schwartz(1987), cela donne la possibilité à des groupes très

restreints d’obtenir des avantages importants en signalant aux futurs élus le caractère

conditionnel de leur soutien (notant en matière d’investissement public en faveur d’une zone

géographique). Ce phénomène sera en revanche moins sensible si les votes sont comptabilisés

sur de larges entités 38 .

38 En un certain sens, le vote sera d’autant moins « anonyme » que les résultats seront comptabilisés à un niveau

plus désagrégé (quartier par quartier par exemple). Cette situation peut servir les intérêts des élus, qui peuvent

soit punir les quartiers qui « votent mal », soit au contraire essayer de les convaincre par un traitement de faveur.

61


5. Adoption d’une stratégie de « regret minimax » (minimax regret). Selon Ferejohn et

Fiorina(1974) l'électeur ne maximise pas son espérance d'utilité mais adopte à la place une

stratégie de "regret minimax". Cette attitude face au risque consiste à choisir la solution qui

minimise la perte au cas où la pire éventualité se produirait 39 . Pour un électeur i, la matrice

des « regrets » (c'est-à-dire de ce que l’on aurait pu avoir en plus dans la meilleure des autres

options possibles) est la suivante :

i est décisif i est non décisif

i vote 0 C

i s’abstient B-C 0

Considérons par exemple la dernière ligne du tableau : si i s’abstient et s’il est décisif,

il perd la possibilité de faire adopter le programme qu’il préfère, et donc la possibilité de

gagner B-C. Au contraire, si i n’est pas décisif, il ne peut pas obtenir plus en prenant une autre

décision (en allant voter). Son « regret » est donc nul.

Pour choisir entre voter et s’abstenir, i considère le regret maximal que lui apporte

chaque décision. S’il choisit de voter, son regret maximal est de C. S’il choisit de s’abstenir,

son regret maximal est de B-C (dont la valeur est en général très supérieure à C, surtout

lorsque i a une préférence forte pour l’un des deux programmes). i choisit de voter car c’est la

décision qui correspond au plus petit regret maximum (au regret minimax). Cette stratégie de

choix revient à considérer chaque situation indépendamment de sa probabilité d’occurrence.

L'individu choisit de voter ou de s'abstenir sur la seule base de B-C (ou B+D-C) et non de

p.B-C (ou de p.B+D-C). L'obstacle que représente une valeur de p infinitésimale est ainsi

contourné. Cependant, on peut se demander pourquoi l'individu adopte un comportement

aussi conservateur face au risque, et pourquoi il le fait seulement quand il s’agit de choisir

entre voter ou ne pas voter. De façon générale, pour être retenu, ce type d’explication devrait

être appuyé sur des preuves empiriques beaucoup fortes que celles avancées par Ferejohn et

Fiorina(1975).

Mais elle peut aussi servir les électeurs, qui pourront plus facilement marchander leur soutien et signaler par

exemple qu’ils pratiquent une stratégie de donnant-donnant (tit for tat).

39 "… que se serait-il passé si je n'avais pas voté et si le candidat que je préfère avait perdu d'une voix Cela

aurait été comme si je m'étais porté à moi-même un coup mortel." (Ferejohn et Fiorina(1974)).

62


6. Influence des institutions sociales ou du gouvernement sur les avantages et les coûts

du vote. Dans les régimes totalitaires, où les élections (à 99,99%) ne servent nullement à

choisir mais à légitimer, les gouvernements manipulent à la fois les coûts (par des pressions

politico-policières) et les avantages (en organisant notamment des fêtes et banquets autour des

bureaux de vote). Dans le cas des démocraties représentatives, une abstention trop massive est

souvent vue comme un menace pour le système politique en longue période. L'individu qui ne

vote pas impose donc des coûts externes à tous ceux qui en souhaitent le maintien. On a là une

justification potentielle pour une action publique. Il y a plusieurs moyens d'inciter les

individus à internaliser ces effets externes. On peut par exemple instaurer, par le biais du

système éducatif et de campagnes régulières contre le manque de civisme, un système de

pression sociale. On peut, plus simplement, rendre le vote obligatoire (comme cela a été ou

est le cas en Belgique, en Grèce, en Italie ou en Australie): l'amende que l'on doit payer en cas

d'abstention accroît d'autant le bénéfice net du vote. Cependant, la façon dont un

gouvernement va inciter les abstentionnistes à voter dépendra de l'avantage électoral qu'il

espère en retirer. D’un côté, l'effet de notoriété dont bénéficient traditionnellement les sortants

devrait rendre une participation accrue favorable au gouvernement en place. Mais d'autres

facteurs peuvent venir brouiller les cartes, notamment le fait que les abstentionnistes qui se

décident à voter ont une faible fidélité partisane: s'ils se répartissent également entre les partis,

c'est alors le parti minoritaire qui est bénéficiaire (qu'il soit au pouvoir ou dans l'opposition) 40 .

Il n'est donc pas certain que les intérêts à court terme du gouvernement coïncident toujours

avec l'intérêt à long terme du régime politique.

Plusieurs études empiriques ont mis en évidence la présence d'un lien

significatif entre la participation des électeurs et leurs anticipations concernant le caractère

plus ou moins serré du vote, ce qui tendrait à confirmer la présence d'un certain calcul

rationnel de la part des électeurs dans une optique instrumentale. Cependant, des études

empiriques ultérieures ont eu tendance à modérer ces résultats initiaux (Mueller(1989:354-

361)). Les électeurs sont apparemment moins naïfs quant à leur capacité d'influencer le

résultat. Cela signifie que, parallèlement à l’aspect « signal », les coûts du vote (C) et les

préférences intrinsèques pour le vote (D) jouent à nouveau un rôle central, de même que la

question des déterminants de ces deux variables.

40 Le cas du Congrès américain semble confirmer qu'une forte participation est plutôt favorable au parti

minoritaire, notamment lorsqu'il s'agit des Démocrates. Voir DeNardo(1980) sur ce point.

63


Il est établi depuis longtemps que la participation au vote croît avec le revenu et le

niveau d'éducation et qu'elle est plus forte chez les fonctionnaires. La raison en est

vraisemblablement, dans le cas du niveau d’éducation et de l’appartenance à la fonction

publique, une différence dans l'information préalablement acquise sur les choix sociaux. Cette

meilleure information correspond à un intérêt civique plus marqué (D est plus fort) – ainsi

qu’à un intérêt personnel direct dans le cas des fonctionnaires - et à des coûts plus faibles dans

l'acquisition et le traitement des informations politiquement pertinentes pour un vote

« éclairé » (C est plus faible).

Dans le cas du revenu, le résultat est a priori surprenant : dans la mesure où les

personnes ayant un revenu élevé ont un coût d’opportunité du temps plus fort, elles devraient

moins voter (le paradoxe de la participation devrait être encore plus important pour elles).

Mais cette anomalie est en fait une illusion d’optique. Elle provient de ce que le revenu (y) et

le niveau d’éducation (e) sont statistiquement très corrélés. S’il est exact que la participation p

est une fonction croissante de y dans une corrélation simple (p = α.y + α 0 avec α>0, α

significativement positif et r² élevé), le coefficient du revenu devient négatif dans une

corrélation multiple du type : p = a.y + b.e + c. On obtient alors a0, a et b

significativement différents de zéro et r² élevé. En d’autres termes, à éducation constante (en

« contrôlant » pour l’éducation), un électeur vote d’autant moins que son revenu est élevé,

contrairement à la relation simple entre participation et revenu, mais conformément à la

théorie de la rationalité des comportements individuels.

Section II : Le vote à la majorité simple

A) Théorie « spatiale » du vote

La théorie économique du vote utilise un mode particulier de représentation

des préférences des n individus-électeurs. On suppose qu’un électeur i a une fonction

d’utilité U i (x i ,g), avec x i bien privé (prix p x ) et g bien public (prix p g ). g, qui est

consommé en égale quantité par tous, n’est pas indexé pour i. La contrainte budgétaire

de i s’écrit :

y i = p x .x i +t i (g), avec t i (g) = µ i .p g .g et ∑ µ i = 1 (contrainte d’équilibre du budget

public).

64


x

E

U’

U’’

U*

g’’

g’

g*

g

Figure 2-1a

U*

U’

U’’

g’’ g’ g*

g

Figure 2-1b

FIGURE 2-1 : Préférences des électeurs et théorie spatiale du vote (une

dimension)

La figure 2-1a indique l’optimum du consommateur-électeur quand celui-ci

doit choisir entre le bien public et le bien privé, pour une part d’impôt µ i donnée (point

E où la contrainte budgétaire est tangente à la courbe d’indifférence représentant un

niveau d’utilité

Sur la figure 2-1b, g* correspond au niveau de dépense publique qui

maximiserait U i * compte tenu de la contrainte budgétaire y i . Cependant, comme g est

un bien public, il est fourni en quantité unique pour tous (par exemple, le nombre de

kilomètres d’autoroute construits chaque année est le même pour tous les électeurs). Si

le montant fixé collectivement est g’, le niveau d’utilité de l’individu correspondra à la

courbe d’indifférence U i ’ sur la figure 2-1a et au niveau d’utilité U i ’ sur la figure 2-1b.

65


Si le montant fourni est g’’, la valeur correspondante est U i ’’. Il est alors possible de

tracer la courbe d’utilité de l’individu i, compte tenu de sa contrainte budgétaire et de

sa part d’impôt µ i (figure 2-1b). Il s’agit d’une courbe à un sommet (ou point idéal –

bliss point), g*.

Si l’on fait en plus l’hypothèse que la courbe de la figure 2-1b est symétrique,

il suffit alors de connaître la distance de g’’’ à g* d’un point g’’’ et la distance de g’’’’

à g* d’un point g’’’’ (et rien d’autre) pour connaître les préférences de l’électeur i

entre g’’’ et g’’’’. On voit pourquoi ce mode de représentation des préférences pour les

biens offerts par le secteur public est appelé théorie « spatiale » du vote.

On a supposé jusqu’à maintenant que la dimension unique du choix proposé

correspondait à un montant global de dépense publique. Mais cette dimension peut

correspondre à un axe regroupant plusieurs facteurs en un seul agrégat. Ainsi, on

retient fréquemment la dimension idéologique droite/gauche comme axe unique. Un

électorat sera alors représenté comme l’ensemble des « bliss points » des électeurs. La

figure 2-2 représente par exemple un électorat comprenant sept personnes. Il est alors

facile de voir que la proposition P1 est préféré par quatre électeurs à la proposition P2

et obtiendra donc un majorité en cas de vote.

P2

P1

Droite

4 2 7 1 5 3 6

Gauche

Note : les numéros sont les indices i des 7 électeurs. P1 et P2 sont des

programmes politiques.

Figure 2-2 : Représentation spatiale d’un électorat sur un axe idéologique

Dans la réalité, les programmes proposés aux électeurs sont rarement

unidimensionnels. Au contraire, ils effectuent des propositions dans la plupart des

dimensions, du moins dans celles que l’actualité et les médias placent au premier plan.

Les courbes d’indifférence sont alors des hypersurfaces et les contraintes budgétaires

des hyperplans. Le bliss point d’un individu-électeur correspond toujours au point de

tangence entre l’hypersurface d’indifférence la plus haute et l’hyperplan de contrainte

budgétaire. La courbe obtenue dans la figure 2-1b devient alors une hypersurface dont

66


le sommet correspond au bliss point. La figure 2-3 représente le cas d’un espace à

deux dimensions. Mutatis mutandis, elle correspond à la situation de la figure 2-1b.

U

(sous

contrainte)

.

E (bliss point)

O

g 1

.

g 2

FIGURE 2-3 : Préférences des électeurs et théorie spatiale du vote (deux

dimensions)

Les deux dimensions sont deux catégories de dépenses publiques, g 1

(l’éducation par exemple) et g 2 (la défense nationale par exemple). On trace pour

chaque valeur de U (compte tenu de la contrainte budgétaire) le plan horizontal

correspondant à cette valeur et on projette sur le plan g 1 Og 2 son intersection avec la

surface d’utilité. Si la surface d’utilité est symétrique par rapport à l’axe vertical

passant par le bliss point E, la courbe projetée, qui représente le lieu des points

correspondant à la valeur de U choisie, est un cercle dont le centre est la projection du

bliss point E.

La figure 2-4 représente le résultat obtenu dans le plan g 1 Og 2.

Le bliss point de l’électeur 1 est représenté en même temps que trois de ses

courbes d’indifférence (en forme de cercle). Elles correspondent à un niveau d’utilité

d’autant plus faible que le rayon du cercle considéré est grand. Le programme B

(correspondant à g b 1 de g 1 et g b 2 de g 2 ) est préféré au programme A car il se trouve sur

une courbe d’indifférence plus proche du bliss point de 1. En fait, il n’est pas

nécessaire de tracer les cercles d’indifférence pour chaque électeur. Il suffit de calculer

67


les distances (euclidiennes) de A et B à son bliss point. Ainsi, on constate que 3

préfère A à B et que 2 préfère B à A. En cas de vote, B l’emporte sur A par deux voix

(celles de 1 et 2) contre une (celle de 3).

g 2

(défense)

g 2

b

g 1

b

g 1 (éducation)

Figure 2-4 : Représentation des préférences de trois électeurs (deux

dimensions)

La connaissance des bliss points des électeurs permet ainsi de déterminer

l’ensemble de leurs préférences et donc de prévoir le résultat de tout vote entre

différentes options (sous réserve que les conditions de symétrie posées soient

remplies). De façon générale, un électorat comprenant n électeurs (quel que soit leur

nombre) pourra être représenté par une distribution des n bliss points dans le plan g 1 g 2

(dans le cas d’un choix bidimensionnel).

On notera enfin que tous les programmes situés à l’intérieur du triangle qui

relie les sommets 1,2 et 3 sont des optima parétiens. Il n’est pas possible de trouver un

programme B qui soit préféré (au sens large) à un programme A par les 3 électeurs à la

fois. On peut trouver un programme B qui soit préféré à la majorité à A, mais toujours

avec le vote contre d’au moins un électeur.

68


B Théorème de l’électeur médian

Examinons à nouveau l’électorat représenté sur la figure 2-2. Il est clair que si

un parti propose un programme correspondant exactement au bliss point de l’électeur

1, il ne pourra pas être battu à la majorité dans des duels avec les autres concurrents.

La position occupée par l’électeur 1 correspond à un équilibre en stratégie dominante

et la seule réponse possible pour l’autre parti est de faire la même chose, afin d’avoir

la même espérance de voix (chacun obtiendra trois voix avec certitude et le résultat

final dépendra du choix de 1, qui choisira au hasard, puisqu’il est indifférent entre les

deux programmes). De même, dans un vote entre des motions prises deux à deux, celle

qui correspond aux préférences de 1 l’emporte sur toutes les autres.

Pourquoi la règle de majorité converge-t-elle de façon systématique vers les

préférences de 1 L’électeur 1 ne dispose ni d’un quelconque pouvoir de coercition ni

d’une aptitude particulière à convaincre les autres. Ses préférences se situent tout

simplement en position médiane, c'est-à-dire qu’il y a dans l’exemple retenu autant

d’électeurs qui demandent plus de bien public g que lui et autant d’électeurs qui en

demandent moins. On dit que 1 est un dictateur positionnel : ses préférences sont

exactement satisfaites non parce qu’il est puissant mais parce qu’il a les préférences

qu’il a 41 . Le théorème de l’électeur médian se contente de constater cette situation.

Théorème de l’électeur médian : le résultat d’un vote à la majorité simple

entre des projets pris deux à deux correspondra à l’optimum de l’électeur médian, sous

réserve que les électeurs soient en nombre impair ou qu’ils soient nombreux (auquel

cas le risque d’égalité de voix est négligeable).

Le point médian atteint à l’issue du vote ne correspond pas a priori à un

optimum parétien. Si certains électeurs ont une préférence très intense pour une option

et si plusieurs autres ont des préférences inverses mais avec beaucoup moins

d’intensité, il est vraisemblable qu’un accord entre les différents électeurs pourrait

permettre, après définition d’un système de transfert et de compensation adéquat,

d’atteindre un point Pareto-supérieur. Toutefois, si les électeurs ont a à peu près la

41 Techniquement, la théorie des choix sociaux distingue les dictateurs faibles, qui ont un pouvoir d’inclusion

(qui peuvent obliger les autres à inclure leurs préférences dans le choix social – avec la règle d’unanimité, tout

citoyen est un dictateur faible), les dictateurs forts qui ont un pouvoir d’exclusion (peuvent exclure du choix

social certaines préférences – ce concept est le plus proche du concept courant de dictateur) et les dictateurs

positionnels (qui ont seulement la chance de posséder les « bonnes préférences »).

69


même intensité des préférences ou si ces préférences sont distribuées au hasard (de

telle sorte qu’à un individu situé à droite du médian, on puisse faire correspondre un

individu situé à gauche et ayant la même intensité de ses préférences), et si les optima

individuels sont approximativement symétriques, alors la médiane correspond au

« point d’insatisfaction » minimum. Tout mouvement par rapport à la position de

l’électeur médian implique un résultat électoral moins favorable pour l’ensemble du

groupe social.

Le théorème de l’électeur médian fait toutefois l’hypothèse que le choix social

est unidimesionnel. Il est donc nécessaire de voir comment cette question se pose dans

un univers multidimesionnel (bidimensionnel pour simplifier). En fait, il est très

difficile de généraliser le cas unidimensionnel. Si l’on prend le cas de trois électeurs, il

est facile de montrer que tout point, même s’il est un optimum parétien (c'est-à-dire

situé à l’intérieur du triangle reliant les trois bliss points), peut être battu à la majorité.

La figure 2-5 permet de voir l’ensemble des points susceptibles de battre A. Ce

domaine est loin d’être vide : tout point situé sur l’un des pales de l’hélice de la figure

2-5 battra A.

g 2

3

A

1

2

g 1

Figure 2-5 : Absence d’équilibre dans le cas de trois électeurs

Parmi les points intérieurs au triangle (parmi les optima parétiens), on aurait

aussi bien pu choisir le point correspondant à la médiane dans chacune des

dimensions. Graphiquement, c’est celui qui a la même abscisse que 3 et la même

70


ordonnée que 1. La conclusion aurait été la même : un programme qui répond aux

préférences médianes dans chaque dimension peut être facilement battu (par un

programme qui parvient à « coaliser des minorités », c'est-à-dire à favoriser les

préférences extrêmes et/ou intenses de différents groupes dans les différentes

dimensions).

Une condition suffisante pour qu’un point soit un équilibre (ne puisse par être

battu dans des duels) est qu’il correspondent à une position de « médiane

généralisée ». Dans ce cas, par définition, toute droite (tout plan ou hyperplan à plus

de deux dimensions) passant par ce point sépare le plan (l’hyperplan) en deux sousensembles

comprenant chacun le même nombre de bliss points.

Démonstration (figure 2-6) : soit E la médiane généralisée et Z un point

quelconque. On trace en E la perpendiculaire VW à ZE. E est préféré par tous les

points (les électeurs) situés à droite de VW, soit par au moins n/2 électeurs (par la

définition même d’une position médiane généralisée).

Z

W

g 2

E

V

g 1

Figure 2-6 : Existence d’un équilibre en cas de position médiane

généralisée

Le problème de la règle de majorité simple à plus d’une dimension est qu’il

n’existe pas toujours de position médiane généralisée. Une telle position n’existe mêm

que très rarement.

71


B) Paradoxe du vote et chaos

I Le paradoxe du vote

La règle de majorité simple pose des problèmes dès que le nombre des options

offertes est supérieure à deux, c'est-à-dire dans pratiquement tous les contextes a priori

intéressants. Dans ce cas, en effet, il n’existe pas de méthode unique d’extension de la

majorité simple.

Une première possibilité est de retenir le « vainqueur de Condorcet », c'est-àdire

l’option qui l’emporte sur toutes les autres dans des duels. Exemple : choix entre

quatre options, A, B, C, D. C est vainqueur de Condorcet si C l’emporte sur A à la

majorité simple, sur B à la majorité simple, sur D à la majorité simple.

Une seconde possibilité est de définir un ordre séquentiel de vote. On

commence par exemple par un duel à la majorité entre A et B, puis par un duel à la

majorité entre C et D. Dans une seconde étape, on confronte à la majorité les

vainqueurs du duel A/B et du duel C/D. L’option retenue est celle qui obtient la

majorité dans cette seconde (et ici ultime) étape.

a) Problème du vainqueur de Condorcet

La difficulté avec la première méthode est que le vainqueur de Condorcet

n’existe pas toujours (cas dit de « paradoxe de Condorcet »). Ce vainqueur n’existe

même jamais lorsque la règle majoritaire est utilisée pour résoudre des problèmes

purement redistributifs (des jeux « à somme nulle ») entre individus égoïstes (on parle

dans ce cas de « paradoxe de Ward » - cf. Ward(1961)).

Considérer un problème de partage entre trois individus, qui obtiennent

respectivement une part f1, f2, f3 (avec f1+f2+f3 = 1 puisque le jeu est à somme

nulle).

Le programme {f1,f2,f3} sera toujours perdant – par deux voix contre une -

face à un programme du type {0, f2’=f2+f1/2, f3’=f3+f1/2), où 2 et 3 s’accordent pour

ne rien donner à 1. Mais le programme précédent peut à son tour être battu – par deux

voix contre une – par un programme {f1’’=f2’/2, 0, f’3’=f3’+f2’/2}, où 1 et 3 se

coalisent pour ne rien donner à 2. Il est alors facile de trouver un nouveau programme

72


(coalisant par exemple 1 et 2) susceptible de battre le programme précédent. On dit

que l’on est confronté à un programme sans fin de « majorités cycliques ».

Ce problème de majorité cyclique peut également se produire lorsque les

préférences des électeurs ont une configuration particulière. On se trouve alors dans le

cas d’un paradoxe de Condorcet.

Soit le « profil de préférences » suivant :

1 : ABC

2 : BCA

3 : CAB

où 1 : ABC signifie que l’électeur 1 préfère A à B à C.

A l’emporte sur B dans un vote à la majorité. B l’emporte sur C dans un vote à

la majorité et C l’emporte sur A dans un vote à la majorité. La règle de majorité ne

conduit donc pas dans ce cas à des choix collectifs transitifs. En soi, cette nontransitivité

ne pose pas un problème : on demande à une règle d’effectuer des choix

collectifs et pas de ressembler nécessairement à la « rationalité » d’un individu isolé.

En revanche, elle pose un problème par ses conséquences : les choix collectifs sont

manipulables et la décision finalement prise dpépendra de l’ordre dans lequel les duels

seront organisés. Par exemple, si l’ordre du jour (agenda en anglais) commence par un

duel entre A et B puis entre le vainqueur (A) et C, c’est C qui est retenu. Si on

commence au contraire par un duel entre B et C puis entre le vainqueur (B) et A, c’est

A qui sera choisi.

Le paradoxe de Condorcet montre que, dans certains cas, le choix collectif sera

totalement indépendant des préférences des individus pose. Le choix collectif risque

alors soit d’être purement aléatoire (si l’ordre du jour est choisi par tirage aléatoire),

soit de ne représenter que les préférences de celui qui contrôle cet ordre du jour.

Quelle est la probabilité de rencontrer ce type de situation Les estimations de

la probabilité « objective » (nombre de cas « favorables » par rapport au nombre de

cas possibles) montrent que cette probabilité est généralement très faible et qu’elle

décroît quand le nombre des individus et des options croît. En pratique, cette

probabilité est surtout faible quand les préférences des individus sont homogènes

(mais alors presque toutes les règles de choix social, avec ou sans vote, donneront les

mêmes résultats). En revanche, elle est beaucoup plus forte dans les situations où l’on

73


a véritablement de faire des « choix sociaux », c'est-à-dire lorsque les préférences sont

très hétérogènes (en d’autres termes lorsque les avis sont les plus divergents).

b) Préférences à pic unique

Existe-t-il une configuration des préférences individuelles garantissant

l'existence d'un vainqueur de Condorcet (c'est-à-dire l'absence d'un paradoxe de

Condorcet) Pour que la réponse à cette question soit positive, il suffit, comme l'a

montré Duncan Black (1958), que tous les ordres de préférences soient "à pic unique"

(single-peaked).

Soit 3 options, A, B, C à une dimension entre lesquelles doivent choisir trois

électeurs, 1, 2 et 3. Supposons qu'il s'agisse de décider de la taille d'un barrage: A est

un petit barrage, B un barrage moyen et C un grand barrage.

Les préférences sont les suivantes:

Electeur 1: ABC

Electeur 2: BCA

Electeur 3: CAB

On se trouve donc dans un cas type de paradoxe de Condorcet.

Utilité

nette

Electeur 3

Electeur 2

Electeur 1

A B

C Taille des

projets

Figure 2-7: Paradoxe de Condorcet et non-unicité des pics

Dans la figure 2-7, l'électeur 3 à la différence des deux autres électeurs a des

préférences qui ne sont pas à pic unique (single-peaked). Dans le cas contraire, la

condition de Black serait respectée et il existerait un vainqueur de Condorcet.

74


La condition de Black se démontre par l'absurde: s'il n'y a pas de vainqueur de

Condorcet, un électeur au moins possède des préférences qui ne sont pas à pic unique.

Cette condition est seulement une condition suffisante. On peut parfaitement

avoir un vainqueur de Condorcet même si elle n'est pas vérifiée. Supposons qu'une

majorité des électeurs aient des préférences correspondant à celles de l'électeur 3. En

dépit du fait que ces préférences présentent plusieurs pics, le projet C l'emporte à la

majorité sur tous les autres dans des duels : il est un vainqueur de Condorcet et il n'y a

aucun problème de majorité cyclique.

Enfin, la condition de pic unique ne vaut que dans le cas unidimensionnel. A

plus d'une dimension, on peut parfaitement avoir des préférences qui sont toutes à pic

unique et apparition de cycles majoritaires.

II Théorème du chaos

De façon générale, sauf si l’on impose des restrictions très improbables sur les

fonctions d’utilité des électeurs et/ou sur leur distribution, il n’existe pas de preferenceinduced

equilibrium. En d’autres termes, l’ensemble de Condorcet est vide.

Cela n’exclut toutefois pas que les cycles majoritaires puissent se limiter à une « petite

zone centrale ». Une telle éventualité a été évoquée en 1967 par Gordon Tullock 42 . Cette

« conjecture de Tullock » correspond à une situation semblable à celle de figure 2-8.

L’électorat est composé de N d’électeurs, dont les bliss points (non représentés pour des

questions de lisibilité de la figure) sont X 1 , X 2 et X 3 ,…, X N . Compte tenu de la position de ces

différents bliss points, on suppose que le programme A est d’abord battu à la majorité par B.

B est battu à son tour par C, qui est battu par D, etc. Cependant, bien qu’il n’y ait pas de

convergence vers un point particulier (qu’il n’existe pas de vainqueur de Condorcet), les

programmes qui remportent les votes successifs restent tous situés dans une zone relativement

restreinte. Si l’on se trouve effectivement dans ce cas de figure, le coût social de l’instabilité

liée à la présence de majorités cycliques (et donc au paradoxe de Condorcet) sera

42 Cf. Tullock G. (1967a), Toward a Mathematics of Politics, Ann Arbor : University of Michigan Press,

Tullock G. (1967b), « The General Irrelevance of the General Possibility Theorem », Quareterly Journal of

Economics, 81 (May) : 256-270. Le concept d’ensemble non recouvert (uncovered set), dû à N.R. Miller - voir

supra – est un prolongement de l’idée de Tullock. Sur ce point, cf. Miller N.R. (1980), « A New Solution Set

for Tournaments and Majority Voting : Further Graph-Theoretical Approaches to the Theory of Voting »,

American Journal of Political Science, 24 (February) : 68-96, et Miller N.R. (1983), « The Covering Relation

in Tournaments : Two Corrections », American Journal of Political Science, 27 (May) : 382-385.

75


vraisemblablement très faible : il n’y a pas de vainqueur indiscutable mais tous les

programmes qui sont susceptibles de l’emporter à un moment ou un autre sont très proches. .

G 2

E


D

• F


A

• •

C

• •

B


O

G 1

Figure 2-8 : Cycles dans une zone centrale - Tullock(1976))

Malheureusement, selon la démonstration effectuée Richard Mckelvey en 1976, la

« zone centrale » envisagée par Gordon Tullock n’existe pas. En d’autres termes, en

l’absence d’hypothèses restrictives supplémentaires, la « conjecture de Tullock » est inexacte.

Il est toujours possible de trouver une séquence de votes telle que n’importe quel point du

domaine des possibles peut battre n’importe quel autre point (dans la figure 2-8, le domaine

des possibles est le quadrant positif, dans la mesure où G1 et G2 sont des « dépenses » - dont

la valeur est donc nécessairement positive). Quand la règle de majorité fonctionne mal, quand

il n’y a pas de vainqueur de Condorcet et donc pas de transitivité dans les choix collectifs, on

peut obtenir n’importe quel résultat (« [once] transitivity breaks down, it completely breaks

down ») 43 .

43 p.$$$ in McKelvey R.(1976), « Intransitivities in Multidimensional Voting Models and Some Implications for

Agenda Control », Journal of Economic Theory, 12 (June) : 472-482. Cf. également McKelvey R. (1979),

« General Conditions for Global Intransitivities in Formal Voting Models », Econometrica, 47 : 1085-1111, et

Schofield N. (1978), « Instability of Simple Dynamic Games », Review of Economic Studies, 45 (October) : 575-

594. Ce dernier auteur a obtenu de façon indépendante un résultat semblable à celui de McKelvey, en montrant

que, sauf si les préférences individuelles sont très proches, les choix sociaux ont de très fortes chances d’être

cycliques. Se reporter également à Schofield N. (1986), Social Choice and Democracy, Berlin : Springer-Verlag.

76


La figure 2-9 présente une démonstration graphique du théorème du chaos dans le cas

d’un système à deux dimensions G 1 et G 2 et trois électeurs (1, 2 et 3). Le point de départ est le

point A (correspondant à une option ou à un programme donné). Ce point a deux

particularités :

(1) il fait partie de l’ensemble des optima parétiens (comme tout point situé à

l’intérieur du triangle X 1 , X 2 , X 3 ) ;

(2) il est unanimement préféré au point B. A, qui domine très fortement B au sens de

Pareto, l’emporte par 3 voix à zéro en cas de duel à la majorité entre A et B.

Les électeurs 1 et 3 sont indifférents entre A et son symétrique A’ par rapport au

segment X 1 X 3 . Par conséquent le point A 1 , légèrement plus proche des bliss points de 1 et 3,

sera préféré à la majorité (par 1 et 3) à A’ et donc à A.

De même, les électeurs 1 et 2 sont indifférents entre A 1 et son symétrique A 1 ’ par

rapport au segment X 1 X 2 . Par conséquent le point A 2 , légèrement plus proche des bliss points

de 1 et 2, sera préféré à la majorité (par 1 et 2) à A 1 ’ et donc à A 1 .

Pour des raisons similaires, le point A 3 , légèrement plus proche des bliss points de 2 et

3, sera préféré à la majorité (par 2 et 3) à A 2 ’ et donc à A 2 .

En répétant cette procédure un nombre suffisant de fois, on est toujours en mesure

d’atteindre un point A H tel que :

B f A H f A H-1 f … f A 3 f A 2 f A 1 f A

(f signifiant « préféré à la majorité des voix à »)

Dans le cas de la figure 2-9, une séquence de quatre votes par pair est suffisante pour

que B sorte vainqueur contre A (vote 1 : entre A et A 1 , puis vote 2 : entre le vainqueur A 1 et

A 2 , puis vote 3 : entre le vainqueur A 2 et A 3 , puis vote 4 : entre le vainqueur A 3 et B). Et cela

en dépit du fait que, dans un duel direct, A l’emporte sur B par trois voix contre zéro!

Le théorème de McKelvey a deux conséquences importantes :

(1) le pouvoir de celui qui décide de l’organisation des votes (agenda-setting), c'est-àdire

des options entre lesquelles il faut choisir et de l’ordre dans lequel il convient de le faire,

peut être considérable. Il est important de s’assurer que ce pouvoir, quand il est confié à un

individu ou à un comité restreint, n’est pas l’objet de manipulations destinées à obtenir une

répartition inéquitable des gains procurés par les décisions collectives ;

(2) la possibilité de remettre en cause tout résultat et d’aboutir à des choix

radicalement différents peut être une source d’imprévisibilité et d’instabilité chronique des

77


systèmes électoraux.

Certains auteurs, notamment W. Riker (1982), ont insisté sur le caractère très

destructeur du théorème de McKelvey, dans la mesure où il permet de douter de la stabilité

ou même de l’existence d’un équilibre de long terme dans les systèmes démocratiques 44 . Si

tel est le cas, les mêmes causes peuvent alors aussi bien provoquer des changements

« catastrophiques » que des modifications « incrémentales »… les équilibres atteints, s’ils

existent peuvent dépendre fortement des trajectoires empruntées. Enfin, l’absence d’équilibre

est parfaitement incompatible avec l’existence de longues périodes de stabilité apparente. La

seule différence est que ces périodes peuvent être suivies, à tout moment et sans raison

particulière, de périodes de perturbations sociales et de révoltes très profondes.

Jusqu’à quel point peut-on faire confiance aux conclusions théoriques précédentes Il

existe en effet un contraste surprenant entre ce que suggère la théorie (c'est-à-dire une quasipermanence

de cycles, de manipulations des ordres du jour et de remise en cause des choix

effectués) et la grande stabilité des résultats observés dans la pratique, au moins dans les

démocraties des pays développées. Les explications possibles de ce paradoxe sont examinées

dans la section I du chapitre III.

44 Cf. Riker W. (1982) Liberalism against Populism, A Confrontation Between the Theory of

Democracy and the Theory of Social Choice, San Francisco: Freeman.

78


A’ 3

G 2

B

A’

A 1

X 3 A’ 2

A 3

A

X 1

A 2

X 2

A’ 1

O

G 1

Figure 2-9 : Théorème du chaos (McKelvey (1976))

79


III Théorème d’impossibilité

N’est pas au programme de l’examen

Chapitre III : Démocratie représentative et comportement des partis

politiques

N’est pas au programme de l’examen

Section I : Compétition politique dans un système bipartite

A) Analyse déterministe

I Convergence des programmes

II Comportements d’abstention

III Persistance des cycles

IV Contrainte dans l’espace des politiques possibles

B) Analyse probabiliste

C) Déterminants empiriques du vote

Section II : Théorie des systèmes multipartites

A) Règles de représentation et nombre de partis à l’équilibre

B) Théorie des coalitions

C) Nombre de partis et effecicacité des systèmes politiques

Chapitre IV : Les modèles politico-économiques

A) Les comportement des responsables politiques

B) Le comportement de l’administration publique

C) Le comportement des groupes d’intérêt

D) Les interactions entre économie et politique

80

More magazines by this user
Similar magazines