Cours (0.466 Mo) - Centre d'Ãconomie de la Sorbonne
Université de Paris I Panthéon-Sorbonne
Année universitaire 2002-2003
DEA Décisions publiques, institutions et
organisations
Economie publique positive
et
Analyse économique de la politique
(notes de cours)
(Professeur Jean-Dominique Lafay)
1
Plan :
Introduction
Chapitre 1: Choix collectifs et origines de l'Etat
- L’équilibre social dans un « état de nature »
- L’entreprise Etat et son développement
Chapitre 2: Analyse économique du vote
- Choix de la règle de vote et paradoxe de la participation
- Le vote à la majorité simple
Chapitre 3: Démocratie représentative et comportement des partis
- Compétition dans un système bipartite
- Analyse des systèmes multipartites
Chapitre 4: Les modèles politico-économiques
- Le comportement des responsables gouvernementaux
- Le comportement de l’administration et des groupes d’intérêt
- Les interactions entre économie et politique
Principales références bibliographiques :
Breton A. (1996), Competitive Governments, Cambridge : Cambridge University Press.
Eggertsson T. (1990), Economic Behavior and Institutions, Cambridge : Cambridge
University Press.
Enelow J.M. et Hinich M.J. (1984), The Theory of Spatial Voting, Cambridge : Cambridge
University Press.
Frey B. (1985), Economie publique moderne, Paris : PUF.
Greffe X. (1994), Economie des politiques publiques, Paris : Dalloz.
Kelly J.S. (1987), Social Choice Theory, An Introduction, Berlin : Springer-Verlag.
Lafay J.D. et Lecaillon J. (1992), L’Economie mixte, Que sais-je n°1045, Paris : PUF.
Lecaillon J. (1998), Economie et Politique, Paris : Cujas.
McLean I. (1987), Public Choice : An Introduction, Oxford : Basil Blackwell
McNutt P.A. (1996), The Economics of Public Choice, Cheltenham : Edward Elgar.
Merrill III S. et Grofman B. (1999), A Unified Theory of Voting : Directional and Proximity
Spatial Models, Cambridge : Cambridge University Press.
Mueller D. (1989), Public Choice II, Cambridge : Cambridge University Press.
Pondaven C. (1994), Economie des décisions publiques, Paris : Vuibert.
Pondaven C. (1995), Economie des administrations publiques, Paris : Cujas.
Riker W.H. (1982), Liberalism Against Populism, A Confrontation Between the Theory of
Democracy and the Theory of Social Choice, San Francisco : W.H. Freeman.
Sandler T. (1992), Collective Action, Ann Arbor : University of Michigan Press.
Stiglitz J. (2000), Economics of the Public Sector, 2 nd Edition, New York : Norton.
Wolfelsperger A. (1995), Economie publique, Paris : Presses Universitaires de France.
2
Introduction :
L'économie publique étudie l'ensemble des problèmes liés aux activités de l’Etat,
marchandes ou non marchandes. Le terme « Etat » est défini ici de façon purement
descriptive : il désigne simplement l’institution qui, dans un pays donné, regroupe les
organismes publics et parapublics ainsi que les entreprises publiques ou contrôlées par le
secteur public. Sans référence particulière aux objectifs ou aux fonctions que doit remplir
cette institution.
Les problèmes d’économie publique ont été abordés pendant longtemps de façon
presque exclusivement normative. Les économistes se fixaient pour but de rechercher des
politiques optimales, c'est-à-dire d’indiquer à l'institution Etat ce qu'elle devait ou devrait
faire. Cette façon de voir, qui revient à se placer dans la position du « conseiller du Prince »,
est tout particulièrement développée en France, où les administrations publiques jouent un
rôle déterminant dans la recherche économique.
Mais, quel que soit leur intérêt intrinsèque, les débats normatifs sont loin d'épuiser
l'ensemble des questions scientifiquement importantes. Ils laissent dans l’ombre tous les
problèmes dits positifs, c'est-à-dire ceux concernant ce que l’Etat fait ou fera réellement.
Exemple de la politique budgétaire : la théorie (keynésienne) traditionnelle permet de
répondre à une question normative du type : « faut-il que le gouvernement diminue, accroisse
ou laisse inchangé le déficit budgétaire ». En revanche, elle ne donne aucune indication
quant à la réponse qu’il convient d’apporter à une question positive du type : « le
gouvernement va-t-il diminuer, accroître ou laisser inchangé le déficit budgétaire ». Or les
questions positives concernant la politique publique (ici le problème de la prévision de la
politique budgétaire à venir) sont au moins aussi importantes que les questions normatives, en
particulier pour les investisseurs privés.
Si l’Etat cherchait à tout moment à maximiser le bien-être collectif ou s’il suivait à la
lettre les politiques optimales définies par les économistes, la théorie normative de l’Etat
serait également une théorie positive. L’Etat ferait exactement ce qu’il doit faire (du moins
3
selon les économistes). Mais cela suppose que cet Etat soit un « despote » omniscient, tout
puissant et bienveillant, selon l’expression célèbre de l’économiste suédois Knut Wicksell. En
réalité, l’Etat est une organisation complexe, où les agents qui prennent et exécutent des
décisions ne sont a priori ni omniscients, ni tout puissants, ni spécialement bienveillants.
L'Etat réel risque donc de ne ressembler que de très loin à l’Etat idéal (celui pour lequel on
pourrait considérer que la théorie normative est aussi une théorie positive - principe
« normative as positive ») :
1 - les décideurs publics ont une information imparfaite sur les structures
économiques. Ils ne connaissent pas le « vrai » modèle de l’économie, les relations estimées à
partir des observations antérieures ont des chances d’être instables dans le futur 10 et les
valeurs des variables exogènes sont mal anticipées ;
2 - les décideurs publics ne sont pas tout puissants. Aucun gouvernement, même le
plus autocratique, ne peut manier librement les instruments de politique économique dont il
dispose. Il doit toujours composer avec l’opinion publique, avec divers groupes d’intérêt et,
surtout, avec son administration (sa « bureaucratie »), c'est-à-dire avec l’organisation chargée
de la mise en œuvre des politiques publiques. La liberté du gouvernement est tout
particulièrement restreinte dans une démocratie, dans la mesure où les contre-pouvoirs font
partie intégrante des institutions et où les préférences des électeurs-pivots, ceux dont le vote
peut faire basculer la majorité, jouent un rôle décisif - au moins quand on se trouve à
proximité des échéances électorales ;
3 - l’hypothèse de bienveillance signifie que la seule préoccupation des
gouvernements est de rendre maximum le bien-être collectif. Dans les faits, « l’Etat », le
« gouvernement », etc., sont des entités institutionnelles abstraites derrière lesquelles se
trouvent des individus, avec leurs fonctions d’utilité propres. Il n’y a aucune raison de
supposer que ces individus cherchent à maximiser à tout moment le bien-être collectif. Ils sont
a priori ni plus ni moins altruistes - ou ni plus ni moins malveillants - que les autres. Par
ailleurs, les aléas des luttes de pouvoir font que leur poids respectif dans les décisions
publiques varie considérablement au cours du temps et selon le type de problème.
Reconnaître que l’Etat n’est ni omniscient ni tout puissant (points 1 et 2 ci-dessus) a
10 Si les anticipations sont « rationnelles », les paramètres estimés à partir des observations antérieures ne
permettent pas de simuler correctement de nouvelles politiques économiques, car les agents modifient leur
comportement en fonction de l’expérience acquise. Cette remise en cause des simulations de politique
économique à partir de modèles estimés est connue sous le nom de « critique de Lucas » (Lucas R. E. Jr (1976),
« Econometric Policy Evaluation : A Critique », Journal of Monetary Economics, 2 (supplement)).
4
toutefois des conséquences limitées. Cela ne remet pas fondamentalement en cause la capacité
explicative de l’analyse normative. A condition de tenir compte des coûts d’information et des
coûts de mise en œuvre des politiques optimales proposées, la théorie économique normative
est parfaitement capable d’expliquer les choix réellement faits par un Etat bienveillant à
information imparfaite et à pouvoir limité. En revanche, l’abandon de l’hypothèse de
« bienveillance » (point 3 ci-dessus) est une source de difficultés beaucoup plus grandes. Si
les différents décideurs publics poursuivent des objectifs personnels, les politiques publiques
qu’ils vont [rationnellement] choisir ne correspondront que par hasard aux politiques
optimales 11 . Trois conséquences en découlent :
1 - le seul remède à la non-bienveillance de l’Etat est d’ordre institutionnel. Il consiste
à mettre en place des « institutions optimales », c'est-à-dire des systèmes d’incitations
rendant compatibles la maximisation du bien-être collectif et la maximisation de l’utilité
personnelle des décideurs publics ;
2 - si les institutions existantes ne sont pas « optimales » au sens précédent, il existera
toujours des défaillances de l’Etat parallèles aux défaillances du marché. Le débat sur le
choix entre le marché et l’Etat ne peut se limiter à l’examen des défaillances du seul marché.
Montrer qu’un marché fonctionne mal (ne correspond pas à un optimum social) n’est plus
suffisant pour justifier une intervention de l’Etat. A partir du moment où les décisions
publiques s’écartent systématiquement de l’optimum, il faut aussi montrer que l’Etat
fonctionne moins mal que le marché qu’il est censé remplacer ou corriger ;
3 - l’ampleur des défaillances de l’Etat dépend du comportement des décideurs publics
et de leur capacité de poursuivre des « objectifs d’intérêt public ». Le choix entre marché et
Etat est fonction du type d’Etat considéré et de la qualité de la « gouvernance » dans le
secteur public (c'est-à-dire de l’efficacité incitative des institutions, de l’histoire et de la
sociologie de sa classe politico-administrative, etc.).
En montrant que le choix entre marché et Etat pose à la fois le problème du
fonctionnement du marché et celui du fonctionnement de l’Etat, l’économie publique positive
a complètement renouvelé les termes du débat.
11
L'idée qu'un responsable politique ou un fonctionnaire puisse avoir des objectifs qui ne coïncident pas
nécessairement avec « l'intérêt de l’Etat » suscite toujours des réticences. En revanche, la même hypothèse
appliquée aux personnes travaillant dans le secteur privé ne fait presque jamais problème. Implicitement, cela
supposer que les membres du secteur public ont des fonctions d’utilité plus « altruistes » (plus dépendantes de
l’utilité des autres) que celles des agents du secteur privé. Pour qu’une telle différenciation soit acceptable, il
faudrait (1) montrer qu’elle a des causes théoriques solides (phénomènes d’autosélection dans les choix de
carrière, processus sociologiques de formation des préférences, etc.) et (2) apporter des arguments empiriques
prouvant qu’elle a une existence réelle.
5
Historiquement, les limites et insuffisances de l'approche normative sont devenues
particulièrement évidentes au cours des années 70, en grande partie sous la pression des
circonstances. Les difficultés conjoncturelles liées aux crises pétrolières ont provoqué des
dysfonctionnements importants dans le secteur public, notamment en matière de transferts
sociaux (par suite de la montée du chômage). Les objectifs sont alors devenus plus
étroitement politiques et de plus court terme, avec l’abandon de fait des techniques de
planification budgétaire à moyen terme.
Face aux difficultés précédentes, le besoin d’une analyse capable d’expliquer
rigoureusement les causes de maux internes du secteur public a été ressentie de façon
croissante. C’est à cette période que l’économie publique positive a réellement pris son essor,
pour devenir, au début des années 80, une discipline à part entière. Certes, de nombreuses
variantes coexistent, comme en témoignent les multiples appellations actuellement en
circulation (économie publique positive, analyse économique de la politique, théorie des
choix publics, économie des décisions publiques, théorie politique positive, économie
institutionnelle… et maintenant [nouvelle] économie politique). Ces analyses ont toutefois
deux points communs :
- 1) elles essaient d’expliciter les objectifs et contraintes des décideurs en tenant
explicitement compte de la dimension politique et administrative dans les choix publics ;
- 2) elles considèrent l’Etat comme une organisation au même titre que les autres et
étudient en priorité les différentes incitations résultant des règles institutionnelles existantes
(pour en déduire parfois, dans une vision plus normative, des réformes souhaitables, sinon
optimales, de ces règles).
L’économie publique positive s’est développée à partir des travaux de Kenneth Arrow
(théorie des « choix sociaux » – 1951), de Duncan Black (théorie des « choix politiques » -
années 40 et 1958) et surtout de Anthony Downs (théorie « économique de la démocratie » -
1957), James Buchanan et Gordon Tullock (théorie des « choix publics » - 1962 ) et Mancur
Olson (théorie de « l’action collective » - 1965). L’idée commune à tous ces auteurs (Arrow
mis à part) a été de construire une théorie microéconomique du comportement des différents
acteurs du secteur public, sur la base de leurs fonctions d’utilité propres et de toutes les
contraintes spécifiques auxquelles ils sont soumis (sans se limiter au domaine économique).
Dans ce cadre, l’Etat devient un agent - ou plutôt un agrégat d’agents -, dont on étudie le
comportement au même titre que celui des consommateurs ou des producteurs privés.
6
Chapitre 1: Choix collectifs et origines de l'Etat
Comment s'établit l'équilibre social dans un "état de nature", c'est-à-dire dans une
société où cette forme d'organisation particulière qu'est l'Etat n'existe pas Pour quelles
raisons et quand les individus sont-ils amenés à définir collectivement des règles
institutionnelles ou à s'en remettre à une organisation étatique Répondre à ces différentes
questions permet de bien comprendre les conditions d'émergence d'une « demande d'Etat ».
Naturellement, la forme que prendra l'Etat effectif dépend aussi des conditions de « l’offre
d'Etat ».
La reconstruction logique à laquelle on procède dans ce chapitre n'a aucune prétention
historique. L'émergence de l'Etat dans la réalité a été un processus autrement complexe et
diversifié. Toutefois, tous les mécanismes que l'on analysera dans ce chapitre ont joué à un
moment ou à un autre un rôle déterminant et il est difficile de comprendre l'évolution et le
fonctionnement des Etats modernes sans y faire référence.
Section I: L'équilibre social dans un « état de nature ».
La volonté de reconstruire logiquement le processus d'émergence des institutions
sociales a été une préoccupation constante de la philosophie politique. Le point de départ a été
en général un « état de nature », c'est-à-dire une société sans Etat. Cet état peut être marqué
par la violence et la "guerre de tous contre tous" (comme dans le Leviathan de Thomas
Hobbes (1656)) ou correspondre à une situation plus pacifique (comme dans les Two Treatise
of Government de John Locke(1689)) 12 . Dans le premier cas, l'Etat est une condition de la
survie sociale, dans le second, il est un simple moyen de remédier à des inconvénients.
Ces questions ont été remises au premier plan de l’analyse économique il y a 25 ans
par deux Robert Nozick (dans Anarchia, State, and Utopia, New York: Basic Books, 1974) et
James Buchanan (dans The Limits of Liberty : Between Anarchy and Leviathan, Chicago:
University of Chicago Press, 1975).
L’analyse part d’une société comprenant deux individus, ou deux groupes homogènes
12 Il peut aussi être initialement paisible puis se dégrader de façon irréversible avec l'accroissement de l'inégalité,
comme dans Sur l’origine de l’inégalité de Jean-Jacques Rousseau(1755).
7
d’individus, et a recours à la théorie des jeux pour mettre en évidence les principaux
problèmes posé par l’action collective dans un « état de nature ». On suppose que les jeux
sont non coopératifs. L’hypothèse est que les joueurs ne peuvent pas passer entre eux des
accords qui les engagent de façon certaine (c'est-à-dire matériellement réalisables et qui ne
peuvent pas être remis en cause ex post par la seule volonté de l’un des joueurs). Chaque
individu recherche alors l’utilité maximale pour lui dans le cadre des contraintes posées, sans
tenter de coordonner ses actions avec celles des autres 13 .
Les jeux sont présentés sous forme normale et non sous forme extensive. En d’autres
termes, l’arborescence des choix n’est pas représentée (on ignore leur « dynamique »). Seule
la matrice des gains est étudiée, c'est-à-dire la matrice représentant des gains respectifs de
chaque joueur à la fin du jeu selon les différents cas de figure.
On suppose par ailleurs, sauf précision contraire, que les jeux sont symétriques :
- tous les joueurs accordent la même valeur aux mêmes résultats. Les résultats
diagonaux sont donc de type (x,x) (se reporter par exemple au tableau 1-2);
- les termes symétriques par rapport à cette diagonale sont des images inverses
(du type (x,y);(y,x)).
La symétrie n’est pas nécessaire mais elle permet souvent de simplifier l'analyse sans
perte de généralité, dans la mesure où les choix auxquels sont confrontés les deux agents sont
exactement les mêmes (toute stratégie d’équilibre pour A l’est alors également pour B).
I) Jeux d’assurance, dilemmes du prisonnier et chicken games.
Dans l’analyse des problèmes d’action collective, on distingue trois grandes classes de
jeux : les jeux d’assurance, les dilemmes du prisonnier et les chicken games 14 .
13 Sur la différence entre jeux coopératifs et jeux non coopératifs, cf. Rasmusen(1989 :29 et suiv.). Comme le
remarque cet auteur, dans la réalité, la véritable différence entre les deux types de jeux « lies in the modelling
approach. Both theories start off with the rules of the game, but they differ in the kinds of solution concepts
employed. Cooperative game theory is axiomatic, frequently appealing to Pareto-optimality, … fairness, and
equity. Non cooperative game theory is economic in flavor, with solution concepts based on players maximizing
their own utility functions subject to stated constraints… In applied economics, the most commonly encountered
use of cooperative games is to model bargaining… Cooperative games often allow players to split the gains from
cooperation by making side-payments… The distinction between cooperative and non-cooperative games does
not lie in conflict or absence of conflict ». Rasmusen E.(1989) Games and Information, An Introduction to Game
Theory, Oxford : Basil Blackwell.
14 On préférera l’expression chicken game à sa traduction française « jeu de la poule mouillée » (selon Atkins
B.L. et al. (1995), Le Robert & Collins, dictionnaire français-anglais, anglais-français, 4 ème édition, Paris :
Dictionnaires le Robert.).
8
a) jeux d’assurance et définition de normes sociales
Soit deux conducteurs, A et B, qui peuvent choisir de circuler soit à droite, soit à
gauche, la société n’ayant pas de règles particulières au départ. La matrice des gains est
donnée dans le tableau 1-1. Il s’agit d’un jeu pur de coordination. Si A et B choisissent de
circuler du même côté de la route, c'est-à-dire s’ils font des choix correspondant soit à la
cellule nord-ouest, soit à la cellule sud-est, chacun en retire un gain important (de 1). Au
contraire, les gains respectifs sont nuls s’ils choisissent des côtés différents (gains de 0 dans
les cellules sud-ouest ou nord-est).
Options de A
Circuler à gauche
Optionsde B
Circuler à gauche Circuler à droite
(1,1)
(eq. Nash)
(Pareto opt.)
(0,0)
Circuler à droite
(0,0)
(1,1)
(eq. Nash)
(Pareto opt.)
Tableau 1-1 : Un jeu pur de coordination, le choix des normes de circulation
Note : (x,y) correspond au gain x pour A et au gain y pour B.
Dans les cas les plus simples, les jeux d’assurance possède une seule « solution
prééminente », ou « point focal », liée à des « croyances communes » homogènes (c'est-à-dire
à des éléments non rationnels). L’exemple le plus célèbre est l’expérience effectuée par
Thomas Schelling (dans Strategy of Conflict, Harvard University Press, 1960), où des
personnes devaient se rencontrer un jour donné « à New York », sans préciser ni le lieu ni
l’heure de rendez-vous. La moitié d’entre elles ont choisi la gare centrale et presque toutes
l’heure de midi 15 .
Dans le cas du tableau 1-1, le problème est compliqué par l’existence de deux
solutions prééminentes (tout le monde circule à droite ou tout le monde circule à gauche). Le
choix de l’une ou de l’autre peut alors s’effectuer soit par communication directe entre les
individus et production de normes sociales, soit par apprentissage, une solution se révélant
plus pratique quand le jeu est « répété » (on a par exemple expliqué le choix de chevaucher à
15 Il faut néanmoins préciser que les participants à l’expérience étaient tous originaires de New Haven et que tous
les trains en provenance de New Haven passent par la gare centrale de New York (Grand Central Station).
9
gauche par le fait que, la plupart des personnes étant droitières, il était de la sorte plus facile
de dégainer son épée et de faire front à un adversaire sur des routes peu sûres).
Dans le tableau 1-1, les deux solutions prééminentes sont des équilibres de Nash (ou
de Cournot-Nash). Cela signifie que, si l’on suppose que chaque joueur considère comme
donnée la stratégie de l'autre (c'est-à-dire si personne n'anticipe une possible réaction de
l’autre à sa propre décision), aucun joueur n’aura intérêt à modifier seul son choix 16 .
Soit x d y d les gains de A et B quand ils circulent tous les deux à droite et x g y g les gains
de A et B quand ils circulent tous les deux à gauche. Ces solutions sont des équilibres de Nash
car, pour la case nord-ouest, ∀ x et y, x g y ≤ x g y g et xy g ≤ x g y g et, pour la case sud-est, ∀ x et y,
x d y ≤ x d y d et xy d ≤ x d y d .
Par ailleurs, aucun des équilibres atteints n’est dominé au sens de Pareto par un autre
choix. (1,1) est un optimum parétien, que l’on se place dans la cellule nord-ouest ou dans la
cellule sud-est).
Certains jeux d’assurance peuvent conduire à des équilibres correspondant à des
répartitions des gains très différentes pour les joueurs. Ainsi, dans la « bataille des sexes », un
couple est en désaccord quant à son programme de sortie. Le mari veut assister à un match de
boxe, la femme veut aller au cinéma. Toutefois, ils préfèrent dans tous les cas être ensemble
que séparés. La matrice des gains, que l’on comparera utilement à la matrice du tableau 1-1,
est alors la suivante :
Options de F (femme)
Match de boxe
Cinéma
Options
de M (mari)
Match de boxe (5,2)
M avantagé
(eq.Nash)
(Pareto opt.)
Cinéma
(1,1)
(1,1)
(2,5)
F avantagé
(eq.Nash)
(Pareto opt.)
Tableau 1-2 : Un jeu de coordination impur, la « bataille des sexes »
Note : (x,y) correspond au gain x pour le mari et au gain y pour la femme.
16 En revanche, si un joueur sait que les autres vont modifier leur choix à une certaine date, il peut avoir intérêt à
modifier également le sien, même si la situation actuelle correspond pour lui à un équilibre de Nash. Exemple :
abandon par la Suède de la circulation à gauche pour la circulation à droite à partir du 01/09/1967.
10
Les deux cellules nord-ouest et sud-est (première diagonale de la matrice) sont à la
fois des équilibres de Nash et des optima parétiens (elles n’ont pas de Pareto-supérieurs).
Toutefois, à la différence de ce qui se passait dans le tableau 1-1, ces deux optima n’ont pas
les mêmes conséquences distributives. On appelle ce jeu est jeu de coordination impur car il
contient à la fois des éléments de coordination (aller ensemble au même endroit) et des
éléments de compétition (aller au cinéma ou aller à un match de boxe).
Par rapport au jeu de coordination pur qui précède, la solution sera vraisemblablement
plus difficile et plus longue à faire émerger, mais, une fois celle-ci choisie, elle présentera les
mêmes qualités (optimalité et équilibre de Nash - personne n’a intérêt à en dévier seul).
En définitive, on voit que, dans tous les jeux d’assurance, l’émergence de normes
sociales suffit à atteindre un équilibre optimal, sans risque de déviance de la part des joueurs.
En pratique, ces normes peuvent être produites par l’expérience, par les connaissances
communes ou par une institution spécialisée (un Etat qui se contente d’édicter des règles que
les individus s’appliqueront en général spontanément à eux-mêmes)
b) Dilemmes du prisonnier et passagers clandestins
La société est toujours composée de deux individus (ou de deux groupes homogènes
d'individus), A et B. Chacun a la possibilité d'utiliser ses ressources, soit pour produire de
nouveaux biens, soit pour modifier à son profit la distribution des biens déjà produits. Si les
biens sont tous des biens agricoles et si la violence armée est le seul instrument de
redistribution, les individus ont le choix entre :
- (1) s’engager dans une activité d'agriculteur, avec une forte capacité de produire et
une faible capacité d'attaque et/ou de se défense ;
- (2) s’engager dans une activité de brigandage, avec une forte capacité de redistribuer
par la force à son profit mais une faible capacité de produire.
La cellule sud-est du tableau I-3 correspond à un équilibre de Nash. Ni A ni B ne
modifieront seuls leurs choix. Si A devient agriculteur, B restant brigand, son gain diminue de
2 à 1. De même, si B devient agriculteur, A restant brigand, son gain diminue de 2 à 1.
En réalité, la cellule sud-est correspond à une forme d’équilibre plus robuste qu’un
11
simple équilibre de Nash. Il s’agit d’un équilibre en stratégie dominante. Cela signifie que,
quoi qu’anticipe chaque joueur (que l’autre soit agriculteur ou qu’il soit brigand), chacun a
intérêt à choisir d’être brigand. Lorsque B choisit d'être agriculteur, A gagne 3 comme
agriculteur et 4 comme brigand. Lorsque B choisit d'être brigand, A gagne 1 comme
agriculteur et 2 comme brigand. Dans les deux cas, A a intérêt à choisir la stratégie de
brigandage. Du fait de la symétrie du jeu, on peut dire qu'il en va de même pour B.
La matrice des gains est la suivante:
Options de A
Agriculture
Brigandage
Agriculture
(3,3)
Compromis
(Pareto opt.)
(4,1)
A avantagé
(Pareto opt.)
Optionsde B
Brigandage
(1,4)
B avantagé
(Pareto opt.)
(2,2)
(Eq. en stratégie
dominante)
Tableau 1-3 : Jeu du dilemme du prisonnier
Note : (x,y) correspond au gain x pour A et au gain y pour B.
Ce jeu simple, dit de dilemme du prisonnier, est le jeu de coordination le plus connu
et il joue un rôle très important dans la théorie des choix sociaux. Il correspond en effet à une
situation où la poursuite de son intérêt personnel par chacun conduit à des équilibres sousoptimaux
au sens de Pareto. Dans l'exemple du tableau 1-3, la position d'équilibre sud-est
(2,2) est dominée au sens de Pareto par la position nord-ouest (3,3). Si les joueurs pouvaient
coordonner efficacement leurs actions, ils atteindraient la position nord-ouest (avec trois pour
A et trois pour B). Mais cette solution n’est pas une situation d’équilibre : A et B ont intérêt
l’un et l’autre à prendre des engagements (à s’engager à être agriculteur et à reconnaître
certains droits de propriété) puis à ne pas les respecter par la suite.
Les cas de dilemme du prisonnier sont fréquents dans les situations d’action collective,
en particulier dans les relations internationales, qui conservent par de nombreux aspects les
caractéristiques d’un « état de nature ». La période de la guerre froide est, par son caractère
bipolaire, celle qui s’est rapprochée le plus du modèle de jeu simple retenu ici. L’impossibilité
d’obtenir des accords de désarmement entre deux superpuissances, qui cependant disposaient
12
chacune de quoi faire exploser près d’une dizaine de fois la planète (alors qu’une seule fois
pouvait raisonnablement sembler un maximum), peut s’interpréter comme un équilibre en
stratégie dominante dans un jeu de dilemme du prisonnier 17 .
La raison principale de la sous-optimalité des équilibres atteints est l’impossibilité de
passer des contrats crédibles. Si, dans le tableau 1-3, un joueur était sûr que l’autre puisse
s’engager de façon irrévocable à être agriculteur, il accepterait lui-même de prendre le même
engagement. L’équilibre s’établirait alors dans la cellule Pareto optimale nord-ouest.
Malheureusement, quand A (resp. B) tient ses engagements (est agriculteur), B (resp. A) a
intérêt à ne pas respecter les siens (à devenir brigand). On dit que B (resp. A) a intérêt à se
comporter en passager clandestin (free-rider). Ce problème du passager clandestin, qui est
inexistant dans les jeux d’assurance, fait qu’il n’est plus suffisant d’édicter des règles ou des
normes sociales. Il faut qu’elles soient respectées. Le problème central devient celui de la
capacité de faire respecter des règles – rule enforcement – et, plus généralement, celui de leur
assurer une crédibilité suffisante.
Origine du terme « dilemme du prisonnier » : le terme provient du contenu du jeu
proposé à l’origine, où un prisonnier accusé d’un crime avec un complice doit choisir entre
avouer et ne pas avouer. Les suspects sont placés dans des cellules séparées. Ils ne peuvent
donc pas communiquer entre eux ni, a fortiori, conclure des accords. Le juge informe chacun
que (1) si seulement l’un des deux avoue, celui qui a avoué est condamné à une peine légère
(2 ans) et celui qui n’a pas avoué à une peine maximum (10 ans), que (2) si aucun n’avoue, les
deux sont condamnés à une peine légère (2 ans) et que (3) si les deux avouent, ils sont
condamnés à une peine intermédiaire (5 ans). Il est facile de montrer qu’avouer est une
stratégie dominante pour chacun des suspects (elle minimise leur condamnation quoi que
fasse l’autre). En revanche, l’équilibre atteint, où les deux avouent, est clairement Paretoinférieur
à ce qu’ils auraient obtenu en n’avouant ni l’un ni l’autre (mais cela aurait nécessité
au minimum une concertation entre eux – exclue par hypothèse – et une crédibilité minimale
des engagements pris par chacun).
17 cette suraccumulation s’explique pour sa part par une « dynamique de la course aux armements », où l’écart
d’armement avec l’adversaire compte plus que son niveau absolu (conformément au modèle célèbre de L.F.
Richarson, publié dans Arms and Insecurity : A Mathematical Study of the Causes and Origins of War,
Pittsburgh: The BoxWood Press, 1960).
13
c) Chicken games
Les situations de dilemme du prisonnier sont socialement coûteuses mais elles ont au
moins le mérite de la stabilité, puisque chaque joueur dispose d'une stratégie dominante
(indépendante du choix de l'autre). Dans la situation dite de "chicken game", présentée dans le
tableau 1-4, même cet avantage de stabilité disparaît. Supposons que la matrice des gains soit
modifiée comme suit:
Options de A
Agriculture
Brigandage
Agriculture
(3,3)
Compromis
(4,2)
A avantagé
Optionsde B
Brigandage
(2,4)
B avantagé
(1,1)
Situation de
désastre
Tableau 1-4: Situation de "chicken game"
Note: (x,y) correspond au gain x pour A et au gain y pour B.
Comme on le vérifie facilement en calculant les gains de A et B quand chacun modifie
unilatéralement son choix, il existe maintenant deux équilibres de Nash (cellule sud-ouest
pour le premier, cellule nord-est pour le second).. A choisit ainsi d'être agriculteur quand il est
sûr que B choisit d'être brigand et réciproquement. Comme B gagne plus dans le cas de
l’équilibre de la cellule sud-ouest, il a un intérêt évident à persuader A que, quoi qu'il arrive, il
choisira la stratégie de brigandage : s’il y parvient, A décidera effectivement de devenir
agriculteur, pour le plus grand bénéfice de B. Le problème est que A va effectuer exactement
le même raisonnement. Il sait que, s’il parvient à persuader B qu’il sera quoi qu’il arrive
brigand, alors B décidera d’être agriculteur. Le drame du chicken game est que, si chacun
maintient effectivement ses positions (si personne ne veut céder), on aboutira à la cellule sudest,
c'est-à-dire à la pire des quatre situations représentées dans le tableau 1-4.
A l’origine, le chicken game est un « jeu » où deux automobiles roulent en sens
inverse dans une rue étroite et où le premier qui monte sur le trottoir a perdu. La variante la
14
plus célèbre est celle du film de James Dean, La fureur de vivre 18 , où les deux automobilistes
roulent en direction d’un ravin en sachant que le vainqueur est le dernier qui freine.
Le chicken game offre une bonne représentation des situations de crise, notamment en
matière internationale. La crise de missiles de Cuba, en octobre 1962, est un cas type, avec un
problème très spécifique de crédibilité des menaces nucléaires proférées par les protagonistes
(J.F.Kennedy et N.Kroutchev). Chaque chef d’Etat pouvait en effet croire que la menace de
l’autre d’utiliser l’arme nucléaire n’était pas crédible, qu’il ne prendrait la responsabilité de
faire exploser la planète et n’appuierait donc pas sur le bouton au dernier moment. Or, c’est
justement à cause de ce manque de crédibilité de la menace nucléaire que la situation est
devenue particulièrement dangereuse.
Par rapport à un jeu de dilemme du prisonnier, le chicken game présente des équilibres
multiples et moins stables. La moindre stabilité vient de ce que les équilibres sont seulement
des équilibres de Nash et non des équilibres en stratégie dominante. La multiplicité des
équilibres est de son côté la source d’un conflit distributif entre les joueurs. Cela les incite à
s’engager – à se « précommettre » (precommit) - de la façon la plus crédible (la plus
irrévocable) possible. Le risque est d’aboutir alors à la situation de la cellule sud-est, c'est-àdire
aux gains, positifs ou négatifs, les plus faibles pour tous. Dans les situations de chicken
game, le problème central n’est donc pas celui de la sous-optimalité, comme dans un dilemme
du prisonnier, mais la nécessité d’éviter que le conflit distributif n’aboutisse à une situation de
« désastre ».
II L'émergence de la coordination
Dilemme du prisonnier et chicken game sont deux modèles essentiels pour l'analyse
des choix politiques et sociaux car ils incitent à penser que l'allocation des ressources dans
« l’état de nature » sera très inefficace. Les individus ont tendance à investir beaucoup trop en
moyens de protection de leurs avoirs et/ou en moyens d'appropriation des avoirs des autres.
Toutefois, la vie des individus dans l’état de nature n’est pas nécessairement aussi « solitaire,
pauvre, pénible, bestiale et brève » (« solitary, poore, nasty, brutish, and short ») que le pense
Thomas Hobbes dans le Leviathan. En particulier, si le coût des investissements militaires
défensifs est inférieur à celui des investissements militaires offensifs, la société sera
18 Rebel Without a Cause pour le titre américain original.
15
elativement pacifique. Par ailleurs, une certaine propriété de fait sera respectée si les
individus peuvent dissuader les prédateurs potentiels en les menaçant de coûts très supérieurs
aux avantages nets qu'ils peuvent espérer. Des échanges volontaires entre individus et groupes
peuvent alors parfaitement s’instaurer. En d’autres termes, une institution de type étatique
n'est pas, comme on le prétend parfois, une condition nécessaire de l’émergence du marché
(même s’il s’agit vraisemblablement d’un passage obligé pour son expansion au-delà d'un
certain seuil).
Dans le cas de dilemme du prisonnier comme dans celui de "chicken game", les
individus cherchent à passer à des situations Pareto-supérieures en instaurant un certain degré
de « coopération » entre eux. A ne peut en effet choisir d'être agriculteur que si B s'engage à
l'être également et s’il y a une probabilité suffisante pour que B tienne son engagement. Le
même raisonnement vaut pour B.
En pratique, les individus sont rarement totalement ignorants quant à la capacité des
autres joueurs de respecter leurs engagements ou des règles socialement imposées. Soit a 11 , le
gain de A dans la cellule nord-ouest du tableau 3-1, a 21 son gain dans la cellule nord-est et a 22
son gain dans la cellule sud-est. A doit choisir entre être agriculteur en passant un accord avec
B ou rester brigand. Si A choisit l’accord, il se retrouvera dans la cellule nord-ouest (solution
coopérative) si B tient ses engagements et dans la cellule nord-est si B ne tient pas ses
engagements. En supposant pour simplifier que les individus sont neutres par rapport au
risque, ce choix dépend de la valeur espérée de l’accord avec B pour A.
Soit E(V A ) = p eB . (a 11 - a 22 ) + (1-p eB ) . (a 21 - a 22 ), où :
- p eB représente la probabilité que l’engagement pris par B soit tenu,
- (a 11 - a 22 ) est le gain net apporté par la solution coopérative quand B
respecte ses engagements,
- (a 22 - a 21 ), négatif, correspond au coût supporté par A quand B ne respecte
pas ses engagements.
En reprenant les valeurs retenues dans la matrice des gains du tableau 1-3, on vérifie
facilement que E(V A ) = 2 . p eB – 1. A accepte de signer l’accord si p eB > 0,5. Dans le cas
contraire, il préfère l’équilibre en stratégie dominante (cellule sud-est). De même, on obtient
pour B, E(V B ) = p eA . (b 11 - b 22 ) + (1-p eA ) . (b 12 - b 22 ) = 2 . p eA – 1. B accepte de signer l’accord
si p eA > 0,5. Il y a donc accord si min (p eA, p eB ) > 0,5.
De façon générale, les individus peuvent sortir d’une situation de dilemme du
prisonnier pour trois raisons : (1) parce qu’ils détiennent une information qu’ils jugent
suffisante sur les autres joueurs (information qui peut avoir été accumulée au cours de jeux
16
antérieurs), (2) parce qu’ils sont en mesure de limiter leurs pertes si les événements se passent
mal en changeant de comportement au cours de phases ultérieures du jeu (ce qui suppose que
le jeu soit « répété »), (3) parce que des interventions externes viennent modifier la structure
des gains des différentes options (des pénalités imposées par « l’Etat » peuvent par exemple
augmenter considérablement le coût espéré de l’option « brigandage »).
Expérimentalement, on observe que les situations de dilemme du prisonnier ou de
"chicken game" conduisent habituellement à la solution coopérative (cellule nord-ouest)
lorsque le jeu est joué plusieurs fois par les mêmes joueurs (lorsque le jeu est répété, c'est-àdire
correspond à un superjeu). La raison en est simple: si B ne joue pas « agriculteur » quand
A a joué « agriculteur », A peut toujours lui « rendre la pareille » (redevenir « brigand ») lors
de la partie suivante (stratégie de tit for tat). De façon générale, la solution coopérative
apparaîtra chaque fois que les joueurs peuvent effectuer des menaces crédibles de représailles
pour tout joueur qui n’adopterait pas le comportement auquel il s’est engagé.
Dans les communautés de faible taille et homogènes, l’information sur les punitions
encourues par les individus qui n'adoptent pas un comportement coopératif est facile à
diffuser et il est peu coûteux de détecter ceux qui ne respectent pas les règles posées (les
« passagers clandestins » ou « déviants » - free riders). Le marché pour les activités de
punition et de protection n'est pas suffisamment large pour justifier une division du travail
(une production d'ordre par des spécialistes).
Dans les sociétés nombreuses et hétérogènes, au contraire, les coûts associés au
problème de la non-coopération sont beaucoup plus importants. Il n'est possible de sortir de
situations initiales de dilemme du prisonnier ou de "chicken game" que par l'instauration:
- de règles formelles définissant le "bon" comportement;
- d'un système associant pénalités et récompenses au respect ou au non-respect des
règles précédentes;
- d'une organisation chargée de l'application des pénalités et récompenses;
Les deux dernières conditions sont liées à la possibilité que des agents se comportent
en "passager clandestin". Fondamentalement, l'Etat apparaît comme une organisation
permettant de produire des comportements coopératifs en édictant des règles et en ayant
recours à la coercition pour imposer leur respect.
17
Section II L'entreprise Etat et son développement
On vient de voir que, si l’on excepte les situations correspondant à des jeux
d'assurance, l’impossibilité de coordonner les actions individuelles peut conduire soit à des
situations sous optimales (jeu de "dilemme du prisonnier"), soit à des situations de désastre
(« chicken game »). La demande de garantie des contrats passés, autrement dit la demande
d'ordre, est l’une des principales causes de la création de cette entreprise originale de services
qu'est l'Etat.
L’instauration de l’institution étatique va avoir de profondes conséquences. Tout
d'abord, les incitations à investir en moyens d’attaque ou de défense disparaissent. Aucun
individu ne peut plus obtenir des redistributions par la force et il devient ainsi inutile de se
protéger. En conséquence, un montant important de ressources devient disponible pour la
production. De plus, parce que les engagements pris deviennent crédibles, les possibilités
d'échange s'élargissent considérablement. La spécialisation productive devient alors possible
sur une large échelle : pour un même montant de ressources, il est possible de produire
beaucoup plus. L'Etat, même si, comme on l’a vu, n’est pas la condition de l’émergence du
marché, devient clairement l’une des causes de son développement. La possibilité de
contraindre les individus a aussi une autre conséquence : l’Etat peut financer par la fiscalité un
volume plus adéquat de biens publics (par comparaison avec une situation de « provision
volontaire » de ces biens) ainsi que différentes interventions correctrices.
I) La production des biens publics
Soit une collectivité qui doit se protéger contre les inondations en construisant une
digue de sable. Plus la digue est haute et mieux la collectivité est protégée. Il s'agit ici
clairement d'un bien public pur (à consommation indivisible).
Supposons d'abord que chaque individu i contribue librement à la fourniture de ce bien
public en amenant le nombre gi de sacs de sable qu'il désire. La valeur totale de la protection
apportée et donc du service dont bénéficie chaque membre de la collectivité dépend de la
hauteur de la digue, donc de G = gi + ∑ gj, avec j≠i.
L'individu i a une fonction d'utilité Ui=Ui(xi,G), continue, dérivable à l’ordre deux et
concave, où xi est la quantité de bien privé consommé par i. Pour un revenu yi et des prix p x
(prix du bien privé) et p g (prix du bien public), la contrainte budgétaire s'écrit:
18
yi= p x .xi + p g .gi = p x .xi + p g .(G-∑ gj).
On suppose que i adopte un comportement de type Nash, c'est-à-dire que les quantités
apportées par les autres sont données : gj = constante pour tout j≠i. Donc, ∑ gj= constante.
La maximisation de Ui sous contrainte de yi conduit à:
L = Ui(xi,G) + λ. (yi - p x .xi - p g .(G-∑ gj)
Conditions de premier ordre.
δUi/δG -λ.p g =0
δUi/δxi - λ.p x =0
soit: (δUi/δG)/(δUi/δxi)= p g /p x
(C1)
L’individu i apporte volontairement des sacs de sable jusqu’à ce que le taux marginal
de substitution pour lui entre bien public et bien privé soit égal au rapport des prix.
Examinons maintenant les conditions correspondant à un optimum parétien (c'est-àdire
à dire au comportement d’un décideur central bienveillant).
Il s’agit de maximiser Ui(xi,G) sous une contrainte générale de ressources
(Y= p x .(xi+∑xj)+p g .G) et pour des valeurs fixées des niveaux d’utilité des autres individus
(Uj(xj,G) =⎺Uj pour tout j≠i).
L = Ui(xi,G) + λ. (Y-p x .(xi+∑xj)-p g .G) + ∑ µj. (Uj(Xj,G)- ⎺Uj)
Conditions de premier ordre :
δUi/δxi-λ.p x =0
µj.δUj/δxj-λ.p x =0 pour tout j≠i
δUi/δG+ ∑ µj.δUj/δG - λ.p g =0
En combinant on obtient:
(δUi/δG)/(δUi/δxi) + ∑ (δUj/δG)/(δUj/δxj) = p g /p x
(C2)
ce qui correspond à la condition traditionnelle d'optimalité en cas de biens publics (condition
de Samuelson) : la somme des taux marginaux de substitution entre bien public et bien privé
doit être égale au prix relatif du bien public et du bien privé.
La comparaison de C1 et de C2 permet de voir que la quantité de bien public produite
par provision volontaire (C1) sera vraisemblablement très inférieure à l'optimum (C2). En
d’autres termes, l’individu i apportera volontairement un nombre de sac de sables beaucoup
plus faible que celui qu’un décideur central bienveillant lui indiquerait d’apporter à
l’optimum. Si x et G sont des biens normaux, les tms (δUi/δG)/(δUi/δxi) et
19
(δUj/δG)/(δUj/δxj) sont positifs et décroissants.
C2 peut s’écrire : (δUi/δG)/(δUi/δxi) = p g /p x - ∑ (δUj/δG)/(δUj/δxj) < p g /p x
Le TMS à l’optimum (δUi/δG)/(δUi/δxi) est inférieur à sa valeur de provision
volontaire (C1). Il correspond donc à un montant G* supérieur à ce que l’individu apporte
spontanément : la provision volontaire bien public correspond à une sous-provision. Cette
sous-provision augmente avec la taille de la collectivité (∑ (δUj/δG)/(δUj/δxj) étant d’autant
plus élevé que n, le nombre d’individus, est élevé). En d’autres termes, les bénéfices anticipés
de la coordination des contributions individuelles sont croissants.
Remarques terminales :
1) Si la provision centralisée peut permettre d’atteindre l’optimum, rien n’assure
qu’elle l’atteindra réellement. Tout d’abord, cette méthode d’allocation des ressources
implique de connaître les conditions de demande, c'est-à-dire l’ensemble des taux marginaux
de substitution entre bien privé et bien public pour tous les membres de la collectivité. Non
seulement cette information est très coûteuse à rassembler mais elle risque également d’être
manipulée (les individus ayant intérêt à ne pas révéler leurs véritables TMS). Par ailleurs, les
responsables politiques et administratifs peuvent avoir intérêt à biaiser systématiquement la
révélation et l’agrégation des préférences individuelles. Enfin, rien ne garantit que les
décideurs centralisés souhaitent véritablement parvenir à une allocation efficace des
ressources. Si l’on tient compte de ces coûts et biais spécifiques de l’allocation centralisée, la
provision volontaire de biens publics sera, au moins dans certains cas, beaucoup moins
dominée que l’analyse précédente le laisse supposer.
2) On a supposé, dans l’exemple présenté, que le bien public était de type
"sommation", c'est-à-dire que la quantité disponible pour tous était la somme des
contributions individuelles. Il existe deux autres grands types de biens publics : (a) les biens
de type "maillon faible" (weakest link), où la quantité disponible pour tous dépend de la
contribution de celui qui apporte le moins (voir encadré ci-dessous) et (b), à l'autre extrême,
les biens de type "meilleur tireur" (best shot), où la quantité disponible du bien public est
égale à la contribution de celui qui apporte la quantité la plus forte. Les analyses d’économie
expérimentale tendent à montrer que, au moins pour les collectivités de petite taille, l'écart
entre la provision volontaire et l'optimum est plus faible pour les biens publics de type
weakest link qu’avec les biens publics de type sommation et, a fortiori, avec ceux de type best
shot.
20
3) Les biens publics sont en un certain sens un cas limite d’effets externes, c'est-à-dire
de situations où la consommation ou la production d’un agent économique a des
conséquences non voulues et non prises en compte par lui dans ses décisions sur la production
ou la consommation des autres. Ce qui vient d’être dit pour les biens publics vaut en général
pour l’ensemble des effets externes. Les seules différences viennent de ce que : (a) l’effet
externe peut être autant la source d’un « bien » que celle d’un « mal », (b) tous les membres
de la collectivité concernée ne consomment pas nécessairement le bien (ou le mal) en quantité
égale, (c) la production volontaire d’effets externes (notamment de déséconomies externes)
est beaucoup plus fréquente que celle de biens publics (dans la mesure où l’individu qui en est
responsable ne se préoccupe que des coûts ou des avantages pour lui de sa décision).
Biens publics de type « maillon faible » et « meilleur tireur »
L’exemple type de bien public weakest link (maillon faible) est celui d’un groupe
d’agriculteurs qui construisent une clôture pour protéger leurs cultures de l’intrusion des
animaux. On suppose que chacun possède un des quatre terrains A, B, C, D de sur la figure cidessous.
Chacun est censé construire volontairement la partie de clôture correspondant aux
deux côtés extérieurs de sa propriété (tracés en trait plein gras). Il est clair que la protection
apportée au groupe dépend de la barrière la plus basse (du « maillon faible »). L’incitation à
adopter un comportement de passager clandestin (free rider) est limitée par le risque d’être le
maillon le plus faible et donc de décider du niveau final de protection apporté à tous (et donc
à soi-même).
Terrain de A
Terrain de D
Terrain de B
Terrain de C
Dans le cas de biens publics de type best shot (meilleur tireur), le problème est
exactement inverse. L’incitation à être passager clandestin (à faire peu d’effort dans la
fourniture volontaire du bien) est très forte car (a) la probabilité d’être celui qui fournit
effectivement le bien en tant que « meilleur tireur » est faible (au moins dès qu’un groupe un
tant soit peu nombreux est concerné) et (b) la probabilité qu’un autre fasse au moins aussi
bien que vous est très élevée. Le meilleur moyen de résoudre le problème de fourniture des
biens publics best shot (la production de découvertes scientifiques par exemple) est de fournir
des incitations personnelles fortes à un effort efficace pour les fournisseurs potentiels
(monétaires et/ou non monétaires).
21
II La définition optimale des droits de propriété
L’existence d’un Etat permet de supprimer les inefficacités liées à ce que l’on appelle
la « propriété commune » en instaurant un système de droits de propriété, c'est-à-dire de
droits exclusifs d’usage et de transfert de la propriété de différents biens.
Soit une ressource naturelle appropriée en commun et dont l’offre est fixe ; un lac où
des pêcheurs peuvent venir librement pêcher par exemple. On suppose que tous les pêcheurs
sont identiques et que le coût d’opportunité de leur activité est constant : le salaire qu’ils
peuvent obtenir en travaillant ailleurs est w. La quantité totale de poissons pêchés est Q =
Q(L), où L est le nombre de pêcheurs. La productivité moyenne, Q/L, représente le nombre de
poissons pêchés par chaque pêcheur. La productivité marginale, dQ/dL, représente la
contribution d’un pêcheur supplémentaire à la quantité totale. Pour simplifier, on fait
l’hypothèse que (a) les courbes de productivité sont linéairement décroissantes et que (b) le
prix du poisson est normalisé à 1 : les quantités physiques sont donc identiques aux quantités
monétaires et les productivités en volume ne diffèrent pas des productivités en valeur.
Les pêcheurs vont entrer jusqu’à ce que la productivité moyenne (ce que leur rapporte
la pêche à chacun) soit égale au taux de salaire (w=OW). Cela correspond au point Z sur la
figure 1. En ce point, la ressource naturelle (le lac) est exploitée jusqu’au point où la « rente »
que procure cette ressource est nulle : la valeur totale de la pêche (ZWOL z ) est égale à son
coût d’opportunité. Le point qui maximise la rente est celui pour lequel la productivité
marginale (la contribution à la pêche globale du dernier pêche entré) est égale au taux de
salaire. La rente est égale à la différence entre la valeur globale de la pêche (YUOL y ) et le
coût d’opportunité global (XWOL y ).
Le libre accès à la ressource naturelle (au lac) est donc une source de surexploitation
de cette ressource. La raison de ce phénomène est simple. En Z, le pêcheur obtient pour lui
une quantité L z Z (égale à son coût d’opportunité privé, OW), mais il n’accroît la quantité
totale que de L z T (du montant de sa productivité marginale). Le montant TZ, qui a été pêché
au détriment des pêcheurs inframarginaux (c'est-à-dire déjà présents sur le lac), correspond à
un pur gaspillage de facteur travail (il aurait été pêché de toute manière).
Le phénomène de surexploitation qui précède est connu sous le nom de « Tragedy of
the Commons » (« tragédie de la propriété commune »). Le fait d’instaurer un droit de
propriété individuel apporte une solution simple, dans la mesure où c’est maintenant le
propriétaire unique qui décide de l’entrée : aussi longtemps qu’il cherche à maximiser la rente
que lui procure la ressource naturelle, le nombre de pêcheurs qu’il emploiera (au salaire w)
22
pour pêcher dans le lac sera de L y (point où la productivité marginale du dernier pêcheur est
égale au salaire w payé).
Il est parfois possible d’estimer directement la valeur de certains droits de propriété,
quand , par exemple, l’Etat décide de vendre au secteur privé des terres auparavant laissées en
libre accès ou quand il met aux enchères des licences d’utilisation exclusive de nouvelles
fréquences radio. Le prix que les acheteurs acceptent de payer est une bonne mesure de la
somme actualisée des rentes qu’ils anticipent.
Remarque : l’émergence de la rente est due au caractère exclusif du droit de propriété
(à l’existence d’un seul décideur quant à la quantité de travail à employer pour exploiter la
ressource naturelle) et non au fait que la propriété soit publique ou privée. Si le droit de
propriété est privé, l’Etat pourra toujours reprendre une partie de la rente par une fiscalité
adéquate, de préférence proportionnelle et suffisamment faible pour préserver les incitations à
maximiser. Dans le cas d’un droit de propriété public, le résultat dépendra des objectifs du
décideur. Si celui-ci cherche à maximiser les recettes fiscales de l’Etat, son choix sera le
même que celui d’un décideur privé. S’il est guidé par des objectifs plus « socio-politiques »
(de maximisation du volume de l’emploi à court terme par exemple), il aura alors plutôt
tendance à se rapprocher du point Z (tout en sachant que le coût d’opportunité de cette
politique se mesure par le montant de la rente « gaspillée » en ne se plaçant pas en Y).
23
Pté moyenne
Pté marginale
Tx de salaire
U
Y
W
X
Z
T
O
Ly
Lz
L (travail)
Figure 1-1 : Surexploitation en cas de propriété commune
Les résultats précédents permettent de mettre en évidence une partie des effets de la
définition de droits de propriété. Toutefois, ils sont fondés sur des hypothèses très
simplificatrices (travail homogène, absence d’avantages comparatifs dans l’utilisation de la
ressource naturelle, technique de production simple, pas de barrières à l’entrée, etc.). Dans la
réalité, définir et faire respecter les conditions d’exclusivité de l’usage et du transfert de la
propriété peut se révéler très coûteux.
Selon les cas, la comparaison des coûts aux avantages espérés (somme actualisée des
rentes anticipées) pourra conduire soit à maintenir une propriété commune (à ne pas définir de
droits de propriété), soit à définir des droits incomplets, soit à définir des droits complets mais
à ne les faire que partiellement respecter. Dans ce dernier cas, on retrouve une logique proche
de la « demande de crime » dans la théorie du crime de G. Becker : la société « accepte » un
certain taux de « criminalité » car réduire ce taux à zéro serait plus coûteux que les avantages
espérés.
Sur la figure 1-2, la valeur actuelle des rentes anticipées est une fonction croissante du
degré de certitude ρ des droits de propriété (indicateur tenant compte à la fois de la précision
et de la probabilité de respect des droits existants). Il en va de même pour la valeur actualisée
des coûts associés à la définition et au respect de ces droits (plus le droit est précis et bien
24
especté, plus les coûts sont élevés). On remarquera que ρ dépend fortement de la stabilité
anticipée des règles définissant la propriété, et donc de facteurs comme l’instabilité politique
ou le caractère plus ou moins discrétionnaire de la politique publique. Dans une étude récente,
S. Borner, A.Brunetti et B.Weder (1995, Political Credibility and Economic Development,
New York : St Martin’s Press) ont montré que cet aspect des droits de propriété jouait un rôle
central dans les choix des investisseurs internationaux.
Coûts et
avantages
actualisés de
l’instauration
de droits de
propriété
Coûts
actualisés
Avantages
actualisés
0
ρ∗ (degré
optimal)
1
Degré de précision et
de certitude des
droits de propriété
Figure 1-2 : degré optimal de précision et de certitude des droits de propriété
Dans le cas de la figure 1-2, l’optimum correspond à des droits de propriété
imparfaitement définis (ou respectés de façon seulement partielle). Selon la forme des
courbes, l’optimum pourra conduire soit à laisser le bien en propriété commune, soit à
produire des droits mal définis ou dont le respect est mal assuré, soit établir des droits
parfaitement définis et certains (dont le respect est pleinement assuré). Dans les sociétés
modernes, la propriété totalement commune est relativement rare mais il existe de nombreux
cas où le degré de précision et de certitude des droits demeure sensiblement éloigné de 1.
L’instauration de droits de propriété privés ne correspond pas nécessairement à une
amélioration parétienne, comme le montre la figue 1-3. Il se peut que l’augmentation
25
d’efficacité (le non-gaspillage des rentes) s’accompagne d’une augmentation très forte des
inégalités. Dans ce cas, et au moins en l’absence de transferts permettant de corriger la
distribution pour se rapprocher du nouvel optimum optimorum (point R sur la figure 1-3), le
bien-être social peut diminuer (sans que l’on puisse estimer la probabilité pour qu’une telle
situation se produise effectivement).
U i
Courbes
d’indifférence
sociale
Frontière initiale des
possibilités de production
A
R
Frontière des possibilités de
production avec droits de
propriété
P
Figure 1-3 : Instauration des droits de propriété et bien-être social
U n-i
On suppose dans la figure 1-3 que la société est divisée en deux groupes, l’individu i
d’une part (fonction d’utilité U i ), et tous les autres individus d’autre part (fonction d’utilité
individuelle représentative notée U n-i ). L’équilibre de l’état de nature est A tandis que
l’équilibre après instauration des droits de propriété est P. Compte tenu de la forme des
courbes sociales d’indifférence, on voit que, si la frontière des possibilités de production après
droits de propriété domine la frontière initiale, l’accroissement de l’inégalité de la distribution
des ressources fait plus que compenser cet avantage : l’équilibre P correspond à une courbe
d’indifférence sociale plus basse que celle qui passe par A. Il est toutefois évident que, si des
transferts forfaitaires sont possibles, l’économie peut atteindre le point R, c'est-à-dire un point
correspondant à un niveau de bien-être nettement plus élevé que dans l’état de nature.
La propriété commune correspond à une situation particulière d’interdépendances non
prises en compte (génératrices d’effets externes). Plus généralement, chaque fois que la
législation publique laisse un droit de propriété non défini ou mal défini, pour des motifs de
26
coût ou pour toute autre raison, la collectivité est potentiellement confrontée des problèmes
d’effets externes. Face à une telle situation, trois solutions sont envisageables :
- l’Etat définit, précise et/ou assure un meilleur respect des droits de propriété
concernés. Les individus peuvent alors régler le problème « spontanément », mais pas
nécessairement sans coût, selon une logique de négociation à la Coase (voir ci-dessous) ;
- l’Etat modifier l’environnement pour faire en sorte que les agents internalisent les
effets externes, soit à l’aide d’incitations positives – en modifiant la structure de prix à la
Pigou, soit en s’appuyant sur des incitations négatives – en réglementant ou en instaurant des
pénalités suffisamment élevées et suffisamment crédibles pour dissuader les agents de ne pas
respecter la réglementation ;
- l’Etat n’intervient pas, le statu quo ayant pour avantage de n’avoir aucun coût de
mise en œuvre (no implementation costs).
Pour chaque objectif d’internalisation donné, le choix d’une solution particulière
dépendra de son coût comparé à celui des deux autres. Le résultat dépendra fortement du type
d’effet externe concerné et de son ampleur.
III Accords volontaires et clubs
a) Théorème de Coase
Enoncé initial du théorème in Ronald Coase (1960), « The Problem of Social Cost », Journal
of Law and Economics, 3 (Oct.) :1-44.
Voir également C.G. Veljanovski (1982), « The Coase Theorem and the Economic Theory of
Markets and Law », Kyklos, 35 (1) :53-74.
Depuis A.C. Pigou, l’économie publique normative traditionnelle admet que, en cas
d’effets externes, seule une intervention discrétionnaire de l’Etat, en général sous forme de
taxe ou de subvention, est capable de rétablir l’équilibre. Aucune action volontaire ne serait
en mesure de corriger la sous-optimalité du marché en réconciliant les coûts et avantages
« privés » avec les coûts et avantages « sociaux » (c'est-à-dire en internalisant d’un commun
accord les effets externes).
Le « théorème de Coase » montre, au contraire que, sous réserve que les coûts de
transaction soient nuls, les agents concernés par un effet externe peuvent se mettre d’accord
sur une allocation parétienne des ressources, quelle que soit la structure initiale des droits
de propriété – mais à la condition que cette structure soit clairement définie (que ce soit
par la loi, par la coutume ou par suite d’un commun accord entre les parties concernées).
27
Coûts marginaux
Coût marginal de
la dépollution
Coût marginal
social de la
pollution
E
O
Q E
(pollution
optimale)
Q M
(pollution
« naturelle »)
Q (niveau
de pollution)
Figure 1-4 : Internalisation des effets externes par négociation
Dans la figure 1-4, une entreprise pollue l’environnement, avec un coût social
marginal croissant pour la population environnante. Parallèlement, la réduction de la pollution
implique des coûts marginaux qui sont d’autant plus élevées que l’on s’éloigne du point Q M
de pollution « naturelle » (c'est-à-dire de la pollution que l’on observerait sans système de
dépollution) et que l’on se rapproche du point de pollution zéro.
Si les droits sur l’air appartiennent aux pollueurs (ici à l’entreprise), le point de départ
est Q M : l’entreprise n’effectue aucune dépense susceptible de réduire la pollution que subit la
population. L’initiative viendra de la population. Celle-ci proposera de payer les coûts de
dépollution à l’entreprise jusqu’en E, point au-delà duquel le coût marginal social de la
pollution devient inférieur au coût marginal de la dépollution.
Si les droits sur l’air appartiennent maintenant à la population, le point de départ est
une pollution nulle. L’initiative vient alors de l’entreprise. Jusqu’au point E, celle-ci préférera
dédommager la population (payer le coût marginal social de la pollution dont elle est
responsable) plutôt que de supporter le coût marginal plus élevé de la dépollution. Au-delà du
point E, en revanche, l’entreprise préférera payer le coût de la dépollution plutôt que de
dédommager la population. On voit donc que, dans tous les cas, que les droits de propriété sur
28
l’air soient attribués à l’entreprise ou à la population environnante, on aboutit en E. Or, en ce
point, le coût marginal de la dépollution est égal au coût marginal de la pollution, ce qui
correspond exactement aux conditions de correction optimale de l’effet externe.
Le théorème de Coase montre que la correction des effets externes n’implique
pas nécessairement une modification par l’Etat de la structure des prix (taxes – ou subventions
- à la Pigou) ni a fortiori une suppression du marché (avec fourniture du bien par une
entreprise publique en monopole et censée produire au prix « optimal »). Les agents
concernés par un effet externe peuvent parfaitement internaliser cet effet s’ils se mettent
d’accord sur une structure contractuelle de « droits » de propriété non définis au départ (règles
de bon voisinage par exemple) ou si l’Etat se contente de préciser ou d’établir ces droits
(utilisation des fréquences radio par exemple).
Mais le théorème de Coase présente un autre intérêt, celui de mettre en
évidence, a contrario, les raisons susceptibles de justifier une intervention publique lorsque les
hypothèses posées par Coase ne sont pas vérifiées :
1- Hypothèse de droits de propriété définis : comme on l’a vu, la définition de droits
de propriété peut être plus coûteuse que la somme actualisée des avantages anticipés de cette
définition. Dans ces conditions, on préférera, selon le montant des coûts et avantages, soit
recourir à d’autres modes de correction (taxation à la Pigou, réglementation du marché, etc.)
soit ne pas intervenir du tout (ne pas chercher à corriger les effets externes, c'est-à-dire les
laisser en « propriété commune »).
2 – Hypothèse de coûts de transaction nuls : cette hypothèse est intenable dès que le
nombre des individus concernés par l’effet externe dépasse un certain seuil. Dans le cas de
l’entreprise polluante, ce problème est inexistant du côté du pollueur (l’entreprise est seule). Il
se pose en revanche de façon aiguë pour les milliers d’individus qui subissent la pollution.
Leurs coûts d’information et de coordination sont en général très importants. Dans ce cas, il
est souvent plus intéressant pour eux de s’en remettre à une institution spécialisée pour
bénéficier à la fois d’économies d’échelle et d’économies d’envergure. De plus, le nombre
favorise les comportements de passager clandestin (du fait d’un coût marginal de détection
habituellement croissant). Ce qui a pour effet de diminuer fortement la crédibilité des
engagements qui pourraient être pris.
Si le théorème de Coase vaut dans le cas de deux agents, la conclusion est beaucoup
moins évidente quand le nombre des parties concernées est supérieur à deux. Les études
d’économie expérimentale ont tendance à montrer que l’optimum est presque toujours atteint
29
en cas de marchandage, sous réserve que (1) les marchandages ne soient pas eux-mêmes
interdépendants (chaque externalité doit pouvoir être résolue séparément) et que (2) les coûts
de transaction demeurent nuls.
b) Théorie des clubs
Article fondateur de la théorie des clubs : J.Buchanan (1965), « An Economic Theory of
Clubs », Economica, 32 (Feb.) : 1-14.
De nombreux biens publics sont à la fois « impurs » (au-delà d’un certain seuil, on
observe un phénomène d’encombrement tel que la qualité décroît avec le nombre des
consommateurs du bien) et « locaux » (la consommation est indivisible sur une certaine zone,
mais il est possible (1) d’exclure un individu en lui interdisant l’entrée dans la zone de
consommation et (2) de s’exclure soi-même de cette zone en la quittant). Les biens qui
répondent à ces deux caractéristiques peuvent alors être fournis par des associations
volontaires ou « clubs ». Le terme est ici utilisé en un sens purement technique.
1 – Equilibre et optimalité du club
On suppose que (1) le bien club est un bien de capital acquis une fois pour toutes (une
piscine par exemple), dont l’usure et les coûts d’entretien sont négligeables comparés au coût
d’acquisition, que (2) tous les individus susceptibles d’entrer dans le club sont semblables,
c'est-à-dire qu’ils ont tous la même fonction d’utilité et le même revenu, et que (3) les coûts
sont répartis de façon égalitaire. Pour accéder au club, il faut donc acquitter un droit d’entrée,
t, égal à CT/n, avec CT coût total du club et n nombre de membres.
L’avantage marginal de l’arrivée d’un nouveau membre pour ceux qui sont déjà
membres du club est égal à la part du coût qu’il prend en charge, c'est-à-dire au droit d’entrée
qu’il paie, avec t = CT/n = CM. La courbe d’avantage marginal se confond donc avec la
courbe de coût moyen. De plus, comme CT est fixe, cette courbe est une hyperbole équilatère
(cf. figure 1-5).
Le coût marginal dû à l’arrivée d’un nouveau membre peut être négatif au départ,
c'est-à-dire correspondre à un avantage, comme dans le cas de la figure 1-5. Dans l’exemple
retenu, celui d’une piscine, des individus peu nombreux peuvent s’ennuyer, et donc voir
l’arrivée d’un nouveau membre comme un événement positif. En revanche, au fur et à mesure
30
de l’accroissement du nombre des utilisateurs de la piscine, les phénomènes de congestion (ou
encombrement) vont devenir de plus en plus importants. Sur la figure 1-5, ils l’emportent sur
les bénéfices de convivialité à partir de n C . La comparaison des avantages marginaux et des
coûts marginaux permet de déterminer le nombre optimal de membres du club, soit n E tel que
l’avantage marginal pour les membres existants de l’entrée d’un membre supplémentaire soit
égal au coût marginal qu’implique cette entrée pour eux.
Avantages et
coûts moyens
et marginaux
.
O
Am (avantage
marginal d’un
nouveau
membre) =
CM (coût
moyen
d’entrée)
.
Cm (coût
marginal de
l’entrée d’un
nouveau
membre)
. .
E
n C n E (nombre de
membres à
l’équilibre)
n (nombre de
membres du
‘club’)
Figure 1-5 : Equilibre du bien club
Remarque : l’inclinaison de la courbe de coût marginal est un indicateur du caractère
plus ou moins privatif du bien club considéré. Si cette courbe est horizontale et confondue
avec l’axe des abscisses, le bien club est un bien collectif pur (un membre supplémentaire
n’implique aucun coût pour les autres). En revanche, plus la courbe se rapproche de la
verticale, plus la « rivalité » des nouveaux membres est élevée (plus un consommateur
supplémentaire diminue la quantité disponible pour les autres). A la limite, pour un bien privé,
la courbe sera quasiment verticale et confondue avec l’axe des ordonnées, de telle sorte que la
taille optimale du club soit de 1 (le club optimal pour un bien purement privé est un « club »
où l’individu sera tout seul).
Soit un individu représentatif dont la fonction d’utilité est U=U(x,g,n) et dont la
contrainte budgétaire est y = p x .x+ t, où t est le droit d’entrée dans le club.
31
L’équilibre budgétaire du club implique : t . n = p g .g., soit y = p x .x+ p g .g/n
Y : revenu de l’individu, x : quantité de bien privé qu’il consomme (prix p x ), g :
quantité du bien public local fourni par le club (prix p g ), n : nombre de membres du club, t :
droit d’entrée dans le club.
La maximisation de U sous contrainte de revenu par l’individu représentatif conduit au
lagrangien suivant : L = U(x,g,n) + λ.( y - p x .x - p g .g/n)
Conditions du premier ordre :
∂U
∂x
∂U
∂g
∂U
∂n
− λ.
p
p
− λ.
n
+ λ.
p
x
g
g
= 0
= 0
g
.
n
2 =
0
D’où :
∂U
∂g
pg
n.
=
(1)
∂U
px
∂x
et:
∂U
∂U
n pg.
g
+ ⋅ . = 0
2
∂n
∂g
pg
n
ou:
∂U
∂g
n = − ⋅ g (2)
∂U
∂n
L’équation (1) correspond à la condition de fourniture optimale des biens publics. En
effet, le théorème de Samuelson implique dans ce cas que la somme des TMS bien
public/bien privé individuels soit égale au prix relatif de ces deux biens. Dans la mesure où
l’on a fait l’hypothèse que tous les TMS individuels étaient égaux, la somme des TMS est
égale à n fois le TMS du l’individu représentatif. Ce résultat est permet de dire que la libre
32
entrée et la libre sortie du club, pour le droit d’entrée défini, conduit à un équilibre optimal
(sans intervention d’un planificateur central bienveillant et omniscient).
L’équation (2) permet de calculer le nombre de membres du club à l’équilibre. On
notera que, comme δU/δg est positif, il est nécessaire que δU/δn soit négatif pour que la
valeur d’équilibre de n soit positive. Cela signifie que l’on doit se trouver dans la zone où
chaque membre supplémentaire est une source d’encombrement et non de convivialité (c'està-dire
au-delà du point n C sur la figure 1-5).
L’hypothèse d’identité des fonctions d’utilité et des revenus peut évidemment être
levée. En général, on aboutit à la conclusion qu’il est inefficace de réunir des individus ayant
des préférences ou des revenus différents dans un seul club. Cela permet d’expliquer soit la
création de plusieurs clubs offrant des biens et services similaires, soit l’instauration de tarifs
différenciés à l’intérieur d’un même club (dans le cas d’une piscine, certains catégories de
population bénéficieront par exemple de tarifs plus faibles car elles sont en général présentes
à des moments moins encombrés).
L’existence de plusieurs clubs garantit à chaque individu qu’il ne lui sera pas appliqué
des tarifs discriminatoires et/ou qu’il ne devra pas payer une part disproportionnée des coûts
fixes en tant que nouvel arrivant.
Dans un club, les préférences des individus sont révélées par les mouvements d’entrée
et de sortie. Quelles que soient les règles interne de décision collective, c’est ce « mécanisme
de vote avec les pieds » qui sera déterminant (comme l’a montré C.Tiebout dans un article
célèbre intitulé « A Pure Theory of Local Expenditures », Journal of Political Economy
Octobre 1956, vol 64, pp.416-424). Dans une certaine mesure, une municipalité (ou toute
autre collectivité locale) peut être assimilée à un club, le droit d'entrée correspondant aux
impôts payés. Supposons que la majorité de la population vote en faveur d’un grand
programme de redistribution (comme certaines grandes villes l’ont fait parfois fait dans
différents pays industrialisés). Si le coût de départ de la municipalité est faible, toutes les
personnes qui doivent payer pour financer les transferts auront tendance à aller habiter
ailleurs. En sens inverse, toutes les personnes susceptibles de bénéficier des transferts seront
incitées à venir habiter dans la municipalité concernée. La politique suivie, bien que votée à la
majorité, n’est vraisemblablement pas « soutenable » en longue période. Elle sera une source
de déficit structurel, avec réduction du nombre des personnes qui contribuent au financement
et augmentation du nombre des personnes ayant droit aux transferts. Le vote avec les pieds
l’emporte ici sur le vote tout court – sauf à accroître artificiellement les coûts d’entrée et de
33
sortie par des systèmes autoritaires de contrôle (ce qui, dans le cas des municipalités, n’est pas
envisageable mais a souvent existé dans le cas de ces clubs particuliers que sont les nations).
Au moins dans les cas les plus simples et sous réserve que les coûts d’entrée et de
sortie soient nuls, les processus de migration (de vote avec les pieds) permettent d'atteindre
l'optimalité parétienne en groupant les individus ayant des goûts et des revenus homogènes.
Les processus de « vote avec les pieds » sont des mécanismes spécifiques de révélation des
préférences. Ils s’imposent à tous les dirigeants de « club », qui sont contraints de choisir des
politiques correspondant à l'unanimité, quelle que soit la règle formelle de décision (majorité
simple, majorité relative, majorité renforcée, etc.). Dans le cas contraire, les individus opposés
à la décision retenue quitteraient le club et ce jusqu'à ce que l'unanimité soit rétablie).
Lorsque les coûts d’entrée et de sortie sont non nuls, les responsables des clubs
retrouvent une certaine marge manœuvre. Des décisions non unanimes pourront être mises en
œuvre sans nécessairement provoquer le départ de tous opposants. Les dirigeants du club vont
alors mettre en regard l'avantage marginal pour eux d'une décision non unanime et le coût
associé à la probabilité de départ d'un certain nombre de membres.
Par ailleurs, des problèmes peuvent se poser lorsque des indivisiblilités ou des
économies d'échelle existent. Comme sur un marché, la maximisation indépendante de leur
utilité par les individus conduira à des résultats sous-optimaux. Les membres d'un club
peuvent aussi posséder une ressource unique (richesse du sous-sol, patrimoine culturel, etc.)
qui leur donne la possibilité de se comporter en monopole discriminant, en sélectionnant les
nouveaux arrivants à l’entrée à l’aide de barrières non monétaires, par exemple selon
l'élasticité de la demande du bien public fourni par le club par rapport au revenu. Comme dans
le cas du marché (avec les market failures), le processus de vote avec les pieds peut présenter
un certain nombre de défaillances.
2- Equilibre de clubs multiples avec contrainte de répartition d’une population globale
L’analyse précédente concernait un seul club en équilibre partiel, sans contrainte
globale d’insertion de la totalité d’une population dans au moins un club. Supposons
maintenant que le problème soit d’expliquer la répartition d’une collectivité de taille n (et
dont les individus sont identiques) entre deux « clubs » préexistants, deux régions A cet B
34
d’un même pays par exemple (mais il pourrait tout aussi bien s’agir de deux villes ou de deux
pays). AM i est l’avantage moyen d’être dans une région i (avec i=A,B.). AM i croît d’abord en
fonction du nombre de personnes présentes dans la région i, passe par un maximum puis
décroît (figure 1-6). L’avantage marginal pour un individu de A (Am A ) d’émigrer en B est
égal à l’avantage moyen des habitants de B (AM B ). Le coût marginal pour un individu de A
(Cm A ) d’émigrer en B est égal à l’avantage moyen d’être en A (AM A ). Am A =AM B et
Cm A =AM A . De même, pour B, Am B =AM A et Cm B =AM B .
Sur la figure 1-6, le point E est un point d’équilibre mais pas nécessairement un
optimum. Une répartition différente de la population permettrait vraisemblablement de mieux
exploiter les économies d’échelle en augmentant la taille soit de A soit de B (en se
rapprochant soit du maximum d’avantage moyen de A, M A , soit de celui de B, M B ).
Par ailleurs, le point E ne correspond pas à un équilibre stable. Supposons que, pour
des raisons exogènes, un certain nombre d’individus migrent de B vers A (déplacement à
partir de E vers la droite). L’avantage moyen d’être en A devient supérieur à l’avantage
moyen d’être en B, ce qui provoque une nouvelle de migration de B vers A, c'est-à-dire un
nouveau déplacement vers la droite. Comme AM A reste supérieur à AM B , on aboutit à une
solution de coin, en F, où toute la population a migré en A. De la même manière, on
montrerait qu’un déplacement exogène de population vers la gauche (migration de A vers B)
enclenche un processus cumulatif (AM B reste supérieur à AM A ) aboutissant à la solution de
coin G, où toute la population a migré dans la région (le club) B.
AM B
AM A
M B
E
M A
G
F
O
n
n B (population dans B)
n A (population dans A)
n
O
Figure 1-6 : Répartition d’une population donnée entre deux « clubs »
35
L’instabilité observée dans la figure 1-6 provient de ce que la taille optimale pour
chaque club est supérieure à la taille atteinte au point d’équilibre E (M A est à droite de E et
M B est à gauche). Lorsque ce n’est pas le cas, des équilibres stables sont possibles, même si
ces équilibres ne sont plus nécessairement uniques. Dans la figure 1-7, E1, E2 et E3 sont les
équilibres possibles. On vérifiera que E2 est stable et que E1 et E3 ne le sont pas.
La figure 1-7 correspond à une situation où tout déplacement exogène autour de E2 est
stable, sauf si son ampleur est telle que l’on se retrouve soit à gauche de E1, soit à droite de
E3. Ce cas de figure peut servir à représenter par exemple le rapport des forces entre un parti
au pouvoir et son opposition. En tant normal l’équilibre E2 prévaut, avec une répartition des
forces pas trop inégale. Cet équilibre résiste à des chocs exogènes aussi longtemps que leur
ampleur ne fait pas passer au-delà de E1 ou de E3. Dans le cas contraire, on observe un
phénomène de radicalisation, avec le basculement de la quasi-totalité de la population dans
l’un ou l’autre camp (phénomène fréquent pendant les périodes de « révolution »).
AM A
AM B
M A
E 2
M B
G
E 1 E 3
F
O
n
n B (population dans B)
n A (population dans A)
n
O
Figure 1-7 : Equilibres multiples, les uns stables, les autres instables
Jusqu'à maintenant, on a supposé que le nombre de clubs était fixe (égal à deux dans
les figures 1-6 et 1-7). Lorsque ce n'est plus le cas, les créations de clubs nouveaux et les
migrations qui en découlent font que l'on aboutit à un ensemble de clubs de taille optimale, du
moins aussi longtemps qu'il n'y a pas d'indivisibilités majeures, c'est-à-dire que la taille
36
optimale demeure suffisamment faible par rapport à la population totale pour l'on puisse
considérer que le nombre de clubs est une variable continue.
Illustration : supposons que la population totale soit de 10000 et que la taille optimale
d’un club soit de 500. L’optimum est atteint si l’on crée 20 clubs. Si maintenant la population
totale augmente de 250, il faudrait 20,5 clubs pour atteindre la taille optimale, ce qui n’a
aucun sens (le nombre doit être soit 20, soit 21). On est confronté à un problème de
« programmation en nombres entiers », pour lequel plusieurs techniques spécifiques sont
disponibles. Toutefois, il est clair que le recours à ces techniques, s’il est indispensable
lorsque le nombre optimal de clubs est compris, par exemple, entre 2 et 3, se justifie rarement
quand il s’agit de choisir, par exemple, entre 72 et 73 clubs (le gain en précision est
généralement très inférieur au coût en complexité analytique)
Courbes
d’avantage
moyen
O
n/4
n/2
3n/4
n
Population
Figure 1-8 : Production optimale quand le nombre de clubs est variable
Dans la figure 1-8, la taille de la population est n. La courbe d’avantage moyen du
club indique un maximum pour n/4. Quatre clubs de cette taille sont alors créés. Le premier
37
pour le premier quart de la population, le deuxième pour le deuxième quart (entre n/4 et n/2),
etc. En conséquence, tous les membres de la population se trouvent des clubs procurant un
avantage moyen maximum.
III - Développement et organisation de l'Etat.
La demande de sécurité publique est en général la cause première de l’émergence des
Etats. Dans une collectivité peu importante, cette demande n’est pas suffisante pour justifier
une production par des offreurs spécialisés et à plein temps. Des milices ou des gardes
nationales, mobilisables chaque fois que nécessaire dans le cadre d’un accord coopératif, où
chaque membre de la collectivité est donc à la fois offreur et demandeur, sont des instruments
beaucoup moins coûteux. L’apparition d’un Etat n’a lieu qu’au-delà d’un certain seuil 19 .
Quand ce seuil est atteint, un certain nombre de problèmes apparaissent, liés à la nature
spécifique de ce bien public particulier qu’est la sécurité (sous-section a).
Une fois l’Etat instauré, il convient d’analyser les grands principes de son
fonctionnement et les principaux facteurs de son évolution (sous-section b).
Le comportement des Etats dépend enfin beaucoup des règles institutionnelles qui les
régissent. Cette question des « formes d’Etat » est brièvement abordée dans de la dernière
partie de cette section (sous-section c).
a) les particularités de la production de sécurité publique.
La production de sécurité publique fait référence à l’ensemble des biens et services
destinés à protéger les personnes et les biens et à garantir le respect des contrats passés. Dans
le secteur public, cette production concerne principalement les activités de justice, de police
(sécurité publique intérieure) et de défense (sécurité publique extérieure).
19 Situé, selon R.Auster et M.Silver (The State as a Firm, Boston : Kluwer), entre 15000 et 20000 habitants, sur
la base d’une étude des cités italiennes des XIIe et XIIIe siècles.
38
Les déterminants de la demande de sécurité publique
Même dans les Etats les plus développés, une part significative de la production de
sécurité publique reste parfois le fait du secteur privé, notamment dans le cas de la sécurité
domestique (systèmes d’alarme, vigiles, sociétés de surveillance, etc.), du transport de fonds
(convoyeurs) ou de la protection personnelle directe (gardes du corps). Mais les activités de ce
type restent marginales quand on les compare à la production publique, à l’exception d’Etats
qui connaissent des désordres particuliers, pour cause de guerre civile par exemple. De plus,
ces activités privées de sécurité publique sont étroitement soumises au contrôle de la
puissance publique. Pour ces deux raisons, et même si les conditions de substitution de la
production privée et de la production publique de sécurité posent des problèmes intéressants,
l’analyse se limitera ici à la production publique de sécurité publique.
La demande de sécurité publique dépend de plusieurs facteurs, et notamment :
- du degré d’hostilité de l'environnement géographique;
- de l’histoire propre des populations (l’insistance de Thomas Hobbes dans le
Léviathan sur la nécessité de préserver l'ordre est une conséquence directe de l'expérience
vécue par cet auteur lors de la première révolution anglaise, la Civil War – 1642-1649);
- de la taille et de la densité de la population. Lorsque la population augmente,
la criminalité est plus forte, les coûts de recherche des criminels sont plus élevés et les
problèmes de passager clandestin sont plus nombreux. L'accroissement de population a aussi
un effet sur la demande de sécurité publique extérieure (défense nationale) mais cet effet peut
s’exercer dans des directions opposées. Une population plus nombreuse a un effet dissuasif
plus fort pour les agresseurs potentiels. Mais une population plus nombreuse peut aussi inciter
un pays à faire usage de sa force supérieure pour accroître ses gains au détriment des pays
voisins (en les menaçant ou en les agressant effectivement dans une optique de conquête).
L’augmentation de la densité peut aussi donner lieu à tout un ensemble d’effets externes
négatifs, en particulier accroître le nombre et la gravité des agressions et des conflits
interpersonnels;
39
- de l'accroissement de la richesse du pays. Il y a plus de biens à protéger. Les
risques d'invasion par les voisins augmentent. Les individus ayant la possibilité de vivre de
plus en plus isolés, la force des pressions psychosociales - le "sens de la faute" - tend à
diminuer.
Une production publique en monopole et pas seulement d’une fourniture publique
Lorsque la demande dépasse le seuil justifiant la création d’un Etat, c'est-à-dire d’un
offreur spécialisé de sécurité (voir note 10 supra), cet Etat ne peut pas se contenter de fournir
la sécurité publique, il doit aussi le produire lui-même. La sécurité collective est en effet l’un
des rares biens publics dont la production (et pas seulement la fourniture) doit presque
obligatoirement être effectuée en monopole 20 , ou du moins par des oligopoleurs coopérant
entre eux 21 , ce qui revient au même en pratique. Plusieurs « entreprises de sécurité publique »
en concurrence sur une même zone géographique - des milices privées par exemple -
entreraient en conflit entre elles, et produiraient non de la sécurité mais de l’insécurité et du
désordre.
Le problème devient alors de savoir comment est sélectionné ce « propriétaire » plus
ou moins temporaire de l’Etat, cet offreur unique auquel sera confié le monopole de la force.
Il est important de noter que la nécessité d'instaurer un monopole, d'interdire une concurrence
"sur le terrain" (no competition « on the field »), n’exclut pas évidemment l’existence d’une
concurrence "pour le terrain" (competition « for the field » 22 ), c'est-à-dire d’une concurrence
pour l’attribution des droits de propriété sur l’Etat entre les différents offreurs potentiels de
sécurité publique (et, plus largement, de politiques publiques).
Il y a de grandes chances pour que le nombre des candidats pour l’attribution du
monopole de la force soit élevé et que la concurrence entre eux soit sévère. La rente anticipée
associée au monopole de la force est en effet extrêmement forte, au moins en termes de
« revenu complet », c'est-à-dire en tenant compte aussi bien du revenu monétaire que du
revenu psychologique qu'apporte la détention du "pouvoir". En effet, une fois ce monopole de
la force attribué, celui qui en est le titulaire peut facilement l’utiliser pour réduire la
"contestabilité" du marché politique (dissuader ses concurrents potentiels for the field) en
20 L’Etat étant, selon la célèbre définition de Max Weber, l’institution qui détient « le monopole de la violence
légitime ».
21 Comme dans le cas de la police nationale et des polices municipales.
22 On reprend ici la distinction célèbre de Demsetz entre « competition on the field » et « competition for the
field ».
40
instaurant des barrières à l'entrée ou en renforçant celles qui existent. Il peut également
augmenter ses gains par des redistributions forcées et des politiques publiques orientées
exclusivement en fonction de ses intérêts propres.
On a là une illustration d’un problème d’agence de type politique, c'est-à-dire où la
supériorité de l'agent (du monopoleur politique) sur le principal (la population qui demande
de la sécurité publique) est ici moins lié à une asymétrie d’information (comme dans le
modèle principal/agent habituel des économistes) qu’à une asymétrie dans le pouvoir de
contraindre et de menacer.
L'attribution du monopole de la force et d’un droit de propriété sur l’Etat à un offreur
particulier de politiques publiques est une (la ) question sociale centrale 23 . Dans certains cas,
fréquents dans l’histoire, le principal (la population) n'a pas eu à choisir : un individu ou un
groupe s’est approprié le monopole de la force sans demander quoi que ce soit à qui que ce
soit (un envahisseur plus fort, un soldat vainqueur face à l'ennemi, la conjuration réussie d'une
minorité, etc.). Dans d'autres cas, l'attribution du monopole a fait appel à un processus plus ou
moins consensuel, conduisant à la définition d’un contrat social, matérialisé par un ensemble
de règles institutionnelles (écrites ou non écrites). Selon les cas, on aboutit soit à des règles
d'attribution automatique (succession héréditaire par exemple), soit à une constitution limitant
la durée et la capacité d'utilisation du droit de propriété sur l’Etat et soumettant la désignation
et le renouvellement du mandat des propriétaires temporaires à une règle précise de choix
collectif (démocratie représentative). Certains systèmes ont même essayé de combiner les
deux principes (la monarchie constitutionnelle à l’anglaise par exemple).
Si la force a été une variable décisive dans l’émergence historique des Etats, le
consensus a aussi joué un rôle non négligeable, du moins tant que les individus ont conservé
la possibilité d’émigrer (de « voter avec leurs pieds » à la Tiebout). Dans ce cas, en effet,
même les Etats les plus oppresseurs ne peuvent pas totalement ignorer les préférences de leurs
citoyens. En revanche, dès qu’un Etat a la possibilité d’instaurer des barrières efficaces à la
sortie pour ses citoyens, sa capacité d’oppression (sa capacité d’utiliser à son profit le
monopole de la force) s’accroît considérablement.
b) Fonctionnement et évolution de l’organisation étatique
23 En plaçant au premier plan le problème économique de l’appropriation privée des moyens de production,
l’analyse marxiste a fortement contribué à occulter le problème politique de l’appropriation publique des moyens
de production de sécurité.
41
Une fois l’Etat « approprié », pour une période plus ou moins longue, son
fonctionnement dépend du comportement de ses « propriétaires » et du comportement des
agents choisis par eux (de l’administration). On retrouve ici l’ensemble des questions posées
par la science politique à propos du comportement de la « classe dirigeante », avec l’idée que
la classe politiquement dirigeante n’est pas nécessairement la classe économiquement
dirigeante – bien que le monopole de la force puisse y conduire 24 .
La théorie économique de la politique s’attache alors à expliquer le comportement des
dirigeants politiques, des « bureaucrates », des citoyens-électeurs, des groupes d’intérêt
susceptibles de faire pression sur l’Etat, en intégrant parfois d’autres agents comme les
gouvernements étrangers ou les organisations internationales. Pour cela, elle cherchera,
comme pour les agents « économiques » (ménages et entreprises), à préciser les fonctions
d’utilité et leurs contraintes, ainsi que les interdépendances existant entre eux.
Dans une première étape, on supposera cependant que l’Etat est une entité homogène
cherchant simplement à maximiser son profit de monopole – égal à l’écart entre le montant
des recettes fiscales qu’il perçoit et les biens et services publics qu’il fournit à sa population 25 .
Efficacité du monopole public dans un Etat autocratique – Théorème de Buchanan
En un sens, le fait d’avoir fait preuve de son aptitude à éliminer ses concurrents ou à
emporter la victoire (pour obtenir un droit de propriété sur l’Etat) est un signal de la capacité
de l’autocrate d’utiliser la force (et donc d’assurer l’ordre). Mais c’est aussi le signal qu’il est
capable d’abuser de son pouvoir pour maximiser sa rente. S’il est le plus efficace ex ante, il
est aussi celui qui risque de poser le plus sévère problème d’agence (le moins contrôlable ex
post – problème classique de hasard moral).
En fait, si l’autocrate est rationnel, il va chercher à exploiter efficacement sa
population, c’est-à-dire à lui fournir le minimum de services (g) pour le montant des impôts
prélevés. Toutefois, à la différence d’un monopole privé, l’Etat n’est pas confronté à une
courbe de demande mais à une contrainte de soutien politique minimal, en dessous duquel le
24 « C’est la force qui domine le capital et non l’inverse » (Auster et Silver(1979), op.cit.), contrairement à l’idée
marxiste sommairement résumée dans le Manifeste communiste que l’Etat n’est qu’un « comité de gestion des
affaires communes de la bourgeoisie ».
25 Par la suite, on cherchera à expliquer le comportement des dirigeants politiques, de l’administration (des
« bureaucrates »), des citoyens-électeurs et des groupes d’intérêt susceptibles de faire pression sur l’Etat, en
intégrant parfois d’autres agents comme les gouvernements étrangers ou les organisations internationales.
Comme pour les agents « économiques » (ménages et entreprises), l’objectif sera de définir leurs fonctions
d’utilité et leurs contraintes respectives, ainsi que les interdépendances pouvant exister entre elles.
42
gouvernement en place perd le pouvoir (du fait d’un échec électoral, d’une révolte
incontrôlable de la population, d'un coup d'Etat, etc.).
La collectivité comprend n individus. La fonction d’utilité de l’individu représentatif
est U=U(x,g), où x est le montant de bien privé et g le montant de bien public. Pour simplifier,
on suppose que les prix p x et p g sont normalisés à 1. La contrainte budgétaire est donc : y = x
+ t, (avec y revenu moyen et t impôt moyen payé par chaque contribuable), soit x = y – t.
x*, g* et t* sont les valeurs que les citoyens estiment possible d’atteindre en changeant
de gouvernement, avec x* = y - t*. Si α mesure le coût de transaction associé à ce changement
(mesuré en termes d’utilité), la contrainte de soutien politique implique que :
U(y – t, g) ≥ U(y - t*, g*) - α (3)
On suppose que l’Etat cherche à maximiser son budget discrétionnaire, c'est-à-dire
l’écart entre ses recettes fiscales totales, t, et les dépenses publiques, g, sous sa contrainte de
soutien politique (3). L’écart ainsi obtenu permet de financer des dépenses qui ne sont source
d’utilité que pour les responsables de l’Etat (et non pour les membres de la collectivité).
Le lagrangien s’écrit :
L = n.t - g + λ.(U(y – t, g) - U(y - t*, g*) + α)
Les conditions de premier ordre sont :
∂L
∂U
∂x
= n + λ ⋅ . = 0
∂t
∂x
∂t
∂L
∂U
= −1+ λ ⋅ = 0
∂g
∂g
avec x = y - t, d' où :
∂U
∂U
∂g
1 ∂g
= = − (4)
∂U
n ∂U
∂x
∂t
La relation (4) indique que l’équilibre d’un Etat qui maximise son budget
discrétionnaire est un optimum pour les individus (sous réserve de considérer "l'Etat", ou le
"propriétaire" de l'Etat, comme un "individu" au même titre que les autres). Au point
correspondant, en effet, les conditions d’optimalité parétienne sont remplies : le taux marginal
de substitution entre le bien public g et le bien privé x est égal à leur prix relatif (1/n). En
effet, l’individu représentatif paie le bien privé dans sa totalité (en rappelant que p x = 1 par
hypothèse) tandis qu’il ne paie que le n ème du bien public (dont le prix total p g est aussi par
hypothèse de 1).
43
On voit ici que le monopole public, sous réserve qu’il fournisse des biens selon une
logique politique (c'est-à-dire en étant soumis à une contrainte de soutien minimal), produit de
façon optimale. Ce résultat est connu sous le nom du « théorème de Buchanan ».
On sait que, sur un marché économique, un monopole qui maximise son profit (c'est-àdire
qui se comporte selon une logique économique et non politique) produit une quantité
inférieure à l’optimum (à un prix trop élevé) et provoque de la sorte une perte sociale sèche.
Ici, au contraire, l’équilibre atteint ici par le monopole public est allocativement efficace. Cela
ne signifie évidemment pas que l’équilibre soit distributivement juste. Au contraire, l’Etat
prélève un budget discrétionnaire indu. Simplement, la perte des citoyens n’est pas supérieure
au gain de l’Etat : le jeu est à somme nulle et non à somme négative, comme dans le cas d’un
marché économique en monopole. En d’autres termes, le monopole n’est pas nécessairement
une forme d’organisation aussi inefficace pour la production politique de biens publics que
pour la production économique de biens privatifs.
Remarque : dans le modèle précédent, on a fait l’hypothèse que le revenu du citoyen
représentatif était indépendant du montant des dépenses publiques, g. Si les dépenses
publiques augmentent la productivité générale de l’économie (cas des investissements en
infrastructure par exemple), alors δy/δg>0 et l’Etat ne produit pas suffisamment. Au contraire,
si les dépenses publiques tendent à multiplier les règlements et les distorsions allocatives,
alors δy/δg
propriété ne soient pas respectés – et donc de la capacité du gouvernement à combattre la
« vulnérabilité de la possession » et « l’insécurité transactionnelle). De plus, le manque de
crédibilité politique influence fortement le comportement d’investissement du secteur privé,
national et étranger, et a des coûts importants en termes de croissance (op. cit. 16-36).
- la primauté des objectifs politiques sur les objectifs économiques et donc une
faible compétence technique, la multiplication des redistributions à caractère politique pour
obtenir des soutiens (l’Etat a une forte activité de producteur de rente – de « rent-setter »).
Dans les autocraties faibles, celles qui ne s’appuient pas sur une base large (souvent
parce qu’elles n’ont pas les moyens de la constituer) ou qui n’ont pas les moyens ou hésitent
à un emploi extensif et permanent de hauts niveaux de violence ou de menace, vient s’ajouter
le problème de la menace permanente de renversement, par coup d’Etat ou par révolution ou
par les deux combinés. Pour cette raison, l’horizon des autocraties faibles est en général à
court terme (et à un terme beaucoup plus court que celui des démocraties).
Par ailleurs, les autocraties ont un problème spécifique de succession. Elles n’ont pas,
contrairement aux démocraties, la capacité de changer de gouvernement sans changer de
régime. Quand ils perdent, les responsables politiques perdent tout. Ils sont donc prêts à payer
un prix élevé pour conserver le pouvoir. De plus, une fois le pouvoir devenu vacant, les
autocraties doivent subir la lutte entre les successeurs potentiels. Ces coûts élevés de
succession expliquent par exemple la tentation monarchique que l’on observe par exemple
dans certains régimes communistes du Tiers-monde (la bureaucratie dirigeante préfère une
transmission héréditaire du pouvoir – c'est-à-dire prendre le fils, plutôt que de devoir risquer
un conflit interne pour la succession).
La taille optimale des Etats
En longue période, les gouvernements vont essayer soit d’accroître leur rente
budgétaire (la différence entre les recettes fiscales et les dépenses publiques effectuées en
échange). Pour cela, ils peuvent agir sur la disposition à payer des contribuables pour ses
services (pour les dépenses publiques) en déplaçant vers le bas, grâce à une propagande
adéquate, la courbe de soutien minimal pour rester au pouvoir (U(y - t*, g*) - α dans
l’équation 3 ci-dessus). Une autre possibilité est de modifier la taille de l’Etat pour réduire ses
coûts de fonctionnement. Ce second type de comportement peut servir de base à une théorie
de l’émergence de frontières d’équilibre entre les différents Etats.
45
Pour David Friedman 26 , le facteur déterminant de la taille des Etats est le montant des
recettes fiscales net de leur coût de collecte. Si le commerce est la principale source des
recettes fiscales, on aura des pays de grande taille. S’il s’agit au contraire de rente (liée à
l'exploitation de ressources naturelles par exemple), les pays seront plutôt de petite taille (afin
de partager cette rente entre un plus petit nombre). Enfin, si le travail est la source principale
de recettes, l’objectif sera d’avoir d’accroître la disposition à payer des contribuables en
augmentant le coût de sortie du pays. Cela se manifestera par des frontières fermées et une
langue et une culture homogènes et très différentes de celles des pays environnants.
Sans nier l'importance des facteurs sociologiques, historiques et géographiques,
D. Auster et M. Silver (1979 op.cit.) considèrent pour leur part que les facteurs
démographiques sont prédominants. L’augmentation de la densité de population fait diminuer
les coûts de transport, les coûts de communication et, plus généralement, l’ensemble des coûts
de transaction, ce qui incitera à constituer des Etats de grande taille. De même, les
accroissements de population sont une source d’économie d’échelle car ils réduisent les coûts
techniques de production de sécurité, extérieure et intérieure. En sens inverse, l’isolement
croissant des individus (lié à une plus grande mobilité) et la multiplication des idées
concurrentes (baisse des coûts de communication) rendent plus difficile le contrôle des
comportements de passager clandestin. Au moins à partir d’une certaine taille, ces coûts de
monitoring des comportements deviennent fortement croissants.
Coûts moyens
Coûts de contrôle
+ coûts
techniques
Coûts moyens de
contrôle (monitoring)
Coûts techniques
moyens de production
de sécurité
Taille
optimale
Population
Figure 1-9 : Taille optimale d’un pays en équilibre partiel
26 Friedman D. (1977), « The Size and Shape of Nations », Journal of Political Economy, 85 (Feb.).
46
La figure 1-9 montre comment, en équilibre partiel, les influences contraires de
ces différents facteurs permettent de déterminer la taille optimale d’un Etat. On pourrait
évidemment poursuivre l’analyse dans un cadre d’équilibre général, et aboutir à tout un
ensemble de frontières d’équilibre, selon les informations dont dispose chaque pays sur les
dotations en ressources des autres et selon les hypothèses qu’il fait sur leurs comportements
(notamment en ce qui concerne ses voisins proches).
Le degré optimal de décentralisation
La taille optimale pour la fourniture des biens publics varie fortement d’un bien à
l’autre, notamment du fait de l’importance des économies d’échelle potentielles. La taille
optimale pour la collecte des ordures ménagères est faible : ce sont en général les
municipalités qui en assumeront en général la responsabilité. Inversement, la sécurité
extérieure sera fournie au niveau national : non seulement les économies d’échelle sont fortes
mais il est souvent préférable de coordonner étroitement les décisions dans ce domaine.
On suppose dans la figure 1-10 qu’il existe deux biens publics de taille optimale très
différente : la sécurité intérieure (taille optimale : 50 millions d’habitants) et la sécurité
extérieure (taille optimale : 250 millions d’habitants). Si le pays considéré compte 250
millions d’habitants, il organisera sa défense au niveau national et sa police au niveau régional
(situation proche de celle des Etats-Unis – avec une armée fédérale et des polices
décentralisées par « Etat »). Si le pays compte au contraire uniquement 50 millions
d’habitants (situation proche de la France), les deux biens publics seront fournis au niveau
national : la police parce que cela correspond à la taille optimale et la défense parce que la
faible dimension du pays n’offre pas d’autre solution 27 .
On peut donc s’attendre à la présence d’une corrélation négative entre la taille d’un
pays et son degré de décentralisation. C’est effectivement ce que l’on observe dans les faits :
toutes choses égales, la place du gouvernement central est plus faible dans les grands pays.
27 Un pays dont la taille est trop faible peut partiellement résoudre ce problème en passant des alliances. Dans la
mesure où c’est en matière de défense que les économies d’échelle sont généralement les plus fortes, il n’est pas
surprenant que les alliances de type militaire soient les plus fréquentes. Sur la théorie des alliances, cf. Olson M.
et Zeckhauser R. (1966), An Economic Theory of Alliances, Review of Economics and Statistics, 48 (August):
266-279.
47
Avantage net
par tête
Pmax
Dmax
Défense
Police
50 millions
250 millions
Population
Figure 1-10 : Différences dans les tailles optimales et décentralisation
c) les formes d’Etat
L’existence d’un monopole de la force pose deux types de problèmes : un problème
d’efficacité et un problème d’équité. Comme on l’a vu (théorème de Buchanan), le monopole
public, quand il est soumis à une logique politique, ne pose pas de problème particulier
d’efficacité (à la différence des monopoles soumis à une logique économique). En revanche,
une partie des rentes obtenues est appropriée, d’une façon que l’on peut trouver non justifiée,
par les responsables de l’Etat. La démocratie représentative cherche fondamentalement à
résoudre ce problème d’équité en proposant un mode spécifique d’appropriation de l’Etat,
matérialisé par un droit de vote égal et universel (un homme, une voix). L’objectif est de
transformer les formes de type entreprise individuelle (autocratie) ou à actionnariat limité
(aristocratie, systèmes de suffrage censitaire) en une sorte de coopérative avec des droits de
propriété non transférables et également répartis entre les citoyens « propriétaires ».
Le problème central de la démocratie représentative est que ses efforts en termes
d’équité sont susceptibles d’avoir des conséquences en termes d’efficacité. En théorie, la
concurrence « for the field » entre les différents partis politiques devrait conduire, au moins
en longue période, à une offre de politiques publiques optimales : tout programme sousoptimal
doit en effet être battu à un moment ou à un autre par un programme Pareto-supérieur
(offrant au moins la même chose que lui à au moins n-1 électeurs et plus au n ème électeur).
Mais, en pratique, de nombreuses sources potentielles d’inefficacité ont été avancées :
48
- l’information des électeurs ne serait pas symétrique ;
- les compensations monétaires nécessaires pour atteindre un optimum ne seraient pas
toutes techniquement réalisables et les engagements de compensations monétaires à terme ne
seraient en général pas crédibles ;
- comme toute règle de choix collectif, le vote majoritaire conduirait une agrégation
imparfaite des préférences individuelles (théorème d’impossibilité de K.Arrow) ;
- les contraintes électorales inciteraient les électeurs à la myopie (leur taux
d’actualisation politique serait plus fort que leur taux d’actualisation économique) ;
- les candidats, surtout s’ils sont peu nombreux, auraient intérêt à la collusion afin de
ne pas se faire concurrence quant aux rentes obtenues grâce au monopole étatique ;
- le contrôle des principaux (des électeurs) sur les agents (les responsables politiques
et les « bureaucrates ») serait très peu efficace, si bien que, dans leur ensemble, les dirigeants
politiques et les bureaucrates seraient les propriétaires de fait de l’Etat.
Toutes ces sources d’inefficacité (ces democratic government failures) ont eu tendance
à faire considérer les démocraties représentatives comme des producteurs de biens publics
certes plus équitables mais peu efficaces. Pour certains auteurs, cette inefficacité expliquerait
aussi la durée de vie plus courte de ce type de régime politique au cours de l’histoire.
Toutefois, la question qui a eu le plus d’importance après-guerre est moins celle de
l’inefficacité de la démocratie représentative que celle du régime politique le mieux adapté au
développement. Un certain nombre d’auteurs ont en effet défendu l’idée que la démocratie
représentative était un « bien de luxe », impliquant un revenu par tête élevé pour pouvoir
fonctionner de façon satisfaisante.
Selon cette logique, les PVD avaient intérêt à opter pour un système de parti unique,
sinon pour un système autocratique, même si cela risquait de sacrifier quelque peu l’équité (et
les libertés individuelles) à un impératif catégorique d’efficacité. Ce type d’analyse oubliait
toutefois deux faits, maintenant bien établis empiriquement :
a) les autocraties sont également très inefficaces. 1- La menace permanente de
renversement (par coup d’Etat notamment) fait que l’horizon est encore plus court (et surtout
plus incertain) que dans une démocratie à élections périodiques, même rapprochées. 2 – les
choix des différents responsables économiques sont plus guidés par des critères de soutien
politique que par des critères de compétence économique. 3- L’économie en régime
autocratique est généralement plus contrôlée (le marché est moins développé), plus fermée
49
(les échanges avec l’extérieur sont plus faibles) et la primauté des objectifs économiques est
une source importante d’inefficacité ;
b) les études empiriques montrent qu’il existe une relation étroite entre démocratie et
développement. Certes, la causalité est en partie dans le sens développement → démocratie,
ce qui pourrait indirectement confirmer l’idée de la démocratie « bien de luxe », mais elle
s’exerce également et significativement dans l’autre sens, dans le sens démocratie →
développement. Les libertés politiques favorisant les libertés et les initiatives économiques, le
développement du marché, l’ouverture sur l’extérieur, l’entrée d’investisseurs étrangers, etc.
Le débat sur les institutions les mieux adaptées au développement a repris à la fin des
années 1980, (1) avec les interrogations sur l’efficacité des programmes d’ajustement et sur
les « conditionalités » que les institutions internationales doivent ou ne doivent pas imposer
lors de leurs prêts aux PVD et (2) avec les recherches sur la bonne « gouvernance » et l’intérêt
accru pour « l’analyse économique des institutions ».
Les difficultés rencontrées dans certains pays ont également conduit à s’interroger sur
les causes des dysfonctionnements chroniques des Etats, et éventuellement sur les moyens d’y
remédier. Les Etats peuvent entrer en régression pour plusieurs raisons.
Erreurs des dirigeants. Certains gouvernements peuvent sous-estimer les risques
d’une politique. L’exemple type est celui des militaires argentins lors de la guerre des
Malouines, engagée en grande partie pour faire oublier leurs échec de politique intérieure.
Corruption des dirigeants. Les gouvernements sont autant des rent-setters que des
rent-seekers. Ils pratiquent de nombreuses redistributions à caractère politique. Cela peut
faciliter les choses à court terme et créer des coalitions capables d’assurer leur maintien au
pouvoir. Mais les effets à long terme sont souvent catastrophique en démocratie. Ce type de
politique fait baisser la crédibilité et la légitimité des gouvernements. Leur capacité
d’influencer (de « manipuler ») les anticipations des agents économiques et politiques
s’amenuise. Le stock de capital de confiance, et plus largement de « capital social » dans la
société diminue rapidement. Les échanges se rétractent, la croissance baisse et, par voie de
conséquence, le montant des rentes distribuables. Le conflit entre les « rentiers » et les autres
(qui ne veulent pas payer plus) s’envenime. Si le groupe des bénéficiaires de « rentes » est
suffisamment fort, l’affrontement peut aller jusqu’au conflit civil.
Incompétence des dirigeants. La population remet en cause le mécanisme de sélection
des responsables politiques. Cela se produit en général à la suite de chocs (crise économique,
guerre perdue). Dans les autocraties, cette situation donne lieu à des coups d’Etat, des
50
émeutes, des révolutions, des dissidences armées. Dans les démocraties, elle conduit à la
montée des partis extrémistes, à une abstention croissante par « aliénation » et désintérêt pour
la politique. En général, la critique s’exerce plus à l’encontre du système que des dirigeants.
Instabilité politique. Celle-ci peut provenir de la configuration des préférences des
différents groupes sociaux qui conduisent à des « majorités cycliques » (toute décision
majoritaire peut être remise en cause par une séquence d’autres votes), avec des conflits
redistributifs intenses entre les différents groupes sociaux et politiques. Ce genre de situation
se produit notamment à la suite de la découverte de richesses naturelles dans un pays.
L’instabilité est une source de mouvements de rue, d’atmosphère de complot permanent,
d’activisme révolutionnaire et antiparlementaire.
Perte de crédibilité financière. Certains Etats n’ont plus de ressources financières et ne
peuvent plus s’endetter. Ils ne peuvent plus assurer les tâches de base mais ils continuent à
prélever suffisamment de ressources pour contrôler la situation politique (en distribuant des
rentes et en ayant recours à leur monopole de la violence « légitime »). La population ou des
groupes maffieux tendent à se substituent à l’Etat défaillant en assurant une certaine
« sécurité » (Albanie, Colombie). Une rébellion peut apparaître dans certaines régions du
pays. Les Etats restent assez forts pour préserver leurs rentes mais pas pour contrôler la
rébellion. Celle-ci n’est, pour sa part, pas assez forte pour prendre le pouvoir central.
L’implosion étatique peut se produire par étape : il peut initialement y avoir un large
accord pour renverser le pouvoir en place mais seulement pour le remplacer par un pouvoir
faible et peu cohérent. Ce nouveau pouvoir ne peut alors faire face à une sécession par
exemple (cas de la Tchécoslovaquie, divisée en Tchéquie et Slovaquie). Mais il existe des
contre-exemples, notamment lorsque les pertes anticipées pour certains sont élevées (Biafra-
Nigéria). Dans d’autres cas, le problème suscitera des interventions étrangères (République du
Congo - ex-Zaïre).
51
Chapitre 2: Analyse économique du vote
Section I : Choix de la règle de vote et paradoxe de la participation
Toute société doit prendre des décisions collectives, c'est-à-dire des décisions qui
s'imposent à tous ses membres (on dira de façon équivalente qu’elle doit effectuer des choix
sociaux). Le problème est relativement simple quand il s'agit de se prononcer sur des projets
permettant des améliorations parétiennes par rapport au statu quo. Par définition, personne ne
perd: les conflits potentiels sont limités au partage du gain commun. Malheureusement, la
plupart des décisions collectives ne sont pas de cette nature: elles ont des effets redistributifs
importants. Au moins à court terme, il y a presque toujours des perdants nets (la décision
collective, quelle qu’elle soit, fera baisser le bien-être de certaines personnes).
Sur le marché, les conflits redistributifs de ce type sont rares car les coûts de sortie
demeurent généralement faibles 28 . Ceux qui anticipent qu’ils vont être perdants ont toujours la
possibilité de refuser l'échange 29 , y compris sur le marché du travail. La redistribution à
laquelle les "dominants" peuvent contraindre les "dominés" est limitée, au moins en longue
période. Dans le cas des décisions collectives, au contraire, les pertes que peut subir un
individu sont multiples et importantes. Cela signifie qu’il existe de nombreux conflits
redistributifs potentiels. Ces conflits sont résolus en pratique soit par la domination d'une
coalition particulière (pacifiquement ou après un conflit ouvert), soit par des règles
institutionnelles préétablies (du moins aussi longtemps que ces règles demeurent largement
acceptées).
Ce chapitre est consacré à une règle institutionnelle spécifique, le vote. On notera que:
- même dans les pays où cette règle joue un rôle essentiel, elle est loin d'être la
seule (certaines garanties individuelles ne peuvent être changées par un vote);
- le vote n'est jamais le seul moyen pour un individu de faire prendre en compte
ses préférences dans les choix sociaux. Parallèlement, un individu a, comme on vient de le
28 Les termes de coût, d'avantage, de gagnant, de perdant, etc., font référence à des variations d'utilité (ou de
« revenu complet »), et pas seulement à des modifications de revenu ou de richesse strictement monétaires.
29 Toute personne qui accepte de participer à un échange (sous-entendu « libre ») estime, au moment de la
transaction, que son utilité va s’accroître. Cela ne signifie pas qu’elle sera nécessairement satisfaite du résultat
de cette transaction (que ce qu’elle estime sera avéré). Se reporter sur ce point à J.Stiglitz (2000), Principes
d’Economie moderne, Louvain la Neuve : De Boeck Université.
52
voir, la possibilité de "voter avec ses pieds" 30 , de manifester dans un cadre légal ou toléré,
d'adopter un comportement illégal (de ne pas respecter les décisions collectives) ou même de
se révolter. L'analyse positive du choix entre ces différents modes d'action dépend de leurs
avantages et coûts respectifs (tout comme un consommateur choisit entre différents biens ou
un producteur entre différentes techniques de production);
- le terme de vote recouvre de nombreux systèmes de choix social. On se limite
ici aux mécanismes de type "un homme, une voix", c'est-à-dire où les conditions individuelles
de participation à la décision collective sont égales et où les préférences révélées sont de type
« pour », « contre », ou indifférent 31 . Les problèmes de discrimination dans les conditions
d'accès, de suffrage censitaire ou de révélation d'une information sur l'intensité des
préférences (sous forme de classement entre plusieurs options ou de somme monétaire que
l'individu serait disposé à payer) ne seront pas abordés.
A: Choix de la règle de vote
Même si l'on suppose qu'un accord social s'est dégagé en faveur d'un système "un
homme, une voix", il reste à définir la règle de vote.
Pour simplifier, on limite la discussion au choix entre un projet donné et le statu quo.
A priori, c'est-à-dire sans information particulière sur le comportement des autres membres de
la collectivité, les individus souhaitent éviter tout choix social susceptible de réduire de façon
incontrôlable leur utilité personnelle. La règle la plus sûre de ce point de vue est la règle
d'unanimité: les seuls projets adoptés seront ceux pour lesquels a) personne n'est contre et b)
au moins une personne est pour. En d'autres termes, tous les projets qui ne procurent pas des
"améliorations parétiennes" seront refusés.
Le raisonnement précédent suppose que les coûts d'information et de transaction
associés à la règle d'unanimité sont nuls. Or, dans la réalité, ces coûts peuvent être très élevés:
- les projets correspondant à des améliorations parétiennes sont en général
difficiles à définir techniquement et ils impliquent la plupart du temps des systèmes
complexes de compensation (une mesure qui fait gagner 10 à A et perdre 4 à B est
30 Les coûts du "vote avec les pieds" sont très différents selon les collectivités considérées. Ainsi, il est moins
coûteux de refuser les choix sociaux effectués par une collectivité locale que ceux effectués par une nation, ou de
refuser les choix sociaux d’un pays qui a des voisins culturellement proches que ceux effectués par un pays
replié sur lui-même.
31 Pour simplifier, on regroupe dans la catégorie "indifférent" (1) les électeurs qui ne participent pas au vote, (2)
les électeurs qui mettent un bulletin blanc dans l’urne et (3) les électeurs qui mettent un bulletin nul. Selon les
53
potentiellement supérieure en termes parétiens s’il est possible d’effectuer un transfert
forfaitaire d'au moins 4 de A vers B);
- même si un projet permet une amélioration parétienne, il reste à définir
comment doit être distribué le surplus social qui en découle (dans l'exemple précédent, le
surplus de social est de 6 [10-4] et le transfert de A vers B peut être compris entre 4 et 10).
Pour maximiser leur part, les individus ont intérêt à se comporter stratégiquement, en
conservant l'information dont ils disposent, notamment celle qui concerne leurs préférences.
Ce type de comportement pourra évidemment conduire à des choix sociaux sous-optimaux (à
une « perte sociale sèche » - a social deadweight loss). De plus, même si un accord
« optimal » est finalement obtenu, le temps nécessaire pour l’obtenir sera plus important. En
d’autres termes, les coûts de négociation seront plus élevés et le surplus social net distribuable
sera donc plus faible.
L'intensité des problèmes précédents dépend de deux grands facteurs: (1) de
l'homogénéité des comportements individuels et (2) de la taille de la collectivité concernée.
(1) homogénéité des comportements. Par définition, une décision collective est une
agrégation de choix individuels. Le problème est du même ordre que celui qui consiste, par
exemple, à établir un indice de prix unique à partir de milliers de prix particuliers. Plus les
« unités de base » réagissent de façon similaire et plus on obtient des règles d’agrégation
acceptables. A la limite, si toutes les préférences sont identiques et si tous les individus
perçoivent l'environnement de façon semblable, l'accord est immédiat et la décision collective
devient indépendante de la règle de décision utilisée. Le coût des décisions collectives dépend
donc (1) de l’existence de valeurs culturelles et de codes de conduite sociale largement
acceptés (altruisme, sens du sacrifice à un "bien commun" reconnu, communauté de vues et
de préférences, etc.) et (2) du degré de décentralisation des structures politiques (avec une
large part des décisions collectives prises au niveau de sous-groupes géographiques
homogènes) 32 .
(2) Taille de la collectivité. Le coût des décisions collectives est une fonction
croissante du nombre des individus appelés à y participer. En ce sens, la décentralisation
politique n'est pas seulement un mode d'homogénéisation. Elle contribue aussi, par les
partitions qu'elle autorise, à réduire le coût des décisions collectives.
règles pratiques de vote, ces trois attitudes n'ont pas toujours les mêmes effets sur le calcul des majorités. De
plus, elles peuvent révéler des préférences différentes et/ou correspondre à des « signaux » différents.
32 Argument avancé notamment dans l’article célèbre de W.A. Lewis « La chose publique en Afrique
occidentale » (Analyse et Prévision, 1966, I : 111-132 et 207-218).
54
Une solution radicale pour abaisser les coûts de décision est de lever la contrainte
d'« opposition zéro » qu'implique l'unanimité. La collectivité accepte de passer outre le
désaccord d'un certain nombre d'individus sous réserve que le nombre de personnes qui
approuvent soit supérieur à un minimum institutionnellement défini (p≥p*). Pour simplifier,
on suppose que (a) n est impair et que (b) les électeurs ne peuvent pas s’abstenir. Ils
doivent uniquement exprimer des préférences strictes entre un projet (X) et le maintien du
statu quo (S). Les votes sont soit « pour » (p) soit « contre » (c) : p+c=n 33 .
La figure 2-1, qui reprend un graphique célèbre de Buchanan et Tullock(1962), montre
comment la règle de décision optimale est déterminée. D’un côté, les "coûts de décision" (Cd)
sont une fonction croissante du nombre minimum de voix « pour » requises (de p m ). D’un
autre côté, plus p m est élevé, plus la probabilité pour un électeur de se voir imposer une
décision qui diminue son bien-être (et donc à laquelle il est opposé) est faible : les coûts
externes (Ce) d’une règle de décision collective qui exige un minimum de voix « pour » (p m )
sont une fonction décroissante de ce minimum : Ce=Ce(p m ). Dans le cas de l’unanimité, p m = n
et Ce(n) = 0 (puisque toute personne qui s’oppose à X peut obtenir le rejet du projet en votant
« contre », le risque de coûts externes dus à la règle d’unanimité est nul).
Coûts
totaux
Cd+Ce
(somme verticale
de Cd et de Ce)
M
Ce
(coûts
externes)
Cd
(coûts de
décision)
p m
=n/2
p m *
n (nombre
total
d’électeurs
Nombre minimal de
voix pour X
Figure 2-1: Choix de la règle de décision
Cependant, l'acceptation d'une règle plus faible que l'unanimité ne réduit pas
seulement les coûts de décision. Elle implique aussi pour chaque individu la perte de son droit
33 La possibilité d’indifférence entre X et S – et donc d’abstention – ne change pas le problème sur le fond mais
complique quelque peu sa formulation.
55
de veto 34 . Les autres électeurs sont maintenant en mesure de lui imposer des pertes d'utilité -
des "coûts externes" (Ce). Ces coûts dépendent de la taille de la coalition qu'un opposant doit
constituer avec les autres pour s'opposer victorieusement: ils sont donc d'autant plus forts que
le minimum p m est faible. Sur la figure 2-1, Ce(p m ) est représenté comme une fonction
décroissante, pour n donné.
La somme des deux coûts (Cd+Ce) est minimale en M, pour la règle de décision
correspondant au point p m *. C'est par conséquent cette règle qui sera retenue par un individu
représentatif rationnel. A priori, p m * peut se situer n'importe où entre 1 (une personne décide
seul) et n (unanimité).
En fait, les points situés à gauche de n/2 ne sont pas possibles, car une règle qui
n'exige pas plus que la moitié des voix permet l'adoption simultanée de décisions contraires.
En d'autres termes, si l’on définit une règle de majorité à p m /n % comme une règle exigeant un
pourcentage de votes favorables strictement supérieur à p m /n, seules les règles à 50% et plus
sont admissibles (la zone à gauche de la verticale d’abscisse n/2 sur la figure 2-1 est exclue
pour des raisons de cohérence).
Exemple : supposons que la règle de choix d’une assemblée exige au moins à 40% des
votes et que l'on vote pour ou contre la construction d'un pont. On peut parfaitement avoir
55% des électeurs pour la construction du pont et 45% contre. Dans les deux cas, la barre des
40% a été dépassée : donc l’assemblée peut adopter à la fois une motion « pour » et une
motion « contre » la construction du point.
La règle de majorité simple (c'est-à-dire telle que p m /n = 50%) est la règle de décision
collective cohérente pour laquelle les coûts de décision sont minimaux (et les coûts externes
maximaux). Cette conclusion ne vaut évidemment que pour des systèmes "un homme, une
voix", c'est-à-dire pour des conditions égales d'accès au vote. Dans le cas contraire, des sousgroupes
comprenant des personnes préalablement désignées peuvent parfaitement décider de
façon cohérente (mais à condition que la règle de décision à l’intérieur du sous-groupe
demeure au moins une règle de majorité simple).
Lorsque les coûts externes sont particulièrement élevés, la courbe Cd se situe plus vers
la droite sur la figure et la collectivité tend à recourir à des majorités renforcées (2/3, 3/4, etc.)
de préférence à la majorité à 50% (cas du point M sur la figure 2-1).
34 Avec la règle d'unanimité (au sens de personne contre), l'individu est en position de "dictateur faible", avec un
"pouvoir d'inclusion". Il peut obliger les autres à tenir compte de ses options. En revanche, il n'est pas "dictateur
fort": il n'a pas de "pouvoir d'exclusion" des options des autres.
56
B) Le choix de représentants
Le choix de règles plus faibles que l'unanimité n'est pas le seul moyen de réduire les
coûts de décision. On peut également élire des représentants chargés de décider dans un
Parlement à la place de la collectivité dans son ensemble. Cette solution de "démocratie
représentative" s'impose notamment lorsque le point p m (règle de majorité optimale en
"démocratie directe" sans tenir compte de la contrainte de cohérence) est situé très à gauche
de la majorité à 50% (du point p m =n/2). Certes, la contrainte de cohérence implique de se
situer en p m =n/2 mais les coûts totaux en ce point sont très supérieurs à ce qu'ils auraient été
en l’absence de cette contrainte (figure 2-2).
Coûts
totaux
Cd + Ce
(somme verticale
de Cd et de Ce)
Ce
(coûts
externes)
M
Cd
(coûts de
décision)
p m *
p m
=n/2
n (nombre
total
d’électeurs)
Nombre minimal de
voix pour X
Figure 2-2 : Coût de la contrainte de cohérence quand les coûts de décision sont élevés
Supposons que par une méthode adéquate (tirage au sort ou élections selon des
modalités à préciser) on puisse choisir un échantillon de r représentants (r
derniers. Au fur et à mesure que r diminue, la courbe de coûts externes pour l'individu
représentatif se déplace vers la droite, à partir de sa valeur en démocratie directe (courbe Ce
lorsque r=n). Pour chaque valeur de r, on peut calculer des courbes Cd(r)+Ce(r) et déterminer
à partir de leur minimum la règle de décision optimale. La valeur de r qui correspond au plus
petit minimum de Cd(r)+Ce(r) est celle qui correspond à la taille optimale du parlement. La
valeur correspondante de p m * (vraisemblablement très à gauche de p m =n/2) n’est évidemment
pas la règle de décision qu’il convient d’appliquer à l’intérieur du parlement (celui-ci est tenu
de respecter la contrainte de cohérence). Elle indique simplement que tout se passe comme si
les choix parlementaires pouvaient s’interpréter comme des choix en démocratie directe où
l’électorat ne serait pas soumis à la contrainte de cohérence (mais qui resteraient cohérents
puisque le parlement serait lui soumis à cette contrainte). Le gain social du système
parlementaire optimal peut alors facilement se calculer en comparant les coûts Ce+Cd d’un
vote de l’électorat à la majorité simple et les coûts Ce(r*)+Cd(r*) de décision collective par le
système de démocratie représentative.
La réduction des coûts des décisions collectives n’est que l’un des avantages de la
démocratie représentative par rapport à la démocratie directe, et vraisemblablement pas le
plus déterminant. En démocratie directe, toutes les décisions sont prises par un vote, c'est-àdire
par agrégation des préférences individuelles en un choix unique. Cela signifie que l'on est
confronté, comme on le verra, à des risques d'instabilité et d'incohérence dans les choix
successifs. Dans la démocratie représentative, au contraire, la fonction première du vote n'est
pas de décider des choix collectifs mais de sélectionner des représentants parlementaires et
des dirigeants politiques auxquels ces choix seront délégués, puis de les contrôler (en faisant
peser sur eux la menace de non-réélection et, dans le cas des dirigeants politiques, la menace
de censure par le Parlement).
La fonction du vote change alors profondément. Le problème devient moins de savoir
comment agréger au mieux les préférences individuelles afin de faire apparaître une « volonté
générale » cohérente et pertinente, mais d’utiliser le vote à la fois pour sélectionner au mieux
les nouveaux « agents » politiques lors des élections (un gouvernement et un parlement) et
pour contrôler les agents actuellement en place par la menace de non-réélection. Le problème
devient d’abord un problème d’agence, avec une particularité liée à la présence de
"principaux" multiples (les citoyens-électeurs) 35 . W.Riker(1982) a particulièrement insisté sur
35 Pour une application récente de la théorie dite de l'« agent » (mandataire) et du « principal » (mandant) aux
relations entre un élu et ses électeurs, cf.Davis et Porter(1989).
58
cet aspect de la démocratie représentative, en opposant ce qu’il appelle le « populisme » et le
« libéralisme » . Historiquement, les parlements, au moins en Europe, sont d’abord le résultat
d’une volonté de contrôle de l'utilisation des impôts payés aux monarques. Il ne s’est jamais
agi de réduire les coûts de décision d'une hypothétique démocratie directe (cf. Ardant(1976)
sur ce point).
C) Le paradoxe de la participation
Jusqu'à maintenant, nous avons supposé que tous les individus votaient. Ce qui n’est
manifestement pas le cas.
Si le vote est purement instrumental, ce à quoi on s’attend a priori de la part
d’individus rationnels, ceux-ci n’iront voter que si l'accroissement d'utilité qu'ils anticipent est
supérieur aux coûts qu'ils doivent supporter pour effectuer leur "devoir" électoral.
Soit une compétition entre deux projets P1 et P2. Les utilités de P1 et de P2 pour un
électeur i sont respectivement de U(P1) et de U(P2) avec U(P1)>U(P2). On suppose que ces
utilités sont connues avec certitude et mesurées en termes monétaires: elles représentent les
dispositions à payer de i pour avoir P1 ou P2. Si le vote exprimé par i est décisif (si, étant en
position de pivot, cet électeur peut faire basculer la majorité), l’avantage associé au vote est:
B = U(P1)-U(P2). Dans le cas contraire, cet avantage est nul. Si p est la probabilité d'émettre
un vote décisif et si C sont les coûts du vote (coûts d'information et de déplacement au bureau
de vote), l'avantage net espéré du vote pour i (E(Bn)) est 36 :
E(Bn) = p.B – C = p.(U(P1)-U(P2)) - C. (2-1)
La probabilité p pour un individu i d'émettre un vote décisif (de changer le résultat par
son vote) dépend à la fois de la taille de l'électorat et des anticipations sur le caractère plus ou
moins serré du scrutin. Cependant, dès que le nombre des participants au vote est un peu
élevé, p devient extrêmement faible, même dans le cas le plus favorable (c'est-à-dire où i
anticipe un partage égal des voix entre P1 et P2). Pour un électorat comportant 100 millions
d’électeurs, p est par exemple de 0,00006 (Mueller(1989 :350)) 37 . Dans ces conditions, la
moindre valeur positive de C (ne serait-ce que le coût associé au risque d'être renversé par une
voiture en allant au bureau de vote) fait que l’avantage net pour i (E(Bn) = p.B – C) est
presque toujours négatif. Par conséquent, un individu "rationnel" a très peu de chances d’aller
36 L'individu rationnel face au risque maximise son espérance d'utilité. Compte tenu des simplifications faites,
cela revient ici à simplement maximiser le bénéfice net espéré.
37 Et si P1 et P2 ont des chances différentes de gagner, la valeur de p est encore bien plus faible !
59
voter. Il s’agit du paradoxe de la participation, aussi appelé « paradoxe du vote » (ou
« paradoxe du (non) vote »).
Le défaut principal du résultat précédent est qu'il est totalement en contradiction avec
les faits observés, puisque de nombreux individus votent. En France, par exemple, la
participation dépasse régulièrement 70% pour les élections nationales (législatives et
présidentielles). Et même si elle est plus faible dans un pays comme les Etats-Unis (en
descendant couramment en dessous de 50%), elle demeure nettement plus importante que
l'implique la "rationalité". La théorie et les faits peuvent être réconciliés de plusieurs
manières:
1. Introduction d'une "préférence pour le vote", D. Le fait même d'aller au bureau de
vote et d'exprimer son opinion peut procurer des bénéfices psychologiques. On retrouve ici la
même logique que celle qui conduit certains individus à répondre à des enquêtes d'opinion,
dont l'avantage espéré est strictement nul mais le coût en temps est toujours significatif.
L'électeur peut aussi avoir conscience d'accomplir un devoir civique ou de contribuer à
renforcer la légitimité des futurs élus. Si p.B - C est presque toujours négatif, p.B + D - C sera
en revanche positif pour un nombre significatif d'individus. Tout en reconnaissant qu'elle rend
compte dans certains cas de l'abstention, certains critiques reprochent à cette explication de
représenter le type même de l'hypothèse ad hoc, celle que l'on introduit pour sauver une
théorie menacée par une réfutation particulière.
2. Prise en compte des comportements stratégiques. Le paradoxe de la participation
suppose une rationalité simple. Il ne tient pas compte des réactions anticipées des autres à sa
propre décision. Dans la réalité, si i anticipe que tous les autres font le même raisonnement
que lui, il en déduit que la participation sera très faible. Sa probabilité d'émettre un vote
décisif s'accroît donc fortement. Sous certaines hypothèses, on peut alors montrer que le vote,
vu comme une forme particulière de jeu non coopératif à n personnes, conduit à un taux de
participation positif (Ledyard(1984)). Toutefois, les analyses expérimentales indiquent que ce
type d’explication ne peut rendre compte que d’un pourcentage de participation limité (de
l’ordre de 20%).
3. Probabilité subjective d’être décisif. L’argument concernant la très faible valeur de
p s’appuie sur un calcul de la probabilité objective d’être décisif, c'est-à-dire sur le rapport
60
entre le nombre de cas « favorables » (où i est décisif) et le nombre des cas « possibles ».
Mais la variable sur laquelle se fonde la décision de voter est la probabilité subjective d’être
décisif, l’idée que l’électeur se fait de l’impact de son vote sur le résultat final. La plupart des
médias et des responsables et partis politiques cherchent souvent à convaincre les électeurs
que les scrutins sont serrés et que « chaque vote compte », c'est-à-dire à accroître leur
probabilité subjective d’être décisifs. Empiriquement, Tollison, Crain et Paultner(1975) ont
montré (en corrélant notamment la participation électorale et la consommation de papier
journal dans les différents Etats américains) comment les médias modifiaient les anticipations
des électeurs dans le sens d'une surestimation de leur probabilité d'être décisif. Toutefois, la
portée de la distinction probabilité objective/probabilité subjective doit être relativisée : si les
électeurs ont un minimum de rationalité dans leurs anticipations, il y a peu de chances que
l’on puisse, selon l’expression célèbre d’Abraham Lincoln, « tromper tout le monde tout le
temps ».
4. Caractère de « signal » du vote. Pour l’électeur, le vote n’est pas seulement un
instrument permettant de choisir entre des programmes. Il a aussi un aspect dit expressif,
c'est-à-dire qu’il procure une satisfaction directe à l’électeur en lui permettant de manifester
son soutien à un candidat ou à un parti. De plus, il est aussi un moyen de signaler une opinion
ou une logique de comportement aux différents acteurs politiques (en envoyant par exemple
un avertissement à certains partis lors d’élections de moindre importance). Chaque vote
comporte à la fois une composante instrumentale, une composante expressive et une
composante de signal. Seule la composante instrumentale fait intervenir la (très faible)
probabilité d’être décisif. Ce que démontre en fin de compte le paradoxe de la participation,
c’est que les électeurs qui vont voter le font surtout pour des raisons expressives et de signal.
L’aspect signal, qui est vraisemblablement le plus important, sera d’autant plus marqué que
les résultats seront comptabilisés au niveau de bureaux concernant un petit nombre
d’électeurs. Comme le note Schwartz(1987), cela donne la possibilité à des groupes très
restreints d’obtenir des avantages importants en signalant aux futurs élus le caractère
conditionnel de leur soutien (notant en matière d’investissement public en faveur d’une zone
géographique). Ce phénomène sera en revanche moins sensible si les votes sont comptabilisés
sur de larges entités 38 .
38 En un certain sens, le vote sera d’autant moins « anonyme » que les résultats seront comptabilisés à un niveau
plus désagrégé (quartier par quartier par exemple). Cette situation peut servir les intérêts des élus, qui peuvent
soit punir les quartiers qui « votent mal », soit au contraire essayer de les convaincre par un traitement de faveur.
61
5. Adoption d’une stratégie de « regret minimax » (minimax regret). Selon Ferejohn et
Fiorina(1974) l'électeur ne maximise pas son espérance d'utilité mais adopte à la place une
stratégie de "regret minimax". Cette attitude face au risque consiste à choisir la solution qui
minimise la perte au cas où la pire éventualité se produirait 39 . Pour un électeur i, la matrice
des « regrets » (c'est-à-dire de ce que l’on aurait pu avoir en plus dans la meilleure des autres
options possibles) est la suivante :
i est décisif i est non décisif
i vote 0 C
i s’abstient B-C 0
Considérons par exemple la dernière ligne du tableau : si i s’abstient et s’il est décisif,
il perd la possibilité de faire adopter le programme qu’il préfère, et donc la possibilité de
gagner B-C. Au contraire, si i n’est pas décisif, il ne peut pas obtenir plus en prenant une autre
décision (en allant voter). Son « regret » est donc nul.
Pour choisir entre voter et s’abstenir, i considère le regret maximal que lui apporte
chaque décision. S’il choisit de voter, son regret maximal est de C. S’il choisit de s’abstenir,
son regret maximal est de B-C (dont la valeur est en général très supérieure à C, surtout
lorsque i a une préférence forte pour l’un des deux programmes). i choisit de voter car c’est la
décision qui correspond au plus petit regret maximum (au regret minimax). Cette stratégie de
choix revient à considérer chaque situation indépendamment de sa probabilité d’occurrence.
L'individu choisit de voter ou de s'abstenir sur la seule base de B-C (ou B+D-C) et non de
p.B-C (ou de p.B+D-C). L'obstacle que représente une valeur de p infinitésimale est ainsi
contourné. Cependant, on peut se demander pourquoi l'individu adopte un comportement
aussi conservateur face au risque, et pourquoi il le fait seulement quand il s’agit de choisir
entre voter ou ne pas voter. De façon générale, pour être retenu, ce type d’explication devrait
être appuyé sur des preuves empiriques beaucoup fortes que celles avancées par Ferejohn et
Fiorina(1975).
Mais elle peut aussi servir les électeurs, qui pourront plus facilement marchander leur soutien et signaler par
exemple qu’ils pratiquent une stratégie de donnant-donnant (tit for tat).
39 "… que se serait-il passé si je n'avais pas voté et si le candidat que je préfère avait perdu d'une voix Cela
aurait été comme si je m'étais porté à moi-même un coup mortel." (Ferejohn et Fiorina(1974)).
62
6. Influence des institutions sociales ou du gouvernement sur les avantages et les coûts
du vote. Dans les régimes totalitaires, où les élections (à 99,99%) ne servent nullement à
choisir mais à légitimer, les gouvernements manipulent à la fois les coûts (par des pressions
politico-policières) et les avantages (en organisant notamment des fêtes et banquets autour des
bureaux de vote). Dans le cas des démocraties représentatives, une abstention trop massive est
souvent vue comme un menace pour le système politique en longue période. L'individu qui ne
vote pas impose donc des coûts externes à tous ceux qui en souhaitent le maintien. On a là une
justification potentielle pour une action publique. Il y a plusieurs moyens d'inciter les
individus à internaliser ces effets externes. On peut par exemple instaurer, par le biais du
système éducatif et de campagnes régulières contre le manque de civisme, un système de
pression sociale. On peut, plus simplement, rendre le vote obligatoire (comme cela a été ou
est le cas en Belgique, en Grèce, en Italie ou en Australie): l'amende que l'on doit payer en cas
d'abstention accroît d'autant le bénéfice net du vote. Cependant, la façon dont un
gouvernement va inciter les abstentionnistes à voter dépendra de l'avantage électoral qu'il
espère en retirer. D’un côté, l'effet de notoriété dont bénéficient traditionnellement les sortants
devrait rendre une participation accrue favorable au gouvernement en place. Mais d'autres
facteurs peuvent venir brouiller les cartes, notamment le fait que les abstentionnistes qui se
décident à voter ont une faible fidélité partisane: s'ils se répartissent également entre les partis,
c'est alors le parti minoritaire qui est bénéficiaire (qu'il soit au pouvoir ou dans l'opposition) 40 .
Il n'est donc pas certain que les intérêts à court terme du gouvernement coïncident toujours
avec l'intérêt à long terme du régime politique.
Plusieurs études empiriques ont mis en évidence la présence d'un lien
significatif entre la participation des électeurs et leurs anticipations concernant le caractère
plus ou moins serré du vote, ce qui tendrait à confirmer la présence d'un certain calcul
rationnel de la part des électeurs dans une optique instrumentale. Cependant, des études
empiriques ultérieures ont eu tendance à modérer ces résultats initiaux (Mueller(1989:354-
361)). Les électeurs sont apparemment moins naïfs quant à leur capacité d'influencer le
résultat. Cela signifie que, parallèlement à l’aspect « signal », les coûts du vote (C) et les
préférences intrinsèques pour le vote (D) jouent à nouveau un rôle central, de même que la
question des déterminants de ces deux variables.
40 Le cas du Congrès américain semble confirmer qu'une forte participation est plutôt favorable au parti
minoritaire, notamment lorsqu'il s'agit des Démocrates. Voir DeNardo(1980) sur ce point.
63
Il est établi depuis longtemps que la participation au vote croît avec le revenu et le
niveau d'éducation et qu'elle est plus forte chez les fonctionnaires. La raison en est
vraisemblablement, dans le cas du niveau d’éducation et de l’appartenance à la fonction
publique, une différence dans l'information préalablement acquise sur les choix sociaux. Cette
meilleure information correspond à un intérêt civique plus marqué (D est plus fort) – ainsi
qu’à un intérêt personnel direct dans le cas des fonctionnaires - et à des coûts plus faibles dans
l'acquisition et le traitement des informations politiquement pertinentes pour un vote
« éclairé » (C est plus faible).
Dans le cas du revenu, le résultat est a priori surprenant : dans la mesure où les
personnes ayant un revenu élevé ont un coût d’opportunité du temps plus fort, elles devraient
moins voter (le paradoxe de la participation devrait être encore plus important pour elles).
Mais cette anomalie est en fait une illusion d’optique. Elle provient de ce que le revenu (y) et
le niveau d’éducation (e) sont statistiquement très corrélés. S’il est exact que la participation p
est une fonction croissante de y dans une corrélation simple (p = α.y + α 0 avec α>0, α
significativement positif et r² élevé), le coefficient du revenu devient négatif dans une
corrélation multiple du type : p = a.y + b.e + c. On obtient alors a0, a et b
significativement différents de zéro et r² élevé. En d’autres termes, à éducation constante (en
« contrôlant » pour l’éducation), un électeur vote d’autant moins que son revenu est élevé,
contrairement à la relation simple entre participation et revenu, mais conformément à la
théorie de la rationalité des comportements individuels.
Section II : Le vote à la majorité simple
A) Théorie « spatiale » du vote
La théorie économique du vote utilise un mode particulier de représentation
des préférences des n individus-électeurs. On suppose qu’un électeur i a une fonction
d’utilité U i (x i ,g), avec x i bien privé (prix p x ) et g bien public (prix p g ). g, qui est
consommé en égale quantité par tous, n’est pas indexé pour i. La contrainte budgétaire
de i s’écrit :
y i = p x .x i +t i (g), avec t i (g) = µ i .p g .g et ∑ µ i = 1 (contrainte d’équilibre du budget
public).
64
x
E
U’
U’’
U*
g’’
g’
g*
g
Figure 2-1a
U*
U’
U’’
g’’ g’ g*
g
Figure 2-1b
FIGURE 2-1 : Préférences des électeurs et théorie spatiale du vote (une
dimension)
La figure 2-1a indique l’optimum du consommateur-électeur quand celui-ci
doit choisir entre le bien public et le bien privé, pour une part d’impôt µ i donnée (point
E où la contrainte budgétaire est tangente à la courbe d’indifférence représentant un
niveau d’utilité
Sur la figure 2-1b, g* correspond au niveau de dépense publique qui
maximiserait U i * compte tenu de la contrainte budgétaire y i . Cependant, comme g est
un bien public, il est fourni en quantité unique pour tous (par exemple, le nombre de
kilomètres d’autoroute construits chaque année est le même pour tous les électeurs). Si
le montant fixé collectivement est g’, le niveau d’utilité de l’individu correspondra à la
courbe d’indifférence U i ’ sur la figure 2-1a et au niveau d’utilité U i ’ sur la figure 2-1b.
65
Si le montant fourni est g’’, la valeur correspondante est U i ’’. Il est alors possible de
tracer la courbe d’utilité de l’individu i, compte tenu de sa contrainte budgétaire et de
sa part d’impôt µ i (figure 2-1b). Il s’agit d’une courbe à un sommet (ou point idéal –
bliss point), g*.
Si l’on fait en plus l’hypothèse que la courbe de la figure 2-1b est symétrique,
il suffit alors de connaître la distance de g’’’ à g* d’un point g’’’ et la distance de g’’’’
à g* d’un point g’’’’ (et rien d’autre) pour connaître les préférences de l’électeur i
entre g’’’ et g’’’’. On voit pourquoi ce mode de représentation des préférences pour les
biens offerts par le secteur public est appelé théorie « spatiale » du vote.
On a supposé jusqu’à maintenant que la dimension unique du choix proposé
correspondait à un montant global de dépense publique. Mais cette dimension peut
correspondre à un axe regroupant plusieurs facteurs en un seul agrégat. Ainsi, on
retient fréquemment la dimension idéologique droite/gauche comme axe unique. Un
électorat sera alors représenté comme l’ensemble des « bliss points » des électeurs. La
figure 2-2 représente par exemple un électorat comprenant sept personnes. Il est alors
facile de voir que la proposition P1 est préféré par quatre électeurs à la proposition P2
et obtiendra donc un majorité en cas de vote.
P2
P1
Droite
4 2 7 1 5 3 6
Gauche
Note : les numéros sont les indices i des 7 électeurs. P1 et P2 sont des
programmes politiques.
Figure 2-2 : Représentation spatiale d’un électorat sur un axe idéologique
Dans la réalité, les programmes proposés aux électeurs sont rarement
unidimensionnels. Au contraire, ils effectuent des propositions dans la plupart des
dimensions, du moins dans celles que l’actualité et les médias placent au premier plan.
Les courbes d’indifférence sont alors des hypersurfaces et les contraintes budgétaires
des hyperplans. Le bliss point d’un individu-électeur correspond toujours au point de
tangence entre l’hypersurface d’indifférence la plus haute et l’hyperplan de contrainte
budgétaire. La courbe obtenue dans la figure 2-1b devient alors une hypersurface dont
66
le sommet correspond au bliss point. La figure 2-3 représente le cas d’un espace à
deux dimensions. Mutatis mutandis, elle correspond à la situation de la figure 2-1b.
U
(sous
contrainte)
.
E (bliss point)
O
g 1
.
g 2
FIGURE 2-3 : Préférences des électeurs et théorie spatiale du vote (deux
dimensions)
Les deux dimensions sont deux catégories de dépenses publiques, g 1
(l’éducation par exemple) et g 2 (la défense nationale par exemple). On trace pour
chaque valeur de U (compte tenu de la contrainte budgétaire) le plan horizontal
correspondant à cette valeur et on projette sur le plan g 1 Og 2 son intersection avec la
surface d’utilité. Si la surface d’utilité est symétrique par rapport à l’axe vertical
passant par le bliss point E, la courbe projetée, qui représente le lieu des points
correspondant à la valeur de U choisie, est un cercle dont le centre est la projection du
bliss point E.
La figure 2-4 représente le résultat obtenu dans le plan g 1 Og 2.
Le bliss point de l’électeur 1 est représenté en même temps que trois de ses
courbes d’indifférence (en forme de cercle). Elles correspondent à un niveau d’utilité
d’autant plus faible que le rayon du cercle considéré est grand. Le programme B
(correspondant à g b 1 de g 1 et g b 2 de g 2 ) est préféré au programme A car il se trouve sur
une courbe d’indifférence plus proche du bliss point de 1. En fait, il n’est pas
nécessaire de tracer les cercles d’indifférence pour chaque électeur. Il suffit de calculer
67
les distances (euclidiennes) de A et B à son bliss point. Ainsi, on constate que 3
préfère A à B et que 2 préfère B à A. En cas de vote, B l’emporte sur A par deux voix
(celles de 1 et 2) contre une (celle de 3).
g 2
(défense)
g 2
b
g 1
b
g 1 (éducation)
Figure 2-4 : Représentation des préférences de trois électeurs (deux
dimensions)
La connaissance des bliss points des électeurs permet ainsi de déterminer
l’ensemble de leurs préférences et donc de prévoir le résultat de tout vote entre
différentes options (sous réserve que les conditions de symétrie posées soient
remplies). De façon générale, un électorat comprenant n électeurs (quel que soit leur
nombre) pourra être représenté par une distribution des n bliss points dans le plan g 1 g 2
(dans le cas d’un choix bidimensionnel).
On notera enfin que tous les programmes situés à l’intérieur du triangle qui
relie les sommets 1,2 et 3 sont des optima parétiens. Il n’est pas possible de trouver un
programme B qui soit préféré (au sens large) à un programme A par les 3 électeurs à la
fois. On peut trouver un programme B qui soit préféré à la majorité à A, mais toujours
avec le vote contre d’au moins un électeur.
68
B Théorème de l’électeur médian
Examinons à nouveau l’électorat représenté sur la figure 2-2. Il est clair que si
un parti propose un programme correspondant exactement au bliss point de l’électeur
1, il ne pourra pas être battu à la majorité dans des duels avec les autres concurrents.
La position occupée par l’électeur 1 correspond à un équilibre en stratégie dominante
et la seule réponse possible pour l’autre parti est de faire la même chose, afin d’avoir
la même espérance de voix (chacun obtiendra trois voix avec certitude et le résultat
final dépendra du choix de 1, qui choisira au hasard, puisqu’il est indifférent entre les
deux programmes). De même, dans un vote entre des motions prises deux à deux, celle
qui correspond aux préférences de 1 l’emporte sur toutes les autres.
Pourquoi la règle de majorité converge-t-elle de façon systématique vers les
préférences de 1 L’électeur 1 ne dispose ni d’un quelconque pouvoir de coercition ni
d’une aptitude particulière à convaincre les autres. Ses préférences se situent tout
simplement en position médiane, c'est-à-dire qu’il y a dans l’exemple retenu autant
d’électeurs qui demandent plus de bien public g que lui et autant d’électeurs qui en
demandent moins. On dit que 1 est un dictateur positionnel : ses préférences sont
exactement satisfaites non parce qu’il est puissant mais parce qu’il a les préférences
qu’il a 41 . Le théorème de l’électeur médian se contente de constater cette situation.
Théorème de l’électeur médian : le résultat d’un vote à la majorité simple
entre des projets pris deux à deux correspondra à l’optimum de l’électeur médian, sous
réserve que les électeurs soient en nombre impair ou qu’ils soient nombreux (auquel
cas le risque d’égalité de voix est négligeable).
Le point médian atteint à l’issue du vote ne correspond pas a priori à un
optimum parétien. Si certains électeurs ont une préférence très intense pour une option
et si plusieurs autres ont des préférences inverses mais avec beaucoup moins
d’intensité, il est vraisemblable qu’un accord entre les différents électeurs pourrait
permettre, après définition d’un système de transfert et de compensation adéquat,
d’atteindre un point Pareto-supérieur. Toutefois, si les électeurs ont a à peu près la
41 Techniquement, la théorie des choix sociaux distingue les dictateurs faibles, qui ont un pouvoir d’inclusion
(qui peuvent obliger les autres à inclure leurs préférences dans le choix social – avec la règle d’unanimité, tout
citoyen est un dictateur faible), les dictateurs forts qui ont un pouvoir d’exclusion (peuvent exclure du choix
social certaines préférences – ce concept est le plus proche du concept courant de dictateur) et les dictateurs
positionnels (qui ont seulement la chance de posséder les « bonnes préférences »).
69
même intensité des préférences ou si ces préférences sont distribuées au hasard (de
telle sorte qu’à un individu situé à droite du médian, on puisse faire correspondre un
individu situé à gauche et ayant la même intensité de ses préférences), et si les optima
individuels sont approximativement symétriques, alors la médiane correspond au
« point d’insatisfaction » minimum. Tout mouvement par rapport à la position de
l’électeur médian implique un résultat électoral moins favorable pour l’ensemble du
groupe social.
Le théorème de l’électeur médian fait toutefois l’hypothèse que le choix social
est unidimesionnel. Il est donc nécessaire de voir comment cette question se pose dans
un univers multidimesionnel (bidimensionnel pour simplifier). En fait, il est très
difficile de généraliser le cas unidimensionnel. Si l’on prend le cas de trois électeurs, il
est facile de montrer que tout point, même s’il est un optimum parétien (c'est-à-dire
situé à l’intérieur du triangle reliant les trois bliss points), peut être battu à la majorité.
La figure 2-5 permet de voir l’ensemble des points susceptibles de battre A. Ce
domaine est loin d’être vide : tout point situé sur l’un des pales de l’hélice de la figure
2-5 battra A.
g 2
3
A
1
2
g 1
Figure 2-5 : Absence d’équilibre dans le cas de trois électeurs
Parmi les points intérieurs au triangle (parmi les optima parétiens), on aurait
aussi bien pu choisir le point correspondant à la médiane dans chacune des
dimensions. Graphiquement, c’est celui qui a la même abscisse que 3 et la même
70
ordonnée que 1. La conclusion aurait été la même : un programme qui répond aux
préférences médianes dans chaque dimension peut être facilement battu (par un
programme qui parvient à « coaliser des minorités », c'est-à-dire à favoriser les
préférences extrêmes et/ou intenses de différents groupes dans les différentes
dimensions).
Une condition suffisante pour qu’un point soit un équilibre (ne puisse par être
battu dans des duels) est qu’il correspondent à une position de « médiane
généralisée ». Dans ce cas, par définition, toute droite (tout plan ou hyperplan à plus
de deux dimensions) passant par ce point sépare le plan (l’hyperplan) en deux sousensembles
comprenant chacun le même nombre de bliss points.
Démonstration (figure 2-6) : soit E la médiane généralisée et Z un point
quelconque. On trace en E la perpendiculaire VW à ZE. E est préféré par tous les
points (les électeurs) situés à droite de VW, soit par au moins n/2 électeurs (par la
définition même d’une position médiane généralisée).
Z
W
g 2
E
V
g 1
Figure 2-6 : Existence d’un équilibre en cas de position médiane
généralisée
Le problème de la règle de majorité simple à plus d’une dimension est qu’il
n’existe pas toujours de position médiane généralisée. Une telle position n’existe mêm
que très rarement.
71
B) Paradoxe du vote et chaos
I Le paradoxe du vote
La règle de majorité simple pose des problèmes dès que le nombre des options
offertes est supérieure à deux, c'est-à-dire dans pratiquement tous les contextes a priori
intéressants. Dans ce cas, en effet, il n’existe pas de méthode unique d’extension de la
majorité simple.
Une première possibilité est de retenir le « vainqueur de Condorcet », c'est-àdire
l’option qui l’emporte sur toutes les autres dans des duels. Exemple : choix entre
quatre options, A, B, C, D. C est vainqueur de Condorcet si C l’emporte sur A à la
majorité simple, sur B à la majorité simple, sur D à la majorité simple.
Une seconde possibilité est de définir un ordre séquentiel de vote. On
commence par exemple par un duel à la majorité entre A et B, puis par un duel à la
majorité entre C et D. Dans une seconde étape, on confronte à la majorité les
vainqueurs du duel A/B et du duel C/D. L’option retenue est celle qui obtient la
majorité dans cette seconde (et ici ultime) étape.
a) Problème du vainqueur de Condorcet
La difficulté avec la première méthode est que le vainqueur de Condorcet
n’existe pas toujours (cas dit de « paradoxe de Condorcet »). Ce vainqueur n’existe
même jamais lorsque la règle majoritaire est utilisée pour résoudre des problèmes
purement redistributifs (des jeux « à somme nulle ») entre individus égoïstes (on parle
dans ce cas de « paradoxe de Ward » - cf. Ward(1961)).
Considérer un problème de partage entre trois individus, qui obtiennent
respectivement une part f1, f2, f3 (avec f1+f2+f3 = 1 puisque le jeu est à somme
nulle).
Le programme {f1,f2,f3} sera toujours perdant – par deux voix contre une -
face à un programme du type {0, f2’=f2+f1/2, f3’=f3+f1/2), où 2 et 3 s’accordent pour
ne rien donner à 1. Mais le programme précédent peut à son tour être battu – par deux
voix contre une – par un programme {f1’’=f2’/2, 0, f’3’=f3’+f2’/2}, où 1 et 3 se
coalisent pour ne rien donner à 2. Il est alors facile de trouver un nouveau programme
72
(coalisant par exemple 1 et 2) susceptible de battre le programme précédent. On dit
que l’on est confronté à un programme sans fin de « majorités cycliques ».
Ce problème de majorité cyclique peut également se produire lorsque les
préférences des électeurs ont une configuration particulière. On se trouve alors dans le
cas d’un paradoxe de Condorcet.
Soit le « profil de préférences » suivant :
1 : ABC
2 : BCA
3 : CAB
où 1 : ABC signifie que l’électeur 1 préfère A à B à C.
A l’emporte sur B dans un vote à la majorité. B l’emporte sur C dans un vote à
la majorité et C l’emporte sur A dans un vote à la majorité. La règle de majorité ne
conduit donc pas dans ce cas à des choix collectifs transitifs. En soi, cette nontransitivité
ne pose pas un problème : on demande à une règle d’effectuer des choix
collectifs et pas de ressembler nécessairement à la « rationalité » d’un individu isolé.
En revanche, elle pose un problème par ses conséquences : les choix collectifs sont
manipulables et la décision finalement prise dpépendra de l’ordre dans lequel les duels
seront organisés. Par exemple, si l’ordre du jour (agenda en anglais) commence par un
duel entre A et B puis entre le vainqueur (A) et C, c’est C qui est retenu. Si on
commence au contraire par un duel entre B et C puis entre le vainqueur (B) et A, c’est
A qui sera choisi.
Le paradoxe de Condorcet montre que, dans certains cas, le choix collectif sera
totalement indépendant des préférences des individus pose. Le choix collectif risque
alors soit d’être purement aléatoire (si l’ordre du jour est choisi par tirage aléatoire),
soit de ne représenter que les préférences de celui qui contrôle cet ordre du jour.
Quelle est la probabilité de rencontrer ce type de situation Les estimations de
la probabilité « objective » (nombre de cas « favorables » par rapport au nombre de
cas possibles) montrent que cette probabilité est généralement très faible et qu’elle
décroît quand le nombre des individus et des options croît. En pratique, cette
probabilité est surtout faible quand les préférences des individus sont homogènes
(mais alors presque toutes les règles de choix social, avec ou sans vote, donneront les
mêmes résultats). En revanche, elle est beaucoup plus forte dans les situations où l’on
73
a véritablement de faire des « choix sociaux », c'est-à-dire lorsque les préférences sont
très hétérogènes (en d’autres termes lorsque les avis sont les plus divergents).
b) Préférences à pic unique
Existe-t-il une configuration des préférences individuelles garantissant
l'existence d'un vainqueur de Condorcet (c'est-à-dire l'absence d'un paradoxe de
Condorcet) Pour que la réponse à cette question soit positive, il suffit, comme l'a
montré Duncan Black (1958), que tous les ordres de préférences soient "à pic unique"
(single-peaked).
Soit 3 options, A, B, C à une dimension entre lesquelles doivent choisir trois
électeurs, 1, 2 et 3. Supposons qu'il s'agisse de décider de la taille d'un barrage: A est
un petit barrage, B un barrage moyen et C un grand barrage.
Les préférences sont les suivantes:
Electeur 1: ABC
Electeur 2: BCA
Electeur 3: CAB
On se trouve donc dans un cas type de paradoxe de Condorcet.
Utilité
nette
Electeur 3
Electeur 2
Electeur 1
A B
C Taille des
projets
Figure 2-7: Paradoxe de Condorcet et non-unicité des pics
Dans la figure 2-7, l'électeur 3 à la différence des deux autres électeurs a des
préférences qui ne sont pas à pic unique (single-peaked). Dans le cas contraire, la
condition de Black serait respectée et il existerait un vainqueur de Condorcet.
74
La condition de Black se démontre par l'absurde: s'il n'y a pas de vainqueur de
Condorcet, un électeur au moins possède des préférences qui ne sont pas à pic unique.
Cette condition est seulement une condition suffisante. On peut parfaitement
avoir un vainqueur de Condorcet même si elle n'est pas vérifiée. Supposons qu'une
majorité des électeurs aient des préférences correspondant à celles de l'électeur 3. En
dépit du fait que ces préférences présentent plusieurs pics, le projet C l'emporte à la
majorité sur tous les autres dans des duels : il est un vainqueur de Condorcet et il n'y a
aucun problème de majorité cyclique.
Enfin, la condition de pic unique ne vaut que dans le cas unidimensionnel. A
plus d'une dimension, on peut parfaitement avoir des préférences qui sont toutes à pic
unique et apparition de cycles majoritaires.
II Théorème du chaos
De façon générale, sauf si l’on impose des restrictions très improbables sur les
fonctions d’utilité des électeurs et/ou sur leur distribution, il n’existe pas de preferenceinduced
equilibrium. En d’autres termes, l’ensemble de Condorcet est vide.
Cela n’exclut toutefois pas que les cycles majoritaires puissent se limiter à une « petite
zone centrale ». Une telle éventualité a été évoquée en 1967 par Gordon Tullock 42 . Cette
« conjecture de Tullock » correspond à une situation semblable à celle de figure 2-8.
L’électorat est composé de N d’électeurs, dont les bliss points (non représentés pour des
questions de lisibilité de la figure) sont X 1 , X 2 et X 3 ,…, X N . Compte tenu de la position de ces
différents bliss points, on suppose que le programme A est d’abord battu à la majorité par B.
B est battu à son tour par C, qui est battu par D, etc. Cependant, bien qu’il n’y ait pas de
convergence vers un point particulier (qu’il n’existe pas de vainqueur de Condorcet), les
programmes qui remportent les votes successifs restent tous situés dans une zone relativement
restreinte. Si l’on se trouve effectivement dans ce cas de figure, le coût social de l’instabilité
liée à la présence de majorités cycliques (et donc au paradoxe de Condorcet) sera
42 Cf. Tullock G. (1967a), Toward a Mathematics of Politics, Ann Arbor : University of Michigan Press,
Tullock G. (1967b), « The General Irrelevance of the General Possibility Theorem », Quareterly Journal of
Economics, 81 (May) : 256-270. Le concept d’ensemble non recouvert (uncovered set), dû à N.R. Miller - voir
supra – est un prolongement de l’idée de Tullock. Sur ce point, cf. Miller N.R. (1980), « A New Solution Set
for Tournaments and Majority Voting : Further Graph-Theoretical Approaches to the Theory of Voting »,
American Journal of Political Science, 24 (February) : 68-96, et Miller N.R. (1983), « The Covering Relation
in Tournaments : Two Corrections », American Journal of Political Science, 27 (May) : 382-385.
75
vraisemblablement très faible : il n’y a pas de vainqueur indiscutable mais tous les
programmes qui sont susceptibles de l’emporter à un moment ou un autre sont très proches. .
G 2
E
•
D
• F
•
A
• •
C
• •
B
•
O
G 1
Figure 2-8 : Cycles dans une zone centrale - Tullock(1976))
Malheureusement, selon la démonstration effectuée Richard Mckelvey en 1976, la
« zone centrale » envisagée par Gordon Tullock n’existe pas. En d’autres termes, en
l’absence d’hypothèses restrictives supplémentaires, la « conjecture de Tullock » est inexacte.
Il est toujours possible de trouver une séquence de votes telle que n’importe quel point du
domaine des possibles peut battre n’importe quel autre point (dans la figure 2-8, le domaine
des possibles est le quadrant positif, dans la mesure où G1 et G2 sont des « dépenses » - dont
la valeur est donc nécessairement positive). Quand la règle de majorité fonctionne mal, quand
il n’y a pas de vainqueur de Condorcet et donc pas de transitivité dans les choix collectifs, on
peut obtenir n’importe quel résultat (« [once] transitivity breaks down, it completely breaks
down ») 43 .
43 p.$$$ in McKelvey R.(1976), « Intransitivities in Multidimensional Voting Models and Some Implications for
Agenda Control », Journal of Economic Theory, 12 (June) : 472-482. Cf. également McKelvey R. (1979),
« General Conditions for Global Intransitivities in Formal Voting Models », Econometrica, 47 : 1085-1111, et
Schofield N. (1978), « Instability of Simple Dynamic Games », Review of Economic Studies, 45 (October) : 575-
594. Ce dernier auteur a obtenu de façon indépendante un résultat semblable à celui de McKelvey, en montrant
que, sauf si les préférences individuelles sont très proches, les choix sociaux ont de très fortes chances d’être
cycliques. Se reporter également à Schofield N. (1986), Social Choice and Democracy, Berlin : Springer-Verlag.
76
La figure 2-9 présente une démonstration graphique du théorème du chaos dans le cas
d’un système à deux dimensions G 1 et G 2 et trois électeurs (1, 2 et 3). Le point de départ est le
point A (correspondant à une option ou à un programme donné). Ce point a deux
particularités :
(1) il fait partie de l’ensemble des optima parétiens (comme tout point situé à
l’intérieur du triangle X 1 , X 2 , X 3 ) ;
(2) il est unanimement préféré au point B. A, qui domine très fortement B au sens de
Pareto, l’emporte par 3 voix à zéro en cas de duel à la majorité entre A et B.
Les électeurs 1 et 3 sont indifférents entre A et son symétrique A’ par rapport au
segment X 1 X 3 . Par conséquent le point A 1 , légèrement plus proche des bliss points de 1 et 3,
sera préféré à la majorité (par 1 et 3) à A’ et donc à A.
De même, les électeurs 1 et 2 sont indifférents entre A 1 et son symétrique A 1 ’ par
rapport au segment X 1 X 2 . Par conséquent le point A 2 , légèrement plus proche des bliss points
de 1 et 2, sera préféré à la majorité (par 1 et 2) à A 1 ’ et donc à A 1 .
Pour des raisons similaires, le point A 3 , légèrement plus proche des bliss points de 2 et
3, sera préféré à la majorité (par 2 et 3) à A 2 ’ et donc à A 2 .
En répétant cette procédure un nombre suffisant de fois, on est toujours en mesure
d’atteindre un point A H tel que :
B f A H f A H-1 f … f A 3 f A 2 f A 1 f A
(f signifiant « préféré à la majorité des voix à »)
Dans le cas de la figure 2-9, une séquence de quatre votes par pair est suffisante pour
que B sorte vainqueur contre A (vote 1 : entre A et A 1 , puis vote 2 : entre le vainqueur A 1 et
A 2 , puis vote 3 : entre le vainqueur A 2 et A 3 , puis vote 4 : entre le vainqueur A 3 et B). Et cela
en dépit du fait que, dans un duel direct, A l’emporte sur B par trois voix contre zéro!
Le théorème de McKelvey a deux conséquences importantes :
(1) le pouvoir de celui qui décide de l’organisation des votes (agenda-setting), c'est-àdire
des options entre lesquelles il faut choisir et de l’ordre dans lequel il convient de le faire,
peut être considérable. Il est important de s’assurer que ce pouvoir, quand il est confié à un
individu ou à un comité restreint, n’est pas l’objet de manipulations destinées à obtenir une
répartition inéquitable des gains procurés par les décisions collectives ;
(2) la possibilité de remettre en cause tout résultat et d’aboutir à des choix
radicalement différents peut être une source d’imprévisibilité et d’instabilité chronique des
77
systèmes électoraux.
Certains auteurs, notamment W. Riker (1982), ont insisté sur le caractère très
destructeur du théorème de McKelvey, dans la mesure où il permet de douter de la stabilité
ou même de l’existence d’un équilibre de long terme dans les systèmes démocratiques 44 . Si
tel est le cas, les mêmes causes peuvent alors aussi bien provoquer des changements
« catastrophiques » que des modifications « incrémentales »… les équilibres atteints, s’ils
existent peuvent dépendre fortement des trajectoires empruntées. Enfin, l’absence d’équilibre
est parfaitement incompatible avec l’existence de longues périodes de stabilité apparente. La
seule différence est que ces périodes peuvent être suivies, à tout moment et sans raison
particulière, de périodes de perturbations sociales et de révoltes très profondes.
Jusqu’à quel point peut-on faire confiance aux conclusions théoriques précédentes Il
existe en effet un contraste surprenant entre ce que suggère la théorie (c'est-à-dire une quasipermanence
de cycles, de manipulations des ordres du jour et de remise en cause des choix
effectués) et la grande stabilité des résultats observés dans la pratique, au moins dans les
démocraties des pays développées. Les explications possibles de ce paradoxe sont examinées
dans la section I du chapitre III.
44 Cf. Riker W. (1982) Liberalism against Populism, A Confrontation Between the Theory of
Democracy and the Theory of Social Choice, San Francisco: Freeman.
78
A’ 3
G 2
B
A’
A 1
X 3 A’ 2
A 3
A
X 1
A 2
X 2
A’ 1
O
G 1
Figure 2-9 : Théorème du chaos (McKelvey (1976))
79
III Théorème d’impossibilité
N’est pas au programme de l’examen
Chapitre III : Démocratie représentative et comportement des partis
politiques
N’est pas au programme de l’examen
Section I : Compétition politique dans un système bipartite
A) Analyse déterministe
I Convergence des programmes
II Comportements d’abstention
III Persistance des cycles
IV Contrainte dans l’espace des politiques possibles
B) Analyse probabiliste
C) Déterminants empiriques du vote
Section II : Théorie des systèmes multipartites
A) Règles de représentation et nombre de partis à l’équilibre
B) Théorie des coalitions
C) Nombre de partis et effecicacité des systèmes politiques
Chapitre IV : Les modèles politico-économiques
A) Les comportement des responsables politiques
B) Le comportement de l’administration publique
C) Le comportement des groupes d’intérêt
D) Les interactions entre économie et politique
80