12.07.2015 Views

Comparaisons multidimensionnelles de bien-être et de pauvreté ...

Comparaisons multidimensionnelles de bien-être et de pauvreté ...

Comparaisons multidimensionnelles de bien-être et de pauvreté ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

YÉLÉ MAWEKI BATANA<strong>Comparaisons</strong> <strong>multidimensionnelles</strong> <strong>de</strong> <strong>bien</strong>-<strong>être</strong> <strong>et</strong> <strong>de</strong>pauvr<strong>et</strong>é : métho<strong>de</strong>s, inférence <strong>et</strong> applicationsThèse présentéeà la Faculté <strong>de</strong>s étu<strong>de</strong>s supérieures <strong>de</strong> l’Université Lavaldans le cadre du programme <strong>de</strong> doctorat Économiquepour l’obtention du gra<strong>de</strong> <strong>de</strong> Philosophiae Doctor (Ph.D)FACULTÉ DES SCIENCES SOCIALESUNIVERSITÉ LAVALQUÉBECMai 2008c○Yélé Maweki Batana, 2008


RésuméL’objectif <strong>de</strong> c<strong>et</strong>te thèse est <strong>de</strong> proposer une démarche statistique adéquate pour réaliser<strong>de</strong>s comparaisons robustes en <strong>bien</strong>-<strong>être</strong> lorsqu’on traite <strong>de</strong> distributions multivariées. Aprèsune revue critique <strong>de</strong>s inférences statistiques basées sur <strong>de</strong>s hypothèses composites, la formulation<strong>de</strong> type intersection-union a été r<strong>et</strong>enue pour établir <strong>de</strong>s comparaisons robustes <strong>et</strong>univoques en termes <strong>de</strong> dominance stricte. Davidson <strong>et</strong> Duclos (2006) proposent dans cesens, une métho<strong>de</strong> basée sur le ratio <strong>de</strong> vraisemblance empirique pour tester la dominancestochastique dans le contexte <strong>de</strong> distributions univariées. C<strong>et</strong>te métho<strong>de</strong> est étendue ici auxdistributions multivariées, ce qui, dans le cadre <strong>de</strong> l’analyse <strong>de</strong> la pauvr<strong>et</strong>é <strong>et</strong> du <strong>bien</strong>-<strong>être</strong>,concor<strong>de</strong> avec l’évolution récente <strong>de</strong> la littérature qui favorise l’usage <strong>de</strong> plusieurs dimensionspour étudier la répartition du <strong>bien</strong>-<strong>être</strong>.Un premier exercice consiste à analyser les performances d’une démarche proposée dansle contexte bidimensionnel. La démarche, basée sur la maximisation d’une fonction <strong>de</strong> vraisemblanceempirique, teste l’hypothèse nulle <strong>de</strong> non dominance contre l’alternative <strong>de</strong> dominance.La statistique <strong>de</strong> test est pivotale, ce qui perm<strong>et</strong> <strong>de</strong> réaliser <strong>de</strong>s simulations <strong>de</strong> MonteCarlo pour étudier le niveau <strong>et</strong> la puissance <strong>de</strong>s tests asymptotiques <strong>et</strong> <strong>de</strong> bootstrap.Une fois les performances du test jugées acceptables, <strong>de</strong>s applications sont réalisées pouranalyser les relations <strong>de</strong> dominance stochastique en pauvr<strong>et</strong>é entre quelques pays africains.Pour définir les distributions, les <strong>de</strong>ux dimensions considérées sont le statut nutritionnel <strong>et</strong>un indice <strong>de</strong> richesse estimé par les métho<strong>de</strong>s d’analyse factorielle à partir <strong>de</strong> données EDS(Enquêtes démographie <strong>et</strong> santé).


RésuméiiiUn troisième vol<strong>et</strong> consiste à considérer le cas où l’une <strong>de</strong>s <strong>de</strong>ux dimensions <strong>de</strong> la distributionest une variable discrète. L’on teste alors <strong>de</strong>s relations <strong>de</strong> dominance stochastiqueséquentielle en <strong>bien</strong>-<strong>être</strong> <strong>et</strong> en pauvr<strong>et</strong>é, en utilisant une démarche statistique analogue à celledu chapitre précé<strong>de</strong>nt.Enfin, un <strong>de</strong>rnier exercice analyse le phénomène <strong>de</strong> la mobilité qui constitue un aspectdynamique <strong>de</strong> la distribution <strong>de</strong> <strong>bien</strong>-<strong>être</strong>. Des conditions <strong>de</strong> dominance stochastique en mobilitéau premier <strong>et</strong> au second ordre sont dérivées <strong>et</strong> <strong>de</strong>s tests sont à nouveau réalisés sousl’hypothèse nulle <strong>de</strong> non dominance contre l’alternative <strong>de</strong> dominance. L’application est faiteà partir <strong>de</strong>s données américaines du PSID (Panel Studies of Income Dynamics).


AbstractThe main objective of this thesis is to purpose a suitable statistical m<strong>et</strong>hod for comparingwelfare when we <strong>de</strong>al with multivariate distributions. After a critical literature review onstatistical inference based composite hypotheses, the intersection-union (IU) type of formulationhas been r<strong>et</strong>ained for making unambiguous robust comparisons in the sense of strictstochastic dominance. Davidson and Duclos (2006) suggest in this way, a m<strong>et</strong>hod using theempirical likelihood ratio for testing the stochastic dominance in the univariate distributionscontext. This m<strong>et</strong>hod is exten<strong>de</strong>d by this thesis to the multivariate distribution, which is inphase with the recent literature on poverty and welfare analysis that advocates the use ofseveral dimensions to measure the welfare.The first chapter consists in analyzing the performances of the suggested m<strong>et</strong>hod in bidimensionalcontext. This m<strong>et</strong>hod, based on the maximization of an empirical likelihoodfunction, tests for the null hypothesis of non dominance against the alternative of dominance.The test statistic is pivotal, which enable to perform Monte Carlo simulations for analyzingthe size and the power of asymptotic and bootstrap tests.Once the test performances judged satisfactory, illustrations are ma<strong>de</strong> to study the stochasticdominance relations in poverty b<strong>et</strong>ween some African countries. Two dimensions areconsi<strong>de</strong>red for drawing the bivariate distributions : The nutritional status and an ass<strong>et</strong> in<strong>de</strong>x<strong>de</strong>rived from factor analysis m<strong>et</strong>hods using DHS (Demography and Health Surveys) data.The third chapter consists in consi<strong>de</strong>ring the case where one of the two dimensions is adiscr<strong>et</strong>e variable. We then test for the sequential stochastic dominance relations in welfare


Abstractvand poverty, by using a statistical process similar to the one of the previous chapter.Finally, a last chapter analyzes the mobility concept which is the dynamic aspect of thewelfare distribution. The first and second-or<strong>de</strong>r conditions of stochastic dominance in mobilityare <strong>de</strong>rived and several tests are performed un<strong>de</strong>r the null hypothesis of non dominanceagainst the alternative of dominance. Some illustrations are done using the USA PSID (PanelStudies of Income Dynamics) data.


Avant-proposJe tiens avant tout à remercier mon directeur <strong>de</strong> thèse Jean-Yves Duclos pour avoir accepté<strong>de</strong> me diriger. Sa disponibilité, sa rigueur scientifique <strong>et</strong> ses encouragements m’ont disposé àréaliser c<strong>et</strong>te thèse dans <strong>de</strong> bonnes conditions.Je remercie également mon co-directeur John Cockburn pour son implication <strong>et</strong> ses suggestionsqui ont permis d’améliorer le travail.Mes étu<strong>de</strong>s ont été rendues possibles grâce au soutien financier <strong>de</strong> l’ACDI (Agence Canadienne<strong>de</strong> Développement International) dans le cadre du Programme Canadien <strong>de</strong> Bourse <strong>de</strong>la Francophonie (PCBF). Qu’elle trouve ici l’expression <strong>de</strong> mes remerciements. Mes remerciementsvont également au PEP (Politiques Économiques <strong>et</strong> Pauvr<strong>et</strong>é) <strong>et</strong> au CIRPÉE (CentreInteruniversitaire sur le Risque, les Politiques Économiques <strong>et</strong> l’Emploi) qui m’ont soutenuà divers moments <strong>de</strong> ma rédaction, rendant possible ma participation à plusieurs conférencesau Canada <strong>et</strong> à l’étranger.Je remercie les enseignants du département pour la qualité <strong>de</strong> l’enseignement reçu, ce quinous a adéquatement préparé à la rédaction <strong>de</strong> c<strong>et</strong>te thèse.Je remercie également tous les collègues du département <strong>et</strong> particulièrement Guy Muhindoavec qui j’ai eu plusieurs discussions fructueuses dans le cadre <strong>de</strong> mon travail.Je remercie enfin toute ma famille pour le soutien <strong>et</strong> les encouragements qu’elle m’atémoignés.


Je dédie c<strong>et</strong>te thèse à la mémoire <strong>de</strong> mon père Mathieu <strong>et</strong><strong>de</strong> mon frère David.


Table <strong>de</strong>s matièresRésuméAbstractAvant-proposTable <strong>de</strong>s matièresListe <strong>de</strong>s tableauxTable <strong>de</strong>s figuresiiivviviiixiixiv1 Introduction 12 Mesures <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle <strong>et</strong> inférences statistiques 42.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42.2 Les mesures <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle . . . . . . . . . . . . . . . . 62.2.1 Les approches non-axiomatiques . . . . . . . . . . . . . . . . . . . . 62.2.2 Les approches axiomatiques . . . . . . . . . . . . . . . . . . . . . . 112.3 Inférences statistiques <strong>et</strong> dominance stochastique . . . . . . . . . . . . . . . 202.3.1 Les tests d’union-intersection <strong>et</strong> alternatives . . . . . . . . . . . . . . 202.3.2 Les tests d’intersection-union <strong>et</strong> alternatives . . . . . . . . . . . . . . 292.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32Bibliographie 343 Tests <strong>de</strong> comparaisons <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle 42


Table <strong>de</strong>s matièresix3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 423.2 La dominance stochastique multidimensionnelle . . . . . . . . . . . . . . . . 453.2.1 La dominance <strong>de</strong> premier ordre . . . . . . . . . . . . . . . . . . . . 463.2.2 La dominance stochastique d’ordre supérieur . . . . . . . . . . . . . 473.3 Les métho<strong>de</strong>s d’estimation . . . . . . . . . . . . . . . . . . . . . . . . . . . 483.3.1 Le ratio <strong>de</strong> vraisemblance empirique . . . . . . . . . . . . . . . . . . 483.3.2 Les procédures <strong>de</strong> test . . . . . . . . . . . . . . . . . . . . . . . . . 523.4 Simulations <strong>de</strong> Monte Carlo . . . . . . . . . . . . . . . . . . . . . . . . . . 533.4.1 Métho<strong>de</strong>s <strong>de</strong> génération <strong>de</strong>s données . . . . . . . . . . . . . . . . . . 533.4.2 Résultats <strong>de</strong>s simulations . . . . . . . . . . . . . . . . . . . . . . . . 553.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 603.6 Annexes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61Bibliographie 634 Dominance en pauvr<strong>et</strong>é multidimensionnelle 684.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 684.2 Estimation <strong>de</strong>s indicateurs <strong>de</strong> pauvr<strong>et</strong>é . . . . . . . . . . . . . . . . . . . . . 704.2.1 Le calcul <strong>de</strong> l’indicateur nutritionnel . . . . . . . . . . . . . . . . . . 704.2.2 L’estimation <strong>de</strong> l’indicateur <strong>de</strong> la richesse . . . . . . . . . . . . . . . 714.3 Analyse <strong>de</strong> la dominance stochastique bidimensionnelle . . . . . . . . . . . . 744.3.1 La dominance <strong>de</strong> premier ordre . . . . . . . . . . . . . . . . . . . . 754.3.2 La dominance stochastique d’ordre supérieur . . . . . . . . . . . . . 774.3.3 Inférence statistique . . . . . . . . . . . . . . . . . . . . . . . . . . 784.4 Analyse empirique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 814.4.1 Les données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 814.4.2 Résultats <strong>de</strong>s tests <strong>de</strong> dominance . . . . . . . . . . . . . . . . . . . . 824.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 854.6 Annexes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 874.6.1 Annexe : La métho<strong>de</strong> NBS . . . . . . . . . . . . . . . . . . . . . . . 874.6.2 Annexe : Inférence sur la dominance d’ordres supérieurs . . . . . . . 89


Table <strong>de</strong>s matièresx4.6.3 Annexe : Les principaux tableaux . . . . . . . . . . . . . . . . . . . 90Bibliographie 945 Inférence statistique en dominance stochastique 975.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 975.2 Dominance stochastique en <strong>bien</strong>-<strong>être</strong> . . . . . . . . . . . . . . . . . . . . . . 985.3 Dominance stochastique en pauvr<strong>et</strong>é . . . . . . . . . . . . . . . . . . . . . . 1015.4 Métho<strong>de</strong> d’inférence statistique . . . . . . . . . . . . . . . . . . . . . . . . . 1055.5 Résultats empiriques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1105.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1155.7 Annexes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1165.7.1 Annexe : Preuve <strong>de</strong> la proposition 4 . . . . . . . . . . . . . . . . . . 1165.7.2 Annexe : Preuve <strong>de</strong> la proposition 5 . . . . . . . . . . . . . . . . . . 1175.7.3 Annexe : Principaux tableaux . . . . . . . . . . . . . . . . . . . . . 119Bibliographie 1246 Tests <strong>de</strong> dominance stochastique en mobilité 1266.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1266.2 Mesures <strong>de</strong> mobilité <strong>et</strong> dominance stochastique . . . . . . . . . . . . . . . . 1296.2.1 Les mesures <strong>de</strong> mobilité absolue . . . . . . . . . . . . . . . . . . . . 1306.2.2 Les mesures basées sur les matrices <strong>de</strong> transition . . . . . . . . . . . 1346.3 Les métho<strong>de</strong>s d’inférence statistique . . . . . . . . . . . . . . . . . . . . . . 1416.3.1 L’inférence sur les mesures <strong>de</strong> mobilité absolue . . . . . . . . . . . . 1416.3.2 L’inférence sur les matrices <strong>de</strong> transition . . . . . . . . . . . . . . . 1456.4 Résultats empiriques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1486.4.1 La mobilité absolue . . . . . . . . . . . . . . . . . . . . . . . . . . . 1496.4.2 Les matrices <strong>de</strong> transition . . . . . . . . . . . . . . . . . . . . . . . 1516.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1556.6 Annexes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156


Table <strong>de</strong>s matièresxi6.6.1 Annexe : Mobilité d’échange . . . . . . . . . . . . . . . . . . . . . . 1566.6.2 Annexe : Mobilité avec croissance . . . . . . . . . . . . . . . . . . . 157Bibliographie 1587 Conclusion 162


Liste <strong>de</strong>s tableaux3.1 Probabilités <strong>de</strong> rej<strong>et</strong> <strong>de</strong>s tests asymptotiques en l’absence <strong>de</strong> corrélation . . . 613.2 Probabilités <strong>de</strong> rej<strong>et</strong> <strong>de</strong>s tests asymptotiques en présence <strong>de</strong> corrélation . . . . 613.3 Puissances <strong>de</strong>s tests asymptotiques en l’absence <strong>de</strong> corrélation . . . . . . . . 623.4 Puissances <strong>de</strong>s tests asymptotiques en présence <strong>de</strong> corrélation . . . . . . . . . 623.5 Probabilités <strong>de</strong> rej<strong>et</strong> <strong>de</strong>s tests <strong>de</strong> bootstrap . . . . . . . . . . . . . . . . . . . 623.6 Puissances <strong>de</strong>s tests <strong>de</strong> bootstrap . . . . . . . . . . . . . . . . . . . . . . . . 624.1 Principales caractéristiques <strong>de</strong>s enquêtes EDS . . . . . . . . . . . . . . . . . 904.2 Statistiques <strong>de</strong>scriptives <strong>de</strong> l’indice <strong>de</strong> richesse (X) . . . . . . . . . . . . . . 914.3 Statistiques <strong>de</strong>scriptives <strong>de</strong> l’indicateur nutritionnel (Z_score) . . . . . . . . 914.4 Analyse <strong>de</strong> sensibilité <strong>de</strong> l’indice <strong>de</strong> richesse X à travers <strong>de</strong>s quartiles . . . . 914.5 Corrélation entre les indices <strong>de</strong> richesse <strong>de</strong>s <strong>de</strong>ux approches . . . . . . . . . 924.6 Tests <strong>de</strong> dominance stochastique <strong>de</strong> premier ordre, pays F versus pays G . . 924.7 Tests <strong>de</strong> dominance stochastique <strong>de</strong> premier ordre, zone rurale versus zoneurbaine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 934.8 Tests <strong>de</strong> dominance stochastique d’ordres supérieurs, pays F versus pays G . 935.1 Tests <strong>de</strong> dominance restreinte <strong>de</strong> premier ordre, avec taille du ménage commeindicateur discr<strong>et</strong> . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1195.2 Surface <strong>de</strong> dominance <strong>de</strong> second ordre présentant les statistiques LR, Malivs Côte d’Ivoire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1205.3 Surface <strong>de</strong> dominance <strong>de</strong> second ordre présentant les statistiques LR, Togovs Mali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121


Liste <strong>de</strong>s tableauxxiii5.4 Tests <strong>de</strong> dominance <strong>de</strong> premier ordre, avec lieu <strong>de</strong> rési<strong>de</strong>nce comme indicateurdiscr<strong>et</strong> . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1225.5 Tests <strong>de</strong> dominance restreinte <strong>de</strong> second ordre avec, lieu <strong>de</strong> rési<strong>de</strong>nce commeindicateur discr<strong>et</strong> . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1225.6 Tests <strong>de</strong> dominance <strong>de</strong> premier ordre, avec le niveau d’éducation comme indicateurdiscr<strong>et</strong> . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1236.1 Résultats <strong>de</strong>s tests statistiques sur les courbes <strong>de</strong> Lorenz généralisé . . . . . . 1506.2 Résultats <strong>de</strong>s tests statistiques sur les courbes <strong>de</strong> l’approche Mitra <strong>et</strong> Ok . . . 1516.3 Résultats <strong>de</strong> la dominance <strong>de</strong> premier ordre dans le cas <strong>de</strong> croissance . . . . . 1526.4 Résultats <strong>de</strong> la dominance non restreinte <strong>de</strong> second ordre pour les <strong>de</strong>ux cas . . 1536.5 Résultats <strong>de</strong> la dominance restreinte (aux 4 premières classes) <strong>de</strong> secondordre pour les <strong>de</strong>ux cas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154


Table <strong>de</strong>s figures2.1 Définitions d’union, d’intersection <strong>et</strong> intermédiaire du seuil <strong>de</strong> pauvr<strong>et</strong>é . . . 133.1 Probabilités <strong>de</strong> rej<strong>et</strong> <strong>de</strong>s tests asymptotiques . . . . . . . . . . . . . . . . . . 563.2 Probabilités <strong>de</strong> rej<strong>et</strong> <strong>de</strong>s tests asymptotiques <strong>et</strong> <strong>de</strong> bootstrap . . . . . . . . . . 573.3 Probabilités <strong>de</strong> rej<strong>et</strong> comparées <strong>de</strong>s cas <strong>de</strong> non-corrélation <strong>et</strong> <strong>de</strong> corrélation . 573.4 Courbes <strong>de</strong> puissances <strong>de</strong>s tests asymptotiques <strong>et</strong> <strong>de</strong> bootstrap . . . . . . . . 583.5 Courbes <strong>de</strong> puissances comparées <strong>de</strong>s cas <strong>de</strong> non-corrélation <strong>et</strong> <strong>de</strong> corrélation 593.6 Configuration alternative,lorsque les distributions se touchent en <strong>de</strong>ux points . 604.1 Définitions d’union, d’intersection <strong>et</strong> intermédiaire du seuil <strong>de</strong> pauvr<strong>et</strong>é . . . 764.2 Diagramme <strong>de</strong> dominance entre les pays <strong>de</strong> L’UEMOA . . . . . . . . . . . . 844.3 Diagrammes <strong>de</strong> dominance selon la localisation . . . . . . . . . . . . . . . . 855.1 Diagramme <strong>de</strong> dominance séquentielle entre les pays <strong>de</strong> L’UEMOA, avec lataille du ménage comme indicateur discr<strong>et</strong> . . . . . . . . . . . . . . . . . . . 1125.2 Diagramme <strong>de</strong> dominance séquentielle entre les pays <strong>de</strong> L’UEMOA, avec lelieu <strong>de</strong> rési<strong>de</strong>nce comme indicateur discr<strong>et</strong> . . . . . . . . . . . . . . . . . . . 1135.3 Diagramme <strong>de</strong> dominance séquentielle entre les pays <strong>de</strong> L’UEMOA, avec leniveau d’éducation comme indicateur discr<strong>et</strong> . . . . . . . . . . . . . . . . . 1146.1 Différences entre les courbes <strong>de</strong> Lorenz généralisé . . . . . . . . . . . . . . . 1496.2 Différence entre les courbes <strong>de</strong> l’approche Mitra <strong>et</strong> Ok . . . . . . . . . . . . 150


Chapitre 1IntroductionC<strong>et</strong>te thèse vise à comparer <strong>de</strong> manière statistiquement <strong>et</strong> normativement robuste le <strong>bien</strong><strong>être</strong>,conçu comme un phénomène multidimensionnel. Elle s’appuie au départ sur un test <strong>de</strong>ratio <strong>de</strong> vraisemblance empirique proposé par Davidson <strong>et</strong> Duclos (2006) pour comparer <strong>de</strong>uxdistributions univariées en terme <strong>de</strong> dominance stochastique. La démarche poursuivie ici estd’étendre c<strong>et</strong>te métho<strong>de</strong> aux distributions multivariées <strong>et</strong> <strong>de</strong> l’appliquer à certains aspectsdu <strong>bien</strong>-<strong>être</strong> comme la pauvr<strong>et</strong>é <strong>et</strong> la mobilité. La thèse se compose essentiellement <strong>de</strong> cinqchapitres.Le chapitre 2 fait une revue <strong>de</strong> littérature sur les principales mesures <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle<strong>et</strong> sur les différents tests statistiques utiles pour réaliser <strong>de</strong>s comparaisonsrobustes entre distributions. On distingue tout d’abord <strong>de</strong>ux tendances dans les mesures <strong>de</strong>la pauvr<strong>et</strong>é multidimensionnelle, à savoir les approches non-axiomatiques <strong>et</strong> les approchesaxiomatiques. Les premières englobent entre autres les métho<strong>de</strong>s <strong>de</strong>s ensembles flous, <strong>de</strong> lafonction <strong>de</strong> distance, <strong>de</strong> la théorie <strong>de</strong> l’information <strong>et</strong> <strong>de</strong> l’inertie. Les secon<strong>de</strong>s sont plutôtune extension à <strong>de</strong>ux dimensions ou plus <strong>de</strong> certaines classes d’indices <strong>de</strong> pauvr<strong>et</strong>é proposéesdans le cadre unidimensionnel (Watts, 1968 ; Foster, Greer <strong>et</strong> Thorbecke, 1984 ; Foster <strong>et</strong>Shorrocks, 1991). On présente ensuite <strong>de</strong>s métho<strong>de</strong>s <strong>de</strong> dominance perm<strong>et</strong>tant <strong>de</strong> procé<strong>de</strong>r à<strong>de</strong>s comparaisons normativement robustes <strong>de</strong> pauvr<strong>et</strong>é multidimensionnelle. Une fois la mesure<strong>et</strong> les distributions déterminées, <strong>de</strong>s comparaisons en terme <strong>de</strong> dominance stochastique


Chapitre 1. Introduction 2nécessitent la formulation d’hypothèses composites. On distingue alors essentiellement lesformulations <strong>de</strong> type union-intersection (UI) <strong>et</strong> celle du type intersection-union (IU). L’analyse<strong>de</strong> la pertinence <strong>de</strong>s démarches généralement utilisées nous amènent à adopter l’approched’intersection-union proposée par Davidson <strong>et</strong> Duclos (2006).Le chapitre 3 évalue les performances d’une telle approche telle qu’étendue au cas bidimensionnel.La statistique <strong>de</strong> test, basée sur le ratio <strong>de</strong> vraisemblance empirique, perm<strong>et</strong> <strong>de</strong>tester l’hypothèse nulle <strong>de</strong> non dominance entre <strong>de</strong>ux distributions bivariées contre l’alternative<strong>de</strong> dominance. C<strong>et</strong>te formulation perm<strong>et</strong> <strong>de</strong> conclure sans equivoque à l’existence <strong>de</strong> ladominance lorsque l’hypothèse nulle est rej<strong>et</strong>ée. La procédure <strong>de</strong> test fournit <strong>de</strong>s probabilitésqui ren<strong>de</strong>nt possible le tirage d’échantillons <strong>de</strong> bootstrap selon un processus <strong>de</strong> génération <strong>de</strong>données qui satisfait l’hypothèse nulle <strong>de</strong> non dominance. La statistique <strong>de</strong> test est pivotale,ce qui perm<strong>et</strong> <strong>de</strong> réaliser <strong>de</strong>s simulations <strong>de</strong> Monte Carlo pour étudier les performances <strong>de</strong>stests asymptotiques <strong>et</strong> <strong>de</strong> bootstrap. Les résultats suggèrent la pertinence d’une telle démarchemême si la convergence est plus lente que dans le cas univarié à cause <strong>de</strong> la malédiction <strong>de</strong> ladimensionnalité. Les tests <strong>de</strong> bootstrap sur les statistiques pivotales produisent <strong>de</strong>s résultatsplus soli<strong>de</strong>s que les tests asymptotiques usuels.Le chapitre 4 est une extension empirique du chapitre précé<strong>de</strong>nt à quelques pays africains.Il analyse les relations <strong>de</strong> dominance <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle entre six pays <strong>de</strong>l’UEMOA. Deux dimensions sont considérées à savoir le statut nutritionnel <strong>et</strong> l’indice <strong>de</strong>richesse. L’indice <strong>de</strong> richesse est déterminé selon <strong>de</strong>ux métho<strong>de</strong>s d’analyse factorielle à partird’une série <strong>de</strong> variables qualitatives issues <strong>de</strong>s enquêtes DHS (Demography and HealthSurveys). La première métho<strong>de</strong> s’appuie sur l’analyse <strong>de</strong>s correspondances multiples (ACM)alors que la secon<strong>de</strong> se base sur la maximisation d’une fonction <strong>de</strong> vraisemblance <strong>et</strong> l’analysebayesienne. Les tests <strong>de</strong> bootstrap suggérés par les métho<strong>de</strong>s <strong>de</strong> maximisation <strong>de</strong> la vraisemblanceempirique perm<strong>et</strong>tent d’i<strong>de</strong>ntifier l’existence <strong>de</strong> dominance entre plusieurs pays <strong>de</strong>l’union, soit 12 relations sur les 15 possibles. Par ailleurs, la pauvr<strong>et</strong>é apparaît plus importanteen milieu rural qu’urbain. Les résultats ten<strong>de</strong>nt à confirmer certaines relations établiesdans le cadre univarié.


Chapitre 1. Introduction 3Le chapitre 5 considère <strong>de</strong>ux dimensions, comme dans le chapitre précé<strong>de</strong>nt, mais à ladifférence qu’une dimension est discrète. Le problème est alors reconsidéré en terme <strong>de</strong> dominancestochastique séquentielle multidimensionnelle. L’on formule les conditions <strong>de</strong> dominanceen <strong>bien</strong>-<strong>être</strong> <strong>et</strong> en pauvr<strong>et</strong>é où la dimension continue est représentée par l’indice <strong>de</strong>richesse calculé par les métho<strong>de</strong>s d’analyse factorielle sur les données DHS. Pour la dimensiondiscrète, trois indicateurs sont successivement considérés à savoir la taille du ménage,le lieu <strong>de</strong> rési<strong>de</strong>nce <strong>et</strong> le niveau d’éducation. Les tests <strong>de</strong> bootstrap révèlent l’existence <strong>de</strong>quelques relations <strong>de</strong> dominance séquentielles en <strong>bien</strong>-<strong>être</strong>.Le chapitre 6, quant à lui, abor<strong>de</strong> plutôt un aspect dynamique <strong>de</strong> la distribution <strong>de</strong> <strong>bien</strong><strong>être</strong>.Il s’agit notamment du concept <strong>de</strong> mobilité <strong>de</strong>s revenus. Ce chapitre propose une application<strong>de</strong>s tests <strong>de</strong> dominance stochastique à la mobilité. On constitue quatre pério<strong>de</strong>s <strong>de</strong>mobilité (1970-75, 1975-80, 1980-85, 1985-90) construites à partir <strong>de</strong>s données PSID (PanelStudies of Income Dynamics) <strong>de</strong>s USA. Deux types <strong>de</strong> mesures généralement utiliséesdans la littérature <strong>de</strong> la mobilité sont considérés, notamment les mesures <strong>de</strong> mobilité absolue<strong>et</strong> celles utilisant les matrices <strong>de</strong> transition. Après avoir dérivé les conditions <strong>de</strong> dominancestochastique en mobilité au premier <strong>et</strong> au second ordres, <strong>de</strong>s tests statistiques sont réaliséssous l’hypothèse nulle <strong>de</strong> non dominance contre l’alternative <strong>de</strong> dominance. Les analysesmontrent l’existence <strong>de</strong> quelques relations <strong>de</strong> dominance, mais seulement peu d’entre ellesse sont avérées significatives.


Chapitre 2Mesures <strong>de</strong> la pauvr<strong>et</strong>émultidimensionnelle <strong>et</strong> inférencesstatistiques2.1 IntroductionComparer le <strong>bien</strong>-<strong>être</strong> <strong>et</strong> la pauvr<strong>et</strong>é peut se révéler utile pour analyser les politiques <strong>de</strong>développement, notamment celles qui visent à alléger la pauvr<strong>et</strong>é. Il peut également perm<strong>et</strong>tred’établir <strong>de</strong>s priorités <strong>de</strong> développement, dépendamment <strong>de</strong>s différences observéesentre pays <strong>et</strong> entre régions. Ces préoccupations sont en phase avec les principaux Objectifsdu Millénaire pour le développement (OMD) qui sont entre autres <strong>de</strong> réduire l’extrêmepauvr<strong>et</strong>é, <strong>de</strong> rendre l’éducation primaire universelle, d’améliorer la santé (réduction <strong>de</strong> lamortalité infantile, amélioration <strong>de</strong> la santé maternelle, lutte contre le VIH/sida, le paludisme<strong>et</strong> les autres maladies), <strong>et</strong>c.Pour comparer la pauvr<strong>et</strong>é, il faut au préalable en déterminer la mesure. Deux tendancessont généralement distinguées dans la littérature relative aux mesures <strong>de</strong> pauvr<strong>et</strong>é : celle baséesur l’aspect financier ou monétaire (Ravallion <strong>et</strong> Chen, 1997) <strong>et</strong> celle qui m<strong>et</strong> l’accentsur une définition beaucoup plus large que la simple considération monétaire (Drèze <strong>et</strong> Sen,1989 ; Sen, 1979 ; 1985 ; 1987). La première approche consiste à utiliser le revenu (dépenses)


Chapitre 2. Mesures <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle <strong>et</strong> inférences statistiques 5comme mesure <strong>de</strong> pauvr<strong>et</strong>é à l’ai<strong>de</strong> <strong>de</strong>s fonctions <strong>de</strong> <strong>bien</strong>-<strong>être</strong> utilitaristes. C<strong>et</strong>te approche essentiellementaxiomatique qui, au départ, était unidimensionnelle peut <strong>être</strong> facilement adaptéeà un cadre <strong>de</strong> pauvr<strong>et</strong>é multidimensionnelle. La secon<strong>de</strong> approche qui est basée sur lesbesoins fondamentaux <strong>et</strong> les facultés <strong>de</strong> Sen (1985, 1992) caractérise le <strong>bien</strong>-<strong>être</strong> comme unphénomène multidimensionnel. Sen (1992 ; 1995), dans c<strong>et</strong>te optique, suggère <strong>de</strong> mesurer le<strong>bien</strong>-<strong>être</strong> directement en observant les facultés <strong>de</strong>s individus <strong>et</strong> ménages, c’est-à-dire leurscapacités <strong>de</strong> se définir une vie plus ou moins décente. Les choix <strong>de</strong>s attributs à inclure dansl’évaluation <strong>et</strong> <strong>de</strong> leurs poids respectifs sont généralement dérivés <strong>de</strong> façon non-axiomatique<strong>et</strong> sont essentiellement basés sur le jugement <strong>de</strong> leur nature, <strong>de</strong> leur mérite relatif <strong>et</strong> <strong>de</strong> leurimportance (Klasen, 2000). Les approches <strong>de</strong> mesure particulière <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnellepeuvent alors <strong>être</strong> résumées en <strong>de</strong>ux : les approches non-axiomatiques <strong>et</strong> lesapproches axiomatiques. La section suivante fait une revue <strong>de</strong> ces principales mesures.La littérature suggère aussi d’effectuer <strong>de</strong>s tests <strong>de</strong> comparaisons robustes <strong>de</strong> la pauvr<strong>et</strong>é.Plutôt que d’effectuer <strong>de</strong>s tests ponctuels <strong>de</strong> la moyenne ou d’autres statistiques <strong>de</strong>scriptives<strong>de</strong> la distribution du revenu, les comparaisons se font alors en termes <strong>de</strong> dominance stochastique<strong>et</strong> sont basées sur <strong>de</strong>s hypothèses composites. En pareille circonstance, <strong>et</strong> dépendamment<strong>de</strong> la façon <strong>de</strong> formuler ces hypothèses, les tests usuels aussi <strong>bien</strong> paramétriques quenon paramétriques peuvent <strong>être</strong> appliqués alternativement avec <strong>de</strong>s tests d’union-intersection(UI) ou <strong>de</strong>s tests d’intersection-union (IU). La section 3 propose une revue <strong>de</strong> littérature surces tests <strong>et</strong> leurs variantes.La <strong>de</strong>rnière section conclut ce chapitre en proposant une métho<strong>de</strong> d’inférence ainsi qu’uneapproche <strong>de</strong> mesure <strong>de</strong> la pauvr<strong>et</strong>é pertinentes pour réaliser <strong>de</strong>s comparaisons robustes <strong>et</strong>satisfaisantes <strong>de</strong> <strong>bien</strong>-<strong>être</strong>.


Chapitre 2. Mesures <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle <strong>et</strong> inférences statistiques 62.2 Les mesures <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle2.2.1 Les approches non-axiomatiquesOn y distingue aussi <strong>bien</strong> les mesures basées sur les indicateurs agrégés <strong>de</strong> <strong>bien</strong>-<strong>être</strong> quecelles qui sont axées sur les données individuelles. Dans ce qui suit, on se focalise essentiellementsur la secon<strong>de</strong> catégorie 1 . On r<strong>et</strong>rouve notamment les mesures s’inspirant <strong>de</strong>s métho<strong>de</strong>s<strong>de</strong>s ensembles flous, celles exploitant la fonction <strong>de</strong> distance, celles faisant recours à la théorie<strong>de</strong> l’information <strong>et</strong> un ensemble d’autres mesures basées sur l’approche d’inertie.Les métho<strong>de</strong>s <strong>de</strong>s ensembles flousC<strong>et</strong>te théorie remonte à Za<strong>de</strong>h (1965) qui caractérise la classe <strong>de</strong>s ensembles flous comme“une classe avec un continuum <strong>de</strong> gra<strong>de</strong>s <strong>de</strong>s membres” 2 . En supposant un ensemble X, <strong>et</strong>soient x les éléments <strong>de</strong> c<strong>et</strong> ensemble, un sous-ensemble flou A <strong>de</strong> X est alors défini commeun ensemble <strong>de</strong> couples A = {x, M A (x)} ∀ x ∈ X où M A est une application <strong>de</strong> X dansl’intervalle [0, 1] appelée fonction <strong>de</strong> membre du sous-ensemble flou A. Elle représente end’autres termes, le <strong>de</strong>gré d’appartenance <strong>de</strong> l’élément x à A. Ainsi, si A est un sous-ensembleflou, alors on a : M A (x) = 0 si x n’est pas élément <strong>de</strong> A, M A (x) = 1 si x appartientcomplètement à A <strong>et</strong> 0 < M A (x) < 1 si x appartient partiellement à APlus M A se rapproche <strong>de</strong> 1 <strong>et</strong> plus le <strong>de</strong>gré d’appartenance est plus grand. Cerioli <strong>et</strong> Zani(1990) ont adopté ce concept pour mesurer la pauvr<strong>et</strong>é à travers leur approche <strong>de</strong>s ensemblesflous totaux. Ils prennent en compte un certain nombre <strong>de</strong> variables supposées mesurer unaspect particulier <strong>de</strong> la pauvr<strong>et</strong>é <strong>et</strong> définissent la fonction d’appartenance en distinguant troiscas à savoir : le cas <strong>de</strong> variables dichotomiques, le cas <strong>de</strong> variables polytomiques <strong>et</strong> celui <strong>de</strong>variables continues. Si le premier cas, qui concerne la possession ou non d’un <strong>bien</strong> durable, seréduit à une fonction d’appartenance classique, les <strong>de</strong>ux autres cas perm<strong>et</strong>tent <strong>de</strong> dériver <strong>de</strong>s1 Voir Bibi (2005) pour une revue <strong>de</strong>s mesures basées sur les indicateurs agrégés.2 Voir d’Ambrosio, Deutsch <strong>et</strong> Silber (2004) <strong>et</strong> Deutsch <strong>et</strong> Silber (2005) pour une revue détaillée.


Chapitre 2. Mesures <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle <strong>et</strong> inférences statistiques 7relations d’appartenance à <strong>de</strong>s classes <strong>de</strong> pauvres correspondant aux sous-ensembles flous.Plusieurs autres étu<strong>de</strong>s ont utilisé la même approche pour analyser les questions <strong>de</strong> <strong>bien</strong>-<strong>être</strong><strong>et</strong> <strong>de</strong> pauvr<strong>et</strong>é (Cheli <strong>et</strong> Lemmi, 1995 ; Chiappero, 2000 ; Maggio, 2004 ; Szeles, 2004 ; B<strong>et</strong>ti,Cheli, Lemmi <strong>et</strong> Pannuzi, 2005).L’approche <strong>de</strong> la fonction <strong>de</strong> distanceC<strong>et</strong>te approche s’inspire <strong>de</strong> la littérature sur la théorie <strong>de</strong> la production notamment surl’analyse <strong>de</strong> l’efficacité. Lovell, Richardson, Travers <strong>et</strong> Wood (1994) l’adoptent pour mesurerle <strong>bien</strong>-<strong>être</strong> tandis que Deutsch <strong>et</strong> Silber (2005) l’utilisent dans le cadre <strong>de</strong> l’analyse <strong>de</strong> lapauvr<strong>et</strong>é multidimensionnelle. An<strong>de</strong>rson, Crawford <strong>et</strong> Liecester (2005) définissent ce conceptcomme une approche qui cherche, en considérant une mesure <strong>de</strong> la distance entre un vecteur<strong>de</strong> <strong>bien</strong>s (ressourses <strong>et</strong> facultés) d’un individu <strong>et</strong> un vecteur <strong>de</strong> référence, à mesurer <strong>de</strong> quelmontant ajuster l’ensemble <strong>de</strong>s attributs <strong>de</strong> c<strong>et</strong> individu pour réaliser le niveau <strong>de</strong> <strong>bien</strong>-<strong>être</strong><strong>de</strong> référence. Analytiquement, la fonction <strong>de</strong> distance est exprimée comme suit :(x i , W ) ≡ mind{d : W (dx i ) = W ∗ , d > 0} , (2.1)où x i est un vecteur <strong>de</strong> caractéristiques <strong>de</strong> l’état <strong>de</strong> l’individu i, W la fonction <strong>de</strong> poids(<strong>bien</strong>-<strong>être</strong>) choisie, W ∗ la fonction <strong>de</strong> poids du niveau <strong>de</strong> référence tandis que d représentela mesure <strong>de</strong> la distance qui <strong>de</strong>vrait correspondre au montant <strong>de</strong> l’ajustement minimal à effectuerpour ramener l’état <strong>de</strong> l’individu au niveau <strong>de</strong> référence. Pour analyser le problème,Lovell <strong>et</strong> al (1994) <strong>et</strong> Deutsch <strong>et</strong> Silber (2005) utilisent comme mesure <strong>de</strong> <strong>bien</strong>-<strong>être</strong> une fonctiontranslog qui agrège l’ensemble <strong>de</strong>s caractéristiques <strong>de</strong> <strong>bien</strong>-<strong>être</strong> <strong>de</strong> chaque agent <strong>et</strong> ennormalisant par rapport à l’une d’elles. An<strong>de</strong>rson <strong>et</strong> al (2005) proposent une formulation généralequi ne nécessite pas le choix d’une fonction d’agrégation en particulier. Leur approches’appuie sur certaines propriétés générales <strong>de</strong> la fonction W telles que la monotonicité <strong>et</strong> laquasi-concavité pour dériver la borne inférieure <strong>de</strong> la mesure <strong>de</strong> distance du <strong>bien</strong>-<strong>être</strong> relatif


Chapitre 2. Mesures <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle <strong>et</strong> inférences statistiques 8comme suit :D (x i ) ≡ mind{d : W (dx i ) = W ∗ , d > 0, ∀ W monotone <strong>et</strong> quasi-concave} (2.2)Avec les propriétés <strong>de</strong> W , les ensembles <strong>de</strong>s niveaux <strong>de</strong> <strong>bien</strong>-<strong>être</strong> sont convexes par rapportà l’origine. Il est alors possible <strong>de</strong> dériver un ensemble convexe dont la limite inférieurequi est une courbe convexe inf (X) correspond au niveau <strong>de</strong> <strong>bien</strong>-<strong>être</strong> <strong>de</strong> l’individu <strong>de</strong> référence.Dans le cas où l’on analyse le problème <strong>de</strong> pauvr<strong>et</strong>é, c<strong>et</strong>te courbe peut-<strong>être</strong> interprétéecomme la frontière ”rawlsienne” puisqu’elle représente alors la frontière <strong>de</strong>s individus lesplus pauvres <strong>de</strong> la population.La théorie <strong>de</strong> l’information : les mesures d’entropieC<strong>et</strong>te théorie, originellement développée dans le domaine <strong>de</strong>s sciences <strong>de</strong> la communication,a été adaptée par Theil (1967) à l’économie. Maasoumi (1993) <strong>et</strong> Deutsch <strong>et</strong> Silber(2005) en exposent les principes <strong>de</strong> base. Soit P i = prob (x = x i ), i = 1, ..., n la probabilitéque le résultat d’une expérience soit x i avec 0 ≤ P i ≤ 1. On suppose alors une fonctiong (P i ) qui capte l’information générée par l’expérience comme une fonction <strong>de</strong> probabilité.Lorsque la probabilité a priori d’un évènement est élevée, on s’attend moins à une modification<strong>de</strong>s attentes par les résultats <strong>de</strong> l’expérience. Par exemple, si P k = 1 pour un k donné <strong>et</strong>P i = 0 pour les autres i ≠ k, alors la réalisation d’un évènement x k ne contient aucune information.Ainsi, on pose que g (.) est une fonction décroissante avec g (1) = 0 <strong>et</strong> g(0) → ∞.L’information anticipée d’une expérience est finalement définie par :H (P ) =n∑P i g (P i ) ≥ 0, P = (P 1 , ..., P n ) (2.3)i=1Maasoumi (1993) définit l’entropie comme la mesure <strong>de</strong> l’incertitu<strong>de</strong> ou <strong>de</strong> la volatilité


Chapitre 2. Mesures <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle <strong>et</strong> inférences statistiques 9associée à une variable aléatoire. Lorsque g (P i ) = − log P i , H (P ) est connu comme étantl’entropie <strong>de</strong> Shannon. Dans ce cas, pour un évènement sûr, par exemple P = (0, 1, 0, ..., 0),on a H (P ) = 0 alors que H (P ) = max H (P ) = log n pour <strong>de</strong>s évènements équiprobablesoù on a P i= 1 ∀i. On a alors : 0 ≤ H (P ) ≤ log n. On définit alors <strong>de</strong>s mesures pourncapter les divergences entre distributions. Soit une distribution a priori P = (P 1 , ..., P n ) <strong>et</strong>en supposant que l’on reçoit une information <strong>de</strong> nature à modifier c<strong>et</strong>te distribution en unenouvelle distribution a posteriori Q = (Q 1 , ..., Q n ), la mesure <strong>de</strong> divergences D (Q, P ) entreles <strong>de</strong>ux distributions est donnée par :D (Q, P ) =n∑i=1Q i log Q iP i(2.4)Maasoumi (1986) propose une classe alternative <strong>de</strong> mesures basée sur la famille <strong>de</strong> l’entropiegénéralisée :GE γ (Q, P ) =1γ (γ + 1)n∑[( ) γ ]QiQ i − 1 , avec γ ≠ 0, −1 (2.5)P ii=1L’adaptation d’une telle théorie aux mesures <strong>de</strong> pauvr<strong>et</strong>é multidimentionnelle repose surla procédure suivante : supposons qu’on dispose <strong>de</strong> n individus indicés par i, avec i = 1, ..., n<strong>et</strong> <strong>de</strong> m attributs <strong>de</strong> <strong>bien</strong>-<strong>être</strong> indicés par j, avec j = 1, ..., m, x ij représente alors la valeurd’un attribut j pour l’individu i. La première étape consiste à agréger le vecteur d’attributs(x i1 , ..., x im ) <strong>de</strong> l’individu i en une valeur unique x ic . L’idée suggerée par Maasoumi (1986)<strong>et</strong> Maasoumi <strong>et</strong> Nickelsburg (1988) est <strong>de</strong> trouver un vecteur x c = (x 1c , ..., x nc ) qui réflète leplus possible le niveau <strong>de</strong> <strong>bien</strong>-<strong>être</strong> procuré à chaque indidivu par l’ensemble <strong>de</strong> ses attributs.Il s’agit dans ce cas <strong>de</strong> minimiser la fonction d’entropie généralisée suivante :GE γ (x c , X; α) ={1m∑ n∑ [( ) γ ] }xicj x ic − 1 , avec γ ≠ 0, −1 (2.6)γ (γ + 1)j=1αxi=1ij


Chapitre 2. Mesures <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle <strong>et</strong> inférences statistiques 10α j représente le poids <strong>de</strong> l’attribut j. La solution du cas général (γ ≠ 0, −1) <strong>de</strong> c<strong>et</strong>teminimisation est donnée par :[ m] −1γ∑x ic ∝ δ j (x ij ) −γj=1avec δ j =α jm∑(2.7)α jj=1L’étape suivante consiste à i<strong>de</strong>ntifier les critères <strong>de</strong> définition <strong>de</strong> la pauvr<strong>et</strong>é. Pour Asselin(2002), c<strong>et</strong>te démarche souffre un problème d’indétermination lié à la nature paramétrique<strong>de</strong>s mesures proposées. De plus, il existe le problème <strong>de</strong> détermination <strong>de</strong>s poids <strong>de</strong>s attributsdans un sens moins arbitraire. Les métho<strong>de</strong>s d’inertie apportent une piste <strong>de</strong> solutions à c<strong>et</strong>tesecon<strong>de</strong> préoccupation.Les métho<strong>de</strong>s d’inertieLe but ici est d’éliminer le plus possible l’arbitraire dans le calcul d’un indicateur composite<strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle 3 . C<strong>et</strong>te approche est basée sur les techniques d’analysesmultivariées (analyses factorielles) qui sont entre autres l’Analyse en Composante Principal(ACP), l’Analyse Canonique Généralisée (ACG) <strong>et</strong> l’Analyse <strong>de</strong> Correspondances Multiples(ACM) qui est un cas particulier <strong>de</strong> l’ACG (Meulman, 1992). En considérant N individusindicés par i = 1, ..., N, <strong>et</strong> J attributs pour chacun d’eux, avec chaque attributj = 1, ..., J, il s’agit <strong>de</strong> représenter par un nuage <strong>de</strong> points autour d’un centroï<strong>de</strong> (moyennespondérées) les N individus dans l’espace <strong>de</strong>s J attributs avec un poids associé à chaque point.L’inertie totale du nuage <strong>de</strong> points, dépendamment <strong>de</strong> la métrique choisie, est la somme pondérée<strong>de</strong>s distances <strong>de</strong> chaque point par rapport au centroï<strong>de</strong>.L’ACP utilise la métrique euclidienne pour calculer les distances entre unités <strong>et</strong> centroï<strong>de</strong>.Elle est appropriée lorsque les attributs sont <strong>de</strong>s variables quantitatives.3 Pour une revue détaillée, voir Asselin (2002).


Chapitre 2. Mesures <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle <strong>et</strong> inférences statistiques 11L’ACG quant à elle considère le cas où l’on distingue au moins <strong>de</strong>ux ensembles d’attributs(variables). C<strong>et</strong>te démarche utilise la métrique <strong>de</strong> Mahalanobis pour le processus d’optimisation<strong>de</strong> l’inertie. L’ACM est un cas particulier <strong>de</strong> l’ACG qui est appliqué lorsque les variablessont qualitatives <strong>et</strong> prennent les valeurs binaires 0 ou 1.Klasen (2000) considère une mesure assez large <strong>de</strong> privation comme étant un indicateurcomposite <strong>de</strong> 14 attributs directement reliés aux capacités spécifiques. Pour dériver les poids<strong>de</strong> chaque composante <strong>de</strong> l’indicateur, il utilise <strong>de</strong>ux procédures, dont l’une consiste à calculerl’indicateur <strong>de</strong> privation comme une moyenne simple <strong>de</strong>s scores <strong>de</strong> toutes les composantesindividuelles tandis que l’autre est basée sur l’ACP. Contrairement à Klasen, Sahn <strong>et</strong> Stifel(2000 <strong>et</strong> 2003) utilisent une analyse factorielle.Les métho<strong>de</strong>s d’inertie non seulement constituent une approche non paramétrique plusréaliste que le choix d’une forme fonctionnelle donnée, mais elles perm<strong>et</strong>tent aussi <strong>de</strong> réduirel’arbitraire inhérent aux métho<strong>de</strong>s d’entropie notamment dans la détermination <strong>de</strong>s poids(Asselin, 2002).Cependant, la plupart <strong>de</strong>s démarches passées en revue consistent à résumer plusieurs aspectsdu <strong>bien</strong>-<strong>être</strong> en un indicateur unique, ce qui réduit l’analyse statistique au cadre traditionnelunidimensionnel. Pour Bourguignon <strong>et</strong> Chakravarty (2002), les choix d’une mesureparticulière, <strong>de</strong> même que les conclusions subséquentes, comportent un <strong>de</strong>gré d’arbitraireque l’on peut réduire en choisissant <strong>de</strong>s mesures <strong>de</strong> pauvr<strong>et</strong>é basées sur un certain nombre <strong>de</strong>postulats raisonnables.2.2.2 Les approches axiomatiquesL’idée ici est d’adapter certaines classes d’indices <strong>de</strong> pauvr<strong>et</strong>é proposées dans le cadre<strong>de</strong> la pauvr<strong>et</strong>é unidimensionnelle (Watts, 1968 ; Foster, Greer <strong>et</strong> Thorbecke, 1984 ; Foster <strong>et</strong>Shorrocks, 1991) à un contexte <strong>de</strong> pauvr<strong>et</strong>é multidimentionnelle. Pour ce faire, il est importantd’i<strong>de</strong>ntifier les pauvres.


Chapitre 2. Mesures <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle <strong>et</strong> inférences statistiques 12L’i<strong>de</strong>ntification <strong>de</strong>s pauvresDans l’analyse <strong>de</strong> la pauvr<strong>et</strong>é unidimensionnelle où le <strong>bien</strong>-<strong>être</strong> est représenté par le revenu,la préoccupation essentielle dans la définition <strong>de</strong>s pauvres est <strong>de</strong> savoir quel seuil <strong>de</strong>pauvr<strong>et</strong>é r<strong>et</strong>enir. Il existe <strong>de</strong>ux principaux types <strong>de</strong> seuil à savoir : le seuil absolu <strong>et</strong> le seuilrelatif. Le seuil absolu est défini indépendamment du niveau général <strong>de</strong> <strong>bien</strong>-<strong>être</strong> <strong>de</strong> la sociététandis que le seuil relatif est déterminé par rapport à ce niveau notamment par le choix d’unecertaine proportion <strong>de</strong> la moyenne ou <strong>de</strong> la médiane. Cependant, jusqu’ici, toutes les analyses<strong>multidimensionnelles</strong> <strong>de</strong> la pauvr<strong>et</strong>é ont privilégié la définition absolue du seuil dans la mesureoù la définition relative s’avère ambiguë dans certaines dimensions. Toutefois, l’analysemultidimensionnelle introduit une autre considération dans la définition <strong>de</strong>s seuils <strong>de</strong> pauvr<strong>et</strong>é(Atkinson, 2003 ; Bouguignon <strong>et</strong> Chakravarty, 2003 ; Duclos, Sahn <strong>et</strong> Younger, 2006) :la distinction à faire entre l’approche <strong>de</strong> l’union <strong>et</strong> celle <strong>de</strong> l’intersection dans l’i<strong>de</strong>ntification<strong>de</strong>s pauvres.Soit une population <strong>de</strong> taille N, chaque individu i <strong>de</strong> la population possè<strong>de</strong> un vecteur x i<strong>de</strong> J attributs, avec x i ɛ R+, J où R+ J est l’orthant non négatif <strong>de</strong> l’espace euclidien R J . SoitX une matrice N × J, où chaque élément x ij <strong>de</strong> la matrice donne la quantité d’attribut j quepossè<strong>de</strong> l’individu i. Soit z j ɛ Z le seuil <strong>de</strong> pauvr<strong>et</strong>é pour chaque attribut j, avec le vecteurZ ɛ R++ J l’orthant positif <strong>de</strong> l’espace euclidien R J . Le point fondamental est que l’approchemultidimensionnelle définit la pauvr<strong>et</strong>é comme une insuffisance par rapport au seuil pourchaque attribut. L’approche d’intersection considère un individu i comme étant pauvre s’ill’est au niveau <strong>de</strong> tous les attributs, c’est-à-dire si x ij < z j pour tout j.En considérant le cas <strong>de</strong> <strong>de</strong>ux attributs, x 1 <strong>et</strong> x 2 , c<strong>et</strong>te situation est représentée par lerectangle 0Z 2 AZ 1 du graphique 1. Le seuil <strong>de</strong> pauvr<strong>et</strong>é est alors donné par λ 1 (x 1 , x 2 ). Sil’on considère la distribution cumulative F (x 1 , x 2 ) définie pour <strong>de</strong>s valeurs non négatives<strong>de</strong> x 1 <strong>et</strong> x 2 , F (x 1 ) <strong>et</strong> F (x 2 ) étant leurs distributions marginales respectives, le rectangle0Z 2 AZ 1 donne alors la proportion F (z 1 , z 2 ) <strong>de</strong> ceux qui sont pauvres dans les <strong>de</strong>ux attributs.Bourguignon <strong>et</strong> Chakravarty (2003) trouvent c<strong>et</strong>te définition trop restrictive dans la mesure


Chapitre 2. Mesures <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle <strong>et</strong> inférences statistiques 13où, même si elle perm<strong>et</strong> d’i<strong>de</strong>ntifier les individus les plus nécessiteux, elle ne perm<strong>et</strong> pasd’appréhen<strong>de</strong>r tous les pauvres. Il serait ainsi erroné <strong>de</strong> considérer un vieux mendiant commeétant riche si les <strong>de</strong>ux attributs sont la durée <strong>de</strong> vie <strong>et</strong> le revenu.L’autre approche extrême est celle <strong>de</strong> l’union qui considère un individu comme étantpauvre s’il l’est pour au moins un <strong>de</strong>s attributs, auquel cas l’on a x ij < z j pour au moinsun j. Le seuil <strong>de</strong> pauvr<strong>et</strong>é dans ce cas correspond à λ 2 (x 1 , x 2 ). En additionnant les proportions<strong>de</strong> pauvres selon chaque attribut x 1 <strong>et</strong> x 2 , respectivement F (z 1 ) <strong>et</strong> F (z 2 ), on faitune double comptabilisation <strong>de</strong> ceux qui sont pauvres simultanément dans les <strong>de</strong>ux attributs.C’est pourquoi la proportion <strong>de</strong>s pauvres selon l’approche <strong>de</strong> l’union est donnée parF (z 1 ) + F (z 2 ) − F (z 1 , z 2 ).Duclos <strong>et</strong> al (2006) proposent une approche intermédiaire où le seuil <strong>de</strong> pauvr<strong>et</strong>é estdéfini par une frontière <strong>de</strong> pauvr<strong>et</strong>é telle qu’illustrée par λ 3 (x 1 , x 2 ) sur le graphique 2.1. C<strong>et</strong>teapproche qui suggère une combinaison entre les <strong>de</strong>ux attributs est basée sur l’idée qu’ils sontsubstituables dans une certaine mesure.FIG. 2.1 – Définitions d’union, d’intersection <strong>et</strong> intermédiaire du seuil <strong>de</strong> pauvr<strong>et</strong>éx 2x ,xZ 11 2x 1,x 2Z 2Ax 1,x 20x 1


Chapitre 2. Mesures <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle <strong>et</strong> inférences statistiques 14Les indices <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle <strong>et</strong> leurs principesPlusieurs indices <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle ont été suggérés par la littérature récente(Tsui, 2002 ; Bourguignon <strong>et</strong> Chakravarty, 2002 <strong>et</strong> 2003 ; Chakravarty, Deutsch <strong>et</strong> Silber,2005). Ces indices sont dérivés à partir <strong>de</strong> différentes combinaisons d’un certain nombred’axiomes. Depuis les travaux <strong>de</strong> Sen (1976) qui introduit les axiomes <strong>de</strong> monotonicité <strong>et</strong><strong>de</strong> transfert, plusieurs autres axiomes ont été proposés <strong>et</strong> sont généralement acceptés par lalittérature (voir entre autres Foster <strong>et</strong> al, 1984 ; Donaldson <strong>et</strong> Weymark, 1986 ; Foster <strong>et</strong> Shorrocks,1991 ; Bourguignon <strong>et</strong> Fields, 1997).Les différents axiomes sont les suivants :Axiome 1 La concentration : L’indice <strong>de</strong> pauvr<strong>et</strong>é <strong>de</strong>meure inchangé lorsqu’un attribut jaugmente pour un individu i, les autres attributs <strong>de</strong> la matrice étant constants, si initialementla situation était caractérisée par x ij ≥ z j 4 .Axiome 2 La monotonicité : Pour x ij < z j , une augmentation <strong>de</strong> x ij n’accroît pas l’indice<strong>de</strong> pauvr<strong>et</strong>é si les autres attributs restent inchangés.Axiome 3 Le principe <strong>de</strong> population 5 : Si la matrice <strong>de</strong>s attributs X est reproduite plusieursfois alors l’indice <strong>de</strong> pauvr<strong>et</strong>é ne change pas <strong>et</strong> l’on aura alors P (X; z) = P (X r ; z), où X rest la matrice X reproduite r fois.Axiome 4 La symétrie ou l’anonymat : Pour tout X ∈ M, toute permutation <strong>de</strong>s individus <strong>de</strong>la matrice n’aura aucun impact sur l’indice <strong>de</strong> pauvr<strong>et</strong>é, autrement dit P (X; z) = P (ρX; z),où ρ représente une quelconque matrice <strong>de</strong> permutation d’ordre N.4 Bourguignon <strong>et</strong> Chakravarty (2003) distinguent pour c<strong>et</strong> axiome une version forte <strong>et</strong> une version faible.Toutefois c<strong>et</strong>te distinction ne change pas les développements à venir.5 C<strong>et</strong> axiome est équivalent à celui <strong>de</strong> l’invariance <strong>de</strong> la réplication formulé par Tsui (2002).


Chapitre 2. Mesures <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle <strong>et</strong> inférences statistiques 15Axiome 5 La continuité : Pour tout z ∈ Z, P (X; z) est continu sur M, ce qui signifie quel’indice <strong>de</strong> pauvr<strong>et</strong>é ne doit pas <strong>être</strong> très sensible à une variation marginale <strong>de</strong> la quantitéd’un attribut.Le premier axiome dit que lorsqu’un individu est <strong>bien</strong> loti au niveau d’un attribut, luien augmenter la valeur n’influe pas sur l’intensité <strong>de</strong> la pauvr<strong>et</strong>é même s’il est pauvre dansd’autres attributs. Si c<strong>et</strong>te idée est parfaitement compatible avec les définitions <strong>de</strong> l’union<strong>et</strong> <strong>de</strong> l’intersection du seuil <strong>de</strong> pauvr<strong>et</strong>é, elle exclut par contre l’idée <strong>de</strong> substitualité (mêmelimitée) ou <strong>de</strong> compromis contenue dans la définition intermédiaire du seuil <strong>de</strong> pauvr<strong>et</strong>é. Eneff<strong>et</strong>, si on considère ce seuil introduit par Duclos <strong>et</strong> al (2006) dans le cas bidimensionnel <strong>et</strong>illustré dans le graphique 1, il est possible qu’une augmentation d’un attribut, l’autre restantinchangé, puisse rendre non pauvre un individu suffisamment proche du seuil <strong>de</strong> pauvr<strong>et</strong>é.L’axiome 1 pourrait <strong>être</strong> conciliée avec c<strong>et</strong>te idée s’il circonscrivait le postulat aux individusse situant au <strong>de</strong>ssus du seuil <strong>de</strong> pauvr<strong>et</strong>é global plutôt qu’au niveau <strong>de</strong> chaque attribut.L’axiome 2 nous dit que l’amélioration <strong>de</strong>s conditions <strong>de</strong>s pauvres n’augmente pas la mesure<strong>de</strong> la pauvr<strong>et</strong>é. Au contraire, elle peut la réduire. L’axiome 3 perm<strong>et</strong> par la réplication parexemple <strong>de</strong> réduire <strong>de</strong>ux matrices <strong>de</strong> tailles différentes à la même taille, ce qui peut s’avérerutile pour les comparaisons ordinales <strong>de</strong> pauvr<strong>et</strong>é entre régions <strong>et</strong> entre pério<strong>de</strong>s. L’axiome4 requiert que les mesures <strong>de</strong> pauvr<strong>et</strong>é ne dépen<strong>de</strong>nt pas <strong>de</strong>s caractéristiques non pertinentes<strong>de</strong>s individus tandis que l’axiome 5 s’assure que les imprécisions qui caractérisent les donnéessur le <strong>bien</strong>-<strong>être</strong> ne les affectent pas significativement.Pour Tsui (2002), la mesure <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle est une valeur réelled’une fonction P : M × Z −→ R qui satisfait les cinq axiomes ci-<strong>de</strong>ssus cités. Il existed’autres axiomes perm<strong>et</strong>tant <strong>de</strong> spécifier une forme aux mesures <strong>de</strong> pauvr<strong>et</strong>é.Axiome 6 La décomposabilité par sous-groupe : Pour tout z ∈ Z <strong>et</strong> X 1 , X 2 ,..., X k ∈ M<strong>et</strong> tels que X = ∪ i=ki=1X i alors P (X; z) = ∑ k N ii=1P N (Xi ; z) où N i est la taille associée àchaque sous-groupe X i avec ∑ ki=1 N i = N.


Chapitre 2. Mesures <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle <strong>et</strong> inférences statistiques 16C<strong>et</strong> axiome signifie que lorsque la population est partitionnée en plusieurs sous-groupesk, alors la mesure <strong>de</strong> pauvr<strong>et</strong>é globale est une moyenne pondérée <strong>de</strong>s mesures <strong>de</strong> pauvr<strong>et</strong>épour chaque sous-groupe. Ceci perm<strong>et</strong> notamment d’étudier la pauvr<strong>et</strong>é selon différents sousgroupes(<strong>et</strong>hnique, géographique, <strong>et</strong>c.) <strong>et</strong> d’analyser leur contribution à la pauvr<strong>et</strong>é globale,ce qui peut offrir <strong>de</strong>s perspectives intéressantes pour le ciblage <strong>de</strong> la lutte contre la pauvr<strong>et</strong>é.Si l’on ajoute c<strong>et</strong> axiome aux autres, Bourguignon <strong>et</strong> Chakravarty (2002) définissent l’indice<strong>de</strong> pauvr<strong>et</strong>é multidimensionnelle suivant comme satisfaisant l’ensemble <strong>de</strong> ces axiomes :P (X; z) = 1 NN∑p (x i ; z) (2.8)i=1C<strong>et</strong>te forme est conforme à la forme générale dérivée par la proposition 1 <strong>de</strong> Tsui (2002)comme nécessaire <strong>et</strong> suffisante pour que l’indice <strong>de</strong> pauvr<strong>et</strong>é multidimensionnelle P (X; z)satisfasse l’axiome 6 :[]1N∑P (X; z) = H λ (x i ; z) ; zNi=1(2.9)où H est une fonction continue <strong>et</strong> strictement croissante tandis que λ : M × Z −→ R estcontinue <strong>et</strong> non croissante par rapport aux attributs.Pour faciliter les comparaisons ordinales <strong>de</strong> pauvr<strong>et</strong>é entre pays pouvant utiliser <strong>de</strong>s unités<strong>de</strong> mesures différentes, l’axiome suivant est proposé :Axiome 7 L’invariance aux variations d’échelle : Pour tout X ∈ M <strong>et</strong> tout z ∈ Z, soit unematrice Ω ∈ R J + <strong>et</strong> δ = diag (Ω), alors P (X; z) = P (Xδ; zδ).C<strong>et</strong>te propriété signifie que la mesure <strong>de</strong> pauvr<strong>et</strong>é est homogène <strong>de</strong> <strong>de</strong>gré 0 par rapport àX <strong>et</strong> z. Il s’agit ainsi <strong>de</strong> ne pas faire dépendre l’indice <strong>de</strong>s unités <strong>de</strong> mesure.


Chapitre 2. Mesures <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle <strong>et</strong> inférences statistiques 17A ces propriétés s’ajoutent d’autres axiomes moins faciles à adapter au cadre multidimensionnel<strong>de</strong> la pauvr<strong>et</strong>é (Bourguignon <strong>et</strong> Chakravarty, 2003).Axiome 8 Le principe <strong>de</strong> transfert : Pour tout z ∈ Z, X <strong>et</strong> Y ∈ M, lorsque Y est dérivé<strong>de</strong> X par une redistribution <strong>de</strong>s attributs au niveau <strong>de</strong>s pauvres avec Y P = BX P , où Best une matrice <strong>de</strong> transformation (<strong>et</strong> non <strong>de</strong> permutation) bistochastique appropriée, alorsP (Y ; z) ≤ P (X; z).C<strong>et</strong> axiome s’appuie sur le principe <strong>de</strong> Pigou-Dalton qui, dans le cadre unidimensionnelhabituel, suggère qu’une redistribution égalitaire <strong>de</strong> revenu entre les pauvres qui n’engendrepas <strong>de</strong> reclassement entre ces <strong>de</strong>rniers est <strong>de</strong> nature à diminuer la pauvr<strong>et</strong>é. Bourguignon <strong>et</strong>Chakravarty définissent une version unidimensionnelle du principe <strong>de</strong> transfert dans un cadremultidimensionnel en considérant que la redistribution ne s’opère que sur un attribut. C<strong>et</strong>teversion simplifiée <strong>de</strong> l’axiome 8 est appelée principe <strong>de</strong> transfert en une dimension (PTUD).La version plus générale donnée à travers l’axiome s’inspire <strong>de</strong> Kolm (1977) <strong>et</strong> correspond,lorsqu’on l’applique aux pauvres plutôt qu’à toute la population, au principe <strong>de</strong> transfertmultidimensionnel (PTM) suggéré par Tsui (2002). Dans le cas bidimensionnel (j = 2) laproposition 2 <strong>de</strong> Bourguignon <strong>et</strong> Chakravarty montre que les courbes d’isopauvr<strong>et</strong>é 6 dansl’espace <strong>de</strong>s attributs sont convexes par rapport à l’origine, ce qui est la conséquence <strong>de</strong> lanon croissance du taux marginal <strong>de</strong> substitution entre les attributs impliquée par l’axiome 8.C<strong>et</strong>te propriété signifie que si par exemple les <strong>de</strong>ux combinaisons d’attributs (1, 3) <strong>et</strong> (3, 1)garantissaient le même niveau <strong>de</strong> pauvr<strong>et</strong>é, alors le point (2, 2) qui est une combinaison linéaire<strong>de</strong>s <strong>de</strong>ux correspondrait à un niveau <strong>de</strong> pauvr<strong>et</strong>é inférieur ou égal.En outre, lorsqu’un indice <strong>de</strong> pauvr<strong>et</strong>é multidimensionnelle satisfaisant l’axiome 6 <strong>de</strong>décomposabilité <strong>et</strong> le PTUD possè<strong>de</strong> <strong>de</strong>s dérivés partielles <strong>de</strong> premier ordre, alors la proposition3 <strong>de</strong> Bourguignon <strong>et</strong> Chakravarty montre qu’il est additif entre les attributs. Dans ce cas,l’indice peut <strong>être</strong> explicité comme suit :6 Il s’agit, par analogie aux courbes d’indifférence, <strong>de</strong> courbes représentant, pour chacune, le lieu <strong>de</strong>s combinaisonsd’attributs garantissant un même niveau <strong>de</strong> pauvr<strong>et</strong>é.


Chapitre 2. Mesures <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle <strong>et</strong> inférences statistiques 18P (X; z) = 1 NN∑p (x i ; z) = 1 Ni=1N∑ J∑p j (x ij ; z j ) , (2.10)i=1 j=1où p j () est la fonction <strong>de</strong> pauvr<strong>et</strong>é individuelle associée à l’attribut j.D’autres axiomes tenant compte <strong>de</strong> la nature multidimensionnelle <strong>et</strong> notamment <strong>de</strong> lacorrélation entre les attributs ont été développés (Bourguignon <strong>et</strong> Chakravarty, 2002 ; Chakravarty,Deutsh <strong>et</strong> Silber, 2005).Axiome 9 Non décroissance <strong>de</strong> la pauvr<strong>et</strong>é suite à une augmentation <strong>de</strong> la corrélation entreattributs : Pour tout X ∈ M <strong>et</strong> z ∈ Z, si Y ∈ M est obtenu à partir <strong>de</strong> X par le transfertd’un attribut entre <strong>de</strong>ux individus pauvres à la fois dans tous les attributs, ce qui accroît lacorrélation entre attributs, alors P (X; z) ≤ P (Y ; z) si les attributs sont substituables.C<strong>et</strong> axiome peut <strong>être</strong> illustré dans le cadre <strong>de</strong> <strong>de</strong>ux attributs comme suit : en supposant<strong>de</strong>ux individus pauvres à la fois dans <strong>de</strong>ux attributs 1 <strong>et</strong> 2, avec toutefois chacun d’eux qui estmieux loti que l’autre dans l’un <strong>de</strong>s attributs. Si l’on transfère un attribut <strong>de</strong> l’individu le plusloti vers le moins loti, on augmente la corrélation entre les attributs puisqu’ils se r<strong>et</strong>rouvent,l’un, avec une combinaison d’attributs relativement élevés <strong>et</strong>, l’autre, avec une combinaisond’attributs relativement peu élevés. Cependant, les attributs étant substituables dans le sensqu’ils sont <strong>de</strong> la même nature, ce que gagne en termes <strong>de</strong> réduction <strong>de</strong> la pauvr<strong>et</strong>é l’individuqui voit son attribut augmenter n’est pas suffisant pour compenser l’augmentation <strong>de</strong> la pauvr<strong>et</strong>édu second individu. Il est alors raisonnable <strong>de</strong> s’attendre à une non décroissance <strong>de</strong> lapauvr<strong>et</strong>é globale. C’est l’inverse dans le cas d’attributs complémentaires. En eff<strong>et</strong>, puisque lapauvr<strong>et</strong>é sera dépendante <strong>de</strong> l’attribut relativement rare pour chaque individu, l’on pourraitalors, en transférant la partie non contributive <strong>de</strong> l’attribut <strong>de</strong> l’individu 1 à l’individu 2, réduirela pauvr<strong>et</strong>é au niveau du second individu sans affecter la situation du premier. C’est cequ’exprime l’axiome suivant qui n’est que la version du précé<strong>de</strong>nt, adaptée au cas d’attributscomplémentaires :


Chapitre 2. Mesures <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle <strong>et</strong> inférences statistiques 19Axiome 10 Non croissance <strong>de</strong> la pauvr<strong>et</strong>é suite à un accroissement <strong>de</strong> la corrélation entreattributs : Pour tout X ∈ M <strong>et</strong> z ∈ Z, si Y ∈ M est obtenu à partir <strong>de</strong> X par le transfertd’un attribut entre <strong>de</strong>ux individus pauvres à la fois dans tous les attributs, ce qui accroît lacorrélation entre attributs, alors P (X; z) ≥ P (Y ; z) si les attributs sont complémentaires.Plusieurs indices <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle, avec une forme explicite <strong>de</strong> p j (),satisfaisant une combinaison <strong>de</strong> ces axiomes ont été suggérés. Bourguignon <strong>et</strong> Chakravarty(2002) proposent un indice qui satisfait à tous ces axiomes. Il s’agit d’une extension <strong>de</strong> laclasse <strong>de</strong> mesure FGT <strong>de</strong> Foster <strong>et</strong> al (1984) à un cadre bidimensionnel :P α,β (X; z) = 1 N[N∑( ) β z1 − x i1I (x i1 < z 1 )+ b β α I (xi2 < z 2 )z 1i=1(z2 − x i2z 2) β] αβ,(2.11)où α ≥ 1, β ≥ 1, b > 0 <strong>et</strong> I() une fonction indicatrice prenant la valeur zéro ou un. b traduitl’importance relative accordée au second attribut. La condition α ≥ 1 garantit l’axiome 8 pourun seuil <strong>de</strong> pauvr<strong>et</strong>é d’union tandis que lorsqu’elle est donnéé, la condition supplémentaireβ ≥ 1 assure l’axiome 8 dans le cas du seuil <strong>de</strong> pauvr<strong>et</strong>é d’intersection. Lorsque 1 ≤ β ≤ α,alors l’indice satisfait l’axiome 9. Pour β > α, alors les attributs <strong>de</strong>viennent complémentaires<strong>et</strong> l’indice <strong>de</strong> pauvr<strong>et</strong>é satisfait plutôt l’axiome 10. A la limite, lorsqu’on a <strong>de</strong>s complémentsparfaits, c’est-à-dire β −→ ∞, l’indice <strong>de</strong>vient :P α,∞ (X; z) = 1 NN∑i=1[1 − min(1, x i1z 1, x i2z 2)] α. (2.12)Même si ces axiomes satisfont le PTM, ils ne satisfont pas le PTUD <strong>et</strong> ne sont donc pasadditifs. Dans le cas général <strong>de</strong> J attributs, Bourguignon <strong>et</strong> Chakravarty (2003) suggèrent unindice additif cependant moins général dans la forme que le précé<strong>de</strong>nt :


Chapitre 2. Mesures <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle <strong>et</strong> inférences statistiques 20P θ (X; z) = 1 NJ∑ ∑j=1i∈S ja j ·(zj − x ijz j) θj, (2.13)avec a j représentant le poids <strong>de</strong> chaque attribut <strong>et</strong> S j l’ensemble <strong>de</strong>s individus pauvres enattribut j. C<strong>et</strong>te formulation est une généralisation à J dimensions du cas α = β <strong>de</strong> l’indiceprécé<strong>de</strong>nt, en considérant que les θ j sont i<strong>de</strong>ntiques <strong>et</strong> donc égaux à α <strong>et</strong> β.L’on peut considérer aussi pour c<strong>et</strong>te formulation large le cas où les attributs sont parfaitementcomplémentaires <strong>et</strong> celui où ils sont substituables.Chakravarty <strong>et</strong> al (2005) dérivent un indice différent qui est une extension <strong>de</strong> l’indice <strong>de</strong>pauvr<strong>et</strong>é <strong>de</strong> Watts (1968). Il est <strong>de</strong> la forme suivante :P W (X; z) = 1 NJ∑ ∑j=1i∈S jω j log z jx ij, (2.14)où ω j est un paramètre d’échelle ≥ 0 avec <strong>de</strong>s inégalités strictes pour certains j. C<strong>et</strong>te mesuresatisfait tous les axiomes hormis les <strong>de</strong>ux <strong>de</strong>rniers. En eff<strong>et</strong>, une augmentation <strong>de</strong> la corrélationentre attributs due à un réaménagement dans la répartition d’un attribut n’affecte pasle niveau <strong>de</strong> c<strong>et</strong> indice, ce qui traduit que c<strong>et</strong> type <strong>de</strong> mesure considère les attributs commeétant indépendants, dans le sens qu’ils ne sont ni substituables, ni complémentaires.2.3 Inférences statistiques <strong>et</strong> dominance stochastique2.3.1 Les tests d’union-intersection <strong>et</strong> alternativesLe principe <strong>de</strong>s tests d’union-intersection remonte à Roy (1953). Ce principe consiste,lorsque l’hypothèse nulle à rej<strong>et</strong>er est une intersection d’hypothèses simples <strong>et</strong> par conséquent


Chapitre 2. Mesures <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle <strong>et</strong> inférences statistiques 21l’hypothèse alternative une union <strong>de</strong> ces hypothèses, à tester chacune <strong>de</strong>s hypothèses <strong>et</strong> àrej<strong>et</strong>er l’hypothèse nulle seulement lorsque au moins l’une <strong>de</strong> ces hypothèses simples estrej<strong>et</strong>ée. La plupart <strong>de</strong>s tests en dominance stochastique sont basés sur la formulation <strong>de</strong> typeunion-intersection. Trois hypothèses imbriquées sont généralement combinées pour réaliserles tests (Davidson <strong>et</strong> Duclos, 2000). Ces trois hypothèses H 0 , H 1 <strong>et</strong> H 2 sont respectivementla relation d’égalité, celle d’inégalité non stricte <strong>et</strong> la non restriction avec une imbricationH 0 ⊂ H 1 ⊂ H 2 .Il existe plusieurs tests paramétriques basés sur différentes combinaisons <strong>de</strong> ces hypothèsesavec notamment Gourieroux, Holly <strong>et</strong> Monfort (1982) <strong>et</strong> Wolak (1989) qui analysentle problème dans un contexte <strong>de</strong> modèles non-linéaires <strong>et</strong> <strong>de</strong> contraintes d’inégalité non linéaires7 . Mais leurs utilisations restent limitées en dominance stochastique dans la mesure oùles distributions à comparer ne sont généralement pas connues, ni issues <strong>de</strong> la même famille<strong>et</strong> que les préoccupations peuvent porter sur <strong>de</strong>s caractéristiques plus générales que les <strong>de</strong>uxpremiers moments (Maasoumi, 2001).Soit µ 0 ∈ R K , la différence entre <strong>de</strong>ux vecteurs <strong>de</strong> caractéristiques d’intérêt (par exemplequantiles, moyennes conditionnelles, courbes ordonnées <strong>de</strong> Lorenz <strong>et</strong> <strong>de</strong> Lorenz généralisé).Pour examiner la dominance <strong>de</strong>s courbes <strong>de</strong> Lorenz, Beach <strong>et</strong> Davidson (1983) suggèrent untest <strong>de</strong> Wald basé sur la formulation suivante :H 0 : µ 0 = 0 vs H 2 : µ 0 ≠ 0. (2.15)H 0 est un vecteur <strong>de</strong> K hypothèses simples H 0,i basées sur µ 0,i avec i = 1, ..., K. Suivantles travaux <strong>de</strong> Beach <strong>et</strong> Richmond (1985), Bishop, Formby <strong>et</strong> Thistle (1989,1992) proposentun test d’union-intersection pour ce type <strong>de</strong> formulation. Il est basé sur les hypothèses suivantes:7 Pour une revue détaillée <strong>de</strong>s tests paramétriques, voir Maasoumi (2001).


Chapitre 2. Mesures <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle <strong>et</strong> inférences statistiques 22H 0,i : µ 0,i = 0 ∀ i = 1, ..., K vs H 2 : µ 0,i ≠ 0 pour certains i. (2.16)L’hypothèse nulle globale H 0 : µ 0 = 0 est l’intersection <strong>de</strong> toutes les hypothèses simplesH 0,i , tandis que l’hypothèse alternative H 2 : µ 0 ≠ 0 représente plutôt leur union. Ainsi, onne rej<strong>et</strong>te pas l’hypothèse H 0 seulement lorsqu’on ne rej<strong>et</strong>te aucune <strong>de</strong>s hypothèses H 0,i . Ensupposant que ̂µ 0 est un estimateur <strong>de</strong> µ 0 , Bishop <strong>et</strong> al (1989) établissent à partir d’une série<strong>de</strong> théorèmes, s’inspirant en partie <strong>de</strong> Rao (1965) <strong>et</strong> <strong>de</strong> Beach <strong>et</strong> Davidson (1983), que sousl’hypothèse nulle H 0 : µ 0 = 0, on a :̂µ 0 ∼ d N (0, Σ) . (2.17)Sous l’hypothèse d’indépendance entre <strong>de</strong>ux distributions a <strong>et</strong> b, ils dérivent la statistique :Z i =̂µ a 0,i − ̂µ b 0,i[(̂σaii /N a ) + (̂σ b ii /N b)] 1/2 , (2.18)avec ̂µ 0,i = ̂µ a 0,i − ̂µ b 0,i, ̂σ ii a <strong>et</strong> ̂σ ii b les variances respectives <strong>de</strong> ̂µ a 0,i <strong>et</strong> ̂µ b 0,i, tandis que N a <strong>et</strong>N b sont les nombres d’observations respectivement pour les <strong>de</strong>ux distributions a <strong>et</strong> b. C<strong>et</strong>testatistique est asymptotiquement normale standard pour i = 1, ..., K. Pour contrôler la tailleα du test, ils utilisent <strong>de</strong>s valeurs critiques basées sur la distribution SMM 8 dont la table estfournie par Stoline <strong>et</strong> Ury (1979) pour tester chacune <strong>de</strong>s hypothèses simples. H 0,i est rej<strong>et</strong>éelorsque |Z i | ≥ m α (K, ∞) <strong>et</strong> acceptée dans le cas contraire. Un avantage <strong>de</strong>s procédures <strong>de</strong>comparaison multiple est qu’elles perm<strong>et</strong>tent d’i<strong>de</strong>ntifier les tests qui rej<strong>et</strong>tent <strong>et</strong> ceux qui nerej<strong>et</strong>tent pas (Savin, 1980).La formulation <strong>de</strong> l’hypothèse nulle d’égalité contre l’hypothèse alternative <strong>de</strong> non restrictionpeut paraître assez vague <strong>et</strong> non informative dans la mesure où l’on ne peut distinguer8 Stu<strong>de</strong>ntized maximum modulus.


Chapitre 2. Mesures <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle <strong>et</strong> inférences statistiques 23la dominance <strong>de</strong> l’absence <strong>de</strong> restriction en cas <strong>de</strong> rej<strong>et</strong> <strong>de</strong> l’hypothèse nulle (Fisher, Willson<strong>et</strong> Xu, 1996). C’est surtout le cas lorsque l’on est plus préoccupé par l’aspect <strong>de</strong> dominanceplutôt que celui <strong>de</strong> non dominance. C’est ainsi qu’il existe une autre spécification où l’onteste l’hypothèse nulle d’égalité contre l’alternative <strong>de</strong> dominance :H 0 : µ 0 = 0 vs H 1 : µ 0 ≥ 0 (2.19)Ce cas n’est pas à proprement parler une formulation <strong>de</strong> type UI puisque aussi <strong>bien</strong> l’hypothèsenulle que l’alternative sont formulées comme <strong>de</strong>s intersections d’hypothèses. Pourcomparer les courbes <strong>de</strong> Lorenz <strong>et</strong> les indices <strong>de</strong> Gini, Gastwirth <strong>et</strong> Gail (1985) proposent<strong>de</strong>s statistiques qui perm<strong>et</strong>tent <strong>de</strong> détecter <strong>de</strong>s relations <strong>de</strong> dominance éventuelles. Bishop,Chakravarty <strong>et</strong> Thistle (1989) éten<strong>de</strong>nt l’analyse à la dominance en termes <strong>de</strong> Lorenz généralisé.Pour tester c<strong>et</strong>te formulation, An<strong>de</strong>rson (1996) utilise une extension du test <strong>de</strong> Pearson.En considérant Y une variable aléatoire qu’on partitionne en K catégories exclusives aprèsl’avoir ordonnée <strong>et</strong> soit x i le nombre d’observations <strong>de</strong> Y dans la i e catégorie, x i suit unedistribution multinomiale avec les probabilités P i , i = 1, ..., K telle que :K∑x i = n <strong>et</strong>i=1K∑P i = 1. (2.20)i=1En utilisant le théorème central limite multivarié, le vecteur <strong>de</strong> fréquences empiriques x<strong>de</strong> dimension (K × 1) ∼ d N (µ, Ω) avec :⎡n −1 µ =⎢⎣P 1P 2··P K⎤⎥⎦⎡<strong>et</strong> n −1 Ω =⎢⎣P 1 (1 − P 1 ) −P 1 P 2 · · · −P 1 P K−P 2 P 1 P 2 (1 − P 2 ) · · · −P 2 P K· · · · · ·· · · · · ·−P K P 1 −P K P 2 · · · P K (1 − P K )⎤. (2.21)⎥⎦


Chapitre 2. Mesures <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle <strong>et</strong> inférences statistiques 24En supposant <strong>de</strong>ux vecteurs <strong>de</strong> fréquences x A <strong>et</strong> x B issus <strong>de</strong> <strong>de</strong>ux populations A <strong>et</strong> B,à partir <strong>de</strong> la définition analytique <strong>de</strong> la dominance stochastique aux trois premiers ordres,An<strong>de</strong>rson (1996) modifie la règle trapézoïdale <strong>de</strong> Goodman (1967) pour l’approximation<strong>de</strong>s intégrales <strong>et</strong> définit <strong>de</strong>ux matrices I f <strong>et</strong> I F . I f est une matrice triangulaire inférieure <strong>de</strong>dimension (K × K) alors que I F est une matrice <strong>de</strong> même dimension <strong>de</strong> la forme :⎡I F =⎢⎣⎤d 1 0 · · · 0d 1 + d 2 d 2 · · · 0· · · · · ·⎥· · · · · · ⎦d 1 + d 2 d 2 + d 3 · · · d Koù d i représente la longueur <strong>de</strong> l’intervalle <strong>de</strong> la partition i. Il dérive alors un test <strong>de</strong> Waldbasé sur les hypothèses suivantes :H 1 0 : I f(P A − P B) = 0 vs H 1 1 : I f(P A − P B) ≤ 0H 2 0 : I F I f(P A − P B) = 0 vs H 2 1 : I F I f(P A − P B) ≤ 0H 3 0 : I F I F I f(P A − P B) = 0 vs H 3 1 : I F I F I f(P A − P B) ≤ 0Ces hypothèses concernent respectivement les dominances stochastiques <strong>de</strong> premier ordre,<strong>de</strong> second ordre <strong>et</strong> <strong>de</strong> troisième ordre. Pour Barr<strong>et</strong>t <strong>et</strong> Donald (2003), l’estimation <strong>de</strong> la fonction<strong>de</strong> distribution cumulée (CDF) à <strong>de</strong>s points d’évaluation par An<strong>de</strong>rson produit <strong>de</strong>s résultatspotentiellement biaisés <strong>et</strong> non convergents, ce qui n’est pas le cas lorsque la métho<strong>de</strong>d’estimation du CDF est plutôt basée sur l’intégration directe comme chez Davidson <strong>et</strong> Duclos(2000). Ils pensent que, même si ce biais ne peut en général pas conduire à rej<strong>et</strong>er une


Chapitre 2. Mesures <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle <strong>et</strong> inférences statistiques 25H 0 vraie, il introduit la possibilité d’accroître l’erreur <strong>de</strong> secon<strong>de</strong> espèce c’est-à-dire <strong>de</strong> nepas rej<strong>et</strong>er H 0 lorsqu’elle est fausse.En général, c<strong>et</strong>te formulation est meilleure si l’on suppose que µ 0 ≥ 0, c’est à dire qu’ona la relation <strong>de</strong> dominance. Un inconvénient majeur par exemple dans le cas <strong>de</strong>s courbes <strong>de</strong>GL est que ni H 0 ni H 1 ne couvrent le cas où les courbes sont croisées (Morimune <strong>et</strong> Murasawa,2002). Or il est possible que les <strong>de</strong>ux courbes se croisent <strong>et</strong> que les distributions soientalors non comparables. Il existe un troisième type <strong>de</strong> formulation, le plus usité, particulièrementdans la littérature relativement récente. Il s’agit dans ce cas <strong>de</strong> tester l’hypothèse <strong>de</strong>dominance H 1 contre l’alternative <strong>de</strong> non H 1 . La majorité <strong>de</strong> ces tests sont basés sur le type<strong>de</strong> test Kolmogorov-Smirnov (KS).McFad<strong>de</strong>n (1989) propose une statistique basée sur le supremum pour tester l’hypothèsenulle H 1 contre l’hypothèse alternative <strong>de</strong> non H 1 . Schmid <strong>et</strong> Tre<strong>de</strong> (1996,1998) testent ladominance <strong>de</strong> second ordre à partir <strong>de</strong> la même formulation :H 0 : µ 0 ≤ 0 vs H A : non H 0 . (2.22)L’hypothèse nulle implique qu’une <strong>de</strong>s <strong>de</strong>ux distributions domine stochastiquement l’autreou lui est équivalente alors que l’hypothèse alternative stipule qu’il n’existe pas <strong>de</strong> dominance.Tout comme McFad<strong>de</strong>n (1989), ils utilisent <strong>de</strong>s tests <strong>de</strong> permutation en considérantun supremum <strong>de</strong> la forme :T 1 = Supˆµ 0 (t) (2.23)t ∈ RCela est similaire à la statistique <strong>de</strong> KS dans le cas <strong>de</strong> la dominance du premier ordre.Schmid <strong>et</strong> Tre<strong>de</strong> (1996) en particulier réalisent <strong>de</strong>s tests alternatifs dont l’un est basé sur lanormalité asymptotique <strong>de</strong> ˆµ 0 <strong>et</strong> l’autre sur l’intégration. D’autres étu<strong>de</strong>s ont proposé <strong>de</strong>s


Chapitre 2. Mesures <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle <strong>et</strong> inférences statistiques 26extensions du test KS en faisant recours aux techniques <strong>de</strong> simulation <strong>et</strong> <strong>de</strong> bootstrap pouranalyser la dominance stochastique du premier <strong>et</strong> du second ordre (Heshmati <strong>et</strong> Maasoumi,1998 <strong>et</strong> 2005 ; Linton, Maasoumi <strong>et</strong> Whang, 2005 ; Linton, Post <strong>et</strong> Whang, 2005 ; Maasoumi<strong>et</strong> Millim<strong>et</strong>, 2005).Linton, Maasoumi <strong>et</strong> Whang (2005) en particulier proposent une procédure d’estimation<strong>de</strong>s valeurs critiques dans le cas <strong>de</strong> K options. En considérant K options 9 X 1 , ..., X K ,soient A = {X k : k = 1, ..., K} <strong>et</strong> ℵ = {X k,i : i = 1, ..., N} les réalisations <strong>de</strong> X k pourk = 1, ..., K, ils définissent l’expression suivante pour la distribution jointe typiquementdans le cas <strong>de</strong> la dominance du premier ordre :d ∗ = mink≠lsup [F k (x) − F l (x)] l, k = 1, ..., K. (2.24)x ∈ℵIls dérivent alors les hypothèses H d 0 : d ∗ ≤ 0 vs H d 1 : d ∗ > 0, où l’hypothèse nulleH d 0 implique que les perspectives dans A ne sont pas stochastiquement optimales au premierordre, ce qui signifie qu’il existe au moins une option qui domine les autres.Des étu<strong>de</strong>s comme celles <strong>de</strong> Barr<strong>et</strong>t <strong>et</strong> Donald (2003), Horváth, Kokoszka <strong>et</strong> Zitikis(2006) <strong>et</strong> Scaill<strong>et</strong> <strong>et</strong> Topaloglou (2005) éten<strong>de</strong>nt l’analyse à la dominance stochastique d’ordre≥ 2. Comme les distributions asymptotiques sont alors complexes, ces auteurs utilisent <strong>de</strong>sapproches basées sur les simulations <strong>et</strong> le bootstrap pour réaliser <strong>de</strong>s inférences vali<strong>de</strong>s. Morimune<strong>et</strong> Murasawa (2002) ainsi que Barr<strong>et</strong>t, Bhattacharya <strong>et</strong> Donald (2004), quant à eux,circonscrivent l’analyse respectivement à la dominance <strong>de</strong> la courbe GL <strong>et</strong> à celle <strong>de</strong> la courbe<strong>de</strong> Lorenz.En s’inspirant <strong>de</strong> Kod<strong>de</strong> <strong>et</strong> Palm (1986) <strong>et</strong> <strong>de</strong> Wolak (1989), Xu (1997) <strong>et</strong> Fisher, Willson<strong>et</strong> Xu (1998) proposent une alternative aux tests <strong>de</strong> la famille KS, le premier pour analyserla dominance <strong>de</strong> la courbe GL <strong>et</strong> les seconds pour la dominance stochastique du premier9 Il peut s’agir par exemple <strong>de</strong>s différents actifs d’un portefeuille.


Chapitre 2. Mesures <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle <strong>et</strong> inférences statistiques 27<strong>et</strong> du second ordre. C<strong>et</strong>te alternative consiste à construire une statistique <strong>de</strong> test basée surl’estimation non contrainte <strong>de</strong> µ 0 (ˆµ 0 ) <strong>et</strong> sur l’estimation <strong>de</strong> µ 0 sous la contrainte µ 0 ≥ 0(˜µ 0 ). La statistique T obtenue est une mesure normalisée entre les <strong>de</strong>ux séries d’estimation <strong>et</strong>perm<strong>et</strong> <strong>de</strong> tester l’hypothèse nulle µ 0 ≥ 0. En eff<strong>et</strong>, lorsque les <strong>de</strong>ux estimations coïnci<strong>de</strong>nt,cela indique que la contrainte d’inégalité n’est pas liante <strong>et</strong> donc que la valeur <strong>de</strong> la statistiquesera proche <strong>de</strong> zéro, ce qui accroît la probabilité <strong>de</strong> non rej<strong>et</strong> <strong>de</strong> l’hypothèse µ 0 ≥ 0. C’estl’inverse dans le cas où la valeur <strong>de</strong> la statisque dévie fortement <strong>de</strong> zéro. La statistique utiliséeest <strong>de</strong> la forme :T = ∆ ′ ˆΩ−1 ∆, (2.25)avec ∆ = [ˆµ 0 − ˜µ 0 ] <strong>et</strong> ˆΩ, la matrice <strong>de</strong> variances-covariances. Elle suit une somme pondérée<strong>de</strong> khi-<strong>de</strong>ux à différents <strong>de</strong>grés <strong>de</strong> liberté. Kod<strong>de</strong> <strong>et</strong> Palm (1986) fournissent les bornesinférieures <strong>et</strong> supérieures <strong>de</strong>s valeurs critiques.Certaines étu<strong>de</strong>s suggèrent plusieurs formulations à la fois. Dardanoni <strong>et</strong> Forcina (1999)analysent le classement <strong>de</strong>s courbes <strong>de</strong> Lorenz dans un contexte multivarié. En eff<strong>et</strong>, en supposantm distributions avec m ≥ 2, ils considèrent les trois hypothèses suivantes :H 0 : µ 1 = · · · = µ mH 1 : µ 1 ≥ · · · ≥ µ mH 2 : Les m courbes <strong>de</strong> Lorenz sont sans restriction.Ils effectuent <strong>de</strong>s tests <strong>de</strong> distance <strong>de</strong> H 0 vs H 2 , H 0 vs H 1 , H 1 vs H 2 ainsi que <strong>de</strong> H 2−1vs H 1 . Ils suggèrent également l’approche <strong>de</strong> la comparaison multiple <strong>et</strong> utilisent l’analyse


Chapitre 2. Mesures <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle <strong>et</strong> inférences statistiques 28<strong>de</strong> Monte Carlo pour comparer les performances. Aura (2000) réalise <strong>de</strong>s tests d’unionintersectionpour tester aussi plusieurs formulations. En considérant une grille <strong>de</strong> points, typiquement<strong>de</strong>s points <strong>de</strong> décile, il propose <strong>de</strong> tester simultanément l’hypothèse nulle H 0,i :µ 0,i = 0 ∀ i contre trois alternatives à savoir :1. A domine B si µ 0,i ≥ 0 ∀ i <strong>et</strong> µ 0,i > 0 pour au moins un i ;2. B domine A dans le cas inverse ;3. non comparabilité si µ 0,i > 0 pour au moins un i <strong>et</strong> µ 0,j < 0 pour au moins un j.En s’appuyant sur <strong>de</strong>s mesures <strong>de</strong> pauvr<strong>et</strong>é P (Z) où Z est le seuil <strong>de</strong> pauvr<strong>et</strong>é, Davidson<strong>et</strong> Duclos (2000) dérivent la distribution asymptotique <strong>et</strong> la matrice <strong>de</strong> covariances asymptotiquespour une distribution jointe lorsque les distributions sont <strong>de</strong> même taille, issues <strong>de</strong> lamême population <strong>et</strong> donc dépendantes. Ils suggèrent d’intégrer c<strong>et</strong>te structure <strong>de</strong> covariancesaux anciens tests en vue d’améliorer leur puissance. Ils dérivent également la distribution <strong>et</strong>la structure <strong>de</strong> covariances asymptotiques pour la distribution jointe tronquée lorsque Z leseuil <strong>de</strong> pauvr<strong>et</strong>é est estimé à partir <strong>de</strong>s informations <strong>de</strong> l’échantillon <strong>et</strong> donc aléatoire. Ceciperm<strong>et</strong> d’examiner les questions <strong>de</strong> dominance en pauvr<strong>et</strong>é. Peu <strong>de</strong> travaux ont été menésen vue <strong>de</strong> comparer les performances statistiques <strong>de</strong>s différents tests proposés. On peut citercependant Tse <strong>et</strong> Zhang (2004) qui, à partir <strong>de</strong> simulations <strong>de</strong> monte Carlo <strong>de</strong> distributionsindépendantes, comparent les tests d’An<strong>de</strong>rson (1996), <strong>de</strong> Davidson <strong>et</strong> Duclos (2000) <strong>et</strong> <strong>de</strong>Kaur, Rao <strong>et</strong> Singh (1994). Ils trouvent entre autres que l’utilisation <strong>de</strong> la structure <strong>de</strong> covariancessuggérée par Davidson <strong>et</strong> Duclos, à travers les tests d’union-intersection, donne lesmeilleurs résultats.Ce troisième type <strong>de</strong> formulation qui est la plus usitée semble aussi non satisfaisante. Eneff<strong>et</strong>, le non rej<strong>et</strong> <strong>de</strong> l’hypothèse nulle <strong>de</strong> dominance ne perm<strong>et</strong> pas d’accepter la dominancequi est généralement l’intérêt <strong>de</strong>s étu<strong>de</strong>s. D’un point <strong>de</strong> vue logique, il peut alors <strong>être</strong> préférable<strong>de</strong> spécifier l’hypothèse nulle <strong>de</strong> non dominance <strong>de</strong> façon à conclure forcément à ladominance lorsque les tests rej<strong>et</strong>tent c<strong>et</strong>te hypothèse (Davidson <strong>et</strong> Duclos, 2006). Les limites<strong>de</strong> la première <strong>et</strong> <strong>de</strong> la secon<strong>de</strong> formulations (H 0 : µ 0 = 0 vs H 1 ou H 2 ) étant établies, c<strong>et</strong>te


Chapitre 2. Mesures <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle <strong>et</strong> inférences statistiques 29nouvelle perspective n’est envisageable qu’à travers les formulations <strong>de</strong> type intersectionunion.2.3.2 Les tests d’intersection-union <strong>et</strong> alternativesLe principe <strong>de</strong>s tests intersection-union a été introduit par Gleser (1973) <strong>et</strong> Berger (1982).A l’inverse <strong>de</strong>s tests d’union-intersection, l’hypothèse nulle est une union d’hypothèses simplestandis que l’hypothèse alternative en est une intersection. Dans ce cas, on rej<strong>et</strong>te l’hypothèsenulle seulement lorsque toutes les hypothèses simples sont rej<strong>et</strong>ées. Lorsque les tests individuelssur les hypothèses simples H 0,i sont <strong>de</strong> niveau α, alors les théorèmes 1 <strong>et</strong> 2 <strong>de</strong> Berger(1982) <strong>et</strong> Berger <strong>et</strong> Sinclair (1984) montrent que, non seulement le test <strong>de</strong> H 0 contre H 1 est<strong>de</strong> niveau α, mais est exactement <strong>de</strong> taille α sous certaines conditions. Berger <strong>et</strong> Sinclair(1984) dérivent également un test <strong>de</strong> ratio <strong>de</strong> vraisemblance pour ce type <strong>de</strong> formulation <strong>et</strong>montrent qu’un test intersection-union proprement dit est plus puissant qu’un test <strong>de</strong> ratio<strong>de</strong> vraisemblance lorsque les paramètres testés au niveau <strong>de</strong> chaque hypothèse simple sont<strong>de</strong> dimensions différentes. Le même résultat est obtenu par Berger (1989), Berger <strong>et</strong> Saikali(2002) <strong>et</strong> Perlman <strong>et</strong> Wu (2003). La plupart <strong>de</strong> ces travaux se situent dans le cadre <strong>de</strong>s inférencesparamétriques. Il y a peu d’applications <strong>de</strong> ce principe à l’analyse <strong>de</strong> la dominancestochastique qui a plutôt recours essentiellement à <strong>de</strong>s outils non paramétriques.Kaur <strong>et</strong> al (1994) sont parmi les précurseurs <strong>de</strong> l’utilisation du principe intersectionunionpour tester la dominance stochastique. Leur approche a pour point <strong>de</strong> départ certainesinsuffisances du test <strong>de</strong> McFad<strong>de</strong>n (1989). Selon eux, la statistique <strong>de</strong> McFad<strong>de</strong>n n’a pasune forme analytique facile à manipuler <strong>et</strong> sa distribution asymptotique n’est pas entièrementcaractérisée sous l’hypothèse nulle r<strong>et</strong>enue par ce <strong>de</strong>rnier. Ainsi, les statistiques <strong>de</strong> test nepeuvent <strong>être</strong> obtenues que par les métho<strong>de</strong>s <strong>de</strong> Monte Carlo, même pour les échantillons <strong>de</strong>gran<strong>de</strong> taille. De plus le test <strong>de</strong> McFad<strong>de</strong>n suppose que les distributions sont <strong>de</strong> même taille.En supposant <strong>de</strong>ux fonctions <strong>de</strong> distributions cumulées F <strong>et</strong> G <strong>et</strong> x un point quelconque sur lesupport [a, b], pour analyser la dominance stochastique du second ordre, les auteurs proposent


Chapitre 2. Mesures <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle <strong>et</strong> inférences statistiques 30alors un test basé sur la formulation suivante :H 0 : ∫ xF (u) du ≤ ∫ xG (u) du pour certains x ∈ [a, b]−∞ −∞vsH 1 : ∫ xF (u) du > ∫ xG (u) du ∀ x ∈ [a, b]−∞ −∞L’hypothèse nulle H 0 signifie la non dominance <strong>de</strong> F par G. Kaur <strong>et</strong> al (1994) montrentque ce test est convergent <strong>et</strong> asymptotiquement borné supérieurement par α <strong>et</strong> dérivent,comme statistique, un infimum inf Z m,n (x) qui est tel qu’on rej<strong>et</strong>te H 0 si <strong>et</strong> seulement sia≤x≤binf Z m,n (x) > Z α , où Z α est le (1 − α) ième percentile <strong>de</strong> la distribution normale standarda≤x≤bN (0, 1) avec P (Z > Z α ) = α. C<strong>et</strong>te approche ne nécessite pas le recours aux métho<strong>de</strong>s <strong>de</strong>Monte Carlo <strong>et</strong> s’applique aux distributions <strong>de</strong> tailles différentes. Howes (1993) propose uneapproche similaire à la différence que les statistiques sont calculées pour <strong>de</strong>s intervalles <strong>de</strong>points.Cebrián, Denuit <strong>et</strong> Scaill<strong>et</strong> (2004) <strong>et</strong> Denuit <strong>et</strong> Scaill<strong>et</strong> (2004) réalisent également <strong>de</strong>stests d’IU à partir <strong>de</strong>s hypothèses :H 0 : µ l ≤ 0 pour certains l vs H 1 : µ l > 0 ∀ l. (2.26)La statistique <strong>de</strong> test est alors basée sur le minimum <strong>de</strong> la statistique t. Cebrián <strong>et</strong> al (2004)pensent que c<strong>et</strong>te définition <strong>de</strong>s hypothèses nulles <strong>et</strong> alternatives est la plus appropriée à restituer<strong>de</strong>s résultats plus proches <strong>de</strong> la vérité <strong>et</strong> donc <strong>de</strong>vrait possé<strong>de</strong>r les meilleures propriétés.Ils reconnaissent cependant que les approches basées sur les tests <strong>de</strong> distance <strong>de</strong> l’hypothèsenulle <strong>de</strong> dominance exploitent la structure <strong>de</strong> covariance relativement à celles basées sur lesstatistiques t.


Chapitre 2. Mesures <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle <strong>et</strong> inférences statistiques 31Davidson <strong>et</strong> Duclos (1997) adaptent l’analyse au cas où les échantillons à comparer nesont pas nécessairement indépendants. Ils établissent la distribution asymptotique <strong>de</strong>s estimateurs<strong>de</strong> quantiles <strong>et</strong> réalisent <strong>de</strong>s inférences statistiques pour mesurer les inci<strong>de</strong>nces <strong>de</strong>staxes <strong>et</strong> transferts. Ils adoptent la procédure <strong>de</strong> Howes (1993) en posant l’hypothèse nulle <strong>de</strong>non dominance contre l’alternative <strong>de</strong> dominance <strong>et</strong> en rej<strong>et</strong>ant l’hypothèse nulle en faveur<strong>de</strong> l’hypothèse alternative seulement si chaque point <strong>de</strong> l’un <strong>de</strong>s échantillons se trouve <strong>être</strong>statistiquement plus élevé que le point correspondant dans l’autre échantillon au seuil <strong>de</strong> 5%.Dardanoni <strong>et</strong> Forcina (1999) spécifient également une formulation <strong>de</strong> type intersectionunionen testant H 2−1 vs H 1 <strong>et</strong> proposent un test <strong>de</strong> distance D 21 qui coïnci<strong>de</strong> avec celui<strong>de</strong> Howes (1993) dans le contexte <strong>de</strong> la comparaison <strong>de</strong> <strong>de</strong>ux courbes <strong>de</strong> Lorenz (m = 2).Pour eux, si le souci est <strong>de</strong> minimiser l’erreur d’accepter la dominance stricte à tort, alorsla procédure <strong>de</strong> test D 21 est la plus adaptée même si elle implique un coût en termes <strong>de</strong>faiblesse <strong>de</strong> la puissance. Lorsqu’il existe <strong>de</strong> fortes présomptions <strong>de</strong> dominance stricte c<strong>et</strong>teprocédure, même si elle n’est plus la plus désirable, <strong>de</strong>meure pratique lorsque m = 2, ce quin’est plus le cas au <strong>de</strong>là <strong>de</strong> <strong>de</strong>ux distributions car elle <strong>de</strong>vient trop faible en puissance. Enintégrant la structure <strong>de</strong> covariances asymptotiques qu’ils ont dérivée, Davidson <strong>et</strong> Duclos(2000) réalisent à la fois <strong>de</strong>s tests d’union-intersection (Bishop, Formby <strong>et</strong> Thistle, 1989),<strong>de</strong> Wald (Wolak, 1989) <strong>et</strong> d’intersection-union (Howes, 1993) <strong>et</strong> montrent que ce <strong>de</strong>rnier,conformément à Dardanoni <strong>et</strong> Forcina, fonctionne <strong>bien</strong> lorsqu’il s’agit <strong>de</strong> comparer <strong>de</strong>uxdistributions.Davidson <strong>et</strong> Duclos (2006) adoptent une démarche originale dans le domaine <strong>de</strong> la dominancestochastique, basée sur la statistique du ratio <strong>de</strong> vraisemblance empirique. Ils montrent,avec leur formulation, qu’il est impossible <strong>de</strong> rej<strong>et</strong>er l’hypothèse nulle <strong>de</strong> non dominancelorsque les distributions sont continues dans les extrémités inférieures. Cependant en discrétisantles distributions, singulièrement dans les extrémités inférieures, ils dérivent à la fois<strong>de</strong>s tests asymptotiques <strong>et</strong> <strong>de</strong>s tests basés sur le bootstrap pour l’hypothèse nulle. Ils montrenten outre que la statistique basée sur la vraisemblance asymptotique est numériquement trèsproche <strong>de</strong> celle <strong>de</strong> Kaur <strong>et</strong> al (1994).


Chapitre 2. Mesures <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle <strong>et</strong> inférences statistiques 32A la lumière <strong>de</strong> la littérature existante, quelques observations méritent d’<strong>être</strong> soulevées :1. il existe très peu d’étu<strong>de</strong>s sur la dominance stochastique dont la formulation est <strong>de</strong> typeintersection-union alors que l’hypothèse nulle <strong>de</strong> dominance souvent testée n’est pastoujours la meilleure spécification ;2. très peu d’étu<strong>de</strong>s ont essayé <strong>de</strong> faire le point <strong>de</strong>s étu<strong>de</strong>s antérieures notamment par unecomparaison <strong>de</strong> leurs performances statistiques ;3. l’application <strong>de</strong> ces inférences au cas <strong>de</strong> distributions multivariées (typiquement bivariées)est très limitée alors que An<strong>de</strong>rson (2005) montre que l’intégration d’une dimensionsuplémentaire dans la mesure du <strong>bien</strong>-<strong>être</strong>, ce qui est conforme aux suggestions<strong>de</strong> Sen (1992), pourrait modifier les analyses effectuées dans le cadre habituel <strong>de</strong> distributionsunivariées 10 .2.4 ConclusionLe <strong>bien</strong>-<strong>être</strong> est maintenant largement reconnu comme un phénomène multidimensionnelpar les économistes. Plusieurs mesures ont ainsi été proposées pour appréhen<strong>de</strong>r la pauvr<strong>et</strong>émultidimensionnelle. Certaines <strong>de</strong> ces mesures sont non axiomatiques. On y distingue entreautres les métho<strong>de</strong>s <strong>de</strong>s ensembles flous (Za<strong>de</strong>h, 1965 ; Cheli <strong>et</strong> Lemmi, 1995 ; Chiappero,2000 ; Szeles, 2004 ; B<strong>et</strong>ti <strong>et</strong> al, 2005), l’approche <strong>de</strong> la fonction <strong>de</strong> distance (Lovell <strong>et</strong> al,1994 ; An<strong>de</strong>rson <strong>et</strong> al, 2005 ; Deutsch <strong>et</strong> Silber, 2005), la théorie <strong>de</strong> l’information (Theil,1967 ; Maasoumi, 1986 <strong>et</strong> 1993 ; Maasoumi <strong>et</strong> Nickelsburg, 1988 ; Deutsch <strong>et</strong> Silber, 2005)<strong>et</strong> les métho<strong>de</strong>s d’inertie (Meulman, 1992 ; Klasen, 2000 ; Sahn <strong>et</strong> Stifel, 2000 <strong>et</strong> 2003).Cependant, certains économistes jugent ces métho<strong>de</strong>s assez arbitraires, notamment dansle choix d’une mesure particulière <strong>et</strong> les conclusions subséquentes (Bourguignon <strong>et</strong> Chakravarty,2002). Par ailleurs, la plupart <strong>de</strong> ces métho<strong>de</strong>s reviennent à réduire plusieurs aspects du10 Pour les étu<strong>de</strong>s ayant traité <strong>de</strong> dominance stochastique dans le cadre <strong>de</strong> distributions multivariées, voir entreautres Crawford (2005) <strong>et</strong> Duclos <strong>et</strong> al (2006)


Chapitre 2. Mesures <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle <strong>et</strong> inférences statistiques 33<strong>bien</strong>-<strong>être</strong> à un indicateur unique, occultant dans une large mesure la nature <strong>et</strong> les spécificités<strong>de</strong> chaque aspect. Les mesures axiomatiques perm<strong>et</strong>tent alors <strong>de</strong> réduire ce <strong>de</strong>gré d’arbitraireen proposant <strong>de</strong>s indices <strong>de</strong> pauvr<strong>et</strong>é basés sur un certain nombre <strong>de</strong> postulats raisonnables. Ilest alors possible <strong>de</strong> comparer la pauvr<strong>et</strong>é dans plusieurs dimensions à la fois sans <strong>être</strong> obligé<strong>de</strong> les synthétiser en une moyenne. Cependant, le problème <strong>de</strong> la malédiction <strong>de</strong> la dimensionnalitépeut se poser lorsqu’on considère un grand nombre <strong>de</strong> dimensions. C’est pourquoi,la plupart <strong>de</strong>s étu<strong>de</strong>s se limitent à <strong>de</strong>s indices comportant <strong>de</strong>ux ou trois dimensions.Au niveau <strong>de</strong>s inférences statistiques, il apparaît que la plupart <strong>de</strong>s tests <strong>de</strong> dominancestochastique sont basés sur <strong>de</strong>s formulations du type union-intersection. Toutefois, pour établir<strong>de</strong>s comparaisons robustes <strong>et</strong> univoques en terme <strong>de</strong> dominance stricte, une formulationdu type intersection-union s’avère plus pertinente. Les métho<strong>de</strong>s, basées sur le ratio <strong>de</strong> vraisemblanceempirique, développées par Davidson <strong>et</strong> Duclos (2006), si elles sont étendues auxcas <strong>de</strong> distributions multivariées, peuvent constituer un cadre statistique adéquat pour réaliser<strong>de</strong>s comparaisons <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle. La problématique du chapitre suivantest basée sur une synthèse <strong>de</strong> la littérature sur les inférences statistiques en dominance stochastique.


Bibliographie[1] d’Ambrosio C., J. Deutsch <strong>et</strong> J. Silber (2004), “Multidimensional Approaches to PovertyMeasurement : An Empirical Analysis of Poverty in Belgium, France, Germany,Italy and Spain Based on the European Panel”, 28 th General Conference of The internationalAssociation for Research in Income and Wealth.[2] An<strong>de</strong>rson, G. (1996), “Nonparam<strong>et</strong>ric Tests of Stochastic Dominance in Income Distribution”,Econom<strong>et</strong>rica, 64, 1183-1193.[3] An<strong>de</strong>rson, G. (2005), “Life Expectancy and Economic Welfare : The Example of africain the 1990s”, Review of Income and Wealth, 51, 455-468.[4] An<strong>de</strong>rson, G., Crawford, I. <strong>et</strong> A. Liecester (2005), “Statistical Tests for MultidimensionalPoverty Analysis”, International Conference : The many Dimensions of Poverty,Brasilia, Brazil, August.[5] Asselin, L.-M. (2002), “Multidimensional Poverty : theory”, Institut <strong>de</strong> MathématiqueGauss.[6] Atkinson, A. B. (2003), “Multidimensional Deprivation : Constrasting Social Welfareand Counting Approaches”, Journal of Economic Inequality, 1, 51-65.[7] Aura, S. (2000), “Statistical Inference for Lorenz Curves Using Simulated Critical Values”,Journal of Income Distribution, 9, 199-213.[8] Barr<strong>et</strong>t, G. F., Bhattacharya, D. <strong>et</strong> S. G. Donald (2004), “A Comparaison of ConsistentNonparam<strong>et</strong>ric Tests for Lorenz Dominance”, Economics Department Seminars, MacquarieUniversity.


Bibliographie 35[9] Barr<strong>et</strong>t, G. F. <strong>et</strong> S. G. Donald (2003), “Consistent Tests for Stochastic Dominance”,Econom<strong>et</strong>rica, 71, 71-104.[10] Beach, C. M. <strong>et</strong> R. Davidson (1983), “Distribution-Free Statistical Inference with LorenzCurves and Income Shares”, The Review of Economic Studies, 50, 723-735.[11] Beach, C. M. <strong>et</strong> J. Richmond (1985), “Joint Confi<strong>de</strong>nce Intervals for Income Shares andLorenz Curves”, International Economic Review, 26, 439-450.[12] Berger, R. L. (1982), “Multiparam<strong>et</strong>er Hypothesis Testing and Acceptance Sampling”,Technom<strong>et</strong>rics, 24, 295-300.[13] Berger, R. L. (1989), “Uniformly More Powerful Tests for Hypotheses Concerning LinearInequalities and Normal Means”, Journal of the American Statistical Association,84, 192-199.[14] Berger, R. L. <strong>et</strong> K. G. Saikali (2002), “More Powerful Tests for the Sign Testing Problem”,Journal of Statistical Planning and Inference, 107, 187-205.[15] Berger, R. L. <strong>et</strong> D. F. Sinclair (1984), “Testing Hypotheses Concerning Unions of LinearSubspaces”, Journal of the American Statistical Association, 79, 158-163.[16] B<strong>et</strong>ti, G., Cheli, B., Lemmi, A. <strong>et</strong> N. Pannuzi (2005), “Estimating the Dynamics ofPoverty in Europe Via a TFR Approach : The Experience of the Second Half of theNin<strong>et</strong>ies”, 1 rst Me<strong>et</strong>ing of the Soci<strong>et</strong>y for the Study of Economic Inequality, Palma <strong>de</strong>Mallorca, Spain, July.[17] Bibi S. (2005), “Measuring Poverty in a Multidimensional Perspective : A Review ofLiterature”, PMMA Working Paper 2005-7.[18] Bishop, A. J., Chakraborti, S. <strong>et</strong> P. D. Thistle (1989), “Asymptotically Distribution-FreeStatistical Inference for Generalized Lorenz Curves”, The Review of Economics andStatistics, 71, 725-727.[19] Bishop, A. J., Formby, J. P. <strong>et</strong> P. D. Thistle (1989), “Statistical Inference, Income Distributions,and Social Welfare”, In D. J. Slottje (Ed.), Research on Income Inequality, 1,49-91.


Bibliographie 36[20] Bishop, A. J., Formby, J. P. <strong>et</strong> P. D. Thistle (1992), “Convergence of the South and Non-South Income Distributions, 1969-1979”, The American Economic Review, 82, 262-272.[21] Bourguignon, F. <strong>et</strong> S. R. Chakravarty (2002), “Multidimensional Poverty Or<strong>de</strong>rings”,DELTA Working Paper 2002-22.[22] Bourguignon, F. <strong>et</strong> S. R. Chakravarty (2003), “The Measurement of MultimensionalPoverty”, Journal of Economic Inequality, 1, 25-49.[23] Bourguignon, F. <strong>et</strong> G. Fields (1997), “Discontinuous Losses from Poverty, GeneralizedMeasures and Optimal Transfers to the Poor”, Journal of Public Economics, 63, 155-175.[24] Cebrián, A. C., Denuit. M. <strong>et</strong> O. Scaill<strong>et</strong> (2004), “Testing for Concordance Or<strong>de</strong>ring”,ASTIN Bull<strong>et</strong>in, 34, 151-173.[25] Cerioli, A. <strong>et</strong> S. Zani (1990), “A Fuzzy Approach to the Measurement of Poverty”, inDagum C. and M. Zenga (eds), Income and Wealth Inequality and Poverty, Studies inContemporary Economics, Springer Verlag, Berlin, 272-284.[26] Chakravarty, S. R., Deutsch, J. <strong>et</strong> J. Silber (2005), “On the Watts Multimensional PovertyIn<strong>de</strong>x”, International Conference, The Many Dimensions of Poverty, Brasilia, August.[27] Cheli, B. <strong>et</strong> A. Lemmi (1995), “A Totally Fuzzi and Relative Approach to the MultidimensionalAnalysis of Poverty”, Economic Notes, 24, 115-134.[28] Chiappero, M. E. (2000), “A Multidimensional Assessment of Well-Being based onSen’s Functioning Approach”, Rivista Internazionale di Science Sociali, 2, 207-239.[29] Crawford, I. (2005), “A Nonparam<strong>et</strong>ric Test of Stochastic Dominance in MultivariateDistributions”, Discussion Papers in Economics, University of Surrey.[30] Dardanoni, V. <strong>et</strong> A. Forcina (1999), “Inference for Lorenz Curve Or<strong>de</strong>rings”, Econom<strong>et</strong>ricsJournal, 2, 49-75.[31] Davidson, R. <strong>et</strong> J.-Y. Duclos (1997), “Statistical Inference for the Measurement of theInci<strong>de</strong>nce of Taxes and Transfers”, Econom<strong>et</strong>rica, 65, 1453-1465.


Bibliographie 37[32] Davidson, R. <strong>et</strong> J.-Y. Duclos (2000), “Statistical Inference for Stochastic Dominanceand for the Measurement of Poverty and Inequality”, Econom<strong>et</strong>rica, 68, 1435-1464.[33] Davidson, R. <strong>et</strong> J.-Y. Duclos (2006), “Testing for Restricted Stochastic Dominance”,IZA Discussion Paper No 2047.[34] Denuit, M. <strong>et</strong> O. Scaill<strong>et</strong> (2004), “Nonparam<strong>et</strong>ric Tests for Positive Quadrant”, Journalof Financial Econom<strong>et</strong>rics, 2, 422-450.[35] Deutsch, J. <strong>et</strong> J. Silber (2005), “Measuring Multidimensional Poverty : An EmpiricalComparaison of Various Approaches”, Review of Income and Wealth, 51, 145-174.[36] Donaldson, D. <strong>et</strong> J. A. Weymark (1986), “Properties of Fixed Population Poverti Indices”,International Economic Review, 27, 667-688.[37] Drèze, J. <strong>et</strong> A. Sen (1989), Hunger and Public Action, Oxford University Press, Oxford.[38] Duclos, J.-Y., D. E. Sahn <strong>et</strong> S. D. Younger (2006), “Robust Multidimensional PovertyComparison”, Economic Journal, 113, 943-968.[39] Fisher, G., Willson, D. <strong>et</strong> K. Xu (1996), “Testing First and Second-Or<strong>de</strong>r StochasticDominance”, The Canadian Journal of Economics, 29, Special Issue, Part 2, S562-S564.[40] Fisher, G., Willson, D. <strong>et</strong> K. Xu (1998), “An Empirical Analysis of Term PremiumsUsing Significance Tests for Stochastic Dominance”, Economics L<strong>et</strong>ters, 60, 195-203.[41] Foster, J. E., Greer, J. <strong>et</strong> E. Thorbecke (1984), “A Class of Decomposable Poverty Measures”,Econom<strong>et</strong>rica, 52, 761-766.[42] Foster, J. E. <strong>et</strong> A. F. Shorrocks (1991), “Subgroup Consistent Poverty Indics”, Econom<strong>et</strong>rica,59, 687-709.[43] Gastwirth, J. L. <strong>et</strong> M. H. Gail (1985), “Simple Asymptotically Distribution-Free M<strong>et</strong>hodsfor Comparing Lorenz Curves and Gini Indices Obtained from Compl<strong>et</strong>e Data”,In Basmann R.L. and G. F. Rho<strong>de</strong>s Jr. (Ed.), Advances in Econom<strong>et</strong>rics, 4, 229-243.[44] Gleser, L. J. (1973), “On a Theory of Intersection-Union Tests”, Institute of MathematicalStatistics Bull<strong>et</strong>in (Abstract), 2, 233.


Bibliographie 38[45] Goodman, A. W. (1967), Mo<strong>de</strong>rn Calculus with Analytical Geom<strong>et</strong>ry, Vol. 1, New York,MacMillan.[46] Gourieroux C., Holly, A. <strong>et</strong> A. Monfort (1982), “Likelihood Ratio Test, Wald Test,and Kuhn-Tucker Test in Linear Mo<strong>de</strong>ls with Inequality Constraints on the RegressionParam<strong>et</strong>ers”, Econom<strong>et</strong>rica, 50, 63-80.[47] Heshmati, A. <strong>et</strong> E. Maasoumi (1998), “Stochastic Dominance Amongst Swedish IncomeDistributions”, Working Paper Series in Economics and Finance 279, StockolmSchool of Economics.[48] Heshmati, A. <strong>et</strong> E. Maasoumi (2005), “Evaluating Dominance Ranking of PSID Incomesby Various Household Attributes”, IZA Discussion Papers 1727.[49] Howes, S. (1993), “Asymptotique Properties of Four Fundamental Curves of DistributionalAnalysis”, Unpublished paper, STICERD, London School of Economics.[50] Horváth, L., Kokoszka, P. <strong>et</strong> R. Zitikis (2006), “Testing for Stochastic Dominance Usingthe Weighted McFad<strong>de</strong>n Type Statistic”, Journal of Econom<strong>et</strong>rics, 133, 191-205.[51] Kaur, A., Rao, B. L. S. P. <strong>et</strong> H. Singh (1994), “Testing for Second-Or<strong>de</strong>r StochasticDominance of Two Distributions”, Econom<strong>et</strong>ric Theory, 10, 849-866.[52] Klasen, S. (2000), “Measuring Poverty and Deprivation in South Africa”, Review ofIncome and Wealth, 46, 33-58.[53] Kod<strong>de</strong>, D. A. <strong>et</strong> F. C. Palm (1986), “Wald Criteria for Jointly Testing Equality andInequality Restrictions”, Econom<strong>et</strong>rica, 54, 1243-1248.[54] Kolm, S.-C. (1977), “Multidimensional Egalitarianisms”, The Quarterly Journal ofEconomics, 91, 1-13.[55] Linton, O., Maasoumi, E. <strong>et</strong> Y.-J. Whang (2005), “Consistent Testing for StochasticDominance un<strong>de</strong>r General Sampling Schemes”, The Review of Economic Studies, 72,735-765.[56] Linton, O., Post, T. <strong>et</strong> Y.-J. Whang (2005), “Testing for Stochastic Dominance Efficiency”,ERIM Report Series Research in Management No. ERS-2005-033-F&A.


Bibliographie 39[57] Lovell, C. A. K., Richardson, S., Travers, P. <strong>et</strong> L. Wood (1994), “Resources and Functionings: A New View of Inequality in Australia”, in Eichhorn W. (ed.), Mo<strong>de</strong>les andMeasurement of Welfare and Inequality, Springer Verlag Hei<strong>de</strong>lberg.[58] Maasoumi, E. (1986), “The Measurement and Decomposition of Multi-DimensionalInequality”, Econom<strong>et</strong>rica, 54, 991-998.[59] Maasoumi, E. (1993), “A Compendium to Information Theory in Economics and Econom<strong>et</strong>rics”,Econom<strong>et</strong>ric Reviews, 12, 1-49.[60] Maasoumi, E. (2001), “Param<strong>et</strong>ric and Nonparam<strong>et</strong>ric Tests of Limited Domain andOr<strong>de</strong>red Hypotheses in Economics”, Chapitre 25, in B. Baltagi (Ed.), A Companion toEconom<strong>et</strong>ric Theory, Basil Blackwell.[61] Maasoumi, E. <strong>et</strong> G. Nickelsburg (1988), “Multivariate Measures of Well-Being and anAnalysis of Inequality in the Michigan Data”, Journal of Business and Economic Statistics,6, 327-334.[62] Maasoumi, E. <strong>et</strong> D. L. Millim<strong>et</strong> (2005), “Robust Inference Concerning Recent Trendsin US Environmental Quality”, Journal of Applied Econom<strong>et</strong>rics, 20, 55-77.[63] Maggio, D. (2004), “Multidimensional Analysis of Poverty Dynamics in UK”, ISERWorking Papers, No 2004-10.[64] McFad<strong>de</strong>n, D. (1989), “Testing for Stochastic Dominance”, in Fomby T. B. and T. K.Seo (Ed.), Studies in the Economics of Uncertainty, New York, Wiley.[65] Meulman, J. J. (1992), “The Integration of Multidimensional Scaling and Multivariatewith Optimal Transformation”, Psychom<strong>et</strong>rika, 57, 539-565.[66] Morimune, K. <strong>et</strong> Y. Murasawa (2002), “Statistical Inference for Generalized LorenzDominance Based on Grouped Data : A Reconsi<strong>de</strong>ration”, Discussion Paper 2002-1.[67] Perlman, M. D. <strong>et</strong> L. Wu (2003), “On the Validity of the Likelihood Ratio and MaximumLikelihood M<strong>et</strong>hods”, Journal of Statistical Planning and Inference, 117, 59-81.[68] Rao, C. R. (1965), Linear Statistical Inference and Its Application, New York, Wiley.[69] Ravallion, M. <strong>et</strong> S. Chen (1997), “What Can New Survey Data Tell Us About RecentChanges in Distribution and Poverty ?”, World Bank Economic Review, 11, 357-382.


Bibliographie 40[70] Roy, S. N. (1953), “On a Heuristic M<strong>et</strong>hod of Test Construction and its use in MultivariateAnalysis”, The Annals of Mathematical Statistics, 24, 220-238.[71] Sahn, D. E. <strong>et</strong> D. C. Stifel (2000), “Poverty Comparisons Over Time and Across Countriesin Africa ”, World Development, 28, 2123-2155.[72] Sahn, D. E. <strong>et</strong> D. C. Stifel (2003), “Exploring Alternative Measures of Welfare in theAbsence of Expenditure Data”, Review of Income and Wealth, 49, 463-489.[73] Savin, N. E. (1980), “The Bonferroni and Sheffe Multiple Comparaison Procedures”,Reviews of Economic Studies, 47, 255-273.[74] Scaill<strong>et</strong>, O. <strong>et</strong> N. Topaloglou (2005), “Testing for Stochastic Efficiency”, FAME ResearchPaper No. 154.[75] Schmid, F. <strong>et</strong> M. Tre<strong>de</strong> (1996), “Nonparam<strong>et</strong>ric Inference for Second Or<strong>de</strong>r StochasticDominance”, Discussion Papers in Statistics and Econom<strong>et</strong>rics, No. 2/96, University ofCologne.[76] Schmid, F. <strong>et</strong> M. Tre<strong>de</strong> (1998), “A Kolmogorov-Type Test fot Second-Or<strong>de</strong>r StochasticDominance”, Statistics and Probability L<strong>et</strong>ters, 37, 183-193.[77] Sen, A. (1976), “Poverty : An Ordinal Approach to Measurement”, Econom<strong>et</strong>rica, 44,219-231.[78] Sen, A. (1979), “Personal Utilities and Public Judgements : Or what’s Wrong with WelfareEconomics”, The Economic Journal, 89, 537-558.[79] Sen, A. (1985), Commodities and Capabilities, North-Holland, Amsterdam.[80] Sen, A. (1987), The Standard of Living, Cambridge University Press, Cambridge.[81] Sen, A. (1992), Inequality Reexamined, Harvard University Press.[82] Sen, A. (1995), “The Political Economy of Targ<strong>et</strong>ing”, in D. van <strong>de</strong>r Walle and K. Nead(eds), Public Spending and the Poor : Theory and Evi<strong>de</strong>nce, Johns Hopkins UniversityPress, Baltimore.[83] Stoline, M. R. <strong>et</strong> H. K. Ury (1979), “Table of the Stu<strong>de</strong>ntized Maximum Modulus Distributionand an Application to Multiple <strong>Comparaisons</strong> among Means”, Technom<strong>et</strong>rics,21, 87-93.


Bibliographie 41[84] Szeles, M. (2004), “Multidimensional Poverty Comparisons within Europe : Evi<strong>de</strong>ncefrom the European Community Household Panel”, IRISS Working Paper Series No2004-05.[85] Theil, H. (1967), Economics and Information Theory, Amsterdam, North-Holland.[86] Tse, Y. K. <strong>et</strong> X. B. Zhang (2004), “A Monte Carlo Investigation of Some Tests forStochastic Dominance”, Journal of Statistical Computation and Simulation, 74, 361-378.[87] Tsui, K.-Y. (2002), “Multidimensional Poverty indice ?”, Social Choice and Welfare,19, 69-93.[88] Watts, H. (1968), “An Economic Definition of Poverty”, in D. P. Moynihan (eds), OnUn<strong>de</strong>rstanding Poverty, Basic Books, New York.[89] Wolak, F. A. (1989), “Testing Inequality Constraints in Linear Econom<strong>et</strong>ric Mo<strong>de</strong>ls”,Journal of Econom<strong>et</strong>rics, 41, 205-235.[90] Xu, K. (1997), “Asymptotically Distribution-Free Statistical Test for Generalized LorenzCurves : An Alternative Approach”, Journal of Income Distribution, 7, 45-62.[91] Za<strong>de</strong>h, L. A. (1965), “Fuzzy S<strong>et</strong>s”, Information and Control, 8, 338-353.


Chapitre 3Tests <strong>de</strong> comparaisons <strong>de</strong> la pauvr<strong>et</strong>émultidimensionnelle basés sur le ratio <strong>de</strong>vraisemblance empirique3.1 IntroductionPlusieurs tests ont été développés <strong>de</strong>puis les cinq <strong>de</strong>rnières décennies dont certains onttrouvé leurs applications dans les comparaisons <strong>de</strong> <strong>bien</strong>-<strong>être</strong>. Il s’agit entre autres <strong>de</strong> comparer<strong>de</strong>ux ou plusieurs distributions représentant <strong>de</strong>s profils <strong>de</strong> pauvr<strong>et</strong>é ou d’inégalité. Enprésence d’hypothèses composites <strong>et</strong> dépendamment <strong>de</strong> la façon <strong>de</strong> les formuler, les testsusuels aussi <strong>bien</strong> paramétriques que non paramétriques peuvent <strong>être</strong> appliqués alternativementavec <strong>de</strong>s tests d’union-intersection (UI) ou <strong>de</strong>s tests d’intersection-union (IU).Le principe <strong>de</strong>s tests UI qui remonte à Roy (1953) consiste, lorsque l’hypothèse nulleH 0 est une intersection d’hypothèses simples H 0i <strong>et</strong> l’hypothèse alternative (H 1 ) une union,à tester chacune <strong>de</strong>s hypothèses simples <strong>et</strong> à rej<strong>et</strong>er H 0 seulement quand au moins une <strong>de</strong>shypothèses H 0i est rej<strong>et</strong>ée. La plupart <strong>de</strong>s tests <strong>de</strong> dominance stochastique sont basés sur laformulation <strong>de</strong> type UI. Une première spécification est <strong>de</strong> poser l’hypothèse nulle d’égalitéentre <strong>de</strong>ux distributions contre l’alternative <strong>de</strong> non restriction. Beach <strong>et</strong> Davidson (1983)proposent un test <strong>de</strong> Wald tandis que Bishop, Formby <strong>et</strong> Thistle (1989,1992), s’appuyant sur


Chapitre 3. Tests <strong>de</strong> comparaisons <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle 43les travaux <strong>de</strong> Beach <strong>et</strong> Richmond (1985), suggèrent plutôt un test d’UI où leur statistique quiest asymptotiquement normale standard N (0, 1) est comparée aux valeurs critiques baséessur la distribution SMM 1 dont la table est fournie par Stoline <strong>et</strong> Ury (1979). C<strong>et</strong>te formulationpeut cependant paraître vague <strong>et</strong> non informative dans la mesure où, si l’on rej<strong>et</strong>te l’hypothèsenulle d’égalité, il est alors difficile <strong>de</strong> discerner entre la dominance <strong>et</strong> la non comparabilité(Fisher, Willson <strong>et</strong> Xu, 1996). En pratique, si la position <strong>de</strong>s courbes <strong>de</strong> dominance peutperm<strong>et</strong>tre <strong>de</strong> lever partiellement l’ambiguïté dans le cas <strong>de</strong> la dominance <strong>de</strong> premier ordre,la situation peut se révéler compliquée pour les ordres <strong>de</strong> dominance supérieurs ou dans uncontexte multidimensionnel.La formulation la plus usitée <strong>et</strong> relativement récente est <strong>de</strong> tester l’hypothèse nulle <strong>de</strong>dominance contre l’hypothèse alternative <strong>de</strong> non dominance. La majorité <strong>de</strong> ces tests sont<strong>de</strong> type Kolmogorov-Smirnov (KS) où la statistique <strong>de</strong> test est basée sur un supremum (Mc-Fad<strong>de</strong>n, 1989 ; Schmid <strong>et</strong> Tre<strong>de</strong>, 1996 <strong>et</strong> 1998). Certaines étu<strong>de</strong>s proposent <strong>de</strong>s extensionsdu test KS en faisant recours aux techniques <strong>de</strong> simulations <strong>et</strong> <strong>de</strong> bootstrap pour analyserla dominance stochastique du premier <strong>et</strong> du second ordre (Heshmati <strong>et</strong> Maasoumi, 1998 <strong>et</strong>2005 ; Linton, Maasoumi <strong>et</strong> Whang, 2005 ; Linton, Post <strong>et</strong> Whang, 2005 ; Maasoumi <strong>et</strong> Millim<strong>et</strong>,2005). D’autres étu<strong>de</strong>s comme celles <strong>de</strong> Barr<strong>et</strong>t <strong>et</strong> Donald (2003), Horváth, Kokoszka<strong>et</strong> Zitikis (2006) <strong>et</strong> Scaill<strong>et</strong> <strong>et</strong> Topaloglou (2005) éten<strong>de</strong>nt l’analyse à la dominance d’ordresupérieur à <strong>de</strong>ux. En s’inspirant <strong>de</strong> Kod<strong>de</strong> <strong>et</strong> Palm (1986) <strong>et</strong> <strong>de</strong> Wolak (1989), Xu (1997)<strong>et</strong> Fisher, Willson <strong>et</strong> Xu (1998) proposent une alternative aux tests <strong>de</strong> la famille KS quiconsiste à construire une statistique <strong>de</strong> test basée sur une mesure normalisée entre un estimateurcontraint <strong>et</strong> un estimateur non contraint. Davidson <strong>et</strong> Duclos (2000) dérivent une structure<strong>de</strong> covariances asymptotiques susceptible d’améliorer la puissance <strong>de</strong>s tests précé<strong>de</strong>nts. Toutefois,c<strong>et</strong>te secon<strong>de</strong> formulation, tout comme la première, semble aussi peu satisfaisante. Eneff<strong>et</strong>, le non rej<strong>et</strong> <strong>de</strong> l’hypothèse nulle <strong>de</strong> dominance ne perm<strong>et</strong> pas d’accepter la dominancequi est généralement l’intérêt <strong>de</strong>s étu<strong>de</strong>s, puisque l’hypothèse nulle est formulée <strong>de</strong> telle façonqu’on ne distingue pas entre la dominance <strong>et</strong> l’équivalence entre les <strong>de</strong>ux distributions.D’un point <strong>de</strong> vue logique, il peut alors <strong>être</strong> préférable, selon Davidson <strong>et</strong> Duclos (2006), <strong>de</strong>1 Stu<strong>de</strong>ntized maximum modulus.


Chapitre 3. Tests <strong>de</strong> comparaisons <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle 44spécifier l’hypothèse nulle <strong>de</strong> non dominance <strong>de</strong> façon à conclure forcément à la dominancelorsque les tests rej<strong>et</strong>tent c<strong>et</strong>te hypothèse. Ceci est envisageable à travers les formulations <strong>de</strong>type IU.Le principe <strong>de</strong>s tests IU introduit par Gleser (1973) <strong>et</strong> Berger (1982), à l’inverse <strong>de</strong>s testsUI, consiste à spécifier H 0 comme une union d’hypothèses simples <strong>et</strong> H 1 comme une intersection,<strong>et</strong> à rej<strong>et</strong>er l’hypothèse nulle seulement lorsque toutes les hypothèses simples sontrej<strong>et</strong>ées. Si les avantages d’une telle formulation ont été discutés dans le cadre <strong>de</strong>s inférencesparamétriques (Berger, 1982 <strong>et</strong> 1989 ; Berger <strong>et</strong> Sinclair, 1984 ; Berger <strong>et</strong> Saikali, 2002), ily a peu d’applications <strong>de</strong> ce principe à l’analyse <strong>de</strong> la dominance stochastique qui a plutôtrecours essentiellement à <strong>de</strong>s outils non paramétriques. S’appuyant sur l’hypothèse nulle <strong>de</strong>non dominance contre l’alternative <strong>de</strong> dominance, Howes (1993), Kaur, Rao <strong>et</strong> Singh (1994),Cebrián, Denuit <strong>et</strong> Scaill<strong>et</strong> (2004) ainsi que Denuit <strong>et</strong> Scaill<strong>et</strong> (2004) proposent une statistique<strong>de</strong> test basée sur l’infimum qui suit la distribution normale standard N (0, 1). Davidson <strong>et</strong> Duclos(2006) adoptent une démarche originale axée sur la statistique du ratio <strong>de</strong> vraisemblanceempirique. Même s’ils obtiennent que leur statistique est asymptotiquement équivalente à lastatistique <strong>de</strong> Kaur <strong>et</strong> al (1994), son estimation offre, à travers <strong>de</strong>s calculs <strong>de</strong> probabilités souscontraintes, la possibiliter <strong>de</strong> procé<strong>de</strong>r à <strong>de</strong>s tests <strong>de</strong> bootstrap qui apparaissent meilleurs auxtests asymptotiques. À la lumière <strong>de</strong> la littérature existente, un double constat peut <strong>être</strong> fait :(i) il existe très peu d’étu<strong>de</strong>s dont la formulation est <strong>de</strong> type IU alors que l’hypothèsenulle <strong>de</strong> dominance souvent testée n’est pas toujours la meilleure spécification ;(ii) l’application <strong>de</strong> ces inférences au cas <strong>de</strong> distributions multivariées est très limitéealors que An<strong>de</strong>rson (2005) montre que l’intégration d’une dimension suplémentaire dans lamesure du <strong>bien</strong>-<strong>être</strong>, ce qui est conforme aux suggestions <strong>de</strong> Sen (1992), pourrait modifierles analyses effectuées dans le cadre habituel <strong>de</strong> distributions univariées 1 .1 Les rares étu<strong>de</strong>s ayant testé la dominance stochastique dans le cadre <strong>de</strong> distributions multivariées sont celles<strong>de</strong> Crawford (2005) <strong>et</strong> <strong>de</strong> Duclos, Sahn <strong>et</strong> Younger (2006)


Chapitre 3. Tests <strong>de</strong> comparaisons <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle 45Pour répondre à c<strong>et</strong>te double préoccupation, le présent papier étend la démarche <strong>de</strong> Davidson<strong>et</strong> Duclos (2006) à un contexte <strong>de</strong> distributions bivariées.La section 2 décrit l’approche multidimensionnelle <strong>de</strong> la dominance stochastique. La section3 présente les métho<strong>de</strong>s d’estimation basées sur la fonction <strong>de</strong> vraisemblance empirique.On y dérive la statistique du ratio <strong>de</strong> vraisemblance ainsi que les procédures du test. La section4 décrit les expériences <strong>de</strong> Monte Carlo, en présentant la méthodologie <strong>de</strong> génération <strong>de</strong>sdonnées <strong>et</strong> les résultats <strong>de</strong>s simulations. La <strong>de</strong>rnière section conclut le papier.3.2 La dominance stochastique multidimensionnelleIl s’agit dans c<strong>et</strong>te section <strong>de</strong> décrire les extensions <strong>multidimensionnelles</strong> <strong>de</strong> l’approche <strong>de</strong>la dominance stochastique développée par Atkinson (1987) <strong>et</strong> Foster <strong>et</strong> Shorrocks (1988a,b,c)dans un cadre unidimensionnel. Cela perm<strong>et</strong> <strong>de</strong> procé<strong>de</strong>r à <strong>de</strong>s comparaisons ordinales <strong>de</strong>pauvr<strong>et</strong>é. Bourguignon <strong>et</strong> Chakravarty (2002) proposent une démarche qui s’inspire <strong>de</strong> Levy<strong>et</strong> Paroush (1974) <strong>et</strong> <strong>de</strong> Atkinson <strong>et</strong> Bourguignon (1982). L’analyse multidimensionnelle introduitune nouvelle considération qui est <strong>de</strong> faire la distinction entre l’approche <strong>de</strong> l’union<strong>et</strong> <strong>de</strong> celle <strong>de</strong> l’intersection dans l’i<strong>de</strong>ntification <strong>de</strong>s pauvres (Atkinson, 2003 ; Bourguignon<strong>et</strong> Chakravarty, 2003 ; Duclos, Sahn <strong>et</strong> Younger, 2006).Soient <strong>de</strong>ux fonctions <strong>de</strong> distributions cumulatives F <strong>et</strong> G <strong>de</strong>finies sur [0, a 1 ] × [0, a 2 ], lesindices <strong>de</strong> pauvr<strong>et</strong>é associés à ces distributions sont :P (F, z) = ∫ a 10∫ a20π (x 1 , x 2 ; z 1 , z 2 ) dF (x 1 , x 2 )P (G, z) = ∫ a 10∫ a20π (x 1 , x 2 ; z 1 , z 2 ) dG (x 1 , x 2 )π() est la fonction <strong>de</strong> pauvr<strong>et</strong>é individuelle. L’objectif étant <strong>de</strong> comparer les indices <strong>de</strong>pauvr<strong>et</strong>é, l’on s’intéresse plutôt à leur différence :


Chapitre 3. Tests <strong>de</strong> comparaisons <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle 46∆P (z) = P (F, z) − P (G, z) = ∫ a 10∫ a20π (x 1 , x 2 ; z 1 , z 2 ) dH (x 1 , x 2 ) ,avec H (x 1 , x 2 ) = F (x 1 , x 2 ) − G (x 1 , x 2 ).On dira alors que F domine (faiblement) G en pauvr<strong>et</strong>é si ∆P (z) est négatif (non positif).3.2.1 La dominance <strong>de</strong> premier ordreDuclos <strong>et</strong> al (2006) définissent un indice additif 2 <strong>de</strong> pauvr<strong>et</strong>é compatible avec les troistypes <strong>de</strong> seuil (intersection, union <strong>et</strong> intermédiaire) :∫ ∫P (λ) = π (x 1 , x 2 ; λ) dF (x 1 , x 2 ) , (3.1)Λ(λ)où λ (x 1 , x 2 ) est un indicateur résumé du <strong>bien</strong>-<strong>être</strong>, λ (x 1 , x 2 ) = 0 la frontière ou le seuil <strong>de</strong>pauvr<strong>et</strong>é <strong>et</strong> Λ (λ), l’ensemble <strong>de</strong>s pauvres dépendant <strong>bien</strong> entendu du type <strong>de</strong> seuil r<strong>et</strong>enu.Ils présentent alors un exemple d’indice <strong>de</strong> pauvr<strong>et</strong>é multidimensionnelle qui n’est autrequ’une extension bidimensionnelle <strong>de</strong> l’indice FGT <strong>de</strong> Foster <strong>et</strong> al (1984) :P α1 ,α 2(z 1 , z 2 ) =∫ z1∫ z20 0(z 1 − x 1 ) α 1(z 2 − x 2 ) α 2dF (x 1 , x 2 ) . (3.2)α 1 , α 2 ≥ 0 captent l’aversion à l’inégalité vis-à-vis <strong>de</strong> la pauvr<strong>et</strong>é dans les <strong>de</strong>ux dimensions.Ils donnent certaines interprétations <strong>de</strong> P α1 ,α 2(z 1 , z 2 ) pour diverses combinaisons <strong>de</strong>α 1 <strong>et</strong> α 2 . Ils utilisent c<strong>et</strong> indice pour générer <strong>de</strong>s surfaces <strong>de</strong> dominance stochastique à <strong>de</strong>uxdimensions, ce qui est utile pour <strong>de</strong>s comparaisons robustes <strong>de</strong> pauvr<strong>et</strong>é. Les ordres <strong>de</strong> dominancesont donnés par s 1 = 1 + α 1 <strong>et</strong> s 2 = 1 + α 2 . La surface <strong>de</strong> dominance est donnéepar :2 Dans le sens <strong>de</strong> la décomposabilité par sous-groupes.


Chapitre 3. Tests <strong>de</strong> comparaisons <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle 47∆P s 1s 2(z 1 , z 2 ) =∫ z1∫ z20 0(z 1 − x 1 ) s 1−1 (z 2 − x 2 ) s 2−1 dH (x 1 , x 2 ) . (3.3)Duclos <strong>et</strong> al (2006) fournissent cependant une classe <strong>de</strong> mesures <strong>de</strong> pauvr<strong>et</strong>é multidimensionnelleΨ 1,1 (λ ∗ ) plus générale que la forme arbitraire FGT <strong>et</strong> qui est compatible avec tousles types <strong>de</strong> seuil. C<strong>et</strong>te classe est donnée par :⎧⎪⎨Ψ 1,1 (λ ∗ ) = P (λ)⎪⎩∣Λ (λ) ⊂ Λ (λ ∗ )⎫⎪π (x 1 , x 2 ; λ) = 0 si λ (x 1 , x 2 ) = 0 ⎬∂x 1≤ 0 <strong>et</strong> ∂π(x 1,x 2 ;λ). (3.4)∂x 2≤ 0 ∀ x 1 , x 2∂ 2 π(x 1 ,x 2⎪;λ)⎭∂x 1 ∂x 2≥ 0 ∀ x 1 , x 2∂π(x 1 ,x 2 ;λ)La première ligne définit l’ensemble maximal <strong>de</strong>s pauvres. La secon<strong>de</strong> indique la continuité<strong>de</strong>s indices <strong>de</strong> pauvr<strong>et</strong>é le long <strong>de</strong> la frontière <strong>de</strong> pauvr<strong>et</strong>é. La troisième ligne provient<strong>de</strong> l’axiome <strong>de</strong> monotonicité <strong>et</strong> suggère que les indices sont faiblement décroissants dans lesattributs x 1 <strong>et</strong> x 2 . La <strong>de</strong>rnière ligne renvoie à l’axiome <strong>de</strong> la non décroissance <strong>de</strong> la pauvr<strong>et</strong>é.C<strong>et</strong>te hypothèse introduit cependant <strong>de</strong>s restrictions dans la classe Ψ 1,1 (λ ∗ ) dans la mesureoù, dépendamment <strong>de</strong> la nature <strong>de</strong>s attributs, il est possible qu’on ait plutôt une relation <strong>de</strong>complémentarité ou d’indépendance comme l’ont révélé Bourguignon <strong>et</strong> Chakravarty (2002).Le théorème 1 <strong>de</strong> Duclos <strong>et</strong> al (2006) établit alors la condition <strong>de</strong> dominance <strong>de</strong> premier ordrequi suggère que, pour <strong>de</strong>s classes <strong>de</strong> mesures Ψ 1,1 (λ ∗ ), la pauvr<strong>et</strong>é sera plus forte en F qu’enG, ou que G domine F en pauvr<strong>et</strong>é, si <strong>et</strong> seulement si ∆P 1,1 (x 1 , x 2 ) > 0 ∀ (x 1 , x 2 ) ∈ Λ (λ ∗ ).3.2.2 La dominance stochastique d’ordre supérieurIl est aussi possible, en s’inspirant <strong>de</strong> Atkinson <strong>et</strong> Bourguignon (1982), <strong>de</strong> définir lesconditions <strong>de</strong> dominance stochastique <strong>de</strong> second ordre pour les cas <strong>de</strong> substituabilité <strong>et</strong> <strong>de</strong>complémentarité. Mais cela requiert <strong>de</strong>s hypothèses fortes sur les signes <strong>de</strong>s dérivées d’ordresupérieur (troisième <strong>et</strong> quatrième). Dans les classes <strong>de</strong> dominance spécifiées par Duclos <strong>et</strong> al


Chapitre 3. Tests <strong>de</strong> comparaisons <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle 48(2006), l’on peut augmenter l’ordre dans l’une ou l’autre <strong>de</strong>s dimensions ou dans les <strong>de</strong>uxsimultanément. Ainsi, l’on peut définir les classes Ψ 2,1 (λ ∗ ), Ψ 2,2 (λ ∗ ), Ψ 1,2 (λ ∗ ) <strong>et</strong>c. La premièreest explicitée par Duclos <strong>et</strong> al. comme suit :⎧P (λ) ∈ Ψ 1,1 (λ ∗ )⎪⎨∂π(x 1 ,x 2 ;λ)Ψ 2,1 (λ ∗ ∂x) = P (λ)1= 0 si λ (x 1 , x 2 ) = 0∂ 2 π(x 1 ,x 2 ;λ)≥ 0 ∀ x(∂x⎪⎩1 ) 2 1∂∣π(x 1 ,x 2 ;λ)≤ 0 ∀ x(∂x 1 ) 2 ∂x 1 , x 2 2⎫⎪ ⎬.⎪ ⎭(3.5)La première ligne signifie que les conditions <strong>de</strong> la classe Ψ 1,1 (λ ∗ ) sont respectées. Lasecon<strong>de</strong> suggère que la dérivée première par rapport à l’attribut x 1 est continue le long <strong>de</strong> lafrontière <strong>de</strong> pauvr<strong>et</strong>é. La troisième indique que le principe <strong>de</strong> transfert (PTUD) est vérifié auniveau <strong>de</strong> l’attribut x 1 . La <strong>de</strong>rnière ligne quant à elle révèle que l’eff<strong>et</strong> égalisateur inhérent autransfert décroît faiblement en fonction <strong>de</strong> x 2 .D’après leur théorème 2, il y a dominance stochastique, ou G domine F en pauvr<strong>et</strong>é, pourla classe Ψ 2,1 (λ ∗ ) si <strong>et</strong> seulement si ∆P 2,1 (x 1 , x 2 ) > 0 ∀ (x 1 , x 2 ) ∈ Λ (λ ∗ ).3.3 Les métho<strong>de</strong>s d’estimationC<strong>et</strong>te section développe d’abord la statistique <strong>de</strong> test qui n’est autre que le ratio <strong>de</strong> vraisemblanceempirique, puis décrit les procédures <strong>de</strong> test.3.3.1 Le ratio <strong>de</strong> vraisemblance empiriqueOn suppose <strong>de</strong>ux distributions bivariées A <strong>et</strong> B <strong>et</strong> leurs fonctions <strong>de</strong> répartitions F A <strong>et</strong>F B . Soient U 1 <strong>et</strong> U 2 les unions <strong>de</strong>s supports <strong>de</strong>s <strong>de</strong>ux distributions dans les <strong>de</strong>ux dimensions,avec z 1 ∈ U 1 <strong>et</strong> z 2 ∈ U 2 , en adoptant la définition d’intersection du seuil, on dira alors quela distribution B domine stochastiquement A au premier ordre si F A (z 1 , z 2 ) ≥ F B (z 1 , z 2 )pour tous les couples (z 1 , z 2 ) ∈ U = U 1 ⊗ U 2 , avec une inégalité stricte pour au moins un


Chapitre 3. Tests <strong>de</strong> comparaisons <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle 49couple. Supposons qu’on dispose <strong>de</strong> <strong>de</strong>ux échantillons <strong>de</strong> tailles N A <strong>et</strong> N B représentant les<strong>de</strong>ux distributions. Les ensembles <strong>de</strong>s réalisations dans les <strong>de</strong>ux échantillons sont donnés par( ) ( )XA1 , X2A <strong>et</strong> XB1 , X2B <strong>et</strong> leur union par (X1 , X 2 ). De façon générale, pour une distributionquelconque L, si ( ( )x L i1, xi2) L représente un couple <strong>de</strong> points <strong>de</strong> l’ensemble XL1 , X2L , lafonction <strong>de</strong> répartition empirique pour un couple (z 1 , z 2 ) ∈ U est donnée par :̂F (z 1 , z 2 ) = 1 ∑N LI ( )x L i1 ≤ z 1 , x L i2 ≤ z 2 , (3.6)N Li=1où I (·) est une fonction indicatrice qui prend la valeur 1 lorsque la condition est vérifiée <strong>et</strong> 0sinon. C<strong>et</strong>te formulation est compatible avec les trois définitions <strong>de</strong> seuil, la seule expressionà modifier étant la condition qui définit la fonction indicatrice. En s’inspirant <strong>de</strong> Davidson<strong>et</strong> Duclos (2006), le problème <strong>de</strong> maximisation <strong>de</strong> la fonction <strong>de</strong> vraisemblance empirique(FVE) est alors donné par :∑max n LPiL i log PiLisuj<strong>et</strong> à ∑ iP Li = 1.Les P Li représentent les probabilités <strong>de</strong> réalisations <strong>de</strong> ( x L i1, x L i2)tandis que les nLi représententle nombre <strong>de</strong> réalisations égales à ( x L i1, x L i2). Pour les <strong>de</strong>ux distributions A <strong>et</strong> B, laFVE non contrainte maximisée est la suivante :− N A log N A − N B log N B + ∑ in A i log n A i+ ∑ jn B j log n B j . (3.7)Si l’on considère l’hypothèse nulle que B ne domine pas A, cela signifie qu’il existe aumoins un couple (z 1 , z 2 ) ∈ U pour lequel F A (z 1 , z 2 ) ≤ F B (z 1 , z 2 ). Pour les valeurs extrêmesdu support U, les fonctions <strong>de</strong> répartition sont respectivement 0 <strong>et</strong> 1 <strong>et</strong> l’on aura toujoursF A (z 1 , z 2 ) = F B (z 1 , z 2 ) aux extrémités. En pratique, l’on exclut les valeurs extrêmes <strong>de</strong>


Chapitre 3. Tests <strong>de</strong> comparaisons <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle 50façon à éviter ce résultat trivial. Dans ce cas, lorsque ̂F A (z 1 , z 2 ) ≤ ̂F B (z 1 , z 2 ), on a la nondominance dans les échantillons <strong>et</strong> l’on ne va alors pas rej<strong>et</strong>er l’hypothèse nulle. En l’absence<strong>de</strong> dominance dans les échantillons, la contrainte ci-<strong>de</strong>ssus n’est pas liante <strong>et</strong> la valeur maximale<strong>de</strong> la FVE contrainte est la même que celle non contrainte. En revanche, lorsqu’il y adominance, le maximum <strong>de</strong> la FVE contrainte est inférieur à celui <strong>de</strong> la FVE non contrainte<strong>et</strong> la différence est d’autant plus gran<strong>de</strong> que la contrainte est liante. Ainsi, comme le suggèrentDavidson <strong>et</strong> Duclos (2006), en imposant plutôt la condition F A (z 1 , z 2 ) = F B (z 1 , z 2 ),on force la contrainte à <strong>être</strong> la moins liante possible, ce qui donne la valeur la plus gran<strong>de</strong>pour la FVE contrainte. C<strong>et</strong>te spécification est par ailleurs utile d’un point <strong>de</strong> vue analytique<strong>et</strong> opérationnel. La contrainte est alors la suivante :∑P Ai I ( ) ∑x A i1 ≤ z 1 , x A i2 ≤ z 2 = Pj B I ( )x B j1 ≤ z 1 , x B j2 ≤ z 2 . (3.8)ijLe nouveau problème <strong>de</strong> maximisation est défini par :maxPiA,P jB∑n A i log PiA + ∑ijn B j log P B jsuj<strong>et</strong> à∑iPiA= 1, ∑ jP B j = 1,<strong>et</strong>∑iP Ai I ( ) ∑x A i1 ≤ z 1 , x A i2 ≤ z 2 = Pj B I ( )x B j1 ≤ z 1 , x B j2 ≤ z 2 .jLes résultats <strong>de</strong> la maximisation nous donnent les nouvelles probabilités pour les distributionsA <strong>et</strong> B :Pi A = nA i I i (z 1 , z 2 )+ nA i (1 − I i (z 1 , z 2 ))ϖψ(3.9)


Chapitre 3. Tests <strong>de</strong> comparaisons <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle 51Pj B = nB j I j (z 1 , z 2 )N − ϖ + nB j (1 − I j (z 1 , z 2 ))N − ψ(3.10)avec I i (z 1 , z 2 ) ≡ I ( x A i1 ≤ z 1 , x A i2 ≤ z 2),I j (z 1 , z 2 ) ≡ I ( x B j1 ≤ z 1 , x B j2 ≤ z 2),ϖ =N×N A (z 1 ,z 2 ), ψ = N×M A (z 1 ,z 2 ), N N A (z 1 ,z 2 )+N B (z 1 ,z 2 ) M A (z 1 ,z 2 )+M B (z 1 ,z 2 ) A (z 1 , z 2 ) = ∑ in A i I i (z 1 , z 2 ),N B (z 1 , z 2 ) = ∑ jn A j I j (z 1 , z 2 ), N = N A + N B , M A (z 1 , z 2 ) = N A − N A (z 1 , z 2 ),M B (z 1 , z 2 ) = N B − N B (z 1 , z 2 ).Le ratio <strong>de</strong> vraisemblance empirique est obtenu en multipliant par 2 la différence entre lemaximum <strong>de</strong> la FVE non contrainte <strong>et</strong> celui <strong>de</strong> la FVE contrainte. On obtient alors :12 LR (z 1, z 2 ) =⎧⎪⎨⎪⎩N log N − N A log N A − N B log N B+N A (z 1 , z 2 ) log N A (z 1 , z 2 ) + N B (z 1 , z 2 ) log N B (z 1 , z 2 )+M A (z 1 , z 2 ) log M A (z 1 , z 2 ) + M B (z 1 , z 2 ) log M B (z 1 , z 2 )− (N A (z 1 , z 2 ) + N B (z 1 , z 2 )) log (N A (z 1 , z 2 ) + N B (z 1 , z 2 ))− (M A (z 1 , z 2 ) + M B (z 1 , z 2 )) log (M A (z 1 , z 2 ) + M B (z 1 , z 2 ))⎫⎪⎬.(3.11)⎪⎭Dans ce cas, lorsque l’hypothèse nulle est vérifiée, c’est-à-dire qu’il y a absence <strong>de</strong> dominancealors la statistique sera proche <strong>de</strong> 0 alors que dans le cas contraire elle en sera éloignée.D’après le théorème 1 <strong>de</strong> Davidson <strong>et</strong> Duclos (2006), sous l’hypothèse nulle F A (z 1 , z 2 ) =F B (z 1 , z 2 ), la statistique LR (z 1 , z 2 ) est équivalente au carré <strong>de</strong> la statistique t utilisée parHowes (1993) <strong>et</strong> Kaur <strong>et</strong> al (1994). C<strong>et</strong>te statistique, en bidimensionnel, peut <strong>être</strong> donnéepar :


Chapitre 3. Tests <strong>de</strong> comparaisons <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle 52t 2 (z 1 , z 2 ) =N B ̂FA (z 1 , z 2 )(N A N B ̂FA (z 1 , z 2 ) − ̂F) 2B (z 1 , z 2 ))(1 − ̂F A (z 1 , z 2 )+ N A ̂FB (z 1 , z 2 )(1 − ̂F). (3.12)B (z 1 , z 2 )3.3.2 Les procédures <strong>de</strong> testNous voulons tester la non dominance <strong>de</strong> la distribution A par la distribution B. Celasignifie qu’il existe un point (z 1 , z 2 ) pour lequel F A (z 1 , z 2 ) ≤ F B (z 1 , z 2 ). Comme Davidson<strong>et</strong> Duclos (2006) l’ont montré, pour qu’il y ait possibilité <strong>de</strong> rej<strong>et</strong> <strong>de</strong> l’hypothèse nulle lorsqueles distributions sont continues, l’on doit exclure les valeurs extrêmes <strong>de</strong> z 1 <strong>et</strong> <strong>de</strong> z 2 . Si ondéfinit alors <strong>de</strong>s bornes inférieures z 1 <strong>et</strong> z 2 , <strong>et</strong> <strong>de</strong>s bornes supérieures z 1 <strong>et</strong> z 2 , l’hypothèsenulle <strong>de</strong> non dominance est donnée par la relation suivante :min F A (z 1 , z 2 ) − F B (z 1 , z 2 ) ≤ 0. (3.13)z 1 ∈[z 1 ,z 1 ],z 2 ∈[z 2 ,z 2 ]Sous la contrainte F A (z 1 , z 2 ) = F B (z 1 , z 2 ), l’utilisation du minimum <strong>de</strong> la statistiqu<strong>et</strong> (t min ), qui n’est autre que la racine carrée <strong>de</strong> la statistique donnée par l’équation (3.12),est relativement triviale (voir Howes, 1993 ; Kaur <strong>et</strong> al, 1994 ; Cebrián <strong>et</strong> al, 2004) ; Denuit<strong>et</strong> Scaill<strong>et</strong> (2004). En eff<strong>et</strong>, aussi <strong>bien</strong> Berger (1982) que Kaur <strong>et</strong> al (1994) montrentque la statitisque <strong>de</strong> test ainsi basée sur l’infimum est <strong>de</strong> niveau α, ce qui signifie que,si l’hypothèse nulle H 0 est vraie, sa probabilité <strong>de</strong> rej<strong>et</strong> est bornée supérieurement par α.Lorsque le t min est supérieur à la statistique critique au seuil α, alors l’on rej<strong>et</strong>te l’hypothèsenulle, ce qui équivaut à ne pas rej<strong>et</strong>er l’hypothèse alternative <strong>de</strong> dominance, c’est-à-dire queF A (z 1 , z 2 ) − F B (z 1 , z 2 ) > 0 pour tout (z 1 , z 2 ) ∈ [z 1 , z 1 ] ⊗ [z 2 , z 2 ]. Pour ce qui concernela statistique du ratio <strong>de</strong> vraisemblance empirique (LR) dont l’expression est donnée parl’équation (3.11), son utilisation n’est pas aussi directe que pour la précé<strong>de</strong>nte. Puisqu’elleest toujours positive, elle ne perm<strong>et</strong> pas dans l’hypothèse <strong>de</strong> dominance <strong>de</strong> distinguer si c’estA qui domine B ou si c’est plutôt l’inverse. Cependant, si l’on s’intéresse à l’hypothèse nulle


Chapitre 3. Tests <strong>de</strong> comparaisons <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle 53<strong>de</strong> la non dominance <strong>de</strong> A par B, il n’y a pas <strong>de</strong> coût à contraindre l’égalité entre ̂F A (z 1 , z 2 )<strong>et</strong> ̂FB (z 1 , z 2 ), lorsque ̂F A (z 1 , z 2 ) ≤ ̂F B (z 1 , z 2 ). En eff<strong>et</strong>, dans ce cas, la contrainte n’estpas liante <strong>et</strong> la FVE contrainte est égale à la FVE non contrainte, ce qui donne un ratio <strong>de</strong>vraisemblance nul. L’expression du ratio LR (z 1 , z 2 ) peut <strong>être</strong> résumée comme suit :LR (z 1 , z 2 ) ={0 si ̂F A (z 1 , z 2 ) ≤ ̂F B (z 1 , z 2 )LR sinon}. (3.14)La racine carrée du minimum <strong>de</strong> LR (z 1 , z 2 ) dénotée par LR min peut <strong>être</strong> alors utilisé<strong>et</strong>out comme le t min pour tester l’hypothèse nulle <strong>de</strong> non dominance contre l’alternative <strong>de</strong>dominance.3.4 Simulations <strong>de</strong> Monte CarloC<strong>et</strong>te section présente les mo<strong>de</strong>s <strong>de</strong> génération <strong>de</strong> données pour les répétions <strong>de</strong> MonteCarlo <strong>et</strong> le rééchantillonnage <strong>de</strong> bootstrap, puis les résultats <strong>de</strong> l’expérience <strong>de</strong> simulation.3.4.1 Métho<strong>de</strong>s <strong>de</strong> génération <strong>de</strong>s donnéesPour étudier les performances du test <strong>de</strong> ratio <strong>de</strong> vraisemblance au niveau <strong>de</strong>s distributionsbivariées, l’on spécifie diverses façons <strong>de</strong> générer ces distributions. D’abord, on génère les<strong>de</strong>ux distributions A <strong>et</strong> B <strong>de</strong> telle sorte que l’hypothèse nulle soit vraie. Le premier casque l’on considère est celui où B domine A sauf aux extrémités <strong>et</strong> en un point à l’intérieurdu support. La nature bidimensionnelle perm<strong>et</strong> <strong>de</strong> distinguer la situation où il y a absence<strong>de</strong> corrélation entre les <strong>de</strong>ux dimensions <strong>de</strong> chaque observation <strong>et</strong> celle dans laquelle l’onadm<strong>et</strong> l’existence d’une corrélation. Dans la situation d’indépendance, chaque dimension <strong>de</strong>la distribution A est générée selon une loi uniforme sur l’intervalle [0, 1], avec F A (x i1 ) =x i1 <strong>et</strong> F A (x i2 ) = x i2 pour x i1 , x i2∈ [0, 1]. Si l’on divise c<strong>et</strong> intervalle en huit segments


Chapitre 3. Tests <strong>de</strong> comparaisons <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle 54égaux dont les bornes supérieures sont 0.125, 0.25, 0.375, 0.5, 0.625, 0.75, 0.875 <strong>et</strong> 1, lesprobabilités cumulées marginales pour A à chaque borne sont égales aux valeurs <strong>de</strong>s bornes.Pour la distribution B par contre, les probabilités cumulées dans chaque dimension pources bornes supérieures sont respectivement 0.05, 0.15, 0.25, 0.50, 0.55, 0.65, 0.75, <strong>et</strong> 1, <strong>de</strong>telle sorte que les <strong>de</strong>ux distributions A <strong>et</strong> B se touchent au point (z 1 , z 2 ) = (0.5, 0.5) oùl’on a alors F A (0.5, 0.5) = F B (0.5, 0.5) = 0.25. Au sein <strong>de</strong> chaque segment, la fonction<strong>de</strong> <strong>de</strong>nsité cumulée est linéaire. Toutefois, on exclut les valeurs extrêmes en les discrétisant.Ainsi, l’intervalle [0, 0.1] est discrétisé à 0.1 tandis que [0.9, 1] est discrétisé à 0.9. Dans unesecon<strong>de</strong> configuration, l’on introduit la corrélation entre les <strong>de</strong>ux attributs. Dans ce cas, lesobservations (x i1 , u i2 ) pour la distribution A <strong>et</strong> (x j1 , u j2 ) pour la distibution B sont généréescomme précé<strong>de</strong>mment, puis on remplace u i2 <strong>et</strong> u j2 respectivement par x i2 <strong>et</strong> x j2 qui sontobtenus comme suit :x i2 = 0.40x i1 + 0.60u i2x j2 = 0.40x j1 + 0.60u j2 .Pour étudier la puissance du test, on modifie la configuration <strong>de</strong> base <strong>de</strong> sorte que ladistribution B domine légèrement la A. C<strong>et</strong>te fois-ci, les probabilités cumulées sont 0.05,0.15, 0.25, 0.40, 0.55, 0.65, 0.75, <strong>et</strong> 1. On effectue 10000 répétitions <strong>de</strong> Monte Carlo pourdifférents nombres d’observations notamment 50, 100, 200, 500 <strong>et</strong> 1000. Pour réaliser <strong>de</strong>stests <strong>de</strong> bootstrap, l’on adopte le procédé suivant décrit par Davidson <strong>et</strong> MacKinnon (1999) :(i) pour chacune <strong>de</strong>s 10000 répétitions, on calcule la statistique <strong>de</strong> test ̂LR qui satisfaitl’hypothèse nulle, ainsi que les probabilités qui lui sont associées (équations 9 <strong>et</strong> 10). Cependant,ceci n’est réalisé que lorsque les <strong>de</strong>ux distributions révèlent l’existence <strong>de</strong> la dominanceDavidson <strong>et</strong> Duclos (2006) ;


Chapitre 3. Tests <strong>de</strong> comparaisons <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle 55(ii) ensuite, les probabilités calculées en (i) sont utilisées pour générer T = 399 3 échantillons<strong>de</strong> bootstrap pour les <strong>de</strong>ux distributions A <strong>et</strong> B. L’on calcule alors pour chaque échantillonla statistique ̂LR t avec t = 1, ..., T ;(iii) enfin, la valeur P du bootstrap (p T ) est calculée comme étant la proportion <strong>de</strong> statistiqueŝLR t supérieures à ̂LR. Ainsi, pour un test effectué au seuil α, on rej<strong>et</strong>te l’hypothèsenulle si p T < α. Pour chaque répétition <strong>de</strong> Monte Carlo, lorsqu’il y a absence <strong>de</strong> dominance,c’est-à-dire si les <strong>de</strong>ux distributions se coupent ou se touchent, l’hypothèse nulle ne peut <strong>être</strong>rej<strong>et</strong>ée <strong>et</strong> pour s’en assurer l’on affecte la valeur 1 à p T .3.4.2 Résultats <strong>de</strong>s simulationsIl ressort <strong>de</strong>s simulations que les tests asymptotiques du ratio <strong>de</strong> vraisemblance (LR min ) <strong>et</strong><strong>de</strong> la statistique t min donnent <strong>de</strong>s résultats approximativement i<strong>de</strong>ntiques. Comme le montrele tableau 3.1 en annexe, les probabilités <strong>de</strong> rej<strong>et</strong> sont plus faibles que les seuils nominaux,surtout dans les échantillons <strong>de</strong> tailles faibles. Même si les résultats sont conformes à ceuxobtenus par Davidson <strong>et</strong> Duclos (2000), la nature bidimensionnelle dans le cas présent ralentitla vitesse <strong>de</strong> convergence. En eff<strong>et</strong>, les estimateurs non paramétriques sont souvent affectéspar ce problème connu sous l’expression <strong>de</strong> la malédiction <strong>de</strong> la dimensionalité. Ceci sembles’expliquer surtout par l’absence <strong>de</strong> corrélation entre les <strong>de</strong>ux dimensions <strong>de</strong> chaque distribution.En eff<strong>et</strong>, lorsqu’on adm<strong>et</strong> l’existence <strong>de</strong> la corrélation, la convergence apparaît meilleurecomme on peut le voir dans le tableau 3.2. On remarque également, selon les <strong>de</strong>ux tableaux,que la convergence <strong>de</strong>s probabilités <strong>de</strong> rej<strong>et</strong> ne commence que lorsque les échantillons sont <strong>de</strong>gran<strong>de</strong> taille, notamment autour <strong>de</strong> 500. Les tableaux ne concernent cependant que certainesvaleurs extrêmes du seuil nominal α en l’occurrence 1%, 5% <strong>et</strong> 10% <strong>et</strong> donc n’apportent que<strong>de</strong>s informations limitées. Pour avoir plus d’information, Davidson <strong>et</strong> MacKinnon (1998)suggèrent <strong>de</strong>s métho<strong>de</strong>s graphiques qui perm<strong>et</strong>tent <strong>de</strong> tracer les courbes <strong>de</strong> probabilités <strong>de</strong>3 Davidson <strong>et</strong> MacKinnon (2000) suggèrent, pour réduire la perte <strong>de</strong> puissance inhérente au bootstrapping,<strong>de</strong> choisir un nombre assez élevé d’échantillons <strong>de</strong> bootstrap. Le nombre 399 est jugé assez raisonnable pourréaliser <strong>de</strong>s tests au seuil <strong>de</strong> 5%.


Chapitre 3. Tests <strong>de</strong> comparaisons <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle 56rej<strong>et</strong> (valeur P ) en fonction <strong>de</strong>s seuils nominaux sur un intervalle assez grand. On réaliseles graphiques pour α ∈ [0, 0.5]. Le graphique 3.1, réalisé pour N A = 100 <strong>et</strong> N A = 200,confirme la similitu<strong>de</strong> entre les <strong>de</strong>ux tests, puisque les <strong>de</strong>ux courbes respectivement LR min <strong>et</strong>t min se confon<strong>de</strong>nt pour la plupart <strong>de</strong>s points α.FIG. 3.1 – Probabilités <strong>de</strong> rej<strong>et</strong> <strong>de</strong>s tests asymptotiques0.50.4T min , N A = 100LR min , N A = 100T min , N A = 200LR min , N A = 2000.3P−value0.20.10.0 0.1 0.2 0.3 0.4 0.5Seuil nominalLes tests <strong>de</strong> bootstrap donnent <strong>de</strong> meilleurs résultats comme on peut le voir dans le graphique3.2. Même pour N A = 100, la convergence du bootstrap est n<strong>et</strong>tement meilleure quecelle du test asymptotique obtenue pour N A = 200. Cependant, le test <strong>de</strong> bootstrap tendà rej<strong>et</strong>er plus que le niveau α pour <strong>de</strong>s échantillons plus grands. Bien que chaque dimensionsoit générée indépendamment <strong>de</strong> l’autre, il existe toujours une très faible corrélationentre elles. La métho<strong>de</strong> <strong>de</strong> génération en <strong>de</strong>ux étapes <strong>de</strong>s observations <strong>de</strong> B fait que la corrélationy est relativement plus faible que celle dans la distribution A. Cela implique qu’enpratique F A (0.5, 0.5) se r<strong>et</strong>rouve souvent légèrement au <strong>de</strong>ssus F B (0.5, 0.5) comme c’est lecas en situation <strong>de</strong> dominance. Cela explique pourquoi les probalilités <strong>de</strong> rej<strong>et</strong> ont tendance à<strong>être</strong> supérieures aux seuils nominaux lorsqu’on accroît la taille <strong>de</strong>s échantillons. On observeune saturation <strong>de</strong>s courbes <strong>de</strong> probabilités pour le bootstrap puisque, pour <strong>de</strong>s valeurs <strong>de</strong> αproches <strong>de</strong> 50%, leurs valeurs se réduisent à celles <strong>de</strong>s tests asymptotiques <strong>et</strong> correspon<strong>de</strong>nten fait aux pourcentages <strong>de</strong>s distributions qui contiennent <strong>de</strong> la dominance.


Chapitre 3. Tests <strong>de</strong> comparaisons <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle 57FIG. 3.2 – Probabilités <strong>de</strong> rej<strong>et</strong> <strong>de</strong>s tests asymptotiques <strong>et</strong> <strong>de</strong> bootstrap0.50.4Asymptotique, N A = 100Bootstrap, N A = 100Asymptotique, N A = 200Bootstrap, N A = 2000.3P−value0.20.10.0 0.1 0.2 0.3 0.4 0.5Seuil nominalFIG. 3.3 – Probabilités <strong>de</strong> rej<strong>et</strong> comparées <strong>de</strong>s cas <strong>de</strong> non-corrélation <strong>et</strong> <strong>de</strong> corrélation0.50.4Sans corrélation, N A = 100Avec corrélation, N A = 100Sans corrélation, N A = 200Avec corrélation, N A = 2000.50.4Sans corrélation, N A = 100Avec corrélation, N A = 100Sans corrélation, N A = 200Avec corrélation, N A = 2000.30.3P−valueP−value0.20.20.10.10.0 0.1 0.2 0.3 0.4 0.5Seuil nominal(a) Asymptotique0.0 0.1 0.2 0.3 0.4 0.5Seuil nominal(b) Bootstrap


Chapitre 3. Tests <strong>de</strong> comparaisons <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle 58Le graphique 3.3 fait une comparaison entre le cas d’indépendance entre dimensions <strong>et</strong>le cas où l’on adm<strong>et</strong> l’existence <strong>de</strong> la corrélation. Le graphique <strong>de</strong> gauche concerne les testsasymptotiques <strong>et</strong> celui <strong>de</strong> droite, les tests <strong>de</strong> bootstrap. Ces graphiques confirment le fait quel’existence <strong>de</strong> la corrélation positive accroît les probabilités <strong>de</strong> rej<strong>et</strong>.La même expérience est réalisée pour étudier la puissance <strong>de</strong>s tests. Pour N A = 100, lestests asymptotiques donnent <strong>de</strong>s probabilités <strong>de</strong> rej<strong>et</strong> inférieures aux seuils nominaux commele suggère le graphique 3.4. Même pour N A = 200, ces tests n’affichent pas une bonnepuissance. Par contre, les tests <strong>de</strong> bootstrap apparaissent uniformément plus puissants que lestests asymptotiques. Pour N A = 200, les probabilités <strong>de</strong> rej<strong>et</strong> <strong>de</strong>s tests <strong>de</strong> bootstrap sont <strong>de</strong>2.5%, 18% <strong>et</strong> 33% respectivement pour les seuils α <strong>de</strong> 1%, 5% <strong>et</strong> 10% (voir tableau 3.6 enAnnexes). Le graphique 3.5 confirme que l’introduction d’une corrélation positive entre lesattributs perm<strong>et</strong> d’obtenir <strong>de</strong>s puissances plus élevées.FIG. 3.4 – Courbes <strong>de</strong> puissances <strong>de</strong>s tests asymptotiques <strong>et</strong> <strong>de</strong> bootstrap0.50.4P−value0.30.20.1Asymptotique, N A = 100Bootstrap, N A = 100Asymptotique, N A = 200Bootstrap, N A = 2000.0 0.1 0.2 0.3 0.4 0.5Seuil nominalUne autre configuration est spécifiée. Dans celle-ci, lorsqu’on exclut les extrémités, les<strong>de</strong>ux distributions se touchent en <strong>de</strong>ux points au lieu d’un seul point comme précé<strong>de</strong>mment.Pour c<strong>et</strong>te nouvelle configuration, la distribution B est donnée par : 0.05, 0.25, 0.30, 0.40,0.55, 0.75, 0.80, <strong>et</strong> 1. Pour étudier la puissance, les points 0.25 <strong>et</strong> 0.75 sont remplacés res-


Chapitre 3. Tests <strong>de</strong> comparaisons <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle 59FIG. 3.5 – Courbes <strong>de</strong> puissances comparées <strong>de</strong>s cas <strong>de</strong> non-corrélation <strong>et</strong> <strong>de</strong> corrélation0.60.5Sans corrélation, N A = 100Avec corrélation, N A = 100Sans corrélation, N A = 200Avec corrélation, N A = 2000.60.50.40.4P−value0.3P−value0.30.20.20.10.1Sans corrélation, N A = 100Avec corrélation, N A = 100Sans corrélation, N A = 200Avec corrélation, N A = 2000.0 0.1 0.2 0.3 0.4 0.5Seuil nominal(a) Asymptotique0.0 0.1 0.2 0.3 0.4 0.5Seuil nominal(b) Bootstrappectivement par 0.30 <strong>et</strong> 0.65 <strong>de</strong> telle sorte que B domine légèrement A. Le graphique 3.6montre, conformément aux attentes, que les tests <strong>de</strong>viennent plus conservateurs <strong>et</strong> moinspuissants. Dans ce graphique, l’illustration <strong>de</strong> la gauche présente les résultats obtenus quandl’hypothèse nulle <strong>de</strong> dominance est vraie, tandis que celle <strong>de</strong> la droite est relative aux tests<strong>de</strong> la puissance. Les tests <strong>de</strong> bootstrap semblent toujours plus fiables. Le caractère conservateur<strong>de</strong>s tests indique toutefois que si l’on rej<strong>et</strong>te l’hypothèse nulle c’est qu’il y a <strong>de</strong> bonnesraisons <strong>de</strong> le faire. L’on peut alors conclure forcément à la dominance.De façon générale, la statistique du ratio <strong>de</strong> vraisemblance semble i<strong>de</strong>ntique au carré <strong>de</strong>la statistique t. Pour les tests <strong>de</strong> bootstrap, l’une ou l’autre <strong>de</strong> ces <strong>de</strong>ux statistiques peut <strong>être</strong>utilisée indifféremment pour calculer la valeur P qui est la proportion <strong>de</strong>s statistiques <strong>de</strong>séchantillons <strong>de</strong> bootstrap supérieures à la statistique <strong>de</strong> l’échantillon initial. Pour que les testssoient crédibles, les résultats semblent indiquer que les distributions <strong>de</strong>vraient avoir une tailleminimale d’au moins 500 pour les tests asymptotiques <strong>et</strong> d’au moins 200 pour les tests <strong>de</strong>bootstrap. Cela ne <strong>de</strong>vrait pas constituer un problème pour les comparaisons <strong>de</strong> <strong>bien</strong>-<strong>être</strong>dans la mesure où les distributions disponibles sont généralement au-<strong>de</strong>là <strong>de</strong> ces chiffres.


Chapitre 3. Tests <strong>de</strong> comparaisons <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle 60FIG. 3.6 – Configuration alternative, lorsque les distributions se touchent en <strong>de</strong>ux points0.50.4Asymptotique, N A = 100Bootstrap, N A = 100Asymptotique, N A = 200Bootstrap, N A = 2000.50.40.30.3P−valueP−value0.20.20.10.0 0.1 0.2 0.3 0.4 0.5Seuil nominal(a) Probabilités <strong>de</strong> rej<strong>et</strong>0.1Asymptotique, N A = 100Bootstrap, N A = 100Asymptotique, N A = 200Bootstrap, N A = 2000.0 0.1 0.2 0.3 0.4 0.5Seuil nominal(b) Courbes <strong>de</strong> puissance3.5 ConclusionLe but du présent papier est d’analyser la performance d’un test basé sur le ratio <strong>de</strong> vraisemblanceempirique en présence <strong>de</strong> distributions bivariées. Il constitue ainsi une extension<strong>de</strong> la démarche proposée par Davidson <strong>et</strong> Duclos (2006) dans un cadre univarié standard.L’avantage d’une telle démarche est qu’elle perm<strong>et</strong> <strong>de</strong> conclure sans équivoque à une relation<strong>de</strong> dominance lorsque celle-ci existe. Les résultats obtenus ici semblent corroborer les leurs,même si l’introduction d’une dimension supplémentaire ralentit la vitesse <strong>de</strong> convergence.Lorsque l’on utilise les probabilités obtenues par la maximisation <strong>de</strong> la fonction <strong>de</strong> vraisemblancesous l’hypothèse nulle <strong>de</strong> non dominance pour les rééchantillonnages <strong>de</strong> bootstrap,les tests apparaissent alors meilleurs que les tests asymptotiques, c’est-à-dire à la foisplus puissants <strong>et</strong> moins conservateurs. Cependant, à cause <strong>de</strong> la malédiction <strong>de</strong> la dimensionalité,les distributions <strong>de</strong>vraient <strong>être</strong> <strong>de</strong> tailles suffisamment gran<strong>de</strong>s pour que les testssoient pertinents. Ces tests sont également sensibles aux corrélations existant entre les <strong>de</strong>uxcomposantes <strong>de</strong> chaque distribution.L’analyse bidimensionnelle proposée ici va dans le sens <strong>de</strong>s préoccupations actuelles dans


Chapitre 3. Tests <strong>de</strong> comparaisons <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle 61le domaine <strong>de</strong> l’économie du <strong>bien</strong>-<strong>être</strong>. En eff<strong>et</strong>, <strong>de</strong>puis les suggestions <strong>de</strong> Sen, les mesures<strong>de</strong> pauvr<strong>et</strong>é <strong>et</strong> <strong>de</strong> <strong>bien</strong>-<strong>être</strong> sont <strong>de</strong> plus en plus inspirées du cadre multidimensionnel. Il estdésormais question <strong>de</strong> considérer non pas uniquement le revenu comme mesure <strong>de</strong> <strong>bien</strong>-<strong>être</strong>,mais également d’autres variables pertinentes comme le loisir, la nutrition, <strong>et</strong>c.3.6 AnnexesTAB. 3.1 – Probabilités <strong>de</strong> rej<strong>et</strong> <strong>de</strong>s tests asymptotiques en l’absence <strong>de</strong> corrélationt minLR minα = 0.01 α = 0.05 α = 0.10 α = 0.01 α = 0.05 α = 0.10N A = 50 0.0000 0.0000 0.0012 0.0000 0.0007 0.0025N A = 100 0.0000 0.0008 0.0039 0.0000 0.0017 0.0055N A = 200 0.0000 0.0030 0.0156 0.0000 0.0044 0.0187N A = 500 0.0022 0.0222 0.0674 0.0023 0.0254 0.0701N A = 1000 0.0082 0.0515 0.1134 0.0086 0.0518 0.1146TAB. 3.2 – Probabilités <strong>de</strong> rej<strong>et</strong> <strong>de</strong>s tests asymptotiques en présence <strong>de</strong> corrélationt minLR minα = 0.01 α = 0.05 α = 0.10 α = 0.01 α = 0.05 α = 0.10N A = 50 0.0000 0.0001 0.0018 0.0000 0.0010 0.0044N A = 100 0.0000 0.0017 0.0084 0.0001 0.0029 0.0114N A = 200 0.0002 0.0065 0.0255 0.0005 0.0088 0.0285N A = 500 0.0018 0.0272 0.0776 0.0018 0.0282 0.0792N A = 1000 0.0081 0.0528 0.1070 0.0085 0.0530 0.1073


Chapitre 3. Tests <strong>de</strong> comparaisons <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle 62TAB. 3.3 – Puissances <strong>de</strong>s tests asymptotiques en l’absence <strong>de</strong> corrélationt minLR minα = 0.01 α = 0.05 α = 0.10 α = 0.01 α = 0.05 α = 0.10N A = 50 0.0000 0.0002 0.0022 0.0001 0.0016 0.0047N A = 100 0.0000 0.0018 0.0108 0.0001 0.0036 0.0154N A = 200 0.0004 0.0166 0.0570 0.0011 0.0252 0.0688N A = 500 0.0412 0.2257 0.4172 0.0487 0.2506 0.4343N A = 1000 0.3499 0.6860 0.8250 0.3762 0.6936 0.8353TAB. 3.4 – Puissances <strong>de</strong>s tests asymptotiques en présence <strong>de</strong> corrélationt minLR minα = 0.01 α = 0.05 α = 0.10 α = 0.01 α = 0.05 α = 0.10N A = 50 0.0000 0.0004 0.0035 0.0001 0.0020 0.0084N A = 100 0.0001 0.0033 0.0211 0.0004 0.0076 0.0300N A = 200 0.0011 0.0315 0.0927 0.0037 0.0394 0.1028N A = 500 0.0669 0.2905 0.4889 0.0709 0.3060 0.5071N A = 1000 0.4475 0.7702 0.8850 0.4625 0.7740 0.8878TAB. 3.5 – Probabilités <strong>de</strong> rej<strong>et</strong> <strong>de</strong>s tests <strong>de</strong> bootstrapSans corrélationAvec corrélationα = 0.01 α = 0.05 α = 0.10 α = 0.01 α = 0.05 α = 0.10N A = 50 0.0007 0.0128 0.0410 0.0009 0.0174 0.0558N A = 100 0.0024 0.0301 0.0826 0.0037 0.0372 0.0949N A = 200 0.0055 0.0579 0.1403 0.0071 0.0617 0.1428TAB. 3.6 – Puissances <strong>de</strong>s tests <strong>de</strong> bootstrapSans corrélationAvec corrélationα = 0.01 α = 0.05 α = 0.10 α = 0.01 α = 0.05 α = 0.10N A = 50 0.0017 0.0238 0.0689 0.0030 0.0335 0.0879N A = 100 0.0068 0.0723 0.1609 0.0076 0.0829 0.1801N A = 200 0.0251 0.1801 0.3326 0.0327 0.1991 0.3580


Bibliographie[1] An<strong>de</strong>rson, G. (2005), “Life Expectancy and Economic Welfare : The Example of africain the 1990s”, Review of Income and Wealth, 51, 455-468.[2] Atkinson, A. B. (1987), “On the Measurement of Poverty”, Econom<strong>et</strong>rica, 55, 749-764.[3] Atkinson, A. B. (2003), “Multidimensional Deprivation : Constrasting Social Welfareand Counting Approaches”, Journal of Economic Inequality, 1, 51-65.[4] Atkinson, A. B. <strong>et</strong> F. Bourguignon (1982), “The Comparison of Multidimensional Distributionsof Economic Status”, Review of Economic Studies, XLIX, 183-201.[5] Barr<strong>et</strong>t, G. F. <strong>et</strong> S. G. Donald (2003), “Consistent Tests for Stochastic Dominance”,Econom<strong>et</strong>rica, 71, 71-104.[6] Beach, C. M. <strong>et</strong> R. Davidson (1983), “Distribution-Free Statistical Inference with LorenzCurves and Income Shares”, The Review of Economic Studies, 50, 723-735.[7] Beach, C. M. <strong>et</strong> J. Richmond (1985), “Joint Confi<strong>de</strong>nce Intervals for Income Shares andLorenz Curves”, International Economic Review, 26, 439-450.[8] Berger, R. L. (1982), “Multiparam<strong>et</strong>er Hypothesis Testing and Acceptance Sampling”,Technom<strong>et</strong>rics, 24, 295-300.[9] Berger, R. L. (1989), “Uniformly More Powerful Tests for Hypotheses Concerning LinearInequalities and Normal Means”, Journal of the American Statistical Association,84, 192-199.[10] Berger, R. L. <strong>et</strong> K. G. Saikali (2002), “More Powerful Tests for the Sign Testing Problem”,Journal of Statistical Planning and Inference, 107, 187-205.


Bibliographie 64[11] Berger, R. L. <strong>et</strong> D. F. Sinclair (1984), “Testing Hypotheses Concerning Unions of LinearSubspaces”, Journal of the American Statistical Association, 79, 158-163.[12] Bishop, A. J., Formby, J. P. <strong>et</strong> P. D. Thistle (1989), “Statistical Inference, Income Distributions,and Social Welfare”, In D. J. Slottje (Ed.), Research on Income Inequality, 1,49-91.[13] Bishop, A. J., Formby, J. P. <strong>et</strong> P. D. Thistle (1992), “Convergence of the South and Non-South Income Distributions, 1969-1979”, The American Economic Review, 82, 262-272.[14] Bourguignon, F. <strong>et</strong> S. R. Chakravarty (2002), “Multidimensional Poverty Or<strong>de</strong>rings”,DELTA Working Paper 2002-22.[15] Bourguignon, F. <strong>et</strong> S. R. Chakravarty (2003), “The Measurement of MultimensionalPoverty”, Journal of Economic Inequality, 1, 25-49.[16] Cebrián, A. C., Denuit, M. <strong>et</strong> O. Scaill<strong>et</strong> (2004), “Testing for Concordance Or<strong>de</strong>ring”,ASTIN Bull<strong>et</strong>in, 34, 151-173.[17] Crawford, I. (2005), “A Nonparam<strong>et</strong>ric Test of Stochastic Dominance in MultivariateDistributions”, Discussion Papers in Economics, University of Surrey, DP 12/05.[18] Davidson, R. <strong>et</strong> J.-Y. Duclos (2000), “Statistical Inference for Stochastic Dominanceand for the Measurement of Poverty and Inequality”, Econom<strong>et</strong>rica, 68, 1435-1464.[19] Davidson, R. <strong>et</strong> J.-Y. Duclos (2006), “Testing for Restricted Stochastic Dominance”,IZA Discussion Paper No 2047.[20] Davidson, R. <strong>et</strong> J. G. MacKinnon (1998), “Graphical M<strong>et</strong>hods for Investigating the Sizeand Power of Hypothesis Tests”, The Manchester School,66, 1-26.[21] Davidson, R. <strong>et</strong> J. G. MacKinnon (1999), “Bootstrap Testing in Nonlinear Mo<strong>de</strong>ls”,International Economic Reviews,40, 487-508.[22] Davidson, R. <strong>et</strong> J. G. MacKinnon (2000), “Bootstrap Tests : How Many Bootstraps”,Econom<strong>et</strong>ric Review, 19, 55-68.[23] Denuit, M. <strong>et</strong> O. Scaill<strong>et</strong> (2004), “Nonparam<strong>et</strong>ric Tests for Positive Quadrant”, Journalof Financial Econom<strong>et</strong>rics, 2, 422-450.


Bibliographie 65[24] Duclos, J.-Y., Sahn, D. E. <strong>et</strong> S. D. Younger (2006), “Robust Multimensional PovertyComparison”, Economic Journal, 113, 943-968.[25] Fisher, G., Willson, D. <strong>et</strong> K. Xu (1996), “Testing First and Second-Or<strong>de</strong>r StochasticDominance”, The Canadian Journal of Economics, 29, Special Issue, Part 2, S562-S564.[26] Fisher, G., Willson, D. <strong>et</strong> K. Xu (1998), “An Empirical Analysis of Term PremiumsUsing Significance Tests for Stochastic Dominance”, Economics L<strong>et</strong>ters, 60, 195-203.[27] Foster, J. E., Greer, J. <strong>et</strong> E. Thorbecke (1984), “A Class of Decomposable Poverty Measures”,Econom<strong>et</strong>rica, 52, 761-766.[28] Foster, J. E. <strong>et</strong> A. F. Shorrocks (1988a), “Poverty Or<strong>de</strong>rings”, Econom<strong>et</strong>rica, 56, 173-177.[29] Foster, J. E. <strong>et</strong> A. F. Shorrocks (1988b), “Poverty Or<strong>de</strong>rings and Welfare Dominance”,Social Choice Welfare, 5, 179-198.[30] Foster, J. E. <strong>et</strong> A. F. Shorrocks (1988c), “Inequality and Poverty Or<strong>de</strong>ring”, EuropeanEconomic Review, 32, 654-662.[31] Gleser, L. J. (1973), “On a Theory of Intersection-Union Tests”, Institute of MathematicalStatistics Bull<strong>et</strong>in (Abstract), 2, 233.[32] Heshmati, A. <strong>et</strong> E. Maasoumi (1998), “Stochastic Dominance Amongst Swedish IncomeDistributions”, Working Paper Series in Economics and Finance 279, StockolmSchool of Economics.[33] Heshmati, A. <strong>et</strong> E. Maasoumi (2005), “Evaluating Dominance Ranking of PSID Incomesby Various Household Attributes”, IZA Discussion Papers 1727.[34] Horváth, L., Kokoszka, P. <strong>et</strong> R. Zitikis (2006), “Testing for Stochastic Dominance Usingthe Weighted McFad<strong>de</strong>n Type Statistic”, Journal of Econom<strong>et</strong>rics, 133, 191-205.[35] Howes, S. (1993), “Asymptotique Properties of Four Fundamental Curves of DistributionalAnalysis”, Unpublished paper, STICERD, London School of Economics.[36] Kaur, A., Rao, B. L. S. P. <strong>et</strong> H. Singh (1994), “Testing for Second-Or<strong>de</strong>r StochasticDominance of Two Distributions”, Econom<strong>et</strong>ric Theory, 10, 849-866.


Bibliographie 66[37] Kod<strong>de</strong>, D. A. <strong>et</strong> F. C. Palm (1986), “Wald Criteria for Jointly Testing Equality andInequality Restrictions”, Econom<strong>et</strong>rica, 54, 1243-1248.[38] Levy, H. <strong>et</strong> J. Paroush (1974), “Toward Multivariate Efficiency Criteria”, Journal ofEconomic Theory, 7, 129-142.[39] Linton, O., Maasoumi, E. <strong>et</strong> Y.-J. Whang (2005), “Consistent Testing for StochasticDominance un<strong>de</strong>r General Sampling Schemes”, The Review of Economic Studies, 72,735-765.[40] Linton, O., Post, T. <strong>et</strong> Y.-J. Whang (2005), “Testing for Stochastic Dominance Efficiency”,ERIM Report Series Research in Management No. ERS-2005-033-F&A.[41] Maasoumi, E. <strong>et</strong> D. L. Millim<strong>et</strong> (2005), “Robust Inference Concerning Recent Trendsin US Environmental Quality”, Journal of Applied Econom<strong>et</strong>rics, 20, 55-77.[42] McFad<strong>de</strong>n, D. (1989), “Testing for Stochastic Dominance”, in Fomby T. B. and T. K.Seo (Ed.), Studies in the Economics of Uncertainty, New York, Wiley.[43] Roy, S. N. (1953), “On a Heuristic M<strong>et</strong>hod of Test Construction and its use in MultivariateAnalysis”, The Annals of Mathematical Statistics, 24, 220-238.[44] Scaill<strong>et</strong>, O. <strong>et</strong> N. Topaloglou (2005), “Testing for Stochastic Efficiency”, FAME ResearchPaper No. 154.[45] Schmid, F. <strong>et</strong> M. Tre<strong>de</strong> (1996), “Nonparam<strong>et</strong>ric Inference for Second Or<strong>de</strong>r StochasticDominance”, Discussion Papers in Statistics and Econom<strong>et</strong>rics, No. 2/96, University ofCologne.[46] Schmid, F. <strong>et</strong> M. Tre<strong>de</strong> (1998), “A Kolmogorov-Type Test fot Second-Or<strong>de</strong>r StochasticDominance”, Statistics and Probability L<strong>et</strong>ters, 37, 183-193.[47] Sen, A. (1992), Inequality Reexamined, Harvard University Press, Cambridge MA.[48] Stoline, M. R. <strong>et</strong> H. K. Ury (1979), “Table of the Stu<strong>de</strong>ntized Maximum Modulus Distributionand an Application to Multiple <strong>Comparaisons</strong> among Means”, Technom<strong>et</strong>rics,21, 87-93.[49] Wolak, F. A. (1989), “Testing Inequality Constraints in Linear Econom<strong>et</strong>ric Mo<strong>de</strong>ls”,Journal of Econom<strong>et</strong>rics, 41, 205-235.


Bibliographie 67[50] Xu, K. (1997), “Asymptotically Distribution-Free Statistical Test for Generalized LorenzCurves : An Alternative Approach”, Journal of Income Distribution, 7, 45-62.


Chapitre 4Dominance en pauvr<strong>et</strong>émultidimensionnelle : inférencestatistique <strong>et</strong> application aux pays <strong>de</strong>l’UEMOA4.1 IntroductionDeux approches sont généralement distinguées dans la littérature <strong>de</strong>s mesures <strong>de</strong> la pauvr<strong>et</strong>é: celle basée sur l’aspect financier ou monétaire (Ravallion <strong>et</strong> Chen, 1997) <strong>et</strong> celle quim<strong>et</strong> l’accent sur une définition plus large que la considération monétaire (Drèze <strong>et</strong> Sen, 1989 ;Sen, 1979 ; 1985 ; 1987). La première approche consiste essentiellement à considérer le revenucomme mesure <strong>de</strong> <strong>bien</strong>-<strong>être</strong>. Plusieurs tests <strong>de</strong> comparaisons robustes <strong>de</strong> ce <strong>bien</strong>-<strong>être</strong>ont été proposés dans ce cadre (An<strong>de</strong>rson, 1996 ; Davidson <strong>et</strong> Duclos, 2000 ; Barr<strong>et</strong>t <strong>et</strong> Donald,2003). Cependant, comme le souligne An<strong>de</strong>rson (2005), l’intégration d’une dimensionsupplémentaire dans la mesure du <strong>bien</strong>-<strong>être</strong> pourrait modifier les analyses effectuées dans lecadre habituel <strong>de</strong> distributions univariées.La secon<strong>de</strong> approche caractérise le <strong>bien</strong>-<strong>être</strong> comme un phénomène multidimensionel.Sahn <strong>et</strong> Stifel (2000 ; 2003) utilisent l’analyse factorielle pour dériver un indicateur <strong>de</strong> la


Chapitre 4. Dominance en pauvr<strong>et</strong>é multidimensionnelle 714.2.2 L’estimation <strong>de</strong> l’indicateur <strong>de</strong> la richesseL’approche d’inertie sera utilisée pour dériver l’indicateur <strong>de</strong> richesse. Il s’agit d’une approchepratique dont le but est <strong>de</strong> réduire dans la mesure du possible l’arbitraire dans le calcul<strong>de</strong> l’indicateur 1 . En considérant N individus indicés par i = 1, ..., N, <strong>et</strong> J attributs pour chacund’eux, avec chaque attribut j = 1, ..., J, il s’agit <strong>de</strong> représenter par un nuage <strong>de</strong> pointsautour d’un centroï<strong>de</strong> (moyennes pondérées) les N individus dans l’espace <strong>de</strong>s J attributsavec un poids associé à chaque point. L’inertie totale du nuage <strong>de</strong> points, dépendamment<strong>de</strong> la métrique choisie, est la somme pondérée <strong>de</strong>s distances <strong>de</strong> chaque point par rapport aucentroï<strong>de</strong>.Il s’agit alors <strong>de</strong> construire un indicateur <strong>de</strong> la richesse pour chaque ménage basé sur lasomme pondérée <strong>de</strong> différents attributs <strong>de</strong> <strong>bien</strong>-<strong>être</strong>. Soit X i l’indicateur <strong>de</strong> richesse pour leménage i, x ij sa dotation en attribut j <strong>et</strong> α j le poids <strong>de</strong> chaque attribut, l’expression <strong>de</strong> X i estdonnée par :X i = α 1 x i1 + ... + α J x iJ . (4.2)Afin <strong>de</strong> réduire l’arbitraire dans le choix <strong>de</strong> la métho<strong>de</strong> <strong>de</strong> réduction <strong>de</strong> données, <strong>de</strong>uxapproches sont utilisées : d’abord l’ACM usuelle <strong>et</strong> ensuite une métho<strong>de</strong> basée sur la maximisation<strong>de</strong> la vraisemblance. Les techniques <strong>de</strong> l’ACM sont assez connues <strong>et</strong> ne seront doncpas développées ici. Pour ce qui concerne l’autre métho<strong>de</strong>, qui s’appuie sur l’analyse factorielleconfirmatoire avec variables qualitatives, la littérature propose essentiellement <strong>de</strong>uxapproches : l’approche <strong>de</strong> la variable <strong>de</strong> réponse sous-jacente <strong>et</strong> l’approche <strong>de</strong> la fonction <strong>de</strong>réponse (Moustaki, 2000 ; Jöreskog <strong>et</strong> Moustaki, 2001).Dans la première approche, on suppose que chaque variable qualitative est générée parune variable <strong>de</strong> réponse inobservée <strong>et</strong> continue (variable latente) qui suit une distributionnormale. C<strong>et</strong>te approche a été adoptée par plusieurs auteurs qui ont estimé le modèle en <strong>de</strong>uxétapes (Lee, Poon <strong>et</strong> Bentler, 1992) ou en trois (Muthèn, 1983 ; Jöreskog, 1994).1 Asselin (2002) en fait une revue détaillée.


Chapitre 4. Dominance en pauvr<strong>et</strong>é multidimensionnelle 73un total <strong>de</strong> paramètres à estimer <strong>de</strong> Σ J j=1m j . Soit θ l’ensemble <strong>de</strong>s paramètres à estimer <strong>et</strong>soit r une <strong>de</strong>s configurations possibles <strong>de</strong>s J réponses respectives au niveau <strong>de</strong>s J variablesqualitatives, la probabilité <strong>de</strong> réalisation d’une configuration est donnée par :π r (θ) = P r (x 1 = a 1 , x 2 = a 2 , ..., x J = a J ) =∫ γ(1)a 1γ (1)a 1 −1∫ γ(2)a 2γ (2)a 2 −1...∫ γ(J)a Jγ (J)a J −1φ J (ε 1 , ε 2 , ..., ε J |Γ) dε 1 , dε 2 , ..., dε J . (4.5)On remplace π r (θ) par son expression dans l’équation <strong>de</strong> la fonction <strong>de</strong> vraisemblancesuivante :L NMS (θ) = ∑ rP r ln π r (θ), (4.6)avec P r= n rN , où n r est le nombre <strong>de</strong> réalisations <strong>de</strong> la configuration r <strong>et</strong> N la taille <strong>de</strong>l’échantillon questionné. En maximisant L(θ) par rapport à θ, on obtient les estimateurs dumaximum <strong>de</strong> vraisemblance à information complète. Cependant, lorsque J > 4, l’estimationn’est plus numériquement faisable à cause <strong>de</strong> la faible puissance relative <strong>de</strong> la plupart <strong>de</strong>sordinateurs actuels. C’est pourquoi Jöreskog <strong>et</strong> Moustaki (2001) proposent d’estimer plutôtune approche basée sur la normale bivariée sous-jacente (NBS). Ici, au lieu <strong>de</strong> s’intéresser auxprobabilités <strong>de</strong>s différentes configurations <strong>de</strong>s J réponses, l’on se contente <strong>de</strong>s probabilitésstandards π (j)aprobabilités π (jh)abd’obtenir, pour une variable j, une réponse dans la catégorie a, ainsi que <strong>de</strong>sd’avoir simultanément une réponse dans la catégorie a pour la variable j<strong>et</strong> une réponse dans la catégorie b pour la variable h. Elles sont respectivement expriméescomme suit :∫ (j) γπ a (j)a(θ) = φ (u) du (4.7)γ (j)a−1∫ (j) γπ (jh)aab(θ) =γ (j)a−1∫ γ(h)bγ (h)b−1φ 2 (u, v|ρ jh ) dudv. (4.8)φ (u) est une fonction <strong>de</strong> <strong>de</strong>nsité normale standard tandis que φ 2 (u, v|ρ) est une fonction<strong>de</strong> <strong>de</strong>nsité normale bivariée <strong>de</strong> corrélation ρ. Les paramètres sont alors estimés par la


Chapitre 4. Dominance en pauvr<strong>et</strong>é multidimensionnelle 74maximisation <strong>de</strong> la fonction suivante :m J∑ ∑ jL NBS (θ) =j=1 a=1P (j)aln π (j)a (θ) +j−1 m J∑ ∑∑j∑m hj=2 h=1 a=1 b=1P (jh)abln π (jh)ab(θ). (4.9)Même si c<strong>et</strong>te technique ne s’appuie pas sur une base théorique soli<strong>de</strong>, Jöreskog <strong>et</strong> Moustaki(2001) trouvent qu’elle donne les mêmes résultats que les autres démarches à informationcomplète basées sur l’approche <strong>de</strong> la fonction <strong>de</strong> réponse. De plus, elle est moins coûteuseen terme <strong>de</strong> temps d’exécution du programme économétrique <strong>et</strong> s’applique <strong>bien</strong> quand lenombre <strong>de</strong> variables ordonnées est grand.L’étape ultérieure consiste à estimer les scores factoriels. Dans le cas <strong>de</strong> variables ordonnées,il n’existe pas <strong>de</strong> relation linéaire entre les facteurs <strong>et</strong> les variables observées. Pourestimer alors le score, Shi <strong>et</strong> Lee (1997) proposent une approche bayésienne basée sur la distributiona posteriori <strong>de</strong>s facteurs. Dans ce qui suit, f est un scalaire, λ, x <strong>et</strong> x ∗ <strong>de</strong>s vecteurs(J × 1) <strong>et</strong> ψ une matrice diagonale (J × J). Si l’on suppose que p(f) est la fonction <strong>de</strong> <strong>de</strong>nsité<strong>de</strong> f, p(x ∗ |f) la fonction <strong>de</strong> <strong>de</strong>nsité conditionnelle <strong>de</strong> x ∗ par rapport à f, <strong>et</strong> Pr(x|f) laprobabilité conditionnelle <strong>de</strong> x par rapport à f, la distribution conditionnelle <strong>de</strong> f par rapportà x est donnée, d’après le théorème <strong>de</strong> Bayes, par :p(f|x) =∫Rp(f) Pr(x|f). (4.10)p(f) Pr(x|f)dfA partir <strong>de</strong> ce théorème, on peut dériver l’estimateur du score par :X i = ̂f B = E(f|x) = 1 B λ′ ψ −1 x ∗ W . (4.11)Les différentes étapes ainsi que les expressions <strong>de</strong> B <strong>et</strong> x ∗ Wsont données en annexe.4.3 Analyse <strong>de</strong> la dominance stochastique bidimensionnelleLes techniques présentées ici sont <strong>de</strong>s extensions <strong>multidimensionnelles</strong> <strong>de</strong> l’approche <strong>de</strong>la dominance stochastique développée par Atkinson (1987) <strong>et</strong> Foster <strong>et</strong> Shorrocks (1988a,b,c)


Chapitre 4. Dominance en pauvr<strong>et</strong>é multidimensionnelle 75dans le cadre unidimensionnel. Elles perm<strong>et</strong>tent <strong>de</strong> procé<strong>de</strong>r à <strong>de</strong>s comparaisons ordinales <strong>de</strong>pauvr<strong>et</strong>é (voir par exemple Bourguignon <strong>et</strong> Chakravarty (2002) <strong>et</strong> Atkinson <strong>et</strong> Bourguignon(1982)). L’analyse multidimensionnelle introduit une nouvelle considération : la distinctionentre l’approche <strong>de</strong> l’union <strong>et</strong> celle <strong>de</strong> l’intersection dans l’i<strong>de</strong>ntification <strong>de</strong>s pauvres (Atkinson,2003 ; Bourguignon <strong>et</strong> Chakravarty, 2003 ; Duclos, Sahn <strong>et</strong> Younger, 2006).4.3.1 La dominance <strong>de</strong> premier ordreL’approche adoptée ici est celle <strong>de</strong> Duclos <strong>et</strong> al (2006) qui définissent un indice additif 3<strong>de</strong> pauvr<strong>et</strong>é compatible avec les trois types <strong>de</strong> seuil (intersection, union <strong>et</strong> intermédiaire) :∫ ∫P (λ) = π (x 1 , x 2 ; λ) dF (x 1 , x 2 ) , (4.12)Λ(λ)où λ (x 1 , x 2 ) est un indicateur résumé du <strong>bien</strong>-<strong>être</strong>, λ (x 1 , x 2 ) = 0 la frontière ou le seuil<strong>de</strong> pauvr<strong>et</strong>é <strong>et</strong> Λ (λ), l’ensemble <strong>de</strong>s pauvres dépendamment <strong>bien</strong> entendu du type <strong>de</strong> seuilr<strong>et</strong>enu.Il est à noter que λ (x 1 , x 2 ) peut <strong>être</strong> défini comme un seuil <strong>de</strong> pauvr<strong>et</strong>é d’union, d’intersectionou intermédiaire. Ceci est illustré dans le graphique Figure 4.1, où x 1 <strong>et</strong> x 2 sont<strong>de</strong>ux dimensions du <strong>bien</strong>-<strong>être</strong>. λ 1 (x 1 , x 2 ) représente le seuil <strong>de</strong> pauvr<strong>et</strong>é d’intersection : ilconsidère un individu comme étant pauvre seulement s’il est pauvre à la fois dans <strong>de</strong>ux dimensions.λ 2 (x 1 , x 2 ) définit plutôt un seuil d’union qui considère qu’un individu est pauvrelorsqu’il l’est dans au moins une <strong>de</strong>s dimensions. λ 3 (x 1 , x 2 ) donne, quant à lui, une définitionintermédiaire du seuil <strong>de</strong> pauvr<strong>et</strong>é : une individu est alors jugé pauvre même avec x 1 > Z 1 , sila valeur <strong>de</strong> son x 2 est suffisamment faible pour qu’il se r<strong>et</strong>rouve à gauche <strong>de</strong> λ 3 (x 1 , x 2 ) = 0.Inversement, un individu sera considéré comme non-pauvre même avec x 1 < Z 1 si la valeur<strong>de</strong> son x 2 suffisamment élevée pour qu’il se r<strong>et</strong>rouve à droite <strong>de</strong> λ 3 (x 1 , x 2 ) = 0.Duclos <strong>et</strong> al (2006) présentent un exemple d’indice <strong>de</strong> pauvr<strong>et</strong>é multidimensionnelle quin’est autre qu’une extension bidimensionnelle <strong>de</strong> l’indice FGT <strong>de</strong> Foster, Greer <strong>et</strong> Thorbecke3 Dans le sens <strong>de</strong> la décomposabilité par sous-groupes.


Chapitre 4. Dominance en pauvr<strong>et</strong>é multidimensionnelle 76FIG. 4.1 – Définitions d’union, d’intersection <strong>et</strong> intermédiaire du seuil <strong>de</strong> pauvr<strong>et</strong>éx 2x ,xZ 11 2x 1,x 2Z 2Ax 1,x 20x 1(1984) :P α1 ,α 2(z 1 , z 2 ) =∫ z1∫ z20 0(z 1 − x 1 ) α 1(z 2 − x 2 ) α 2dF (x 1 , x 2 ) . (4.13)α 1 , α 2 ≥ 0 captent l’aversion à l’inégalité vis-à-vis <strong>de</strong> la pauvr<strong>et</strong>é dans les <strong>de</strong>ux dimensions.Ils donnent certaines interprétations <strong>de</strong> P α1 ,α 2(z 1 , z 2 ) pour diverses combinaisons <strong>de</strong>α 1 <strong>et</strong> α 2 . Ils utilisent c<strong>et</strong> indice pour générer <strong>de</strong>s surfaces <strong>de</strong> dominance stochastique à <strong>de</strong>uxdimensions, ce qui est utile pour <strong>de</strong>s comparaisons robustes <strong>de</strong> pauvr<strong>et</strong>é. Les ordres <strong>de</strong> dominanceétant s 1 = 1 + α 1 <strong>et</strong> s 2 = 1 + α 2 , la surface <strong>de</strong> dominance est donnée par :∆P s 1s 2(z 1 , z 2 ) =∫ z1∫ z20 0(z 1 − x 1 ) s 1−1 (z 2 − x 2 ) s 2−1 dH (x 1 , x 2 ) . (4.14)Pour dériver la dominance stochastique bidimensionnelle du premier ordre, Duclos <strong>et</strong> al(2006) fournissent cependant une classe <strong>de</strong> mesures Ψ 1,1 (λ ∗ ) plus générale que la forme FGT<strong>et</strong> compatible avec tous les types <strong>de</strong> seuil :⎧Λ (λ) ⊂ Λ (λ ∗ )⎪⎨Ψ 1,1 (λ ∗ π (x 1 , x 2 ; λ) = 0 si λ (x 1 , x 2 ) = 0) = P (λ)∂π(x 1 ,x 2 ;λ)⎪⎩∂x 1≤ 0 <strong>et</strong> ∂π(x 1,x 2 ;λ)∂x 2≤ 0 ∀ x 1 , x 2∣∂ 2 π(x 1 ,x 2 ;λ)∂x 1 ∂x 2≥ 0 ∀ x 1 , x 2 .⎫⎪⎬⎪⎭(4.15)


Chapitre 4. Dominance en pauvr<strong>et</strong>é multidimensionnelle 77La première ligne définit l’ensemble maximal <strong>de</strong>s pauvres. La secon<strong>de</strong> indique la continuité<strong>de</strong>s indices <strong>de</strong> pauvr<strong>et</strong>é le long <strong>de</strong> la frontière <strong>de</strong> pauvr<strong>et</strong>é. La troisième ligne provient<strong>de</strong> l’axiome <strong>de</strong> monotonicité <strong>et</strong> suggère que les indices sont faiblement décroissants dans lesattributs x 1 <strong>et</strong> x 2 . La <strong>de</strong>rnière ligne renvoie à l’axiome <strong>de</strong> la non décroissance <strong>de</strong> la pauvr<strong>et</strong>é.C<strong>et</strong>te hypothèse introduit cependant <strong>de</strong>s restrictions dans la classe Ψ 1,1 (λ ∗ ) dans la mesureoù, dépendamment <strong>de</strong> la nature <strong>de</strong>s attributs, il est possible qu’on ait plutôt une relation <strong>de</strong>complémentarité comme l’ont révélé Bourguignon <strong>et</strong> Chakravarty (2002). Le théorème 1 <strong>de</strong>Duclos <strong>et</strong> al(2006) établit alors la condition <strong>de</strong> dominance <strong>de</strong> premier ordre qui indique que,pour <strong>de</strong>s classes <strong>de</strong> mesures Ψ 1,1 (λ ∗ ), la pauvr<strong>et</strong>é sera plus forte en F qu’en G, ou que Gdomine F en pauvr<strong>et</strong>é, si <strong>et</strong> seulement si ∆P 1,1 (x 1 , x 2 ) > 0 ∀ (x 1 , x 2 ) ∈ Λ (λ ∗ ).4.3.2 La dominance stochastique d’ordre supérieurIl est aussi possible, en s’inspirant d’Atkinson <strong>et</strong> Bourguignon (1982), <strong>de</strong> définir les conditions<strong>de</strong> dominance stochastique <strong>de</strong> second ordre pour les cas <strong>de</strong> substituabilité <strong>et</strong> <strong>de</strong> complémentarité.Mais cela requiert <strong>de</strong>s hypothèses fortes sur les signes <strong>de</strong>s dérivées d’ordresupérieur (troisième <strong>et</strong> quatrième). Dans les classes <strong>de</strong> dominance spécifiées par Duclos <strong>et</strong> al(2006), l’on peut augmenter l’ordre dans l’une ou l’autre <strong>de</strong>s dimensions ou dans les <strong>de</strong>uxsimultanément. Ainsi, l’on peut définir les classes Ψ 2,1 (λ ∗ ), Ψ 2,2 (λ ∗ ), Ψ 1,2 (λ ∗ ) <strong>et</strong>c. La premièreest explicitée par Duclos <strong>et</strong> al comme suit :⎧P (λ) ∈ Ψ 1,1 (λ ∗ )⎪⎨∂π(x 1 ,x 2 ;λ)Ψ 2,1 (λ ∗ ∂x) = P (λ)1= 0 si λ (x 1 , x 2 ) = 0∂ 2 π(x 1 ,x 2 ;λ)≥ 0 ∀ x(∂x⎪⎩1 ) 2 1∂∣3 π(x 1 ,x 2 ;λ)≤ 0 ∀ x(∂x 1 ) 2 ∂x 1 , x 2 .2⎫⎪⎬⎪⎭(4.16)La première ligne signifie que les conditions <strong>de</strong> la classe Ψ 1,1 (λ ∗ ) sont respectées. Lasecon<strong>de</strong> suggère que la dérivée première par rapport à l’attribut x 1 est continue le long <strong>de</strong> lafrontière <strong>de</strong> pauvr<strong>et</strong>é. La troisième indique que le principe <strong>de</strong> transfert (PTUD) est vérifié auniveau <strong>de</strong> l’attribut x 1 . La <strong>de</strong>rnière ligne quant à elle révèle que l’eff<strong>et</strong> égalisateur inhérent autransfert décroît faiblement en fonction <strong>de</strong> x 2 .


Chapitre 4. Dominance en pauvr<strong>et</strong>é multidimensionnelle 78D’après leur théorème 2, il y a dominance stochastique, ou G domine F en pauvr<strong>et</strong>é, pourla classe Ψ 2,1 (λ ∗ ) si <strong>et</strong> seulement si ∆P 2,1 (x 1 , x 2 ) > 0 ∀ (x 1 , x 2 ) ∈ Λ (λ ∗ ).4.3.3 Inférence statistiqueLa démarche proposée perm<strong>et</strong> <strong>de</strong> tester la non dominance <strong>de</strong> la distribution F par la distributionG. La non dominance implique qu’il existe un point (z 1 , z 2 ) pour lequel ∆P s 1s 2(z 1 , z 2 ) ≤0. Formellement, on teste l’hypothèse :H 0 : ∆P s 1s 2(z 1 , z 2 ) ≤ 0 pour certains couples (z 1 , z 2 )versusH 1 : ∆P s 1s 2(z 1 , z 2 ) > 0 ∀ (z 1 , z 2 ).Le ratio <strong>de</strong> vraisemblance empirique proposé par Davidson <strong>et</strong> Duclos (2006) dans lecontexte <strong>de</strong> distributions univariées sera utilisé. C<strong>et</strong>te démarche perm<strong>et</strong> <strong>de</strong> conclure sanséquivoque à la dominance si les tests sont concluants. Le ratio est obtenu en résolvant leproblème <strong>de</strong> maximisation <strong>de</strong> la fonction <strong>de</strong> vraisemblance empirique suivante :maxPiF ,P jG∑in F ilog P Fi+ ∑ jn G j log P G j (4.17)suj<strong>et</strong> à∑iP Fi = 1,∑Pj G = 1j<strong>et</strong>∑iP Fi (z 1 − x F i1) s 1−1 (z 2 − x F i2) s 2−1 I ( x F i1 ≤ z 1 , x F i2 ≤ z 2)=


Chapitre 4. Dominance en pauvr<strong>et</strong>é multidimensionnelle 79∑Pj G (z 1 − x G j1) s1−1 (z 2 − x G j2) s2−1 I ( )x G j1 ≤ z 1 , x G j2 ≤ z 2jn F i <strong>et</strong> n G j représentent les nombres <strong>de</strong> réalisations égales respectivement à ( x F i1, xi2) F <strong>et</strong>( )xGj1 , x G j2 . I (·) est une fonction indicatrice qui prend la valeur 1 lorsque la condition estvérifiée <strong>et</strong> 0 sinon. s 1 <strong>et</strong> s 2 constituent les ordres <strong>de</strong> dominance tandis que P Fi <strong>et</strong> P G j sontles probabilités empiriques. Le ratio <strong>de</strong> vraisemblance mesure la distance entre le maximum<strong>de</strong> la vraisemblance non contrainte <strong>et</strong> le maximum <strong>de</strong> la vraisemblance contrainte ci-<strong>de</strong>ssusprésentée. Une valeur <strong>de</strong> 0 signifie que la contrainte n’est pas liante <strong>et</strong> qu’on ne peut pasrej<strong>et</strong>er l’hypothèse nulle <strong>de</strong> non dominance. Une valeur positive indique plutôt la possibilité<strong>de</strong> dominance, ce qui <strong>de</strong>vrait alors <strong>être</strong> testé formellement. Comme l’on s’intéresse à la nondominance <strong>de</strong> F par G, il n’y a pas <strong>de</strong> coût à contraindre l’égalité ∆P s 1s 2(z 1 , z 2 ) = 0 lorsque∆P s 1s 2(z 1 , z 2 ) ≤ 0. Dans ce cas la contrainte n’est pas liante <strong>et</strong> le ratio <strong>de</strong> vraisemblance aune valeur nulle. L’expression du ratio <strong>de</strong> vraisemblance LR (z 1 , z 2 ) peut alors <strong>être</strong> résuméecomme suit :LR (z 1 , z 2 ) ={0 si ∆ ̂P s 1s 2(z 1 , z 2 ) ≤ 0LR sinon}(4.18)L’expression du ratio LR sera développée plus loin. Le test étant basé sur une formulation<strong>de</strong> type intersection-union, pour les différentes valeurs (z 1 , z 2 ) du support [z 1 , z 1 ] ⊗ [z 2 , z 2 ],la statistique est donnée par le minimum <strong>de</strong> LR. z 1 <strong>et</strong> z 2 sont les bornes inférieures du supporttandis que z 1 <strong>et</strong> z 2 en sont les bornes supérieures. Pour la dominance <strong>de</strong> premier ordre, on as 1 = s 2 = 1 <strong>et</strong> la secon<strong>de</strong> contrainte du problème <strong>de</strong> maximisation (équation 4.17) <strong>de</strong>vient :∑i I ( ) ∑x F i1 ≤ z 1 , x F i2 ≤ z 2 = Pj G I ( )x G j1 ≤ z 1 , x G j2 ≤ z 2P Fij(4.19)La solution analytique du problème <strong>de</strong> maximisation donnent les expressions <strong>de</strong> nouvellesprobabilités pour les distributions F <strong>et</strong> G :Pi F = nF i I i (z 1 , z 2 )+ nF i (1 − I i (z 1 , z 2 ))ϖψ(4.20)


Chapitre 4. Dominance en pauvr<strong>et</strong>é multidimensionnelle 80Pj G = nG j I j (z 1 , z 2 )N − ϖ + nG j (1 − I j (z 1 , z 2 ))N − ψ(4.21)avec :I i (z 1 , z 2 ) ≡ I ( x F i1 ≤ z 1 , x F i2 ≤ z 2), Ij (z 1 , z 2 ) ≡ I ( x G j1 ≤ z 1 , x G j2 ≤ z 2),ϖ =N F (z 1 , z 2 ) = ∑ iN × N F (z 1 , z 2 )N F (z 1 , z 2 ) + N G (z 1 , z 2 ) , ψ = N × M F (z 1 , z 2 )M F (z 1 , z 2 ) + M G (z 1 , z 2 ) ,n F i I i (z 1 , z 2 ) ,N G (z 1 , z 2 ) = ∑ jn F j I j (z 1 , z 2 ) , N = N F + N G ,M F (z 1 , z 2 ) = N F − N F (z 1 , z 2 ) , M G (z 1 , z 2 ) = N G − N G (z 1 , z 2 )Le ratio <strong>de</strong> vraisemblance empirique est obtenu en multipliant par 2 le minimum <strong>de</strong> ladifférence entre la vraisemblance non contrainte <strong>et</strong> la vraisemblance contrainte. On obtientalors :12 LR (z 1, z 2 ) =⎧⎪⎨⎪⎩N log N − N F log N F − N G log N G+N F (z 1 , z 2 ) log N F (z 1 , z 2 ) + N G (z 1 , z 2 ) log N G (z 1 , z 2 )+M F (z 1 , z 2 ) log M F (z 1 , z 2 ) + M G (z 1 , z 2 ) log M G (z 1 , z 2 )− (N F (z 1 , z 2 ) + N G (z 1 , z 2 )) log (N F (z 1 , z 2 ) + N G (z 1 , z 2 ))− (M F (z 1 , z 2 ) + M G (z 1 , z 2 )) log (M F (z 1 , z 2 ) + M G (z 1 , z 2 ))⎫⎪⎬(4.22)⎪⎭D’après le théorème 1 <strong>de</strong> Davidson <strong>et</strong> Duclos (2006), sous l’hypothèse nulle, la statistiqueLR (z 1 , z 2 ) est asymptotiquement équivalente au carré <strong>de</strong> la statistique t utilisée par Kaur <strong>et</strong>al (1994). C<strong>et</strong>te statistique en bidimensionnel est donnée par :t 2 (z 1 , z 2 ) =(N F N G ̂F (z1 , z 2 ) − Ĝ (z 1, z 2 )(N G ̂F (z1 , z 2 ) 1 − ̂F)() (4.23)(z 1 , z 2 ) + N F Ĝ (z 1 , z 2 ) 1 − Ĝ (z 1, z 2 )) 2Les tests <strong>de</strong> bootstrap sont réalisés suivant le procédé décrit par Davidson <strong>et</strong> Duclos(2006). Lorsqu’il y a existence <strong>de</strong> dominance dans l’échantillon, on calcule le minimum <strong>de</strong>la statistique <strong>de</strong> test LR <strong>et</strong> on calcule les probabilités qui lui sont associées qui perm<strong>et</strong>tentaux échantillons <strong>de</strong> satisfaire tout juste l’hypothèse nulle. Ces probabilités sont utilisées pourgénérer T = 399 échantillons <strong>de</strong> bootstrap pour les <strong>de</strong>ux distributions. Ensuite l’on calcule,pour chaque paire d’échantillon, la statistique LR t (avec t = 1, ..., T ) donnée par (4.22).


Chapitre 4. Dominance en pauvr<strong>et</strong>é multidimensionnelle 81Enfin, la valeur p T du bootstrap est calculée comme étant la proportion <strong>de</strong> statistiques LR tsupérieures à LR.Pour les ordres <strong>de</strong> dominance supérieurs, il n’existe pas <strong>de</strong> solution analytique. Les détailssont donnés en annexe.4.4 Analyse empirique4.4.1 Les donnéesLes données proviennent essentiellement <strong>de</strong>s enquêtes démographiques <strong>et</strong> santé (EDS).Il s’agit d’enquêtes nationales auprès <strong>de</strong>s ménages en milieux urbain <strong>et</strong> rural. Six pays <strong>de</strong>l’UEMOA sont concernés par l’étu<strong>de</strong> à savoir : le Bénin, le Burkina, la Côte d’Ivoire, leMali, le Niger, <strong>et</strong> le Togo. Le Sénégal a été exclu parce que, pour la pério<strong>de</strong> considérée, lesdonnées nutritionnelles n’ont pas été collectées. En eff<strong>et</strong>, l’étu<strong>de</strong> se focalise sur les enquêtesmenées au milieu <strong>de</strong>s années 90 (1996-98) dans ces pays. On y r<strong>et</strong>rouve essentiellement 3questionnaires à savoir : le questionnaire ménage, le questionnaire individuel femme <strong>et</strong> lequestionnaire individuel homme. L’enquête individuelle femme s’adresse aux femmes âgées<strong>de</strong> 15 à 49 ans tandis que celle <strong>de</strong>s hommes concerne en général les hommes <strong>de</strong> 15 à 59 ans.Les principales caractéristiques <strong>de</strong> ces enquêtes sont résumées dans le tableau 4.1 en annexes.Ces enquêtes fournissent <strong>de</strong>s informations qui perm<strong>et</strong>tent d’estimer l’indicateur nutritionnel(Z_score) <strong>et</strong> l’indice <strong>de</strong> la richesse (X). Pour calculer le Z_score, on utilise les donnéessur la taille <strong>de</strong>s enfants, leur âge, leur sexe <strong>et</strong> sur les valeurs standards pour une population<strong>de</strong> référence. Pour cela, on considère uniquement les ménages pour lesquels les données nutritionnellessur les enfants ont été collectées. Quant au X, pour l’estimer l’on se sert <strong>de</strong>sinformations sur la possession <strong>de</strong> <strong>bien</strong>s durables (radio, télévision, réfrigérateur, bicycl<strong>et</strong>te,moto, car) <strong>et</strong> sur l’accès à d’autres <strong>bien</strong>s <strong>et</strong> services (électricité, type <strong>de</strong> toil<strong>et</strong>te, qualité duplancher, eau potable, éducation). Toutes les variables sont qualitatives d’où l’utilisation <strong>de</strong>


Chapitre 4. Dominance en pauvr<strong>et</strong>é multidimensionnelle 82l’ACM <strong>et</strong> <strong>de</strong> l’approche NBS.L’échantillon global a été utilisé pour générer les scores factoriels. Pour la métho<strong>de</strong> NBS,l’on estime d’abord les paramètres grâce à la maximisation <strong>de</strong> l’équation (4.9). Ces estiméssont alors considérés pour calculer les scores factoriels d’après l’équation (4.11). Pourl’intégration <strong>de</strong> Monte Carlo, 100000 vecteurs aléatoires ont été générés chacun selon la loiuniforme. Les <strong>de</strong>ux métho<strong>de</strong>s <strong>de</strong> réduction <strong>de</strong> données ont également tenu compte du poidséchantillonnal <strong>de</strong> chaque observation.Les principales statistiques décrivant les <strong>de</strong>ux indices calculés sont présentées dans lestableaux 4.2 <strong>et</strong> 4.3 en annexes. La Côte d’Ivoire, le Togo <strong>et</strong> le Mali affichent en moyenne lesmeilleurs niveaux <strong>de</strong> <strong>bien</strong>-<strong>être</strong> alors que Le Burkina <strong>et</strong> le Niger enregistrent quant à eux lesplus faibles indices.Le tableau 4.4 présente une analyse <strong>de</strong> sensibilité <strong>de</strong> l’indice <strong>de</strong> richesse. La <strong>de</strong>uxièmeligne représente les quartiles. Il s’agit <strong>de</strong> savoir si les indices estimés décrivent assez <strong>bien</strong> lephénomène <strong>de</strong> pauvr<strong>et</strong>é. Cela est le cas lorsque le pourcentage <strong>de</strong> ménages qui n’ont pas accèsà un <strong>bien</strong> diminue quand on passe du plus p<strong>et</strong>it quartile au plus grand. L’ACM <strong>et</strong> l’approcheNBS donnent tous <strong>de</strong>ux <strong>de</strong>s indices <strong>de</strong> richesse qui semblent <strong>bien</strong> appréhen<strong>de</strong>r la pauvr<strong>et</strong>é.Par ailleurs, le tableau 4.5 établit que ces <strong>de</strong>ux indices sont corrélés avec un coefficient <strong>de</strong> corrélationpour l’échantillon global <strong>de</strong> 96%. Pour l’analyse <strong>de</strong> dominance, l’estimateur obtenupar l’approche NBS est considéré pour la présentation <strong>de</strong>s résultats. Toutefois, l’existence <strong>de</strong>dominance n’est admise que si elle est confirmée pour les <strong>de</strong>ux métho<strong>de</strong>s.4.4.2 Résultats <strong>de</strong>s tests <strong>de</strong> dominancePour effectuer en pratique <strong>de</strong>s comparaisons robustes <strong>de</strong> pauvr<strong>et</strong>é, on définit une grille <strong>de</strong>points (z 1 , z 2 ) plutôt que <strong>de</strong> considérer l’ensemble <strong>de</strong>s points <strong>de</strong>s <strong>de</strong>ux distributions F <strong>et</strong> G.En théorie, s’il est possible <strong>de</strong> considérer l’ensemble <strong>de</strong> ces points, cela se révèle difficile enpratique lorsque les distributions sont <strong>de</strong> tailles assez gran<strong>de</strong>s. De plus, le choix d’une grille


Chapitre 4. Dominance en pauvr<strong>et</strong>é multidimensionnelle 83<strong>de</strong> points perm<strong>et</strong> d’analyser plus aisément, à travers un tableau, les surfaces <strong>de</strong> dominance.L’on peut alors définir <strong>de</strong>s intervalles [ ]z1 − , z 1+ ⊂ [z1 , z 1 ] <strong>et</strong> [ ]z2 − , z 2+ ⊂ [z2 , z 2 ] sur lesquelson peut tester la dominance. Pour constituer la grille, l’on considère 20 quantiles pour l’indice<strong>de</strong> richesse <strong>et</strong> 10 déciles pour l’indice nutritionnel, qu’on détermine après fusion <strong>de</strong>s<strong>de</strong>ux distributions à comparer. Au lieu <strong>de</strong> considérer les quantiles en tant que tels, la grilleest déterminéee en prenant plutôt les moyennes <strong>de</strong> chaque intervalle <strong>de</strong> quantile <strong>et</strong> <strong>de</strong> décile.Cela perm<strong>et</strong> <strong>de</strong> ne pas exclure spontanément le point [z 1 , z 2 ] pour lequel l’indice <strong>de</strong> pauvr<strong>et</strong>éau premier ordre aurait été <strong>de</strong> facto <strong>de</strong> 100% pour les <strong>de</strong>ux distributions si l’on avait considérésimplement les quantiles. Cela donne un total <strong>de</strong> 200 points. Avec les 6 pays, il y a 15combinaisons possibles <strong>et</strong> donc 15 relations <strong>de</strong> dominance possibles.Le tableau 4.6 présente les résultats <strong>de</strong>s tests <strong>de</strong> dominance du premier ordre. Le premierpays représente la distribution F <strong>et</strong> le second la distribution G. Le test est réalisé sous l’hypothèsenulle que G ne domine pas F . Les résultats révèlent l’existence <strong>de</strong> 12 relations <strong>de</strong>dominance. Hormis le cas BK-CI qui est une relation <strong>de</strong> dominance complète, les 11 autresrelations <strong>de</strong> dominance sont restreintes en ce sens qu’il a fallu préalablement exclure certainspoints <strong>de</strong> la grille (dans les parties inférieures <strong>et</strong>/ou supérieures) pour obtenir la dominance.Le tableau donne également le pourcentage d’individus situés dans la grille <strong>de</strong> dominance[ ] [ ]z−1 , z 1+ ⊗ z−2 , z 2+ . Les 3 cas <strong>de</strong> non dominance relevés ici correspon<strong>de</strong>nt à <strong>de</strong>s situationsoù il existe plusieurs points d’intersection entre les <strong>de</strong>ux distributions <strong>de</strong> telle sorte qu’il n’apas été possible d’obtenir <strong>de</strong>s différences dans les surfaces <strong>de</strong> dominance assez significatives.La Côte d’Ivoire (CI) domine tous les pays, suivie du Togo (TG) qui dominent également3 autres pays à savoir le Bénin (BN), le Burkina (BK) <strong>et</strong> le Niger (NG). Le Bénin <strong>et</strong> le Mali(ML) dominent quant à eux le Burkina <strong>et</strong> le Niger. On note l’absence <strong>de</strong> dominance entre leMali <strong>et</strong> le Togo, le Mali <strong>et</strong> le Bénin <strong>et</strong> entre le Burkina <strong>et</strong> le Niger. Les résultats montrentégalement que les <strong>de</strong>ux statistiques utilisées pour le bootstrap (les statistiques LR <strong>et</strong> t) sonttrès proches sinon i<strong>de</strong>ntiques.Le tableau 4.7 montre que le milieu urbain domine en pauvr<strong>et</strong>é le milieu rural. Ceci s’est


Chapitre 4. Dominance en pauvr<strong>et</strong>é multidimensionnelle 84FIG. 4.2 – Diagramme <strong>de</strong> dominance entre les pays <strong>de</strong> L’UEMOAavéré aussi <strong>bien</strong> dans chacun <strong>de</strong>s pays que pour l’échantillon global. Dans ce cas ci, 4 <strong>de</strong>s7 relations <strong>de</strong> dominance établies sont <strong>de</strong>s dominances complètes notamment dans le cas duBurkina, du Mali, du Togo <strong>et</strong> <strong>de</strong> l’échantillon global. Les autres relations <strong>de</strong> dominance sontrestreintes.L’analyse <strong>de</strong>s ordres <strong>de</strong> dominance supérieurs confirme la non dominance entre le Mali <strong>et</strong>le Togo (confère le tableau 4.8). Cela n’est pas le cas pour les <strong>de</strong>ux autres relations puisquele Mali domine stochastiquement le Bénin au second ordre tandis que le Niger domine leBurkina au troisième ordre. Ici également la non dominance implique l’intersection entre lesdistributions. Le graphique 4.2 indique le classement <strong>de</strong>s pays en terme <strong>de</strong> dominance. Lesflêches en continu traduisent la dominance au premier ordre alors que celles en pointillésreprésentent les dominances d’ordres supérieurs. La position <strong>de</strong> chaque pays par rapport ausomm<strong>et</strong> indique sa position eu égard au niveau <strong>de</strong> pauvr<strong>et</strong>é. Si au somm<strong>et</strong> on r<strong>et</strong>rouve la Côted’Ivoire qui affiche le plus faible niveau <strong>de</strong> pauvr<strong>et</strong>é, à l’inverse en bas on r<strong>et</strong>rouve le BurkinaFaso qui présente le niveau le plus élevé.Pour affiner l’analyse, on fait une décomposition <strong>de</strong> la dominance en tenant compte <strong>de</strong> la


Chapitre 4. Dominance en pauvr<strong>et</strong>é multidimensionnelle 85FIG. 4.3 – Diagrammes <strong>de</strong> dominance selon la localisation(a) Milieu rural(b) Milieu urbainlocalisation <strong>de</strong>s individus. On obtient ainsi <strong>de</strong>ux diagrammes dont l’un présente les relations<strong>de</strong> dominance en milieu rural <strong>et</strong> l’autre celles en milieu urbain. Le graphique 4.3 présenteces <strong>de</strong>ux diagrammes dont celui <strong>de</strong> gauche est celui du milieu rural tandis que celui <strong>de</strong> droiteconcerne le milieu urbain. L’on observe que les relations <strong>de</strong> dominance en milieu rural sontquasiment i<strong>de</strong>ntiques à celles du graphique 4.2. La seule différence est que la zone rurale<strong>de</strong> la Côte d’Ivoire domine celle du Mali à l’ordre 2, <strong>et</strong> non à l’ordre 1. Les résultats <strong>de</strong> ladominance pour le milieu urbain sont beaucoup plus surprenants. En eff<strong>et</strong>, le Burkina quiétait dominé précé<strong>de</strong>mment par tous les pays n’est plus dominé que par la Côte d’Ivoire. LeBénin apparaît c<strong>et</strong>te fois-ci comme le plus pauvre au niveau <strong>de</strong> la population citadine. C<strong>et</strong>tesituation peut signifier un déséquilibre important entre le niveau <strong>de</strong> vie en milieu rural <strong>et</strong> celuien milieu urbain pour certains pays comme le Burkina.4.5 ConclusionLa dominance stochastique a été le plus souvent analysée dans le cadre <strong>de</strong> distributionsunivariées. Plus récemment, Bourguignon <strong>et</strong> Chakravarty (2002) proposent un cadre théo-


Chapitre 4. Dominance en pauvr<strong>et</strong>é multidimensionnelle 86rique <strong>de</strong> dominance stochastique en pauvr<strong>et</strong>é multidimensionselle. Crawford (2005) <strong>et</strong> Duclos<strong>et</strong> al (2006) effectuent <strong>de</strong>s étu<strong>de</strong>s empiriques dans ce sens. Le présent papier s’inscritdans c<strong>et</strong>te lignée, en recourant au test du ratio <strong>de</strong> vraisemblance empirique proposée par Davidson<strong>et</strong> Duclos (2006) pour comparer la pauvr<strong>et</strong>é multidimensionnelle dans six pays <strong>de</strong>l’UEMOA.La démarche utilisée ici concilie les <strong>de</strong>ux gran<strong>de</strong>s catégories d’approches <strong>de</strong> mesures <strong>de</strong>la pauvr<strong>et</strong>é multidimensionnelle à savoir les approches non axiomatiques <strong>et</strong> les approchesaxiomatiques. Ainsi, <strong>de</strong>s métho<strong>de</strong>s d’analyse factorielle qui relèvent <strong>de</strong> la première catégoried’approches ont permis d’estimer un indicateur <strong>de</strong> richesse à partir <strong>de</strong>s données DHS. Pourréduire l’arbitraire inhérent au choix d’une métho<strong>de</strong> particulière <strong>de</strong> réduction <strong>de</strong> données,<strong>de</strong>ux métho<strong>de</strong>s d’analyse factorielle ont été utilisées : l’ACM <strong>et</strong> une métho<strong>de</strong> basée sur lafonction <strong>de</strong> vraisemblance. Pour produire les indices <strong>de</strong> pauvr<strong>et</strong>é bidimensionnelle suggéréspar les approches axiomatiques, le statut nutritionnel a été considéré comme une nouvelledimension associée à l’indicateur <strong>de</strong> la richesse.La métho<strong>de</strong> d’inférence statistique basée sur le ratio <strong>de</strong> vraisemblance empirique produit<strong>de</strong>s probabilités qui perm<strong>et</strong>tent <strong>de</strong> déterminer les échantillons <strong>de</strong> bootstrap. Les résultats <strong>de</strong>stests montrent que sur les 15 relations <strong>de</strong> dominance possibles, 12 se sont avérées statistiquementrobustes au premier ordre, même si, pour la plupart, il s’agit <strong>de</strong> dominance restreinte.La Côte d’Ivoire domine tous les autres pays en pauvr<strong>et</strong>é. Il y a ensuite le Togo qui domine lereste <strong>de</strong>s pays, excepté le Mali. Pour sa part, le Mali, tout comme le Bénin, domine le Burkina<strong>et</strong> le Niger. Les tests <strong>de</strong> dominance d’ordres supérieurs confirment la non dominance entrele Mali <strong>et</strong> le Togo alors que le Mali <strong>et</strong> le Niger dominent respectivement le Bénin à l’ordre2 <strong>et</strong> le Burkina à l’ordre 3. La pauvr<strong>et</strong>é est aussi apparue plus importante en milieu ruralequ’urbain. Les résutats traduisent également dans certains pays un écart considérable entre lapauvr<strong>et</strong>é rurale <strong>et</strong> urbaine.


Chapitre 4. Dominance en pauvr<strong>et</strong>é multidimensionnelle 874.6 Annexes4.6.1 Annexe : La métho<strong>de</strong> NBSConsidérons :p(f|x) =∫Rp(f) Pr(x|f),p(f) Pr(x|f)dfp(f) peut-<strong>être</strong> dérivée puisque l’on a supposé que f suit une loi N(0, 1). Puisque la distributionconditionnelle <strong>de</strong> x ∗ par rapport à f suit une loi N(fλ, ψ), on a :⎡∣ ⎤γa 1 1 −1 ≤ x ∗ 1 ≤ γ 1 ∣∣∣∣∣∣∣∣∣∣a 1·Pr(x|f) = Pr· f=⎢⎥⎣ ·⎦γa J J −1 ≤ x ∗ J ≤ γJ a Javecoù∫Ω{(2π) −J/2 |ψ| −1/2 exp⎡− (x∗ − fλ) ′ ψ −1 (x ∗ − fλ)2γa 1 1 −1 ≤ x ∗ 1 ≤ γa 1 1·Ω =·⎢⎣ ·γa K K −1 ≤ x ∗ K ≤ γK a K∫p(f) Pr(x|f) = (2π) −(J+1)/2 |ψ| −1/2g(x ∗ ) = f 2 + (x ∗ − fλ) ′ ψ −1 (x ∗ − fλ) = BΩ⎤,⎥⎦}dx ∗{ }exp − g(x∗ )dx ∗2[f − 1 ] 2B (λ′ ψ −1 x ∗ ) + x ∗′ Ax ∗On a :B = 1 + λ ′ ψ −1 λA = ψ −1 − 1 B ψ−1 λλ ′ ψ −1Lorsqu’on adopte la fonction <strong>de</strong> perte quadratique, l’estimateur bayésien qui minimise laperte est donné par la moyenne <strong>de</strong> la distribution a posteriori, en l’occurrence celle du score


Chapitre 4. Dominance en pauvr<strong>et</strong>é multidimensionnelle 88factoriel.=∫E (f|x) = fp(f|x)dfR∫fp(f) Pr(x|f)dfR= ∫p(f) Pr(x|f)dfR∫R f ∫ } {− exp g(x∗ )dx ∗ dfΩ 2= ∫} {−R∫Ω exp g(x∗ )dx2∗ df∫} {−Ω∫R f exp g(x∗ )dfdx ∗2= ∫} {−Ω∫R exp g(x∗ )dfdx2∗∫Ω exp { {} ∫− x∗′ Ax ∗f exp 2 R 2∫Ω exp { {} ∫− x∗′ Ax ∗exp 2 R 2}− [f− 1 B (λ′ ψ −1 x ∗ )] 2dfdx ∗− [f− 1 B (λ′ ψ −1 x ∗ )] 2}dfdx ∗Sans perte <strong>de</strong> généralités, en déplaçant la moyenne <strong>de</strong> f <strong>de</strong> 0 à 1 B λ′ ψ −1 x ∗ , il découle <strong>de</strong>spropriétés <strong>de</strong>s fonctions <strong>de</strong> <strong>de</strong>nsité normale que :∫ { [f −1Bexp −(λ′ ψ −1 x ∗ ) ] }2df = 1 <strong>et</strong>R2∫ { [f −1Bf exp −(λ′ ψ −1 x ∗ ) ] }2df = 1 2B λ′ ψ −1 x ∗ .RCela implique alors que :∫X i = ̂f B = E (f|x) =avec :Ωx ∗ W =1B λ′ ψ −1 x ∗ exp { }− x∗′ Ax ∗2 dx∗∫Ω exp { }− x∗′ Ax ∗dx∗∫Ω x∗ exp { }− x∗′ Ax ∗2 dx∗∫Ω exp { }− .x∗′ Ax ∗dx∗22= 1 B λ′ ψ −1 x ∗ WSachant que exp {x ∗′ Ax ∗ /2} est proportionnelle à la fonction <strong>de</strong> <strong>de</strong>nsité <strong>de</strong> la loi N(0, A −1 ),Shi <strong>et</strong> Lee (1997) recomman<strong>de</strong>nt l’utilisation d’une métho<strong>de</strong> simple <strong>de</strong> Monte Carlo. Il s’agit<strong>de</strong> générer L vecteurs aléatoires u 1 , ..., u L où chaque vecteur est généré suivant la loi uniformesur Ω. Si le but est <strong>de</strong> calculer une intégrale <strong>de</strong> la forme ∫ Ω Q(x∗ )dx ∗ , alors l’on a :∫V (Ω) [Q(u 1 ) + ... + Q(u L )] /L → Q(x ∗ )dx ∗ si L → ∞Ω


Chapitre 4. Dominance en pauvr<strong>et</strong>é multidimensionnelle 89où V (Ω) dénote le volume <strong>de</strong> Ω. En appliquant ce résultat à l’expression <strong>de</strong> x ∗ W , on a :avec :D(u 1 ) + ... + D(u L )d(u 1 ) + ... + d(u L ) → x∗ W , si L → ∞}D(x ∗ ) = x ∗ exp{− x∗′ Ax ∗2}<strong>et</strong> d(x ∗ ) = exp{− x∗′ Ax ∗.24.6.2 Annexe : Inférence sur la dominance d’ordres supérieursLes statistiques <strong>de</strong> test sont alors dérivées numériquement. Pour ce faire, l’on considèrele Lagrangien (L) associé au problème <strong>de</strong> maximisation sous contrainte. En posant :∑P Fi (z 1 − x F i1) s 1−1 (z 2 − x F i2) s 2−1 I ( x F i1 ≤ z 1 , x F i2 ≤ z 2)=∑iiPi F Γ s 1,s 2F,i()I i (z 1 , z 2 )<strong>et</strong>∑Pj G (z 1 − x G j1) s1−1 (z 2 − x G j2) s2−1 I ( ) ∑x G j1 ≤ z 1 , x G j2 ≤ z 2 = Pj G Γ s 1,s 2G,j ()I j (z 1 , z 2 ) ,jjalors L est donné par :L = ∑ in F ilog P Fi+ ∑ jn G j log P G j+ λ F (1 − ∑ iP Fi ) + λ G (1 − ∑ jP G j )− µ( ∑ iPi F Γ s 1,s 2F,i()I i (z 1 , z 2 ) − ∑ jP G j Γ s 1,s 2G,j ()I j (z 1 , z 2 )), (4.24)où λ F , λ G <strong>et</strong> µ ∈ R sont <strong>de</strong>s multiplicateurs <strong>de</strong> Lagrange. Les conditions <strong>de</strong> premier ordresont les suivantes :λ F + λ G = N F + N G = N,P Fi =n F iλ + µΓ s 1,s 2F,i()I i (z 1 , z 2 ) <strong>et</strong> P G j =n G jN − λ − µΓ s 1,s 2G,j ()I j (z 1 , z 2 )(4.25)avec λ = λ F . Il est alors plus aisé <strong>de</strong> résoudre le problème en recherchant ̂λ <strong>et</strong> ̂µ comme suit :(̂λ, ̂µ) = arg minλ,µ∈R− ∑ in F i log(λ + µΓ s 1,s 2F,i()I i (z 1 , z 2 ))− ∑ jn G j log(N − λ − µΓ s 1,s 2G,j ()I j (z 1 , z 2 )) (4.26)


Chapitre 4. Dominance en pauvr<strong>et</strong>é multidimensionnelle 90Si on considère que (z ∗ 1, z ∗ 2) est le couple <strong>de</strong> seuils qui minimise la fonction ci-<strong>de</strong>ssus, lesprobabilités ̂P Fi (z ∗ 1, z ∗ 2) <strong>et</strong> ̂P G j (z ∗ 1, z ∗ 2) sont obtenues en remplaçant, dans l’équation 4.25, λ <strong>et</strong>µ par leurs estimés. Le ratio <strong>de</strong> vraisemblance est alors donné par l’expression :⎧⎪⎨ −N F log N F − N G log N G + ∑ n F i log n F i + ∑ ⎫n G j log n G j⎪⎬ijLR s1 ,s 2= 2⎪⎩ − ∑ n F i log ̂P i F (z1, ∗ z2) ∗ − ∑ n G j log ̂P j G (z1, ∗ z2)∗ ⎪⎭ (4.27)ijL’équivalence entre c<strong>et</strong>te statistique <strong>et</strong> la statistique t peut <strong>être</strong> démontrée à l’ai<strong>de</strong> <strong>de</strong>smétho<strong>de</strong>s <strong>de</strong> Davidson (2007).4.6.3 Annexe : Les principaux tableauxTAB. 4.1 – Principales caractéristiques <strong>de</strong>s enquêtes EDSBénin Burkina CI Mali Niger TogoAnnées <strong>de</strong> sondage 1996 1998-99 1998-99 1995-96 1998 1998Nombre <strong>de</strong> zones <strong>de</strong>dénombrement 200 210 140 300 268 288Nombre <strong>de</strong> ménages :- Enquêtés 4499 4812 2122 8716 5928 7517- Milieu urbain (%) 32 26 67 32 28 32- Milieu rural (%) 68 74 33 68 72 68Nombre <strong>de</strong> femmes :- Enquêtés 5491 6445 3040 9704 7577 8569- Milieu urbain (%) 33 26 68 36 31 36- Milieu rural (%) 67 74 32 64 69 64Nombre d’hommes :- Enquêtés 1535 2641 886 2474 3542 3819- Milieu urbain (%) 33 30 66 36 34 35- Milieu rural (%) 67 70 34 64 66 65Source : Enquêtes EDS


Chapitre 4. Dominance en pauvr<strong>et</strong>é multidimensionnelle 91TAB. 4.2 – Statistiques <strong>de</strong>scriptives <strong>de</strong> l’indice <strong>de</strong> richesse (X)Pays Approche NBS ACMMoy. Ecart-t. Max Min Moy. Ecart-t. Max MinBénin 0.009 0.573 1.930 −0.486 0.020 0.587 2.819 −0.456Burkina −0.150 0.472 2.045 −0, 486 −0.133 0.496 2.819 −0.456CI 0.663 0.754 2.044 −0.481 0.566 0.788 2.819 −0.449Mali 0.066 0.498 1.989 −0.490 −0.010 0.496 2.647 −0.456Niger −0.179 0.482 2.009 −0.479 −0.159 0.485 2.819 −0.449Togo 0.138 0.583 1.931 −0.491 0.104 0.580 2.819 −0.456Ensemble 0.023 0.574 2.045 −0.491 0.000 0.572 2.819 −0.456TAB. 4.3 – Statistiques <strong>de</strong>scriptives <strong>de</strong> l’indicateur nutritionnel (Z_score)Pays Moy. Ecart-t. Max MinBénin −1.265 2.724 19.527 −28.471Burkina −1.749 2.512 17.108 −28.921CI −1.350 2.312 7.294 −27.808Mali −1.294 2.428 45.800 −23.978Niger −1.762 1.944 10.954 −13.117Togo −1.196 2.345 37.817 −29.016Ensemble −1.449 2.389 45.800 −29.016TAB. 4.4 – Analyse <strong>de</strong> sensibilité <strong>de</strong> l’indice <strong>de</strong> richesse X à travers <strong>de</strong>s quartilesApproche NBSACM1 er 2 eme 3 eme 4 eme 1 er 2 eme 3 eme 4 emePas d’élect. 100 100 100 57.3 100 100 99.7 57.0Pas <strong>de</strong> radio 82.7 31.6 35.2 18.9 72.0 56.2 20.7 16.7Pas <strong>de</strong> TV 100 100 100 59.0 100 100 99.8 58.5Pas <strong>de</strong> frigo 100 100 100 84.4 100 100 100 84.2Pas <strong>de</strong> bicycl<strong>et</strong>te 54.0 39.7 51.5 67.4 46.8 57.1 42.7 68.3Pas <strong>de</strong> moto 100 82.9 80.8 60.8 100 83.6 78.4 59.4Pas <strong>de</strong> car 100 100 99.9 87.4 100 100 99.9 87.2Plancher pauvre 100 68.8 72.6 28.5 100 80.5 60.0 25.2Pas <strong>de</strong> latrine 100 95.0 36.0 14.8 100 78.4 45.5 18.2Pas d’éducation 100 99.7 76.7 41.3 99.6 89.2 80.1 46.8Pas d’accès à l’eau 14.1 15.5 11.5 5.2 14.8 18.2 9.4 4.3


Chapitre 4. Dominance en pauvr<strong>et</strong>é multidimensionnelle 92TAB. 4.5 – Corrélation entre les indices <strong>de</strong> richesse <strong>de</strong>s <strong>de</strong>ux approchesPays CoefficientsBénin 0.97Burkina 0.98CI 0.94Mali 0.96Niger 0.97Togo 0.96Ensemble 0.96TAB. 4.6 – Tests <strong>de</strong> dominance stochastique <strong>de</strong> premier ordre, pays F versus pays GIntervalles Nature <strong>de</strong> la P-valueX Z_score dominance LR tBN-CI [−0.46, 1.23] [−2.96, 2.18] restreinte 0.000 ∗∗∗ 0.000 ∗∗∗BK-CI [−0.48, 1.87] [−5.97, 2.23] complète 0.005 ∗∗∗ 0.003 ∗∗∗ML-CI [−0.44, 1.52] [−3.27, 2.30] restreinte 0.000 ∗∗∗ 0.000 ∗∗∗NG-CI [−0.45, 1.85] [−3.46, 1.85] ” 0.000 ∗∗∗ 0.000 ∗∗∗TG-CI [−0.44, 1.00] [−2.87, 2.18] ” 0.000 ∗∗∗ 0.000 ∗∗∗BN-TG [−0.46, 0.24] [−2.92, 2.36] ” 0.090 ∗ 0.090 ∗BK-TG [−0.47, 1.18] [−5.64, 2.23] ” 0.013 ∗∗ 0.013 ∗∗ML-TG − − − non dominanceNG-TG [−0.44, 1.63] [−5.03, 1.97] restreinte 0.033 ∗∗ 0.033 ∗∗BN-ML − − − non dominanceBK-ML [−0.47, 1.08] [−5.46, 2.44] restreinte 0.000 ∗∗∗ 0.000 ∗∗∗NG-ML [−0.45, 1.62] [−3.47, 2.28] ” 0.000 ∗∗∗ 0.000 ∗∗∗BK-BN [−0.47, 1.64] [−5.85, 0.44] ” 0.000 ∗∗∗ 0.003 ∗∗∗NG-BN [−0.44, 1.10] [−3.38, 2.11] ” 0.070 ∗ 0.070 ∗BK-NG − − − non dominance


Chapitre 4. Dominance en pauvr<strong>et</strong>é multidimensionnelle 93TAB. 4.7 – Tests <strong>de</strong> dominance stochastique <strong>de</strong> premier ordre, zone rurale versus zone urbaineIntervalles Nature <strong>de</strong> la P-valueX Z_score dominance LR tBénin [−0.48, 1.58] [−3.00, 2.37] restreinte 0.028 ∗∗ 0.018 ∗∗Burkina [−0.48, 1.68] [−6.03, 2.43] complète 0.033 ∗∗ 0.028 ∗∗CI [−0.40, 1.92] [−2.86, 1.84] restreinte 0.013 ∗∗ 0.013 ∗∗Mali [−0.46, 1.57] [−5.02, 2.44] complète 0.028 ∗∗ 0.033 ∗∗Niger [−0.45, 1.62] [−4.88, 1.63] restreinte 0.023 ∗∗ 0.025 ∗∗Togo [−0.47, 1.58] [−5.08, 2.07] complète 0.020 ∗∗ 0.008 ∗∗∗Ensemble [−0.47, 1.73] [−5.33, 2.27] ” 0.000 ∗∗∗ 0.000 ∗∗∗TAB. 4.8 – Tests <strong>de</strong> dominance stochastique d’ordres supérieurs, pays F versus pays GIntervalles Nature <strong>de</strong> la P-valueX Z_score dominance LR tBN-ML (2) [−0.47, 0.10] [−3.23, 2.71] restreinte 0.023 ∗∗ 0.020 ∗∗ML-TG − − − non dominanceBK-NG (3) [−0.45, 1.69] [−5.44, −0.55] restreinte 0.035 ∗∗ 0.040 ∗∗


Bibliographie[1] An<strong>de</strong>rson, G. (1996), “Nonparam<strong>et</strong>ric Test of Stochastic Dominance in Income Distribution”,Econom<strong>et</strong>rica, 64, 1183-1193.[2] An<strong>de</strong>rson, G. (2005), “Life Expectancy and Economic Welfare : The Example of Africain the 1990s”, Review of Income and Wealth, 51, 455-468.[3] Atkinson, A. B. (1987), “On the Measurement of Poverty”, Econom<strong>et</strong>rica, 55, 749-764.[4] Atkinson, A. B. (2003), “Multidimensional Deprivation : Constrasting Social Welfareand Counting Approaches”, Journal of Economic Inequality, 1, 51-65.[5] Atkinson, A. B. <strong>et</strong> F. Bourguignon (1982), “The Comparison of Multidimensional Distributionsof Economic Status”, Review of Economic Studies, XLIX, 183-201.[6] Barr<strong>et</strong>t, G. F. <strong>et</strong> S. G. Donald (2003), “A Comparison of Consistent Nonparam<strong>et</strong>ric Testsfor Stochastic Dominance”, Econom<strong>et</strong>rica, 71, 71-104.[7] Bartholomew, D. J. (1983), “Latent Variable Mo<strong>de</strong>ls for Or<strong>de</strong>red Categorical Data”,Journal of Econom<strong>et</strong>rics, 22, 229-243.[8] Bartholomew, D. J. (1984), “The Foundations of Factor Analysis”, Biom<strong>et</strong>rika, 71, 221-232.[9] Bourguignon F. <strong>et</strong> S. R. Chakravarty (2002), “Multidimensional Poverty Or<strong>de</strong>rings”,DELTA Working Paper 2002-22.[10] Bourguignon, F. <strong>et</strong> S. R. Chakravarty (2003), “The Measurement of MultimensionalPoverty”, Journal of Economic Inequality, 1, 25-49.[11] Crawford, I. (2005), “A Nonparam<strong>et</strong>ric Test of Stochastic Dominance in MultivariateDistributions”, Discussion Papers in Economics, University of Surrey, DP 12/05.


Bibliographie 95[12] Davidson, R. (2007), “Testing for Restricted Stochastic Dominance : Some Further Results”,mimeo.[13] Davidson, R. <strong>et</strong> J.-Y. Duclos (2000), “Statistical Inference for Stochastic Dominance”,Econom<strong>et</strong>rica, 68, 1435-1464.[14] Davidson, R. <strong>et</strong> J.-Y. Duclos (2006), “Testing for Restricted Stochastic Dominance”,IZA Discussion Paper No 2047.[15] Drèze, J. <strong>et</strong> A. Sen (1989), Hunger and Public Action, Oxford University Press, Oxford.[16] Duclos, J.-Y., D. E. Sahn <strong>et</strong> S. D. Younger (2006), “Robust Multidimensional PovertyComparison”, Economic Journal, 113, 943-968.[17] Foster, J. E., J. Greer <strong>et</strong> E. Thorbecke (1984), “A Class of Decomposable Poverty Measures”,Econom<strong>et</strong>rica, 52, 761-766.[18] Foster, J. E. <strong>et</strong> A. F. Shorrocks (1988a), “Poverty Or<strong>de</strong>rings”, Econom<strong>et</strong>rica, 56, 173-177.[19] Foster, J. E. <strong>et</strong> A. F. Shorrocks (1988b), “Poverty Or<strong>de</strong>rings and Welfare Dominance”,Social Choice Welfare, 5, 179-198.[20] Foster, J. E. <strong>et</strong> A. F. Shorrocks (1988c), “Inequality and Poverty Or<strong>de</strong>ring”, EuropeanEconomic Review, 32, 654-662.[21] Jöreskog, K. G. (1994), “On the Estimation of Polychoric Correlation and their AsymptoticCovariance Matrix”, Psychom<strong>et</strong>rika, 59, 381-389.[22] Jöreskog, K. G. <strong>et</strong> I. Moustaki (2001), “Factor Analysis of Ordinal Variables : A Comparisonof Threee Approaches”, Multivariate Behavioral Research, 36, 347-387.[23] Kaur, A., B. L. S. P. Rao <strong>et</strong> H. Singh (1994), “Testing for Second-Or<strong>de</strong>r stochasticDominance of Two Distributions”, Econom<strong>et</strong>ric Theory, 10, 849-866.[24] Lee, S.-Y., W.-Y. Poon <strong>et</strong> P. M. Bentler (1992), “Structural Equation Mo<strong>de</strong>ls with Continuousand Polytomous Variables”, Psychom<strong>et</strong>rika, 57, 89-105.[25] Moustaki, I. (2000), “A Latent Variable Mo<strong>de</strong>l for Ordinal Variables”, Applied PsychologicalMeasurement, 24, 211-223.


Bibliographie 96[26] Muthén, B. (1983), “Latent Variable Structural Equation Mo<strong>de</strong>ling with CategoricalData”, Journal of Econom<strong>et</strong>rics, 22, 43-63.[27] Ravallion, M. <strong>et</strong> S. Chen (1997), “What Can New Survey Data Tell Us About RecentChanges in Distribution and Poverty ?”, World Bank Economic Review, 11, 357-382.[28] Sahn, D. E. and D. C. Stifel (2000), “Poverty Comparisons Over Time and Across Countriesin Africa ”, World Development, 28, 2123-2155.[29] Sahn, D. E. <strong>et</strong> D. C. Stifel (2002), “Robust Comparisons of Malnutrition in DevelopingCountries ”, American Journal of Agricultural Economics, 84, 716-735.[30] Sahn, D. E. and D. C. Stifel (2003), “Exploring Alternative Measures of Welfare in theAbsence of Expenditure Data”, Review of Income and Wealth, 49, 463-489.[31] Sen, A. (1979), “Personal Utilities and Public Judgements : Or what’s Wrong with WelfareEconomics”, The Economic Journal, 89, 537-558.[32] Sen, A. (1985), Commodities and Capabilities, North-Holland, Amsterdam.[33] Sen, A. (1987), The Standard of Living, Cambridge University Press, Cambridge.[34] Shi, J.-Q. <strong>et</strong> S.-Y. Lee (1997), “A Bayesian Estimation of Factor Score in ConfirmatoryFactor Mo<strong>de</strong>l with Polytomous, Censored or Truncated Data”, Psychom<strong>et</strong>rika, 62, 29-50.


Chapitre 5Inférence statistique en dominancestochastique en présence d’un indicateurdiscr<strong>et</strong> <strong>de</strong> <strong>bien</strong>-<strong>être</strong>5.1 IntroductionDepuis les travaux <strong>de</strong> Sen (1979,1985,1987), la pauvr<strong>et</strong>é est reconnue comme un phénomènemultidimensionnel. Outre le revenu, un certain nombre <strong>de</strong> variables peuvent <strong>être</strong>i<strong>de</strong>ntifiées comme étant <strong>de</strong>s manifestations <strong>de</strong> la pauvr<strong>et</strong>é à savoir, entre autres, l’état <strong>de</strong> lasanté, le niveau d’éducation, la possession <strong>de</strong> <strong>bien</strong>s durables, l’accès à <strong>de</strong>s services <strong>de</strong> base,<strong>et</strong>c. La plupart <strong>de</strong> ces dimensions sont discrètes, ce qui suggère d’établir <strong>de</strong>s conditions <strong>de</strong>comparaisons <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle qui tiennent compte <strong>de</strong> c<strong>et</strong>te nature.Par exemple, <strong>de</strong> nombreux économistes estiment que la taille <strong>et</strong> la composition du ménagesont <strong>de</strong>s déterminants <strong>de</strong> son niveau <strong>de</strong> vie. Ainsi, Bourguignon (1989) propose un critère <strong>de</strong>dominance en <strong>bien</strong>-<strong>être</strong> social qui tient compte <strong>de</strong> la taille du ménage. Atkinson (1992),Atkinson <strong>et</strong> Bourguignon (1987) <strong>et</strong> Jenkins <strong>et</strong> Lambert (1993) proposent <strong>de</strong>s conditions <strong>de</strong>dominance séquentielle en <strong>bien</strong>-<strong>être</strong> <strong>et</strong> en pauvr<strong>et</strong>é qui tiennent compte <strong>de</strong>s différences <strong>de</strong>taille <strong>de</strong>s ménages. Chambaz <strong>et</strong> Maurin (1998) analysent la pertinence empirique <strong>de</strong> c<strong>et</strong>te démarche.Plus récemment, Duclos <strong>et</strong> Makdissi (2005) éten<strong>de</strong>nt l’analyse aux ordres supérieurs


Chapitre 5. Inférence statistique en dominance stochastique 98<strong>de</strong> dominance.Cependant, il n’y a pas que la taille <strong>de</strong>s ménages qui constitue une dimension discrète.Il existe plusieurs autres aspects que l’on peut considérer. Ainsi, l’alphabétisation, le lieu <strong>de</strong>rési<strong>de</strong>nce (rural vs urbain), le type d’activités sont autant d’aspects qui peuvent influencerle <strong>bien</strong>-<strong>être</strong> <strong>de</strong> chaque ménage. Par ailleurs, la plupart <strong>de</strong>s étu<strong>de</strong>s s’en sont tenus à dériverles conditions <strong>de</strong> dominance <strong>et</strong> à effectuer <strong>de</strong>s comparaisons d’estimés <strong>de</strong> la pauvr<strong>et</strong>é entrepays, pério<strong>de</strong>s ou régions. Duclos, Sahn <strong>et</strong> Younger (2007) proposent <strong>de</strong>s comparaisons robustes<strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle dont une ou plusieurs dimensions sont discrètes.Ils s’appuient sur un test asymptotique. Notre objectif est <strong>de</strong> réaliser <strong>de</strong>s inférences statistiquesen dominance stochastique basée sur l’approche d’intersection-union. C<strong>et</strong>te approcheperm<strong>et</strong> <strong>de</strong> tester l’existence d’une dominance stricte. Davidson <strong>et</strong> Duclos (2006) proposent,dans le cadre <strong>de</strong>s distributions univariées, un test <strong>de</strong> ratio <strong>de</strong> vraisemblance empirique quisera étendu au cas <strong>de</strong> la pauvr<strong>et</strong>é multidimensionnelle en présence d’un indicateur discr<strong>et</strong> <strong>de</strong><strong>bien</strong>-<strong>être</strong>.La section suivante expose les conditions <strong>de</strong> dominance en <strong>bien</strong>-<strong>être</strong> tandis que la section3 décrit plutôt celle <strong>de</strong> la dominance en pauvr<strong>et</strong>é. Ces conditions sont empruntées à Atkinson<strong>et</strong> Bourguignon (1987), Jenkins <strong>et</strong> Lambert (1993), Chambaz <strong>et</strong> Maurin (1998) <strong>et</strong> Duclos<strong>et</strong> al (2007). La section 4 présente la métho<strong>de</strong> d’inférence qui s’appuie sur le ratio <strong>de</strong> vraisemblanceempirique <strong>et</strong> <strong>de</strong>s échantillonnages <strong>de</strong> bootstrap. La section 5 présente quelquesillustrations empiriques <strong>de</strong> comparaisons <strong>de</strong> la pauvr<strong>et</strong>é basées sur la métho<strong>de</strong> proposée. La<strong>de</strong>rnière section conclut le chapitre.5.2 Dominance stochastique en <strong>bien</strong>-<strong>être</strong>C<strong>et</strong>te partie s’inspire <strong>de</strong>s travaux d’Atkinson <strong>et</strong> Bourguignon (1987), <strong>de</strong> Jenkins <strong>et</strong> Lambert(1993) <strong>et</strong> <strong>de</strong> Chambaz <strong>et</strong> Maurin (1998). On suppose une population hétérogène quel’on peut partitionner en K sous-groupes selon un indicateur discr<strong>et</strong>. On adm<strong>et</strong> également


Chapitre 5. Inférence statistique en dominance stochastique 99que les sous-groupes peuvent <strong>être</strong> classés par ordre croissant ou décroissant selon leurs utilités.Soient x le revenu <strong>et</strong> u k (x) la fonction d’utilité concave <strong>et</strong> croissante du sous-groupe<strong>de</strong> ménages k ; soit F k (x) la fonction <strong>de</strong> <strong>de</strong>nsité cumulative <strong>de</strong>s ménages dans chaque sousgroupek ; soit φ F k∑ Kk=1 φF kla proportion <strong>de</strong>s ménages du sous-groupe k dans la population totale avec= 1 ; la fonction d’utilité sociale W <strong>de</strong> c<strong>et</strong>te population est donnée par :W F =K∑k=1φ F k∫ x0u k (x)dF k (x) dx, (5.1)où x correspond au supremum <strong>de</strong>s revenus maximaux <strong>de</strong>s sous-groupes, avec F k (x) = 1 ∀k = 1, ..., K. On fait l’hypothèse suivante :u (1)1 (x) ≥ u (1)2 (x) ≥ · · · ≥ u (1) (x) ≥ 0 ∀ x. (5.2)KC<strong>et</strong>te hypothèse signifie que, pour un même niveau <strong>de</strong> revenu x, les sous-groupes ayantplus <strong>de</strong> besoins (les sous-groupes sont ordonnés <strong>de</strong> telle façon que 1 correspond au plusnécessiteux <strong>et</strong> K au moins nécessiteux) valorisent le plus une augmentation <strong>de</strong> leur revenupar rapport aux sous-groupes ayant moins <strong>de</strong> besoins. Les ménages ayant plus <strong>de</strong> besoins sont<strong>de</strong>s ménages qui nécessitent plus <strong>de</strong> ressources pour atteindre le même niveau <strong>de</strong> <strong>bien</strong>-<strong>être</strong>qu’un ménage avec moins <strong>de</strong> besoins. Pour tenir compte du fait que l’on fait abstraction <strong>de</strong>différences éventuelles dans les besoins pour les ménages à hauts revenus, on peut poser unehypothèse supplémentaire (Jenkins <strong>et</strong> Lambert, 1993 ; Chambaz <strong>et</strong> Maurin, 1998) :u 1 (x) = u 2 (x) = · · · = u K (x). (5.3)Considérons une autre population dont les fonctions <strong>de</strong> <strong>de</strong>nsité cumulative pour les Ksous-groupes sont données par G k (x). On dénote alors par φ G kla proportion <strong>de</strong>s ménages


Chapitre 5. Inférence statistique en dominance stochastique 100dans chaque sous-groupe k. La condition <strong>de</strong> dominance séquentielle <strong>de</strong> premier ordre en<strong>bien</strong>-<strong>être</strong> <strong>de</strong> F par G est donnée par la proposition 1.Proposition 1 W G ≥ W F ∀ u k (x), avec k = 1, ..., K, satisfaisant les hypothèses (2) <strong>et</strong> (3),L∑ (si <strong>et</strong> seulement si φFk F k (x) − φ G k G k (x) ) ≥ 0 ∀ x <strong>et</strong> ∀ L = 1, ..., K.k=1Pour la preuve, voir Chambaz <strong>et</strong> Maurin (1998) qui s’inspirent <strong>de</strong> la démonstration d’Atkinson<strong>et</strong> Bourguignon (1987) tout en relâchant l’hypothèse φ F k = φG k .Pour examiner la dominance stochastique sequentielle <strong>de</strong> second ordre, l’on introduit unehypothèse additionnelle :u (2)1 (x) ≤ u (2)2 (x) ≤ · · · ≤ u (2) (x) ≤ 0 ∀ x. (5.4)KC<strong>et</strong>te hypothèse signifie que les différences entre les utilités marginales sont en valeurabsolue plus faibles pour les sous-groupes ayant moins <strong>de</strong> besoins. Autrement dit, la décroissance<strong>de</strong> l’utilité marginale est plus forte pour les sous-groupes ayant plus <strong>de</strong> besoins <strong>et</strong>diminue au fur <strong>et</strong> à mesure que l’on considère les sous-groupes avec <strong>de</strong> moins en moins <strong>de</strong>besoins. La condition <strong>de</strong> dominance stochastique séquentielle <strong>de</strong> second ordre en <strong>bien</strong>-<strong>être</strong><strong>de</strong> F par G est donnée par la proposition 2.Proposition 2 W G ≥ W F ∀ u k (x), avec k = 1, ..., K, satisfaisant les hypothèses (2), (3) <strong>et</strong>L∑ [(4), si <strong>et</strong> seulement si φFk F k (y) − φ G k G k (y) ] dy ≥ 0 ∀ x <strong>et</strong> ∀ L = 1, ..., K.k=1∫ x0Jenkins <strong>et</strong> Lambert (1993) donnent la preuve <strong>de</strong> la suffisance <strong>de</strong> c<strong>et</strong>te proposition dans lecas général où φ F k <strong>et</strong> φG k ne sont pas forcément égales. Chambaz <strong>et</strong> Maurin (1998) en donnentla preuve <strong>de</strong> la nécessité.


Chapitre 5. Inférence statistique en dominance stochastique 1015.3 Dominance stochastique en pauvr<strong>et</strong>éPour établir les conditions <strong>de</strong> dominance en pauvr<strong>et</strong>é, quelques autres hypothèses sontnécessaires. On considère les ensembles <strong>de</strong> séquences <strong>de</strong> seuils <strong>de</strong> pauvr<strong>et</strong>é suivantes :Z 1 ≥ Z 2 ≥ · · · ≥ Z k (5.5)C<strong>et</strong>te condition signifie que les seuils <strong>de</strong> pauvr<strong>et</strong>é <strong>de</strong>s différents sous-groupes peuvent<strong>être</strong> ordonnés décroissants <strong>de</strong>s plus nécessiteux aux moins nécessiteux. C<strong>et</strong>te supposition estraisonnable lorsqu’on prend par exemple le cas <strong>de</strong> la taille <strong>de</strong>s ménages, où le sous-groupele plus nécessiteux correspond aux ménages <strong>de</strong> gran<strong>de</strong>s tailles (sous-groupe 1) tandis quele moins nécessiteux correspond aux ménages d’un seul individu (sous-groupe K). Dans cecas, il est approprié <strong>de</strong> supposer qu’un ménage d’un sous-groupe k ait au moins autant <strong>de</strong>besoins que celui d’un sous-groupe k + 1 <strong>et</strong>, par conséquent, un seuil <strong>de</strong> pauvr<strong>et</strong>é au moinsaussi grand.On définit par P k (Z k ), la mesure <strong>de</strong> pauvr<strong>et</strong>é dans chaque sous-groupe k :P k (Z k ) =∫ Zk0π k (x) dF k (x) dx, (5.6)où π k (x) est la contribution à la pauvr<strong>et</strong>é d’un ménage du sous-groupe k ayant un niveau<strong>de</strong> revenu x. L’on a π k (x) = 0 si x ≥ Z k . Il est assez intuitif d’imaginer que, pour unmême niveau <strong>de</strong> revenu x, une même augmentation du revenu d’un individu diminuera lapauvr<strong>et</strong>é d’un sous-groupe k au moins autant que celle d’un sous-groupe k + 1. C’est ce quel’hypothèse suivante exprime :π (1)1 (x) ≤ π (1)2 (x) ≤ · · · ≤ π (1) (x) ≤ 0, ∀ x. (5.7)K


Chapitre 5. Inférence statistique en dominance stochastique 102C<strong>et</strong>te condition adm<strong>et</strong> également, par la non positivité <strong>de</strong> π (1)k(x), l’axiome <strong>de</strong> monotonicitédéfini dans les mesures axiomatiques <strong>de</strong> la pauvr<strong>et</strong>é 1 .Considérons la mesure <strong>de</strong> la pauvr<strong>et</strong>é pour l’ensemble <strong>de</strong> la population :K∑∫ ZkK∑P (Z) = φ k π k (x) dF k (x) dx = φ k P k (Z k ) , (5.8)k=10k=1avec Z = (Z 1 , Z 2 , ..., Z K ). Soient P F (Z) la mesure <strong>de</strong> la pauvr<strong>et</strong>é pour une population F<strong>et</strong> P G (Z) celle pour une population G, avec ∆P (Z) = P F (Z) − P G (Z). Dénotons parΠ 1 (Z), la classe <strong>de</strong>s mesures <strong>de</strong> pauvr<strong>et</strong>é satisfaisant l’ensemble <strong>de</strong>s hypothèses ci-<strong>de</strong>ssusénumérées. On définit <strong>de</strong>s limites supérieures <strong>de</strong> seuils <strong>de</strong> pauvr<strong>et</strong>é Z 1 + ≥ Z 2 + ≥ · · · ≥ Z + k<strong>de</strong> telle sorte que Z k ≤ Z + k, ∀ k. La condition <strong>de</strong> premier ordre en pauvr<strong>et</strong>é <strong>de</strong> F par G estdonnée par la proposition 3.Proposition 3 ∆P (Z) > 0, ∀ P (Z) ∈ Π 1 (Z) <strong>et</strong> ∀ Z k ∈ [ ]0, Z + k , k = 1, ..., K si <strong>et</strong>L∑ [seulement si φFk F k (Z k ) − φ G k G k (Z k ) ] > 0, ∀ Z k ∈ [ ]0, Z + L <strong>et</strong> ∀ L = 1, ..., K.k=1Jenkins <strong>et</strong> Lambert (1993) <strong>et</strong> Chambaz <strong>et</strong> Maurin (1998) en donnent la preuve.Duclos <strong>et</strong> al (2007) considèrent également, par simplicité, la classe <strong>de</strong> mesures <strong>de</strong> pauvr<strong>et</strong>éadditives. Mais ils dérivent <strong>de</strong>s conditions <strong>de</strong> dominance en utilisant directement c<strong>et</strong>temesure comme alternative aux fonctions <strong>de</strong> répartitions. Ils prennent l’exemple <strong>de</strong>s mesuresdu type F GT (Foster, greer <strong>et</strong> Thorbecke, 1984) où l’expression <strong>de</strong> π k (x) est donnée par :π k (x) = (Z k − x) α (5.9)Nous avons alors :1 Voir Bourguignon <strong>et</strong> Chakravarty (2002,2003) ainsi que Tsui (2002) pour une discussion <strong>de</strong> c<strong>et</strong> axiome <strong>et</strong><strong>de</strong>s autres principaux axiomes qui caractérisent les indices <strong>de</strong> pauvr<strong>et</strong>é.


Chapitre 5. Inférence statistique en dominance stochastique 103P k (Z k ; α) =∫ Zk0(Z k − x) α dF k (x) dx. (5.10)α = 0 correspond à l’inci<strong>de</strong>nce <strong>de</strong> la pauvr<strong>et</strong>é, α = 1 à l’écart <strong>de</strong> la pauvr<strong>et</strong>é <strong>et</strong> α = 2à l’indice <strong>de</strong> sévérité <strong>de</strong> la pauvr<strong>et</strong>é. La mesure r<strong>et</strong>enue (notamment le choix <strong>de</strong> α) indiquel’ordre <strong>de</strong> dominance en pauvr<strong>et</strong>é qui est égal à α + 1. Ainsi, la secon<strong>de</strong> condition <strong>de</strong> laproposition 3 est i<strong>de</strong>ntique à celle dérivée par Duclos <strong>et</strong> al (2007) pour la dominance enpauvr<strong>et</strong>é <strong>de</strong> premier ordre :L∑ [φFk Pk F (Z k ; 0) − φ G k Pk G (Z k ; 0) ] > 0, ∀ Z k ∈ [ ]0, Z + Lk=1<strong>et</strong> ∀ L = 1, ..., K. (5.11)Duclos <strong>et</strong> al (2007) considèrent aussi le cas où les indices <strong>de</strong> pauvr<strong>et</strong>é ne sont pas continusau niveau du seuil <strong>de</strong> pauvr<strong>et</strong>é. On a alors π k (x) = 0 si x > Z k <strong>et</strong> l’on postule l’hypothèseadditionnelle suivante :π 1 (x) ≥ π 2 (x) ≥ · · · ≥ π K (x) ≥ 0, ∀ x. (5.12)C<strong>et</strong>te condition signifie simplement que, pour un même niveau <strong>de</strong> revenu x, un ménaged’un sous-groupe k est perçu comme étant au moins aussi pauvre que celui d’un sous-groupek+1. La condition <strong>de</strong> dominance du premier ordre requiert alors, en plus <strong>de</strong> l’équation (5.11),la condition suivante :L∑ [φFk PkFk=1(Z+k ; 0) − φ G k P G k(Z+k ; 0)] > 0, ∀ L = 1, ..., K. (5.13)Il est possible d’établir la condition <strong>de</strong> dominance en utilisant un seuil unique Z u pourtous les sous-groupes plutôt qu’une séquence <strong>de</strong> seuils Z 1 ≥ Z 2 ≥ · · · ≥ Z k . Dans ce cas,


Chapitre 5. Inférence statistique en dominance stochastique 104lorsqu’on a Z u + ≥ Z 1 + avec Z u ∈ [0, Z u + ], alors c<strong>et</strong>te condition <strong>de</strong> dominance est plus forteque celle <strong>de</strong> la proposition 3. Autrement dit, c<strong>et</strong>te dominance implique la dominance <strong>de</strong> laproposition 3 alors que la réciproque n’est pas vraie. Par ailleurs, lorsqu’on considère plutôtZ u∈ [0, x], la condition <strong>de</strong> dominance en pauvr<strong>et</strong>é <strong>de</strong>vient équivalente à la condition <strong>de</strong>dominance en <strong>bien</strong>-<strong>être</strong> exprimée par la proposition 1.Pour étendre l’analyse à la dominance <strong>de</strong> second ordre, l’on considère l’hypothèse suivante:π (2)1 (x) ≥ π (2)2 (x) ≥ · · · ≥ π (2)K(x) ≥ 0, ∀ x. (5.14)Dénotons par Π 2 (Z), la classe <strong>de</strong>s mesures <strong>de</strong> pauvr<strong>et</strong>é respectant en plus l’hypothèse ci<strong>de</strong>ssus.La proposition 4 établit les conditions d’équivalence en dominance <strong>de</strong> second ordre<strong>de</strong> F par G en pauvr<strong>et</strong>é.Proposition 4 Les conditions suivantes sont équivalentes :(i) ∆P (Z) > 0, ∀ P (Z) ∈ Π 2 (Z) <strong>et</strong> ∀ Z k ∈ [ ]0, Z + k , k = 1, ..., K(ii) L ∑k=1∫ Zk0[φFk F k (x) − φ G k G k (x) ] dx > 0, ∀ Z k ∈ [ ]0, Z + L <strong>et</strong> ∀ L = 1, ..., K.∑(iii) L [φFk Pk F (Z k; 1) − φ G k P k G (Z k; 1) ] > 0, ∀ Z k ∈ [ ]0, Z + L <strong>et</strong> ∀ L = 1, ..., K.k=1avec :P F k (Z k ; 1) =∫ Zk0(Z k − x) dF k (x) dx <strong>et</strong> P G k (Z k ; 1) =∫ Zk0(Z k − x) dG k (x) dx(5.15)Proof. Voir la preuve en annexes.


Chapitre 5. Inférence statistique en dominance stochastique 105Ici aussi, le choix d’un Z u ∈ [0, x] unique pour tous les sous-groupes rend la condition <strong>de</strong>dominance équivalente à la dominance <strong>de</strong> second ordre en <strong>bien</strong>-<strong>être</strong> (proposition 2).5.4 Métho<strong>de</strong> d’inférence statistiqueOn considère une population <strong>de</strong> taille N qu’on partitionne en K sous-groupes selon un indicateurdiscr<strong>et</strong> d (niveau d’éducation, lieu <strong>de</strong> rési<strong>de</strong>nce, taille du ménage, <strong>et</strong>c). On considèreégalement un indicateur continu x <strong>de</strong> <strong>bien</strong>-<strong>être</strong> (revenu, dépenses, <strong>et</strong>c). Soit P i la probabilitérattachée au ménage i, avec i = 1, ..., N <strong>et</strong> ∑ Ni=1 P i = 1. Soit p ki la probabilité rattachéeau ménage i relativement au sous-groupe k <strong>de</strong> telle sorte que P i = φ k p ki . En considérant ycomme un niveau quelconque <strong>de</strong> revenu dans l’ensemble [0, x], la fonction <strong>de</strong> distributioncumulative normalisée (F k ) 2 d’un sous-groupe peut <strong>être</strong> estimée par :̂F k (y) =N∑P i I (x i ≤ y, d i = k) (5.16)i=1I(·) est une fonction indicatrice qui prend la valeur 1 lorsque la condition est vérifiée <strong>et</strong> lavaleur 0 sinon. Supposons maintenant qu’on veuille comparer <strong>de</strong>ux distributions bivariées F<strong>et</strong> G <strong>de</strong> tailles respectives N F <strong>et</strong> N G . La proposition 1 suggère l’existence d’une dominancestochastique séquentielle du premier ordre en <strong>bien</strong>-<strong>être</strong> <strong>de</strong> F par G si :L∑ [̂Fk (y) − (y)]Ĝk > 0 ∀ y <strong>et</strong> ∀ L = 1, ..., K. (5.17)k=1∑Ainsi, il y a absence <strong>de</strong> dominance lorsqu’on a L [F k (y) − G k (y)] ≤ 0 pour au moinsun couple (y, L). Le test est réalisé sous l’hypothèse nulle <strong>de</strong> non dominance contre l’alternative<strong>de</strong> dominance :2 On a ainsi que F k (∞) = φ k .k=1


Chapitre 5. Inférence statistique en dominance stochastique 106L∑H 0 : [F k (y) − G k (y)] = 0 pour certains couples (y, L)k=1versusL∑H 1 : [F k (y) − G k (y)] > 0 ∀ y <strong>et</strong> ∀ L = 1, ..., K.k=1Davidson <strong>et</strong> Duclos (2006) proposent dans le cadre univarié une métho<strong>de</strong> <strong>de</strong> comparaisonrobuste basée sur le ratio <strong>de</strong> vraisemblance empirique. C<strong>et</strong>te métho<strong>de</strong> est étendue ici auxdistributions bivariées dont une <strong>de</strong>s dimensions est discrète. Le problème <strong>de</strong> maximisation <strong>de</strong>la fonction <strong>de</strong> vraisemblance empirique est donné par :maxPiF ,P jG∑N Fi=1∑N Glog Pi F +jlog P G j (5.18)suj<strong>et</strong> à :∑iP Fi= 1 <strong>et</strong> ∑ jP G j = 1En résolvant le problème, on obtient la fonction <strong>de</strong> vraisemblance empirique maximiséenon contrainte ÊL. Dans une secon<strong>de</strong> étape, le problème (5.18) est maximisé en tenantcompte <strong>de</strong> la contrainte supplémentaire :∑N F∑N Gi I(x F i ≤ y, d F i ≤ L) − Pj G I(x G j ≤ y, d G j ≤ L) = 0. (5.19)P Fi=1j=1On obtient alors la fonction <strong>de</strong> vraisemblance empirique contrainte ÊL c. Le ratio <strong>de</strong> vraisemblanceLR est obtenu en multipliant par 2 la différence entre ÊL <strong>et</strong> ÊL c. Son expressionest donnée par :


Chapitre 5. Inférence statistique en dominance stochastique 107⎧⎪⎨LR(y, L) = 2⎪⎩N log N − N F log N F − N G log N G+N F (y, L) log N F (y, L) + N G (y, L) log N G (y, L)+M F (y, L) log M F (y, L) + M G (y, L) log M G (y, L)−(N F (y, L) + N G (y, L)) log(N F (y, L) + N G (y, L))−(M F (y, L) + M G (y, L)) log(M F (y, L) + M G (y, L))⎫⎪⎬⎪⎭(5.20)où N h (y, L) = ∑ N hi=1 I i(y, L), M h (y, L) = N F − N h (y, L) <strong>et</strong> I i (y, L) = I(x h i ≤ y, d h ß ≤ L),avec h = F, G. Lorsqu’on abor<strong>de</strong> la dominance séquentielle en pauvr<strong>et</strong>é, la contrainte (19)peut <strong>être</strong> reécrite comme suit :∑N F∑N Gi I(x F i ≤ Z L , d F i ≤ L) − Pj G I(x G j ≤ Z L , d G j ≤ L) = 0, avec Z L ∈ [0, Z + L ].(5.21)P Fi=1j=1Comme l’ont montré Davidson <strong>et</strong> Duclos (2006), le ratio LR est asymptotiquement équivalentreau carré <strong>de</strong> la statistique t <strong>de</strong> Kaur, Rao <strong>et</strong> Singh (1994) dans le cas univarié. Ilest assez trivial <strong>de</strong> montrer que cela tient dans le cas bivarié. La proposition 5 établit c<strong>et</strong>teéquivalence :∑Proposition 5 Sous l’hypothèse F (y, L) = G(y, L), avec F (y, L) = L F k (y) <strong>et</strong> G(y, L) =L∑G k (y), lorsque N → ∞, alors LR(y, L) est équivalente à t 2 (y, L).k=1k=1Proof. Voir la preuve en annexe.L’expression du carré <strong>de</strong> la statistique t est la suivante :t 2 (y, L) =( ) 2N F N G ̂F (y, L) − Ĝ (y, L)N G ̂F (y, L)(1 − ̂F)). (5.22)(y, L) + N F Ĝ (y, L)(1 − Ĝ (y, L)L’avantage avec l’approche du ratio <strong>de</strong> vraisemblance est que son estimation perm<strong>et</strong> égalementd’estimer les probabilités P Fi <strong>et</strong> P G j qui vont servir à dériver les échantillons du boots-


Chapitre 5. Inférence statistique en dominance stochastique 108trap 3 . Dans la démarche précé<strong>de</strong>nte, qui concerne la dominance du premier ordre, les solutionssont déterminées analytiquement. Les expressions <strong>de</strong> P Fi <strong>et</strong> P G j sont données par :Pi F = I i(y, L)+ (1 − I i(y, L))θφ(5.23)P G j =I j (y, L)N F + N G − θ + (1 − I j(y, L))N F + N G − φ(5.24)avecθ = (N F + N G ) × N F (y, L)N F (y, L) + N G (y, L)<strong>et</strong> φ = (N F + N G ) × M F (y, L)M F (y, L) + M G (y, L) .Les statistiques LR(y, L) <strong>et</strong> t(y, L) correspon<strong>de</strong>nt aux minimums respectifs parmi l’ensemble<strong>de</strong>s combinaisons (y, L) possibles. Si ce minimum est égal à 0, alors la courbe <strong>de</strong>dominance donnée par ( ∑ i P Fi I i (y, L) − ∑ j P G j I j (y, L)) prend au moins une valeur négativeou nulle pour certains couples (y, L). Dans le cas contraire, il y a alors possibilité <strong>de</strong>dominance <strong>et</strong> les tests <strong>de</strong> bootstrap seront effectués en adoptant la démarche <strong>de</strong> Davidson <strong>et</strong>Duclos (2006). En utilisant P Fi<strong>et</strong> P G j , on génère 399 échantillons <strong>de</strong> bootstrap respectivementpour les distributions F <strong>et</strong> G. La P − value qui représente la probabilité rattachée àl’hypothèse nulle H 0 est égale à la proportion <strong>de</strong>s échantillons pour lesquels les statistiquesLR <strong>et</strong> t <strong>de</strong> bootstrap sont respectivement supérieures aux minimums LR(y, L) <strong>et</strong> t(y, L)obtenus avec les échantillons initiaux.Pour la dominance stochastique d’ordre supérieur, il n’existe pas <strong>de</strong> solution analytique.On considère c<strong>et</strong>te fois-ci une contrainte <strong>de</strong> la forme :3 Les statistiques LR 1/2 (y, L) <strong>et</strong> t 1/2 (y, L) sont asymptotiquement pivotales. En eff<strong>et</strong>, sous l’hypothèsenulle F (y, L) = G(y, L), la statistique LR 1/2 (y, L) est équivalente à la statistique t 1/2 (y, L) qui est, sous c<strong>et</strong>temême hypothèse, asymptotiquement distribuée selon la loi N(0, 1), ce qui est valable pour leurs minimums.Voir Kaur, Rao <strong>et</strong> Singh (1994) <strong>et</strong> Davidson <strong>et</strong> Duclos (2006) pour la démonstration dans le cadre univarié.


Chapitre 5. Inférence statistique en dominance stochastique 109∑N F∑N Gi (y − x F i ) s I i (y, L) − Pj G (y − x G j ) s I j (y, L) = 0, (5.25)P Fi=1j=1où s + 1 est l’ordre <strong>de</strong> dominance. On pose le Lagrangien (L) associé au nouveau problème<strong>de</strong> maximisation comme suit :L = ∑ ilog P Fi+ ∑ jlog P G j+ λ F (1 − ∑ iP Fi ) + λ G (1 − ∑ jP G j )∑N F− µ(i=1∑N Gi (y − x F i ) s I i (y, L) − Pj G (y − x G j ) s I j (y, L)). (5.26)P Fj=1λ F , λ G <strong>et</strong> µ ∈ R sont <strong>de</strong>s multiplicateurs <strong>de</strong> Lagrange. Pour s ≥ 1, il n’y a pas <strong>de</strong> solutionanalytique. Mais il est possible <strong>de</strong> faire quelques transformations pour dériver les solutionsnumériques plus facilement. Pour cela, on obtient d’abord les conditions <strong>de</strong> premier ordre duproblème <strong>de</strong> maximisation précé<strong>de</strong>nt :λ F + λ G = N F + N GP Fi =1λ F + µ(y − x F i )s I i (y, L) <strong>et</strong> P G j =1N F + N G − λ F − µ(y − x G j )s I j (y, L) . (5.27)On peut maintenant résoudre le problème en recherchant ̂λ F <strong>et</strong> ̂µ :(̂λ F , ̂µ) = arg minλ F ,µ∈R− ∑ ilog(λ F + µ(y − x F i ) s I i (y, L))− ∑ jlog(N F + N G − λ F − µ(y − x G j ) s I j (y, L)). (5.28)


Chapitre 5. Inférence statistique en dominance stochastique 110Il s’agira ensuite <strong>de</strong> remplacer λ F <strong>et</strong> µ par leurs estimés ̂λ F <strong>et</strong> ̂µ dans l’équation (5.26)pour obtenir les probabilités ̂P Fi<strong>et</strong> ̂P G j . Ces probabilités sont alors utilisées pour déterminerle ratio LR(y, L). On r<strong>et</strong>ient finalement la statistique qui correspond au minimum parmil’ensemble <strong>de</strong>s couples <strong>de</strong> points (y, L). Dans quelques extensions <strong>de</strong>s métho<strong>de</strong>s <strong>de</strong> Davidson<strong>et</strong> Duclos, Davidson (2007) montre dans le cas univarié que, sous l’hypothèse nulle <strong>de</strong> nondominance <strong>de</strong> second ordre ∫ yF (y) = ∫ yG(y) pour au moins un seuil (y), c<strong>et</strong>te statistique0 0est équivalente au carré <strong>de</strong> la statistique t correspondante. L’extension au cas ∫ yF (y, L) =∫ y0G(y, L) est triviale.05.5 Résultats empiriquesNous utilisons les données issues <strong>de</strong>s enquêtes démographiques <strong>et</strong> <strong>de</strong> santé (EDS) poursix pays <strong>de</strong> l’UEMOA (Bénin, Burkina, Côte d’Ivoire, Mali, Niger, Togo) afin d’illustrerl’existence <strong>de</strong> dominance stochastique séquentielle stricte en présence d’un indicateur discr<strong>et</strong><strong>de</strong> <strong>bien</strong>-<strong>être</strong>. La première variable que nous considérons est un indice multidimensionnel <strong>de</strong>richesse calculé selon les métho<strong>de</strong>s d’analyse factorielle. Plus précisement, on le calcule enappliquant l’analyse <strong>de</strong>s correspondances multiples (ACM) à un ensemble <strong>de</strong> 11 variablesqualitatives indiquant la possession <strong>de</strong> <strong>bien</strong>s durables (radio, télévision, réfrigérateur, bicycl<strong>et</strong>te,moto, car) <strong>et</strong> l’accès à d’autres <strong>bien</strong>s <strong>et</strong> services (électricité, type <strong>de</strong> toil<strong>et</strong>te, qualitédu plancher, eau potable, éducation) 4 . Comme indicateur discr<strong>et</strong>, nous utilisons la taille duménage. On partitionne alors les échantilons en 10 groupes dont le premier est composé <strong>de</strong>sménages <strong>de</strong> 10 individus <strong>et</strong> plus alors que le 10 ème groupe ne comprend que les ménagesd’un seul individu. Un autre indicateur discr<strong>et</strong> considéré par l’étu<strong>de</strong> est la zone <strong>de</strong> rési<strong>de</strong>nce.Les échantillons sont alors divisés en <strong>de</strong>ux groupes à savoir, ceux qui vivent en zone rurale<strong>et</strong> ceux qui vivent en zone urbaine. Le niveau d’éducation du chef <strong>de</strong> menage constitue le<strong>de</strong>rnier indicateur discr<strong>et</strong>.Pour effectuer les comparaisons <strong>de</strong> pauvr<strong>et</strong>é, avec la taille du ménage comme indicateur4 Voir Greenacre (1993) <strong>et</strong> Greenacre <strong>et</strong> Blasius (2006) pour <strong>de</strong>s détails sur les métho<strong>de</strong>s ACM


Chapitre 5. Inférence statistique en dominance stochastique 111discr<strong>et</strong>, on constitue une grille <strong>de</strong> points (z y , L), soit 20 points pour y <strong>et</strong> 10 points pour L.Pour l’indice <strong>de</strong> richesse, on considère 20 quantiles, après fusion <strong>de</strong>s <strong>de</strong>ux distributions àcomparer, <strong>et</strong> les points z y sont donnés par les moyennes dans chaque classe <strong>de</strong> quantile. Ondéfinit ensuite L = [1, 2, ..., 10] où L = 1 correspond aux ménages <strong>de</strong> 10 individus <strong>et</strong> plus,L = 2 à celui <strong>de</strong> 9 individus, ainsi <strong>de</strong> suite jusqu’à L = 10 qui correspond à celui composéd’un seul individu.Le graphique 5.1 décrit les relations <strong>de</strong> dominance entre les six pays. Les flèches encontinu traduisent la dominance <strong>de</strong> premier ordre alors que celles en pointillés indiquent ladominance d’ordre 2. La Côte d’Ivoire domine tous les autres pays, suivie du Mali qui sembledominer les 4 autres pays, puis du Togo qui domine les 3 pays restants. On note une absence<strong>de</strong> dominance entre le Bénin <strong>et</strong> le Niger, ainsi qu’entre le Niger <strong>et</strong> le Burkina. La dominance<strong>de</strong> second ordre entre la Côte d’Ivoire <strong>et</strong> le Mali n’est obtenue que lorsqu’on exclutles comparaisons touchant uniquement les ménages <strong>de</strong> 8 individus <strong>et</strong>/ou plus. En eff<strong>et</strong>, lescomparaisons entre ces groupes exclusivement ne donnent pas <strong>de</strong> relation <strong>de</strong> dominance carles courbes se croisent. Mais, lorsqu’on élargit les échantillons <strong>de</strong> sorte à inclure <strong>de</strong>s ménages<strong>de</strong> tailles inférieures à 8, alors la dominance apparaît. Dans le cas du Mali <strong>et</strong> du Togo, c’estplutôt en excluant les ménages <strong>de</strong> 4 individus <strong>et</strong> moins qu’on obtient <strong>de</strong> la dominance.Les résultats plus détaillés <strong>de</strong>s tests sont reportés dans les tableaux 5.1, 5.2 <strong>et</strong> 5.3 en annexes.Le tableau 5.1 décrit les résultats <strong>de</strong> la dominance du premier ordre. Les P − valuesont les probabilités associées à l’hypothèse H 0 que le second pays ne domine pas séquentiellementle premier. Les résultats selon le ratio LR <strong>et</strong> la statistique t sont i<strong>de</strong>ntiques. L<strong>et</strong>ableau 5.2 présente la surface <strong>de</strong> dominance <strong>de</strong> second ordre dans le cas Mali-Côte d’Ivoire,notamment les valeurs du ratio LR. Les valeurs <strong>de</strong> LR égales à 0 signifient que les courbesse croisent, ce qui exclut la possibilité <strong>de</strong> dominance sur la portion <strong>de</strong> la surface considérée.Pour tester la dominance restreinte <strong>de</strong> second ordre, les minimums obtenus sont respectivement<strong>de</strong> 1, 919 pour le ratio LR <strong>et</strong> <strong>de</strong> 2, 409 pour la statistique t. Les P − value obtenuespar le bootstrap sont égales à 0, 000 pour les <strong>de</strong>ux statistiques, ce qui signifie que le rej<strong>et</strong> <strong>de</strong>l’hypothèse <strong>de</strong> non dominance se fait à un seuil <strong>de</strong> confiance <strong>de</strong> moins <strong>de</strong> 1%. Le tableau 5.3


Chapitre 5. Inférence statistique en dominance stochastique 112FIG. 5.1 – Diagramme <strong>de</strong> dominance séquentielle entre les pays <strong>de</strong> L’UEMOA, avec la tailledu ménage comme indicateur discr<strong>et</strong>quant à lui décrit plutôt les résultats dans le cas Togo-Mali. Dans ce cas, les statistiques LR<strong>et</strong> t sont respectivement <strong>de</strong> 2, 193 <strong>et</strong> 2, 195 avec <strong>de</strong>s P − value égales aussi à 0, 000.L’autre spécification considère plutôt le lieu <strong>de</strong> rési<strong>de</strong>nce comme indicateur discr<strong>et</strong>. Legraphique 5.2 présente le diagramme <strong>de</strong> dominance dans ce cas là. Comme précé<strong>de</strong>mment,la Côte d’Ivoire domine tous les autres pays en pauvr<strong>et</strong>é séquentielle, suivie du Mali <strong>et</strong> duTogo entre lesquels on note une absence <strong>de</strong> dominance. On obtient également une absence<strong>de</strong> dominance entre le Bénin <strong>et</strong> le Niger, ainsi qu’entre le Niger <strong>et</strong> le Burkina. La dominancedu Mali <strong>et</strong> du Togo sur le Bénin n’a été obtenu qu’au second ordre. Hormis les relations <strong>de</strong>dominance qui impliquent la Côte d’Ivoire, les autres relations <strong>de</strong> dominance sont restreintesen ce sens qu’il a fallu en général exclure les valeurs extrêmes <strong>de</strong> z y pour obtenir <strong>de</strong> ladominance.Les résultats détaillés <strong>de</strong> la dominance <strong>de</strong> premier ordre sont présentés dans le tableau 5.4en annexes. Le tableau 5.5 quant à lui décrit les résultats <strong>de</strong> la dominance <strong>de</strong> second ordre.Une troisième spécification considère le niveau d’éducation comme variable discrète.


Chapitre 5. Inférence statistique en dominance stochastique 113FIG. 5.2 – Diagramme <strong>de</strong> dominance séquentielle entre les pays <strong>de</strong> L’UEMOA, avec le lieu<strong>de</strong> rési<strong>de</strong>nce comme indicateur discr<strong>et</strong>Pour ce faire, c<strong>et</strong>te variable a été exclue <strong>de</strong> l’évaluation <strong>de</strong> l’indice <strong>de</strong> richesse, ce qui arestreint l’évaluation aux 10 variables qualitatives restantes. Le niveau d’éducation comporteici trois modalités à savoir l’absence d’éducation, le niveau d’éducation primaire <strong>et</strong> le niveausecondaire ou plus. Le graphique 5.3 présente le diagramme <strong>de</strong> dominance obtenu dans c<strong>et</strong>roisième cas qui se révèle assez proche <strong>de</strong> celui obtenu au niveau <strong>de</strong> la secon<strong>de</strong> spécification.Les différences ici sont que le Togo domine le Bénin au premier ordre tandis que ce <strong>de</strong>rnier,contrairement à la secon<strong>de</strong> spécification, domine le Niger également au premier ordre. Onnote toujours l’absence <strong>de</strong> dominance entre le Togo <strong>et</strong> le Mali <strong>et</strong> entre le Burkina <strong>et</strong> le Niger.Les résultats chiffrés <strong>de</strong> la dominance <strong>de</strong> premier ordre sont présentés dans le tableau 5.6.Pour l’unique dominance <strong>de</strong> second ordre, les minimums <strong>de</strong>s statistiques LR <strong>et</strong> t sont respectivement3, 154 <strong>et</strong> 3, 181 <strong>et</strong> correspon<strong>de</strong>nt à une même P − value <strong>de</strong> 0, 000, ce qui suggèredonc le rej<strong>et</strong> <strong>de</strong> l’hypothèse nulle <strong>de</strong> non dominance.Au niveau <strong>de</strong> la première spécification (avec la taille du ménage comme indicateur discr<strong>et</strong>),l’on obtient 13 relations <strong>de</strong> dominance sur les 15 relations possibles, parmi lesquelles11 sont <strong>de</strong>s dominances <strong>de</strong> premier ordre <strong>et</strong> 2 <strong>de</strong>s dominances <strong>de</strong> second ordre. Au niveau <strong>de</strong>


Chapitre 5. Inférence statistique en dominance stochastique 114FIG. 5.3 – Diagramme <strong>de</strong> dominance séquentielle entre les pays <strong>de</strong> L’UEMOA, avec le niveaud’éducation comme indicateur discr<strong>et</strong>la <strong>de</strong>uxième spécification (avec le lieu <strong>de</strong> rési<strong>de</strong>nce comme indicateur discr<strong>et</strong>), c’est plutôt12 relations <strong>de</strong> dominance dont 10 relations <strong>de</strong> dominance <strong>de</strong> premier ordre. Dans la <strong>de</strong>rnièrespécification, on a 13 relations <strong>de</strong> dominance avec 12 dominances <strong>de</strong> premier ordre. Lorsquela dominance s’avère pour la <strong>de</strong>rnière colonne <strong>de</strong> la surface <strong>de</strong> dominance (par exemple la<strong>de</strong>rnière colonne du tableau 5.2), cela signifie qu’on aurait obtenu la dominance dans le casunivarié si l’on avait fait abstraction <strong>de</strong> l’indicateur discr<strong>et</strong>. Au niveau <strong>de</strong> c<strong>et</strong>te relation <strong>de</strong>dominance du Mali par la Côte d’Ivoire, en réduisant le nombre <strong>de</strong>s classes <strong>de</strong> ménages, e.g.la première classe constituée <strong>de</strong> ménages <strong>de</strong> 7 individus <strong>et</strong> plus, la dominance restreinte obtenuepourrait alors <strong>être</strong> perçue comme une dominance entière. C’est la même chose dans lecas <strong>de</strong> la dominance du Togo par le Mali (tableau 5.3), sauf qu’ici la réduction du nombre<strong>de</strong> classes se fait en considérant une <strong>de</strong>rnière classe avec plus d’individus (e.g. une classe <strong>de</strong>5 individus). Ceci peut <strong>être</strong> justifié dans le cas <strong>de</strong> pays en développement où les ménagessont généralement <strong>de</strong> gran<strong>de</strong>s tailles. Par ailleurs, les dominances en <strong>bien</strong>-<strong>être</strong> établies sontplus fortes que la dominance en pauvr<strong>et</strong>é <strong>et</strong> impliquent c<strong>et</strong>te <strong>de</strong>rnière. Si on prend l’exempledu tableau 5.3, une situation <strong>de</strong> dominance en pauvr<strong>et</strong>é caractérisée par une non dominanceen <strong>bien</strong>-<strong>être</strong> serait celle où <strong>de</strong>s valeurs nulles tendraient à apparaître plutôt dans la partie du


Chapitre 5. Inférence statistique en dominance stochastique 115bas <strong>et</strong> <strong>de</strong> la droite du tableau. Dans ce cas, il serait possible d’obtenir une séquence <strong>de</strong> seuilsZ + 1 ≥ Z + 2 ≥ · · · ≥ Z + krobustes.pour lesquels on obtient <strong>de</strong>s statistiques positives <strong>et</strong> suffisamment5.6 ConclusionA part le revenu qui est généralement utilisé comme indicateur <strong>de</strong> <strong>bien</strong>-<strong>être</strong>, plusieursautres variables peuvent perm<strong>et</strong>tre <strong>de</strong> caractériser divers aspects <strong>de</strong> la pauvr<strong>et</strong>é. Ainsi, lataille du ménage, le lieu <strong>de</strong> rési<strong>de</strong>nce <strong>et</strong> le niveau d’éducation constituent autant d’indicateursqui peuvent influencer les besoins <strong>de</strong>s ménages. Réaliser alors l’analyse <strong>de</strong> la dominancestochastique univariée basée sur le revenu ou sur un indicateur <strong>de</strong> richesse n’est pas tout àfait convenable dans la mesure où l’on occulte les différences dans les besoins <strong>de</strong>s ménages.Il est alors plus adéquat <strong>de</strong> faire <strong>de</strong>s analyses <strong>de</strong> dominance en considérant <strong>de</strong>s variablessupplémentaires qui captent ces différences. Mais ces variables sont généralement discrètes<strong>et</strong> les nouvelles conditions <strong>de</strong> dominance <strong>de</strong>vraient en tenir compte. Ceci est fait à traversles conditions <strong>de</strong> dominance stochastique séquentielle en <strong>bien</strong>-<strong>être</strong> <strong>et</strong> en pauvr<strong>et</strong>é dérivéesentre autres par Atkinson (1992), Atkinson <strong>et</strong> Bouguignon (1987), Jenkins <strong>et</strong> Lambert (1993),Chambaz <strong>et</strong> Maurin (1998) <strong>et</strong>, plus récemment, Duclos <strong>et</strong> Makdissi (2005) ainsi que Duclos<strong>et</strong> al (2007).La présente étu<strong>de</strong> effectue <strong>de</strong>s inférences statistiques en dominance stochastique séquentielleen se basant sur le ratio <strong>de</strong> vraisemblance empirique. L’approche perm<strong>et</strong> <strong>de</strong> tester l’hypothèsenulle <strong>de</strong> non dominance contre l’alternative <strong>de</strong> dominance. Les données DHS perm<strong>et</strong>tent<strong>de</strong> procé<strong>de</strong>r à quelques illustrations empiriques <strong>de</strong> comparaisons entre six pays <strong>de</strong>l’Afrique <strong>de</strong> l’Ouest. La première spécification considère l’indice <strong>de</strong> richesse <strong>et</strong> la taille duménage comme indicateurs <strong>de</strong> <strong>bien</strong>-<strong>être</strong>. La secon<strong>de</strong> utilise le lieu <strong>de</strong> rési<strong>de</strong>nce à la place <strong>de</strong>la taille du ménage alors que la troisième spécification r<strong>et</strong>ient plutôt le niveau d’éducation.Les résultats basés sur les tests <strong>de</strong> bootstrap révèlent l’existence <strong>de</strong> plusieurs relations


Chapitre 5. Inférence statistique en dominance stochastique 116<strong>de</strong> dominance au niveau <strong>de</strong>s trois spécifications. Ils ont permis d’ailleurs d’établir trois diagrammes<strong>de</strong> dominance entre ces pays, respectivement pour les trois spécifications. La Côted’Ivoire apparaît ainsi dominer tous les autres pays, suivie du Mali <strong>et</strong> du Togo. Ces résultatssuggèrent aussi que les tests <strong>de</strong> dominance stricte basés sur le ratio <strong>de</strong> vraisemblancesont pratiques pour analyser la dominance stochastique multidimensionnelle lorsque l’une<strong>de</strong>s dimensions est discrète.5.7 Annexes5.7.1 Annexe : Preuve <strong>de</strong> la proposition 4Si on part <strong>de</strong> l’équation (5.8), Chambaz <strong>et</strong> Maurin (1998) prouvent que la condition (i) <strong>de</strong>la proposition implique la condition (ii).Considérons maintenant la première expression <strong>de</strong> la partie <strong>de</strong> droite <strong>de</strong> la condition (ii) :L∑∫ Zk[φFk F k (x) − φ G k G k (x) ] dxk=10=L∑k=1φ F k∫ Zk0F k (x) dx −L∑φ G kk=1∫ Zk0G k (x) dx (5.29)En intégrant par parties ∫ Z k0F k (x) dx <strong>et</strong> ∫ Z k0G k (x) dx, on obtient que l’expression (5.29)est égale à :=L∑k=1φ F k∫ ZkL∑(Z k − x)dF k (x) dx − φ G k0k=1∫ Zk0(Z k − x)dG k (x) dx (5.30)


Chapitre 5. Inférence statistique en dominance stochastique 117En utilisant les expressions <strong>de</strong> l’équation (5.15), on aura alors :L∑∫ Zk[φFk F k (x) − φ G k G k (x) ] dx =L∑ [φFk Pk F (Z k ; 1) − φ G k Pk G (Z k ; 1) ] ,k=10k=1d’où la preuve que (ii) implique (iii).Enfin, Duclos <strong>et</strong> Makdissi (2005) montrent que (iii) implique (i).5.7.2 Annexe : Preuve <strong>de</strong> la proposition 5C<strong>et</strong>te preuve est inspirée <strong>de</strong> celle fournie par Davidson <strong>et</strong> Duclos (2006). On dérived’abord une expression asymptotique du carré <strong>de</strong> t donnée en équation (5.22). On supposeque F (y, L) = G(y, L). On pose également que ∆(y, L) ≡ ̂F (y, L) − Ĝ(y, L). Par ailleurs,lorsque N → ∞, alors N F /N → r, où r est une constante comprise entre 0 <strong>et</strong> 1. Ainsi, siN → ∞, on a les égalités suivantes :̂F (y, L) = Ĝ(y, L) = F (y, L) + O P( )N − 1 2(5.31)<strong>et</strong>∆(y, L) = O P(N − 1 2). (5.32)La statistique (5.22) peut <strong>être</strong> alors exprimée asymptotiquement comme suit :t 2 (y, L) =r(1 − r)( )F (y, L) (1 − F (y, L)) P limN→∞ N∆2 (y, L) + O P N − 1 2(5.33)Davidson <strong>et</strong> Duclos montrent que la statistique LR est asymptotiquement équivalente àla statistique ci-<strong>de</strong>ssus. En eff<strong>et</strong>, considérons la statistique LR(y, L) donnée en (5.7.2). En


Chapitre 5. Inférence statistique en dominance stochastique 118suivant leur démonstration, sachant que N F (y, L) = N F F (y, L), N G (y, L) = N G G(y, L),M F (y, L) = N F −N F (y, L) <strong>et</strong> M G (y, L) = N G −N G (y, L), on peut transformer l’expression(5.7.2) comme étant la somme multipliée par 2 <strong>de</strong>s <strong>de</strong>ux expressions suivantes :{( )( ) }−N F ̂F (y, L) logNF ̂F (y,L)+NG Ĝ(y,L)N ̂F − N(y,L)G Ĝ(y, L) logNF ̂F (y,L)+NG Ĝ(y,L)(5.34)NĜ(y,L)<strong>et</strong>⎧⎨⎩−N F (1 − ̂F (y, L)) log( )N−(NF ̂F (y,L)+NG Ĝ(y,L))N−(1− ̂F (y,L)) )N−(1−Ĝ(y,L))−N G (1 − Ĝ(y, L)) log (N−(NF ̂F (y,L)+NG Ĝ(y,L))⎫⎬⎭ . (5.35)On peut réécrire la première expression (5.34) comme suit :−(N F ̂F (y, L) + NG Ĝ(y, L)) log(N F ̂F (y, L) + NG Ĝ(y, L))+N F ̂F (y, L) log(N ̂F (y, L)) + NG Ĝ(y, L) log(NĜ(y, L)) . (5.36)Si on introduit ∆(y, L) dans l’expression (5.36), sachant que ∆(y, L) ≡̂F (y, L) −Ĝ(y, L) <strong>et</strong> par conséquent N F ̂F (y, L) + NG Ĝ(y, L) =, par un développement <strong>de</strong> Tayloron obtient l’expression réduite suivante :1 N F N G ∆ 2 (y, L))2 N ̂F+ O P(N − 1 2 . (5.37)(y, L)Etant donné l’équation (5.31), l’expression ci-<strong>de</strong>ssus est égale à :12N F N G ∆ 2 (y, L). (5.38)NF (y, L)En réduisant la secon<strong>de</strong> expression 5.35 <strong>de</strong> façon similaire <strong>et</strong> en multipliant par 2, l’équation() <strong>de</strong>vient :


Chapitre 5. Inférence statistique en dominance stochastique 119N F N G ∆ 2 (y, L)( )NF (y, L)(1 − F (y, L)) + O P N − 1 2 . (5.39)Sachant que N F /N → r lorsque N → ∞, l’équation <strong>de</strong>viens alors :r(1 − r)( )F (y, L)(1 − F (y, L)) + O P N − 1 2 P limN∆ 2 (y, L), (5.40)Ce qui est equivalent au terme à droite <strong>de</strong> l’équation (5.33).5.7.3 Annexe : Principaux tableauxTAB. 5.1 – Tests <strong>de</strong> dominance restreinte <strong>de</strong> premier ordre, avec taille du ménage commeindicateur discr<strong>et</strong>F n’est pas dominé par G Ratio LR Statistique t(F -G) LR P − value t P − valueBénin-Côte d’Ivoire 2,295 0,000*** 2,317 0,000***Burkina-Côte d’Ivoire 2,360 0,000*** 2,377 0,000***Niger-Côte d’Ivoire 2,337 0,000*** 2,379 0,000***Togo-Côte d’Ivoire 3,180 0,000*** 3,259 0,000***Bénin-Mali 2,478 0,000*** 2,491 0,000***Burkina-Mali 7,197 0,000*** 6,227 0,000***Niger-Mali 2,656 0.025** 2,668 0.025**Bénin-Togo 2,635 0.005*** 2,512 0.005***Burkina-Togo 4,173 0.003*** 4,071 0.003***Niger-Togo 2,922 0.090* 2,921 0.090*Burkina-Bénin 2,584 0.035** 2,631 0.035**


Chapitre 5. Inférence statistique en dominance stochastique 120TAB. 5.2 – Surface <strong>de</strong> dominance <strong>de</strong> second ordreprésentant les statistiques LR, Mali vs Côted’IvoireTaille du ménagez y 10 <strong>et</strong> + 9 <strong>et</strong> + 8 <strong>et</strong> + 7 <strong>et</strong> + 6 <strong>et</strong> + 5 <strong>et</strong> + 4 <strong>et</strong> + 3 <strong>et</strong> + 2 <strong>et</strong> + 1 <strong>et</strong> +-0,46 3,88 1,13 1,21 1,92 2,51 2,54 2,51 2,99 2,99 2,99-0,44 2,01 1,10 1,44 2,33 3,06 3,91 4,38 5,43 5,43 5,43-0,35 1,69 0,86 1,78 2,84 4,37 6,19 6,97 8,71 8,73 8,73-0,30 1,94 1,33 2,39 3,64 5,38 7,26 8,03 9,86 9,89 9,89-0,17 1,05 0,67 1,56 3,12 5,02 6,95 7,68 9,62 9,60 9,60-0,13 0,24 0,00 0,83 2,57 4,53 6,51 7,30 9,29 9,27 9,27-0,12 0,02 0,00 0,67 2,49 4,48 6,50 7,33 9,36 9,33 9,33-0,04 0,00 0,00 0,31 2,53 4,69 6,91 8,01 10,20 10,14 10,14-0,03 0,00 0,00 0,30 2,58 4,77 7,02 8,16 10,38 10,32 10,32-0,02 0,00 0,00 0,48 2,81 5,03 7,32 8,52 10,77 10,71 10,71-0,00 0,00 0,00 0,69 3,08 5,33 7,66 8,92 11,20 11,14 11,140,05 0,00 0,27 1,67 4,27 6,69 9,30 10,80 13,30 13,23 13,230,11 0,25 0,93 2,47 5,21 7,77 10,60 12,28 14,98 14,91 14,910,18 0,75 1,60 3,26 6,18 8,92 12,06 14,03 16,99 16,92 16,920,33 1,03 2,14 4,04 7,17 10,21 13,82 16,33 19,78 19,72 19,720,71 1,02 2,41 4,72 8,12 11,60 15,99 19,66 24,22 24,14 24,141,02 0,58 2,04 4,51 7,99 11,58 16,30 20,62 25,88 25,80 25,801,24 0,00 1,19 3,70 7,26 10,88 15,82 20,60 26,43 26,35 26,351,52 0,00 0,00 2,42 6,04 9,65 14,81 20,12 26,70 26,62 26,621,82 0,00 0,00 0,92 4,54 8,10 13,46 19,29 26,78 26,698 26,698


Chapitre 5. Inférence statistique en dominance stochastique 121TAB. 5.3 – Surface <strong>de</strong> dominance <strong>de</strong> second ordre présentant les statistiques LR, Togo vsMaliTaille du ménagez y 10 <strong>et</strong> + 9 <strong>et</strong> + 8 <strong>et</strong> + 7 <strong>et</strong> + 6 <strong>et</strong> + 5 <strong>et</strong> + 4 <strong>et</strong> + 3 <strong>et</strong> + 2 <strong>et</strong> + 1 <strong>et</strong> +-0,47 2,40 3,04 3,29 3,56 3,45 2,75 2,95 2,64 2,64 2,64-0,45 4,68 5,68 6,37 5,16 5,76 4,61 4,01 2,91 2,91 2,91-0,39 4,61 5,48 6,11 5,71 4,98 2,81 1,43 0,00 0,00 0,00-0,34 4,62 5,50 5,99 5,67 4,70 2,32 0,77 0,00 0,00 0,00-0,31 5,03 6,00 6,29 5,96 4,83 2,34 0,66 0,00 0,00 0,00-0,24 7,15 8,46 8,79 8,67 7,72 5,50 3,75 1,11 1,16 1,16-0,19 8,66 10,12 10,50 10,49 9,64 7,65 5,93 3,30 3,36 3,36-0,14 10,29 11,83 12,28 12,35 11,62 9,82 8,11 5,53 5,60 5,60-0,12 10,70 12,25 12,72 12,76 12,05 10,30 8,56 5,98 6,06 6,06-0,05 11,40 12,89 13,35 13,23 12,48 10,75 8,80 6,27 6,37 6,37-0,03 11,52 12,97 13,42 13,24 12,49 10,77 8,76 6,23 6,34 6,34-0,01 11,40 12,78 13,16 12,93 12,14 10,39 8,31 5,76 5,88 5,880,01 11,04 12,30 12,60 12,27 11,43 9,60 7,40 4,76 4,89 4,890,09 9,95 10,96 11,17 10,63 9,75 7,72 5,29 2,41 2,56 2,560,14 9,18 10,04 10,22 9,58 8,67 6,54 3,96 0,91 1,09 1,090,23 8,14 8,78 8,94 8,23 7,31 5,13 2,32 0,00 0,00 0,000,38 7,10 7,49 7,69 6,88 5,96 3,79 0,64 0,00 0,00 0,000,76 5,84 5,90 6,14 5,29 4,47 2,43 0,00 0,00 0,00 0,001,14 5,44 5,35 5,56 4,79 4,08 2,19 0,00 0,00 0,00 0,001,60 5,27 5,07 5,30 4,67 4,11 2,55 0,00 0,00 0,00 0,00


Chapitre 5. Inférence statistique en dominance stochastique 122TAB. 5.4 – Tests <strong>de</strong> dominance <strong>de</strong> premier ordre, avec lieu <strong>de</strong> rési<strong>de</strong>nce comme indicateurdiscr<strong>et</strong>F n’est pas dominé par G Ratio LR Statistique t Nature <strong>de</strong> la(F -G) LR P − value t P − value dominanceBénin-Côte d’Ivoire 1,545 0,000*** 1,539 0,000*** non restreinteBurkina-Côte d’Ivoire 5,466 0,000*** 5,021 0,000*** non restreinteNiger-Côte d’Ivoire 7,150 0,000*** 5,573 0,000*** non restreinteTogo-Côte d’Ivoire 4,358 0,000*** 5,303 0,000*** non restreinteMali-Côte d’Ivoire 4,463 0,000*** 4,665 0,000*** non restreinteBurkina-Mali 6,244 0,098* 6,359 0,100* restreinteNiger-Mali 7,391 0,000*** 7,232 0,000*** restreinteBurkina-Togo 6,396 0,000*** 6,230 0,000*** restreinteNiger-Togo 7,360 0,040** 7,301 0,040** restreinteBurkina-Bénin 4,312 0,013** 4,351 0,013** restreinteTAB. 5.5 – Tests <strong>de</strong> dominance restreinte <strong>de</strong> second ordre avec, lieu <strong>de</strong> rési<strong>de</strong>nce commeindicateur discr<strong>et</strong>F n’est pas dominé par G Ratio LR Statistique t(F -G) LR P − value t P − valueBénin-Mali 1,998 0,000*** 2,000 0,000***Bénin-Togo 2,811 0,000*** 2,813 0,000***


Chapitre 5. Inférence statistique en dominance stochastique 123TAB. 5.6 – Tests <strong>de</strong> dominance <strong>de</strong> premier ordre, avec le niveau d’éducation comme indicateurdiscr<strong>et</strong>F n’est pas dominé par G Ratio LR Statistique t Nature <strong>de</strong> la(F -G) LR P − value t P − value dominanceBénin-Côte d’Ivoire 6,073 0,000*** 5,649 0,000*** non restreinteBurkina-Côte d’Ivoire 4,987 0,000*** 4,0784 0,000*** non restreinteMali-Côte d’Ivoire 2,279 0,000*** 2,314 0,000*** non restreinteNiger-Côte d’Ivoire 8,250 0,000*** 6,339 0,000*** non restreinteTogo-Côte d’Ivoire 2,752 0,000*** 2,742 0,000*** restreinteBénin-Togo 2,920 0,003*** 2,942 0,003*** restreinteBurkina-Togo 5,516 0,000*** 5,409 0,000*** restreinteNiger-Togo 6,423 0,063* 6,373 0,063* restreinteBurkina-Mali 9,200 0,000*** 8,366 0,000*** restreinteNiger-Mali 7,177 0,000*** 7,026 0,000*** restreinteBurkina-Bénin 3,786 0,005*** 3,846 0,005*** restreinteNiger-Bénin 3,951 0,058* 4,001 0,058* restreinte


Bibliographie[1] Atkinson, A. B. (1992), “Measuring Poverty and Differences in Family Composition”,Economica, 59, 1-16.[2] Atkinson, A. B. <strong>et</strong> F. Bourguignon (1987), “Income Distribution and Differences inNeeds”, in G. R. Feiwel (ed.) Arrow and the Foundations of the Theory of EconomicPolicy, New York : New York Press, 350-70.[3] Bourguignon, F. (1989), “Family Size and Social Utility : Income Distribution DominanceCriteria”, Journal of Econom<strong>et</strong>rics, 42, 67-80.[4] Bourguignon F. <strong>et</strong> S. R. Chakravarty (2002), “Multidimensional Poverty Or<strong>de</strong>rings”,DELTA Working Paper 2002-22.[5] Bourguignon, F. <strong>et</strong> S. R. Chakravarty (2003), “The Measurement of MultimensionalPoverty”, Journal of Economic Inequality, 1, 25-49.[6] Chambaz, C. <strong>et</strong> E. Maurin (1998), “Atkinson and Bourguignon’s Dominance Criteria :Exten<strong>de</strong>d and Applied to the Measurement of Poverty in France”, Review of Income andWealth, 44, 497-513.[7] Davidson, R. (2007), “Testing for Restricted Stochastic Dominance : Some Further Results”,mimeo.[8] Davidson, R. <strong>et</strong> J.-Y. Duclos (2006), “Testing for Restricted Stochastic Dominance”,IZA Discussion Paper No 2047.[9] Duclos, J.-Y. <strong>et</strong> P. Makdissi (2005), “Sequential Stochastic Dominance and the Robustnessof Poverty Or<strong>de</strong>rings”, Review of Income and Wealth, 51, 63-88.


Bibliographie 125[10] Duclos, J.-Y., D. Sahn <strong>et</strong> S. D. Younger (2007), “Robust Multidimensional PovertyComparisons with Discr<strong>et</strong>e Indicators of Well-being”, forthcoming, in S. P. Jenkins andJ. Micklewright, eds., Poverty and Inequality Re-examined, Oxford University Press.[11] Foster, J. E., J. Greer <strong>et</strong> E. Thorbecke (1984), “A Class of Decomposable Poverty Measures”,Econom<strong>et</strong>rica, 52, 761-766.[12] Greenacre, M. J. (1993), Correspon<strong>de</strong>nce Analysis in Pratice, London : Aca<strong>de</strong>micPress.[13] Greenacre, M. and J. Blasius (2006), Multiple Correspon<strong>de</strong>nce Analysis and RelatedM<strong>et</strong>hods, Statistics in The social and Behavioral Sciences Series, CRC Press.[14] Jenkins, S. P. <strong>et</strong> P. J. Lambert (1993), “Ranking Income Distributions When NeedsDiffer”, Review of Income and Wealth, 39, 337-356.[15] Kaur, A., B. L. S. P. Rao <strong>et</strong> H. Singh (1994), “Testing for Second-Or<strong>de</strong>r stochasticDominance of Two Distributions”, Econom<strong>et</strong>ric Theory, 10, 849-866.[16] Sen, A. (1979), “Personal Utilities and Public Judgements : Or what’s Wrong with WelfareEconomics”, The Economic Journal, 89, 537-558.[17] Sen, A. (1985), Commodities and Capabilities, North-Holland, Amsterdam.[18] Sen, A. (1987), The Standard of Living, Cambridge University Press, Cambridge.[19] Tsui, K.-Y. (2002), “Multidimensional Poverty indices ?”, Social Choice and Welfare,19, 69-93.


Chapitre 6Tests <strong>de</strong> dominance stochastique enmobilité6.1 IntroductionPour cerner l’aspect dynamique <strong>de</strong> la distribution <strong>de</strong> <strong>bien</strong>-<strong>être</strong> d’une société, l’on analysesouvent la mobilité <strong>de</strong>s revenus. On considère généralement qu’une société connaissant ungrand <strong>de</strong>gré <strong>de</strong> mobilité jouit d’un <strong>bien</strong>-<strong>être</strong> plus grand, dans la mesure où il existe dansc<strong>et</strong>te société assez d’opportunités pour qu’un individu pauvre <strong>de</strong>vienne plus riche. Il existeessentiellement <strong>de</strong>ux sources <strong>de</strong> mobilité : la première source <strong>de</strong> mobilité resulte <strong>de</strong> la simpleréallocation <strong>de</strong>s revenus tandis que la secon<strong>de</strong> tient aux changements dans le revenu total(Fields <strong>et</strong> Ok, 1996).Depuis Prais (1955), plusieurs mesures <strong>de</strong> la mobilité ont été proposées dans la littérature.A côté <strong>de</strong>s mesures assez triviales s’appuyant sur <strong>de</strong>s statistiques élémentaires comme lecoefficient <strong>de</strong> corrélation entre <strong>de</strong>s individus à différentes dates (Atkinson, Bourguignon <strong>et</strong>Morrisson, 1992 ; P<strong>et</strong>ers, 1992 ; Bjorklund <strong>et</strong> Jantti, 1997 ; Chadwick <strong>et</strong> Solon, 2002 ; Corak,2006), on distingue d’autres mesures plus élaborées basées sur les matrices <strong>de</strong> transition oud’autres processus dynamiques.


Chapitre 6. Tests <strong>de</strong> dominance stochastique en mobilité 127Certaines étu<strong>de</strong>s adoptent le concept relatif dans lequel la mobilité est considérée commeun phénomène <strong>de</strong> reclassement où les individus changent <strong>de</strong> position. Les mesures <strong>de</strong> mobilitésouvent proposées sont alors fonctions <strong>de</strong>s matrices <strong>de</strong> transition (Shorrocks, 1978a ;Bartholomew, 1996).D’autres étu<strong>de</strong>s considèrent plutôt la mobilité comme un concept absolu dans lequel toutchangement <strong>de</strong> revenu d’un individu par rapport à la situation initiale est synonyme d’augmentation<strong>de</strong> la mobilité (Fields <strong>et</strong> Ok, 1996). Ici, la mobilité d’un individu i peut <strong>être</strong> directementdérivée sans tenir compte <strong>de</strong> la situation <strong>de</strong>s autres individus <strong>de</strong> la population.D’Agostino <strong>et</strong> Dardanoni (2005) proposent une interprétation <strong>de</strong> la distinction entre la mobilitéabsolue <strong>et</strong> la mobilité relative.Il existe également une autre catégorie d’étu<strong>de</strong>s proposant <strong>de</strong>s mesures <strong>de</strong> mobilité baséessur <strong>de</strong>s interprétations spécifiques, notamment sur ses implications sur le <strong>bien</strong>-<strong>être</strong> social.Ainsi, Shorrocks (1978b) <strong>et</strong> Maasoumi <strong>et</strong> Zandvakili (1986) mesurent l’indice <strong>de</strong> mobilitécomme un ratio <strong>de</strong> l’inégalité du revenu moyen sur un certain nombre d’années par rapportà la moyenne <strong>de</strong>s inégalités <strong>de</strong> revenu sur chaque année. Schluter <strong>et</strong> Tre<strong>de</strong> (2003) adoptentla même mesure <strong>et</strong> en donnent une approximation sous forme d’intégrale d’une distributionpondérée. Chakravarty, Dutta <strong>et</strong> Weymark (1985) construisent <strong>de</strong>s indices éthiques <strong>de</strong>la mobilité du revenu en explorant la comparaison <strong>de</strong> <strong>bien</strong>-<strong>être</strong> entre une structure <strong>de</strong> revenusréelle (distribution <strong>de</strong> revenus sur une séquence <strong>de</strong> pério<strong>de</strong>s données) <strong>et</strong> une structure<strong>de</strong> référence (hypothétique) traduisant l’immobilité <strong>de</strong> l’économie. Toutefois, pour l’analyseempirique, ces mesures ne sont pertinentes que pour les pays disposant <strong>de</strong> données <strong>de</strong> panelsur une pério<strong>de</strong> assez longue, ce qui n’est généralement pas le cas <strong>de</strong>s pays en développement.D’autres étu<strong>de</strong>s, en considérant la façon dont la mobilité <strong>de</strong> l’économie influence le<strong>bien</strong>-<strong>être</strong>, proposent un cadre d’analyse <strong>de</strong> la mobilité valable même lorsqu’on ne dispose <strong>de</strong>données que sur <strong>de</strong>ux années ou <strong>de</strong>ux pério<strong>de</strong>s (Atkinson, 1983 ; Markandya, 1984 ; Conlisk,1989 ; Dardanoni, 1993).Si plusieurs étu<strong>de</strong>s ont porté sur les mesures <strong>de</strong> mobilité, relativement peu se sont intéres-


Chapitre 6. Tests <strong>de</strong> dominance stochastique en mobilité 128sées à <strong>de</strong>s comparaisons robustes <strong>de</strong> mobilité entre pays, régions ou entre plusieurs pério<strong>de</strong>s.Certaines étu<strong>de</strong>s proposent un cadre d’analyse pour les classements partiels <strong>de</strong> la mobilité.Ainsi, Atkinson (1983), Conlisk (1989), Dardanoni (1993), Benabou <strong>et</strong> Ok (2001) <strong>et</strong> Formby,Smith <strong>et</strong> Zheng (2003) dérivent <strong>de</strong>s conditions <strong>de</strong> dominance en mobilité basées sur les matrices<strong>de</strong> transition. Mitra <strong>et</strong> Ok (1998) considèrent le cas d’une mesure absolue <strong>de</strong> la mobilité<strong>de</strong> revenu comme celles proposées par Fields <strong>et</strong> Ok (1996), tandis que Schluter <strong>et</strong> Tre<strong>de</strong>(2003) se basent plutôt sur les mesures proposées par Shorrocks (1978b) <strong>et</strong> généralisées parMaasoumi <strong>et</strong> Zandvakili (1986).Les rares étu<strong>de</strong>s empiriques qui ont introduit l’inférence statistique à l’analyse ont consistéà comparer la mobilité aux Etats-unis <strong>et</strong> en Allemagne (Schluter, 1998 ; Schluter <strong>et</strong> Tre<strong>de</strong>,2003 ; Maasoumi <strong>et</strong> Tre<strong>de</strong>, 2001 ; Formby, Smith <strong>et</strong> Zheng, 2004). Fields, Leary <strong>et</strong> Ok (2002)comparent la mobilité <strong>de</strong>s revenus entre plusieurs pério<strong>de</strong>s <strong>de</strong> 5 années chacune aux Etatsunis<strong>de</strong> 1970 à 1995. Fabig (1999), quant à lui, effectue une comparaison entre les Etats-unis,la Gran<strong>de</strong>-Br<strong>et</strong>agne <strong>et</strong> l’Allemagne. La démarche générale <strong>de</strong> ces étu<strong>de</strong>s a consisté à dériver,pour <strong>de</strong>s indices <strong>de</strong> mobilité différentiables, une distribution asymptotique normale grâceà la métho<strong>de</strong> <strong>de</strong>lta. Formby <strong>et</strong> al (2004) définissent différentes approches <strong>de</strong> constructiond’une matrice <strong>de</strong> transition <strong>et</strong> déterminent, pour chaque approche, les structures <strong>de</strong> variancescovariances.Par ailleurs, hormis Fields <strong>et</strong> al (2002) qui intègrent explicitement la fonction<strong>de</strong> <strong>de</strong>nsité cumulative pour dériver les conditions <strong>de</strong> dominance stochastique <strong>et</strong> Formby <strong>et</strong>al (2004) qui font <strong>de</strong>s comparaisons entre <strong>de</strong>ux vecteurs d’indicateurs <strong>de</strong> mobilité (hypothèsescomposites), les autres étu<strong>de</strong>s se contentent <strong>de</strong> tester ponctuellement l’égalité entre<strong>de</strong>ux indices <strong>de</strong> mobilité. Le but du présent papier est <strong>de</strong> contribuer à l’aspect inférentiel <strong>de</strong>l’analyse <strong>de</strong> la mobilité en utilisant la statistique basée sur le ratio <strong>de</strong> vraisemblance pour testerl’existence <strong>de</strong> dominance stochastique en mobilité. Deux types <strong>de</strong> mesures <strong>de</strong> la mobilitésont r<strong>et</strong>enus, notamment les mesures <strong>de</strong> mobilité absolue <strong>et</strong> celles qui utilisent les matrices <strong>de</strong>transition. Ces <strong>de</strong>ux approches sont, en eff<strong>et</strong>, plus faciles à concilier avec les outils comme lafonction <strong>de</strong> <strong>de</strong>nsité cumulative dont l’utilisation dans la métho<strong>de</strong> <strong>de</strong> vraisemblance empiriqueproposée par Davidson <strong>et</strong> Duclos (2006) est primordiale. Par ailleurs, les mesures basées surles matrices <strong>de</strong> transition offrent l’opportunité d’appliquer <strong>de</strong> façon triviale c<strong>et</strong>te métho<strong>de</strong> <strong>de</strong>


Chapitre 6. Tests <strong>de</strong> dominance stochastique en mobilité 129vraisemblance.Le reste du papier est organisé comme suit. La section 2 présente les mesures <strong>de</strong> mobilité<strong>et</strong> un cadre théorique <strong>de</strong> leurs classements partiels. On y développe quelques exemples <strong>de</strong>s<strong>de</strong>ux types <strong>de</strong> mesures r<strong>et</strong>enus ainsi que les conditions <strong>de</strong> la dominance stochastique en mobilité.La section 3 décrit les métho<strong>de</strong>s d’inférence statistique basées sur la maximisation <strong>de</strong>la vraisemblance empirique <strong>et</strong> les tests <strong>de</strong> bootstrap. La section 4 donne quelques illustrationsbasées sur <strong>de</strong>s comparaisons robustes <strong>de</strong> mobilité aux USA. La <strong>de</strong>rnière section conclut lechapitre.6.2 Mesures <strong>de</strong> mobilité <strong>et</strong> dominance stochastiqueLa mobilité <strong>de</strong> revenu est un phénomène qui traduit le <strong>de</strong>gré <strong>de</strong> changement à traversle temps d’une distribution <strong>de</strong> revenus. Il peut s’agir aussi <strong>bien</strong> <strong>de</strong> changements relatifs auxmêmes individus qu’entre générations d’individus (par exemple entre un père <strong>et</strong> son fils).Supposons une distribution croissante <strong>de</strong> revenus x = (x 1 , x 2 , ..., x i , ..., x n ) ∈ R n + où x i est lerevenu du ième individu d’une population <strong>de</strong> taille n. Soit y i le revenu <strong>de</strong> l’individu i à une dateultérieure ou le revenu <strong>de</strong> son <strong>de</strong>scendant <strong>de</strong> telle sorte qu’on a une nouvelle distribution <strong>de</strong>revenu y = (y 1 , y 2 , ..., y i, ..., y n ) ∈ R n + obtenue par le processus <strong>de</strong> transformation (x → y).Les écarts entre revenus individuels traduisent l’ampleur <strong>de</strong> la mobilité.La mesure <strong>de</strong> mobilité est alors définie comme une fonction continue M : R n + ×R n + → R.Soient <strong>de</strong>ux autres distributions x ′ <strong>et</strong> y ′ qui suivent le processus <strong>de</strong> transformation (x ′ →y ′ ), on dira alors qu’un processus (x → y) est plus mobile qu’un autre processus (x ′ → y ′ )lorsqu’on a M(x, y) ≥ M(x ′ , y ′ ).Il existe plusieurs mesures <strong>de</strong> mobilité. La présente étu<strong>de</strong> r<strong>et</strong>ient <strong>de</strong>ux catégories <strong>de</strong> mesuresdont la première capte les <strong>de</strong>ux types <strong>de</strong> mobilité que constituent la mobilité structurelleou <strong>de</strong> croissance <strong>et</strong> la mobilité d’échange ou latérale. La mobilité structurelle augmente lors-


Chapitre 6. Tests <strong>de</strong> dominance stochastique en mobilité 130que’on enregistre un mouvement général <strong>de</strong> baisse ou <strong>de</strong> hausse du revenu tandis que la mobilitéd’échange traduit simplement un changement <strong>de</strong> position ou, dans un cas extrême, unepermutation <strong>de</strong>s revenus entre individus 1 . La secon<strong>de</strong> catégorie <strong>de</strong> mesures capte essentiellementla mobilité d’échange. Les mesures <strong>de</strong> mobilité absolue correspon<strong>de</strong>nt à la premièrecatégorie tandis que la secon<strong>de</strong> catégorie concerne les mesures qui s’appuient sur les matrices<strong>de</strong> transition.6.2.1 Les mesures <strong>de</strong> mobilité absolueFields <strong>et</strong> Ok (1996) dérivent une mesure <strong>de</strong> mobilité absolue du revenu basée sur unefonction <strong>de</strong> distance M d . Ils postulent un certain nombre d’axiomes dont l’homogénéité linéaire,l’invariance par rapport à la translation, le principe <strong>de</strong> normalisation, la décomposabilitéfaible, la consistance par rapport à la population, la sensibilité à la croissance <strong>et</strong> lacontribution individualiste 2 . Ils proposent une mesure générique satisfaisant l’ensemble <strong>de</strong>ces axiomes hormis la contribution individualiste :M d (x, y) =( n∑i=1|x i − y i | α ) 1/α∀ x, y ∈ R n +, <strong>et</strong> α > 0. (6.1)Posons ∆ i = |x i − y i |, avec i = 1, ..., n. Les ∆ i sont les contributions individuelles à lamobilité. Considérons une classe <strong>de</strong> fonctions M d = M d (∆) = M d (∆ 1 , ..., ∆ i , ..., ∆ n ). Bienqu’une augmentation <strong>de</strong> M d ne signifie pas forcément une amélioration <strong>de</strong> <strong>bien</strong>-<strong>être</strong>, il estcependant possible, en s’inspirant <strong>de</strong> Willig (1981), <strong>de</strong> Shorrocks (1983) <strong>et</strong> <strong>de</strong> Foster <strong>et</strong> Shorrocks(1988), d’utiliser les propriétés d’une fonction <strong>de</strong> <strong>bien</strong>-<strong>être</strong> pour établir les conditions<strong>de</strong> dominance en mobilité. C<strong>et</strong>te démarche est conforme à l’esprit <strong>de</strong> Fields <strong>et</strong> al (2002) quiproposent d’intégrer la fonction <strong>de</strong> <strong>de</strong>nsité cumulative (cdf ) à l’analyse <strong>de</strong> la mobilité. La désirablepropriété <strong>de</strong> monotonicité (H A ) <strong>de</strong> la fonction <strong>de</strong> <strong>bien</strong>-<strong>être</strong> conférée par le principe <strong>de</strong>1 Voir Fields <strong>et</strong> Ok (1999) pour une discussion plus détaillée.2 Voir Fields <strong>et</strong> Ok (1996,1999) <strong>et</strong> Mitra <strong>et</strong> Ok (1998) pour une <strong>de</strong>scription <strong>de</strong> ces axiomes.


Chapitre 6. Tests <strong>de</strong> dominance stochastique en mobilité 131Par<strong>et</strong>o est évi<strong>de</strong>nte dans le cas <strong>de</strong> M d . En eff<strong>et</strong>, ∆ i étant interprété comme la contribution <strong>de</strong>l’individu i à la mobilité totale, son augmentation, toutes choses égales par ailleurs, ne peutqu’entraîner une augmentation <strong>de</strong> la mobilité. Par ailleurs, on suppose vérifiée l’hypothèse<strong>de</strong> symétrie (H B ) : M d (∆) = M d (Γ∆), avec Γ une matrice <strong>de</strong> permutation. Si ce principe n<strong>et</strong>ient pas à l’étape initiale <strong>de</strong> détermination <strong>de</strong> la mobilité individuelle, une fois c<strong>et</strong>te <strong>de</strong>rnièreestimée pour chaque individu, une permutation <strong>de</strong>s contributions entre individus laisse lamobilité totale inchangée. Dénotons par M + d, la classe <strong>de</strong>s fonctions <strong>de</strong> mobilité satisfaisantles hypothèses H A <strong>et</strong> H B . Soient ∆ = ∆(x, y) <strong>et</strong> ∆ ′ = ∆(x ′ , y ′ ) <strong>de</strong>ux profils <strong>de</strong> mobilitésindividuelles dont les cdf sont respectivement F (Z) <strong>et</strong> G(Z) :F (Z) =∫ Z0dF (t)dt <strong>et</strong> G(Z) =∫ Z0dG(t)dt (6.2)où Z est un élément <strong>de</strong> l’ensemble <strong>de</strong>s quantiles. Soient Q F (p) <strong>et</strong> Q G (p) les courbes <strong>de</strong>quantiles respectives, par analogie aux conditions <strong>de</strong> dominance dérivées par Duclos <strong>et</strong> Araar(2006), le théorème 1 établit les conditions <strong>de</strong> dominance <strong>de</strong> premier ordre en mobilité.Theorème 1 Les conditions suivantes sont équivalentes :(i) M d (∆) ≥ M d (∆ ′ ) pour tout M d ∈ M + d(ii) F (Z) ≤ G(Z) pour tout Z ∈ [0, +∞[(iii) Q F (p) ≥ Q G (p) pour tout p ∈ [0, 1]Lorsqu’on ajoute l’hypothèse <strong>de</strong> Schur-concavité (H C ) pour la fonction M d , on peut égalementdériver les conditions <strong>de</strong> dominance <strong>de</strong> second ordre. On définit alors par M ++dclasse <strong>de</strong>s fonctions <strong>de</strong> mobilité qui respectent les hypothèses H A , H B <strong>et</strong> H C . DéfinissonsF 2 (Z) <strong>et</strong> G 2 (Z) :la


Chapitre 6. Tests <strong>de</strong> dominance stochastique en mobilité 132F 2 (Z) =∫ Z0F (t)dt <strong>et</strong> G 2 (Z) =∫ Z0G(t)dt. (6.3)Considérons également les courbes <strong>de</strong> Lorenz généralisé GL F (p) <strong>et</strong> GL G (p) telles que :GL F (p) =∫ pQ F (q)dq <strong>et</strong> GL G (p) =∫ p00Q G (q)dq, (6.4)avec p ∈ [0, 1]. On peut remplacer GL F (p) <strong>et</strong> GL G (p) par leurs estimés sans biais (Zheng,2002) :ĜL F (p) = 1 nn∑∆ i I(∆ i ≤ ̂Q F (p)) <strong>et</strong> ĜL G (p) = 1 m∑∆ ′mjI(∆ ′ j ≤ ̂Q G (p)). (6.5)i=1j=1Le théorème 2 établit les conditions <strong>de</strong> dominance en mobilité au second ordre.Theorème 2 Les conditions suivantes sont équivalentes :(i) M d (∆) ≥ M d (∆ ′ ) pour tout M d ∈ M ++d(ii) F 2 (Z) ≤ G 2 (Z) pour tout Z ∈ [0, +∞[(iii) GL F (p) ≥ GL G (p) pour tout p ∈ [0, 1]L’hypothèse <strong>de</strong> Schur-concavité (principe <strong>de</strong> Pigou-Dalton) signifie qu’un transfert égalitaire<strong>de</strong>s mobilités individuelles est <strong>de</strong> nature à accroître la mobilité totale. Cependant, l’interprétationéconomique <strong>de</strong> c<strong>et</strong>te hypothèse est ambiguë dans le cas présent. En eff<strong>et</strong>, lorsqueles contributions individuelles à la mobilité correspon<strong>de</strong>nt toutes à <strong>de</strong>s augmentations <strong>de</strong> revenus,cela signifie qu’une augmentation égalitaire <strong>de</strong> revenus est désirable dans la mesure où


Chapitre 6. Tests <strong>de</strong> dominance stochastique en mobilité 133elle est susceptible <strong>de</strong> réduire les inégalités <strong>de</strong> revenus. Dans la classe <strong>de</strong>s fonctions <strong>de</strong> mobilitéproposée par Fields <strong>et</strong> Ok (1996), c<strong>et</strong>te hypothèse est vérifiable pour α ≤ 1. Toutefois,leur classe <strong>de</strong> fonctions ne distingue pas une mobilité “positive” (augmentation <strong>de</strong> revenu)d’une mobilité “négative” (diminution <strong>de</strong> revenu), ce qui ne donne pas un sens économiqueréel à l’hypothèse H C .Mitra <strong>et</strong> Ok (1998) r<strong>et</strong>iennent plutôt la classe <strong>de</strong> fonctions Schur-convexes en choisissantα ≥ 1. Ils développent une approche pour les classements partiels où (x → y) est plus mobileque (x ′ → y ′ ) si :n∑∆ α i (x, y) ≥i=1n∑∆ α i (x ′ , y ′ ) ∀ α ≥ 1. (6.6)i=1Cependant, la condition dépend du paramètre α, ce qui rend quasiment impossible d’établirun classement <strong>de</strong> la mobilité en <strong>de</strong>hors <strong>de</strong>s cas triviaux. Mitra <strong>et</strong> Ok dérivent alors uneautre condition plus réaliste <strong>de</strong> classement partiel. Ainsi, en disposant ∆ <strong>et</strong> ∆ ′ par ordredécroissant <strong>de</strong> j, la dominance <strong>de</strong> (x ′ → y ′ ) par (x → y) tient lorsqu’on a :s∑∆ j (x, y) ≥j=1s∑∆ j (x ′ , y ′ ) ∀ s = 1, ..., n, . (6.7)j=1Il s’agit d’une approche alternative à celle <strong>de</strong> la dominance en terme <strong>de</strong> Lorenz généralisédérivée dans le théorème 2 où les ∆ i étaient plutôt disposés par ordre croissant. Ici, on accor<strong>de</strong>plus <strong>de</strong> poids aux individus les plus mobiles, ce qui est normal à cause <strong>de</strong> l’hypothèse <strong>de</strong>Schur-convexité r<strong>et</strong>enue par le choix <strong>de</strong> α ≥ 1. Lorsqu’on considère α ≤ 1, on a plutôtl’hypothèse <strong>de</strong> Schur-concavité où un “transfert égalitaire <strong>de</strong> mobilité” est désirable. Dans cecas, l’approche du Lorenz généralisé sera privilégiée. Lorsqu’on a α = 1, tous les individusont le même poids quelque soit leur niveau <strong>de</strong> mobilité <strong>et</strong> les <strong>de</strong>ux approches peuvent <strong>être</strong>utilisées. Ce cas correspond à la fonction M d <strong>de</strong> Fields <strong>et</strong> Ok (1996) qui satisfait l’axiome <strong>de</strong>la contribution individualiste :


Chapitre 6. Tests <strong>de</strong> dominance stochastique en mobilité 134M d (x, y) =n∑∆ i . (6.8)i=1Une faiblesse <strong>de</strong>s approches précé<strong>de</strong>ntes est que l’on n’est pas intéressé à savoir si lamobilité est plus le fait <strong>de</strong>s individus les plus pauvres ou <strong>de</strong>s plus riches. Van Kerm (2006)propose une autre approche qui exclut l’anonymat puisque les individus ne sont plus ordonnésselon leur contribution à la mobilité totale, mais plutôt selon leur revenus initiaux. Il considèreson approche comme complémentaire <strong>et</strong> non substitut aux précé<strong>de</strong>ntes.6.2.2 Les mesures basées sur les matrices <strong>de</strong> transitionLa matrice <strong>de</strong> transitionIl est convenable <strong>de</strong> définir d’abord une matrice <strong>de</strong> transition. On suppose que le revenusuit un processus <strong>de</strong> Markov discr<strong>et</strong> <strong>de</strong> η états, par exemple très pauvre, pauvre, moyen,riche <strong>et</strong> très riche. Soit P = [P kl ], la matrice <strong>de</strong> transition (η × η) supposée régulière (i.e.P d est strictement positive pour <strong>de</strong>s valeurs suffisamment élevées d’un entier d) qui est tellequ’il existe un vecteur <strong>de</strong> probabilités π <strong>de</strong> l’état stationnaire, solution unique <strong>de</strong> l’équationπ τ= π τ P . τ désigne la transposée. L’élément P kl représente la probabilité qu’un individuinitialement dans l’état k se r<strong>et</strong>rouve dans l’état l.Reconsidérons le processus (x → y) où x = (x 1 , x 2 , ..., x i , ..., x n ) <strong>et</strong> y = (y 1 , y 2 , ..., y i, ..., y n ).On suppose que les x i <strong>et</strong> y i sont bornés supérieurement respectivement par <strong>de</strong>s valeurs strictementpositives x <strong>et</strong> y. Soient Ω k chacune <strong>de</strong>s η partitions <strong>de</strong> l’intervalle [0, x] représentant lesclasses <strong>de</strong> rang k, <strong>et</strong> Γ l , chacune <strong>de</strong>s η partitions <strong>de</strong> l’intervalle [0, y] représentant les classes<strong>de</strong> rang l. On définit également p i comme la probabilité associée à chaque couple (x i , y i ) avecn∑p i = 1. L’expression <strong>de</strong> P kl est donnée par :i=1


Chapitre 6. Tests <strong>de</strong> dominance stochastique en mobilité 135P kl = Pr ([x i ∈ Ω k ] ∩ [y i ∈ Γ l ])Pr (x i ∈ Ω k )=n∑p i I (x i ∈ Ω k , y i ∈ Γ l )i=1n∑p i I (x i ∈ Ω k )i=1(6.9)où Pr exprime la probabilité <strong>et</strong> I(.) une fonction indicatrice prenant la valeur 1 si la conditionest vérifiée <strong>et</strong> 0 sinon. On note également les probabilités marginales suivantes :π k =n∑p i I (x i ∈ Ω k ) <strong>et</strong> π l =i=1n∑p i I (y i ∈ Γ l ) . (6.10)i=1π (k) <strong>et</strong> π (l) sont <strong>de</strong>s vecteurs contenant respectivement les probabilités marginales π k <strong>et</strong>π l , avec π (k) = π (l) = π à l’état stationnaire.Les indices <strong>de</strong> mobilitéPlusieurs indices <strong>de</strong> mobilité s’appuyant sur les matrices <strong>de</strong> transition ont été proposésdans la littérature 3 . Une première mesure est proposée par Prais (1955) <strong>et</strong> Shorrocks (1978a)<strong>et</strong> s’appuie sur la trace <strong>de</strong> la matrice <strong>de</strong> transition :M P S =η − η ∑P kkk=1η − 1(6.11)C<strong>et</strong> indice néglige les probabilités <strong>de</strong> la matrice <strong>de</strong> transition qui n’appartiennent pasà la diagonale principale. Ainsi, il ne respecte pas, d’après Maasoumi (1998), le principe<strong>de</strong>s transferts dynamiques <strong>de</strong> Pigou-Dalton 4 . Si l’on considère <strong>de</strong>ux matrices <strong>de</strong> transition3 Voir Maasoumi (1998) <strong>et</strong> Fields <strong>et</strong> Ok (1999) pour une revue détaillée <strong>de</strong> ces mesures.4 Le transfert D.P.D. est un transfert qui améliore les chances d’un individu <strong>de</strong> la classe initiale k d’avoir unmeilleur revenu dans la secon<strong>de</strong> pério<strong>de</strong>, alors qu’il détériore celles d’un individu <strong>de</strong> la classe initiale k + h(avec k + h ≤ η), tout en préservant la monotonicité <strong>de</strong> la matrice <strong>de</strong> transition. Voir Dardanoni (1993) pourplus <strong>de</strong> détails.


Chapitre 6. Tests <strong>de</strong> dominance stochastique en mobilité 136monotones P <strong>et</strong> ˜P où ˜P est dérivée à partir <strong>de</strong> P par ce type <strong>de</strong> transfert, alors le principe estrespecté lorsque ˜P affiche plus <strong>de</strong> mobilité que P . Cela n’est pas le cas pour l’indice M P S ,particulièrement lorsqu’un transfert se traduit par l’accroissement <strong>de</strong> n’importe quel élément<strong>de</strong> la diagonale. Par ailleurs, c<strong>et</strong> indice ne prend pas en compte l’ampleur <strong>de</strong>s mouvements.Prenons l’exemple <strong>de</strong> <strong>de</strong>ux matrices <strong>de</strong> transition P <strong>et</strong> ˜P suivantes :P =⎡⎢⎣0.5 0.5 00.5 0.5 00 0 1⎤ ⎡⎥ ⎢⎦ <strong>et</strong> ˜P = ⎣0.5 0 0.50 1 00.5 0 0.5⎤⎥⎦D’après l’indice M P S , ces <strong>de</strong>ux matrices affichent le même niveau <strong>de</strong> mobilité 1 . Il est2pourtant raisonnable <strong>de</strong> penser que ˜P décrit une plus gran<strong>de</strong> mobilité dans la mesure où lemouvement se fait entre les <strong>de</strong>ux extrêmes. Une autre mesure a été proposée <strong>et</strong> tient compte<strong>de</strong> c<strong>et</strong>te distance entre les classes <strong>de</strong> rang k <strong>et</strong> l (Bartholomew, 1996). Son expression estdonnée par :M BA = 1η − 1η∑ η∑π k P kl |k − l| (6.12)k=1 l=1C<strong>et</strong> indice respecte également le principe <strong>de</strong>s transferts dynamiques <strong>de</strong> Pigou-Dalton. Ilexiste en fait plusieurs autres indices <strong>de</strong> mobilité qui ont, chacun, leurs avantages <strong>et</strong> inconvénients.Ces indices sont assez disparates en réalité qu’il est quasiment impossible d’utiliserc<strong>et</strong>te diversité pour établir <strong>de</strong>s conditions <strong>de</strong> dominance. Certains auteurs analysent alorsl’implication <strong>de</strong> la mobilité sur le <strong>bien</strong>-<strong>être</strong> social pour établir <strong>de</strong>s critères <strong>de</strong> dominance.La mobilité <strong>et</strong> le <strong>bien</strong>-<strong>être</strong> socialLes conditions <strong>de</strong> dominance dérivées par Atkinson (1983) peuvent perm<strong>et</strong>tre <strong>de</strong> classerla mobilité pour une classe <strong>de</strong> fonctions <strong>de</strong> <strong>bien</strong>-<strong>être</strong> social satisfaisant un certain nombre <strong>de</strong>


Chapitre 6. Tests <strong>de</strong> dominance stochastique en mobilité 137propriétés. Considérons le cas <strong>de</strong> <strong>de</strong>ux pério<strong>de</strong>s, notamment un processus (x → y). SoientF (x, y) la cdf bivariée, F (x) <strong>et</strong> F (y) les cdf marginales, <strong>et</strong> dF les fonctions <strong>de</strong> <strong>de</strong>nsitérespectives. La fonction <strong>de</strong> <strong>bien</strong>-<strong>être</strong> social est la suivante :W (x, y) =∫ x ∫ y0 0U (x, y) dF (x, y) dxdy, (6.13)avec U x > 0, U y > 0 <strong>et</strong> U xy ≤ 0. Considérons que G(x, y) représente la cdf bivariéed’un autre processus (x ′ → y ′ ). G(x) <strong>et</strong> G(y) sont les cdf marginales <strong>et</strong> l’on suppose queF (x) = G(x) <strong>et</strong> F (y) = G(y).Si un processus <strong>de</strong> mobilité est décrit par la matrice <strong>de</strong> transition P , on a :π τ (l) = π τ (k)P ou π l =η∑P kl π k ∀ l = 1, ..., η (6.14)k=1où π(k) <strong>et</strong> π(l) sont <strong>de</strong>ux vecteurs colonne (η × 1) contenant respectivement les <strong>de</strong>nsitésmarginales π k <strong>et</strong> π l relatives aux rangs respectifs k <strong>et</strong> l. Soient x k <strong>et</strong> y l , les revenus respectivement<strong>de</strong>s rangs k <strong>et</strong> l, la fonction <strong>de</strong> <strong>bien</strong>-<strong>être</strong> anticipé <strong>de</strong>vient alors :W =η∑ η∑U ( x k , y l) P kl π k . (6.15)k=1 l=1Une distribution F domine stochastiquement une distribution G si elle engendre un niveaud’utilité espérée au moins aussi grand pour toutes les fonctions d’utilité <strong>de</strong> la classe U.S’appuyant sur les travaux <strong>de</strong> Hadar <strong>et</strong> Russell (1974), Atkinson montre que, pour <strong>de</strong>s distributionsmarginales i<strong>de</strong>ntiques (C’est à dire F (x k ) = G(x k ) <strong>et</strong> F (y l ) = G(y l )), le processus(x → y) domine stochastiquement au premier ordre le processus (x ′ → y ′ ) si :F (x k , y l ) ≤ G(x k , y l ) ∀ k, l = 1, ..., η. (6.16)


Chapitre 6. Tests <strong>de</strong> dominance stochastique en mobilité 138Il s’agit d’une dominance en terme d’utilité espérée puisqu’elle implique que le niveaud’utilité espérée engendré par la distribution F est au moins aussi élevé que celui engendrépar la distribution G pour la classe <strong>de</strong>s fonctions d’utilité U. Il est également possible <strong>de</strong>dériver la condition <strong>de</strong> dominance au second ordre qui est moins forte que celle du premierordre. Si on définit :F ( 2 x k , y l) =∫ x k ∫ y lF (s, t) dtds <strong>et</strong> G 2 (x, y) =∫ x ∫ y0 00 0la dominance <strong>de</strong> second ordre implique alors que :G (s, t) dtds, (6.17)F 2 ( x k , y l) ≤ G 2 ( x k , y l) ∀ k, l = 1, ..., η, (6.18)pour la classe U telle que U xy < 0,sont moins intuitives.U xxy , U xyy ≥ 0 <strong>et</strong> U xxyy ≤ 0. Les <strong>de</strong>rnière hypothèsesUne différence entre π (k) <strong>et</strong> π (l) perm<strong>et</strong>trait <strong>de</strong> tenir compte <strong>de</strong> la mobilité structurell<strong>et</strong>andis que P perm<strong>et</strong> <strong>de</strong> capter la mobilité pure (mobilité d’échange). Lorsqu’on suppose queles distributions marginales sont égales, i.e. π (k) = π (l) = π, alors l’on isole la mobilitépure. Dardanoni (1993) considère une durée <strong>de</strong> vie i<strong>de</strong>ntique <strong>de</strong> t pério<strong>de</strong>s pour tous lesindividus <strong>et</strong> introduit un système <strong>de</strong> pondération λ qui accor<strong>de</strong> au moins autant <strong>de</strong> poidsaux individus qui ont les plus bas niveaux <strong>de</strong> revenu dans la société. On suppose un vecteurd’utilités instantanées u = (u 1 , u 2 , ..., u η ) τ <strong>et</strong> un vecteur d’utilités intertemporelles V P =(V 1 , V 2 , ..., V η ) t tels que V P = u + ρP u + ρ 2 P 2 u + ... + ρ t P t u, avec ρ un facteur d’escompte(0 ≤ ρ < 0). Il adopte une fonction <strong>de</strong> <strong>bien</strong>-<strong>être</strong> social linéaire :W ( V P , λ ) =η∑k=1π k λ k V Pk (6.19)Pour sa démonstration, Dardanoni suppose <strong>de</strong>s matrices <strong>de</strong> transition monotones. Unematrice monotone est une matrice pour laquelle chaque ligne domine stochastiquement la


Chapitre 6. Tests <strong>de</strong> dominance stochastique en mobilité 139ligne au-<strong>de</strong>ssus d’elle. Conlisk (1990) en donne une définition formelle. Il considère l’équationsuivante :∆P k (l) = (P k,1 + P k,2 + ... + P k,l ) − (P k+1,1 + P k+1,2 + ... + P k+1,l ) (6.20)C<strong>et</strong>te expression traduit la différence entre les lème <strong>de</strong>nsités cumulatives respectivement<strong>de</strong> la ligne k <strong>et</strong> <strong>de</strong> la ligne k + 1. Si ∆P k (l) ≥ 0 ∀ l = 1, 2, ..., η − 1, alors la ligne k + 1domine stochastiquement la ligne k. Et, si c<strong>et</strong>te dominance s’avère pour k = 1, 2, ..., η − 1,alors on dit que la matrice P est monotone. Cela traduit qu’un individu initialement dansl’état k + 1 fait face à une meilleure loterie que celle à laquelle il aurait fait face dans l’étatinitial k 5 . En s’inspirant <strong>de</strong> Atkinson (1983) <strong>et</strong> <strong>de</strong> Dardanoni (1993), le théorème 3 établit lesconditions <strong>de</strong> dominance <strong>de</strong> premier ordre en mobilité basée sur les matrices <strong>de</strong> transition :Theorème 3 Soient <strong>de</strong>ux matrices régulières <strong>et</strong> monotones P <strong>et</strong> ˜P ayant le même vecteur <strong>de</strong>probabilités d’équilibre π, alors les conditions suivantes sont équivalentes :(i) F (x k , y l ) ≤ G(x k , y l )∀ k, l = 1, ..., η(ii) W P ≥ W ˜P , W P <strong>et</strong> W ˜P vérifiant les hypothèses appropriées 6((iii) T τ Π P − ˜P)T ≤ 0Π est une matrice (η × η) dont la diagonale principale contient les éléments du vecteurπ <strong>et</strong> T , une matrice triangulaire supérieure contenant <strong>de</strong>s valeurs 0 en <strong>de</strong>ssous <strong>de</strong> la diagonaleprincipale <strong>et</strong> <strong>de</strong>s valeurs 1 partout ailleurs. C<strong>et</strong>te condition nécessaire <strong>et</strong> suffisante estune extension à l’horizon infini <strong>de</strong> la condition <strong>de</strong> dominance stochastique <strong>de</strong> premier ordre5 Dans le cas <strong>de</strong> la mobilité intergénérationnelle, cela peut vouloir dire simplement que l’enfant d’un parentriche (état k + 1) a <strong>de</strong> meilleures chances <strong>de</strong> s’en sortir que celui d’un parent moins riche (état k).6 Pour Atkinson, cela suppose que U x > 0, U y > 0 <strong>et</strong> U xy ≤ 0. Pour Dardanoni, cela requiert <strong>de</strong>s vecteurs<strong>de</strong> λ non croissants, ainsi que <strong>de</strong>s fonctions d’utilité u non décroissantes.


Chapitre 6. Tests <strong>de</strong> dominance stochastique en mobilité 140d’Atkinson (1983). Si on pose que P = [P kl ] <strong>et</strong> ˜P =réécrite comme suit :[˜Pkl], la condition (iii) peut alors <strong>être</strong>K∑ L∑π k P kl ≤k=1 l=1K∑ L∑π k ˜Pkl ∀ K, L = 1, 2, ..., η, (6.21)k=1 l=1∑ce qui est i<strong>de</strong>ntique à la condition (i) puisqu’on a K L∑K∑ L∑π k P kl = F (x K , y L ) <strong>et</strong> π k ˜Pkl =G(x K , y L ).k=1l=1k=1l=1Cependant, l’on peut relâcher l’hypothèse <strong>de</strong> l’état stationnaire π t = π t P = π t ˜P , <strong>de</strong> sorteà considérer la croissance (Formby <strong>et</strong> al, 2003). Il est possible, conformément à la suggestiond’Atkinson, <strong>de</strong> dériver les conditions <strong>de</strong> dominance du second ordre. En suivant Atkinson<strong>et</strong> Bourguignon (1982), l’expression <strong>de</strong> F ( 2 x k , y l) dans l’équation (6.17) peut <strong>être</strong>, aprèsquelques intégrations par parties, réécrite comme suit :∫ x k ∫ y lF ( 2 x k , y l) = (x k − s)(y l − t)dF (s, t) dtds. (6.22)0 0C<strong>et</strong>te expression équivaut à la mesure <strong>de</strong> l’écart <strong>de</strong> la pauvr<strong>et</strong>é bidimensionnelle basée surla classe <strong>de</strong>s mesures FGT (Foster, Greer <strong>et</strong> Thorbecke, 1984), si on considère x k <strong>et</strong> y l comme<strong>de</strong>s seuils <strong>de</strong> pauvr<strong>et</strong>é respectifs dans chacune <strong>de</strong>s <strong>de</strong>ux dimensions. Atkinson <strong>et</strong> Bourguignon(1982) l’interprètent également comme étant la covariance incomplète. Le théorème 4 donneles conditions <strong>de</strong> dominance <strong>de</strong> second ordre en mobilité.Theorème 4 Soient <strong>de</strong>ux matrices régulières <strong>et</strong> monotones P <strong>et</strong> ˜P ayant le même vecteur <strong>de</strong>probabilités d’équilibre π, alors les conditions suivantes sont équivalentes :(i) F 2 ( x k , y l) ≤ G 2 ( x k , y l) ∀ k, l = 1, ..., η.


Chapitre 6. Tests <strong>de</strong> dominance stochastique en mobilité 141(6.18).(ii) W P≥ W ˜P , W P <strong>et</strong> W ˜P vérifiant les hypothèses énoncées au niveau <strong>de</strong> l’équation6.3 Les métho<strong>de</strong>s d’inférence statistiqueLes tests <strong>de</strong> dominance en mobilité suggérés ici vont s’appuyer sur la statistique duratio <strong>de</strong> vraisemblance empirique <strong>de</strong> Davidson <strong>et</strong> Duclos (2006). Il s’agit d’une approcheintersection-union perm<strong>et</strong>tant <strong>de</strong> tester la dominance stricte. Au niveau <strong>de</strong>s mesures <strong>de</strong> mobilitéabsolue, la condition <strong>de</strong> dominance concerne une distribution univariée si <strong>bien</strong> quel’application <strong>de</strong> la métho<strong>de</strong> <strong>de</strong> Davidson <strong>et</strong> Duclos est directe. Quant à la comparaison <strong>de</strong>smesures basées sur les matrices <strong>de</strong> transition, elle nécessite une extension <strong>de</strong> la métho<strong>de</strong> aucas bidimensionnel.6.3.1 L’inférence sur les mesures <strong>de</strong> mobilité absolueSoient <strong>de</strong>ux distributions <strong>de</strong> mobilités individuelles ∆ <strong>et</strong> ∆ ′ , <strong>de</strong> tailles respectives N F <strong>et</strong>N G , dérivées <strong>de</strong>s processus (x → y) <strong>et</strong> (x ′ → y ′ ). On suppose également que ∆ <strong>et</strong> ∆ ′ sontdécrites par les cdf respectives F (Z) <strong>et</strong> G(Z) dont les estimées sont les suivantes :̂F (Z) = 1 ∑N FI (∆ s ≤ Z) <strong>et</strong> Ĝ(Z) = 1 ∑N GI (∆ ′ h ≤ Z) (6.23)N F N Gs=1h=1La condition <strong>de</strong> dominance <strong>de</strong> ∆ ′ par ∆ est satisfaite lorsque ̂F (Z) ≤ Ĝ(Z) pour toutZ. Le problème <strong>de</strong> maximisation <strong>de</strong> la fonction <strong>de</strong> vraisemblance empirique (FVE) noncontrainte est le suivant :


Chapitre 6. Tests <strong>de</strong> dominance stochastique en mobilité 142maxp F s ,pG h∑N Fs=1∑N Glog p F s + log p G hh=1suj<strong>et</strong> à∑N F∑N Gp F s = 1, p G h = 1 (6.24)s=1h=1p F s<strong>et</strong> p G h représentent les probabilités <strong>de</strong> réalisation respectivement <strong>de</strong> ∆ s <strong>et</strong> ∆ ′ h . La solution<strong>de</strong> ce problème donne p F s = 1N F<strong>et</strong> p G h = 1N Gmaximisée non contrainte est :telles que la valeur <strong>de</strong> la vraisemblancêF V E NC = −N F log N F − N G log N G (6.25)La dominance stricte en mobilité <strong>de</strong> G par F , i.e. (x → y) domine stochastiquementen mobilité (x ′ → y ′ ), implique que G(Z) > F (Z) pour tout Z. C<strong>et</strong>te condition n’est pasvérifiée s’il existe un point Z pour lequel G(Z) ≤ F (Z). Pour tester l’hypothèse nulle <strong>de</strong> nondominance <strong>de</strong> G par F , soit H 0 : G(Z) ≤ F (Z) pour certains Z vs l’hypothèse alternativeH 1 : G(Z) > F (Z) ∀ Z, le problème <strong>de</strong> maximisation est reformulé pour tenir compte <strong>de</strong>la contrainte <strong>de</strong> non dominance qu’on peut remplacer par l’égalité G(Z) = F (Z) pour <strong>de</strong>squestions d’ordres pratique <strong>et</strong> logique. C<strong>et</strong>te contrainte est donnée par :∑N G∑N Fp G h I (∆ ′ h ≤ Z) = p F s I (∆ s ≤ Z) (6.26)h=1s=1La statistique <strong>de</strong> test LR (qui est définie plus loin) capte la différence entre la valeur<strong>de</strong> la vraisemblance non contrainte maximisée (̂F V E NC ) <strong>et</strong> la valeur <strong>de</strong> la vraisemblancecontrainte maximisée (̂F V E C ). Au niveau <strong>de</strong>s points Z pour lesquels on a Ĝ(Z) ≤ ̂F (Z), lacontrainte est non liante <strong>et</strong> LR est par conséquent nul. Par contre, lorsqu’on a Ĝ(Z) > ̂F (Z)pour un Z, la contrainte <strong>de</strong>vient liante <strong>et</strong> ̂F V E C est inférieure à ̂F V E NC <strong>de</strong> telle sorte queLR correspond à un réel strictement positif :


Chapitre 6. Tests <strong>de</strong> dominance stochastique en mobilité 143LR (Z) ={0 si Ĝ(Z) ≤ ̂F (Z)LR > 0 sinon}(6.27)La maximisation nous donne les résultats suivants :p G h = I(∆′ h ≤ Z)θ+ (1 − I(∆′ h ≤ Z))φ(6.28)p F s = I(∆ s ≤ Z)N − θ+ (1 − I(∆ s ≤ Z))N − φ(6.29)avec :θ =N × N G(Z)N G (Z) + N F (Z) <strong>et</strong> φ =N × M G(Z)M G (Z) + M F (Z)∑N G∑N FN G (Z) = I (∆ ′ h ≤ Z) <strong>et</strong> N F (Z) = I (∆ s ≤ Z)h=1s=1M G (Z) = N G − N G (Z), M F (Z) = N F − N F (Z) <strong>et</strong> N = N G + N FLe ratio <strong>de</strong> vraisemblance est donné par :⎧⎪⎨LR (Z) = 2⎪⎩N log N − N G log N G − N F log N F+N G (Z) log N G (Z) + N F (Z) log N F (Z)+M G (Z) log M G (Z) + M F (Z) log M F (Z)−(N G (Z) + N F (Z)) log(N G (Z) + N F (Z))−(M G (Z) + M F (Z)) log(M G (Z) + M F (Z)).⎫⎪⎬⎪⎭(6.30)


Chapitre 6. Tests <strong>de</strong> dominance stochastique en mobilité 144Les tests <strong>de</strong> bootstrap seront réalisés selon le procédé décrit par Davidson <strong>et</strong> Duclos(2006). Lorsque les échantillons comparés exhibent <strong>de</strong> la dominance, on calcule la statistique<strong>de</strong> test LR(Z) sous l’hypothèse nulle <strong>de</strong> non dominance, ainsi que les probabilités quilui sont associées. Ces probabilités sont alors utilisées pour générer B = 399 échantillons<strong>de</strong> bootstrap pour chacune <strong>de</strong>s <strong>de</strong>ux distributions. L’on calcule ensuite, pour chaque paired’échantillons, la statistique LR b (Z) (avec b = 1, ..., B). La valeur p B du bootstrap est alorsdonnée par la proportion <strong>de</strong> statistiques LR b (Z) supérieures à LR(Z).Pour tester la dominance du second ordre, la condition (iii) du théorème 2 sera considérée.Il s’agit <strong>de</strong> la dominance en terme <strong>de</strong> Lorenz généralisé. Contrairement à la dominance dupremier ordre, ici on exclut la dominance <strong>de</strong> G par F s’il existe un couple (Z F , Z G ) pourlequel GL F (Z F ) ≤ GL G (Z G ). La contrainte (6.26) <strong>de</strong>vient alors :∑N F∑N Gp F s ∆ s I (∆ s ≤ Z F ) = p G h ∆ ′ hI (∆ ′ h ≤ Z G ) (6.31)s=1h=1Z F <strong>et</strong> Z G correspon<strong>de</strong>nt à <strong>de</strong>s quantiles <strong>de</strong> même rang. Le Lagrangien L du problème <strong>de</strong>maximisation est le suivant :L = ∑ slog P F s+ ∑ hlog P G h+ λ F (1 − ∑ sP F s ) + λ G (1 − ∑ hP G h )− µ( ∑ sP F s ∆ s I s (Z F ) − ∑ hP G h ∆ ′ hI h (Z G )), (6.32)λ F , λ G <strong>et</strong> µ ∈ R sont <strong>de</strong>s multiplicateurs <strong>de</strong> Lagrange. Les solutions <strong>de</strong> ce problèmene peuvent <strong>être</strong> dérivées analytiquement. Cependant, en partant <strong>de</strong>s conditions <strong>de</strong> premierordre, on peut déterminer plus facilement <strong>de</strong>s solutions numériques. Ces conditions sont lessuivantes :λ F + λ G = N F + N G = N


Chapitre 6. Tests <strong>de</strong> dominance stochastique en mobilité 145P G h =1N − λ F − µ∆ ′ h I h (Z G ) <strong>et</strong> P F s =1λ F + µ∆ s I s (Z F )(6.33)On résoud le problème en recherchant ̂λ F <strong>et</strong> ̂µ :(̂λ F , ̂µ) = arg minλ F ,µ∈R− ∑ slog(λ F + µ∆ s I s (Z F )) − ∑ hlog(N − λ F − µ∆ ′ hI h (Z G ))(6.34)Une fois estimés, ̂λ F <strong>et</strong> ̂µ perm<strong>et</strong>tent <strong>de</strong> calculer les probabilités <strong>et</strong> le ratio <strong>de</strong> vraisemblancepour chaque couple (Z F , Z G ). Cependant, Z F <strong>et</strong> Z G sont endogènes puisqu’ils dépen<strong>de</strong>ntrespectivement <strong>de</strong> P F s<strong>et</strong> <strong>de</strong> Ph G. Ainsi, en partant du couple (Z0 F , Z0 G ) initial, onutilise les probabilités estimées pour déterminer le nouveau couple (ZF 1 , Z1 G ). On fait alorsune itération <strong>de</strong> l’optimisation du problème (6.34) <strong>et</strong> on recalcule les probabilités en utilisantles formules en (6.33). On arrête à la i ème itération lorsque les différences entre (Z i−1F, Zi−1 G )<strong>et</strong> (ZF i , Zi G ) <strong>de</strong>viennent négligeables. Deux approches seront considérée à savoir, l’approchedu Lorenz généralisé <strong>et</strong> celle <strong>de</strong> Mitra <strong>et</strong> Ok (1998).6.3.2 L’inférence sur les matrices <strong>de</strong> transitionConsidérons une matrice <strong>de</strong> transition P = [P kl ]. Considérons également l’expressionK∑ L∑π k P kl . Si on remplace P kl <strong>et</strong> π k par leurs expressions au niveau <strong>de</strong>s équations (6.9) <strong>et</strong>k=1l=1(6.10), on obtient l’équation :K∑ L∑π k P kl =k=1 l=1K∑ L∑ n∑p i I (x i ∈ Ω k , y i ∈ Γ l ) ∀ K, L = 1, 2, ..., η (6.35)k=1 l=1 i=1Notons Ω k = [X k−1 , X k ] <strong>et</strong> Γ l = [Y l−1 , Y l ] avec Ω 1 = [0, X 1 ], Ω η =]X η−1 , x], Γ 1 = [0, Y 1 ]<strong>et</strong> Γ η =]Y η−1 , y]. Les X k <strong>et</strong> Y l (k, l = 1, ..., η) sont les η quantiles r<strong>et</strong>enus au niveau <strong>de</strong> chaquedimension. Ainsi, l’expression (6.35) peut <strong>être</strong> réécrite comme suit :


Chapitre 6. Tests <strong>de</strong> dominance stochastique en mobilité 146K∑ L∑π k P kl =k=1 l=1n∑p i I (x i ≤ X K , y i ≤ Y L ) ∀ K, L = 1, 2, ..., η. (6.36)i=1Soient <strong>de</strong>ux <strong>de</strong>nsités cumulatives bivariées F <strong>et</strong> G décrivant respectivement les <strong>de</strong>ux distributions(x → y) <strong>et</strong> (x ′ → y ′ ). La contrainte <strong>de</strong> non dominance <strong>de</strong> G par F selon le critèred’Atkinson (1983) <strong>et</strong> Dardanoni (1993) implique, pour au moins un couple (k, l), que :∑N Gj=1p G j I ( x ′ j ≤ X ′ k, y ′ j ≤ Y ′l) ∑N F= p F i I (x i ≤ X k , y i ≤ Y l ) (6.37)i=1X ′ k <strong>et</strong> Y ′lsont les quantiles issus <strong>de</strong> la distribution G correspondant aux mêmes rangsque X k <strong>et</strong> Y l issus <strong>de</strong> la distribution F . Le test suit la même procédure que dans la sectionprécé<strong>de</strong>nte. Les résultats <strong>de</strong> la maximisation donnent alors :p G j (k, l) = I ( x ′ j ≤ X k ′ , )y′ j ≤ Y l′+θ( (1 − I x′j ≤ X k ′ , ))y′ j ≤ Y l′φ(6.38)p F i (k, l) = I (x i ≤ X k , y i ≤ Y l )N − θ+ (1 − I (x i ≤ X k , y i ≤ Y l ))N − φ(6.39)avec :θ =N × N G (k, l)N G (k, l) + N F (k, l) <strong>et</strong> φ = N × M G (k, l)M G (k, l) + M F (k, l)∑N GN G (k, l) = I ( ) ∑N Fx ′ j ≤ X k, ′ y j ′ ≤ Y l′ <strong>et</strong> NF (k, l) = I (x i ≤ X k , y i ≤ Y l )j=1i=1


Chapitre 6. Tests <strong>de</strong> dominance stochastique en mobilité 147M G (k, l) = N G − N G (k, l), M F (k, l) = N F − N F (k, l) <strong>et</strong> N = N G + N F .Le nouveau ratio <strong>de</strong> vraisemblance est :⎧⎪⎨LR (k, l) = 2⎪⎩N log N − N G log N G − N F log N F+N G (k, l) log N G (k, l) + N F (k, l) log N F (k, l)+M G (k, l) log M G (k, l) + M F (k, l) log M F (k, l)−(N G (k, l) + N F (k, l)) log(N G (k, l) + N F (k, l))−(M G (k, l) + M F (k, l)) log(M G (k, l) + M F (k, l)).⎫⎪⎬⎪⎭(6.40)Comme dans le cas <strong>de</strong> la mobilité asbolue, les couples (X k , Y L ) <strong>et</strong> (X k ′ , Y L ′ ) sont endogènesce qui rend nécessaire d’effectuer plusieurs itérations.Pour analyser la dominance <strong>de</strong> second ordre, l’on utilise l’expression <strong>de</strong> l’équation (6.22).La contrainte (6.37) <strong>de</strong>vient :∑N Gj=1p G j (X k ′ − x ′ j)(Y l ′ − y j)I ( ′ x ′ j ≤ X k, ′ y j ′ ≤ Y l′∑N Fi=1)=p F i (X k − x i )(Y l − y i )I (x i ≤ X k , y i ≤ Y l ) (6.41)Les solutions seront dérivées <strong>de</strong> façon numérique en suivant la même procédure que dansle cas <strong>de</strong> la mobilité absolue.On va distinguer <strong>de</strong>ux cas dépendamment <strong>de</strong> la façon <strong>de</strong> déterminer la matrice <strong>de</strong> transition.Le premier cas correspond à celui dans lequel l’on ne se soucie que <strong>de</strong> la mobilité pureou mobilité d’échange (Atkinson, 1983 ; Dardanoni, 1993). On y adm<strong>et</strong> l’hypothèse <strong>de</strong> l’état


Chapitre 6. Tests <strong>de</strong> dominance stochastique en mobilité 148stationnaire avec F (X k ) = F (Y l ) = G(X ′ k ) = G(Y ′l ) = π k pour k = l. La matrice est alorsdéterminée selon <strong>de</strong>s classes <strong>de</strong> pourcentages i<strong>de</strong>ntiques pour les distributions x <strong>et</strong> y.Le second cas intègre la croissance comme l’ont suggéré Formby <strong>et</strong> al (2003). Mais ici,la croissance considérée est celle observée dans la dynamique <strong>de</strong> chacune <strong>de</strong>s populations àcomparer. Elle ne concerne pas les différences dans les niveaux <strong>de</strong> revenus initiaux entre lespopulations. C’est le cas lorsqu’on utilise les quantiles pour la distribution x <strong>et</strong> que les valeurs<strong>de</strong> ces quantiles sont r<strong>et</strong>enues pour établir le positionnement <strong>de</strong> la distribution y. Dans ce cas,nous n’avons que l’égalité F (X k ) = G(X k ′ ).6.4 Résultats empiriquesNos données proviennent <strong>de</strong>s enquêtes PSID (Panel Study of Income Dynamics). L’analysea été restreinte aux individus agés <strong>de</strong> 24 à 49 ans ne travaillant pas pour leur proprecompte. Nous avons ainsi constitué pour les USA 4 pério<strong>de</strong>s pour lesquelles on compare lamobilité : 1970-75, 1975-80, 1980-85 <strong>et</strong> 1985-90. Tous les revenus ont été évalués au prix <strong>de</strong>l’année 1990.Certains individus peuvent se r<strong>et</strong>rouver dans <strong>de</strong>ux pério<strong>de</strong>s différentes, ce qui suggèrel’existence d’une éventuelle corrélation entre les <strong>de</strong>ux échantillons représentatifs. Cependant,c<strong>et</strong>te corrélation est assez limitée parce qu’une gran<strong>de</strong> partie <strong>de</strong> l’échantillon d’une pério<strong>de</strong>donnée n’est pas présente dans la pério<strong>de</strong> précé<strong>de</strong>nte. Par ailleurs, les 4 échantillons sont <strong>de</strong>tailles différentes, respectivement 1982, 2570, 3603 <strong>et</strong> 4428 pour les pério<strong>de</strong>s successives,ce qui fait que la probabilité pour un même individu peut varier d’un échantillon à un autredépendamment <strong>de</strong> son poids relatif. Cela ne perm<strong>et</strong> pas <strong>de</strong> modéliser <strong>de</strong> manière commo<strong>de</strong> leproblème <strong>de</strong> corrélations entre échantillons comme l’a suggéré Davidson (2007) 7 . Mais cela<strong>de</strong> facto minimise également l’existence <strong>de</strong> ces corrélations dans nos échantillons.7 Davidson (2007) propose, pour <strong>de</strong>ux échantillons corrélés <strong>de</strong> même taille issus <strong>de</strong> <strong>de</strong>ux distributions F <strong>et</strong>G, <strong>de</strong> considérer une probabilité P i unique pour chaque couple (x G , x F ) au lieu <strong>de</strong> considérer le cas général <strong>de</strong><strong>de</strong>ux probabilités P F i <strong>et</strong> P G i pour chaque élément du couple.


Chapitre 6. Tests <strong>de</strong> dominance stochastique en mobilité 1496.4.1 La mobilité absolueLes tests <strong>de</strong> dominance du premier ordre ont révélé une absence <strong>de</strong> dominance en mobilitéentre les 4 pério<strong>de</strong>s <strong>de</strong> l’étu<strong>de</strong>. Pour la dominance du second ordre l’approche du Lorenzgénéralisé <strong>et</strong> celle <strong>de</strong> Mitra <strong>et</strong> Ok (1998) sont considérées. On définit 100 quantiles (centiles)pour chacune <strong>de</strong>s <strong>de</strong>ux distributions, soient ̂Q F (p) <strong>et</strong> ̂Q G (p). L’on exclut cependant 5% <strong>de</strong>squantiles les plus faibles <strong>et</strong> 5% <strong>de</strong>s plus élevés pour éviter une trop gran<strong>de</strong> influence <strong>de</strong>s extrêmes.Le graphique 6.1 présente les différences entre les courbes <strong>de</strong> Lorenz généralisé quise sont avérées positives. On obtient ainsi quatres courbes qui traduisent 4 relations <strong>de</strong> dominanceéventuelles <strong>de</strong>s courbes <strong>de</strong>s pério<strong>de</strong>s 1970-75 <strong>et</strong> 1980-85 par les courbes <strong>de</strong>s pério<strong>de</strong>s1975-80 <strong>et</strong> 1985-90. Le fait que les quatres courbes se coupent confirme qu’il n’existe pasd’autres relations <strong>de</strong> dominance.FIG. 6.1 – Différences entre les courbes <strong>de</strong> Lorenz généraliséUS dollars (1,000)0.1 0.2 0.3 0.4 0.5 0.6(1975−80)−(1970−75)(1975−80)−(1980−85)(1985−90)−(1970−75)(1985−90)−(1980−85)0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9centilesAu niveau <strong>de</strong> l’approche Mitra <strong>et</strong> Ok (graphique 6.2), seule la pério<strong>de</strong> 1975-80 paraîtdominer toutes les autres puisque les différences entre la courbe <strong>de</strong> c<strong>et</strong>te pério<strong>de</strong> <strong>et</strong> celles<strong>de</strong>s autres pério<strong>de</strong>s sont positives. Les trois courbes du graphique se coupe ce qui exclutl’existence d’autres relations <strong>de</strong> dominance. L’inférence statistique perm<strong>et</strong> <strong>de</strong> confirmer laplupart <strong>de</strong> ces relations. En eff<strong>et</strong>, les résultats <strong>de</strong>s tableaux 6.1 <strong>et</strong> 6.2 montrent que, parmi


Chapitre 6. Tests <strong>de</strong> dominance stochastique en mobilité 150les 7 relations <strong>de</strong> dominance i<strong>de</strong>ntifiées, 5 se sont avérées significatives aux seuils <strong>de</strong> 5 ou1%. Les <strong>de</strong>ux autres relations <strong>de</strong> dominance n’apparaissent pas suffisamment significativescomme peuvent en témoigner leurs P-values (les probabilités rattachées à l’hypothèse H 0 <strong>de</strong>non dominance). Dans tous les tableaux qui vont suivre, les relations <strong>de</strong> dominance <strong>de</strong> G vsF indiquent qu’on teste l’hypothèse nulle <strong>de</strong> non dominance <strong>de</strong> G par F . Le rej<strong>et</strong> <strong>de</strong> c<strong>et</strong>tehypothèse qui est obtenu pour <strong>de</strong>s P-value faibles signifie alors que F domine G en mobilité.FIG. 6.2 – Différence entre les courbes <strong>de</strong> l’approche Mitra <strong>et</strong> OkUS dollars (1,000)0.3 0.4 0.5 0.6 0.7 0.8 0.9(1975−80)−(1970−75)(1975−80)−(1980−85)(1975−80)−(1985−90)0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9centilesTAB. 6.1 – Résultats <strong>de</strong>s tests statistiques sur les courbes <strong>de</strong> Lorenz généraliséG n’est pas dominé par F Ratio LR P-value1970-75 vs 1975-80 4.653 0.000**1970-75 vs 1985-90 2,898 0.010*1980-85 vs 1975-80 3,362 0.025*1980-85 vs 1985-90 1.108 0.208(*) <strong>et</strong> (**) dénotent que les statistiques sont significatives respectivement aux seuils <strong>de</strong> 5 <strong>et</strong>1%.


Chapitre 6. Tests <strong>de</strong> dominance stochastique en mobilité 151TAB. 6.2 – Résultats <strong>de</strong>s tests statistiques sur les courbes <strong>de</strong> l’approche Mitra <strong>et</strong> OkG n’est pas dominé par F Ratio LR P-value1970-75 vs 1975-80 1.089 0.1631980-85 vs 1975-80 2.859 0.008**1985-90 vs 1975-80 3.015 0.000**(**) dénote que la statistique est significative au seuil <strong>de</strong> 1%.6.4.2 Les matrices <strong>de</strong> transitionLes matrices <strong>de</strong> transition ont été définies par commodité en divisant la population en 5classes <strong>de</strong> revenu comme Formby <strong>et</strong> al (2004). Pour le premier cas (mobilité d’échange), onsuppose l’état stationnaire avec F (x) = F (y) = G(x) = G(y) = π = (0.2, 0.2, 0.2, 0.2, 0.2).Il s’agit simplement <strong>de</strong> considérer pour chaque distribution bivariée les 5 quantiles (quintiles)<strong>de</strong> x <strong>et</strong> <strong>de</strong> y. De ce fait, les éléments <strong>de</strong> la <strong>de</strong>rnière colonne <strong>et</strong> <strong>de</strong> la <strong>de</strong>rnière ligne <strong>de</strong> la matrice<strong>de</strong> dominance qu’on peut dénoter par { K L∑ ∑0.2( ˜P kl − P kl )}, sont égaux à zéro park=1l=1définition. L’inférence statistique proposée qui se fait plutôt en terme <strong>de</strong> dominance strictek=1 l=1nécessite l’exclusion <strong>de</strong> ces éléments. Ainsi, les tests sont réalisés en considérant la matrice{ K−1 ∑ L−1 ∑0.2( ˜P kl − P kl )}. Pour ce premier cas, il n’a pas été possible <strong>de</strong> déterminer <strong>de</strong>s relations<strong>de</strong> dominance éventuelles parce que toutes les courbes se croisent.Pour le second cas (mobilité avec croissance), on définit seulement l’égalité F (x) =G(x) = π = (0.2, 0.2, 0.2, 0.2, 0.2). Ici, seuls les quintiles du revenu initial x sont considérés.Ces quintiles sont alors utilisés pour définir les classes du revenu final y. Pour illustration, lesmatrices <strong>de</strong> transition estimées pour les pério<strong>de</strong>s 1970-75, 1980-85 <strong>et</strong> 1985-90 sont donnéespar :⎡̂P 1970−75 =⎢⎣0.480 0.297 0.118 0.075 0.0320.190 0.369 0.254 0.125 0.0610.079 0.190 0.308 0.301 0.1180.021 0.057 0.186 0.401 0.4230.014 0.021 0.075 0.165 0.598⎤⎥⎦


Chapitre 6. Tests <strong>de</strong> dominance stochastique en mobilité 152⎡̂P 1980−85 =⎢⎣⎡̂P 1985−90 =⎢⎣0.554 0.271 0.100 0.061 0.0140.210 0.415 0.248 0.092 0.0430.145 0.216 0.314 0.238 0.1200.049 0.090 0.183 0.316 0.3300.049 0.061 0.067 0.189 0.6190.449 0.278 0.138 0.078 0.0570.169 0.363 0.322 0.138 0.0770.081 0.120 0.265 0.321 0.1400.041 0.062 0.148 0.389 0.4180.034 0.029 0.054 0.163 0.663⎤⎥⎦⎤⎥⎦Au niveau <strong>de</strong> chaque matrice <strong>de</strong> transition P <strong>et</strong> ˜P , il est pris en compte l’eff<strong>et</strong> <strong>de</strong> lacroissance au sein <strong>de</strong> chaque population. L’on peut également vérifier qu’elles sont toutesmonotones. Toutefois, les différences <strong>de</strong> revenus entre les <strong>de</strong>ux populations respectives <strong>de</strong> P<strong>et</strong> ˜P ne sont pas prises en compte. En eff<strong>et</strong>, on peut supposer la même dynamique <strong>de</strong> revenuspour les <strong>de</strong>ux populations <strong>de</strong> même taille <strong>de</strong> telle sorte que P = ˜P . On aura toujours unemobilité i<strong>de</strong>ntique pour ces populations même si on suppose que la secon<strong>de</strong> population estune réplique <strong>de</strong> la première mais avec une échelle <strong>de</strong> revenus <strong>de</strong>ux fois supérieure. Ceci estcomparable à l’axiome <strong>de</strong> l’invariance d’échelle postulé au niveau <strong>de</strong>s indices <strong>de</strong> pauvr<strong>et</strong>é 8 .Ici, seuls les éléments <strong>de</strong> la <strong>de</strong>rnière colonne <strong>de</strong> la matrice <strong>de</strong> dominance sont nuls. Le test est∑alors effectué en considérant la matrice { K L−1 ∑0.2( ˜P kl − P kl )}. Ici, <strong>de</strong>ux relations semblentk=1 l=1<strong>être</strong> <strong>de</strong>s relations <strong>de</strong> dominance. Il s’agit notamment <strong>de</strong>s courbes <strong>de</strong>s pério<strong>de</strong>s 1975-80 <strong>et</strong>1985-90 qui se r<strong>et</strong>rouvent en <strong>de</strong>ssous <strong>de</strong> celle <strong>de</strong> 1980-85. Mais les résultats <strong>de</strong>s tests (voirtableau 6.3) montrent que ces relations <strong>de</strong> dominance ne sont pas significatives.TAB. 6.3 – Résultats <strong>de</strong> la dominance <strong>de</strong> premier ordre dans le cas <strong>de</strong> croissanceRelations <strong>de</strong> dominance Ratio LR P-value1980-85 vs 1970-75 0.409 0.3761980-85 vs 1985-90 0.205 0.459Pour tester la dominance <strong>de</strong> second ordre, on se sert <strong>de</strong> la contrainte (6.41). On compare8 L’invariance d’échelle stipule que la mesure <strong>de</strong> pauvr<strong>et</strong>é est homogène <strong>de</strong> <strong>de</strong>gré zero par rapport à sesarguments que sont les revenus <strong>et</strong> les lignes <strong>de</strong> pauvr<strong>et</strong>é.


Chapitre 6. Tests <strong>de</strong> dominance stochastique en mobilité 153donc le produit moyen <strong>de</strong>s écarts <strong>de</strong> revenus par rapport à un couple (X k , Y L ) donné. Onconsidère toujours les <strong>de</strong>ux cas ci-<strong>de</strong>ssus r<strong>et</strong>enus. Une distribution F domine alors en mobilitéune distribution G si son produit moyen apparaît généralement plus faible pour tous lescouples.Ceci est assez intuitif. En eff<strong>et</strong>, si on considère une distribution caractérisée par l’immobilisme,ce qui correspond à une matrice <strong>de</strong> transition diagonale, le produit moyen <strong>de</strong>s écartsaura tendance à <strong>être</strong> élevé pour les individus à faible revenu surtout lorsqu’on considère <strong>de</strong>scouples (X k , Y L ) où l’un <strong>de</strong>s <strong>de</strong>ux éléments correspond à une classe <strong>de</strong> revenus faibles <strong>et</strong>l’autre à une classe <strong>de</strong> revenus élevés. L’analyse prend en compte la croissance dans les revenus.En eff<strong>et</strong>, supposons que l’on dérive, à partir <strong>de</strong> c<strong>et</strong>te matrice diagonale, une matric<strong>et</strong>riangulaire inférieure. Cela correspondrait à une situation <strong>de</strong> mobilité où certains individusvoient plutôt leurs revenus finaux diminuer. Il est alors clair que le produit moyen <strong>de</strong>s écartsva <strong>être</strong> encore plus élevé que dans le cas <strong>de</strong> la matrice diagonale. C’est l’inverse pour unematrice triangulaire supérieure.TAB. 6.4 – Résultats <strong>de</strong> la dominance non restreinte <strong>de</strong> second ordre pour les <strong>de</strong>ux casRelations <strong>de</strong> dominance Ratio LR P-valueMobilité d’échange1975-80 vs 1970-75 0.135 0.6501975-80 vs 1985-90 0.023 0.808Mobilité avec croissance1970-75 vs 1985-90 0.499 0.5011975-80 vs 1970-75 0.241 0.3761975-80 vs 1985-90 1.364 0.3301980-85 vs 1985-90 0.174 0.702Pour réaliser les tests, le second échantillon issu <strong>de</strong> la distribution F est normalisé <strong>de</strong> tellesorte que, pour π = (0.2, 0.2, 0.2, 0.2, 0.2), il ait les mêmes quintiles que l’échantillon issu <strong>de</strong>la distribution G. Pour le cas <strong>de</strong> mobilité d’échange, c<strong>et</strong>te normalisation se fait à la fois dansl’espace <strong>de</strong>s revenus initiaux x <strong>et</strong> dans celui <strong>de</strong>s revenus finaux y. Pour le cas <strong>de</strong> la mobilitéavec croissance, la normalisation est d’abord effectuée dans l’espace <strong>de</strong>s x, puis les revenusfinaux y sont ajustés <strong>de</strong> telle sorte que les probabilités <strong>de</strong>s classes <strong>de</strong>s y ajustés définies par les


Chapitre 6. Tests <strong>de</strong> dominance stochastique en mobilité 154quantiles <strong>de</strong>s x normalisés soient équivalentes aux probabilités <strong>de</strong>s classes <strong>de</strong>s y non ajustésdéfinies par les quantiles <strong>de</strong>s x non normalisés (cf. annexes).TAB. 6.5 – Résultats <strong>de</strong> la dominance restreinte (aux 4 premières classes) <strong>de</strong> second ordrepour les <strong>de</strong>ux casRelations <strong>de</strong> dominance Ratio LR P-valueMobilité d’échange1970-75 vs 1985-90 0.088 0.8221975-80 vs 1970-75 0.135 0.1201975-80 vs 1980-85 0.057 0.9701975-80 vs 1985-90 1.900 0.010*Mobilité avec croissance1970-75 vs 1985-90 0.744 0.5061975-80 vs 1970-75 0.0.769 0.3131975-80 vs 1985-90 2.080 0.036*1980-85 vs 1985-90 0.591 0.719(*) dénotent que la statistique est significative au seuil respectifs <strong>de</strong> 5%.L’analyse <strong>de</strong> second ordre i<strong>de</strong>ntifie d’abord 6 relations <strong>de</strong> dominance non restreinte potentiellespour lesquelles le minimum <strong>de</strong> la statistique LR n’est pas nul. Parmi ces 6 relations,on a 2 pour le cas <strong>de</strong> la mobilité d’échange <strong>et</strong> 4 pour le cas <strong>de</strong> la mobilité avec croissance.Comme on peut le voir dans le tableau 6.4, aucune <strong>de</strong> ces relations ne s’est révélée significativepuisque les probabilités associées à l’hypothèse nulle (P − value) sont suffisammentélevées pour qu’on ne puisse pas rej<strong>et</strong>er celle-ci. L’analyse porte ensuite sur l’i<strong>de</strong>ntification<strong>de</strong> quelques relations <strong>de</strong> dominance restreinte. Pour ce faire, on fait abstraction <strong>de</strong> la <strong>de</strong>rnièrecolonne <strong>de</strong> la matrice <strong>de</strong> transition. Deux relations <strong>de</strong> dominance apparaissent significativeau seuil <strong>de</strong> 5% dont une pour chacune <strong>de</strong>s <strong>de</strong>ux cas (cf. tableau 6.5). Plus précisement, la pério<strong>de</strong>1985-90 domine la perio<strong>de</strong> 1975-80 dans les <strong>de</strong>ux cas. Même si les autres relations nese sont pas avérées significatives, la pério<strong>de</strong> 1985-90 semble avoir globalement connu plus <strong>de</strong>mobilité que les autres. Toutefois, on note que les résultats dépen<strong>de</strong>nt du choix <strong>de</strong> la mesure<strong>de</strong> mobilité puisque <strong>de</strong>s résultats différents ont été obtenus dans le cas <strong>de</strong> la mobilité absolue.


Chapitre 6. Tests <strong>de</strong> dominance stochastique en mobilité 1556.5 ConclusionPlusieurs mesures <strong>de</strong> la mobilité sont proposées dans la littérature. L’on peut alors, enutilisant une mesure spécifique, évaluer le <strong>de</strong>gré <strong>de</strong> mobilité d’une société. Mais la vraiequestion n’est pas en soi d’évaluer la mobilité, mais <strong>de</strong> pouvoir dire si la mobilité dans unesociété A est plus ou moins importante que celle dans une société B. Il est généralementimpossible d’établir une comparaison qui soit robuste aux différentes mesures proposées. Peud’étu<strong>de</strong>s ont essayé d’établir <strong>de</strong>s comparaisons robustes <strong>de</strong> mobilité. Elles décrivent, pourl’essentiel, quelques cadres théoriques pour le classement partiel <strong>de</strong> la mobilité (Atkinson,1983 ; Conlisk, 1989 ; Dardanoni, 1993 ; Mitra <strong>et</strong> Ok, 1998 ; Formby <strong>et</strong> al, 2003).La présente étu<strong>de</strong> propose, à l’instar <strong>de</strong> Maasoumi <strong>et</strong> Tre<strong>de</strong> (2001) <strong>et</strong> <strong>de</strong> Formby <strong>et</strong> al(2004), un test statistique <strong>de</strong> comparaison <strong>de</strong> la mobilité. La différence est que, ici, le testse fait en terme <strong>de</strong> dominance stochastique stricte. Par ailleurs, l’étu<strong>de</strong> r<strong>et</strong>ient <strong>de</strong>ux types <strong>de</strong>mesures. Le premier type repose sur les mesures <strong>de</strong> mobilité absolue proposées par Fields <strong>et</strong>Ok (1996). Le second type s’appuie sur les matrices <strong>de</strong> transition <strong>et</strong> perm<strong>et</strong> <strong>de</strong> réaliser <strong>de</strong>scomparaisons <strong>de</strong> mobilité en terme <strong>de</strong> <strong>bien</strong>-<strong>être</strong> social. Les tests sont effectués sous l’hypothèsenulle <strong>de</strong> non dominance contre l’alternative <strong>de</strong> dominance. L’analyse a été étendue à ladominance stochastique <strong>de</strong> second ordre.Pour réaliser <strong>de</strong>s applications, l’étu<strong>de</strong> a été basée sur les données PSID <strong>de</strong>s USA <strong>et</strong> acomparé quatres pério<strong>de</strong>s comprises entre 1970 <strong>et</strong> 1990. Au niveau <strong>de</strong>s mesures <strong>de</strong> mobilitéabsolue, il n’existe pas <strong>de</strong> relation <strong>de</strong> dominance au premier ordre car les courbes se coupent.Pour la dominance <strong>de</strong> second ordre, <strong>de</strong>ux approches sont considérées : l’approche <strong>de</strong> Lorenzgénéralisé classique <strong>et</strong> l’approche <strong>de</strong> Mitra <strong>et</strong> Ok. Les analyses montrent l’existence<strong>de</strong> quelques relations <strong>de</strong> dominance, qui se sont révélées pour la plupart statistiquement robustes.Au niveau <strong>de</strong>s mesures basées sur les matrices <strong>de</strong> transition, on note <strong>de</strong>ux relations<strong>de</strong> dominance au premier ordre (toutes <strong>de</strong>ux dans le cas <strong>de</strong> la mobilité avec croissance) quine se sont pas avérées significatives. L’analyse <strong>de</strong> la dominance <strong>de</strong> second ordre révèle quantà elle l’existence <strong>de</strong> plusieurs relations <strong>de</strong> dominance dont <strong>de</strong>ux sont apparues significatives.


Chapitre 6. Tests <strong>de</strong> dominance stochastique en mobilité 156Les résultats suggèrent que, même si théoriquement on adm<strong>et</strong> <strong>de</strong>s différences dans les <strong>de</strong>grés<strong>de</strong> mobilité entre plusieurs économies ou entre plusieurs pério<strong>de</strong>s d’une économie donnée,il est difficile d’obtenir <strong>de</strong>s classements robustes <strong>de</strong> la mobilité basée sur le concept <strong>de</strong> ladominance stochastique stricte. Il est cependant important <strong>de</strong> réaliser <strong>de</strong>s tests statistiquespour vérifier si <strong>de</strong>s classements en terme <strong>de</strong> mobilité sont robustes plutôt que <strong>de</strong> se limiteraux comparaisons d’estimées qui sont insuffisantes.6.6 Annexes6.6.1 Annexe : Mobilité d’échangeSoient X K <strong>et</strong> Y K les quintiles issus <strong>de</strong> la distribution F , <strong>et</strong> X ′ K <strong>et</strong> Y ′ Kceux issus <strong>de</strong> ladistribution G, avec K, L = 1, ..., 5. On veut transformer les observations (x ′ , y ′ ) <strong>de</strong> G en(˜x, ỹ) <strong>de</strong> façon que leurs quintiles soient respectivement X K <strong>et</strong> Y K . Pour ce faire, on appliquela formule suivante :˜x j = X K−1 + (x ′ j − X K−1) ′ X K − X K−1XK ′ − , ∀ j = 1, ..., N G tq X X′ K−1 ′ < x ′ j ≤ X K. ′ (6.42)K−1Pour K = 1, X K−1 = X ′ K−1 = 0.La même chose est faite pour déterminer les ỹ j , soit :ỹ j = Y L−1 + (y j ′ − Y L−1) ′ Y L − Y L−1YL ′ − Y , ∀ j = 1, ..., NL−1′ G tq Y L−1 ′ < y j ′ ≤ Y L. ′ (6.43)Pour L = 1, Y L−1 = Y ′ L−1= 0. Après c<strong>et</strong>te transformation, les nouvelles observations(˜x, ỹ) issues <strong>de</strong> G auront les mêmes quintiles que ceux obtenus pour F .


Chapitre 6. Tests <strong>de</strong> dominance stochastique en mobilité 1576.6.2 Annexe : Mobilité avec croissanceIci, seuls les quintiles du revenu initial sont déterminés à savoir X K pour F <strong>et</strong> X ′ K pourG, avec K = 1, ..., 5. Ces mêmes quintiles sont r<strong>et</strong>enus pour déterminer les classes dansle revenu final. On suppose que les proportions d’individus dans les classes <strong>de</strong> revenu finalsont respectivement P K <strong>et</strong> P ′ K . Il s’agit dès lors <strong>de</strong> transformer (x′ , y ′ ) en (˜x, ỹ) <strong>de</strong> façonque les quintiles du revenu initial ˜x soient égaux à X K . De plus, c<strong>et</strong>te transformation doitpréserver les proportions P K ′ dans les classes <strong>de</strong> revenu final. On procè<strong>de</strong> <strong>de</strong> la même façonqu’au niveau <strong>de</strong> l’équation (6.42) pour déterminer les ˜x j . Les ỹ j sont alors calculés d’aprèsl’équation suivante :ỹ j = X K−1 + (y j ′ − X K−1) ′ X K − X K−1XK ′ − , ∀ j = 1, ..., N G tq X X′ K−1 ′ < y j ′ ≤ X K. ′ (6.44)K−1


Bibliographie[1] Atkinson, A. B. (1983), “The Measurement of Economic Mobility”, in : Social Justiceand Public Policy, Harvester Wheatsheaf.[2] Atkinson, A. B. <strong>et</strong> F. Bourguignon (1982), “The Comparison of Multi-Dimensional Distributionsof Economic Status ”, Review of Economic Studies, 49, 183-201.[3] Atkinson, A. B., Bourguignon F. <strong>et</strong> C. Morrisson (1992), Empirical Studies of EarningsMobility, Harwood Aca<strong>de</strong>mic Publishers.[4] Bartholomew, D. J. (1996), The Statistical Approach to Social Measurement, Aca<strong>de</strong>micPress, San Diego.[5] Benabou, R. <strong>et</strong> E. A. Ok (2001), “Mobility as Progressivity : Ranking Income ProcessesAccording to Equality of Opportunitiy”, NBER Working Paper 8431.[6] Bjorklund, A. <strong>et</strong> M. Jantti (1997), “Intergenerational Income Mobility in Swe<strong>de</strong>n Comparedto the United States”, American Economic Review, 87, 1009-1018.[7] Chadwick, L. <strong>et</strong> G. Solon (2002), “Intergenerational Income Mobility among Daughters”,American Economic Review, 92, 335-344.[8] Chakravarty, S. R., B. Dutta <strong>et</strong> J. A. Weymark (1985), “Ethical Indices of Income Mobility”,Social Choice Welfare, 2, 1-21.[9] Conlisk, J. (1989), “Ranking Mobility Matrices”, Economics L<strong>et</strong>ters, 29, 231-235.[10] Conlisk, J. (1990), “Monotone Mobility Matrices”, Journal of Mathematical Sociology,15, 173-191.[11] Corak, M. (2006), “Generational Income Mobility”, Review of Income and Wealth, 52,477-486.


Bibliographie 159[12] D’Agostino, M. <strong>et</strong> V. Dardanoni (2005), “The Measurement of Mobility : A Class ofDistance Indices”, Preliminary draft.[13] Dardanoni, V. (1993), “Measuring Social Mobility”, Journal of Economic Theory, 61,372-394.[14] Davidson, R. (2007), “Testing for Restricted Stochastic Dominance : Some Further Results”,mimeo.[15] Davidson, R. <strong>et</strong> J.-Y. Duclos (2006), “Testing for Restricted Stochastic Dominance”,IZA Discussion Paper No 2047.[16] Duclos, J.-Y. <strong>et</strong> A. Araar (2006), Poverty and Equity : Measurement, Policy, and Estimationwith DAD, Berlin and Ottawa : Springer and IDRC.[17] Fabig, H. (1999), “Income Mobility and the Welfare State : An International Comparisonwith Panel Data”, Journal of European Social Policy, 9, 105-111.[18] Fields, G. S. <strong>et</strong> E. A. Ok (1996), “The Meaning and Measurement of Income Mobility”,Journal of Economic Theory, 71, 349-377.[19] Fields, G. S. <strong>et</strong> E. A. Ok (1999), “The Measurement of Income Mobility : An Introductionto the Literature”, in Silber, J. (Ed.), Handbook of Inequality Measurement, KluwerAca<strong>de</strong>mic Publishers, Dordrecht.[20] Fields, G. S., J. B. Leary <strong>et</strong> E. A. Ok (2002), “Stochastic Dominance in Mobility Analysis”,Economics L<strong>et</strong>ters, 75, 333-339.[21] Formby, J. P., W. J. Smith <strong>et</strong> B. Zheng (2003), “Economic Growth, Welfare and the Measurementof Social Mobility”, in : Amiel, Y., J. A. Bishop (Eds), Research on EconomicInequality, 9, 105-111.[22] Formby, J. P., W. J. Smith <strong>et</strong> B. Zheng (2004), “Mobility Measurement, Transition Matricesand Statistical Inference”, Journal of Econom<strong>et</strong>rics, 120, 181-205.[23] Foster, J. E. <strong>et</strong> A. F. Shorrocks (1988), “Poverty Or<strong>de</strong>rings and Welfare Dominance”,Social Choice and Welfare, 5, 179-198.[24] Foster, J. E., Greer, J. <strong>et</strong> E. Thorbecke (1984), “A Class of Decomposable Poverty Measures”,Econom<strong>et</strong>rica, 52, 761-776.


Bibliographie 160[25] Hadar, J. <strong>et</strong> W. R. Russell (1974), “Stochastic Dominance in Choice Un<strong>de</strong>r Uncertainty”,in : Balch, M. S., D. L. McFad<strong>de</strong>n <strong>et</strong> S. Y. Wu (eds), Essays on EconomicBehaviour Un<strong>de</strong>r Uncertainty, North-Holland, Amsterdam.[26] Maasoumi, E. (1998), “On Mobility”, in : Ullah, A., D. E. A. Giles (Eds), Handbook ofApplied Economic Statistics, Marcel Dekker, New York.[27] Maasoumi, E. <strong>et</strong> S. Zandvakili (1986), “A Class of Generalized Measures of Mobilitywith Applications”, Economics L<strong>et</strong>ters, 22, 97-102.[28] Maasoumi, E. <strong>et</strong> M. Tre<strong>de</strong> (2001), “ Comparing Income Mobility in Germany and theUnited States Using Generalized Entropy Mobility Measures”, The Review of Economicsand Statistics, 83, 551-559.[29] Markandya, A. (1984), “The Welfare Measurement of Changes in Economic Mobility”,Economica, 51, 457-471.[30] Mitra, T. <strong>et</strong> E. A. Ok (1998), “The measurement of Income Mobility : A Partial Or<strong>de</strong>ringApproach”, Economic Theory, 12, 77-102.[31] P<strong>et</strong>ers, H. E. (1992), “Patterns of Intergenerational Mobility in Income and Earnings”,Reviews of Economics and Statistics, 74, 456-466.[32] Prais, S. J. (1955), “Measuring Social Mobility”, Journal of the Royal Statistical Soci<strong>et</strong>y,Series A, 118, 56-66.[33] Schluter, C. (1998), “Statistical Inference with Mobility Indices”, Economics L<strong>et</strong>ters,59, 157-162.[34] Schluter, C. <strong>et</strong> M. Tre<strong>de</strong> (2003), “Local Versus Global Assessment of Mobility”, InternationalEconomic Review, 44, 1313-1335.[35] Shorrocks, A. F. (1978a), “The Measurement of Mobility”, Econom<strong>et</strong>rica, 46, 1013-1024.[36] Shorrocks, A. F. (1978b), “Income Inequality and Income Mobility”, Journal of EconomicTheory, 19, 376-393.[37] Shorrocks, A. F. (1983), “Ranking Income Distributions”, Economica, 50, 3-17.


Bibliographie 161[38] Van Kerm, P. (2006), “Comparisons of Income Mobility Profiles”, ISER Working Paper2006-36.[39] Willig, R. D. (1981), “Social Welfare Dominance”, American Economic Review, 71,200-204.[40] Zheng, B. (2002), “Testing Lorenz Curves with Non-Simple Random Samples”, Econom<strong>et</strong>rica,70, 1235-1243.


Chapitre 7ConclusionComparer le <strong>bien</strong>-<strong>être</strong> <strong>et</strong> la pauvr<strong>et</strong>é est un exercice important pour analyser les différencesdans les niveaux <strong>de</strong> développement, ainsi que pour cerner l’inci<strong>de</strong>nce <strong>de</strong>s politiques<strong>de</strong> développement. L’analyse <strong>de</strong> la dominance stochastique s’est révélée dans le passé un outilindispensable pour réaliser <strong>de</strong>s comparaisons robustes en pauvr<strong>et</strong>é cohérentes avec <strong>de</strong>s comparaisonsen termes d’utilité ou <strong>de</strong> <strong>bien</strong>-<strong>être</strong>. C<strong>et</strong> outil a aussi été largement utilisé en financepour analyser l’efficacité <strong>de</strong>s portefeuilles ou comparer le ren<strong>de</strong>ment <strong>de</strong> fonds mutuels.Plusieurs tests statistiques ont été proposés dans le passé dont la plupart perm<strong>et</strong>tent <strong>de</strong> testerla dominance faible. Davidson <strong>et</strong> Duclos (2006) suggèrent une métho<strong>de</strong> <strong>de</strong> vraisemblanceempirique pour réaliser <strong>de</strong>s tests <strong>de</strong> dominance stricte basés sur l’hypothèse nulle <strong>de</strong> non dominance.Leur démarche semble intéressante à certains égards. D’abord, elle est basée surune formulation <strong>de</strong> type intersection-union qui perm<strong>et</strong> d’accepter sans ambiguïté l’existence<strong>de</strong> la dominance lorsque celle-ci s’avère. Ensuite, elle fournit <strong>de</strong>s probabilités qui serventà tirer <strong>de</strong>s échantillons <strong>de</strong> bootstrap <strong>et</strong> à réaliser <strong>de</strong>s tests sur <strong>de</strong>s statistiques pivotales plusperformants que ceux réalisés avec les échantillonnages <strong>de</strong> bootstrap classiques.La présente thèse a consisté d’abord à étendre la métho<strong>de</strong> <strong>de</strong> Davidson <strong>et</strong> Duclos aucas <strong>de</strong> distributions multivariées <strong>de</strong> <strong>bien</strong>-<strong>être</strong>. C<strong>et</strong>te idée est compatible avec la littératureactuelle qui considère la pauvr<strong>et</strong>é <strong>et</strong> le <strong>bien</strong>-<strong>être</strong> comme <strong>de</strong>s phénomènes multidimensionnels


Chapitre 7. Conclusion 163qui vont au <strong>de</strong>là <strong>de</strong> la simple perception monétaire. Les simulations <strong>de</strong> Monte Carlo ontrévélé que les tests <strong>de</strong> bootstrap fonctionnent assez <strong>bien</strong> lorsqu’on considère <strong>de</strong>s distributionsbivariées. Des applications sont faites à partir <strong>de</strong> données <strong>de</strong> quelques pays africains. Elles ontconfirmé la bonne puissance <strong>de</strong> ces tests puisque plusieurs relations <strong>de</strong> dominance stricte ontété mises en évi<strong>de</strong>nce. Par ailleurs, un cas particulier <strong>de</strong> distribution bivariée a été égalementconsidéré. Il s’agit <strong>de</strong> la situation dans laquelle une <strong>de</strong>s dimensions est une variable discrète.Les tests ont là aussi été largement concluants avec la mise en exergue <strong>de</strong> l’existence <strong>de</strong>plusieurs relations <strong>de</strong> dominance séquentielle. Dans une <strong>de</strong>rnière analyse, les tests ont étéappliqués à un domaine assez peu usité en terme <strong>de</strong> dominance stochastique. Il s’agit <strong>de</strong> lamobilité qui est un phénomène captant l’aspect dynamique du <strong>bien</strong>-<strong>être</strong>. Bien que dans nosillustrations relativement moins <strong>de</strong> relations se soient avérées <strong>être</strong> <strong>de</strong>s relations <strong>de</strong> dominancesignificatives, dans l’ensemble, les tests semblent <strong>bien</strong> fonctionner.La présente thèse se veut une contribution à la littérature sur la dominance stochastiquemultidimensionnelle <strong>et</strong> étend <strong>de</strong>s tests statistiques récents dans ce sens. En abordant l’analysestatistique en terme multidimensionnel, c<strong>et</strong>te thèse s’inscrit dans le souci <strong>de</strong> plus en plusconsensuel <strong>de</strong> considérer le <strong>bien</strong>-<strong>être</strong> <strong>et</strong> la pauvr<strong>et</strong>é comme <strong>de</strong>s phénomènes multidimensionnels.Elle constitue à c<strong>et</strong> égard une contribution pertinente. Elle offre aussi <strong>de</strong>s idées surles possibilités d’extension <strong>de</strong> l’analyse à plusieurs autres domaines <strong>de</strong> l’économie du <strong>bien</strong><strong>être</strong>.On peut penser entre autres aux concepts d’inégalité <strong>et</strong> d’inégalité multidimensionnelle.L’analyse peut aussi <strong>être</strong> réalisée en présence <strong>de</strong> distributions corrélées. En eff<strong>et</strong>, Davidson(2007) propose une extension dans c<strong>et</strong>te direction qui peut aisément <strong>être</strong> adaptée au cas <strong>de</strong>distributions multivariées. Il est aussi possible que l’analyse trouve <strong>de</strong>s applications dansd’autres domaines tels que la finance si l’on souhaite faire <strong>de</strong>s comparaisons qui vont au <strong>de</strong>là<strong>de</strong> la simple préoccupation du ren<strong>de</strong>ment moyen <strong>et</strong> du risque.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!