02.07.2013 Views

UE 502 Psychométrie – Support TD : Textes - Vincent Berthet

UE 502 Psychométrie – Support TD : Textes - Vincent Berthet

UE 502 Psychométrie – Support TD : Textes - Vincent Berthet

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Licence 3 Psychologie<br />

Année universitaire 2012-2013<br />

<strong>UE</strong> <strong>502</strong> <strong>–</strong> PYCHOMETRIE<br />

<strong>Support</strong> de Cours <strong>–</strong> <strong>TD</strong><br />

<strong>Textes</strong><br />

<strong>Vincent</strong> <strong>Berthet</strong>


Texte 1<br />

Anastasi, A. (1994). Introduction à la psychométrie. Montréal : Guérin<br />

(chapitre 1 : p.3-24)


Texte 2<br />

Plaisant, O., Guertault, J., Courtois, R., Réveillère, C., Mendelsohn, G. A., & John, O. P. (2010).<br />

Histoire des « Big Five » : OCEAN des cinq grands facteurs de la personnalité. Introduction du Big<br />

Five Inventory français ou BFI-Fr. Annales Medico-psychologiques, 168, 481-486.


Mémoire<br />

Histoire des « Big Five » : OCEAN des cinq grands facteurs de la personnalité.<br />

Introduction du Big Five Inventory français ou BFI-Fr<br />

Big Five History: OCEAN of personality factors. Introduction of the French Big Five Inventory<br />

or BFI-Fr<br />

O. Plaisant a,b,c, *, J. Guertault b , R. Courtois c,d ,C.Réveillère c , G.A. Mendelsohn e , O.P. John e<br />

a URDIA, faculté de médecine, université Paris Descartes, 75005 Paris, France<br />

b Épilepsie et consultation de la douleur, groupe hospitalier Pitié-Salpêtrière, AP<strong>–</strong>HP, 47<strong>–</strong>83, boulevard de l’Hôpital, 75013 Paris, France<br />

c EA 2114 « Psychologie des âges de la vie », département de psychologie, université François-Rabelais, 37041 Tours cedex, France<br />

d Clinique psychiatrique universitaire, CHRU de Tours, 37044, Tours cedex 9, France<br />

e Department of Psychology and IPSR, University of California, Berkeley, États-Unis<br />

INFO ARTICLE<br />

Historique de l’article :<br />

Reçu le 9 juin 2008<br />

Accepté le 15 avril 2009<br />

Disponible sur Internet le 1 juillet 2010<br />

Mots clés :<br />

BFI-Fr<br />

Big Five Inventory<br />

Cinq grands facteurs de la personnalité<br />

Modèle des cinq facteurs de la personnalité<br />

Keywords:<br />

BFI-Fr<br />

Big Five<br />

Big Five Inventory<br />

Five factor model of personality<br />

Annales Médico-Psychologiques 168 (2010) 481<strong>–</strong>486<br />

RÉSUMÉ<br />

La description de la personnalité aété conçue à partir d’une variété de points de vue théoriques et à<br />

différents niveaux d’abstraction. Dans l’étude de la personnalité, l’unité la plus fréquemment utilisée<br />

pour mesurer les différences individuelles a été le trait. Un consensus semble se dégager actuellement<br />

sur une taxonomie générale des traits de la personnalité, les cinq facteurs de la personnalité, connus sous<br />

le nom des « Big Five », expression introduite par Goldberg. Le but de cet article est de resituer<br />

l’élaboration de la version originale du Big Five Inventory (BFI) de John, Donahue et Kentle (1991) dans<br />

son histoire, et parmi les autres tests disponibles le « <strong>TD</strong>A ou trait descriptive adjective » de Goldberg et le<br />

« NEO PI-R ou NEO personality inventory revised » de Costa et McCrae. La revue reprend les différents<br />

stades de conceptualisation des catégories qui furent élaborées à partir d’une sélection d’adjectifs de<br />

dictionnaires permettant de différencier un individu d’un autre. Seuls les traits seront utilisés pour<br />

l’élaboration des trois tests mentionnés. Les « Big Five » retrouvésàpartir d’analyses factorielles peuvent<br />

se résumer en cinq facteurs réplicables connus sous le nom de OCEAN ou CANOE de la personnalité,<br />

moyen mnémotechnique pour E (Extraversion, Énergie, Enthousiasme) ; A (Agréabilité, Altruisme,<br />

Affection) ; C (Conscience, Contrôle, Contrainte) ; N (Émotions Négatives, Névrosisme, Nervosité) ;O<br />

(Ouverture, Originalité, Ouverture d’esprit), ordre établi par les auteurs du BFI. La structure des « Big<br />

Five » regroupe à un haut niveau d’abstraction les points communs de la plupart des systèmes existant<br />

sur la description de la personnalité et met à disposition un modèle descriptif intégré pour des<br />

recherches sur la personnalité.<br />

ß 2010 Elsevier Masson SAS. Tous droits réservés.<br />

ABSTRACT<br />

* Auteur correspondant.<br />

Adresse e-mail : odile.plaisant@parisdescartes.fr (O. Plaisant).<br />

0003-4487/$ <strong>–</strong> see front matter ß 2010 Elsevier Masson SAS. Tous droits réservés.<br />

doi:10.1016/j.amp.2009.04.016<br />

Personality has been conceptualized from a variety of theoretical perspectives, and at various levels of<br />

abstraction or breadth. In personality research, the most common unit of measurement of individual<br />

differences remains trait. Today, a consensus seems to emerge as a general taxonomy of personality<br />

traits known as the Big Five, an expression introduced by Goldberg. The aim of this article is to describe<br />

the circumstances surrounding the elaboration of the Big Five Inventory in 1991 by John, Donahue, and<br />

Kentle, to put it back in its historical context, and compare it to the different tests available such as ‘‘<strong>TD</strong>A<br />

or trait descriptive adjective’’ of Goldberg and ‘‘NEO PI-R or NEO personality inventory revised’’ of Costa<br />

and McCrae. First, the different steps of category conceptualisation, developed from adjectives selected<br />

from the English dictionary to distinguish the behaviour of one human being from that of another will be


482<br />

‘‘... the scientific description of personality may not be quite so<br />

hopelessly complex as it is sometimes thought to be’’. Thurstone LL,<br />

septembre 1933 [39].<br />

« ... la description scientifique de la personnalité n’est peut-être<br />

pas aussi désespérément complexe qu’on le suppose parfois »<br />

(traduction des auteurs).<br />

1. Introduction<br />

La description de la personnalité aété conçue à partir d’une<br />

variété de points de vue théoriques et à différents niveaux<br />

d’abstraction. Par exemple, dès 1929, McDougall avait proposé<br />

cinq domaines pour définir la personnalité. Illesdénomma :<br />

« intellect », intelligence et connaissance ; « disposition »,<br />

tendances conatives et affectives ; « temper », mode d’exploitation<br />

des tendances conatives, le plus confus et obscur des<br />

facteurs ; « temperament », action du corps sur les réactions<br />

psychologiques et physiques du système nerveux ; « character »,<br />

organisation des tendances affectives en sentiments et<br />

complexes [29]. Chacun de ces niveaux, incluant la description<br />

de McDougall, a apporté une contribution à la compréhension<br />

des différences individuelles.<br />

Dans l’étude de la personnalité, l’unité la plus fréquemment<br />

utilisée pour mesurer ces différences individuelles a été le trait.<br />

Toutefois, le nombre de traits de personnalité et les échelles<br />

élaborées pour les explorer se sont multipliés considérablement.<br />

Les chercheurs et les praticiens s’intéressant à l’évaluation de la<br />

personnalité sont donc confrontés àune multitude d’échelles, qui<br />

peuvent avoir le même nom sans forcément mesurer les mêmes<br />

choses, ou au contraire ayant des noms différents tout en mesurant<br />

des concepts similaires.<br />

Après des années de recherche, un consensus semble se<br />

profiler sur une taxonomie générale des traits de la personnalité,<br />

les cinq grands facteurs de la personnalité, connus sous le nom<br />

des « Cinq Grands » ou « Big Five », expression introduite par<br />

Goldberg [17]. Le contenu de ces facteurs sera décrit ultérieurement<br />

dans l’article.<br />

Ces facteurs ne représentent pas un point de vue théorique<br />

particulier ; ils dérivent de l’analyse empirique, factorielle, des<br />

termes du langage courant qu’on utilise pour se décrire ou décrire<br />

les autres. N’ayant pas pour but de remplacer les systèmes<br />

précédents, la taxonomie des « Big Five » a une fonction intégrative<br />

car elle peut présenter les différents systèmes descriptifs de la<br />

personnalité dans un cadre commun [24]. Plusieurs inventaires<br />

pour mesurer les « Big Five » sont disponibles ; l’un d’entre eux, le<br />

« Big Five Inventory », est l’objet de cet article, dont le but est de<br />

montrer la découverte et la généralisation des cinq grands facteurs<br />

de la personnalité ; de resituer l’élaboration de la version originale<br />

du Big Five Inventory (BFI) de John et al. [22] dans son histoire,<br />

parmi les autres tests disponibles, et de faire l’inventaire des<br />

différentes versions du BFI disponibles en langue autre que<br />

l’anglais, comme la version espagnole [3], la version française, ou<br />

BFI-Fr (v45) [33], ou la version allemande [27].<br />

O. Plaisant et al. / Annales Médico-Psychologiques 168 (2010) 481<strong>–</strong>486<br />

considered. Only the traits have been used to elaborate the three tests. Factor structures resembling the Big<br />

Five were identified in numerous sets of variables. The Big Five were the only consistently replicable factors<br />

known as E (Extraversion, Energy, Enthusiasm), A (Agreeableness, Altruism, Affection), C (Conscientiousness,<br />

Control, Constraint), N (Neuroticism, Negative Affectivity, Nervousness), O (Openness, Originality,<br />

Open-mindedness). The reader intrigued by anagrams may have noticed that these letters form the OCEAN<br />

or the CANOE of personality dimensions. The Big Five structure captures, at a broad level of abstraction, the<br />

commonalities among most of the existing systems of personality description, and provides an integrative<br />

descriptive model for personality research.<br />

ß 2010 Elsevier Masson SAS. All rights reserved.<br />

2. Approche lexicale et découverte des « Big Five »<br />

De nombreux psychologues se sont tournés vers la langue<br />

comme source d’attributs afin de développer une taxonomie<br />

scientifique des traits de la personnalité. L’hypothèse lexicale<br />

postule que la plupart des caractéristiques importantes et<br />

socialement pertinentes de la personnalité d’une culture donnée<br />

sont encodées dans le langage naturel sous forme d’adjectifs [17].<br />

2.1. Travaux initiaux<br />

Allport peut être considéré comme l’un des pères du modèle en<br />

cinq facteurs (Five-Factor Model ou FFM). Suivant les travaux de<br />

Klages (1926) et ceux de Baumgarten (1933) [20], Allport et Odbert<br />

[2] menèrent une étude lexicale en relevant tous les termes<br />

décrivant la personnalité dans un dictionnaire anglais. Ils inclurent<br />

tous les termes pouvant être utilisés pour distinguer le comportement<br />

d’une personne de celui d’une autre [2] (p. 24). La liste<br />

complète s’éleva à presque 18 000 termes. Ils identifièrent quatre<br />

catégories principales. La première inclut les traits de personnalité<br />

(par exemple sociable, agressif, peureux) qu’ils définirent comme<br />

des tendances, des déterminants généraux et personnels des<br />

comportements habituels et stables de l’adaptation de l’individu à<br />

son environnement. La deuxième inclut des états temporaires, des<br />

humeurs et des activités tels que être effrayé ou transporté de joie,<br />

se réjouir. La troisième consiste en des jugements évaluant les<br />

conduites personnelles et la réputation des personnes, par<br />

exemple excellent, respectable, moyen et irritant. La dernière<br />

inclut les caractéristiques physiques, les capacités et les talents, les<br />

termes sans rapport avec la personnalité ou ne pouvant être inclus<br />

dans aucune des catégories.<br />

Allport et Odbert [2], puis Norman [30] qui augmenta le nombre<br />

de catégories, les considérèrent comme s’excluant mutuellement.<br />

Une inspection rapide de la classification montra que les catégories<br />

se chevauchaient et que leurs limites étaient floues, ce qui amena<br />

certains chercheurs à conclure que les distinctions entre les<br />

différentes classes de caractéristiques décrivant la personnalité<br />

étaient arbitraires et qu’elles devraient être abolies [1].<br />

2.2. Conception en modèle type (ou en prototype)<br />

Chaplin et al. [7], utilisant la théorie et les méthodes de Rosch<br />

[35], continuèrent à développer l’approche lexicale et se prononcèrent<br />

en faveur d’une conception en modèle type (prototype) où<br />

chaque catégorie <strong>–</strong> traits, états, activité, etc. <strong>–</strong> est définie par les<br />

termes les plus caractéristiques plutôt que par les définitions<br />

abstraites des limites de la catégorie ; les éléments des catégories<br />

n’avaient pas besoin d’être distincts mais pouvaient se définir le<br />

long d’un continuum. D’où le terme de prototype employé par les<br />

auteurs pour décrire les prototypes de la personnalité.<br />

Ils appliquèrent ce concept en prototype aux traits, aux états et<br />

aux activités pour mieux les différencier. Les états-type apparaissaient<br />

temporaires, brefs et déterminés par des causes externes,<br />

par exemple misérable, outragé. Les traits-types apparaissaient<br />

stables, durables, déterminés par des causes internes, par exemple


gentil, autoritaire. Ces résultats répliquèrent étroitement les<br />

premières classifications et confirmèrent que les définitions<br />

conceptuelles des traits et des états étaient largement retrouvées<br />

en recherche. Les activités n’étaient pas considérées comme une<br />

variable de personnalité.<br />

L’histoire des efforts pour développer une taxonomie des traits<br />

sera maintenant développée [21]. La première tentative a été faite<br />

par Thurstone [39]. Dès 1933, il avait montré, par analyse<br />

factorielle, la fréquence de distribution de cinq facteurs dans<br />

une étude de 60 traits de personnalité sous forme d’adjectifs.<br />

2.3. Travaux de Cattell et le 16PF<br />

Cattell utilisa la liste d’Allport et Odbert comme point de départ<br />

de son modèle multidimensionnel des structures de la personnalité.<br />

Cette liste étant trop longue, il commença avec 4500 traits [5]<br />

organisés en 160 clusters de termes bipolaires. Il réduisit les<br />

4500 traits à simplement 35 variables. Utilisant ce petit ensemble<br />

de variables, il conduisit plusieurs analyses factorielles obliques et<br />

conclut qu’il avait identifié 12 facteurs de personnalité qui<br />

finalement firent partie de son questionnaire des 16 facteurs de<br />

la personnalité (16PF) [6]. Toutefois, une nouvelle analyse des<br />

matrices de corrélation de Cattell n’a pas confirmé le nombre et la<br />

nature des facteurs [40].<br />

2.4. Première découverte des « Big Five »<br />

Le premier, Fiske [16], construisit une classification très<br />

simplifiée de 22 des variables de Cattell. La structure (factorielle)<br />

des facteurs ressemblait à ce qui serait connu plus tard comme les<br />

« Big Five ». Pour clarifier ces facteurs, Tupes et Christal [40]<br />

analysèrent à nouveau les matrices de corrélation provenant de<br />

huit échantillons différents. Dans toutes les analyses, Tupes et<br />

Christal retrouvèrent « cinq facteurs relativement constants et<br />

récurrents » [40] (p. 14). Norman [30], Borgatta [4], Digman et<br />

Takemoto-Chock [14] répliquèrent cette structure en cinq facteurs<br />

de listes dérivant des 35 variables de Cattell.<br />

Les cinq facteurs ont été dénommés différemment selon les<br />

auteurs et selon l’époque, mais furent finalement reconnus<br />

comme les cinq facteurs de la personnalité [17] <strong>–</strong>untitrechoisi<br />

non pas pour montrer leur grandeur intrinsèque mais pour mettre<br />

en évidence l’ampleur de chaque facteur. Ces cinq facteurs<br />

représentent le plus haut niveau d’abstraction de la personnalité<br />

et chaque dimension englobe un grand nombre de caractéristiques<br />

distinctes et plus spécifiques de la personnalité (traduction<br />

des auteurs).<br />

3. Approche actuelle des « Big Five »<br />

3.1. Les travaux de Goldberg et le « trait descriptive adjective ou <strong>TD</strong>A »<br />

Pendant les 45 ans qui suivirent l’utilisation des traits en<br />

langue anglaise que Cattell utilisa pour commencer sa description<br />

de la personnalité, de nombreux investigateurs ont proposé une<br />

structure alternative basée sur cinq facteurs orthogonaux. Dès<br />

1987, Peabody et Goldberg [31] définirent les cinq facteurs<br />

comme (I) Pouvoir ou Surgence, (II) Amour ou Amabilité, (III)<br />

Travail ou Conscience, (IV) Affect ou Émotions positives et (V)<br />

Intellect ou Culture [38]. Pour démontrer la généralisation de ce<br />

modèle en cinq facteurs, Goldberg a utilisé des groupes de termes<br />

dérivant du travail de Norman exprimant des traits sous forme<br />

d’adjectifs. Dans la première des trois études, 1431 traits sous<br />

forme d’adjectifs (1431-<strong>TD</strong>A) regroupés en75clustersontété<br />

analysés ; pratiquement une structure identique émergeait de dix<br />

différentes procédures d’analyse factorielle. Une deuxième étude<br />

de 479 termes courants regroupés en 133 clusters synonymes a<br />

O. Plaisant et al. / Annales Médico-Psychologiques 168 (2010) 481<strong>–</strong>486 483<br />

mis en évidencelamême structure dans deux échantillons d’autoévaluation<br />

et dans deux échantillons d’hétéro-évaluation. Aucun<br />

facteur apparu après les cinq facteurs ne s’était généralisé à<br />

travers les études. Dans la troisième étude, les analyses de<br />

100 clusters de 339 traits ont mis en évidence leur utilité<br />

potentielle en tant que marqueurs des « Big Five » pour des<br />

recherches ultérieures [18].<br />

L’approche de Goldberg [18] dérivant directement de<br />

l’approche lexicale évalue donc les cinq grands facteurs en<br />

décrivant les traits à l’aide d’adjectifs (Trait Descriptive Adjectives).<br />

Il a mis au point différentes listes d’adjectifs plus courtes que les<br />

précédentes dont l’une d’entre elles comprenant 50 items utilise<br />

un format connu sous le nom de « transparent ». Peu utilisée en<br />

recherche, celle-ci est intéressante sur le plan pédagogique [32].<br />

Une échelle de dix adjectifs bipolaires (par exemple, silencieuxvolubile)<br />

mesure chaque facteur. Les dix adjectifs sont regroupés<br />

sous le nom du facteur de telle sorte que le participant connaît les<br />

adjectifs attribués àchaque facteur, ce qui confère au test une très<br />

grande transparence. Une version française est disponible dans<br />

[32] (chap. 8, p. 227).<br />

La liste la plus utilisée en recherche est un ensemble de<br />

100 adjectifs unipolaires décrivant les traits (100-<strong>TD</strong>A). Par une<br />

série d’analyses factorielles, Goldberg a développé et affiné le <strong>TD</strong>A<br />

comme une représentation optimale de l’espace des cinq facteurs<br />

en anglais en ne sélectionnant pour chaque échelle des « Big Five »<br />

que les adjectifs définissant uniquement le facteur concerné. Les<br />

« Big Five » pour Goldberg deviennent Surgence, Agréabilité,<br />

Conscience, Stabilité émotionnelle et Intellect. Une version abrégée<br />

à 40 items a été développée par Saucier en 1994 [36,37].<br />

Goldberg est le créateur du « International Personality Item<br />

Pool » ou IPIP, un site web présentant la traduction de ses<br />

inventaires en de nombreuses langues ; ainsi une traduction<br />

française est disponible, notamment des 50 items en relation avec<br />

les cinq domaines du NEO-PI-R de Costa et McCrae (http://<br />

ipip.ori.org/).<br />

3.2. Recherche de Costa et McCrae et le NEO-PI-R<br />

Goldberg a suivi systématiquement l’approche lexicale mais<br />

d’autres auteurs ont préféré une autre approche pour évaluer la<br />

personnalité. L’une d’entre elles utilise des phrases descriptives<br />

dans une approche par questionnaire.<br />

Dans les années 1980, Costa et McCrae ont développé un<br />

questionnaire, le « NEO Personality Inventory » [9] pour mesurer<br />

trois importantes dimensions de la personnalité : Névrosisme,<br />

Extraversion et Ouverture aux expériences (NEO).<br />

En fait, Costa et McCrae commencèrent leur travail avec<br />

l’analyse des clusters des 16PF [6] qui dérivaient du travail lexical<br />

initial de Cattell. Leurs analyses ont reproduit les dimensions<br />

Extraversion et Névrosisme mais les ont convaincus de l’importance<br />

de l’ouverture qui provenait de plusieurs facteurs primaires<br />

de Cattell (par exemple imaginatif, expérimenté). En 1983, Costa et<br />

McCrae ont réalisé que leur système NEO était très proche de trois<br />

des cinq facteurs mais n’incluait pas de traits des deux autres<br />

domaines, Agréabilité et Conscience. Ils ont alors étendu leur<br />

modèle avec des échelles préliminaires mesurant l’Agréabilité et la<br />

Conscience. Dans plusieurs études [9,10], ils ont démontré que leur<br />

questionnaire à cinq échelles était très semblable aux mesures des<br />

« Big Five » basées sur les adjectifs, bien que leur conception de<br />

l’ouverture soit beaucoup plus large que les facteurs « intellect ou<br />

imagination » sortis des analyses lexicales. En 1992, Costa et<br />

McCrae ont publié les 240 items révisés de l’inventaire de<br />

personnalité (NEO Personality Inventory, Revised, NEO PI-R) [11]<br />

qui permet de différencier les mesures de chacun des cinq grands<br />

facteurs, appelés les cinq domaines, en fonction de six facettes<br />

spécifiques pour chacun des facteurs.


[(Fig._1)<strong>TD</strong>$FIG]<br />

484<br />

La Fig. 1 montre les six facettes définissant chacun des<br />

domaines ainsi que les adjectifs correspondant aux traits les plus<br />

corrélés avec chacune des facettes, montrant ainsi le lien avec les<br />

recherches lexicales. Chaque facette possède des variances<br />

partagées avec les autres facettes du domaine mais elle possède<br />

aussi leur propre variance. Chaque domaine est indépendant. Les<br />

facettes entre les domaines sont indépendantes.<br />

Le NEO PI-R a été développé sur des échantillons d’adultes d’âge<br />

moyen et d’âge mûr utilisant à la fois des analyses factorielles et<br />

des procédures de validation multiméthode pour construire le test.<br />

Les échelles ont montré une consistance interne, une stabilité<br />

temporelle et une validité convergente et discriminative lors des<br />

évaluations par les conjoints ou les pairs [11].<br />

Pour beaucoup de recherches, le NEO PI-R est trop long [24].<br />

C’est la raison pour laquelle Costa et McCrae ont développé le NEO-<br />

Five Factor Inventory (NEO-FFI) à 60 items, une version abrégée<br />

basée sur l’analyse factorielle des items de la version de 1985 du<br />

NEO PI [9,10]. Dans les échelles à 12 items du FFI n’ont été retenus<br />

que les items saturant le plus les cinq facteurs. Le NEO-FFI sert à<br />

évaluer les cinq domaines tandis que le NEO-PI-R donne des<br />

résultats pour chacune des facettes, permettant ainsi une approche<br />

psychopathologique plus fine [13]. L’inventaire de Costa et McCrae<br />

aété largement traduit dans différentes langues ; la version à<br />

240 items est disponible et a été adaptée en langue française par<br />

Rolland et al. [34]. La traduction proposée pour dénommer les<br />

facteurs est Névrosisme, Extraversion, Ouverture, Agréabilité,<br />

Conscience ou NEOAC, ordre défini par Costa et McCrae [12].<br />

Ultérieurement, les auteurs ont développé la théorie des cinq<br />

facteurs de la personnalité (Five-Factor Theory ou FFT), une<br />

interprétation explicative de la taxonomie des « Big Five ». La<br />

théorie est basée sur le fait que les cinq grandes dimensions<br />

auraient une base génétique importante [28] et devraient par<br />

conséquent dériver en partie de processus et de structures<br />

biologiques tels que des loci spécifiques sur des gènes, des régions<br />

cérébrales (par exemple l’amygdale), des neurotransmetteurs (par<br />

exemple, la dopamine), des hormones (par exemple la testostérone)<br />

[24]. C’est dans ce sens que les traits auraient un statut causal<br />

d’après les auteurs, mais il n’y a aucun lien spécifique entre les<br />

traits et des facteurs biologiques disponibles actuellement.<br />

Dès 1991, Costa soulignait l’intérêt d’évaluer la personnalité<br />

avant toute prise en charge psychologique de façon à offrir la<br />

meilleure thérapie en fonction des troubles mais aussi de façon à<br />

anticiper le cours de la thérapie et le suivi et à énoncer des buts [8].<br />

O. Plaisant et al. / Annales Médico-Psychologiques 168 (2010) 481<strong>–</strong>486<br />

Fig. 1. Montrant les six facettes du NEO-P-R définissant chacun des facteurs ainsi que les adjectifs correspondant aux traits les plus corrélés avec chacune des facettes,<br />

montrant ainsi le lien avec les recherches lexicales (traduction des auteurs. Communication personnelle 2000).<br />

De nombreuses recherches actuellement font le lien avec la<br />

psychopathologie ou la classification du DSM [13].<br />

Deux approches des « Big Five » peuvent ainsi être différenciées,<br />

les recherches lexicales de Goldberg [18] et les recherches basées<br />

sur des questionnaires de Costa et McCrae [11]. Malgré une<br />

abondante littérature, la structure des cinq grands facteurs de la<br />

personnalité n’a pas été acceptée comme une superstructure<br />

taxonomique par tous les chercheurs travaillant sur la personnalité.<br />

Pour renforcer cette hypothèse, une autre approche, dérivant<br />

de l’approche lexicale, va utiliser la conception en prototypes.<br />

3.3. Description des cinq facteurs dérivant de l’analyse en prototypes<br />

des catégories avec le Big Five Inventory<br />

Malgré des dénominations qui diffèrent et des contenus qui<br />

semblent varier, John [20] va s’interroger sur les cinq facteurs et<br />

chercher à extraire le dénominateur commun des catégories de<br />

traits définies par les chercheurs précédents. Pour cela, il a utilisé<br />

des évaluateurs et comme lexique les 300 termes de l’« Adjective<br />

Check List » de Gough et Heilbrun (ACL) comme point de départ de<br />

sa recherche [19] 1 .<br />

Un groupe de dix évaluateurs étudièrent dans le détail les cinq<br />

grandes dimensions en analysant les résultats des analyses<br />

factorielles et leurs interprétations dans tous les articles importants<br />

publiés sur les « Big Five » à l’époque de la recherche. Les<br />

évaluateurs classèrent chacun des 300 items de l’ACL dans l’une<br />

des cinq grandes catégories. Si cela n’était pas possible, les adjectifs<br />

étaient mis dans une sixième catégorie, « sans décision ». La validité<br />

interjuge était élevée. Les coefficients alpha étaient situés à<br />

0,90 pour le facteur IV (émotions négatives) et 0,94 pour le facteur<br />

V (ouverture), montrant que les évaluateurs avaient une compréhension<br />

consensuelle voire identique des cinq dimensions. Cent<br />

douze des 300 termes de l’ACL furent classés dans une des cinq<br />

grandes dimensions avec pratiquement une parfaite concordance<br />

(par exemple, par au moins 90 % des évaluateurs). Ces 112 termes<br />

représentaient une définition relativement étroite ou le fondement<br />

de la définition des cinq facteurs [24]. Logiquement, comme pour la<br />

construction de toute mesure, la validité de ces catégories devait<br />

être démontrée empiriquement. Si les prototypes initiaux mon-<br />

1 Une traduction française de « l’Adjectif Check List » est disponible et a été<br />

utilisée pour évaluer la désirabilité sociale dans trois cultures différentes<br />

américaine, italienne et française [traduction du CREDA Paris 5 ; 15].


traient une composition en cinq facteurs, les 112 termes auraient<br />

dû clairement définir cinq facteurs et chaque terme aurait dû avoir<br />

une saturation factorielle maximale dans chacun de leur facteur<br />

respectif. La plupart des recherches sur les « Big Five » ont été faites<br />

par auto-évaluation ou évaluation par des pairs, typiquement sur<br />

des étudiants. Cette étude a utilisé des évaluations par des<br />

psychologues testant ainsi la possibilité de retrouver les « Big Five »<br />

grâce à des descriptions de la personnalité formulées par des<br />

psychologues sur la base d’observations et d’entretiens intensifs.<br />

3.3.1. Validation des prototypes dans des observations<br />

L’ACL fut initialement développée àl’« Institute of Personality<br />

Assessment and Research, IPAR » (maintenant Institute of<br />

Personality and Social Research, ou IPSR) à l’université de<br />

Californie à Berkeley (États-Unis) pour permettre aux membres<br />

du personnel de décrire la personnalité des individus des<br />

programmes d’évaluation du centre [19] (p. 1).<br />

John [20] a utilisé un échantillon de 140 hommes et 140 femmes<br />

qui ont participé par groupe de dix à 15 à un programme<br />

d’évaluation de la personnalité à IPSR. Il y a eu dix descriptions par<br />

sujet, faites par dix évaluateurs différents. Les données résultantes<br />

ont fait l’objet d’une analyse factorielle. Les résultats de l’analyse<br />

factorielle ont montré que chaque adjectif pouvait être classé dans<br />

le facteur qui lui avait été attribué hypothétiquement au départ,<br />

confirmant ainsi de façon spectaculaire les prototypes initiaux.<br />

Avec une exception, chaque item se situait dans son hypothétique<br />

facteur dans la direction espérée. Pour 98 des 112 items, les plus<br />

grandes saturations factorielles se retrouvaient aussi dans le<br />

facteur et la plupart de celles-ci étaient élevées.<br />

Dans cette étude, on retrouvait différentes composantes pour<br />

chaque facteur. Par exemple pour l’Extraversion : niveau d’Activité<br />

(actif, énergique), Dominance (sûr de soi, autoritaire), Sociabilité<br />

(extraverti, sociable, bavard), Expressivité (aventureux, carré,<br />

bruyant, vantard) et Émotions positives (enthousiaste, a du cran).<br />

Il faut remarquer que ces cinq composantes sont semblables à cinq<br />

des six facettes que Costa et McCrae [11] ont inclues dans leur<br />

définition du domaine Extraversion <strong>–</strong> Activité, Autoritarisme,<br />

Grégarisme, Surexcitation et Émotions positives.<br />

3.3.2. Big Five Inventory (BFI) : mesure des caractéristiques<br />

principales des « Big Five » à l’aide de courtes phrases ou de<br />

groupes de mots<br />

Pour répondre au besoin d’un instrument court mesurant les<br />

prototypes des cinq facteurs de la personnalité communs aux<br />

investigateurs précédents, John et al. ont construit le « Big Five<br />

Inventory » [3,22]. Les 44 items du BFI ont été développés en<br />

Californie pour représenter les prototypes élaborés à partir de<br />

l’évaluation d’experts et ultérieurement vérifiés par analyse<br />

factorielle à partir des données d’évaluation d’observateurs. Le<br />

but était de créer un inventaire bref qui permettrait une mesure<br />

efficace et flexible des cinq dimensions quand il n’y a pas de<br />

nécessité de mesure plus approfondie des facettes.<br />

Les items du BFI n’utilisent pas de simples adjectifs car les<br />

réponses à de simples adjectifs sont moins précises ; celles-ci sont<br />

meilleures quand elles sont accompagnées de définitions ou dans<br />

un contexte plus élaboré. Le BFI utilise de courtes phrases ou des<br />

groupes de mots basés sur les traits à partir des adjectifs reconnus<br />

pour être les prototypes de la description des « Big Five », ayant la<br />

plus grande saturation factorielle dans la dimension [20,24,26].Un<br />

ou deux adjectifs-types servent d’information principale pour la<br />

construction de l’item auquel sont ajoutées des informations plus<br />

élaborées, clarifiantes ou contextuelles. Par exemple, l’adjectif<br />

appartenant au facteur d’Ouverture « original » devient l’item du<br />

BFI : est créatif, plein d’idées originales ; et l’adjectif « persévérant »<br />

O. Plaisant et al. / Annales Médico-Psychologiques 168 (2010) 481<strong>–</strong>486 485<br />

du facteur Conscience sert de base à l’item : persévère jusqu’à ce<br />

que sa tâche soit finie. Bien qu’il n’y ait que huit à dix items par<br />

facteurs, le BFI présente de bonnes propriétés psychométriques et<br />

couvre le contenu des domaines. Par exemple, l’échelle d’Agréabilité<br />

à neuf items dans la version anglaise et espagnole, à dix items<br />

dans les versions allemande et française, inclut des items couvrant<br />

au moins cinq des six facettes de Costa et McCrae [11] : Confiance<br />

(indulgent, confiant), Altruisme (serviable, généreux), Compliance<br />

(conciliant), Modestie (ne critique pas les autres) et Sensibilité<br />

(prévenant, gentil).<br />

Le BFI a été traduit en plusieurs langues. Toutes ces traductions<br />

ont été construites pour avoir des propriétés psychométriques<br />

aussi proches que possible de la version originale américaine de<br />

John et al. [22]. La version espagnole possède 44 items comme la<br />

version américaine, mais l’ordre des items est différent [3]. En<br />

français, le BFI-Fr, comme il a été appelé par les auteurs, comprend<br />

dans sa version définitive 45 items [33] ; il en est de même pour la<br />

version allemande [27]. Les versions du BFI élaborées en<br />

collaboration avec Oliver P. John, sauf la version française, sont<br />

disponibles sur le site : http://www.outofservice.com/bigfive/. Le<br />

BFI de John et al. [20] aété fréquemment utilisé en recherche<br />

quand le temps de passation devait être court et quand il était<br />

préférable d’utiliser de courtes expressions donnant plus d’explications<br />

que les simples adjectifs de Goldberg et étant moins<br />

complexes que les phrases utilisées dans les questionnaires NEO de<br />

Costa et McCrae. Cependant, John et al. soulignent que les<br />

questionnaires NEO de Costa et McCrae [11] représentent la<br />

mesure des « Big Five » la plus validée dans la tradition des<br />

questionnaires ; alors que le <strong>TD</strong>A à 100 items de Goldberg est la<br />

mesure la plus communément utilisée en ce qui concerne<br />

l’utilisation de simples adjectifs [20,24,26].<br />

Pour obtenir une comparaison empirique des trois outils<br />

mesurant les « Big Five », John et al. ont résumé les réponses<br />

aux trois tests de 829 étudiants de l’université de Californie à<br />

Berkeley [25,26] qui avaient rempli le BFI, la version à 40 items<br />

élaborée par Saucier [36] du <strong>TD</strong>A de Goldberg, ainsi que le NEO PI-R<br />

de Costa et McCrae [11] à partir duquel ils ont évalué à la fois les<br />

Tableau 1<br />

Définitions et exemples d’items du BFI-Fr.<br />

Exemples d’items français Pôle<br />

E (Facteur 1)<br />

Extraversion, Énergie, Enthousiasme<br />

1. est bavard Positif (élevé)<br />

6. est réservé Négatif (bas)<br />

A (Facteur 2)<br />

A (Agréabilité, Altruisme, Affection)<br />

32. est prévenant et gentil avec presque tout le monde Positif (élevé)<br />

27. est parfois dédaigneux, méprisant Négatif (bas)<br />

C (Facteur 3)<br />

C (Conscience, Contrôle, Contrainte)<br />

3. travaille consciencieusement Positif (élevé)<br />

23. a tendance à être paresseux Négatif (bas)<br />

N (Facteur 4)<br />

Émotions Négatives, Névrosisme, Nervosité<br />

39. est facilement anxieux Positif (élevé)<br />

9. est « relaxe », détendu, gère bien les stress Négatif (bas)<br />

O (Facteur 5)<br />

Ouverture, Originalité, Ouverture d’esprit<br />

5. est créatif, plein d’idées originales Positif (élevé)<br />

41. est peu intéressé par tout ce qui est artistique Négatif (bas)<br />

Le BFI donne une note pour chacun des cinq grands facteurs qui représente la<br />

moyenne des scores. Chaque item se situe vers le pôle positif (élevé) oulepôle<br />

négatif (bas) de la dimension. Les deux pôles sont « opposés ». Certains items sont<br />

cotés àl’envers de telle sorte que chaque score moyen se trouve dans la même<br />

direction, dans la direction du nom de la dimension. BFI : Big Five Inventory ; Fr :<br />

français. Items reproduits avec permission.


486<br />

scores des 30 facettes et ceux des domaines du NEO-FFI. Si<br />

globalement les corrélations entre les trois outils étaient satisfaisantes,<br />

une étude minutieuse des résultats a reposé la signification<br />

et l’ordre d’importance des facteurs ainsi que leur dénomination.<br />

Le fait qu’il importe peu que les facteurs soient mesurés avec<br />

des adjectifs, des expressions ou des phrases d’un questionnaire<br />

suggère que les cinq grandes dimensions ont les mêmes bases<br />

conceptuelles, quel que soit l’outil utilisé, que cet outil dérive de<br />

l’approche lexicale, de l’approche par prototype ou de l’approche<br />

par questionnaire.<br />

Il existe cinq grandes dimensions de la personnalité que l’on<br />

peut répliquer et qui peuvent se résumer par un concept large de<br />

EACNO connu sous le nom de : Extraversion, Agréabilité,<br />

Conscience, émotions Négatives (Névrosisme), Ouverture. John<br />

et al. ont pris ainsi la position de ne plus dénommer les facteurs<br />

mais de leur attribuer une lettre connue sous les anagrammes<br />

OCEAN ou CANOE, l’océan ou le canoë de la personnalité, moyens<br />

mnémotechniques permettant de mémoriser les cinq facteurs. Ils<br />

réfutent aussi le chiffre romain conventionnel attribué à chaque<br />

facteur dans les analyses lexicales qui reflète l’importance relative<br />

des facteurs E (I), A (II), C (III), N (IV), O (V) et leur donne ainsi un<br />

ordre spécifique EACNO, reflet des résultats de l’analyse factorielle.<br />

Ils préfèrent, comme cela est montré dans le Tableau 1,<br />

accompagner la dénomination du facteur par sa lettre et par<br />

une série de termes explicatifs englobant ainsi l’ensemble de la<br />

définition du facteur [26] (Tableau 1).<br />

4. Conclusion<br />

La structure des « Big Five » regroupe à un haut niveau<br />

d’abstraction les points communs de la plupart des systèmes<br />

existant sur la description de la personnalité et met à disposition<br />

un modèle descriptif intégré pour des recherches sur la personnalité.<br />

Les anagrammes OCEAN ou CANOE de la personnalité résument<br />

cinq des facteurs réplicables de la description de la personnalité<br />

qui sont E (Extraversion, Énergie, Enthousiasme) ; A (Agréabilité,<br />

Altruisme, Affection) ; C (Conscience, Contrôle, Contrainte) ; N<br />

(émotions Négatives, Névrosisme, Nervosité) ; O (Ouverture,<br />

Originalité, Ouverture d’esprit).<br />

Le choix de l’outil utilisé dépend du but de l’étude envisagée. Le<br />

BFI-Fr [33] dont la traduction a été élaborée de façon à avoir des<br />

propriétés psychométriques très similaires à celles du BFI<br />

américain, par sa brièveté et sa facilité de passation, offre un outil<br />

très maniable pour évaluer rapidement de grands échantillons. Il<br />

offre aussi un inventaire rapide et fiable voire ludique pour le suivi<br />

des thérapies et rejoint ainsi les possibilités offertes par le NEO<br />

[15]. Il peut être utilisé en auto-évaluation ou en évaluation par des<br />

pairs, y compris les thérapeutes. La version adaptée aux<br />

adolescents offrira une possibilité d’utilisation au cours des<br />

évaluations des familles ou des thérapies systémiques [23,38].<br />

Conflit d’intérêt<br />

Aucun.<br />

Références<br />

[1] Allen BP, Potkay CR. On the arbitrary distinction between states and traits. J<br />

Pers Soc Psychol 1981;41:916<strong>–</strong>28.<br />

[2] Allport GW, Odbert HS. Trait-names: a psycho-lexical study. Psychol Monogr<br />

1936;47:211.<br />

[3] Benet-Martinez V, John OP. Los Cinco Grandes across cultures and ethnic<br />

groups: multitrait-multimethod analyses of the Big Five in Spanish and<br />

English. J Pers Soc Psychol 1998;75:729<strong>–</strong>50.<br />

[4] Borgatta EF. The structure of personality characteristics. Behav Sci 1964;9:<br />

8<strong>–</strong>17.<br />

O. Plaisant et al. / Annales Médico-Psychologiques 168 (2010) 481<strong>–</strong>486<br />

[5] Cattell RB. Advances in Cattellian personality theory. In: Pervin LA, editor.<br />

Handbook of personality: theory and research. New York: Guilford; 1990. p.<br />

101<strong>–</strong>10.<br />

[6] Cattell RB, Eber HW, Tatsuoka MM. Handbook for the Sixteen Personality<br />

Factor Questionnaire (16PF). Champaign, IL: IPAT; 1970.<br />

[7] Chaplin WF, John OP, Goldberg LR. Conceptions of states and traits: dimensional<br />

attributes with ideals as prototypes. J Pers Soc Psychol 1988;54:541<strong>–</strong>57.<br />

[8] Costa PT. Clinical use of the five factor model: an introduction. J Pers Assess<br />

1991;57:393<strong>–</strong>8.<br />

[9] Costa PT, McCrae RR. The NEO Personality Inventory manual. Odessa, FL:<br />

Psychological Assessment Resources; 1985.<br />

[10] Costa PT, McCrae RR. NEO PI/FFI Manual Supplement. Odessa, FL: Psychological<br />

Assessment Resources; 1989.<br />

[11] Costa PT, McCrae RR. NEO PI-R Professional Manual. Odessa, FL: Psychological<br />

Assessment Resources; 1992.<br />

[12] Costa PT, McCrae RR. Inventaire NEO PI-R adaptation française (JP Rolland).<br />

ECPA; 1998.<br />

[13] Costa PT, Widiger TA, editors. Personality disorders and the five factor model<br />

of personality. Washington, DC: American Psychological Association; 2002.<br />

[14] Digman JM, Takemoto-Chock NK. Factors in the natural language of personality:<br />

re-analysis and comparison of six major studies. Multivariate Behav Res<br />

1981;16:149<strong>–</strong>70.<br />

[15] Fioravanti M, Gough HG, Frere LJ. English, French, and Italian adjective check<br />

lists. A social desirability analysis. J Cross Cult Psychol 1981;12(4):461<strong>–</strong>72.<br />

[16] Fiske DW. Consistency of the factorial structures of personality ratings from<br />

different sources. J Abnorm Soc Psychol 1949;44:329<strong>–</strong>44.<br />

[17] Goldberg LR. Language and individual differences: the search for universals in<br />

personality lexicons. In: Wheeler L, editor. Review of personality and social<br />

psychology, vol. 2. Beverly Hills, CA: Sage; 1981 (pp. 141<strong>–</strong>65).<br />

[18] Goldberg LR. An alternative ‘‘description of personality’’: the Big-Five factor<br />

structure. J Pers Soc Psychol 1990;59:1216<strong>–</strong>29.<br />

[19] Gough HG, Heilbrun Jr AB. The Adjective Check List manual. Palo Alto, CA:<br />

Consulting Psychologists Press; 1983.<br />

[20] John OP. The ‘‘Big Five’’ factor taxonomy: dimensions of personality in the<br />

natural language and questionnaires. In: Pervin LA, editor. Handbook of<br />

personality: theory and research. New York: Guilford Press; 1990. p. 66<strong>–</strong>100.<br />

[21] John OP, Angleitner A, Ostendorf F. The lexical approach to personality: a<br />

historical review of trait taxonomic research. Eur J Pers 1988;2:171<strong>–</strong>203.<br />

[22] John OP, Donahue EM, Kentle RL. The Big Five Inventory-Versions 4a and 54.<br />

University of California/Institute of Personality and Social Research: Berkeley;<br />

1991.<br />

[23] John OP, Caspi A, Robins RW, Moffitt TE, Stouthamer-Loeber M. The ‘‘Little<br />

Five’’: exploring the nomological network of the five-factor model of personality<br />

in adolescent boys. Child Dev 1994;65:160<strong>–</strong>78.<br />

[24] John OP, Srivastava S. The Big Five trait taxonomy: history, measurement, and<br />

theoretical perspectives. In: Pervin LA, John OP, editors. Handbook of personality:<br />

theory and research. New York: Guilford; 1999. p. 102<strong>–</strong>38.<br />

[25] John OP, Soto CJ. The importance of being valid: reliability and the process of<br />

construct validation. In: Robins RW, Fraley RC, Krueger RF, editors. Handbook<br />

of research methods in personality psychology. New York: Guilford; 2007.<br />

[26] John OP, Naumann LP, Soto CJ. Paradigm shift to the integrative Big-Five trait<br />

taxonomy: history, measurement, and conceptual Issues. In: John OP, Robins<br />

RW, Pervin LA, editors. Handbook of personality: theory and research (3rd ed.).<br />

New York: Guilford 2008. 114<strong>–</strong>58.<br />

[27] Lang FR, Luedtke O, Asendorpf JB. Validity and psychometric equivalence of<br />

the German version of the Big Five Inventory in young, middle-aged and old<br />

adults. Diagnostica 2001;47:111<strong>–</strong>21.<br />

[28] Loehlin JC, McCrae RR, Costa PT, John OP. Heritabilities of common and<br />

measure-specific components of the Big Five personality factors. J Res Pers<br />

1998;32:431<strong>–</strong>53.<br />

[29] McDougall W. Of the words character and personality. J Pers 1932;1:3<strong>–</strong>16.<br />

[30] Norman WT. 2,800 personality trait descriptors: normative operating characteristics<br />

for a university population. Michigan: Department of Psychology,<br />

University of Michigan; 1967.<br />

[31] Peabody D, Goldberg LR. Some determinants of factor structures from personality-trait<br />

descriptors. J Pers Soc Psychol 1989;57:552<strong>–</strong>67.<br />

[32] Pervin LA, John OP. La personnalité : de la théorie à la recherche. De<br />

Boeck, Bruxelles; 2005.<br />

[33] Plaisant O, Courtois R, Réveillère R, Mendelsohn GA, John OP. Validation du Big<br />

Five Inventory français (inventaire des cinq grandes dimensions de la personnalité).<br />

Ann Med Psychol 2010; 168: 97<strong>–</strong>106<br />

[34] Rolland JP, Parker WD, Stumpf H. A psychometric examination of the French<br />

translations of NEO-PI-R and NEO-FFI. J Pers Assess 1998;71(2):269<strong>–</strong>91.<br />

[35] Rosch E. Principles of categorization. In: Rosch E, Lloyd B, editors. Cognition<br />

and categorization. Hillsdale, NJ: Erlbaum; 1978. p. 27<strong>–</strong>48.<br />

[36] Saucier G. Mini-Markers: a brief version of Goldberg’s unipolar Big-Five<br />

markers. J Pers Assess 1994;63:506<strong>–</strong>16.<br />

[37] Saucier G, Goldberg LR. Personnalité, caractère et tempérament : la structure<br />

translinguistique des traits. Psychol Fr 2006;51:265<strong>–</strong>84.<br />

[38] Soto CJ, John OP, Gosling SD, Potter J. The developmental psychometrics of Big<br />

Five self-reports: acquiescence, factor structure, coherence, and differentiation<br />

from ages 10 to 20. J Pers Soc Psychol 2008;94(4):718<strong>–</strong>37.<br />

[39] Thurstone LL. The vectors of mind. Psychol Rev 1934;41:1<strong>–</strong>32.<br />

[40] Tupes EC, Christal RC. Recurrent personality factors based on trait ratings. J<br />

Pers 1992;60:225<strong>–</strong>51 (réimprimé en 1992).


Texte 3<br />

Lautrey, J. (2006). Cent ans après Binet, quoi de neuf sur l’intelligence de l’enfant ? Bulletin de<br />

psychologie, 59, 133-143.


Cent ans après Binet : quoi de neuf sur l’intelligence de l’enfant ?<br />

1<br />

Jacques Lautrey 1<br />

L’année 2005 est celle du centenaire de la publication de la première version de l’échelle<br />

métrique qu’Alfred Binet et Théodore Simon ont mise au point pour évaluer le<br />

développement de l’intelligence chez l’enfant (Binet, Simon, 1905). Pour célébrer ce<br />

centenaire, la Fédération Française des Psychologues et de Psychologie (FFPP), a organisé un<br />

congrès international intitulé « L’intelligence de l’enfant : cent ans après Binet » qui s’est<br />

tenu à Paris en octobre 2005 2 et visait à faire le point sur l’état actuel des connaissances sur<br />

l’intelligence de l’enfant.<br />

Le propos du présent article est de tenter une synthèse 3 des communications présentées à<br />

ce congrès afin de dégager quelques unes des lignes de force qui sous-tendent, cent ans après<br />

Binet, l’évolution des idées sur l’intelligence de l’enfant. Le nombre et la diversité des<br />

communications présentées 4 suffiraient à dissuader toute tentative de synthèse exhaustive<br />

mais celle-ci est de toute façon rendue impossible par le fait que les symposia et certaines des<br />

conférences se déroulaient en parallèle. Comme chacun des participants, l’auteur de ces lignes<br />

n’a pu assister qu’à un symposium sur quatre et à une conférence semi-plénière sur deux. La<br />

synthèse qui suit est donc très partielle et forcément partiale.<br />

Puisqu’à l’origine de ce congrès il y avait la volonté de célébrer le centenaire de la<br />

publication de l’échelle métrique de l’intelligence de Binet et Simon, commençons par ce qui<br />

s’est dit de l’histoire de cette invention. Deux points ressortent plus particulièrement de la<br />

conférence que Michel Huteau (Conservatoire National des Arts et Métiers) a consacrée à<br />

cette question, d’une part la rupture créée par les idées de Binet avec la conception de<br />

l’intelligence de l’enfant qui était dominante à l’époque, d’autre part la faiblesse de l’impact<br />

que l’échelle métrique a eu en France, par rapport à celui qu’elle a eu dans le reste de<br />

l’Europe et surtout aux États-Unis. À la fin du XIXe siècle, la théorie dominante sur le<br />

1 Professeur émérite à l’Université Paris 5-René Descartes, Centre Henri Piéron, 71 Avenue Edouard Vaillant, 92<br />

774 Boulogne-Billancourt. Courriel : jacques.lautrey@psycho.univ-paris5.fr<br />

2 Ce congrès, qui a réuni 1225 participants et 85 conférenciers, s’est tenu du 6 au 8 octobre 2005 au Palais de la<br />

Mutualité sous le haut patronage du ministère de l’Education et de la Recherche et du ministère de la Santé, avec<br />

le soutien de la Fédération européenne des associations de psychologues et de l’Association américaine de<br />

psychologie.<br />

3 Cet article reprend la synthèse présentée dans la conférence de clôture du congrès.<br />

4 une vingtaine de conférences plénières ou semi-plénières et une cinquantaine de communications dans des<br />

symposia ou des tables rondes ont été présentées et elles ont porté sur des thèmes relevant aussi bien de la<br />

pratique de l’évaluation de l’intelligence que de la recherche fondamentale dans ce domaine.


fonctionnement de l’intelligence était l’associationnisme : la pensée était supposée procéder<br />

de l’association d’images et les images étaient supposées procéder de l’association de<br />

sensations. Wundt adhérait à cette théorie associationniste et le principe sur lequel il avait<br />

fondé la psychologie expérimentale était qu’à l’instar de la physique, la psychologie<br />

scientifique devait aborder l’étude des phénomènes psychiques complexes en les<br />

décomposant en éléments plus simples et en commençant par l’étude de ces éléments. Ceci<br />

explique que les premières tentatives de mesure de l’intelligence, celles de Galton et de<br />

Cattell, aient été focalisées sur la mesure de sensations. Si les sensations étaient les briques<br />

avec lesquelles se construisait l’intelligence, l’efficacité de cette dernière devait en somme<br />

être déterminée par la qualité des briques.<br />

Binet, qui avait d’ailleurs lui-même adhéré à l’associationnisme auparavant, a rompu avec<br />

cette conception à la fois sur le rôle des images, et sur celui des sensations. Sur le premier<br />

point, il a contribué à montrer qu’il y a une pensée sans images et a suggéré que l’origine de<br />

la pensée était plutôt à chercher dans l’activité du sujet. Selon Michel Huteau, ce point de vue<br />

préfigurait le rôle que Piaget a plus tard donné à l’action dans la construction de la pensée<br />

logique, et il a rappelé à cette occasion que Piaget a mis en oeuvre les méthodes d'étude de<br />

l'intelligence de Binet lors de son séjour à Paris de 1919 à 1921. Sur le second point, Binet a<br />

très tôt affirmé (voir Binet, Henri, 1895) que la mesure de l’intelligence devait s’appuyer sur<br />

l’étude des différences d’efficience observées dans les processus supérieurs plutôt que dans<br />

des processus aussi élémentaires que les sensations, comme le faisaient Galton et Cattell à<br />

cette époque. L’échelle métrique était l’application de ces idées à la mesure de l’intelligence.<br />

Pourquoi le Binet-Simon n’a-t-il pas eu en France l’impact qu’il a eu aux États-Unis où en<br />

quelques années il a donné naissance au mouvement des tests ? Plusieurs raisons ont pu jouer<br />

et Michel Huteau en a évoqué quelques unes. Parmi celles-ci le décès prématuré de Binet bien<br />

sûr, l’année même de la publication de la troisième version de son test (Binet, 1911).<br />

L’absence de disciples aussi, qui n’était sans doute pas étranger à son caractère indépendant.<br />

Mais un des facteurs les plus décisifs a sans doute été la froideur de l’accueil fait à l’échelle<br />

métrique par les expérimentalistes. La communauté des expérimentalistes était en fait très<br />

restreinte et se concentrait dans le laboratoire de Villejuif, dirigé par Edouard Toulouse, dont<br />

les assistants étaient Henri Piéron et Nicolas Vaschide. Cette équipe travaillait aussi à la mise<br />

au point de techniques de mesure de l’intelligence mais restait encore très attachée à<br />

l’approche associationniste et élémentiste défendue par Wundt (Toulouse, Vaschide, Piéron,<br />

1904). Même si Piéron s’est mis, lui aussi, avec certes un certain retard sur Binet, à<br />

l’évaluation des processus supérieurs, il est par contre toujours resté réticent vis-à-vis de la<br />

2


notion d’intelligence globale. Il concevait les aptitudes comme multiples et indépendantes, ce<br />

qui lui a plus tard fait trouver beaucoup plus d’intérêt à la conception multi-factorielle de<br />

l’intelligence défendue par Thurstone qu’à la notion de QI ou à celle de facteur général. Or,<br />

Comme l’a rappelé Michel Huteau, c’est Piéron qui s’est trouvé par la suite en position de<br />

développer la psychologie scientifique en France. Le désaccord qui l’opposait à Binet sur les<br />

méthodes d’évaluation de l’intelligence est probablement une des raisons du manque de<br />

reconnaissance de la communauté de psychologie scientifique française envers le Binet-<br />

Simon (voir Huteau, 2001, sous presse).<br />

Il était donc important que le centenaire de l’échelle métrique soit célébré en France et ce<br />

congrès international a été une excellente occasion de manifester à l’œuvre de Binet sur<br />

l’intelligence de l’enfant, une reconnaissance qui lui a longtemps été assez chichement<br />

mesurée dans son propre pays.<br />

La synthèse qui suit est articulée autour de quelques évolutions majeures dans les idées<br />

sur l’intelligence qui m’ont paru se dégager des communications présentées au congrès.<br />

DES PROCESSUS SUPÉRIEURS AUX PROCESSUS EXÉCUTIFS<br />

Binet a varié dans la liste des processus supérieurs qui lui paraissaient sous-tendre<br />

l’intelligence. Il a par exemple cité la mémoire, l’imagination, l’attention, la faculté de<br />

comprendre (Binet, Henri, 1895) ; le bon sens, le sens pratique, l’initiative, la faculté de<br />

s’adapter (Binet, Simon, 1905) ; la compréhension, l’invention, la direction, la censure (Binet,<br />

1909). Il n’a par contre jamais varié dans l’idée que l’explication des différences d’efficience<br />

intellectuelle devait être recherchée à ce niveau. Cette idée est manifestement encore<br />

d’actualité, à ceci près que les processus supérieurs auxquels on s’intéresse maintenant sont<br />

les processus exécutifs, ceux qui se trouvent au sommet d’une organisation hiérarchique du<br />

fonctionnement cognitif et assurent le contrôle des autres processus cognitifs. Selon les cadres<br />

théoriques de référence, il s’agit des processus responsables de la capacité de la mémoire de<br />

travail, de la capacité attentionnelle, de la puissance mentale, ou de la métacognition. Une<br />

nette convergence s’est manifestée sur ce point au cours du congrès.<br />

Dans le cadre de la perspective développementale, Juan Pascual-Leone (Université de<br />

Toronto) a présenté l’état actuel de sa théorie neo-piagétienne du développement de<br />

l’intelligence. Celle-ci met l’accent sur un système central de gestion attentionnelle dont les<br />

principaux opérateurs sont celui de puissance mentale, M, qui définit le nombre de schèmes<br />

pouvant être activés simultanément, celui d’inhibition, I, qui permet d’interrompre l’exécution<br />

3


de schèmes non pertinents, et E, celui des schèmes exécutifs qui définissent les buts et<br />

allouent les ressources d’activation aux autres opérateurs. On retrouve cette idée de ressource<br />

centrale limitée, dont la capacité s’accroît avec le développement, dans les autres théories<br />

neo-piagetiennes qui ont été présentées par Anik de Ribaupierre (Université de Genève). Cette<br />

ressource centrale correspond à l’empan de la mémoire de travail dans la théorie de Robbie<br />

Case, ou au niveau optimal dans la théorie de Kurt Fischer. Toutes les théories neopiagetiennes<br />

ont en commun de lier le développement cognitif à l’accroissement de cette<br />

capacité cognitive centrale. Une vue d’ensemble de ce courant de recherche peut être trouvée<br />

dans un ouvrage collectif (Demetriou, Shayer, Efklides, 1988) et dans une discussion critique<br />

de son évolution plus récente (Ribaupierre, 1997).<br />

Dans le cadre de l’étude neuropsychologique du développement de la pensée logique,<br />

Olivier Houdé (Université Paris 5) a lui aussi mis l’accent sur le rôle central des processus<br />

exécutifs responsables de l’activation et de l’inhibition dont le siège est situé dans les aires du<br />

cortex préfrontal (Houdé, 2005). Les travaux d’imagerie cérébrale de Duncan et<br />

collaborateurs vont dans le même sens en montrant que ce sont principalement les aires du<br />

cortex préfrontal qui sont activées lorsque des sujets résolvent des tests saturés par le facteur<br />

général d’intelligence fluide (Duncan, Seitz et coll., 2000).<br />

Dans le cadre de l’approche expérimentale et de l’approche différentielle maintenant, les<br />

travaux actuels sur la mémoire de travail présentés par Thierry Lecerf (Université de Genève)<br />

montrent que celle-ci explique une grande partie de la variance du facteur d’intelligence<br />

fluide, tel qu’il est mis en œuvre dans des épreuves comme les matrices progressives de<br />

Raven (Conway, Cowan et coll., 2002 ; Engle, Tuholski et coll., 1999). Pour ces auteurs, la<br />

mémoire de travail (MT) correspond aux éléments activés de la mémoire à long terme et son<br />

empan renseigne sur la capacité attentionnelle maximale susceptible s’être mise en œuvre<br />

pour maintenir l’activation de ces éléments.<br />

Peut-on donc conclure que le facteur général d’intelligence fluide, qui est le plus proche<br />

du facteur général d’intelligence, correspond à la capacité de la mémoire de travail ? Oui pour<br />

une bonne part, c’est une des conclusions que l’on peut tirer des travaux présentés à ce<br />

congrès. Mais il faut aussitôt se demander si la notion de mémoire de travail n’est pas aussi<br />

globale que la notion d’intelligence. Dès que l’on commence à analyser plus avant les<br />

processus en jeu dans la mémoire de travail, on est amené à distinguer, par exemple, les<br />

processus de commutation, de mise à jour, et d’inhibition (Miyake, Friedman et coll., 2000).<br />

Or les corrélations entre ces différents processus ne sont pas très fortes. En outre, si on pousse<br />

plus loin l’analyse d’un des ces processus, par exemple celle du processus d’inhibition, il faut<br />

4


alors au moins distinguer une forme d’inhibition qui correspond à la résistance à<br />

l’interférence de distracteurs et une autre qui correspond à la résistance à l’interférence pro-<br />

active et, à nouveau, elles sont peu liées entre elles (Friedman, Miyake, 2004). De même faut-<br />

il faire des distinctions entre l’efficience dans les épreuves de MT verbale, de MT spatiale, et<br />

de MT numérique (Mackintosh, Bennett, 2003).<br />

De fait, l’analyse factorielle d’un ensemble de tâches cernant les différents processus et<br />

les différents contenus de la MT fait apparaître une structure factorielle hiérarchique très<br />

similaire à celle qu’on obtient pour l’intelligence, avec un facteur général de MT et des<br />

facteurs de groupe. Et c’est en fait le facteur général de mémoire de travail qui corrèle<br />

fortement avec le facteur général d’intelligence (Süss, Oberauer et coll., 2002). A-t-on<br />

beaucoup avancé en remplaçant un concept aussi global que celui d’intelligence par un<br />

concept aussi global que celui de mémoire de travail ? L’avenir le dira. La progression ne se<br />

confirmera que si on se montre capable de modéliser la façon dont les différents processus en<br />

jeu dans la mémoire de travail s’orchestrent pour rendre compte de la performance globale.<br />

Dans l’état actuel de l’art, on sait évaluer directement la performance globale, on sait aussi<br />

isoler les processus plus élémentaires qui interviennent dans cette performance globale, mais<br />

on ne sait pas modéliser la façon dont tous ces processus s’assemblent pour aboutir à cette<br />

performance globale. On oscille donc entre une approche globale et une approche élémentiste,<br />

sans savoir comment les relier car sans doute faudrait-il avoir d’autres modèles du<br />

fonctionnement cognitif, plus systémiques, pour pouvoir articuler ces deux vues partielles.<br />

Wechsler disait que l’intelligence est dans l’orchestration or, pour filer la métaphore, nous<br />

savons comment marche chacun des instruments considéré isolément et nous savons apprécier<br />

si le produit global du jeu de l’orchestre est plus moins harmonieux, mais nous ne<br />

comprenons pas comment se fait l’orchestration dans un système qui ne comporte pas de chef<br />

d’orchestre. Le point suivant suggère peut-être quelques pistes.<br />

DES MODÈLES STATIQ<strong>UE</strong>S AUX MODÈLES DYNAMIQ<strong>UE</strong>S DE L’INTELLIGENCE<br />

Les modèles de l’intelligence ont longtemps été statiques. C’est le cas de la structure<br />

factorielle de l’intelligence. C’est aussi le cas des structures opératoires dans la théorie de<br />

Piaget. Dans ce dernier cas, c’est le modèle de l’équilibration qui avait pour fonction de<br />

rendre compte de la dynamique de la construction cognitive, mais il n’a pas paru apporter une<br />

modélisation testable des mécanismes de transition entre les différents états décrit pas les<br />

structures opératoires.<br />

5


Une évolution notable dans le champ du développement cognitif est la montée en<br />

puissance d’approches qui visent à modéliser la dynamique du changement développemental<br />

et qui incluent donc la flèche du temps dans leur formalisation. C’est en particulier le cas des<br />

modèles connexionnistes et des modèles de systèmes dynamiques non linéaires. Les uns et les<br />

autres donnent une large place aux mécanismes d’auto-organisation dans l’explication du<br />

développement cognitif. Deux ouvrages ont particulièrement cristallisé et théorisé ces<br />

évolutions. Pour la modélisation connexionniste du développement, « Rethinking Innateness »<br />

(Elman, Bates, et coll., 1996) et pour l’approche des systèmes dynamiques, « A dynamic<br />

systems approach to the development of cognition and action », (Thelen, Smith, 1994). La<br />

vitalité de ces courants de recherche est attestée par la publication en 2003 d’un numéro<br />

spécial de la revue « Developmental Science » qui leur était consacré.<br />

Plusieurs des conférences présentées à de ce congrés s’inscrivaient dans ce courant, celles<br />

d’Annette Karmiloff et d’Ulman Lindenberger pour la modélisation connexionniste et celle de<br />

Paul van Geert pour la modélisation de systèmes dynamiques. Quel est l’intérêt de ces<br />

approches ?<br />

L’un des apports est évidemment de permettre de simuler le processus de changement luimême.<br />

Ces simulations fonctionnent par itérations : à chaque pas, l’état du système est calculé<br />

en fonction de son état au pas précédent. La flèche du temps est ainsi incluse dans le modèle.<br />

Un autre apport de ces modélisations est de démontrer que des processus d’auto-organisation<br />

assez simples ont le pouvoir de provoquer des changements qui ressemblent à certains des<br />

changements observés dans les processus d’apprentissage ou de développement. Les<br />

possibilités d’expérimentation virtuelle qu’offre la simulation sont aussi appréciables. Par<br />

exemple, ce que peut apprendre un réseau connexionniste dépend de sa structure initiale,<br />

c’est-à-dire du nombre d’unités d’entrée, du nombre d’unités de sortie, du nombre d’unités<br />

dans la couche interne, de l’architecture des connexions entre ces unités, des algorithmes de<br />

propagation de l’activation entre ces unités, etc. Les méthodes de simulation permettent de<br />

jouer sur tous ces paramètres pour en voir les conséquences sur le développement. Elles<br />

permettent ainsi d’expérimenter, par exemple, sur les conséquences de telle ou telle<br />

modification de l’état initial pour le développement ultérieur. C’est en ce sens que, pour<br />

reprendre le titre de l’ouvrage « Rethinking innateness », la simulation offre une voie<br />

intéressante pour « repenser l’innéité ».<br />

C’est dans cet esprit qu’Annette Karmiloff (Institut de la santé de l’enfant de Londres),<br />

une des co-signataires de cet ouvrage, s’est appuyée sur la modélisation connexionniste pour<br />

repenser la modularité de l’esprit. Selon elle, il n’est pas nécessaire que des réseaux<br />

6


neuronaux soient déjà spécifiques à certains domaines de connaissance à la naissance pour<br />

pouvoir expliquer l’existence de modules spécialisés à l’état adulte. Il suffit que les réseaux<br />

neuronaux aient une architecture appropriée aux caractéristiques de l’information relative à un<br />

domaine pour qu’ils l’emportent dans la compétition avec d’autres réseaux neuronaux pour<br />

prendre ce domaine en charge. Mais si le réseau neuronal le plus approprié à un domaine de<br />

connaissance n’est pas fonctionnel ou n’est pas suffisamment fonctionnel, d’autres moins<br />

appropriés peuvent y suppléer, même s’ils remplissent moins bien la même fonction. Si cette<br />

hypothèse est exacte, la dynamique développementale de ces phénomènes de suppléance doit<br />

avoir pour conséquence que les pathologies entraînées par la lésion d’un réseau neuronal chez<br />

le bébé ou chez le jeune enfant, ne sont pas de même nature que les pathologies entraînées par<br />

la même lésion chez l’adulte.<br />

Dans sa conférence, Annette Karmiloff-Smith a étayé ce point de vue en donnant<br />

plusieurs exemples d’études dans lesquelles elle a pu montrer que chez des enfants dont<br />

certains réseaux neuronaux présentent des altérations d’origine génétique, l’information<br />

habituellement traitée par ces réseaux est prise en charge par d’autres processus. Par exemple,<br />

les enfants qui présentent le syndrome de Williams, une pathologie d’origine génétique dans<br />

laquelle le traitement du langage est relativement préservé alors que le traitement de<br />

l’information spatiale est très déficitaire, parviennent pourtant à construire <strong>–</strong> avec retard <strong>–</strong> la<br />

notion de cardinalité du nombre mais en s’appuyant pour cela sur le langage là où les autres<br />

enfants s’appuient sur un traitement visuo-spatial des objets à dénombrer (Ansari, Donlan et<br />

coll., 2003).<br />

On reproche parfois à l’approche connexionniste du développement de ne modéliser que<br />

de petites tâches spécifiques, comme la tâche de la balance ou la conjugaison des verbes au<br />

temps passé, mais d’échouer à rendre compte de caractéristiques générales du développement<br />

qui soient transversales aux différentes tâches et domaines. La conférence d’Ulman<br />

Lindenberger (Institut Max-Planck de Berlin pour le développement humain) a apporté un<br />

contre-exemple. En collaboration avec Shu Chen Li, ce chercheur a proposé un modèle<br />

connexionniste qui simule un certain nombre de caractéristiques générales du vieillissement.<br />

On sait qu’avec le vieillissement, on observe une baisse moyenne des performances<br />

cognitives, une dédifférenciation des aptitudes et une augmentation des différences<br />

individuelles. Pour simuler le vieillissement d’un réseau de neurones, Lindenberger, Li,<br />

Brehmer, (2002) ont simplement diminué le paramètre de gain, c’est-à-dire la pente de la<br />

fonction logistique qui, pour chaque neurone du réseau, relie le niveau d’activation reçu en<br />

entrée au niveau d’activation produit en sortie. Lorsque la pente de cette fonction est élevée,<br />

7


de petites différences d’activation en entrée, autour de la zone du seuil de réaction du neurone,<br />

provoquent de grandes différences d’activation en sortie, ce qui permet des discriminations<br />

nettes entre les entrées. Lorsque la pente de cette fonction est plus réduite, les petites<br />

variations en entrée sont moins bien discriminées et il y a plus de bruit dans les activations en<br />

sortie. En présentant diverses tâches d’apprentissage à deux groupes de réseaux neuronaux,<br />

l’un constitué de réseaux dits « jeunes » (paramètre de gain fixé à des valeurs hautes chez les<br />

différents individus) et l’autre de réseaux dits « vieux » (paramètre de gain fixé à des valeurs<br />

basses), Li et Lindenberger montrent la manipulation de ce seul paramètre reproduit les trois<br />

effets observés dans le vieillissement cognitif humain : baisse du niveau moyen des<br />

performances, dédifférenciation des aptitudes (c’est-à-dire augmentation des corrélations<br />

entre les performances dans les différentes tâches), et augmentation des différences<br />

individuelles. Reste bien sûr à interpréter ce paramètre, à trouver à quoi il peut correspondre<br />

dans les réseaux de neurones réels. L’hypothèse des auteurs est que cette diminution dans la<br />

pente de réaction de chacun des neurones du réseau pourrait correspondre à une baisse de la<br />

concentration en neurotransmetteurs dopaminergiques avec l’âge. Quelle que soit<br />

l’interprétation, le point intéressant dans ce type de modélisation est de montrer comment des<br />

propriétés générales du fonctionnement cognitif peuvent être distribuées sur l’ensemble du<br />

réseau.<br />

L’approche des systèmes dynamiques est une autre manière de modéliser l’autoorganisation<br />

d’un système. Ses principes généraux et quelques exemples ont été présentés par<br />

Paul van Geert (Université de Groningen) dans le symposium sur les théories actuelles de<br />

l’intelligence. Le comportement est ici vu comme le produit d’une assemblée souple de<br />

composantes qui interagissent et forment donc un système. Par rapport aux réseaux<br />

neuronaux, les composantes sont ici plus molaires et elles incluent aussi bien des éléments de<br />

l’organisme, processus neuronaux ou parties du corps, que des éléments de l’environnement<br />

dans lequel cet organisme évolue. C’est tout cet ensemble qui constitue le système et<br />

contribue à son évolution. On a donc affaire à une conception en général plus contextualiste<br />

du fonctionnement cognitif qu’avec les réseaux neuronaux. Le temps est ici aussi une<br />

composante essentielle de la modélisation, puisque l’état de chacune des composantes au<br />

moment t est fonction de son état et de l’état de toutes les autres composantes à l’état t − 1 et<br />

influence ce que sera son état et celui de toutes les autres composantes à l’état t + 1, etc. Sans<br />

entrer davantage dans les caractéristiques de ce type de modèles on peut souligner plus<br />

particulièrement deux de leurs apports à l’évolution des représentations du développement<br />

cognitif.<br />

8


L’un est de contribuer à faire évoluer le statut épistémologique des variations en<br />

psychologie (van Geert, van Dijk, 2002). Celles-ci ne sont pas considérées comme des<br />

bizarreries gênantes à neutraliser, mais comme la source même de la dynamique du système.<br />

Les variations intra-individuelles, les phases d’instabilité, sont essentielles pour permettre<br />

aux composantes du système de se désassembler, de s’ajuster différemment, pour évoluer<br />

vers un nouvel attracteur et s’y stabiliser dans des assemblages différents. Les degrés de<br />

liberté qui existent dans la nature des différentes composantes susceptibles de s’assembler<br />

pour remplir une certaine fonction adaptative sont aussi à l’origine de variations<br />

interindividuelles dans les trajectoires conduisant à un même attracteur ou même dans le type<br />

d’attracteur vers lequel le système évolue.<br />

Un autre apport important est de mettre l’accent sur la dynamique que provoquent les<br />

interactions entre les différents processus de traitement d’une part et entre ces processus de<br />

traitement et les éléments du contexte d’autre part. Pour illustrer cet aspect des modèles<br />

dynamiques, Paul van Geert a simulé sur ordinateur et montré sur écran au cours de sa<br />

conférence, les effets de la manipulation de différents paramètres de l’interaction entre<br />

composantes du système cognitif sur la courbe de développement. Par exemple la<br />

manipulation des poids respectifs de l’intelligence fluide et de l’intelligence cristallisée dans<br />

l’hypothèse d’une relation de support mutuel entre ces deux formes d’intelligence au cours du<br />

développement, ou encore la manipulation de l’écart entre le niveau de développement requis<br />

par l’enseignant et celui auquel se situe l’élève. Dans ce second exemple, les effets sur la<br />

courbe de développement faisaient clairement ressortir l’existence d’un optimum dans<br />

l’ampleur de cet écart, optimum qu’il est tentant d’assimiler à ce que Vygotski appelait la<br />

zone proximale de développement.<br />

Une conception dynamique du développement de l’intelligence caractérisait aussi des<br />

communications qui s’appuient sur d’autres cadres théoriques que les modélisations évoquées<br />

ci-dessus. En plaçant le développement de l’intelligence à l’interface entre affectivité et<br />

cognition et en cherchant à articuler psychanalyse et psychologie cognitive pour comprendre<br />

le fonctionnement de cette interface, Bernard Golse (service de psychopathologie de l’enfant à<br />

l’hôpital Necker) a mis l’accent sur le rôle crucial joué par la dynamique des interactions entre<br />

modalités perceptives, ou entre l’enfant et son environnement. Un des exemples développés<br />

est celui du rôle de la dynamique de l’accordage affectif entre le bébé et sa mère, dynamique<br />

dont les caractéristiques (par exemple la rapidité des réactions) formeraient la base de la<br />

représentation que se fait le bébé de l’état affectif de sa mère. Un autre exemple est le rôle que<br />

9


joue, dans la qualité de la co-construction des capacités d’attention, la dynamique des<br />

interactions entre le bébé et sa mère dans les situations d’attention conjointe.<br />

DE LA FIXITÉ À LA PLASTICITÉ DU SYSTÈME COGNITIF<br />

Les marges de variation du système cognitif d’une personne ont longtemps été<br />

considérées comme assez rigidement déterminées par les contraintes qu’exercent les<br />

différents déterminants de l’organisation cérébrale, que ceux-ci soient d’ordre génétique,<br />

neurobiologique, ou processuel. Un des enseignements que l’on peut tirer de ce congrès est<br />

qu’on trouve à tous ces niveaux beaucoup plus de plasticité qu’on ne le pensait.<br />

Au niveau génétique<br />

Commençons par le niveau de déterminisme qui se trouve le plus en amont du système<br />

cognitif, celui qui peut être attribué au patrimoine génétique. Un point de départ intéressant<br />

est le paradoxe apparent entre les résultats dont Michèle Carlier (Université de Provence) a<br />

fait état, à propos des pathologies de la cognition d’origine génétique, et certains de ceux que<br />

Pierre Roubertoux (CNRS, Université de la Méditerranée) a évoqués à propos de la recherche<br />

des gènes associés aux différences de QI. Michèle Carlier a donné plusieurs exemples de<br />

pathologies dans lesquelles une anomalie au niveau d’un seul gène peut affecter tout ou partie<br />

du fonctionnement cognitif, ce qui montre à l’évidence le rôle déterminant du génome dans la<br />

cognition. Par ailleurs, Pierre Roubertoux a indiqué que, jusqu’ici, on n’a pu trouver aucun<br />

gène spécifiquement associé aux différences de QI dans la marge de variation normale. Ce<br />

dernier résultat ne pouvant évidemment pas être interprété comme une absence d’implication<br />

des gènes dans la cognition, il suggère que c’est au niveau du système génétique qu’il faut<br />

chercher l’influence exercée par le patrimoine génétique sur des indicateurs aussi globaux que<br />

le QI.<br />

Ceci est à rapprocher des informations que la génétique moléculaire a apportées sur le<br />

fonctionnement du système génétique. Deux des informations tirées de la conférence de<br />

Pierre Roubertoux sont particulièrement importantes pour comprendre le caractère systémique<br />

des mécanismes génétiques. D’une part, l’expression d’un gène dépend des interactions qu’il<br />

entretient avec les autres gènes (épistasie). D’autre part, l’expression d’un gène est aussi<br />

fonction des caractéristiques de l’environnement dans lequel il se trouve. Autrement dit, les<br />

gènes sont certes invariants, mais l’expression de chacun d’entre eux est fonction de<br />

l’environnement dans lequel il se trouve, le terme environnement étant ici pris au sens large et<br />

10


incluant les produits des autres gènes (types de protéines) et les milieux plus ou moins<br />

distants dans lesquels ils s’expriment (Carlier, Roubertoux, 2005 ; Roubertoux, 2004).<br />

Ces deux propriétés font que l’expression des gènes est le produit d’un système dont la<br />

plasticité a été sous-estimée.<br />

Au niveau neurobiologique<br />

L’architecture neuronale est aussi plus plastique qu’on ne le pensait. Quelques exemples<br />

de cette plasticité ont été donnés dans la conférence de Scania de Schonen (CNRS, Université<br />

de Paris 5). Chez le bébé, les réseaux neuronaux qui traitent les visages sont en place dès trois<br />

mois. Bien qu’ils ne soient pas spécialisés au départ dans la reconnaissance de tel ou tel type<br />

de visage (par exemple asiatique ou caucasien), ces réseaux se spécialisent rapidement par un<br />

phénomène de restriction. Les connexions neuronales qui sont régulièrement sollicitées se<br />

maintiennent, tandis que celles qui ne le sont pas disparaissent. Ainsi, la capacité de faire des<br />

distinctions fines dans la reconnaissance d’un certain type de visage (par exemple le type de<br />

visage caucasien pour les enfants européens) s’accompagne de la disparition de la capacité de<br />

faire des distinctions équivalentes dans le type de visage auquel les enfants ne sont pas<br />

exposés (visages asiatiques dans cet exemple). Ce phénomène de restriction est déjà sensible à<br />

trois mois, mais à cet âge, il est encore réversible si l’enfant est exposé régulièrement à un<br />

autre type de visages que celui auquel il a été habitué. Par contre, après trois ans, il n’est<br />

pratiquement plus réversible. C’est du moins ce que l’on a longtemps pensé, mais on a<br />

récemment trouvé un renversement des effets chez des enfants qui avaient été adoptés après 5<br />

ans, ce qui tend à montrer que la plasticité neuronale est plus importante qu’on ne l’avait cru.<br />

Les cas de réorganisation des circuits neuronaux après des lésions ou du fait d’un exercice<br />

intensif vont dans le même sens. Les méthodes d’imagerie cérébrale ont permis de voir, par<br />

exemple, que les aires motrices correspondant aux doigts de la main gauche sont beaucoup<br />

plus étendues chez les violonistes professionnels que chez des violonistes amateurs (Elbert,<br />

Pantev, et coll., 1995), ou que les aires normalement dévolues à la mémoire épisodique sont<br />

recrutées par l’activité de calcul mental chez un calculateur prodige (Pesenti, Zago, et coll.,<br />

2001). On a aussi longtemps pensé que l’adulte ne formait plus de nouveaux neurones or<br />

l’existence d’une neurogenèse dans le cerveau adulte du primate a été récemment prouvée et<br />

ce phénomène a aussi été démontré chez l’homme par la culture de cellules pluripotentes<br />

prélevées dans plusieurs régions du cerveau. Bien que ces nouveaux neurones soient peu<br />

nombreux chez l’adulte et que l’on connaisse encore mal leur fonction, ils pourraient jouer un<br />

rôle dans l’apprentissage et la mémoire en contribuant à moduler les circuits existants (Gross,<br />

11


2000). Ces différents exemples montrent que la plasticité de l’architecture neuronale est elle<br />

aussi plus importante qu’on ne l’avait supposé.<br />

Au niveau processuel<br />

Une même comportement peut être obtenu en mobilisant des processus de traitement<br />

différents et donc des circuits neuronaux différents chez des sujets différents. Ces<br />

phénomènes de vicariance, de redondance, ont déjà été illustrés plus haut dans le cas de<br />

pathologies, avec l’exemple de vicariance dans la construction de la notion de cardinalité chez<br />

des enfants présentant le syndrome de williams (Ansari, Donlan et coll., 2003). Ces<br />

phénomènes de vicariance sont également présents et jouent un rôle fondamental dans le<br />

fonctionnement cognitif normal (Lautrey, 2002, 2003 ; Reuchlin, 1978).<br />

En résumé, la plasticité du comportement, qui est le meilleur indicateur de l’intelligence,<br />

implique la plasticité des processus cognitifs, qui elle-même implique la plasticité des réseaux<br />

neuronaux, qui elle-même implique une certaine plasticité de l’expression du système<br />

génétique…. L’intelligence s’accommode mal de déterminismes aussi rigides que ceux que<br />

l’on a longtemps supposé s’exercer à ces différents niveaux.<br />

DE LA COGNITION FROIDE À LA COGNITION CHAUDE<br />

La cognition a longtemps été considérée comme suffisamment autonome pour être étudiée<br />

indépendamment d’aspects plus « chauds » du fonctionnement psychique comme l’émotion,<br />

l’affectivité, la personnalité. Le dualisme cartésien, mais sans doute aussi, plus récemment, le<br />

rôle joué par la métaphore de l’ordinateur dans les débuts de la psychologie cognitive, ont<br />

contribué à entretenir cet isolationnisme. Sur ce point aussi, les idées ont évolué et les<br />

recherches qui tentent d’intégrer le chaud et le froid dans le fonctionnement cognitif sont de<br />

plus en plus nombreuses. Plusieurs communications ont traité de la façon dont l’émotion,<br />

l’affectivité ou la personnalité interviennent dans la cognition.<br />

Dans le domaine de la neuropsychologie, la recherche sur les relations entre émotion et<br />

cognition a connu un regain d’intérêt dans la période récente, notamment avec les travaux de<br />

Damasio (1995). On connaît mieux maintenant les aires cérébrales impliquées dans cette<br />

relation. Le cortex préfrontal ventromédian semble être le lieu privilégié de l’interface entre<br />

le système limbique, qui est le centre des émotions, et le cortex frontal dorsolatéral qui est<br />

impliqué dans les fonctions exécutives (mémoire de travail, gestion de l’attention,<br />

planification). Les études de cas de lésion du cortex préfrontal ventromédian chez l’adulte ont<br />

12


montré que ces lésions affectaient la planification et la décision, surtout dans les domaines<br />

que l’on peut qualifier de personnel et de social. Le raisonnement sur des questions abstraites<br />

n’est pas touché mais la capacité à planifier son propre avenir, à se conduire en fonction des<br />

règles sociales, sont gravement affectées. Scania de Schonen (CNRS, Université de Paris 5) a<br />

fait état de deux cas d’enfants chez qui une lésion du cortex frontal ventro-médian est<br />

survenue dans les premiers mois de la vie et qui ont été suivis par Damasio. Les<br />

comportements observés quelques années après correspondaient d’assez près à ceux observés<br />

chez les adultes (impulsivité, absence d’anticipation des conséquences de ses propres actions,<br />

insensibilité aux punitions, comportements d’amassement, mais réussite scolaire normale).<br />

En dehors de la contribution de Bernard Golse, déjà évoquée plus haut, la question des<br />

relations entre affectivité et cognition a aussi été abordée dans le symposium « Clinique et<br />

pratiques de l’examen psychologique ». Anne Andronikof (Université de Paris 10) a rapporté<br />

à ce sujet une étude dans laquelle les seules différences observées entre des groupes contrastés<br />

sur la performance scolaire avaient trait à la relation à soi (investissement de soi, capacité à se<br />

critiquer, etc.). Selon elle, le soi serait le noyau de la relation entre l’affect et la cognition.<br />

Certaines des recherches sur les relations entre cognition et personnalité, présentées par<br />

Pierre-Yves Gilles(Université de Provence) dans le symposium « Intelligence de la mesure »,<br />

donnent des résultats qui semblent aller dans le même sens. C’est dans ce cas l’auto-<br />

évaluation de ses propres capacités cognitives qui semble être le maillon intermédiaire dans la<br />

relation entre certains facteurs de la personnalité et la cognition.<br />

En résumé, le climat est manifestement au réchauffement de la cognition.<br />

DE L’INTELLIGENCE UNIDIMENSIONNELLE À L’INTELLIGENCE<br />

MULTIDIMENSIONNELLE<br />

Existe-t-il une intelligence ou des intelligences ? Ce débat a commencé, il y a bien<br />

longtemps, avec la controverse qui opposait Spearman, partisan d’un facteur général<br />

d’intelligence, à Thurstone, partisan de facteurs multiples correspondant à des aptitudes<br />

primaires indépendantes. Il a fallu quelques temps avant de réaliser que ces deux modèles<br />

factoriels n’étaient pas incompatibles et pouvaient être intégrés dans un modèle hiérarchique<br />

comportant des facteurs de niveaux de généralité différents : des facteurs primaires corrélés<br />

entre eux, et des facteurs de niveau hiérarchique supérieur rendant compte de la corrélation<br />

entre les facteurs primaires. Néanmoins, la controverse a continué, car certains trouvaient trois<br />

étages et un seul facteur général (Burt et Vernon), tandis que d’autres trouvaient deux étages<br />

13


et plusieurs facteurs généraux (Cattell et Horn). Un consensus a finalement été trouvé autour<br />

du modèle de Carroll, qui est un modèle hiérarchique à trois étages et un seul facteur général<br />

(Carroll, 1993 ; Grégoire, 2004 ; Huteau, Lautrey, 1999). Ce modèle de la structure de<br />

l’intelligence a été présenté par Jacques Grégoire (Université Catholique de Louvain) et a été<br />

évoqué à plusieurs reprises au cours du congrès. Pourquoi ce consensus et peut-on considérer<br />

maintenant ce problème comme réglé ?<br />

Dans l’analyse factorielle de tests d’intelligence, les facteurs qui peuvent être extraits<br />

dépendent de l’échantillonnage des tests (par exemple, si on ne met pas de tests d’aptitude<br />

spatiale ou si on en met trop peu, il ne pourra pas y avoir de facteur spatial), mais comment<br />

être sûr que l’on a échantillonné toutes les activités intellectuelles possibles ? Le saut en<br />

hauteur en fait-il partie ? Les facteurs dépendent aussi de l’échantillonnage des sujets qui<br />

passent ces tests (par exemple, si les sujets sont de niveau général trop homogène, on ne<br />

trouvera pas de facteur général). Ils dépendent enfin de la méthode d’analyse factorielle<br />

utilisée (pour prendre un exemple caricatural, on ne trouvera pas de facteur général si on fait<br />

une rotation orthogonale des facteurs). La difficulté des psychologues à se mettre d’accord sur<br />

la structure factorielle de l’intelligence a tenu pour une bonne part au fait que les différentes<br />

études que l’on comparait portaient le plus souvent sur des échantillons de tests différents,<br />

passés par des échantillons de sujets différents et utilisaient des options différentes dans les<br />

méthodes d’analyse factorielle.<br />

Le mérite de Carroll est d’avoir mis un peu d’homogénéité dans tout cela. Comme l’a<br />

rappelé Jacques Grégoire, Carroll a fait un véritable travail de bénédictin en réanalysant toutes<br />

les analyses factorielles de tests publiées et utilisables dans la littérature, environ 460, en leur<br />

appliquant la même méthode d’analyse factorielle : analyse de premier ordre qui extrait des<br />

facteurs primaires corrélés entre eux, puis analyses d’ordre n+1 pour extraire la variance<br />

correspondant à la corrélation entre les facteurs d’ordre n. L’examen des 460 analyses a<br />

permis d’identifier une quarantaine de facteurs de premier ordre, dont chaque étude n’avait<br />

évidemment échantillonné qu’une partie. Ensuite, Carroll a refait pour chacune de ces 460<br />

études une analyse de second ordre pour extraire, au deuxième étage du modèle, les facteurs<br />

qui rendent compte des corrélations entre les facteurs primaires. À ce niveau, huit grands<br />

facteurs, également corrélés entre eux, suffisent pour rendre compte de l’ensemble des études<br />

réanalysées. Ils correspondent en gros aux facteurs généraux qu’avaient identifiés Horn et<br />

Cattell, les plus connus étant les facteurs d’intelligence fluide, cristallisée, visuo-spatiale,<br />

mémoire, vitesse cognitive. Enfin, une analyse de troisième ordre a permis d’extraire, au<br />

troisième étage, le ou les facteurs rendant compte de la part de variance commune aux huit<br />

14


facteurs de second ordre. Aucune des 460 réanalyses n’a abouti à plus d’un facteur général et<br />

ce facteur général correspond en gros à celui qu’avait extrait Spearman. Le modèle de Carroll<br />

est donc un modèle de synthèse, capable de rendre compte de l’ensemble des études<br />

réanalysées. La structure de l’intelligence qu’il définit est multidimensionnelle : elle comporte<br />

à la fois une dimension commune à toutes les activités intellectuelles analysées et des<br />

dimensions spécifiques à des formes d’intelligence différentes.<br />

Si ce modèle fait actuellement consensus, comme on a pu l’observer dans ce congrès,<br />

c’est simplement parce que les analyses sur lesquelles il repose font l’échantillonnage le plus<br />

large dont on dispose des tests et des sujets (puisqu’il prend en compte l’ensemble des<br />

échantillons de tests et de sujets ayant jusqu’ici donné lieu à analyse factorielle) et qu’il leur<br />

applique une même méthode. Il minimise donc autant que faire se peut les trois facteurs de<br />

variation mentionnés plus haut. Le problème est-il pour autant résolu sur le fond ?<br />

Evidemment non, puisqu’en l’absence de théorie unifiée sur l’intelligence, nul ne peut assurer<br />

que toutes les situations qui devraient figurer dans une batterie de tests d’intelligence ont bien<br />

été échantillonnées.<br />

Et c’est ainsi que le débat rebondit actuellement. Plusieurs auteurs défendent l’idée que les<br />

tests actuels d’intelligence ne mesurent qu’une des formes de l’activité intellectuelle,<br />

l’intelligence académique, celle qui est valorisée par le système scolaire. On connaît la théorie<br />

des intelligences multiples de Gardner qui, à côté de l’intelligence logico-mathématique et de<br />

l’intelligence langagière, valorisées par l’école et évaluées par les tests d’intelligence, défend<br />

l’existence d’autres formes d’intelligence, par exemple musicale, kinesthésique, intra<br />

personnelle, interpersonnelle. La théorie triarchique de Sternberg, de son côté, distingue trois<br />

formes d’intelligence, l’intelligence analytique, évaluée par les tests classiques, l’intelligence<br />

créative, à laquelle était consacré le symposium organisé par Todd Lubart (Université de Paris<br />

5), et l’intelligence pratique, que Robert Sternberg (Université de Yale) a illustrée par<br />

plusieurs exemples dans sa conférence sur l’impact des aspects culturels dans l’évaluation de<br />

l’intelligence. Aussi bien Gardner que Sternberg postulent que ces différentes formes<br />

d’intelligence sont indépendantes entre elles et indépendantes de l’intelligence évaluée par les<br />

tests psychométriques classiques. En d’autres termes, ils considèrent qu’une batterie de<br />

situations élargissant l’évaluation aux formes d’intelligence qu’ils distinguent n’admettrait<br />

pas de facteur général. Ces perspectives d’extension du concept d’intelligence sont<br />

intéressantes et stimulantes. Elles relancent le débat sur l’unicité ou la pluralité des<br />

intelligences à un moment où un relatif consensus a été trouvé concernant l’intelligence<br />

mesurée par les tests psychométriques classiques. Néanmoins, jusqu’ici, aucun résultat<br />

15


empirique solide n’est venu étayer l’hypothèse d’indépendance de ces différentes formes<br />

d’intelligence.<br />

L’ÉVOLUTION DES INSTRUMENTS ET DES PRATIQ<strong>UE</strong>S D’ÉVALUATION<br />

Il existe sur ce point un paradoxe intéressant. Depuis Binet, les idées sur l’intelligence ont<br />

beaucoup évolué. Pour ne parler que des grands mouvements d’idées, il y a eu notamment les<br />

théories factorielles, la théorie de Piaget et la psychologie cognitive, qui ont chacune<br />

renouvelé assez profondément nos représentations de l’intelligence. Pourtant, les échelles de<br />

mesure de l’intelligence ont très peu changé et, jusqu’assez récemment, elles sont restées<br />

bâties sur les mêmes principes que l’échelle métrique de Binet et Simon. Même si l’on prend<br />

en compte les modifications opérées par Wechsler, la séparation d’une sous-échelle verbale et<br />

d’une sous-échelle de performance, c’est une conception de l’évaluation de l’intelligence qui<br />

a plus d’un demi-siècle.<br />

Pourquoi ce décalage dans les rythmes d’évolution entre les théories sur l’intelligence et<br />

les instruments d’évaluation ? Est-ce parce que ceux qui s’occupent d’évaluation de<br />

l’intelligence, les concepteurs d’instruments et les praticiens qui les utilisent, n’ont pas suivi<br />

les évolutions théoriques ? En fait, la théorie de Piaget a bel et bien inspiré la construction de<br />

tests piagétiens et la psychologie cognitive a bel et bien inspiré la construction de quelques<br />

batteries de tâches destinées à évaluer l’efficience de processus cognitifs, mais ces tests n’ont<br />

pas supplanté les bonnes vieilles échelles d’intelligence. Pourquoi des échelles construites<br />

avec une démarche très empirique résistent-elles mieux au temps que des épreuves construites<br />

sur des fondements théoriques plus élaborés ?<br />

Vraisemblablement, c’est précisément le caractère a-théorique des échelles de QI qui<br />

explique leur bonne résistance. En évaluant les performances des sujets dans des activités<br />

intellectuelles faisant appel aux processus supérieurs et en situant ces performances par<br />

rapport à celles observées dans leur groupe d’âge, les pionniers de ce type d’évaluation ont<br />

mis le doigt sur un moyen d’accès direct aux productions du système cognitif. Sous réserve<br />

que la personne examinée ait bien baigné dans le milieu culturel pour lequel le test a été<br />

conçu, cet accès direct aux productions du système cognitif renseigne, indirectement, sur son<br />

fonctionnement global sans qu’il soit nécessaire pour cela de comprendre comment tout cela<br />

fonctionne. Si un enfant a acquis en temps et en heure les connaissances et les habiletés qui<br />

sont d’habitude acquises par la plupart des enfants à cet âge là, c’est que son cerveau<br />

16


fonctionne normalement et on peut pronostiquer que, sauf accident, il acquerra en temps et en<br />

heure les connaissances et habiletés cognitives plus complexes.<br />

L’objectif de théories comme celle de Piaget ou celles du traitement de l’information est<br />

tout différent. Il est de comprendre comment le système cognitif fonctionne et manifestement,<br />

jusqu’ici, ces théories n’ont donné que des vues partielles de l’intelligence. Par exemple, les<br />

étapes du développement de la pensée logique pour la théorie piagétienne, ou le rôle de la<br />

vitesse d’exécution de certains processus élémentaires de traitement de l’information pour la<br />

psychologie cognitive. Les tests inspirés de ces vues partielles se sont révélés utiles pour<br />

évaluer certains aspects particuliers du fonctionnement cognitif, mais se sont révélés<br />

beaucoup moins valides pour remplir la fonction d’évaluation globale de l’efficience du<br />

système cognitif. C’est à mon avis ce qui explique la bonne résistance des bonnes vieilles<br />

échelles d’intelligence.<br />

Toutefois, ce décalage entre la recherche fondamentale sur l’intelligence et la pratique de<br />

son évaluation est en train de changer. C’est un des enseignements qui peuvent être tirés de ce<br />

congrès. Cette évolution est apparue nettement, par exemple, dans la présentation de la<br />

dernière révision de la WISC qu’a faite Larry Weiss, un des chercheurs qui l’ont conduite.<br />

Pour la première fois, une révision de cette échelle en a modifié assez profondément la<br />

composition pour intégrer l’évaluation de compétences dont l’intérêt a été mis en évidence par<br />

l’approche factorielle et par la psychologie cognitive. Les résultats des recherches montrant<br />

l’importance de la relation entre la mémoire de travail et l’intelligence fluide, qui ont été<br />

évoquées plus haut, ont convaincu les auteurs de la révision d’introduire une épreuve de<br />

mémoire de travail, et de dissocier l’épreuve des chiffres à rebours, qui est aussi une épreuve<br />

de mémoire de travail, de l’épreuve de simple répétition de nombres qui est plutôt une<br />

épreuve de mémoire à court terme. Ceci a permis d’introduire dans l’évaluation une nouvelle<br />

dimension de l’intelligence, l’efficience de la mémoire de travail. Il en va de même avec<br />

l’introduction d’une nouvelle épreuve de vitesse cognitive qui, avec l’épreuve du code permet<br />

de faire apparaître une dimension correspondant au facteur de vitesse cognitive du modèle de<br />

Carroll. Les auteurs de la révision se sont par ailleurs décidés à introduire une épreuve de<br />

matrices inspirée de celle de Raven, dont on sait qu’elle est un des tests les plus fortement<br />

saturés en facteur général d’intelligence. De leur côté, les concepteurs du K-ABC avaient déjà<br />

fait cette démarche en introduisant une distinction entre processus simultanés et séquentiels<br />

inspirée des travaux de neuropsychologie, en particulier de ceux de Luria. Dans leur dernière<br />

révision de cette échelle, ils font un pas de plus pour indiquer les correspondances entre les<br />

dimensions du K-ABC et les facteurs du modèle de Carroll. Là encore, l’instrument<br />

17


d’évaluation se rapproche des conceptions multidimensionnelles qui prévalent dans les<br />

théories actuelles de l’intelligence. Une des conséquences de cette évolution vers une<br />

conception multidimensionnelle de l’intelligence est de réduire l’intérêt d’un concept aussi<br />

global que celui de QI (Lautrey, 2005).<br />

La conclusion générale que l’on peut tirer de ces différentes évolutions est que le<br />

cloisonnement qui a longtemps existé entre l’approche psychométrique de l’intelligence et la<br />

recherche fondamentale sur la cognition est peut-être en train de disparaître. Si ces deux<br />

démarches sont restées si longtemps cloisonnées, c’est que ni le behaviorisme, exclusivement<br />

centré sur l’apprentissage, ni la théorie de Piaget, exclusivement centrée sur le développement<br />

de la pensée logique et ignorant les différences individuelles, ni les premiers modèles de<br />

traitement de l’information, trop centrés sur les processus élémentaires, n’étaient capables de<br />

rendre compte d’une fonction aussi complexe que l’intelligence.<br />

Si ce rapprochement commence enfin à se faire <strong>–</strong> et c’est la conclusion principale que je<br />

tire pour ma part des travaux de ce congrès <strong>–</strong> c’est parce que la psychologie cognitive<br />

commence à offrir des modèles de fonctionnement qui, à la fois, portent sur les processus<br />

cognitifs supérieurs (les processus exécutifs) et sont capables de rendre compte de la<br />

variabilité intra et interindividuelle des performances. C’est ce qui provoque un intérêt<br />

réciproque, des chercheurs pour les tests d’intelligence et des concepteurs de tests pour<br />

certaines avancées de la recherche fondamentale. Dans le cas de la mémoire de travail, par<br />

exemple, les premiers utilisent les tests d’intelligence fluide pour démontrer le caractère<br />

général et central de la capacité attentionnelle et les seconds intègrent dans leurs tests des<br />

tâches de mémoire de travail issues de la recherche fondamentale. Cette évolution aurait<br />

certainement plu à Binet…<br />

18


RÉFÉRENCES<br />

Ansari (Daniel), Donlan (Chris), Thomas (Michael), Ewing (Sandra), Peen (Tiffany),<br />

Karmiloff-Smith (Annette).<strong>–</strong> What makes counting count ? Verbal and visuo-spatial<br />

contributions to typical and atypical number development, Journal of experimental<br />

child psychology, 85, 2003, p 50-62.<br />

Binet (Alfred), Henri (Victor).<strong>–</strong> La psychologie individuelle, L’Année psychologique, 2, 1895,<br />

p. 415-465.<br />

Binet (Alfred), Simon (Théodore).<strong>–</strong> Méthodes nouvelles pour le diagnostic du niveau<br />

intellectuel des anormaux, L’Année psychologique, 11, 1905, p. 191-244.<br />

Binet (Alfred).- Les idées modernes sur les enfants, Paris, Flammarion, 1909.<br />

Binet (Alfred).<strong>–</strong> Nouvelles recherches sur la mesure du niveau intellectuel chez les enfants<br />

des écoles, L’Année psychologique, 17, 1911, p. 145-201.<br />

Carlier (Michèle), Roubertoux (Pierre).<strong>–</strong> Des gènes à la cognition, dans Lautrey (J.), Richard<br />

(J.-F.), L’intelligence, Paris, Hermès science publ. Lavoisier, 2005, p. 229-242.<br />

Carroll (John B.) <strong>–</strong> Human cognitive abilities: A survey of factor-analytic studies, Cambridge,<br />

Cambridge University Press, 1993.<br />

Conway (Andrew R. A.), Cowan (Nelson), Bunting (Michael F.), Therriault (David J.),<br />

Minkoff (Scott R. B.).<strong>–</strong> A latent variable analysis of working memory capacity, short<br />

term memory capacity, processing speed, and general fluid intelligence, Intelligence,<br />

30, 2002, p. 163-183.<br />

Damasio (Antonio).<strong>–</strong> L’erreur de Descartes, Paris, Odile Jacob, 1995.<br />

Demetriou (Andreas), Shayer (Michael), Efklides (Anastasia).<strong>–</strong> The Neo-Piagetian theories of<br />

cognitive development : toward an integration, Amsterdam, Routledge, 1988.<br />

Duncan (John), Seitz (Rüdiger J.), Kolodny (Jonathan), Bor (Daniel), Herzog (Hans), Ahmed<br />

(Ayesha), Newell (Fiona N.), Emslie (Hazel).<strong>–</strong> A neural basis for general intelligence,<br />

Science, 289, 2000, p. 457-460.<br />

Elbert (T.), Pantev (C.), Weinbruch (C.), Rockstroh (B.), Taub (E) <strong>–</strong> Increased cortical<br />

representation of the fingers of the left hand in string players, Science, 270, 1995, p.<br />

305-307.<br />

Elman (Jeffrey L.), Bates (Elizabeth A.), Johnson (Mark H.), Karmiloff-Smith (Annette),<br />

Parisi (Domenico), Plunkett (Kim) <strong>–</strong> Rethinking Innateness: A connectionist<br />

perspective on development, Cambridge, Ma, MIT Press, 1996.<br />

19


Engle (Randall W.), Tuholski (Stephen W.), Laughlin (James E.), Conway (Andrew R. A.).<strong>–</strong><br />

Working memory, short-term memory and general fluid intelligence : a latent variable<br />

approach, Journal of experimental psychology : General, 128, 1999, p. 309<strong>–</strong>331.<br />

Friedman (Naomi), Miyake (Akira).<strong>–</strong> The relations among inhibition and interference control<br />

functions : a latent variable analysis, Journal of experimental psychology : General,<br />

133, 2004, p. 101-135.<br />

Grégoire (Jacques).<strong>–</strong> L’examen clinique de l’intelligence de l’adulte, Sprimont, Mardaga,<br />

2004.<br />

Gross (Charles G.).<strong>–</strong> Neurogenesis in the adult brain : death of a dogma, Nature Reviews<br />

Neuroscience, 1, 2000, p. 67-73.<br />

Houdé (Olivier).<strong>–</strong> Intelligence : psychométrie, psychologie cognitive et imagerie cérébrale,<br />

dans Lautrey (Jacques), Richard (Jean-François), L’intelligence, Paris, Hermès science<br />

publ. Lavoisier, 2005, p. 279-287.<br />

Huteau (Michel), Lautrey (Jacques).<strong>–</strong> Évaluer l’intelligence. <strong>Psychométrie</strong> cognitive, Paris,<br />

Presses universitaires de France, 1999.<br />

Huteau (Michel).<strong>–</strong> Le débat Binet-Toulouse et les débuts de la psychologie différentielle en<br />

France, dans Flieller (André) et coll., Questions de psychologie différentielle, Rennes,<br />

Presses universitaires de Rennes, 2001, p. 23-42.<br />

Huteau (Michel). <strong>–</strong> Alfred Binet et la psychologie de l’intelligence, Journal des psychologues,<br />

sous presse.<br />

Lautrey (Jacques).<strong>–</strong> A pluralistic approach to cognitive differenciation and development, dans<br />

Sternberg (Robert. J.), Lautrey (Jacques.), Lubart (Todd.), Models of intelligence :<br />

international perspectives, Washington, American psychological press, 2003, p. 117-<br />

131.<br />

Lautrey (Jacques).<strong>–</strong> Le statut de la variabilité entre les individus en psychologie cognitive,<br />

dans Lautrey (Jacques.), Mazoyer (Bernard.), van Geert (Paul.), Invariants et<br />

variabilité, Paris, Editions de la Maison des sciences de l’homme, 2002, p. 103-121.<br />

Lautrey (Jacques) <strong>–</strong> Le QI: concept mal compris ou concept dépassé?, A.N.A.E., n° 83-84,<br />

2005, p. 146-150.<br />

Lindenberger (Ulman), Li (Shu-Chen), Brehmer (Yvonne).<strong>–</strong> La variabilité dans le<br />

vieillissement comportemental : conséquence et agent du changement ontogénétique,<br />

dans Lautrey (Jacques), Mazoyer (Bernard), van Geert (Paul), Invariants et variabilité,<br />

Paris, Editions de la Maison des sciences de l’homme, 2002, 315-334.<br />

20


Mackintosh (N. J.), Bennett (E. S.).<strong>–</strong> The fractionation of working memory maps onto<br />

different components of intelligence, Intelligence, 31, 2003, p. 519-531.<br />

Miyake (Akira), Friedman (Naomi P.), Emerson (Michael J.), Witzki (Alexander H.),<br />

Howerter (Amy), Wager (Tor D.).<strong>–</strong> The unity and diversity of executive functions and<br />

their contributions to complex “frontal lobe” tasks : a latent variable analysis,<br />

Cognitive psychology, 41, 2000, p. 49-100.<br />

Pesenti (Mauro), Zago (Laure), Crivello (Fabrice), Mellet (Emmanual), Samson (Dana),<br />

Duroux (Bruno), Séron (Xavier), Mazoyer (Bernard), Tzuro-Mazoyer (Nathalie).-<br />

Mental calculation in a prodigy is sustained by right prefrontal and medial temporal<br />

areas, Nature Neuroscience, 4 (1), p.103-107.<br />

Reuchlin (Maurice).<strong>–</strong> Processus vicariants et différences individuelles, Journal de<br />

psychologie, 2, 1978, p. 133-145.<br />

Ribaupierre (Annick de).<strong>–</strong> Les modèles néo-piagétiens : quoi de nouveau ?, Psychologie<br />

française, 42, 1997, p. 9-21.<br />

Roubertoux (Pierre).<strong>–</strong> Existe-t-il des gènes du comportement ?, Paris, Odile Jacob, 2004.<br />

Süss (Heinz-Martin), Oberauer (Klaus), Wittmann (Werner), Wilhelm (Oliver), Schulze<br />

(Ralf).<strong>–</strong> Working memory capacity explains reasoning ability <strong>–</strong> and a little bit more,<br />

Intelligence, 30, 2002, p. 261-288.<br />

Thelen (Esther), Smith (Linda B.) <strong>–</strong> A dynamic systems approach to the development of<br />

cognition and action, Cambridge, Ma, MIT Press, 1994.<br />

Toulouse (Edouard), Vaschide (Nicolas), Piéron (Henri).<strong>–</strong> Technique de psychologie<br />

expérimentale, Paris, Douin, 1904.<br />

Van Geert (Paul), van Dijk (Marijn).<strong>–</strong> Focus on variability : new tools to study intra-<br />

individual variability in developmental data, Journal of infant behavior and<br />

development, 25, 2002, p. 340-374.<br />

21


Texte 4<br />

Lautrey, J. (2007). Pour l’abandon du QI : les raisons du succès d’un concept dépassé. In M. Duru-<br />

Bellat & M. Fournier (Eds.), L’intelligence de l’enfant <strong>–</strong> l’empreinte du social. Auxerre : Editions<br />

Sciences Humaines.


Pour l’abandon du QI :<br />

les raisons du succès d’un concept scientifiquement dépassé<br />

Jacques Lautrey est professeur émérite à l’Université Paris 5<br />

Il a notamment publié Classe sociale, milieu familial, intelligence (PUF, 1980) ; Evaluer<br />

l’intelligence : psychométrie cognitive (avec Michel Huteau, PUF, 2003) ; L’intelligence (Dir,<br />

avec Jean-François Richard, Editions Lavoisier, 2005) ; Les tests d’intelligence (avec Michel<br />

Huteau, La découverte, 2006) ; L’approche différentielle de l’intelligence, In J. Lautrey (Dir.),<br />

Psychologie du développement et psychologie différentielle (PUF, 2006).<br />

Ce chapitre reprend, en la développant, la thèse défendue à l’origine dans un article<br />

publié par la revue ANAE : Lautrey, J. (2005). Le Q.I. : concept mal compris ou concept<br />

dépassé ? ANAE, 17,146-149.<br />

Parmi les concepts issus de la psychologie, il en est peu qui aient autant de succès dans le<br />

grand public que celui de QI. Les sites internet qui proposent, moyennant quelques euros,<br />

d’évaluer son propre QI en passant un test d’intelligence en ligne affichent des millions de<br />

connexions. En 2002, six millions de téléspectateurs ont regardé « Le grand test », une<br />

émission au cours de laquelle chacun pouvait répondre aux questions tirées d’un test<br />

d’intelligence et calculer son QI. Les psychologues font état d’un nombre croissant de parents<br />

qui s’adressent à eux en leur demandant de faire passer un test d’intelligence à leur enfant et<br />

de leur communiquer son QI. Même la presse people inclut maintenant le QI dans les<br />

mensurations des stars: celui de Madonna serait de 140 et la rumeur court que celui de Sharon<br />

Stone serait de 153…<br />

Les dérives qui accompagnent cette généralisation de l’usage du QI. inquiètent les<br />

psychologues. En témoigne le manifeste sur les usages du QI, publié récemment par un<br />

groupe de spécialistes de l’examen psychologique et intellectuel de l’enfant, que de nombreux<br />

psychologues ont signé 1 . Ce manifeste pointe avec justesse les dérives parfois observées dans<br />

1 « Des psychologues s’interrogent sur le QI et certains de ses usages », Journal des Psychologues, n° 230,<br />

septembre 2005. Le site www.psy-et-QI.com sur lequel le texte de ce manifeste peut être signé fait état de plus<br />

de 600 signatures à la date où ces lignes sont écrites.


l’usage qui est fait du QI par certains psychologues, certains media, certains services<br />

administratifs et, plus généralement, par les différents usagers de l’examen intellectuel de<br />

l’enfant (dans la suite, le terme usagers réfèrera à cet ensemble d’utilisateurs potentiels du<br />

QI). Il rappelle, par exemple, que le chiffre du QI, à lui seul, n’a aucune signification et que<br />

seule l’interprétation que peut en faire le psychologue, à la lumière des autres informations<br />

recueillies au cours de l’examen psychologique, permet de passer de ce chiffre à une<br />

évaluation des capacités intellectuelles.<br />

Cette contribution à la réflexion sur les usages du QI est utile. Elle est cependant insuffisante<br />

car le texte mentionné plus haut ne questionne pas assez clairement la pertinence même du<br />

concept de QI dans l’état actuel de nos connaissances sur l’intelligence. Certaines de ses<br />

faiblesses sont certes mentionnées, mais la position des auteurs reste sur ce point ambiguë. Ils<br />

affirment en effet avec force que « Le QI, qui a bientôt 100 ans, est devenu une donnée<br />

scientifique et sophistiquée, une source exceptionnelle d’informations privilégiées pour le<br />

psychologue ». Pour les auteurs de ce manifeste, le problème semble donc venir surtout de ce<br />

que la signification complexe de l’indication chiffrée exprimant le QI échappe à beaucoup de<br />

ceux qui utilisent cette notion. Cette analyse des mésusages du QI les conduit à revendiquer<br />

que les psychologues soient les seuls à pouvoir en faire usage et aient le droit de refuser de le<br />

communiquer .<br />

La curiosité du grand public pour ce qui touche au QI tient en bonne partie à l’importance que<br />

notre société accorde aux capacités intellectuelles et en particulier à la forme d’intelligence<br />

requise pour réussir à l’école. La corrélation observée entre QI et réussite scolaire 2 contribue<br />

certainement à cette valorisation du QI et, plus généralement, à alimenter la curiosité pour ce<br />

qui touche à l’évaluation de l’intelligence. Cette curiosité est légitime et doit être satisfaite.<br />

Dans ce contexte, l’attitude de psychologues qui calculeraient un QI, le consigneraient dans<br />

un dossier, mais refuseraient de le communiquer aux usagers concernés risque d’être mal<br />

comprise. Il est certes problématique que la notion de QI, telle qu’elle est comprise par les<br />

usagers de la psychologie, aiguille sur de fausses pistes leur légitime curiosité sur<br />

l’intelligence et sur la façon dont celle-ci peut être évaluée. Mais peut-être vaudrait-il mieux<br />

commencer par se demander pourquoi la notion de QI est si mal interprétée et à quoi peut<br />

bien tenir alors son succès auprès du grand public.<br />

2 Cette corrélation est en moyenne de l’ordre de .50, ce qui signifie que le QI peut rendre compte de 25% de la<br />

variance observée dans les résultats scolaires.<br />

2


Des représentations erronées mais pérennes<br />

Ce succès tient, c’est du moins notre hypothèse, à ce que la représentation de l’intelligence<br />

implicitement véhiculée par la notion de QI se trouve précisément être celle qui correspond<br />

aux conceptions spontanées de tout un chacun. Mais comment expliquer alors cette<br />

correspondance entre la représentation de l’intelligence véhiculée par le concept de QI et celle<br />

du sens commun?<br />

Il est en fait fréquent, dans l’histoire des sciences, que les recherches s’appuient au départ sur<br />

des concepts du sens commun dont elles modifient ensuite la définition au fur et à mesure des<br />

réajustements qu’imposent les résultats expérimentaux. C’est ce qui s’est passé pour le<br />

concept d’intelligence. Les premières tentatives de mesure, faites il y a maintenant plus d’un<br />

siècle par des pionniers comme Alfred Binet, qui avait élaboré la première « échelle<br />

métrique » du développement de l’intelligence, ou Charles Spearman, qui a proposé la<br />

première procédure mathématique pour extraire ce qu’il pensait être l’unique facteur commun<br />

aux tâches intellectuelles, qu’il appelait le facteur général d’intelligence (facteur g),<br />

s’appuyaient sur une représentation unidimensionnelle de l’intelligence qui était celle du sens<br />

commun. Au cours du siècle qui s’est écoulé depuis, les recherches ont conduit à une<br />

représentation qui s’est beaucoup écartée de cette conception unidimensionnelle alors que<br />

cette dernière est restée pérenne dans le grand public. Il n’y a donc plus de correspondance<br />

évidente entre la façon dont les psychologues qui ont suivi cette évolution scientifique<br />

interprètent les résultats d’un test d’intelligence et la façon dont le public se représente<br />

l’intelligence à travers la notion de QI.<br />

Comment sortir de ce malentendu ? En réservant l’usage du QI aux psychologues comme le<br />

préconisent les auteurs du manifeste cité plus haut? En expliquant mieux cette notion aux<br />

usagers ? En l’abandonnant ? C’est ce dernier point de vue qui sera défendu ici.<br />

L’inconvénient de la notion de QI est en effet de susciter des inférences erronées qui<br />

contribuent à cristalliser une représentation scientifiquement dépassée de l’intelligence.<br />

Selon nous, les instruments d'évaluation dont les psychologues peuvent disposer aujourd’hui<br />

leur permettent effectivement de tirer des informations scientifiques d'une grande richesse sur<br />

l'intelligence mais le concept de QI , par contre, n'est plus adapté pour rendre compte de cette<br />

richesse et devrait donc être abandonné, y compris par les psychologues.<br />

En évaluant l’intelligence d’une personne par un indicateur chiffré unique, le QI suscite chez<br />

les usagers des inférences trompeuses sur ce qui est mesuré. Il suggère implicitement que<br />

3


l’intelligence est une entité unidimensionnelle (puisqu’un indicateur unique suffit à la<br />

caractériser), dont chaque personne possède une certaine quantité (puisque cet indicateur est<br />

un nombre), qui caractérise cette personne de façon stable (puisque Madonna a, aujourd’hui<br />

comme hier, un QI de 140). Le malentendu vient de ce que, comme on se propose de le<br />

montrer dans ce qui suit, chacune de ces trois inférences est erronée.<br />

1. De l’inconvénient de résumer l’évaluation de l’intelligence par un indicateur unique<br />

L’utilisation d’un indicateur unique suggère que l’intelligence est une fonction unitaire, dont<br />

l’efficience peut être caractérisée de façon globale. Cette représentation est celle qui a inspiré,<br />

il y a un siècle, la notion globale d’âge mental à Binet, le calcul du Quotient Intellectuel par<br />

Stern (voir encadré), et l’extraction d’un facteur général d’intelligence par Spearman. Comme<br />

cela a été indiqué plus haut, les recherches ultérieures ont conduit à abandonner cette<br />

représentation unidimensionnelle de l’intelligence.<br />

Dans le cadre des travaux qui se sont appuyés sur les méthodes d’analyse factorielle pour<br />

étudier l’intelligence, une évolution longue et laborieuse a abouti à un modèle factoriel<br />

hiérarchique à trois niveaux, dans lequel s’articulent un facteur général d’intelligence, des<br />

facteurs de groupe larges correspondant à différents aspects de l’intelligence (fluide,<br />

cristallisée, visuo-spatiale, etc.), chacun de ces facteurs larges pouvant être subdivisé à son<br />

tour en facteurs de groupe plus étroits 3 . Il subsiste bien un facteur général, dont le rôle est très<br />

important, mais celui-ci n’est plus qu’une des dimensions sur lesquelles les performances<br />

varient dans les tâches intellectuelles 4 .<br />

Dans le cadre des travaux qui ont porté sur la construction d’échelles de mesure du<br />

développement de l’intelligence, le fractionnement du concept a été initié à partir de 1939 par<br />

la séparation introduite par le psychologue américain David Wechsler entre une échelle dite<br />

verbale et une échelle dite de performances non verbales. De leur côté, A.et N. Kaufman,<br />

auteurs du K-ABC (Kaufman-Assessment Battery for Children), ont plus tard distingué, dans<br />

leur propre échelle, des sous-échelles relatives aux types de processus mentaux sollicités<br />

(séquentiels versus simultanés) et une sous-échelle relative aux connaissances. Ce<br />

fractionnement s’est amplifié plus récemment avec la distinction introduite, dans la WISC<br />

3 voir l’explication de ces différents modèles dans L’Intelligence de l’enfant, le regard des psychologues,<br />

M.Fournier, R.lécuyer (dir.), éditions Sciences Humaines 2006.<br />

4 voir Carroll, J.B. (1993). Human cognitive abilities. Cambridge: Cambridge University Press Et Lautrey, J.<br />

(2006). L’approche différentielle de l’intelligence. In J. Lautrey (Ed.), Psychologie du développement et<br />

psychologie différentielle. Paris : PUF.<br />

4


IV* (dernière révision de l’échelle de Wechsler pour enfants), entre quatre sous-échelles<br />

correspondant à quatre grandes dimensions cognitives : des indices permettent de distinguer<br />

des aspects de l’intelligence qui étaient auparavant confondus dans le QI verbal (la<br />

compréhension verbale et la capacité de la mémoire de travail) ou dans le calcul du « QI<br />

performance » (le raisonnement perceptif et la vitesse de traitement) 5 .<br />

Dans la construction des échelles de mesure, ce fractionnement du concept d’intelligence a<br />

d’abord été assez global et inspiré par l’expérience clinique, comme ce fut le cas chez<br />

Wechsler pour la distinction verbal / performance, mais il tend à s’appuyer de plus en plus sur<br />

les apports de l’analyse factorielle et de la psychologie cognitive, comme dans les dernières<br />

révisions de toutes les grandes échelles de développement de l’intelligence : Stanford-Binet,<br />

K-ABC, échelles de Wechsler par exemple 6 .<br />

Le passage d’une conception unitaire à une conception multidimensionnelle de l’intelligence<br />

est donc une tendance lourde qui caractérise l’évolution des idées au cours du siècle qui nous<br />

sépare de l’invention du premier test d’intelligence. Le maintien d’une forme d’évaluation de<br />

l’intelligence qui se traduit par un indicateur unique n’est pas la pratique la plus propice à<br />

faire saisir cette évolution aux usagers.<br />

2. De l’inconvénient d’utiliser un indicateur qui ressemble à un nombre sans en avoir<br />

toutes les propriétés<br />

La seconde inférence trompeuse réside dans l’utilisation d’un indicateur chiffré (le QI) tel que<br />

140 ou 157… pour mesurer l’intelligence. Cette mesure de l’intelligence par « une note » d e<br />

QI suggère que celle-ci aurait toutes les propriétés des nombres. En réalité, le niveau de<br />

mesure le plus puissant sur lequel les psychologues puissent fonder leurs évaluations de<br />

l’intelligence est le niveau ordinal: ils savent ordonner les personnes en fonction de leurs<br />

performances dans les tests (nombre d’items réussis) et ils savent aussi ordonner les items de<br />

ces tests en fonction de leur niveau de difficulté (nombre de personnes qui réussissent chaque<br />

item). Depuis Wechsler, le QI d’un sujet ne traduit rien d’autre que le rang auquel sa<br />

performance le situe dans son groupe d’âge (voir encadré). Les différents arrangements qui<br />

5 Wechsler, D. (2005a). WISC IV. Manuel d’interprétation. Paris: Editions du Centre de Psychologie Appliquée.<br />

Wechsler, D. (2005b). WISC IV. Manuel d’administration et de cotation. Paris : Editions du Centre de<br />

Psychologie Appliquée.<br />

6 cf. Flanagan, D.P., & Harrison, P.L. (2005) (Eds.). Contemporary Intellectual Assessment, 2 nd Edition. New<br />

York: The Guilford Press. ET Lautrey, 2006, op. cit<br />

5


permettent de passer de ce simple rang à un nombre tel que 140 ou 157 relèvent de<br />

commodités qui n’ont rien à voir avec les propriétés de l’intelligence.<br />

Le premier arrangement, celui qui correspond au passage du score brut au score standard dans<br />

les échelles de Wechsler, consiste à s’appuyer sur la forme normale de la distribution des<br />

scores dans l’échantillon d’étalonnage pour transformer ceux-ci en écarts-réduits. C’est ce qui<br />

permet ensuite de les traiter comme s’ils constituaient une échelle d’intervalle. Mais la forme<br />

« normale » de la distribution des scores dans l’échantillon d’étalonnage, sur laquelle on<br />

s’appuie pour faire cette manipulation, n’est pas une propriété de l’intelligence. Elle est<br />

seulement la forme que les constructeurs de tests tentent généralement de donner à la<br />

distribution des scores en faisant une répartition appropriée des niveaux de difficulté des<br />

items. Les objectifs visés par cette manipulation sont de l’ordre de la commodité (meilleure<br />

discrimination aux extrêmes de la distribution, possibilité d’utiliser les techniques statistiques<br />

qui présupposent la normalité de la distribution, etc.).<br />

Le second arrangement, celui qui permet de passer des scores standard au QI, est un<br />

changement d’échelle visant à donner à la distribution des scores totaux une moyenne de 100<br />

et un écart-type de 15. Wechsler y avait eu recours pour que les nombres auxquels aboutissait<br />

la mesure soient du même ordre de grandeur que ceux auxquels étaient habitués les<br />

psychologues qui utilisaient des échelles où on calculait un QI de type Stern (voir encadré).<br />

Cette pratique a été conservée depuis.<br />

Vouloir expliquer aux usagers la signification réelle du nombre que le psychologue utilise<br />

lorsqu’il leur communique un QI serait donc une entreprise ardue. La solution la plus<br />

raisonnable pour ce faire serait de s’appuyer sur la seule propriété solidement fondée à<br />

laquelle renvoie ce nombre, c’est à dire le rang auquel la performance du sujet le classe dans<br />

son groupe d’âge (en précisant les marges de l’incertitude due à l’erreur de mesure). C’est une<br />

information qui a en outre l’avantage de pouvoir être facilement comprise par tout le monde.<br />

Mais dans ce cas, à quoi a servi tout le détour consistant à passer par un QI ? Ne pourrait-on<br />

pas en rester, y compris pour le psychologue, au niveau de mesure qui peut être<br />

scientifiquement justifié ?<br />

3. Des inférences erronées que suscite la stabilité du QI<br />

Il y a peu de corrélation entre le quotient de développement évalué dans la petite enfance et le<br />

QI ultérieur mais, dès le début de l’enfance, disons dès 5 ou 6 ans, la stabilité du QI devient<br />

forte. Dans les études longitudinales où le QI mesuré vers 6 ans a été mis en relation avec le<br />

6


QI mesuré à l’adolescence ou à l’âge adulte, les corrélations trouvées sont fortes (de l’ordre<br />

de .80) 7 . La stabilité relative du QI est donc un fait statistique avéré. C’est son interprétation<br />

qui fait problème.<br />

Que peut signifier en effet le fait que la mesure de l’intelligence d’une personne se traduise à<br />

peu près par le même nombre quand elle a 6 ans et quand elle en a 18 ? Un peu de bon sens<br />

suffit pour réaliser que cela ne veut probablement pas dire qu’elle a le même degré<br />

d’intelligence à 18 ans qu’à 6 ans, chacun ayant pu constater que les performances<br />

intellectuelles d’un adolescent sont en général supérieures à celles d’un enfant. Mais il est<br />

plus difficile, car cette information n’est pas transparente, de comprendre le sens précis de<br />

cette corrélation, à savoir que le score de cette personne dans le test est certes bien plus élevé<br />

à 18 ans qu’à 6 ans, mais qu’il la classe à peu près au même rang, à ces deux moments de son<br />

développement, lorsqu’on le rapporte aux scores qui sont observés dans son groupe d’âge.<br />

L’absence de transparence quant au statut du nombre par lequel le QI est exprimé contribue à<br />

rendre problématique l’interprétation de sa stabilité.<br />

Une meilleure compréhension de ce que traduit le chiffre exprimant le QI ne suffit cependant<br />

pas à écarter les interprétations erronées qui sont souvent faites de la stabilité de ce chiffre.<br />

Les erreurs les plus courantes sont de voir dans cette stabilité l’expression soit d’une<br />

détermination essentiellement génétique de l’intelligence, soit d’une fatalité sociologique. Les<br />

résultats des études qui ont porté sur le développement intellectuel d’enfants adoptés<br />

permettent d’écarter ces deux interprétations. Lorsque des enfants sont adoptés par des parents<br />

ayant un niveau socio-culturel différent de celui de leurs parents biologiques, les QI de ces<br />

enfants diffèrent d’au moins une douzaine de points en moyenne (près d’un écart-type donc)<br />

de celui de leurs frères et sœurs adoptés par des parents ayant le même niveau socio-culturel<br />

que leurs parents biologiques 8 . Ceci ne signifie évidemment pas que les facteurs génétiques<br />

n’influencent pas le développement intellectuel (les mêmes études donnent des résultats qui<br />

sont aussi compatibles avec cette hypothèse) mais il montre que la stabilité du QI ne relève<br />

d’aucune forme de fatalité. Elle tient seulement à ce qu’en l’absence de modifications<br />

sensibles de l’environnement socio-culturel dans lequel un enfant se développe, le rang<br />

auquel son score dans un test de QI le classe dans son groupe d’âge reste relativement stable.<br />

Cette stabilité est de nature statistique, elle est simplement due à ce que, dans la population,<br />

les cas de modifications sensibles de l’environnement socio-culturel sont rares. Mais, comme<br />

7 Voir par exemple Bayley, N. (1970). Development of mental abilities. In P.M. Mussen (Ed.), Carmichael’s<br />

Manual of Child Psychology. New-York: Wiley.<br />

8 voir l’article de Duyme, p…<br />

7


le montrent les études sur les enfants adoptés, lorsque de telles modifications surviennent, le<br />

QI évolue.<br />

La stabilité de l’indicateur du développement intellectuel n’est certes pas propre au QI. Elle<br />

serait la même avec un indicateur correspondant plus simplement au rang auquel la<br />

performance du sujet le classe dans son groupe d’âge. Ce que nous avons voulu souligner à<br />

propos des erreurs d’interprétation auxquelles cette stabilité donne lieu, c’est que l’absence de<br />

transparence du nombre par lequel le QI est exprimé les induit plus facilement.<br />

Réserver l’usage du Qi aux psychologues… ou l’abandonner ?<br />

Ces trois exemples d’inférences erronées montrent bien que, du point de vue des<br />

connaissances scientifiques actuelles, la représentation de l’intelligence suggérée par l’usage<br />

du QI est dépassée. Compte tenu de la difficulté dans laquelle se trouveraient les<br />

psychologues s’ils devaient réellement expliquer aux usagers pourquoi ni l’intelligence ni sa<br />

mesure ne correspondent aux apparences que véhicule le QI, il ne reste que deux solutions<br />

pour régler le problème. La première est de réserver le QI à l’usage exclusif des<br />

psychologues, seuls capables, par la formation qu’ils ont reçue, d’interpréter et d’utiliser à<br />

bon escient une notion aussi complexe et aussi trompeuse. La seconde est d’abandonner cette<br />

notion et de la remplacer par d’autres plus appropriées aux connaissances actuelles sur<br />

l’intelligence et aux possibilités d’évaluation qui en découlent.<br />

Le texte publié par le Journal des Psychologues plaide pour la première de ces deux solutions.<br />

On pourrait comprendre que les psychologues restent attachés au QI si, en dépit de ses<br />

inconvénients, cette notion leur offrait des avantages irremplaçables. Est-ce bien le cas ?<br />

Perdrait-on de l’information en utilisant des concepts plus appropriés à la prise en compte du<br />

caractère multidimensionnel de l’intelligence et plus respectueux du niveau ordinal de la<br />

mesure effectuée? C’est ce qui se pratique depuis longtemps lorsqu’on utilise des batteries<br />

factorielles. Le profil obtenu en caractérisant la performance du sujet par son rang dans<br />

l’échantillon de référence pour chacun des facteurs de l’intelligence restitue le caractère<br />

multidimensionnel de celle-ci et colle au plus près du niveau réel de la mesure effectuée. La<br />

forme du profil renseigne sur les avances et retards dans les différents aspects de l’intelligence<br />

et l’ « altitude » du profil renseigne sur le niveau général des performances lorsqu’elles sont<br />

suffisamment homogènes. Ce type d’évaluation analytique est aussi pratiqué depuis<br />

longtemps par les psychologues qui utilisent des échelles d’intelligence de type Wechsler.<br />

8


Toutefois l’inconvénient du profil établi à partir des scores dans les différents sous-tests de<br />

l’échelle était, jusqu’ici, qu’il s’appuyait sur des sous-tests spécifiques, issus d’un<br />

échantillonnage très empirique des tâches intellectuelles et non sur les grandes dimensions de<br />

l’intelligence répertoriées depuis. Du fait que chaque sous-test ne comportait qu’une seule<br />

épreuve, et du fait que les liens de ces sous-tests avec les grandes dimensions de l’intelligence<br />

n’étaient pas évidents, ces profils avaient un faible fidélité et il était difficile d’en donner une<br />

interprétation claire. L’évolution amorcée dans la plupart des échelles d’intelligence, qui<br />

permet de calculer des indices de performance dans chacune des grandes dimensions<br />

factorielles distinguées dans l’échelle (comme par exemple la compréhension verbale, la<br />

mémoire de travail, le raisonnement perceptif, la vitesse de traitement, dans la WISC IV) va<br />

dans le bon sens et devrait fournir des bases plus solides à cette démarche.<br />

On opposera peut-être que le même résultat pourrait être obtenu en distinguant plusieurs QI.<br />

Les versions précédentes de la WISC, par exemple, permettaient déjà de distinguer un QI<br />

verbal et un QI performance. La WISC IV (dernière révision de la WISC), qui permet de<br />

calculer des indices de performance sur quatre dimensions factorielles distinctes, aurait pu<br />

permettre de calculer, pourquoi pas, quatre QI distincts. Les auteurs de cette révision de la<br />

WISC n’ont pas suivi cette voie et ils ont eu raison. Ce type d’utilisation de la notion de QI la<br />

viderait du sens qu’elle avait à l’origine et ne ferait donc qu’accroître encore la confusion.<br />

Les auteurs de la WISC IV laissent néanmoins la possibilité de calculer un QI global dont ils<br />

disent que celui-ci peut alors être considéré comme une estimation du facteur général. Il est<br />

effectivement nécessaire qu’une évaluation du facteur général figure dans une évaluation<br />

multidimensionnelle de l’intelligence, mais le QI global n’en est pas la meilleure estimation.<br />

La raison en est simple, le score en facteur général est calculé en donnant à chacun des sous-<br />

tests de l’échelle un poids qui est fonction de sa contribution à ce facteur général. Le QI par<br />

contre est calculé en additionnant simplement les scores standards aux différents sous-tests, ce<br />

qui accorde donc à chacun de ces sous-tests un poids égal dans la somme, quelle que soit sa<br />

contribution au facteur général. La procédure adoptée dans ce dernier cas est en somme<br />

comparable à celle qui consisterait à donner le même coefficient à toutes les matières dans le<br />

calcul de la moyenne à un examen, quelle que soit l’importance de cette matière dans cet<br />

examen. Les auteurs de la révision de la WISC IV sont donc restés à mi-chemin dans<br />

l’évolution qu’ils ont amorcée: ils ont adopté la logique factorielle pour le calcul des indices<br />

correspondant aux facteurs de groupe (compréhension verbale, mémoire de travail,<br />

raisonnement perceptif, vitesse de traitement) mais sont restés dans la logique du QI, qui n’est<br />

pas la plus appropriée, pour l’évaluation du facteur général.<br />

9


En résumé, le QI est certes un concept souvent mal compris mais c’est aussi un<br />

concept qui n’est plus vraiment adapté aux connaissances scientifiques actuelles sur<br />

l’intelligence. Au cours du siècle qui nous sépare des premières tentatives de mesure de<br />

l’intelligence, on est progressivement passé d’une conception unidimensionnelle et globale<br />

de cette fonction à une conception multidimensionnelle et plus analytique. Bien adapté à la<br />

première de ces deux conceptions, qui était et reste encore très répandue dans le public, le QI<br />

n’est plus adapté à l’opérationnalisation de la seconde. C’est la raison pour laquelle la<br />

solution des malentendus soulevés par l’usage du QI passe par l’abandon de cette notion.<br />

Cette évolution ne peut probablement être que progressive, ne serait-ce que par ce qu’elle<br />

suppose une évolution préalable, ou au moins parallèle, des instruments d’évaluation et des<br />

modes de quantification qui leur sont associés. Pourtant, cette évolution est maintenant<br />

nécessaire.<br />

Qu’est-ce que le QI ?<br />

Pour construire leur échelle métrique de l’intelligence, Binet et Simon (1908) ont cherché à mettre au<br />

point, pour chaque âge de l’enfant, de petites tâches intellectuelles qui soient caractéristiques de cet âge, c’est à<br />

dire des items réussis par à peu près la moitié des enfants de l’âge considéré mais par contre échouées par la<br />

plupart des enfants de l’âge précédent et réussies par la plupart des enfants de l’âge suivant. Un enfant<br />

réussissant, par exemple, les items caractéristiques de l’âge de 12 ans est alors considéré comme ayant un « âge<br />

mental » de 12 ans, quel que soit son âge chronologique. Stern proposa un peu plus tard, en 1912, de quantifier<br />

le degré d’avance ou de retard du développement intellectuel en rapportant l’âge mental à l’âge chronologique.<br />

Ainsi, un enfant crédité de 12 ans d’âge mental dont l’âge chronologique est de 10 ans est caractérisé par un<br />

quotient de 12/10= 1,2. Terman multiplia ce quotient par 100 pour éviter les décimales, ce qui donne, dans notre<br />

exemple, un QI de (12/10) x 100 = 120. Avec cette méthode de calcul, le cas où l’âge mental est le même que<br />

l’âge chronologique, qui est la norme, correspond à un QI de 100.<br />

Ce quotient, qui sera désigné dans ce chapitre comme le QI de type Stern, avait un certain nombre<br />

d’inconvénients. Tel qu’il est évalué dans ce type de test, l’âge mental n’augmente plus après l’adolescence,<br />

alors que l’âge chronologique continue d’augmenter, ce qui rendrait absurde de calculer ainsi le QI d’adultes. Par<br />

ailleurs, le fait que la dispersion des QI ainsi calculés varie selon les âges rend la comparaison des QI obtenus à<br />

des âges différents problématiques. Ces différents problèmes rencontrés avec le QI de type Stern ont conduit<br />

Wechsler à proposer une méthode différente de quantification de la performance intellectuelle. Cette méthode<br />

consiste à simplement attribuer des points aux items réussis, puis à transformer la note globale ainsi obtenue en<br />

une variable à laquelle on assigne à chaque âge un écart-type identique et une moyenne de 100 (Wechsler a<br />

choisi un écart-type de 15 pour que cette variable se distribue autour de la moyenne 100 avec un ordre de<br />

grandeur comparable à l’écart-type moyen observé avec le QI de type Stern). Wechsler a conservé le terme de QI<br />

pour désigner cette variable qui n’est pourtant plus un quotient. Nous conviendrons dans ce chapitre d’appeler<br />

cette variable le QI de type Wechsler. Le QI de type Wechsler est celui qui est maintenant utilisé dans toutes les<br />

échelles de développement de l’intelligence. Son mode de calcul est présenté de façon un peu plus complète dans<br />

ce chapitre.<br />

Les deux méthodes de calcul du QI, celui de type Stern et celui de type Wechsler, ont en commun de<br />

faire une sommation globale des réussites aux différents types d’items que comporte le test (addition des<br />

nombres de mois d’âge mental dont sont crédités les différents items du test pour calculer l’âge mental dans la<br />

méthode de calcul du QI de type Stern, addition des scores obtenus aux différents sous-tests pour le QI de type<br />

Wechsler). Cette globalisation, par sommation, de réussites dans des tâches intellectuelles très variées, postule<br />

l’unicité de l’intelligence. C’est précisément une des caractéristiques du QI qui sont critiquées dans ce chapitre.<br />

10


Texte 5<br />

Blaison, C., Chassard, D., Kop, J. L., & Gana, K. (2006). L'IAT (Implicit Association Test) ou la mesure<br />

des cognitions sociales implicites ? Revue critique de la validité et des fondements théoriques des<br />

scores qu'il produit. L'Année Psychologique, 106, 305-335.


L’IAT (Implicit Association Test) ou la mesure<br />

des cognitions sociales implicites :<br />

Revue critique de la validité et des fondements<br />

théoriques des scores qu’il produit<br />

Christophe Blaison, Delphine Chassard, Jean-Luc Kop et Kamel Gana*<br />

Laboratoire de Psychologie Clinique et Cognitive, Laboratoire de Psychologie Lorrain, et<br />

Groupe d’Analyse Psychométrique des Conduites <strong>–</strong> Université Nancy 2<br />

RÉSUMÉ<br />

Récemment, dans le but de remédier aux limites des mesures par questionnaires<br />

(biais d’auto-présentation, capacités introspectives limitées),<br />

plusieurs mesures dites indirectes ont été développées. Parmi elles, le test<br />

des associations implicites (IAT, Greenwald, McGhee et Schwartz, 1998) est<br />

celui qui a suscité le plus d’intérêt et le plus de travaux : il est suffisamment<br />

flexible pour mesurer des concepts variés (attitude, personnalité, stéréotypes…),<br />

il fournit des scores fidèles et offre des résultats encourageants en<br />

termes de validité critérielle. Mais la validité de construit des scores de l’IAT<br />

est contestée, notamment parce que leur interprétation n’est pas univoque.<br />

Il en est de même pour l’interprétation des dissociations observées entre<br />

mesures directes (questionnaires) et mesures indirectes qui, en l’absence<br />

d’un cadre théorique solide, donne lieu à de multiples débats. Ces défauts<br />

de jeunesse des mesures indirectes ont toutefois le mérite de stimuler la<br />

créativité des chercheurs et d’offrir de nouvelles perspectives qui devraient<br />

déboucher sur de nouveaux outils, mieux fondés théoriquement.<br />

Implicit Association Test or the measure of implicit social cognition:<br />

a critical review of the validity and the theoretical basement<br />

of its scores<br />

ABSTRACT<br />

In order to remedy the limits of self-report measures (self-presentational biases, introspective<br />

limits…), several indirect measures have been developed. The Implicit Association<br />

Test (IAT, Greenwald, McGhee et Schwartz, 1998) is the one that has concentrated most<br />

interest and research: it is flexible enough to measure a broad range of constructs<br />

*Pr. Kamel Gana, Université Nancy 2, 3 Place Godefroy de Bouillon, 54015 Nancy Cedex.<br />

Kamel.gana@univ-nancy2.fr<br />

Notes des auteurs : l’ordre entre des deux premiers auteurs a été déterminé par tirage au sort.<br />

L’année psychologique, 2006, 106, 305-336


306<br />

L’année psychologique, 2006, 106, 305-336<br />

Christophe Blaison • Delphine Chassard • Jean-Luc Kop • Kamel Gana<br />

(attitude, personality, stereotypes…), and it produces reliable and encouraging criteria<br />

valid scores. But the construct validity of the IAT scores remains controversial because<br />

their interpretation is quite ambiguous. In the same vein, because of the lack of any strong<br />

theoretical background, the interpretation of the observed dissociations between direct<br />

(self-report) and indirect measures remains problematic. This leads to multiple discussions.<br />

These “youthful limits” however stimulate researchers’ creativity and open new<br />

perspectives which should lead to more theoretically grounded measures.<br />

1. INTRODUCTION<br />

Les construits propres à la cognition sociale tels que les attitudes, les stéréotypes,<br />

l’estime de soi ou le concept de soi sont le plus souvent appréhendés<br />

par des mesures auto-rapportées ( i.e. , directes). Les limites de ce type de<br />

mesures sont bien connues : elles dépendent à la fois de ce que les sujets<br />

veulent bien nous dire ( i.e. , biais d’auto-présentation) et de ce qu’ils peuvent<br />

nous dire ( i.e. , limites des capacités introspectives). Récemment, dans le but<br />

de remédier à ces limites, plusieurs mesures de type indirect, dont l’Implicit<br />

Association Test (ou IAT) (1) (Greenwald, McGhee et Schwartz, 1998), ont<br />

été développées et l’intérêt à leur égard n’a cessé d’augmenter.<br />

Ces mesures s’inscrivent dans le domaine de la cognition sociale implicite<br />

(Devos et Banaji, 2003) dont on verra les principaux paradigmes<br />

dans la première partie de cet article, ce qui nous permettra de mieux<br />

comprendre le contexte dans lequel l’IAT a été créé.<br />

Dans les deux parties suivantes, notre objectif sera de présenter une synthèse<br />

des travaux portant tant sur les caractéristiques méthodologiques de<br />

l’IAT (partie 2) que sur ses fondements théoriques (partie 3), avec pour<br />

objectif de fournir aux lecteurs francophones une vue d’ensemble des<br />

débats soulevés par l’IAT, ce qui devrait aider à une utilisation appropriée<br />

de ce nouvel instrument.<br />

Dans la seconde partie, nous présenterons donc en détail l’IAT parce que<br />

c’est celui qui a suscité le plus d’intérêt, d’enthousiasme mais aussi le plus<br />

de critiques dès sa première publication. Nous évoquerons le principe sur<br />

lequel repose l’IAT ainsi que ses propriétés psychométriques.<br />

Les limites<br />

potentielles de l’IAT seront ensuite abordées à travers les critiques théoriques<br />

et méthodologiques qui lui ont été adressées avant de présenter les<br />

nouveaux instruments développés pour tenter d’y remédier.<br />

Dans la troisième et dernière partie, nous reviendrons plus spécifiquement<br />

sur les problèmes théoriques posés par l’IAT et notamment sur les<br />

difficultés soulevées par les études de validité, celles-ci conduisant à<br />

s’interroger sur la nature même des construits appréhendés par cet outil.


Validité et fondements théoriques des scores IAT<br />

2. LA COGNITION SOCIALE IMPLICITE<br />

ET SON OPÉRATIONNALISATION<br />

Les avancées scientifiques dans le domaine de la cognition humaine ont<br />

permis à la psychologie de commencer à étudier de façon prometteuse,<br />

d’une part, les processus mentaux inconscients (Jacoby et Kelley, 1987 ;<br />

Jacoby, Toth et Yonelinas, 1993), voire, d’autre part, l’“inconscient psychologique”<br />

des individus (Kihlstrom, Barnhardt et Tataryn 1992 ;<br />

Kihlstrom, Mulvaney, Tobias et Tobis, 2000). Derrière cette expression<br />

d’“inconscient psychologique”, se cache l’idée selon laquelle nos pensées,<br />

notre expérience et nos actes conscients pourraient être influencés par des<br />

perceptions, des souvenirs et autres contenus mentaux dont nous<br />

n’aurions pas conscience et qui seraient indépendants de tout contrôle<br />

volontaire. Si Kihlstrom et al. (2000) parlent volontiers d’« inconscient<br />

psychologique », d’autres préfèrent à ces termes ceux de cognition implicite,<br />

postulant que nos comportements ainsi que nos jugements peuvent<br />

être influencés par des expériences passées sans que nous n’ayons<br />

conscience de cette influence ni que nous nous rappelions cette expérience<br />

(Greenwald et Banaji, 1995). La notion de cognition implicite<br />

marque une avancée supplémentaire dans le domaine de la cognition par<br />

rapport à celle <strong>–</strong> plus ancienne <strong>–</strong> d’automaticité selon laquelle certains de<br />

nos savoir-faire moteurs et cognitifs peuvent, grâce à une pratique intensive,<br />

devenir automatiques et donc rendre les procédures ou les<br />

opérations sous-jacentes inaccessibles à l’introspection (Kihlstrom et al. ,<br />

2000). En effet, alors que la notion d’automaticité fait exclusivement référence<br />

à des processus mentaux dont nous n’aurions pas conscience, celle<br />

de cognition implicite laisse entrevoir la possibilité d’étendre cette idée<br />

aux contenus mentaux associés à ces processus.<br />

Depuis ces dernières années, le concept de cognition implicite a largement<br />

été diffusé. En témoigne le nombre important de travaux publiés<br />

portant sur la mémoire implicite, l’apprentissage implicite, la perception<br />

implicite ou sur les pensées implicites (cf. Kihlstrom et al. , 2000).<br />

En 1995, Greenwald et Banaji proposent de s’intéresser plus spécifiquement<br />

à l’étude des différences individuelles dans le domaine de la<br />

cognition sociale implicite, notamment aux attitudes, aux stéréotypes, à<br />

l’estime de soi et, plus tard (Greenwald et al. , 1998), au concept de soi. De<br />

façon générale, ces auteurs définissent un construit implicite comme une<br />

trace de notre expérience passée non identifiable de façon introspective<br />

(ou identifiée de manière imprécise, voire incorrecte) capable<br />

d’influencer nos sentiments, nos pensées et nos actions envers divers<br />

307<br />

L’année psychologique, 2006, 106, 305-336


308<br />

L’année psychologique, 2006, 106, 305-336<br />

Christophe Blaison • Delphine Chassard • Jean-Luc Kop • Kamel Gana<br />

objets sociaux (Greenwald et Banaji, 1995, p. 5). Dès lors, l’étude des différences<br />

individuelles dans le domaine de la cognition sociale implicite se<br />

heurte au problème de la mesure des construits implicites. Si l’on considère<br />

effectivement que ces derniers sont des traces en mémoire non<br />

identifiables de façon introspective, il n’est pas envisageable de les appréhender<br />

à l’aide de mesures auto-rapportées ( i.e. , directes) puisque cellesci<br />

dépendent des limites des capacités introspectives des sujets (Nisbett et<br />

Wilson, 1977). Il faut donc avoir recours à des instruments qui ne requièrent<br />

pas de réponses auto-rapportées (Greenwald et Banaji, 1995),<br />

autrement dit à des mesures appelées indirectes.<br />

S’inspirant de toute sorte de paradigmes expérimentaux, Greenwald (cf.<br />

Dasgupta, Greenwald et Banaji, 2003) s’est alors lancé dans une série<br />

d’études ayant pour but de mettre au point un instrument de mesure<br />

susceptible d’appréhender des construits implicites tout en produisant<br />

des scores satisfaisants d’un point de vue psychométrique. De cette série<br />

d’études est né l’ Implicit Association Test (ou IAT ; Greenwald et al. ,<br />

1998). L’IAT emprunte le paradigme expérimental classique des temps<br />

de réponse (« response time paradigm ») dont le Stroop,<br />

le Simon Task ou<br />

l’amorçage sémantique sont l’illustration (Chassard et Kop, 2003), et<br />

qui stipule que les temps de réponse d’un sujet à un certain matériel<br />

dépendent des structures cognitives spécifiques qu’il entretient à propos<br />

du monde ou de lui-même. Plus tard, ce paradigme a été adapté pour<br />

être utilisé dans des champs d’étude plus conatifs avec des stimuli<br />

chargés émotionnellement, permettant ainsi l’étude des processus automatiques<br />

d’évaluation (Musch et Klauer, 2003) comme, par exemple, le<br />

Stroop émotionnel (Pratto et John, 1991) ou le paradigme d’amorçage<br />

affectif (Fazio, Sanbonmatsu, Powell et Kardes, 1986). Dans sa forme<br />

originale, le paradigme d’amorçage affectif montre que les sujets traitent<br />

plus rapidement une cible affectivement polarisée quand elle est précédée<br />

d’une amorce de même valence ( e.g. , « amour » précédé de<br />

« joie ») que lorsqu’elle est précédée d’une amorce de valence opposée<br />

( e.g. , « amour » précédé de « torture »). Enfin, certains chercheurs ( e.g. ,<br />

Banse, 1999) ont eu l’idée d’utiliser la variabilité interindividuelle<br />

relevée dans ces nouvelles tâches pour en faire des mesures <strong>–</strong> au sens<br />

psychométrique du terme <strong>–</strong> indirectes d’attitudes, la logique étant que si<br />

les sujets ont une attitude positive envers un objet présenté comme<br />

amorce, ils doivent identifier plus rapidement la valence de cibles positives<br />

que la valence de cibles négatives et inversement s’ils ont une<br />

attitude négative. Cependant, la fidélité observée pour de telles mesures<br />

restant très faible (Bosson, Swann et Pennebaker, 2000), les tentatives<br />

de mesure des différences individuelles sont restées peu satisfaisantes.


Validité et fondements théoriques des scores IAT<br />

C’est donc principalement pour remédier à ce problème que l’IAT a été<br />

développé (Greenwald et al. , 1998).<br />

3. LE TEST DES ASSOCIATIONS IMPLICITES (IAT)<br />

3.1. Principes de base et modalités d’administration<br />

Nous empruntons à Greenwald et Farnham (2000) une illustration évocatrice<br />

du principe sur lequel repose l’IAT. Supposez que vous ayez à trier<br />

un jeu de 52 cartes en deux tas situés à votre gauche et à votre droite. Il<br />

vous sera probablement plus facile de classer les piques et les trèfles d’un<br />

côté et les cœurs et carreaux de l’autre, que de classer piques et cœurs<br />

d’un côté et trèfles et carreaux de l’autre. Cette facilité accrue est due au<br />

fait que les piques et les trèfles d’une part et les cœurs et les carreaux<br />

d’autre part “vont bien ensemble” : ils partagent respectivement un même<br />

attribut, ici la couleur. S’inspirant de cette idée, le principe général de<br />

l’IAT repose sur le fait qu’il est plus facile de classer ensemble des items<br />

cognitifs lorsque les groupements à réaliser sont cohérents avec ceux que<br />

l’on adopte spontanément du fait de notre manière particulière d’organiser<br />

l’information. Par exemple, par rapport à la population générale, un<br />

joueur de bridge s’empresserait d’infirmer l’observation faite plus haut,<br />

car pour lui ce sont d’une part les cœurs et les piques et de l’autre les carreaux<br />

et les trèfles qui vont le mieux ensemble ; pour ce joueur,<br />

l’association entre les familles de cartes n’est plus spontanément créée par<br />

la couleur mais par un autre attribut acquis à travers la pratique du<br />

bridge. L’IAT se veut donc être une méthode de mesure indirecte de la force<br />

relative des associations entre différents concepts<br />

309<br />

(Greenwald, Banaji,<br />

Rudman, Farnham, Nosek et Mellott, 2002).<br />

Afin de décrire plus précisément les applications de l’IAT, nous prendrons<br />

l’exemple d’un IAT censé mesurer l’estime de soi. Par son<br />

entremise, on mesure la force d’association entre le concept de soi et les<br />

deux valences affectives positive et négative. Cette application fait intervenir<br />

deux concepts dits cibles : « Moi » vs. « Pas moi » et deux concepts<br />

dits attributs : « Agréable » vs. « Désagréable ». Le sujet de l’expérience est<br />

assis en face d’un ordinateur muni d’un clavier dont il ne doit utiliser que<br />

deux touches, l’une à gauche, l’autre à droite. La procédure comporte<br />

cinq étapes dans lesquelles on lui demande de classer aussi vite que possible,<br />

tout en faisant le minimum d’erreurs, des stimuli exemplifiant les<br />

L’année psychologique, 2006, 106, 305-336


310<br />

L’année psychologique, 2006, 106, 305-336<br />

Christophe Blaison • Delphine Chassard • Jean-Luc Kop • Kamel Gana<br />

concepts-cibles et les concepts-attributs. Le tableau I résume le contenu<br />

de ces cinq étapes (ou blocs d’items) détaillées ci-dessous.<br />

Étape 1 <strong>–</strong> Des items appartenant aux deux concepts-cibles apparaissent<br />

les uns après les autres sur l’écran. Lorsque les items renvoient au<br />

concept-cible « Moi » ( e.g., « je », « mien », « mon »), le sujet doit appuyer<br />

sur une touche du côté droit du clavier ; lorsqu’ils renvoient au conceptcible<br />

« Pas moi » ( e.g. , « ils », « leurs », « il »), le sujet doit appuyer sur une<br />

touche située du côté gauche du clavier.<br />

Étape 2 <strong>–</strong> Les sujets doivent classer des items appartenant aux deux<br />

concepts-attributs. Lorsqu’ils renvoient au concept-attribut « Agréable »<br />

( e.g. , « sourire », « plaisir », « joie »), le sujet doit appuyer sur une touche<br />

du côté droit du clavier ; lorsqu’ils renvoient au concept-attribut « Désagréable<br />

» ( e.g. , « mort », « poison », « vomi »), le sujet doit appuyer sur<br />

une touche située du côté gauche du clavier.<br />

er<br />

Étape 3 (1 bloc-test) <strong>–</strong> Les deux tâches précédentes sont présentées<br />

conjointement, les items à classer sont donc soit des exemplaires des<br />

concepts-cibles ( e.g. , « je », « ils ») soit des exemplaires de conceptsattributs<br />

( e.g. , « sourire », « mort »). Lorsqu’ils renvoient soit au conceptcible<br />

« Moi », soit au concept-attribut « Agréable », le sujet doit appuyer<br />

sur une touche du côté droit du clavier ; lorsqu’ils renvoient soit au<br />

concept-cible « Pas moi », soit au concept-attribut « Désagréable », le<br />

sujet doit appuyer sur une touche située du côté gauche du clavier.<br />

Étape 4 <strong>–</strong> Les sujets doivent à nouveau classer des items appartenant aux<br />

deux concepts-cibles (cf. étape 1) mais les touches à utiliser pour classer<br />

les exemplaires sont inversées (gauche pour « Moi », droite pour « Pas<br />

moi »).<br />

e Étape 5 (2 bloc-test) <strong>–</strong> Cette dernière étape repose sur le même principe<br />

e que la 3 étape mais les sujets doivent cette fois appuyer sur une touche<br />

située du côté droit du clavier lorsque apparaissent des items renvoyant<br />

soit au concept-cible « Pas Moi », soit au concept-attribut « Agréable » ; et<br />

du côté gauche lorsque apparaissent des items renvoyant soit au conceptcible<br />

« Moi », soit au concept-attribut « Désagréable ».<br />

La mesure résultante de la procédure ( IAT effect ou effet IAT) repose sur<br />

la comparaison entre la force combinée des associations « Pas moi <strong>–</strong> Désa-<br />

er<br />

gréable » et « Moi <strong>–</strong> Agréable » (1 bloc-test, étape 3) et la force combinée des<br />

e<br />

associations « Moi <strong>–</strong> Désagréable » et « Pas moi <strong>–</strong> Agréable » (2 bloc-test,<br />

étape 5). Seules les étapes 3 et 5 sont donc prises en compte lors de l’analyse<br />

des résultats, l’effet IAT s’exprimant par la différence de temps de<br />

réponses entre les deux blocs-tests.<br />

Si un sujet répond plus rapidement aux<br />

items du premier bloc-test qu’aux items du second bloc-test, on en déduit<br />

qu’il associe plus fortement « Moi » et « Agréable » que « Moi » et « Désa-


Validité et fondements théoriques des scores IAT<br />

Tableau I. llustration des cinq étapes d’un IAT d’estime de soi<br />

Étapes/Blocs<br />

Table I. Five constitutive steps of a self-esteem IAT<br />

Presser<br />

Touche gauche<br />

Presser<br />

Touche droite<br />

1 Pas moi Moi<br />

2 Désagréable Agréable<br />

3 <strong>–</strong> 1 er bloc-test Pas moi ou Désagréable Moi ou Agréable<br />

4 Moi Pas moi<br />

5 <strong>–</strong> 2e bloc-test Moi ou Désagréable Pas moi ou Agréable<br />

gréable » ; et on en infère qu’il possède une estime de soi plus élevée par<br />

rapport à un sujet qui est plus rapide au second bloc-test qu’au premier.<br />

L’IAT est capable d’évaluer d’autres caractéristiques psychologiques, car<br />

son mode de construction en fait un outil très flexible. D’une part, les<br />

stimuli servant à sa construction peuvent être langagiers, picturaux,<br />

sonores ou des combinaisons de ces différentes modalités. D’autre part, le<br />

couplage judicieux de certains concepts-cibles et de certains conceptsattributs,<br />

permet théoriquement d’évaluer des attitudes, des stéréotypes<br />

ou des caractéristiques de personnalité (Greenwald et al. , 2002). Par<br />

exemple, si l’on définit une attitude comme l’association entre un objet<br />

social et un attribut valencé (positif ou négatif) (Fazio, Williams et<br />

Powell, 2000 ; Greenwald et al. , 2002), il est possible grâce à l’IAT de<br />

mesurer l’attitude envers des individus de couleur en sélectionnant les<br />

concepts-cibles « Blancs » vs. « Noirs » et les concepts-attributs<br />

« Agréable » vs. « Désagréable ». Si un sujet est plus rapide dans le bloc où<br />

les concepts « Blancs » et « Agréable » (respectivement, « Noirs » et<br />

« Désagréable ») sont associés à une même touche de réponse que dans<br />

celui où sont associés « Noirs » et « Agréable » (respectivement, « Blancs »<br />

et « Désagréable »), alors on en infère qu’il possède une attitude positive<br />

envers les Blancs et négative envers les Noirs. En poursuivant cette stratégie,<br />

on peut envisager un stéréotype comme l’association entre un<br />

groupe social et un ou plusieurs attributs non-valencés ( e.g. , cibles :<br />

« Hommes » vs. « Femmes », attributs : « Mathématiques » vs. « Arts »).<br />

Enfin, une caractéristique personnelle de personnalité peut être assimilée<br />

à l’association entre le concept de soi et un attribut non-valencé ( e.g. ,<br />

cibles : « Moi » vs. « Pas moi », attributs : « Introverti » vs. « Extraverti »).<br />

311<br />

L’année psychologique, 2006, 106, 305-336


312<br />

L’année psychologique, 2006, 106, 305-336<br />

Christophe Blaison • Delphine Chassard • Jean-Luc Kop • Kamel Gana<br />

Cette flexibilité a permis d’étendre l’utilisation de l’IAT à de nombreux<br />

domaines. Il existe par exemple des études sur les attitudes ( e.g. , Karpinski<br />

et Hilton, 2001 ; Jelenec et Steffens, 2002 ; Palfai et Ostafin, 2003 ;<br />

DeJong, Van den Hout, Rietbroek et Huijding, 2003), les stéréotypes ( e.g. ,<br />

Nosek, Banaji et Greenwald, 2002a ; Nosek, Banaji et Greenwald, 2002b),<br />

la catégorisation sociale (Piontkowski, Blanz, Rohman, Schmermund et<br />

Florack, 2001), l’estime de soi ( e.g. , Bosson et al. , 2000 ; Greenwald et Farnham,<br />

2000), la timidité ( e.g. , Asendorpf, Banse et Mücke, 2002),<br />

l’affectivité positive et négative (Blaison et Gana, 2004), les cinq dimensions<br />

de personnalité (OCEAN) (Steffens, 2004), la dépression ( e.g. ,<br />

Gemar, Segal, Sagrati et Kennedy, 2001), l’anxiété ( e.g, Egloff et Schmukle,<br />

2002), l’anxiété sociale (De Jong, 2002), la phobie des animaux<br />

(Teachman, Gregg et Woody, 2001), le conditionnement évaluatif (Mitchell,<br />

Anderson et Lovibond, 2003a).<br />

3.2. Fidélité<br />

Développé principalement dans le but de remédier au manque de fidélité<br />

des scores obtenus par des outils tels que le Stroop émotionnel ou l’amorçage<br />

affectif, l’IAT a réussi son pari. Comme il permet d’obtenir des tailles<br />

d’effet importantes <strong>–</strong> dès 1998, Greenwald et al. rapportent une taille d’effet<br />

IAT (d ≈ 1.21)(2) deux fois supérieure à celle de l’amorçage (d ≈ 0.62) <strong>–</strong> il<br />

devient possible d’envisager une mesure offrant des scores fidèles des différences<br />

individuelles, ce que l’on constate effectivement avec l’IAT. Quel que<br />

soit l’objet mesuré, l’IAT montre une bonne consistance interne ( α de<br />

Cronbach ≈ 0.80), comparable à celle des mesures directes correspondantes<br />

(Bosson et al. , 2000 ; Banse, Seise et Zerbes, 2001 ; Cunningham, Preacher<br />

et Banaji, 2001 ; Egloff et Schmukle, 2002) (3). Sa stabilité temporelle (fidélité<br />

test-retest), bien que modérée (r ≈ 0.60), dépasse largement celle<br />

d’autres mesures indirectes (Bosson et al. , 2000 ; Dasgupta et Greenwald,<br />

2001 ; Greenwald et Nosek, 2001).<br />

3.3. Éléments de validation<br />

Les mesures utilisant l’IAT permettent généralement d’obtenir, au niveau<br />

du groupe, des différences d’attitude conformes à ce qui est attendu.<br />

Ainsi, un favoritisme envers l’endogroupe a pu être détecté, et ce, aussi<br />

bien avec des groupes réels (Greenwald et al. , 1998) qu’en utilisant le<br />

paradigme des groupes minimaux (Ashburn-Nardo, Voils et Monteith,<br />

2001). Hummert, Gartska, O’Brien, Greenwald et Mellott (2002) ont


Validité et fondements théoriques des scores IAT<br />

montré que les personnes âgées avaient, comparativement à de jeunes<br />

adultes, une attitude plus favorable envers les jeunes et une estime de soi<br />

plus élevée. Nosek et al. (2002a) ont montré que les garçons avaient une<br />

attitude plus favorable envers les disciplines scientifiques que les filles.<br />

Gemar et al. (2001) ont montré que des sujets récemment sortis de<br />

dépression avaient une attitude plus négative envers eux-mêmes que des<br />

sujets sains. Dans un autre domaine, Teachman et al. (2001) ont pu différencier<br />

des sujets arachnophobes de sujets ayant la phobie des serpents :<br />

les sujets arachnophobes ont une attitude plus négative envers les araignées<br />

et plus positive envers les serpents alors que c’est l’inverse chez les<br />

sujets ayant la phobie des serpents. Citons aussi DeJong (2002), qui a<br />

montré que des sujets anxieux avaient une estime de soi plus faible que<br />

des sujets non-anxieux, Swanson, Rudman et Greenwald (2001) qui ont<br />

établi que des végétariens avaient une attitude plus positive envers les légumes<br />

et les fruits et plus négative envers la viande que des non-végétariens ou<br />

Banse et al. (2001) qui ont mis en évidence, chez des sujets homosexuels,<br />

comparativement à des hétérosexuels, une attitude plus positive envers<br />

l’homosexualité, etc.<br />

Les résultats concernant la validité critérielle des scores des différentes<br />

applications de l’IAT sont, eux aussi encourageants (Poehlman, Uhlman,<br />

Greenwald et Banaji, 2005) même s’ils restent peu nombreux. Ainsi,<br />

Phelps et al. (2000) ont pu mettre en évidence une relation entre une<br />

mesure IAT d’attitudes raciales (« Blancs » vs. « Noirs ») et l’intensité de<br />

l’activation de l’amygdale (évaluée par IRMf) lorsqu’un visage blanc ou<br />

noir est présenté au sujet. Greenwald et Farnham (2000) ont montré<br />

qu’un IAT d’estime de soi prédisait les réactions des sujets après un feedback<br />

positif ou négatif (les sujets ayant une forte estime de soi semblent<br />

moins affectés par un feed-back négatif). Asendorpf et al. (2002) ont,<br />

quant à eux, observé qu’un IAT de timidité prédisait davantage les comportements<br />

de timidité spontanée ( e.g. , position et tension corporelle) qu’une<br />

mesure directe de timidité, alors que cette dernière est davantage corrélée<br />

aux comportements contrôlés de timidité ( e.g., durée d’une prise de<br />

parole en public).<br />

Tout comme d’autres mesures élaborées essentiellement sur des bases<br />

empiriques, celles utilisant l’IAT connaissent de sérieuses difficultés<br />

lorsqu’il s’agit d’apprécier la validité de construit des scores qu’elles produisent.<br />

Dès les premières applications de l’IAT, on a cherché à établir le<br />

niveau de relation entre la mesure directe d’un concept et la mesure indirecte<br />

de ce même concept (voir, par exemple, Greenwald et Nosek, 2001 ;<br />

Nosek et al. , 2002b ; Fazio et Olson, 2003). Dans l’ensemble, les corrélations<br />

obtenues sont plutôt faibles (r < .30 ; Hofman, Gawronski,<br />

313<br />

L’année psychologique, 2006, 106, 305-336


314 Christophe Blaison • Delphine Chassard • Jean-Luc Kop • Kamel Gana<br />

Gschwendner, Le et Schmitt, 2005), même si l’on a pu constater quelques<br />

exceptions pour certains construits. L’interprétation de ces dissociations<br />

entre mesures directes et mesures indirectes reste toutefois ambiguë<br />

puisqu’on peut soit retenir ce résultat comme montrant la faillite du<br />

paradigme (pour absence de validité convergente), soit l’utiliser pour<br />

attester de l’absence de contamination des mesures indirectes par les biais<br />

inhérents aux mesures directes. Rapidement esquissée, cette controverse<br />

amène à s’interroger sur ce que mesure réellement un paradigme comme<br />

l’IAT. C’est à cette question qu’est consacrée la majeure partie de la suite<br />

de cet article.<br />

3.4. Les limites : l’interprétation équivoque de l’effet IAT<br />

À un niveau strictement opératoire, l’effet IAT n’est qu’une différence de<br />

temps de réponse entre les deux blocs-tests de la procédure. On a d’abord<br />

considéré que cette différence reflétait des associations privilégiées entre<br />

concepts et attributs pouvant s’interpréter, selon le cas, comme des attitudes,<br />

des stéréotypes ou encore des représentations de soi. Ces<br />

interprétations <strong>–</strong> que l’on désignera par l’expression « interprétation<br />

naïve » <strong>–</strong> sont loin d’être aussi univoques qu’elles ne le paraissaient, et<br />

plusieurs éléments théoriques et/ou empiriques incitent aujourd’hui à<br />

davantage de prudence. Dans les points qui vont suivre, nous présentons<br />

les questionnements majeurs quant à l’interprétation d’un score IAT,<br />

ainsi que les garde-fous et/ou les raffinements méthodologiques permettant<br />

d’y répondre.<br />

Premièrement, la mesure IAT est une mesure d’associations relatives (De<br />

Houwer, 2002). Prenons pour illustrer un IAT censé appréhender les attitudes<br />

raciales (utilisant les cibles « Blancs » vs. « Noirs » et les attributs<br />

« Agréable » vs. « Désagréable »). Supposons qu’un sujet soit plus rapide<br />

dans le bloc où les catégories « Blancs » et « Agréable » (respectivement<br />

« Noirs » et « Désagréable ») partagent la même touche de réponse que<br />

dans le bloc où les catégories « Noirs » et « Agréable » (respectivement<br />

« Blancs » et « Désagréable ») sont associées. Tout ce que l’on peut dire,<br />

c’est que l’association « Blancs <strong>–</strong> Agréable » ou l’association « Noirs <strong>–</strong><br />

Désagréable » est plus forte que l’association « Blancs <strong>–</strong> Désagréable » ou<br />

plus forte que l’association « Noirs <strong>–</strong> Agréable ». Et, pour inférer de ce<br />

résultat que le sujet a une attitude positive envers les Blancs et négative<br />

envers les Noirs, il faut supposer que les deux premières associations sont<br />

fortement établies et que les secondes sont faibles ou inexistantes. On<br />

observerait toutefois les mêmes résultats : a) si le sujet avait une attitude<br />

positive envers les Blancs et neutre vis-à-vis des Noirs (i.e., l’association<br />

L’année psychologique, 2006, 106, 305-336


Validité et fondements théoriques des scores IAT 315<br />

« Noirs <strong>–</strong> Agréable » est du même ordre de grandeur que l’association<br />

« Noirs <strong>–</strong> Désagréable ») ; b) ou s’il avait une attitude neutre envers les<br />

Blancs (i.e., même intensité des associations « Blancs <strong>–</strong> Agréable » et<br />

« Blancs <strong>–</strong> Désagréable ») et une attitude négative vis-à-vis des Noirs (i.e.,<br />

association « Noirs <strong>–</strong> Désagréable » plus intense que l’association<br />

« Noirs <strong>–</strong> Agréable »). Pour trancher entre ces différentes interprétations,<br />

il faudrait connaître le niveau absolu de l’une des associations, ce qui n’est<br />

pas possible à l’intérieur du paradigme IAT, même si l’on essaie de<br />

contourner la difficulté en intégrant une catégorie supposée neutre. Les<br />

résultats obtenus dans cette perspective par Brendl, Markman et Messner<br />

(2001) montrent toute l’importance de cette relativité. Dans un premier<br />

temps, ces auteurs répliquent le résultat princeps de Greenwald et al.<br />

(1998) : les associations « Fleurs <strong>–</strong> Agréable » et « Insectes <strong>–</strong> Désagréable »<br />

donnent lieu en moyenne à des réponses plus rapides que les associations<br />

« Fleurs <strong>–</strong> Désagréable » et « Insectes <strong>–</strong> Agréable », ce qui est d’habitude<br />

interprété comme indiquant une attitude favorable vis-à-vis des fleurs et<br />

négative envers les insectes. Dans un second temps, les noms de fleurs ont<br />

été remplacés par des mots sans signification (catégorie « Pseudo-mots »),<br />

supposés affectivement neutres, le reste du matériel étant identique à<br />

celui de la première expérience. On observe alors que les associations<br />

« Insectes <strong>–</strong> Agréable » et « Pseudo-mots <strong>–</strong> Désagréable » donnent lieu à<br />

des réponses plus rapides que les associations « Insectes <strong>–</strong> Désagréable » et<br />

« Pseudo-mots <strong>–</strong> Agréable », ce qui, si l’on s’en tient à l’interprétation<br />

naïve, signifierait cette fois, qu’en général, les individus ont une attitude<br />

positive vis-à-vis des insectes et négative envers les pseudo-mots ! Cette<br />

étude illustre ainsi la relativité des mesures d’association révélées par<br />

l’IAT, et insiste donc sur le fait que l’appréciation d’un concept-cible est<br />

fortement dépendante de l’autre concept-cible utilisé. Ainsi, même<br />

lorsque l’application d’une méthode analytique afin d’évaluer une association<br />

absolue entre une seule cible et ses attributs semble séduisante, il<br />

est fortement déconseillé de calculer un effet IAT sur la base des temps de<br />

réponse aux exemplaires d’un seul concept-cible et de ses attributs (i.e.,<br />

soustraction des moyennes des temps de réponse à « Fleurs » et<br />

« Agréable » dans le premier bloc, de la moyenne des temps de réponse à<br />

« Fleurs » et « Désagréable » dans le deuxième bloc) (Nosek, Greenwald et<br />

Banaji, étude 1, 2005a).<br />

Néanmoins, le fait que l’IAT ne permettrait que la mesure d’associations<br />

relatives n’est pas forcément problématique. En fait, que cela pose problème<br />

ou non dépend avant tout de ce que l’on cherche à appréhender.<br />

Par exemple, si l’on recourt à un IAT « Fleurs/Insectes » dans le but de<br />

situer des sujets les uns par rapport aux autres selon leur attitude envers<br />

L’année psychologique, 2006, 106, 305-336


316 Christophe Blaison • Delphine Chassard • Jean-Luc Kop • Kamel Gana<br />

les fleurs, le problème de la mesure d’associations relatives se pose alors<br />

dans le sens où les différences de scores entre les sujets ne reflètent pas<br />

forcément leur différence d’attitude envers les fleurs (e.g. des sujets ayant<br />

la même attitude envers les fleurs peuvent obtenir des scores IAT<br />

« Fleurs/Insectes » différents et des sujets obtenant le même score IAT<br />

peuvent avoir des attitudes différentes envers les fleurs). Par contre, si<br />

l’on cherche à situer des sujets les uns par rapport aux autres selon leur<br />

préférence pour les fleurs ou les insectes, alors le problème de la mesure<br />

relative ne se pose plus, en ce sens que les différences de scores entre les<br />

sujets devraient refléter leur niveau de préférence pour les fleurs ou les<br />

insectes (e.g. un effet IAT négatif indique une préférence pour les insectes<br />

par rapport aux fleurs, un effet IAT nul indique une absence de préférence,<br />

un effet IAT positif indique une préférence pour les fleurs par<br />

rapport aux insectes ; et plus l’effet est élevé, en valeur absolue, plus la<br />

préférence est marquée).<br />

Deuxièmement, il n’est pas certain que ce soient toujours les associations<br />

entre concepts-cibles et concepts-attributs qui soient pertinentes dans<br />

l’effet IAT, alors que c’est sur celles-ci que repose l’interprétation naïve.<br />

Dans la plupart des applications habituelles, la valence des concepts-cibles<br />

est confondue avec la valence des exemplaires qui les représentent (dans<br />

un IAT « Fleurs vs. Insectes », tous les noms de fleurs utilisés évoquent<br />

des représentations positives, tous les noms d’insectes utilisés évoquent<br />

des représentations négatives). De Houwer (2001) a essayé de rendre<br />

indépendantes la valence des cibles et celle de leurs exemplaires. Ainsi,<br />

dans un IAT « Anglais vs. Étrangers » réalisé en Grande-Bretagne, les<br />

exemplaires de chaque concept-cible sont pour moitié des personnes<br />

appréciées et, pour moitié, des personnes supposées détestées (e.g., respectivement<br />

« Ghandi » et « Hitler » pour la cible « Étrangers »). Les<br />

résultats obtenus semblent indiquer que les concepts-cibles priment sur<br />

les exemplaires, c’est-à-dire que l’on observe bien un effet IAT interprété<br />

comme une préférence envers l’endogroupe. Mais ce n’est pas toujours le<br />

cas : dans certaines situations, la valence des exemplaires peut contribuer<br />

à moduler l’effet IAT (Mitchell, Nosek et Banaji, 2003b), voire à l’expliquer<br />

totalement lorsque les concepts-cibles n’ont pas de valence marquée<br />

(De Houwer, 2001). L’effet IAT serait donc non seulement relatif aux<br />

concepts-cibles utilisés, mais aussi aux exemplaires choisis pour les représenter.<br />

Cette question étant néanmoins bien traitée dans la littérature, il<br />

est possible d’éviter les écueils d’interprétation qui lui sont liés pour peu<br />

que l’on respecte certaines règles établies de choix d’exemplaires. On peut<br />

trouver une belle synthèse méthodologique concernant le rationnel de ce<br />

choix dans Nosek, Greenwald et Banaji (2005b).<br />

L’année psychologique, 2006, 106, 305-336


Validité et fondements théoriques des scores IAT 317<br />

Troisièmement, les différences de temps de réponse mesurés aux deux<br />

blocs-tests de l’IAT pourraient refléter davantage la fréquence avec<br />

laquelle les sujets sont confrontés aux associations rencontrées dans leur<br />

environnement plutôt que l’attitude individuelle que l’on infère souvent.<br />

Si l’on suit, par exemple, le raisonnement de Karpinski et Hilton (2001),<br />

on peut considérer en effet que l’on a davantage d’occasions d’établir des<br />

associations stéréotypées « Blancs <strong>–</strong> Agréable » et « Noirs <strong>–</strong> Désagréable »<br />

que l’inverse (dans la culture américaine tout du moins). La familiarisation<br />

avec ces associations permettrait de traiter plus rapidement le bloc<br />

dans lequel elles sont présentées et l’on n’aurait alors nul besoin d’invoquer<br />

une quelconque attitude pour rendre compte des différences<br />

constatées. Certains scores d’attitude IAT sont compatibles avec cette<br />

hypothèse, notamment ceux qui montrent que les fumeurs ont une attitude<br />

aussi négative envers le tabac que les non-fumeurs (Swanson et al.,<br />

2001), ou bien qu’approximativement la moitié des Noirs américains ont<br />

une attitude plus positive vis-à-vis des Blancs que vis-à-vis des Noirs<br />

(Nosek et al., 2002b ; Banaji, 2001). En substance, l’idée qu’avancent Karpinski<br />

et Hilton (2001) ainsi que d’autres comme Olson et Fazio (2004),<br />

est que les associations « culturelles » ne nous appartiennent pas, et<br />

qu’elles parasitent de ce fait l’évaluation IAT des attitudes personnelles.<br />

Mais, avec Nosek et Hansen (2004), on pourrait réviser nos conceptions<br />

habituelles en considérant les attitudes automatiques (i.e., les attitudes<br />

telles qu’évaluées par l’IAT) comme des construits multidimensionnels<br />

dont l’une des nombreuses facettes serait forgée par un conditionnement<br />

culturel. Ce qui compterait alors, ce ne serait pas tant l’origine de l’attitude<br />

considérée, mais sa disponibilité, son accessibilité et son<br />

applicabilité dans un certain contexte (Nosek et Hansen, 2004).<br />

Quatrièmement, une autre explication de l’effet IAT met l’accent sur<br />

l’intervention de mécanismes de contrôle exécutif dont certains effets sur<br />

les temps de réponse seraient indépendants de la force d’association entre<br />

concepts et fausseraient par là l’interprétation des scores IAT (Mierke et<br />

Klauer, 2001, 2003 ; Klauer et Mierke, 2005). Comme le rappellent<br />

McFarland et Crouch (2002), on peut s’étonner que dès la première présentation<br />

de l’IAT (Greenwald et al., 1998), les auteurs trouvent une<br />

corrélation anormalement élevée (r = .58) entre les scores d’un IAT<br />

portant sur les concepts-cibles « Fleurs vs. Insectes » et ceux d’un IAT<br />

portant sur les concepts-cibles « Instruments de musique vs. Armes » (les<br />

attributs étant « Agréable » et « Désagréable » dans les deux cas) : l’attitude<br />

envers les fleurs serait ainsi assez fortement liée à l’attitude envers les<br />

instruments de musique. Obtenant des résultats similaires avec d’autres<br />

cibles dont on s’attend à ce qu’elles génèrent des attitudes indépendantes<br />

L’année psychologique, 2006, 106, 305-336


318 Christophe Blaison • Delphine Chassard • Jean-Luc Kop • Kamel Gana<br />

les unes des autres, McFarland et Crouch (2002) concluent alors que ces<br />

corrélations reflètent un effet de méthode qu’ils attribuent à la plus ou<br />

moins grande facilité avec laquelle les sujets sont capables de traiter le<br />

bloc-test dit incompatible, c’est-à-dire celui qui repose sur les associations<br />

les moins évidentes pour les sujets (et qui entraîne donc des temps de<br />

réponse en général plus longs). Mierke et Klauer (2001, 2003) proposent<br />

une explication cognitive élégante de cet effet faisant intervenir le coût de<br />

l’alternance entre deux tâches (“task switch cost”). Selon ces auteurs,<br />

confrontés au bloc compatible de l’IAT (celui dans lequel les associations<br />

sont les plus évidentes pour les sujets), les sujets pourraient simplifier la<br />

consigne qui leur demande de classer des stimuli soit en fonction des<br />

concepts-cibles (e.g., « Fleurs » vs. « Insectes »), soit en fonction des<br />

concepts-attributs (e.g., « Agréable » vs. « Désagréable »). Ainsi suffirait-il,<br />

dans le bloc où sont associés « Fleurs » et « Agréable » d’une part, et<br />

« Insectes » et « Désagréable » d’autre part, de ne classer qu’en fonction<br />

d’une seule dichotomie : « Agréable » vs. « Désagréable ». Cette simplification<br />

de deux tâches en une n’est plus possible dans le bloc incompatible<br />

(associations « Fleurs <strong>–</strong> Désagréable » et « Insectes <strong>–</strong> Agréable ») où la<br />

sélection de la réponse appropriée ne peut se faire qu’en fonction des<br />

deux dichotomies indiquées dans la consigne (i.e., « Fleurs » vs.<br />

« Insectes » et « Agréable » vs. « Désagréable »). Par exemple, lors du<br />

passage d’un exemplaire attribut à un exemplaire cible, le sujet doit<br />

inhiber la tendance de réponse maintenant non pertinente (classer selon<br />

la dichotomie « Agréable » vs. « Désagréable ») pour activer le schéma de<br />

réponse maintenant pertinent (classer selon la catégorie sémantique<br />

« Fleur » vs. « Insecte »). Cette alternance entre deux tâches entraînerait<br />

un coût cognitif supplémentaire dont l’importance serait propre à chaque<br />

individu et ce, quels que soient les concepts-cibles ou attributs à classer.<br />

C’est ici que s’infiltrerait une part de variabilité interindividuelle non<br />

désirée car indépendante de la force d’association entre concepts. Afin<br />

d’appuyer leur théorie, Mierke et Klauer (2001) rapportent les résultats<br />

d’études expérimentales montrant notamment que l’effet IAT diminue<br />

lorsqu’on fournit aux sujets, avant chaque essai, des indices permettant de<br />

diminuer le coût de l’alternance entre les tâches (cf. aussi l’étude de Dasgupta,<br />

McGhee, Greenwald et Banaji (2000) établissant que l’effet IAT est<br />

plus faible lorsqu’il s’agit de classer des photos que lorsqu’il s’agit de<br />

classer des noms, le premier classement étant jugé cognitivement moins<br />

complexe que le second). D’autres résultats semblent, eux aussi, apporter<br />

quelque crédit à cette hypothèse. Ainsi, Chee, Sriram, Soon et Lee (2000)<br />

observent, par IRMf, une activation des centres neuronaux impliqués<br />

dans l’inhibition lorsque des sujets réalisent un IAT ; Hummert et al.<br />

L’année psychologique, 2006, 106, 305-336


Validité et fondements théoriques des scores IAT 319<br />

(2002) parviennent à faire disparaître ou à atténuer certaines différences<br />

entre groupes d’âge lorsque la vitesse globale de traitement de l’information<br />

des sujets est contrôlée. Dans une perspective quelque peu différente,<br />

les observations mettant en évidence le rôle de l’apprentissage dans l’effet<br />

IAT peuvent aussi être lues à l’aune de l’hypothèse de Mierke et Klauer<br />

(2001). Ainsi, des études montrent que l’effet IAT est plus faible : lors<br />

d’une seconde passation comparativement à la première (Steffens et<br />

Buchner, 2003) ; quand on le calcule sur la seconde partie des items des<br />

blocs-tests par rapport au même calcul sur la première moitié des items<br />

(Marsh, Johnson et Scott-Sheldon, 2001) ; lorsque le bloc incompatible<br />

précède le bloc compatible (Greenwald et Nosek, 2001)(4). La présence<br />

de variabilité systématique de méthode dans les scores produits par l’IAT<br />

est donc bien établie. Ce pourrait être un coup sérieux porté à la validité<br />

des scores IAT si l’on n’avait pas récemment découvert une parade à ce<br />

problème. Signalons d’abord qu’il existe deux manières « canoniques » de<br />

calculer l’effet IAT : l’algorithme dit « amélioré » apparu en 2003<br />

(Greenwald et al., 2003) ; l’algorithme dit « conventionnel » (Greenwald<br />

et al., 1998), considéré comme dépassé. Une des particularités de l’algorithme<br />

amélioré est de calculer l’effet IAT en unité d’écart-type des temps<br />

de réponse sur l’ensemble des deux blocs qui composent l’IAT. Mierke et<br />

Klauer (2003) ont montré que parce qu’il prenait en compte la variabilité<br />

intraindividuelle des temps de réponse, le nouvel algorithme contrôle en<br />

fait la variabilité interindividuelle de flexibilité cognitive dont provient la<br />

part de variance systématique de méthode des scores IAT. Pour cette<br />

raison, et parmi d’autres (cf. Greenwald et al., 2003), il est fortement<br />

conseillé d’utiliser maintenant l’algorithme amélioré pour tout calcul<br />

d’effet IAT.<br />

Cinquièmement, en raison de la relation asymétrique entre une association<br />

et une attitude, il n’est pas toujours certain que les associations<br />

observées dans les IAT d’attitudes renvoient aux attitudes correspondantes.<br />

Pour Fiedler, Messner et Bluemke (2005)(5), le fait de définir une<br />

attitude comme une association entre un objet donné et une valence<br />

(positive ou négative) (Fazio, 1986 ; Greenwald et al., 2002) ne doit pas<br />

faire oublier qu’il n’y a aucune raison de postuler, comme on le fait habituellement,<br />

qu’il existe une relation symétrique entre ces deux concepts :<br />

si l’on peut effectivement modéliser une attitude par l’association entre<br />

un objet donné et une valence, toute association entre un objet donné et<br />

une valence observée dans un IAT n’est pas forcément le reflet d’une attitude.<br />

Il suffit pour cela que les sujets utilisent d’autres critères de<br />

classification que ceux indiqués par l’expérimentateur. Comme illustration<br />

un peu extrême, prenons l’exemple de De Houwer, Geldof et De<br />

L’année psychologique, 2006, 106, 305-336


320 Christophe Blaison • Delphine Chassard • Jean-Luc Kop • Kamel Gana<br />

Bruycker (2005) qui montre que les associations « Pizzas <strong>–</strong> Pièces de<br />

monnaie » et « Serpents <strong>–</strong> Rivières » donnent lieu à des réponses plus<br />

rapides que les associations « Pizzas <strong>–</strong> Rivières » et « Serpents <strong>–</strong> Pièces de<br />

monnaie ». Dans la première situation et afin de simplifier la tâche, les<br />

sujets utilisent probablement la similarité de forme entre les concepts,<br />

même si cette caractéristique n’a jamais été évoquée dans les consignes.<br />

D’autres caractéristiques non pertinentes du point de vue du chercheur<br />

peuvent être utilisées par les sujets. Par exemple, Rothermund et Wentura<br />

(2004) expliquent la relative facilité des associations « Insectes <strong>–</strong><br />

Agréable » et « Pseudo-mots <strong>–</strong> Désagréable » décrite supra par un modèle<br />

de saillance figure-fond. Selon ce dernier, les pseudo-mots (du fait de leur<br />

caractère étrange) et les attributs négatifs (e.g., « Désagréable ») (parce<br />

que les stimuli négatifs attirent davantage l’attention que les stimuli positifs,<br />

cf. Peeters, 1992) constituent des éléments saillants par rapport au<br />

fond constitué des attributs positifs et des exemplaires renvoyant à<br />

« Insectes ». Les associations peuvent se former ici suivant le degré de<br />

saillance du matériel à classer. D’où le fait que l’on observe une « attitude<br />

» favorable envers les insectes. En revanche, dans un IAT plus<br />

traditionnel (« Fleurs » vs. « Insectes » et « Agréable » vs. « Désagréable »),<br />

la catégorie « Désagréable » reste saillante par rapport à la catégorie<br />

« Agréable », mais cette fois-ci, la catégorie « Insectes » est plus saillante<br />

que la catégorie « Fleurs » (en raison de l’asymétrie entre concepts négatifs<br />

et positifs). L’association « Insectes <strong>–</strong> Désagréable » est dès lors<br />

facilitée, et on observe une « attitude » défavorable vis-à-vis des insectes.<br />

La « référence à soi » constituera un dernier exemple de critère de classification<br />

non pertinent du point de vue de l’expérimentateur. Dans un IAT<br />

« Blancs » vs. « Noirs » et « Agréable » vs. « Désagréable », un Blanc ayant<br />

une bonne estime de lui-même peut réduire la difficulté de la tâche en<br />

utilisant le fait que les stimuli de personnes blanches font référence à soi<br />

(car c’est une de ses caractéristiques propres) tout comme les stimuli de la<br />

caractéristique « Agréable » si elle possède une estime de soi élevée. Pour<br />

cette personne, l’association « Blancs <strong>–</strong> Agréable » va donner lieu à des<br />

réponses plus rapides, qui risquent d’être interprétées, à tort, comme un<br />

indicateur d’attitude favorable envers les Blancs et défavorable envers les<br />

Noirs.<br />

En fait, n’importe quelle ressemblance suscitée par des caractéristiques<br />

communes non pertinentes du point de vue du chercheur mais néanmoins<br />

utilisée par un sujet donné pour se faciliter la tâche de<br />

classification, peut provoquer des effets IAT. On peut alors réinterpréter<br />

le paradigme comme une mesure générale de similarité entre catégories<br />

(De Houwer et al., 2005). Le modèle de la redondance de Fiedler et al.<br />

L’année psychologique, 2006, 106, 305-336


Validité et fondements théoriques des scores IAT 321<br />

(2003) tente d’en formuler les principes. Dans le bloc compatible, les<br />

catégories associées à la même touche de réponse partagent un maximum<br />

de caractéristiques, les catégories associées à des touches différentes n’ont<br />

que peu ou pas de caractéristiques communes : dans cette situation, il n’y<br />

a donc guère de raison de confondre les touches de réponse. Dans le bloc<br />

incompatible en revanche, les catégories associées à des touches différentes<br />

ont en commun une ou plusieurs caractéristiques, les deux touches<br />

de réponse ont par conséquent tendance à être psychologiquement<br />

confondues. Dans ce modèle, l’interprétation traditionnelle de l’effet IAT<br />

est appropriée quand, du point de vue du chercheur, la distance psychologique<br />

entre les touches de réponse est uniquement fonction des<br />

associations entre les caractéristiques pertinentes des attributs et des<br />

cibles ; elle devient inappropriée quand la distance psychologique est due<br />

à des redondances entre caractéristiques non pertinentes des attributs et<br />

des cibles.<br />

3.5. Des alternatives<br />

Afin de remédier à certaines des limitations venant d’être évoquées, des<br />

instruments concurrents ou plutôt complémentaires à l’IAT sont apparus.<br />

Dans ce qui suit, nous mentionnerons uniquement le GNAT (Go/No-go<br />

Association Task ; Nosek et Banaji, 2001), l’EAST (Extrinsic Affective<br />

Simon Task ; De Houwer, 2003) et le SCAT (Single Category Association<br />

Test ; Karpinski & Steinman, 2006), car ils nous semblent les plus<br />

prometteurs.<br />

Le GNAT résout le problème de la mesure relative car il permet de<br />

mesurer la force d’association entre un seul concept-cible et son attribut.<br />

La tâche du sujet consiste à discriminer entre les exemplaires d’un<br />

concept-cible (e.g., « Fruit ») ou d’un attribut (e.g., « Agréable ») et des<br />

distracteurs. Dans le premier cas (exemplaire-cible ou exemplaireattribut),<br />

le sujet appuie sur une touche prédéterminée (« Go ») alors que<br />

dans le second (distracteurs), aucune action n’est requise (« No Go »).<br />

Tout comme dans l’IAT, la procédure de mesure s’effectue en deux<br />

phases se distinguant par le changement d’attribut : par exemple, pour<br />

mesurer une attitude, on utilise un attribut positif dans une phase (e.g.,<br />

« Agréable ») et un attribut négatif dans la seconde phase (e.g., « Désagréable<br />

»). Le concept-cible est donc associé soit à un attribut positif, soit<br />

à un attribut négatif. De la différence de performance entre ces deux<br />

phases, on en infère une attitude plus ou moins positive vis-à-vis du<br />

concept-cible. Bien que les qualités psychométriques du GNAT soient<br />

comparables à celles de l’IAT, les deux mesures corrèlent très faiblement<br />

L’année psychologique, 2006, 106, 305-336


322 Christophe Blaison • Delphine Chassard • Jean-Luc Kop • Kamel Gana<br />

ensemble (Nosek et Banaji, 2001) ; et les seules corrélations avec une<br />

mesure explicite rapportées, à notre connaissance, dans la littérature sont<br />

très faibles à inexistantes (Nosek et Banaji, 2001). Mais il est vrai que très<br />

peu d’études ont utilisé ce paradigme jusqu’à présent (pour de rares<br />

exceptions, cf. Blair, Ma et Lenton, 2001 ; Mitchell, et al., 2003).<br />

L’EAST (De Houwer, 2003) élimine lui aussi le problème de la mesure<br />

relative ; il évite, en plus, la comparaison entre deux blocs reposant sur<br />

des tâches différentes. Tout comme dans l’IAT, il s’agit de classer des stimuli,<br />

mais le critère de classification est ici soit la signification<br />

sémantique (pour les concepts-attributs), soit la couleur (pour le<br />

concept-cible). Concrètement, des exemplaires-attributs sont présentés<br />

dans une couleur blanche, le sujet devant indiquer s’ils relèvent de la catégorie<br />

« Agréable » ou de la catégorie « Désagréable » en appuyant sur la<br />

touche correspondante. Le concept-cible est, quant à lui, présenté soit en<br />

bleu, soit en vert, le sujet devant discriminer la couleur en utilisant les<br />

mêmes touches de réponse que celles utilisées pour discriminer les exemplaires-attributs.<br />

Même si la signification des concepts-cibles peut être<br />

ignorée pour réussir la tâche, on suppose que le sujet sera plus rapide<br />

lorsque la valence <strong>–</strong> automatiquement activée <strong>–</strong> de la cible et sa couleur<br />

correspondent à la même touche de réponse ; et qu’il sera plus lent<br />

lorsque la valence de la cible et sa couleur relèvent de deux touches différentes.<br />

Ainsi, si les catégories « Agréable » et « Couleur bleue » sont<br />

associées à la même touche de réponse alors que les catégories « Désagréable<br />

» et « Couleur verte » sont associées à l’autre touche de réponse,<br />

un sujet qui a une attitude favorable envers les fruits devrait répondre<br />

plus rapidement lorsque ceux-ci sont présentés en bleu que lorsqu’ils sont<br />

présentés en vert, ce qui est vérifié empiriquement (De Houwer, 2003).<br />

L’EAST permet donc d’estimer des associations absolues (i.e., non relatives)<br />

en une seule phase ; il présente aussi l’avantage de permettre la<br />

mesure simultanée de plusieurs attitudes puisqu’il est possible de présenter<br />

des exemplaires de plusieurs concepts-cibles, ceux-ci ne devant être<br />

discriminés que par rapport à leur couleur. Malheureusement, malgré le<br />

caractère ingénieux de la procédure, les qualités psychométriques du<br />

paradigme sont décevantes (De Houwer, 2003) et bien inférieures à celles<br />

de l’IAT, ce qui s’explique sans doute en partie par des écarts trop faibles<br />

de performances entre les deux conditions expérimentales (exemplairescibles<br />

d’une couleur vs. de l’autre couleur), et donc à des tailles d’effet<br />

insuffisantes pour assurer des différences interindividuelles stables.<br />

L’interprétation des effets mesurés dans ce paradigme étant toutefois<br />

moins équivoque que celle des effets IAT, on peut espérer que des aménagements<br />

internes puissent remédier à ces difficultés psychométriques.<br />

L’année psychologique, 2006, 106, 305-336


Validité et fondements théoriques des scores IAT 323<br />

Le SCAT (Karpinski & Steinman, 2006) est le dernier né de ces trois instruments<br />

alternatifs. Il permet lui aussi de mesurer la force d’association<br />

absolue entre un concept-cible et son attribut. Il ressemble beaucoup à<br />

l’IAT dans sa mise en œuvre : grâce à deux touches, le sujet doit classer à<br />

droite ou à gauche des stimuli appartenant à des catégories différentes.<br />

Mais au lieu d’être quatre, ces catégories ne sont que trois : deux catégories<br />

d’attributs opposés (e.g., « Agréable » vs. « Désagréable ») et une seule<br />

catégorie cible (e.g., « Fruit »). Ainsi, dans le premier bloc-test les sujets<br />

doivent classer par exemple les stimuli relevant des catégories « Agréable »<br />

et « Fruit » à gauche et ceux de la catégorie « Désagréable » à droite ; dans<br />

le deuxième bloc-test, ils doivent cette fois classer les exemplaires de la<br />

catégorie « Agréable » à gauche et ceux des catégories « Désagréable » et<br />

« Fruit » à droite. Dans les trois applications rapportées par Karpinski<br />

(2004), les consistances internes sont satisfaisantes et du même ordre de<br />

grandeur que celles que l’on observe habituellement avec l’IAT ; les corrélations<br />

avec des mesures directes sont sensiblement supérieures à celles<br />

impliquant l’IAT, résultat que l’auteur attribue au fait que son instrument<br />

mesure des associations absolues alors que l’IAT ne mesure que des associations<br />

relatives. Cette caractéristique fait du SCAT un paradigme<br />

prometteur pour peu que l’on puisse expliquer certains résultats étonnants,<br />

comme l’absence totale de corrélation entre un SCAT d’estime de<br />

soi et un IAT d’estime de soi (Karpinski & Steinman, 2006).<br />

4. LES RELATIONS ENTRE MESURES DIRECTES<br />

ET MESURES INDIRECTES<br />

L’étude de validité des mesures dérivées des différents paradigmes de<br />

mesures indirectes en général et de l’IAT en particulier a largement fait<br />

référence à la mise en relation entre mesures directes et indirectes du<br />

même construit (Nosek, 2004 ; Hofman et al., 2005). Mais pour que les<br />

résultats de ces études puissent servir au processus de validation, encore<br />

faut-il que l’on ait des hypothèses précises quant à la nature des relations<br />

entre ces mesures. Or, s’il existe un relatif consensus sur le fait que les<br />

relations observées sont généralement faibles mais positives, l’interprétation<br />

de cette dissociation reste l’objet de débats : s’explique-t-elle<br />

simplement par les problèmes théoriques et méthodologiques posés par<br />

l’IAT ou bien par les biais inhérents aux mesures directes ? Renvoie-t-elle<br />

à l’existence de construits différents ? L’objectif de cette dernière partie est<br />

L’année psychologique, 2006, 106, 305-336


324 Christophe Blaison • Delphine Chassard • Jean-Luc Kop • Kamel Gana<br />

de détailler les arguments fournis en faveur des différentes explications<br />

proposées.<br />

Premièrement, la dissociation observée entre mesures directes et IAT peut<br />

s’expliquer par les problèmes méthodologiques et théoriques posés par<br />

l’IAT. Nous avons déjà fait référence au fait qu’il ne produit que des<br />

mesures d’associations relatives. Par exemple, un IAT d’estime de soi<br />

mesurerait en fait la force d’association entre les concepts « Moi <strong>–</strong><br />

Agréable » comparativement à la force d’association entre les concepts<br />

« Pas moi <strong>–</strong> Agréable » et non la force d’association « Moi <strong>–</strong> Agréable » en<br />

elle-même (Karpinski & Steinman, 2006). Or, même si certains items des<br />

mesures directes d’estime de soi font référence à autrui, elles ne sont pas<br />

entièrement construites sur ce modèle, ce qui pourrait participer à la<br />

faible relation observée entre mesures directe et IAT. De plus, le fait que<br />

la tâche IAT se décompose en deux blocs indépendants introduit un<br />

certain nombre de biais de mesure, qui, alliés à ceux cités plus haut, contribuent<br />

sans doute aussi au manque de convergence entre mesures<br />

directes et IAT. Ces explications ne sont toutefois pas entièrement convaincantes<br />

puisque avec les nouveaux paradigmes censés corriger certains<br />

des défauts de l’IAT (GNAT, EAST, SCAT), les corrélations entre mesures<br />

directes et indirectes restent très inférieures à ce que l’on pourrait<br />

attendre. Il faut donc chercher des explications complémentaires.<br />

Deuxièmement, la dissociation observée entre mesures directes et IAT<br />

pourrait être imputée à certains biais propres aux mesures directes :<br />

l’auto-présentation et les limites des capacités introspectives des sujets.<br />

Alors que les mesures directes sont connues pour leur sensibilité aux stratégies<br />

de présentation adoptées par les sujets (Kop et Chassard, 2005),<br />

l’IAT n’en serait pas affecté (Greenwald et al., 2002). Néanmoins, les<br />

résultats des études portant sur le rôle modérateur de l’auto-présentation<br />

dans la relation entre mesures directe et IAT sont contradictoires. Alors<br />

que Nosek (2004) trouve effectivement que plus l’auto-présentation est<br />

élevée, plus la relation entre mesures directes et IAT est faible et que<br />

Banse (2004) montre que l’auto-présentation modère la relation entre<br />

mesures directes et IAT, Nosek et Banaji (2002) et Egloff et Schmukle<br />

(2003) ne répliquent pas ces résultats. Il semble en outre peu probable<br />

que l’auto-présentation puisse expliquer entièrement les dissociations<br />

observées. Si elle devait rendre compte, par exemple, de l’absence de corrélation<br />

(Greenwald et al., 1998) entre un IAT et une mesure directe<br />

censés appréhender l’attitude envers les fleurs, il faudrait alors faire<br />

l’hypothèse que ce type d’attitude est particulièrement sensible à l’autoprésentation<br />

! Enfin, les limites des capacités introspectives des sujets,<br />

plus difficiles à appréhender dans des études empiriques, ont fait l’objet<br />

L’année psychologique, 2006, 106, 305-336


Validité et fondements théoriques des scores IAT 325<br />

de moins de discussions mais continuent à être invoquées comme une<br />

cause possible des dissociations entre mesures directes et indirectes. Toutefois,<br />

comme le reconnaissent Greenwald et al. (2002), il est souvent<br />

quasi impossible de faire la distinction entre ces deux facteurs explicatifs<br />

potentiels : les domaines pour lesquels les sujets n’ont que peu de raisons<br />

à chercher à dissimuler leur attitude sont aussi généralement ceux qui<br />

sont les plus facilement accessibles à l’introspection.<br />

Troisièmement, la dissociation entre mesures directes et IAT peut s’expliquer<br />

par des éléments théoriques relevant de la cognition implicite, grâce<br />

notamment à certaines réflexions récentes relatives aux attitudes. Deux<br />

grandes classes de modèles peuvent être distinguées selon que l’on considère<br />

que la mesure directe et la mesure indirecte appréhendent chacune<br />

un construit différent ou selon que l’on suppose qu’elles sont deux<br />

manières différentes d’appréhender le même construit. Nous commencerons<br />

par évoquer l’hypothèse de l’existence de deux construits différents.<br />

En postulant l’existence de deux construits, les partisans de cette<br />

approche supposent que chacun des construits possède sa propre représentation<br />

en mémoire (Greenwald et Banaji, 1995 ; Wilson, Lindsley et<br />

Schooler, 2000). Par exemple, le modèle des attitudes duelles (model of<br />

dual attitudes) développé par Wilson et al. (2000), distingue entre le<br />

construit d’« attitude explicite » (Ae) et celui d’« attitude implicite » (Ai)<br />

et repose sur les cinq hypothèses suivantes : a) Une Ae et une Ai envers un<br />

même objet peuvent coexister en mémoire ; b) Lorsque des attitudes<br />

duelles coexistent, Ai est activée automatiquement alors que Ae requiert<br />

davantage de ressources cognitives et de motivations pour être récupérée.<br />

Si les individus sont capables de récupérer Ae, celle-ci prend alors le pas<br />

sur Ai, de sorte que les sujets expriment Ae. Au contraire, si les individus<br />

n’ont ni les ressources ni la motivation nécessaires pour récupérer Ae, ils<br />

expriment Ai ; c) Même lorsque Ae est récupérée, Ai influence les<br />

réponses implicites, c’est-à-dire les réponses que les individus ne peuvent<br />

contrôler (e.g., comportements non-verbaux) ou qu’ils ne considèrent pas<br />

comme l’expression de leur attitude, et donc n’essaient pas de contrôler ;<br />

d) Les Ae changent relativement facilement, alors que les Ai, comme de<br />

vieilles habitudes, changent plus lentement ; e) Les attitudes duelles sont<br />

distinctes de l’ambivalence ainsi que des attitudes à composantes affective<br />

et cognitive contradictoires. En conséquence, plutôt que de faire l’expérience<br />

d’un état conflictuel subjectif, les individus expriment l’attitude la<br />

plus accessible (Wilson et al., 2000, p. 104).<br />

Wilson et al. (2000) distinguent quatre types d’attitudes duelles selon que<br />

l’on ait ou non conscience de posséder une attitude implicite Ai et selon<br />

que l’on ait besoin de capacités cognitives et de motivations particulières<br />

L’année psychologique, 2006, 106, 305-336


326 Christophe Blaison • Delphine Chassard • Jean-Luc Kop • Kamel Gana<br />

pour la remplacer par une attitude explicite Ae (cf. tableau II). Si l’on s’en<br />

tient à ce modèle, l’IAT permettrait plus particulièrement de mesurer des<br />

attitudes implicites que les individus seraient motivés à remplacer par<br />

leurs attitudes explicites, et ce qu’ils en aient conscience ou non (cf. cas de<br />

refoulement et de remplacement motivé). Mais que les individus aient<br />

conscience ou non de leurs attitudes implicites, qu’ils aient besoin ou non<br />

de ressources cognitives et de motivations particulières pour les remplacer,<br />

le modèle de Wilson et al. (2000) permet d’expliquer la<br />

dissociation entre mesures directe et indirecte par l’existence de deux<br />

construits de nature différente : un construit implicite qui se manifesterait<br />

systématiquement dans les mesures de type indirect, et un construit explicite<br />

qui s’exprimerait préférentiellement dans les mesures de type direct.<br />

Dans cette perspective, il est essentiel de mieux connaître les facteurs pouvant<br />

modérer la relation entre attitudes explicites et attitudes implicites. Nosek<br />

(2004) s’est ainsi lancé dans une entreprise de grande ampleur visant à<br />

repérer les modérateurs pertinents pour 57 objets d’attitude différents. Les<br />

corrélations entre mesures directes et indirectes (IAT) varient entre -0.05 et<br />

0.70 selon l’objet d’attitude et une part non négligeable de la variabilité de ces<br />

corrélations (39 %) peut effectivement être expliquée par les quatre modéra-<br />

Ai est-elle<br />

accessible<br />

à la<br />

conscience ?<br />

A-t-on<br />

besoin de<br />

ressources<br />

cognitives<br />

et de<br />

motivations<br />

particulières<br />

pour<br />

remplacer Ai<br />

par Ae ?<br />

Tableau II. Quatre types d’attitudes duelles<br />

(d’après Wilson et al., 2000, p. 105)<br />

Table II. Four types of dual attitudes (cf. Wilson et al ., 2000, p. 105)<br />

Refoulement<br />

L’année psychologique, 2006, 106, 305-336<br />

Systèmes<br />

indépendants<br />

Remplacement<br />

motivé<br />

NON NON OUI<br />

Remplacement<br />

automatique<br />

Sous certaines<br />

conditions<br />

OUI NON OUI NON<br />

Note : Ai = Attitude implicite ; Ae = Attitude explicite


Validité et fondements théoriques des scores IAT 327<br />

teurs retenus dans l’étude : auto-présentation (i.e., motivation à altérer ses<br />

réponses à des fins personnelles ou sociales) ; intensité de l’attitude ; dimensionnalité<br />

de l’attitude (i.e., degré de bipolarité) ; différence perçue entre son<br />

attitude personnelle et l’attitude moyenne. Ces résultats, prometteurs, méritent<br />

néanmoins d’être affinés et répliqués.<br />

Une seconde classe de modèles théoriques considère au contraire qu’il<br />

n’existe qu’un seul construit, supposé se différencier par le type de processus<br />

de traitement de l’information en jeu lors de sa mesure (Greenwald et<br />

Banaji, 1995 ; Dambrun et Guimond, 2003 ; Fazio et Olson, 2003). Ainsi,<br />

une dissociation entre mesures directes et IAT peut s’expliquer par le fait<br />

qu’une mesure indirecte appréhenderait un construit activé automatiquement<br />

sous l’effet de processus spontanés de traitement de l’information alors<br />

qu’une mesure directe appréhenderait ce même construit après intervention<br />

de processus délibérés (i.e., contrôlés). Le modèle de Fazio et Towles-Schwen<br />

(1999, « MODE model of attitude-behavior processes ») censé rendre<br />

compte des relations entre attitude et comportement est, dans ce contexte,<br />

particulièrement pertinent. En effet, ces auteurs distinguent entre des processus<br />

de type spontané qui ne nécessiteraient ni effort conscient, ni<br />

intention, ni contrôle de la part des individus et des processus délibérés qui<br />

demanderaient un travail cognitif important (inspection de l’information<br />

disponible, analyse des caractéristiques positives et négatives, des coûts et des<br />

bénéfices…), ce qui suppose de pouvoir disposer à la fois de la motivation et<br />

de l’opportunité (i.e., ressources cognitives et temps) nécessaires pour que ce<br />

type de processus puisse se mettre en place (Fazio et Towles-Schwen, 1999 ;<br />

Koole, Dijksterhuis et Van Knippenberg, 2001). Les processus spontanés et<br />

délibérés seraient relativement indépendants les uns des autres, mais ils interagiraient<br />

afin de déterminer conjointement le comportement, la<br />

prédominance d’un type de processus sur l’autre serait alors fonction de la<br />

motivation et de l’opportunité. Ainsi, lorsque la motivation et l’opportunité<br />

sont faibles, ce sont les processus spontanés qui détermineraient en grande<br />

partie le comportement. Au contraire, si la motivation et l’opportunité sont<br />

élevées, les processus de type délibéré prendraient le pas sur les processus<br />

spontanés (Fazio et Towles-Schwen, 1999). Banse et al. (2001) ont obtenu<br />

des résultats compatibles avec ce modèle théorique dans une étude d’attitude<br />

envers l’homosexualité. En particulier, les sujets ayant des attitudes négatives<br />

spontanées (mesurées à l’aide d’un IAT) envers l’homosexualité et ayant peu<br />

de motivation à contrôler leurs réactions se caractérisent par une attitude<br />

homophobe prononcée à une mesure directe. En revanche, chez des sujets<br />

ayant un même niveau d’attitudes négatives spontanées, mais chez lesquels la<br />

motivation à contrôler leurs réactions est accentuée, cette homophobie dans<br />

les mesures directes est fortement réduite.<br />

L’année psychologique, 2006, 106, 305-336


328 Christophe Blaison • Delphine Chassard • Jean-Luc Kop • Kamel Gana<br />

L’année psychologique, 2006, 106, 305-336<br />

5. CONCLUSION<br />

L’apparition de l’IAT en 1998 a suscité un engouement dépassant largement<br />

le cercle restreint de la psychologie scientifique : articles de presse,<br />

émissions télévisées, sites Internet (https://implicit.harvard.edu/implicit/<br />

france/) ont donné à cet outil une notoriété inattendue. Il faut sans doute<br />

y voir une certaine fascination de la psychologie populaire pour la possibilité<br />

d’accéder au plus profond de l’âme humaine. Se présentant comme<br />

un instrument permettant de révéler des sentiments que l’on tente habituellement<br />

de dissimuler, voire des sentiments auxquels on n’a pas accès,<br />

l’IAT a tout naturellement fait écho à ce penchant. La communauté scientifique,<br />

elle non plus, n’a pas échappé à cet effet de mode, si l’on en croit<br />

le nombre considérable de publications consacrées à ce paradigme depuis<br />

cette date. Toutefois, au fur et à mesure des années, la fascination initiale<br />

a peu à peu cédé la place à des approches plus critiques, davantage<br />

conformes à l’esprit scientifique. Et l’on s’aperçoit, aujourd’hui, que le<br />

monde de l’IAT est un monde de paradoxes.<br />

Paradoxe de sa construction, tout d’abord. L’étude de la cognition sociale<br />

implicite nécessitait en effet de nouveaux outils et c’est bien dans ce cadre<br />

de référence théorique que s’inscrit la naissance de l’IAT. Mais au lieu de<br />

construire un instrument s’inspirant des théories de ce courant, les<br />

concepteurs de l’IAT ont privilégié une démarche empirique s’appuyant<br />

essentiellement sur un critère de maximisation de la consistance interne<br />

qui n’est qu’une condition nécessaire pour produire des mesures offrant<br />

des scores fidèles et valides et en aucun cas une condition suffisante.<br />

Paradoxe de son fonctionnement ensuite. L’analyse des processus en<br />

œuvre dans l’IAT conduit à différentes interprétations de la mesure<br />

obtenue, interprétations parfois très éloignées de celle que souhaiteraient<br />

ses concepteurs (une force d’association entre concepts reflétant, selon la<br />

nature des concepts pris en compte, une attitude, un stéréotype, une<br />

représentation de soi…). Comment toutefois expliquer que les mesures<br />

IAT offrent par ailleurs des gages de validité compatibles avec l’interprétation<br />

naïve, comme par exemple, des fidélités comparables à celles des<br />

scores des mesures directes et des corrélations avec des indicateurs<br />

comportementaux spontanés ou des indicateurs physiologiques ? Qui<br />

plus est, pourquoi des outils considérés comme étant « processuellement<br />

» plus purs que l’IAT (et donc moins équivoques quant à<br />

l’interprétation de la mesure résultante) donnent des résultats si décevants,<br />

là même où l’IAT affiche ses résultats les plus convaincants ?<br />

Paradoxe des études de validation des mesures IAT enfin, qui, à quelques<br />

exceptions près, s’appuient sur la mise en relation de mesures directes


Validité et fondements théoriques des scores IAT 329<br />

avec des mesures indirectes, alors que les premières sont accusées de<br />

maux que les secondes sont justement censées corriger. La signification<br />

donnée aux résultats obtenus dans cette perspective ne peut donner lieu<br />

qu’à des controverses difficiles à trancher, sauf à considérer comme<br />

Nosek et Smyth (2004), que les construits tels que mesurés par l’IAT sont<br />

théoriquement distincts de ceux mesurés par questionnaires. Par rapport<br />

aux scores recueillis à l’aide de questionnaires, il deviendrait alors plus<br />

intéressant d’explorer, à l’aide de plans de recherche différents, la valeur<br />

originale des scores produits par la famille de mesures dont l’IAT fait<br />

partie.<br />

Il faut avoir la modestie de reconnaître qu’aujourd’hui, alors que l’on<br />

continue d’avancer de manière remarquable (cf. Klauer et Mierke, 2005 ;<br />

Conrey, Sherman, Gawronski, Hugenberg et Groom, 2005), on ne maîtrise<br />

toujours pas complètement ce que mesurent les applications de<br />

l’IAT. L’article de Greenwald et al. (1998) reste néanmoins un révélateur :<br />

il a permis de décomplexer les chercheurs face à la possibilité de mesurer<br />

de manière fiable des construits inaccessibles aux mesures directes traditionnelles.<br />

Les imperfections de cet instrument de mesure relevées depuis<br />

ont eu en outre le mérite de stimuler la créativité des chercheurs dans différentes<br />

directions : étude des processus cognitifs en jeu dans des tâches<br />

de classification faisant intervenir des associations entre concepts, développement<br />

de modèles théoriques intégrant les construits implicites, mise<br />

au point de nouveaux paradigmes théoriquement mieux fondés.<br />

NOTES<br />

1. Même si l’on parle souvent de « mesure » ou d’« instrument » à propos<br />

de l’IAT, il serait plus correct de faire référence à un paradigme permettant<br />

de générer des instruments de mesure. Dans la suite du texte, afin de<br />

ne pas trop alourdir l’exposé, nous sacrifierons toutefois à l’usage en utilisant<br />

ces expressions.<br />

2. Conventionnellement, d = .20 : taille d’effet faible, d = .50 : taille d’effet<br />

moyenne et d = .80 : taille d’effet importante (Cohen, 1988).<br />

3. Il n’existe pas de consensus concernant la façon d’évaluer la consistance<br />

interne des scores produits par une adaptation particulière de l’IAT. Cette<br />

question est en outre très rarement débattue. Dans tous les articles l’évaluant,<br />

il est cependant une constante consistant à la calculer à partir d’un<br />

certain nombre de “sous-effets IAT” obtenus à partir d’autant de sousensembles<br />

de temps de réponse. Tout comme l’effet IAT principal, ils sont<br />

considérés comme reflétant la plus ou moins grande tendance à associer tel<br />

ou tel concept cible avec tel ou tel concept attribut. La consistance interne<br />

L’année psychologique, 2006, 106, 305-336


330 Christophe Blaison • Delphine Chassard • Jean-Luc Kop • Kamel Gana<br />

de ces sous-scores représente alors la consistance de cette tendance telle<br />

que révélée lors de la tâche IAT. Certains auteurs calculent deux souseffets<br />

IATs et les corrèlent (i.e., méthode split-half, ex., Marsh, Johnson et<br />

Scott-Sheldon, 2001 ; Greenwald et al., 2003), d’autres utilisent l’alpha de<br />

Cronbach soit à partir de deux sous-effet IAT (ex., Banse et al., 2001), soit<br />

à partir de quatre (ex., Asendorpf et al., 2002 ; Gawronski, 2002), soit<br />

encore à partir d’autant de sous-effets qu’il y a d’essais (i.e., essai 1 du<br />

deuxième bloc moins essai 1 du premier bloc, essai 2 du deuxième bloc<br />

moins essai 2 du premier bloc, etc. ; ex., Bosson et al., 2000 ; Egloff et Schmuckle,<br />

2004).<br />

4. Lorsque le bloc compatible précède le bloc incompatible, les associations<br />

du premier bloc correspondent à des associations connues nécessitant peu<br />

d’apprentissage (e.g., « Fleurs <strong>–</strong> Agréable »). Dans le bloc incompatible, il<br />

faut « désapprendre » ces associations et en apprendre de nouvelles, moins<br />

évidentes (e.g., « Fleurs <strong>–</strong> Désagréable »). La différence de vitesse entre les<br />

deux blocs est maximale. Or, lorsqu’on inverse les deux blocs, ce sont cette<br />

fois les associations du bloc incompatible qui sont nouvelles et nécessitent<br />

un apprentissage (e.g., « Fleurs <strong>–</strong> Désagréable »). À cela s’ajoute le fait que<br />

ces associations devront de surcroît être inhibées lors du second bloc. D’où<br />

le fait que dans cet ordre d’apparition des blocs, la différence de vitesse<br />

entre les deux blocs est minimale. C’est pourquoi, si l’on s’intéresse à l’effet<br />

IAT au niveau du groupe, il est généralement recommandé de contrebalancer<br />

les deux ordres de présentation (Greenwald et al., 1998). Par contre,<br />

il serait moins pertinent de le faire si l’on s’intéressait aux différences interindividuelles.<br />

Dans ce cas le fait de doubler le nombre d’essais<br />

d’entraînement entre les deux blocs tests éliminerait ou tout du moins<br />

réduirait l’effet de l’ordre de présentation des blocs pour un grand nombre<br />

d’IAT d’attitude (Nosek et al., 2005a).<br />

5. Même si Fiedler et al. (2005) évoquent plus volontiers le concept d’attitudes,<br />

leur critique peut être étendue aux autres types de concepts<br />

appréhendés par l’IAT (i.e. stéréotypes, estime de soi, concept de soi).<br />

Asendorpf, J.B., Banse, R. & Mucke,<br />

D. (2002). Double dissociation between<br />

implicit and explicit personality selfconcept:<br />

the case of shy behavior. Journal<br />

L’année psychologique, 2006, 106, 305-336<br />

BIBLIOGRAPHIE<br />

of Personality and Social Psychology, 83,<br />

380-393.<br />

Ashburn,-Nardo, L., Voils, C.I., & Monteith,<br />

M.J. (2001). Implicit associations as


Validité et fondements théoriques des scores IAT 331<br />

the seeds of intergroup bias: How easily do<br />

they take root? Journal of Personality and<br />

Social Psychology, 81, 789-799.<br />

Banaji, M.R. (2001). Implicit attitudes can<br />

be measured. In H.L. Roediger, III, J.S.<br />

Nairne, I. Neath, & A. Surprenant (Eds.),<br />

The nature of remembering: Essays in honor<br />

of Robert G. Crowder. Washington: American<br />

Psychological Association.<br />

Banse, R. (1999). Evaluation of self and significant<br />

others: Affective priming in close<br />

relationships. Journal of Social and Personal<br />

Relationships, 16, 803-821.<br />

Banse, R. (2004, July). Indirect measures of<br />

aggressiveness. Paper presented at the 12 th<br />

European Conference on Personality. Groningen:<br />

The Netherlands.<br />

Banse, R., Seise, J. & Zerbes, N. (2001). Implicit<br />

attitudes towards homosexuality :<br />

Reliability, validity, and controllability of<br />

the IAT. Zeitschrift für Experimentelle Psychologie,<br />

48, 145-160.<br />

Blair, I.V., Ma, J.E., & Lenton, A.P. (2001).<br />

Imagining stereotypes away: the moderation<br />

of implicit stereotypes through mental<br />

imagery. Journal of Personality and Social<br />

Psychology, 81, 828-841.<br />

Blaison, C. & Gana, K. (2004, July).<br />

Using the Implicit Association Test (IAT)<br />

to measure affectivity-trait versus state.<br />

Paper presented at the 12 th European<br />

Conference on Personality. Groningen:<br />

The Netherlands.<br />

Bosson, J.K., Swann, W.B., & Pennebaker,<br />

J.W. (2000). Stalking the perfect measure<br />

of implicit self-esteem: The blind men and<br />

the elephant revisited? Journal of Personality<br />

and Social Psychology, 79, 631-643.<br />

Brendl, C.M., Markman, A.B & Messner,<br />

C. (2001). How do indirect measures of<br />

evaluation work? Evaluating the inference<br />

of prejudice in the Implicit Association<br />

Test. Journal of Personality and Social Psychology,<br />

81, 760-773.<br />

Chassard, D., & Kop, J.-L. (2003). Des processus<br />

automatiques d’évaluation à la mesure<br />

des différences individuelles : l’essor<br />

des mesures indirectes. In A. Vom Hofe,<br />

H. Charvin, J.-L. Bernaud, D. & Guédon<br />

(Eds.), Psychologie différentielle : recherches<br />

et réflexions. Rennes, Presses Universitaires<br />

de Rennes.<br />

Chee, M., Sriram, N., Soon, C.H., & Lee,<br />

K.M. (2000). Dorsolateral prefrontal cortex<br />

and the implicit association of concepts<br />

and attributes. Neuroreport: For Rapid<br />

Communication of Neuroscience Research,<br />

11,135-140.<br />

Cohen, J. (1988). Statistical power analysis<br />

for the behavioral sciences. 2e ed. Hillsdale<br />

(NJ): Erlbaum.<br />

Conrey, F.R., Sherman, J.W.,<br />

Gawronski, B., Hugenberg, K. & Groom,<br />

C.J. (2005) Separating multiple processes<br />

in implicit social cognition: the Quad model<br />

of implicit task performance. Journal of<br />

Personality and Social Psychology, 89, 469-<br />

487.<br />

Cunningham, W.A., Preacher, K.J. & Banaji,<br />

M.R. (2001). Implicit attitude measures:<br />

Consistency, stability, and convergent<br />

validity. Psychological Science, 121, 163-<br />

170.<br />

Dambrun, M. & Guimond, S. (2003). Les<br />

mesures implicites et explicites des préjugés<br />

et leur relation : développements récents<br />

et perspectives théoriques. Les Cahiers<br />

Internationaux de Psychologie Sociale,<br />

57, 52-73.<br />

Dasgupta, N. & Greenwald, A.G. (2001).<br />

On the malleability of automatic attitudes:<br />

combatting automatic prejudice with images<br />

of admired and disliked individuals.<br />

Journal of Personality and Social Psychology,<br />

85, 800-814.<br />

Dasgupta, N., Greenwald, A.G. & Banaji,<br />

M.R. (2003). The first ontological challenge<br />

to the IAT: attitude or mere familiarity.<br />

Psychological Inquiry, 14, 238-243.<br />

Dasgupta, N., McGhee, D.E., Greenwald,<br />

A.G., & Banaji, M.R. (2000). Automatic<br />

preference for white americans: eliminating<br />

the familiarity explanation. Journal of<br />

Experimental Social Psychology, 36, 316-<br />

328.<br />

L’année psychologique, 2006, 106, 305-336


332 Christophe Blaison • Delphine Chassard • Jean-Luc Kop • Kamel Gana<br />

De Houwer, J. (2001). A structural and<br />

process analysis of the Implicit Association<br />

Test. Journal of Experimental Social Psychology,<br />

37, 443-451.<br />

De Houwer, J. (2002). The Implicit Association<br />

Test as a tool for studying dysfunctional<br />

associations in psychopathology:<br />

strength and limitations. Journal of Behavior<br />

Therapy and Experimental Psychiatry,<br />

33, 115-133.<br />

De Houwer, J. (2003). The Extrinsic Affective<br />

Simon Task. Experimental Psychology,<br />

50, 77-85.<br />

De Houwer, J., Geldof, T, & De Bruycker,<br />

E. (2005) The Implicit Assocation Test as a<br />

general measure of similarity. Canadian<br />

Journal of Experimental Psychology, 59, 228-<br />

239.<br />

De Jong, P.J. (2002). Implicit self-esteem<br />

and social anxiety: differential selffavouring<br />

effects in high and low anxious<br />

individuals. Behaviour Research and Therapy,<br />

40, 501-508.<br />

De Jong, P.J., Van Den Hout, M.A., Rietbroek,<br />

H &, Huijding, J. (2003). Dissociation<br />

between implicit and explicit attitudes<br />

toward phobic stimuli. Cognition and Emotion,<br />

17, 521-545.<br />

Devos, T., & Banaji, M.R. (2003). Implicit<br />

self and identity. Annals of the New York<br />

Academy of Sciences, 1001, 177-211.<br />

Egloff, B. & Schmukle, S.C. (2002). Predictive<br />

validity of an implicit association test<br />

for assessing anxiety. Journal of Personality<br />

and Social Psychology, 83, 1441-1455.<br />

Egloff, B. & Schmukle, S.C. (2003). Does<br />

social desirability moderate the relationship<br />

between implicit and explicit anxiety<br />

measures? Personality and Individual<br />

Differences, 34, 1-10.<br />

Fazio, R.H. (1986). How do attitudes guide<br />

behaviour? In R.M. Sorrentino & E.T. Higgins<br />

(Eds.), Handbook of motivation and cognition<br />

: Foundations of social behaviour.<br />

New York: Guilford Press.<br />

Fazio, R.H, & Olson, M.A. (2003). Implicit<br />

measures in social cognition research:<br />

L’année psychologique, 2006, 106, 305-336<br />

Their meaning and use. Annual Review of<br />

Psychology, 54, 297-327.<br />

Fazio, R.H., Sanbonmatsu, D.M., Powell,<br />

M.C. & Kardes, F.R. (1986). On the automatic<br />

activation of attitudes. Journal of Personality<br />

and Social Psychology, 50, 229-238.<br />

Fazio, R.H. & Towles-Schwen, T. (1999).<br />

The MODE model of attitude-behavior<br />

processes. In S. Chaiken & Y. Trope (Eds.),<br />

Dual-process theories in social psychology.<br />

New York, Guilford Press.<br />

Fazio, R.H., Williams, C.J. & Powell, M.C.<br />

(2000). Measuring associative strength: Category-item<br />

associations and their activation<br />

from memory. Political Psychology, 21,<br />

7-25.<br />

Fiedler, K., Messner, C. & Blümke, M.<br />

(2003). Unresolved problems with the “I”,<br />

the “A” and the “T”: Logical and psychometric<br />

critique of the implicit association<br />

test (IAT). Manuscrit non publié.<br />

Fiedler, K., Messner, C. & Blümke, M.<br />

(2005). Some psychometric problems with<br />

the “I”, the“A” ans the“T” of the implicit association<br />

test. Soumis à publication.<br />

Gawronski, B. (2002). What does the implicit<br />

association test measure ? A test of<br />

the convergent and discriminant validity of<br />

prejudice-related IATs. Experimental Psychology,<br />

49, 171-180.<br />

Gemar, M.C., Segal, Z.V., Sagrati, S. &<br />

Kennedy, S.J. (2001). Mood-induced changes<br />

on the Implicit Association test in recovered<br />

depressed patients. Journal of Abnormal<br />

Psychology, 110, 282-289.<br />

Greenwald, A.G, & Banaji, M.R. (1995).<br />

Implicit social cognition : Attitudes, selfesteem,<br />

and stereotypes. Psychological Review,<br />

102, 4-27.<br />

Greenwald, A.G., Banaji, M.R., Rudman,<br />

L.A., Farnham, S.D., Nosek, B.A. & Mellott,<br />

D.S. (2002). A unified theory of implicit<br />

attitudes, stereotypes, self-esteem,<br />

and self-concept. Psychological Review,<br />

109, 3-25.<br />

Greenwald, A.G., & Farnham, S.D. (2000).<br />

Using the implicit association test to<br />

measure self-esteem and self-concept. Jour-


Validité et fondements théoriques des scores IAT 333<br />

nal of Personality and Social Psychology, 79,<br />

1022-1038.<br />

Greenwald, A.G., McGhee, D.E. &<br />

Schwartz, J.L. (1998). Measuring individual<br />

differences in implicit cognition: The<br />

implicit association test. Journal of Personality<br />

and Social Psychology, 74, 1464-1480.<br />

Greenwald, A.G. & Nosek, B.A. (2001).<br />

Health of the Implicit Association Test at<br />

age 3. Zeitschrift für Experimentelle Psychologie,<br />

48, 85-93.<br />

Greenwald, A.G., Nosek, B.A., & Banaji,<br />

M.R. (2003). Understanding and using the<br />

Implicit Association Test: an improved algorithm.<br />

Journal of Personality and Social<br />

Psychology, 85, 197-216.<br />

Hofman, W., Gawronski, B., Gschwendner,<br />

T., Le, H., & Schmitt, M. (2005). A<br />

meta-analysis on the correlation between<br />

IAT and explicit self-report measures. Personality<br />

and Social Psychology Bulletin, 31,<br />

1369-1385.<br />

Hummert, M.L., Gartska, T.A., O’Brien, L.T.,<br />

Greenwald, A.G., & Mellott, D.S. (2002).<br />

Using the Implicit Association Test to<br />

measure age differences in implicit social cognition.<br />

Psychology and Aging, 17, 482-495.<br />

Jacoby, L.L., & Kelley, C.M. (1987). Unconscious<br />

influences of memory for a prior<br />

event. Personality and Social Behavior Bulletin,<br />

13, 314-336.<br />

Jacoby, L.L., Toth, J.P., & Yonelinas, A.P.<br />

(1993). Separating conscious and unconscious<br />

influences of memory: Measuring recollection.<br />

Journal of Experimental Psychology:<br />

General, 122, 139-154.<br />

Jelenec, P., & Steffens, M.C. (2002). Implicit<br />

attitude toward elderly women and<br />

men. Current Research in Social Psychology,<br />

7, 275-292.<br />

Karpinski, A. & Hilton, J.L. (2001). Attitudes<br />

and the implicit association test. Journal<br />

of Personality and Social Psychology, 81,<br />

774-788.<br />

Karpinski, A., & Steinman, R. B. (2006).<br />

The single category implicit association test<br />

as a measure of implicit social cognition.<br />

Journal of Personality and Social Psychology,<br />

91, 16-32.<br />

Kihlstrom, J.F., Barnhardt, T.M., & Tataryn,<br />

D.J. (1992). The psychological unconscious:<br />

Found, lost, and regained. American<br />

Psychologist, 47, 788-791.<br />

Kihlstrom, J.F., Mulvaney, S., Tobias, B.A,<br />

& Tobis, I.P. (2000). The emotional unconscious.<br />

In E. Eich, J.F. Kihlstrom, G.H.<br />

Bower, J.P. Forgas & P.M. Niedenthal<br />

(Eds.), Cognition and emotion. Oxford: Oxford<br />

University Press.<br />

Klauer, K.C., & Mierke, J. (2005). Task-set<br />

inertia, attitude accessibility, and compatibility-order<br />

effects: New evidence for a<br />

task-set switching account of the IAT effect.<br />

Personality and Social Psychology Bulletin,<br />

31, 208-217.<br />

Koole, S.L., Dijksterhuis, A., & Van Knippenberg,<br />

A. (2001). What’s in a name: Implicit<br />

self-esteem and the automatic self.<br />

Journal of Personality and Social Psychology,<br />

80, 669-685.<br />

Kop, J-L. & Chassard, D. (2005). La falsification<br />

des réponses dans l’évaluation de la<br />

personnalité : une solution du côté des mesures<br />

indirectes ? Psychologie du Travail et<br />

des Organisations, 11, 15-23.<br />

Marsh, K.L., Johnson, B.T., & Scott-<br />

Sheldon, L.A. (2001). Heart versus reason<br />

in condom use: implicit versus explicit<br />

attitudinal predictors of sexual behavior.<br />

Zeitschrift für Experimentelle Psychologie,<br />

48, 161-175.<br />

McFarland, S.G., & Crouch, Z. (2002). A<br />

cognitive skill confound on the IAT. Social<br />

Cognition, 20, 483-510.<br />

Mierke, J., & Klauer, K.C. (2001). Implicit<br />

association measurement with IAT: Evidence<br />

for effects of executive control processes.<br />

Zeitschrift für Experimentelle Psychologie,<br />

48, 107-192.<br />

Mierke, J., & Klauer, K.C. (2003). Methodspecific<br />

variance in the Implicit Association<br />

Test. Journal of Personality and Social Psychology,<br />

85, 1180-1192.<br />

Mitchell, C.J., Anderson, N.E., & Lovibond,<br />

P.F. (2003). Measuring evaluative<br />

L’année psychologique, 2006, 106, 305-336


334 Christophe Blaison • Delphine Chassard • Jean-Luc Kop • Kamel Gana<br />

conditionning using the Implicit Association<br />

Test. Learning and Motivation, 34,<br />

203-217.<br />

Mitchell, J.P., Nosek, B.A. & Banaji, M.R.<br />

(2003). Contextual variations in implicit<br />

variations. Journal of Experimental Psychology:<br />

General, 132, 455-469.<br />

Musch, J., & Klauer, K.C. (Eds.) (2003).<br />

The psychology of evaluation: Affective processes<br />

in cognition and emotion. Mahwah<br />

(NJ, US): Lawrence Erlbaum Associates.<br />

Nisbett, R.E., & Wilson, T.D. (1977). Telling<br />

more than we can know: verbal reports<br />

on mental processes. Psychological Review,<br />

84, 231-259.<br />

Nosek, B.A. (2004). Moderators of the relationship<br />

between implicit and explicit attitudes.<br />

Dissertation Abstracts International:<br />

Section-B: The Sciences and Engineering, 63,<br />

4965.<br />

Nosek, B.A., & Banaji, M.R. (2001). The<br />

go/no go association task. Social Cognition,<br />

19, 625-664.<br />

Nosek, B.A, & Banaji, M.R. (2002). [Polish<br />

language] (At least) two factors moderate<br />

the relationship between implicit and explicit<br />

attitudes. In R.K. Ohme & M. Jarymowicz<br />

(Eds.), Natura automatyzmon.<br />

Warszawa: Wip Pan & SWPS.<br />

Nosek, B.A., Banaji, M.R., & Greenwald,<br />

A.G. (2002a). Math = male, me = female,<br />

therefore math ≠ me. Journal of Personality<br />

and Social Psychology, 83, 44-59.<br />

Nosek, B.A., Banaji, M.R., & Greenwald,<br />

A.G. (2002b). Harvesting implicit group<br />

attitudes and beliefs from a demonstration<br />

web site. Group Dynamics, 6, 101-115.<br />

Nosek, B.A., Greenwald, A.G., & Banaji,<br />

M.R. (2005a). Understanding and using<br />

the Implicit Association Test: II. Method<br />

variables and construct validity. Personality<br />

and Social Psychology Bulletin, 31, 166-180.<br />

Nosek, B.A., Greenwald, A.G., & Banaji,<br />

M.R. (2005b). The Implicit Association<br />

Test at age 7: A methodological and<br />

conceptual review. In J.A. Bargh (Edit.),<br />

Automatic Processes in Social Thinking and<br />

Behavior. Psychology Press.<br />

L’année psychologique, 2006, 106, 305-336<br />

Nosek, B.A., & Hansen, J.J. (2004). The associations<br />

in our heads belong to us: Measuring<br />

the multifaceted attitude construct in<br />

implicit social cognition. Manuscrit non<br />

publié.<br />

Nosek, B.A., & Smyth, F.L. (2005). A multitrait-multimethod<br />

validation of the<br />

Implicit Association Test: Implicit and<br />

explicit attitudes are related but distinct<br />

constructs. Sous presse.<br />

Olson, M.A., & Fazio, R.H. (2004). Reducing<br />

the influence of extrapersonal associations<br />

on the Implicit Association Test: personalizing<br />

the IAT. Journal of Personality<br />

and Social Psychology, 86, 653-667.<br />

Palfai, T.P., & Ostafin, B.D. (2003). Alcohol<br />

related motivational tendencies in hazardous<br />

drinkers: assessing implicit response<br />

tendencies using the modified-IAT.<br />

Behaviour Research and Therapy, 41, 1149-<br />

1162.<br />

Peeters, G. (1992). Evaluative meanings of<br />

adjectives in vitro and in context: Some<br />

theoretical implications and practical consequences<br />

of positive-negative asymmetry and<br />

behavioral-adaptive concepts of evaluation.<br />

Psychologica Belgica, 32, 211-231.<br />

Phelps, E.A., O’Connor, K.J., Cunningham,<br />

W.A., Funayama, E.S., Gatenby,<br />

J.C., Gore, J.C., & Banaji, M.R. (2000). Performance<br />

on indirect measures of race evaluation<br />

predicts amygdalia activation. Journal<br />

of Cognitive Neuroscience, 12, 729-738.<br />

Piontkowski, U., Blanz, M., Rohmann, A.,<br />

Schmermund, A., & Florack, A. (2001).<br />

The impact of multiple fit on implicit associations<br />

between categories: the Implicit<br />

Association Test as a research instrument<br />

in the study of social categorization. In<br />

F. Columbus (Ed.), Advances in psychology<br />

research, t. VI. Hauppauge (NY): Nova<br />

Science Publishers.<br />

Poehlman, T.A., Uhlmann, E., Greenwald,<br />

A.G, & Banaji, M.R. (2005). Understanding<br />

and Using the Implicit Association Test: III.<br />

Meta-analysis of Predictive Validity. Manuscrit<br />

non publié.


Validité et fondements théoriques des scores IAT 335<br />

Pratto, F., & John, O.P. (1991). Automatic<br />

vigilance: The attention-grabbing power of<br />

negative social information. Journal of Personality<br />

and Social Psychology, 61, 380-391.<br />

Rothermund, K., & Wentura, D. (2004).<br />

Underlying processes in the Implicit Association<br />

Test (IAT): Dissociating salience<br />

from association. Journal of Experimental<br />

Psychology: General, 133, 139-<br />

165.<br />

Steffens, M.C. (2004). Is the Implicit Association<br />

Test Immune to Faking? Experimental<br />

Psychology, 51, 165-179.<br />

Steffens, M.C., & Buchner, A. (2003). Implicit<br />

Association Test: separating transituationally<br />

stable and variable components<br />

of attitudes toward gay men. Experimental<br />

Psychology, 50, 33-48.<br />

Swanson, J.E., Rudman, L.A., &<br />

Greenwald, A.G. (2001). Using the Implicit<br />

Association Test to investigate<br />

attitude-behavior consistency for stigmatized<br />

behavior. Cognition and Emotion,<br />

15, 207-230.<br />

Teachman, B.A., Gregg, A.P. & Woody,<br />

S.R. (2001). Implicit associations for fearrelevant<br />

stimuli among individuals with<br />

snake and spider fears. Journal of Abnormal<br />

Psychology, 110, 226-235.<br />

Wilson, T.D., Lindsley, S. & Schooler, T.Y.<br />

(2000). A model of dual attitudes. Psychological<br />

Review, 107, 101-126.<br />

L’année psychologique, 2006, 106, 305-336

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!