UE 502 Psychométrie – Support TD : Textes - Vincent Berthet
UE 502 Psychométrie – Support TD : Textes - Vincent Berthet
UE 502 Psychométrie – Support TD : Textes - Vincent Berthet
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Licence 3 Psychologie<br />
Année universitaire 2012-2013<br />
<strong>UE</strong> <strong>502</strong> <strong>–</strong> PYCHOMETRIE<br />
<strong>Support</strong> de Cours <strong>–</strong> <strong>TD</strong><br />
<strong>Textes</strong><br />
<strong>Vincent</strong> <strong>Berthet</strong>
Texte 1<br />
Anastasi, A. (1994). Introduction à la psychométrie. Montréal : Guérin<br />
(chapitre 1 : p.3-24)
Texte 2<br />
Plaisant, O., Guertault, J., Courtois, R., Réveillère, C., Mendelsohn, G. A., & John, O. P. (2010).<br />
Histoire des « Big Five » : OCEAN des cinq grands facteurs de la personnalité. Introduction du Big<br />
Five Inventory français ou BFI-Fr. Annales Medico-psychologiques, 168, 481-486.
Mémoire<br />
Histoire des « Big Five » : OCEAN des cinq grands facteurs de la personnalité.<br />
Introduction du Big Five Inventory français ou BFI-Fr<br />
Big Five History: OCEAN of personality factors. Introduction of the French Big Five Inventory<br />
or BFI-Fr<br />
O. Plaisant a,b,c, *, J. Guertault b , R. Courtois c,d ,C.Réveillère c , G.A. Mendelsohn e , O.P. John e<br />
a URDIA, faculté de médecine, université Paris Descartes, 75005 Paris, France<br />
b Épilepsie et consultation de la douleur, groupe hospitalier Pitié-Salpêtrière, AP<strong>–</strong>HP, 47<strong>–</strong>83, boulevard de l’Hôpital, 75013 Paris, France<br />
c EA 2114 « Psychologie des âges de la vie », département de psychologie, université François-Rabelais, 37041 Tours cedex, France<br />
d Clinique psychiatrique universitaire, CHRU de Tours, 37044, Tours cedex 9, France<br />
e Department of Psychology and IPSR, University of California, Berkeley, États-Unis<br />
INFO ARTICLE<br />
Historique de l’article :<br />
Reçu le 9 juin 2008<br />
Accepté le 15 avril 2009<br />
Disponible sur Internet le 1 juillet 2010<br />
Mots clés :<br />
BFI-Fr<br />
Big Five Inventory<br />
Cinq grands facteurs de la personnalité<br />
Modèle des cinq facteurs de la personnalité<br />
Keywords:<br />
BFI-Fr<br />
Big Five<br />
Big Five Inventory<br />
Five factor model of personality<br />
Annales Médico-Psychologiques 168 (2010) 481<strong>–</strong>486<br />
RÉSUMÉ<br />
La description de la personnalité aété conçue à partir d’une variété de points de vue théoriques et à<br />
différents niveaux d’abstraction. Dans l’étude de la personnalité, l’unité la plus fréquemment utilisée<br />
pour mesurer les différences individuelles a été le trait. Un consensus semble se dégager actuellement<br />
sur une taxonomie générale des traits de la personnalité, les cinq facteurs de la personnalité, connus sous<br />
le nom des « Big Five », expression introduite par Goldberg. Le but de cet article est de resituer<br />
l’élaboration de la version originale du Big Five Inventory (BFI) de John, Donahue et Kentle (1991) dans<br />
son histoire, et parmi les autres tests disponibles le « <strong>TD</strong>A ou trait descriptive adjective » de Goldberg et le<br />
« NEO PI-R ou NEO personality inventory revised » de Costa et McCrae. La revue reprend les différents<br />
stades de conceptualisation des catégories qui furent élaborées à partir d’une sélection d’adjectifs de<br />
dictionnaires permettant de différencier un individu d’un autre. Seuls les traits seront utilisés pour<br />
l’élaboration des trois tests mentionnés. Les « Big Five » retrouvésàpartir d’analyses factorielles peuvent<br />
se résumer en cinq facteurs réplicables connus sous le nom de OCEAN ou CANOE de la personnalité,<br />
moyen mnémotechnique pour E (Extraversion, Énergie, Enthousiasme) ; A (Agréabilité, Altruisme,<br />
Affection) ; C (Conscience, Contrôle, Contrainte) ; N (Émotions Négatives, Névrosisme, Nervosité) ;O<br />
(Ouverture, Originalité, Ouverture d’esprit), ordre établi par les auteurs du BFI. La structure des « Big<br />
Five » regroupe à un haut niveau d’abstraction les points communs de la plupart des systèmes existant<br />
sur la description de la personnalité et met à disposition un modèle descriptif intégré pour des<br />
recherches sur la personnalité.<br />
ß 2010 Elsevier Masson SAS. Tous droits réservés.<br />
ABSTRACT<br />
* Auteur correspondant.<br />
Adresse e-mail : odile.plaisant@parisdescartes.fr (O. Plaisant).<br />
0003-4487/$ <strong>–</strong> see front matter ß 2010 Elsevier Masson SAS. Tous droits réservés.<br />
doi:10.1016/j.amp.2009.04.016<br />
Personality has been conceptualized from a variety of theoretical perspectives, and at various levels of<br />
abstraction or breadth. In personality research, the most common unit of measurement of individual<br />
differences remains trait. Today, a consensus seems to emerge as a general taxonomy of personality<br />
traits known as the Big Five, an expression introduced by Goldberg. The aim of this article is to describe<br />
the circumstances surrounding the elaboration of the Big Five Inventory in 1991 by John, Donahue, and<br />
Kentle, to put it back in its historical context, and compare it to the different tests available such as ‘‘<strong>TD</strong>A<br />
or trait descriptive adjective’’ of Goldberg and ‘‘NEO PI-R or NEO personality inventory revised’’ of Costa<br />
and McCrae. First, the different steps of category conceptualisation, developed from adjectives selected<br />
from the English dictionary to distinguish the behaviour of one human being from that of another will be
482<br />
‘‘... the scientific description of personality may not be quite so<br />
hopelessly complex as it is sometimes thought to be’’. Thurstone LL,<br />
septembre 1933 [39].<br />
« ... la description scientifique de la personnalité n’est peut-être<br />
pas aussi désespérément complexe qu’on le suppose parfois »<br />
(traduction des auteurs).<br />
1. Introduction<br />
La description de la personnalité aété conçue à partir d’une<br />
variété de points de vue théoriques et à différents niveaux<br />
d’abstraction. Par exemple, dès 1929, McDougall avait proposé<br />
cinq domaines pour définir la personnalité. Illesdénomma :<br />
« intellect », intelligence et connaissance ; « disposition »,<br />
tendances conatives et affectives ; « temper », mode d’exploitation<br />
des tendances conatives, le plus confus et obscur des<br />
facteurs ; « temperament », action du corps sur les réactions<br />
psychologiques et physiques du système nerveux ; « character »,<br />
organisation des tendances affectives en sentiments et<br />
complexes [29]. Chacun de ces niveaux, incluant la description<br />
de McDougall, a apporté une contribution à la compréhension<br />
des différences individuelles.<br />
Dans l’étude de la personnalité, l’unité la plus fréquemment<br />
utilisée pour mesurer ces différences individuelles a été le trait.<br />
Toutefois, le nombre de traits de personnalité et les échelles<br />
élaborées pour les explorer se sont multipliés considérablement.<br />
Les chercheurs et les praticiens s’intéressant à l’évaluation de la<br />
personnalité sont donc confrontés àune multitude d’échelles, qui<br />
peuvent avoir le même nom sans forcément mesurer les mêmes<br />
choses, ou au contraire ayant des noms différents tout en mesurant<br />
des concepts similaires.<br />
Après des années de recherche, un consensus semble se<br />
profiler sur une taxonomie générale des traits de la personnalité,<br />
les cinq grands facteurs de la personnalité, connus sous le nom<br />
des « Cinq Grands » ou « Big Five », expression introduite par<br />
Goldberg [17]. Le contenu de ces facteurs sera décrit ultérieurement<br />
dans l’article.<br />
Ces facteurs ne représentent pas un point de vue théorique<br />
particulier ; ils dérivent de l’analyse empirique, factorielle, des<br />
termes du langage courant qu’on utilise pour se décrire ou décrire<br />
les autres. N’ayant pas pour but de remplacer les systèmes<br />
précédents, la taxonomie des « Big Five » a une fonction intégrative<br />
car elle peut présenter les différents systèmes descriptifs de la<br />
personnalité dans un cadre commun [24]. Plusieurs inventaires<br />
pour mesurer les « Big Five » sont disponibles ; l’un d’entre eux, le<br />
« Big Five Inventory », est l’objet de cet article, dont le but est de<br />
montrer la découverte et la généralisation des cinq grands facteurs<br />
de la personnalité ; de resituer l’élaboration de la version originale<br />
du Big Five Inventory (BFI) de John et al. [22] dans son histoire,<br />
parmi les autres tests disponibles, et de faire l’inventaire des<br />
différentes versions du BFI disponibles en langue autre que<br />
l’anglais, comme la version espagnole [3], la version française, ou<br />
BFI-Fr (v45) [33], ou la version allemande [27].<br />
O. Plaisant et al. / Annales Médico-Psychologiques 168 (2010) 481<strong>–</strong>486<br />
considered. Only the traits have been used to elaborate the three tests. Factor structures resembling the Big<br />
Five were identified in numerous sets of variables. The Big Five were the only consistently replicable factors<br />
known as E (Extraversion, Energy, Enthusiasm), A (Agreeableness, Altruism, Affection), C (Conscientiousness,<br />
Control, Constraint), N (Neuroticism, Negative Affectivity, Nervousness), O (Openness, Originality,<br />
Open-mindedness). The reader intrigued by anagrams may have noticed that these letters form the OCEAN<br />
or the CANOE of personality dimensions. The Big Five structure captures, at a broad level of abstraction, the<br />
commonalities among most of the existing systems of personality description, and provides an integrative<br />
descriptive model for personality research.<br />
ß 2010 Elsevier Masson SAS. All rights reserved.<br />
2. Approche lexicale et découverte des « Big Five »<br />
De nombreux psychologues se sont tournés vers la langue<br />
comme source d’attributs afin de développer une taxonomie<br />
scientifique des traits de la personnalité. L’hypothèse lexicale<br />
postule que la plupart des caractéristiques importantes et<br />
socialement pertinentes de la personnalité d’une culture donnée<br />
sont encodées dans le langage naturel sous forme d’adjectifs [17].<br />
2.1. Travaux initiaux<br />
Allport peut être considéré comme l’un des pères du modèle en<br />
cinq facteurs (Five-Factor Model ou FFM). Suivant les travaux de<br />
Klages (1926) et ceux de Baumgarten (1933) [20], Allport et Odbert<br />
[2] menèrent une étude lexicale en relevant tous les termes<br />
décrivant la personnalité dans un dictionnaire anglais. Ils inclurent<br />
tous les termes pouvant être utilisés pour distinguer le comportement<br />
d’une personne de celui d’une autre [2] (p. 24). La liste<br />
complète s’éleva à presque 18 000 termes. Ils identifièrent quatre<br />
catégories principales. La première inclut les traits de personnalité<br />
(par exemple sociable, agressif, peureux) qu’ils définirent comme<br />
des tendances, des déterminants généraux et personnels des<br />
comportements habituels et stables de l’adaptation de l’individu à<br />
son environnement. La deuxième inclut des états temporaires, des<br />
humeurs et des activités tels que être effrayé ou transporté de joie,<br />
se réjouir. La troisième consiste en des jugements évaluant les<br />
conduites personnelles et la réputation des personnes, par<br />
exemple excellent, respectable, moyen et irritant. La dernière<br />
inclut les caractéristiques physiques, les capacités et les talents, les<br />
termes sans rapport avec la personnalité ou ne pouvant être inclus<br />
dans aucune des catégories.<br />
Allport et Odbert [2], puis Norman [30] qui augmenta le nombre<br />
de catégories, les considérèrent comme s’excluant mutuellement.<br />
Une inspection rapide de la classification montra que les catégories<br />
se chevauchaient et que leurs limites étaient floues, ce qui amena<br />
certains chercheurs à conclure que les distinctions entre les<br />
différentes classes de caractéristiques décrivant la personnalité<br />
étaient arbitraires et qu’elles devraient être abolies [1].<br />
2.2. Conception en modèle type (ou en prototype)<br />
Chaplin et al. [7], utilisant la théorie et les méthodes de Rosch<br />
[35], continuèrent à développer l’approche lexicale et se prononcèrent<br />
en faveur d’une conception en modèle type (prototype) où<br />
chaque catégorie <strong>–</strong> traits, états, activité, etc. <strong>–</strong> est définie par les<br />
termes les plus caractéristiques plutôt que par les définitions<br />
abstraites des limites de la catégorie ; les éléments des catégories<br />
n’avaient pas besoin d’être distincts mais pouvaient se définir le<br />
long d’un continuum. D’où le terme de prototype employé par les<br />
auteurs pour décrire les prototypes de la personnalité.<br />
Ils appliquèrent ce concept en prototype aux traits, aux états et<br />
aux activités pour mieux les différencier. Les états-type apparaissaient<br />
temporaires, brefs et déterminés par des causes externes,<br />
par exemple misérable, outragé. Les traits-types apparaissaient<br />
stables, durables, déterminés par des causes internes, par exemple
gentil, autoritaire. Ces résultats répliquèrent étroitement les<br />
premières classifications et confirmèrent que les définitions<br />
conceptuelles des traits et des états étaient largement retrouvées<br />
en recherche. Les activités n’étaient pas considérées comme une<br />
variable de personnalité.<br />
L’histoire des efforts pour développer une taxonomie des traits<br />
sera maintenant développée [21]. La première tentative a été faite<br />
par Thurstone [39]. Dès 1933, il avait montré, par analyse<br />
factorielle, la fréquence de distribution de cinq facteurs dans<br />
une étude de 60 traits de personnalité sous forme d’adjectifs.<br />
2.3. Travaux de Cattell et le 16PF<br />
Cattell utilisa la liste d’Allport et Odbert comme point de départ<br />
de son modèle multidimensionnel des structures de la personnalité.<br />
Cette liste étant trop longue, il commença avec 4500 traits [5]<br />
organisés en 160 clusters de termes bipolaires. Il réduisit les<br />
4500 traits à simplement 35 variables. Utilisant ce petit ensemble<br />
de variables, il conduisit plusieurs analyses factorielles obliques et<br />
conclut qu’il avait identifié 12 facteurs de personnalité qui<br />
finalement firent partie de son questionnaire des 16 facteurs de<br />
la personnalité (16PF) [6]. Toutefois, une nouvelle analyse des<br />
matrices de corrélation de Cattell n’a pas confirmé le nombre et la<br />
nature des facteurs [40].<br />
2.4. Première découverte des « Big Five »<br />
Le premier, Fiske [16], construisit une classification très<br />
simplifiée de 22 des variables de Cattell. La structure (factorielle)<br />
des facteurs ressemblait à ce qui serait connu plus tard comme les<br />
« Big Five ». Pour clarifier ces facteurs, Tupes et Christal [40]<br />
analysèrent à nouveau les matrices de corrélation provenant de<br />
huit échantillons différents. Dans toutes les analyses, Tupes et<br />
Christal retrouvèrent « cinq facteurs relativement constants et<br />
récurrents » [40] (p. 14). Norman [30], Borgatta [4], Digman et<br />
Takemoto-Chock [14] répliquèrent cette structure en cinq facteurs<br />
de listes dérivant des 35 variables de Cattell.<br />
Les cinq facteurs ont été dénommés différemment selon les<br />
auteurs et selon l’époque, mais furent finalement reconnus<br />
comme les cinq facteurs de la personnalité [17] <strong>–</strong>untitrechoisi<br />
non pas pour montrer leur grandeur intrinsèque mais pour mettre<br />
en évidence l’ampleur de chaque facteur. Ces cinq facteurs<br />
représentent le plus haut niveau d’abstraction de la personnalité<br />
et chaque dimension englobe un grand nombre de caractéristiques<br />
distinctes et plus spécifiques de la personnalité (traduction<br />
des auteurs).<br />
3. Approche actuelle des « Big Five »<br />
3.1. Les travaux de Goldberg et le « trait descriptive adjective ou <strong>TD</strong>A »<br />
Pendant les 45 ans qui suivirent l’utilisation des traits en<br />
langue anglaise que Cattell utilisa pour commencer sa description<br />
de la personnalité, de nombreux investigateurs ont proposé une<br />
structure alternative basée sur cinq facteurs orthogonaux. Dès<br />
1987, Peabody et Goldberg [31] définirent les cinq facteurs<br />
comme (I) Pouvoir ou Surgence, (II) Amour ou Amabilité, (III)<br />
Travail ou Conscience, (IV) Affect ou Émotions positives et (V)<br />
Intellect ou Culture [38]. Pour démontrer la généralisation de ce<br />
modèle en cinq facteurs, Goldberg a utilisé des groupes de termes<br />
dérivant du travail de Norman exprimant des traits sous forme<br />
d’adjectifs. Dans la première des trois études, 1431 traits sous<br />
forme d’adjectifs (1431-<strong>TD</strong>A) regroupés en75clustersontété<br />
analysés ; pratiquement une structure identique émergeait de dix<br />
différentes procédures d’analyse factorielle. Une deuxième étude<br />
de 479 termes courants regroupés en 133 clusters synonymes a<br />
O. Plaisant et al. / Annales Médico-Psychologiques 168 (2010) 481<strong>–</strong>486 483<br />
mis en évidencelamême structure dans deux échantillons d’autoévaluation<br />
et dans deux échantillons d’hétéro-évaluation. Aucun<br />
facteur apparu après les cinq facteurs ne s’était généralisé à<br />
travers les études. Dans la troisième étude, les analyses de<br />
100 clusters de 339 traits ont mis en évidence leur utilité<br />
potentielle en tant que marqueurs des « Big Five » pour des<br />
recherches ultérieures [18].<br />
L’approche de Goldberg [18] dérivant directement de<br />
l’approche lexicale évalue donc les cinq grands facteurs en<br />
décrivant les traits à l’aide d’adjectifs (Trait Descriptive Adjectives).<br />
Il a mis au point différentes listes d’adjectifs plus courtes que les<br />
précédentes dont l’une d’entre elles comprenant 50 items utilise<br />
un format connu sous le nom de « transparent ». Peu utilisée en<br />
recherche, celle-ci est intéressante sur le plan pédagogique [32].<br />
Une échelle de dix adjectifs bipolaires (par exemple, silencieuxvolubile)<br />
mesure chaque facteur. Les dix adjectifs sont regroupés<br />
sous le nom du facteur de telle sorte que le participant connaît les<br />
adjectifs attribués àchaque facteur, ce qui confère au test une très<br />
grande transparence. Une version française est disponible dans<br />
[32] (chap. 8, p. 227).<br />
La liste la plus utilisée en recherche est un ensemble de<br />
100 adjectifs unipolaires décrivant les traits (100-<strong>TD</strong>A). Par une<br />
série d’analyses factorielles, Goldberg a développé et affiné le <strong>TD</strong>A<br />
comme une représentation optimale de l’espace des cinq facteurs<br />
en anglais en ne sélectionnant pour chaque échelle des « Big Five »<br />
que les adjectifs définissant uniquement le facteur concerné. Les<br />
« Big Five » pour Goldberg deviennent Surgence, Agréabilité,<br />
Conscience, Stabilité émotionnelle et Intellect. Une version abrégée<br />
à 40 items a été développée par Saucier en 1994 [36,37].<br />
Goldberg est le créateur du « International Personality Item<br />
Pool » ou IPIP, un site web présentant la traduction de ses<br />
inventaires en de nombreuses langues ; ainsi une traduction<br />
française est disponible, notamment des 50 items en relation avec<br />
les cinq domaines du NEO-PI-R de Costa et McCrae (http://<br />
ipip.ori.org/).<br />
3.2. Recherche de Costa et McCrae et le NEO-PI-R<br />
Goldberg a suivi systématiquement l’approche lexicale mais<br />
d’autres auteurs ont préféré une autre approche pour évaluer la<br />
personnalité. L’une d’entre elles utilise des phrases descriptives<br />
dans une approche par questionnaire.<br />
Dans les années 1980, Costa et McCrae ont développé un<br />
questionnaire, le « NEO Personality Inventory » [9] pour mesurer<br />
trois importantes dimensions de la personnalité : Névrosisme,<br />
Extraversion et Ouverture aux expériences (NEO).<br />
En fait, Costa et McCrae commencèrent leur travail avec<br />
l’analyse des clusters des 16PF [6] qui dérivaient du travail lexical<br />
initial de Cattell. Leurs analyses ont reproduit les dimensions<br />
Extraversion et Névrosisme mais les ont convaincus de l’importance<br />
de l’ouverture qui provenait de plusieurs facteurs primaires<br />
de Cattell (par exemple imaginatif, expérimenté). En 1983, Costa et<br />
McCrae ont réalisé que leur système NEO était très proche de trois<br />
des cinq facteurs mais n’incluait pas de traits des deux autres<br />
domaines, Agréabilité et Conscience. Ils ont alors étendu leur<br />
modèle avec des échelles préliminaires mesurant l’Agréabilité et la<br />
Conscience. Dans plusieurs études [9,10], ils ont démontré que leur<br />
questionnaire à cinq échelles était très semblable aux mesures des<br />
« Big Five » basées sur les adjectifs, bien que leur conception de<br />
l’ouverture soit beaucoup plus large que les facteurs « intellect ou<br />
imagination » sortis des analyses lexicales. En 1992, Costa et<br />
McCrae ont publié les 240 items révisés de l’inventaire de<br />
personnalité (NEO Personality Inventory, Revised, NEO PI-R) [11]<br />
qui permet de différencier les mesures de chacun des cinq grands<br />
facteurs, appelés les cinq domaines, en fonction de six facettes<br />
spécifiques pour chacun des facteurs.
[(Fig._1)<strong>TD</strong>$FIG]<br />
484<br />
La Fig. 1 montre les six facettes définissant chacun des<br />
domaines ainsi que les adjectifs correspondant aux traits les plus<br />
corrélés avec chacune des facettes, montrant ainsi le lien avec les<br />
recherches lexicales. Chaque facette possède des variances<br />
partagées avec les autres facettes du domaine mais elle possède<br />
aussi leur propre variance. Chaque domaine est indépendant. Les<br />
facettes entre les domaines sont indépendantes.<br />
Le NEO PI-R a été développé sur des échantillons d’adultes d’âge<br />
moyen et d’âge mûr utilisant à la fois des analyses factorielles et<br />
des procédures de validation multiméthode pour construire le test.<br />
Les échelles ont montré une consistance interne, une stabilité<br />
temporelle et une validité convergente et discriminative lors des<br />
évaluations par les conjoints ou les pairs [11].<br />
Pour beaucoup de recherches, le NEO PI-R est trop long [24].<br />
C’est la raison pour laquelle Costa et McCrae ont développé le NEO-<br />
Five Factor Inventory (NEO-FFI) à 60 items, une version abrégée<br />
basée sur l’analyse factorielle des items de la version de 1985 du<br />
NEO PI [9,10]. Dans les échelles à 12 items du FFI n’ont été retenus<br />
que les items saturant le plus les cinq facteurs. Le NEO-FFI sert à<br />
évaluer les cinq domaines tandis que le NEO-PI-R donne des<br />
résultats pour chacune des facettes, permettant ainsi une approche<br />
psychopathologique plus fine [13]. L’inventaire de Costa et McCrae<br />
aété largement traduit dans différentes langues ; la version à<br />
240 items est disponible et a été adaptée en langue française par<br />
Rolland et al. [34]. La traduction proposée pour dénommer les<br />
facteurs est Névrosisme, Extraversion, Ouverture, Agréabilité,<br />
Conscience ou NEOAC, ordre défini par Costa et McCrae [12].<br />
Ultérieurement, les auteurs ont développé la théorie des cinq<br />
facteurs de la personnalité (Five-Factor Theory ou FFT), une<br />
interprétation explicative de la taxonomie des « Big Five ». La<br />
théorie est basée sur le fait que les cinq grandes dimensions<br />
auraient une base génétique importante [28] et devraient par<br />
conséquent dériver en partie de processus et de structures<br />
biologiques tels que des loci spécifiques sur des gènes, des régions<br />
cérébrales (par exemple l’amygdale), des neurotransmetteurs (par<br />
exemple, la dopamine), des hormones (par exemple la testostérone)<br />
[24]. C’est dans ce sens que les traits auraient un statut causal<br />
d’après les auteurs, mais il n’y a aucun lien spécifique entre les<br />
traits et des facteurs biologiques disponibles actuellement.<br />
Dès 1991, Costa soulignait l’intérêt d’évaluer la personnalité<br />
avant toute prise en charge psychologique de façon à offrir la<br />
meilleure thérapie en fonction des troubles mais aussi de façon à<br />
anticiper le cours de la thérapie et le suivi et à énoncer des buts [8].<br />
O. Plaisant et al. / Annales Médico-Psychologiques 168 (2010) 481<strong>–</strong>486<br />
Fig. 1. Montrant les six facettes du NEO-P-R définissant chacun des facteurs ainsi que les adjectifs correspondant aux traits les plus corrélés avec chacune des facettes,<br />
montrant ainsi le lien avec les recherches lexicales (traduction des auteurs. Communication personnelle 2000).<br />
De nombreuses recherches actuellement font le lien avec la<br />
psychopathologie ou la classification du DSM [13].<br />
Deux approches des « Big Five » peuvent ainsi être différenciées,<br />
les recherches lexicales de Goldberg [18] et les recherches basées<br />
sur des questionnaires de Costa et McCrae [11]. Malgré une<br />
abondante littérature, la structure des cinq grands facteurs de la<br />
personnalité n’a pas été acceptée comme une superstructure<br />
taxonomique par tous les chercheurs travaillant sur la personnalité.<br />
Pour renforcer cette hypothèse, une autre approche, dérivant<br />
de l’approche lexicale, va utiliser la conception en prototypes.<br />
3.3. Description des cinq facteurs dérivant de l’analyse en prototypes<br />
des catégories avec le Big Five Inventory<br />
Malgré des dénominations qui diffèrent et des contenus qui<br />
semblent varier, John [20] va s’interroger sur les cinq facteurs et<br />
chercher à extraire le dénominateur commun des catégories de<br />
traits définies par les chercheurs précédents. Pour cela, il a utilisé<br />
des évaluateurs et comme lexique les 300 termes de l’« Adjective<br />
Check List » de Gough et Heilbrun (ACL) comme point de départ de<br />
sa recherche [19] 1 .<br />
Un groupe de dix évaluateurs étudièrent dans le détail les cinq<br />
grandes dimensions en analysant les résultats des analyses<br />
factorielles et leurs interprétations dans tous les articles importants<br />
publiés sur les « Big Five » à l’époque de la recherche. Les<br />
évaluateurs classèrent chacun des 300 items de l’ACL dans l’une<br />
des cinq grandes catégories. Si cela n’était pas possible, les adjectifs<br />
étaient mis dans une sixième catégorie, « sans décision ». La validité<br />
interjuge était élevée. Les coefficients alpha étaient situés à<br />
0,90 pour le facteur IV (émotions négatives) et 0,94 pour le facteur<br />
V (ouverture), montrant que les évaluateurs avaient une compréhension<br />
consensuelle voire identique des cinq dimensions. Cent<br />
douze des 300 termes de l’ACL furent classés dans une des cinq<br />
grandes dimensions avec pratiquement une parfaite concordance<br />
(par exemple, par au moins 90 % des évaluateurs). Ces 112 termes<br />
représentaient une définition relativement étroite ou le fondement<br />
de la définition des cinq facteurs [24]. Logiquement, comme pour la<br />
construction de toute mesure, la validité de ces catégories devait<br />
être démontrée empiriquement. Si les prototypes initiaux mon-<br />
1 Une traduction française de « l’Adjectif Check List » est disponible et a été<br />
utilisée pour évaluer la désirabilité sociale dans trois cultures différentes<br />
américaine, italienne et française [traduction du CREDA Paris 5 ; 15].
traient une composition en cinq facteurs, les 112 termes auraient<br />
dû clairement définir cinq facteurs et chaque terme aurait dû avoir<br />
une saturation factorielle maximale dans chacun de leur facteur<br />
respectif. La plupart des recherches sur les « Big Five » ont été faites<br />
par auto-évaluation ou évaluation par des pairs, typiquement sur<br />
des étudiants. Cette étude a utilisé des évaluations par des<br />
psychologues testant ainsi la possibilité de retrouver les « Big Five »<br />
grâce à des descriptions de la personnalité formulées par des<br />
psychologues sur la base d’observations et d’entretiens intensifs.<br />
3.3.1. Validation des prototypes dans des observations<br />
L’ACL fut initialement développée àl’« Institute of Personality<br />
Assessment and Research, IPAR » (maintenant Institute of<br />
Personality and Social Research, ou IPSR) à l’université de<br />
Californie à Berkeley (États-Unis) pour permettre aux membres<br />
du personnel de décrire la personnalité des individus des<br />
programmes d’évaluation du centre [19] (p. 1).<br />
John [20] a utilisé un échantillon de 140 hommes et 140 femmes<br />
qui ont participé par groupe de dix à 15 à un programme<br />
d’évaluation de la personnalité à IPSR. Il y a eu dix descriptions par<br />
sujet, faites par dix évaluateurs différents. Les données résultantes<br />
ont fait l’objet d’une analyse factorielle. Les résultats de l’analyse<br />
factorielle ont montré que chaque adjectif pouvait être classé dans<br />
le facteur qui lui avait été attribué hypothétiquement au départ,<br />
confirmant ainsi de façon spectaculaire les prototypes initiaux.<br />
Avec une exception, chaque item se situait dans son hypothétique<br />
facteur dans la direction espérée. Pour 98 des 112 items, les plus<br />
grandes saturations factorielles se retrouvaient aussi dans le<br />
facteur et la plupart de celles-ci étaient élevées.<br />
Dans cette étude, on retrouvait différentes composantes pour<br />
chaque facteur. Par exemple pour l’Extraversion : niveau d’Activité<br />
(actif, énergique), Dominance (sûr de soi, autoritaire), Sociabilité<br />
(extraverti, sociable, bavard), Expressivité (aventureux, carré,<br />
bruyant, vantard) et Émotions positives (enthousiaste, a du cran).<br />
Il faut remarquer que ces cinq composantes sont semblables à cinq<br />
des six facettes que Costa et McCrae [11] ont inclues dans leur<br />
définition du domaine Extraversion <strong>–</strong> Activité, Autoritarisme,<br />
Grégarisme, Surexcitation et Émotions positives.<br />
3.3.2. Big Five Inventory (BFI) : mesure des caractéristiques<br />
principales des « Big Five » à l’aide de courtes phrases ou de<br />
groupes de mots<br />
Pour répondre au besoin d’un instrument court mesurant les<br />
prototypes des cinq facteurs de la personnalité communs aux<br />
investigateurs précédents, John et al. ont construit le « Big Five<br />
Inventory » [3,22]. Les 44 items du BFI ont été développés en<br />
Californie pour représenter les prototypes élaborés à partir de<br />
l’évaluation d’experts et ultérieurement vérifiés par analyse<br />
factorielle à partir des données d’évaluation d’observateurs. Le<br />
but était de créer un inventaire bref qui permettrait une mesure<br />
efficace et flexible des cinq dimensions quand il n’y a pas de<br />
nécessité de mesure plus approfondie des facettes.<br />
Les items du BFI n’utilisent pas de simples adjectifs car les<br />
réponses à de simples adjectifs sont moins précises ; celles-ci sont<br />
meilleures quand elles sont accompagnées de définitions ou dans<br />
un contexte plus élaboré. Le BFI utilise de courtes phrases ou des<br />
groupes de mots basés sur les traits à partir des adjectifs reconnus<br />
pour être les prototypes de la description des « Big Five », ayant la<br />
plus grande saturation factorielle dans la dimension [20,24,26].Un<br />
ou deux adjectifs-types servent d’information principale pour la<br />
construction de l’item auquel sont ajoutées des informations plus<br />
élaborées, clarifiantes ou contextuelles. Par exemple, l’adjectif<br />
appartenant au facteur d’Ouverture « original » devient l’item du<br />
BFI : est créatif, plein d’idées originales ; et l’adjectif « persévérant »<br />
O. Plaisant et al. / Annales Médico-Psychologiques 168 (2010) 481<strong>–</strong>486 485<br />
du facteur Conscience sert de base à l’item : persévère jusqu’à ce<br />
que sa tâche soit finie. Bien qu’il n’y ait que huit à dix items par<br />
facteurs, le BFI présente de bonnes propriétés psychométriques et<br />
couvre le contenu des domaines. Par exemple, l’échelle d’Agréabilité<br />
à neuf items dans la version anglaise et espagnole, à dix items<br />
dans les versions allemande et française, inclut des items couvrant<br />
au moins cinq des six facettes de Costa et McCrae [11] : Confiance<br />
(indulgent, confiant), Altruisme (serviable, généreux), Compliance<br />
(conciliant), Modestie (ne critique pas les autres) et Sensibilité<br />
(prévenant, gentil).<br />
Le BFI a été traduit en plusieurs langues. Toutes ces traductions<br />
ont été construites pour avoir des propriétés psychométriques<br />
aussi proches que possible de la version originale américaine de<br />
John et al. [22]. La version espagnole possède 44 items comme la<br />
version américaine, mais l’ordre des items est différent [3]. En<br />
français, le BFI-Fr, comme il a été appelé par les auteurs, comprend<br />
dans sa version définitive 45 items [33] ; il en est de même pour la<br />
version allemande [27]. Les versions du BFI élaborées en<br />
collaboration avec Oliver P. John, sauf la version française, sont<br />
disponibles sur le site : http://www.outofservice.com/bigfive/. Le<br />
BFI de John et al. [20] aété fréquemment utilisé en recherche<br />
quand le temps de passation devait être court et quand il était<br />
préférable d’utiliser de courtes expressions donnant plus d’explications<br />
que les simples adjectifs de Goldberg et étant moins<br />
complexes que les phrases utilisées dans les questionnaires NEO de<br />
Costa et McCrae. Cependant, John et al. soulignent que les<br />
questionnaires NEO de Costa et McCrae [11] représentent la<br />
mesure des « Big Five » la plus validée dans la tradition des<br />
questionnaires ; alors que le <strong>TD</strong>A à 100 items de Goldberg est la<br />
mesure la plus communément utilisée en ce qui concerne<br />
l’utilisation de simples adjectifs [20,24,26].<br />
Pour obtenir une comparaison empirique des trois outils<br />
mesurant les « Big Five », John et al. ont résumé les réponses<br />
aux trois tests de 829 étudiants de l’université de Californie à<br />
Berkeley [25,26] qui avaient rempli le BFI, la version à 40 items<br />
élaborée par Saucier [36] du <strong>TD</strong>A de Goldberg, ainsi que le NEO PI-R<br />
de Costa et McCrae [11] à partir duquel ils ont évalué à la fois les<br />
Tableau 1<br />
Définitions et exemples d’items du BFI-Fr.<br />
Exemples d’items français Pôle<br />
E (Facteur 1)<br />
Extraversion, Énergie, Enthousiasme<br />
1. est bavard Positif (élevé)<br />
6. est réservé Négatif (bas)<br />
A (Facteur 2)<br />
A (Agréabilité, Altruisme, Affection)<br />
32. est prévenant et gentil avec presque tout le monde Positif (élevé)<br />
27. est parfois dédaigneux, méprisant Négatif (bas)<br />
C (Facteur 3)<br />
C (Conscience, Contrôle, Contrainte)<br />
3. travaille consciencieusement Positif (élevé)<br />
23. a tendance à être paresseux Négatif (bas)<br />
N (Facteur 4)<br />
Émotions Négatives, Névrosisme, Nervosité<br />
39. est facilement anxieux Positif (élevé)<br />
9. est « relaxe », détendu, gère bien les stress Négatif (bas)<br />
O (Facteur 5)<br />
Ouverture, Originalité, Ouverture d’esprit<br />
5. est créatif, plein d’idées originales Positif (élevé)<br />
41. est peu intéressé par tout ce qui est artistique Négatif (bas)<br />
Le BFI donne une note pour chacun des cinq grands facteurs qui représente la<br />
moyenne des scores. Chaque item se situe vers le pôle positif (élevé) oulepôle<br />
négatif (bas) de la dimension. Les deux pôles sont « opposés ». Certains items sont<br />
cotés àl’envers de telle sorte que chaque score moyen se trouve dans la même<br />
direction, dans la direction du nom de la dimension. BFI : Big Five Inventory ; Fr :<br />
français. Items reproduits avec permission.
486<br />
scores des 30 facettes et ceux des domaines du NEO-FFI. Si<br />
globalement les corrélations entre les trois outils étaient satisfaisantes,<br />
une étude minutieuse des résultats a reposé la signification<br />
et l’ordre d’importance des facteurs ainsi que leur dénomination.<br />
Le fait qu’il importe peu que les facteurs soient mesurés avec<br />
des adjectifs, des expressions ou des phrases d’un questionnaire<br />
suggère que les cinq grandes dimensions ont les mêmes bases<br />
conceptuelles, quel que soit l’outil utilisé, que cet outil dérive de<br />
l’approche lexicale, de l’approche par prototype ou de l’approche<br />
par questionnaire.<br />
Il existe cinq grandes dimensions de la personnalité que l’on<br />
peut répliquer et qui peuvent se résumer par un concept large de<br />
EACNO connu sous le nom de : Extraversion, Agréabilité,<br />
Conscience, émotions Négatives (Névrosisme), Ouverture. John<br />
et al. ont pris ainsi la position de ne plus dénommer les facteurs<br />
mais de leur attribuer une lettre connue sous les anagrammes<br />
OCEAN ou CANOE, l’océan ou le canoë de la personnalité, moyens<br />
mnémotechniques permettant de mémoriser les cinq facteurs. Ils<br />
réfutent aussi le chiffre romain conventionnel attribué à chaque<br />
facteur dans les analyses lexicales qui reflète l’importance relative<br />
des facteurs E (I), A (II), C (III), N (IV), O (V) et leur donne ainsi un<br />
ordre spécifique EACNO, reflet des résultats de l’analyse factorielle.<br />
Ils préfèrent, comme cela est montré dans le Tableau 1,<br />
accompagner la dénomination du facteur par sa lettre et par<br />
une série de termes explicatifs englobant ainsi l’ensemble de la<br />
définition du facteur [26] (Tableau 1).<br />
4. Conclusion<br />
La structure des « Big Five » regroupe à un haut niveau<br />
d’abstraction les points communs de la plupart des systèmes<br />
existant sur la description de la personnalité et met à disposition<br />
un modèle descriptif intégré pour des recherches sur la personnalité.<br />
Les anagrammes OCEAN ou CANOE de la personnalité résument<br />
cinq des facteurs réplicables de la description de la personnalité<br />
qui sont E (Extraversion, Énergie, Enthousiasme) ; A (Agréabilité,<br />
Altruisme, Affection) ; C (Conscience, Contrôle, Contrainte) ; N<br />
(émotions Négatives, Névrosisme, Nervosité) ; O (Ouverture,<br />
Originalité, Ouverture d’esprit).<br />
Le choix de l’outil utilisé dépend du but de l’étude envisagée. Le<br />
BFI-Fr [33] dont la traduction a été élaborée de façon à avoir des<br />
propriétés psychométriques très similaires à celles du BFI<br />
américain, par sa brièveté et sa facilité de passation, offre un outil<br />
très maniable pour évaluer rapidement de grands échantillons. Il<br />
offre aussi un inventaire rapide et fiable voire ludique pour le suivi<br />
des thérapies et rejoint ainsi les possibilités offertes par le NEO<br />
[15]. Il peut être utilisé en auto-évaluation ou en évaluation par des<br />
pairs, y compris les thérapeutes. La version adaptée aux<br />
adolescents offrira une possibilité d’utilisation au cours des<br />
évaluations des familles ou des thérapies systémiques [23,38].<br />
Conflit d’intérêt<br />
Aucun.<br />
Références<br />
[1] Allen BP, Potkay CR. On the arbitrary distinction between states and traits. J<br />
Pers Soc Psychol 1981;41:916<strong>–</strong>28.<br />
[2] Allport GW, Odbert HS. Trait-names: a psycho-lexical study. Psychol Monogr<br />
1936;47:211.<br />
[3] Benet-Martinez V, John OP. Los Cinco Grandes across cultures and ethnic<br />
groups: multitrait-multimethod analyses of the Big Five in Spanish and<br />
English. J Pers Soc Psychol 1998;75:729<strong>–</strong>50.<br />
[4] Borgatta EF. The structure of personality characteristics. Behav Sci 1964;9:<br />
8<strong>–</strong>17.<br />
O. Plaisant et al. / Annales Médico-Psychologiques 168 (2010) 481<strong>–</strong>486<br />
[5] Cattell RB. Advances in Cattellian personality theory. In: Pervin LA, editor.<br />
Handbook of personality: theory and research. New York: Guilford; 1990. p.<br />
101<strong>–</strong>10.<br />
[6] Cattell RB, Eber HW, Tatsuoka MM. Handbook for the Sixteen Personality<br />
Factor Questionnaire (16PF). Champaign, IL: IPAT; 1970.<br />
[7] Chaplin WF, John OP, Goldberg LR. Conceptions of states and traits: dimensional<br />
attributes with ideals as prototypes. J Pers Soc Psychol 1988;54:541<strong>–</strong>57.<br />
[8] Costa PT. Clinical use of the five factor model: an introduction. J Pers Assess<br />
1991;57:393<strong>–</strong>8.<br />
[9] Costa PT, McCrae RR. The NEO Personality Inventory manual. Odessa, FL:<br />
Psychological Assessment Resources; 1985.<br />
[10] Costa PT, McCrae RR. NEO PI/FFI Manual Supplement. Odessa, FL: Psychological<br />
Assessment Resources; 1989.<br />
[11] Costa PT, McCrae RR. NEO PI-R Professional Manual. Odessa, FL: Psychological<br />
Assessment Resources; 1992.<br />
[12] Costa PT, McCrae RR. Inventaire NEO PI-R adaptation française (JP Rolland).<br />
ECPA; 1998.<br />
[13] Costa PT, Widiger TA, editors. Personality disorders and the five factor model<br />
of personality. Washington, DC: American Psychological Association; 2002.<br />
[14] Digman JM, Takemoto-Chock NK. Factors in the natural language of personality:<br />
re-analysis and comparison of six major studies. Multivariate Behav Res<br />
1981;16:149<strong>–</strong>70.<br />
[15] Fioravanti M, Gough HG, Frere LJ. English, French, and Italian adjective check<br />
lists. A social desirability analysis. J Cross Cult Psychol 1981;12(4):461<strong>–</strong>72.<br />
[16] Fiske DW. Consistency of the factorial structures of personality ratings from<br />
different sources. J Abnorm Soc Psychol 1949;44:329<strong>–</strong>44.<br />
[17] Goldberg LR. Language and individual differences: the search for universals in<br />
personality lexicons. In: Wheeler L, editor. Review of personality and social<br />
psychology, vol. 2. Beverly Hills, CA: Sage; 1981 (pp. 141<strong>–</strong>65).<br />
[18] Goldberg LR. An alternative ‘‘description of personality’’: the Big-Five factor<br />
structure. J Pers Soc Psychol 1990;59:1216<strong>–</strong>29.<br />
[19] Gough HG, Heilbrun Jr AB. The Adjective Check List manual. Palo Alto, CA:<br />
Consulting Psychologists Press; 1983.<br />
[20] John OP. The ‘‘Big Five’’ factor taxonomy: dimensions of personality in the<br />
natural language and questionnaires. In: Pervin LA, editor. Handbook of<br />
personality: theory and research. New York: Guilford Press; 1990. p. 66<strong>–</strong>100.<br />
[21] John OP, Angleitner A, Ostendorf F. The lexical approach to personality: a<br />
historical review of trait taxonomic research. Eur J Pers 1988;2:171<strong>–</strong>203.<br />
[22] John OP, Donahue EM, Kentle RL. The Big Five Inventory-Versions 4a and 54.<br />
University of California/Institute of Personality and Social Research: Berkeley;<br />
1991.<br />
[23] John OP, Caspi A, Robins RW, Moffitt TE, Stouthamer-Loeber M. The ‘‘Little<br />
Five’’: exploring the nomological network of the five-factor model of personality<br />
in adolescent boys. Child Dev 1994;65:160<strong>–</strong>78.<br />
[24] John OP, Srivastava S. The Big Five trait taxonomy: history, measurement, and<br />
theoretical perspectives. In: Pervin LA, John OP, editors. Handbook of personality:<br />
theory and research. New York: Guilford; 1999. p. 102<strong>–</strong>38.<br />
[25] John OP, Soto CJ. The importance of being valid: reliability and the process of<br />
construct validation. In: Robins RW, Fraley RC, Krueger RF, editors. Handbook<br />
of research methods in personality psychology. New York: Guilford; 2007.<br />
[26] John OP, Naumann LP, Soto CJ. Paradigm shift to the integrative Big-Five trait<br />
taxonomy: history, measurement, and conceptual Issues. In: John OP, Robins<br />
RW, Pervin LA, editors. Handbook of personality: theory and research (3rd ed.).<br />
New York: Guilford 2008. 114<strong>–</strong>58.<br />
[27] Lang FR, Luedtke O, Asendorpf JB. Validity and psychometric equivalence of<br />
the German version of the Big Five Inventory in young, middle-aged and old<br />
adults. Diagnostica 2001;47:111<strong>–</strong>21.<br />
[28] Loehlin JC, McCrae RR, Costa PT, John OP. Heritabilities of common and<br />
measure-specific components of the Big Five personality factors. J Res Pers<br />
1998;32:431<strong>–</strong>53.<br />
[29] McDougall W. Of the words character and personality. J Pers 1932;1:3<strong>–</strong>16.<br />
[30] Norman WT. 2,800 personality trait descriptors: normative operating characteristics<br />
for a university population. Michigan: Department of Psychology,<br />
University of Michigan; 1967.<br />
[31] Peabody D, Goldberg LR. Some determinants of factor structures from personality-trait<br />
descriptors. J Pers Soc Psychol 1989;57:552<strong>–</strong>67.<br />
[32] Pervin LA, John OP. La personnalité : de la théorie à la recherche. De<br />
Boeck, Bruxelles; 2005.<br />
[33] Plaisant O, Courtois R, Réveillère R, Mendelsohn GA, John OP. Validation du Big<br />
Five Inventory français (inventaire des cinq grandes dimensions de la personnalité).<br />
Ann Med Psychol 2010; 168: 97<strong>–</strong>106<br />
[34] Rolland JP, Parker WD, Stumpf H. A psychometric examination of the French<br />
translations of NEO-PI-R and NEO-FFI. J Pers Assess 1998;71(2):269<strong>–</strong>91.<br />
[35] Rosch E. Principles of categorization. In: Rosch E, Lloyd B, editors. Cognition<br />
and categorization. Hillsdale, NJ: Erlbaum; 1978. p. 27<strong>–</strong>48.<br />
[36] Saucier G. Mini-Markers: a brief version of Goldberg’s unipolar Big-Five<br />
markers. J Pers Assess 1994;63:506<strong>–</strong>16.<br />
[37] Saucier G, Goldberg LR. Personnalité, caractère et tempérament : la structure<br />
translinguistique des traits. Psychol Fr 2006;51:265<strong>–</strong>84.<br />
[38] Soto CJ, John OP, Gosling SD, Potter J. The developmental psychometrics of Big<br />
Five self-reports: acquiescence, factor structure, coherence, and differentiation<br />
from ages 10 to 20. J Pers Soc Psychol 2008;94(4):718<strong>–</strong>37.<br />
[39] Thurstone LL. The vectors of mind. Psychol Rev 1934;41:1<strong>–</strong>32.<br />
[40] Tupes EC, Christal RC. Recurrent personality factors based on trait ratings. J<br />
Pers 1992;60:225<strong>–</strong>51 (réimprimé en 1992).
Texte 3<br />
Lautrey, J. (2006). Cent ans après Binet, quoi de neuf sur l’intelligence de l’enfant ? Bulletin de<br />
psychologie, 59, 133-143.
Cent ans après Binet : quoi de neuf sur l’intelligence de l’enfant ?<br />
1<br />
Jacques Lautrey 1<br />
L’année 2005 est celle du centenaire de la publication de la première version de l’échelle<br />
métrique qu’Alfred Binet et Théodore Simon ont mise au point pour évaluer le<br />
développement de l’intelligence chez l’enfant (Binet, Simon, 1905). Pour célébrer ce<br />
centenaire, la Fédération Française des Psychologues et de Psychologie (FFPP), a organisé un<br />
congrès international intitulé « L’intelligence de l’enfant : cent ans après Binet » qui s’est<br />
tenu à Paris en octobre 2005 2 et visait à faire le point sur l’état actuel des connaissances sur<br />
l’intelligence de l’enfant.<br />
Le propos du présent article est de tenter une synthèse 3 des communications présentées à<br />
ce congrès afin de dégager quelques unes des lignes de force qui sous-tendent, cent ans après<br />
Binet, l’évolution des idées sur l’intelligence de l’enfant. Le nombre et la diversité des<br />
communications présentées 4 suffiraient à dissuader toute tentative de synthèse exhaustive<br />
mais celle-ci est de toute façon rendue impossible par le fait que les symposia et certaines des<br />
conférences se déroulaient en parallèle. Comme chacun des participants, l’auteur de ces lignes<br />
n’a pu assister qu’à un symposium sur quatre et à une conférence semi-plénière sur deux. La<br />
synthèse qui suit est donc très partielle et forcément partiale.<br />
Puisqu’à l’origine de ce congrès il y avait la volonté de célébrer le centenaire de la<br />
publication de l’échelle métrique de l’intelligence de Binet et Simon, commençons par ce qui<br />
s’est dit de l’histoire de cette invention. Deux points ressortent plus particulièrement de la<br />
conférence que Michel Huteau (Conservatoire National des Arts et Métiers) a consacrée à<br />
cette question, d’une part la rupture créée par les idées de Binet avec la conception de<br />
l’intelligence de l’enfant qui était dominante à l’époque, d’autre part la faiblesse de l’impact<br />
que l’échelle métrique a eu en France, par rapport à celui qu’elle a eu dans le reste de<br />
l’Europe et surtout aux États-Unis. À la fin du XIXe siècle, la théorie dominante sur le<br />
1 Professeur émérite à l’Université Paris 5-René Descartes, Centre Henri Piéron, 71 Avenue Edouard Vaillant, 92<br />
774 Boulogne-Billancourt. Courriel : jacques.lautrey@psycho.univ-paris5.fr<br />
2 Ce congrès, qui a réuni 1225 participants et 85 conférenciers, s’est tenu du 6 au 8 octobre 2005 au Palais de la<br />
Mutualité sous le haut patronage du ministère de l’Education et de la Recherche et du ministère de la Santé, avec<br />
le soutien de la Fédération européenne des associations de psychologues et de l’Association américaine de<br />
psychologie.<br />
3 Cet article reprend la synthèse présentée dans la conférence de clôture du congrès.<br />
4 une vingtaine de conférences plénières ou semi-plénières et une cinquantaine de communications dans des<br />
symposia ou des tables rondes ont été présentées et elles ont porté sur des thèmes relevant aussi bien de la<br />
pratique de l’évaluation de l’intelligence que de la recherche fondamentale dans ce domaine.
fonctionnement de l’intelligence était l’associationnisme : la pensée était supposée procéder<br />
de l’association d’images et les images étaient supposées procéder de l’association de<br />
sensations. Wundt adhérait à cette théorie associationniste et le principe sur lequel il avait<br />
fondé la psychologie expérimentale était qu’à l’instar de la physique, la psychologie<br />
scientifique devait aborder l’étude des phénomènes psychiques complexes en les<br />
décomposant en éléments plus simples et en commençant par l’étude de ces éléments. Ceci<br />
explique que les premières tentatives de mesure de l’intelligence, celles de Galton et de<br />
Cattell, aient été focalisées sur la mesure de sensations. Si les sensations étaient les briques<br />
avec lesquelles se construisait l’intelligence, l’efficacité de cette dernière devait en somme<br />
être déterminée par la qualité des briques.<br />
Binet, qui avait d’ailleurs lui-même adhéré à l’associationnisme auparavant, a rompu avec<br />
cette conception à la fois sur le rôle des images, et sur celui des sensations. Sur le premier<br />
point, il a contribué à montrer qu’il y a une pensée sans images et a suggéré que l’origine de<br />
la pensée était plutôt à chercher dans l’activité du sujet. Selon Michel Huteau, ce point de vue<br />
préfigurait le rôle que Piaget a plus tard donné à l’action dans la construction de la pensée<br />
logique, et il a rappelé à cette occasion que Piaget a mis en oeuvre les méthodes d'étude de<br />
l'intelligence de Binet lors de son séjour à Paris de 1919 à 1921. Sur le second point, Binet a<br />
très tôt affirmé (voir Binet, Henri, 1895) que la mesure de l’intelligence devait s’appuyer sur<br />
l’étude des différences d’efficience observées dans les processus supérieurs plutôt que dans<br />
des processus aussi élémentaires que les sensations, comme le faisaient Galton et Cattell à<br />
cette époque. L’échelle métrique était l’application de ces idées à la mesure de l’intelligence.<br />
Pourquoi le Binet-Simon n’a-t-il pas eu en France l’impact qu’il a eu aux États-Unis où en<br />
quelques années il a donné naissance au mouvement des tests ? Plusieurs raisons ont pu jouer<br />
et Michel Huteau en a évoqué quelques unes. Parmi celles-ci le décès prématuré de Binet bien<br />
sûr, l’année même de la publication de la troisième version de son test (Binet, 1911).<br />
L’absence de disciples aussi, qui n’était sans doute pas étranger à son caractère indépendant.<br />
Mais un des facteurs les plus décisifs a sans doute été la froideur de l’accueil fait à l’échelle<br />
métrique par les expérimentalistes. La communauté des expérimentalistes était en fait très<br />
restreinte et se concentrait dans le laboratoire de Villejuif, dirigé par Edouard Toulouse, dont<br />
les assistants étaient Henri Piéron et Nicolas Vaschide. Cette équipe travaillait aussi à la mise<br />
au point de techniques de mesure de l’intelligence mais restait encore très attachée à<br />
l’approche associationniste et élémentiste défendue par Wundt (Toulouse, Vaschide, Piéron,<br />
1904). Même si Piéron s’est mis, lui aussi, avec certes un certain retard sur Binet, à<br />
l’évaluation des processus supérieurs, il est par contre toujours resté réticent vis-à-vis de la<br />
2
notion d’intelligence globale. Il concevait les aptitudes comme multiples et indépendantes, ce<br />
qui lui a plus tard fait trouver beaucoup plus d’intérêt à la conception multi-factorielle de<br />
l’intelligence défendue par Thurstone qu’à la notion de QI ou à celle de facteur général. Or,<br />
Comme l’a rappelé Michel Huteau, c’est Piéron qui s’est trouvé par la suite en position de<br />
développer la psychologie scientifique en France. Le désaccord qui l’opposait à Binet sur les<br />
méthodes d’évaluation de l’intelligence est probablement une des raisons du manque de<br />
reconnaissance de la communauté de psychologie scientifique française envers le Binet-<br />
Simon (voir Huteau, 2001, sous presse).<br />
Il était donc important que le centenaire de l’échelle métrique soit célébré en France et ce<br />
congrès international a été une excellente occasion de manifester à l’œuvre de Binet sur<br />
l’intelligence de l’enfant, une reconnaissance qui lui a longtemps été assez chichement<br />
mesurée dans son propre pays.<br />
La synthèse qui suit est articulée autour de quelques évolutions majeures dans les idées<br />
sur l’intelligence qui m’ont paru se dégager des communications présentées au congrès.<br />
DES PROCESSUS SUPÉRIEURS AUX PROCESSUS EXÉCUTIFS<br />
Binet a varié dans la liste des processus supérieurs qui lui paraissaient sous-tendre<br />
l’intelligence. Il a par exemple cité la mémoire, l’imagination, l’attention, la faculté de<br />
comprendre (Binet, Henri, 1895) ; le bon sens, le sens pratique, l’initiative, la faculté de<br />
s’adapter (Binet, Simon, 1905) ; la compréhension, l’invention, la direction, la censure (Binet,<br />
1909). Il n’a par contre jamais varié dans l’idée que l’explication des différences d’efficience<br />
intellectuelle devait être recherchée à ce niveau. Cette idée est manifestement encore<br />
d’actualité, à ceci près que les processus supérieurs auxquels on s’intéresse maintenant sont<br />
les processus exécutifs, ceux qui se trouvent au sommet d’une organisation hiérarchique du<br />
fonctionnement cognitif et assurent le contrôle des autres processus cognitifs. Selon les cadres<br />
théoriques de référence, il s’agit des processus responsables de la capacité de la mémoire de<br />
travail, de la capacité attentionnelle, de la puissance mentale, ou de la métacognition. Une<br />
nette convergence s’est manifestée sur ce point au cours du congrès.<br />
Dans le cadre de la perspective développementale, Juan Pascual-Leone (Université de<br />
Toronto) a présenté l’état actuel de sa théorie neo-piagétienne du développement de<br />
l’intelligence. Celle-ci met l’accent sur un système central de gestion attentionnelle dont les<br />
principaux opérateurs sont celui de puissance mentale, M, qui définit le nombre de schèmes<br />
pouvant être activés simultanément, celui d’inhibition, I, qui permet d’interrompre l’exécution<br />
3
de schèmes non pertinents, et E, celui des schèmes exécutifs qui définissent les buts et<br />
allouent les ressources d’activation aux autres opérateurs. On retrouve cette idée de ressource<br />
centrale limitée, dont la capacité s’accroît avec le développement, dans les autres théories<br />
neo-piagetiennes qui ont été présentées par Anik de Ribaupierre (Université de Genève). Cette<br />
ressource centrale correspond à l’empan de la mémoire de travail dans la théorie de Robbie<br />
Case, ou au niveau optimal dans la théorie de Kurt Fischer. Toutes les théories neopiagetiennes<br />
ont en commun de lier le développement cognitif à l’accroissement de cette<br />
capacité cognitive centrale. Une vue d’ensemble de ce courant de recherche peut être trouvée<br />
dans un ouvrage collectif (Demetriou, Shayer, Efklides, 1988) et dans une discussion critique<br />
de son évolution plus récente (Ribaupierre, 1997).<br />
Dans le cadre de l’étude neuropsychologique du développement de la pensée logique,<br />
Olivier Houdé (Université Paris 5) a lui aussi mis l’accent sur le rôle central des processus<br />
exécutifs responsables de l’activation et de l’inhibition dont le siège est situé dans les aires du<br />
cortex préfrontal (Houdé, 2005). Les travaux d’imagerie cérébrale de Duncan et<br />
collaborateurs vont dans le même sens en montrant que ce sont principalement les aires du<br />
cortex préfrontal qui sont activées lorsque des sujets résolvent des tests saturés par le facteur<br />
général d’intelligence fluide (Duncan, Seitz et coll., 2000).<br />
Dans le cadre de l’approche expérimentale et de l’approche différentielle maintenant, les<br />
travaux actuels sur la mémoire de travail présentés par Thierry Lecerf (Université de Genève)<br />
montrent que celle-ci explique une grande partie de la variance du facteur d’intelligence<br />
fluide, tel qu’il est mis en œuvre dans des épreuves comme les matrices progressives de<br />
Raven (Conway, Cowan et coll., 2002 ; Engle, Tuholski et coll., 1999). Pour ces auteurs, la<br />
mémoire de travail (MT) correspond aux éléments activés de la mémoire à long terme et son<br />
empan renseigne sur la capacité attentionnelle maximale susceptible s’être mise en œuvre<br />
pour maintenir l’activation de ces éléments.<br />
Peut-on donc conclure que le facteur général d’intelligence fluide, qui est le plus proche<br />
du facteur général d’intelligence, correspond à la capacité de la mémoire de travail ? Oui pour<br />
une bonne part, c’est une des conclusions que l’on peut tirer des travaux présentés à ce<br />
congrès. Mais il faut aussitôt se demander si la notion de mémoire de travail n’est pas aussi<br />
globale que la notion d’intelligence. Dès que l’on commence à analyser plus avant les<br />
processus en jeu dans la mémoire de travail, on est amené à distinguer, par exemple, les<br />
processus de commutation, de mise à jour, et d’inhibition (Miyake, Friedman et coll., 2000).<br />
Or les corrélations entre ces différents processus ne sont pas très fortes. En outre, si on pousse<br />
plus loin l’analyse d’un des ces processus, par exemple celle du processus d’inhibition, il faut<br />
4
alors au moins distinguer une forme d’inhibition qui correspond à la résistance à<br />
l’interférence de distracteurs et une autre qui correspond à la résistance à l’interférence pro-<br />
active et, à nouveau, elles sont peu liées entre elles (Friedman, Miyake, 2004). De même faut-<br />
il faire des distinctions entre l’efficience dans les épreuves de MT verbale, de MT spatiale, et<br />
de MT numérique (Mackintosh, Bennett, 2003).<br />
De fait, l’analyse factorielle d’un ensemble de tâches cernant les différents processus et<br />
les différents contenus de la MT fait apparaître une structure factorielle hiérarchique très<br />
similaire à celle qu’on obtient pour l’intelligence, avec un facteur général de MT et des<br />
facteurs de groupe. Et c’est en fait le facteur général de mémoire de travail qui corrèle<br />
fortement avec le facteur général d’intelligence (Süss, Oberauer et coll., 2002). A-t-on<br />
beaucoup avancé en remplaçant un concept aussi global que celui d’intelligence par un<br />
concept aussi global que celui de mémoire de travail ? L’avenir le dira. La progression ne se<br />
confirmera que si on se montre capable de modéliser la façon dont les différents processus en<br />
jeu dans la mémoire de travail s’orchestrent pour rendre compte de la performance globale.<br />
Dans l’état actuel de l’art, on sait évaluer directement la performance globale, on sait aussi<br />
isoler les processus plus élémentaires qui interviennent dans cette performance globale, mais<br />
on ne sait pas modéliser la façon dont tous ces processus s’assemblent pour aboutir à cette<br />
performance globale. On oscille donc entre une approche globale et une approche élémentiste,<br />
sans savoir comment les relier car sans doute faudrait-il avoir d’autres modèles du<br />
fonctionnement cognitif, plus systémiques, pour pouvoir articuler ces deux vues partielles.<br />
Wechsler disait que l’intelligence est dans l’orchestration or, pour filer la métaphore, nous<br />
savons comment marche chacun des instruments considéré isolément et nous savons apprécier<br />
si le produit global du jeu de l’orchestre est plus moins harmonieux, mais nous ne<br />
comprenons pas comment se fait l’orchestration dans un système qui ne comporte pas de chef<br />
d’orchestre. Le point suivant suggère peut-être quelques pistes.<br />
DES MODÈLES STATIQ<strong>UE</strong>S AUX MODÈLES DYNAMIQ<strong>UE</strong>S DE L’INTELLIGENCE<br />
Les modèles de l’intelligence ont longtemps été statiques. C’est le cas de la structure<br />
factorielle de l’intelligence. C’est aussi le cas des structures opératoires dans la théorie de<br />
Piaget. Dans ce dernier cas, c’est le modèle de l’équilibration qui avait pour fonction de<br />
rendre compte de la dynamique de la construction cognitive, mais il n’a pas paru apporter une<br />
modélisation testable des mécanismes de transition entre les différents états décrit pas les<br />
structures opératoires.<br />
5
Une évolution notable dans le champ du développement cognitif est la montée en<br />
puissance d’approches qui visent à modéliser la dynamique du changement développemental<br />
et qui incluent donc la flèche du temps dans leur formalisation. C’est en particulier le cas des<br />
modèles connexionnistes et des modèles de systèmes dynamiques non linéaires. Les uns et les<br />
autres donnent une large place aux mécanismes d’auto-organisation dans l’explication du<br />
développement cognitif. Deux ouvrages ont particulièrement cristallisé et théorisé ces<br />
évolutions. Pour la modélisation connexionniste du développement, « Rethinking Innateness »<br />
(Elman, Bates, et coll., 1996) et pour l’approche des systèmes dynamiques, « A dynamic<br />
systems approach to the development of cognition and action », (Thelen, Smith, 1994). La<br />
vitalité de ces courants de recherche est attestée par la publication en 2003 d’un numéro<br />
spécial de la revue « Developmental Science » qui leur était consacré.<br />
Plusieurs des conférences présentées à de ce congrés s’inscrivaient dans ce courant, celles<br />
d’Annette Karmiloff et d’Ulman Lindenberger pour la modélisation connexionniste et celle de<br />
Paul van Geert pour la modélisation de systèmes dynamiques. Quel est l’intérêt de ces<br />
approches ?<br />
L’un des apports est évidemment de permettre de simuler le processus de changement luimême.<br />
Ces simulations fonctionnent par itérations : à chaque pas, l’état du système est calculé<br />
en fonction de son état au pas précédent. La flèche du temps est ainsi incluse dans le modèle.<br />
Un autre apport de ces modélisations est de démontrer que des processus d’auto-organisation<br />
assez simples ont le pouvoir de provoquer des changements qui ressemblent à certains des<br />
changements observés dans les processus d’apprentissage ou de développement. Les<br />
possibilités d’expérimentation virtuelle qu’offre la simulation sont aussi appréciables. Par<br />
exemple, ce que peut apprendre un réseau connexionniste dépend de sa structure initiale,<br />
c’est-à-dire du nombre d’unités d’entrée, du nombre d’unités de sortie, du nombre d’unités<br />
dans la couche interne, de l’architecture des connexions entre ces unités, des algorithmes de<br />
propagation de l’activation entre ces unités, etc. Les méthodes de simulation permettent de<br />
jouer sur tous ces paramètres pour en voir les conséquences sur le développement. Elles<br />
permettent ainsi d’expérimenter, par exemple, sur les conséquences de telle ou telle<br />
modification de l’état initial pour le développement ultérieur. C’est en ce sens que, pour<br />
reprendre le titre de l’ouvrage « Rethinking innateness », la simulation offre une voie<br />
intéressante pour « repenser l’innéité ».<br />
C’est dans cet esprit qu’Annette Karmiloff (Institut de la santé de l’enfant de Londres),<br />
une des co-signataires de cet ouvrage, s’est appuyée sur la modélisation connexionniste pour<br />
repenser la modularité de l’esprit. Selon elle, il n’est pas nécessaire que des réseaux<br />
6
neuronaux soient déjà spécifiques à certains domaines de connaissance à la naissance pour<br />
pouvoir expliquer l’existence de modules spécialisés à l’état adulte. Il suffit que les réseaux<br />
neuronaux aient une architecture appropriée aux caractéristiques de l’information relative à un<br />
domaine pour qu’ils l’emportent dans la compétition avec d’autres réseaux neuronaux pour<br />
prendre ce domaine en charge. Mais si le réseau neuronal le plus approprié à un domaine de<br />
connaissance n’est pas fonctionnel ou n’est pas suffisamment fonctionnel, d’autres moins<br />
appropriés peuvent y suppléer, même s’ils remplissent moins bien la même fonction. Si cette<br />
hypothèse est exacte, la dynamique développementale de ces phénomènes de suppléance doit<br />
avoir pour conséquence que les pathologies entraînées par la lésion d’un réseau neuronal chez<br />
le bébé ou chez le jeune enfant, ne sont pas de même nature que les pathologies entraînées par<br />
la même lésion chez l’adulte.<br />
Dans sa conférence, Annette Karmiloff-Smith a étayé ce point de vue en donnant<br />
plusieurs exemples d’études dans lesquelles elle a pu montrer que chez des enfants dont<br />
certains réseaux neuronaux présentent des altérations d’origine génétique, l’information<br />
habituellement traitée par ces réseaux est prise en charge par d’autres processus. Par exemple,<br />
les enfants qui présentent le syndrome de Williams, une pathologie d’origine génétique dans<br />
laquelle le traitement du langage est relativement préservé alors que le traitement de<br />
l’information spatiale est très déficitaire, parviennent pourtant à construire <strong>–</strong> avec retard <strong>–</strong> la<br />
notion de cardinalité du nombre mais en s’appuyant pour cela sur le langage là où les autres<br />
enfants s’appuient sur un traitement visuo-spatial des objets à dénombrer (Ansari, Donlan et<br />
coll., 2003).<br />
On reproche parfois à l’approche connexionniste du développement de ne modéliser que<br />
de petites tâches spécifiques, comme la tâche de la balance ou la conjugaison des verbes au<br />
temps passé, mais d’échouer à rendre compte de caractéristiques générales du développement<br />
qui soient transversales aux différentes tâches et domaines. La conférence d’Ulman<br />
Lindenberger (Institut Max-Planck de Berlin pour le développement humain) a apporté un<br />
contre-exemple. En collaboration avec Shu Chen Li, ce chercheur a proposé un modèle<br />
connexionniste qui simule un certain nombre de caractéristiques générales du vieillissement.<br />
On sait qu’avec le vieillissement, on observe une baisse moyenne des performances<br />
cognitives, une dédifférenciation des aptitudes et une augmentation des différences<br />
individuelles. Pour simuler le vieillissement d’un réseau de neurones, Lindenberger, Li,<br />
Brehmer, (2002) ont simplement diminué le paramètre de gain, c’est-à-dire la pente de la<br />
fonction logistique qui, pour chaque neurone du réseau, relie le niveau d’activation reçu en<br />
entrée au niveau d’activation produit en sortie. Lorsque la pente de cette fonction est élevée,<br />
7
de petites différences d’activation en entrée, autour de la zone du seuil de réaction du neurone,<br />
provoquent de grandes différences d’activation en sortie, ce qui permet des discriminations<br />
nettes entre les entrées. Lorsque la pente de cette fonction est plus réduite, les petites<br />
variations en entrée sont moins bien discriminées et il y a plus de bruit dans les activations en<br />
sortie. En présentant diverses tâches d’apprentissage à deux groupes de réseaux neuronaux,<br />
l’un constitué de réseaux dits « jeunes » (paramètre de gain fixé à des valeurs hautes chez les<br />
différents individus) et l’autre de réseaux dits « vieux » (paramètre de gain fixé à des valeurs<br />
basses), Li et Lindenberger montrent la manipulation de ce seul paramètre reproduit les trois<br />
effets observés dans le vieillissement cognitif humain : baisse du niveau moyen des<br />
performances, dédifférenciation des aptitudes (c’est-à-dire augmentation des corrélations<br />
entre les performances dans les différentes tâches), et augmentation des différences<br />
individuelles. Reste bien sûr à interpréter ce paramètre, à trouver à quoi il peut correspondre<br />
dans les réseaux de neurones réels. L’hypothèse des auteurs est que cette diminution dans la<br />
pente de réaction de chacun des neurones du réseau pourrait correspondre à une baisse de la<br />
concentration en neurotransmetteurs dopaminergiques avec l’âge. Quelle que soit<br />
l’interprétation, le point intéressant dans ce type de modélisation est de montrer comment des<br />
propriétés générales du fonctionnement cognitif peuvent être distribuées sur l’ensemble du<br />
réseau.<br />
L’approche des systèmes dynamiques est une autre manière de modéliser l’autoorganisation<br />
d’un système. Ses principes généraux et quelques exemples ont été présentés par<br />
Paul van Geert (Université de Groningen) dans le symposium sur les théories actuelles de<br />
l’intelligence. Le comportement est ici vu comme le produit d’une assemblée souple de<br />
composantes qui interagissent et forment donc un système. Par rapport aux réseaux<br />
neuronaux, les composantes sont ici plus molaires et elles incluent aussi bien des éléments de<br />
l’organisme, processus neuronaux ou parties du corps, que des éléments de l’environnement<br />
dans lequel cet organisme évolue. C’est tout cet ensemble qui constitue le système et<br />
contribue à son évolution. On a donc affaire à une conception en général plus contextualiste<br />
du fonctionnement cognitif qu’avec les réseaux neuronaux. Le temps est ici aussi une<br />
composante essentielle de la modélisation, puisque l’état de chacune des composantes au<br />
moment t est fonction de son état et de l’état de toutes les autres composantes à l’état t − 1 et<br />
influence ce que sera son état et celui de toutes les autres composantes à l’état t + 1, etc. Sans<br />
entrer davantage dans les caractéristiques de ce type de modèles on peut souligner plus<br />
particulièrement deux de leurs apports à l’évolution des représentations du développement<br />
cognitif.<br />
8
L’un est de contribuer à faire évoluer le statut épistémologique des variations en<br />
psychologie (van Geert, van Dijk, 2002). Celles-ci ne sont pas considérées comme des<br />
bizarreries gênantes à neutraliser, mais comme la source même de la dynamique du système.<br />
Les variations intra-individuelles, les phases d’instabilité, sont essentielles pour permettre<br />
aux composantes du système de se désassembler, de s’ajuster différemment, pour évoluer<br />
vers un nouvel attracteur et s’y stabiliser dans des assemblages différents. Les degrés de<br />
liberté qui existent dans la nature des différentes composantes susceptibles de s’assembler<br />
pour remplir une certaine fonction adaptative sont aussi à l’origine de variations<br />
interindividuelles dans les trajectoires conduisant à un même attracteur ou même dans le type<br />
d’attracteur vers lequel le système évolue.<br />
Un autre apport important est de mettre l’accent sur la dynamique que provoquent les<br />
interactions entre les différents processus de traitement d’une part et entre ces processus de<br />
traitement et les éléments du contexte d’autre part. Pour illustrer cet aspect des modèles<br />
dynamiques, Paul van Geert a simulé sur ordinateur et montré sur écran au cours de sa<br />
conférence, les effets de la manipulation de différents paramètres de l’interaction entre<br />
composantes du système cognitif sur la courbe de développement. Par exemple la<br />
manipulation des poids respectifs de l’intelligence fluide et de l’intelligence cristallisée dans<br />
l’hypothèse d’une relation de support mutuel entre ces deux formes d’intelligence au cours du<br />
développement, ou encore la manipulation de l’écart entre le niveau de développement requis<br />
par l’enseignant et celui auquel se situe l’élève. Dans ce second exemple, les effets sur la<br />
courbe de développement faisaient clairement ressortir l’existence d’un optimum dans<br />
l’ampleur de cet écart, optimum qu’il est tentant d’assimiler à ce que Vygotski appelait la<br />
zone proximale de développement.<br />
Une conception dynamique du développement de l’intelligence caractérisait aussi des<br />
communications qui s’appuient sur d’autres cadres théoriques que les modélisations évoquées<br />
ci-dessus. En plaçant le développement de l’intelligence à l’interface entre affectivité et<br />
cognition et en cherchant à articuler psychanalyse et psychologie cognitive pour comprendre<br />
le fonctionnement de cette interface, Bernard Golse (service de psychopathologie de l’enfant à<br />
l’hôpital Necker) a mis l’accent sur le rôle crucial joué par la dynamique des interactions entre<br />
modalités perceptives, ou entre l’enfant et son environnement. Un des exemples développés<br />
est celui du rôle de la dynamique de l’accordage affectif entre le bébé et sa mère, dynamique<br />
dont les caractéristiques (par exemple la rapidité des réactions) formeraient la base de la<br />
représentation que se fait le bébé de l’état affectif de sa mère. Un autre exemple est le rôle que<br />
9
joue, dans la qualité de la co-construction des capacités d’attention, la dynamique des<br />
interactions entre le bébé et sa mère dans les situations d’attention conjointe.<br />
DE LA FIXITÉ À LA PLASTICITÉ DU SYSTÈME COGNITIF<br />
Les marges de variation du système cognitif d’une personne ont longtemps été<br />
considérées comme assez rigidement déterminées par les contraintes qu’exercent les<br />
différents déterminants de l’organisation cérébrale, que ceux-ci soient d’ordre génétique,<br />
neurobiologique, ou processuel. Un des enseignements que l’on peut tirer de ce congrès est<br />
qu’on trouve à tous ces niveaux beaucoup plus de plasticité qu’on ne le pensait.<br />
Au niveau génétique<br />
Commençons par le niveau de déterminisme qui se trouve le plus en amont du système<br />
cognitif, celui qui peut être attribué au patrimoine génétique. Un point de départ intéressant<br />
est le paradoxe apparent entre les résultats dont Michèle Carlier (Université de Provence) a<br />
fait état, à propos des pathologies de la cognition d’origine génétique, et certains de ceux que<br />
Pierre Roubertoux (CNRS, Université de la Méditerranée) a évoqués à propos de la recherche<br />
des gènes associés aux différences de QI. Michèle Carlier a donné plusieurs exemples de<br />
pathologies dans lesquelles une anomalie au niveau d’un seul gène peut affecter tout ou partie<br />
du fonctionnement cognitif, ce qui montre à l’évidence le rôle déterminant du génome dans la<br />
cognition. Par ailleurs, Pierre Roubertoux a indiqué que, jusqu’ici, on n’a pu trouver aucun<br />
gène spécifiquement associé aux différences de QI dans la marge de variation normale. Ce<br />
dernier résultat ne pouvant évidemment pas être interprété comme une absence d’implication<br />
des gènes dans la cognition, il suggère que c’est au niveau du système génétique qu’il faut<br />
chercher l’influence exercée par le patrimoine génétique sur des indicateurs aussi globaux que<br />
le QI.<br />
Ceci est à rapprocher des informations que la génétique moléculaire a apportées sur le<br />
fonctionnement du système génétique. Deux des informations tirées de la conférence de<br />
Pierre Roubertoux sont particulièrement importantes pour comprendre le caractère systémique<br />
des mécanismes génétiques. D’une part, l’expression d’un gène dépend des interactions qu’il<br />
entretient avec les autres gènes (épistasie). D’autre part, l’expression d’un gène est aussi<br />
fonction des caractéristiques de l’environnement dans lequel il se trouve. Autrement dit, les<br />
gènes sont certes invariants, mais l’expression de chacun d’entre eux est fonction de<br />
l’environnement dans lequel il se trouve, le terme environnement étant ici pris au sens large et<br />
10
incluant les produits des autres gènes (types de protéines) et les milieux plus ou moins<br />
distants dans lesquels ils s’expriment (Carlier, Roubertoux, 2005 ; Roubertoux, 2004).<br />
Ces deux propriétés font que l’expression des gènes est le produit d’un système dont la<br />
plasticité a été sous-estimée.<br />
Au niveau neurobiologique<br />
L’architecture neuronale est aussi plus plastique qu’on ne le pensait. Quelques exemples<br />
de cette plasticité ont été donnés dans la conférence de Scania de Schonen (CNRS, Université<br />
de Paris 5). Chez le bébé, les réseaux neuronaux qui traitent les visages sont en place dès trois<br />
mois. Bien qu’ils ne soient pas spécialisés au départ dans la reconnaissance de tel ou tel type<br />
de visage (par exemple asiatique ou caucasien), ces réseaux se spécialisent rapidement par un<br />
phénomène de restriction. Les connexions neuronales qui sont régulièrement sollicitées se<br />
maintiennent, tandis que celles qui ne le sont pas disparaissent. Ainsi, la capacité de faire des<br />
distinctions fines dans la reconnaissance d’un certain type de visage (par exemple le type de<br />
visage caucasien pour les enfants européens) s’accompagne de la disparition de la capacité de<br />
faire des distinctions équivalentes dans le type de visage auquel les enfants ne sont pas<br />
exposés (visages asiatiques dans cet exemple). Ce phénomène de restriction est déjà sensible à<br />
trois mois, mais à cet âge, il est encore réversible si l’enfant est exposé régulièrement à un<br />
autre type de visages que celui auquel il a été habitué. Par contre, après trois ans, il n’est<br />
pratiquement plus réversible. C’est du moins ce que l’on a longtemps pensé, mais on a<br />
récemment trouvé un renversement des effets chez des enfants qui avaient été adoptés après 5<br />
ans, ce qui tend à montrer que la plasticité neuronale est plus importante qu’on ne l’avait cru.<br />
Les cas de réorganisation des circuits neuronaux après des lésions ou du fait d’un exercice<br />
intensif vont dans le même sens. Les méthodes d’imagerie cérébrale ont permis de voir, par<br />
exemple, que les aires motrices correspondant aux doigts de la main gauche sont beaucoup<br />
plus étendues chez les violonistes professionnels que chez des violonistes amateurs (Elbert,<br />
Pantev, et coll., 1995), ou que les aires normalement dévolues à la mémoire épisodique sont<br />
recrutées par l’activité de calcul mental chez un calculateur prodige (Pesenti, Zago, et coll.,<br />
2001). On a aussi longtemps pensé que l’adulte ne formait plus de nouveaux neurones or<br />
l’existence d’une neurogenèse dans le cerveau adulte du primate a été récemment prouvée et<br />
ce phénomène a aussi été démontré chez l’homme par la culture de cellules pluripotentes<br />
prélevées dans plusieurs régions du cerveau. Bien que ces nouveaux neurones soient peu<br />
nombreux chez l’adulte et que l’on connaisse encore mal leur fonction, ils pourraient jouer un<br />
rôle dans l’apprentissage et la mémoire en contribuant à moduler les circuits existants (Gross,<br />
11
2000). Ces différents exemples montrent que la plasticité de l’architecture neuronale est elle<br />
aussi plus importante qu’on ne l’avait supposé.<br />
Au niveau processuel<br />
Une même comportement peut être obtenu en mobilisant des processus de traitement<br />
différents et donc des circuits neuronaux différents chez des sujets différents. Ces<br />
phénomènes de vicariance, de redondance, ont déjà été illustrés plus haut dans le cas de<br />
pathologies, avec l’exemple de vicariance dans la construction de la notion de cardinalité chez<br />
des enfants présentant le syndrome de williams (Ansari, Donlan et coll., 2003). Ces<br />
phénomènes de vicariance sont également présents et jouent un rôle fondamental dans le<br />
fonctionnement cognitif normal (Lautrey, 2002, 2003 ; Reuchlin, 1978).<br />
En résumé, la plasticité du comportement, qui est le meilleur indicateur de l’intelligence,<br />
implique la plasticité des processus cognitifs, qui elle-même implique la plasticité des réseaux<br />
neuronaux, qui elle-même implique une certaine plasticité de l’expression du système<br />
génétique…. L’intelligence s’accommode mal de déterminismes aussi rigides que ceux que<br />
l’on a longtemps supposé s’exercer à ces différents niveaux.<br />
DE LA COGNITION FROIDE À LA COGNITION CHAUDE<br />
La cognition a longtemps été considérée comme suffisamment autonome pour être étudiée<br />
indépendamment d’aspects plus « chauds » du fonctionnement psychique comme l’émotion,<br />
l’affectivité, la personnalité. Le dualisme cartésien, mais sans doute aussi, plus récemment, le<br />
rôle joué par la métaphore de l’ordinateur dans les débuts de la psychologie cognitive, ont<br />
contribué à entretenir cet isolationnisme. Sur ce point aussi, les idées ont évolué et les<br />
recherches qui tentent d’intégrer le chaud et le froid dans le fonctionnement cognitif sont de<br />
plus en plus nombreuses. Plusieurs communications ont traité de la façon dont l’émotion,<br />
l’affectivité ou la personnalité interviennent dans la cognition.<br />
Dans le domaine de la neuropsychologie, la recherche sur les relations entre émotion et<br />
cognition a connu un regain d’intérêt dans la période récente, notamment avec les travaux de<br />
Damasio (1995). On connaît mieux maintenant les aires cérébrales impliquées dans cette<br />
relation. Le cortex préfrontal ventromédian semble être le lieu privilégié de l’interface entre<br />
le système limbique, qui est le centre des émotions, et le cortex frontal dorsolatéral qui est<br />
impliqué dans les fonctions exécutives (mémoire de travail, gestion de l’attention,<br />
planification). Les études de cas de lésion du cortex préfrontal ventromédian chez l’adulte ont<br />
12
montré que ces lésions affectaient la planification et la décision, surtout dans les domaines<br />
que l’on peut qualifier de personnel et de social. Le raisonnement sur des questions abstraites<br />
n’est pas touché mais la capacité à planifier son propre avenir, à se conduire en fonction des<br />
règles sociales, sont gravement affectées. Scania de Schonen (CNRS, Université de Paris 5) a<br />
fait état de deux cas d’enfants chez qui une lésion du cortex frontal ventro-médian est<br />
survenue dans les premiers mois de la vie et qui ont été suivis par Damasio. Les<br />
comportements observés quelques années après correspondaient d’assez près à ceux observés<br />
chez les adultes (impulsivité, absence d’anticipation des conséquences de ses propres actions,<br />
insensibilité aux punitions, comportements d’amassement, mais réussite scolaire normale).<br />
En dehors de la contribution de Bernard Golse, déjà évoquée plus haut, la question des<br />
relations entre affectivité et cognition a aussi été abordée dans le symposium « Clinique et<br />
pratiques de l’examen psychologique ». Anne Andronikof (Université de Paris 10) a rapporté<br />
à ce sujet une étude dans laquelle les seules différences observées entre des groupes contrastés<br />
sur la performance scolaire avaient trait à la relation à soi (investissement de soi, capacité à se<br />
critiquer, etc.). Selon elle, le soi serait le noyau de la relation entre l’affect et la cognition.<br />
Certaines des recherches sur les relations entre cognition et personnalité, présentées par<br />
Pierre-Yves Gilles(Université de Provence) dans le symposium « Intelligence de la mesure »,<br />
donnent des résultats qui semblent aller dans le même sens. C’est dans ce cas l’auto-<br />
évaluation de ses propres capacités cognitives qui semble être le maillon intermédiaire dans la<br />
relation entre certains facteurs de la personnalité et la cognition.<br />
En résumé, le climat est manifestement au réchauffement de la cognition.<br />
DE L’INTELLIGENCE UNIDIMENSIONNELLE À L’INTELLIGENCE<br />
MULTIDIMENSIONNELLE<br />
Existe-t-il une intelligence ou des intelligences ? Ce débat a commencé, il y a bien<br />
longtemps, avec la controverse qui opposait Spearman, partisan d’un facteur général<br />
d’intelligence, à Thurstone, partisan de facteurs multiples correspondant à des aptitudes<br />
primaires indépendantes. Il a fallu quelques temps avant de réaliser que ces deux modèles<br />
factoriels n’étaient pas incompatibles et pouvaient être intégrés dans un modèle hiérarchique<br />
comportant des facteurs de niveaux de généralité différents : des facteurs primaires corrélés<br />
entre eux, et des facteurs de niveau hiérarchique supérieur rendant compte de la corrélation<br />
entre les facteurs primaires. Néanmoins, la controverse a continué, car certains trouvaient trois<br />
étages et un seul facteur général (Burt et Vernon), tandis que d’autres trouvaient deux étages<br />
13
et plusieurs facteurs généraux (Cattell et Horn). Un consensus a finalement été trouvé autour<br />
du modèle de Carroll, qui est un modèle hiérarchique à trois étages et un seul facteur général<br />
(Carroll, 1993 ; Grégoire, 2004 ; Huteau, Lautrey, 1999). Ce modèle de la structure de<br />
l’intelligence a été présenté par Jacques Grégoire (Université Catholique de Louvain) et a été<br />
évoqué à plusieurs reprises au cours du congrès. Pourquoi ce consensus et peut-on considérer<br />
maintenant ce problème comme réglé ?<br />
Dans l’analyse factorielle de tests d’intelligence, les facteurs qui peuvent être extraits<br />
dépendent de l’échantillonnage des tests (par exemple, si on ne met pas de tests d’aptitude<br />
spatiale ou si on en met trop peu, il ne pourra pas y avoir de facteur spatial), mais comment<br />
être sûr que l’on a échantillonné toutes les activités intellectuelles possibles ? Le saut en<br />
hauteur en fait-il partie ? Les facteurs dépendent aussi de l’échantillonnage des sujets qui<br />
passent ces tests (par exemple, si les sujets sont de niveau général trop homogène, on ne<br />
trouvera pas de facteur général). Ils dépendent enfin de la méthode d’analyse factorielle<br />
utilisée (pour prendre un exemple caricatural, on ne trouvera pas de facteur général si on fait<br />
une rotation orthogonale des facteurs). La difficulté des psychologues à se mettre d’accord sur<br />
la structure factorielle de l’intelligence a tenu pour une bonne part au fait que les différentes<br />
études que l’on comparait portaient le plus souvent sur des échantillons de tests différents,<br />
passés par des échantillons de sujets différents et utilisaient des options différentes dans les<br />
méthodes d’analyse factorielle.<br />
Le mérite de Carroll est d’avoir mis un peu d’homogénéité dans tout cela. Comme l’a<br />
rappelé Jacques Grégoire, Carroll a fait un véritable travail de bénédictin en réanalysant toutes<br />
les analyses factorielles de tests publiées et utilisables dans la littérature, environ 460, en leur<br />
appliquant la même méthode d’analyse factorielle : analyse de premier ordre qui extrait des<br />
facteurs primaires corrélés entre eux, puis analyses d’ordre n+1 pour extraire la variance<br />
correspondant à la corrélation entre les facteurs d’ordre n. L’examen des 460 analyses a<br />
permis d’identifier une quarantaine de facteurs de premier ordre, dont chaque étude n’avait<br />
évidemment échantillonné qu’une partie. Ensuite, Carroll a refait pour chacune de ces 460<br />
études une analyse de second ordre pour extraire, au deuxième étage du modèle, les facteurs<br />
qui rendent compte des corrélations entre les facteurs primaires. À ce niveau, huit grands<br />
facteurs, également corrélés entre eux, suffisent pour rendre compte de l’ensemble des études<br />
réanalysées. Ils correspondent en gros aux facteurs généraux qu’avaient identifiés Horn et<br />
Cattell, les plus connus étant les facteurs d’intelligence fluide, cristallisée, visuo-spatiale,<br />
mémoire, vitesse cognitive. Enfin, une analyse de troisième ordre a permis d’extraire, au<br />
troisième étage, le ou les facteurs rendant compte de la part de variance commune aux huit<br />
14
facteurs de second ordre. Aucune des 460 réanalyses n’a abouti à plus d’un facteur général et<br />
ce facteur général correspond en gros à celui qu’avait extrait Spearman. Le modèle de Carroll<br />
est donc un modèle de synthèse, capable de rendre compte de l’ensemble des études<br />
réanalysées. La structure de l’intelligence qu’il définit est multidimensionnelle : elle comporte<br />
à la fois une dimension commune à toutes les activités intellectuelles analysées et des<br />
dimensions spécifiques à des formes d’intelligence différentes.<br />
Si ce modèle fait actuellement consensus, comme on a pu l’observer dans ce congrès,<br />
c’est simplement parce que les analyses sur lesquelles il repose font l’échantillonnage le plus<br />
large dont on dispose des tests et des sujets (puisqu’il prend en compte l’ensemble des<br />
échantillons de tests et de sujets ayant jusqu’ici donné lieu à analyse factorielle) et qu’il leur<br />
applique une même méthode. Il minimise donc autant que faire se peut les trois facteurs de<br />
variation mentionnés plus haut. Le problème est-il pour autant résolu sur le fond ?<br />
Evidemment non, puisqu’en l’absence de théorie unifiée sur l’intelligence, nul ne peut assurer<br />
que toutes les situations qui devraient figurer dans une batterie de tests d’intelligence ont bien<br />
été échantillonnées.<br />
Et c’est ainsi que le débat rebondit actuellement. Plusieurs auteurs défendent l’idée que les<br />
tests actuels d’intelligence ne mesurent qu’une des formes de l’activité intellectuelle,<br />
l’intelligence académique, celle qui est valorisée par le système scolaire. On connaît la théorie<br />
des intelligences multiples de Gardner qui, à côté de l’intelligence logico-mathématique et de<br />
l’intelligence langagière, valorisées par l’école et évaluées par les tests d’intelligence, défend<br />
l’existence d’autres formes d’intelligence, par exemple musicale, kinesthésique, intra<br />
personnelle, interpersonnelle. La théorie triarchique de Sternberg, de son côté, distingue trois<br />
formes d’intelligence, l’intelligence analytique, évaluée par les tests classiques, l’intelligence<br />
créative, à laquelle était consacré le symposium organisé par Todd Lubart (Université de Paris<br />
5), et l’intelligence pratique, que Robert Sternberg (Université de Yale) a illustrée par<br />
plusieurs exemples dans sa conférence sur l’impact des aspects culturels dans l’évaluation de<br />
l’intelligence. Aussi bien Gardner que Sternberg postulent que ces différentes formes<br />
d’intelligence sont indépendantes entre elles et indépendantes de l’intelligence évaluée par les<br />
tests psychométriques classiques. En d’autres termes, ils considèrent qu’une batterie de<br />
situations élargissant l’évaluation aux formes d’intelligence qu’ils distinguent n’admettrait<br />
pas de facteur général. Ces perspectives d’extension du concept d’intelligence sont<br />
intéressantes et stimulantes. Elles relancent le débat sur l’unicité ou la pluralité des<br />
intelligences à un moment où un relatif consensus a été trouvé concernant l’intelligence<br />
mesurée par les tests psychométriques classiques. Néanmoins, jusqu’ici, aucun résultat<br />
15
empirique solide n’est venu étayer l’hypothèse d’indépendance de ces différentes formes<br />
d’intelligence.<br />
L’ÉVOLUTION DES INSTRUMENTS ET DES PRATIQ<strong>UE</strong>S D’ÉVALUATION<br />
Il existe sur ce point un paradoxe intéressant. Depuis Binet, les idées sur l’intelligence ont<br />
beaucoup évolué. Pour ne parler que des grands mouvements d’idées, il y a eu notamment les<br />
théories factorielles, la théorie de Piaget et la psychologie cognitive, qui ont chacune<br />
renouvelé assez profondément nos représentations de l’intelligence. Pourtant, les échelles de<br />
mesure de l’intelligence ont très peu changé et, jusqu’assez récemment, elles sont restées<br />
bâties sur les mêmes principes que l’échelle métrique de Binet et Simon. Même si l’on prend<br />
en compte les modifications opérées par Wechsler, la séparation d’une sous-échelle verbale et<br />
d’une sous-échelle de performance, c’est une conception de l’évaluation de l’intelligence qui<br />
a plus d’un demi-siècle.<br />
Pourquoi ce décalage dans les rythmes d’évolution entre les théories sur l’intelligence et<br />
les instruments d’évaluation ? Est-ce parce que ceux qui s’occupent d’évaluation de<br />
l’intelligence, les concepteurs d’instruments et les praticiens qui les utilisent, n’ont pas suivi<br />
les évolutions théoriques ? En fait, la théorie de Piaget a bel et bien inspiré la construction de<br />
tests piagétiens et la psychologie cognitive a bel et bien inspiré la construction de quelques<br />
batteries de tâches destinées à évaluer l’efficience de processus cognitifs, mais ces tests n’ont<br />
pas supplanté les bonnes vieilles échelles d’intelligence. Pourquoi des échelles construites<br />
avec une démarche très empirique résistent-elles mieux au temps que des épreuves construites<br />
sur des fondements théoriques plus élaborés ?<br />
Vraisemblablement, c’est précisément le caractère a-théorique des échelles de QI qui<br />
explique leur bonne résistance. En évaluant les performances des sujets dans des activités<br />
intellectuelles faisant appel aux processus supérieurs et en situant ces performances par<br />
rapport à celles observées dans leur groupe d’âge, les pionniers de ce type d’évaluation ont<br />
mis le doigt sur un moyen d’accès direct aux productions du système cognitif. Sous réserve<br />
que la personne examinée ait bien baigné dans le milieu culturel pour lequel le test a été<br />
conçu, cet accès direct aux productions du système cognitif renseigne, indirectement, sur son<br />
fonctionnement global sans qu’il soit nécessaire pour cela de comprendre comment tout cela<br />
fonctionne. Si un enfant a acquis en temps et en heure les connaissances et les habiletés qui<br />
sont d’habitude acquises par la plupart des enfants à cet âge là, c’est que son cerveau<br />
16
fonctionne normalement et on peut pronostiquer que, sauf accident, il acquerra en temps et en<br />
heure les connaissances et habiletés cognitives plus complexes.<br />
L’objectif de théories comme celle de Piaget ou celles du traitement de l’information est<br />
tout différent. Il est de comprendre comment le système cognitif fonctionne et manifestement,<br />
jusqu’ici, ces théories n’ont donné que des vues partielles de l’intelligence. Par exemple, les<br />
étapes du développement de la pensée logique pour la théorie piagétienne, ou le rôle de la<br />
vitesse d’exécution de certains processus élémentaires de traitement de l’information pour la<br />
psychologie cognitive. Les tests inspirés de ces vues partielles se sont révélés utiles pour<br />
évaluer certains aspects particuliers du fonctionnement cognitif, mais se sont révélés<br />
beaucoup moins valides pour remplir la fonction d’évaluation globale de l’efficience du<br />
système cognitif. C’est à mon avis ce qui explique la bonne résistance des bonnes vieilles<br />
échelles d’intelligence.<br />
Toutefois, ce décalage entre la recherche fondamentale sur l’intelligence et la pratique de<br />
son évaluation est en train de changer. C’est un des enseignements qui peuvent être tirés de ce<br />
congrès. Cette évolution est apparue nettement, par exemple, dans la présentation de la<br />
dernière révision de la WISC qu’a faite Larry Weiss, un des chercheurs qui l’ont conduite.<br />
Pour la première fois, une révision de cette échelle en a modifié assez profondément la<br />
composition pour intégrer l’évaluation de compétences dont l’intérêt a été mis en évidence par<br />
l’approche factorielle et par la psychologie cognitive. Les résultats des recherches montrant<br />
l’importance de la relation entre la mémoire de travail et l’intelligence fluide, qui ont été<br />
évoquées plus haut, ont convaincu les auteurs de la révision d’introduire une épreuve de<br />
mémoire de travail, et de dissocier l’épreuve des chiffres à rebours, qui est aussi une épreuve<br />
de mémoire de travail, de l’épreuve de simple répétition de nombres qui est plutôt une<br />
épreuve de mémoire à court terme. Ceci a permis d’introduire dans l’évaluation une nouvelle<br />
dimension de l’intelligence, l’efficience de la mémoire de travail. Il en va de même avec<br />
l’introduction d’une nouvelle épreuve de vitesse cognitive qui, avec l’épreuve du code permet<br />
de faire apparaître une dimension correspondant au facteur de vitesse cognitive du modèle de<br />
Carroll. Les auteurs de la révision se sont par ailleurs décidés à introduire une épreuve de<br />
matrices inspirée de celle de Raven, dont on sait qu’elle est un des tests les plus fortement<br />
saturés en facteur général d’intelligence. De leur côté, les concepteurs du K-ABC avaient déjà<br />
fait cette démarche en introduisant une distinction entre processus simultanés et séquentiels<br />
inspirée des travaux de neuropsychologie, en particulier de ceux de Luria. Dans leur dernière<br />
révision de cette échelle, ils font un pas de plus pour indiquer les correspondances entre les<br />
dimensions du K-ABC et les facteurs du modèle de Carroll. Là encore, l’instrument<br />
17
d’évaluation se rapproche des conceptions multidimensionnelles qui prévalent dans les<br />
théories actuelles de l’intelligence. Une des conséquences de cette évolution vers une<br />
conception multidimensionnelle de l’intelligence est de réduire l’intérêt d’un concept aussi<br />
global que celui de QI (Lautrey, 2005).<br />
La conclusion générale que l’on peut tirer de ces différentes évolutions est que le<br />
cloisonnement qui a longtemps existé entre l’approche psychométrique de l’intelligence et la<br />
recherche fondamentale sur la cognition est peut-être en train de disparaître. Si ces deux<br />
démarches sont restées si longtemps cloisonnées, c’est que ni le behaviorisme, exclusivement<br />
centré sur l’apprentissage, ni la théorie de Piaget, exclusivement centrée sur le développement<br />
de la pensée logique et ignorant les différences individuelles, ni les premiers modèles de<br />
traitement de l’information, trop centrés sur les processus élémentaires, n’étaient capables de<br />
rendre compte d’une fonction aussi complexe que l’intelligence.<br />
Si ce rapprochement commence enfin à se faire <strong>–</strong> et c’est la conclusion principale que je<br />
tire pour ma part des travaux de ce congrès <strong>–</strong> c’est parce que la psychologie cognitive<br />
commence à offrir des modèles de fonctionnement qui, à la fois, portent sur les processus<br />
cognitifs supérieurs (les processus exécutifs) et sont capables de rendre compte de la<br />
variabilité intra et interindividuelle des performances. C’est ce qui provoque un intérêt<br />
réciproque, des chercheurs pour les tests d’intelligence et des concepteurs de tests pour<br />
certaines avancées de la recherche fondamentale. Dans le cas de la mémoire de travail, par<br />
exemple, les premiers utilisent les tests d’intelligence fluide pour démontrer le caractère<br />
général et central de la capacité attentionnelle et les seconds intègrent dans leurs tests des<br />
tâches de mémoire de travail issues de la recherche fondamentale. Cette évolution aurait<br />
certainement plu à Binet…<br />
18
RÉFÉRENCES<br />
Ansari (Daniel), Donlan (Chris), Thomas (Michael), Ewing (Sandra), Peen (Tiffany),<br />
Karmiloff-Smith (Annette).<strong>–</strong> What makes counting count ? Verbal and visuo-spatial<br />
contributions to typical and atypical number development, Journal of experimental<br />
child psychology, 85, 2003, p 50-62.<br />
Binet (Alfred), Henri (Victor).<strong>–</strong> La psychologie individuelle, L’Année psychologique, 2, 1895,<br />
p. 415-465.<br />
Binet (Alfred), Simon (Théodore).<strong>–</strong> Méthodes nouvelles pour le diagnostic du niveau<br />
intellectuel des anormaux, L’Année psychologique, 11, 1905, p. 191-244.<br />
Binet (Alfred).- Les idées modernes sur les enfants, Paris, Flammarion, 1909.<br />
Binet (Alfred).<strong>–</strong> Nouvelles recherches sur la mesure du niveau intellectuel chez les enfants<br />
des écoles, L’Année psychologique, 17, 1911, p. 145-201.<br />
Carlier (Michèle), Roubertoux (Pierre).<strong>–</strong> Des gènes à la cognition, dans Lautrey (J.), Richard<br />
(J.-F.), L’intelligence, Paris, Hermès science publ. Lavoisier, 2005, p. 229-242.<br />
Carroll (John B.) <strong>–</strong> Human cognitive abilities: A survey of factor-analytic studies, Cambridge,<br />
Cambridge University Press, 1993.<br />
Conway (Andrew R. A.), Cowan (Nelson), Bunting (Michael F.), Therriault (David J.),<br />
Minkoff (Scott R. B.).<strong>–</strong> A latent variable analysis of working memory capacity, short<br />
term memory capacity, processing speed, and general fluid intelligence, Intelligence,<br />
30, 2002, p. 163-183.<br />
Damasio (Antonio).<strong>–</strong> L’erreur de Descartes, Paris, Odile Jacob, 1995.<br />
Demetriou (Andreas), Shayer (Michael), Efklides (Anastasia).<strong>–</strong> The Neo-Piagetian theories of<br />
cognitive development : toward an integration, Amsterdam, Routledge, 1988.<br />
Duncan (John), Seitz (Rüdiger J.), Kolodny (Jonathan), Bor (Daniel), Herzog (Hans), Ahmed<br />
(Ayesha), Newell (Fiona N.), Emslie (Hazel).<strong>–</strong> A neural basis for general intelligence,<br />
Science, 289, 2000, p. 457-460.<br />
Elbert (T.), Pantev (C.), Weinbruch (C.), Rockstroh (B.), Taub (E) <strong>–</strong> Increased cortical<br />
representation of the fingers of the left hand in string players, Science, 270, 1995, p.<br />
305-307.<br />
Elman (Jeffrey L.), Bates (Elizabeth A.), Johnson (Mark H.), Karmiloff-Smith (Annette),<br />
Parisi (Domenico), Plunkett (Kim) <strong>–</strong> Rethinking Innateness: A connectionist<br />
perspective on development, Cambridge, Ma, MIT Press, 1996.<br />
19
Engle (Randall W.), Tuholski (Stephen W.), Laughlin (James E.), Conway (Andrew R. A.).<strong>–</strong><br />
Working memory, short-term memory and general fluid intelligence : a latent variable<br />
approach, Journal of experimental psychology : General, 128, 1999, p. 309<strong>–</strong>331.<br />
Friedman (Naomi), Miyake (Akira).<strong>–</strong> The relations among inhibition and interference control<br />
functions : a latent variable analysis, Journal of experimental psychology : General,<br />
133, 2004, p. 101-135.<br />
Grégoire (Jacques).<strong>–</strong> L’examen clinique de l’intelligence de l’adulte, Sprimont, Mardaga,<br />
2004.<br />
Gross (Charles G.).<strong>–</strong> Neurogenesis in the adult brain : death of a dogma, Nature Reviews<br />
Neuroscience, 1, 2000, p. 67-73.<br />
Houdé (Olivier).<strong>–</strong> Intelligence : psychométrie, psychologie cognitive et imagerie cérébrale,<br />
dans Lautrey (Jacques), Richard (Jean-François), L’intelligence, Paris, Hermès science<br />
publ. Lavoisier, 2005, p. 279-287.<br />
Huteau (Michel), Lautrey (Jacques).<strong>–</strong> Évaluer l’intelligence. <strong>Psychométrie</strong> cognitive, Paris,<br />
Presses universitaires de France, 1999.<br />
Huteau (Michel).<strong>–</strong> Le débat Binet-Toulouse et les débuts de la psychologie différentielle en<br />
France, dans Flieller (André) et coll., Questions de psychologie différentielle, Rennes,<br />
Presses universitaires de Rennes, 2001, p. 23-42.<br />
Huteau (Michel). <strong>–</strong> Alfred Binet et la psychologie de l’intelligence, Journal des psychologues,<br />
sous presse.<br />
Lautrey (Jacques).<strong>–</strong> A pluralistic approach to cognitive differenciation and development, dans<br />
Sternberg (Robert. J.), Lautrey (Jacques.), Lubart (Todd.), Models of intelligence :<br />
international perspectives, Washington, American psychological press, 2003, p. 117-<br />
131.<br />
Lautrey (Jacques).<strong>–</strong> Le statut de la variabilité entre les individus en psychologie cognitive,<br />
dans Lautrey (Jacques.), Mazoyer (Bernard.), van Geert (Paul.), Invariants et<br />
variabilité, Paris, Editions de la Maison des sciences de l’homme, 2002, p. 103-121.<br />
Lautrey (Jacques) <strong>–</strong> Le QI: concept mal compris ou concept dépassé?, A.N.A.E., n° 83-84,<br />
2005, p. 146-150.<br />
Lindenberger (Ulman), Li (Shu-Chen), Brehmer (Yvonne).<strong>–</strong> La variabilité dans le<br />
vieillissement comportemental : conséquence et agent du changement ontogénétique,<br />
dans Lautrey (Jacques), Mazoyer (Bernard), van Geert (Paul), Invariants et variabilité,<br />
Paris, Editions de la Maison des sciences de l’homme, 2002, 315-334.<br />
20
Mackintosh (N. J.), Bennett (E. S.).<strong>–</strong> The fractionation of working memory maps onto<br />
different components of intelligence, Intelligence, 31, 2003, p. 519-531.<br />
Miyake (Akira), Friedman (Naomi P.), Emerson (Michael J.), Witzki (Alexander H.),<br />
Howerter (Amy), Wager (Tor D.).<strong>–</strong> The unity and diversity of executive functions and<br />
their contributions to complex “frontal lobe” tasks : a latent variable analysis,<br />
Cognitive psychology, 41, 2000, p. 49-100.<br />
Pesenti (Mauro), Zago (Laure), Crivello (Fabrice), Mellet (Emmanual), Samson (Dana),<br />
Duroux (Bruno), Séron (Xavier), Mazoyer (Bernard), Tzuro-Mazoyer (Nathalie).-<br />
Mental calculation in a prodigy is sustained by right prefrontal and medial temporal<br />
areas, Nature Neuroscience, 4 (1), p.103-107.<br />
Reuchlin (Maurice).<strong>–</strong> Processus vicariants et différences individuelles, Journal de<br />
psychologie, 2, 1978, p. 133-145.<br />
Ribaupierre (Annick de).<strong>–</strong> Les modèles néo-piagétiens : quoi de nouveau ?, Psychologie<br />
française, 42, 1997, p. 9-21.<br />
Roubertoux (Pierre).<strong>–</strong> Existe-t-il des gènes du comportement ?, Paris, Odile Jacob, 2004.<br />
Süss (Heinz-Martin), Oberauer (Klaus), Wittmann (Werner), Wilhelm (Oliver), Schulze<br />
(Ralf).<strong>–</strong> Working memory capacity explains reasoning ability <strong>–</strong> and a little bit more,<br />
Intelligence, 30, 2002, p. 261-288.<br />
Thelen (Esther), Smith (Linda B.) <strong>–</strong> A dynamic systems approach to the development of<br />
cognition and action, Cambridge, Ma, MIT Press, 1994.<br />
Toulouse (Edouard), Vaschide (Nicolas), Piéron (Henri).<strong>–</strong> Technique de psychologie<br />
expérimentale, Paris, Douin, 1904.<br />
Van Geert (Paul), van Dijk (Marijn).<strong>–</strong> Focus on variability : new tools to study intra-<br />
individual variability in developmental data, Journal of infant behavior and<br />
development, 25, 2002, p. 340-374.<br />
21
Texte 4<br />
Lautrey, J. (2007). Pour l’abandon du QI : les raisons du succès d’un concept dépassé. In M. Duru-<br />
Bellat & M. Fournier (Eds.), L’intelligence de l’enfant <strong>–</strong> l’empreinte du social. Auxerre : Editions<br />
Sciences Humaines.
Pour l’abandon du QI :<br />
les raisons du succès d’un concept scientifiquement dépassé<br />
Jacques Lautrey est professeur émérite à l’Université Paris 5<br />
Il a notamment publié Classe sociale, milieu familial, intelligence (PUF, 1980) ; Evaluer<br />
l’intelligence : psychométrie cognitive (avec Michel Huteau, PUF, 2003) ; L’intelligence (Dir,<br />
avec Jean-François Richard, Editions Lavoisier, 2005) ; Les tests d’intelligence (avec Michel<br />
Huteau, La découverte, 2006) ; L’approche différentielle de l’intelligence, In J. Lautrey (Dir.),<br />
Psychologie du développement et psychologie différentielle (PUF, 2006).<br />
Ce chapitre reprend, en la développant, la thèse défendue à l’origine dans un article<br />
publié par la revue ANAE : Lautrey, J. (2005). Le Q.I. : concept mal compris ou concept<br />
dépassé ? ANAE, 17,146-149.<br />
Parmi les concepts issus de la psychologie, il en est peu qui aient autant de succès dans le<br />
grand public que celui de QI. Les sites internet qui proposent, moyennant quelques euros,<br />
d’évaluer son propre QI en passant un test d’intelligence en ligne affichent des millions de<br />
connexions. En 2002, six millions de téléspectateurs ont regardé « Le grand test », une<br />
émission au cours de laquelle chacun pouvait répondre aux questions tirées d’un test<br />
d’intelligence et calculer son QI. Les psychologues font état d’un nombre croissant de parents<br />
qui s’adressent à eux en leur demandant de faire passer un test d’intelligence à leur enfant et<br />
de leur communiquer son QI. Même la presse people inclut maintenant le QI dans les<br />
mensurations des stars: celui de Madonna serait de 140 et la rumeur court que celui de Sharon<br />
Stone serait de 153…<br />
Les dérives qui accompagnent cette généralisation de l’usage du QI. inquiètent les<br />
psychologues. En témoigne le manifeste sur les usages du QI, publié récemment par un<br />
groupe de spécialistes de l’examen psychologique et intellectuel de l’enfant, que de nombreux<br />
psychologues ont signé 1 . Ce manifeste pointe avec justesse les dérives parfois observées dans<br />
1 « Des psychologues s’interrogent sur le QI et certains de ses usages », Journal des Psychologues, n° 230,<br />
septembre 2005. Le site www.psy-et-QI.com sur lequel le texte de ce manifeste peut être signé fait état de plus<br />
de 600 signatures à la date où ces lignes sont écrites.
l’usage qui est fait du QI par certains psychologues, certains media, certains services<br />
administratifs et, plus généralement, par les différents usagers de l’examen intellectuel de<br />
l’enfant (dans la suite, le terme usagers réfèrera à cet ensemble d’utilisateurs potentiels du<br />
QI). Il rappelle, par exemple, que le chiffre du QI, à lui seul, n’a aucune signification et que<br />
seule l’interprétation que peut en faire le psychologue, à la lumière des autres informations<br />
recueillies au cours de l’examen psychologique, permet de passer de ce chiffre à une<br />
évaluation des capacités intellectuelles.<br />
Cette contribution à la réflexion sur les usages du QI est utile. Elle est cependant insuffisante<br />
car le texte mentionné plus haut ne questionne pas assez clairement la pertinence même du<br />
concept de QI dans l’état actuel de nos connaissances sur l’intelligence. Certaines de ses<br />
faiblesses sont certes mentionnées, mais la position des auteurs reste sur ce point ambiguë. Ils<br />
affirment en effet avec force que « Le QI, qui a bientôt 100 ans, est devenu une donnée<br />
scientifique et sophistiquée, une source exceptionnelle d’informations privilégiées pour le<br />
psychologue ». Pour les auteurs de ce manifeste, le problème semble donc venir surtout de ce<br />
que la signification complexe de l’indication chiffrée exprimant le QI échappe à beaucoup de<br />
ceux qui utilisent cette notion. Cette analyse des mésusages du QI les conduit à revendiquer<br />
que les psychologues soient les seuls à pouvoir en faire usage et aient le droit de refuser de le<br />
communiquer .<br />
La curiosité du grand public pour ce qui touche au QI tient en bonne partie à l’importance que<br />
notre société accorde aux capacités intellectuelles et en particulier à la forme d’intelligence<br />
requise pour réussir à l’école. La corrélation observée entre QI et réussite scolaire 2 contribue<br />
certainement à cette valorisation du QI et, plus généralement, à alimenter la curiosité pour ce<br />
qui touche à l’évaluation de l’intelligence. Cette curiosité est légitime et doit être satisfaite.<br />
Dans ce contexte, l’attitude de psychologues qui calculeraient un QI, le consigneraient dans<br />
un dossier, mais refuseraient de le communiquer aux usagers concernés risque d’être mal<br />
comprise. Il est certes problématique que la notion de QI, telle qu’elle est comprise par les<br />
usagers de la psychologie, aiguille sur de fausses pistes leur légitime curiosité sur<br />
l’intelligence et sur la façon dont celle-ci peut être évaluée. Mais peut-être vaudrait-il mieux<br />
commencer par se demander pourquoi la notion de QI est si mal interprétée et à quoi peut<br />
bien tenir alors son succès auprès du grand public.<br />
2 Cette corrélation est en moyenne de l’ordre de .50, ce qui signifie que le QI peut rendre compte de 25% de la<br />
variance observée dans les résultats scolaires.<br />
2
Des représentations erronées mais pérennes<br />
Ce succès tient, c’est du moins notre hypothèse, à ce que la représentation de l’intelligence<br />
implicitement véhiculée par la notion de QI se trouve précisément être celle qui correspond<br />
aux conceptions spontanées de tout un chacun. Mais comment expliquer alors cette<br />
correspondance entre la représentation de l’intelligence véhiculée par le concept de QI et celle<br />
du sens commun?<br />
Il est en fait fréquent, dans l’histoire des sciences, que les recherches s’appuient au départ sur<br />
des concepts du sens commun dont elles modifient ensuite la définition au fur et à mesure des<br />
réajustements qu’imposent les résultats expérimentaux. C’est ce qui s’est passé pour le<br />
concept d’intelligence. Les premières tentatives de mesure, faites il y a maintenant plus d’un<br />
siècle par des pionniers comme Alfred Binet, qui avait élaboré la première « échelle<br />
métrique » du développement de l’intelligence, ou Charles Spearman, qui a proposé la<br />
première procédure mathématique pour extraire ce qu’il pensait être l’unique facteur commun<br />
aux tâches intellectuelles, qu’il appelait le facteur général d’intelligence (facteur g),<br />
s’appuyaient sur une représentation unidimensionnelle de l’intelligence qui était celle du sens<br />
commun. Au cours du siècle qui s’est écoulé depuis, les recherches ont conduit à une<br />
représentation qui s’est beaucoup écartée de cette conception unidimensionnelle alors que<br />
cette dernière est restée pérenne dans le grand public. Il n’y a donc plus de correspondance<br />
évidente entre la façon dont les psychologues qui ont suivi cette évolution scientifique<br />
interprètent les résultats d’un test d’intelligence et la façon dont le public se représente<br />
l’intelligence à travers la notion de QI.<br />
Comment sortir de ce malentendu ? En réservant l’usage du QI aux psychologues comme le<br />
préconisent les auteurs du manifeste cité plus haut? En expliquant mieux cette notion aux<br />
usagers ? En l’abandonnant ? C’est ce dernier point de vue qui sera défendu ici.<br />
L’inconvénient de la notion de QI est en effet de susciter des inférences erronées qui<br />
contribuent à cristalliser une représentation scientifiquement dépassée de l’intelligence.<br />
Selon nous, les instruments d'évaluation dont les psychologues peuvent disposer aujourd’hui<br />
leur permettent effectivement de tirer des informations scientifiques d'une grande richesse sur<br />
l'intelligence mais le concept de QI , par contre, n'est plus adapté pour rendre compte de cette<br />
richesse et devrait donc être abandonné, y compris par les psychologues.<br />
En évaluant l’intelligence d’une personne par un indicateur chiffré unique, le QI suscite chez<br />
les usagers des inférences trompeuses sur ce qui est mesuré. Il suggère implicitement que<br />
3
l’intelligence est une entité unidimensionnelle (puisqu’un indicateur unique suffit à la<br />
caractériser), dont chaque personne possède une certaine quantité (puisque cet indicateur est<br />
un nombre), qui caractérise cette personne de façon stable (puisque Madonna a, aujourd’hui<br />
comme hier, un QI de 140). Le malentendu vient de ce que, comme on se propose de le<br />
montrer dans ce qui suit, chacune de ces trois inférences est erronée.<br />
1. De l’inconvénient de résumer l’évaluation de l’intelligence par un indicateur unique<br />
L’utilisation d’un indicateur unique suggère que l’intelligence est une fonction unitaire, dont<br />
l’efficience peut être caractérisée de façon globale. Cette représentation est celle qui a inspiré,<br />
il y a un siècle, la notion globale d’âge mental à Binet, le calcul du Quotient Intellectuel par<br />
Stern (voir encadré), et l’extraction d’un facteur général d’intelligence par Spearman. Comme<br />
cela a été indiqué plus haut, les recherches ultérieures ont conduit à abandonner cette<br />
représentation unidimensionnelle de l’intelligence.<br />
Dans le cadre des travaux qui se sont appuyés sur les méthodes d’analyse factorielle pour<br />
étudier l’intelligence, une évolution longue et laborieuse a abouti à un modèle factoriel<br />
hiérarchique à trois niveaux, dans lequel s’articulent un facteur général d’intelligence, des<br />
facteurs de groupe larges correspondant à différents aspects de l’intelligence (fluide,<br />
cristallisée, visuo-spatiale, etc.), chacun de ces facteurs larges pouvant être subdivisé à son<br />
tour en facteurs de groupe plus étroits 3 . Il subsiste bien un facteur général, dont le rôle est très<br />
important, mais celui-ci n’est plus qu’une des dimensions sur lesquelles les performances<br />
varient dans les tâches intellectuelles 4 .<br />
Dans le cadre des travaux qui ont porté sur la construction d’échelles de mesure du<br />
développement de l’intelligence, le fractionnement du concept a été initié à partir de 1939 par<br />
la séparation introduite par le psychologue américain David Wechsler entre une échelle dite<br />
verbale et une échelle dite de performances non verbales. De leur côté, A.et N. Kaufman,<br />
auteurs du K-ABC (Kaufman-Assessment Battery for Children), ont plus tard distingué, dans<br />
leur propre échelle, des sous-échelles relatives aux types de processus mentaux sollicités<br />
(séquentiels versus simultanés) et une sous-échelle relative aux connaissances. Ce<br />
fractionnement s’est amplifié plus récemment avec la distinction introduite, dans la WISC<br />
3 voir l’explication de ces différents modèles dans L’Intelligence de l’enfant, le regard des psychologues,<br />
M.Fournier, R.lécuyer (dir.), éditions Sciences Humaines 2006.<br />
4 voir Carroll, J.B. (1993). Human cognitive abilities. Cambridge: Cambridge University Press Et Lautrey, J.<br />
(2006). L’approche différentielle de l’intelligence. In J. Lautrey (Ed.), Psychologie du développement et<br />
psychologie différentielle. Paris : PUF.<br />
4
IV* (dernière révision de l’échelle de Wechsler pour enfants), entre quatre sous-échelles<br />
correspondant à quatre grandes dimensions cognitives : des indices permettent de distinguer<br />
des aspects de l’intelligence qui étaient auparavant confondus dans le QI verbal (la<br />
compréhension verbale et la capacité de la mémoire de travail) ou dans le calcul du « QI<br />
performance » (le raisonnement perceptif et la vitesse de traitement) 5 .<br />
Dans la construction des échelles de mesure, ce fractionnement du concept d’intelligence a<br />
d’abord été assez global et inspiré par l’expérience clinique, comme ce fut le cas chez<br />
Wechsler pour la distinction verbal / performance, mais il tend à s’appuyer de plus en plus sur<br />
les apports de l’analyse factorielle et de la psychologie cognitive, comme dans les dernières<br />
révisions de toutes les grandes échelles de développement de l’intelligence : Stanford-Binet,<br />
K-ABC, échelles de Wechsler par exemple 6 .<br />
Le passage d’une conception unitaire à une conception multidimensionnelle de l’intelligence<br />
est donc une tendance lourde qui caractérise l’évolution des idées au cours du siècle qui nous<br />
sépare de l’invention du premier test d’intelligence. Le maintien d’une forme d’évaluation de<br />
l’intelligence qui se traduit par un indicateur unique n’est pas la pratique la plus propice à<br />
faire saisir cette évolution aux usagers.<br />
2. De l’inconvénient d’utiliser un indicateur qui ressemble à un nombre sans en avoir<br />
toutes les propriétés<br />
La seconde inférence trompeuse réside dans l’utilisation d’un indicateur chiffré (le QI) tel que<br />
140 ou 157… pour mesurer l’intelligence. Cette mesure de l’intelligence par « une note » d e<br />
QI suggère que celle-ci aurait toutes les propriétés des nombres. En réalité, le niveau de<br />
mesure le plus puissant sur lequel les psychologues puissent fonder leurs évaluations de<br />
l’intelligence est le niveau ordinal: ils savent ordonner les personnes en fonction de leurs<br />
performances dans les tests (nombre d’items réussis) et ils savent aussi ordonner les items de<br />
ces tests en fonction de leur niveau de difficulté (nombre de personnes qui réussissent chaque<br />
item). Depuis Wechsler, le QI d’un sujet ne traduit rien d’autre que le rang auquel sa<br />
performance le situe dans son groupe d’âge (voir encadré). Les différents arrangements qui<br />
5 Wechsler, D. (2005a). WISC IV. Manuel d’interprétation. Paris: Editions du Centre de Psychologie Appliquée.<br />
Wechsler, D. (2005b). WISC IV. Manuel d’administration et de cotation. Paris : Editions du Centre de<br />
Psychologie Appliquée.<br />
6 cf. Flanagan, D.P., & Harrison, P.L. (2005) (Eds.). Contemporary Intellectual Assessment, 2 nd Edition. New<br />
York: The Guilford Press. ET Lautrey, 2006, op. cit<br />
5
permettent de passer de ce simple rang à un nombre tel que 140 ou 157 relèvent de<br />
commodités qui n’ont rien à voir avec les propriétés de l’intelligence.<br />
Le premier arrangement, celui qui correspond au passage du score brut au score standard dans<br />
les échelles de Wechsler, consiste à s’appuyer sur la forme normale de la distribution des<br />
scores dans l’échantillon d’étalonnage pour transformer ceux-ci en écarts-réduits. C’est ce qui<br />
permet ensuite de les traiter comme s’ils constituaient une échelle d’intervalle. Mais la forme<br />
« normale » de la distribution des scores dans l’échantillon d’étalonnage, sur laquelle on<br />
s’appuie pour faire cette manipulation, n’est pas une propriété de l’intelligence. Elle est<br />
seulement la forme que les constructeurs de tests tentent généralement de donner à la<br />
distribution des scores en faisant une répartition appropriée des niveaux de difficulté des<br />
items. Les objectifs visés par cette manipulation sont de l’ordre de la commodité (meilleure<br />
discrimination aux extrêmes de la distribution, possibilité d’utiliser les techniques statistiques<br />
qui présupposent la normalité de la distribution, etc.).<br />
Le second arrangement, celui qui permet de passer des scores standard au QI, est un<br />
changement d’échelle visant à donner à la distribution des scores totaux une moyenne de 100<br />
et un écart-type de 15. Wechsler y avait eu recours pour que les nombres auxquels aboutissait<br />
la mesure soient du même ordre de grandeur que ceux auxquels étaient habitués les<br />
psychologues qui utilisaient des échelles où on calculait un QI de type Stern (voir encadré).<br />
Cette pratique a été conservée depuis.<br />
Vouloir expliquer aux usagers la signification réelle du nombre que le psychologue utilise<br />
lorsqu’il leur communique un QI serait donc une entreprise ardue. La solution la plus<br />
raisonnable pour ce faire serait de s’appuyer sur la seule propriété solidement fondée à<br />
laquelle renvoie ce nombre, c’est à dire le rang auquel la performance du sujet le classe dans<br />
son groupe d’âge (en précisant les marges de l’incertitude due à l’erreur de mesure). C’est une<br />
information qui a en outre l’avantage de pouvoir être facilement comprise par tout le monde.<br />
Mais dans ce cas, à quoi a servi tout le détour consistant à passer par un QI ? Ne pourrait-on<br />
pas en rester, y compris pour le psychologue, au niveau de mesure qui peut être<br />
scientifiquement justifié ?<br />
3. Des inférences erronées que suscite la stabilité du QI<br />
Il y a peu de corrélation entre le quotient de développement évalué dans la petite enfance et le<br />
QI ultérieur mais, dès le début de l’enfance, disons dès 5 ou 6 ans, la stabilité du QI devient<br />
forte. Dans les études longitudinales où le QI mesuré vers 6 ans a été mis en relation avec le<br />
6
QI mesuré à l’adolescence ou à l’âge adulte, les corrélations trouvées sont fortes (de l’ordre<br />
de .80) 7 . La stabilité relative du QI est donc un fait statistique avéré. C’est son interprétation<br />
qui fait problème.<br />
Que peut signifier en effet le fait que la mesure de l’intelligence d’une personne se traduise à<br />
peu près par le même nombre quand elle a 6 ans et quand elle en a 18 ? Un peu de bon sens<br />
suffit pour réaliser que cela ne veut probablement pas dire qu’elle a le même degré<br />
d’intelligence à 18 ans qu’à 6 ans, chacun ayant pu constater que les performances<br />
intellectuelles d’un adolescent sont en général supérieures à celles d’un enfant. Mais il est<br />
plus difficile, car cette information n’est pas transparente, de comprendre le sens précis de<br />
cette corrélation, à savoir que le score de cette personne dans le test est certes bien plus élevé<br />
à 18 ans qu’à 6 ans, mais qu’il la classe à peu près au même rang, à ces deux moments de son<br />
développement, lorsqu’on le rapporte aux scores qui sont observés dans son groupe d’âge.<br />
L’absence de transparence quant au statut du nombre par lequel le QI est exprimé contribue à<br />
rendre problématique l’interprétation de sa stabilité.<br />
Une meilleure compréhension de ce que traduit le chiffre exprimant le QI ne suffit cependant<br />
pas à écarter les interprétations erronées qui sont souvent faites de la stabilité de ce chiffre.<br />
Les erreurs les plus courantes sont de voir dans cette stabilité l’expression soit d’une<br />
détermination essentiellement génétique de l’intelligence, soit d’une fatalité sociologique. Les<br />
résultats des études qui ont porté sur le développement intellectuel d’enfants adoptés<br />
permettent d’écarter ces deux interprétations. Lorsque des enfants sont adoptés par des parents<br />
ayant un niveau socio-culturel différent de celui de leurs parents biologiques, les QI de ces<br />
enfants diffèrent d’au moins une douzaine de points en moyenne (près d’un écart-type donc)<br />
de celui de leurs frères et sœurs adoptés par des parents ayant le même niveau socio-culturel<br />
que leurs parents biologiques 8 . Ceci ne signifie évidemment pas que les facteurs génétiques<br />
n’influencent pas le développement intellectuel (les mêmes études donnent des résultats qui<br />
sont aussi compatibles avec cette hypothèse) mais il montre que la stabilité du QI ne relève<br />
d’aucune forme de fatalité. Elle tient seulement à ce qu’en l’absence de modifications<br />
sensibles de l’environnement socio-culturel dans lequel un enfant se développe, le rang<br />
auquel son score dans un test de QI le classe dans son groupe d’âge reste relativement stable.<br />
Cette stabilité est de nature statistique, elle est simplement due à ce que, dans la population,<br />
les cas de modifications sensibles de l’environnement socio-culturel sont rares. Mais, comme<br />
7 Voir par exemple Bayley, N. (1970). Development of mental abilities. In P.M. Mussen (Ed.), Carmichael’s<br />
Manual of Child Psychology. New-York: Wiley.<br />
8 voir l’article de Duyme, p…<br />
7
le montrent les études sur les enfants adoptés, lorsque de telles modifications surviennent, le<br />
QI évolue.<br />
La stabilité de l’indicateur du développement intellectuel n’est certes pas propre au QI. Elle<br />
serait la même avec un indicateur correspondant plus simplement au rang auquel la<br />
performance du sujet le classe dans son groupe d’âge. Ce que nous avons voulu souligner à<br />
propos des erreurs d’interprétation auxquelles cette stabilité donne lieu, c’est que l’absence de<br />
transparence du nombre par lequel le QI est exprimé les induit plus facilement.<br />
Réserver l’usage du Qi aux psychologues… ou l’abandonner ?<br />
Ces trois exemples d’inférences erronées montrent bien que, du point de vue des<br />
connaissances scientifiques actuelles, la représentation de l’intelligence suggérée par l’usage<br />
du QI est dépassée. Compte tenu de la difficulté dans laquelle se trouveraient les<br />
psychologues s’ils devaient réellement expliquer aux usagers pourquoi ni l’intelligence ni sa<br />
mesure ne correspondent aux apparences que véhicule le QI, il ne reste que deux solutions<br />
pour régler le problème. La première est de réserver le QI à l’usage exclusif des<br />
psychologues, seuls capables, par la formation qu’ils ont reçue, d’interpréter et d’utiliser à<br />
bon escient une notion aussi complexe et aussi trompeuse. La seconde est d’abandonner cette<br />
notion et de la remplacer par d’autres plus appropriées aux connaissances actuelles sur<br />
l’intelligence et aux possibilités d’évaluation qui en découlent.<br />
Le texte publié par le Journal des Psychologues plaide pour la première de ces deux solutions.<br />
On pourrait comprendre que les psychologues restent attachés au QI si, en dépit de ses<br />
inconvénients, cette notion leur offrait des avantages irremplaçables. Est-ce bien le cas ?<br />
Perdrait-on de l’information en utilisant des concepts plus appropriés à la prise en compte du<br />
caractère multidimensionnel de l’intelligence et plus respectueux du niveau ordinal de la<br />
mesure effectuée? C’est ce qui se pratique depuis longtemps lorsqu’on utilise des batteries<br />
factorielles. Le profil obtenu en caractérisant la performance du sujet par son rang dans<br />
l’échantillon de référence pour chacun des facteurs de l’intelligence restitue le caractère<br />
multidimensionnel de celle-ci et colle au plus près du niveau réel de la mesure effectuée. La<br />
forme du profil renseigne sur les avances et retards dans les différents aspects de l’intelligence<br />
et l’ « altitude » du profil renseigne sur le niveau général des performances lorsqu’elles sont<br />
suffisamment homogènes. Ce type d’évaluation analytique est aussi pratiqué depuis<br />
longtemps par les psychologues qui utilisent des échelles d’intelligence de type Wechsler.<br />
8
Toutefois l’inconvénient du profil établi à partir des scores dans les différents sous-tests de<br />
l’échelle était, jusqu’ici, qu’il s’appuyait sur des sous-tests spécifiques, issus d’un<br />
échantillonnage très empirique des tâches intellectuelles et non sur les grandes dimensions de<br />
l’intelligence répertoriées depuis. Du fait que chaque sous-test ne comportait qu’une seule<br />
épreuve, et du fait que les liens de ces sous-tests avec les grandes dimensions de l’intelligence<br />
n’étaient pas évidents, ces profils avaient un faible fidélité et il était difficile d’en donner une<br />
interprétation claire. L’évolution amorcée dans la plupart des échelles d’intelligence, qui<br />
permet de calculer des indices de performance dans chacune des grandes dimensions<br />
factorielles distinguées dans l’échelle (comme par exemple la compréhension verbale, la<br />
mémoire de travail, le raisonnement perceptif, la vitesse de traitement, dans la WISC IV) va<br />
dans le bon sens et devrait fournir des bases plus solides à cette démarche.<br />
On opposera peut-être que le même résultat pourrait être obtenu en distinguant plusieurs QI.<br />
Les versions précédentes de la WISC, par exemple, permettaient déjà de distinguer un QI<br />
verbal et un QI performance. La WISC IV (dernière révision de la WISC), qui permet de<br />
calculer des indices de performance sur quatre dimensions factorielles distinctes, aurait pu<br />
permettre de calculer, pourquoi pas, quatre QI distincts. Les auteurs de cette révision de la<br />
WISC n’ont pas suivi cette voie et ils ont eu raison. Ce type d’utilisation de la notion de QI la<br />
viderait du sens qu’elle avait à l’origine et ne ferait donc qu’accroître encore la confusion.<br />
Les auteurs de la WISC IV laissent néanmoins la possibilité de calculer un QI global dont ils<br />
disent que celui-ci peut alors être considéré comme une estimation du facteur général. Il est<br />
effectivement nécessaire qu’une évaluation du facteur général figure dans une évaluation<br />
multidimensionnelle de l’intelligence, mais le QI global n’en est pas la meilleure estimation.<br />
La raison en est simple, le score en facteur général est calculé en donnant à chacun des sous-<br />
tests de l’échelle un poids qui est fonction de sa contribution à ce facteur général. Le QI par<br />
contre est calculé en additionnant simplement les scores standards aux différents sous-tests, ce<br />
qui accorde donc à chacun de ces sous-tests un poids égal dans la somme, quelle que soit sa<br />
contribution au facteur général. La procédure adoptée dans ce dernier cas est en somme<br />
comparable à celle qui consisterait à donner le même coefficient à toutes les matières dans le<br />
calcul de la moyenne à un examen, quelle que soit l’importance de cette matière dans cet<br />
examen. Les auteurs de la révision de la WISC IV sont donc restés à mi-chemin dans<br />
l’évolution qu’ils ont amorcée: ils ont adopté la logique factorielle pour le calcul des indices<br />
correspondant aux facteurs de groupe (compréhension verbale, mémoire de travail,<br />
raisonnement perceptif, vitesse de traitement) mais sont restés dans la logique du QI, qui n’est<br />
pas la plus appropriée, pour l’évaluation du facteur général.<br />
9
En résumé, le QI est certes un concept souvent mal compris mais c’est aussi un<br />
concept qui n’est plus vraiment adapté aux connaissances scientifiques actuelles sur<br />
l’intelligence. Au cours du siècle qui nous sépare des premières tentatives de mesure de<br />
l’intelligence, on est progressivement passé d’une conception unidimensionnelle et globale<br />
de cette fonction à une conception multidimensionnelle et plus analytique. Bien adapté à la<br />
première de ces deux conceptions, qui était et reste encore très répandue dans le public, le QI<br />
n’est plus adapté à l’opérationnalisation de la seconde. C’est la raison pour laquelle la<br />
solution des malentendus soulevés par l’usage du QI passe par l’abandon de cette notion.<br />
Cette évolution ne peut probablement être que progressive, ne serait-ce que par ce qu’elle<br />
suppose une évolution préalable, ou au moins parallèle, des instruments d’évaluation et des<br />
modes de quantification qui leur sont associés. Pourtant, cette évolution est maintenant<br />
nécessaire.<br />
Qu’est-ce que le QI ?<br />
Pour construire leur échelle métrique de l’intelligence, Binet et Simon (1908) ont cherché à mettre au<br />
point, pour chaque âge de l’enfant, de petites tâches intellectuelles qui soient caractéristiques de cet âge, c’est à<br />
dire des items réussis par à peu près la moitié des enfants de l’âge considéré mais par contre échouées par la<br />
plupart des enfants de l’âge précédent et réussies par la plupart des enfants de l’âge suivant. Un enfant<br />
réussissant, par exemple, les items caractéristiques de l’âge de 12 ans est alors considéré comme ayant un « âge<br />
mental » de 12 ans, quel que soit son âge chronologique. Stern proposa un peu plus tard, en 1912, de quantifier<br />
le degré d’avance ou de retard du développement intellectuel en rapportant l’âge mental à l’âge chronologique.<br />
Ainsi, un enfant crédité de 12 ans d’âge mental dont l’âge chronologique est de 10 ans est caractérisé par un<br />
quotient de 12/10= 1,2. Terman multiplia ce quotient par 100 pour éviter les décimales, ce qui donne, dans notre<br />
exemple, un QI de (12/10) x 100 = 120. Avec cette méthode de calcul, le cas où l’âge mental est le même que<br />
l’âge chronologique, qui est la norme, correspond à un QI de 100.<br />
Ce quotient, qui sera désigné dans ce chapitre comme le QI de type Stern, avait un certain nombre<br />
d’inconvénients. Tel qu’il est évalué dans ce type de test, l’âge mental n’augmente plus après l’adolescence,<br />
alors que l’âge chronologique continue d’augmenter, ce qui rendrait absurde de calculer ainsi le QI d’adultes. Par<br />
ailleurs, le fait que la dispersion des QI ainsi calculés varie selon les âges rend la comparaison des QI obtenus à<br />
des âges différents problématiques. Ces différents problèmes rencontrés avec le QI de type Stern ont conduit<br />
Wechsler à proposer une méthode différente de quantification de la performance intellectuelle. Cette méthode<br />
consiste à simplement attribuer des points aux items réussis, puis à transformer la note globale ainsi obtenue en<br />
une variable à laquelle on assigne à chaque âge un écart-type identique et une moyenne de 100 (Wechsler a<br />
choisi un écart-type de 15 pour que cette variable se distribue autour de la moyenne 100 avec un ordre de<br />
grandeur comparable à l’écart-type moyen observé avec le QI de type Stern). Wechsler a conservé le terme de QI<br />
pour désigner cette variable qui n’est pourtant plus un quotient. Nous conviendrons dans ce chapitre d’appeler<br />
cette variable le QI de type Wechsler. Le QI de type Wechsler est celui qui est maintenant utilisé dans toutes les<br />
échelles de développement de l’intelligence. Son mode de calcul est présenté de façon un peu plus complète dans<br />
ce chapitre.<br />
Les deux méthodes de calcul du QI, celui de type Stern et celui de type Wechsler, ont en commun de<br />
faire une sommation globale des réussites aux différents types d’items que comporte le test (addition des<br />
nombres de mois d’âge mental dont sont crédités les différents items du test pour calculer l’âge mental dans la<br />
méthode de calcul du QI de type Stern, addition des scores obtenus aux différents sous-tests pour le QI de type<br />
Wechsler). Cette globalisation, par sommation, de réussites dans des tâches intellectuelles très variées, postule<br />
l’unicité de l’intelligence. C’est précisément une des caractéristiques du QI qui sont critiquées dans ce chapitre.<br />
10
Texte 5<br />
Blaison, C., Chassard, D., Kop, J. L., & Gana, K. (2006). L'IAT (Implicit Association Test) ou la mesure<br />
des cognitions sociales implicites ? Revue critique de la validité et des fondements théoriques des<br />
scores qu'il produit. L'Année Psychologique, 106, 305-335.
L’IAT (Implicit Association Test) ou la mesure<br />
des cognitions sociales implicites :<br />
Revue critique de la validité et des fondements<br />
théoriques des scores qu’il produit<br />
Christophe Blaison, Delphine Chassard, Jean-Luc Kop et Kamel Gana*<br />
Laboratoire de Psychologie Clinique et Cognitive, Laboratoire de Psychologie Lorrain, et<br />
Groupe d’Analyse Psychométrique des Conduites <strong>–</strong> Université Nancy 2<br />
RÉSUMÉ<br />
Récemment, dans le but de remédier aux limites des mesures par questionnaires<br />
(biais d’auto-présentation, capacités introspectives limitées),<br />
plusieurs mesures dites indirectes ont été développées. Parmi elles, le test<br />
des associations implicites (IAT, Greenwald, McGhee et Schwartz, 1998) est<br />
celui qui a suscité le plus d’intérêt et le plus de travaux : il est suffisamment<br />
flexible pour mesurer des concepts variés (attitude, personnalité, stéréotypes…),<br />
il fournit des scores fidèles et offre des résultats encourageants en<br />
termes de validité critérielle. Mais la validité de construit des scores de l’IAT<br />
est contestée, notamment parce que leur interprétation n’est pas univoque.<br />
Il en est de même pour l’interprétation des dissociations observées entre<br />
mesures directes (questionnaires) et mesures indirectes qui, en l’absence<br />
d’un cadre théorique solide, donne lieu à de multiples débats. Ces défauts<br />
de jeunesse des mesures indirectes ont toutefois le mérite de stimuler la<br />
créativité des chercheurs et d’offrir de nouvelles perspectives qui devraient<br />
déboucher sur de nouveaux outils, mieux fondés théoriquement.<br />
Implicit Association Test or the measure of implicit social cognition:<br />
a critical review of the validity and the theoretical basement<br />
of its scores<br />
ABSTRACT<br />
In order to remedy the limits of self-report measures (self-presentational biases, introspective<br />
limits…), several indirect measures have been developed. The Implicit Association<br />
Test (IAT, Greenwald, McGhee et Schwartz, 1998) is the one that has concentrated most<br />
interest and research: it is flexible enough to measure a broad range of constructs<br />
*Pr. Kamel Gana, Université Nancy 2, 3 Place Godefroy de Bouillon, 54015 Nancy Cedex.<br />
Kamel.gana@univ-nancy2.fr<br />
Notes des auteurs : l’ordre entre des deux premiers auteurs a été déterminé par tirage au sort.<br />
L’année psychologique, 2006, 106, 305-336
306<br />
L’année psychologique, 2006, 106, 305-336<br />
Christophe Blaison • Delphine Chassard • Jean-Luc Kop • Kamel Gana<br />
(attitude, personality, stereotypes…), and it produces reliable and encouraging criteria<br />
valid scores. But the construct validity of the IAT scores remains controversial because<br />
their interpretation is quite ambiguous. In the same vein, because of the lack of any strong<br />
theoretical background, the interpretation of the observed dissociations between direct<br />
(self-report) and indirect measures remains problematic. This leads to multiple discussions.<br />
These “youthful limits” however stimulate researchers’ creativity and open new<br />
perspectives which should lead to more theoretically grounded measures.<br />
1. INTRODUCTION<br />
Les construits propres à la cognition sociale tels que les attitudes, les stéréotypes,<br />
l’estime de soi ou le concept de soi sont le plus souvent appréhendés<br />
par des mesures auto-rapportées ( i.e. , directes). Les limites de ce type de<br />
mesures sont bien connues : elles dépendent à la fois de ce que les sujets<br />
veulent bien nous dire ( i.e. , biais d’auto-présentation) et de ce qu’ils peuvent<br />
nous dire ( i.e. , limites des capacités introspectives). Récemment, dans le but<br />
de remédier à ces limites, plusieurs mesures de type indirect, dont l’Implicit<br />
Association Test (ou IAT) (1) (Greenwald, McGhee et Schwartz, 1998), ont<br />
été développées et l’intérêt à leur égard n’a cessé d’augmenter.<br />
Ces mesures s’inscrivent dans le domaine de la cognition sociale implicite<br />
(Devos et Banaji, 2003) dont on verra les principaux paradigmes<br />
dans la première partie de cet article, ce qui nous permettra de mieux<br />
comprendre le contexte dans lequel l’IAT a été créé.<br />
Dans les deux parties suivantes, notre objectif sera de présenter une synthèse<br />
des travaux portant tant sur les caractéristiques méthodologiques de<br />
l’IAT (partie 2) que sur ses fondements théoriques (partie 3), avec pour<br />
objectif de fournir aux lecteurs francophones une vue d’ensemble des<br />
débats soulevés par l’IAT, ce qui devrait aider à une utilisation appropriée<br />
de ce nouvel instrument.<br />
Dans la seconde partie, nous présenterons donc en détail l’IAT parce que<br />
c’est celui qui a suscité le plus d’intérêt, d’enthousiasme mais aussi le plus<br />
de critiques dès sa première publication. Nous évoquerons le principe sur<br />
lequel repose l’IAT ainsi que ses propriétés psychométriques.<br />
Les limites<br />
potentielles de l’IAT seront ensuite abordées à travers les critiques théoriques<br />
et méthodologiques qui lui ont été adressées avant de présenter les<br />
nouveaux instruments développés pour tenter d’y remédier.<br />
Dans la troisième et dernière partie, nous reviendrons plus spécifiquement<br />
sur les problèmes théoriques posés par l’IAT et notamment sur les<br />
difficultés soulevées par les études de validité, celles-ci conduisant à<br />
s’interroger sur la nature même des construits appréhendés par cet outil.
Validité et fondements théoriques des scores IAT<br />
2. LA COGNITION SOCIALE IMPLICITE<br />
ET SON OPÉRATIONNALISATION<br />
Les avancées scientifiques dans le domaine de la cognition humaine ont<br />
permis à la psychologie de commencer à étudier de façon prometteuse,<br />
d’une part, les processus mentaux inconscients (Jacoby et Kelley, 1987 ;<br />
Jacoby, Toth et Yonelinas, 1993), voire, d’autre part, l’“inconscient psychologique”<br />
des individus (Kihlstrom, Barnhardt et Tataryn 1992 ;<br />
Kihlstrom, Mulvaney, Tobias et Tobis, 2000). Derrière cette expression<br />
d’“inconscient psychologique”, se cache l’idée selon laquelle nos pensées,<br />
notre expérience et nos actes conscients pourraient être influencés par des<br />
perceptions, des souvenirs et autres contenus mentaux dont nous<br />
n’aurions pas conscience et qui seraient indépendants de tout contrôle<br />
volontaire. Si Kihlstrom et al. (2000) parlent volontiers d’« inconscient<br />
psychologique », d’autres préfèrent à ces termes ceux de cognition implicite,<br />
postulant que nos comportements ainsi que nos jugements peuvent<br />
être influencés par des expériences passées sans que nous n’ayons<br />
conscience de cette influence ni que nous nous rappelions cette expérience<br />
(Greenwald et Banaji, 1995). La notion de cognition implicite<br />
marque une avancée supplémentaire dans le domaine de la cognition par<br />
rapport à celle <strong>–</strong> plus ancienne <strong>–</strong> d’automaticité selon laquelle certains de<br />
nos savoir-faire moteurs et cognitifs peuvent, grâce à une pratique intensive,<br />
devenir automatiques et donc rendre les procédures ou les<br />
opérations sous-jacentes inaccessibles à l’introspection (Kihlstrom et al. ,<br />
2000). En effet, alors que la notion d’automaticité fait exclusivement référence<br />
à des processus mentaux dont nous n’aurions pas conscience, celle<br />
de cognition implicite laisse entrevoir la possibilité d’étendre cette idée<br />
aux contenus mentaux associés à ces processus.<br />
Depuis ces dernières années, le concept de cognition implicite a largement<br />
été diffusé. En témoigne le nombre important de travaux publiés<br />
portant sur la mémoire implicite, l’apprentissage implicite, la perception<br />
implicite ou sur les pensées implicites (cf. Kihlstrom et al. , 2000).<br />
En 1995, Greenwald et Banaji proposent de s’intéresser plus spécifiquement<br />
à l’étude des différences individuelles dans le domaine de la<br />
cognition sociale implicite, notamment aux attitudes, aux stéréotypes, à<br />
l’estime de soi et, plus tard (Greenwald et al. , 1998), au concept de soi. De<br />
façon générale, ces auteurs définissent un construit implicite comme une<br />
trace de notre expérience passée non identifiable de façon introspective<br />
(ou identifiée de manière imprécise, voire incorrecte) capable<br />
d’influencer nos sentiments, nos pensées et nos actions envers divers<br />
307<br />
L’année psychologique, 2006, 106, 305-336
308<br />
L’année psychologique, 2006, 106, 305-336<br />
Christophe Blaison • Delphine Chassard • Jean-Luc Kop • Kamel Gana<br />
objets sociaux (Greenwald et Banaji, 1995, p. 5). Dès lors, l’étude des différences<br />
individuelles dans le domaine de la cognition sociale implicite se<br />
heurte au problème de la mesure des construits implicites. Si l’on considère<br />
effectivement que ces derniers sont des traces en mémoire non<br />
identifiables de façon introspective, il n’est pas envisageable de les appréhender<br />
à l’aide de mesures auto-rapportées ( i.e. , directes) puisque cellesci<br />
dépendent des limites des capacités introspectives des sujets (Nisbett et<br />
Wilson, 1977). Il faut donc avoir recours à des instruments qui ne requièrent<br />
pas de réponses auto-rapportées (Greenwald et Banaji, 1995),<br />
autrement dit à des mesures appelées indirectes.<br />
S’inspirant de toute sorte de paradigmes expérimentaux, Greenwald (cf.<br />
Dasgupta, Greenwald et Banaji, 2003) s’est alors lancé dans une série<br />
d’études ayant pour but de mettre au point un instrument de mesure<br />
susceptible d’appréhender des construits implicites tout en produisant<br />
des scores satisfaisants d’un point de vue psychométrique. De cette série<br />
d’études est né l’ Implicit Association Test (ou IAT ; Greenwald et al. ,<br />
1998). L’IAT emprunte le paradigme expérimental classique des temps<br />
de réponse (« response time paradigm ») dont le Stroop,<br />
le Simon Task ou<br />
l’amorçage sémantique sont l’illustration (Chassard et Kop, 2003), et<br />
qui stipule que les temps de réponse d’un sujet à un certain matériel<br />
dépendent des structures cognitives spécifiques qu’il entretient à propos<br />
du monde ou de lui-même. Plus tard, ce paradigme a été adapté pour<br />
être utilisé dans des champs d’étude plus conatifs avec des stimuli<br />
chargés émotionnellement, permettant ainsi l’étude des processus automatiques<br />
d’évaluation (Musch et Klauer, 2003) comme, par exemple, le<br />
Stroop émotionnel (Pratto et John, 1991) ou le paradigme d’amorçage<br />
affectif (Fazio, Sanbonmatsu, Powell et Kardes, 1986). Dans sa forme<br />
originale, le paradigme d’amorçage affectif montre que les sujets traitent<br />
plus rapidement une cible affectivement polarisée quand elle est précédée<br />
d’une amorce de même valence ( e.g. , « amour » précédé de<br />
« joie ») que lorsqu’elle est précédée d’une amorce de valence opposée<br />
( e.g. , « amour » précédé de « torture »). Enfin, certains chercheurs ( e.g. ,<br />
Banse, 1999) ont eu l’idée d’utiliser la variabilité interindividuelle<br />
relevée dans ces nouvelles tâches pour en faire des mesures <strong>–</strong> au sens<br />
psychométrique du terme <strong>–</strong> indirectes d’attitudes, la logique étant que si<br />
les sujets ont une attitude positive envers un objet présenté comme<br />
amorce, ils doivent identifier plus rapidement la valence de cibles positives<br />
que la valence de cibles négatives et inversement s’ils ont une<br />
attitude négative. Cependant, la fidélité observée pour de telles mesures<br />
restant très faible (Bosson, Swann et Pennebaker, 2000), les tentatives<br />
de mesure des différences individuelles sont restées peu satisfaisantes.
Validité et fondements théoriques des scores IAT<br />
C’est donc principalement pour remédier à ce problème que l’IAT a été<br />
développé (Greenwald et al. , 1998).<br />
3. LE TEST DES ASSOCIATIONS IMPLICITES (IAT)<br />
3.1. Principes de base et modalités d’administration<br />
Nous empruntons à Greenwald et Farnham (2000) une illustration évocatrice<br />
du principe sur lequel repose l’IAT. Supposez que vous ayez à trier<br />
un jeu de 52 cartes en deux tas situés à votre gauche et à votre droite. Il<br />
vous sera probablement plus facile de classer les piques et les trèfles d’un<br />
côté et les cœurs et carreaux de l’autre, que de classer piques et cœurs<br />
d’un côté et trèfles et carreaux de l’autre. Cette facilité accrue est due au<br />
fait que les piques et les trèfles d’une part et les cœurs et les carreaux<br />
d’autre part “vont bien ensemble” : ils partagent respectivement un même<br />
attribut, ici la couleur. S’inspirant de cette idée, le principe général de<br />
l’IAT repose sur le fait qu’il est plus facile de classer ensemble des items<br />
cognitifs lorsque les groupements à réaliser sont cohérents avec ceux que<br />
l’on adopte spontanément du fait de notre manière particulière d’organiser<br />
l’information. Par exemple, par rapport à la population générale, un<br />
joueur de bridge s’empresserait d’infirmer l’observation faite plus haut,<br />
car pour lui ce sont d’une part les cœurs et les piques et de l’autre les carreaux<br />
et les trèfles qui vont le mieux ensemble ; pour ce joueur,<br />
l’association entre les familles de cartes n’est plus spontanément créée par<br />
la couleur mais par un autre attribut acquis à travers la pratique du<br />
bridge. L’IAT se veut donc être une méthode de mesure indirecte de la force<br />
relative des associations entre différents concepts<br />
309<br />
(Greenwald, Banaji,<br />
Rudman, Farnham, Nosek et Mellott, 2002).<br />
Afin de décrire plus précisément les applications de l’IAT, nous prendrons<br />
l’exemple d’un IAT censé mesurer l’estime de soi. Par son<br />
entremise, on mesure la force d’association entre le concept de soi et les<br />
deux valences affectives positive et négative. Cette application fait intervenir<br />
deux concepts dits cibles : « Moi » vs. « Pas moi » et deux concepts<br />
dits attributs : « Agréable » vs. « Désagréable ». Le sujet de l’expérience est<br />
assis en face d’un ordinateur muni d’un clavier dont il ne doit utiliser que<br />
deux touches, l’une à gauche, l’autre à droite. La procédure comporte<br />
cinq étapes dans lesquelles on lui demande de classer aussi vite que possible,<br />
tout en faisant le minimum d’erreurs, des stimuli exemplifiant les<br />
L’année psychologique, 2006, 106, 305-336
310<br />
L’année psychologique, 2006, 106, 305-336<br />
Christophe Blaison • Delphine Chassard • Jean-Luc Kop • Kamel Gana<br />
concepts-cibles et les concepts-attributs. Le tableau I résume le contenu<br />
de ces cinq étapes (ou blocs d’items) détaillées ci-dessous.<br />
Étape 1 <strong>–</strong> Des items appartenant aux deux concepts-cibles apparaissent<br />
les uns après les autres sur l’écran. Lorsque les items renvoient au<br />
concept-cible « Moi » ( e.g., « je », « mien », « mon »), le sujet doit appuyer<br />
sur une touche du côté droit du clavier ; lorsqu’ils renvoient au conceptcible<br />
« Pas moi » ( e.g. , « ils », « leurs », « il »), le sujet doit appuyer sur une<br />
touche située du côté gauche du clavier.<br />
Étape 2 <strong>–</strong> Les sujets doivent classer des items appartenant aux deux<br />
concepts-attributs. Lorsqu’ils renvoient au concept-attribut « Agréable »<br />
( e.g. , « sourire », « plaisir », « joie »), le sujet doit appuyer sur une touche<br />
du côté droit du clavier ; lorsqu’ils renvoient au concept-attribut « Désagréable<br />
» ( e.g. , « mort », « poison », « vomi »), le sujet doit appuyer sur<br />
une touche située du côté gauche du clavier.<br />
er<br />
Étape 3 (1 bloc-test) <strong>–</strong> Les deux tâches précédentes sont présentées<br />
conjointement, les items à classer sont donc soit des exemplaires des<br />
concepts-cibles ( e.g. , « je », « ils ») soit des exemplaires de conceptsattributs<br />
( e.g. , « sourire », « mort »). Lorsqu’ils renvoient soit au conceptcible<br />
« Moi », soit au concept-attribut « Agréable », le sujet doit appuyer<br />
sur une touche du côté droit du clavier ; lorsqu’ils renvoient soit au<br />
concept-cible « Pas moi », soit au concept-attribut « Désagréable », le<br />
sujet doit appuyer sur une touche située du côté gauche du clavier.<br />
Étape 4 <strong>–</strong> Les sujets doivent à nouveau classer des items appartenant aux<br />
deux concepts-cibles (cf. étape 1) mais les touches à utiliser pour classer<br />
les exemplaires sont inversées (gauche pour « Moi », droite pour « Pas<br />
moi »).<br />
e Étape 5 (2 bloc-test) <strong>–</strong> Cette dernière étape repose sur le même principe<br />
e que la 3 étape mais les sujets doivent cette fois appuyer sur une touche<br />
située du côté droit du clavier lorsque apparaissent des items renvoyant<br />
soit au concept-cible « Pas Moi », soit au concept-attribut « Agréable » ; et<br />
du côté gauche lorsque apparaissent des items renvoyant soit au conceptcible<br />
« Moi », soit au concept-attribut « Désagréable ».<br />
La mesure résultante de la procédure ( IAT effect ou effet IAT) repose sur<br />
la comparaison entre la force combinée des associations « Pas moi <strong>–</strong> Désa-<br />
er<br />
gréable » et « Moi <strong>–</strong> Agréable » (1 bloc-test, étape 3) et la force combinée des<br />
e<br />
associations « Moi <strong>–</strong> Désagréable » et « Pas moi <strong>–</strong> Agréable » (2 bloc-test,<br />
étape 5). Seules les étapes 3 et 5 sont donc prises en compte lors de l’analyse<br />
des résultats, l’effet IAT s’exprimant par la différence de temps de<br />
réponses entre les deux blocs-tests.<br />
Si un sujet répond plus rapidement aux<br />
items du premier bloc-test qu’aux items du second bloc-test, on en déduit<br />
qu’il associe plus fortement « Moi » et « Agréable » que « Moi » et « Désa-
Validité et fondements théoriques des scores IAT<br />
Tableau I. llustration des cinq étapes d’un IAT d’estime de soi<br />
Étapes/Blocs<br />
Table I. Five constitutive steps of a self-esteem IAT<br />
Presser<br />
Touche gauche<br />
Presser<br />
Touche droite<br />
1 Pas moi Moi<br />
2 Désagréable Agréable<br />
3 <strong>–</strong> 1 er bloc-test Pas moi ou Désagréable Moi ou Agréable<br />
4 Moi Pas moi<br />
5 <strong>–</strong> 2e bloc-test Moi ou Désagréable Pas moi ou Agréable<br />
gréable » ; et on en infère qu’il possède une estime de soi plus élevée par<br />
rapport à un sujet qui est plus rapide au second bloc-test qu’au premier.<br />
L’IAT est capable d’évaluer d’autres caractéristiques psychologiques, car<br />
son mode de construction en fait un outil très flexible. D’une part, les<br />
stimuli servant à sa construction peuvent être langagiers, picturaux,<br />
sonores ou des combinaisons de ces différentes modalités. D’autre part, le<br />
couplage judicieux de certains concepts-cibles et de certains conceptsattributs,<br />
permet théoriquement d’évaluer des attitudes, des stéréotypes<br />
ou des caractéristiques de personnalité (Greenwald et al. , 2002). Par<br />
exemple, si l’on définit une attitude comme l’association entre un objet<br />
social et un attribut valencé (positif ou négatif) (Fazio, Williams et<br />
Powell, 2000 ; Greenwald et al. , 2002), il est possible grâce à l’IAT de<br />
mesurer l’attitude envers des individus de couleur en sélectionnant les<br />
concepts-cibles « Blancs » vs. « Noirs » et les concepts-attributs<br />
« Agréable » vs. « Désagréable ». Si un sujet est plus rapide dans le bloc où<br />
les concepts « Blancs » et « Agréable » (respectivement, « Noirs » et<br />
« Désagréable ») sont associés à une même touche de réponse que dans<br />
celui où sont associés « Noirs » et « Agréable » (respectivement, « Blancs »<br />
et « Désagréable »), alors on en infère qu’il possède une attitude positive<br />
envers les Blancs et négative envers les Noirs. En poursuivant cette stratégie,<br />
on peut envisager un stéréotype comme l’association entre un<br />
groupe social et un ou plusieurs attributs non-valencés ( e.g. , cibles :<br />
« Hommes » vs. « Femmes », attributs : « Mathématiques » vs. « Arts »).<br />
Enfin, une caractéristique personnelle de personnalité peut être assimilée<br />
à l’association entre le concept de soi et un attribut non-valencé ( e.g. ,<br />
cibles : « Moi » vs. « Pas moi », attributs : « Introverti » vs. « Extraverti »).<br />
311<br />
L’année psychologique, 2006, 106, 305-336
312<br />
L’année psychologique, 2006, 106, 305-336<br />
Christophe Blaison • Delphine Chassard • Jean-Luc Kop • Kamel Gana<br />
Cette flexibilité a permis d’étendre l’utilisation de l’IAT à de nombreux<br />
domaines. Il existe par exemple des études sur les attitudes ( e.g. , Karpinski<br />
et Hilton, 2001 ; Jelenec et Steffens, 2002 ; Palfai et Ostafin, 2003 ;<br />
DeJong, Van den Hout, Rietbroek et Huijding, 2003), les stéréotypes ( e.g. ,<br />
Nosek, Banaji et Greenwald, 2002a ; Nosek, Banaji et Greenwald, 2002b),<br />
la catégorisation sociale (Piontkowski, Blanz, Rohman, Schmermund et<br />
Florack, 2001), l’estime de soi ( e.g. , Bosson et al. , 2000 ; Greenwald et Farnham,<br />
2000), la timidité ( e.g. , Asendorpf, Banse et Mücke, 2002),<br />
l’affectivité positive et négative (Blaison et Gana, 2004), les cinq dimensions<br />
de personnalité (OCEAN) (Steffens, 2004), la dépression ( e.g. ,<br />
Gemar, Segal, Sagrati et Kennedy, 2001), l’anxiété ( e.g, Egloff et Schmukle,<br />
2002), l’anxiété sociale (De Jong, 2002), la phobie des animaux<br />
(Teachman, Gregg et Woody, 2001), le conditionnement évaluatif (Mitchell,<br />
Anderson et Lovibond, 2003a).<br />
3.2. Fidélité<br />
Développé principalement dans le but de remédier au manque de fidélité<br />
des scores obtenus par des outils tels que le Stroop émotionnel ou l’amorçage<br />
affectif, l’IAT a réussi son pari. Comme il permet d’obtenir des tailles<br />
d’effet importantes <strong>–</strong> dès 1998, Greenwald et al. rapportent une taille d’effet<br />
IAT (d ≈ 1.21)(2) deux fois supérieure à celle de l’amorçage (d ≈ 0.62) <strong>–</strong> il<br />
devient possible d’envisager une mesure offrant des scores fidèles des différences<br />
individuelles, ce que l’on constate effectivement avec l’IAT. Quel que<br />
soit l’objet mesuré, l’IAT montre une bonne consistance interne ( α de<br />
Cronbach ≈ 0.80), comparable à celle des mesures directes correspondantes<br />
(Bosson et al. , 2000 ; Banse, Seise et Zerbes, 2001 ; Cunningham, Preacher<br />
et Banaji, 2001 ; Egloff et Schmukle, 2002) (3). Sa stabilité temporelle (fidélité<br />
test-retest), bien que modérée (r ≈ 0.60), dépasse largement celle<br />
d’autres mesures indirectes (Bosson et al. , 2000 ; Dasgupta et Greenwald,<br />
2001 ; Greenwald et Nosek, 2001).<br />
3.3. Éléments de validation<br />
Les mesures utilisant l’IAT permettent généralement d’obtenir, au niveau<br />
du groupe, des différences d’attitude conformes à ce qui est attendu.<br />
Ainsi, un favoritisme envers l’endogroupe a pu être détecté, et ce, aussi<br />
bien avec des groupes réels (Greenwald et al. , 1998) qu’en utilisant le<br />
paradigme des groupes minimaux (Ashburn-Nardo, Voils et Monteith,<br />
2001). Hummert, Gartska, O’Brien, Greenwald et Mellott (2002) ont
Validité et fondements théoriques des scores IAT<br />
montré que les personnes âgées avaient, comparativement à de jeunes<br />
adultes, une attitude plus favorable envers les jeunes et une estime de soi<br />
plus élevée. Nosek et al. (2002a) ont montré que les garçons avaient une<br />
attitude plus favorable envers les disciplines scientifiques que les filles.<br />
Gemar et al. (2001) ont montré que des sujets récemment sortis de<br />
dépression avaient une attitude plus négative envers eux-mêmes que des<br />
sujets sains. Dans un autre domaine, Teachman et al. (2001) ont pu différencier<br />
des sujets arachnophobes de sujets ayant la phobie des serpents :<br />
les sujets arachnophobes ont une attitude plus négative envers les araignées<br />
et plus positive envers les serpents alors que c’est l’inverse chez les<br />
sujets ayant la phobie des serpents. Citons aussi DeJong (2002), qui a<br />
montré que des sujets anxieux avaient une estime de soi plus faible que<br />
des sujets non-anxieux, Swanson, Rudman et Greenwald (2001) qui ont<br />
établi que des végétariens avaient une attitude plus positive envers les légumes<br />
et les fruits et plus négative envers la viande que des non-végétariens ou<br />
Banse et al. (2001) qui ont mis en évidence, chez des sujets homosexuels,<br />
comparativement à des hétérosexuels, une attitude plus positive envers<br />
l’homosexualité, etc.<br />
Les résultats concernant la validité critérielle des scores des différentes<br />
applications de l’IAT sont, eux aussi encourageants (Poehlman, Uhlman,<br />
Greenwald et Banaji, 2005) même s’ils restent peu nombreux. Ainsi,<br />
Phelps et al. (2000) ont pu mettre en évidence une relation entre une<br />
mesure IAT d’attitudes raciales (« Blancs » vs. « Noirs ») et l’intensité de<br />
l’activation de l’amygdale (évaluée par IRMf) lorsqu’un visage blanc ou<br />
noir est présenté au sujet. Greenwald et Farnham (2000) ont montré<br />
qu’un IAT d’estime de soi prédisait les réactions des sujets après un feedback<br />
positif ou négatif (les sujets ayant une forte estime de soi semblent<br />
moins affectés par un feed-back négatif). Asendorpf et al. (2002) ont,<br />
quant à eux, observé qu’un IAT de timidité prédisait davantage les comportements<br />
de timidité spontanée ( e.g. , position et tension corporelle) qu’une<br />
mesure directe de timidité, alors que cette dernière est davantage corrélée<br />
aux comportements contrôlés de timidité ( e.g., durée d’une prise de<br />
parole en public).<br />
Tout comme d’autres mesures élaborées essentiellement sur des bases<br />
empiriques, celles utilisant l’IAT connaissent de sérieuses difficultés<br />
lorsqu’il s’agit d’apprécier la validité de construit des scores qu’elles produisent.<br />
Dès les premières applications de l’IAT, on a cherché à établir le<br />
niveau de relation entre la mesure directe d’un concept et la mesure indirecte<br />
de ce même concept (voir, par exemple, Greenwald et Nosek, 2001 ;<br />
Nosek et al. , 2002b ; Fazio et Olson, 2003). Dans l’ensemble, les corrélations<br />
obtenues sont plutôt faibles (r < .30 ; Hofman, Gawronski,<br />
313<br />
L’année psychologique, 2006, 106, 305-336
314 Christophe Blaison • Delphine Chassard • Jean-Luc Kop • Kamel Gana<br />
Gschwendner, Le et Schmitt, 2005), même si l’on a pu constater quelques<br />
exceptions pour certains construits. L’interprétation de ces dissociations<br />
entre mesures directes et mesures indirectes reste toutefois ambiguë<br />
puisqu’on peut soit retenir ce résultat comme montrant la faillite du<br />
paradigme (pour absence de validité convergente), soit l’utiliser pour<br />
attester de l’absence de contamination des mesures indirectes par les biais<br />
inhérents aux mesures directes. Rapidement esquissée, cette controverse<br />
amène à s’interroger sur ce que mesure réellement un paradigme comme<br />
l’IAT. C’est à cette question qu’est consacrée la majeure partie de la suite<br />
de cet article.<br />
3.4. Les limites : l’interprétation équivoque de l’effet IAT<br />
À un niveau strictement opératoire, l’effet IAT n’est qu’une différence de<br />
temps de réponse entre les deux blocs-tests de la procédure. On a d’abord<br />
considéré que cette différence reflétait des associations privilégiées entre<br />
concepts et attributs pouvant s’interpréter, selon le cas, comme des attitudes,<br />
des stéréotypes ou encore des représentations de soi. Ces<br />
interprétations <strong>–</strong> que l’on désignera par l’expression « interprétation<br />
naïve » <strong>–</strong> sont loin d’être aussi univoques qu’elles ne le paraissaient, et<br />
plusieurs éléments théoriques et/ou empiriques incitent aujourd’hui à<br />
davantage de prudence. Dans les points qui vont suivre, nous présentons<br />
les questionnements majeurs quant à l’interprétation d’un score IAT,<br />
ainsi que les garde-fous et/ou les raffinements méthodologiques permettant<br />
d’y répondre.<br />
Premièrement, la mesure IAT est une mesure d’associations relatives (De<br />
Houwer, 2002). Prenons pour illustrer un IAT censé appréhender les attitudes<br />
raciales (utilisant les cibles « Blancs » vs. « Noirs » et les attributs<br />
« Agréable » vs. « Désagréable »). Supposons qu’un sujet soit plus rapide<br />
dans le bloc où les catégories « Blancs » et « Agréable » (respectivement<br />
« Noirs » et « Désagréable ») partagent la même touche de réponse que<br />
dans le bloc où les catégories « Noirs » et « Agréable » (respectivement<br />
« Blancs » et « Désagréable ») sont associées. Tout ce que l’on peut dire,<br />
c’est que l’association « Blancs <strong>–</strong> Agréable » ou l’association « Noirs <strong>–</strong><br />
Désagréable » est plus forte que l’association « Blancs <strong>–</strong> Désagréable » ou<br />
plus forte que l’association « Noirs <strong>–</strong> Agréable ». Et, pour inférer de ce<br />
résultat que le sujet a une attitude positive envers les Blancs et négative<br />
envers les Noirs, il faut supposer que les deux premières associations sont<br />
fortement établies et que les secondes sont faibles ou inexistantes. On<br />
observerait toutefois les mêmes résultats : a) si le sujet avait une attitude<br />
positive envers les Blancs et neutre vis-à-vis des Noirs (i.e., l’association<br />
L’année psychologique, 2006, 106, 305-336
Validité et fondements théoriques des scores IAT 315<br />
« Noirs <strong>–</strong> Agréable » est du même ordre de grandeur que l’association<br />
« Noirs <strong>–</strong> Désagréable ») ; b) ou s’il avait une attitude neutre envers les<br />
Blancs (i.e., même intensité des associations « Blancs <strong>–</strong> Agréable » et<br />
« Blancs <strong>–</strong> Désagréable ») et une attitude négative vis-à-vis des Noirs (i.e.,<br />
association « Noirs <strong>–</strong> Désagréable » plus intense que l’association<br />
« Noirs <strong>–</strong> Agréable »). Pour trancher entre ces différentes interprétations,<br />
il faudrait connaître le niveau absolu de l’une des associations, ce qui n’est<br />
pas possible à l’intérieur du paradigme IAT, même si l’on essaie de<br />
contourner la difficulté en intégrant une catégorie supposée neutre. Les<br />
résultats obtenus dans cette perspective par Brendl, Markman et Messner<br />
(2001) montrent toute l’importance de cette relativité. Dans un premier<br />
temps, ces auteurs répliquent le résultat princeps de Greenwald et al.<br />
(1998) : les associations « Fleurs <strong>–</strong> Agréable » et « Insectes <strong>–</strong> Désagréable »<br />
donnent lieu en moyenne à des réponses plus rapides que les associations<br />
« Fleurs <strong>–</strong> Désagréable » et « Insectes <strong>–</strong> Agréable », ce qui est d’habitude<br />
interprété comme indiquant une attitude favorable vis-à-vis des fleurs et<br />
négative envers les insectes. Dans un second temps, les noms de fleurs ont<br />
été remplacés par des mots sans signification (catégorie « Pseudo-mots »),<br />
supposés affectivement neutres, le reste du matériel étant identique à<br />
celui de la première expérience. On observe alors que les associations<br />
« Insectes <strong>–</strong> Agréable » et « Pseudo-mots <strong>–</strong> Désagréable » donnent lieu à<br />
des réponses plus rapides que les associations « Insectes <strong>–</strong> Désagréable » et<br />
« Pseudo-mots <strong>–</strong> Agréable », ce qui, si l’on s’en tient à l’interprétation<br />
naïve, signifierait cette fois, qu’en général, les individus ont une attitude<br />
positive vis-à-vis des insectes et négative envers les pseudo-mots ! Cette<br />
étude illustre ainsi la relativité des mesures d’association révélées par<br />
l’IAT, et insiste donc sur le fait que l’appréciation d’un concept-cible est<br />
fortement dépendante de l’autre concept-cible utilisé. Ainsi, même<br />
lorsque l’application d’une méthode analytique afin d’évaluer une association<br />
absolue entre une seule cible et ses attributs semble séduisante, il<br />
est fortement déconseillé de calculer un effet IAT sur la base des temps de<br />
réponse aux exemplaires d’un seul concept-cible et de ses attributs (i.e.,<br />
soustraction des moyennes des temps de réponse à « Fleurs » et<br />
« Agréable » dans le premier bloc, de la moyenne des temps de réponse à<br />
« Fleurs » et « Désagréable » dans le deuxième bloc) (Nosek, Greenwald et<br />
Banaji, étude 1, 2005a).<br />
Néanmoins, le fait que l’IAT ne permettrait que la mesure d’associations<br />
relatives n’est pas forcément problématique. En fait, que cela pose problème<br />
ou non dépend avant tout de ce que l’on cherche à appréhender.<br />
Par exemple, si l’on recourt à un IAT « Fleurs/Insectes » dans le but de<br />
situer des sujets les uns par rapport aux autres selon leur attitude envers<br />
L’année psychologique, 2006, 106, 305-336
316 Christophe Blaison • Delphine Chassard • Jean-Luc Kop • Kamel Gana<br />
les fleurs, le problème de la mesure d’associations relatives se pose alors<br />
dans le sens où les différences de scores entre les sujets ne reflètent pas<br />
forcément leur différence d’attitude envers les fleurs (e.g. des sujets ayant<br />
la même attitude envers les fleurs peuvent obtenir des scores IAT<br />
« Fleurs/Insectes » différents et des sujets obtenant le même score IAT<br />
peuvent avoir des attitudes différentes envers les fleurs). Par contre, si<br />
l’on cherche à situer des sujets les uns par rapport aux autres selon leur<br />
préférence pour les fleurs ou les insectes, alors le problème de la mesure<br />
relative ne se pose plus, en ce sens que les différences de scores entre les<br />
sujets devraient refléter leur niveau de préférence pour les fleurs ou les<br />
insectes (e.g. un effet IAT négatif indique une préférence pour les insectes<br />
par rapport aux fleurs, un effet IAT nul indique une absence de préférence,<br />
un effet IAT positif indique une préférence pour les fleurs par<br />
rapport aux insectes ; et plus l’effet est élevé, en valeur absolue, plus la<br />
préférence est marquée).<br />
Deuxièmement, il n’est pas certain que ce soient toujours les associations<br />
entre concepts-cibles et concepts-attributs qui soient pertinentes dans<br />
l’effet IAT, alors que c’est sur celles-ci que repose l’interprétation naïve.<br />
Dans la plupart des applications habituelles, la valence des concepts-cibles<br />
est confondue avec la valence des exemplaires qui les représentent (dans<br />
un IAT « Fleurs vs. Insectes », tous les noms de fleurs utilisés évoquent<br />
des représentations positives, tous les noms d’insectes utilisés évoquent<br />
des représentations négatives). De Houwer (2001) a essayé de rendre<br />
indépendantes la valence des cibles et celle de leurs exemplaires. Ainsi,<br />
dans un IAT « Anglais vs. Étrangers » réalisé en Grande-Bretagne, les<br />
exemplaires de chaque concept-cible sont pour moitié des personnes<br />
appréciées et, pour moitié, des personnes supposées détestées (e.g., respectivement<br />
« Ghandi » et « Hitler » pour la cible « Étrangers »). Les<br />
résultats obtenus semblent indiquer que les concepts-cibles priment sur<br />
les exemplaires, c’est-à-dire que l’on observe bien un effet IAT interprété<br />
comme une préférence envers l’endogroupe. Mais ce n’est pas toujours le<br />
cas : dans certaines situations, la valence des exemplaires peut contribuer<br />
à moduler l’effet IAT (Mitchell, Nosek et Banaji, 2003b), voire à l’expliquer<br />
totalement lorsque les concepts-cibles n’ont pas de valence marquée<br />
(De Houwer, 2001). L’effet IAT serait donc non seulement relatif aux<br />
concepts-cibles utilisés, mais aussi aux exemplaires choisis pour les représenter.<br />
Cette question étant néanmoins bien traitée dans la littérature, il<br />
est possible d’éviter les écueils d’interprétation qui lui sont liés pour peu<br />
que l’on respecte certaines règles établies de choix d’exemplaires. On peut<br />
trouver une belle synthèse méthodologique concernant le rationnel de ce<br />
choix dans Nosek, Greenwald et Banaji (2005b).<br />
L’année psychologique, 2006, 106, 305-336
Validité et fondements théoriques des scores IAT 317<br />
Troisièmement, les différences de temps de réponse mesurés aux deux<br />
blocs-tests de l’IAT pourraient refléter davantage la fréquence avec<br />
laquelle les sujets sont confrontés aux associations rencontrées dans leur<br />
environnement plutôt que l’attitude individuelle que l’on infère souvent.<br />
Si l’on suit, par exemple, le raisonnement de Karpinski et Hilton (2001),<br />
on peut considérer en effet que l’on a davantage d’occasions d’établir des<br />
associations stéréotypées « Blancs <strong>–</strong> Agréable » et « Noirs <strong>–</strong> Désagréable »<br />
que l’inverse (dans la culture américaine tout du moins). La familiarisation<br />
avec ces associations permettrait de traiter plus rapidement le bloc<br />
dans lequel elles sont présentées et l’on n’aurait alors nul besoin d’invoquer<br />
une quelconque attitude pour rendre compte des différences<br />
constatées. Certains scores d’attitude IAT sont compatibles avec cette<br />
hypothèse, notamment ceux qui montrent que les fumeurs ont une attitude<br />
aussi négative envers le tabac que les non-fumeurs (Swanson et al.,<br />
2001), ou bien qu’approximativement la moitié des Noirs américains ont<br />
une attitude plus positive vis-à-vis des Blancs que vis-à-vis des Noirs<br />
(Nosek et al., 2002b ; Banaji, 2001). En substance, l’idée qu’avancent Karpinski<br />
et Hilton (2001) ainsi que d’autres comme Olson et Fazio (2004),<br />
est que les associations « culturelles » ne nous appartiennent pas, et<br />
qu’elles parasitent de ce fait l’évaluation IAT des attitudes personnelles.<br />
Mais, avec Nosek et Hansen (2004), on pourrait réviser nos conceptions<br />
habituelles en considérant les attitudes automatiques (i.e., les attitudes<br />
telles qu’évaluées par l’IAT) comme des construits multidimensionnels<br />
dont l’une des nombreuses facettes serait forgée par un conditionnement<br />
culturel. Ce qui compterait alors, ce ne serait pas tant l’origine de l’attitude<br />
considérée, mais sa disponibilité, son accessibilité et son<br />
applicabilité dans un certain contexte (Nosek et Hansen, 2004).<br />
Quatrièmement, une autre explication de l’effet IAT met l’accent sur<br />
l’intervention de mécanismes de contrôle exécutif dont certains effets sur<br />
les temps de réponse seraient indépendants de la force d’association entre<br />
concepts et fausseraient par là l’interprétation des scores IAT (Mierke et<br />
Klauer, 2001, 2003 ; Klauer et Mierke, 2005). Comme le rappellent<br />
McFarland et Crouch (2002), on peut s’étonner que dès la première présentation<br />
de l’IAT (Greenwald et al., 1998), les auteurs trouvent une<br />
corrélation anormalement élevée (r = .58) entre les scores d’un IAT<br />
portant sur les concepts-cibles « Fleurs vs. Insectes » et ceux d’un IAT<br />
portant sur les concepts-cibles « Instruments de musique vs. Armes » (les<br />
attributs étant « Agréable » et « Désagréable » dans les deux cas) : l’attitude<br />
envers les fleurs serait ainsi assez fortement liée à l’attitude envers les<br />
instruments de musique. Obtenant des résultats similaires avec d’autres<br />
cibles dont on s’attend à ce qu’elles génèrent des attitudes indépendantes<br />
L’année psychologique, 2006, 106, 305-336
318 Christophe Blaison • Delphine Chassard • Jean-Luc Kop • Kamel Gana<br />
les unes des autres, McFarland et Crouch (2002) concluent alors que ces<br />
corrélations reflètent un effet de méthode qu’ils attribuent à la plus ou<br />
moins grande facilité avec laquelle les sujets sont capables de traiter le<br />
bloc-test dit incompatible, c’est-à-dire celui qui repose sur les associations<br />
les moins évidentes pour les sujets (et qui entraîne donc des temps de<br />
réponse en général plus longs). Mierke et Klauer (2001, 2003) proposent<br />
une explication cognitive élégante de cet effet faisant intervenir le coût de<br />
l’alternance entre deux tâches (“task switch cost”). Selon ces auteurs,<br />
confrontés au bloc compatible de l’IAT (celui dans lequel les associations<br />
sont les plus évidentes pour les sujets), les sujets pourraient simplifier la<br />
consigne qui leur demande de classer des stimuli soit en fonction des<br />
concepts-cibles (e.g., « Fleurs » vs. « Insectes »), soit en fonction des<br />
concepts-attributs (e.g., « Agréable » vs. « Désagréable »). Ainsi suffirait-il,<br />
dans le bloc où sont associés « Fleurs » et « Agréable » d’une part, et<br />
« Insectes » et « Désagréable » d’autre part, de ne classer qu’en fonction<br />
d’une seule dichotomie : « Agréable » vs. « Désagréable ». Cette simplification<br />
de deux tâches en une n’est plus possible dans le bloc incompatible<br />
(associations « Fleurs <strong>–</strong> Désagréable » et « Insectes <strong>–</strong> Agréable ») où la<br />
sélection de la réponse appropriée ne peut se faire qu’en fonction des<br />
deux dichotomies indiquées dans la consigne (i.e., « Fleurs » vs.<br />
« Insectes » et « Agréable » vs. « Désagréable »). Par exemple, lors du<br />
passage d’un exemplaire attribut à un exemplaire cible, le sujet doit<br />
inhiber la tendance de réponse maintenant non pertinente (classer selon<br />
la dichotomie « Agréable » vs. « Désagréable ») pour activer le schéma de<br />
réponse maintenant pertinent (classer selon la catégorie sémantique<br />
« Fleur » vs. « Insecte »). Cette alternance entre deux tâches entraînerait<br />
un coût cognitif supplémentaire dont l’importance serait propre à chaque<br />
individu et ce, quels que soient les concepts-cibles ou attributs à classer.<br />
C’est ici que s’infiltrerait une part de variabilité interindividuelle non<br />
désirée car indépendante de la force d’association entre concepts. Afin<br />
d’appuyer leur théorie, Mierke et Klauer (2001) rapportent les résultats<br />
d’études expérimentales montrant notamment que l’effet IAT diminue<br />
lorsqu’on fournit aux sujets, avant chaque essai, des indices permettant de<br />
diminuer le coût de l’alternance entre les tâches (cf. aussi l’étude de Dasgupta,<br />
McGhee, Greenwald et Banaji (2000) établissant que l’effet IAT est<br />
plus faible lorsqu’il s’agit de classer des photos que lorsqu’il s’agit de<br />
classer des noms, le premier classement étant jugé cognitivement moins<br />
complexe que le second). D’autres résultats semblent, eux aussi, apporter<br />
quelque crédit à cette hypothèse. Ainsi, Chee, Sriram, Soon et Lee (2000)<br />
observent, par IRMf, une activation des centres neuronaux impliqués<br />
dans l’inhibition lorsque des sujets réalisent un IAT ; Hummert et al.<br />
L’année psychologique, 2006, 106, 305-336
Validité et fondements théoriques des scores IAT 319<br />
(2002) parviennent à faire disparaître ou à atténuer certaines différences<br />
entre groupes d’âge lorsque la vitesse globale de traitement de l’information<br />
des sujets est contrôlée. Dans une perspective quelque peu différente,<br />
les observations mettant en évidence le rôle de l’apprentissage dans l’effet<br />
IAT peuvent aussi être lues à l’aune de l’hypothèse de Mierke et Klauer<br />
(2001). Ainsi, des études montrent que l’effet IAT est plus faible : lors<br />
d’une seconde passation comparativement à la première (Steffens et<br />
Buchner, 2003) ; quand on le calcule sur la seconde partie des items des<br />
blocs-tests par rapport au même calcul sur la première moitié des items<br />
(Marsh, Johnson et Scott-Sheldon, 2001) ; lorsque le bloc incompatible<br />
précède le bloc compatible (Greenwald et Nosek, 2001)(4). La présence<br />
de variabilité systématique de méthode dans les scores produits par l’IAT<br />
est donc bien établie. Ce pourrait être un coup sérieux porté à la validité<br />
des scores IAT si l’on n’avait pas récemment découvert une parade à ce<br />
problème. Signalons d’abord qu’il existe deux manières « canoniques » de<br />
calculer l’effet IAT : l’algorithme dit « amélioré » apparu en 2003<br />
(Greenwald et al., 2003) ; l’algorithme dit « conventionnel » (Greenwald<br />
et al., 1998), considéré comme dépassé. Une des particularités de l’algorithme<br />
amélioré est de calculer l’effet IAT en unité d’écart-type des temps<br />
de réponse sur l’ensemble des deux blocs qui composent l’IAT. Mierke et<br />
Klauer (2003) ont montré que parce qu’il prenait en compte la variabilité<br />
intraindividuelle des temps de réponse, le nouvel algorithme contrôle en<br />
fait la variabilité interindividuelle de flexibilité cognitive dont provient la<br />
part de variance systématique de méthode des scores IAT. Pour cette<br />
raison, et parmi d’autres (cf. Greenwald et al., 2003), il est fortement<br />
conseillé d’utiliser maintenant l’algorithme amélioré pour tout calcul<br />
d’effet IAT.<br />
Cinquièmement, en raison de la relation asymétrique entre une association<br />
et une attitude, il n’est pas toujours certain que les associations<br />
observées dans les IAT d’attitudes renvoient aux attitudes correspondantes.<br />
Pour Fiedler, Messner et Bluemke (2005)(5), le fait de définir une<br />
attitude comme une association entre un objet donné et une valence<br />
(positive ou négative) (Fazio, 1986 ; Greenwald et al., 2002) ne doit pas<br />
faire oublier qu’il n’y a aucune raison de postuler, comme on le fait habituellement,<br />
qu’il existe une relation symétrique entre ces deux concepts :<br />
si l’on peut effectivement modéliser une attitude par l’association entre<br />
un objet donné et une valence, toute association entre un objet donné et<br />
une valence observée dans un IAT n’est pas forcément le reflet d’une attitude.<br />
Il suffit pour cela que les sujets utilisent d’autres critères de<br />
classification que ceux indiqués par l’expérimentateur. Comme illustration<br />
un peu extrême, prenons l’exemple de De Houwer, Geldof et De<br />
L’année psychologique, 2006, 106, 305-336
320 Christophe Blaison • Delphine Chassard • Jean-Luc Kop • Kamel Gana<br />
Bruycker (2005) qui montre que les associations « Pizzas <strong>–</strong> Pièces de<br />
monnaie » et « Serpents <strong>–</strong> Rivières » donnent lieu à des réponses plus<br />
rapides que les associations « Pizzas <strong>–</strong> Rivières » et « Serpents <strong>–</strong> Pièces de<br />
monnaie ». Dans la première situation et afin de simplifier la tâche, les<br />
sujets utilisent probablement la similarité de forme entre les concepts,<br />
même si cette caractéristique n’a jamais été évoquée dans les consignes.<br />
D’autres caractéristiques non pertinentes du point de vue du chercheur<br />
peuvent être utilisées par les sujets. Par exemple, Rothermund et Wentura<br />
(2004) expliquent la relative facilité des associations « Insectes <strong>–</strong><br />
Agréable » et « Pseudo-mots <strong>–</strong> Désagréable » décrite supra par un modèle<br />
de saillance figure-fond. Selon ce dernier, les pseudo-mots (du fait de leur<br />
caractère étrange) et les attributs négatifs (e.g., « Désagréable ») (parce<br />
que les stimuli négatifs attirent davantage l’attention que les stimuli positifs,<br />
cf. Peeters, 1992) constituent des éléments saillants par rapport au<br />
fond constitué des attributs positifs et des exemplaires renvoyant à<br />
« Insectes ». Les associations peuvent se former ici suivant le degré de<br />
saillance du matériel à classer. D’où le fait que l’on observe une « attitude<br />
» favorable envers les insectes. En revanche, dans un IAT plus<br />
traditionnel (« Fleurs » vs. « Insectes » et « Agréable » vs. « Désagréable »),<br />
la catégorie « Désagréable » reste saillante par rapport à la catégorie<br />
« Agréable », mais cette fois-ci, la catégorie « Insectes » est plus saillante<br />
que la catégorie « Fleurs » (en raison de l’asymétrie entre concepts négatifs<br />
et positifs). L’association « Insectes <strong>–</strong> Désagréable » est dès lors<br />
facilitée, et on observe une « attitude » défavorable vis-à-vis des insectes.<br />
La « référence à soi » constituera un dernier exemple de critère de classification<br />
non pertinent du point de vue de l’expérimentateur. Dans un IAT<br />
« Blancs » vs. « Noirs » et « Agréable » vs. « Désagréable », un Blanc ayant<br />
une bonne estime de lui-même peut réduire la difficulté de la tâche en<br />
utilisant le fait que les stimuli de personnes blanches font référence à soi<br />
(car c’est une de ses caractéristiques propres) tout comme les stimuli de la<br />
caractéristique « Agréable » si elle possède une estime de soi élevée. Pour<br />
cette personne, l’association « Blancs <strong>–</strong> Agréable » va donner lieu à des<br />
réponses plus rapides, qui risquent d’être interprétées, à tort, comme un<br />
indicateur d’attitude favorable envers les Blancs et défavorable envers les<br />
Noirs.<br />
En fait, n’importe quelle ressemblance suscitée par des caractéristiques<br />
communes non pertinentes du point de vue du chercheur mais néanmoins<br />
utilisée par un sujet donné pour se faciliter la tâche de<br />
classification, peut provoquer des effets IAT. On peut alors réinterpréter<br />
le paradigme comme une mesure générale de similarité entre catégories<br />
(De Houwer et al., 2005). Le modèle de la redondance de Fiedler et al.<br />
L’année psychologique, 2006, 106, 305-336
Validité et fondements théoriques des scores IAT 321<br />
(2003) tente d’en formuler les principes. Dans le bloc compatible, les<br />
catégories associées à la même touche de réponse partagent un maximum<br />
de caractéristiques, les catégories associées à des touches différentes n’ont<br />
que peu ou pas de caractéristiques communes : dans cette situation, il n’y<br />
a donc guère de raison de confondre les touches de réponse. Dans le bloc<br />
incompatible en revanche, les catégories associées à des touches différentes<br />
ont en commun une ou plusieurs caractéristiques, les deux touches<br />
de réponse ont par conséquent tendance à être psychologiquement<br />
confondues. Dans ce modèle, l’interprétation traditionnelle de l’effet IAT<br />
est appropriée quand, du point de vue du chercheur, la distance psychologique<br />
entre les touches de réponse est uniquement fonction des<br />
associations entre les caractéristiques pertinentes des attributs et des<br />
cibles ; elle devient inappropriée quand la distance psychologique est due<br />
à des redondances entre caractéristiques non pertinentes des attributs et<br />
des cibles.<br />
3.5. Des alternatives<br />
Afin de remédier à certaines des limitations venant d’être évoquées, des<br />
instruments concurrents ou plutôt complémentaires à l’IAT sont apparus.<br />
Dans ce qui suit, nous mentionnerons uniquement le GNAT (Go/No-go<br />
Association Task ; Nosek et Banaji, 2001), l’EAST (Extrinsic Affective<br />
Simon Task ; De Houwer, 2003) et le SCAT (Single Category Association<br />
Test ; Karpinski & Steinman, 2006), car ils nous semblent les plus<br />
prometteurs.<br />
Le GNAT résout le problème de la mesure relative car il permet de<br />
mesurer la force d’association entre un seul concept-cible et son attribut.<br />
La tâche du sujet consiste à discriminer entre les exemplaires d’un<br />
concept-cible (e.g., « Fruit ») ou d’un attribut (e.g., « Agréable ») et des<br />
distracteurs. Dans le premier cas (exemplaire-cible ou exemplaireattribut),<br />
le sujet appuie sur une touche prédéterminée (« Go ») alors que<br />
dans le second (distracteurs), aucune action n’est requise (« No Go »).<br />
Tout comme dans l’IAT, la procédure de mesure s’effectue en deux<br />
phases se distinguant par le changement d’attribut : par exemple, pour<br />
mesurer une attitude, on utilise un attribut positif dans une phase (e.g.,<br />
« Agréable ») et un attribut négatif dans la seconde phase (e.g., « Désagréable<br />
»). Le concept-cible est donc associé soit à un attribut positif, soit<br />
à un attribut négatif. De la différence de performance entre ces deux<br />
phases, on en infère une attitude plus ou moins positive vis-à-vis du<br />
concept-cible. Bien que les qualités psychométriques du GNAT soient<br />
comparables à celles de l’IAT, les deux mesures corrèlent très faiblement<br />
L’année psychologique, 2006, 106, 305-336
322 Christophe Blaison • Delphine Chassard • Jean-Luc Kop • Kamel Gana<br />
ensemble (Nosek et Banaji, 2001) ; et les seules corrélations avec une<br />
mesure explicite rapportées, à notre connaissance, dans la littérature sont<br />
très faibles à inexistantes (Nosek et Banaji, 2001). Mais il est vrai que très<br />
peu d’études ont utilisé ce paradigme jusqu’à présent (pour de rares<br />
exceptions, cf. Blair, Ma et Lenton, 2001 ; Mitchell, et al., 2003).<br />
L’EAST (De Houwer, 2003) élimine lui aussi le problème de la mesure<br />
relative ; il évite, en plus, la comparaison entre deux blocs reposant sur<br />
des tâches différentes. Tout comme dans l’IAT, il s’agit de classer des stimuli,<br />
mais le critère de classification est ici soit la signification<br />
sémantique (pour les concepts-attributs), soit la couleur (pour le<br />
concept-cible). Concrètement, des exemplaires-attributs sont présentés<br />
dans une couleur blanche, le sujet devant indiquer s’ils relèvent de la catégorie<br />
« Agréable » ou de la catégorie « Désagréable » en appuyant sur la<br />
touche correspondante. Le concept-cible est, quant à lui, présenté soit en<br />
bleu, soit en vert, le sujet devant discriminer la couleur en utilisant les<br />
mêmes touches de réponse que celles utilisées pour discriminer les exemplaires-attributs.<br />
Même si la signification des concepts-cibles peut être<br />
ignorée pour réussir la tâche, on suppose que le sujet sera plus rapide<br />
lorsque la valence <strong>–</strong> automatiquement activée <strong>–</strong> de la cible et sa couleur<br />
correspondent à la même touche de réponse ; et qu’il sera plus lent<br />
lorsque la valence de la cible et sa couleur relèvent de deux touches différentes.<br />
Ainsi, si les catégories « Agréable » et « Couleur bleue » sont<br />
associées à la même touche de réponse alors que les catégories « Désagréable<br />
» et « Couleur verte » sont associées à l’autre touche de réponse,<br />
un sujet qui a une attitude favorable envers les fruits devrait répondre<br />
plus rapidement lorsque ceux-ci sont présentés en bleu que lorsqu’ils sont<br />
présentés en vert, ce qui est vérifié empiriquement (De Houwer, 2003).<br />
L’EAST permet donc d’estimer des associations absolues (i.e., non relatives)<br />
en une seule phase ; il présente aussi l’avantage de permettre la<br />
mesure simultanée de plusieurs attitudes puisqu’il est possible de présenter<br />
des exemplaires de plusieurs concepts-cibles, ceux-ci ne devant être<br />
discriminés que par rapport à leur couleur. Malheureusement, malgré le<br />
caractère ingénieux de la procédure, les qualités psychométriques du<br />
paradigme sont décevantes (De Houwer, 2003) et bien inférieures à celles<br />
de l’IAT, ce qui s’explique sans doute en partie par des écarts trop faibles<br />
de performances entre les deux conditions expérimentales (exemplairescibles<br />
d’une couleur vs. de l’autre couleur), et donc à des tailles d’effet<br />
insuffisantes pour assurer des différences interindividuelles stables.<br />
L’interprétation des effets mesurés dans ce paradigme étant toutefois<br />
moins équivoque que celle des effets IAT, on peut espérer que des aménagements<br />
internes puissent remédier à ces difficultés psychométriques.<br />
L’année psychologique, 2006, 106, 305-336
Validité et fondements théoriques des scores IAT 323<br />
Le SCAT (Karpinski & Steinman, 2006) est le dernier né de ces trois instruments<br />
alternatifs. Il permet lui aussi de mesurer la force d’association<br />
absolue entre un concept-cible et son attribut. Il ressemble beaucoup à<br />
l’IAT dans sa mise en œuvre : grâce à deux touches, le sujet doit classer à<br />
droite ou à gauche des stimuli appartenant à des catégories différentes.<br />
Mais au lieu d’être quatre, ces catégories ne sont que trois : deux catégories<br />
d’attributs opposés (e.g., « Agréable » vs. « Désagréable ») et une seule<br />
catégorie cible (e.g., « Fruit »). Ainsi, dans le premier bloc-test les sujets<br />
doivent classer par exemple les stimuli relevant des catégories « Agréable »<br />
et « Fruit » à gauche et ceux de la catégorie « Désagréable » à droite ; dans<br />
le deuxième bloc-test, ils doivent cette fois classer les exemplaires de la<br />
catégorie « Agréable » à gauche et ceux des catégories « Désagréable » et<br />
« Fruit » à droite. Dans les trois applications rapportées par Karpinski<br />
(2004), les consistances internes sont satisfaisantes et du même ordre de<br />
grandeur que celles que l’on observe habituellement avec l’IAT ; les corrélations<br />
avec des mesures directes sont sensiblement supérieures à celles<br />
impliquant l’IAT, résultat que l’auteur attribue au fait que son instrument<br />
mesure des associations absolues alors que l’IAT ne mesure que des associations<br />
relatives. Cette caractéristique fait du SCAT un paradigme<br />
prometteur pour peu que l’on puisse expliquer certains résultats étonnants,<br />
comme l’absence totale de corrélation entre un SCAT d’estime de<br />
soi et un IAT d’estime de soi (Karpinski & Steinman, 2006).<br />
4. LES RELATIONS ENTRE MESURES DIRECTES<br />
ET MESURES INDIRECTES<br />
L’étude de validité des mesures dérivées des différents paradigmes de<br />
mesures indirectes en général et de l’IAT en particulier a largement fait<br />
référence à la mise en relation entre mesures directes et indirectes du<br />
même construit (Nosek, 2004 ; Hofman et al., 2005). Mais pour que les<br />
résultats de ces études puissent servir au processus de validation, encore<br />
faut-il que l’on ait des hypothèses précises quant à la nature des relations<br />
entre ces mesures. Or, s’il existe un relatif consensus sur le fait que les<br />
relations observées sont généralement faibles mais positives, l’interprétation<br />
de cette dissociation reste l’objet de débats : s’explique-t-elle<br />
simplement par les problèmes théoriques et méthodologiques posés par<br />
l’IAT ou bien par les biais inhérents aux mesures directes ? Renvoie-t-elle<br />
à l’existence de construits différents ? L’objectif de cette dernière partie est<br />
L’année psychologique, 2006, 106, 305-336
324 Christophe Blaison • Delphine Chassard • Jean-Luc Kop • Kamel Gana<br />
de détailler les arguments fournis en faveur des différentes explications<br />
proposées.<br />
Premièrement, la dissociation observée entre mesures directes et IAT peut<br />
s’expliquer par les problèmes méthodologiques et théoriques posés par<br />
l’IAT. Nous avons déjà fait référence au fait qu’il ne produit que des<br />
mesures d’associations relatives. Par exemple, un IAT d’estime de soi<br />
mesurerait en fait la force d’association entre les concepts « Moi <strong>–</strong><br />
Agréable » comparativement à la force d’association entre les concepts<br />
« Pas moi <strong>–</strong> Agréable » et non la force d’association « Moi <strong>–</strong> Agréable » en<br />
elle-même (Karpinski & Steinman, 2006). Or, même si certains items des<br />
mesures directes d’estime de soi font référence à autrui, elles ne sont pas<br />
entièrement construites sur ce modèle, ce qui pourrait participer à la<br />
faible relation observée entre mesures directe et IAT. De plus, le fait que<br />
la tâche IAT se décompose en deux blocs indépendants introduit un<br />
certain nombre de biais de mesure, qui, alliés à ceux cités plus haut, contribuent<br />
sans doute aussi au manque de convergence entre mesures<br />
directes et IAT. Ces explications ne sont toutefois pas entièrement convaincantes<br />
puisque avec les nouveaux paradigmes censés corriger certains<br />
des défauts de l’IAT (GNAT, EAST, SCAT), les corrélations entre mesures<br />
directes et indirectes restent très inférieures à ce que l’on pourrait<br />
attendre. Il faut donc chercher des explications complémentaires.<br />
Deuxièmement, la dissociation observée entre mesures directes et IAT<br />
pourrait être imputée à certains biais propres aux mesures directes :<br />
l’auto-présentation et les limites des capacités introspectives des sujets.<br />
Alors que les mesures directes sont connues pour leur sensibilité aux stratégies<br />
de présentation adoptées par les sujets (Kop et Chassard, 2005),<br />
l’IAT n’en serait pas affecté (Greenwald et al., 2002). Néanmoins, les<br />
résultats des études portant sur le rôle modérateur de l’auto-présentation<br />
dans la relation entre mesures directe et IAT sont contradictoires. Alors<br />
que Nosek (2004) trouve effectivement que plus l’auto-présentation est<br />
élevée, plus la relation entre mesures directes et IAT est faible et que<br />
Banse (2004) montre que l’auto-présentation modère la relation entre<br />
mesures directes et IAT, Nosek et Banaji (2002) et Egloff et Schmukle<br />
(2003) ne répliquent pas ces résultats. Il semble en outre peu probable<br />
que l’auto-présentation puisse expliquer entièrement les dissociations<br />
observées. Si elle devait rendre compte, par exemple, de l’absence de corrélation<br />
(Greenwald et al., 1998) entre un IAT et une mesure directe<br />
censés appréhender l’attitude envers les fleurs, il faudrait alors faire<br />
l’hypothèse que ce type d’attitude est particulièrement sensible à l’autoprésentation<br />
! Enfin, les limites des capacités introspectives des sujets,<br />
plus difficiles à appréhender dans des études empiriques, ont fait l’objet<br />
L’année psychologique, 2006, 106, 305-336
Validité et fondements théoriques des scores IAT 325<br />
de moins de discussions mais continuent à être invoquées comme une<br />
cause possible des dissociations entre mesures directes et indirectes. Toutefois,<br />
comme le reconnaissent Greenwald et al. (2002), il est souvent<br />
quasi impossible de faire la distinction entre ces deux facteurs explicatifs<br />
potentiels : les domaines pour lesquels les sujets n’ont que peu de raisons<br />
à chercher à dissimuler leur attitude sont aussi généralement ceux qui<br />
sont les plus facilement accessibles à l’introspection.<br />
Troisièmement, la dissociation entre mesures directes et IAT peut s’expliquer<br />
par des éléments théoriques relevant de la cognition implicite, grâce<br />
notamment à certaines réflexions récentes relatives aux attitudes. Deux<br />
grandes classes de modèles peuvent être distinguées selon que l’on considère<br />
que la mesure directe et la mesure indirecte appréhendent chacune<br />
un construit différent ou selon que l’on suppose qu’elles sont deux<br />
manières différentes d’appréhender le même construit. Nous commencerons<br />
par évoquer l’hypothèse de l’existence de deux construits différents.<br />
En postulant l’existence de deux construits, les partisans de cette<br />
approche supposent que chacun des construits possède sa propre représentation<br />
en mémoire (Greenwald et Banaji, 1995 ; Wilson, Lindsley et<br />
Schooler, 2000). Par exemple, le modèle des attitudes duelles (model of<br />
dual attitudes) développé par Wilson et al. (2000), distingue entre le<br />
construit d’« attitude explicite » (Ae) et celui d’« attitude implicite » (Ai)<br />
et repose sur les cinq hypothèses suivantes : a) Une Ae et une Ai envers un<br />
même objet peuvent coexister en mémoire ; b) Lorsque des attitudes<br />
duelles coexistent, Ai est activée automatiquement alors que Ae requiert<br />
davantage de ressources cognitives et de motivations pour être récupérée.<br />
Si les individus sont capables de récupérer Ae, celle-ci prend alors le pas<br />
sur Ai, de sorte que les sujets expriment Ae. Au contraire, si les individus<br />
n’ont ni les ressources ni la motivation nécessaires pour récupérer Ae, ils<br />
expriment Ai ; c) Même lorsque Ae est récupérée, Ai influence les<br />
réponses implicites, c’est-à-dire les réponses que les individus ne peuvent<br />
contrôler (e.g., comportements non-verbaux) ou qu’ils ne considèrent pas<br />
comme l’expression de leur attitude, et donc n’essaient pas de contrôler ;<br />
d) Les Ae changent relativement facilement, alors que les Ai, comme de<br />
vieilles habitudes, changent plus lentement ; e) Les attitudes duelles sont<br />
distinctes de l’ambivalence ainsi que des attitudes à composantes affective<br />
et cognitive contradictoires. En conséquence, plutôt que de faire l’expérience<br />
d’un état conflictuel subjectif, les individus expriment l’attitude la<br />
plus accessible (Wilson et al., 2000, p. 104).<br />
Wilson et al. (2000) distinguent quatre types d’attitudes duelles selon que<br />
l’on ait ou non conscience de posséder une attitude implicite Ai et selon<br />
que l’on ait besoin de capacités cognitives et de motivations particulières<br />
L’année psychologique, 2006, 106, 305-336
326 Christophe Blaison • Delphine Chassard • Jean-Luc Kop • Kamel Gana<br />
pour la remplacer par une attitude explicite Ae (cf. tableau II). Si l’on s’en<br />
tient à ce modèle, l’IAT permettrait plus particulièrement de mesurer des<br />
attitudes implicites que les individus seraient motivés à remplacer par<br />
leurs attitudes explicites, et ce qu’ils en aient conscience ou non (cf. cas de<br />
refoulement et de remplacement motivé). Mais que les individus aient<br />
conscience ou non de leurs attitudes implicites, qu’ils aient besoin ou non<br />
de ressources cognitives et de motivations particulières pour les remplacer,<br />
le modèle de Wilson et al. (2000) permet d’expliquer la<br />
dissociation entre mesures directe et indirecte par l’existence de deux<br />
construits de nature différente : un construit implicite qui se manifesterait<br />
systématiquement dans les mesures de type indirect, et un construit explicite<br />
qui s’exprimerait préférentiellement dans les mesures de type direct.<br />
Dans cette perspective, il est essentiel de mieux connaître les facteurs pouvant<br />
modérer la relation entre attitudes explicites et attitudes implicites. Nosek<br />
(2004) s’est ainsi lancé dans une entreprise de grande ampleur visant à<br />
repérer les modérateurs pertinents pour 57 objets d’attitude différents. Les<br />
corrélations entre mesures directes et indirectes (IAT) varient entre -0.05 et<br />
0.70 selon l’objet d’attitude et une part non négligeable de la variabilité de ces<br />
corrélations (39 %) peut effectivement être expliquée par les quatre modéra-<br />
Ai est-elle<br />
accessible<br />
à la<br />
conscience ?<br />
A-t-on<br />
besoin de<br />
ressources<br />
cognitives<br />
et de<br />
motivations<br />
particulières<br />
pour<br />
remplacer Ai<br />
par Ae ?<br />
Tableau II. Quatre types d’attitudes duelles<br />
(d’après Wilson et al., 2000, p. 105)<br />
Table II. Four types of dual attitudes (cf. Wilson et al ., 2000, p. 105)<br />
Refoulement<br />
L’année psychologique, 2006, 106, 305-336<br />
Systèmes<br />
indépendants<br />
Remplacement<br />
motivé<br />
NON NON OUI<br />
Remplacement<br />
automatique<br />
Sous certaines<br />
conditions<br />
OUI NON OUI NON<br />
Note : Ai = Attitude implicite ; Ae = Attitude explicite
Validité et fondements théoriques des scores IAT 327<br />
teurs retenus dans l’étude : auto-présentation (i.e., motivation à altérer ses<br />
réponses à des fins personnelles ou sociales) ; intensité de l’attitude ; dimensionnalité<br />
de l’attitude (i.e., degré de bipolarité) ; différence perçue entre son<br />
attitude personnelle et l’attitude moyenne. Ces résultats, prometteurs, méritent<br />
néanmoins d’être affinés et répliqués.<br />
Une seconde classe de modèles théoriques considère au contraire qu’il<br />
n’existe qu’un seul construit, supposé se différencier par le type de processus<br />
de traitement de l’information en jeu lors de sa mesure (Greenwald et<br />
Banaji, 1995 ; Dambrun et Guimond, 2003 ; Fazio et Olson, 2003). Ainsi,<br />
une dissociation entre mesures directes et IAT peut s’expliquer par le fait<br />
qu’une mesure indirecte appréhenderait un construit activé automatiquement<br />
sous l’effet de processus spontanés de traitement de l’information alors<br />
qu’une mesure directe appréhenderait ce même construit après intervention<br />
de processus délibérés (i.e., contrôlés). Le modèle de Fazio et Towles-Schwen<br />
(1999, « MODE model of attitude-behavior processes ») censé rendre<br />
compte des relations entre attitude et comportement est, dans ce contexte,<br />
particulièrement pertinent. En effet, ces auteurs distinguent entre des processus<br />
de type spontané qui ne nécessiteraient ni effort conscient, ni<br />
intention, ni contrôle de la part des individus et des processus délibérés qui<br />
demanderaient un travail cognitif important (inspection de l’information<br />
disponible, analyse des caractéristiques positives et négatives, des coûts et des<br />
bénéfices…), ce qui suppose de pouvoir disposer à la fois de la motivation et<br />
de l’opportunité (i.e., ressources cognitives et temps) nécessaires pour que ce<br />
type de processus puisse se mettre en place (Fazio et Towles-Schwen, 1999 ;<br />
Koole, Dijksterhuis et Van Knippenberg, 2001). Les processus spontanés et<br />
délibérés seraient relativement indépendants les uns des autres, mais ils interagiraient<br />
afin de déterminer conjointement le comportement, la<br />
prédominance d’un type de processus sur l’autre serait alors fonction de la<br />
motivation et de l’opportunité. Ainsi, lorsque la motivation et l’opportunité<br />
sont faibles, ce sont les processus spontanés qui détermineraient en grande<br />
partie le comportement. Au contraire, si la motivation et l’opportunité sont<br />
élevées, les processus de type délibéré prendraient le pas sur les processus<br />
spontanés (Fazio et Towles-Schwen, 1999). Banse et al. (2001) ont obtenu<br />
des résultats compatibles avec ce modèle théorique dans une étude d’attitude<br />
envers l’homosexualité. En particulier, les sujets ayant des attitudes négatives<br />
spontanées (mesurées à l’aide d’un IAT) envers l’homosexualité et ayant peu<br />
de motivation à contrôler leurs réactions se caractérisent par une attitude<br />
homophobe prononcée à une mesure directe. En revanche, chez des sujets<br />
ayant un même niveau d’attitudes négatives spontanées, mais chez lesquels la<br />
motivation à contrôler leurs réactions est accentuée, cette homophobie dans<br />
les mesures directes est fortement réduite.<br />
L’année psychologique, 2006, 106, 305-336
328 Christophe Blaison • Delphine Chassard • Jean-Luc Kop • Kamel Gana<br />
L’année psychologique, 2006, 106, 305-336<br />
5. CONCLUSION<br />
L’apparition de l’IAT en 1998 a suscité un engouement dépassant largement<br />
le cercle restreint de la psychologie scientifique : articles de presse,<br />
émissions télévisées, sites Internet (https://implicit.harvard.edu/implicit/<br />
france/) ont donné à cet outil une notoriété inattendue. Il faut sans doute<br />
y voir une certaine fascination de la psychologie populaire pour la possibilité<br />
d’accéder au plus profond de l’âme humaine. Se présentant comme<br />
un instrument permettant de révéler des sentiments que l’on tente habituellement<br />
de dissimuler, voire des sentiments auxquels on n’a pas accès,<br />
l’IAT a tout naturellement fait écho à ce penchant. La communauté scientifique,<br />
elle non plus, n’a pas échappé à cet effet de mode, si l’on en croit<br />
le nombre considérable de publications consacrées à ce paradigme depuis<br />
cette date. Toutefois, au fur et à mesure des années, la fascination initiale<br />
a peu à peu cédé la place à des approches plus critiques, davantage<br />
conformes à l’esprit scientifique. Et l’on s’aperçoit, aujourd’hui, que le<br />
monde de l’IAT est un monde de paradoxes.<br />
Paradoxe de sa construction, tout d’abord. L’étude de la cognition sociale<br />
implicite nécessitait en effet de nouveaux outils et c’est bien dans ce cadre<br />
de référence théorique que s’inscrit la naissance de l’IAT. Mais au lieu de<br />
construire un instrument s’inspirant des théories de ce courant, les<br />
concepteurs de l’IAT ont privilégié une démarche empirique s’appuyant<br />
essentiellement sur un critère de maximisation de la consistance interne<br />
qui n’est qu’une condition nécessaire pour produire des mesures offrant<br />
des scores fidèles et valides et en aucun cas une condition suffisante.<br />
Paradoxe de son fonctionnement ensuite. L’analyse des processus en<br />
œuvre dans l’IAT conduit à différentes interprétations de la mesure<br />
obtenue, interprétations parfois très éloignées de celle que souhaiteraient<br />
ses concepteurs (une force d’association entre concepts reflétant, selon la<br />
nature des concepts pris en compte, une attitude, un stéréotype, une<br />
représentation de soi…). Comment toutefois expliquer que les mesures<br />
IAT offrent par ailleurs des gages de validité compatibles avec l’interprétation<br />
naïve, comme par exemple, des fidélités comparables à celles des<br />
scores des mesures directes et des corrélations avec des indicateurs<br />
comportementaux spontanés ou des indicateurs physiologiques ? Qui<br />
plus est, pourquoi des outils considérés comme étant « processuellement<br />
» plus purs que l’IAT (et donc moins équivoques quant à<br />
l’interprétation de la mesure résultante) donnent des résultats si décevants,<br />
là même où l’IAT affiche ses résultats les plus convaincants ?<br />
Paradoxe des études de validation des mesures IAT enfin, qui, à quelques<br />
exceptions près, s’appuient sur la mise en relation de mesures directes
Validité et fondements théoriques des scores IAT 329<br />
avec des mesures indirectes, alors que les premières sont accusées de<br />
maux que les secondes sont justement censées corriger. La signification<br />
donnée aux résultats obtenus dans cette perspective ne peut donner lieu<br />
qu’à des controverses difficiles à trancher, sauf à considérer comme<br />
Nosek et Smyth (2004), que les construits tels que mesurés par l’IAT sont<br />
théoriquement distincts de ceux mesurés par questionnaires. Par rapport<br />
aux scores recueillis à l’aide de questionnaires, il deviendrait alors plus<br />
intéressant d’explorer, à l’aide de plans de recherche différents, la valeur<br />
originale des scores produits par la famille de mesures dont l’IAT fait<br />
partie.<br />
Il faut avoir la modestie de reconnaître qu’aujourd’hui, alors que l’on<br />
continue d’avancer de manière remarquable (cf. Klauer et Mierke, 2005 ;<br />
Conrey, Sherman, Gawronski, Hugenberg et Groom, 2005), on ne maîtrise<br />
toujours pas complètement ce que mesurent les applications de<br />
l’IAT. L’article de Greenwald et al. (1998) reste néanmoins un révélateur :<br />
il a permis de décomplexer les chercheurs face à la possibilité de mesurer<br />
de manière fiable des construits inaccessibles aux mesures directes traditionnelles.<br />
Les imperfections de cet instrument de mesure relevées depuis<br />
ont eu en outre le mérite de stimuler la créativité des chercheurs dans différentes<br />
directions : étude des processus cognitifs en jeu dans des tâches<br />
de classification faisant intervenir des associations entre concepts, développement<br />
de modèles théoriques intégrant les construits implicites, mise<br />
au point de nouveaux paradigmes théoriquement mieux fondés.<br />
NOTES<br />
1. Même si l’on parle souvent de « mesure » ou d’« instrument » à propos<br />
de l’IAT, il serait plus correct de faire référence à un paradigme permettant<br />
de générer des instruments de mesure. Dans la suite du texte, afin de<br />
ne pas trop alourdir l’exposé, nous sacrifierons toutefois à l’usage en utilisant<br />
ces expressions.<br />
2. Conventionnellement, d = .20 : taille d’effet faible, d = .50 : taille d’effet<br />
moyenne et d = .80 : taille d’effet importante (Cohen, 1988).<br />
3. Il n’existe pas de consensus concernant la façon d’évaluer la consistance<br />
interne des scores produits par une adaptation particulière de l’IAT. Cette<br />
question est en outre très rarement débattue. Dans tous les articles l’évaluant,<br />
il est cependant une constante consistant à la calculer à partir d’un<br />
certain nombre de “sous-effets IAT” obtenus à partir d’autant de sousensembles<br />
de temps de réponse. Tout comme l’effet IAT principal, ils sont<br />
considérés comme reflétant la plus ou moins grande tendance à associer tel<br />
ou tel concept cible avec tel ou tel concept attribut. La consistance interne<br />
L’année psychologique, 2006, 106, 305-336
330 Christophe Blaison • Delphine Chassard • Jean-Luc Kop • Kamel Gana<br />
de ces sous-scores représente alors la consistance de cette tendance telle<br />
que révélée lors de la tâche IAT. Certains auteurs calculent deux souseffets<br />
IATs et les corrèlent (i.e., méthode split-half, ex., Marsh, Johnson et<br />
Scott-Sheldon, 2001 ; Greenwald et al., 2003), d’autres utilisent l’alpha de<br />
Cronbach soit à partir de deux sous-effet IAT (ex., Banse et al., 2001), soit<br />
à partir de quatre (ex., Asendorpf et al., 2002 ; Gawronski, 2002), soit<br />
encore à partir d’autant de sous-effets qu’il y a d’essais (i.e., essai 1 du<br />
deuxième bloc moins essai 1 du premier bloc, essai 2 du deuxième bloc<br />
moins essai 2 du premier bloc, etc. ; ex., Bosson et al., 2000 ; Egloff et Schmuckle,<br />
2004).<br />
4. Lorsque le bloc compatible précède le bloc incompatible, les associations<br />
du premier bloc correspondent à des associations connues nécessitant peu<br />
d’apprentissage (e.g., « Fleurs <strong>–</strong> Agréable »). Dans le bloc incompatible, il<br />
faut « désapprendre » ces associations et en apprendre de nouvelles, moins<br />
évidentes (e.g., « Fleurs <strong>–</strong> Désagréable »). La différence de vitesse entre les<br />
deux blocs est maximale. Or, lorsqu’on inverse les deux blocs, ce sont cette<br />
fois les associations du bloc incompatible qui sont nouvelles et nécessitent<br />
un apprentissage (e.g., « Fleurs <strong>–</strong> Désagréable »). À cela s’ajoute le fait que<br />
ces associations devront de surcroît être inhibées lors du second bloc. D’où<br />
le fait que dans cet ordre d’apparition des blocs, la différence de vitesse<br />
entre les deux blocs est minimale. C’est pourquoi, si l’on s’intéresse à l’effet<br />
IAT au niveau du groupe, il est généralement recommandé de contrebalancer<br />
les deux ordres de présentation (Greenwald et al., 1998). Par contre,<br />
il serait moins pertinent de le faire si l’on s’intéressait aux différences interindividuelles.<br />
Dans ce cas le fait de doubler le nombre d’essais<br />
d’entraînement entre les deux blocs tests éliminerait ou tout du moins<br />
réduirait l’effet de l’ordre de présentation des blocs pour un grand nombre<br />
d’IAT d’attitude (Nosek et al., 2005a).<br />
5. Même si Fiedler et al. (2005) évoquent plus volontiers le concept d’attitudes,<br />
leur critique peut être étendue aux autres types de concepts<br />
appréhendés par l’IAT (i.e. stéréotypes, estime de soi, concept de soi).<br />
Asendorpf, J.B., Banse, R. & Mucke,<br />
D. (2002). Double dissociation between<br />
implicit and explicit personality selfconcept:<br />
the case of shy behavior. Journal<br />
L’année psychologique, 2006, 106, 305-336<br />
BIBLIOGRAPHIE<br />
of Personality and Social Psychology, 83,<br />
380-393.<br />
Ashburn,-Nardo, L., Voils, C.I., & Monteith,<br />
M.J. (2001). Implicit associations as
Validité et fondements théoriques des scores IAT 331<br />
the seeds of intergroup bias: How easily do<br />
they take root? Journal of Personality and<br />
Social Psychology, 81, 789-799.<br />
Banaji, M.R. (2001). Implicit attitudes can<br />
be measured. In H.L. Roediger, III, J.S.<br />
Nairne, I. Neath, & A. Surprenant (Eds.),<br />
The nature of remembering: Essays in honor<br />
of Robert G. Crowder. Washington: American<br />
Psychological Association.<br />
Banse, R. (1999). Evaluation of self and significant<br />
others: Affective priming in close<br />
relationships. Journal of Social and Personal<br />
Relationships, 16, 803-821.<br />
Banse, R. (2004, July). Indirect measures of<br />
aggressiveness. Paper presented at the 12 th<br />
European Conference on Personality. Groningen:<br />
The Netherlands.<br />
Banse, R., Seise, J. & Zerbes, N. (2001). Implicit<br />
attitudes towards homosexuality :<br />
Reliability, validity, and controllability of<br />
the IAT. Zeitschrift für Experimentelle Psychologie,<br />
48, 145-160.<br />
Blair, I.V., Ma, J.E., & Lenton, A.P. (2001).<br />
Imagining stereotypes away: the moderation<br />
of implicit stereotypes through mental<br />
imagery. Journal of Personality and Social<br />
Psychology, 81, 828-841.<br />
Blaison, C. & Gana, K. (2004, July).<br />
Using the Implicit Association Test (IAT)<br />
to measure affectivity-trait versus state.<br />
Paper presented at the 12 th European<br />
Conference on Personality. Groningen:<br />
The Netherlands.<br />
Bosson, J.K., Swann, W.B., & Pennebaker,<br />
J.W. (2000). Stalking the perfect measure<br />
of implicit self-esteem: The blind men and<br />
the elephant revisited? Journal of Personality<br />
and Social Psychology, 79, 631-643.<br />
Brendl, C.M., Markman, A.B & Messner,<br />
C. (2001). How do indirect measures of<br />
evaluation work? Evaluating the inference<br />
of prejudice in the Implicit Association<br />
Test. Journal of Personality and Social Psychology,<br />
81, 760-773.<br />
Chassard, D., & Kop, J.-L. (2003). Des processus<br />
automatiques d’évaluation à la mesure<br />
des différences individuelles : l’essor<br />
des mesures indirectes. In A. Vom Hofe,<br />
H. Charvin, J.-L. Bernaud, D. & Guédon<br />
(Eds.), Psychologie différentielle : recherches<br />
et réflexions. Rennes, Presses Universitaires<br />
de Rennes.<br />
Chee, M., Sriram, N., Soon, C.H., & Lee,<br />
K.M. (2000). Dorsolateral prefrontal cortex<br />
and the implicit association of concepts<br />
and attributes. Neuroreport: For Rapid<br />
Communication of Neuroscience Research,<br />
11,135-140.<br />
Cohen, J. (1988). Statistical power analysis<br />
for the behavioral sciences. 2e ed. Hillsdale<br />
(NJ): Erlbaum.<br />
Conrey, F.R., Sherman, J.W.,<br />
Gawronski, B., Hugenberg, K. & Groom,<br />
C.J. (2005) Separating multiple processes<br />
in implicit social cognition: the Quad model<br />
of implicit task performance. Journal of<br />
Personality and Social Psychology, 89, 469-<br />
487.<br />
Cunningham, W.A., Preacher, K.J. & Banaji,<br />
M.R. (2001). Implicit attitude measures:<br />
Consistency, stability, and convergent<br />
validity. Psychological Science, 121, 163-<br />
170.<br />
Dambrun, M. & Guimond, S. (2003). Les<br />
mesures implicites et explicites des préjugés<br />
et leur relation : développements récents<br />
et perspectives théoriques. Les Cahiers<br />
Internationaux de Psychologie Sociale,<br />
57, 52-73.<br />
Dasgupta, N. & Greenwald, A.G. (2001).<br />
On the malleability of automatic attitudes:<br />
combatting automatic prejudice with images<br />
of admired and disliked individuals.<br />
Journal of Personality and Social Psychology,<br />
85, 800-814.<br />
Dasgupta, N., Greenwald, A.G. & Banaji,<br />
M.R. (2003). The first ontological challenge<br />
to the IAT: attitude or mere familiarity.<br />
Psychological Inquiry, 14, 238-243.<br />
Dasgupta, N., McGhee, D.E., Greenwald,<br />
A.G., & Banaji, M.R. (2000). Automatic<br />
preference for white americans: eliminating<br />
the familiarity explanation. Journal of<br />
Experimental Social Psychology, 36, 316-<br />
328.<br />
L’année psychologique, 2006, 106, 305-336
332 Christophe Blaison • Delphine Chassard • Jean-Luc Kop • Kamel Gana<br />
De Houwer, J. (2001). A structural and<br />
process analysis of the Implicit Association<br />
Test. Journal of Experimental Social Psychology,<br />
37, 443-451.<br />
De Houwer, J. (2002). The Implicit Association<br />
Test as a tool for studying dysfunctional<br />
associations in psychopathology:<br />
strength and limitations. Journal of Behavior<br />
Therapy and Experimental Psychiatry,<br />
33, 115-133.<br />
De Houwer, J. (2003). The Extrinsic Affective<br />
Simon Task. Experimental Psychology,<br />
50, 77-85.<br />
De Houwer, J., Geldof, T, & De Bruycker,<br />
E. (2005) The Implicit Assocation Test as a<br />
general measure of similarity. Canadian<br />
Journal of Experimental Psychology, 59, 228-<br />
239.<br />
De Jong, P.J. (2002). Implicit self-esteem<br />
and social anxiety: differential selffavouring<br />
effects in high and low anxious<br />
individuals. Behaviour Research and Therapy,<br />
40, 501-508.<br />
De Jong, P.J., Van Den Hout, M.A., Rietbroek,<br />
H &, Huijding, J. (2003). Dissociation<br />
between implicit and explicit attitudes<br />
toward phobic stimuli. Cognition and Emotion,<br />
17, 521-545.<br />
Devos, T., & Banaji, M.R. (2003). Implicit<br />
self and identity. Annals of the New York<br />
Academy of Sciences, 1001, 177-211.<br />
Egloff, B. & Schmukle, S.C. (2002). Predictive<br />
validity of an implicit association test<br />
for assessing anxiety. Journal of Personality<br />
and Social Psychology, 83, 1441-1455.<br />
Egloff, B. & Schmukle, S.C. (2003). Does<br />
social desirability moderate the relationship<br />
between implicit and explicit anxiety<br />
measures? Personality and Individual<br />
Differences, 34, 1-10.<br />
Fazio, R.H. (1986). How do attitudes guide<br />
behaviour? In R.M. Sorrentino & E.T. Higgins<br />
(Eds.), Handbook of motivation and cognition<br />
: Foundations of social behaviour.<br />
New York: Guilford Press.<br />
Fazio, R.H, & Olson, M.A. (2003). Implicit<br />
measures in social cognition research:<br />
L’année psychologique, 2006, 106, 305-336<br />
Their meaning and use. Annual Review of<br />
Psychology, 54, 297-327.<br />
Fazio, R.H., Sanbonmatsu, D.M., Powell,<br />
M.C. & Kardes, F.R. (1986). On the automatic<br />
activation of attitudes. Journal of Personality<br />
and Social Psychology, 50, 229-238.<br />
Fazio, R.H. & Towles-Schwen, T. (1999).<br />
The MODE model of attitude-behavior<br />
processes. In S. Chaiken & Y. Trope (Eds.),<br />
Dual-process theories in social psychology.<br />
New York, Guilford Press.<br />
Fazio, R.H., Williams, C.J. & Powell, M.C.<br />
(2000). Measuring associative strength: Category-item<br />
associations and their activation<br />
from memory. Political Psychology, 21,<br />
7-25.<br />
Fiedler, K., Messner, C. & Blümke, M.<br />
(2003). Unresolved problems with the “I”,<br />
the “A” and the “T”: Logical and psychometric<br />
critique of the implicit association<br />
test (IAT). Manuscrit non publié.<br />
Fiedler, K., Messner, C. & Blümke, M.<br />
(2005). Some psychometric problems with<br />
the “I”, the“A” ans the“T” of the implicit association<br />
test. Soumis à publication.<br />
Gawronski, B. (2002). What does the implicit<br />
association test measure ? A test of<br />
the convergent and discriminant validity of<br />
prejudice-related IATs. Experimental Psychology,<br />
49, 171-180.<br />
Gemar, M.C., Segal, Z.V., Sagrati, S. &<br />
Kennedy, S.J. (2001). Mood-induced changes<br />
on the Implicit Association test in recovered<br />
depressed patients. Journal of Abnormal<br />
Psychology, 110, 282-289.<br />
Greenwald, A.G, & Banaji, M.R. (1995).<br />
Implicit social cognition : Attitudes, selfesteem,<br />
and stereotypes. Psychological Review,<br />
102, 4-27.<br />
Greenwald, A.G., Banaji, M.R., Rudman,<br />
L.A., Farnham, S.D., Nosek, B.A. & Mellott,<br />
D.S. (2002). A unified theory of implicit<br />
attitudes, stereotypes, self-esteem,<br />
and self-concept. Psychological Review,<br />
109, 3-25.<br />
Greenwald, A.G., & Farnham, S.D. (2000).<br />
Using the implicit association test to<br />
measure self-esteem and self-concept. Jour-
Validité et fondements théoriques des scores IAT 333<br />
nal of Personality and Social Psychology, 79,<br />
1022-1038.<br />
Greenwald, A.G., McGhee, D.E. &<br />
Schwartz, J.L. (1998). Measuring individual<br />
differences in implicit cognition: The<br />
implicit association test. Journal of Personality<br />
and Social Psychology, 74, 1464-1480.<br />
Greenwald, A.G. & Nosek, B.A. (2001).<br />
Health of the Implicit Association Test at<br />
age 3. Zeitschrift für Experimentelle Psychologie,<br />
48, 85-93.<br />
Greenwald, A.G., Nosek, B.A., & Banaji,<br />
M.R. (2003). Understanding and using the<br />
Implicit Association Test: an improved algorithm.<br />
Journal of Personality and Social<br />
Psychology, 85, 197-216.<br />
Hofman, W., Gawronski, B., Gschwendner,<br />
T., Le, H., & Schmitt, M. (2005). A<br />
meta-analysis on the correlation between<br />
IAT and explicit self-report measures. Personality<br />
and Social Psychology Bulletin, 31,<br />
1369-1385.<br />
Hummert, M.L., Gartska, T.A., O’Brien, L.T.,<br />
Greenwald, A.G., & Mellott, D.S. (2002).<br />
Using the Implicit Association Test to<br />
measure age differences in implicit social cognition.<br />
Psychology and Aging, 17, 482-495.<br />
Jacoby, L.L., & Kelley, C.M. (1987). Unconscious<br />
influences of memory for a prior<br />
event. Personality and Social Behavior Bulletin,<br />
13, 314-336.<br />
Jacoby, L.L., Toth, J.P., & Yonelinas, A.P.<br />
(1993). Separating conscious and unconscious<br />
influences of memory: Measuring recollection.<br />
Journal of Experimental Psychology:<br />
General, 122, 139-154.<br />
Jelenec, P., & Steffens, M.C. (2002). Implicit<br />
attitude toward elderly women and<br />
men. Current Research in Social Psychology,<br />
7, 275-292.<br />
Karpinski, A. & Hilton, J.L. (2001). Attitudes<br />
and the implicit association test. Journal<br />
of Personality and Social Psychology, 81,<br />
774-788.<br />
Karpinski, A., & Steinman, R. B. (2006).<br />
The single category implicit association test<br />
as a measure of implicit social cognition.<br />
Journal of Personality and Social Psychology,<br />
91, 16-32.<br />
Kihlstrom, J.F., Barnhardt, T.M., & Tataryn,<br />
D.J. (1992). The psychological unconscious:<br />
Found, lost, and regained. American<br />
Psychologist, 47, 788-791.<br />
Kihlstrom, J.F., Mulvaney, S., Tobias, B.A,<br />
& Tobis, I.P. (2000). The emotional unconscious.<br />
In E. Eich, J.F. Kihlstrom, G.H.<br />
Bower, J.P. Forgas & P.M. Niedenthal<br />
(Eds.), Cognition and emotion. Oxford: Oxford<br />
University Press.<br />
Klauer, K.C., & Mierke, J. (2005). Task-set<br />
inertia, attitude accessibility, and compatibility-order<br />
effects: New evidence for a<br />
task-set switching account of the IAT effect.<br />
Personality and Social Psychology Bulletin,<br />
31, 208-217.<br />
Koole, S.L., Dijksterhuis, A., & Van Knippenberg,<br />
A. (2001). What’s in a name: Implicit<br />
self-esteem and the automatic self.<br />
Journal of Personality and Social Psychology,<br />
80, 669-685.<br />
Kop, J-L. & Chassard, D. (2005). La falsification<br />
des réponses dans l’évaluation de la<br />
personnalité : une solution du côté des mesures<br />
indirectes ? Psychologie du Travail et<br />
des Organisations, 11, 15-23.<br />
Marsh, K.L., Johnson, B.T., & Scott-<br />
Sheldon, L.A. (2001). Heart versus reason<br />
in condom use: implicit versus explicit<br />
attitudinal predictors of sexual behavior.<br />
Zeitschrift für Experimentelle Psychologie,<br />
48, 161-175.<br />
McFarland, S.G., & Crouch, Z. (2002). A<br />
cognitive skill confound on the IAT. Social<br />
Cognition, 20, 483-510.<br />
Mierke, J., & Klauer, K.C. (2001). Implicit<br />
association measurement with IAT: Evidence<br />
for effects of executive control processes.<br />
Zeitschrift für Experimentelle Psychologie,<br />
48, 107-192.<br />
Mierke, J., & Klauer, K.C. (2003). Methodspecific<br />
variance in the Implicit Association<br />
Test. Journal of Personality and Social Psychology,<br />
85, 1180-1192.<br />
Mitchell, C.J., Anderson, N.E., & Lovibond,<br />
P.F. (2003). Measuring evaluative<br />
L’année psychologique, 2006, 106, 305-336
334 Christophe Blaison • Delphine Chassard • Jean-Luc Kop • Kamel Gana<br />
conditionning using the Implicit Association<br />
Test. Learning and Motivation, 34,<br />
203-217.<br />
Mitchell, J.P., Nosek, B.A. & Banaji, M.R.<br />
(2003). Contextual variations in implicit<br />
variations. Journal of Experimental Psychology:<br />
General, 132, 455-469.<br />
Musch, J., & Klauer, K.C. (Eds.) (2003).<br />
The psychology of evaluation: Affective processes<br />
in cognition and emotion. Mahwah<br />
(NJ, US): Lawrence Erlbaum Associates.<br />
Nisbett, R.E., & Wilson, T.D. (1977). Telling<br />
more than we can know: verbal reports<br />
on mental processes. Psychological Review,<br />
84, 231-259.<br />
Nosek, B.A. (2004). Moderators of the relationship<br />
between implicit and explicit attitudes.<br />
Dissertation Abstracts International:<br />
Section-B: The Sciences and Engineering, 63,<br />
4965.<br />
Nosek, B.A., & Banaji, M.R. (2001). The<br />
go/no go association task. Social Cognition,<br />
19, 625-664.<br />
Nosek, B.A, & Banaji, M.R. (2002). [Polish<br />
language] (At least) two factors moderate<br />
the relationship between implicit and explicit<br />
attitudes. In R.K. Ohme & M. Jarymowicz<br />
(Eds.), Natura automatyzmon.<br />
Warszawa: Wip Pan & SWPS.<br />
Nosek, B.A., Banaji, M.R., & Greenwald,<br />
A.G. (2002a). Math = male, me = female,<br />
therefore math ≠ me. Journal of Personality<br />
and Social Psychology, 83, 44-59.<br />
Nosek, B.A., Banaji, M.R., & Greenwald,<br />
A.G. (2002b). Harvesting implicit group<br />
attitudes and beliefs from a demonstration<br />
web site. Group Dynamics, 6, 101-115.<br />
Nosek, B.A., Greenwald, A.G., & Banaji,<br />
M.R. (2005a). Understanding and using<br />
the Implicit Association Test: II. Method<br />
variables and construct validity. Personality<br />
and Social Psychology Bulletin, 31, 166-180.<br />
Nosek, B.A., Greenwald, A.G., & Banaji,<br />
M.R. (2005b). The Implicit Association<br />
Test at age 7: A methodological and<br />
conceptual review. In J.A. Bargh (Edit.),<br />
Automatic Processes in Social Thinking and<br />
Behavior. Psychology Press.<br />
L’année psychologique, 2006, 106, 305-336<br />
Nosek, B.A., & Hansen, J.J. (2004). The associations<br />
in our heads belong to us: Measuring<br />
the multifaceted attitude construct in<br />
implicit social cognition. Manuscrit non<br />
publié.<br />
Nosek, B.A., & Smyth, F.L. (2005). A multitrait-multimethod<br />
validation of the<br />
Implicit Association Test: Implicit and<br />
explicit attitudes are related but distinct<br />
constructs. Sous presse.<br />
Olson, M.A., & Fazio, R.H. (2004). Reducing<br />
the influence of extrapersonal associations<br />
on the Implicit Association Test: personalizing<br />
the IAT. Journal of Personality<br />
and Social Psychology, 86, 653-667.<br />
Palfai, T.P., & Ostafin, B.D. (2003). Alcohol<br />
related motivational tendencies in hazardous<br />
drinkers: assessing implicit response<br />
tendencies using the modified-IAT.<br />
Behaviour Research and Therapy, 41, 1149-<br />
1162.<br />
Peeters, G. (1992). Evaluative meanings of<br />
adjectives in vitro and in context: Some<br />
theoretical implications and practical consequences<br />
of positive-negative asymmetry and<br />
behavioral-adaptive concepts of evaluation.<br />
Psychologica Belgica, 32, 211-231.<br />
Phelps, E.A., O’Connor, K.J., Cunningham,<br />
W.A., Funayama, E.S., Gatenby,<br />
J.C., Gore, J.C., & Banaji, M.R. (2000). Performance<br />
on indirect measures of race evaluation<br />
predicts amygdalia activation. Journal<br />
of Cognitive Neuroscience, 12, 729-738.<br />
Piontkowski, U., Blanz, M., Rohmann, A.,<br />
Schmermund, A., & Florack, A. (2001).<br />
The impact of multiple fit on implicit associations<br />
between categories: the Implicit<br />
Association Test as a research instrument<br />
in the study of social categorization. In<br />
F. Columbus (Ed.), Advances in psychology<br />
research, t. VI. Hauppauge (NY): Nova<br />
Science Publishers.<br />
Poehlman, T.A., Uhlmann, E., Greenwald,<br />
A.G, & Banaji, M.R. (2005). Understanding<br />
and Using the Implicit Association Test: III.<br />
Meta-analysis of Predictive Validity. Manuscrit<br />
non publié.
Validité et fondements théoriques des scores IAT 335<br />
Pratto, F., & John, O.P. (1991). Automatic<br />
vigilance: The attention-grabbing power of<br />
negative social information. Journal of Personality<br />
and Social Psychology, 61, 380-391.<br />
Rothermund, K., & Wentura, D. (2004).<br />
Underlying processes in the Implicit Association<br />
Test (IAT): Dissociating salience<br />
from association. Journal of Experimental<br />
Psychology: General, 133, 139-<br />
165.<br />
Steffens, M.C. (2004). Is the Implicit Association<br />
Test Immune to Faking? Experimental<br />
Psychology, 51, 165-179.<br />
Steffens, M.C., & Buchner, A. (2003). Implicit<br />
Association Test: separating transituationally<br />
stable and variable components<br />
of attitudes toward gay men. Experimental<br />
Psychology, 50, 33-48.<br />
Swanson, J.E., Rudman, L.A., &<br />
Greenwald, A.G. (2001). Using the Implicit<br />
Association Test to investigate<br />
attitude-behavior consistency for stigmatized<br />
behavior. Cognition and Emotion,<br />
15, 207-230.<br />
Teachman, B.A., Gregg, A.P. & Woody,<br />
S.R. (2001). Implicit associations for fearrelevant<br />
stimuli among individuals with<br />
snake and spider fears. Journal of Abnormal<br />
Psychology, 110, 226-235.<br />
Wilson, T.D., Lindsley, S. & Schooler, T.Y.<br />
(2000). A model of dual attitudes. Psychological<br />
Review, 107, 101-126.<br />
L’année psychologique, 2006, 106, 305-336