Les métamorphoses des échelles de Wechsler

Le Journal des psychologues n°230

Dossier : journal des psychologues n°230

Extrait du dossier : L’examen psychologique : intérêt et renouveau
Date de parution : Septembre 2005
Rubrique dans le JDP : Dossier
Nombre de mots : 2500

Auteur(s) : Gregoire Jacques

Présentation

La parution de la quatrième édition de l’échelle d’intelligence de Wechsler pour enfants (WISC-IV) est l’occasion de faire le point sur l’évolution de ces mesures classiques de l’intelligence. En plus d’un demi-siècle d’existence, comment les échelles de Wechsler se sont-elles transformées ? Quelle influence ont eue sur elles l’étude scientifique de l’intelligence et les nouveaux modèles de la cognition ? Partant des fondements des échelles de Wechsler, il est possible de retracer leurs lentes métamorphoses et d’analyser leur impact sur les pratiques de l’évaluation.

Détail de l'article

La première échelle construite par D. Wechsler, la Wechsler-Bellevue, parue aux états-Unis en 1939, a été développée selon des principes très proches de ceux suivis par A. Binet une trentaine d’années plus tôt. Tout comme A. Binet, l’objectif de D. Wechsler est d’obtenir un indicateur de l’efficience intel­lectuelle globale des sujets. Et, comme A. Binet, il considère que la meilleure méthode pour y parvenir est de confronter les sujets à un ensemble de tâches diversifiées dont on retient la tendance moyenne. La logique suivie est similaire à celle du sondage d’opinion. De même que le sondeur peut se faire une idée de l’opinion dominante au sein de la population à travers les réponses d’un échantillon de sujets, le psychologue peut estimer la compétence d’une personne à travers ses réponses à un échantillon de tâches. Tout comme les individus interrogés par le sondeur, le choix de ces tâches est arbitraire. L’essentiel est qu’elles soient suffisamment nombreuses et variées. Dans cette perspective, la mesure de l’intelligence n’est pas la somme de mesures d’aptitudes spécifiques. Aucune des épreuves sélectionnées par D. Wechsler ne mesure, en effet, une aptitude ciblée. Au contraire, toutes les épreuves nous fournissent des mesures composites. Leur rôle est d’être les témoins de la capacité globale et complexe d’un individu d’agir avec intelligence.  
Wechsler se distingue de A. Binet sur deux points importants. Alors que ce dernier s’intéresse aux seuls enfants d’âge scolaire, D. Wechsler veut mesurer l’intelligence tout au long de la vie, de l’enfance à la vieillesse, ce qui l’oblige à sélectionner des épreuves capables de distinguer des degrés de performance intellectuelle à tous les âges. Une seconde différence est que l’objectif de A. Binet est avant tout scolaire, alors que celui de D. Wechsler est essentiellement clinique. Confronté à l’évaluation de patients adultes dans le cadre de l’hôpital psychiatrique Bellevue de New York, il cherche à identifier les particu­larités de leur fonctionnement intel­lectuel par-delà la seule mesure du QI. L’analyse de la variabilité et des particularités des résultats aux diverses épreuves du test occupe chez lui une place beaucoup plus importante que chez A. Binet. Cette analyse est essentiellement celle des différences entre les QI et entre les notes aux subtests. De son expérience dans les services psychologiques de l’armée américaine, D. Wechsler a, en effet, repris l’idée d’une distinction entre une facet­te verbale et une facette non verbale de l’intelligence, chacune mesurée par un QI spécifique (le QI verbal – QIV – et le QI de performance – QIP) qu’il juge très intéressante d’un point de vue clinique. Quant à l’analyse de la dispersion des notes aux subtests, D. Wechsler lui accorde une grande importance dans ses différentes publications, malgré sa difficulté intrinsèque due à la complexité des variables mesurées par chaque épreuve.
 

Des stars endormies
Du fait de la qualité de leur construction et de leur intérêt clinique, la Wechsler-Bellevue et ses héritiers (le WISC en 1949, la WAIS en 1955 et le WPPSI en 1967) vont rapidement devenir des standards de la mesure de l’intelligence. Les échelles de Wechsler sont traduites dans le monde entier et figu­rent parmi les tests les plus utilisés par les psychologues. Les premières révisions des échelles (le WISC-R en 1974 et la WAIS-R en 1981) ne sont, pour l’essentiel, qu’un réétalonnage des versions précédentes. Les subtests sont simple­ment mis au goût du jour en remplaçant les items désuets. Ce conservatisme est essentiellement le fait de D. Wechsler lui-même qui considère ses échelles comme cliniquement satisfaisantes et ne juge dès lors pas nécessaire de les modifier plus substan­tiellement. A. S. Kaufman (1994), qui assiste D. Wechsler lors du développement du WISC-R, rapporte avec humour les discussions épiques qu’il eut avec lui à l’époque pour le convaincre de renoncer à l’un ou l’autre item de la version précédente.
Jusqu’au début des années quatre-vingt-dix, les échelles de Wechsler apparaissent comme des stars endormies. Largement utilisées par les praticiens du monde entier, elles ne sont plus en phase avec l’évolution des connaissances scientifiques de l’intelligence. Certains (Franck, 1983) n’hésitent d’ailleurs pas à les assimiler à des dinosaures et à prédire leur extinction.
À la même époque, les recherches sur l’intelligence progressent selon deux voies : celle de l’analyse factorielle et celle de l’analyse des processus mentaux, encouragée par l’émergence de la psychologie cognitive. En 1993, J. B. Carvrol­l propose un modèle hiérarchique de l’intelligence basé sur l’analyse de plus de quatre cent soixante ensembles de données récoltées entre 1930 et 1985 lors de recherches sur les aptitudes cognitives. Le modèle de J. B. Carroll est orga­nisé en trois niveaux (figure 1). Le premier niveau correspond aux aptitudes spécifiques, le second à des aptitudes de plus grande étendue et le troisième à l’intelligence générale. Les échelles de Wechsler ne couvrent qu’une partie de ce modèle. Le QIV est une bonne mesure de l’« intel­ligence cristallisée », et le QIP est une mesure satisfaisante de la « perception visue­lle ». Mais plusieurs facettes de l’intelligence, situées au niveau 2 du modèle de J. B. Carroll, sont peu ou pas évaluées par les échelles de Wechsler. C’est particulièrement le cas de l’« Intelligence fluide » et de la « Mémoire générale ». D’autres modèles factoriels, comme celui de Cattell-Horn (Flanagan et al., 1999), vont dans le même sens, mettant en évidence des lacunes au sein des échelles de Wechsler.
Parallèlement aux analyses factorielles, les travaux réalisés en psychologie cognitive ont apporté un nouvel éclairage sur les fonctions cognitives impliquées dans les épreuves intellectuelles. Le rôle de la mémoire de travail, des fonctions exécutives et de l’attention dans l’efficience intellectuelle a été mis en évidence (voir, par exemple, Engle et al., 1999). Par ailleurs, les processus mentaux mis en œuvre dans les traitements verbaux et visuo-spatiaux sont de mieux en mieux identifiés.  Ces nouvelles connaissances débouchent sur la possibilité d’une meilleure compréhension des performances observées dans les tests d’intelligence. Mais cette amélioration ne peut devenir effective que si certaines informations qualitatives peuvent être ré­coltée­s à l’occasion du testing. Malheureusement, les épreuves traditionnelles des échelles de Wechsler ont été conçues pour n’enregistrer que la réussite ou l’échec. Les informations relatives aux stratégies et aux facteurs responsables des échecs ne sont pas enregistrées de manière systématique et, bien souvent, ne sont que difficilement identifiables.
 


Figure 1. Modèle hiérarchique des aptitudes intellectuelles selon J. B. Carroll (Grégoire, 2004, p. 52.)

Du WISC-III au WISC-IV
Après la mort de D. Wechsler, en 1981, les nouveaux développements de ses échelles ont été pris en charge par l’équipe de recherche de l’éditeur américain Psychological Corporation. Sensible aux critiques de la structure traditionnelle des échelles de Wechsler, cette équipe décide d’introduire des changements de plus en plus substantiels à l’occasion des diverses révisions des échelles.
Sur la base de résultats d’analyses factorielles du WISC-R, A. S. Kaufman (1975) avait suggéré de regrouper les subtests de cette échelle en trois ensembles, corres­pondant à trois facettes de l’intelligence : la compréhension verbale, l’organisation perceptive et la résistance à la distraction (freedom from distractability). Cette dernière facette était mesurée par les épreuves « Arithmétique », « Code » et « Mémoire de chiffres ». Lors du développement du WISC-III (1991), les chercheurs ont voulu renforcer la mesure du troisième facteur en introduisant une nouvelle épreuve : « Symboles ». Cette introduction n’a toutefois pas eu l’effet escompté. L’analyse factorielle des données d’étalonnage américaines a, en effet, mis en évidence quatre facteurs au lieu des trois attendus, la nouvelle épreuve de « Symboles » constituant un quatrième facteur avec l’épreuve de « Code ». Dans la version américaine du WISC-III, les praticiens ont dès lors été invi­tés à calculer quatre indices factoriels, en plus des traditionnels QIV, QIP et QI total (QIT). Cette suggestion ne s’est guère révélée fructueuse. La grande majorité des praticiens a continué à calculer les seuls QI et a négligé les indices factoriels. Ce manque d’intérêt n’est guère étonnant. Les praticiens sont restés attachés aux mesures qu’ils connaissent et pensent pouvoir interpréter correctement. Ils se sont, au contraire, détournés de scores dont les implications cliniques leur étaient obscures. Par ailleurs, l’indice résistance à la distraction, composé d’« Arithmétique » et de « Mémoire de chiffres », s’est révélé relativement faible d’un point de vue psychométrique. Ce facteur n’a d’ailleurs pas été retrouvé dans toutes les adaptations du WISC-III (Georgas et al., 2003). Les adaptations françaises, néerlandaises et grecques n’ont permis de mettre en évidence que trois facteurs : « Compréhension verbale », « Organisation perceptive » et « Vitesse de traitement ». Le facteur « Résistance à la distraction » n’a pas pu être extrait du fait de la saturation élevée du subtest « Arithmétique » par le facteur « Compréhension verbale » (Grégoire, 2001).
Le relatif échec des modifications introduites dans le WISC-III a conduit les chercheurs à introduire des transformations nettement plus importantes lors du développement de la WAIS-III (1997). En plus de « Symboles », deux nouveaux subtests sont alors proposés : « Matrices » et « Séquence lettres-chiffres ». Le premier représente une mesure de l’intelligence fluide, trop peu présente dans les échelles de Wechsler antérieures (Flanagan et al., 1999), et le second renforce la mesure de la mémoire de travail dont le rôle dans l’activité intellectuelle a été souligné dans les recherches récentes (Kyllonen et Christal, 1990). Ces nouveaux subtests, associés à une réduction de l’importance accordée à la vitesse de réalisation de certaines tâches, ont permis de mettre en évidence une solide structure en quatre facteurs et de garantir la validité des quatre indices correspondants : « Compréhension verbale », « Organisation perceptive », « Mémoire de travail » et « Vitesse de traitement » (Wechsler, 1997 ; Grégoire, 2004). Soucieux de ne pas trop bousculer les habitudes des praticiens, les concepteurs de la WAIS-III ont toutefois conservé la possibilité de calculer les traditionnels QIV et QIP.
Dans la WAIS-III, l’alternative laissée aux praticiens entre le calcul des QI et celui des indices ne semble pas avoir entraîné un important changement des pratiques. Les cliniciens sont restés attachés aux QI traditionnels et à la comparaison entre les QIV et QIP. Les nouveaux indices, malgré leur robustesse psychométrique, semblent les avoir laissés indifférents. Partant de ce constat, les concepteurs du WISC-IV (Wechsler, 2003) ont pris une décision radicale : la suppression des QIV et QIP, et leur remplacement par les seuls indices factoriels (voir tableau 1, p. 27). Le QIT, raison première des échelles de Wechsler, a toutefois été conservé. Les  nouveaux indices ont été construits en sélectionnant les subtests les plus saturés par les facteurs correspondants. Par ailleurs, l’introduction des nouveaux subtests « Matrices » et « Identifications de concepts » et l’élimination d’« Arrangement d’ima­ges » et d’« Assemblage d’objets », ont profondément modifié la nature de l’ancienne échelle de « Performance », à laquelle correspondait, pour l’essentiel, l’indice « Organisation perceptive » du WISC-III et de la WAIS-III. Dans le WISC-IV, l’ensemble formé par les subtests « Cubes », « Identification de concepts » et « Matrices » met moins l’accent sur le raisonnement visuo-spatial. L’impact des bonus de temps est également plus réduit. Le nom de l’indice a été adapté en conséquence. Il s’appelle désormais « Raisonnement perceptif », car les subtests demandent tous de raisonner sur la base de stimuli perceptifs, à la différence des subtests de l’indice « Compréhension verbale » où le raisonnement se base sur des informations verbales.
L’utilisation forcée des indices factoriels va inévitablement modifier les pratiques, la comparaison des quatre indices remplaçant celle des QIV et QIP. Cette nouvelle comparaison est susceptible de fournir d’importantes informations cliniques, à condition que les praticiens identifient bien ce que mesure chacun des indices et utilisent une méthodologie appropriée. Par ailleurs, plusieurs procédures optionnelles ont été introduites dans le WISC-IV afin d’aider les praticiens à identifier les facteurs responsables d’éventuels échecs.

 

 

Conclusion
Entre la première échelle de Wechsler, la Wechsler-Bellevue, et le dernier-né de la lignée, le WISC-IV, près de soixante-cinq ans se sont écoulés. Longtemps figées dans leur format original, les échelles de Wechsler ont commencé à évoluer au cours des années quatre-vingt-dix. Cette évolution s’est d’abord faite à pas feutrés, pour s’accélérer avec la WAIS-III et, surtout, le WISC-IV dont la version française paraît en 2005. Si le WISC-IV permet toujours de mesurer un QI, il se veut avant tout un test clinique. L’introduction de nouvelles épreuves, la réorganisation de la structure de l’échelle et la possibilité d’étudier en détail certaines procédures offrent, sans aucun doute, un potentiel important pour les analyses cliniques. Encore faudra-t-il que les praticiens s’approprient ce nouvel outil et modifient en conséquence leurs procédures d’interprétation.

 

* Jacques Grégoire a assuré la responsabilité scientifique de l’adaptation française des échelles de toutes les Wechsler depuis le WISC-III. Il est l’auteur de nombreux articles et ouvrages sur l’intelligence et les échelles de Wechsler. Ses derniers ouvrages sont L’Évaluation clinique de l’intelligence de l’enfant (2002) et L’Examen clinique de l’intelligence de l’adulte (2004), tous deux parus chez Mardaga.

Pour citer cet article

Gregoire Jacques  ‘‘Les métamorphoses des échelles de Wechsler‘‘
URL de cet article : https://www.jdpsychologues.fr/article/les-metamorphoses-des-echelles-de-wechsler

Partage sur les réseaux sociaux

Pour une évaluation neuropsychologique éthique, entre théorie et clinique

Abonnez-vous !

pour profiter du Journal des Psychologues où et quand vous voulez : abonnement à la revue + abonnement au site internet

Restez Connecté !

de l'actualité avec le Journal des Psychologues
en vous inscrivant à notre newsletter