Évolution psycho­métrique, théorique et clinique

Le Journal des psychologues n°253

Dossier : journal des psychologues n°253

Extrait du dossier : Le WISC se met en IV
Date de parution : Décembre - Janvier 2008
Rubrique dans le JDP : Dossier
Nombre de mots : 3600

Auteur(s) : Rozencwajg Paulette

Présentation

L’objectif de cet article est de présenter l’évolution théorique et psychométrique du WISC-IV relativement à ses prédécesseurs, ainsi que les questions qui émergent de ces changements. Quelques résultats contribueront à mieux comprendre son fonctionnement. Des exemples de mise en perspective des subtests du WISC-IV permettront également de montrer que l’approche clinique est toujours possible, et ce, malgré les changements profonds.

Détail de l'article

Deux approches théoriques (1) caractérisent notamment l’intelligence : globale ou factorielle.
Inspirées par les travaux d’A. Binet, psychologue expérimentaliste clinicien, toujours en éveil devant le « spectacle si attachant d’une intelligence en activité » (Binet et Simon, 1908, p. 61), les échelles de Wechsler appartenaient, jusqu’au WISC-IV, à l’approche globale dans laquelle le sujet se trouve au centre de l’évaluation. Ces échelles sont pour cela, depuis longtemps, l’outil privilégié de la clinique du bilan psychologique. Même si un QI global est calculé (d’où l’ambiguïté attachée à cette approche, parfois considérée comme unitaire), l’analyse des subtests et des ré­ponses des sujets permet néanmoins une analyse plurielle de l’intelligence.
L’approche factorielle est, quant à elle, centrée sur les variables (les tests) et leur organisation en facteurs mathématiques sous forme hiérarchisée. Le modèle hiérarchisé de J. L. Horn et R. B. Cattell (1966) est le plus connu. Il comporte cinq facteurs de second ordre, dont les deux plus importants sont l’intelligence fluide (GF) et l’intelligence cristallisée (GC). Le modèle de L. Caroll (1993) a ensuite intégré le modèle de J. L. Horn et R. B. Cattell, en montrant qu’il admettait, en outre, un facteur général au sommet de la hiérarchie, modèle appelé aujourd’hui chc (Cattell-Horn-Carroll).
Par ailleurs, des travaux récents en psychologie cognitive (Kyllonen et Christal, 1990 ; Süß et al., 2002 ; Colom et al., 2004) ont montré le caractère central de la mé­moire de travail dans le fonctionnement cognitif, du moins la relation étroite entre le facteur général et la mémoire de travail. De plus, le fonctionnement de la mémoire de travail est amélioré par la capacité du sujet de traiter rapidement les informations, du fait qu’il soulage ses ressources limitées en mémoire de travail.
Néanmoins, il est important de préciser que non seulement l’ensemble du fonctionnement cognitif ne se réduit pas au facteur général, mais aussi que le facteur g n’est pas identique statistiquement au QI. Dans le QI, chaque épreuve a le même poids, ce qui revient à calculer une somme équipondérée des performances, tandis que le facteur g, à partir d’une analyse factorielle, est un résumé des différentes épreuves, ce qui revient à faire une somme pondérée des variables, car chaque épreuve n’a pas, cette fois, la même saturation avec le facteur g (Lautrey, 2005). D. Wechsler avait trouvé dans le facteur général la justification théorique du calcul du QI, mais le QI n’est qu’une évaluation assez grossière du facteur g, étant lui aussi déterminé par d’autres facteurs.
Les changements du WISC-IV semblent s’être conformés à l’évolution récente de ces travaux sur l’intelligence en intégrant les facteurs d’Intelligence fluide, de Mémoire de travail et de Vitesse de traitement.
La deuxième évolution majeure du WISC-IV est psychométrique. Pour D. Wechsler, la recherche de corrélations modérées était la base d’une bonne échelle d’intelligence. Les deux échelles, Verbale et Performance, de l’ancien Wisc étaient ainsi plutôt hétérogènes, même si les analyses statistiques montraient globalement cette décomposition. Ces deux QI ne sont plus calculés dans le WISC-IV et sont remplacés par quatre indices factoriels plus homogènes. L’échelle Verbale est en quelque sorte divisée en deux parties : un indice de Compréhension verbale (ICV), statistiquement assez proche de l’ancien QIV (évalue GC), et un indice de Mémoire de travail (imt). L’échelle de performance se divise également en deux parties : un indice de Raisonnement perceptif (IRP) (évalue GF) et un indice de Vitesse de traitement (IVT). L’indice IRP ne partage que les Cubes de Kohs avec les anciens iop et QIP. La composition de l’indice IRP a été choisie pour évaluer essentiellement l’intelligence fluide. La création des indices factoriels imt et IVT a entraîné la nécessité d’introduire deux nouveaux subtests comptés dans le QI : Symboles et Séquences lettres-chiffres. En effet, l’identification d’un facteur nécessite au minimum deux subtests en forte corrélation. De plus, Mémoire des chiffres n’était qu’optionnel dans le WISC-III. La recherche de scores factoriels homogènes ne donne ainsi que l’apparence d’une multi­dimensionnalité plus importante (quatre scores composites au lieu de deux), la re­dondance de la composition des échelles ayant été augmentée.
Les auteurs du WISC-IV ont cherché à diminuer la nature « hoche pot » des échelles pour se conformer à l’évolution actuelle de la conception de l’intelligence, celle d’un « noyau dur ». Néanmoins, nous verrons que, de mon point de vue, ce réductionnisme a, heureusement, échoué. En tout état de cause, ces profondes modifications conduisent à se demander si le QI Total est le même. On montrera notamment l’effet de ces changements sur les enfants à haut potentiel.

 

Conséquences sur les calculs de QI des enfants à haut potentiel
Le QI lui-même a nécessairement changé de signification, puisque sa composition est modifiée de 50 %. On observe, en particulier, une réduction de l’intelligence visuo-spatiale, de l’intelligence appliquée aux situations sociales et des contenus, réduction qui s’accompagne d’une augmentation des tests centrés sur la mesure de ressources attentionnelles. On constate une séparation de la vitesse et de la performance, une augmentation du raisonnement (GF) et l’apparition d’une nouvelle dimension de flexibilité (Identification de concepts et Raisonnement verbal) qui mériterait un approfondissement.
Cette nouvelle composition du QI a manifestement des répercussions sur les enfants à haut potentiel, puisque les enfants hp, avec le WISC-III, ne le sont plus que pour moitié avec le WISC-IV. Le QIt moyen a, en effet, diminué de 16 points d’après les données du manuel. L’effet de l’actualisation de l’étalonnage ne peut suffire à expliquer cette différence. En effet, le gain annuel entre le WISC-III et le WISC-IV est de 0,18 point de QI (Grégoire, 2006). L’étalonnage du WISC-III est de 1996 et celui du WISC-IV de 2005. En dix ans, l’effet de génération n’a donc augmenté le QI que d’environ 2 points. Pourquoi, dans ce cas, cette baisse de 16 points ? On sait que l’IVT est le seul indice factoriel habituellement « chuté » chez les enfants hp. Or, la vt est augmentée dans le QI du WISC-IV. De plus, les contenus ont été réduits, or les enfants hp sont connus pour la brillance de leur intelligence cristallisée.
Dans une étude menée en 2007 2, deux groupes d’enfants atypiques aux deux extrêmes de la courbe de Gauss ont été comparés, chacun à un groupe témoin. Chez les enfants hp, enfants non consultants, le QIt est de 142, l’ICV de 139, l’IRP de 131, l’imt de 129 et l’IVT de 124. On constate que les enfants qui ont un QI très élevé ont aussi des scores composites supérieurs à la moyenne, mais surtout qu’ils sont tous inférieurs au QI lui-même (rappelons que le QI n’est pas une moy­enne de ces scores composites ; on ajoute les notes standardisées à l’ensemble des épreuves ; cette somme est ensuite étalonnée selon la loi normale). Ce phénomène peut s’expliquer par le fait qu’il est très rare pour un enfant de réussir dans tous les domaines (même si l’IVT est plus faible, il reste élevé relativement au groupe d’âge du sujet). Il peut s’ensuivre un effet « boule de neige » de l’intelligence. On a essentiellement parlé de cet effet pour l’intelligence cristallisée ; pour autant, il est sans doute plus global. Chez les enfants d’une classe d’intégration scolaire (clis), le QIt est de 55, l’ICV de 62, l’IRP de 65, l’imt de 59 et l’IVT de 74. On constate les mêmes résultats chez ces enfants souffrant d’un retard intellectuel, mais en sens inverse : leur QI Total est inférieur à chacun des scores composites. Cet effet « boule de neige » de l’intelligence pourrait être éclairé par le modèle de la vicariance de Reuchlin (1978). Les enfants à haut potentiel ont à leur disposition un grand nombre de processus, tandis que les enfants souffrant de retard mental ne les ont pas.
Concernant l’analyse des subtests, le subtest Similitudes s’avère le mieux réussi chez les enfants hp, ce qui est conforme à la littérature. Barrages et Symboles sont, quant à eux, les plus chutés. Ces tâches semblent être moins investies chez ces enfants. En revanche, le Code n’est pas chuté, contrairement à ce qui est habituellement observé, ce qui peut être expliqué par le biais d’échantillonnage des hp habituels. Le groupe hp et le groupe témoin de cette étude comporte tous deux, en effet, de très bons élèves qui ne consultent pas et qui n’ont pas de retard en écriture entraînant parfois un retard grapho-moteur décelable dans le Code.
On constate, par ailleurs, un nombre relativement important de subtests pour lesquels la différence n’est pas significative entre les enfants hp et le groupe témoin : Raisonnement verbal, Matrices, Mémoire des chiffres, Arithmétique et Barrages. En dehors du subtest Raisonnement verbal, qui ne renvoie d’ailleurs pas exclusivement à des connaissances verbales, mais aussi à une certaine flexibilité (Grégoire, 2006), la différence est significative pour tous les tests de l’indice de Compréhension verbale (Vocabulaire, Similitudes, Compréhension, Information). Ce résultat va dans le sens où l’intelligence cristallisée serait spécifique des enfants à haut potentiel, les acquis facilitant les nouveaux apprentissages (Emmanuelli, 2006). Le test des Matrices, représentant par excellence de l’intelligence fluide, sup­posée fondamentale pour l’intelligence générale, et les subtests de Mémoire de travail (Mémoire des chiffres, Arithmétique), supposés fondamentaux pour expliquer cette intelligence générale (Kyllonen, Christal, 1990 ; Rozencwajg, 2006), ne semblent pas discriminants pour les enfants hp. Ce résultat irait dans le sens où les fondements de l’intelligence ne seraient pas les mêmes en fonction du niveau du QI, ce que nous reprendrons plus loin avec d’autres analyses.
Ces résultats illustrent à nouveau le fait que la moitié des enfants hp avec le WISC-III ne le sont plus avec le WISC-IV (Wechsler, 2005), car certains subtests, mieux réussis (Information, Complètement d’images), ne sont plus comptés dans le QI, tandis que d’autres, relativement moins bien réussis (Matrices, Symboles, Mémoire des chiffres), composent dorénavant le QI.
Contrairement aux résultats précédents avec les enfants hp, la différence entre les enfants souffrant de retard intellectuel et les enfants du groupe témoin est significative pour tous les subtests. Aucun domaine n’échappe à la déficience intellectuelle de ces enfants. Néanmoins, le subtest Arithmétique présente le score le plus bas dans le groupe des enfants souffrant de retard mental. On peut expliquer ce résultat par le fait que les compétences impliquées dans ce test ne relèvent pas seulement de la Mémoire de travail, qui est également très chutée, mais aussi des acquisitions scolaires, très échouées chez ces enfants (Vocabulaire et Information). J. Grégoire (2006) observe, en effet, dans l’échantillon d’étalonnage du WISC-IV, une saturation d’Arithmétique aussi forte dans les facteurs de Compréhension verbale et de Mémoire de travail. Les subtests de Vitesse de traitement sont relativement moins échoués, et notamment Code et Barrages qui pourraient être interprétés comme des indicateurs d’investissement de la tâche. Le subtest Symboles se distingue, quant à lui, par l’augmentation des informations à traiter au cours du test, ce qui handicape les enfants souffrant de déficit intellectuel. Cette surcharge d’informations s’observe également dans l’Identification de concepts quand l’item passe de deux à trois rangées.
Un autre résultat concerne la comparaison des performances des deux groupes témoins. En effet, les enfants hp étant tous de milieu social favorisé, le groupe témoin des enfants hp l’est également. Inversement, les enfants souffrant de retard intellectuel étant tous de milieu social défavorisé, le groupe témoin de ces enfants l’est également. Les deux groupes témoins ne se distinguent ainsi que par le milieu. Or, les trois subtests de Vitesse de traitement sont les seuls à être équivalents pour les deux milieux, résultat déjà observé par J. Grégoire (2006).  
Afin d’évaluer si le poids du facteur général varie en fonction du niveau du QI, une analyse en composantes principales a été menée en divisant l’échantillon, selon que le QI est inférieur à 100 ou supérieur à 100. Les étendues des QI sont les suivantes : QI [109 ; 156]>100 et QI [45 ; 99]<100. Dans le groupe [QI<100], l’axe 1 prend en compte 61 % de la variance totale et deux dimensions sont supérieures à la valeur propre moyenne. Les corrélations des subtests avec l’axe 1 sont comprises entre .63 et .88. Dans le groupe [QI>100], l’axe 1 prend en compte 46 % de la variance totale et trois dimensions sont supérieures à la valeur propre moyenne. Les corrélations des subtests avec l’axe 1 sont comprises entre .22 et .83.
Conformément aux travaux de D. K. Detterman et M. H. Daniel (1989), ainsi que ceux de B. Facon (2003), le facteur g paraît plus important chez les enfants avec un QI plus faible et paraît au contraire plus faible chez les enfants de QI élevé. Plus précisément, chez les enfants de QI élevé, la Mémoire des chiffres est le seul subtest qui ne contribue pas au facteur général (r=.22), tandis que le Vocabulaire et les Matrices y contribuent le plus (r=.83). Chez les enfants de QI plus faible, tous les subtests contribuent de façon égale au facteur général.
Le tableau 1 présente les corrélations entre la Mémoire des chiffres et les subtests évaluant classiquement les acquisitions scolaires (Kaufman, 1979 ; Rozencwajg, 2006). Ces résultats indiquent à nouveau que l’intelligence n’aurait pas les mêmes fondements en fonction du niveau du QI. Les enfants de QI élevé apprennent (GC), mais la mémoire immédiate contribue peu à ce développement. L’importance fondamentale de la mémoire de travail dans l’intelligence générale ne serait pas vraie pour des niveaux intellectuels élevés. Pour les enfants de QI faible, l’ensemble des processus est déficient et toutes les corrélations sont importantes. On notera que le manuel du WISC-IV propose des normes d’analyse des différences entre indices factoriels en fonction du niveau du QI.
Comme je le soulignais plus haut, l’approche globale, plurielle, me paraît toujours possible avec le WISC-IV. La décomposition du QI ne s’arrête pas au profil des quatre indices factoriels. Chaque subtest, même s’il a une saturation importante sur chacun de ces facteurs, met potentiellement en œuvre plusieurs processus, qui peuvent être communs à d’autres subtests. Les quatre scores factoriels ne suffisent pas à rendre compte de cette richesse processuelle (Rozencwajg, 2005). Par exemple, un échec au Code est à examiner avec les Symboles pour confirmer ou infirmer les difficultés dans la vt. Mais il est aussi à mettre en relation avec des tests influencés par la scolarité (Arithmétique, Vocabulaire, Information), du fait du processus d’investissement de la scolarité (désir de réussite) qui existe dans le Code. Ou encore, le subtest In­formation sature l’intelligence cristal­lisée à travers des connaissances non ­spécialisées. Mais un échec doit aussi être examiné au regard d’un milieu peu favorisé qui aurait donné moins de possibilités d’apprentissage et qui serait alors à confronter avec les Similitudes (subtest moins influencé par le milieu social), ou au regard de difficultés scolaires et qui serait alors à confronter avec le Vocabulaire et l’Arithmétique, ou, enfin, au regard d’une moindre curiosité pour l’environ­nement extérieur, social et physique, et qui serait, quant à lui, à confronter avec Compréhension.
Une ébauche d’analyse corrélationnelle du subtest Arithmétique est aussi révélatrice. Sur l’ensemble des groupes d’âge, les corrélations médianes d’Arithmétique avec les quatre indices factoriels sont les suivantes : 0.53 avec ICV, 0.49 avec IRP, 0.51 avec imt et 0.32 avec IVT. On constate donc des corrélations très proches les unes des autres, en dehors de la Vitesse de traitement, peu impliquée en Arithmétique (sauf dans les groupes d’âge des enfants de six et sept ans). Ce subtest est supposé pouvoir remplacer un des subtests de l’indice de Mémoire de travail. Cela signifie que des processus variés sont en réalité impliqués et pas seulement des ressources en Mémoire de travail. Une étude plus approfondie serait nécessaire. Par exemple, on sait que les énoncés de problèmes additifs sont plus difficiles à résoudre que les opérations elles-mêmes, même si celles-ci se différencient également en fonction des opérandes. Le fait que la vitesse de traitement soit impliquée en arithmétique uniquement chez les jeunes enfants mériterait également une recherche spécifique.

 

Corrélations avec Mémoire des chiffres Vocabulaire Arithmétique Information
[QI < 100] 0.61 0.60 0.67
[QI > 100] 0.61 0.19 -0.09

Tableau 1. Corrélations entre MCH et les tests d’acquisitions scolaires en fonction du QI.

 

L’Arithmétique s’avère bien un révélateur de l’évolution du WISC-IV. Le souhait du WISC-IV était une mesure « pure » de l’intelligence, moins déterminée par le contexte, le contenu. « Le subtest Arithmétique, dont la complexité cognitive affaiblissait le QIV, est écarté de cette échelle qui apparaît, à présent, comme une mesure relativement homogène du raisonnement verbal. » (Wechsler, 2005, p. 7.) De ce fait, Arithmétique est optionnel. Pourtant, les corrélations révèlent la richesse du test Arithmétique et une pluralité des processus. L’enfant doit se faire une représentation mentale à partir d’un énoncé. Il doit réaliser un stockage des résultats intermédiaires et un traitement simultané. Cela nécessite, bien sûr, des compétences numériques et de raisonnement. Ces résultats sont d’autant plus intéressants que les items ont été modifiés pour être davantage de la mt et moins du calcul.
Malgré le souhait des concepteurs du WISC-IV de mieux isoler les causes des difficultés, le fonctionnement intellectuel n’échappe pas à la complexité.
Un autre exemple : chez les enfants présentant des troubles de l’attention, la baisse de l’indice de Vitesse de traitement masque en fait que seul le subtest du Code est déficient et non celui des Symboles, tandis que les différences sont importantes pour Arithmétique et Information. La nouvelle dimension de flexibilité (Identification de Concepts et Raisonnement verbal) est un autre révélateur de cette complexité, ainsi que la comparaison possible entre la catégorisation à partir d’images et à partir de mots dans les subtests d’Identification de concepts et les Similitudes. Une analyse des items dans la tâche d’Identification de concepts serait d’ailleurs très intéressante, car, contrairement aux Similitudes, la réponse optimale ne se situe pas au même niveau d’abstraction. Il est possible que la flexibilité que J. Grégoire (2006) note dans cette tâche provienne aussi de ces changements de niveau de réponse. Un autre facteur de flexibilité vient, en effet, du fait que si l’enfant associe un concept à partir de l’examen de la première rangée, mais que ce concept ne convient pas pour la seconde rangée, alors il doit changer sa représentation du problème. La même flexibilité est en œuvre dans le Raisonnement verbal.
La complexité de la composition d’un QI a pour conséquence que le QI seul n’est pas en soi source de connaissance sur le fonctionnement intellectuel du sujet.

 

Une base d’interprétations à approfondir…
En guise de conclusion, je dirai que le QI ne se confond pas avec l’échelle d’intel­ligence tout comme l’âge mental ne se confondait pas avec le test de Binet-Simon. Cette richesse processuelle en fait un outil très intéressant pour le psychologue, mais l’échelle d’intelligence ne sert qu’à formuler des hypothèses d’interprétation qu’il faudra approfondir. A. Binet me semble l’auteur le plus adéquat pour conclure cet article : « Les qualités intellectuelles ne se mesurent pas comme des longueurs, elles ne sont pas superposables. » (Binet et Simon, 1905, p. 195.) « Ce n’est pas, malgré les apparences, une méthode automatique, comparable à une bascule de gare, sur laquelle il suffit de monter pour que la machine vomisse notre poids imprimé sur un ticket. Nous prédisons au médecin pressé, qui voudrait la faire appliquer par des infirmiers, bien des déboires. » (Binet et Simon, 1908, p. 60.)

 

Note
1. Une troisième approche, processuelle, existe aussi qui ne sera pas présentée ici (Rozencwajg, 2005).

Pour citer cet article

Rozencwajg Paulette  ‘‘Évolution psycho­métrique, théorique et clinique‘‘
URL de cet article : https://www.jdpsychologues.fr/article/evolution-psychometrique-theorique-et-clinique

Partage sur les réseaux sociaux

L’Évaluation thérapeutique, un nouveau paradigme clinique L’Évaluation thérapeutique, un nouveau paradigme clinique
Pour une évaluation neuropsychologique éthique, entre théorie et clinique

Abonnez-vous !

pour profiter du Journal des Psychologues où et quand vous voulez : abonnement à la revue + abonnement au site internet

Restez Connecté !

de l'actualité avec le Journal des Psychologues
en vous inscrivant à notre newsletter