Réflexion critique sur la mesure de la pensée critique

Une liste de mesures de pensée critiques.

Dans mon dernier article, j’ai discuté de la nature du processus de réflexion critique (CT) et mentionné les personnes qui tirent une conclusion et finissent par être correctes. Mais, juste parce qu’ils ont raison, cela ne signifie pas qu’ils ont utilisé la tomodensitométrie pour y arriver. Je l’ai illustré à travers une observation faite ces dernières années concernant les mesures existantes de la TDM, dont beaucoup évaluent la TDM via des questions à choix multiples. Dans le cas des CT MCQ, vous pouvez deviner la bonne réponse 20-25% du temps, sans nécessité de scanner. Donc, la question est la suivante: ces mesures de CT mesurent-elles vraiment la TDM?

Comme l’expliquent mes articles précédents, la tomodensitométrie est un processus métacognitif consistant en un certain nombre de sous-compétences et de dispositions qui, appliquées par un jugement réfléchi, autorégulateur et réfléchi, augmentent les chances de trouver une solution logique à un problème ou à un problème valide. conclusion à un argument (Dwyer, 2017; Dwyer, Hogan & Stewart, 2014). La plupart des définitions, bien que formulées différemment, tendent à s’accorder avec cette perspective: elles consistent en certaines dispositions, compétences spécifiques et une sensibilité réflexive qui régit l’application de ces compétences. C’est comme ça que c’est défini; Cependant, ce n’est pas nécessairement la manière dont il a été défini sur le plan opérationnel .

La définition opérationnelle de quelque chose consiste à définir les termes du processus ou de la mesure requis pour déterminer la nature et les propriétés d’un phénomène. Simplement, il définit le concept en fonction de la façon dont il peut être fait, évalué ou mesuré. Si la manière dont vous mesurez quelque chose ne correspond pas ou évaluez les paramètres définis dans la manière dont vous la définissez, vous n’avez pas réussi à le définir de manière opérationnelle .

Bien que la plupart des définitions théoriques de la tomodensitométrie soient similaires, la manière dont elles varient entrave souvent la construction d’un compte-rendu théorique intégré sur la meilleure façon de mesurer les compétences CT. En conséquence, les chercheurs et les éducateurs doivent prendre en compte le large éventail de mesures de CT disponibles, afin d’identifier les mesures les meilleures et les plus appropriées, sur la base de la conceptualisation CT utilisée pour la formation. Il existe différentes mesures de CT – les plus populaires parmi elles sont l’évaluation critique de Watson-Glaser (WGCTA; Watson & Glaser, 1980), le Cornell Critical Thinking Test (CCTT; Ennis, Millman et Tomko, 1985), le California Critical Test de compétences intellectuelles (CCTST; Facione, 1990a), le Test de la pensée critique Ennis-Weir (EWCTET; Ennis & Weir, 1985) et l’évaluation de la pensée critique de Halpern (Halpern, 2010).

Certains commentateurs ont noté que ces différentes mesures de la capacité du scanner ne sont peut-être pas directement comparables (Abrami et al., 2008). Par exemple, le WGCTA se compose de 80 QCM qui mesurent la capacité à tirer des conclusions; reconnaître les hypothèses; évaluer les arguments; et utiliser une interprétation logique et un raisonnement déductif (Watson et Glaser, 1980). Le CCTT est composé de 52 QCM qui mesurent les compétences de la pensée critique associée à l’induction; déduction; observation et crédibilité; identification et identification des hypothèses; et le sens et les erreurs. Enfin, le CCTST comprend 34 questions à choix multiple et mesure la TDM en fonction des compétences fondamentales d’analyse, d’évaluation et d’inférence, ainsi que du raisonnement inductif et déductif.

Comme indiqué ci-dessus, le format MCQ de ces trois évaluations est loin d’être idéal – même problématique, car il permet aux candidats de deviner simplement quand ils ne connaissent pas la bonne réponse, au lieu de démontrer leur capacité à analyser et à évaluer les problèmes déduire des solutions à ces problèmes (Ku, 2009). De plus, comme le fait valoir Halpern (2003), le format MCQ fait de l’évaluation un test de connaissance verbale et quantitative plutôt que CT (c.-à-d. Parmi une liste de réponses possibles plutôt que de déterminer ses propres critères). La mesure de la CT par le biais de QCM pose également problème étant donné l’incompatibilité potentielle entre la conceptualisation de la CT qui façonne la construction du test et son évaluation à l’aide de QCM. Autrement dit, les tests de QMM évaluent les capacités cognitives associées à l’identification de réponses justes ou erronées et, par conséquent, cette méthode de test ne permet pas de mesurer directement l’utilisation de processus métacognitifs tels que la TDM, le jugement réflexif, et disposition vers CT.

Au lieu d’utiliser des éléments de QCM, une meilleure mesure de la TDM pourrait poser des questions ouvertes, ce qui permettrait aux candidats de démontrer s’ils utilisent spontanément une compétence CT spécifique. Le test de réflexion critique Ennis-Weir (EWCTET; Ennis & Weir, 1985) est une évaluation de CT couramment utilisée, mentionnée ci-dessus, qui utilise un format ouvert. L’EWCTET est une évaluation par essai de la capacité du candidat à analyser, évaluer et répondre aux arguments et aux débats dans des situations réelles (Ennis & Weir, 1985; voir Ku, 2009 pour une discussion). Les auteurs de l’EWCTET fournissent ce qu’ils appellent une “liste approximative de domaines de compétence en matière de pensée critique”, mesurée par leur test (Ennis & Weir, 1985, p. 1). Cependant, ce test a également été critiqué – pour sa nature spécifique au domaine (Taube, 1997), la subjectivité de son protocole de notation et son parti pris en faveur de ceux qui maîtrisent l’écriture (Adams, Whitlow, Stover & Johnson, 1996). .

Une autre évaluation CT plus récente utilisant un format ouvert est l’évaluation de la pensée critique de Halpern (HCTA; Halpern, 2010). Le HCTA comprend 25 questions ouvertes basées sur des situations quotidiennes crédibles, suivies de 25 questions spécifiques qui recherchent le raisonnement derrière chaque réponse. La nature multi-partie des questions permet d’évaluer la capacité à utiliser des compétences CT spécifiques lorsque l’invite est fournie (Ku, 2009). Le protocole de notation de l’HCTA fournit également des instructions compréhensibles et sans ambiguïté sur la manière d’évaluer les réponses en les décomposant en composants clairs et mesurables. Les questions sur le HCTA représentent cinq catégories d’applications de CT: le test d’hypothèses (par exemple, comprendre les limites du raisonnement corrélationnel et savoir quand les allégations causales ne peuvent pas être faites), le raisonnement verbal (par exemple, reconnaître un langage envahissant ou trompeur) reconnaître la structure des arguments, comment examiner la crédibilité d’une source et comment juger ses propres arguments), juger de la probabilité et de l’incertitude (appliquer des principes de probabilité pertinents, éviter la confiance excessive dans certaines situations) et résoudre l’objectif du problème, générer et sélectionner des solutions parmi les alternatives).

Jusqu’à l’élaboration du HCTA, j’aurais recommandé le CCTST pour mesurer la tomodensitométrie, malgré ses limites. Ce qui est bien avec le CCTST, c’est qu’il évalue les trois compétences essentielles de la CT: l’analyse, l’évaluation et l’inférence, ce que les autres échelles n’ont pas (explicitement). Donc, si vous étiez intéressé à évaluer la capacité de sous-compétence des élèves, cela serait utile. Cependant, comme nous le savons, bien que la performance des compétences CT soit une séquence, c’est aussi une collation de ces compétences – ce qui signifie que pour chaque problème ou sujet donné, chaque compétence est nécessaire. En administrant un problème d’analyse, un problème d’évaluation et un problème d’inférence, dans lequel l’étudiant obtient les meilleures notes pour les trois, cela ne garantit pas que l’élève appliquera ces trois points à un problème plus vaste nécessitant les trois. C’est-à-dire que ces questions ne mesurent pas la capacité de CT en soi, mais plutôt les compétences d’analyse, les compétences d’évaluation et les compétences d’inférence isolées. Simplement, les scores peuvent prédire la performance des compétences CT, mais ils ne le mesurent pas.

Ce qui pourrait être un meilleur indicateur de la performance du scanner est l’évaluation de l’ application du scanner. Comme évoqué ci-dessus, il existe cinq applications générales de la tomodensitométrie: tests d’hypothèses, raisonnement verbal, argumentation, vraisemblance et incertitude liées à la résolution de problèmes et à l’évaluation – nécessitant toutes une analyse, une évaluation et une inférence. Bien que les sous-compétences de l’analyse, de l’évaluation et de l’inférence ne soient pas directement mesurées dans ce cas, leur assemblage est mesuré au moyen de cinq applications distinctes. et, à mon sens, fournit une évaluation plus «vraie» de la TDM. En plus d’évaluer le scanner via un format ouvert, à réponse courte, le HCTA mesure le scanner en fonction des cinq applications du scanner; Je recommande donc son utilisation pour mesurer la tomodensitométrie.

Cependant, cela ne veut pas dire que le HCTA est parfait. Bien qu’il se compose de 25 questions ouvertes, suivies de 25 questions spécifiques qui recherchent le raisonnement derrière chaque réponse, lorsque je l’ai utilisé pour la première fois pour évaluer un échantillon d’étudiants, j’ai constaté que 165 possibilités de notation à travers le test. Les recherches antérieures recommandent que l’évaluation dure entre 45 et 60 minutes. Cependant, plusieurs de mes participants ont signalé qu’il fallait plus de deux heures (parfois plus). C’est une longue évaluation – approfondie, mais longue. Heureusement, des versions adaptées et raccourcies sont désormais disponibles, et c’est une version adaptée que je gère actuellement pour évaluer les CT. Une autre limite est que, malgré les raisons avancées ci-dessus, il serait utile d’avoir une idée de la manière dont les participants acquièrent les sous-compétences d’analyse, d’évaluation et d’inférence, car compétences individuelles et les applications. Avec cela, je suppose qu’il est possible d’administrer à la fois l’HCTA et le CCTST pour évaluer ces hypothèses.

Bien qu’il soit évidemment important de considérer la manière dont les évaluations mesurent réellement la CT et la nature de chacune d’entre elles, le problème macroéconomique plus vaste doit encore être étudié. Tout comme les conceptualisations de la tomodensitométrie varient, la fiabilité et la validité des différentes mesures de tomodensitométrie varient également, ce qui a amené Abrami et ses collègues (2008, p. 1104) à se demander: nous sommes incertains quant à la validité et à la fiabilité des mesures des résultats? “Abrami et ses collègues ajoutent que, même lorsque les chercheurs déclarent explicitement qu’ils évaluent la CT, il reste encore le grand défi de s’assurer que les résultats mesurés sont liés à la conceptualisation et à la définition opérationnelle de la CT qui a servi de base à la pratique de l’enseignement dans les cas de recherche interventionnelle. Souvent, la relation entre les concepts de TDM enseignés et ceux qui sont évalués n’est pas claire, et la grande majorité des études dans ce domaine n’incluent aucune théorie pour aider à élucider ces relations.

En conclusion, résoudre le problème de la cohérence entre la conceptualisation, la formation et la mesure de la tomodensitométrie n’est pas une tâche facile. Je pense que les récents progrès dans le développement de l’échelle de CT (par exemple, le développement du HCTA et de ses versions adaptées) ont atténué le problème, étant donné qu’ils comblent maintenant le fossé entre la théorie actuelle et l’évaluation pratique. Cependant, ces progrès doivent être clarifiés pour les populations intéressées. Comme toujours, je suis très intéressé par les lecteurs qui pourraient avoir des idées ou des suggestions!

Les références

Abrami, CP, Bernard, RM, E. Borokhovski, A. Wade, MA Surkes, R. Tamim, et Zhang D. (2008). Interventions pédagogiques affectant les compétences et les dispositions en matière de pensée critique: une méta-analyse en phase 1. Review of Educational Research, 78 (4), 1102-1134.

Adams, MH, Whitlow, JF, Stover, LM et Johnson, KW (1996). Pensée critique en tant que résultat éducatif: Une évaluation des outils de mesure actuels. Infirmière éducatrice, 21, 23-32.

Dwyer, CP (2017). Pensée critique: perspectives conceptuelles et directives pratiques. Cambridge, Royaume-Uni: Cambridge University Press.

Dwyer, CP, Hogan, MJ et Stewart, I. (2014). Un cadre de réflexion critique intégré pour le 21ème siècle. Réflexion et créativité, 12, 43-52.

Ennis, RH, Millman, J. et Tomko, TN (1985). Tests de pensée critique de Cornell. CA: Critical Thinking Co.

Ennis, RH et Weir, E. (1985). Le test de pensée critique d’Ennis-Weir. Pacific Grove, Californie: Midwest Publications.

Facione, PA (1990a). Le test d’aptitude à la pensée critique en Californie (CCTST): formulaires A et B; le manuel de test du CCTST. Millbrae, Californie: California Academic Press.

Facione, PA (1990b). Le rapport Delphi: Comité sur la philosophie pré-universitaire. Millbrae, Californie: California Academic Press.

Halpern, DF (2003b). Le “comment” et le “pourquoi” de l’évaluation de la pensée critique. Dans D. Fasko (Ed.), Pensée critique et raisonnement: Recherche, théorie et pratique actuelles. Cresskill, NJ: Hampton Press.

Halpern, DF (2010). L’évaluation de la pensée critique de Halpern: manuel. Vienne: Schuhfried.

Ku, KYL (2009). Évaluer la performance critique des élèves: Demander des mesures en utilisant le format multi-réponses. Réflexion et créativité, 4, 1, 70-76.

Taube, KT (1997). Capacité de pensée critique et disposition comme facteurs de performance lors d’un test écrit de pensée critique. Journal of General Education, 46, 129-164.

Watson, G. et Glaser, EM (1980). Évaluation critique de Watson-Glaser. New York: Société psychologique.