Réformer notre système de test obsolète

Les cibles potentielles de la réforme scolaire comprennent le curriculum (ce qui devrait être enseigné), l'enseignement (comment se déroule l'enseignement et qui le fait) et les tests (la méthode par laquelle l'apprentissage est mesuré). Puisque j'ai déjà discuté des instructions, j'aimerais utiliser cet article pour discuter de ce qui doit être changé à propos des tests, un processus qui est actuellement aussi obsolète que l'enseignement en classe lui-même.

Une grande partie de cette obsolescence résulte de la dépendance continue de l'industrie des tests pédagogiques aux hypothèses qui sous-tendent le modèle psychométrique classique qui a nourri, et a été avancé par, les premières tentatives de développer des tests d'intelligence et d'aptitude. Hypothèses qui peuvent avoir été jugées acceptables pour des constructions qui (a) étaient d'étiologie inconnue, (b) possédaient des domaines d'items qui ne pouvaient être spécifiés de manière exhaustive et (c) étaient considérées (incorrectement) comme stables et immuables à l'instruction. D'une importance égale, un score parfait (ou un score de zéro) sur les tests qui en résultent ne pouvait pas être interprété quantitativement car il était impossible pour un humain d'atteindre la perfection (ou d'être complètement dépourvu) des attributs en question.

D'un autre côté, l'apprentissage scolaire ne possède aucune de ces contraintes, bien que les tests de «réussite» commerciale soient construits comme si c'était le cas. Cela s'est avéré très regrettable puisque les objectifs réels des tests d'éducation sont d'identifier la part du programme que chaque élève a maîtrisé et ce qu'il faut enseigner (ou réapprendre).

Comment les tests de l'apprentissage scolaire devraient être construits

Puisque nous connaissons les causes de l'apprentissage (enseignement) et de ce qui devrait être enseigné dans nos écoles (le programme d'études), l'évaluation de l'apprentissage scolaire n'est guère une science de fusée. En supposant que notre période d'essai continue à être une année scolaire, «tout» nous devons faire est:

1. Précisez l'ensemble du programme de l'école élémentaire en utilisant suffisamment d'objectifs pédagogiques pour permettre la rédaction de plusieurs items de test pour chaque objectif.

2. Construire des tests d'apprentissage scolaire par une procédure transparente et défendable à partir de cette liste d'objectifs pédagogiques et d'items de test. Ces tests peuvent être basés sur des sujets académiques uniques (par exemple, les mathématiques, la compréhension en lecture) ou des sujets d'enseignement plus spécialisés au sein d'une matière (par exemple, le vocabulaire de lecture à vue).

3. Administrer chaque test deux fois (de préférence via des ordinateurs afin que les résultats puissent être immédiatement disponibles, stockés de manière sécurisée et correctement distribués), une fois au début de l'année et une fois à la fin. (Il n'est pas nécessaire d'évaluer deux fois des objectifs ou des éléments identiques, car il n'est pas difficile d'assurer l'équivalence si les mêmes procédures d'échantillonnage sont utilisées, mais il faut administrer les tests deux fois pendant la même année. sur ce qui se passe pendant les mois d'été.)

La différence entre les résultats des tests de début d'année et de fin d'année représentera alors la quantité absolue du programme d'études que chaque étudiant a appris au cours de cette année. La plus grande partie dépendra de l'enseignement scolaire, bien qu'il y ait (et qu'il y aura toujours) une erreur associée aux conclusions basées sur les résultats d'un test, un élève peut avoir ressenti pendant l'une des séances d'essai, une exposition à une école supplémentaire instruction, et ainsi de suite. Aucune mesure jamais développée (physique, psychologique ou éducative) n'est effectuée sans un certain degré d'erreur.)

Les scores de tests ainsi construits présentent un certain nombre de caractéristiques intéressantes, dont certaines sont:

1. Il n'est pas nécessaire d'utiliser des scores standard (tels que les équivalences de notes, les rangs de centiles, etc.). Toutes ces manipulations algébriques, y compris la courbe normale elle-même, sont utilisées uniquement pour classer les scores d'ordre afin de les comparer les uns aux autres, ce qui n'est nécessaire que lorsqu'un test est incapable de mesurer la quantité absolue de quelque chose. Les tests évaluant l'apprentissage scolaire devraient être capables de produire des zéros significatifs (indiquant qu'aucun programme n'a été appris) et des scores parfaits (c'est-à-dire une maîtrise à 100% du curriculum). En d'autres termes, les scores produits par ces tests représenteraient la quantité d'apprentissage qui a lieu. Les réduire à une simple liste ordonnée serait une idiotie.

2. Des tests comme ceux-là ont des implications pédagogiques directes en soi puisque chaque item représente un objectif pédagogique et qu'un item manqué représente donc un concept spécifique non appris qui doit être enseigné (ou ré-enseigné). L'unité d'analyse la plus significative devient donc souvent la réponse d'un élève à chaque élément individuel.

3. Parce que toutes les parties intéressées (enseignants, parents et élèves) pourraient avoir accès aux objectifs pédagogiques qui devraient être enseignés et aux types d'items qui seront utilisés pour évaluer l'apprentissage: (a) les enseignants devraient enseigner le test et devraient employer des tests simulés basés sur des items similaires (mais pas identiques) pour déterminer quels élèves maîtrisent les objectifs qui suivent immédiatement l'instruction; (b) les parents auraient également la capacité d'évaluer les progrès de leurs enfants pendant l'année scolaire; et (c) les étudiants se familiariseraient à la fois avec le processus de test et les types d'items auxquels ils seront confrontés à la fin de l'année.

4. Des ressources comme celles-ci (l'existence d'une traduction complète du programme par le biais d'objectifs pédagogiques, accompagnés chacun d'exemples de tests) pourraient également accélérer le développement de logiciels supplémentaires de tutorat numérique, rendre le tutorat humain supplémentaire plus efficace et réduire les effets des compétences de prise de test différentielles contribuant à l'écart des tests socio-économiques.

De mon point de vue, la seule question sans réponse est de savoir pourquoi il devrait y avoir une quelconque résistance, en dehors de l'industrie des tests, à substituer un tel processus à notre modèle de test actuellement obsolète.

Pour une discussion plus complète sur les tests scolaires, voir le chapitre huit de TROP SIMPLE POUR ÉCHOUER: un cas de changement dans l'éducation (Oxford University Press) [[email protected]]