Quand “Big Data” va à l’école

Transformer les élèves en nombres devrait nous rendre mal à l’aise

Voici une règle pour vous: L’enthousiasme d’une personne à l’égard de l’emploi de «données» dans l’éducation est directement proportionnel à sa distance par rapport aux étudiants réels. Les décideurs politiques et les économistes se réfèrent généralement aux enfants dans leur ensemble, les considérant généralement comme une source de chiffres à traiter. Ils le font encore plus que les consultants et les surintendants, qui le font plus que les directeurs, qui le font plus que les enseignants. En fait, les meilleurs enseignants ont tendance à éviter les discussions sérieuses sur les avantages de «l’instruction basée sur les données», l’utilisation de «data coaches», les «data murs», etc.

Pire encore, les données en question ne sont généralement que des résultats de tests standardisés – même si, comme je l’ai expliqué ailleurs, ce n’est pas la seule raison d’être perturbé par ce partage de données. Et cela n’aide pas lorsque le processus de quantification des enfants (et de l’apprentissage) est orné d’adjectifs tels que “personnalisé” ou “personnalisé”.

Mais voici la question d’aujourd’hui: si la collecte et le tri des données sur les étudiants nous rendent mal à l’aise, comment devrions-nous nous interroger sur le rôle croissant du Big Data?

Commençons par noter que ce terme ne semble pas avoir de sens précis. Certaines personnes supposent qu’il s’agit simplement de rassembler plus d’ informations numériques. Certains disent que cela se réfère principalement aux techniques de modélisation statistique utilisées pour faire des prévisions basées sur les données collectées. Et au moins un auteur croit que le terme est maintenant utilisé principalement par les critiques – pour faire référence à une attitude extrêmement vénérée envers les données.

Pour être juste, aspirer d’énormes quantités de descripteurs numériques peut parfois nous permettre de voir des modèles et de faire des prédictions. Comme une vue aérienne, il offre une perspective unique qui a ses utilisations. Christian Rudder plaide en faveur des données volumineuses dans son livre Dataclysm de 2014, et son pouvoir de persuasion pourrait en partie s’expliquer par le fait qu’il est drôle, sans prétention, politiquement progressiste et qu’il aime parler de sexe. “Ce ne sont pas des chiffres qui nous priveront de notre humanité; c’est la décision calculée de cesser d’être humain », soutient-il à un moment donné.

Mais je crains que cela ne soit qu’une version de l’ancien canard selon laquelle la technologie, en soi, est neutre, que tout dépend de la façon dont elle est utilisée. À ce jour, nous aurions dû réaliser que les méthodes laissaient une empreinte sur les objectifs et que la technologie en particulier avait un impact causal. (Lisez Amusing Ourself à la mort de Neil Postman et The Shallows de Nicholas Carr si vous n’êtes pas encore convaincu.) La réduction inconsidérée des êtres humains en nombre est choquante, peu importe ce qui est fait avec ces chiffres. Une vue aérienne par définition ne parvient pas à capturer l’individualité des personnes sur le terrain et il y a un prix à payer si nous passons nos journées à regarder l’humanité – ou même la littérature [1] – de cette manière.

Le problème réside en partie dans le fait que nous finissons par ignorer ou minimiser l’importance de tout ce qui ne se prête pas à l’analyse des données. C’est un peu comme la vieille blague du type qui cherchait ses clés perdues la nuit près d’un réverbère, même si ce n’est pas là qu’il les a laissées tomber. (“Mais la lumière est tellement meilleure ici!”) Il n’est pas étonnant que la recherche en éducation – de plus en plus menée par des économistes – repose de plus en plus sur des ensembles de données énormes constitués de résultats de tests standardisés. Ces scores peuvent être des représentations moche de l’apprentissage – et, en fait, de manière extrêmement trompeuse. Mais, par gomme, ils sont facilement disponibles.

“Qu’est-ce qui est laissé de côté?”, Alors, est une question critique à poser. Noam Scheiber, un journaliste qui couvre les problèmes du lieu de travail, a récemment observé que les mégadonnées “augmentent massivement l’asymétrie de puissance entre exploiteurs et exploités” (pour plus d’informations, consultez Cathy O’Neil). livre Weapons of Math Destruction [2]) Et ces questions doivent être posées sur le big data dans l’éducation autant que partout ailleurs. Dans le contexte de la maternelle à la 12e année, comme je l’ai déjà noté, cela implique généralement des résultats de tests standardisés – pas seulement un examen sommatif et souvent élevé, mais un régime de test incessant cela vise à conduire l’enseignement tout au long de l’année. Dernièrement, cette même sensibilité réductrice s’est infiltrée dans l’enseignement supérieur, à la grande consternation de nombreux enseignants, sous le slogan “évaluation des résultats d’apprentissage”.

Mais les “données” à l’université peuvent également se référer aux notes. [3] Une étude de cas intéressante a paru au début de 2017 dans un compte rendu essentiellement peu critique paru dans le New York Times . Il semble que plusieurs entreprises ont convaincu les universités de payer pour des programmes informatiques utilisant l’analyse prédictive pour suivre les progrès des étudiants, l’idée étant de déterminer si un faible niveau dans un cours donné peut être associé à un risque d’abandon. “Nos Big Data n’ont pas besoin de savoir exactement pourquoi un étudiant obtient une mauvaise note”, a expliqué un administrateur. “Nous regardons un modèle.”

Ce que les analystes de données colportent, c’est la capacité de faire plus de chiffres, d’examiner non seulement les MPC, mais aussi les notes de cours individuelles (pour tous les étudiants). Notez que personne ne propose de repérer les problèmes en s’asseyant avec les élèves et en leur demandant comment vont les choses – du moins pas avant que l’ordinateur ne signale les problèmes. Le diagnostic de risque est basé sur ce que le logiciel dit de ses notes plutôt que sur ce que les étudiants eux-mêmes pourraient dire.

De plus, nous sommes invités à accepter que si les étudiants n’obtiennent pas une bonne note dans ce cours, ils ne le feront probablement pas non plus – et cela reflète une lacune avec les étudiants plutôt qu’avec la qualité des cours – être enseigné et comment. L’enthousiasme pour les données volumineuses – plus de chiffres que jamais! – est une distraction séduisante de poser des questions troublantes sur ce que ces chiffres représentent. Ou ce qu’ils excluent nécessairement.

Par analogie, pensez à ces affirmations répandues selon lesquelles «les études montrent qu’il est avantageux de faire en sorte que les élèves suivent des cours avancés de mathématiques au secondaire. Ces affirmations sont citées avec respect malgré le fait qu’elles offrent un exemple classique de ce que l’on appelle un effet de sélection: ce n’est pas tant que la prise de calcul aide les élèves mais que les élèves qui prennent des calculs tendent à réussir plus tard. Deuxièmement, «bénéfique» se traduit souvent par «corrélation avec le succès des cours de mathématiques ultérieurs», ce qui pose la question de savoir pourquoi la grande majorité des étudiants doivent en suivre. [4] (La recherche prouve aussi de manière convaincante qu’il est avantageux de prendre le latin 1 … en ce sens que cela va grandement améliorer les notes en latin 2.) Je pense que la même chose vaut pour les déclarations sur la valeur des statistiques concises. cours d’introduction où il est essentiel d’obtenir une bonne note.

Quiconque a observé l’enthousiasme de former les élèves à montrer plus de “courage” ou à développer une “mentalité de croissance” devrait savoir ce que signifie se concentrer sur l’enfant pour mieux s’adapter au système plutôt que de poser des questions système lui-même. En gros, le Big Data nous donne plus d’informations, basées sur les notes, sur les enfants à corriger (et quand et comment), rendant encore moins probable la possibilité de contester les effets destructeurs de la pratique . [5]

L’analyse prédictive permet aux administrateurs de croire qu’ils surveillent de près leurs accusations alors qu’en réalité ils n’apprennent rien de l’ expérience de chaque élève, de ses besoins, de ses peurs, de ses espoirs, de ses croyances et de son état d’esprit. La création d’un ensemble de données «personnalisé» souligne à quel point l’interaction avec les élèves est personnelle et peut même aggraver ce problème. En même temps que cette approche réduit les êtres humains à une pile de données de performance académiques, elle décourage également la réflexion critique sur la manière dont le système, y compris l’enseignement et l’évaluation, affecte ces êtres humains.

Aucune de ces objections n’est abordée par la collecte de données sur d’autres aspects de la vie des étudiants. Le même article du New York Times décrit une expérience de «suivi des étudiants de première année… alors qu’ils passent leur carte d’identité pour aller à la bibliothèque ou au gymnase, payer un repas à la cafétéria ou acheter un sweat dans la librairie interaction. “Ces morceaux de données ne nous permettent pas de prétendre que nous connaissons un étudiant donné. Ils ne nous invitent pas non plus à examiner les problèmes structurels sous-jacents de leur éducation. L’expansion du Big Data suscite des inquiétudes supplémentaires à propos de Big Brother, étant donné que davantage d’activités des étudiants sont surveillées. (Cela suggère également la possibilité troublante que certaines écoles signalent des élèves à risque non pas pour les aider mais pour s’en débarrasser afin d’améliorer le taux de diplomation à temps de l’institution.)

Lorsque les enseignants réduisent les élèves en données, ils manquent énormément. Quand ils utilisent des données volumineuses, ils peuvent même aggraver les choses.

REMARQUES

1. Oui, les rédacteurs de nombres se sont fixés pour tâche de tirer des conclusions sur la littérature en se basant sur des tabulations informatiques de l’apparition de mots spécifiques dans une vaste collection de livres. Si votre réaction est que quelque chose d’important a été manqué, la même réaction serait probablement appropriée lorsque des données volumineuses concernent l’éducation ou la psychologie.

2. Voir aussi Black Box Society de Frank Pasquale et cette bibliographie d’autres critiques. Pour un bref aperçu des préoccupations méthodologiques – un rappel que les données nous disent souvent beaucoup moins que nous supposons, voir cet essai.

3. Cela devrait être un rappel utile du fait que le problème ne concerne pas uniquement une métrique particulière, mais la dépendance excessive à la quantification elle-même. Plutôt que de demander “Comment mesurons-nous …?”, Les éducateurs et les décideurs politiques devraient se demander “Comment évaluons-nous …?” Afin d’éviter de nous enfermer dans le sous-ensemble de l’évaluation exigeant une réduction des chiffres.

4. Sur le premier point, voir le regretté Grant Wiggins, “Un diplôme qui vaut la peine”, Leadership pédagogique , mars 2011, p. 31-2. Sur le deuxième point, voir Andrew Hacker, Le mythe mathématique – Et autres délires de la tige (New Press, 2016). Voir aussi Nicholson Baker, «Wrong Answer: The Case Against Algebra II», Harper’s , septembre 2013, p. 31-8.

5. J’ai entendu que, sous l’influence du gourou de la gestion, W. Edwards Deming, lorsqu’un ouvrier de la chaîne de montage de Toyota avait fait une erreur, les dirigeants lui serraient la main et le remerciaient d’avoir contribué à révéler un défaut de conception du système. Ces gestionnaires ont compris que le système est principalement responsable du succès ou de l’échec des individus sur le lieu de travail – ce qui indique que récompenser ou punir des personnes (par exemple, plans d’incitation et autres systèmes de rémunération) est non seulement manipulateur et destructeur. la motivation intrinsèque, mais aussi simplement un exercice consistant à manquer le point.