La menace de stéréotype est-elle trop cuite, surévaluée et survendue?

La vente de la menace de stéréotype

La menace de stéréotype est l'un des phénomènes les plus célèbres et les plus influents de toute la psychologie. Le célèbre article (Steele & Aronson, 1995) dévoilant le phénomène a été cité plus de 5000 fois, selon Google Scholar. Et pour une bonne raison.

Les études originales semblaient révéler une découverte extraordinairement frappante. La différence moyenne généralement très grande dans les résultats des tests standardisés entre les Afro-Américains et les Blancs était, soi-disant, une différence superficielle et superficielle, facilement éliminée par l'un ou l'autre de deux petits ajustements aux conditions dans lesquelles de tels tests étaient administrés. Étant donné que, pendant plus de 50 ans, les éducateurs et les spécialistes des sciences sociales avaient trouvé qu'il était essentiellement impossible d'élaborer des programmes qui éliminaient les différences de rendement racial, il s'agissait d'une découverte «qui change le monde».

Quel était ce petit tweak situationnel? Encadrer le test en évaluant «les facteurs psychologiques dans la résolution de problèmes» plutôt que comme un test de «facteurs personnels dans la performance». «C'est ça?», Dites-vous. C'est vraiment ça. Cela était supposé fonctionner parce que, selon la théorie de la menace du stéréotype, les étudiants afro-américains deviennent souvent anxieux à l'idée de confirmer les stéréotypes raciaux, ce qui nuit à leur performance. Selon les interprétations largement répandues des découvertes de Steele et Aronson (1995), si l'on supprime cette menace, voilà! Les différences raciales ont disparu.

Based on Steele & Aronson, 1995
Source: D'après Steele & Aronson, 1995

Les barres noires sont pour les étudiants afro-américains; Les barres rayées sont pour les étudiants blancs. Ce chiffre est basé sur les résultats présentés dans Steele et Aronson, 1995, étude 2. Parce qu'ils ont seulement rapporté des tests de signification de la différence, et n'ont pas rapporté les valeurs, les valeurs ici sont des approximations basées sur une figure qu'ils ont présentée.

Regardez ces bars! Ils sont étonnants. Lorsque le test a été conçu comme un «défi», l'écart de réussite raciale a complètement disparu! Pas étonnant que ce document a été cité 5000 fois. Eureka! Enfin, quelqu'un a résolu le problème de l'écart de réussite raciale!

L'overselling de stéréotype Menace 1.0: Trop de recherches

Sauf qu'ils ne l'ont pas fait. La menace de stéréotype a été surestimée, sur-promue et survendue.

Comment cela peut-il être? Vous pouvez voir de vos propres yeux, n'est-ce pas, que la différence raciale s'est complètement évaporée lorsque le test a été conçu comme une résolution de problème? Que puis-je vous dire qui pourrait suggérer le contraire?

Les résultats ne sont pas ce qu'ils semblent être. Il est certainement vrai que si les résultats étaient des scores moyens de performance de test, qui sont comment ils sont étiquetés sur l'axe X, ils seraient en fait un World Changing Result montrant qu'un simple réglage situationnel peut éliminer les différences de réalisation raciale.

Mais regardez l'étiquette Y-Axis. Voir ce méchant petit, presque caché à la vue parenthétique "(ajusté par les scores SAT)"? Ce chiffre ne montre pas les résultats moyens des tests. Parce qu'il ne montre pas de moyens, il ne peut pas (et ne montre pas) que les moyens étaient égaux.

Il montre des scores de test moyens ajustés, contrôlant les scores SAT antérieurs. Cela change de façon cruciale la signification des résultats; et il change ce résultat changeant du monde à quelque chose d'un peu plus mondain. Plus précisément, ce résultat ne fournit aucune preuve que la différence de réalisation raciale ait même été réduite, et encore moins éliminée, un point d'abord fait dans un article publié il y a plus de dix ans (Sackett et al, 2004).

Comment cela peut-il être? Cette fausse équation des moyennes se fait à travers une technique statistique appelée Analyse de Covariance (ANCOVA). Si les hypothèses pour une ANCOVA sont remplies, et si les étudiants étaient vraiment assignés aléatoirement aux conditions, les moyens ajustés égaux n'indiquent pas des moyens égaux; ils indiquent que les différences antérieures ont simplement été maintenues. Si les hypothèses statistiques n'ont pas été respectées, le résultat est ininterprétable. Si l'assignation aléatoire a échoué, l'ensemble du résultat reflète une étude non expérimentale presque impossible à interpréter.

ANCOVA "contrôle" pour les scores SAT antérieurs. Il peut y avoir de bonnes raisons d'utiliser ANCOVA, mais il ne faut jamais confondre un vrai moyen avec un «covariable adjusted mean». Si nous «contrôlons» les différences antérieures (ie les éliminons) et n'obtenons aucune différence, ce n'est pas parce que nous avons conduit "élimine" cette différence; c'est parce que nous avons statistiquement enlevé la différence. Nous pouvons le faire, bien sûr, mais «l'égalité» devient une fiction statistique résultant de notre élimination des différences et la différence est toujours là. Des moyennes ajustées égales dans ANCOVA peuvent être un peu comme si on disait: «À l'exception de la différence moyenne de taille de quatre pouces entre les hommes et les femmes, leurs hauteurs moyennes sont identiques.

On peut peut-être le voir le plus facilement dans une petite analyse que nous avons menée récemment sur le sujet beaucoup moins controversé des différences de température entre Tampa et Anchorage. Nous avons choisi 20 jours dispersés tout au long de l'année et, quel choc, trouvé que Tampa en moyenne 40 degrés plus chaud qu'Anchorage.

Cependant, grâce à la magie de ANCOVA, nous pouvons faire disparaître cette différence "statistiquement". Nous avons simplement identifié les températures à Tampa et à Anchorage le jour précédent, et avons maintenant effectué une ANCOVA, «contrôlant les températures antérieures». La figure 2A montre l'énorme différence de 40 degrés de la température réelle. La figure 2B montre comment, en contrôlant les températures antérieures, il n'y a pas de différence de température entre Tampa et Anchorage.

Mais bien sûr, il n'y en a pas. Dire "il n'y a pas de différences, contrôler les différences antérieures" est une chose idiote et vide à dire. C'est comme dire: "Il n'y a pas de différence, après avoir enlevé la différence".

Autrement dit, en déclarant que «dans les conditions non menaçantes, les étudiants afro-américains et blancs ont exécuté de manière égale (en contrôlant les performances précédentes)» signifie essentiellement la même chose que «Tampa et Nome ont les mêmes températures (contrôlant pour les températures antérieures).

Figure 2A

Lee Jussim
Source: Lee Jussim

Figure 2B

Lee Jussim
Source: Lee Jussim

Températures moyennes ajustées covariantes, à Nome et Tampa sur 20 jours en 2014

Chiffres basés sur ceux apparaissant dans Jussim et al (sous presse). Statistiquement "contrôler" pour la différence de température entre Tampa les jours précédents, "élimine" la différence entre Tampa et Nome les jours suivants. Sauf, bien sûr, ceci est une fiction statistique.

Survente de la menace de stéréotype 2.0

Au cours des 10 premières années après la publication des études sur les stéréotypes originaux, ils ont été vendus comme montrant que «supprimer la menace et éliminer les différences raciales» (Jussim, Crawford, Anglin, Stevens et Duarte, sous presse, Sackett et al, 2004, voir aussi les références à la fin).

En réponse à la critique de Sackett et al., Même Steele & Aronson (2004, p.48) ont reconnu que ce n'était tout simplement pas vrai:

Deuxièmement, l'analyse étroite de Sackett et al. (2004) a peut-être aussi conduit à s'inquiéter trop de l'utilisation de l'analyse de covariance dans l'étude de Steele et Aronson (1995). Ils craignaient que cette analyse amène les lecteurs à croire que les Afro-Américains se sont comportés aussi bien que les Blancs dans la condition non-diagnostique (sans menace de stéréotype) de cette expérience, alors qu'en réalité, sans cet ajustement, ils seraient plus mauvais que les Blancs, comme prédit par la différence de groupe dans leurs SAT. Nous, autant que Sackett et al., Regrettons toute confusion que cette analyse commune aurait pu causer. "

Vous devez lire ce passage ci-dessus de près. Ce qui commence par une critique de l'argument de Sackett et al. Enfouit la reconnaissance que Sackett et al avaient raison! La reconnaissance critique vaut la peine d'être répétée: «… sans cet ajustement, ils seraient plus performants que les Blancs .» Et pourtant, l'affirmation «Steele & Aronson a trouvé que supprimer la menace et Black = les résultats des tests blancs» apparaît encore et encore (voir les exemples à la fin de ce post).

Mais c'est pire, ou, au moins, pas beaucoup mieux. Les psychologues sociaux réagissent souvent assez défensivement quand on nous accuse de ne pas être une «vraie» science. Certaines accusations de ce genre sont probablement portées par des gens qui n'aiment pas nos conclusions, mais je préférerais ne pas donner beaucoup de crédit à de telles critiques. Et les «vraies» sciences s'auto-corrigent, quand on a constaté qu'elles favorisaient des conclusions invalides.

Alors, comment faisons-nous l'autocorrection? On trouve fréquemment des revendications telles que:

Schmader, Johns et Forbes (2008, page 336) ont affirmé que les études originales (Steele et Aronson, 1995) ont montré que: «… les étudiants afro-américains ont obtenu des résultats moins bons que leurs homologues blancs sur des questions de test standardisées. ils ont diagnostiqué leur capacité verbale, mais leur performance était équivalente à celle de leurs pairs blancs lorsque les mêmes questions étaient simplement présentées comme un exercice de résolution de problèmes (et après avoir tenu compte des scores SAT antérieurs).

De même, Walton, Spencer et Erman (2013, p.5) ont écrit: «Dans une série classique d'études, les étudiants noirs ont obtenu des résultats inférieurs à ceux des étudiants blancs lors d'un test GRE décrit comme évaluant la capacité verbale, un domaine dans lequel les Noirs sont négativement stéréotypé. Mais lorsque le même test a été décrit comme non évaluatif – rendant le stéréotype non pertinent – les Noirs se sont comportés aussi bien que les Blancs (contrôlant les scores SAT, Steele & Aronson, 1995).

Ces déclarations sont techniquement vraies, hautement alambiquées et non uniques à ces documents. Le langage doit être compliqué, car pour que les affirmations soient vraies techniquement, la déclaration selon laquelle les scores afro-américains et blancs sont «équivalents» dans des conditions non menaçantes doit être revue en ajoutant la parenthèse relative au «contrôle des scores SAT antérieurs». Cette «marche arrière» rend la conclusion statistiquement vraie, mais aussi significative que de déclarer que Tampa et Anchorage ont des températures égales (en tenant compte de la température antérieure). Le résultat réel – les différences préexistantes ont continué même dans des conditions sans menace – n'est jamais explicitement indiqué dans ces descriptions de Steele & Aronson (1995).

Maintenant, en toute équité, tous les chercheurs sur les menaces stéréotypées ne s'engagent pas dans cette surenchère des résultats, et même beaucoup d'entre eux reconnaissent aussi, lorsqu'ils discutent de recherches autres que Steele & Aronson (1995), que la menace stéréotypée ne fournit pas une explication complète de la réussite raciale différences. En outre, les résultats sous les conditions «menaçantes» (test de capacité verbale) indiquent que quelque chose d'intéressant est arrivé dans les études originales – parce que ces moyens sont ajustés, ils indiquent que les différences raciales augmentaient quand les étudiants afro-américains croyaient qu'ils étaient testés sur leur capacité verbale. Menacer des étudiants afro-américains de cette manière a semblé empirer leur accomplissement, au moins dans ces études.

La menace du stéréotype n'est probablement pas aussi grave que l'achat d'un pont pour un désert de l'Arizona. Cependant, de nombreux examens et même méta-analyses de la menace stéréotypée sont menés par des «défenseurs» – ceux qui ont embrassé l'idée avec enthousiasme, ont publié beaucoup de recherches «démontrant» l'importance de la menace stéréotypée, et qui rarement, sinon jamais, travailler à des tests sceptiques de falsification.

Les analyses sceptiques soulèvent des doutes sur la puissance de la menace de stéréotype

Une «analyse hétérodoxe» est une analyse qui remet en cause une orthodoxie enracinée (l'expression «h» en minuscules renvoie à l'idée de contester les orthodoxies, j'utiliserai le terme «H» pour désigner les membres de l'Académie Hétérodoxe et l'érudition). Les tests de plaidoyer sont ceux qui sont conçus pour «prouver» l'ampleur ou l'importance d'un phénomène (ou le peu et l'importance de ce phénomène, selon que le fait d'être grand ou petit fait avancer le programme de plaidoyer). Ils sont «démonstratifs» et certains d'entre nous croient qu'ils sont autant ou plus théâtre que science. Mon point de vue est que la vraie science implique des tests sceptiques pour falsifier les théories et les croyances chéries, Karl Karl Popper. Falsification absente, les gens intelligents peuvent «prouver» presque n'importe quoi. Ils peuvent habituellement le faire même avec une forte falsification, mais c'est au moins plus difficile.

Sydney Festival
Source: Festival de Sydney

Simplement essayer de falsifier une croyance chérie, cependant, crée souvent des risques pour le falsificateur, quelque chose de bien connu de Copernic par Galilée et Darwin. C'est tout aussi vrai aujourd'hui, mais, au contraire, ces croyances sacrées chères, au moins dans les sciences sociales, impliquent souvent une certaine variation sur «égalitarisme». La menace de stéréotype, bien sûr, est un grand outil rhétorique dans la quête de l'égalitarisme. oh, regardez la base situationnelle fragile pour les différences raciales dans la réussite "). Il est donc risqué sur le plan professionnel de contester des idées qui servent une rhétorique égalitaire.

Il y a cependant eu une petite poignée d'analyses sceptiques menées par des personnes extérieures, par des personnes qui n'ont pas misé une partie importante de leur carrière sur l'importance réelle ou imaginée de la menace du stéréotype. Par exemple, Flore & Wicherts (2015) a réalisé la seule méta-analyse dont je suis conscient qui a soumis les résultats de la menace de stéréotype à toute une famille de tests sceptiques, tels que les courbes p, les entonnoirs et les parcelles forestières, et les tests de résultats significatifs. Les résultats ne sont pas beaux et montrent que les effets apparaissent principalement dans les études à petite échelle sous-alimentées, et disparaissent ou s'inversent complètement dans les études à grande échelle très puissantes. Uli Schimmack a également montré que les études sur les menaces stéréotypées ont probablement beaucoup de mal à se reproduire.

En outre, comme Amy Wax (2009) de l'Académie Hétérodoxe l'a si bien souligné, les effets stéréotypés des menaces chez les Afro-Américains ont été principalement obtenus dans des échantillons très sélectifs et non représentatifs. Une série de conditions aux limites ont été proposées, ce qui est une autre façon de dire: «cela pourrait ne s'appliquer qu'à certaines personnes dans certaines circonstances». Cela ne signifie pas que la menace de stéréotype est inexistante. Cela signifie cependant que la généralisabilité des résultats et la mesure dans laquelle ils expliquent en grande partie les très grandes différences raciales dans la réussite scolaire sont, au mieux, douteuses, inconnues et certainement pas une «science établie».

Que va-t-il se passer ensuite?

Très probablement, les chercheurs sur les menaces stéréotypées continueront de marcher comme si de rien n'était. Ils vont probablement défendre leur territoire et ignorer les critiques convaincantes de leurs conclusions (ou nier qu'ils sont convaincants). S'ils répondent du tout, ils vont probablement produire, pas des excuses pour avoir trompé tant de gens, mais des excuses – des défenses de leurs positions et revendications. Tant que les critiques hétérodoxes sont rares, les partisans de la menace stéréotypée peuvent probablement continuer de cette façon, car leur travail sera probablement soumis à un examen sceptique, silencieux et intermittent, le cas échéant. Pour ce qui est de faire avancer sa carrière, de se faire publier, d'obtenir des subventions, etc., c'est probablement une stratégie très efficace. Les récits égalitaires, aussi injustifiés ou fragiles soient-ils, ont tendance à jouer très bien entre les organismes subventionnaires et les réviseurs de revues. Ce qui nous ramène à l'une des principales inspirations de HeterodoxAcademy: Les dysfonctionnements scolaires qui résultent du manque de diversité intellectuelle et politique dans l'académie

Comment pourrait-il être différent?

J'espère que cette vision pessimiste est fausse. J'invite tout porte-parole de la menace du stéréotype à se manifester et à reconnaître que la région a mal tourné et qu'elle peut mieux faire. Ce serait formidable, pas seulement pour la façon dont les gens comprennent la menace stéréotypée, et pas seulement pour faire quelque chose pour élever le statut scientifique et la crédibilité de mon domaine de psychologie sociale (bien que cela fasse les deux). Traiter la maladie sociale droite (inégalité académique) avec un «médicament» faible ou inefficace est aussi susceptible d'être efficace que de traiter la pneumonie avec de l'aspirine. Une menace stéréotypée excessive ne rend pas service à ceux que la recherche est censée aider. Cela est particulièrement poignant quand on considère les «coûts d'opportunité» – les millions dépensés en subventions pour des recherches stéréotypées sur des menaces qui auraient pu être consacrées à d'autres types de recherches non financées, et l'espace journal dédié à la menace stéréotypée cela aurait pu contribuer davantage aux compréhensions fondamentales de la psychologie humaine et / ou aux interventions académiques ciblant des phénomènes susceptibles de faire des différences plus importantes, comme l'amélioration effective de la qualité de l'éducation que reçoivent les étudiants des minorités.

Les références

Flore, PC, & Wicherts, JM (2014). La menace du stéréotype influence-t-elle la performance des filles dans les domaines stéréotypés? Une méta-analyse. Journal of School Psychology, 53 , 25-44.

Jussim, L., Crawford, JT, Anglin, SM, Stevens, ST, et Duarte, JL (sous presse). Interprétations et méthodes: Vers une psychologie sociale autocorrectrice plus efficace. Journal of Experimental Social Psychology.

Sackett, PR, Hardison, CM, & Cullen, MJ (2004). Sur l'interprétation de la menace de stéréotype en tenant compte des différences entre les Afro-Américains et les Blancs sur les tests cognitifs. Psychologue américain, 59 , 7-13.

Schmader, T., Johns, M. et Forbes, C. (2008). Un modèle de processus intégré d'effets de menace de stéréotype sur la performance. Psychological Review, 115, 336-356.

Steele, CM, et Aronson, JA (2004). Steele et Aronson (1995) ne vivent pas la menace du stéréotype. Psychologue américain, 59 , 47-48.

Walton, GM, Spencer, SJ et Erman, S. (2013). Méritocratie affirmative. Questions sociales et examen des politiques, 7 , 1-35.

Wax, A. (2009). Menace stéréotype: un cas de syndrome de surclassement? Dans CH Sommers (Ed.), La science sur les femmes et la science (pp. 132-169). Washington DC: Presse AIE.

D'autres exemples de la façon dont les résultats de Steele & Aronson sont systématiquement déformés ou mal interprétés comme «montrant» que «supprimer la menace, et Black = scores blancs»:

http://www.reducingstereotypethreat.org/definition.html (récupéré le 29/12/15):

"Lorsque la race n'a pas été soulignée, cependant, les étudiants noirs ont obtenu de meilleurs résultats que les étudiants blancs."

http://www.apa.org/research/action/stereotype.aspx (récupéré le 29/12/15):

"Dans la condition de non-stéréotype-menace dans lequel le même test a été décrit comme une tâche de laboratoire qui n'indiquait pas la capacité-la performance des Noirs a augmenté pour correspondre à celle des Blancs également qualifiés. "

Pigliucci, M. (2013). Que devons-nous faire du concept de race? Pensées d'un philosophe-scientifique. Etudes en Histoire et Philosophie des Sciences Biologiques et Biomédicales, 44 , 272-277. Page 276:

"Steele et Aronson (1995), entre autres, ont examiné les tests de QI et les tests ETS (par exemple SAT, GREs, etc.) pour voir si les performances intellectuelles humaines peuvent être manipulées avec des astuces psychologiques simples qui favorisent les stéréotypes négatifs. s'identifier avec. Notoirement, le tour a fonctionné, et par conséquent nous pouvons expliquer presque tout le fossé entre les blancs et les noirs sur les tests d'intelligence comme artefact de menace de stéréotype, un biais de situation de test jusqu'ici inconnu.