Un biais de moyenne

L’amour de partialité est non partagé – encore une fois.

“Αν μέτρον άριστον. [Tout avec modération.] ” —Kleoboulos de Lindos, attribué, VIe siècle avant notre ère.

La capacité d’établir une moyenne sur des données bruitées est essentielle pour une cognition et une prise de décision efficaces. Les étudiants initiés à la distribution des erreurs gaussiennes sont gâtés car cette distribution est non seulement normale, mais aussi belle. Le fait qu’il existe différentes mesures de la « tendance centrale » n’a pas encore été compris, car avec Gauss, elles sont toutes identiques: la moyenne (la moyenne arithmétique), le mode (le pic) et la médiane (le 50e centile). ). Lorsque le biais est introduit, les trois voies se séparent. Pour une distribution asymétrique négative (avec la queue mince à gauche) et avec des nombres en hausse à partir de la gauche, le mode est supérieur à la médiane, ce qui est supérieur à la moyenne.

Lorsque les chercheurs présentent aux participants une série de chiffres et leur demandent d’estimer la moyenne, ils ont intérêt à expliquer les trois types de tendance centrale et à préciser laquelle ils recherchent. Les chercheurs semblent souvent présumer que demander une «moyenne» sera compris comme une «moyenne arithmétique». Lorsque les estimations moyennes s’écartent des moyennes réelles, ils concluent qu’il se passe quelque chose d’intéressant.

Si les estimations moyennes atteignaient toujours bien les moyennes réelles, il n’y aurait pas beaucoup de psychologie (Peterson & Beach, 1967). Les divergences soulèvent des questions sur ce que les gens font réellement pour résoudre le problème et comment le modéliser. Parducci (1965) a présenté un compte-rendu simple et élégant de la moyenne. Selon sa théorie plage-fréquence (RFT), les estimations des moyennes découlent d’un compromis entre un principe de plage et un principe de rang . Le principe de plage prend la moitié de la valeur observée entre le plus petit et le plus grand, et le principe de rang prend la médiane. Si les deux diffèrent, divisez la différence. La RFT réussit bien à prédire la performance humaine dans la moyenne des tâches dans une grande variété de contextes (Wedell et Parducci, 2000).

De temps à autre, les chercheurs tentent de réinventer la RFT ou de l’améliorer – avec un succès limité. Dans un essai précédent (Krueger, 2018), j’ai décrit les efforts déployés par une équipe de Harvard pour introduire un nouveau concept d’ expansion de catégorie , pour constater que la RFT décrit bien les données sans nécessiter un processus psychologique inédit, sans parler de «biais».

Des chercheurs de Yale et de Cornell nous parlent maintenant d’un bia s binaire , une soi-disant heuristique de calcul de moyenne qui produit une erreur systématique (Fisher & Keil, 2018; Fisher et al., 2018). Le péché psychologique du jour est la dichotomisation. La moyenne est difficile, et on pense que les répondants divisent la plage des valeurs observées en une moitié gauche et une moitié droite (rappelez le principe de la plage), pour ensuite estimer le nombre d’observations dans chaque moitié et soustraire un compte de l’autre pour arriver. à un score de déséquilibre. Cela ressemble beaucoup à RFT car il reprend le principe de plage (en utilisant la demi-plage comme critère de dichotomisation) et le principe de rang (en utilisant des variations du biais de distribution). En effet, la mesure dépendante critique, le score de déséquilibre , prédit des estimations de la moyenne sur toute la plage. Étonnamment, cependant, le modèle de calcul du biais binaire est muet sur la façon dont le score de déséquilibre se traduit en une moyenne estimée; il prédit seulement que les deux sont corrélés sur des paires de distributions.

J. Krueger

Un conte de 2 menus

Source: J. Krueger

Pour tester l’hypothèse de biais binaire, les auteurs construisent des paires de distributions où les deux moyennes sont identiques mais l’ inclinaison est différente. Désormais, l’alignement affecte à la fois le score de déséquilibre et la médiane, confondant ainsi les deux. Prenons l’exemple des deux menus (présentés dans la première figure insérée). Il y a 10 éléments au menu. Les prix varient de 12 $ à 20 $ dans le menu 1 et de 10 $ à 17 $ dans le menu 2. Ainsi, le médium est de 16 $ dans le menu 1 et 13,5 $ dans le menu 2. Dans le menu 1, 7 articles sont moins chers que le prix moyen, et 3 sont plus cher. Cela donne un score de déséquilibre de 4 (7 – 3). Dans le menu 2, 2 articles sont plus chers que le milieu de gamme et 8 sont moins chers. Cela donne un score de déséquilibre de -6 (2 – 8). Selon les prévisions, les répondants estiment un prix moyen inférieur pour le menu 1 à celui du menu 2, et c’est effectivement le cas. Et voilà , le biais génère une erreur.

Pourtant, la médiane montre la même inégalité. La distribution des prix pour le menu 1 est positivement asymétrique (la plupart des plats étant bon marché), tandis que la distribution pour le menu 2 n’est pas asymétrique. Le prix médian dans le menu 1 est de 14 $ et le prix médian dans le menu 2 est de 16 $. Cette partie de la RFT se porte bien. Si, toutefois, les répondants devaient donner un poids égal aux prix médian et moyen, lors de l’estimation des moyennes, la moyenne estimée pour le menu 1 serait légèrement supérieure à la moyenne estimée pour le menu 2.

La possibilité que les répondants prennent simplement la médiane lors de l’estimation de la moyenne se présente comme une alternative psychologique plausible. Les auteurs notent à maintes reprises la confusion entre les préjugés binaires et les jugements fondés sur la médiane, mais ne font rien pour y remédier. Le test le plus direct se trouve dans l’étude 7 de Fisher et al. (2018). Ici, nous trouvons 3 types de paires de distribution. Dans les trois paires, la distribution avec le biais positif a une moyenne légèrement inférieure à la distribution avec le biais négatif. Étant donné que les nombres présentent un intérêt dans cette expérience, tous les répondants devraient choisir parmi cette dernière distribution; mais la plupart ne le font pas, ce qui est compatible avec le biais binaire. Les résultats sont pratiquement les mêmes lorsque les 5 cellules sont étiquetées de «très pauvre» à «très bien». Ici, la demi-plage coïncide avec l’étiquette neutre. Dans la troisième condition, cependant, les répondants trouvent une échelle univalente allant de «passable» (1) à «extrêmement bon» (5). Environ la moitié de ces répondants préfèrent encore la distribution avec la différence moyenne inférieure mais positive. Les auteurs concluent que l’introduction d’étiquettes n’a aucune importance si la source de l’erreur est biaisée.

C’est une façon curieuse d’essayer de séparer les hypothèses concurrentes. L’introduction d’étiquettes de «juste» (1) à «extrêmement bon» (5) génère une nouvelle concurrence à la fois pour le biais binaire et le compte asymétrique. Dans cette condition, la limite de catégorie suggérée sémantiquement est passée de 3 à 1,5. Il existe maintenant une forte demande pour regrouper toutes les notes contenant le mot «bien». Et il se trouve que la distribution avec la moyenne inférieure contient moins d’éléments «équitables» que la distribution avec la moyenne supérieure. Ce test n’est pas rigoureux, car il se fonde sur l’idée que tout effet significatif réfute l’hypothèse ne prédit aucun effet (Krueger & Heck, 2017). En déployant une manipulation forte suggérant une demande, le jeu est empilé. Avec une signification en main, on oublie facilement que même dans ces circonstances urgentes, la plupart des réponses étaient similaires aux réponses des deux autres conditions et non différentes de celles-ci.

J. Krueger

Que ce soit un steak!

Source: J. Krueger

Bien que ce test puisse ne pas être terrible, il faut le considérer comme faible quand on lui demande de faire tout le travail. Il n’est pas difficile de trouver un autre moyen, complémentaire, d’opposer l’hypothèse du biais binaire à l’hypothèse de biais. Revenons au paradigme du menu et ajoutons un article coûteux (steak ribeye pour 30 $) à chaque liste. La deuxième figure montre que les moyennes ont augmenté et que la deuxième liste conserve un prix médian plus élevé. De manière critique, le score de déséquilibre est maintenant équilibré, de sorte qu’aucun biais binaire n’est prédit. La RFT, en utilisant à la fois les informations de demi-portée et de classement, prédit une toute petite différence.

Avec un peu plus de recherche, nous pourrons alors savoir si nous avons besoin du nouveau concept de biais binaire. Une partie de l’attractivité – trompeuse – de cette recherche est qu’elle utilise l’observation non controversée voulant que les gens catégorisent spontanément les stimuli continus (Krueger et Clément, 1994; Tajfel, 1969) pour affirmer que cette tendance compromet la connaissance croisée entre les catégories en moyenne.

Références

Fisher, M. et Keil, FC (2018). Le biais binaire: une distorsion systématique dans l’intégration de l’information. Science psychologique . DOI: 10.1177 / 09567718792256

Fisher, M., Newman, GE et R. Dhar (2018). Voir les étoiles: Comment le biais binaire déforme l’interprétation des notes des clients. Journal of Consumer Research . DOI: 10.1093 / jcr / ucy017

Krueger, JI (16 juillet 2018). Problèmes sociaux et cognition humaine. Psychology Today en ligne . https://www.psychologytoday.com/intl/blog/one-among-many/201807/social-problems-and-human-cognition

Krueger, J. & RW, Clement (1994). Jugements fondés sur la mémoire sur plusieurs catégories: révision et extension de la théorie de l’accentuation de Tajfel. Journal de personnalité et de psychologie sociale, 67 , 35-47.

Krueger, JI, et Heck, PR (2017). La valeur heuristique de p dans l’inférence statistique inductive. Frontiers in Psychology: Psychology Educational [Sujet de recherche: aspects épistémologiques et éthiques de la recherche en sciences sociales] . https://doi.org/10.3389/fpsyg.2017.00908

Parducci, A. (1965). Jugement de catégorie: Un modèle plage-fréquence. Psychological Review, 72 , 407-418.

Peterson, CR et Beach, LR (1967). L’homme en tant que statisticien intuitif. Psychological Bulletin, 68 , 29–46.

Wedell DH, & Parducci A. (2000). La comparaison sociale. Dans: J. Suls, & L. Wheeler (eds.), Manuel de comparaison sociale: théorie et recherche (pp. 223-252). New York: Plenum / Kluwer.

Tajfel, H. (1969). Aspects cognitifs des préjugés. Journal of Social Issues, 25 , 79–97.