Diviser et conquérir

J. Krueger
Le nombre d'or
Source: J. Krueger

J'ai écrit cet essai avec Patrick Heck.

En principe erat ratio . ~ St. John, pseudepigraphique

Cet essai porte sur un problème mathématique apparemment simple, qui, croyons-nous, a des implications psychologiques profondes. Commençons par commenter St. Jean, qui ouvre son Évangile en assimilant le Logos à Dieu. Logos est un concept grec ancien d'une énorme gravité. Il peut se référer à des mots, à des phrases, à des significations ou à des communications, mais aussi à l'ordre divin de la nature et de la loi naturelle. On pourrait même voir des similitudes entre le Logos grec ancien et le Tao de l'Est. Dans l'Occident moderne, Logos est réduit à la Parole, une rétrogradation qui a commencé avec le testament de la Vulgate (Latin), qui rend le Logos comme Verbum. Imaginez, Dieu est un verbe. En dehors de la bible, les Latins ont rendu Logos comme Ratio, et là nous entrons dans l'épaisseur des choses. Du rapport nous obtenons la rationalité et la rationalité, l'étalon-or de la pensée, la plus grande portée du fonctionnement psychologique.

Une autre signification de ratio se réfère au résultat de la division, ce que vous obtenez de fractionnement. Mais quelle est la différence entre cette signification mathématique étroite et la signification psychologique cognitive? Après Posner (1973), qui définit la pensée comme imaginant ce qui n'est pas immédiatement donné (le stimulus) et considérant leurs relations, Dawes (1988) a diagnostiqué la pensée relative, comparative et fractionnée comme le cœur de la rationalité. Dawes a ainsi intégré la fabrication de ratios dans l'accomplissement de la rationalité. Dans la psychologie du jugement et de la prise de décision, les ratios et leur rationalité présumée font surtout partie d'un argument plus bayésien. Le révérend Bayes a enseigné comment avoir un esprit bien élevé, un esprit qui ne se contredira pas.

Je me souviens comme si c'était avant-hier, quand un camarade de lycée a résumé un article de McCauley et Stitt (1978), qui prétendait montrer que les stéréotypes sociaux sont bayésiens, c'est-à-dire qu'ils sont relatifs. Considérez les Japonais. Ils ont – Dieu merci – un faible taux de suicide, mais ce taux peut être – et peut être perçu comme étant – un peu plus grand que dans le reste du monde, ou dans votre propre pays si ce n'est le Japon. Disons que la prévalence perçue du suicide au Japon est de 3%, alors qu'elle est de 1% au Luxembourg. Selon McCauley & Stitt, cette différence de perception rend le suicide stéréotypé des Japonais et contre-stéréotypé des Luxembourgeois et devrait être exprimé comme un rapport de diagnostic ; ici 3/1. McCauley et Stitt ont fait valoir que le rapport diagnostique est une meilleure mesure des stéréotypes que le bon vieux pourcentage obtenu pour les Japonais. Effectivement, ils ont trouvé que les ratios diagnostiques sont corrélés avec les cotes de typicité («Quelle est la fréquence du suicide des Japonais?»), Mais dans une quête continue de dix ans, mes collègues et moi avons montré que le numérateur (% japonais) le travail, alors que le dénominateur (% Luxembourgeois) dégrade la mesure au lieu de l'aiguiser (revue dans Krueger, 2008). Les estimations en pourcentage simples pour un groupe sont plus fortement corrélées avec les cotes de typicalité des caractères que les ratios de diagnostic. Nous pouvons voir cela même dans les propres données de McCauley & Stitt.

Pourquoi McCauley et Stitt pensent-ils que les ratios diagnostiques sont supérieurs? Ils sont partis de la prémisse – une croyance antérieure que vous pourriez dire – que toute la cognition, et donc la cognition sociale, est bayésienne. Cela signifie que les croyances peuvent être exprimées de manière probabiliste et qu'un ensemble de croyances est – ou du moins devrait être – cohérent à la manière de Bayes. Dans le théorème de Bayes, le rapport entre la probabilité qu'un suicide suive une personne japonaise, p (S | J), divisé par la probabilité qu'un Luxembourgeois décède par suicide, p (S | L), est égal au ratio de la classification a posteriori, c'est-à-dire la probabilité qu'un suicide soit japonais, p (J | S), sur la probabilité qu'un suicide soit luxembourgeois, p (L | S), multiplié par le rapport de la probabilité a priori qu'une personne est Japonais, p (J), sur la probabilité préalable qu'une personne soit luxembourgeoise, p (L). En d'autres termes, le théorème de Bayes exige le calcul d'un ratio de probabilités conditionnelles afin qu'une personne puisse être classée comme japonaise ou luxembourgeoise étant donné leurs probabilités différentielles de suicide. Aussi élégante que soit la méthode de Bayes, ce n'est pas une bonne description de la façon dont les gens perçoivent la typicité de divers traits dans les groupes sociaux.

McCauley et d'autres sont ensuite passés des ratios aux scores de différence sans trop de commentaires. Quoi qu'il en soit, ils ont probablement pensé que la prise en compte de la façon dont un groupe de comparaison est perçu ne peut qu'améliorer la mesure et la prédiction. Pourtant, les ratios et les scores de différence diffèrent de manière importante. Premièrement, les ratios sont limités à 0 au plancher, mais ils n'ont pas de plafond. Alors que 1,0 est le point médian, abaisser le numérateur ne peut pas rendre le rapport négatif, tandis que l'abaissement du dénominateur peut déplacer le ratio vers l'infini. Cette asymétrie donne des distributions fortement asymétriques. En revanche, les scores de différence font avec une distribution modeste et symétrique autour de 0, où le maximum est X max – Y max . Deuxièmement – et de manière connexe – la taille du ratio nous permet d'estimer la taille du dénominateur. Si le ratio est très grand, le dénominateur est probablement très petit. Cependant, un très grand score de différence nous indique que les deux, le numérateur et le dénominateur sont proches des extrémités de leurs échelles, mais à des extrémités opposées. Au niveau intuitif-conceptuel, les ratios semblent «relativiser» la variable dans le numérateur, alors que les scores de différence semblent la «corriger».

La fascination pour les scores «relatifs» ou «corrigés» est profonde, au moins pour deux raisons. Une raison est que le théorème de Bayes fournit une norme pour la pensée rationnelle. La pensée rationnelle est cohérente, et le théorème de Bayes garantit que les pièces s'emboîtent. Si une probabilité est négligée ou complètement ignorée, l'ajustement cohérent ne peut plus être garanti et tout enfer mental peut se déchaîner (Thomas Bayes était un pasteur). L'autre raison est l'intuition quotidienne. Cette intuition est une chose amusante. Il dit, par exemple, que «plus d'informations est toujours meilleur», mais a tendance à ignorer ses propres conseils lorsqu'il fait des jugements intuitifs. Les bayésiens et les autres correcteurs et relativistes font appel à l'intuition «plus-est-mieux» lorsqu'ils professent leur horreur à l'idée que de simples indices heuristiques peuvent très bien servir d'outils de décision. Selon leur philosophie, le jugement rationnel doit diviser (ou soustraire) parce que le fait de ne pas le faire laisserait l'information sur la table – et cela finirait tôt ou tard par provoquer le chaos.

Les scores relatifs tels que les ratios ou les différences sont utiles s'ils font mieux que l'un ou l'autre de leurs composants simples pour prédire une troisième variable. Une raison pour laquelle ils ne peuvent pas faire cela est qu'ils sont confondus avec leurs composants. Le score de différence est plus facile à comprendre que les ratios. Commençons donc là. Les manuels de statistiques nous apprennent que les différences sont positivement corrélées avec la variable dont nous soustrayons, et qu'elles sont corrélées négativement avec la variable soustraite (McNemar, 1969). La corrélation, r , est positive entre X et XY, et négative entre Y et XY.

J. Krueger
Source: J. Krueger

En mettant de côté les variances, ou en supposant qu'elles soient identiques pour X et Y, nous pouvons voir que le numérateur est susceptible d'être positif et qu'il sera plus positif lorsque la corrélation entre X et Y tombera ou deviendra négative.

P. Heck
Ratios en fonction de leur numérateur
Source: P. Heck

Que peut-on dire des ratios? Le ratio X / Y sera-t-il positivement corrélé avec son numérateur X? Comment cela ne peut-il pas être ainsi? Lorsque X augmente, ceteris paribus , X / Y doit également augmenter. Eh bien, ça ne semble pas fonctionner d'abord de cette façon. Nous avons effectué des simulations sur ordinateur en laissant X et Y aller sur une distribution uniforme de 0 à 1. Nous avons également fait varier la corrélation entre X et Y, mais cela n'avait pas beaucoup d'importance. Dans chaque simulation, la plupart des valeurs de X / Y étaient proches de 1, tandis que quelques-unes étaient beaucoup plus grandes et encore moins nombreuses. Ce résultat confirme l'idée que la division donne une distribution fortement asymétrique. Incliner en un

P. Heck
Un biais positif (à droite) lorsque X et Y sont négativement corrélés.
Source: P. Heck

La variable diminue les corrélations avec d'autres variables. Pour les valeurs positivement corrélées de X et Y ( r = 0,5), nous trouvons une corrélation entre X et le rapport X / Y de -021, et pour une corrélation négative X et Y, nous trouvons .152. Les graphiques sur la gauche montrent les deux diagrammes de dispersion où X / Y est représenté en fonction de X. La plupart des ratios sont dans la section la plus basse de l'échelle, alors qu'il y a un saupoudrage de valeurs aberrantes. Lorsque X et Y sont positivement corrélés, la distribution de X / Y est décalée vers la gauche; lorsque la corrélation est négative, elle est faussée à droite.

On pourrait être tenté de conclure qu'un manque de corrélation fournit une preuve d'indépendance. Une telle conclusion serait hâtive parce que l'asymétrie peut masquer une véritable association. Une correction standard consiste à log-transformer une variable asymétrique avant de la corréler avec d'autres variables. Lorsque nous transformons les valeurs logarithmiques, nous éliminons l'influence démesurée des grandes périphéries, et une association positive entre le numérateur, X, et le rapport complet, X / Y, émerge. Le deuxième ensemble de deux figures le montre. Pour les valeurs positivement corrélées de X et Y ( r = .5), nous trouvons une corrélation entre X et le rapport X / Y de. 514, et pour X et Y négativement corrélés, nous trouvons .831. Ces corrélations sont assez grandes, ce qui accrédite l'idée que la division ajoute peu à ce que le numérateur accomplit déjà. La division ajoute plus quand la corrélation entre X et Y devient de plus en plus positive. Cela est intéressant car cela signifie que «relativiser» une variable X en la divisant par la variable Y est très informatif dans la mesure où les différences entre elles (entre une valeur échantillonnée de X et une valeur échantillonnée de Y) deviennent plus petites.

P. Heck
Relation linéaire émergeant après la transformation du journal
Source: P. Heck

L'asymétrie de la distribution du rapport a une autre conséquence problématique. Nous savons que la moyenne arithmétique est susceptible d'être plus élevée que le point central conceptuel de 1.0, ce que nous obtiendrions quand X = Y. Puisqu'il est possible d'obtenir un rapport de X / Y> 2 mais impossible d'obtenir un <0, la plupart des moyennes d'échantillons seront> 1. Dans une distribution symétrique, la moyenne est une estimation non biaisée de la moyenne vraie (c'est-à-dire, la moyenne d'un échantillon infiniment grand); il n'est ni systématiquement trop petit ni trop grand et ne varie pas systématiquement en fonction de la taille de l'échantillon. Ce n'est pas le cas dans une distribution asymétrique. Dans une distribution asymétrique, la moyenne

P. Heck
Association linéaire forte entre X et X / Y.
Source: P. Heck

la taille de l'échantillon N augmente au fur et à mesure que les échantillons plus volumineux augmentent la probabilité que des valeurs très rares mais très grandes (ici, des ratios) soient capturées. S'ils sont capturés, ils tirent la moyenne. Puisque nous savons qu'un rapport peut dériver vers l'infini car le dénominateur devient infinitésimalement petit, nous savons aussi qu'un très très grand échantillon donnera très probablement une moyenne pratiquement, pratiquement ou moralement infinie. Nous ne voudrions pas que cela se produise parce que le résultat serait ininterprétable.

Pour illustrer la montée de la moyenne en fonction de N, nous avons effectué une série

P. Heck
L'effet biaisant de la taille de l'échantillon sur le ratio moyen attendu.
Source: P. Heck

de simulations. La figure finale montre les moyennes d'échantillon de X / Y calculées sur 1000 simulations pour chacune des 7 tailles d'échantillons le long d'une échelle logarithmique. Notez que le rapport moyen augmente, tout comme la précision avec laquelle il est estimé (les barres autour de chaque moyenne expriment l'erreur-type, qui est l'écart-type des moyennes échantillonnées divisé par la racine carrée de leur nombre).

Il n'y a aucune raison d'abandonner tout espoir et tous les ratios. Mais dans de nombreux contextes psychologiques, il est bon de demander si on a autant gagné qu'on l'espérait. On ne voudrait pas rationaliser l'utilisation des ratios après le fait. Nous recommandons de rapporter les ratios ainsi que leurs variables d'ingrédients afin que l'on puisse apprécier les niveaux absolus à partir desquels les ratios sont apparus. Et bien sûr, certains ratios sont beaux, comme celui d'or dans l'image en haut. En fermant le cercle – si vous permettez une métaphore géométrique – Fra Luca Pacioli, le grand mathématicien de la Renaissance, a observé que «Comme Dieu, la Proportion Divine est toujours semblable à elle-même.

Krueger, JI (2008). La beauté robuste des associations simples. Dans JI Krueger (Ed.), Rationalité et responsabilité sociale: Essais en l'honneur de Robyn M. Dawes (pp. 111-140). New York, NY: Presse de psychologie.

McCauley, C., & Stitt, CL (1978). Une mesure individuelle et quantitative des stéréotypes. Journal de la personnalité et de la psychologie sociale, 36 , 929-940.

McNemar, Q. (1969). Statistiques psychologiques (4 e éd.). New York, NY: Wiley.

Posner, M. (1973). Cognition: Une introduction . Glenview, Ill: Scott, Foresman.