Évaluation de la recherche en psychologie

De nombreuses études psychologiques célèbres ne peuvent être reproduites.

Les études en psychologie trouvent souvent des résultats différents. Même dans des domaines comme la médecine, où l’on pourrait penser qu’il existe une relation directe entre l’intervention à tester et ses effets, les résultats peuvent varier.

Wikimedia Commons

Expérience de la prison de Stanford

Source: Wikimedia Commons

Par exemple, une étude a révélé que boire un verre de jus d’orange par jour pourrait augmenter de 18% le risque de diabète de type 2. Des chercheurs de l’Université de Californie, Davis, ont toutefois constaté que la consommation de jus à 100% réduisait le risque de plusieurs maladies chroniques, dont le cancer.

Wikimedia Commons

Guimauves blanches

Source: Wikimedia Commons

Mais beaucoup pensent que la situation est pire en psychologie.

Un article récent du New York Times mentionne des études psychologiques célèbres sur le comportement humain qui ne peuvent être reproduites, notamment la célèbre expérience de la prison de Stanford qui montre comment les jeux de rôle des gardiens ont rapidement agi de manière cruelle. cela montrait que les jeunes enfants qui pouvaient retarder la gratification avaient de meilleurs résultats scolaires plus tard que ceux qui ne le pouvaient pas.

Pourquoi les résultats de la recherche varient-ils et ne se reproduisent-ils pas?

La relation entre une intervention et ses effets peut dépendre de nombreux facteurs. Et les différences de contexte ou de mise en œuvre peuvent avoir un impact important sur les résultats d’une étude. Il existe d’autres raisons pour lesquelles les études pourraient signaler des effets différents: Les erreurs de probabilité pourraient affecter les résultats d’une étude. Les chercheurs peuvent aussi, consciemment ou par inadvertance, influencer leurs résultats.

Toutes ces sources de variabilité ont fait craindre une «crise de réplication» en psychologie et dans d’autres sciences sociales. Compte tenu de cette préoccupation, comment devrions-nous évaluer la recherche en psychologie et en sciences sociales?

La première règle à suivre est de ne pas compter uniquement sur une seule étude. Si possible, passez en revue les méta-analyses ou les revues systématiques combinant les résultats de plusieurs études. Les méta-analyses peuvent fournir des preuves plus crédibles. Les méta-analyses peuvent suggérer des raisons pour lesquelles les résultats diffèrent.

Une méta-analyse est une analyse statistique qui combine les résultats de plusieurs études de recherche. Le principe de base de la méta-analyse est qu’il existe une vérité commune à toutes les études de recherche conceptuellement similaires, mais chaque étude individuelle a été mesurée avec une certaine erreur dans les études individuelles. L’objectif est d’utiliser des statistiques pour obtenir une estimation groupée, la plus proche de la vérité commune inconnue. Une méta-analyse donne alors une moyenne pondérée à partir des résultats de toutes les études individuelles.

En plus de fournir une estimation de la vérité commune inconnue, la méta-analyse peut également mettre en contraste les résultats de différentes études et identifier des tendances parmi les résultats de l’étude. Il peut également identifier des sources de désaccord parmi ces résultats. Et il peut identifier d’autres relations intéressantes qui apparaissent dans le cadre de plusieurs études. Un avantage clé de l’approche méta-analytique est l’agrégation de l’information qui conduit à une puissance statistique plus élevée et à une estimation ponctuelle plus robuste que celle qui est possible à partir de la mesure dérivée de nombreuses études individuelles.

Cependant, l’approche méta-analytique présente également certaines limites. Le chercheur doit faire des choix quant aux études à inclure qui peuvent affecter les résultats de la méta-analyse (par exemple, uniquement des études publiées). Le chercheur doit décider comment rechercher les études. Et le chercheur doit décider comment traiter les données incomplètes, analyser les données et prendre en compte les biais de publication.

Parfois, cependant, nous voulons évaluer une seule étude de psychologie individuelle. Alors, comment devrions-nous nous y prendre? Lorsque vous examinez le poids à donner à une étude et ses résultats, concentrez-vous sur la taille de l’échantillon. Les études sont plus susceptibles de ne pas se reproduire si elles utilisent de petits échantillons. Les résultats les plus positifs et les plus négatifs sont souvent ceux avec les plus petits échantillons ou les intervalles de confiance les plus larges. De plus petites études sont plus susceptibles de ne pas se reproduire en partie à cause du hasard, mais les effets peuvent également être moins importants lorsque la taille de l’échantillon augmente, pour de nombreuses raisons. Si l’étude testait une intervention, il pourrait y avoir des contraintes de capacité qui empêchent une mise en œuvre de haute qualité à grande échelle. De plus petites études ciblent aussi souvent l’échantillon souhaitable qui produirait les effets les plus importants.

Il y a une ligne de raisonnement à ceci: si, par exemple, vous avez un programme éducatif de diversité onéreux que vous ne pouvez utiliser qu’avec un nombre limité d’étudiants, vous pourriez n’avoir qu’un seul cours et avoir des étudiants qui pourraient en bénéficier le plus. Cela signifie que l’effet serait probablement plus faible si vous mettiez en œuvre l’éducation à la diversité dans un groupe plus large. Donc, plus généralement, il peut être utile de réfléchir à ce qui pourrait être différent si le programme éducatif était mis à l’échelle. Par exemple, il est peu probable que des programmes éducatifs de faible diversité affectent l’institution, la communauté ou la société en général. Cependant, si la culture institutionnelle, communautaire ou sociétale peut évoluer à plus grande échelle, la réponse peut changer.

De même, considérez les caractéristiques spécifiques de l’échantillon, du contexte et de la mise en œuvre. Comment les chercheurs sont-ils venus étudier le programme d’éducation à la diversité, y compris l’établissement et les étudiants? Souhaitez-vous que cet échantillon ait obtenu des résultats meilleurs ou moins bons que ceux qui vous intéressent? Par exemple, si je souhaitais tester les résultats de la méthode d’enseignement que j’utilise dans mon cours sur la conférence Web, le contexte de la psychologie de la diversité à Harvard (par exemple, Harvard, conférence Web, campus) aurait également affecté les résultats. Y a-t-il quelque chose d’unique dans le décor qui aurait pu augmenter les résultats?

Si l’étude évalue un cours de formation sur la diversité, la manière dont ce cours a été mis en œuvre est également importante. Supposons, par exemple, qu’un cours de conférence Web sur la diversité puisse améliorer le sentiment d’appartenance et d’inclusion des élèves. Si vous envisagiez de mettre en place un cours similaire, vous voudriez probablement connaître le format du cours de la conférence Web et le contenu du cours, ainsi que la formation du personnel enseignant afin de déterminer si vous pourriez avoir des résultats différents.

Vous pouvez également avoir davantage confiance dans les résultats d’une étude s’il existe un mécanisme clair qui explique les résultats et qui est constant dans tous les contextes. Certains résultats en économie comportementale, par exemple, suggèrent que certaines règles du comportement humain sont câblées. Mais ces mécanismes peuvent être difficiles à découvrir. Et de nombreuses expériences d’économie comportementale qui semblaient initialement refléter une règle câblée n’ont pas réussi à se reproduire, par exemple en trouvant que le bonheur augmente la patience et l’apprentissage.

Mais, s’il existe une raison convaincante pour laquelle nous pourrions nous attendre à voir les résultats trouvés par une étude, ou s’il existe une forte raison théorique pour laquelle un résultat spécifique pourrait se généraliser, cela devrait nous amener à faire confiance aux résultats d’une étude. étude unique un peu plus. Mais nous devrions prendre soin d’examiner pourquoi nous pensons qu’il y a une raison convaincante.

Enfin, si cela semble trop beau pour être vrai, c’est probablement le cas. Ceci est basé sur un principe tiré des statistiques bayésiennes: les assertions de Stranger devraient exiger des preuves plus solides afin de changer les “priors” ou les croyances. Si nous prenons nos croyances sérieusement – et il y a des raisons de conclure que les humains sont en moyenne assez bons pour faire des prédictions – alors les résultats qui semblent improbables sont en réalité moins probables.

En conclusion, toute recherche en psychologie est sujette à erreur et, par conséquent, les résultats peuvent varier et ne pas se reproduire. Il vaut beaucoup mieux en être conscient que de ne pas être au courant des erreurs potentiellement cachées dans la recherche. La méthode scientifique a été développée pour s’appuyer sur un raisonnement empirique pour nous aider à résoudre les cas dans lesquels les études varient ou ne se reproduisent pas. L’application de la méthode scientifique à l’étude du comportement humain et de la psychologie n’a pas simplifié le comportement humain; au lieu de cela, il a suggéré la complexité du comportement humain.

Les références

Weissmark, M. (à venir). La science de la diversité Oxford University Press, États-Unis.

Weissmark, M. (2004). J ustice Matters: Legs de l’Holocauste et de la Seconde Guerre mondiale . Oxford University Press, États-Unis.

Weissmark, M. et Giacomo, D. (1998). Faire de la psychothérapie efficacement. Université de Chicago Press, États-Unis.