Plus de preuves d'une description de la dACC liée à la douleur

[Note: s'il vous plaît assurez-vous de lire le troisième paragraphe qui clarifie ce qui semble être une source majeure de confusion au sujet de notre document]

Depuis notre dernière réponse à Tal Yarkoni (TY), il y a eu trois nouvelles réponses de TY, Tor Wager (TW) et Alex Shackman (AS). Ces réponses nous ont donné beaucoup à réfléchir et nous ont amenés à réaliser des analyses supplémentaires que nous (Lieberman & Eisenberger, ci-après L & E) croyons clarifier, étendre et finalement renforcer nos revendications originales. Bien que nous soyons d'accord avec toutes les analyses contenues dans le document PNAS, nous aurions aimé avoir déjà pensé à faire ces analyses et à les inclure dans le document.

Nous sommes très en désaccord avec certains des derniers blogs, mais comme nous sommes intéressés à aller de l'avant, nous voulons recommencer avec des domaines où il semble y avoir un accord, puis passer à nos nouvelles analyses, puis sur une discussion de quatre questions: (a) La relation de la douleur et de la peur dans la base de données Neurosynth (b) Les z-scores de Neurosynth nous informent-ils sur l'inférence inverse? (c) Priors empiriques et (d) Peut-on dire qu'une région du cerveau a une fonction? Nous voulons être clair que ce blog sera notre dernier commentaire sur tout cela. Entre le post précédent et celui-ci, nous sentons que nous avons clarifié tout ce dont nous avons besoin pour démontrer que nos conclusions sont solides. Nous prévoyons que ceux qui ont déjà écrit des messages continueront d'être en désaccord avec nous, mais nous espérons que d'autres trouveront cela utile.

Mais avant de sauter dans le texte principal de ce blog, nous avons voulu clarifier un point important qui sera développé plus tard dans ce blog. D'après les analyses de notre document PNAS, nous ne pensons pas que lorsque nous voyons l'activité dACC, cela implique nécessairement que la personne éprouve de la douleur . Pour faire cette affirmation, il faudrait générer des probabilités postérieures basées sur des a priori empiriques du monde réel qui n'existent pas (ni le précédent Neurosynth de .50, ni la prévalence de 3,5% de la douleur dans les résumés Neurosynth fournissent cette information car cette dernière reflète ce qui est étudié fréquemment, pas ce qui se produit fréquemment en général). Mais ce n'était pas le genre de réclamation que nous faisions. Notre affirmation était beaucoup plus simple: Il existe des preuves fiables basées sur les z-scores des cartes d'inférence inverses que la douleur est associée à une grande partie du dACC . En revanche, à travers la plupart des dACC, il y a beaucoup moins de preuves, basées sur les z-scores des cartes d'inférence inverse, que les processus exécutifs, de conflit et de saillance sont associés de manière fiable au dACC . Ces résultats suggèrent qu'un compte rendu de la fonction dACC devrait se concentrer davantage sur les processus douloureux que les processus cognitifs généralement ciblés. Notre argument est de construire le meilleur compte de la fonction dACC, de ne pas prédire le processus présent dans une étude particulière ou de supposer que chaque neurone dACC fait la même chose. Nous examinons ci-dessous plusieurs comptes supplémentaires de la fonction dACC pour rendre cette allégation plus complète.

Domaines d'accord

Bien que TY souligne qu'il est en désaccord avec presque tout ce que nous avons dit dans notre premier blog, il poivra également son dernier billet de blog avec des citations de nous ou des reformulations de réclamations de notre part avec lesquelles il est explicitement d'accord (ou n'a aucun problème). Nous pensons que ceux-ci méritent d'être soulignés parce que nous pensons que ce sont quelques-unes des revendications les plus importantes de notre document.

Nous avons écrit: "La conclusion des cartes d'inférence inverse Neurosynth est sans équivoque: Le dACC est impliqué dans le traitement de la douleur. Lorsque seules les données d'inférence prospective étaient disponibles, il était raisonnable d'affirmer que dACC n'était peut-être pas impliqué dans la douleur, mais que le traitement de la douleur pouvait être réduit à la fonction «réelle» du dACC, comme les processus exécutifs, la détection des conflits ou réponses de saillance aux stimuli douloureux. Les cartes d'inférence inverses ne prennent en charge aucun de ces comptes qui tentent de réduire la douleur à des processus cognitifs plus génériques. "

TY a écrit en réponse: "Cette affirmation me semble en effet largement injustifiable."

Nous avons écrit: «Pour les termes exécutif et conflit, notre figure 3 dans le document PNAS montre un tout petit peu de dACC. Nous pensons que les chiffres plus complets que nous avons inclus ici continuent de raconter la même histoire. Si quelqu'un veut raconter l'histoire conflictuelle de la raison pour laquelle la douleur active le dACC, nous pensons qu'il devrait y avoir des preuves d'une cartographie d'inférence inversée robuste et généralisée du dACC au conflit. Mais la preuve d'une telle affirmation n'est tout simplement pas là. Quoi que vous pensiez du reste de nos statistiques et revendications, cela devrait faire réfléchir beaucoup de gens, parce que ce n'est pas ce que nous aurions attendu de ces cartes d'inférence inverse (y compris nous).

TY a écrit en réponse: "Pas d'objections ici"

Il y a eu d'autres exemples d'accord paraphrasant. Par exemple TY a écrit:

Et "Si L & E m'avait demandé", hé, pensez-vous que Neurosynth soutient que l'activation du dACC est un bon marqueur de "saillance"? ", J'aurais dit" non, bien sûr que non ".

Et dans une section séparée, il a écrit:

"Si leur signification est quelque chose comme" en moyenne, en prenant la moyenne de tous les voxels dans dACC, il y a plus de preuves d'une association statistique entre douleur et dACC que douleur et surveillance des conflits ", alors je vais bien." : nous supposons que la dernière phrase est mal écrite et que TY signifiait "surveillance des conflits et dACC"]

Étant donné que toutes ces allégations reposent sur l'interprétation des cartes z-score fournies par Neurosynth comme preuve (ou absence de preuve) qu'un terme est une cible d'inférence inversée raisonnable, nous prenons d'importants points d'accord:

  1. Les z-scores de Neurosynth fournissent des preuves sur le fait que des voxels particuliers peuvent être attribués de manière plausible, par inférence inverse, à une fonction particulière. Il peut y avoir plusieurs termes qui montrent des z-scores significatifs pour un voxel et tous ces termes sont des fonctions plausibles à attribuer à ce voxel.
  2. Il y a très peu de preuves tirées des z-scores d'inférence inverse que les processus exécutifs, de conflit et de saillance sont de bonnes cibles d'inférence inverse pour l'activation du dACC. Notez que nous disons «peu», pas «non» de preuve, tout comme nous l'avons fait dans notre document, parce qu'il y a des preuves inverses de la CCNA pour les conflits, mais c'est modeste.
  3. Les scores z montrent que les processus de douleur sont de bonnes cibles d'inférence inverse pour une grande partie des voxels dACC.

Si nous pouvons nous entendre sur ces points, je pense que nous sommes d'accord sur la plupart de ce qui nous intéresse dans notre document.

Nouvelles analyses Neurosynth

La dernière déclaration de TY ci-dessus ("Si ce qu'ils veulent dire, c'est quelque chose comme …") nous a fait réaliser qu'il y avait une façon différente d'aborder les conclusions que nous avions atteintes dans le document de PNAS. Comme nous l'avons dit, une partie de ce qui nous a surpris lorsque nous avons examiné les cartes d'inférence inverses pour la douleur, l'exécutif, le conflit et la saillance il y a quelques années était la couverture de la douleur par rapport aux autres termes. Nous avons essayé de capturer cela en regardant 8 voxels répartis dans le dACC. Ce n'était peut-être pas la meilleure façon de quantifier ce que nous voyions et elle n'était pas sensible à deux questions raisonnables soulevées par TY et AS. D'abord, nous avons seulement regardé la ligne médiane, un problème mentionné par TY. Deuxièmement, nous avons défini nos limites du dACC en utilisant un atlas non probabiliste et nous n'avons donc pas pu indiquer la confiance que les voxels considérés étaient vraiment des voxels dACC, une question soulevée par AS.

Ce que nous avons fait dans nos nouvelles analyses est défini un masque dACC utilisant l'atlas probabiliste de Harvard-Oxford (ci-après HO) et ensuite examiné le pourcentage de voxels dans le dACC pour lesquels les différents termes sont une cible d'inférence inversée raisonnable basée sur l'inférence inverse Neurosynth Plans. Pour créer l'atlas HO, ils ont pris des images pondérées en T1 à partir de douzaines de cerveaux (bit.ly/1RMTAzp). Diverses régions d'intérêt (par exemple ACC) ont été identifiées sur des cerveaux individuels avant toute transformation. Ensuite, chaque analyse a été enregistrée dans l'espace MNI. À ce stade, ils pouvaient déterminer pour chaque voxel dans l'espace MNI, combien de cerveaux individuels avaient été étiquetés avec une étiquette particulière dans la première étape. Donc, si 75% des cerveaux avaient une coordonnée particulière étiquetée comme ACC, alors ce voxel serait évalué comme ayant 75% de probabilité d'être ACC dans tout nouveau balayage enregistré dans l'espace MNI.

Matthew Lieberman
Source: Matthew Lieberman

En utilisant cet atlas, nous avons pu définir des masques dACC (-8 ≤ x ≤ 8, 0 ≤ y ≤ 30) pour lesquels les voxels étaient 25%, 35%, 50% ou 75% susceptibles d'être dans le dACC (voir figure au dessus). On pourrait argumenter que seuls les voxels qui sont au moins 50% ou 75% susceptibles d'être des voxels dACC devraient être inclus dans nos ROI, mais une inspection visuelle suggère que ces masques ROI ressemblaient beaucoup à ce que nous avions déjà utilisé dans le PNAS. réponse de AS, nous sommes donc allés avec un masque plus libéral de 35% pour nos analyses présentées ici.

Notez que les résultats sont qualitativement les mêmes pour tous les masques différents. La seule différence majeure que nous avons constatée est que nous sommes passés de masques dACC de confiance inférieure (25%) à des masques de confiance dACC plus élevés (75%), le pourcentage de voxels dACC associés, par inférence inverse, aux termes affectifs augmentés (p. %, peur + 12%, affect négatif + 6%) et le pourcentage de voxels dACC associés à des termes cognitifs a diminué (par exemple, conflit -12%, erreur -6%). Ainsi, à mesure que nous augmentons notre confiance qu'un voxel particulier se trouve effectivement dans le dACC, il est plus susceptible d'être associé à un processus affectif et moins susceptible d'être associé à un processus cognitif. En d'autres termes, les voxels qui sont associés aux processus cognitifs dans le dACC ont tendance à être les voxels dont nous devrions avoir le moins confiance dans le dACC.

Les analyses présentées ci-dessous utilisent toutes le masque de 35%. Nous avons d'abord pensé à regarder nos quatre principales catégories d'intérêt dans le document PNAS (douleur, exécutif, conflit, saillance) ainsi que celles soulevées par TY comme alternatives que nous aurions dû considérer (peur, autonomie, récompense). En fin de compte, nous avons décidé d'inclure plus de termes dans nos analyses afin que nous puissions répondre à la norme de sélectivité donnée par TY par TY dans son dernier blog:

"Une région du cerveau peut être dite" sélective "pour une fonction particulière si elle (i) montre une association robuste avec cette fonction, (ii) montre une association négligeable avec toutes les autres alternatives facilement disponibles, et (iii) les auteurs ont fait preuve de diligence raisonnable en s'assurant que les principales fonctions proposées dans la littérature sont bien représentées dans leur analyse. "

Nous pensons que cette définition va au-delà de la façon dont de nombreux chercheurs ont utilisé ce terme dans le passé (c.-à-d. Dans les documents MVPA), mais nous avons pensé qu'il serait intéressant de voir ce qui se passe lorsque nous appliquons cette définition à nos analyses. Notons que nous interprétons le mot «association» dans cette définition pour désigner uniquement les associations identifiées dans les cartes d'inférence inverse, et non ce qui est observé dans les cartes d'inférence directe. Par conséquent, nous avons essayé de faire preuve de diligence raisonnable en veillant à ce que les principales fonctions proposées dans la littérature soient bien représentées dans leur analyse. Ainsi, nous avons maintenant une liste de 14 termes qui couvre chaque compte dACC dont nous avons connaissance au fil des ans. Notre liste de termes comprend:

douleur, attention, autonomie, évitement, conflit, émotion, erreur, exécutif, peur, affect négatif, inhibition de réponse, sélection de réponse, récompense et saillance.

Nous croyons que c'est une liste assez complète de termes et espérons que si nous en avons manqué, ils ont un synonyme raisonnable sur la liste susceptible de produire des effets similaires.

Sur les analyses. La première chose que nous avons faite a été de compter le nombre de voxels dans le masque de 35%. Il y avait 1110 voxels que l'atlas HO était au moins 35% confiant étaient voxels dACC. Parmi ceux-ci, 947 voxels (ou 85,3%) apparaissent dans la carte d'inférence inverse pour la douleur (en utilisant le niveau de signification standard de Neurosynth de p <0,01, corrigé par FDR). Sur les 13 autres termes, aucun ne couvrait même 20% des voxels dACC (voir figure ci-dessous). La comparaison chi carré de la douleur par rapport à tout autre terme était hautement significative. Tous X 2 > 975.278, p <.00001, d > 5.38. Ceux-ci nous disent que la douleur est beaucoup plus omniprésente dans l'explication des inférences inverses à travers les voxels du dACC que n'importe lequel des 13 autres termes.

Matthew Lieberman
Affiche le pourcentage de voxels dACC qui apparaissent dans la carte d'inférence inverse de chaque terme. Le même voxel peut apparaître sur la carte pour plusieurs termes
Source: Matthew Lieberman

L'analyse ci-dessus ne va pas au cœur du problème de sélectivité tel que caractérisé dans la définition de TY parce que le même voxel peut apparaître pour plusieurs termes et n'indiquer ainsi pas la sélectivité d'un terme par rapport aux autres. Ainsi, nous avons ensuite évalué combien de voxels dans le dACC semblaient sélectifs pour n'importe quoi, de sorte qu'ils apparaissaient pour la carte d'inférence inverse d'un terme, mais n'apparaissaient dans aucune des cartes d'inférence inverse des 13 autres termes. On pourrait imaginer qu'avec 14 termes, quasiment aucun voxel dans le dACC ne montrerait de sélectivité selon cette définition – tout voxel significatif pour seulement deux des termes est éliminé de cette analyse. Malgré l'obstacle important à la sélectivité, 477 voxels sur les 1110 (43%) du dACC sont apparus dans seulement une des 14 cartes d'inférence inverse. Ces 477 voxels sembleraient alors répondre à la barre de sélectivité fixée par la définition de TY. Sur les 477 voxels dACC sélectifs pour un terme unique (sur les 14 termes considérés), 91,2% étaient sélectifs pour le terme douleur .

Matthew Lieberman
Des voxels dACC qui sont sélectifs pour 1 des 14 termes, montre le pourcentage pour chaque terme.
Source: Matthew Lieberman

En tout, 435 des 477 voxels sélectifs étaient présents seulement dans la carte d'inférence inverse de la douleur et non dans aucune des cartes d'inférence inverse pour les 13 autres termes. Le seul autre terme qui avait plus de 10 voxels sélectifs était la récompense, à 30 voxels (nous en avons fait allusion dans le document original). La peur est la prochaine à 8 voxels, avec une erreur à 3 voxels, et un conflit à 1 voxel. Les voxels dACC sélectifs pour la douleur sont plus d'un ordre de grandeur plus commun que tout autre type de voxel sélectif dACC. La comparaison chi carré de la douleur par rapport à tout autre terme pour le nombre de voxels sélectifs dans le dACC était hautement significative. Tous X 2 > 446.203, p <.00001, d > s 1.64. Ces résultats nous indiquent que parmi les voxels dACC qui montrent des signes de sélectivité, ils sont beaucoup plus susceptibles d'être liés à la douleur que l'un quelconque des 13 autres termes.

Deux mises en garde très importantes ici:

1) Puisque 477 voxels étaient sélectifs pour un terme, cela signifie que 633 voxels dACC n'étaient pas sélectifs pour un terme. Bien que nous pensions utiliser maintenant une barre de sélectivité très élevée ici, plus élevée que tout ce que nous avons vu dans la littérature, il est clair qu'avec cette barre haute, moins de la moitié des voxels dACC montrent une sélectivité. De ce point de vue, il est excessif de dire que "le dACC" est uniformément sélectif pour la douleur par rapport à tous les autres 13 comptes de la fonction dACC que nous étudions actuellement. Deux réponses à cette mise en garde. Premièrement, en utilisant seulement les quatre termes initialement considérés (douleur, exécutif, conflit et saillance), 823 voxels étaient sélectifs selon la définition actuelle (soit 74,1% des voxels dACC) et parmi ceux-ci, 811 étaient sélectifs pour la douleur (ce qui aurait 98,5% des voxels sélectifs). Ainsi, dans le contexte des catégories considérées dans notre document PNAS, notre prétention de sélectivité pour la douleur par rapport aux processus exécutifs, conflictuels et de saillance était raisonnable. Deuxièmement, étant donné que toutes les réponses que nous avons reçues à propos du dACC sont trop génériques ou multiformes, nous pensons qu'il est assez impressionnant que près de la moitié des voxels dACC soient sélectifs et que presque tous soient sélectifs pour la douleur.

2) On pourrait regarder ces analyses et penser qu'il n'est pas juste de comparer chaque terme par rapport à l'autre 13 parce que certaines d'entre elles se chevauchent. Par exemple, nous avons inclus les conflits et les erreurs, qui sont des comptes distincts mais chevauchants du dACC. Si elles apparaissaient dans les mêmes voxels les unes que les autres, elles feraient tomber ces voxels hors de l'analyse de sélectivité ci-dessus. Pour résoudre ce problème, nous avons ci-dessous une figure montrant la comparaison des cartes pour la douleur et chaque autre terme seul – de sorte que chaque terme peut montrer combien de voxels apparaissent pour sa carte d'inférence inverse mais pas de douleur. Les barres orange dans chaque paire de deux barres ci-dessous montre le pourcentage de voxels dACC associés à chaque terme lorsque seuls les voxels associés à la douleur sont supprimés. Ainsi, les termes comme l'erreur et le conflit ne sont pas en concurrence ici. (Les barres bleues montrent combien de voxels apparaissent dans la carte d'inférence inverse de la douleur, mais pas pour l'autre terme dans la comparaison)

Matthew Lieberman
Source: Matthew Lieberman

Comme il va de soi, cette analyse ne montre aucun autre terme particulièrement performant lorsque l'on oppose 1 à 1 à la douleur. En dehors de la récompense, pour laquelle 2.7% des voxels dACC apparaissent sur sa carte mais pas sur la carte de la douleur, aucun autre terme ne dépasse 1.1%. En revanche, dans ces analyses, la douleur devient systématiquement supérieure à 65% de tous les voxels dACC après leur élimination pour un autre terme. Bien que nous ayons indiqué dans le document PNAS que la récompense montre effectivement des effets plus forts que la douleur dans la partie antéroventrale du dACC, nous avons pensé qu'il serait utile de montrer cela un peu plus clairement. Si nous avions utilisé une limite oblique (ligne verte pointillée), comme d'autres l'ont fait, pour distinguer le dACC du rACC, la carte d'inférence inverse de la récompense pourrait être largement absente du dACC. Il est assez clair dans cette figure que l'effet d'inférence inverse pour la récompense fait largement partie d'un cluster ACC plus rostral.

Matthew Lieberman
Source: Matthew Lieberman

Les conclusions de nos analyses actuelles réaffirment le point général soulevé dans le document PNAS. Si nous allons parler de la fonction du dACC comme l'ont fait d'innombrables articles au cours des 20 dernières années, la douleur est la seule fonction pour laquelle le dACC semble sélectif sur plus d'une poignée de voxels. Nous avons utilisé la définition de sélectivité de TY (en supposant que l'association fait référence à l'association d'inférence inverse). Ainsi, nous avons essayé de créer une liste plus exhaustive de termes qui sont des comptes raisonnables de dACC. Nous avons déterminé quel pourcentage de voxels dACC présentait une association d'inférence inverse avec chacun des 14 termes. Nous avons ensuite déterminé, parmi ces voxels, combien ne présentaient qu'une association d'inférence inverse avec 1 terme et aucun des 13 autres termes. Pour résumer nos conclusions:

  1. Sur les 1110 voxels dACC, 43% (soit 477 voxels) répondaient aux critères de sélectivité ci-dessus (n'apparaissant que dans 1 des 14 cartes d'inférence inverse).
  2. Sur les 477 voxels sélectifs, 91,2% (soit 435 voxels) étaient sélectifs pour la douleur.
  3. Ainsi, une partie importante du dACC peut être décrite par un terme unique parmi cette grande liste de termes historiquement plausibles.
  4. De la partie importante des voxels dACC qui peuvent être décrits par un seul terme de cette longue liste de comptes raisonnables, presque tous apparaissent dans la carte d'inférence inverse pour la douleur et pour aucun des 13 autres termes.

Douleur et peur

Nous avons soutenu que l'affect lié à la détresse pourrait être le compte-rendu général des processus du CC am, le CC am traitant les aspects de la douleur liés à la détresse (Rainville et al., 1997). Le travail sur les lésions de plusieurs décennies suggère que le dACC joue un rôle clé dans la détresse de la douleur physique ainsi que dans l'anxiété (Foltz & White, 1962, Tow & Whitty, 1953). Comme on l'a souligné, il existe un nombre non trivial de voxels dACC qui apparaissent dans la carte d'inférence inverse pour la peur (12,2% dans notre masque dACC). Nous croyons que la douleur et la peur sont conceptuellement liées parce que la plupart de ce que nous craignons sont des choses qui pourraient nous causer de la douleur (physiquement, socialement ou émotionnellement). Mais dans le contexte de Neurosynth, la relation est beaucoup plus directe. Beaucoup d'études de neuro-imagerie de la peur sont des études de conditionnement de la peur qui utilisent la douleur (par exemple le choc) comme stimulus inconditionnel. Ces études n'utilisent presque jamais le mot «douleur» et ne sont donc pas marquées pour la douleur dans Neurosynth, mais peuvent introduire des effets spécifiques à la douleur dans les cartes d'inférence inverse pour la peur.

Pour examiner cette possibilité, nous avons inspecté manuellement les 50 premières études IRMf qui apparaissent dans Neurosynth pour le terme peur. Nous avons constaté que 50% de ces études utilisaient des manipulations de la douleur. Afin de voir si ces manipulations de la douleur pourraient conduire le signal dACC dans la carte d'inférence inversée par peur, nous avons compté combien d'études avec activations dACC avaient des manipulations de la douleur et combien d'études sans activations dACC avaient des manipulations de la douleur. Comme le montre la figure ci-dessous, une grande majorité des études sur la peur (71%) produisant une réponse dACC utilisent des manipulations de la douleur, alors qu'une majorité importante d'études sur la peur (69%) ne produisent pas de douleur. manipulations. La comparaison chi carré de ce 2 × 2 était hautement significative; X2 > 8,013, p <0,006, d = 0,87. Ce résultat suggère que les études sur la peur qui incluent une manipulation de la douleur sont plus susceptibles de produire une réponse dACC.

Matthew Lieberman
Source: Matthew Lieberman

Si l'on considère la possibilité que la réponse dACC dans la carte d'inférence inverse de Neurosynth soit (a) conceptuellement liée aux réponses dACC à la douleur ou (b) soit littéralement due à des manipulations de la douleur activant le dACC dans des études de peur, alors il est raisonnable de combiner les réponses dACC à la douleur et à la peur. Bien que nous ne voulions pas faire trop de ces analyses, quand la douleur et la peur sont combinées en un seul ROI combiné (ci-après, douleur + peur), nous constatons que 566 des 1110 voxels dACC montrent la sélectivité pour l'un des 13 termes . Ainsi, 51% des voxels dACC sont sélectifs dans ces conditions. En outre, 532 des 566 voxels sélectifs sont sélectifs pour la douleur + la peur. En d'autres termes, 94% des voxels sélectifs dACC dans cette analyse sont sélectifs pour la douleur + peur. De plus, 48% de tous les voxels dACC sont sélectifs pour la douleur + la peur.

En résumé, si nous traitons la douleur et la peur comme faisant partie d'une construction unique en ce qui concerne le dACC, nous voyons que près de la moitié des voxels dACC sont sélectifs pour cette construction et presque tous les voxels dACC qui sont sélectifs sont sélectifs pour cette construction. Comme dans nos analyses principales dans la section précédente, aucun autre terme que récompense (5% des voxels sélectifs ici) ne recueille même 1% des voxels sélectifs dans le dACC.

Les z-scores de Neurosynth nous informent-ils sur l'inférence inverse?

Nous pensons que c'est sans ambiguïté que les z-scores de Neurosynth disent quelque chose d'important sur l'inférence inverse. Ainsi, l'un des aspects les plus inattendus de l'échange sur notre article PNAS est que TY et TW, créateurs de Neurosynth, semblent suggérer que presque rien ne peut être appris sur l'inférence inverse des z-scores et que nous devrions nous concentrer principalement sur les probabilités postérieures. Par exemple, TY a écrit:

"J'ai expliqué pourquoi on ne peut pas obtenir de support pour une inférence inverse en utilisant des z-scores ou des p-values. L'inférence inverse est intrinsèquement une notion bayésienne, et n'a de sens que si vous êtes prêt à parler de probabilités a priori et postérieures. "

Nous trouvons cela étrange parce que quand on utilise l'interface web de Neurosynth et regarde n'importe quel terme, il y a un seul bouton sur l'écran intitulé "inférence inverse". Lorsque vous cliquez sur ce bouton, il affiche une carte de chaleur qui, compte tenu de son système d'étiquetage, ne peut que supposer qu'elle est censée nous parler de l'inférence inverse. Cette carte de chaleur est une carte thermique des scores z d'inférence inverse, et non des probabilités postérieures. De même, si vous téléchargez la carte d'inférence inversée pour un terme, il s'agit d'une carte de z-scores, et non de probabilités postérieures. Bien qu'ils ne soient pas bayésiens, ces z-scores sont ce que TY et TW ont utilisé pour remplir leurs cartes d'inférence inverse. Si ceux-ci ne nous parlent pas d'inférence inverse, il est très étrange que le seul bouton d'inférence inverse de l'interface mène à ces z-scores.

TY a également écrit sur la valeur des z-scores de Neurosynth dans plusieurs endroits qui semblent contredire la revendication ci-dessus ("on ne peut pas obtenir de soutien …"). Nous avons d'abord le texte de la FAQ Neurosynth:

"Inverser la carte d'inférence: scores z correspondant à la probabilité qu'un terme soit utilisé dans une étude étant donné la présence de l'activation signalée (c'est-à-dire, P (Terme | Activation))"

Cela nous semble comme le z-score nous dit quelque chose sur l'inférence inverse. Voici des extraits de ce que TY a écrit sur Google+ où il répond gracieusement à de nombreuses questions sur Neurosynth:

"Le score z est une mesure de confiance dans l'association statistique; la probabilité a posteriori est une mesure de la taille de l'effet. En général, je recommande d'accorder plus d'attention à la première , car celle-ci est soumise à un bruit lié à la taille de l'échantillon. Un terme avec moins d'études incluses dans la méta-analyse aura une plus grande variabilité, ce qui se traduira par des probabilités postérieures plus extrêmes. Cependant, un terme avec moins d'études produira aussi * moins * des valeurs p / z extrêmes, toutes choses égales par ailleurs. Donc, si vous essayez de faire une réclamation de la forme "il est probable que la fonction F est associée à l'activité dans la région R", vous feriez probablement mieux de baser cela sur le z-score . [soulignement ajouté] "

Cette affirmation est totalement incohérente avec son affirmation ci-dessus selon laquelle "un canon obtient le support d'une inférence inverse en utilisant des z-scores." Dans son blog il a aussi écrit ceci de z-scores:

"Tout ce qu'il nous dit, c'est que, étant donné toutes les données que nous avons, il est très peu probable qu'il y ait exactement une association nulle entre un terme et une région."

Malgré le phrasé péjoratif, nous pensons que "tout cela nous dit" est assez étonnant puisque nous n'avions aucun moyen de le faire avant des bases de données comme Neurosynth. C'est une chose très importante à savoir, surtout quand elle est combinée avec d'autres analyses suggérant que pour d'autres termes, il n'y a pas de preuve d'association entre le terme et la région. Enfin, TY écrit:

"Si le but est simplement de dire quelque chose comme" nous pensons que la jonction temporo-pariétale est associée au mouvement biologique et à la théorie de l'esprit "ou" les preuves suggèrent que le cortex parahippocampique est associé à la navigation spatiale ". en basant cette affirmation sur les cartes de z-score de Neurosynth. "

Nous pensons que c'est exactement ce que nous faisons en même temps que nous montrons que nous sommes tout à fait justifiés de faire des allégations liées à la douleur au sujet de la fonction dACC plutôt que d'autres termes. Dans l'article de PNAS, nous avons fait cela en comparant les termes qui avaient des z-scores non significatifs (exécutif, conflit, saillance) à un terme qui le faisait (douleur). Bien que ceux-ci ne montrent pas que les effets sont plus importants pour la douleur que les autres termes (ce qui n'a jamais été notre objectif), ils montrent que nous pouvons être plus confiants qu'il existe une réelle association entre la douleur et le dACC. termes et dACC. Nous pensons que c'est une contribution précieuse. Dans les analyses actuelles, nous avons adopté une approche différente, en comptant le nombre de voxels qui présentent une association d'inférence inverse pour un et un seul parmi 14 termes. Encore une fois, la plupart des voxels du dACC qui répondent à ces critères étaient sélectifs pour la douleur.

TW donne de bons détails dans la réponse de son blog sur la façon dont le z-score est calculé, en commençant réellement comme un khi-carré:

"Il compare la fréquence d'activation pour un terme cible (" douleur ") contre le taux de base d'activation pour les autres études (" pas de douleur "). Formellement, il compare P (A | pain) à P (A | pas de douleur) en utilisant un test du chi carré. Ainsi, il nous parle de préférence, mais pas de spécificité par rapport à d'autres états potentiels. "

Nous sommes d'accord que le z-score pour la douleur ne fait pas le travail par lui-même. Mais si nous connaissons aussi P (A | moteur) et P (A | non moteur) pour les mêmes coordonnées, cela nous permet d'évaluer si cette activation est plus sélective pour la douleur que moteur. Plus le z-score est grand, plus nous avons confiance que P (A | term) est plus grand que P (A | not term). La comparaison de ces z-scores entre les termes (z douleur vs z moteur ) nous dit si nous devrions avoir une plus grande confiance que l'un de ces termes est associé à l'activité dans la région d'intérêt que l'autre terme.

Enfin, nous avons maintenant comparé les probabilités a posteriori des termes douleur, exécutif, conflit et saillance à l'aide des 8 voxels sur lesquels nous nous sommes concentrés dans notre document PNAS. Par exemple, nous avons comparé les probabilités a posteriori de la douleur (en utilisant les 8 probabilités postérieures pour la douleur provenant de 8 points d'activation différents) avec les probabilités postérieures pour l'exécutif (en utilisant les 8 probabilités postérieures pour l'exécutif). Pour la douleur par rapport à chacun des trois autres termes, les probabilités postérieures de la douleur étaient significativement plus élevées, t> 5,92, p <0,003, d > 4,47. De plus, même en comparant la douleur à la peur et à l'autonomie, les probabilités a posteriori de la douleur sont significativement plus élevées, t> 2,92, p = 0,03, d > 2,21. Nous n'avons jamais pensé que la comparaison des probabilités postérieures était essentielle pour faire valoir notre point de vue, mais c'est au moins une preuve que l'effet est là.

Peut-être ne devrait-il pas être surprenant que nous voyions la même chose avec des probabilités postérieures que nous avons vues avec des z-scores étant donné que, du moins avec les données que nous examinions, les deux séries de statistiques étaient fortement liées. Plus précisément, la corrélation de toutes les probabilités a posteriori et les z-scores pour les termes d'intérêt dans les 8 emplacements examinés dans notre document PNAS était de r = 0,86 . Ainsi, bien qu'il puisse y avoir un certain jour conceptuel entre ces mesures, fonctionnellement, elles fournissaient à peu près la même information dans nos analyses. Cette similitude peut être vu dans la figure ci-dessous qui trace les z-scores contre les probabilités postérieures pour la douleur, l'exécutif, le conflit et la saillance des 8 emplacements dans notre document PNAS. On peut aussi voir que les 7 probabilités postérieures les plus élevées et les 7 scores z les plus élevés proviennent tous de la douleur. Notez que la relation curvilinéaire est probablement due à des probabilités postérieures contraint à une limite supérieure de 1,0.

Matthew Lieberman
Source: Matthew Lieberman

Sélectivité

Nous avons déjà beaucoup parlé de la sélectivité dans notre précédent blog. Nous voulons juste dire quelques autres choses. La première est qu'il n'y a pas de définition universellement acceptée de la sélectivité (TW la décrit comme «vaguement définie»). Les gens ont des définitions, mais tout le monde n'a pas le même. L'implication est que nous avons chacun besoin de dire ce que nous entendons par sélectivité lorsque nous utilisons le terme (quelque chose que presque aucun des journaux qui utilisent ce terme ne fait, y compris notre document PNAS). Nous serons certainement plus prudents à ce sujet à l'avenir, mais nous devrions respecter les définitions des différents chercheurs quand ils les donnent et ne pas les traiter comme ayant une définition mauvaise ou incohérente simplement parce qu'elle est différente de la nôtre. Nous avons maintenant vu au moins trois définitions de la sélectivité dans les voxels dACC, qui sont tous raisonnables:

Sélectivité L & E : les voxels dACC sont sélectifs pour la douleur, si la douleur est une source plus fiable d'activation du dACC que les autres termes d'intérêt (exécutif, conflit, saillance).

Sélectivité TY : on peut dire que les voxels dACC sont 'sélectifs' pour une fonction particulière si (i) montre une association robuste avec cette fonction, (ii) montre une association négligeable avec toutes les autres alternatives facilement disponibles, et (iii) les auteurs ont fait preuve de diligence raisonnable en s'assurant que les principales fonctions proposées dans la littérature sont bien représentées dans leur analyse.

Sélectivité TW : les voxels dACC sont sélectifs pour une fonction particulière si le voxel est activé par cette fonction et "non activé par d'autres choses"

Nous pensons que la définition de TW est défendable, mais elle exclut probablement tout appel sélectif aux analyses IRMf car il y a probablement peu ou pas de voxels dans le cerveau qui montrent l'activation d'un seul et unique processus (ie n'apparaissant que dans une seule carte d' inférence ). Nous pensons que notre définition et la définition de TY sont toutes deux plus pratiques. Nous pensons que le nôtre est implicite dans la plupart des études MVPA discutant de la sélectivité à ce jour et nous pensons que TY représente une barre plus haute, mais une barre intéressante, et qui nécessite vraiment des outils comme Neurosynth, plutôt que MVPA.

Priors empiriques

Dans le dernier blog de TY, il suggère que l'un des problèmes avec nos conclusions est que notre utilisation des probabilités a posteriori est trompeuse. Les probabilités a posteriori de la douleur sont de l'ordre de 0,80 alors que les probabilités a posteriori des autres termes examinés dans l'article tendent à se situer entre 0,50 et 0,60 (où 0,50 est essentiellement un effet nul). Nous pensons que ces différences (et en particulier les différences de z-score associées) nous renseignent sur les fonctions probables du dACC. Cependant, TY implique que nous pensons que sur la base de ces effets, si une nouvelle étude Neurosynth avec l'activité du dACC était sélectionnée au hasard, nous pourrions prédire qu'il s'agirait d'une étude de la douleur. Bien que nous puissions voir pourquoi TY pourrait penser que nous le croyons, nous n'avons jamais fait cette affirmation et ne le croyons pas en réalité.

Le TY signale que la probabilité postérieure de .80 pour la douleur dépend de commencer avec le .50 avant que Neurosynth assume pour chaque terme. En aucun cas, une probabilité postérieure de 0,80 dans Neurosynth implique que 80% des études avec des activations dACC étaient des études de la douleur. En fait, nous l'avons déjà signalé dans notre document PNAS:

"Une probabilité a posteriori s'apparente à une taille d'effet, bien que n'étant pas directement interprétable, parce que le précédent bayésien pour chaque terme était normé à 0,50. Ainsi, une probabilité a posteriori de 0,82 est probablement une taille d'effet significativement plus grande qu'une autre de 0,56; cependant, en raison de la normalisation, on ne peut pas dire que le 0.82 implique qu'il y a 82% de chance qu'une activation provienne d'une étude avec un terme psychologique particulier. "

TY continue ensuite à discuter des priors empiriques de la douleur et d'autres termes. Parce que la douleur apparaît dans l'abstrait de 3,5% de toutes les études dans la base de données Neurosynth et moteur apparaît dans l'abstrait de 18% de toutes les études dans la base de données Neurosynth, si ceux-ci (0,03 et 0,18) sont utilisés comme chaque terme (au lieu de 0,50), le moteur se retrouve avec des probabilités postérieures plus élevées que la douleur.

Nous sommes entièrement d'accord que si vous voyez une étude dans la base de données Neurosynth avec une activation du dACC, il est plus susceptible de provenir d'une étude de moteur qu'une étude de la douleur. Pourtant, nous pensons que cela est presque totalement hors de propos. Nous ne sommes pas intéressés par la distribution des études dans la base de données Neurosynth en tant que telle. Nous sommes intéressés à essayer de tirer des conclusions sur la (les) fonction (s) probable (s) du dACC dans le monde réel. Le fait qu'il y ait plus d'études motrices que d'études sur la douleur dans la base de données Neurosynth ne porte que sur les priorités de recherche antérieures des scientifiques et peut-être sur la facilité avec laquelle une étude motrice peut être menée.

Pour préciser à quel point cette différence dans le précédent basé sur Neurosynth est non pertinente, considérons l'exemple suivant. Imaginez une base de données avec seulement des études de douleur et de moteur. Supposons qu'il y ait 100 études sur la douleur et 1 000 000 d'études sur les moteurs dans la base de données. En outre, imaginez que 100% des études sur la douleur produisent une activité dACC dans un voxel particulier et que seulement 1% des études sur la motricité produisent une activité dACC dans le même voxel. Si nous devions tirer au hasard une étude de cette base de données qui montre une activité dans ce voxel dACC, il serait 100 fois plus susceptible d'être une étude motrice qu'une étude de la douleur. Néanmoins, toute personne raisonnable examinerait ces résultats et conclurait que cette tache dans le dACC est probablement impliquée dans la douleur, mais pas dans les processus moteurs. Le chi-carré soutiendrait cette conclusion.

Nous comprenons que 3,5% et 18% sont en quelque sorte des priors empiriques pour la douleur et le moteur, respectivement, dans le contexte de Neurosynth, mais ils ne sont pas des priors empiriques du monde réel (et TY le souligne plus tard dans son blog). Nous pensons que la décision de TY de mettre tous les priors à 0,50 quand il a créé Neurosynth était une très bonne idée car elle évite que les effets soient dirigés par les types d'études qui sont mieux représentés dans la base de données.

Dans le premier blog de TY, il a donné une bonne explication de la façon de penser aux probabilités postérieures. Il a écrit:

"L'interprétation stricte d'une probabilité a posteriori de 80% pour la douleur dans un voxel dACC est que, si nous devions prendre 11 000 études IRMf publiées et prétendre que 50% d'entre elles incluaient le terme" douleur "dans leurs résumés, la présence de activation dans le voxel en question devrait augmenter notre estimation de la probabilité du terme «douleur» se produisant de 50% à 80%. "

Alors laissons jouer cet exemple un peu. Supposons que nous ayons 2 000 études dans une base de données hypothétique Neurosynth, au lieu de 11 000. En plaçant le prieur pour la douleur à 0,50, nous disons "imaginez que 1000 des 2 000 études ont le terme douleur dans l'abstrait et les 1 000 autres pas". En outre, imaginez que parmi ces 2 000 études, 1 000 d'entre elles ont une activité dACC dans un voxel d'intérêt (par exemple, les coordonnées 0, 18, 30). Une probabilité a posteriori de douleur de 0,81 à ce voxel impliquerait que l'on devrait s'attendre à environ 810 des 1000 études avec dACC dans cet échantillon (ou une nouvelle série d'études avec la même distribution douleur / non-douleur) pour avoir la douleur comme un terme et environ 190 sur les 1000 études avec dACC dans cet échantillon de ne pas avoir de douleur comme un terme. En revanche, si le moteur a une probabilité a posteriori de .51 pour ce voxel, alors nous devrions nous attendre à ce que 510 des 1000 études avec dACC dans cet échantillon aient un terme moteur et environ 490 des 1000 études avec dACC dans ce cas. échantillon de ne pas avoir de moteur comme terme. Bien que la douleur et le moteur n'aient pas été directement comparés dans ces analyses, nous pensons que ces deux analyses suggèrent que la douleur est un meilleur compte de l'activité de ce voxel que les processus moteurs. Cela se reflète également dans les scores z à 0, 18, 30 pour la douleur (Z = 9,90) et le moteur (Z = 0,21).

TY écrit aussi ce qui suit:

"La chose intéressante à propos de tout cela est que, quel que soit le préalable que vous choisissez pour un terme donné, le z-score Neurosynth ne changera jamais. C'est parce que le z-score est une mesure fréquentiste de l'association statistique entre l'occurrence de terme et l'activation de voxel. Tout ce qu'il nous dit, c'est que, compte tenu de toutes les données dont nous disposons, il est très peu probable qu'il y ait exactement une association nulle entre un terme et une région. Cela peut être intéressant ou non (je dirais que ce n'est pas le cas, mais c'est pour un poste différent), mais il ne permet certainement pas une inférence inverse comme «l'activation du dACC suggère que la douleur est présente». Pour dessiner cette dernière revendication, vous devez utiliser un cadre bayésien et choisir des prieurs raisonnables. Pas de priors, pas d'inférence inverse. "

Cela n'a toujours aucun sens pour nous. Tout d'abord, autant que nous puissions le dire, nous n'avons jamais écrit les mots que TY semble nous attribuer ici («l'activation du dACC suggère que la douleur est présente») et c'est parce que nous ne soutenons pas cette opinion. De plus, nous comprenons que sans un cadre bayésien, vous n'obtenez pas de probabilités postérieures, ce qui fournit une estimation de la force de l'effet d'inférence inverse. Cependant, le z-score semble certainement nous indiquer s'il existe un effet d'inférence inverse non nul. Ainsi, le z-score nous dit en effet quelque chose d'intéressant sur l'inférence inverse. S'il y a 14 comptes du dACC et seulement 1 des 14 comptes a un z-score significatif dans leurs cartes d'inférence inverse pour un voxel particulier alors nous avons certainement appris quelque chose sur la fonction de ce voxel sans se référer aux probabilités postérieures du tout.

Peut-on dire qu'une région du cerveau a une fonction?

TW a remis en question la prémisse de notre document, suggérant:

"Nous ne devrions pas chercher une explication unifiée de l'activité du dACC, à moins que ce soit pour décrire une collection de processus divers. Essayer de trouver la «meilleure interprétation» pour une collection de 550 millions de neurones est trompeur, car il nous invite à faire des inférences psychologiques basées sur l'activité cérébrale qui ne sont pas justifiées. Par analogie, c'est comme essayer de deviner si une personne est un républicain ou un démocrate basé sur son état d'origine. La "meilleure interprétation" des électeurs qui vivent au Texas est qu'ils sont républicains. Vous auriez raison de deviner républicain, mais vous auriez seulement raison de 57 pour cent du temps. "

C'est vraiment une question de philosophie de la science concernant les unités / niveaux d'analyse. Le même problème surgit en psychologie sociale quand nous disons que «dans certaines conditions, les gens auront tendance à montrer des effets de conformité». Cela n'implique pas que chaque personne mise dans cette situation montrera ces effets, mais plutôt qu'il y a une tendance centrale peut être distingué statistiquement du bruit. Ce n'est pas parce qu'il y a des gens qui ne se conforment pas que nous ne pouvons pas parler utilement de ce que font les gens en général.

La position de TW est philosophiquement défendable, mais elle mène à la conclusion que l'IRMf ne peut pratiquement jamais identifier de fonction psychologique dans une région du cerveau, car chaque voxel contient environ 5,5 millions de neurones (Logothetis, 2008) et il n'y a probablement aucune région 100% de ces neurones sont invoqués par une seule fonction / processus et par aucune autre fonction / processus. Mais les scientifiques ont clairement trouvé une utilité en essayant de décrire, disons, l'hippocampe en fonction d'une fonction particulière, malgré le fait qu'il ait des millions de neurones qui ne font pas tous la même chose. Nous ne suggérons aucune fonction particulière dans la description finale de la fonction hippocampique, mais nous suggérons qu'il n'est pas inutile de poser une fonction générale pour l'hippocampe qui sera débattue, affinée et mise à jour au fil du temps.

Revenons à l'exemple de TW de deviner si un Texan choisi au hasard est un républicain basé sur le fait que 57% des Texans ont voté pour Romney en 2012 (vs 41% pour Obama). Nous pensons que c'est un bon exemple, mais cela ne capte pas la question qui nous intéresse vraiment. Si nous assimilons les Texans individuels avec les neurones dACC et l'état du Texas avec le dACC dans son ensemble, alors notre vraie question n'est pas si nous pouvons deviner si une personne est républicaine (bien que vous seriez fou de ne pas deviner républicain si vous étiez obligé de parier). Au lieu de cela, notre question est plus proche de «Le Texas fonctionne-t-il en tant qu'État républicain, malgré le fait que beaucoup d'individus dans cet État ne sont pas républicains?» La réponse à cette question est un oui emphatique. Les 57% qui votent républicain ont assuré la domination des républicains dans tous les bras du gouvernement: au Sénat américain (100%); Chambre des représentants des États-Unis (69%); Les sénateurs de l'État du Texas (68%); Représentants du Texas (65%); et la Cour suprême du Texas Justice (100%). Ces chiffres sont facilement assez élevés pour assurer que le Texas fonctionne comme un État républicain. Avec 65% ou plus dans les deux chambres de la législature de l'État, les républicains peuvent voter à travers une législation amicale républicaine à 100% et la Cour suprême de l'Etat peut rendre des décisions amicales républicaines, à chaque fois. Ce qui est peut-être le plus important, c'est que 57% des Texans qui votent républicain ont envoyé 100% des 38 voix électorales du Texas au candidat républicain à la présidence pour les 9 dernières élections d'affilée. Donc, pour le moment, nous pensons qu'il est juste de décrire le Texas comme un État républicain, car cela a une grande valeur pratique. Chaque citoyen n'a pas besoin d'être républicain pour que ce soit le cas, pas plus que le fait qu'il y ait des enclaves urbaines qui s'appauvrissent démocratiquement nuisent à cette description de l'État. (Pour ceux qui sont plus avertis en informatique, considérons simplement un réseau connexionniste.Si une représentation a un petit avantage dans les poids reliant certains nœuds, les processus de satisfaction de contraintes itératifs transformeront ce petit avantage en un avantage fonctionnel important dans les résultats.)

Conclusion

Est-ce que les z-scores des cartes d'inférence inverses nous disent la force des effets d'inférence inverse? Non, mais ils sont corrélés .86 dans nos analyses avec les probabilités postérieures qui le font. Est-ce que les z-scores des cartes d'inférence inverse nous indiquent où dans le cerveau il y a des preuves fiables d'une association d'inférence inverse non nulle? Absolument. Les z-scores peuvent-ils être utilisés comme un outil d'inférence inverse si nous identifions des voxels qui montrent des z-scores significatifs pour un terme mais pas pour d'autres d'intérêt? Absolument.

Pensons-nous que chaque neurone ou voxel du dACC est sélectif ou même activé par la douleur? Est-ce que nous pensons que cela signifie qu'il ne peut y avoir de discussion sur la fonction du dACC? Non. La plupart des voxels dans le dACC sont-ils sélectifs en utilisant la définition de TY? Non, mais environ 43% des voxels dACC montrent une sélectivité en utilisant les 14 termes considérés (ce qui signifie que ces voxels sont apparus dans une et une seule des 14 cartes d'inférence inverses considérées).

Parmi les voxels dACC sélectifs, 91% sont sélectifs pour la douleur . Le dACC est-il sélectif pour la douleur par rapport aux processus exécutifs, de conflit et de saillance, comme nous le soutenions dans le document PNAS? Absolument – seulement 1 voxel des 477 voxels qui montrent la sélectivité est sélectif pour l'un de ces trois processus. Basé sur des preuves neurosynthétiques, le dACC est-il plus sélectif pour la douleur que pour l'attention, l'autonomie, l'évitement, le conflit, l'émotion, l'erreur, l'exécutif, la peur, l'affect négatif, la réponse, la récompense et la saillance? Absolument. Étant donné que peu d'entre nous, y compris nous, auraient deviné que le dACC est plus sélectif pour la douleur que tous les autres, nous pensons que nos résultats sont une contribution significative à la neuroscience cognitive et cognitive.