Ce que le paradigme du conditionnement classique a négligé

L'élucidation du paradigme du conditionnement classique a été attribuée au physiologiste russe Ivan Pavlov (1849-1936), qui a remporté le prix Nobel de physiologie / médecine pour son travail sur les réflexes et la digestion. Le mantra standard du conditionnement classique (appelé conditionnement pavlovien) est qu'un stimulus inconditionné (comme la nourriture) provoque une réponse inconditionnée (comme la salivation). Quand des stimuli précédemment neutres, comme le son d'une cloche, sont associés à des stimuli inconditionnels, ils deviennent des stimuli conditionnés qui viennent provoquer des réponses conditionnées, augmentant ainsi le répertoire de comportement d'un organisme. Cependant, ce que je n'ai jamais demandé pendant mes 10 années en tant qu'étudiant et ce qu'aucun étudiant ne m'a jamais demandé, en plus de 40 ans d'enseignement, est de savoir comment le stimulus inconditionnel (UCS) a provoqué la réponse inconditionnée (UCR) dans le première place? Si l'on devait rechercher la définition d'un réflexe dans l'étalon-or de toutes les connaissances actuelles (Wikipedia), cela indiquerait qu'il s'agit d'un mouvement involontaire vers un stimulus. D'autres définitions incluent des explications telles que les réflexes sont innés contre acquis, ce qui n'explique rien de leurs origines évolutionnaires. Longue histoire faite courte: L'appariement UCS-UCR a été appris. Et cela peut fonctionner comme ceci: Imaginez une variété de stimuli associés à la nourriture: principalement, visuelle et olfactive. Même les formes pré-vie exploraient leurs paysages chimiques à la recherche de composés qui amélioraient leur métabolisme, ce qui augmentait leur probabilité de reproduction. Les mutations dans la réplication de l'ADN (par exemple, les réactions enzymatiques du corps entraînent une diversification de l'ADN) conduisent souvent à des variations comportementales (phénotypiques) du comportement. Dans le cas présent, ce serait le temps de réponse. Maintenant, imaginez une variété de temps de réponse basés sur les variations phénotypiques inhérentes à l'ADN des organismes. Ceux qui sont plus rapides à répondre aux stimuli qui annoncent des aliments ou des produits chimiques qui améliorent leur métabolisme (et leur succès reproducteur) sont plus susceptibles de se maintenir et de transmettre ces prédilections génétiques à leur progéniture subséquente. Au fil des générations, la sélection naturelle pour le génome de la réponse rapide devient fixe dans l'ADN (mémoire génétique). Ce dernier processus est également appelé l'effet Baldwin (apprentissage adaptatif).

En 1896, le psychologue J. Mark Baldwin (1861-1934) a proposé un «nouveau facteur» dans l'évolution. C'était la notion que lorsque les organismes rencontrent de nouveaux environnements ou lorsque les environnements existants changent, les organismes qui peuvent apprendre à s'adapter plus rapidement seront favorisés par la sélection naturelle que ceux qui sont moins flexibles ou plus lents. Pendant de nombreuses générations, les comportements continus et soutenus des rejetons ont finalement modifié ou façonné l'évolution de cette espèce. Le nouveau facteur de Baldwin était cette interaction entre l'environnement d'un organisme et son code génétique, et, comme noté précédemment, il est devenu connu sous le nom de l'effet Baldwin. Actuellement, il est accepté comme un mécanisme théoriquement viable dans la théorie de l'évolution. Dans le présent contexte, cela aide à expliquer pourquoi tous les réflexes sont appris et pourquoi la dichotomie «réflexe inné versus acquis» est finalement spécieuse, puisque tous les réflexes sont acquis (ou appris) au départ.

Voici un autre exemple d'un réflexe d'une observation faite par Charles Darwin (1872) lors de la visite des Jardins zoologiques de Londres. Il a dit qu'il avait pressé son visage contre la cage de verre d'une Vipère Puff avec l'intention de ne pas reculer quand l'additionneur a heurté le verre. Cependant, il a dit, en dépit de sa pleine résolution de ne pas bouger, il s'est retrouvé en train de sauter «d'un mètre ou deux en arrière avec une rapidité étonnante» (page 38). De plus, il écrivait: «Ma volonté et ma raison étaient impuissantes contre l'imagination d'un danger qui n'avait jamais été expérimenté» (page 38). Darwin a correctement supposé que sa réaction était un ancien réflexe. Le circuit neuronal du réflexe est maintenant bien connu. L'image visuelle du serpent atteint l'amygdale, qui envoie un signal direct aux motoneurones pour déclencher le réflexe de recul, et ce processus contourne initialement le cortex cérébral. Bien sûr, ce comportement n'a pas été codé directement dans un ancêtre dans un essai. Cependant, il a dû être bénéfique pour la plupart des organismes ancestraux d'éviter rapidement les serpents. Ces organismes ancestraux, qui étaient capables d'éviter un serpent frappant plus rapidement que les autres, étaient en fin de compte à un avantage reproductif. Les gènes qui ont même eu une légère tendance à reculer plus rapidement que les pairs ont été transmis à leur progéniture. Sur un très grand nombre de générations et peut-être de millions d'années, nous pouvons, comme Darwin, observer des réflexes (ou mémoires génétiques), et seul le processus de sélection naturelle est nécessaire pour comprendre leur acquisition. Ce que les mutations de l'ADN ont fourni dans ce contexte était la variation de la vitesse de réponse. En fin de compte, ce que la sélection naturelle offrait était un biais pour les codes génétiques qui favorisaient le rapide, c'est-à-dire l'effet Baldwin. Et, voilà, sur de grandes périodes de temps, le résultat est un appariement UCS-UCR, qui est l'aspect négligé du paradigme de conditionnement classique.

Le professeur Frederick L. Coolidge est co-directeur du Centre for Cognitive Archaeology, Université du Colorado, Colorado Springs. Le Centre offre des certificats en Archéologie Cognitive (pour plus de détails, contactez: [email protected]).