Les entraîneurs devraient-ils dire aux chiens que leur comportement est mauvais?

SC Psychological Enterprises photo
Source: SC Psychological Enterprises photo

Le Golden Retriever se déplaça sur le sol jusqu'à l'endroit où une demi-douzaine d'objets en forme d'haltères étaient étalés. Alors que le chien s'approchait de l'un d'entre eux, l'entraîneur dit "Oui!" D'une voix enthousiaste. Le chien a immédiatement attrapé l'article et le lui a retourné en échange d'un régal.

Quelques instants plus tard, l'article avec l'odeur du handler avait été retourné au groupe d'autres objets et placé dans un endroit différent. De nouveau, le gros chien jaune s'avança et s'apprêtait à soulever un autre objet du sol, mais cette fois ce n'était pas l'objet qui avait l'odeur correcte. Après avoir vu cela, le gestionnaire a annoncé "Désolé!" Le chien a cessé d'atteindre le mauvais article, a regardé le formateur, puis d'une manière plutôt modérée a commencé à explorer les autres articles. Finalement, il a décidé sur le bon article, ce qui a déclenché un autre heureux "Oui!" Et quand il est revenu avec lui, il a eu un autre traitement.

La première partie de cette séquence d'entraînement est un aspect assez commun et familier de l'entraînement canin. Il est similaire à ce qu'on appelle un «clicker training» où un son ou un signal sert de marqueur de récompense pour indiquer que le chien est amené à corriger la réponse et ce marqueur l'informe qu'une friandise attendra quand il retournera au handler ( cliquez ici pour plus à ce sujet). La deuxième partie de la séquence d'entraînement est considérablement moins commune, puisque dans ce cas le mot "Désolé" est un marqueur qui indique au chien qu'il avait tort, et qu'aucune récompense ne vient cette fois.

J'ai demandé au formateur pourquoi elle a choisi d'utiliser ce "marqueur de non-récompense" et elle a dit: "Dire au chien que c'est faux lui fournit simplement des informations supplémentaires et lui permet d'abandonner toute réponse impasse et de passer à d'autres comportements sont plus susceptibles d'être récompensés. J'ai lu plusieurs fois et participé à des ateliers où plusieurs dresseurs de chiens bien connus ont prétendu que le fait de dire au chien quand il est incorrect ainsi que lorsqu'il fait ce qu'il faut est une méthode d'entraînement plus efficace.

L'idée d'un marqueur de récompense lors de la formation des animaux a été introduite par le psychologue BF Skinner. J'ai eu plusieurs occasions de lui parler, car il se rendait souvent à Vancouver parce que sa fille était mariée à un membre du corps enseignant du département d'histoire de mon université. Lors de telles visites, il passait souvent par le département de psychologie pour rendre visite à des amis et à des connaissances. À un moment donné, je me souviens lui avoir demandé comment les dresseurs de chiens pouvaient utiliser des marqueurs. Plus précisément, je voulais savoir si nous devions dire à un animal quand il faisait quelque chose de mal et n'était pas sur le point d'être récompensé de la même manière que nous lui disons quand il avait raison et qu'il était sur le point d'obtenir sa récompense.

Il secoua la tête et sourit. «Chaque fois que vous récompensez un animal pour avoir fait la bonne chose, vous renforcez cette réponse et augmentez la probabilité qu'elle se reproduise. Mais signaler à un animal que c'est faux fait de ce signal une sorte de punisseur. Et la vérité est que les animaux veulent éviter tout ce qui est associé à une situation où ils pourraient être punis. Est-ce que tu fais des mots croisés? »J'acquiesçai. "Eh bien, le plaisir de faire des mots croisés est que chaque fois que vous obtenez quelque chose de bien, vous avez l'impression d'avoir été récompensé. Imaginez ce qui se passerait si chaque fois que vous posez un mauvais mot ou que vous écrivez une mauvaise lettre dans un carré, le puzzle bourdonne pour vous dire que vous avez eu tort. Pensez-vous que le fait de travailler sur un tel jeu de mots croisés serait aussi amusant que d'en faire un où vous deviez simplement fouiner jusqu'à ce que vous obteniez la bonne réponse sans aucun commentaire négatif? Pensez-vous que vous choisiriez volontairement de travailler sur ce puzzle qui vous a donné cette rétroaction négative plutôt que d'opter pour le format plus traditionnel?

J'y ai réfléchi et je suis arrivé à la conclusion que Skinner avait probablement raison. Je crois que je préférerais la situation où tous mes commentaires se concentrent sur mes réponses correctes sans faire de bruit sur mes erreurs. Si tel est le cas pour une personne n'est pas raisonnable de présumer que les animaux qui étaient en train d'être formés ressentiraient probablement la même chose. Cependant, il n'y avait pas de données réelles à l'appui de cette conclusion – jusqu'à maintenant.

J'ai récemment obtenu une copie d'une thèse écrite par Naomi Rotenberg, qui était étudiante à la maîtrise au Hunter College * de la City University of New York. L'expérience rapportée dans cette thèse a directement abordé ce problème. L'étude de Rotenberg était plutôt simple et impliquait 27 chiens qui étaient entrainés à effectuer un tour simple (placer leurs deux jambes dans un cerceau sur le sol). La moitié des chiens ont été enseignés en utilisant seulement un marqueur de récompense, dans ce cas le son généralement utilisé d'un clicker. L'autre moitié du groupe a été enseignée avec un clicker gratifiant, mais en plus ils entendaient un son (juste le ton que nous appelons "middle C" sur un piano) qui disait au chien qu'il avait fait une erreur et choisi le mauvais comportement.

La séquence d'entraînement impliquait l'expérimentateur qui émettait la commande "Hoop", puis attirait le chien à faire la bonne réponse après quoi il entendait le clic et obtenait une récompense. La formation a été divisée en six niveaux différents dans lesquels le leurre a été progressivement éliminé. Au plus haut niveau, le chien a simplement reçu la commande verbale et était censé accomplir le comportement. Combien de niveaux réussis le chien a fait à travers pendant la séance d'entraînement était une indication de combien l'animal avait appris. En outre, le pourcentage de réponses correctes a servi d'autre mesure de la compétence du chien.

Les résultats étaient tout à fait non ambigus. Les chiens qui ont été récompensés pour leurs réponses correctes et qui ont simplement ignoré leurs réponses incorrectes ont fait beaucoup mieux. Ces chiens ont appris plus rapidement et ont atteint un niveau de compétence plus élevé que les chiens qui ont reçu les «informations supplémentaires» en leur disant quand ils avaient tort. Pendant les séances d'entraînement, le niveau médian d'accomplissement pour les chiens dont les erreurs ont été ignorées était le niveau 4 (sur 6), tandis que pour ceux qui ont été mal informés et corrigés, ils ont seulement obtenu une performance médiane de niveau 1 En termes de pourcentage, les chiens qui ont seulement reçu les marqueurs indiquant les cas où ils ont fait la bonne chose ont obtenu un taux de réponse correct de 60%, alors que les chiens qui ont été mal informés ont réussi à corriger seulement 27% du temps. Une analyse statistique a montré que dans l'ensemble les chiens qui ont seulement été informés quand ils étaient corrects étaient presque deux fois plus compétents à la fin de l'entraînement.

Rotenberg résume ainsi ses résultats [où j'énonce ses abréviations entre crochets].

Non seulement les [marqueurs non récompensés qui disaient aux chiens qu'ils avaient tort et qui ne recevaient aucun traitement] affectaient significativement la performance globale des chiens, mais ils ont conduit de nombreux chiens à échouer très tôt dans la séance d'entraînement. Les chiens qui ont entendu un [marqueur de non-récompense] suite à une erreur précoce ont continué à faire des erreurs, et aucun n'a pu progresser vers le niveau 2. En revanche, les chiens dont les erreurs précoces ont été ignorées ont pu récupérer et finalement niveau 2. Cette tendance des résultats accrédite l'affirmation de certains formateurs que l'audition [des marqueurs sans récompense] pourrait amener certains chiens à abandonner l'entraînement, plutôt que d'essayer de dépasser leurs erreurs pour effectuer le comportement correctement …

En d'autres termes, les chiens qui travaillent simplement pour découvrir les comportements corrects, et qui sont récompensés pour ces comportements, gardent la tâche d'entraînement et finalement réussissent, tandis que les chiens sont non seulement informés quand ils ont fait la bonne réponse, mais aussi quand ils ont fait la mauvaise réponse semblent devenir découragés et abandonner toute la tâche d'apprentissage.

Stanley Coren est l'auteur de nombreux livres dont: La sagesse des chiens; Les chiens rêvent-ils? Né à Bark; Le chien moderne Pourquoi les chiens ont des nez humides? Les pawprints de l'histoire; Comment les chiens pensent-ils? Comment parler chien; Pourquoi nous aimons les chiens que nous faisons; Que savent les chiens? L'intelligence des chiens Pourquoi mon chien agissent-ils de cette façon? Comprendre les chiens pour les nuls; Sommeil voleurs; Le syndrome du gauchiste

Copyright SC Psychological Enterprises Ltd. Ne peut être réimprimé ou republié sans permission

* Données de: Naomi Rotenberg (2015). Entraîner un nouveau truc en utilisant des marqueurs sans récompense: effets sur la performance des chiens et les comportements de stress. Thèse de maîtrise, Hunter College, New York. CUNY Academic Works. http://academicworks.cuny.edu/hc_sas_etds/12