Cherchez et vous trouverez: Comment l'imprévisibilité se rapporte à l'exploration

Il y a quelque temps, j'ai écrit un article sur l'imprévisibilité du comportement humain. J'ai discuté du concept de correspondance de probabilité dans le choix. Un cas simple de correspondance de probabilité est celui dans lequel vous avez le choix entre deux coupes, dont une seule aura un M & M. Si le M & M est dans la tasse gauche 80% du temps, et la tasse droite 20% du temps, vous pouvez maximiser le nombre de M & M que vous êtes susceptible de recevoir en sélectionnant toujours la tasse gauche. De cette façon, vous obtiendrez M & Ms 80% du temps. Les gens (et la plupart des autres animaux) ont tendance à ne pas faire cette réponse optimale. Au lieu de cela, nous avons tendance à correspondre à la probabilité. Autrement dit, si la tasse gauche a le M & M 80% du temps, alors nous prenons la tasse gauche 80% du temps.

Il y a plusieurs raisons pour lesquelles nous adoptons ce comportement, et un article de Wolfgang Gaissmaier et Lael Schooler dans le numéro de Cognition de décembre 2008 suggère une nouvelle raison. Ils constatent que les personnes qui ont tendance à correspondre aux probabilités sont mieux en mesure de détecter les changements dans l'environnement que les personnes qui trouvent l'option la plus récompensée et la respectent.

Une façon de penser à cela est qu'il y a toujours un compromis entre explorer le monde et l'exploiter. L'exploration est le processus de recherche de nouvelles choses. L'avantage potentiel de l'exploration est que vous pouvez découvrir de nouvelles sources de récompense. Le danger de l'exploration est que vous pouvez passer beaucoup de temps et d'énergie et venir les mains vides. L'exploitation est le processus qui consiste à tirer des récompenses du monde dans des lieux connus. Le bénéfice de l'exploitation est que vous avez une bonne idée de ce que vous allez obtenir. Le danger est que vous puissiez passer à côté d'autres opportunités plus gratifiantes que celle que vous exploitez actuellement.

Ce compromis d'exploitation d'exploration se produit dans presque chaque facette de nos vies. Si vous regardez régulièrement la même émission, vous exploitez ce spectacle. Si vous goûtez à différents restaurants dans la ville où vous vivez, vous explorez. Si vous jouez d'un instrument de musique et respectez le même ensemble de chansons que vous avez déjà apprises, vous exploitez. Si vous planifiez délibérément vos vacances afin que vous visitiez toujours de nouveaux endroits, vous explorez.

Il a toujours été quelque peu curieux que les gens continuent d'explorer dans des expériences démontrant l'appariement des probabilités. Le comportement optimal consiste à exploiter l'option la plus rentable. Et de manière étroite dans le contexte de l'expérience, il est vrai que l'exploitation de la meilleure option dans l'étude est la meilleure chose à faire. Cependant, le monde est dynamique. Les choses dans le monde changent. Un restaurant qui était horrible pourrait avoir un nouveau chef et tout d'un coup être excellent. Une émission de télévision qui a commencé de façon audacieuse et radicale peut glisser dans la médiocrité.

Si vous évaluez le monde en même temps et que vous l'exploitez ensuite, vous courez le risque de manquer des changements dans le monde. Le système cognitif est structuré pour trouver un moyen raisonnable de résoudre le compromis entre l'exploration et l'exploitation. S'il y a une option qui est de loin supérieure à toutes les autres, alors vous aurez tendance à la choisir la plupart du temps et à sélectionner d'autres options de temps en temps, juste pour vous assurer que le monde n'a pas changé radicalement. Si une option est seulement légèrement meilleure qu'une autre, alors vous échantillonnez la meilleure option seulement légèrement plus souvent que la pire. Ce comportement est utile, car une légère diminution de la qualité de la meilleure option (ou une augmentation de la qualité de l'option la moins bonne) pourrait inverser la qualité relative des options. Et parce que vous faites un bon travail de gestion du compromis entre l'exploration et l'exploitation, vous remarquerez. Donc, l'imprévisibilité du comportement humain est vraiment une vertu.