Rock-Paper-Scissors est plus profond que vous pensiez

En tant qu'enfant, beaucoup d'entre nous réglaient des disputes (par exemple, qui irait en premier sur la diapositive) en jouant à un jeu simple appelé Rock-Paper-Scissors. Le jeu est simple: vous tapez trois fois votre poing fermé dans votre main tout en scandant des "ciseaux de papier-roche", puis signalez votre choix en faisant un poing pour représenter "rock", en pointant votre index et votre majeur pour représenter "ciseaux, »Ou la largeur de la main pour représenter le« papier ». La règle de la victoire était aussi simple: des ciseaux broyés par la roche, des ciseaux coupés en papier et du roc couvert de papier. Si tout le monde a fait le même choix (tout le monde a choisi "rock"), c'était une égalité, et le jeu a été joué à nouveau jusqu'à ce qu'un gagnant soit sorti triomphant.

Ce que vous ne saviez probablement pas, c'est que les ciseaux à papier sont un jeu fondamental non coopératif qui a été largement utilisé par les théoriciens du jeu pour étudier des phénomènes de compétition aussi variés que la diversité des espèces et la dispersion des prix sur les marchés. Parce qu'aucune option n'est absolument meilleure que l'une ou l'autre, un agent rationnel choisit l'une des trois options de manière aléatoire sur chaque round afin d'éviter d'être prévisible et donc d'être exploité par les autres joueurs. Après tout, si vous choisissez toujours "rock", les autres joueurs le comprendront et choisiront toujours "paper" pour vous battre. Cela signifie que chaque agent rationnel a 1 chance sur 3 de gagner sur un tour donné. Dans la théorie des jeux, cette structure de jeu est appelée stratégie équilibrée Nash Equilibrium. La théorie des jeux a récemment catapulté à l'attention nationale quand Arthur Chu l'a utilisé pour gagner une série de jeux de Jeopardy.

Mais la théorie des jeux évolutionnistes basée sur le concept de rationalité bornée prédit un résultat différent: elle prédit le comportement cyclique – et non la sélection aléatoire – en particulier pour les populations finies. L'économiste Herbert Simon a proposé la notion de rationalité limitée pour expliquer comment ce qui compte comme rationnel dépend des décideurs de l'information, de la quantité de temps disponible pour prendre une décision et des limites cognitives ou de calcul de leur esprit. C'est un concept crucial parce que la théorie des jeux et d'autres modèles économiques de la prise de décision rationnelle le définissent comme optimisation, c'est-à-dire, trouver la solution optimale avec un temps, des ressources et une capacité de calcul illimités. La prise de décision répond rarement à ces conditions, et les gens choisissent donc de simplifier leurs choix et d'exploiter les schémas environnementaux (ou contingences) qui permettent d'arriver à une solution satisfaisante – par opposition à optimale. Pour cette raison, la prise de décision humaine est souvent décrite comme satisfaisant plutôt qu'optimisant . Et, tout compte fait, cette stratégie nous sert souvent assez bien.

Une étude récente s'est penchée sur la façon dont les gens jouent aux ciseaux à papier et a découvert que les gens se comportent plus comme des satisfaisants biologiques que des optimiseurs rationnels, adoptant une stratégie cyclique plutôt qu'une stratégie de choix aléatoire compatible avec la théorie des jeux. La chose surprenante, cependant, est que cette stratégie de réponse conditionnelle s'avère effectivement produire de meilleurs résultats que la stratégie mixte de la théorie des jeux de Nash Equilibrium.

Les chercheurs ont recruté un total de 360 ​​étudiants de différentes disciplines de l'Université de Zhejiang et les ont divisés en groupes de 60. Chaque groupe a ensuite joué 300 tours de ciseaux de papier-roche (oui, trois tours de CENT). Après le dernier match, les joueurs ont été payés en espèces proportionnellement à leurs gains accumulés.

Les chercheurs ont découvert que lorsque les joueurs gagnaient un tour en utilisant un choix particulier (p. Ex. «Rock»), ils étaient plus susceptibles de conserver cette option gagnante au tour suivant. Mais s'ils perdaient, ils avaient tendance à passer à l'une des autres options, et l'option qu'ils choisissaient était cohérente avec ce qui aurait battu le choix qu'ils venaient de faire. Donc, si "rock" avait été choisi et était battu par "paper", le joueur essaierait "paper" au prochain round, et ainsi de suite.

Cela signifie que les choix des joueurs étaient conditionnés par ce qui était joué et le résultat de ce choix. Cette stratégie «win-stay, lose-shift» est connue dans la théorie des jeux comme une réponse conditionnelle, et lorsqu'elle joue avec des populations stables (comme cela a été fait dans cette étude), elle s'avère très efficace: Stratégie d'équilibre mixte dans la rentabilité de jusqu'à 10 pour cent. Les chercheurs ont qualifié cette stratégie de «gagner-rester, perdre le quart» comme «socialement efficace». On l'appelle aussi parfois «stratégie de Pavlov» et il a été démontré qu'elle facilite la coopération dans les jeux dilemmes des prisonniers.

Encore plus intéressant est que des modèles de cyclisme similaires ont été observés dans des études connexes avec des jeux qui employaient plus de trois options … tels que les rocailles-papier-ciseaux-lézard-spock.

Copyright 2 mai 2014 Dr. Denise Cummins

Le Dr Cummins est psychologue de recherche, membre de l'Association for Psychological Science et auteur de Good Thinking: Sept idées puissantes qui influencent notre façon de penser.

Plus d'informations sur moi peuvent être trouvées sur ma page d'accueil.

Suis moi sur Twitter.

Et sur Google + .