Quel est le problème avec la stratégie de Jeopardy d'Arthur Chu

Quel est le problème avec le style de jeu Jeopardy d'Arthur Chu? Tout simplement ceci: il ne s'agit pas de gagner parce que vous en savez le plus. Il s'agit de gagner en s'assurant que les autres ne peuvent pas jouer.

Quand les gens regardent Jeopardy, ils regardent avec une supposition implicite: que le gagnant est le plus compétent et le meilleur stratège. Mais le style de jeu «théorie des jeux» d'Arthur Chu supprime le premier. Comme il le dit lui-même:

… vous pouvez tirer parti de vos avantages dans Jeopardy !, même si vous n'êtes pas nécessairement la personne qui connaît le plus de trivial, ou si vous êtes à peu près égalé avec vos adversaires, comment pouvez-vous augmenter vos chances de gagner. Il se trouve qu'il y a beaucoup de choses que vous pouvez faire que la plupart des gens ne font pas pour une raison quelconque.

Certains se plaignaient de l'affirmation selon laquelle Jeopardy est simplement un jeu-questionnaire sur le modèle de Family Feud ou de Hollywood Squares . Les questions vont de l'histoire ancienne à la culture pop. Et certaines catégories de questions nécessitent de trouver des jeux de mots ou des tournures qui fournissent des indices sur la réponse. Mais le message de Chu est clair: vous pouvez être assez ignorant de chaque catégorie mais gagner encore si vous vous assurez simplement que personne d'autre n'a une chance de jouer.

Cela est particulièrement vrai du Daily Doubles qui change la donne. La stratégie de Chu est de les trouver le plus rapidement possible et de les jouer ou de les gaspiller – assurez-vous simplement que les deux autres adversaires n'ont aucune chance de les atteindre.

Après un de ses matchs, Chu a forcé un bris d'égalité inhabituel quand il n'était pas obligé de le faire, permettant à l'un de ses adversaires de rentrer à la maison avec 26 800 $, au lieu de laisser le spectacle à 2 000 $. Mais même ce mouvement apparemment altruiste était en fait une manifestation d'intérêt personnel: en forçant le tie-break, il augmentait ses propres chances de revenir le lendemain parce qu'il incitait son adversaire à tout miser. S'il avait raison, il avancerait, mais si lui et son adversaire avaient tort, il avancerait de toute façon.

Ce que les gens trouvent désagréable à propos de ce style de jeu, c'est qu'il est entièrement axé sur la victoire en limitant les possibilités de jeu de l'adversaire, et non en sachant quoi que ce soit. La NFL est devenue très stricte sur la limitation des tactiques visant à blesser les quarts, parce que, bien sûr, vous pouvez gagner de cette façon, mais la plupart des gens viennent en fait pour voir jouer un bon football. Seuls les fans et parieurs dyed-in-the-laine sont intéressés seulement qui gagne. Dans la NBA, les règles sont structurées de sorte qu'il n'est pas possible de gagner juste en continuellement encrassant les meilleurs joueurs. C'était autrefois possible, mais ils ont changé les règles de sorte que (a) vous commettez une faute, et (b) le pourcentage de lancers francs est beaucoup plus élevé que le pourcentage de lancers, ce qui signifie que vous donnez un avantage à ceux que vous bluffez. Les gens veulent voir le jeu joué, et ils veulent que les gagnants soient de bons joueurs de balle ainsi que des stratèges.

Mais Chu ne le voit pas comme ça. Il dit

… les producteurs ne me payaient pas pour rendre le spectacle agréable à regarder. Si vous jouiez pour le plaisir, vous pourriez parler d'esprit sportif pauvre, mais dans les règles, il s'agit de gagner. Si vous ne l'aimez pas, changez les règles.

Oui, en effet, des mots plus sages n'ont jamais été prononcés, et peut-être que les producteurs de Jeopardy devraient envisager de faire exactement cela.

Il serait probablement de ceux qui considèrent Chu comme un génie et qui sont friands de son style de jeu pour en apprendre un peu plus sur la théorie des jeux. Prenons un exemple simple comme le dilemme du prisonnier. Dans ce jeu simple, si deux parties coopèrent, elles obtiennent un modeste gain. Si l'un d'entre eux est défectueux, le transfuge obtient un gain plus important et le coopérateur reçoit une pénalité importante. Si les deux défauts, ils obtiennent tous deux des sanctions modestes. Par exemple, supposons que vous et un collègue avez conjointement bâclé un rapport de façon importante, ce qui a coûté 100 000 $ à votre employeur. Votre patron est en colère et a l'intention de faire en sorte que la personne responsable rembourse l'entreprise de sa propre poche. Il rencontre chacun d'entre vous séparément et exige de savoir qui a bâclé le rapport. Si vous vous accusez tous les deux, il vous infligera 50 000 $ chacun. Si un seul blâme l'autre, la personne mise en cause se verra infliger une amende de 100 000 $ et l'autre ne sera pas punie. Si vous refusez tous les deux de blâmer l'autre, le patron vous infligera une amende de 25 000 $ et écrira les 50 000 $ restants.

Vous pensez peut-être que la meilleure chose à faire est de garder maman. De cette façon, vous perdez de l'argent, mais personne ne reste coincé dans le sac. Après tout, vous devez encore travailler ensemble après que ce gâchis soit pris en charge. Mais en économie, un agent rationnel est un agent intéressé: vous cherchez à maximiser votre gain et à minimiser vos pertes. Donc, la meilleure stratégie (dominante) dans les jeux One-shot Prisoner Dilemma comme celui-ci est de faire défaut. Prenez l'argent et courez, laissant votre partenaire (ou votre adversaire) tenant le sac.

Mais si vous jouez de cette façon, vous feriez mieux d'espérer que vous ne retrouverez jamais les mêmes joueurs. Voici pourquoi: Si les joueurs agissent comme des agents rationnels et que les autres joueurs sont des automates stupides, alors il est possible de réparer le jeu pour que vous les exploitiez continuellement. Mais si les autres joueurs sont capables d'avoir une «théorie de l'esprit» – c'est-à-dire, ils peuvent comprendre ce que vous êtes susceptible de faire – alors le dilemme du prisonnier devient équivalent au jeu Ultimatum, un jeu dans lequel une personne propose de diviser une somme d'argent et l'autre personne accepte ou refuse la proposition. Si l'offre est rejetée, personne ne reçoit d'argent. Le proposant peut maximiser son propre résultat seulement en donnant plus à son partenaire et il n'y a aucun avantage à le faire. En fait, ils peuvent alors choisir de négocier pour chacun d'entre eux le score de l'autre à la valeur coopérative maximale.

C'est ainsi que se comportent les agents purement rationnels, et cela ne semble pas trop bon pour le pur transfuge. Mais le résultat semble encore plus sombre si l'on se demande comment les gens se comportent en jouant à ce genre de jeux. D'innombrables études en économie expérimentale et en psychologie ont montré que les gens commencent ces jeux avec un préjugé de coopération et se comportent généreusement envers ceux qui coopèrent avec eux. La défection, cependant, se heurte à de vives représailles; les coopérateurs ne s'engageront pas dans de futures transactions avec des transfuges, et ils paieront même une pénalité pour avoir l'opportunité de punir les transfuges. Ils vont même jusqu'à encourir une pénalité sur eux-mêmes pour punir quelqu'un qui a fait défection sur quelqu'un d'autre!

Alors peut-être, à long terme, définir le fait de gagner simplement en battant vos adversaires n'est pas si intelligent après tout.

Pour une présentation en anglais des stratégies de la théorie des jeux, voir le chapitre 2 de mon livre La bonne pensée: Sept idées puissantes qui influencent notre façon de penser.

Droit d'auteur Dr. Denise Cummins 25 février 2014

Le Dr Cummins est psychologue de recherche, membre de l'Association for Psychological Science et auteur de Good Thinking: Sept idées puissantes qui influencent notre façon de penser.

Plus d'informations sur moi peuvent être trouvées sur ma page d'accueil.

Suis moi sur Twitter.

Et sur Google + .