Le dilemme du prisonnier au Moyen-Orient

Regardant avec horreur l'actuelle – et apparemment interminable – sanglante entre Israéliens et Palestiniens, le problème semble frustrant simple: Pourquoi ne coopèrent-ils pas simplement? Comme Rodney King l'a demandé après avoir été battu par la police à Los Angeles: Pourquoi ne pouvons-nous pas tous nous entendre?

La réponse s'avère plus complexe qu'on pourrait le penser, et pas seulement au Moyen-Orient. La théorie des jeux, une technique de prise de décision largement utilisée par les économistes, les mathématiciens, les analystes stratégiques, les psychologues, les politologues et même les biologistes (et à propos de laquelle j'ai écrit il y a quelque temps: The Survival Game: comment la théorie des jeux explique la biologie de la coopération et de la compétition , Henry Holt, 2003). Bien que la théorie des jeux aide à éclairer de tels problèmes – et contribue ainsi à clarifier notre pensée – il est malheureusement moins clair sur la façon de les résoudre. En effet, comme nous le verrons, ses connaissances sont limitées, mais cela vaut la peine d'être compris, ne serait-ce que parce que la théorie des jeux est un grand plaisir intellectuel et, surtout, qu'elle est largement consultée par ceux qui prennent des décisions importantes.

Dans ses cas les plus simples, la théorie des jeux est une façon de regarder des situations impliquant deux parties qui interagissent, à la suite de laquelle chacune reçoit un «bénéfice» déterminé non seulement par ce qu'elle fait, mais par le comportement de l'autre. Ceci est extrêmement important: Habituellement, il n'est pas terriblement difficile d'identifier le «meilleur» comportement tant que son choix n'est pas influencé et, en même temps, susceptible d'influencer, à son tour, ce qu'un autre «joueur» fait. S'il pleut, la décision de porter ou non un parapluie est relativement facile, d'autant plus que cette décision n'est pas susceptible d'affecter ou non la pluie. Mais qu'en est-il de la décision de coopérer ou non avec quelqu'un d'autre, alors que vos gains et ceux de l'autre partie dépendent de ce que vous et votre partenaire / adversaire avez choisi? Et, d'ailleurs, chacun de vous le sait, et est susceptible d'ajuster son comportement en conséquence.

Malheureusement, des situations de ce genre entravent souvent la coopération, surtout lorsque chaque joueur craint d'être exploité par l'autre. Particulièrement important – et pertinent pour l'étreinte meurtrière israélo-palestinienne – est reconnu depuis longtemps, et modélisé mathématiquement, comme le Dilemme du Prisonnier; désormais, PD. (J'ai écrit sur un jeu particulier à trois personnes et aussi sur l'autre jeu bien connu, le soi-disant Game of Chicken, comme une métaphore utile pour conceptualiser les luttes démocratiques-républicaines sur le plafond budgétaire. encore une fois en ce qui concerne la «falaise fiscale» imminente.)

Pendant les périodes de tension internationale, les participants sont susceptibles d'être extrêmement suspicieux que l'autre côté est dangereux, et susceptible de rechercher la faiblesse, étant dissuadé seulement par la force, les assistants de la Maison Blanche ont soutenu que les Soviétiques suivaient la maxime léniniste: «Si vous frappez de l'acier, reculez; Si vous frappez la bouillie, continuez. "Et, bien sûr, tant que chaque partie est déterminée à rencontrer l'autre avec de l'acier plutôt que de la bouillie, chacun peut justifier sa politique en pointant vers l'autre.

Dans le monde expérimental de la DP, théoriquement trop simplifié, chaque participant a deux options: «coopérer» (p. Ex., Être gentil, mush, etc.) ou «défectueux» (p. Ex. Être méchant, acier, etc.). Si les deux coopèrent, chacun reçoit une récompense pour ce faire; si les deux défauts, chacun reçoit une récompense considérablement inférieure, la punition de la défection mutuelle, mais si l'un des défauts et l'autre coopère, le transfuge obtient le plus haut rendement de tous, appelé la tentation de défaut, et celui qui coopère tandis que l'autre avantage de la situation reçoit le plus bas, le gain de Sucker.

Un PD se produit lorsque les paiements sont dans la relation suivante: Tentation> Récompense> Châtiment> Sucker. Dans ce cas, chaque camp est motivé pour obtenir le gain le plus élevé (Tentation) et craint d'être coincé avec le plus bas (Sucker). Pour comprendre ce qui se passe ensuite, imaginez-vous dans la tête de l'un ou l'autre joueur, en essayant de décider comment se comporter: "L'autre partie pourrait coopérer avec moi ou faire défaut. Si elle coopère, alors mon meilleur coup est de faire défection, car alors j'obtiendrais le meilleur rendement de tous (Temptation). D'un autre côté, elle pourrait faire défection, auquel cas ma meilleure décision – une fois de plus – est de faire défection, car même si j'obtiens le Châtiment, ce qui est une mauvaise récompense, au moins c'est mieux que de finir un Sucker.

Chaque joueur est donc déplacé vers un défaut, ce qui pose un dilemme troublant car, ce faisant, chacun obtient la punition de la défection mutuelle (une course aux armements débilitante, ou, dans le Moyen-Orient d'aujourd'hui, des épisodes répétés de meurtre et de chaos). De loin, la meilleure récompense mutuelle aurait été la récompense partagée pour la coopération ou, du moins, la retenue réciproque.

Le Dilemme du Prisonnier est un moyen utile de modéliser le dilemme de penser que l'on doit être «méchant» de peur que quiconque est «gentil» soit à la merci d'autres qui persévèrent à être méchants. D'un autre côté, il est aussi excessivement pessimiste en ce sens qu'il n'opère que deux choix alors qu'en réalité, les individus ou les États ont une variété d'options intermédiaires, connues des hommes d'État comme «mesures de confiance». "Sont des affaires ponctuelles, bien qu'en réalité, les états interagissent plusieurs fois de suite, et peuvent donc varier leur comportement en fonction de ce qui s'est passé la fois précédente. Lorsque les deux parties ont un intérêt à générer une séquence d'interactions coopératives, être gentil n'est pas seulement pour les saints, les softies ou les drageons: il peut donner les meilleurs résultats pour toutes les personnes concernées.

Les modèles informatiques ont montré, en effet, que lorsque deux acteurs ont la perspective d'interactions futures continues, même une PD meurtrière peut être résolue en faveur d'une coopération mutuelle, dans laquelle les deux parties sont récompensées pour leur coopération. Les tactiques optimales dépendent des variations de la technique bien connue du «tit-for-tat», rendue célèbre par le politologue de l'Université du Michigan, Robert Axelrod.

En raison de la simple géographie, et en dépit des revendications mensongères des extrémistes de chaque côté, les Israéliens et les Palestiniens sont coincés avec une longue «ombre du futur» partagée, dans laquelle ils vivront ensemble ou mourront ensemble. D'un autre côté, l'impasse israélo-palestinienne s'écarte du PD classique à d'autres égards, notamment le fait que la théorie exige que les deux parties soient équilibrées de telle sorte que les coûts et les avantages soient symétriques. Cependant, la situation actuelle est nettement déséquilibrée , Israël bénéficiant d'un avantage militaire et économique massif; de plus, beaucoup – peut-être la plupart des Israéliens sont plus ou moins satisfaits de la situation socio-économique et politique actuelle, alors que l'écrasante majorité des Palestiniens ne le sont pas. Par conséquent, ces derniers sont fortement disposés à s'écarter d'un éventuel compagnon de route, se livrant à des actions qui semblent défier les Israéliens et de nombreux Américains, alors que du point de vue palestinien, le statu quo actuel est celui dans lequel Israël est en train de défection chronique. Les Palestiniens languissent comme Suckers.

La théorie des jeux permet de clarifier le dilemme de la coopération, révélant pourquoi «s'entendre» n'est pas aussi simple – ou même naturel – que beaucoup le souhaiteraient. Mais en même temps, cela montre que les êtres humains ne sont pas nécessairement voués à Un monde hobbesien d'une défection sans fin et punitive, s'ils peuvent être persuadés d'avoir une vision plus large de leur situation et, par conséquent, de leurs opportunités.

David P. Barash est professeur de psychologie à l'Université de Washington; son livre le plus récent est Homo Mysterious: des puzzles évolutionnaires de la nature humaine (2012, Oxford University Press)