Conseils pour un champion

Le monde de Go est dans un état de choc, comme nous l'avons rapporté dans un post précédent. Pour la toute première fois, un programme informatique a battu un joueur professionnel. Le programme informatique derrière cet exploit, AlphaGo, est développé par Google Deep Mind et utilise plusieurs techniques de pointe (voir notre article précédent pour plus de détails). Le résultat était révolutionnaire parce que Go – un jeu asiatique avec beaucoup plus de possibilités que les échecs – était considéré comme le Saint Graal de l'IA. On pensait que les ordinateurs devraient être en mesure d'afficher l'intuition afin de jouer à un niveau supérieur – il semble maintenant qu'ils peuvent le faire.

Les choses pourraient empirer très bientôt pour l'humanité. Du 9 mars au 15 mars, AlphaGo jouera contre Lee Sedol (Corée du Sud), l'un des meilleurs joueurs du monde. Le match aura lieu à Séoul et se jouera sur cinq matches, avec un prix de 1 million de dollars. Lee Sedol défendra-t-il le dernier bastion de la fierté humaine contre l'IA?

Fernand Gobet
Source: Fernand Gobet

La Corée du Sud est l'un des principaux pays de Go, où il est appelé "baduk" plutôt que le nom japonais. (Peut-être que AlphaGo devrait être renommé AlphaBaduk pour ce match). Lee Sedol, âgé de trente-trois ans, est confiant qu'il va gagner, mais la communauté Go n'est pas si sûre.

Sur le plan positif, Lee Sedol est beaucoup plus fort que Fan Hui, le champion 2-dan professionnel et européen qui a perdu 0 – 5 à AlphaGo en octobre dernier. La différence est similaire à la différence, aux échecs, entre un Maître et un Grand Maître supérieur. Lee Sedol devrait gagner la plupart des matchs contre Fan Hui.

Sur le plan négatif, Fan Hui a perdu tous les matchs du match, ce qui indique clairement qu'AlphaGo est bien supérieur à un professionnel de 2 dan. Il est également probable que Google Deep Mind utilisera une version améliorée. Par exemple, AlphaGo a profité de cinq mois supplémentaires d'apprentissage depuis octobre, avec plus de jeux de maître, pour améliorer son évaluation des positions et sa sélection de coups. Il pourrait également utiliser un matériel plus puissant, et utiliser également une base de données d'ouverture, ce qu'il n'a pas fait dans la correspondance précédente. Cela lui permettrait de tirer profit des connaissances humaines dans les premiers mouvements et d'éviter ainsi les lignes d'ouverture inférieures.

Quelle stratégie devrait adopter Lee Sedol?

Certains pourraient prétendre que la pression exercée est «tout dans votre tête» mais, comme une nouvelle étude l'a révélé (Chib, Shimojo et O'Doherty, 2014), la pression laisse une véritable empreinte neurologique qui pousse les gens à «étouffer» niveau de capacité. Sedol subira une pression psychologique considérable pendant le match, compte tenu de l'attention mondiale qu'il suscitera. Il semble confiant et parle déjà d'une revanche, ce qui est une bonne attitude à moins que cela ne devienne trop confiant. Dans son match contre Deep Blue en 1997, le champion du monde d'échecs Gary Kasparov n'a pas bien géré la pression et a fait de sérieuses bévues (Hsu, 2002). Sedol peut utiliser plusieurs techniques pour se préparer psychologiquement. Il peut jouer contre des programmes informatiques, de sorte qu'il s'habitue à jouer des machines. Comme les programmes informatiques disponibles sont beaucoup plus faibles qu'AlphaGo, il devrait choisir les positions difficiles qu'il jouerait alors contre l'ordinateur; cela comprend les jeux où il commence avec un handicap matériel. Évidemment, il devrait s'entraîner avec le contrôle du temps convenu pour le match.

Si possible, il devrait regarder les parties jouées par Alpha-Go afin qu'il puisse identifier les faiblesses spécifiques. Idéalement, le contrat du match devrait stipuler que l'équipe Alpha-Go devrait fournir de tels jeux régulièrement pendant la préparation du match. Compte tenu de la publicité que le concours va créer, nous doutons que ce soit le cas. En général, la force d'AlphaGo est aussi sa faiblesse: il a besoin de millions de positions pour apprendre et utilise un grand nombre de jeux maîtres, car il y a beaucoup moins de jeux de joueurs de haut niveau en compétition les uns contre les autres. Ainsi, son jeu est modelé sur le jeu des maîtres plutôt que sur les joueurs de haut niveau. Les Maîtres sont évidemment plus faibles que les joueurs de haut niveau, et un joueur de classe mondiale comme Lee Sedol devrait pouvoir profiter de cette connaissance relativement inférieure. Cependant, AlphaGo apprend aussi par auto-jeu. Dans quelle mesure cela compense le type de jeux utilisés pour l'apprentissage est inconnu, et pourrait bien être le facteur décisif du match.

Bien qu'excellent dans la reconnaissance des formes, souvent considérée comme la marque distinctive de l'expertise humaine (Gobet, 2015), AlphaGo est plus faible lorsqu'il s'agit de recherche anticipée. C'est parce que la façon dont elle effectue la recherche est plutôt statistique en examinant les lignes critiques. À cet égard, c'est le contraire de Deep Blue, qui a été optimisé pour une recherche précise. Lee Sedol pourrait profiter de cela en choisissant des positions contenant des variations tactiques, où le jugement dépend de quelques mouvements critiques. La recherche statistique d'AlphaGo pourrait manquer ces subtilités et opter pour des lignes qui sont supportées par la grande majorité des mouvements mais réfutées par un seul mouvement.

Pour Lee Sedol, le dilemme sera de savoir s'il devrait jouer comme il le ferait contre les humains ou changer de style pour espérer profiter des faiblesses d'AlphaGo. Il y a un danger à faire ce dernier. La recherche sur les échecs a montré que les joueurs, lorsqu'ils jouent à l'extérieur du style dans lequel ils se spécialisent, jouent à un niveau plus faible (Bilalić, McLeod et Gobet, 2009). Cette conclusion est susceptible de s'appliquer également à Go. De plus, essayer d'anticiper la façon de penser d'AlphaGo engagera des ressources cognitives qui ne sont pas utilisées pour jouer bien.

En dépit des formidables capacités de calcul d'AlphaGo et de ses remarquables capacités de reconnaissance de formes, Lee Sedol a une compréhension plus profonde du jeu. Ainsi, compte tenu des incertitudes sur la vraie force d'AlphaGo, nous lui conseillons de commencer le match en jouant le genre de jeu dans lequel il excelle normalement. Ce n'est que si les choses tournent au vinaigre qu'il devrait essayer d'appliquer des méthodes visant à tirer parti des faiblesses (présumées) d'AlphaGo.

Fernand Gobet et Morgan Ereku

Les références

Bilalić, M., McLeod, P., & Gobet, F. (2009). Effet de spécialisation et son influence sur la mémoire et la résolution de problèmes chez les joueurs d'échecs experts. Science cognitive, 33 , 1117-1143.

Chib, V., Shimojo, S., et O'doherty, J. (2014). Les effets du cadrage incitatif sur les performances diminuent pour des résultats monétaires importants: mécanismes comportementaux et neuronaux. The Journal of Neuroscience, 34 , 14833-14844.

Gobet, F. (2015). Comprendre l'expertise: une approche multidisciplinaire . Londres: Palgrave.

Hsu, F.-H. (2002). Derrière Deep Blue: Construire l'ordinateur qui a battu le champion du monde d'échecs . Princeton, New Jersey: Princeton University Press.