Facebook a développé une IA qui peut battre des humains au poker, mais il ne veut pas dévoiler son code

Shutterstock

Le poker ne sera plus jamais le même. Jeudi, Facebook et l'Université Carnegie Mellon ont annoncé qu'une équipe conjointe de chercheurs a réussi à développer un logiciel basé sur l'intelligence artificielle capable de battre certains des meilleurs professionnels de poker Texas Hold'em no-limit et à six joueurs. La complexité du poker, la multiplicité de ses participants et le peu d'informations dont disposent les joueurs en ont fait depuis longtemps un jalon important pour les chercheurs en IA. C'est un problème diaboliquement difficile à résoudre, et qui a d'autres enjeux dans le monde réel, concernant par exemple les voitures autonomes ou la négociation.

Mais désormais, à l'instar du jeu de go ou des échecs, les anciens idéaux du développement de l'intelligence artificielle, les chercheurs ont réussi à développer des robots capables d'une performance "surhumaine" - et comme pour les jeux précédents, la réussite va probablement transformer le jeu lui-même de manière radicale. Dans une interview accordée à Business Insider US, Noam Brown, chercheur en intelligence artificielle chez Facebook, a déclaré que l'entreprise ne publierait pas le code du bot, nommé Pluribus, parce qu'elle s'inquiétait de son impact potentiel sur la communauté du poker. Il a ajouté que Facebook était en train d'envisager son impact sur le jeu dans les années à venir.

L'IA Pluribus varie drastiquement la taille de ses paris, contrairement aux humains

"Cela va changer la façon dont le poker professionnel est joué", dit-il. "Je pense que nous verrons certaines des approches" utilisées par l'IA ensuite dans le monde réel. Un exemple, donné dans l'article des chercheurs publié dans la revue Science : la technique du "donk betting", traditionnellement raillée par les joueurs de poker, était régulièrement utilisée par Pluribus dans ses stratégies fructueuses. "Pluribus diverge de la croyance populaire selon laquelle le 'dong bet' (commencer un tour en pariant quand on a terminé le tour d'enchères précédent par un call) est une erreur", ont écrit les chercheurs. "Pluribus fait cela beaucoup plus souvent que les humains professionnels."

Il a également fait en sorte d'équilibrer ses bluffs, ce qui rendait cela plus difficile de prédire quand il bluffait ou non. Il variait drastiquement la taille des paris alors que les humains, souvent peu enclins au risque, sont moins susceptibles d'utiliser cette méthode - ce qui la rend également plus difficile à déchiffrer.

A lire aussi — Facebook dévoile officiellement la 'Libra', sa nouvelle cryptomonnaie qui permettra au monde entier de payer avec son smartphone

A l'inverse, voici un exemple d'une fois où la croyance populaire s'est avérée juste : "limper" est une mauvaise technique. "Limper" (payer la 'grosse blinde' plutôt que de se coucher ou de relancer) est une technique sous-optimale pour n'importe quel joueur à l'exception du "joueur petite blinde qui a déjà la moitié des grosses blindes dans le pot, et doit donc investir seulement la moitié des sommes que les autres joueurs ont à payer pour suivre".

Cette avancée pourrait bouleverser le poker en ligne

Pluribus a beaucoup joué contre des professionnels humains, en l'espace de 12 jours et 10.000 mains de poker. Mais il s'agit encore d'un petit nombre de jeux par rapport au nombre total de parties jouées chaque jour dans le monde entier. Au fur et à mesure que la technologie deviendra plus accessible, elle offrira de nouvelles perspectives fascinantes sur les stratégies non conventionnelles et fructueuses du jeu entre humains.

Cela pourrait également bouleverser les jeux de poker en ligne, ébranlant la confiance dans le format, alors que les joueurs se méfient de jouer contre des adversaires invisibles de peur de jouer contre une IA surhumaine. Les logiciels de niveau surhumain ont eu un impact massif sur d'autres jeux. Aux échecs, il a aidé à la naissance d'une nouvelle génération de prodiges comme Magnus Carlsen, qui a grandi en jouant contre des IA. Il pourrait aussi conduire à faire des jeux vidéo une partie essentielle des programmes d'entraînement.

Les grands maîtres du jeu de Go ont déjà commencé à tirer des leçons du formidable logiciel AlphaGo de Google. Les effets sur le poker seront sans aucun doute similaires - même si la décision de Facebook de garder le code privé contiendra la vague pendant un certain temps encore. "Nous avons choisi de ne pas publier le code en partie à cause de l'impact potentiel sur la communauté du poker, et à quel point cela pourrait avoir un impact sur le jeu", a déclaré Noam Brown.

L'utilisation de Pluribus était remarquablement peu coûteuse - environ 150 dollars en ressources de cloud computing pour former le modèle. Le chercheur a ajouté que vous pourriez probablement utiliser un logiciel similaire sur un iPhone avec seulement une légère baisse de performance.

Cet article, écrit par Rob Price, a d'abord été publié sur Prime.

Vous avez apprécié cet article ? Likez Business Insider France sur Facebook !

Lire aussi : VIDEO: Molly Bloom a inspiré le film 'Le Grand Jeu' — elle raconte comment elle organisait ses parties de poker à plusieurs millions de dollars

VIDEO: D'anciens terrains d'usine ont été transformés en ferme — voici à quoi ça ressemble