Les LLM offrent des possibilités qu’on ne soupçonne parfois pas du tout : c’était le cas de la traduction il y a quelques années. Et s’ils étaient aussi capables de jouer à des jeux vidéo ? La startup Anthropic tente de relever le défi en faisant jouer son IA Claude à Pokémon Bleu/Rouge sur Game Boy.
Comment faire jouer une IA à Pokémon
C’est dans un fil sur X que l’entreprise décrit comment elle essaie de gagner à Pokémon Bleu/Rouge avec son chatbot. Un défi qui a démarré en juin 2024 avec Claude 3.5 Sonnet, la dernière version à l’époque. Comme l’explique Anthropic, Claude n’ayant pas été formé pour jouer à des jeux vidéo, il tentait en vain d’échapper aux combats obligatoires du jeu.
D’un autre côté, il a pris des initiatives, comme celle… de réinitialiser la partie. En fait, Claude s’était coincé dans le jeu et était convaincu qu’il y avait un bug avec sa sauvegarde. Ce qui a aidé Anthropic, c’est une nouvelle version de Claude : elle a réussi à battre le rival pour la première fois et même à sortir du Bourg Palette, la première « ville » du jeu, d’où vient le personnage principal.

Les derniers progrès en date remontent à la semaine dernière : Anthropic a lancé claude 3.7 Sonnet. Un nouveau modèle de langage censé dépasser GPT ou DeepSeek. La startup a qualifié ses progrès dans Pokémon d’« impressionnants ». Le chatbot n’a pris que quelques heures pour battre Pierre (un champion de Kanto) et quelques jours pour arriver à vaincre Ondine, une autre championne emblématique.
Claude devient un champion de Pokémon
Pour cela, Anthropic a fait appel au nouveau mode de Claude 3.7 Sonnet : le mode « réflexion ». Pas besoin d’aller vite, Claude a le temps de jouer (24 heures par jour) : autant réfléchir sur les actions à réaliser. Comme l’explique Anthropic dans son fil : « là où les modèles précédents erraient sans but ou restaient coincés dans des boucles, Claude 3.7 Sonnet planifie à l’avance, se souvient de ses objectifs et s’adapte lorsque les stratégies initiales échouent. »

Ce qui est possible grâce à une base de connaissances confiée à Claude : il a de quoi stocker des notes (pour se souvenir de stratégies par exemple), une vision du jeu (ce dont il ne disposait pas avant), ainsi que des fonctions accessibles pour simuler des pressions des boutons. Pour le même nombre d’actions, Claude 3.7 Sonnet va plus loin dans le jeu que sa version 3.5 Sonnet.

Anthropic explique que son dernier LLM « est très efficace lorsqu’il s’agit d’essayer de multiples stratégies et de remettre en question les hypothèses précédentes, ce qui lui permet d’améliorer ses propres capacités. »
Claude prend même le temps de « se faire plaisir » en renommant certains Pokémon qu’il capture. Le Carapuce qu’il a choisi au début de son aventure se nomme donc… TSUNMAI!. Si en l’état ça ne sert à rien de terminer Pokémon Bleu/Rouge avec un chatbot, Anthropic le promet : il utilisera ces compétences « pour résoudre des problèmes du monde réel. » Cette expérience représente une étape de plus dans la création d’agents autonomes pour Anthropic. Pour le moment, tout le monde peut suivre Claude en direct sur Twitch, sur la chaîne dédiée, ClaudePlaysPokemon.
+ rapide, + pratique, + exclusif
Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.
Découvrez les nombreux avantages de Numerama+.
Vous avez lu 0 articles sur Numerama ce mois-ci
Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.
Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :
- 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
- 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
- 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.
Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.

Toute l'actu tech en un clin d'oeil
Ajoutez Numerama à votre écran d'accueil et restez connecté au futur !

Marre des réseaux sociaux ? Rejoignez la communauté Numerama sur WhatsApp !