Le modèle d'IA phare de Google, Gemini 2.5 Pro, a terminé le classic de la Game Boy de 1996 « Pokémon Bleu ».
Hier soir, le PDG de Google, Sundar Pichai, a partagé une nouvelle concernant X, en écrivant : « Quelle fin ! Le Gemini 2.5 Pro vient de terminer Pokémon Bleu ! »
Quelle performance ! Gemini 2.5 Pro vient de terminer Pokémon Bleu ! Un grand merci à @TheCodeOfJoel pour avoir créé et animé le live, et à tous ceux qui ont encouragé Gem tout au long de son aventure. pic.twitter.com/E2pn3tpfEb
– Sundar Pichai (@sundarpichai) 3 mai 2025
TechCrunch a rapporté que Joel Z, un ingénieur logiciel de 30 ans qui affirme n'avoir « aucun lien avec Google », a diffusé sa course en direct sur Twitch.
Malgré tout, les dirigeants du géant de la recherche soutiennent activement le projet. Logan Kilpatrick, responsable produit de Google AI Studio, a indiqué le mois dernier que Gemini « progressait à grands pas vers la création de Pokémon » et avait « obtenu son 5e badge (le modèle précédent n'en a que 3 pour l'instant, mais avec un système d'agents différent) ». Sundar Pichai a répondu avec humour : « Nous travaillons sur une API, l'Intelligence Artificielle Pokémon :) »
Gemini surpasse le modèle d'IA anthropique Claude, qui travaille toujours sur Pokémon Rouge
Le choix du jeu n'est pas dent . En février, la société concurrente Anthropic a mis en avant les progrès constants réalisés par ses modèles Claude lors de parties de « Pokémon Rouge ». L'entreprise a déclaré que les capacités de réflexion et d'entraînement des agents de Claude lui avaient conféré un avantage considérable pour des tâches inattendues, comme un jeu de rôle classic
Joel Z a cité la chaîne Twitch Claude Plays Pokémon comme l'une de ses sources d'inspiration.
Pour l'instant, Claude n'a pas terminé « Pokémon Rouge ». Cela signifie que Gemini est un meilleur joueur.
Cependant, Joel Z a mis en garde les spectateurs contre une interprétation trop hâtive de cette comparaison. « Ne considérez pas cela comme un critère de référence pour évaluer les performances d'un joueur de niveau LLM à Pokémon », a-t-il écrit sur sa chaîne Twitch. « On ne peut pas vraiment faire de comparaisons directes : Gemini et Claude disposent d'outils différents et reçoivent des informations différentes. »
Gemini de Google, comme d'autres modèles d'IA, nécessite l'aide d'invites ou de ce que l'on appelle des harnais d'agents
L' agent transmet au LLM des captures d'écran mises à jour contenant des données supplémentaires affichées à l'écran. Gemini analyse ensuite la situation, peut faire appel à des sous-agents pour des tâches spécialisées, et indique enfin quelle touche presser dans l'émulateur Game Boy.

Joel Z a admis intervenir occasionnellement, mais a affirmé que son aide restait toujours dans des limites raisonnables. « Mes interventions améliorent les capacités de décision et de raisonnement globales de Gemini », a-t-il expliqué. De plus, le modèle ne nécessite pas d'indices spécifiques, de tutoriels ou d'instructions directes pour des défis particuliers comme le Mont Lune.
Il a ajouté : « La seule chose qui s'en rapproche, c'est d' Gemini qu'il doit parler deux fois à un sbire de la Team Rocket pour obtenir la clé de l'ascenseur, un bug qui a été corrigé plus tard dans Pokémon Jaune. »
« Gemini Plays Pokémon est toujours en développement actif », a déclaré Joel, précisant que le cadre du projet « continue d'évoluer »

