Le Gemini de Google vient de terminer le jeu Pokémon Bleu sorti sur Game Boy en 1996

Par

Noor Bazmi

2 minutes de lecture - 3 mai 2025

Le Gemini de Google vient de terminer le jeu Pokémon Bleu sorti sur Game Boy en 1996

L'IA Gemini 2.5 Pro de Google a terminé Pokémon Bleu, surpassant Claude d'Anthropic, qui joue encore à Pokémon Rouge.
L'IA a navigué dans le jeu en utilisant des entrées visuelles et des outils d'agent, avec une intervention humaine minimale mais stratégique du développeur Joel Z.
Bien que cette performance soit remarquable, le développeur a mis en garde contre son utilisation comme critère de référence strict en raison des différences d'outils et de frameworks entre les modèles.

Le modèle d'IA phare de Google, Gemini 2.5 Pro, a terminé le classic de la Game Boy de 1996 « Pokémon Bleu ».

Hier soir, le PDG de Google, Sundar Pichai, a partagé une nouvelle concernant X, en écrivant : « Quelle fin ! Le Gemini 2.5 Pro vient de terminer Pokémon Bleu ! »

Quelle performance ! Gemini 2.5 Pro vient de terminer Pokémon Bleu ! Un grand merci à @TheCodeOfJoel pour avoir créé et animé le live, et à tous ceux qui ont encouragé Gem tout au long de son aventure. pic.twitter.com/E2pn3tpfEb

– Sundar Pichai (@sundarpichai) 3 mai 2025

TechCrunch a rapporté que Joel Z, un ingénieur logiciel de 30 ans qui affirme n'avoir « aucun lien avec Google », a diffusé sa course en direct sur Twitch.

Malgré tout, les dirigeants du géant de la recherche soutiennent activement le projet. Logan Kilpatrick, responsable produit de Google AI Studio, a indiqué le mois dernier que Gemini « progressait à grands pas vers la création de Pokémon » et avait « obtenu son 5e badge (le modèle précédent n'en a que 3 pour l'instant, mais avec un système d'agents différent) ». Sundar Pichai a répondu avec humour : « Nous travaillons sur une API, l'Intelligence Artificielle Pokémon :) »

Gemini surpasse le modèle d'IA anthropique Claude, qui travaille toujours sur Pokémon Rouge

Le choix du jeu n'est pasdent. En février, la société concurrente Anthropic a mis en avant les progrès constants réalisés par ses modèles Claude lors de parties de « Pokémon Rouge ». L'entreprise a déclaré que les capacités de réflexion et d'entraînement des agents de Claude lui avaient conféré un avantage considérable pour des tâches inattendues, comme un classic jeu de rôle

Joel Z a cité la chaîne Twitch Claude Plays Pokémon comme l'une de ses sources d'inspiration.

Pour l'instant, Claude n'a pas terminé « Pokémon Rouge ». Cela signifie que Gemini est un meilleur joueur.

Cependant, Joel Z a mis en garde les spectateurs contre une interprétation trop hâtive de cette comparaison. « Ne considérez pas cela comme un critère de référence pour évaluer les performances d'un joueur de niveau LLM à Pokémon », a-t-il écrit sur sa chaîne Twitch. « On ne peut pas vraiment faire de comparaisons directes : Gemini et Claude disposent d'outils différents et reçoivent des informations différentes. »

Gemini de Google, comme d'autres modèles d'IA, nécessite l'aide d'invites ou de ce que l'on appelle des harnais d'agents

L' agent transmet au LLM des captures d'écran mises à jour contenant des données supplémentaires affichées à l'écran. Gemini analyse ensuite la situation, peut faire appel à des sous-agents pour des tâches spécialisées, et indique enfin quelle touche presser dans l'émulateur Game Boy.

Joel Z a admis intervenir occasionnellement, mais a affirmé que son aide restait toujours dans des limites raisonnables. « Mes interventions améliorent les capacités de décision et de raisonnement globales de Gemini », a-t-il expliqué. De plus, le modèle ne nécessite pas d'indices spécifiques, de tutoriels ou d'instructions directes pour des défis particuliers comme le Mont Lune.

Il a ajouté : « La seule chose qui s'en rapproche, c'est d' Gemini qu'il doit parler deux fois à un sbire de la Team Rocket pour obtenir la clé de l'ascenseur, un bug qui a été corrigé plus tard dans Pokémon Jaune. »

« Gemini Plays Pokémon est toujours en développement actif », a déclaré Joel, précisant que le cadre du projet « continue d'évoluer »

Si vous lisez ceci, vous avez déjà une longueur d'avance. Restez-y grâce à notre newsletter.

Google

Partagez cet article

Noor Bazmi

Noor Bazmi collabore avec l'équipe Cryptopolitan et est titulaire d'un diplôme en études des médias. Elle couvre l'actualité de la blockchain, des cryptomonnaies, de l'intelligence artificielle, des géants de la tech, du marché des véhicules électriques, de l'économie mondiale et des changements de politiques gouvernementales. Elle poursuit actuellement des études en marketing afin de toucher un public international.

TABLE DES MATIÈRES

1. Gemini surpasse le modèle d'IA anthropique Claude, qui travaille toujours sur Pokémon Rouge

2. Gemini de Google, comme d'autres modèles d'IA, nécessite l'aide d'invites ou de ce que l'on appelle des harnais d'agents

Partagez cet article