Googles Flaggschiff-KI-Modell, Gemini 2.5 Pro, hat den Game-Boy classic „Pokémon Blau“ von 1996 fertiggestellt.
Gestern Abend verkündete Google-Chef Sundar Pichai Neuigkeiten zu X mit den Worten: „Was für ein Abschluss! Gemini 2.5 Pro hat gerade Pokémon Blau durchgespielt!“
Was für ein Finish! Gemini 2.5 Pro hat Pokémon Blau gerade durchgespielt! Besonderen Dank an @TheCodeOfJoel für die Erstellung und Durchführung des Livestreams und an alle, die Gem dabei angefeuert haben. pic.twitter.com/E2pn3tpfEb
– Sundar Pichai (@sundarpichai) 3. Mai 2025
TechCrunch berichtete , dass Joel Z, ein 30-jähriger Softwareentwickler, der angibt, „in keiner Verbindung zu Google zu stehen“, den Lauf auf Twitch gestreamt hat
Trotzdem haben die Führungskräfte des Suchmaschinenriesen das Projekt unterstützt. Logan Kilpatrick, Produktleiter von Google AI Studio, postete letzten Monat, dass Gemini „große Fortschritte bei der Fertigstellung von Pokémon“ mache und „seine fünfte Auszeichnung erhalten“ habe (das nächstbeste Modell habe bisher nur drei, allerdings mit einem anderen Agenten-System). Pichai antwortete scherzhaft: „Wir arbeiten an einer API, Künstliche Pokémon-Intelligenz :)“
Gemini schlägt das anthropische KI-Modell Claude, das immer noch an Pokémon Rot arbeitet
Die Wahl des Spiels ist kein Zufall dent Im Februar hob das Konkurrenzunternehmen Anthropic die stetigen Fortschritte seiner Claude-Modelle beim Spielen von „Pokémon Rot“ hervor. Das Unternehmen erklärte, Claudes „erweitertes Denkvermögen und Agententraining“ hätten ihm bei unerwarteten Aufgaben wie einem classic Rollenspiel einen „großen Schub“ gegeben.
Joel Z nannte den Twitch-Stream „Claude Plays Pokémon“ als eine seiner Inspirationsquellen.
Bislang hat Claude „Pokémon Rot“ noch nicht durchgespielt. Das bedeutet, dass Gemini der bessere Spieler ist.
Joel Z warnte die Zuschauer jedoch davor, zu viel in den Vergleich hineinzuinterpretieren. „Bitte betrachtet dies nicht als Maßstab dafür, wie gut ein LLM Pokémon spielen kann“, schrieb er auf seiner Twitch-Seite. „Man kann keine direkten Vergleiche anstellen – Gemini und Claude haben unterschiedliche Werkzeuge und erhalten unterschiedliche Informationen.“
Googles Gemini benötigt, wie andere KI-Modelle auch, Hilfe durch Eingabeaufforderungen oder sogenannte Agenten-Harnesses
Das Agenten-System übermittelt aktualisierte Screenshots mit dem LLM, die zusätzliche Bildschirmdaten enthalten. Gemini analysiert daraufhin die Situation, kann Unteragenten für Spezialaufgaben anfordern und gibt schließlich die Anweisung, welche Taste im Game-Boy-Emulator gedrückt werden soll.

Joel Z gab zu, gelegentlich einzugreifen, betonte aber, dass seine Hilfe stets im Rahmen bleibe. „Meine Interventionen verbessern die allgemeinen Entscheidungs- und Denkfähigkeiten von Gemini“, erklärte er. Darüber hinaus benötige das Modell keine konkreten Hinweise, Komplettlösungen oder direkte Anweisungen für bestimmte Herausforderungen wie beispielsweise den Mondberg.
Er fügte hinzu: „Das Einzige, was dem auch nur annähernd nahekommt, ist, Gemini mitzuteilen, dass es zweimal mit einem Rocket-Rüpel sprechen muss, um den Aufzugsschlüssel zu erhalten. Dies war ein Fehler, der später in Pokémon Gelb behoben wurde.“
„Gemini Plays Pokémon wird noch aktiv weiterentwickelt“, sagte Joel und merkte an, dass sich das dem Projekt zugrunde liegende Konzept „ständig weiterentwickelt“

