Il modello di AI di punta di Google, Gemini 2.5 Pro, ha completato il classic Game Boy del 1996 "Pokémon Blue".
Ieri sera, l'amministratore delegato di Google Sundar Pichai ha condiviso notizie su X, scrivendo: "Che finitura! Gemini 2.5 Pro ha appena completato Pokémon Blue!"
Che traguardo! Gemini 2.5 Pro ha appena completato Pokémon Blue! Un ringraziamento speciale a @thecodeofjoel per aver creato e gestito il live streaming e a tutti coloro che hanno esultato la gemma lungo la strada. pic.twitter.com/e2pn3tpfeb
- Sundar Pichai (@sundarpichai) 3 maggio 2025
TechCrunch ha riferito che Joel Z, un ingegnere di software di 30 anni che afferma di non essere "non affiliato con Google", ha trasmesso in streaming la corsa su Twitch.
Anche così, i dirigenti del gigante della ricerca hanno fatto il tifo per il progetto. Logan Kilpatrick, responsabile del prodotto per Google AI Studio, ha pubblicato il mese scorso che Gemini stava "facendo grandi progressi nel completare Pokémon" e aveva "guadagnato il suo 5 ° badge (il prossimo miglior modello ha solo 3 finora, anche se con un diverso imbracatura degli agenti)". Pichai rispose con uno scherzo: "Stiamo lavorando all'API, intelligenza artificiale Pokémon :)"
Gemelli batte l'antropico AI Model Claude, che sta ancora lavorando su Pokémon Red
La scelta del gioco non è un dent . A febbraio, la società rivale antropica ha messo in luce i guadagni costante realizzati dai suoi modelli Claude mentre giocava a "Pokémon Red". La società ha affermato che il "pensiero esteso e la formazione degli agenti" di Claude hanno dato una "spinta importante" su compiti inaspettati come un classic gioco di ruolo.
Joel Z ha citato il feed di Claude Plays Pokémon Twitch come una delle sue ispirazioni.
Finora, Claude non ha finito "Pokémon Red". Questo significa che Gemelli è un giocatore migliore.
Tuttavia, Joel Z ha avvertito gli spettatori di aver letto troppo nel confronto. "Per favore, non considerare questo un punto di riferimento per quanto bene un LLM può giocare a Pokémon", ha scritto sulla sua pagina Twitch. "Non puoi davvero fare confronti diretti: Gemini e Claude hanno strumenti diversi e ricevere informazioni diverse."
I Gemelli di Google, come altri modelli di intelligenza artificiale, richiedono aiuto da istruzioni o cosiddette imbracature degli agenti
Il cablaggio dell'agente condivide gli screenshot aggiornati con l'LLM che trasportano dati sullo schermo extra. Gemini quindi ragioni sulla situazione, possono chiamare sotto-agenti per compiti specializzati e infine istruisce quale pulsante premere nell'emulatore di Game Boy.

Joel Z ha ammesso di intervenire occasionalmente, ma ha sostenuto che l'aiuto rimane nei limiti equi. "I miei interventi migliorano le capacità decisionali e di ragionamento complessive di Gemelli", ha spiegato. Inoltre, il modello non richiede suggerimenti specifici, procedimenti dettagliati o istruzioni dirette per particolari sfide come il Monte Moon.
Ha aggiunto: "L'unica cosa che si avvicina anche è far a Gemelli che deve parlare due volte con un grugnito missilistico per ottenere il tasto di sollevamento, che era un bug che è stato successivamente fissato in Giallo Pokémon."
"Gemelli Plays Pokémon è ancora attivamente sviluppato", ha affermato Joel, osservando che il framework dietro il progetto "continua a evolversi".
Cryptolitan Academy: stanco delle oscillazioni del mercato? Scopri come DeFi può aiutarti a costruire un reddito passivo costante. Registrati ora