Il modello di punta dell'intelligenza artificiale di Google, Gemini 2.5 Pro, ha completato il classic per Game Boy del 1996 "Pokémon Blue".
Ieri sera, l'amministratore delegato di Google Sundar Pichai ha condiviso la notizia su X, scrivendo: "Che traguardo! Gemini 2.5 Pro ha appena completato Pokémon Blu!"
Che traguardo! Gemini 2.5 Pro ha appena completato Pokémon Blu! Un ringraziamento speciale a @TheCodeOfJoel per aver creato e condotto la diretta streaming, e a tutti coloro che hanno sostenuto Gem lungo il percorso. pic.twitter.com/E2pn3tpfEb
– Sundar Pichai (@sundarpichai) 3 maggio 2025
TechCrunch ha riferito che Joel Z, un ingegnere informatico trentenne che afferma di "non essere affiliato a Google", ha trasmesso in streaming la gara su Twitch.
Nonostante ciò, i dirigenti del colosso della ricerca hanno fatto il tifo per il progetto. Logan Kilpatrick, responsabile di prodotto per Google AI Studio, ha scritto il mese scorso che Gemini stava "facendo grandi progressi nel completare Pokémon" e aveva "ottenuto il suo quinto badge (il modello migliore successivo ne ha solo 3 finora, sebbene con un diverso sistema di controllo degli agenti)". Pichai ha risposto con una battuta: "Stiamo lavorando su un'API, l'Intelligenza Artificiale Pokémon :)"
Gemini sconfigge il modello di intelligenza artificiale antropica Claude, che sta ancora lavorando su Pokémon Rosso
La scelta del gioco non è dent . A febbraio, l'azienda rivale Anthropic ha evidenziato i costanti progressi ottenuti dai suoi modelli Claude giocando a "Pokémon Rosso". L'azienda ha affermato che "la capacità di pensiero e l'addestramento degli agenti" di Claude le hanno dato una "spinta importante" in compiti inaspettati come un classic gioco di ruolo.
Joel Z ha citato il feed Twitch di Claude Plays Pokémon come una delle sue fonti di ispirazione.
Finora Claude non ha ancora finito "Pokémon Rosso". Questo significa che Gemini è un giocatore migliore.
Tuttavia, Joel Z ha messo in guardia gli spettatori dal dare troppa importanza al confronto. "Per favore, non consideratelo un parametro di riferimento per valutare quanto bene un LLM possa giocare a Pokémon", ha scritto sulla sua pagina Twitch. "Non si possono fare confronti diretti: Gemini e Claude hanno strumenti diversi e ricevono informazioni diverse"
Gemini di Google, come altri modelli di intelligenza artificiale, richiede l'aiuto di prompt o cosiddetti agenti di imbracatura
L' agente condivide schermate aggiornate con l'LLM, che contengono dati aggiuntivi sullo schermo. Gemini quindi riflette sulla situazione, può chiamare sub-agenti per compiti specializzati e infine indica quale pulsante premere nell'emulatore del Game Boy.

Joel Z ha ammesso di intervenire occasionalmente, ma ha sostenuto che l'aiuto rimane entro limiti ragionevoli. "I miei interventi migliorano le capacità decisionali e di ragionamento complessive di Gemini", ha spiegato. Inoltre, il modello non richiede suggerimenti specifici, procedure dettagliate o istruzioni dirette per sfide particolari come il Monte Luna.
Ha aggiunto: "L'unica cosa che si avvicina anche solo lontanamente è far a Gemini che deve parlare due volte con una Recluta Rocket per ottenere la Chiave Ascensore, un bug che è stato poi corretto in Pokémon Giallo".
"Gemini Plays Pokémon è ancora in fase di sviluppo attivo", ha affermato Joel, sottolineando che la struttura alla base del progetto "continua a evolversi"

