Gemini di Google ha appena battuto l'intero gioco per Game Boy del 1996 Pokémon Blue

Noor Bazmi

Tempo di lettura: 2 minuti. 3 maggio 2025.

Gemini di Google ha appena battuto l'intero gioco per Game Boy del 1996 Pokémon Blue

L'IA Gemini 2.5 Pro di Google ha completato Pokémon Blu, superando Claude di Anthropic, che sta ancora giocando a Pokémon Rosso.
L'intelligenza artificiale ha gestito il gioco utilizzando input visivi e strumenti di agenti, con un intervento umano minimo ma strategico da parte dello sviluppatore Joel Z.
Sebbene il risultato sia notevole, lo sviluppatore ha messo in guardia dal utilizzarlo come parametro di riferimento rigoroso a causa delle differenze tra gli strumenti e i framework dei vari modelli.

Il modello di punta dell'intelligenza artificiale di Google, Gemini 2.5 Pro, ha completato il classic per Game Boy del 1996 "Pokémon Blue".

Ieri sera, l'amministratore delegato di Google Sundar Pichai ha condiviso la notizia su X, scrivendo: "Che traguardo! Gemini 2.5 Pro ha appena completato Pokémon Blu!"

Che finale! Gemini 2.5 Pro ha appena completato Pokémon Blu! Un ringraziamento speciale a @TheCodeOfJoel per aver creato e gestito la diretta streaming, e a tutti coloro che hanno fatto il tifo per Gem lungo il percorso. pic.twitter.com/E2pn3tpfEb

– Sundar Pichai (@sundarpichai) 3 maggio 2025

TechCrunch ha riportato che Joel Z, un ingegnere informatico di 30 anni che afferma di non essere "affiliato a Google", ha trasmesso in streaming la corsa su Twitch.

Ciononostante, i dirigenti del gigante della ricerca hanno sostenuto il progetto. Logan Kilpatrick, responsabile prodotto di Google AI Studio, ha pubblicato il mese scorso che Gemini stava "facendo grandi progressi nel completamento di Pokémon" e si era "guadagnato il suo quinto badge (il modello successivo ne ha solo 3 finora, sebbene con un diverso sistema di agenti)". Pichai ha risposto con una battuta: "Stiamo lavorando su API, Intelligenza Artificiale Pokémon :)".

Gemini sconfigge il modello di intelligenza artificiale antropica Claude, che sta ancora lavorando su Pokémon Rosso

La scelta del gioco non èdent. A febbraio, l'azienda rivale Anthropic ha evidenziato i costanti progressi compiuti dai suoi modelli Claude durante la partita a "Pokémon Rosso". L'azienda ha affermato che il "pensiero avanzato e l'addestramento dell'agente" di Claude gli hanno fornito un "notevole vantaggio" in compiti inaspettati come un classic gioco di ruolo.

Joel Z ha citato il feed Twitch di Claude Plays Pokémon come una delle sue fonti di ispirazione.

Finora Claude non ha ancora finito "Pokémon Rosso". Questo significa che Gemini è un giocatore migliore.

Tuttavia, Joel Z ha messo in guardia gli spettatori dal dare troppa importanza al confronto. "Per favore, non consideratelo un parametro di riferimento per valutare quanto bene un LLM possa giocare a Pokémon", ha scritto sulla sua pagina Twitch. "Non si possono fare confronti diretti: Gemini e Claude hanno strumenti diversi e ricevono informazioni diverse"

Gemini di Google, come altri modelli di intelligenza artificiale, richiede l'aiuto di prompt o cosiddetti agenti di imbracatura

L' agente condivide schermate aggiornate con l'LLM, che contengono dati aggiuntivi sullo schermo. Gemini quindi riflette sulla situazione, può chiamare sub-agenti per compiti specializzati e infine indica quale pulsante premere nell'emulatore del Game Boy.

Joel Z ha ammesso di intervenire occasionalmente, ma ha sostenuto che l'aiuto rimane entro limiti ragionevoli. "I miei interventi migliorano le capacità decisionali e di ragionamento complessive di Gemini", ha spiegato. Inoltre, il modello non richiede suggerimenti specifici, procedure dettagliate o istruzioni dirette per sfide particolari come il Monte Luna.

Ha aggiunto: "L'unica cosa che si avvicina è stata far a Gemini che doveva parlare due volte con un membro del Team Rocket per ottenere la Chiave dell'Ascensore, un bug che è stato poi corretto in Pokémon Giallo."

"Gemini Plays Pokémon è ancora in fase di sviluppo attivo", ha affermato Joel, sottolineando che la struttura alla base del progetto "continua a evolversi"

Non limitarti a leggere le notizie sulle criptovalute. Cerca di capirle. Iscriviti alla nostra newsletter. È gratis.

Google

Condividi questo articolo

Noor Bazmi

Noor Bazmi, laureata in Scienze della Comunicazione, collabora con il team Cryptopolitan . Si occupa di notizie su blockchain, criptovalute, intelligenza artificiale, grandi aziende tecnologiche, mercati dei veicoli elettrici, economia globale e cambiamenti nelle politiche governative. Sta inoltre studiando marketing per poter raggiungere un pubblico internazionale.

INDICE

1. Gemini sconfigge il modello di intelligenza artificiale antropica Claude, che sta ancora lavorando su Pokémon Rosso

2. Gemini di Google, come altri modelli di intelligenza artificiale, richiede l'aiuto di prompt o cosiddetti agenti di imbracatura

Condividi questo articolo