谷歌的Gemini刚刚通关了1996年Game Boy游戏《精灵宝可梦 蓝版》的全部内容。

- 谷歌的 Gemini 2.5 Pro AI 已经完成了《精灵宝可梦 蓝》的测试,其表现优于仍在测试《精灵宝可梦 红》的 Anthropic 的 Claude。.
- AI 使用视觉输入和代理工具来操控游戏,开发者 Joel Z. 的人工干预虽然很少,但却具有战略意义。.
- 虽然这一成就值得关注,但开发者提醒不要将其作为严格的基准,因为不同模型使用的工具和框架各不相同。.
谷歌的旗舰人工智能模型 Gemini 2.5 Pro 已经完成了 1996 年 Game Boy classic “精灵宝可梦 蓝”。.
昨晚,谷歌首席执行官桑达尔·皮查伊在X上分享了一个消息,他写道:“多么完美的收尾!Gemini 2.5 Pro刚刚完成了《精灵宝可梦:蓝》的开发!”
精彩收官!Gemini 2.5 Pro 刚刚通关了《精灵宝可梦:蓝》!特别感谢 @TheCodeOfJoel 创建并主持了直播,也感谢所有一路为 Gemini 加油的朋友们。pic.twitter.com/ E2pn3tpfEb
— Sundar Pichai (@sundarpichai) 2025 年 5 月 3 日
TechCrunch 报道 称,30 岁的软件工程师 Joel Z 自称“与谷歌无关”,他 直播了 在 Twitch 上
即便如此,这家搜索巨头的管理层一直对这个项目充满信心。谷歌人工智能工作室的产品负责人洛根·基尔帕特里克 发帖称 ,Gemini“在完成宝可梦模型方面取得了巨大进展”,并且“已经获得了第五枚徽章(目前排名第二的模型只有三枚,尽管它使用的是不同的智能体框架)。”皮查伊 回复道 开玩笑地
Gemini击败了仍在开发《精灵宝可梦 红》的Anthropic AI模型Claude。
选择这款游戏并非偶然dent今年二月,竞争对手 Anthropic 等意想不到的任务中表现出色 classic 角色扮演游戏
Joel Z 将 Claude Plays Pokémon 的 Twitch 直播频道列为他的灵感来源之一。.
到目前为止,克劳德还没有通关《精灵宝可梦 红》。这意味着杰米尼的游戏水平比他高。.
然而,Joel Z提醒观众不要过度解读这次对比。“请不要把这当作衡量LLM玩家宝可梦水平的标杆,”他在Twitch页面上写道。“你不能直接比较——Gemini和Claude使用的工具不同,接收到的信息也不同。”
谷歌的Gemini和其他人工智能模型一样,需要提示或所谓的代理工具的帮助。
代理 程序 会将更新后的屏幕截图与LLM共享,这些屏幕截图包含额外的屏幕数据。然后,Gemini会分析情况,可能会调用子代理执行特定任务,并最终指示在Game Boy模拟器中按下哪个按钮。

Joel Z承认他偶尔会介入,但他辩称这种帮助始终在合理的范围内。“我的介入提升了Gemini的整体决策和推理能力,”他解释道。此外,该模型并不需要针对特定挑战(例如月见山)提供具体的提示、步骤或直接指导。.
他还补充道:“唯一能与之相提并论的,就是让 双子座 知道它需要与火箭队喽啰对话两次才能获得升降机钥匙,这是一个漏洞,后来在《精灵宝可梦 黄》中得到了修复。”
Joel表示:“Gemini Plays Pokémon仍在积极开发中”,并指出该项目背后的框架“仍在不断发展”。
最顶尖的加密货币专家都在阅读我们的简报。想 加入他们?

努尔·巴兹米
Noor Bazmi拥有媒体研究学位,是 Cryptopolitan 新闻团队的撰稿人。她报道区块链、加密货币、人工智能、大型科技公司、电动汽车市场、全球经济和政府政策变化等方面的新闻。她目前正在学习市场营销,以便更好地与全球受众建立联系。.
学速成课程
- 哪些加密货币可以让你赚钱
- 如何通过钱包提升安全性(以及哪些钱包真正值得使用)
- 专业人士使用的鲜为人知的投资策略
- 如何开始投资加密货币(使用哪些交易所、购买哪种加密货币最划算等)















