最新消息
为您精选
每周
保持领先

最优质的加密货币资讯直接发送到您的邮箱。.

谷歌的Gemini刚刚通关了1996年Game Boy游戏《精灵宝可梦 蓝版》的全部内容。

经过努尔·巴兹米努尔·巴兹米
阅读时长:2分钟
谷歌的Gemini刚刚通关了1996年Game Boy游戏《精灵宝可梦 蓝版》的全部内容。
  • 谷歌的 Gemini 2.5 Pro AI 已经完成了《精灵宝可梦 蓝》的测试,其表现优于仍在测试《精灵宝可梦 红》的 Anthropic 的 Claude。.
  • AI 使用视觉输入和代理工具来操控游戏,开发者 Joel Z. 的人工干预虽然很少,但却具有战略意义。.
  • 虽然这一成就值得关注,但开发者提醒不要将其作为严格的基准,因为不同模型使用的工具和框架各不相同。.

谷歌的旗舰人工智能模型 Gemini 2.5 Pro 已经完成了 1996 年 Game Boy classic “精灵宝可梦 蓝”。.

昨晚,谷歌首席执行官桑达尔·皮查伊在X上分享了一个消息,他写道:“多么完美的收尾!Gemini 2.5 Pro刚刚完成了《精灵宝可梦:蓝》的开发!”

TechCrunch 报道 称,30 岁的软件工程师 Joel Z 自称“与谷歌无关”,他 直播了 在 Twitch 上

即便如此,这家搜索巨头的管理层一直对这个项目充满信心。谷歌人工智能工作室的产品负责人洛根·基尔帕特里克 发帖称 ,Gemini“在完成宝可梦模型方面取得了巨大进展”,并且“已经获得了第五枚徽章(目前排名第二的模型只有三枚,尽管它使用的是不同的智能体框架)。”皮查伊 回复道 开玩笑地

Gemini击败了仍在开发《精灵宝可梦 红》的Anthropic AI模型Claude。

选择这款游戏并非偶然dent今年二月,竞争对手 Anthropic 等意想不到的任务中表现出色 classic 角色扮演游戏

Joel Z 将 Claude Plays Pokémon 的 Twitch 直播频道列为他的灵感来源之一。.

到目前为止,克劳德还没有通关《精灵宝可梦 红》。这意味着杰米尼的游戏水平比他高。.

然而,Joel Z提醒观众不要过度解读这次对比。“请不要把这当作衡量LLM玩家宝可梦水平的标杆,”他在Twitch页面上写道。“你不能直接比较——Gemini和Claude使用的工具不同,接收到的信息也不同。”

谷歌的Gemini和其他人工智能模型一样,需要提示或所谓的代理工具的帮助。

代理 程序 会将更新后的屏幕截图与LLM共享,这些屏幕截图包含额外的屏幕数据。然后,Gemini会分析情况,可能会调用子代理执行特定任务,并最终指示在Game Boy模拟器中按下哪个按钮。

谷歌的Gemini刚刚通关了1996年Game Boy游戏《精灵宝可梦 蓝》的全部内容。
Joel Z 在 Twitch 上直播了“Gemini 玩宝可梦”。

Joel Z承认他偶尔会介入,但他辩称这种帮助始终在合理的范围内。“我的介入提升了Gemini的整体决策和推理能力,”他解释道。此外,该模型并不需要针对特定​​挑战(例如月见山)提供具体的提示、步骤或直接指导。.

他还补充道:“唯一能与之相提并论的,就是让 双子座 知道它需要与火箭队喽啰对话两次才能获得升降机钥匙,这是一个漏洞,后来在《精灵宝可梦 黄》中得到了修复。”

Joel表示:“Gemini Plays Pokémon仍在积极开发中”,并指出该项目背后的框架“仍在不断发展”。

最顶尖的加密货币专家都在阅读我们的简报。想 加入他们

分享这篇文章
努尔·巴兹米

努尔·巴兹米

Noor Bazmi拥有媒体研究学位,是 Cryptopolitan 新闻团队的撰稿人。她报道区块链、加密货币、人工智能、大型科技公司、电动汽车市场、全球经济和政府政策变化等方面的新闻。她目前正在学习市场营销,以便更好地与全球受众建立联系。.

更多…新闻
深度 密码
学速成课程