- DeepMind推出了SIMA 2推理AI代理,该代理与谷歌的Gemini模型集成。
- 人工智能代理可以在虚拟世界中遵循人类语言指令,考虑自身目标,与用户进行对话,并随着时间的推移不断改进自身。.
- 人工智能代理将允许用户通过文本、语音甚至图像与其进行交互。.
谷歌旗下DeepMind公司周四发布了SIMA 2——一款推理型人工智能代理,该公司声称其在虚拟世界中的行为如同人类。这家科技公司表示,SIMA 2帮助DeepMind超越了简单的屏幕操作,迈向能够自我规划、自我解释,并通过经验学习的人工智能时代。.
该公司表示,此次发布标志着向通用人工智能(AGI)迈出了重要一步。DeepMind 还警告称,SIMA 2 对机器人技术和人工智能具身化技术的未来具有重要的普遍意义。.
SIMA 2 能够自主思考并在交互式环境中采取行动
SIMA 2 是我们功能最强大的虚拟 3D 世界 AI 代理。👾🌐
这款由 Gemini 提供技术支持的智能机器人,不仅能够执行基本指令,还能在交互式环境中思考、理解并采取行动——这意味着你可以通过文字、语音甚至图片与它交流。以下是它的使用方法🧵 pic.twitter.com/DuVWGJXW7W
— Google DeepMind (@GoogleDeepMind) 2025年11月13日
这家科技公司 发布了 首个版本的SIMA(可扩展指导多世界智能体)。谷歌表示,这款人工智能智能体通过观看屏幕并使用虚拟键盘和鼠标控制,学习了数百种基本技能。该公司还承认,最新版本的人工智能智能体更进一步,使其能够独立思考。
谷歌DeepMind还透露,Gemini为这款人工智能代理提供了技术支持。该公司表示,SIMA 2与Gemini的整合能够帮助人工智能代理理解用户的高层次目标,进行复杂的推理,并在游戏中熟练地执行目标导向的操作。.
该公司 表示, SIMA 2 是其目前功能最强大的虚拟 3D 世界人工智能代理。DeepMind 发现,与该代理交互的感觉与其说是向其下达指令,不如说是与一位善于推理的伙伴合作完成手头的任务。
根据公告,SIMA 2 不仅能够执行基本指令,还能在交互式环境中思考、理解并采取行动。这款人工智能代理允许用户通过文本、语音甚至图像与其进行交互。.
谷歌表示,其Gemini人工智能模型 能够帮助 SIMA 2理解高层目标,并阐述其计划采取的步骤。该公司还补充说,Gemini能够帮助这款以人为本的新型智能体在游戏中进行协作,其推理能力是原系统无法达到的。
这家科技公司还报告称,SIMA 2 在虚拟环境中展现出tron的泛化能力。DeepMind 证实,SIMA 2 能够完成更长、更复杂的任务,包括逻辑提示、屏幕绘制草图和表情符号。谷歌表示,这项能力使 SIMA 2 在各种任务上的表现更接近人类玩家。该公司还指出,该人工智能代理的任务完成率达到了 65%,而 SIMA 1 的完成率仅为 31%。.
DeepMind发现,SIMA 2能够理解指令并在Genie 3生成的全新3D世界中采取行动。Genie 3项目于去年发布,它能够根据单个图像或文本提示创建交互式环境。这家科技公司表示,SIMA 2能够在测试前从未接触过的世界中辨别方向、理解目标并采取有意义的行动。.
谷歌声称,这款以人为中心的智能体现在能够更好地执行详细指令,即使是在它从未接触过的世界中。该公司表示,SIMA 2 可以将从一个游戏学习到的概念迁移到另一个游戏,从而将相似任务联系起来。.
DeepMind 发现 SIMA 2 中存在需要解决的缺陷。
研究人员 注意到 ,该智能体在学习了人类的示范后,转而进行自主游戏。它利用试错法以及Gemini生成的反馈,创建新的经验数据。这些新经验数据包含一个训练循环,其中SIMA 2尝试完成它自己生成的任务,并将自身的轨迹数据反馈到模型的下一个版本中。
尽管DeepMind称赞SIMA 2是人工智能领域的一项进步,但该研究也发现了一些需要解决的不足之处。谷歌dent的不足之处包括:内存窗口有限、难以处理冗长且多步骤的任务,以及在3D人工智能系统中常见的视觉解读难题。.
DeepMind 透露 ,SIMA 2是一个测试平台,用于开发未来可应用于机器人和导航领域的技能。该公司表示,SIMA 2的研究为机器人技术乃至通用人工智能(AGI)在现实世界中的应用提供了tron的途径。
如果你想以更平和的方式进入 DeFi 加密货币领域 ,避免常见的炒作,那就从这个免费视频开始吧。
学速成课程
- 哪些加密货币可以让你赚钱
- 如何通过钱包提升安全性(以及哪些钱包真正值得使用)
- 专业人士使用的鲜为人知的投资策略
- 如何开始投资加密货币(使用哪些交易所、购买哪种加密货币最划算等)















