微软的触觉感应系统突破了机器人技术的局限性

- 微软于 2026 年 1 月下旬推出了 Rho-alpha,这是一款利用视觉、语言和触摸传感器执行双臂任务的机器人模型。.
- 该系统根据摄像头无法检测到的物理反馈来调整握持力,这对于插入插头和安装零件非常有用。.
- 制造商可通过 Microsoft Foundry 定制该软件,以用于重复性搬运任务。.
微软研究院可以于2026年1月下旬推出了一款全新的机器人控制系统,该系统 让 机器工作,同时还能处理语音指令和物理反馈。这套名为Rho-alpha的系统标志着微软正式进军双臂机器人基础模型领域 。
这项技术将首先 面向 通过早期体验计划 才会将 其 发布 在其 Foundry 平台上。届时,企业可以利用自身数据,根据特定需求对系统进行定制。
为机器人智能增添触觉
工厂和仓库需要 应对 重复相同的预设动作 永远 医院也 需要 机器适应。生产线上,不同批次的产品各不相同,这给传统的自动化带来了 难以 有效解决的问题。 微软 开发了 Rho-alpha 来满足这一需求,它通过传感器处理机器人所看到的、听到的以及感受到的物理信息。
大多数机器人系统 如今 都依赖摄像头和麦克风来感知周围环境并接收 指令。Rho -alpha 在此基础上更进一步,将触觉视为同等重要的信息来源。当机器人夹爪内置压力传感器时,系统 就能获取 摄像头完全无法获取的信息。这在将物品插入插座或组装零件时至关重要,因为仅凭视觉 无法 提供足够的细节来判断部件是否正确对齐。
微软 展示了 这些功能, 使用了两台配备压力和接触传感器的Universal Robots UR5e机械臂。在名为BusyBox的任务测试中,人们 指示 机器人 执行诸如将 托盘放入工具箱并 关上 盖子之类的任务。系统 转化 为双臂之间的协调运动,并根据传感器的感知进行调整。当第一次尝试插入插头 失败 时,操作员可以使用3D输入设备引导机器人,系统会从这些纠正中学习。
获取足够的 训练数据仍然是构建高性能机器人的最大挑战。语言模型可以从海量的在线文本中学习,但机器人训练需要实际的物理演示,而录制这些演示需要耗费大量的时间和金钱。微软通过三种类型的信息训练 Rho-alpha 解决了这个问题:真实物理演示的录像、模拟练习任务以及来自网络的包含问答的大型图像数据集。该公司使用运行在 Azure 服务器上的 Nvidia Isaac Sim,通过强化学习过程创建逼真的合成场景。
这种模拟设置能够生成物理上精确的练习场景,是对实际演示的补充。这种组合方法 使 模型能够应对异常情况和故障场景,而这些情况如果通过实际运行,则需要数千小时才能捕捉到。
这种训练方法遵循模式其他公司机器人Robotics 正在使用的 系统、Figure AI的人形机器人Helix模型以及Physical Intelligence的Pi-zero都采用了类似的方法来 解决 数据不足的问题。该技术 帮助 这些系统学习通用的操作技能,而无需 针对 它们可能遇到的每个任务进行专门的演示 。
在日趋成熟的市场中竞争
微软加入了 机器人基础模型市场,该市场 增长迅猛 在过去一年半中 N1.6 ,专注于全身控制和情境理解。谷歌DeepMind将Gemini扩展到机器人领域,使其具备从折纸到玩扑克牌等多种能力。Physical Intelligence推出了Pi-zero,这是一个经过训练,可跨不同类型机器人使用的通用系统。
Rho-alpha 的 突出之处在于三点。首先,它强调触觉感知, 这解决了 的系统 仅 难以应对的情况。其次,该模型源自微软的 Phi 系列,微软已对其进行优化,使其能够在普通消费级硬件上高效运行。这意味着它可以在本地设备上运行,而无需持续连接云服务器。第三,它专注于从实际操作中的用户纠正中学习,这使其区别于那些需要完全重新训练才能掌握新行为的模型。
微软的商业模式也与竞争对手有所。该公司计划通过其 Foundry 平台提供 Rho-alpha 作为基础设施,制造商和系统集成商可以利用其专有信息进行定制。这与该公司在 Azure OpenAI 服务 ,旨在满足那些希望创建定制版本而非使用通用模型的组织的需求。
对于制造商和物流公司而言,最直接的 机会 在于 发现 当前自动化系统 无法胜任 。例如,质量检验站、成套组件组装作业以及小批量装配线等,Rho-alpha 的语言理解和触觉感应相结合的功能可以 有效减少 编程需求。
微软宣布的早期访问计划 让 企业能够 ,测试该系统是否 符合 自身需求。企业在参与评估时应做好人工监督的准备,并规划好工作流程,以便操作员在初始学习阶段纠正和引导机器人。
物理 人工智能 标志着机器人从程序化工具向灵活协作伙伴的转变 。这一转变需要数年而非数月时间,但微软、英伟达和谷歌的基础模型奠定了未来十年企业机器人技术的基本 defi。
如果你正在阅读这篇文章,你已经领先一步了。 订阅我们的新闻简报,继续保持领先优势。

哈尼亚·胡马云
Hania加入 Cryptopolitan 之前,已积累了丰富的金融、经济趋势和市场预测分析经验。她曾报道过新兴技术、人工智能和金融科技等领域的新闻。作为一名注册建筑师,Hania的经历也为她的新闻写作增添了活力和精准度。她毕业于拉合尔国立艺术学院,获得建筑学学位。
学速成课程
- 哪些加密货币可以让你赚钱
- 如何通过钱包提升安全性(以及哪些钱包真正值得使用)
- 专业人士使用的鲜为人知的投资策略
- 如何开始投资加密货币(使用哪些交易所、购买哪种加密货币最划算等)















