近日,OpenAI推出了更高级的o1reasoning模型版本,名为o1 pro模式。这款聊天机器人于周四发布,定价为每月200美元。然而,社区对如何解读它仍存在疑问。.
该公司新推出的 ChatGPT Pro 计划提供“o1 专业模式”,该模式利用额外的计算能力,为与科学、数学和编程相关的最具挑战性的查询提供最全面、最可靠的答案。.
Open AI 的前首席官 Bob McGrew 认为 o1 pro 模式是“智能过剩”的一个例子,由于简单的、基于文本的界面固有的局限性,“额外智能”中获得价值
与 OpenAI 的其他模型一样,ChatGPT 是与 o1 pro 模式交互的唯一方式。Bob McGrew 指出 ChatGPT 并非完美无缺。他还补充说,200 美元的价格确实会让人抱有过高的期望。此外,ChatGPT Pro 的开发并非易事,其在社交媒体上的初期反响也印证了这一点。.
以下是对这款全新开源人工智能助手的评估结果。
据报道,OpenAI O1 Pro 将成为全球最昂贵的聊天机器人订阅服务,每月 200 美元的费用折合每年 2400 美元。不过,这项服务也提供其他福利,例如取消速率限制以及无限制访问 OpenAI 的其他模型。
英国计算机科学家西蒙·威利森问道: “OpenAI 是否分享过一些具体的例子,说明在常规 o1 中失败但在 o1-pro 中成功执行的提示?”
相反,失败案例已有记录。数独对 O1 Pro 模式来说是个挑战,而且它还受到一种任何人都能轻易察觉的视觉错觉的干扰。.
人工智能工程师蒂博尔·布拉霍在X上: “o1和o1-pro在这里都失败了,可能仍然是由于视觉方面的限制(数独谜题也是如此)。”蒂博尔·布拉霍还指出,o1和o1-pro在视觉能力方面都存在不足。
o1 和 o1-pro 在这里都失败了,可能仍然是由于视力限制(数独谜题也是如此) https://t.co/mAVK7WxBrq pic.twitter.com/O9boSv7ZGt
— Tibor Blaho (@btibor91) 2024年12月5日
o1-pro 代码未能正确理解/读取谜题。
根据 OpenAI 的内部基准测试,标准版 o1 在编码和数学问题上的表现仅比 o1 专业版略好一些。.
为了验证 o1 pro 模式的稳定性,OpenAI 对相同的基准测试进行了更为严格的评估。只有当模型四次都正确dent出答案时,才认为该模型成功解决了问题。然而,在这些评估中,改进并不显著。.
周四,OpenAI 首席执行官 Sam Altman 不得不重申 ChatGPT Pro 并不适合大多数人,尽管他之前曾断言 OpenAI 正在朝着“价格低廉到无法计量”的智能方向发展。
他说: “大多数用户都会对[ChatGPT] Plus 等级中的 o1 非常满意!”
Bob McGrew 表示,提高可靠性可能是 o1 pro 最重要的突破,尤其是在医疗领域。.
关于成本的看法
卡内基梅隆大学机器学习副教授、Amplify Partners 风险合伙人 Ameet Talwalkar 表示: “在我看来,将价格提高十倍似乎风险很大, ”他补充道, “我认为几周后我们就能更好地了解市场对这项功能的需求。”
加州大学洛杉矶分校的计算机科学家盖伊·范登布罗克表示: “我不知道这个价格是否合理,也不知道昂贵的推理模型是否会成为常态。”
当 o1 pro 模式被描述为解决“最棘手问题”的最有效模式时,潜在消费者并没有获得足够的信息。
如果没有具体的例子来证明该模型据称增强的功能(包括“思考时间更长”和“展现智能”),就很难证明支付更多费用是合理的。

