最新消息
为您精选
每周
保持领先

最优质的加密货币资讯直接发送到您的邮箱。.

OpenAI 向市场推出新的 AI 推理模型 o3 和 o4-mini

作者:埃纳西·马帕卡梅Enacy Mapakame
阅读时长:3分钟
OpenAI 向市场推出新的 AI 推理模型 o3 和 o4-mini
  • OpenAI CEO Altman 在 X 平台上发布了新的开源推理模型。.
  • 这是为了击败谷歌、Anthropic、xAI 和 DeepSeek 等竞争对手而采取的措施的一部分。.
  • OpenAI 将它们描述为首批“用图像思考”的模型。

 

ChatGPT 的制造商 OpenAI 于周三宣布发布两个推理 AI 模型,分别为 o3 和 o4-mini,这两个模型旨在暂停并思考问题,然后再做出回应。.

就在一周前,这家人工智能初创公司宣布 移除其 GPT-4 语言模型,并用性能更优的模型取而代之,同时其他一些规模较小的模型也正在研发中,准备推向市场。

OpenAI 将 o3 描述为其迄今为止最先进的推理模型。

据报道,这家人工智能初创公司称其 o3 是该公司最先进的推理模型,因为它在衡量数学、推理、编码、科学和视觉理解能力的测试中表现优于其他先前的模型。.

“o3 和 o4 mini 在编码方面非常出色,因此我们发布了一款新产品 Codex CLI,使它们更容易使用。” 宣布 OpenAI 首席执行官 Sam Altman 在 X 平台上的一篇文章中

“这是一个运行在你电脑上的编码代理程序。它是完全开源的,目前即​​可使用,我们预计它会迅速改进。”

奥特曼。.

至于 o4-mini,该公司称其在价格、速度和性能之间实现了极具竞争力的平衡。据 TechCrunch 报道,这些正是开发者在选择用于驱动其应用程序的 AI 模型时通常会考虑的因素。.

OpenAI 对其模型进行评论时表示,o3 在 SWE-bench 验证(无需自定义脚手架)中取得了最先进的性能,该测试衡量编码能力,该模型得分为 69.1%。.

据该公司称,o4-mini 的测试成绩也达到了 68.1%。这家初创公司性能排名第二的机型 o3-mini 在测试中得分为 49.3%,而 Anthropic 的 Claude 3.7 Sonnet 则获得了 62.3% 的分数。.

TechCrunch,o3 模型差点没能在 ChatGPT 中发布,因为 Altman 在 2 月份表示,该公司希望将更多资源投入到更复杂的 o3 技术中。

然而,竞争压力似乎最终迫使 OpenAI 改变了方向。.

OpenAI希望保持领先于谷歌等竞争对手。

新模型的推出正值 OpenAI 努力保持领先于竞争对手之际,尤其是谷歌、Meta、Anthropic、xAI 和中国的 DeepSeek。.

OpenAI率先发布了人工智能推理模型O1。然而,竞争对手迅速跟进,推出了性能与OpenAI产品线持平甚至更胜一筹的版本。与此同时,随着人工智能实验室不断提升系统性能,推理模型也开始在人工智能领域占据主导地位。.

与之前推出的其他推理模型相比,o3 和 o4-mini 模型能够使用 ChatGPT 中的工具生成响应,例如网页浏览、Python 代码执行、图像处理和图像生成。.

评论 这一公告时,称其发展“非常棒”,并表示“本地编码是未来”,这是一个巨大的进步。

“这是 ChatGPT 自插件以来最大的变革,而且更加流畅。所有功能开箱即用,模型会自行选择解决问题的方法。这是朝着真正能提供帮助(而不仅仅是聊天)的 AI 迈出的重要一步。”

阿扎尔·艾哈迈德。.

据该公司称,OpenAI Pro、Plus 和 Team 套餐的订阅用户可以访问新模型,这些模型还会搭配一个名为“o4-mini-high”的 o4-mini 变体。这些变体需要更多时间生成答案,以提高可靠性。.

OpenAI 表示,这些新模型是其首批能够“图像思考”的模型。这意味着用户可以将图片上传到 ChatGPT,模型会在“思维链”阶段分析图片,然后再给出答案。凭借这项新功能,模型能够理解模糊和低质量的图像,并在推理过程中执行缩放或旋转图像等任务。.

除了图像处理能力之外,这两个模型还可以通过 ChatGPT 的 Canvas 功能直接在用户的浏览器中运行和执行 Python 代码,并在被问及时事时搜索网络。.

最顶尖的加密货币专家都在阅读我们的简报。想 加入他们

分享这篇文章
埃纳西·马帕卡梅

埃纳西·马帕卡梅

Enacy Mapakame是一位拥有超过10年商业和金融新闻从业经验的记者。她关注资本市场和新兴技术,例如元宇宙、人工智能和加密货币。Enacy拥有媒体与社会研究荣誉理学士学位。.

更多…新闻
深度 密码
学速成课程