OpenAI 向市场推出新的 AI 推理模型 o3 和 o4-mini

作者：

阅读时长：3分钟 2025年4月16日

ChatGPT 的制造商 OpenAI 于周三宣布发布两个推理 AI 模型，分别为 o3 和 o4-mini，这两个模型旨在暂停并思考问题，然后再做出回应。.

就在一周前，这家人工智能初创公司宣布移除其 GPT-4 语言模型，并用性能更优的模型取而代之，同时其他一些规模较小的模型也正在研发中，准备推向市场。

据报道，这家人工智能初创公司称其 o3 是该公司最先进的推理模型，因为它在衡量数学、推理、编码、科学和视觉理解能力的测试中表现优于其他先前的模型。.

OpenAI 首席执行官 Sam Altman 在 X 平台上的一篇文章中宣布： “o3 和 o4 mini 在编码方面非常出色，因此我们发布了一款新产品 Codex CLI，使它们更容易使用。”

“这是一个运行在你电脑上的编码代理程序。它是完全开源的，目前即可使用，我们预计它会迅速改进。”

奥特曼。.

至于 o4-mini，该公司称其在价格、速度和性能之间实现了极具竞争力的平衡。据 TechCrunch 报道，这些正是开发者在选择用于驱动其应用程序的 AI 模型时通常会考虑的因素。.

OpenAI 对其模型进行评论时表示，o3 在 SWE-bench 验证（无需自定义脚手架）中取得了最先进的性能，该测试衡量编码能力，该模型得分为 69.1%。.

据该公司称，o4-mini 的测试成绩也达到了 68.1%。这家初创公司性能排名第二的机型 o3-mini 在测试中得分为 49.3%，而 Anthropic 的 Claude 3.7 Sonnet 则获得了 62.3% 的分数。.

据 TechCrunch，o3 模型差点没能在 ChatGPT 中发布，因为 Altman 在 2 月份表示，该公司希望将更多资源投入到更复杂的 o3 技术中。

然而，竞争压力似乎最终迫使 OpenAI 改变了方向。.

o3 和 o4-mini 的编码能力非常强，因此我们发布了一款新产品 Codex CLI，让它们更容易使用。.

这是一个运行在您电脑上的编码代理程序。它是完全开源的，目前即可使用；我们预计它会迅速改进。.

— 萨姆·奥尔特曼 (@sama) 2025 年 4 月 16 日

新模型的推出正值 OpenAI 努力保持领先于竞争对手之际，尤其是谷歌、Meta、Anthropic、xAI 和中国的 DeepSeek。.

OpenAI率先发布了人工智能推理模型O1。然而，竞争对手迅速跟进，推出了性能与OpenAI产品线持平甚至更胜一筹的版本。与此同时，随着人工智能实验室不断提升系统性能，推理模型也开始在人工智能领域占据主导地位。.

与之前推出的其他推理模型相比，o3 和 o4-mini 模型能够使用 ChatGPT 中的工具生成响应，例如网页浏览、Python 代码执行、图像处理和图像生成。.

评论这一公告时，称其发展“非常棒”，并表示“本地编码是未来”，这是一个巨大的进步。

“这是 ChatGPT 自插件以来最大的变革，而且更加流畅。所有功能开箱即用，模型会自行选择解决问题的方法。这是朝着真正能提供帮助（而不仅仅是聊天）的 AI 迈出的重要一步。”

阿扎尔·艾哈迈德。.

据该公司称，OpenAI Pro、Plus 和 Team 套餐的订阅用户可以访问新模型，这些模型还会搭配一个名为“o4-mini-high”的 o4-mini 变体。这些变体需要更多时间生成答案，以提高可靠性。.

OpenAI 表示，这些新模型是其首批能够“图像思考”的模型。这意味着用户可以将图片上传到 ChatGPT，模型会在“思维链”阶段分析图片，然后再给出答案。凭借这项新功能，模型能够理解模糊和低质量的图像，并在推理过程中执行缩放或旋转图像等任务。.

除了图像处理能力之外，这两个模型还可以通过 ChatGPT 的 Canvas 功能直接在用户的浏览器中运行和执行 Python 代码，并在被问及时事时搜索网络。.

最顶尖的加密货币专家都在阅读我们的简报。想加入他们？

分享这篇文章

埃纳西·马帕卡梅

Enacy Mapakame是一位拥有超过10年商业和金融新闻从业经验的记者。她关注资本市场和新兴技术，例如元宇宙、人工智能和加密货币。Enacy拥有媒体与社会研究荣誉理学士学位。.

分享这篇文章

更多…新闻

每天一份简洁明了的简报。