OpenAI宣布其旗舰模型GPT-4.1将上线ChatGPT平台。所有付费账户和团队用户均可通过模型选择器下拉菜单使用该模型。OpenAI透露,免费用户不在此次更新范围内,但企业版和教育版用户将获得访问权限。.
所有用户(包括免费用户)的 GPT-4.0 mini 将被 GPT-4.1 mini 取代。付费用户也将在下拉菜单中看到 GPT-4.1 mini 模型。.
根据 OpenAI 的说法,GPT-4.1 mini 和 GPT-4.1 针对编码任务进行了优化,并增强了指令响应能力,优于 GPT-4.0。.
OpenAI 的 GPT-4.1 在各方面都优于 GPT-4.0。
OpenAI表示,GPT-4.1模型拥有更大的上下文窗口,最多可支持一百万个上下文标记,能够更好地利用上下文进行长篇理解。这家人工智能公司还补充说,软件工程师将受益于使用该模型开发Web应用程序。.
OpenAI 的发布说明显示,工程师可以使用该模型来运行日常查询、后续问题、编码和其他复杂任务。
OpenAI表示,与GPT-4.0的12.8万个词元限制相比,GPT-4.1模型能够处理海量的文本、图像和视频提示。OpenAI称,GPT-4.1在SWE-bench Verified测试中得分54.6%,比GPT-4.0提高了21.4%,比GPT-4.5提高了26.6%,使其成为编码任务的领先模型。
在 Scale 的 MultiChallenge 基准测试中(该测试用于衡量指令执行能力),GPT-4.1 的得分为 38.3%,比 GPT-4.0 提高了 10.5%。此外,在 Video MME 基准测试中(该测试用于衡量多模态长上下文理解能力),GPT-4.1 在无字幕长视频类别中取得了 72.0% 的高分,比 GPT-4.0 提高了 6.7%。.
OpenAI透露,基准测试提供了宝贵的见解,并且他们训练模型时重点关注实际应用。该公司对开发者社区优化模型以应对复杂任务表示感谢。.
GPT-4.1 没有附带安全报告
人工智能研究界批评 OpenAI 在未提供安全报告的情况下发布 GPT-4.1 模型,声称 OpenAI 模型的透明度标准降低了。.
这家人工智能公司辩称,尽管该模型比 GPT-4.0 提供了更好的性能和速度,但它不需要像更高级的模型那样进行安全报告,因为它不是前沿模型。.
“GPT-4.1 没有引入新的模型交互方式或模式,其智能水平也没有超越 GPT-3。这意味着,虽然其安全性也很重要,但与前沿模型有所不同。”
——Johannes Heidecke ,OpenAI 安全主管
针对安全方面的质疑,这家人工智能技术公司发布了更多关于GPT-4.1的信息。周三,该公司承诺将尽快公布其内部模型安全评估的结果,以提高透明度。.
该公司透露,正努力在竞争日益激烈的领域脱颖而出。据报道,即将宣布以30亿美元收购Windsurf,后者是最知名的AI编码工具之一。Windsurf的竞争对手包括另一款流行的AI编码工具Cursor,以及微软和Anthropic等公司现有的AI编码功能。
表示, Windsurf 是一款近几个月来开发者们争相使用的工具,它可以快速编写新软件的代码。这家初创公司的投资者包括 Founders Fund、General Catalyst、Greenoaks 和 Kleiner Perkins。
另一方面,谷歌更新了其Gemini聊天机器人,使其能够更轻松地连接到GitHub项目。此前,OpenAI推出了用于ChatGPT深度研究的GitHub连接器。该GitHub连接器工具会搜索网络和其他资源,以生成关于特定主题的详尽研究报告。
周二,OpenAI 也宣布将 SharePoint 和 Microsoft OneDrive 连接器添加到 ChatGPT 深度研究中。.
照片由 Focal Foto 通过 Flickr 提供。.