Your bank is using your money. You’re getting the scraps.WATCH FREE

DeepSeek 最新推出的 AI 升级对阿里巴巴的 Qwen3 和 OpenAI 的 o3 模型构成了挑战。

本文内容:

  • 在阿里巴巴的Qwen3表现优于其R1模型之后,DeepSeek推出了R1-0528,对其R1模型进行了重大改进。.
  • R1-0528 现在与 OpenAI o3、o4-mini 和 Google 的 Gemini 2.5-Pro 等大型科技公司的模型相匹配。.
  • 该团队将 R1-0528 的思路提炼成更小的 Qwen3 8B 基础版本,其性能比原版提高了 10%。.

DeepSeek推出了R1-0528,这是对其今年1月发布的R1推理模型的一次重大升级。此次升级发布仅一个月前,阿里巴巴集团旗下的Qwen3在LiveBench(一个开源人工智能模型的在线基准测试平台)中击败了DeepSeek的原始R1模型。.

DeepSeek升级后的R1-0528模型在性能上已能与OpenAI和谷歌等领先的AI模型相媲美。这一成绩表明,中国大型科技公司和新兴科技公司正以惊人的速度推进其AI工具的改进。.

DeepSeek在声明中表示,R1-0528展现出更强的推理能力和创造性写作能力。此次更新还tron了编码能力。最重要的是,该公司声称该模型产生的“幻觉”减少了50%。

DeepSeek解释说,这些升级源于在训练后阶段投入的额外计算能力。在训练后阶段,工程师会在主训练过程结束后对模型进行微调。在训练后阶段,工程师的目标是提高模型的效率,并增强其准确性和安全性。.

R1-0528 目前排名紧随 OpenAI 的 o3 和 o4-mini 之后。

在衡量 AI 模型性能的 LiveCodeBench 上, R1-0528目前的排名仅次于 OpenAI 的 o4-mini 和 o3 模型。

“DeepSeek 的最新升级在推理方面更加敏锐,在数学和代码方面tron强大,并且正在接近 Gemini 和 O3 等顶级模型,”Hugging Face 的人工智能研究员 Adina Yakefu 表示。.

她补充说,新版本在“推理和减少幻觉方面有了重大改进”,证明这家初创公司不仅在迎头赶上,而且在积极竞争。.

另见:  特朗普政府计划大规模裁减主要人工智能机构员工,并支持科技公司对抗欧盟人工智能规则

在华盛顿限制对华先进芯片和其他技术出口之后,中国取得了快速发展。然而,中国企业仍在不断改进其系统。本月初,百度和腾讯都介绍了如何在获取尖端半导体资源有限的情况下,提高模型运行效率的方法。

英伟达首席执行官黄仁勋周三批评了美国的出口管制政策。他表示:“美国的政策基于一个假设,即中国无法制造人工智能芯片。这个假设一直都值得怀疑,现在显然是错误的。问题不在于中国是否会拥有人工智能,它已经拥有了。”

DeepSeek 将阿里巴巴 Qwen3 8B 模型的性能提升了 10%。

DeepSeek 还表示,他们将 R1-0528 中使用的推理步骤提炼到阿里巴巴的Qwen3 8B 基础模型中。据该公司称,这一过程创建了一个全新的、更小的模型,其性能比 Qwen3 提升了 10% 以上。同时,该模型的体积缩小了 30 倍。

该公司表示:“我们相信,DeepSeek-R1-0528 的思路对于推理模型的学术研究和小型模型的工业研究具有重要意义。”.

路透社报道, DeepSeek的一位代表在微信群中表示,此次更新是“小幅试用升级”,此前已开放公开测试。为了应对日益激烈的竞争,谷歌降低了部分Gemini套餐的价格,而OpenAI则推出了价格更低的o3 Mini型号。

另见  《人工智能对治疗的颠覆:心理健康专业人士的担忧》

你的钥匙,你的卡。无需交出保管权即可消费,并使用 Ether.fi Cash赚取 8% 以上的余额收益

分享链接:

免责声明:提供的信息并非交易建议。Cryptopolitan.com对任何基于本页面信息进行的投资概不负责。我们Cryptopolitantron您在做出任何投资决定前进行独立研究dent/或咨询合格的专业人士。

阅读最多

正在加载最热门文章…….

随时掌握加密货币新闻动态,每日更新将发送至您的邮箱。

编辑推荐

正在加载编辑精选文章…….

订阅加密货币资讯,掌握先机

市场瞬息万变。.

我们行动更快。.

订阅 Cryptopolitan Daily,即可在您的收件箱中及时获取敏锐、精辟、相关的加密货币见解。.

立即加入,
不错过任何精彩瞬间。

深入了解情况,掌握事实,
抢占先机。

订阅 CryptoPolitan