在对下一代模型充满期待之际，DeepSeek 发布了新的 AI 推理方法。

作者：

奥沃顿斯·阿德巴

阅读时长：3分钟 2025年4月6日

中国人工智能初创公司DeepSeek发布了一种新的AI推理方法，市场对其下一代产品充满期待。.
DeepSeek 公布了一种新的 AI 推理方法，但该公司对 R2 型号的潜在发布仍守口如瓶。.
这家中国人工智能初创公司专注于研发，发布了其 V3 模型的升级版。.

中国人工智能初创公司DeepSeek发布了一种新的推理方法，市场仍在翘首期盼其下一代模型的发布。据报道，该公司推出了一种新颖的方法，旨在提升大型语言模型（LLM）的推理能力，而公众也正翘首以盼其新模型的发布。.

据报道，近期发表的一篇论文揭示了这一成就的取得，这得益于清华大学研究人员与人工智能初创公司DeepSeek的合作。论文指出，DeepSeek开发了一种结合生成式奖励模型（GRM）和自律调优的技术。这种双重方法将使逻辑学习模型（LLM）能够更快、更好地响应通用查询。

DeepSeek 发布了新的 AI 推理方法

研究人员表示，DeepSeek-GRM模型性能优于现有方法，与tron的公共奖励模型相比，其表现毫不逊色。奖励建模是一种帮助逻辑学习模型（LLM）确定人类偏好的过程。研究人员提到，这家人工智能初创公司计划将GRM模型开源，但尚未给出具体的开发时间表。.

在DeepSeek V3基础模型和R1推理模型 enj全球关注后，外界对这家初创公司下一步发展方向的猜测甚嚣尘上，而这篇学术研究论文的发表正值此时。今年早些时候发布的R1模型因其性能优于一些老模型（包括OpenAI的首个ChatGPT模型）而备受瞩目。.

R1模型的发布也让硅谷措手不及，因为该模型是开源的，而且开发成本仅为其他人工智能模型的几分之一。虽然人们的关注度似乎有所下降，但人工智能行业的竞争对手们却取得了显著进展，这表明该领域的竞争将持续很长时间。.

然而，路透社上个月的一篇报道提到，DeepSeek R1的继任者DeepSeek-2可能正在研发中。报道称，该公司可能计划在本月底发布这款产品，以期利用其在人工智能行业日益增长的影响力。另一方面，DeepSeek对R2机型一直保持沉默，官方渠道也未透露任何消息，据报道，其客户服务账号甚至在与企业客户的沟通中否认了这一传闻。.

V3模型的研发工作仍在继续。

总部位于杭州的DeepSeek由企业家梁文峰于2023年创立，近几个月来因其卓越的成就而备受全球关注。然而，该公司一直拒绝公开沟通，而是将所有时间和精力都投入到研发中。尽管该公司在人工智能领域究竟有何新举措尚待观察，但种种传闻表明，它肯定一直在积极筹备。.

上个月，该公司宣布了一项正在研发的成果，向世界展示了其升级版V3型号，名为DeepSeek-V3-0324。据该公司称，升级后的型号“增强了推理能力，优化了前端Web开发，并提升了中文写作能力”。今年2月，该公司将其五个代码库外包，允许开发者审查并参与其软件开发。这家初创公司表示，将“以完全透明的方式稳步前进”。

同月，梁志强发表了一篇关于原生稀疏注意力机制的技术研究，该机制用于提高层级模型（LLM）处理海量数据的效率。现年40岁的梁志强同时也是DeepSeek母公司High-Flyer Quant的创始人，这家对冲基金为这家人工智能初创公司的技术研发提供了雄厚的资金支持。2月下旬，梁志强参加了一场科技企业家研讨会，中国国家主席dent 主持了此次研讨会。习近平主席dent 这家初创公司展现了中国面对美国遏制中国人工智能发展举措的韧性。

不要只是阅读加密货币新闻，要理解它。订阅我们的新闻简报，完全免费。

CNY DeepSeek

分享这篇文章