中国DeepSeek公司推出新一代人工智能模型,旨在与GPT-5竞争。但它真的足够好吗?

- DeepSeek 于周一推出了新的 V3.2-Exp 型号,重点在于速度、降低成本和处理大量数据。.
- 该模型引入了 DeepSeek 稀疏注意力机制,该机制会跳过不相关的数据,从而提高效率并将成本降低一半。.
- 专家警告说,尽管关注度低有其好处,但它可能会遗漏重要信息并降低可靠性。.
中国科技新星DeepSeek发布了名为V3.2-Exp的全新实验模型,旨在挑战美国在人工智能领域的统治地位。该模型于周一发布,并首先通过热门人工智能论坛Hugging Face上的帖子公开。.
DeepSeek 声称,最新版本是在其当前型号 V3.1-Terminus 的基础上开发的,但tron注重速度、成本和内存处理。.
据 Hugging Face 中国社区负责人 Adina Yakefu 称,该模型采用了一种名为 DeepSeek Sparse Attention(简称 DSA)的技术,她表示该技术“使 AI 更擅长处理长文档和对话”,同时还能将运营成本降低一半。.
如果你 还记得,大约一年前,DeepSeek 毫无预警地发布了其首个模型 R1,震惊了业界。该模型证明,使用更少的芯片和更低的计算能力也能训练出大型语言模型。在如此有限的条件下,没有人预料到一支中国团队能够做到这一点。V3.2-Exp 的目标依然不变:更少的硬件,更高的性能。
增加了 DeepSeek 稀疏注意力机制,并降低了 AI 运行成本。
DSA是该模型的核心特性。它改变了人工智能选择信息的方式。DeepSeek训练模型不再扫描所有内容,而是只关注对任务有用的信息。Adina 解释 说,这样做的好处体现在两个方面:“效率”和“成本降低”。
通过跳过无关数据,该模型运行速度更快,能耗更低。她表示,该模型的设计充分考虑了开源协作。.
Futurum Group人工智能研究负责人尼克·佩申斯(Nick Patience)告诉CNBC,该模型有望让那些无力承担更昂贵模型的开发者也能使用强大的AI工具。“它应该能让模型运行更快、更经济高效,而且性能不会明显下降,”尼克说。但这并不意味着没有风险。.
机制的方式 DeepSeek ,就像航空公司选择航线一样。从一个地方到另一个地方可能有数百种路线,但只有少数几条是真正合理的。该模型会过滤掉噪声,专注于真正重要的事情——或者至少是它 认为 重要的事情。
但这其中也存在一些问题。BlankPage Capital 的联合创始人 Ekaterina Almasque 简单地解释道:“基本上,就是剔除你认为不重要的东西。” 但她指出,问题在于,这种模式并不能保证剔除的是正确的 东西 。
曾投资过Dataiku、Darktrac和Graphcore等公司的Ekaterina警告说,偷工减料可能会在以后造成问题。“它们(稀疏注意力模型)丢失了很多细微差别,”她说。“真正的问题是,它们是否拥有正确的机制来排除不重要的数据,或者是否存在排除真正重要数据的机制,如果是这样,结果的相关性就会大大降低?”
连接到中国芯片并发布开源代码
尽管存在这些担忧,DeepSeek 坚称 V3.2-Exp 的性能与 V3.1-Terminus 一样出色。该模型还可以直接运行在昇腾和寒武纪等国产 芯片 ,无需任何额外配置。这对于中国利用自主研发的硬件构建人工智能、减少对外国技术的依赖至关重要。“开箱即用,”Adina 说,“DeepSeek 可以直接与这些芯片配合使用。”
该公司还公开了该模型的完整代码和工具。这意味着任何人都可以下载、运行、修改或基于 V3.2-Exp 进行开发。此举符合 DeepSeek 的开源战略,但也引发了另一个问题:专利。由于该模型是开源的,而且其核心理念——稀疏注意力——早在 2015 年就已出现,DeepSeek 无法通过法律手段对其进行保护。.
“这种方法并不算全新,”叶卡捷琳娜说。在她看来,这项技术唯一值得称道的地方在于DeepSeek如何选择保留哪些数据、忽略哪些数据。.
这才是真正的竞争所在。不仅在于如何打造更智能的模型,还在于如何让模型运行更快、成本更低、更精简——同时又不影响结果。就连DeepSeek也称这个版本是“迈向下一代架构的过渡阶段”,这表明他们已经在着手开发更宏大的项目了。.
尼克表示,该模型表明,效率如今与原始功率同等重要。阿迪娜则认为,公司着眼于长远发展。“DeepSeek着眼长远,旨在让社区持续关注其发展进程,”她说道,“人们总是会选择价格低廉、可靠且高效的产品。”
如果你正在阅读这篇文章,你已经领先一步了。 订阅我们的新闻简报,继续保持领先优势。
学速成课程
- 哪些加密货币可以让你赚钱
- 如何通过钱包提升安全性(以及哪些钱包真正值得使用)
- 专业人士使用的鲜为人知的投资策略
- 如何开始投资加密货币(使用哪些交易所、购买哪种加密货币最划算等)















