Your bank is using your money. You’re getting the scraps.WATCH FREE

DeepSeek透露其人工智能模型的训练成本为29.4万美元

本文内容:

  • 中国人工智能公司称,其模型的训练成本仅为 29.4 万美元。.
  • 这一数字远低于美国竞争对手,引发了行业新的疑问。.
  • DeepSeek否认抄袭竞争对手模型的输出结果。.

中国深智科技声称,其旗舰人工智能系统 R1 的训练费用仅为 29.4 万美元,这只是美国竞争对手所花费金额的一小部分。.

相关细节已于本周发表在《自然》杂志的一篇同行评审论文中,很可能会进一步引发关于北京在全球人工智能竞赛中雄心壮志的争论。这家总部位于杭州的公司表示,该推理模型使用了512颗英伟达H800芯片进行训练。在美国禁止向中国销售性能更强大的H100和A100处理器后,这批硬件是专门为中国市场设计的。.

该报告由创始人梁文峰参与撰写,标志着该公司首次披露此类成本。.

DeepSeek 使用的成本仅为美国同类产品的几分之一。

等老牌巨头的地位,从而引发科技股抛售潮 英伟达和 OpenAI

然而,梁和他的团队一直保持低调,此后只偶尔露面发布产品更新。.

据报道,其售价为 29.4 万美元,这与美国公司的估计形成了鲜明对比。.

OpenAI首席执行官萨姆·奥特曼在2023年表示:“训练基础模型的成本远不止1亿美元。”但他没有给出任何具体的成本明细。.

训练 大型语言模型 需要长时间运行大量高性能芯片,在处理文本和代码的过程中消耗巨额电力。业内人士长期以来一直认为,此类项目的成本高达数千万美元甚至数亿美元。

这一假设目前正受到质疑。DeepSeek 在一份补充文件中承认,该公司拥有 A100 芯片,并在早期开发阶段使用过这些芯片,之后才将全面训练转移到其 H800 集群上。据该公司称,该模型在最终训练阶段运行了 80 小时。.

另见:  瑞银部署人工智能分析师克隆体,以满足对短视频(类似TikTok)投资内容的需求

尽管英伟达坚称这家中国初创公司只能获得其H800处理器,但美国官员对此仍持怀疑态度。几个月前,美国消息人士告诉 路透社 ,DeepSeek非法持有大量H100芯片,而这些芯片在中国被禁止出口。

将创新置于显微镜下审视

R1 之所以引起关注,不仅是因为它的训练成本低,还因为它可能是第一个接受正式同行评审的主要模型。.

“这是一个非常值得欢迎的dent,如果我们没有这种分享的规范,就很难评估风险,”Hugging Face 的机器学习工程师 Lewis Tunstall 说道,他审阅了《自然》杂志的这篇论文。.

审查过程促使 DeepSeek 澄清技术细节,包括其模型的训练方式以及采取了哪些安全措施。.

“经过严格的同行评审过程,肯定有助于验证模型的有效性和实用性,”俄亥俄州立大学人工智能研究员孙欢表示。.

DeepSeek 的关键突破在于采用了纯粹的 强化学习方法。根据论文所述,该方法不依赖于人工精心设计的推理示例,而是通过奖励正确解决问题来逐步发展出自身的解题策略。

该公司表示,这种反复试验的系统使 R1 能够在不模仿人类策略的情况下验证其运作方式。.

另见:  谷歌与贝莱德支持的台湾太阳能开发商合作,助力人工智能蓬勃发展

孙补充道:“这个模型影响很大。到2025年,几乎所有强化学习方面的工作都可能以某种方式受到R1的启发。”

DeepSeek否认抄袭指控

R1 发布后不久,就有传言称 DeepSeek 依赖竞争对手(尤其是 OpenAI)的输出来加速训练;然而,该公司现在断然否认了这一指控。.

在与审稿人的沟通中,DeepSeek 坚称 R1 没有抄袭 OpenAI 生成的推理示例。然而,与大多数大型语言模型一样,R1 也是基于网络文本进行训练的。这意味着其中不可避免地包含了一些人工智能生成的内容,而这一解释也说服了一些审稿人。.

“我不能百分之百确定R1没有使用OpenAI的样本进行训练。但是,其他实验室的复现尝试表明,强化学习本身就足够好了。” Tunstall说道。.

DeepSeek 表示,R1专为处理推理密集型任务而设计,例如编程和数学matic。与大多数美国公司开发的封闭系统不同,R1以开源模型的形式发布,研究人员可以免费下载。在人工智能社区网站 Hugging Face,R1的下载量已超过1000万次。

该公司花费约600万美元开发R1的基础模型,但即使加上这笔费用,其成本也远低于竞争对手。对于业内许多人士而言,这使得R1极具trac。.

Sun 和他的同事最近在科学数据任务上测试了该系统,发现它虽然不是最准确的,但在性价比方面却是最好的之一。.

 

如果你正在阅读这篇文章,你已经领先一步了。 订阅我们的新闻简报,继续保持领先优势

分享链接:

免责声明: 提供的信息并非交易建议。Cryptopolitan.com Cryptopolitan研究 对任何基于本页面信息进行的投资概不负责。我们trondentdentdentdentdentdentdentdent /或咨询合格的专业人士。

阅读最多

正在加载最热门文章…….

随时掌握加密货币新闻动态,每日更新将发送至您的邮箱。

编辑推荐

正在加载编辑精选文章…….

订阅加密货币资讯,掌握先机

市场瞬息万变。.

我们行动更快。.

订阅 Cryptopolitan Daily,即可在您的收件箱中及时获取敏锐、精辟、相关的加密货币见解。.

立即加入,
不错过任何精彩瞬间。

深入了解情况,掌握事实,
抢占先机。

订阅 CryptoPolitan