由于华为昇腾芯片持续出现“技术问题”,DeepSeek推迟了其R2 AI模型的发布。.
中国人工智能巨头在地方政府鼓励其产品使用国产系统后,遭遇了研发进度延误。.
DeepSeek R2 AI 模型发布延迟
中国人工智能公司DeepSeek在与华为昇腾处理器的兼容性方面遭遇持续的技术挑战后,推迟了其最新人工智能模型的发布。
在今年 1 月成功发布 R1 型号后,DeepSeek 受到中国当局的鼓励,开始使用华为的芯片而不是美国制造的英伟达产品,但该公司在 R2 型号的训练阶段遇到了重大问题。.
据知情人士透露,这些问题迫使 DeepSeek 依赖英伟达芯片进行训练,而使用华为昇腾芯片进行推理。.
业内人士表示,与英伟达的产品相比,包括华为在内的中国芯片存在芯片间连接速度较慢、软件限制和稳定性问题等问题。.
消息人士称,华为派遣了一支工程师团队前往DeepSeek的办公室,帮助其将该模型适配到华为的芯片上,但即使有现场支持,这家初创公司也无法在Ascend硬件上成功完成训练运行。
DeepSeek原计划在5月份发布R2型号,但由于Ascend芯片的性能出现问题,发布被推迟了。.
DeepSeek发展势头面临的挑战
据一位知情人士透露,R2 的发布延迟是由于该模型更新功能的数据标注进展比预期要慢。.
尽管一些中国媒体报道称,新机型可能会在未来几周内发布,但DeepSeek创始人梁文峰在内部对研发进展表示不满,敦促团队花必要的时间打造一款能够保持公司竞争优势的机型。.
与此同时,竞争对手继续取得进展。加州大学伯克利分校的人工智能研究员里特维克·古普塔表示,中国许多开发者已经转向阿里巴巴的Qwen3模型,他称该模型既强大又灵活。
Gupta 指出,Qwen3 采用了 DeepSeek 的一些核心创新,例如能够实现推理能力的训练算法,但它使这些创新在部署方面更加高效。.
负责监测华为人工智能生态系统的古普塔表示,Ascend平台正在经历“成长的烦恼”,但他预测最终会得到改善。.
“虽然我们今天没有看到领先的模型使用华为平台进行训练,但这并不意味着将来不会出现这种情况,”他说道。“这只是时间问题。”
作为中美科技紧张局势的核心参与者,英伟达近日同意向美国政府上缴一部分与中国相关的收入,以换取恢复向中国客户销售其H2O芯片。该公司强调了维持与中国开发者合作的重要性,并警告称“放弃整个市场和开发者只会损害美国的经济和国家安全”。
照片由