中国人工智能初创公司DeepSeek周五发布了其期待已久的V4模型预览版,同时首次寻求外部融资,这一举动震动了一些中国人工智能股票,提振了香港和内地市场的芯片制造股,并再次引发了人们对新版本所用芯片的疑问。.
这家总部位于杭州的公司发布了V4测试版,让开发者可以提前体验其各项功能。与前代产品V3一样,V4也是开源的,这意味着开发者可以在自己的系统上下载、运行和修改代码。该型号有两种尺寸,分别是“专业版”和更小巧的“闪存版”。.
DeepSeek表示, V4在与国内竞争对手的较量中表现出色,尤其是在涉及人工智能代理、知识处理和推理的任务方面。该公司还表示,该模型已针对包括Anthropic的Claude Code在内的常用代理工具进行了优化。
在DeepSeek的R1推理模型震撼全球科技市场一年多之后,DeepSeek发布了这款新模型。R1于2025年1月发布,其性能与许多领先的AI模型不相上下,甚至更胜一筹。DeepSeek透露,R1仅用了两个月时间,花费不到600万美元,并且使用的是低端的英伟达芯片。这一消息令投资者感到不安,并引发了人们对美国在人工智能领域领先地位以及大型科技公司在人工智能基础设施上巨额投入的质疑。.
该公司目前在中国蓬勃发展的AI领域面临着日益激烈的竞争。阿里巴巴和字节跳动等公司今年都发布了新版本。上周五,V4版本的发布导致多家中国AI公司在香港的股价下跌。.
智普AI下跌约8-9%,MiniMax下跌约7-8%,Manycore Tech下跌9%。.
然而,芯片制造类股票却朝着相反的方向发展,因为 V4 的发布提振了人们对人工智能驱动需求的乐观情绪。.
中国最大的芯片制造商中芯国际(SMIC)在香港的股价上涨了 11%,而华虹半导体的股价上涨了超过 18%。.
在大陆,寒武纪科技和摩尔线业科技的股价均上涨了 4% 至 6%,海刚信息科技的股价上涨了 10% 以上。.
哪些芯片参与了 DeepSeek V4 的训练?
发布后最大的疑问之一是什么硬件。据路透社报道,华为周五证实,其基于昇腾950的超级节点可以支持V4型号,并表示其全线高性能系统现在都兼容V4系列。
然而,DeepSeek并未透露其用于训练模型的芯片型号,因此该问题仍未得到解答。.
由于美国自 2022 年起实施出口管制,中国人工智能开发者无法购买英伟达最先进的芯片。此后,北京方面一直推动其科技公司转向华为等国产芯片制造商的产品。.
V4发布前一天,白宫指责中国大规模窃取美国人工智能实验室的知识产权,这一指控可能会在下个月美中领导人峰会召开前加剧两国关系紧张。
DeepSeek一直是这场争端的焦点,华盛顿方面指控其获取了英伟达的受限芯片,而包括Anthropic和OpenAI在内的多家公司则称其不正当地复制了它们的专有模型。中国驻华盛顿大使馆驳斥了这些“毫无根据的指控”。
为留住研究人员而筹款
据Cryptopolitan此前报道,DeepSeek 正在与包括腾讯和阿里巴巴在内的一小群战略投资者洽谈,计划以超过 200 亿美元的估值筹集资金,这将是其首次外部融资。
预计融资额仅为数亿美元,远低于同行通常筹集的数十亿美元。运营 Kimi AI 模型的 Moonshot 公司此前估值 180 亿美元,而 MiniMax 和 Zhipu 的估值分别为 340 亿美元和 580 亿美元。.
据英国《金融时报》报道,消息人士透露,此次融资并非出于迫切的 cash 需求,而主要目的是为了留住研究人员。一些研究人员已经跳槽到估值在过去一年里飙升的竞争对手公司。股票期权构成人工智能研究人员薪酬的很大一部分,甚至可以说是绝大部分,而由于估值不明朗,DeepSeek一直难以与之竞争。.
R1 论文的主要作者郭大亚加入了字节跳动,而 DeepSeek 模型训练团队的资深成员王炳轩则离开了公司,加入了腾讯。.
创始人梁文峰通过其量化交易公司为公司提供资金,他还在考虑其他估值方法,包括股票回购或基于业绩的估值方法,以防无法达成融资条款。.
照片由