DeepSeek正在内蒙古招聘员工,为其四月下旬的发布做准备。这将是该公司首个基于华为处理器而非美国处理器的大型版本。.
该公司还在内蒙古乌兰察布市发布了服务器维护工程师和交付经理的招聘信息。这家总部位于杭州的公司此前从未发布过面向其计算基础设施的现场工作岗位
预计四月下旬发布的V4版本采用了混合专家模型设计,总共约有1万亿个参数,但每个任务实际执行的运算量仅为320亿至370亿。这样一来,随着模型规模的扩大,成本也能有效降低。.
“如果他们成功地完全使用华为芯片训练了V4,这标志着地缘政治科技格局发生了实质性转变,”迦太基资本的Stephen Wu表示。.
该片的发行日期已从二月推迟了两次。.
硅谷竞争对手联合起来对抗中国企业
OpenAI、Anthropic 和谷歌于 4 月 6 日宣布将共享情报,以阻止中国公司抄袭他们的模型。这三家竞争对手正通过前沿模型论坛(Frontier Model Forum)开展合作,该论坛是一个成立于 2023 年的行业组织。.
Anthropic公司trac到三家中国公司通过约24000个虚假账户进行的1600万次交易。据称,这些公司使用了对抗蒸馏技术,向ChatGPT和Claude发送大量查询,然后用这些查询结果训练模型。
OpenAI 在 2 月 12 日提交给美国众议院中国问题特别委员会的一份备忘录中指责 DeepSeek “通过新的、混淆的方法”抄袭其模型。.
2022年开始实施的限制措施旨在减缓中国的人工智能发展,这首先导致2022年芯片产量下降了9.8%。然而,这些针对先进芯片的出口管制措施现在似乎正在产生反作用。.
预计国产芯片市场份额将达到50%。
情况正在发生变化。趋势预测,到2026年,国产芯片将占中国人工智能芯片市场的50%。中国半导体设备在国内市场的份额从2024年的25%增长到2025年的35%,超过了“中国制造2025”设定的30%的目标。
中国已投入约1500亿美元用于芯片研发。美国《芯片与科学法案》授权拨款527亿美元。.
转向华为芯片并非一帆风顺。正如Cryptopolitan此前报道,DeepSeek 曾计划使用被禁的英伟达芯片,但并未透露任何技术迹象。
据Counterpoint Research首席人工智能分析师魏孙(Wei Sun)称,放弃英伟达(Nvidia)需要“大量的重新设计”。他表示:“这种转变可能会减慢开发周期,并带来性能上的妥协,尤其是对于V4这种被寄予厚望的尖端型号而言。”.
DeepSeek 于 2024 年 1 月凭借 R1 模型一举成名。R1 是一种推理模型,特朗普dent 称之为对美国企业的“警钟”。该公司价格低廉的工具在中国以及东南亚和中东等地区得到广泛应用。.

