中国电信开发了国内首个采用创新型专家混合(MoE)架构的人工智能模型,这些模型完全基于华为技术有限公司的先进芯片进行训练。.
根据中国电信人工智能研究院(TeleAI)上个月发布的一篇技术论文,TeleChat3 模型的参数数量从 1050 亿到数万亿不等,这些模型是在华为昇腾 910B 芯片及其开源深度学习 AI 框架 MindSpore 上进行训练的。.
TeleAI的研究人员表示,华为的这套技术栈满足了训练各种规模的大规模教育领域模型的“严苛要求”。他们补充道 “这些贡献共同解决了前沿规模模型训练的关键瓶颈,建立了一套成熟的、专为国内计算生态系统量身定制的全栈解决方案。”
中国电信的模型落后于 OpenAI 的 GPT-OSS-120B。
MoE架构将任务分配给多个专门的子模型,或称“专家”。因此,基于该架构开发的AI模型可以在不显著增加计算开销的情况下扩展容量。MoE架构由DeepSeek于2024年12月发布的V3模型推广开来,此后已成为中国前沿AI模型的标准配置。.
然而,MoE模型在训练和运行方面被认为技术要求更高。中国电信自行公布的TeleChat3模型性能得分显示,在多个基准测试中,其表现落后于OpenAI于8月发布的GPT-OSS-120B模型。.
上周,清华大学表示,其新的图像生成模型是在华为芯片上训练的,使其成为第一个完全基于国产训练堆栈开发的开源模型,并在图像生成方面取得了行业领先的成绩。.
总部位于北京的智普人工智能公司于去年1月被华盛顿列入黑名单。美国已将包括华为和科大讯飞在内的多家中国科技公司列入出口管制黑名单。这实际上禁止它们获得美国产芯片、半导体工具和其他先进技术。
阿里巴巴集团旗下金融科技公司蚂蚁集团的研究人员也表示,他们成功训练了一个拥有3000亿参数的MoE模型,“未使用高端GPU”。但他们并未说明是否完全使用了国产芯片。.
与此同时,据CryptopolitanCryptopolitan,追踪中国本土科技股的纳斯达克式指数本月已上涨近13%。trac在港上市的中国科技公司的另一项指数也上涨了6%,这两项指数均已超越纳斯达克100指数。
英伟达股价暴跌,此前北京宣布自力更生
英伟达表示,其先进的GPU和机器学习框架是训练大规模教育部模型的最佳工具。然而,由于美国的贸易限制阻碍了中国企业获取美国先进芯片,北京已将未来五年内实现人工智能全栈的自主研发作为一项关键优先事项。.
美国政府近日批准英伟达向中国出售其性能第二强的芯片H200。然而,中国随即采取措施阻止先进芯片的出口。Cryptopolitan报道,北京方面可能正在考虑采取限制措施,以促进本土芯片研发或增强其与美国的谈判地位。
因此,供应商在封锁事件发生后暂停了H200组件的生产。英伟达原本预计会收到来自中国客户的超过100万份订单,供应商也已做好3月份交货的准备,但据报道,海关官员拒绝了这些芯片的入境。.
消息公布后,英伟达股价下跌约3%。分析师认为,英伟达面临明显风险。如果中国继续阻止H200芯片出货,股价可能跌破近期关键支撑位。如果审批流程放宽,股价可能迅速回升,但政策的不确定性难以预测。.
另一方面,其他芯片制造商的股价走势分化,AMD上涨1.7%,英特尔下跌2.8%,而标普500指数ETF(SPY)下跌约0.1%。与此同时,市场观察人士正密切关注英伟达将于2月25日发布的季度财报,以及其对华出口情况的任何新进展。.

