China Telecom ha desarrollado los primeros modelos de inteligencia artificial del país con la innovadora arquitectura Mixture-of-Experts (MoE) que están entrenados completamente en chips avanzados de Huawei Technologies.
Según un documento técnico publicado el mes pasado por el Instituto de Inteligencia Artificial de China Telecom (TeleAI), los modelos TeleChat3, que van desde 105 mil millones a billones de parámetros, fueron entrenados en los chips Ascend 910B de Huawei y su marco de inteligencia artificial de aprendizaje profundo de código abierto, MindSpore.
Los investigadores de TeleAI afirmaron que la pila de Huawei satisfizo las exigentes exigencias del entrenamiento de modelos MoE a gran escala en diversos tamaños. y adaptada a los ecosistemas computacionales nacionales», añadieron .
El modelo de China Telecom está por detrás del GPT-OSS-120B de OpenAI
La arquitectura MoE distribuye tareas a múltiples submodelos especializados o "expertos". Por lo tanto, los modelos de IA desarrollados con ella pueden ampliar su capacidad sin aumentar significativamente la sobrecarga computacional. MoE se popularizó con el modelo V3 de DeepSeek, lanzado en diciembre de 2024, y desde entonces se ha convertido en la norma para los modelos de IA chinos de vanguardia.
Sin embargo, los modelos MoE se consideraron técnicamente más exigentes de entrenar y ejecutar. Los resultados de rendimiento autodeclarados por China Telecom para sus modelos TeleChat3 mostraron que, en varias pruebas de referencia, estaban por debajo de los del GPT-OSS-120B de OpenAI, publicado en agosto.
La semana pasada, la Universidad de Tsinghua afirmó que su nuevo modelo de generación de imágenes fue entrenado en chips Huawei, lo que lo convierte en el primer modelo de código abierto desarrollado en una pila de entrenamiento completamente nacional en lograr puntajes líderes en la industria en generación de imágenes.
Zhipu AI, con sede en Pekín, fue incluida en la lista negra de Washington el pasado enero. Estados Unidos ha incluido a varias empresas tecnológicas chinas, como Huawei e iFlytek, en listas negras de control de exportaciones. Esto les impide recibir chips, herramientas de semiconductores y otra tecnología avanzada de origen estadounidense.
Los investigadores de Ant Group, una empresa fintech filial de Alibaba Group Holding, también afirmaron haber entrenado con éxito un modelo MoE de 300 mil millones de parámetros sin GPU premium. Sin embargo, no especificaron si utilizaron exclusivamente chips de diseño nacional.
Mientras tanto, según informa Cryptopolitan , un índice similar al Nasdaq de acciones tecnológicas chinas locales ha subido casi un 13% tan solo este mes. Un segundo indicador, trac Cryptopolitan tecnológicas chinas que cotizan en Hong Kong, han subido un 6%, y ambas están dejando atrás al Nasdaq 100.
Las acciones de Nvidia se desploman mientras Pekín declara su autosuficiencia
Nvidia afirmó que sus GPU avanzadas y sus plataformas de aprendizaje automático eran las mejores herramientas del mundo para entrenar modelos MoE a gran escala. Sin embargo, Pekín ha priorizado la autosuficiencia en toda la pila de IA para los próximos cinco años debido a las restricciones comerciales estadounidenses que impiden el acceso de las empresas chinas a chips estadounidenses avanzados.
El gobierno estadounidense autorizó recientemente a Nvidia a vender el H200, su segundo chip más potente, a China. Sin embargo, China decidió bloquear los envíos de chips avanzados. Cryptopolitan informó que Pekín podría estar considerando imponer restricciones para impulsar el desarrollo local de chips o fortalecer su posición negociadora con EE. UU.
Como resultado, los proveedores suspendieron la producción de componentes H200 tras el bloqueo. Nvidia esperaba más de un millón de pedidos de clientes chinos, y los proveedores se preparaban para las entregas en marzo, pero, según informes, las autoridades aduaneras denegaron la entrada de los chips.
Las acciones de Nvidia han caído aproximadamente un 3% desde entonces tras los informes. Según los analistas, Nvidia se enfrenta a un claro riesgo. Si China continúa bloqueando los envíos de H200, la acción podría romper un soporte clave a corto plazo. Si disminuyen las aprobaciones, el impulso podría ser rápido, pero la incertidumbre política es un factor clave.
Por otro lado, otros fabricantes de chips mostraron resultados dispares: AMD subió un 1,7%, Intel cayó un 2,8% y el S&P 500 ETF SPY bajó aproximadamente un 0,1%. Mientras tanto, los analistas del mercado están pendientes de los resultados trimestrales de NVDA, que se publicarán el 25 de febrero, y de cualquier nuevo detalle sobre su situación exportadora a China.

