Después de experimentar “problemas técnicos persistentes” con los chips Ascend de Huawei, DeepSeek ha retrasado el lanzamiento de su modelo R2 AI.
El gigante chino de inteligencia artificial está experimentando retrasos después de que las autoridades locales le animaran a utilizar sistemas nacionales para sus productos.
Se retrasa el lanzamiento del modelo de inteligencia artificial DeepSeek R2
La empresa china de inteligencia artificial DeepSeek ha pospuesto el lanzamiento de su último modelo de IA después de encontrar desafíos técnicos persistentes con los procesadores Ascend de Huawei.
Las autoridades chinas habían alentado a DeepSeek a utilizar chips de Huawei en lugar de productos Nvidia fabricados en Estados Unidos después del exitoso lanzamiento de su modelo R1 en enero, pero la compañía se topó con problemas importantes durante la fase de entrenamiento de su modelo R2.
Según personas familiarizadas con el asunto, estos problemas obligaron a DeepSeek a confiar en los chips Nvidia para el entrenamiento, mientras que utilizaba los chips Ascend de Huawei para la inferencia.
Los expertos de la industria dicen que los chips chinos, incluido el de Huawei, sufren una conectividad entre chips más lenta, limitaciones de software y problemas de estabilidad en comparación con los productos de Nvidia.
Huawei envió un equipo de ingenieros a las oficinas de DeepSeek para ayudar a adaptar el modelo a sus chips, pero incluso con soporte en el sitio, la empresa emergente no pudo completar una prueba de capacitación exitosa en el hardware Ascend, dijeron las fuentes .
DeepSeek había planeado lanzar el modelo R2 en mayo, pero debido a que el chip Ascend enfrenta problemas de rendimiento, el lanzamiento se ha retrasado.
Desafíos para el impulso de DeepSeek
Los retrasos en el lanzamiento de R2 se ven agravados por un progreso más lento de lo esperado en el etiquetado de datos para las capacidades actualizadas del modelo, según una persona familiarizada con el asunto.
Aunque algunos informes de los medios de comunicación chinos sugieren que el nuevo modelo podría lanzarse en las próximas semanas, el fundador de DeepSeek, Liang Wenfeng, ha expresado su insatisfacción con su progreso interno, instando al equipo a tomarse el tiempo necesario para producir un modelo capaz de mantener la ventaja competitiva de la empresa.
Mientras tanto, la competencia ha seguido ganando terreno. Ritwik Gupta, investigador de IA de la Universidad de California, Berkeley, afirmó que muchos desarrolladores en China han recurrido al modelo Qwen3 de Alibaba , que describió como potente y flexible.
Gupta señaló que Qwen3 adoptó algunas de las innovaciones centrales de DeepSeek, como un algoritmo de entrenamiento que permite capacidades de razonamiento, pero las hizo más eficientes en su implementación.
Gupta, quien monitorea el ecosistema de inteligencia artificial de Huawei, dijo que la plataforma Ascend está experimentando “dolores de crecimiento”, pero predijo una mejora eventual.
“Que no veamos modelos líderes entrenados en Huawei hoy no significa que no vaya a suceder en el futuro”, afirmó. “Es cuestión de tiempo”
Nvidia, actor central en las tensiones tecnológicas entre Estados Unidos y China, acordó recientemente ceder al gobierno estadounidense una parte de sus ingresos relacionados con China a cambio de reanudar las ventas de sus chips H2O a clientes chinos. La compañía enfatizó la importancia de mantener el acceso a los desarrolladores chinos, advirtiendo que «ceder mercados y desarrolladores enteros solo perjudicaría la seguridad económica y nacional de Estados Unidos»
Foto de 