DeepSeek añade visión mientras la cadena de suministro de chips de China demuestra que finalmente puede mantenerse al día

- DeepSeek incorporó la visión artificial a su chatbot y lanzó un nuevo modelo estrella, el V4.
- Por primera vez, cuatro fabricantes chinos de chips igualaron la compatibilidad de Nvidia en el día del lanzamiento.
- La competencia en inteligencia artificial está pasando del rendimiento del modelo a la independencia en cuanto a costes y hardware.
Una empresa china de inteligencia artificial ha añadido el reconocimiento de imágenes y vídeos a su chatbot principal.
Al mismo tiempo, los fabricantes locales de chips demostraron que ahora pueden igualar el rápido apoyo al lanzamiento que solía ser un punto fuerte de Estados Unidos.
DeepSeek, una empresa con sede en Hangzhou, añadió discretamente una nueva función llamada "modo de reconocimiento de imágenes" a su plataforma de chat. Este nuevo modo se suma a otros dos que la compañía lanzó a principios de este mes: "experto" y "flash"
Esta nueva función permite que el chatbot entienda fotos y vídeos, no solo texto.
Esto lo equipara a otros importantes chatbots de IA que ofrecen capacidades similares desde hace algún tiempo.
Chen Xiaokang, quien dirige el equipo multimodal de DeepSeek, dijo que la herramienta se probó primero con un pequeño grupo de usuarios tanto en el sitio web como en la aplicación móvil.
Chen Deli, investigador sénior de la empresa, celebró el lanzamiento con una breve publicación que hacía referencia al logotipo de la compañía: "La pequeña ballena ahora puede ver".
La función de imagen y vídeo se lanzó pocos días después de que DeepSeek publicara una vista previa de su nuevo modelo insignia, DeepSeek-V4, y pusiera a disposición de cualquiera los pesos del modelo para su descarga y uso.
V4 no es un solo modelo, sino dos. El primero, DeepSeek-V4-Pro, tiene 1,6 billones de parámetros y está diseñado para tareas difíciles que requieren razonamiento complejo y flujos de trabajo automatizados de varios pasos.
El segundo modelo, DeepSeek-V4-Flash, está diseñado para gestionar un gran número de solicitudes a un menor coste. Ambos modelos admiten una ventana de contexto de un millón de tokens.
También utilizan un diseño de atención híbrido que, según la empresa, reduce la potencia de cálculo y la memoria necesarias durante la inferencia.
Los fabricantes chinos de chips alcanzan un nuevo hito
Lo que llamó la atención de muchos observadores de la industria no fue solo el modelo en sí, sino lo que sucedió el día de su lanzamiento.
Cuatro empresas chinas de chips, Huawei Ascend, Cambricon, Hygon Information y Moore Threads, confirmaron que su hardware funcionaba perfectamente con la versión V4 desde el primer día de su lanzamiento.
Este tipo de soporte el mismo día de su lanzamiento, en el que un nuevo modelo funciona sin problemas en chips que no son de NVIDIA en lugar de semanas o meses después, había sido casi imposible fuera del ecosistema de NVIDIA.
Los chips Ascend de Huawei, incluidos el A2, el A3 y el 950, son compatibles con V4-Pro y V4-Flash.
La compañía afirmó que su chip Ascend 950 utiliza procesos de computación fusionados y flujos de procesamiento paralelo para acelerar la inferencia.
Cambricon finalizó su adaptación utilizando el marco de inferencia de código abierto vLLM y compartió su código en GitHub.
Hygon afirmó haber llevado a cabo una profunda optimización del modelo en su plataforma DCU para crear un proceso fluido desde el lanzamiento del modelo hasta su uso real.
Moore Threads colaboró con la Academia de Inteligencia Artificial de Pekín para ejecutar V4 en su tarjeta MTT S5000 utilizando la pila de software FlagOS.
Según los expertos del sector, este lanzamiento coordinado representa un cambio real.
Durante años, los chips fabricados fuera del ecosistema de Nvidia tardaban meses en ser compatibles con un nuevo modelo importante. Lograr que ocho conjuntos de chips nacionales diferentes funcionen desde el primer día es un hito significativo.
El panorama general: coste e independencia para Deepseek
Los observadores creen que el significado más importante de este lanzamiento es que DeepSeek ha demostrado que puede ofrecer inteligencia artificial de alto nivel sin depender del hardware occidental.
Al lograr que sus modelos funcionen de forma nativa en varios chips chinos simultáneamente, reduce el riesgo derivado de las restricciones a la exportación que han impedido a las empresas chinas acceder a los procesadores estadounidenses más potentes.
El costo también es importante. DeepSeek se ha esforzado por mantener bajo el costo de ejecución de sus modelos. Esto facilita que las empresas desarrollen sistemas automatizados sin incurrir en costos informáticos muy elevados.
De esta forma, las mejoras y el lanzamiento de Deepseek no se centran principalmente en un avance técnico concreto, sino más bien en la convergencia de toda una cadena de suministro.
A partir de este lanzamiento, la cuestión de quién lidera en IA parece estar desplazándose de quién construye el modelo más inteligente, hacia quién puede mantener todo el sistema funcionando de forma económica edenta largo plazo.
Las mentes más brillantes del mundo de las criptomonedas ya leen nuestro boletín. ¿Te apuntas? ¡ Únete!

Hania Humayun
Hania se unió a Cryptopolitan con una larga trayectoria en el análisis de finanzas, tendencias económicas y mercados de predicción. Cubrió temas de tecnología emergente, IA y fintech. La experiencia de Hania como arquitecta licenciada ha contribuido a su dinamismo y precisión en la redacción de noticias. Se graduó del National College of Arts en Lahore con un título en Arquitectura
- ¿Qué criptomonedas pueden hacerte ganar dinero?
- Cómo mejorar tu seguridad con una billetera (y cuáles realmente vale la pena usar)
- Estrategias de inversión poco conocidas que utilizan los profesionales
- Cómo empezar a invertir en criptomonedas (qué plataformas de intercambio usar, las mejores criptomonedas para comprar, etc.)















