Your bank is using your money. You’re getting the scraps.WATCH FREE

DeepSeek añade visión mientras la cadena de suministro de chips de China demuestra que finalmente puede mantenerse al día

En esta publicación:

  • DeepSeek incorporó la visión artificial a su chatbot y lanzó un nuevo modelo estrella, el V4.
  • Por primera vez, cuatro fabricantes chinos de chips igualaron la compatibilidad de Nvidia en el día del lanzamiento.
  • La competencia en inteligencia artificial está pasando del rendimiento del modelo a la independencia en cuanto a costes y hardware.

Una empresa china de inteligencia artificial ha añadido el reconocimiento de imágenes y vídeos a su chatbot principal.

Al mismo tiempo, los fabricantes locales de chips demostraron que ahora pueden igualar el rápido apoyo al lanzamiento que solía ser un punto fuerte de Estados Unidos.

DeepSeek, una empresa con sede en Hangzhou, añadió discretamente una nueva función llamada "modo de reconocimiento de imágenes" a su plataforma de chat. Este nuevo modo se suma a otros dos que la compañía lanzó a principios de este mes: "experto" y "flash"

Esta nueva función permite que el chatbot entienda fotos y vídeos, no solo texto.

Esto lo equipara a otros importantes chatbots de IA que ofrecen capacidades similares desde hace algún tiempo.

Chen Xiaokang, quien dirige el equipo multimodal de DeepSeek, dijo que la herramienta se probó primero con un pequeño grupo de usuarios tanto en el sitio web como en la aplicación móvil.

Chen Deli, investigador sénior de la empresa, celebró el lanzamiento con una breve publicación que hacía referencia al logotipo de la compañía: "La pequeña ballena ahora puede ver".

La función de imagen y vídeo se lanzó pocos días después de que DeepSeek publicara una vista previa de su nuevo modelo insignia, DeepSeek-V4, y pusiera a disposición de cualquiera los pesos del modelo para su descarga y uso.

V4 no es un solo modelo, sino dos. El primero, DeepSeek-V4-Pro, tiene 1,6 billones de parámetros y está diseñado para tareas difíciles que requieren razonamiento complejo y flujos de trabajo automatizados de varios pasos.

Véase también:  La Asociación de Editores insta a reforzar la legislación británica sobre propiedad intelectual antes de la Cumbre Mundial de IA.

El segundo modelo, DeepSeek-V4-Flash, está diseñado para gestionar un gran número de solicitudes a un menor coste. Ambos modelos admiten una ventana de contexto de un millón de tokens.

También utilizan un diseño de atención híbrido que, según la empresa, reduce la potencia de cálculo y la memoria necesarias durante la inferencia.

Los fabricantes chinos de chips alcanzan un nuevo hito

Lo que llamó la atención de muchos observadores de la industria no fue solo el modelo en sí, sino lo que sucedió el día de su lanzamiento.

Cuatro empresas chinas de chips, Huawei Ascend, Cambricon, Hygon Information y Moore Threads, confirmaron que su hardware funcionaba perfectamente con la versión V4 desde el primer día de su lanzamiento.

Este tipo de soporte el mismo día de su lanzamiento, en el que un nuevo modelo funciona sin problemas en chips que no son de NVIDIA en lugar de semanas o meses después, había sido casi imposible fuera del ecosistema de NVIDIA.

Los chips Ascend de Huawei, incluidos el A2, el A3 y el 950, son compatibles con V4-Pro y V4-Flash.

La compañía afirmó que su chip Ascend 950 utiliza procesos de computación fusionados y flujos de procesamiento paralelo para acelerar la inferencia.

Cambricon finalizó su adaptación utilizando el marco de inferencia de código abierto vLLM y compartió su código en GitHub.

Hygon afirmó haber llevado a cabo una profunda optimización del modelo en su plataforma DCU para crear un proceso fluido desde el lanzamiento del modelo hasta su uso real.

Moore Threads colaboró ​​con la Academia de Inteligencia Artificial de Pekín para ejecutar V4 en su tarjeta MTT S5000 utilizando la pila de software FlagOS.

Véase también:  Nvidia afirma haber corregido fallos en sus chips de IA Blackwell.

Según los expertos del sector, este lanzamiento coordinado representa un cambio real.

Durante años, los chips fabricados fuera del ecosistema de Nvidia tardaban meses en ser compatibles con un nuevo modelo importante. Lograr que ocho conjuntos de chips nacionales diferentes funcionen desde el primer día es un hito significativo.

El panorama general: coste e independencia para Deepseek

Los observadores creen que el significado más importante de este lanzamiento es que DeepSeek ha demostrado que puede ofrecer inteligencia artificial de alto nivel sin depender del hardware occidental.

Al lograr que sus modelos funcionen de forma nativa en varios chips chinos simultáneamente, reduce el riesgo derivado de las restricciones a la exportación que han impedido a las empresas chinas acceder a los procesadores estadounidenses más potentes.

El costo también es importante. DeepSeek se ha esforzado por mantener bajo el costo de ejecución de sus modelos. Esto facilita que las empresas desarrollen sistemas automatizados sin incurrir en costos informáticos muy elevados.

De esta forma, las mejoras y el lanzamiento de Deepseek no se centran principalmente en un avance técnico concreto, sino más bien en la convergencia de toda una cadena de suministro.

A partir de este lanzamiento, la cuestión de quién lidera en IA parece estar desplazándose de quién construye el modelo más inteligente, hacia quién puede mantener todo el sistema funcionando de forma económica edenta largo plazo.

Si estás leyendo esto, ya llevas ventaja. Mantente al día con nuestro boletín informativo.

Compartir enlace:

Descargo de responsabilidad. La información proporcionada no constituye asesoramiento financiero. Cryptopolitande no se responsabiliza de las inversiones realizadas con base en la información de esta página. Recomendamostrondentdentdentdentdentdentdentdent inversión.

Lo más leído

Cargando artículos más leídos...

Manténgase al tanto de las noticias sobre criptomonedas, reciba actualizaciones diarias en su bandeja de entrada

Selección del editor

Cargando artículos de Elección del editor...

- El boletín de criptomonedas que te mantiene a la vanguardia -

Los mercados se mueven rápido.

Nos movemos más rápido.

Suscríbete a Cryptopolitan Daily y recibe información sobre criptomonedas actualizada, precisa y relevante directamente en tu bandeja de entrada.

Únete ahora y
no te pierdas ningún movimiento.

Entra. Infórmate.
Adelántate.

Suscríbete a CryptoPolitan