La última actualización de inteligencia artificial de DeepSeek desafía el modelo Qwen3 de Alibaba y el o3 de OpenAI

Por

Shummas Humayun

Lectura de 2 minutos. 30 de mayo de 2025.

La última actualización de inteligencia artificial de DeepSeek desafía el modelo Qwen3 de Alibaba y el modelo o3 de OpenAI.

Foto de Solen Feyissa en Unsplash.

DeepSeek lanzó R1-0528 como un importante impulso a su modelo R1 después de que Qwen3 de Alibaba lo superara.
R1-0528 ahora coincide con modelos de grandes empresas tecnológicas como OpenAI o3, o4-mini y Gemini 2.5-Pro de Google.
El equipo destiló la cadena de pensamiento de R1-0528 en una versión base Qwen3 8B más pequeña que supera al original en un 10%.

DeepSeek ha lanzado R1-0528, una importante actualización del modelo de razonamiento R1 de la startup china, publicado en enero. La actualización llegó justo un mes después de que Qwen3 de Alibaba Group Holding superara al DeepSeek R1 original en LiveBench, un banco de pruebas en línea para modelos de inteligencia artificial de código abierto.

El modelo R1-0528 mejorado de DeepSeek ahora se sitúa a la altura de los modelos líderes de IA de OpenAI y Google en rendimiento. Este regreso demuestra la rapidez con la que las grandes empresas tecnológicas chinas, así como las nuevas, se esfuerzan por mejorar sus herramientas de IA.

En su comunicado, DeepSeek afirmó que el R1-0528 muestra mejores habilidades de razonamiento y escritura creativa. La actualización también ofrece unatroncapacidad de codificación. Y lo más importante, la compañía afirma que el modelo ahora produce un 50 % menos de alucinaciones

DeepSeek explicó que las mejoras se deben a la potencia de procesamiento adicional invertida durante la fase posterior al entrenamiento, cuando los ingenieros perfeccionan un modelo tras el proceso de entrenamiento principal. Durante esta fase, los ingenieros buscan aumentar la eficiencia del modelo y mejorar su precisión y seguridad.

R1-0528 ahora se ubica justo detrás de o3 y o4-mini de OpenAI

En LiveCodeBench, que mide el rendimiento de los modelos de IA, R1-0528 se sitúa ahora justo por detrás de los modelos o4-mini y o3 de OpenAI.

“La última actualización de DeepSeek es más aguda en razonamiento,tronfuerte en matemáticas y código, y se acerca a modelos de primer nivel como Gemini y O3”, dijo Adina Yakefu, investigadora de IA en Hugging Face.

Agregó que la nueva versión muestra “mejoras importantes en la inferencia y la reducción de alucinaciones” y demuestra que la empresa emergente no solo está poniéndose al día sino que está compitiendo activamente.

El rápido progreso se produjo después de que Washington restringiera las exportaciones de chips avanzados y otras tecnologías a China. Sin embargo, las empresas chinas siguen perfeccionando sus sistemas. A principios de este mes, Baidu y Tencent describieron cómo están logrando que sus modelos funcionen con mayor eficiencia a pesar del acceso limitado a semiconductores de vanguardia.

El director ejecutivo de Nvidia, Jensen Huang, criticó el miércoles los controles de exportación. «Estados Unidos ha basado su política en la suposición de que China no puede fabricar chips de IA», declaró. «Esa suposición siempre fue cuestionable, y ahora es claramente errónea. La pregunta no es si China tendrá IA. Ya la tiene»

DeepSeek aumentó el rendimiento del modelo Qwen3 8B de Alibaba en un 10%

DeepSeek también afirmó haber adaptado los pasos de razonamiento utilizados en R1-0528 al Qwen3 8B de Alibaba. Este proceso generó un modelo nuevo y más pequeño que superó el rendimiento de Qwen3 en más del 10%, según la compañía. Además, el modelo era 30 veces más pequeño.

“Creemos que la cadena de pensamiento de DeepSeek-R1-0528 tendrá una importancia significativa para la investigación académica sobre modelos de razonamiento y el trabajo industrial con modelos pequeños”, afirmó la firma.

Según Reuters, un representante de DeepSeek declaró en un grupo de WeChat que el cambio era una "actualización de prueba menor" que ya estaba disponible para pruebas públicas. Ante la creciente competencia, Google ha rebajado algunos niveles de acceso a Gemini, mientras que OpenAI ha lanzado el modelo o3 Mini, de menor coste.

Si estás leyendo esto, ya llevas ventaja. Mantente al día con nuestro boletín informativo.

Alibaba CNY DeepSeek OpenAI USD

Comparte este artículo