El nuevo modelo de DeepSeek supera a su buque insignia en el salto de la IA

- DeepSeek lanzó una nueva actualización V3.1 con mayor eficiencia de pensamiento.
- La nueva actualización de la startup supera al RI en varios puntos de referencia.
- Los analistas de mercado esperaban que DeepSeek lanzara el sucesor de R1 a principios de este año.
La startup china DeepSeek presentó una nueva actualización, afirmando que supera al ampliamente reconocido R1 en las principales pruebas de rendimiento. En una publicación de WeChat del jueves, la empresa de IA confirmó que la nueva versión del modelo, V3.1, ofrece respuestas más rápidas a las consultas y marca su entrada en el desarrollo de agentes de IA.
DeepSeek agregó que el modelo admite una arquitectura de razonamiento híbrido, con modos de pensamiento y de no pensamiento, capacidades de agente mejoradas y untronrendimiento en el uso de herramientas y la ejecución de tareas.
DeepSeek proporciona un botón de “Pensamiento profundo” para cambiar entre modos
Hasta el momento, la aplicación y el sitio web oficiales de DeepSeek ya se han actualizado a la versión 3.1, lo que permite a los usuarios alternar entre los modos de pensamiento y no pensamiento mediante el botón "Deep Thinking", de forma similar a como funcionan los modelos híbridos de Anthropic, como Opus y Sonnet.
Según se informa, el modelo V3.1 también obtiene mejores resultados en benchmarks como SWE y Terminal-Bench, así como en eficiencia de pensamiento, que el R1. Además, según Análisis Artificial, el modelo alcanzó 60 puntos en su índice de inteligencia en modo de razonamiento, justo por encima de los 59 obtenidos por el R1. Aun así, la arquitectura subyacente se mantiene, con 671 mil millones de parámetros totales y 37 mil millones de parámetros activos.
A pesar de su mayor eficiencia, también utiliza ligeramente menos tokens que R1 en el modo de razonamiento. Sin embargo, el nuevo modelo se sitúa ligeramente por detrás del último modelo y del modelo de razonamiento de código abierto de OpenAI, GPT-OSS, en cuanto a rendimiento. Además, carece de la capacidad de llamar a funciones en el modo de razonamiento, lo que se considera una limitación importante en los flujos de trabajo basados en agentes.
La startup anunció el nuevo modelo el martes, aunque en ese momento solo estaba disponible en Hugging Face. En un comunicado aparte, se añadió que la versión se había adaptado para funcionar con chips de inteligencia artificial de última generación fabricados en China.
Ahora, la compañía presentó un nuevo plan de precios para su versión V3 mejorada. El plan aumenta algunos cargos, elimina los descuentos nocturnos y reduce los costos en ciertas aplicaciones, a partir del 6 de septiembre.
DeepSeek fijó el precio de su API de entrada en 0,07 $ por millón de tokens para aciertos de caché y 0,56 $ por fallos de caché, con un precio de 1,68 $ por millón para los tokens de salida. Estas tarifas son muy inferiores a las de la competencia: Gemini 2.5 Pro cuesta 10 $ por millón de tokens de salida (15 $ para indicaciones más largas), GPT-5 de OpenAI también cuesta 10 $ y Claude Opus 4.1 de Anthropic llega hasta los 75 $.
Los analistas esperaban que DeepSeek lanzara el sucesor de R1 a principios de este año
DeepSeek conmocionó por primera vez a Silicon Valley con el lanzamiento de su potente y económico modelo de IA R1 en enero. Desde entonces, el modelo se ha mantenido a la vanguardia del creciente impulso de la IA en China, desafiando a empresas estadounidenses como OpenAI.
Sin embargo, los analistas del mercado aún esperan la continuación del R1, un posible modelo R2, cuyo lanzamiento muchos anticipaban a principios de este año. Informes locales han insinuado que el retraso en el lanzamiento se debe a la insistencia de su fundador, Liang Wenfeng, en perfeccionar el modelo. Al mismo tiempo, gestiona su rentable negocio High-Flyer Asset Management.
Tal y como informó previamente Cryptopolitan, DeepSeek ha retrasado el lanzamiento de su modelo de IA R2 tras experimentar problemas técnicos persistentes con los procesadores Ascend de Huawei. Tras el éxito de su modelo R1 en enero, las autoridades chinas animaron a DeepSeek a adoptar chips de Huawei en lugar de los productos Nvidia fabricados en Estados Unidos. Sin embargo, la compañía se topó con problemas importantes durante la fase de entrenamiento de su modelo R2.
Fuentes familiarizadas con el asunto afirmaron que DeepSeek dependía de chips Nvidia para el entrenamiento, mientras que los procesadores Ascend de Huawei solo se usaban para la inferencia. Expertos del sector señalan que los chips chinos, incluidos los de Huawei, suelen estar por detrás de los de Nvidia en cuanto a conectividad entre chips, compatibilidad de software y estabilidad general.
Huawei envió ingenieros a las oficinas de DeepSeek para ayudar a adaptar el modelo. Sin embargo, la startup no pudo completar con éxito una prueba de entrenamiento con el hardware Ascend, ni siquiera con asistencia in situ. El lanzamiento del modelo R2, previsto inicialmente para mayo, se ha pospuesto debido a estos problemas de hardware.
Si bien algunos medios de comunicación chinos especulan que el nuevo modelo podría lanzarse en las próximas semanas, el fundador de DeepSeek, Liang Wenfeng, ha expresado su frustración interna por su progreso e instó al equipo a tomarse el tiempo necesario para desarrollar un modelo que preserve la ventaja competitiva de la empresa.
Mientras tanto, los pesos pesados de la industria, como Alibaba y Tencent, siguen lanzando actualizaciones rápidamente, y los modelos Qwen de Alibaba estántraca un número particularmentetronde seguidores.
Las mentes más brillantes del mundo de las criptomonedas ya leen nuestro boletín. ¿Te apuntas? ¡ Únete!
Descargo de responsabilidad. La información proporcionada no constituye asesoramiento financiero. Cryptopolitande no se responsabiliza de las inversiones realizadas con base en la información de esta página. Recomendamostrondentdentdentdentdentdentdentdent inversión.
CURSO
- ¿Qué criptomonedas pueden hacerte ganar dinero?
- Cómo mejorar tu seguridad con una billetera (y cuáles realmente vale la pena usar)
- Estrategias de inversión poco conocidas que utilizan los profesionales
- Cómo empezar a invertir en criptomonedas (qué plataformas de intercambio usar, las mejores criptomonedas para comprar, etc.)















