Qwen3 de Alibaba desbanca a R1 de DeepSeek y ahora lidera los modelos de IA de código abierto

- La familia de modelos de IA Qwen3 de Alibaba ha superado al R1 de DeepSeek para convertirse en el mejor modelo de código abierto del mundo en áreas como instrucción de idiomas, matemáticas, codificación y análisis de datos.
- Qwen3 es económico de usar porque solo cuesta $0,55 por cada millón de tokens para ejecutarse.
- Los fabricantes de chips estadounidenses Nvidia e Intel han comenzado a dar soporte a Qwen3.
La nueva familia de modelos de IA Qwen3 de Alibaba ha superado al R1 de DeepSeek y se ha convertido en el mejor modelo de código abierto del mundo. Según informes, Qwen3 superó al R1 en pruebas que miden las capacidades de los modelos de IA de código abierto en áreas como la enseñanza de idiomas, las matemáticas, la programación y el análisis de datos.
La unidad de computación en la nube de Alibaba lanzó la familia Qwen3 la semana pasada. Cuenta con ocho modelos mejorados con entre 600 y 235 mil millones de parámetros. En aprendizaje automático, los parámetros son las variables de un sistema de IA durante su entrenamiento.
Según la LiveBench , una plataforma independientedent prueba grandes modelos de lenguaje, antes de estas nuevas pruebas, el modelo R1 de DeepSeek había sido el mejor modelo de IA de código abierto del mundo desde su lanzamiento en enero. Pero ya no.
Tanto las empresas estadounidenses como las chinas se apresuran a adoptar Qwen 3
El ascenso de Qwen3 en el ranking de LiveBench demuestra la rapidez con la que se está desarrollando la IA en China. La industria tecnológica china ha crecido considerablemente gracias a las herramientas de código abierto. El código abierto de Alibaba ha permitido a otros desarrolladores de software compartir el diseño, corregir enlaces rotos o mejorar la potencia del programa.
Sin embargo, los resultados generales de LiveBench mostraron que Qwen3 no fue tan bueno como o3 de OpenAI, Gemini Pro 2.5 de Google y Claude 3.7 de Anthropic, que son los mejores modelos de IA de código cerrado del mundo. LiveBench afirma que o3-mini high, el modelo de IA más popular de OpenAI, fue el mejor del mundo en general. Microsoft respalda a OpenAI.
Por cada millón de tokens, se necesitan $10 para ejecutar o3. Por otro lado, Qwen3 es más económico, ya que solo cuesta $0.55 por millón de tokens. Dado que Qwen3 es más económico y funciona mejor, muchas empresas afirmaron que respaldarían el nuevo modelo de IA de Alibaba en cuanto saliera al mercado.
Huawei Technologies, Moore Threads, Cambricon Technologies y Hygon Information Technology son empresas de chips que han dicho que apoyarán Qwen3.
Cambricon anunció el martes pasado que había optimizado con éxito Qwen3 para que funcionara rápidamente en sus unidades de procesamiento gráfico. Esto se debió a que los desarrolladores de IA en Filipinas querían chips fabricados en China.
Qwen3 también se utiliza en los servicios de computación en la nube de Hyperbolic y Fireworks.ai, dos empresas de infraestructura de IA. Los fabricantes estadounidenses de chips Nvidia e Intel han comenzado a ofrecer soporte para Qwen3.
Muchos grandes centros de datos en China, como los de Pekín, Shanghái, Hangzhou y las provincias de Hubei, Jilin y el noroeste de Shaanxi, también han anunciado que utilizarán los modelos de IA Qwen de tercera generación de Alibaba. La Red de Supercomputación de China también ha adoptado Qwen3. Esta red conecta más de 20 centros de datos en 20 localidades de 14 provincias.
El director ejecutivo de Anthropic afirma que DeepSeek fue "un poco exagerado"
En un evento empresarial, un cofundador de Anthropic, la empresa creadora de los modelos de IA de Claude, afirmó que DeepSeek todavía está "entre seis y ocho meses por detrás de las empresas estadounidenses de vanguardia". También señaló que el reciente revuelo en torno a la startup china era "quizás un poco exagerado"
DeepSeek captó la atención mundial a finales de diciembre de 2024 y principios de enero de 2025 al compartir dos modelos avanzados de IA de código abierto, V3 y R1. Estos modelos se crearon con una pequeña fracción del coste y la potencia de cálculo que las grandes empresas tecnológicas suelen necesitar para proyectos LLM.
Se desconoce cuándo DeepSeek lanzará la próxima generación de sus modelos. La compañía, con sede en Hangzhou, lanzó discretamente su Prover-V2, con 671 mil millones de parámetros, a finales de abril. Esta actualización se basó en su modelo especializado para el procesamiento de demostraciones matemáticas. Sin embargo, no ha revelado detalles sobre el desarrollo de su tan esperado modelo de razonamiento R2.
No te limites a leer noticias sobre criptomonedas. Entiéndelas. Suscríbete a nuestro boletín. Es gratis.
Aviso legal. La información proporcionada no constituye asesoramiento comercial. Cryptopolitanconsultar no se responsabiliza de las inversiones realizadas con base en la información proporcionada en esta página. Recomendamostronencarecidamente realizar una investigación independientedent un profesional cualificado antes de tomar cualquier decisión de inversión.

Florencia Muchai
Florence es una escritora de finanzas con 6 años de experiencia cubriendo criptomonedas, videojuegos, tecnología e inteligencia artificial. Estudió Informática en la Universidad de Ciencia y Tecnología de Meru y Gestión de Desastres y Diplomacia Internacional en la MMUST. Florence ha trabajado en VAP Group y como editora para varios medios de comunicación especializados en criptomonedas.
CURSO
- ¿Qué criptomonedas pueden hacerte ganar dinero?
- Cómo mejorar tu seguridad con una billetera (y cuáles realmente vale la pena usar)
- Estrategias de inversión poco conocidas que utilizan los profesionales
- Cómo empezar a invertir en criptomonedas (qué plataformas de intercambio usar, las mejores criptomonedas para comprar, etc.)














