ÚLTIMAS NOTICIAS

Hace 31 segundos Reflexiones de la industria
El BYUSDT de Bybit ofrece una oportunidad de doble rentabilidad para los operadores en el lanzamiento de Bybit TradFi

Hace 37 minutos Reflexiones del sector
Bitcoin necesita billones en nuevo capital, pero las instituciones están persiguiendo la IA en su lugar

Hace 41 minutos Noticias
La Comisión de Supervisión Financiera de Corea del Sur investiga a los grandes inversores en criptomonedas conocidas como "kimchi coins" mediante manipulación de precios

Noticias de hace 2 horas

SELECCIONADO PARA TI

Qwen3 de Alibaba desbanca a R1 de DeepSeek y ahora lidera los modelos de IA de código abierto

Por

Florencia Muchai

3 minutos de lectura 6 de mayo de 2025

La familia de modelos de IA Qwen3 de Alibaba ha superado al R1 de DeepSeek para convertirse en el mejor modelo de código abierto del mundo en áreas como instrucción de idiomas, matemáticas, codificación y análisis de datos.
Qwen3 es económico de usar porque solo cuesta $0,55 por cada millón de tokens para ejecutarse.
Los fabricantes de chips estadounidenses Nvidia e Intel han comenzado a dar soporte a Qwen3.

La nueva familia de modelos de IA Qwen3 de Alibaba ha superado al R1 de DeepSeek y se ha convertido en el mejor modelo de código abierto del mundo. Según informes, Qwen3 superó al R1 en pruebas que miden las capacidades de los modelos de IA de código abierto en áreas como la enseñanza de idiomas, las matemáticas, la programación y el análisis de datos.

La unidad de computación en la nube de Alibaba lanzó la familia Qwen3 la semana pasada. Cuenta con ocho modelos mejorados con entre 600 y 235 mil millones de parámetros. En aprendizaje automático, los parámetros son las variables de un sistema de IA durante su entrenamiento.

Según la LiveBench , una plataforma independientedent prueba grandes modelos de lenguaje, antes de estas nuevas pruebas, el modelo R1 de DeepSeek había sido el mejor modelo de IA de código abierto del mundo desde su lanzamiento en enero. Pero ya no.

Tanto las empresas estadounidenses como las chinas se apresuran a adoptar Qwen 3

El ascenso de Qwen3 en el ranking de LiveBench demuestra la rapidez con la que se está desarrollando la IA en China. La industria tecnológica china ha crecido considerablemente gracias a las herramientas de código abierto. El código abierto de Alibaba ha permitido a otros desarrolladores de software compartir el diseño, corregir enlaces rotos o mejorar la potencia del programa.

Sin embargo, los resultados generales de LiveBench mostraron que Qwen3 no fue tan bueno como o3 de OpenAI, Gemini Pro 2.5 de Google y Claude 3.7 de Anthropic, que son los mejores modelos de IA de código cerrado del mundo. LiveBench afirma que o3-mini high, el modelo de IA más popular de OpenAI, fue el mejor del mundo en general. Microsoft respalda a OpenAI.

Por cada millón de tokens, se necesitan $10 para ejecutar o3. Por otro lado, Qwen3 es más económico, ya que solo cuesta $0.55 por millón de tokens. Dado que Qwen3 es más económico y funciona mejor, muchas empresas afirmaron que respaldarían el nuevo modelo de IA de Alibaba en cuanto saliera al mercado.

Huawei Technologies, Moore Threads, Cambricon Technologies y Hygon Information Technology son empresas de chips que han dicho que apoyarán Qwen3.

Cambricon anunció el martes pasado que había optimizado con éxito Qwen3 para que funcionara rápidamente en sus unidades de procesamiento gráfico. Esto se debió a que los desarrolladores de IA en Filipinas querían chips fabricados en China.

Qwen3 también se utiliza en los servicios de computación en la nube de Hyperbolic y Fireworks.ai, dos empresas de infraestructura de IA. Los fabricantes estadounidenses de chips Nvidia e Intel han comenzado a ofrecer soporte para Qwen3.

Muchos grandes centros de datos en China, como los de Pekín, Shanghái, Hangzhou y las provincias de Hubei, Jilin y el noroeste de Shaanxi, también han anunciado que utilizarán los modelos de IA Qwen de tercera generación de Alibaba. La Red de Supercomputación de China también ha adoptado Qwen3. Esta red conecta más de 20 centros de datos en 20 localidades de 14 provincias.

El director ejecutivo de Anthropic afirma que DeepSeek fue "un poco exagerado"

En un evento empresarial, un cofundador de Anthropic, la empresa creadora de los modelos de IA de Claude, afirmó que DeepSeek todavía está "entre seis y ocho meses por detrás de las empresas estadounidenses de vanguardia". También señaló que el reciente revuelo en torno a la startup china era "quizás un poco exagerado"

DeepSeek captó la atención mundial a finales de diciembre de 2024 y principios de enero de 2025 al compartir dos modelos avanzados de IA de código abierto, V3 y R1. Estos modelos se crearon con una pequeña fracción del coste y la potencia de cálculo que las grandes empresas tecnológicas suelen necesitar para proyectos LLM.

Se desconoce cuándo DeepSeek lanzará la próxima generación de sus modelos. La compañía, con sede en Hangzhou, lanzó discretamente su Prover-V2, con 671 mil millones de parámetros, a finales de abril. Esta actualización se basó en su modelo especializado para el procesamiento de demostraciones matemáticas. Sin embargo, no ha revelado detalles sobre el desarrollo de su tan esperado modelo de razonamiento R2.

Si estás leyendo esto, ya llevas ventaja. Mantente al día con nuestro boletín informativo.

Búsqueda profunda de Alibaba Qwen3

Comparte este artículo

Aviso legal. La información proporcionada no constituye asesoramiento comercial. Cryptopolitanconsultar no se responsabiliza de las inversiones realizadas con base en la información proporcionada en esta página. Recomendamostronencarecidamente realizar una investigación independientedent un profesional cualificado antes de tomar cualquier decisión de inversión.

Florencia Muchai

Florence lleva seis años cubriendo noticias sobre criptomonedas, videojuegos, tecnología e inteligencia artificial. Sus estudios de informática en la Universidad de Ciencia y Tecnología de Meru y su formación en Gestión de Desastres y Diplomacia Internacional en la MMUST le proporcionan una sólida base lingüística, capacidad de observación y habilidades técnicas. Florence ha trabajado en VAP Group y como editora para varios medios especializados en criptomonedas.

ÍNDICE

1. Tanto las empresas estadounidenses como las chinas se apresuran a adoptar Qwen 3

2. El director ejecutivo de Anthropic afirma que DeepSeek fue "un poco exagerado"

Comparte este artículo

MÁS… NOTICIAS

MOSTRAR TODO

5 ingeniosas aplicaciones de ChatGPT y qué debes hacer al respecto

Hace 3 años, el técnico John Palmer

El 93% de los líderes empresariales prefieren soluciones basadas en IA para la gestión de la sostenibilidad de la marca, según Reuters

Hace 3 años, el técnico John Palmer

El ecosistema de inteligencia artificial de Francia

Así apoya Macron el vibrante y productivo ecosistema de IA de Francia

Hace 3 años Tech Glory Kaburu

Bloomberg estima que el mercado de IA generativa alcanzará los 1,3 billones de dólares en 2032

Hace 3 años, Tech Aamir Sheikh

¿Qué es Base? La red de capa 2 Ethereum lanzada por Coinbase

21 de octubre de 2025 Aprende sobre criptomonedas: Guías para principiantes
Dogecoin vs. Bitcoin: Diferencias técnicas clave

20 de octubre de 2025 Aprende sobre criptomonedas: Guías para principiantes
¿Qué es TVL (valor total bloqueado) en criptomonedas?

14 de octubre de 2025 Aprende sobre criptomonedas: Guías para principiantes
¿Cómo leer un documento técnico sobre criptomonedas?

13 de octubre de 2025 Aprende sobre criptomonedas: Guías para principiantes
Ripple vs. XRP vs. XRP Ledger: ¿Cuál es la diferencia?

13 de octubre de 2025 Aprende sobre criptomonedas: Guías para principiantes
¿Qué es una billetera multifirma en criptomonedas?

10 de octubre de 2025 Aprende sobre criptomonedas: Guías para principiantes

CURSO INTENSIVO DE CRIPTOMONEDAS PROFUNDAS

¿Qué criptomonedas pueden hacerte ganar dinero?
Cómo mejorar tu seguridad con una billetera (y cuáles realmente vale la pena usar)
Estrategias de inversión poco conocidas que utilizan los profesionales
Cómo empezar a invertir en criptomonedas (qué plataformas de intercambio usar, las mejores criptomonedas para comprar, etc.)