Alibaba anunció una nueva versión de su modelo de inteligencia artificial Qwen 2.5 el miércoles, el primer día del Año Nuevo Lunar en China. La empresa tecnológica china afirmó que Qwen 2.5 superó al aclamado DeepSeek-V3.
Alibaba publicó en su cuenta oficial de WeChat que Qwen 2.5-Max superó a casi todos los modelos de IA, incluyendo GPT-40, DeepSeek-V3 y Llama-3.1-405B. Esta noticia de la compañía se produjo tras el lanzamiento del asistente de IA de DeepSeek (DeepSeek-V3) el 10 de enero y el lanzamiento de su modelo R1 el 20 de enero.
El reciente lanzamiento del modelo R1 de DeepSeek provocó una fuerte conmoción en las acciones de las empresas tecnológicas estadounidenses, especialmente Nvidia. DeepSeek afirmó haber creado el modelo R1 con tan solo 6 mil millones de dólares, en comparación con los miles de millones de dólares que otras empresas tecnológicas estadounidenses invierten en el sector de la IA.
La compañía tecnológica también generó cierto impulso en su propio mercado nacional, con otras empresas tecnológicas chinas apresurándose a lanzar actualizaciones de sus modelos de IA. Un informe de Reuters reveló que dos días después del lanzamiento de DeepSeek-R1, ByteDance también lanzó una actualización de su modelo insignia de IA. La empresa matriz de TikTok argumentó que supera a o1 de OpenAI, respaldado por Microsoft, en pruebas que miden la capacidad de los modelos de IA para comprender y responder a instrucciones complejas.
Alibaba lanza su nueva versión del modelo de IA Qwen2.5
El auge de DeepSeek V3 ha trac la atención de toda la comunidad de IA hacia los modelos MoE a gran escala. Simultáneamente, hemos estado desarrollando Qwen2.5-Max, un gran LLM MoE preentrenado con datos masivos y posentrenado con recetas SFT y RLHF seleccionadas. Logra un rendimiento competitivo… pic.twitter.com/oHVl16vfje
— Qwen (@Alibaba_Qwen) 28 de enero de 2025
La compañía tecnológica china anunció el lunes que el nuevo modelo de IA, Qwen2.5-VL, podría realizar diversas tareas de análisis de texto e imágenes. La firma también afirmó que Qwen2.5 era similar al modelo que impulsa el recientemente lanzado Operator de OpenAI. El modelo de IA puede interpretar vídeos, analizar archivos, contar objetos en imágenes y controlar un ordenador.
Según las pruebas de referencia realizadas por el equipo de Qwen, el modelo Qwen2.5-VL supera al GPT-40 de OpenAI, al Claude 3.5 Sonnet de Anthropic y al Gemini 2.0 Flash de Google. El nuevo modelo de IA podría superar a sus rivales en comprensión de video, matemáticas, análisis de documentos y evaluación de preguntas y respuestas.
Alibaba confirmó que el modelo Qwen2.5-VL estaba disponible para pruebas en su aplicación Qwen Chat y para su descarga desde la plataforma de desarrollo de IA Hugging Face. El equipo de Qwen afirmó que el modelo de IA puede analizar gráficos,tracdatos de escaneos de facturas y formularios, y comprender vídeos de varias horas de duración. El modelo de IA también puede reconocer IP de películas y series de televisión, así como de una amplia variedad de productos.
El equipo de Qwen reveló que el modelo tenía ciertas restricciones sobre los temas que podía abordar en Qwen Chat debido a que la IA fue desarrollada por una empresa china. Según el equipo, el regulador de internet de China evalúa muchos modelos desarrollados en el país para garantizar que sus respuestas "incorporen valores socialistas fundamentales". Varias empresas chinas de IA, como Ernie , también desvían las respuestas a temas que podrían irritar a los reguladores o que podrían considerarse demasiado sensibles.
El equipo de Qwen revela las capacidades de Qwen2.5-VL
El equipo de desarrollo de Qwen2.5-VL reveló que una de las características interesantes del modelo de IA es su capacidad para interactuar con software, tanto en PC como en dispositivos móviles. Philipp Schmid, director técnico de Hugging Face, mostró cómo el modelo de IA iniciaba la app de Booking.com para Android y reservaba un vuelo de Chongqing a Pekín.
A pesar de todo el revuelo por DeepSeek, ¡Qwenn acaba de lanzar el mejor multimodal abierto! Qwen 2.5 VL es un modelo de lenguaje de visión que puede controlar tu computadora, similar al operador OpenAI,tracinformación estructurada de gráficos y mucho más
– Philipp Schmid , director técnico de Hugging Face
Vaibhav Srivastav, científico de datos de Hugging Face, mostró cómo el modelo Qwen2.5-VL controla aplicaciones en un escritorio Linux, pero no logró mucho más que cambiar de pestaña. La demostración coincidió con el análisis comparativo de Qwen, que mostró que Qwen2.5-VL obtuvo una baja puntuación en OSWorld, un análisis comparativo que intenta imitar un entorno informático real.
La empresa china de tecnología de IA también reveló que los dos modelos más pequeños y menos sofisticados de la serie Qwen2.5VL, el Qwen2.5-VL-3B y el Qwen2.5-VL-7B, estaban disponibles bajo licencias permisivas. El modelo insignia, el Qwen2.5-VL-7B, seguirá estando bajo la licencia personalizada de Alibaba, que exige que las empresas y desarrolladores con más de 100 millones de usuarios activos mensuales soliciten permiso a Qwen o Alibaba antes de implementar el modelo de IA comercialmente.

