Alibaba anunció una nueva versión de su modelo de inteligencia artificial Qwen 2.5 el miércoles, el primer día del año lunar en China. La compañía de tecnología china argumentó que Qwen 2.5 superó el muy aclamado Deepseek-V3.
Alibaba publicó en su cuenta oficial de WeChat que Qwen 2.5-Max superó a casi todos los modelos de IA, incluidos GPT-40, Deepseek-V3 y Llama-3.1-405b. Las noticias de la compañía se produjeron a raíz del lanzamiento del Asistente de IA de Deepseek (Deepseek-V3) el 10 de enero y el lanzamiento del 20 de enero de su modelo R1.
El reciente lanzamiento del modelo R1 de Deepseek envió una onda de choque en las acciones de las compañías tecnológicas de EE. UU. Aludando, especialmente Nvidia. Deepseek afirmó que creó el modelo R1 con solo $ 6 mil millones en comparación con los miles de millones de dólares que otras empresas tecnológicas estadounidenses gastaron en el espacio de IA.
La compañía de tecnología también causó cierto impulso en su propio mercado interno, con otras empresas tecnológicas chinas que se apresuran a publicar actualizaciones a sus modelos de IA. Un informe de Reuters reveló que dos días después del lanzamiento de Deepseek-R1, Bytedance también publicó una actualización a su modelo de IA insignia. La empresa matriz de Tiktok argumentó que supera a Openi's O1 respaldado por Microsoft en pruebas que miden qué tan bien los modelos de IA entendieron y respondieron a instrucciones complejas.
Alibaba lanza su nueva versión del modelo QWEN2.5 AI
El estallido de Deepseek V3 ha trac la atención de toda la comunidad de IA a los modelos MOE a gran escala. Al mismo tiempo, hemos estado construyendo Qwen2.5-Max, un gran MOE LLM en datos masivos y post-entrenado con recetas SFT y RLHF curadas. Logra competitivo ... pic.twitter.com/ohvl16vfje
- Qwen (@alibaba_qwen) 28 de enero de 2025
La compañía de tecnología china anunció el lunes que el nuevo modelo de IA, Qwen2.5-VL, podría realizar una serie de tareas de análisis de texto e imágenes. La firma también dijo que Qwen2.5 fue similar al operador recientemente lanzado del modelo que pidió el operador recientemente lanzado. El modelo AI puede comprender videos, analizar archivos y contar objetos en imágenes, así como controlar una PC.
Según las pruebas de evaluación comparativa realizada por el equipo QWEN, el modelo QWEN2.5-VL supera a GPT-40 de OpenAI, el soneto Claude 3.5 de Anthrope y Gemini 2.0 Flash de Google. El nuevo modelo de IA podría superar a sus rivales en la comprensión de video, las matemáticas, el análisis de documentos y las evaluaciones de respuesta.
Alibaba confirmó que el QWEN2.5-VL estaba disponible para probar en su aplicación de chat Qwen y para descargar desde la plataforma AI Dev Hugging Face. El equipo de Qwen dijo que el modelo de IA puede analizar gráficos y gráficos, los datostracde escaneos de facturas y formularios, y "comprender" videos de múltiples horas de duración. El modelo AI también puede reconocer IP de películas y series de televisión, así como una amplia variedad de productos.
El equipo de Qwen reveló que el modelo tenía ciertas restricciones sobre los temas que podría discutir en Qwen Chat debido al hecho de que la IA fue desarrollada por una empresa china. Según el equipo, el regulador de Internet de China indica que muchos modelos desarrollaron en el país para garantizar que sus respuestas "encarnen los valores socialistas centrales". Varias compañías chinas de IA, como Ernie , también desvían las respuestas a los temas que podrían elevar la ira de los reguladores o que podrían considerarse demasiado sensibles.
El equipo de Qwen revela las capacidades de Qwen2.5-VL
El equipo de desarrollo de Qwen2.5-VL reveló que una de las características interesantes del modelo AI es su capacidad para interactuar con el software, tanto en PC como en dispositivos móviles. Philipp Schmid, un protagonista técnico en Hugging Face, mostró que el modelo AI lanzó la aplicación Booking.com para Android y reserva un vuelo de Chongqing a Beijing.
“A pesar de toda la exageración de Deepseek, Qwenn acaba de dejar el mejor multimodal abierto! QWEN 2.5 VL es un modelo de lenguaje de visión que puede controlar su computadora, similar al operador de OpenAI, información estructurada detracde los gráficos y más! ”
- Philipp Schmid , líder tecnológico en Hugging Face
Vaibhav Srivastav, científico de datos de Hugging Face, mostró cómo el modelo QWEN2.5-VL controla las aplicaciones en un escritorio de Linux, pero no pudo lograr mucho más allá de conmutación de pestañas. La manifestación alineada con la evaluación comparativa de Qwen, que mostró Qwen2.5-VL obtuvo una calificación mal en Osworld, un punto de referencia que trata de imitar un entorno informático real.
La compañía de tecnología de IA china también reveló que los dos modelos más pequeños y menos sofisticados en la serie QWEN2.5VL, QWEN2.5-VL-3B y QWEN2.5-VL-7B, estaban disponibles bajo licencias permisivas. El insignia QWEN2.5-VL-7B seguirá bajo la licencia personalizada de Alibaba, lo que requiere que las empresas y los desarrolladores con más de 100 millones de usuarios activos mensuales soliciten permiso de Qwen o Alibaba antes de implementar el modelo AI comercialmente.
Academia Cryptopolitan: ¿Quieres hacer crecer tu dinero en 2025? Aprenda cómo hacerlo con DeFi en nuestra próxima clase web. Guarda tu lugar