Your bank is using your money. You’re getting the scraps.WATCH FREE

Alibaba presenta su nuevo modelo de IA y afirma que supera a DeepSeek-V3

En esta publicación:

  • Alibaba presentó su nueva versión del modelo Qwen 2.5 AI, Qwen2.5-VL.
  • La empresa afirmó que su nuevo modelo de IA supera al modelo de IA de DeepSeek.
  • Philipp Schmid dijo que Qwen2.5-VL es un modelo de lenguaje de visión que puede controlar computadoras de manera similar al Operador de OpenAI.

Alibaba anunció una nueva versión de su modelo de inteligencia artificial Qwen 2.5 el miércoles, el primer día del Año Nuevo Lunar en China. La empresa tecnológica china afirmó que Qwen 2.5 superó al aclamado DeepSeek-V3. 

Alibaba publicó en su cuenta oficial de WeChat que Qwen 2.5-Max superó a casi todos los modelos de IA, incluyendo GPT-40, DeepSeek-V3 y Llama-3.1-405B. Esta noticia de la compañía se produjo tras el lanzamiento del asistente de IA de DeepSeek (DeepSeek-V3) el 10 de enero y el lanzamiento de su modelo R1 el 20 de enero. 

El reciente lanzamiento del modelo R1 de DeepSeek provocó una fuerte conmoción en las acciones de las empresas tecnológicas estadounidenses, especialmente Nvidia. DeepSeek afirmó haber creado el modelo R1 con tan solo 6 mil millones de dólares, en comparación con los miles de millones de dólares que otras empresas tecnológicas estadounidenses invierten en el sector de la IA. 

La compañía tecnológica también generó cierto impulso en su propio mercado nacional, con otras empresas tecnológicas chinas apresurándose a lanzar actualizaciones de sus modelos de IA. Un informe de Reuters reveló que dos días después del lanzamiento de DeepSeek-R1, ByteDance también lanzó una actualización de su modelo insignia de IA. La empresa matriz de TikTok argumentó que supera a o1 de OpenAI, respaldado por Microsoft, en pruebas que miden la capacidad de los modelos de IA para comprender y responder a instrucciones complejas.

Alibaba lanza su nueva versión del modelo de IA Qwen2.5

La compañía tecnológica china anunció el lunes que el nuevo modelo de IA, Qwen2.5-VL, podría realizar diversas tareas de análisis de texto e imágenes. La firma también afirmó que Qwen2.5 era similar al modelo que impulsa el recientemente lanzado Operator de OpenAI. El modelo de IA puede interpretar vídeos, analizar archivos, contar objetos en imágenes y controlar un ordenador.

Véase también  ASML: La piedra angular y el eslabón vital en la cadena de suministro de inteligencia artificial

Según las pruebas de referencia realizadas por el equipo de Qwen, el modelo Qwen2.5-VL supera al GPT-40 de OpenAI, al Claude 3.5 Sonnet de Anthropic y al Gemini 2.0 Flash de Google. El nuevo modelo de IA podría superar a sus rivales en comprensión de video, matemáticas, análisis de documentos y evaluación de preguntas y respuestas.

Alibaba confirmó que el modelo Qwen2.5-VL estaba disponible para pruebas en su aplicación Qwen Chat y para su descarga desde la plataforma de desarrollo de IA Hugging Face. El equipo de Qwen afirmó que el modelo de IA puede analizar gráficos,tracdatos de escaneos de facturas y formularios, y comprender vídeos de varias horas de duración. El modelo de IA también puede reconocer IP de películas y series de televisión, así como de una amplia variedad de productos.

El equipo de Qwen reveló que el modelo tenía ciertas restricciones sobre los temas que podía abordar en Qwen Chat debido a que la IA fue desarrollada por una empresa china. Según el equipo, el regulador de internet de China evalúa muchos modelos desarrollados en el país para garantizar que sus respuestas "incorporen valores socialistas fundamentales". Varias empresas chinas de IA, como Ernie , también desvían las respuestas a temas que podrían irritar a los reguladores o que podrían considerarse demasiado sensibles.

El equipo de Qwen revela las capacidades de Qwen2.5-VL

El equipo de desarrollo de Qwen2.5-VL reveló que una de las características interesantes del modelo de IA es su capacidad para interactuar con software, tanto en PC como en dispositivos móviles. Philipp Schmid, director técnico de Hugging Face, mostró cómo el modelo de IA iniciaba la app de Booking.com para Android y reservaba un vuelo de Chongqing a Pekín. 

A pesar de todo el revuelo por DeepSeek, ¡Qwenn acaba de lanzar el mejor multimodal abierto! Qwen 2.5 VL es un modelo de lenguaje de visión que puede controlar tu computadora, similar al operador OpenAI,tracinformación estructurada de gráficos y mucho más

Philipp Schmid , director técnico de Hugging Face

Vaibhav Srivastav, científico de datos de Hugging Face, mostró cómo el modelo Qwen2.5-VL controla aplicaciones en un escritorio Linux, pero no logró mucho más que cambiar de pestaña. La demostración coincidió con el análisis comparativo de Qwen, que mostró que Qwen2.5-VL obtuvo una baja puntuación en OSWorld, un análisis comparativo que intenta imitar un entorno informático real.

Véase también  El director ejecutivo de British Telecom dice que la IA podría profundizar los recortes de empleos

La empresa china de tecnología de IA también reveló que los dos modelos más pequeños y menos sofisticados de la serie Qwen2.5VL, el Qwen2.5-VL-3B y el Qwen2.5-VL-7B, estaban disponibles bajo licencias permisivas. El modelo insignia, el Qwen2.5-VL-7B, seguirá estando bajo la licencia personalizada de Alibaba, que exige que las empresas y desarrolladores con más de 100 millones de usuarios activos mensuales soliciten permiso a Qwen o Alibaba antes de implementar el modelo de IA comercialmente.

Si estás leyendo esto, ya estás al tanto. Sigue leyendo nuestro boletín .

Compartir enlace:

Aviso legal. La información proporcionada no constituye asesoramiento comercial. Cryptopolitan no se responsabiliza de las inversiones realizadas con base en la información proporcionada en esta página. Recomendamos encarecidamente realizar una investigación independiente tron consultar dent un profesional cualificado antes de tomar cualquier decisión de inversión.

Lo más leído

Cargando artículos más leídos...

Manténgase al tanto de las noticias sobre criptomonedas, reciba actualizaciones diarias en su bandeja de entrada

Selección del editor

Cargando artículos de Elección del editor...

- El boletín de criptomonedas que te mantiene a la vanguardia -

Los mercados se mueven rápido.

Nos movemos más rápido.

Suscríbete a Cryptopolitan Daily y recibe información sobre criptomonedas actualizada, precisa y relevante directamente en tu bandeja de entrada.

Únete ahora y
no te pierdas ningún movimiento.

Entra. Infórmate.
Adelántate.

Suscríbete a CryptoPolitan