Alibaba publica un modelo de IA de código abierto para la generación de vídeo e imágenes

- Alibaba publica en código abierto su modelo de inteligencia artificial Wan 2.1, poniendo a disposición del público su tecnología de generación de video e imágenes para impulsar la innovación y la competencia.
- La empresa lanza cuatro variantes de Wan 2.1, que aprovechan 14 mil millones de parámetros para mejorar la precisión y manejar entradas complejas.
- Alibaba planea una inversión de 52 mil millones de dólares en inteligencia artificial y computación en la nube, lo que marca una de las mayores expansiones de infraestructura de China en el sector.
Alibaba Group Holding Ltd. ha anunciado que su modelo de IA para la generación de vídeo e imágenes, Wan 2.1, ya está disponible públicamente como plataforma de código abierto. Se espera que esta medida impulse su adopción y aumente la competencia en el sector de la IA.
de Alibaba se alinea con una estrategia similar de ByteDance y la startup DeepSeek. A principios de este año, los modelos de código abierto asequibles de DeepSeek captaron la atención de los inversores tecnológicos y sorprendieron a la industria, intensiva en capital, con un rendimiento comparable al de empresas consolidadas como OpenAI.
Alibaba amplía su oferta de inteligencia artificial con cuatro variantes de Wan 2.1
Alibaba ha lanzado cuatro variantes de su modelo de IA Wan 2.1 (T2V-1.3B, T2V-14B, I2V-14B-720P e I2V-14B-480P), que generan imágenes y vídeos a partir de entradas de texto e imagen. La designación "14B" significa que estas variantes procesan 14 mil millones de parámetros, lo que les permite gestionar entradas más complejas y producir resultados más precisos.
Los modelos están disponibles globalmente en las plataformas ModelScope y HuggingFace de Alibaba Cloud para uso académico, de investigación y comercial.
Alibaba presentó la última versión de su modelo de IA para la generación de vídeo e imágenes en enero, abreviando posteriormente su nombre de Wanx a Wan. La compañía promocionó su capacidad para generar imágenes de gran realismo. Desde entonces, Alibaba ha destacado su alta posición en VBench, una clasificación de modelos generativos de vídeo, donde destaca en funcionalidades como la interacción multiobjeto.
El martes, la compañía presentó una vista previa de su modelo de razonamiento, QwQ-Max, que pretende convertir en código abierto una vez lanzado completamente.
ByteDance lanza OmniHuman, una IA que crea vídeos de cuerpo completo a partir de una imagen
El auge del desarrollo de IA de código abierto se produce en medio de importantes avances de la competencia. ByteDance, la empresa matriz de TikTok, anunció recientemente el lanzamiento de OmniHuman, un sistema avanzado de IA que puede generar un video de cuerpo entero a partir de una sola fotografía.
Lo que distingue a OmniHuman de sistemas de IA similares es su capacidad para crear vídeos dinámicos en los que el sujeto puede hablar, gesticular y moverse con naturalidad. El sistema se ha entrenado con más de 19 000 horas de vídeo y utiliza estos datos para crear vídeos que imitan el comportamiento humano en cuanto a movimientos y expresiones.
Una de las primeras demostraciones del uso de OmniHuman es un video de Albert Einstein dando una conferencia. El video se viralizó en cuanto se compartió en internet, lo que demuestra la gran diferencia que supone esta función.
Si bien OmniHuman es el primer sistema de IA que afirma generar un video creíble con solo una imagen, otros sistemas pueden ofrecer resultados similares utilizando unas pocas imágenes.
Para empezar, está Pollo AI, que permite a los usuarios generar videos subiendo imágenes. Es fácil de usar y, con solo imágenes y una instrucción de texto, puede crear videos basados en estilosdefipor el usuario.
Canva cuenta con un generador de videos con IA similar. Su conjunto de plantillas y funciones de edición facilitan la creación de videos generados por IA a partir de imágenes, incluso para usuarios sin conocimientos avanzados de creación de videos.
Freepik también tiene un generador de video de IA similar que ofrece varios modos de generación y opciones de personalización para crear videos atractivos con solo imágenes e indicaciones.
Alibaba destina 52.000 millones de dólares a la expansión de la IA y la nube
Hace unos días, Alibaba anunció planes para invertir al menos 380 mil millones de yuanes (52 mil millones de dólares) durante los próximos tres años para fortalecer su infraestructura de computación en la nube e inteligencia artificial.
El gigante de internet, cuyo cofundador es Jack Ma, invertirá más en su infraestructura de inteligencia artificial y computación en la nube que en los últimos 10 años. Ante la evolución de los modelos, que requieren un uso más intensivo de recursos computacionales, la compañía anunció en su blog oficial que Alibaba planea destacar como socio para las empresas que desarrollan e implementan IA en el mundo real.
Este objetivo constituye una de las mayores inversiones de China en infraestructura de IA y subraya las crecientes ambiciones de Alibaba en este campo. Sin embargo, surge en medio de la preocupación de los inversores sobre si algunas grandes empresas tecnológicas sobreestimarán la demanda de servicios de IA en el futuro o subestimarán el coste de capital para desarrollarlos.
Los analistas de TD Cowen señalaron el viernes que Microsoft Corp. está cancelando contratos de arrendamiento para una importante capacidad de centros de datos en Estados Unidos. Esta medida podría reflejar la preocupación de si está construyendo más infraestructura de computación para IA de la que necesitará a largo plazo. Las acciones de Alibaba en Hong Kong cayeron hasta un 3% el lunes.
Otras grandes empresas tecnológicas, como Meta Platforms Inc. y Amazon.com Inc., están prometiendo miles de millones para construir los centros de datos necesarios para entrenar, desarrollar y alojar servicios de IA.
Si estás leyendo esto, ya llevas ventaja. Mantente al día con nuestro boletín informativo.
Aviso legal. La información proporcionada no constituye asesoramiento comercial. Cryptopolitanconsultar no se responsabiliza de las inversiones realizadas con base en la información proporcionada en esta página. Recomendamostronencarecidamente realizar una investigación independientedent un profesional cualificado antes de tomar cualquier decisión de inversión.

Nellius Irene
Nellius es licenciada en Administración de Empresas y TI con cinco años de experiencia en la industria de las criptomonedas. También es egresada de Bitcoin Dada. Ha colaborado con importantes medios de comunicación, como BanklessTimes, Cryptobasic y Riseup Media.
- ¿Qué criptomonedas pueden hacerte ganar dinero?
- Cómo mejorar tu seguridad con una billetera (y cuáles realmente vale la pena usar)
- Estrategias de inversión poco conocidas que utilizan los profesionales
- Cómo empezar a invertir en criptomonedas (qué plataformas de intercambio usar, las mejores criptomonedas para comprar, etc.)















