Alibaba rend open source un modèle d'IA pour la génération de vidéos et d'images

Par

Nellius Irène

3 minutes de lecture - 26 février 2025

Alibaba rend open source un modèle d'IA pour la génération de vidéos et d'images

Alibaba rend open source son modèle d'IA Wan 2.1, mettant ainsi sa technologie de génération de vidéos et d'images à la disposition du public afin de stimuler l'innovation et la concurrence.
L'entreprise lance quatre variantes de Wan 2.1, exploitant 14 milliards de paramètres pour améliorer la précision et gérer des entrées complexes.
Alibaba prévoit un investissement de 52 milliards de dollars dans l'IA et le cloud computing, ce qui représente l'un des plus importants développements d'infrastructures en Chine dans ce secteur.

Alibaba Group Holding Ltd. a annoncé que son modèle d'IA de génération de vidéos et d'images, Wan 2.1, est désormais disponible publiquement en tant que plateforme open source. Cette initiative devrait stimuler l'adoption et intensifier la concurrence dans le domaine de l'IA.

d'Alibaba s'inscrit dans la lignée d'une stratégie similaire adoptée par ByteDance et la startup DeepSeek. Plus tôt cette année, les modèles open source abordables de DeepSeek ont attiré l'attention des investisseurs du secteur technologique et surpris ce secteur à forte intensité de capital par des performances comparables à celles d'acteurs établis comme OpenAI.

Alibaba élargit son offre en intelligence artificielle avec quatre variantes Wan 2.1

Alibaba a lancé quatre variantes de son modèle d'IA Wan 2.1 : T2V-1.3B, T2V-14B, I2V-14B-720P et I2V-14B-480P. Ces modèles génèrent des images et des vidéos à partir de données textuelles et visuelles. La mention « 14B » indique que ces variantes traitent 14 milliards de paramètres, ce qui leur permet de gérer des données plus complexes et de produire des résultats plus précis.

Les modèles sont disponibles dans le monde entier sur les plateformes ModelScope et HuggingFace d'Alibaba Cloud pour une utilisation académique, de recherche et commerciale.

Alibaba a présenté en janvier la dernière version de son modèle d'IA de génération vidéo et d'images, rebaptisé Wan (au lieu de Wanx). L'entreprise a mis en avant sa capacité à générer des visuels d'un réalisme saisissant. Depuis, Alibaba souligne son excellent classement sur VBench, un comparatif de modèles de génération vidéo, où il excelle notamment dans l'interaction multi-objets.

Mardi, la société a dévoilé un aperçu de son modèle de raisonnement, QwQ-Max, qu'elle prévoit de rendre open source lors de sa sortie complète.

ByteDance lance OmniHuman, une IA qui crée des vidéos de corps entier à partir d'une seule image

L'essor du développement de l'IA open source intervient alors que la concurrence réalise des progrès significatifs. ByteDance, la société mère de TikTok, a récemment annoncé le lancement d' OmniHuman, un système d'IA avancé capable de générer une vidéo complète d'un personnage entier à partir d'une simple photo.

Ce qui distingue OmniHuman des autres systèmes d'IA similaires, c'est sa capacité à créer des vidéos dynamiques où le sujet parle, gesticule et bouge naturellement. Entraîné sur plus de 19 000 heures de contenu vidéo, le système utilise ces données pour créer des vidéos qui imitent le comportement humain en termes de mouvements et d'expressions.

L'une des premières démonstrations d'OmniHuman est une vidéo d'Albert Einstein donnant une conférence. La vidéo est devenue virale dès sa diffusion sur Internet, preuve de l'impact considérable de cette fonctionnalité.

Bien qu'OmniHuman soit le premier système d'IA à prétendre générer une vidéo crédible à partir d'une seule image, d'autres systèmes peuvent fournir des résultats similaires en utilisant quelques images.

Pour commencer, il y a Pollo AI, qui permet aux utilisateurs de générer des vidéos à partir d'images. Facile d'utilisation, il suffit d'images et d'une simple invite textuelle pour créer des vidéos selon des stylesdefipar l'utilisateur.

Canva propose un générateur de vidéos IA similaire. Ses modèles et ses fonctionnalités d'édition permettent même aux utilisateurs ne possédant pas de compétences avancées en création vidéo de créer facilement des vidéos générées par IA à partir d'images.

Freepik propose également un générateur vidéo IA similaire qui offre plusieurs modes de génération et options de personnalisation pour créer des vidéos attrayantes à partir d'images et d'invites.

Alibaba investit 52 milliards de dollars dans l'IA et le développement du cloud

Il y a quelques jours, Alibaba a annoncé son intention d'investir au moins 380 milliards de yuans (52 milliards de dollars) au cours des trois prochaines années pour renforcer son infrastructure de cloud computing et d'IA.

Le géant d'Internet, cofondé par Jack Ma, va investir davantage dans son infrastructure d'intelligence artificielle et de cloud computing qu'il ne l'a fait ces dix dernières années. Face à des modèles en constante évolution et de plus en plus gourmands en ressources de calcul, l'entreprise a annoncé sur son blog officiel qu'Alibaba entend se positionner comme un partenaire de choix pour les entreprises qui développent et déploient l'IA dans le monde réel.

Ce projet représente l'un des plus importants investissements chinois dans les infrastructures d'IA et souligne les ambitions croissantes d'Alibaba dans ce domaine. Il intervient toutefois dans un contexte d'inquiétudes des investisseurs quant à la possibilité que certaines grandes entreprises technologiques surestiment la demande future de services d'IA ou sous-estiment le coût d'investissement nécessaire à leur développement.

Les analystes de TD Cowen ont souligné vendredi que Microsoft résilie des contrats de location portant sur une importante capacité de centres de données aux États-Unis. Cette décision pourrait refléter des inquiétudes quant à la possibilité que l'entreprise investisse davantage dans l'intelligence artificielle que nécessaire à long terme. Lundi, l'action d'Alibaba à Hong Kong a chuté de 3 %.

D'autres géants de la tech, comme Meta Platforms Inc. et Amazon.com Inc., s'engagent à investir des milliards dans la construction des centres de données nécessaires à la formation, au développement et à l'hébergement des services d'IA.

Les plus grands experts en cryptomonnaies lisent déjà notre newsletter. Envie d'en faire partie ? Rejoignez-les !

Alibaba ByteDance CNY DeepSeek

Partagez cet article

Avertissement : Les informations fournies ne constituent pas un conseil en investissement. CryptopolitanCryptopolitan.com toute responsabilité quant aux investissements réalisés sur la base des informations présentées sur cette page. Nous voustronrecommandons vivement d’effectuer vosdent et/ou de consulter un professionnel qualifié avant toute décision d’investissement.

Nellius Irène

Nellius est diplômée en gestion d'entreprise et en informatique et possède cinq ans d'expérience dans le secteur des cryptomonnaies. Elle est également diplômée de Bitcoin Dada. Nellius a collaboré avec des publications médiatiques de premier plan, notamment BanklessTimes, Cryptobasic et Riseup Media.

TABLE DES MATIÈRES

1. Alibaba élargit son offre en intelligence artificielle avec quatre variantes Wan 2.1

2. ByteDance lance OmniHuman, une IA qui crée des vidéos de corps entier à partir d'une seule image

3. Alibaba investit 52 milliards de dollars dans l'IA et le développement du cloud

Partagez cet article