Alibaba Group Holding Ltd. a annoncé que son modèle AI générant des vidéos et d'image, WAN 2.1, est désormais disponible publiquement en tant que plate-forme open source. Cette décision devrait stimuler l'adoption et augmenter la concurrence dans l'espace d'IA.
d'Alibaba s'aligne sur une stratégie similaire de Bytedance et Startup Deepseek. Plus tôt cette année, les modèles open source de Deepseek ont attiré l'attention des investisseurs technologiques et ont surpris l'industrie à forte intensité de capital avec des performances comparables à des acteurs établis comme Openai.
Alibaba étend les offres AI avec quatre variantes WAN 2.1
Alibaba a publié quatre variantes de son modèle WAN 2.1 AI - T2V-1.3b, T2V-14b, I2V-14b-720p et I2V-14B-480P - qui génèrent des images et des vidéos à partir des entrées de texte et d'image. La désignation «14b» signifie que ces variantes traitent 14 milliards de paramètres, leur permettant de gérer des entrées plus complexes et de produire des résultats plus précis.
Les modèles sont disponibles à l'échelle mondiale sur les plates-formes ModelScope et HuggingFace d'Alibaba Cloud pour les universitaires, la recherche et l'utilisation commerciale.
Alibaba a introduit la dernière version de son modèle AI générant des vidéos et d'images en janvier, raccourcissant plus tard son nom à WAN de WANX. L'entreprise a vanté sa capacité à générer des visuels très réalistes. Alibaba a depuis souligné son classement supérieur sur VBench, un classement pour les modèles génératifs vidéo, où il excelle dans les fonctionnalités comme l'interaction multi-objets.
Mardi, la société a dévoilé un aperçu de son modèle de raisonnement, QWQ-Max, qu'elle a l'intention de faire de l'ouverture à la sortie complète.
ByTedance lance Omnihuman, une IA qui crée des vidéos intérimaires à partir d'une image
L'augmentation du développement de l'IA open source intervient au milieu des progrès importants des concurrents. ByTedance, la société mère de Tiktok, a récemment annoncé le lancement d' Omnihuman , un système d'IA avancé qui peut générer une vidéo complète du corps à partir de l'entrée d'une seule photographie.
Ce qui distingue Omnihuman des systèmes d'IA similaires, c'est qu'il peut créer des vidéos dynamiques dans lesquelles le sujet peut parler, geste et bouger naturellement. Le système a été formé sur plus de 19 000 heures de contenu vidéo et utilise ces données pour créer des vidéos qui imitent le comportement humain en termes de mouvements et d'expressions.
L'une des premières démonstrations utilisant Omnihuman est une vidéo d'Albert Einstein livrant une conférence. La vidéo est devenue virale au moment où elle a été partagée sur Internet, ce qui est la preuve de la différence de cette fonctionnalité.
Alors qu'Omnihuman est le premier système d'IA à prétendre générer une vidéo crédible avec une seule image, d'autres systèmes peuvent fournir des résultats similaires en utilisant quelques images.
Pour commencer, il y a Pollo AI, qui permet aux utilisateurs de générer des vidéos en téléchargeant des images. Il est facile à utiliser, et avec juste des images et une invite de texte, il peut créer des vidéos basées sur des styles dedefiutilisateur.
Canva a un générateur vidéo AI similaire. Son ensemble de modèles et les fonctionnalités d'édition permettent aux utilisateurs sans compétences de création vidéo avancées pour créer des vidéos générées par l'IA à l'aide d'images.
Freepik possède également un générateur de vidéos IA similaire qui propose plusieurs modes de génération et options de personnalisation pour créer des vidéos attrayantes avec des images et des invites.
Alibaba engage 52 milliards de dollars à l'IA et à l'expansion du cloud
Il y a quelques jours, Alibaba a annoncé son intention d'investir au moins 380 milliards de yuans (52 milliards de dollars) au cours des trois prochaines années pour renforcer son cloud computing et son infrastructure d'IA.
Le géant de l'Internet, dont le co-fondateur est Jack Ma, investira davantage dans son intelligence artificielle et son infrastructure de cloud computing que depuis 10 ans. Les modèles évolutifs devenant plus à forte intensité de calcul, la société a déclaré sur son blog officiel qu'Alibaba prévoyait de se démarquer en tant que partenaire des entreprises qui construisent et déploient l'IA dans le monde réel.
Cet objectif est l'un des investissements les plus importants de la Chine dans les infrastructures d'IA, et il souligne les ambitions croissantes d'Alibaba dans le domaine. Mais cela se produit au milieu des inquiétudes des investisseurs quant à savoir si certaines grandes entreprises technologiques surestimeront la demande de services d'IA à l'avenir ou sous-estiment le coût en capital de leur construction.
Les analystes de TD Cowen ont souligné vendredi que Microsoft Corp. annule les baux pour une capacité de centre de données substantielle aux États-Unis. Cette décision peut refléter des préoccupations quant à la construction de l'informatique en IA qu'elle n'en aura besoin à long terme. Les actions de Hong Kong d'Alibaba ont glissé jusqu'à 3% lundi.
D'autres grandes entreprises technologiques, telles que Meta Platforms Inc. et Amazon.com Inc., s'engagent à créer des milliards pour construire les centres de données nécessaires pour former, développer et héberger des services d'IA.
Cryptopolitan Academy: à venir bientôt - une nouvelle façon de gagner un revenu passif avec DeFi en 2025. En savoir plus