Alibaba lance un outil d'IA multimodal pour défier OpenAI et DeepSeek

- Alibaba a lancé Qwen VLo, un nouveau modèle d'IA qui génère et modifie des images à l'aide de texte et d'éléments visuels.
- Qwen VLo inaugure la « génération progressive », permettant aux utilisateurs d'assister à la création d'images en temps réel.
- Cette initiative permet à Alibaba de concurrencer GPT-4o et DeepSeek d'OpenAI.
Alibaba Group Holding Ltd. a présenté QwenVLo, son tout nouveau modèle d'IA multimodal, alors que le géant technologique chinois continue de renforcer sa position dans la bataille mondiale de l'IA, de plus en plus concurrentielle.
Ce modèle permet aux utilisateurs de créer et de modifier des images à l'aide d'invites textuelles et d'entrées visuelles, des capacités conçues pour être équivalentes, voire concurrentes, à celles des principaux développeurs d'IA comme OpenAI et DeepSeek.
QwenVLo est une amélioration du de base Qwen2.5-VL , qu'il étend pour prendre en charge de nouvelles tâches telles que la génération de texte en image et d'image en image.
L'une de ses caractéristiques remarquables est la génération progressive, qui permet aux utilisateurs de voir une image se construire au fur et à mesure de sa création – un niveau de transparence et d'interactivité rare dans la plupart des outils d'IA actuels.
« Ce modèle récemment mis à jour ne se contente pas de "comprendre" le monde, il génère également des reconstitutions de haute qualité basées sur cette compréhension », a déclaré la société dans un article de blog.
Alibaba affine sa stratégie en matière d'IA avec la série Qwen
L'essor de l'IA n'est plus un simple atout pour la domination d'Alibaba dans le commerce électronique. L'entreprise investit massivement dans l'IA depuis début 2024.
En février, Eddie Wu, PDG d'Alibaba, a déclaré que le géant du e-commerce et des technologies de l'information allait donner la priorité à ses travaux sur l'intelligence artificielle générale (IAG). Il a souligné que le développement de l'IAG était devenu la priorité absolue d'Alibaba, mettant ainsi en lumière l'importance croissante de l'IA pour la croissance et la compétitivité futures de l'entreprise.
Alibaba a déjà lancé plusieurs modèles sous la marque Qwen, chacun adapté à une modalité spécifique : texte, image, vidéo et audio. QwenVLo remplace cette approche et est conçu pour fonctionner sur des machines moins performantes, notamment les téléphones mobiles et les ordinateurs portables personnels ; cependant, contrairement à la plupart des modèles d’IA de pointe, qui nécessitent encore une importante puissance de calcul dans le cloud pour fonctionner efficacement.
En mars 2025, Quark a lancé une nouvelle application Quark intégrant la nouvelle fonctionnalité Qwen. Cette application fonctionne désormais comme un assistant intelligent doté d'une intelligence artificielle et proposant des outils de recherche, de résumé et de création. Elle illustre la volonté d'Alibaba de développer des modèles d'IA et de les intégrer aux expériences destinées aux consommateurs.
Alibaba défie DeepSeek et OpenAI dans la course à l'IA
Le lancement de QwenVLo par Alibaba coïncide avec une vague d'initiatives liées à l'IA à travers le monde. OpenAI, société américaine, a lancé GPT-4o, son modèle multimodal le plus avancé à ce jour, capable de comprendre et de répondre avec du texte, des images et de l'audio.
En Chine, tous les regards étaient tournés vers DeepSeek, une start-up locale pour laquelle la maîtrise des coûts devient rapidement un enjeu crucial dans le développement de l'IA, car elle affirmait avoir créé un modèle de langage compétitif de grande envergure pour seulement quelques millions de dollars.
Depuis, les géants technologiques chinois se sont empressés de lancer des services d'IA similaires, plus rapides, moins chers et plus polyvalents. Parmi les premiers acteurs sérieux du secteur figure Qwen Vlo d'Alibaba, qui, grâce à ses fonctionnalités multimodales performantes et légères, pourrait bien concurrencer ses rivaux occidentaux et chinois.
La course porte désormais davantage sur la capacité à construire le modèle le plus intelligent, mais aussi à rendre cette intelligence utilisable à grande échelle.
Alibaba parie que les types de personnes qui utilisent une application au quotidien (dent, designers, chefs d'entreprise et développeurs) se tourneront vers des outils rapides, simples d'utilisation et optimisés pour différents appareils.
Cependant, il reste à voir si Qwen VLo parviendra à s'imposer auprès des grands noms du secteur. Alibaba a néanmoins martelé le message suivant : la Chine ne se contente pas de suivre le rythme des autres pays dans la course à la suprématie en IA, elle est déterminée à la mener.
Si vous lisez ceci, vous avez déjà une longueur d'avance. Restez-y grâce à notre newsletter.
LES
- Quelles cryptomonnaies peuvent vous faire gagner de l'argent ?
- Comment renforcer la sécurité de votre portefeuille (et lesquels valent vraiment la peine d'être utilisés)
- Stratégies d'investissement peu connues utilisées par les professionnels
- Comment débuter en investissement crypto (quelles plateformes d'échange utiliser, quelles cryptomonnaies acheter, etc.)















