Alibaba a annoncé mercredi une nouvelle version de son modèle d'intelligence artificielle Qwen 2.5, le premier jour de l'année lunaire en Chine. La société de technologie chinoise a fait valoir que Qwen 2.5 avait dépassé le très acclamé Deepseek-V3.
Alibaba a posté sur son compte WeChat officiel que Qwen 2.5-Max a surpassé presque tous les modèles d'IA, y compris GPT-40, Deepseek-V3 et Llama-3.1-405b. Les nouvelles de la société sont survenues à la suite de la sortie de l'assistant AI de Deepseek (Deepseek-V3) le 10 janvier et la sortie du 20 janvier de son modèle R1.
La récente version du modèle R1 de Deepseek a envoyé une onde de choc dans les actions des sociétés technologiques américaines, en particulier Nvidia. Deepseek a affirmé avoir créé le modèle R1 avec seulement 6 milliards de dollars par rapport aux milliards de dollars que d'autres entreprises technologiques américaines dépensent dans l'espace d'IA.
La société technologique a également provoqué une élan sur son propre marché intérieur, avec d'autres entreprises de technologie chinoises se précipitant pour publier des mises à jour de leurs modèles d'IA. Un rapport de Reuters a révélé que deux jours après la sortie de Deepseek-R1, ByTedance a également publié une mise à jour de son modèle phare d'IA. La société mère de Tiktok a fait valoir qu'elle surpasse O1 d'Openai soutenue par Microsoft dans les tests qui mesurent la façon dont les modèles d'IA ont compris et répondu à des instructions complexes.
Alibaba publie sa nouvelle version du modèle Qwen2.5 AI
L'éclatement de Deepseek V3 a de trac attention de la communauté de l'IA entière aux modèles MOE à grande échelle. Parallèlement, nous avons construit Qwen2.5-Max, un grand Moe LLM pré-entraîné sur des données massives et post-formé avec des recettes SFT et RLHF organisées. Il réalise compétitif… pic.twitter.com/ohvl16vfje
- Qwen (@alibaba_qwen) 28 janvier 2025
La société de technologie chinoise a annoncé lundi que le nouveau modèle d'IA, Qwen2.5-VL, pourrait effectuer un certain nombre de tâches d'analyse de texte et d'image. L'entreprise a également déclaré que Qwen2.5 était similaire à l'opérateur récemment lancé de l'OpenIAD d'Openai. Le modèle AI peut comprendre les vidéos, analyser les fichiers et compter les objets dans les images, ainsi que contrôler un PC.
Selon les tests d'analyse comparative effectués par l'équipe QWEN, le modèle QWEN2.5-VL surpasse le GPT-40 d'OpenAI, le sonnet Claude 3.5 d'Anthropic et le flash Gemini 2.0 de Google. Le nouveau modèle d'IA pourrait battre ses rivaux dans la compréhension vidéo, les mathématiques, l'analyse des documents et les évaluations de questions-réponses.
Alibaba a confirmé que le QWEN2.5-VL était disponible pour les tests dans son application de chat Qwen et pour le téléchargement à partir de la plate-forme AI Dev Huging Face. L'équipe QWEN a déclaré que le modèle d'IA peut analyser les graphiques et les graphiques, les données extracdes analyses de factures et de formulaires, et «comprendre» des vidéos de plusieurs heures. Le modèle d'IA peut également reconnaître les IP à partir de films et de séries télévisées, ainsi qu'une grande variété de produits.
L'équipe QWEN a révélé que le modèle avait certaines restrictions sur les sujets dont il pourrait discuter dans le chat QWen en raison du fait que l'IA a été développé par une entreprise chinoise. Selon l'équipe, le régulateur Internet de la Chine évalue que de nombreux modèles se sont développés dans le pays pour garantir que leurs réponses «incarnent les valeurs socialistes de base». Plusieurs sociétés d'IA chinois, comme Ernie , détournent également les réponses à des sujets qui pourraient soulever la colère des régulateurs ou qui pourraient être jugés trop sensibles.
L'équipe de Qwen révèle les capacités de Qwen2.5-VL
L'équipe de développement de QWEN2.5-VL a révélé que l'une des fonctionnalités intéressantes du modèle d'IA est sa capacité à interagir avec les logiciels, à la fois sur PCS et sur les appareils mobiles. Philipp Schmid, une avance technique à Hugging Face, a montré le modèle AI lançant l'application Booking.com pour Android et réservant un vol de Chongqing à Pékin.
«Malgré tout le battage médiatique en profondeur, Qwenn vient de laisser tomber le meilleur multimodal ouvert! Qwen 2.5 VL est un modèle de langage de vision qui peut contrôler votre ordinateur, similaire à l'opérateur OpenAI, des informations structurées extracdes graphiques, et plus encore !! »
- Philipp Schmid , responsable de la technologie à Hugging Face
Vaibhav Srivastav, Data Scientist de Hugging Face, a montré comment le modèle QWEN2.5-VL contrôle les applications sur un bureau Linux mais n'a pas pu accomplir beaucoup au-delà des onglets de commutation. La démonstration alignée sur l'analyse comparative de Qwen, qui a montré que Qwen2.5-vl a obtenu un score mal sur Osworld, une référence qui essaie d'imiter un véritable environnement informatique.
La société chinoise d'IA Tech a également révélé que les deux modèles plus petits et moins sophistiqués dans la série QWEN2.5VL, QWEN2.5-VL-3B et QWEN2.5-VL-7B, étaient disponibles sous licence permissive. Le phare QWEN2.5-VL-7B sera toujours sous la licence personnalisée d'Alibaba, qui exige que les entreprises et les développeurs avec plus de 100 millions d'utilisateurs actifs mensuels demandent l'autorisation de QWEN ou Alibaba avant de déployer le modèle d'IA commercialement.
Cryptopolitan Academy: Vous voulez développer votre argent en 2025? Apprenez à le faire avec DeFi dans notre prochaine webclass. Enregistrez votre place