Qwen3 d'Alibaba détrône R1 de DeepSeek et domine désormais les modèles d'IA open source

- La famille de modèles d'IA Qwen3 d'Alibaba a surpassé le modèle R1 de DeepSeek pour devenir le meilleur modèle open-source au monde dans des domaines tels que l'enseignement des langues, les mathématiques, la programmation et l'analyse des données.
- Qwen3 est peu coûteux à utiliser car son fonctionnement ne coûte que 0,55 $ par million de jetons.
- Les fabricants de puces américains Nvidia et Intel ont commencé à prendre en charge Qwen3.
La nouvelle famille de modèles d'IA Qwen3 d'Alibaba a surpassé R1 de DeepSeek et s'est hissée au rang de meilleur modèle open source au monde. Selon les rapports, Qwen3 a obtenu de meilleurs résultats que R1 lors de tests évaluant les capacités des modèles d'IA open source dans des domaines tels que l'apprentissage des langues, les mathématiques, la programmation et l'analyse de données.
La famille Qwen3 a été lancée la semaine dernière par la filiale de cloud computing d'Alibaba. Elle comprend huit modèles améliorés comportant entre 600 millions et 235 milliards de paramètres. En apprentissage automatique, les paramètres sont les variables d'un système d'IA lors de son entraînement.
Selon la LiveBench , une plateforme indépendantedent teste de grands modèles de langage, avant ces nouveaux tests, le modèle R1 de DeepSeek était le meilleur modèle d'IA open source au monde depuis sa sortie en janvier. Mais ce n'est plus le cas.
Les entreprises américaines et chinoises se précipitent pour adopter Qwen 3
La progression de Qwen3 dans le classement LiveBench témoigne du développement rapide de l'IA en Chine. Le secteur technologique chinois a connu une forte croissance grâce aux outils open source. Le code source ouvert d'Alibaba a permis à d'autres développeurs de logiciels tiers de partager la conception, de corriger les liens brisés ou d'améliorer le programme.
Cependant, les résultats globaux de LiveBench ont montré que Qwen3 n'était pas aussi performant que o3 d'OpenAI, Gemini Pro 2.5 de Google et Claude 3.7 d'Anthropic, qui sont les meilleurs modèles d'IA propriétaires au monde. LiveBench indique que o3-mini high, le modèle d'IA le plus populaire d'OpenAI, était le meilleur au monde. Microsoft soutient OpenAI.
Pour chaque million de jetons, l'exécution d'O3 coûte 10 $. En revanche, Qwen3 est plus économique, son exécution ne coûtant que 0,55 $ par million de jetons. Grâce à son prix plus abordable et à ses meilleures performances, de nombreuses entreprises ont annoncé leur intention de soutenir le nouveau modèle d'IA d'Alibaba dès sa sortie.
Huawei Technologies, Moore Threads, Cambricon Technologies et Hygon Information Technology sont toutes des entreprises de semi-conducteurs qui ont déclaré qu'elles prendraient en charge Qwen3.
Cambricon a annoncé mardi dernier avoir optimisé avec succès Qwen3 pour une exécution rapide sur ses processeurs graphiques. Cette optimisation faisait suite à la demande des développeurs d'IA philippins qui souhaitaient des puces fabriquées en Chine.
Qwen3 est également utilisé par les services de cloud computing d'Hyperbolic et de Fireworks.ai, deux entreprises spécialisées dans l'infrastructure d'IA. Les fabricants de puces américains Nvidia et Intel ont commencé à prendre en charge Qwen3.
De nombreux grands centres de données en Chine, notamment à Pékin, Shanghai, Hangzhou et dans les provinces du Hubei, du Jilin et du nord-ouest du Shaanxi, ont annoncé leur intention d'utiliser les modèles d'intelligence artificielle Qwen de troisième génération d'Alibaba. Le réseau de supercalculateurs chinois a également adopté Qwen3. Ce réseau relie plus de 20 centres de données répartis dans 20 villes et 14 provinces.
Le PDG d'Anthropic affirme que DeepSeek a été « un peu exagéré »
Lors d'un événement professionnel, un cofondateur d'Anthropic, la société qui a créé les modèles d'IA Claude, a déclaré que DeepSeek accusait encore « six à huit mois de retard sur les entreprises américaines de pointe ». Il a également indiqué que l'engouement récent autour de la start-up chinoise était « peut-être un peu exagéré »
DeepSeek a attiré l'attention du monde entier fin décembre 2024 et début janvier 2025 en partageant deux modèles d'IA open source avancés, V3 et R1. Ces modèles ont été conçus pour une fraction du coût et de la puissance de calcul dont les grandes entreprises technologiques ont généralement besoin pour les projets LLM.
On ignore quand DeepSeek publiera la prochaine génération de ses modèles. L'entreprise basée à Hangzhou a discrètement lancé fin avril. Il s'agissait d'une mise à jour de son modèle spécialisé dans le traitement des preuves mathématiques. Cependant, elle n'a fait aucune déclaration concernant l'avancement de son modèle de raisonnement R2, très attendu.
Ne vous contentez pas de lire les actualités crypto. Comprenez-les. Abonnez-vous à notre newsletter. C'est gratuit.
Avertissement : Les informations fournies ne constituent pas un conseil en investissement. CryptopolitanCryptopolitan.com toute responsabilité quant aux investissements réalisés sur la base des informations présentées sur cette page. Nous voustronrecommandons vivement d’effectuer vosdent et/ou de consulter un professionnel qualifié avant toute décision d’investissement.

Florence Muchai
Florence est une journaliste financière forte de six ans d'expérience dans les secteurs des cryptomonnaies, des jeux vidéo, des technologies et de l'intelligence artificielle. Elle a étudié l'informatique à l'Université des sciences et technologies de Meru (MMUST) et la gestion des catastrophes et la diplomatie internationale à la même université. Florence a travaillé au sein du groupe VAP et comme rédactrice pour plusieurs médias spécialisés dans les cryptomonnaies.
LES
- Quelles cryptomonnaies peuvent vous faire gagner de l'argent ?
- Comment renforcer la sécurité de votre portefeuille (et lesquels valent vraiment la peine d'être utilisés)
- Stratégies d'investissement peu connues utilisées par les professionnels
- Comment débuter en investissement crypto (quelles plateformes d'échange utiliser, quelles cryptomonnaies acheter, etc.)














