DERNIÈRES NOUVELLES

Il y a 31 secondes : Réflexions du secteur
Le BYUSDT de Bybit offre une double opportunité de rendement aux traders lors du déploiement de Bybit TradFi

Il y a 37 minutes : Réflexions du secteur
Bitcoin a besoin de milliers de milliards de dollars de nouveaux capitaux, mais les institutions se tournent plutôt vers l'IA

Actualités d'il y a 41 minutes
La FSC sud-coréenne cible les baleines crypto surnommées « kimchi coins » dans le cadre d'une enquête sur la manipulation des prix

Actualités d'il y a 2 heures

SÉLECTIONNÉ POUR VOUS

Qwen3 d'Alibaba détrône R1 de DeepSeek et domine désormais les modèles d'IA open source

Par

Florence Muchai

3 minutes de lecture 6 mai 2025

La famille de modèles d'IA Qwen3 d'Alibaba a surpassé le modèle R1 de DeepSeek pour devenir le meilleur modèle open-source au monde dans des domaines tels que l'enseignement des langues, les mathématiques, la programmation et l'analyse des données.
Qwen3 est peu coûteux à utiliser car son fonctionnement ne coûte que 0,55 $ par million de jetons.
Les fabricants de puces américains Nvidia et Intel ont commencé à prendre en charge Qwen3.

La nouvelle famille de modèles d'IA Qwen3 d'Alibaba a surpassé R1 de DeepSeek et s'est hissée au rang de meilleur modèle open source au monde. Selon les rapports, Qwen3 a obtenu de meilleurs résultats que R1 lors de tests évaluant les capacités des modèles d'IA open source dans des domaines tels que l'apprentissage des langues, les mathématiques, la programmation et l'analyse de données.

La famille Qwen3 a été lancée la semaine dernière par la filiale de cloud computing d'Alibaba. Elle comprend huit modèles améliorés comportant entre 600 millions et 235 milliards de paramètres. En apprentissage automatique, les paramètres sont les variables d'un système d'IA lors de son entraînement.

Selon la LiveBench , une plateforme indépendantedent teste de grands modèles de langage, avant ces nouveaux tests, le modèle R1 de DeepSeek était le meilleur modèle d'IA open source au monde depuis sa sortie en janvier. Mais ce n'est plus le cas.

Les entreprises américaines et chinoises se précipitent pour adopter Qwen 3

La progression de Qwen3 dans le classement LiveBench témoigne du développement rapide de l'IA en Chine. Le secteur technologique chinois a connu une forte croissance grâce aux outils open source. Le code source ouvert d'Alibaba a permis à d'autres développeurs de logiciels tiers de partager la conception, de corriger les liens brisés ou d'améliorer le programme.

Cependant, les résultats globaux de LiveBench ont montré que Qwen3 n'était pas aussi performant que o3 d'OpenAI, Gemini Pro 2.5 de Google et Claude 3.7 d'Anthropic, qui sont les meilleurs modèles d'IA propriétaires au monde. LiveBench indique que o3-mini high, le modèle d'IA le plus populaire d'OpenAI, était le meilleur au monde. Microsoft soutient OpenAI.

Pour chaque million de jetons, l'exécution d'O3 coûte 10 $. En revanche, Qwen3 est plus économique, son exécution ne coûtant que 0,55 $ par million de jetons. Grâce à son prix plus abordable et à ses meilleures performances, de nombreuses entreprises ont annoncé leur intention de soutenir le nouveau modèle d'IA d'Alibaba dès sa sortie.

Huawei Technologies, Moore Threads, Cambricon Technologies et Hygon Information Technology sont toutes des entreprises de semi-conducteurs qui ont déclaré qu'elles prendraient en charge Qwen3.

Cambricon a annoncé mardi dernier avoir optimisé avec succès Qwen3 pour une exécution rapide sur ses processeurs graphiques. Cette optimisation faisait suite à la demande des développeurs d'IA philippins qui souhaitaient des puces fabriquées en Chine.

Qwen3 est également utilisé par les services de cloud computing d'Hyperbolic et de Fireworks.ai, deux entreprises spécialisées dans l'infrastructure d'IA. Les fabricants de puces américains Nvidia et Intel ont commencé à prendre en charge Qwen3.

De nombreux grands centres de données en Chine, notamment à Pékin, Shanghai, Hangzhou et dans les provinces du Hubei, du Jilin et du nord-ouest du Shaanxi, ont annoncé leur intention d'utiliser les modèles d'intelligence artificielle Qwen de troisième génération d'Alibaba. Le réseau de supercalculateurs chinois a également adopté Qwen3. Ce réseau relie plus de 20 centres de données répartis dans 20 villes et 14 provinces.

Le PDG d'Anthropic affirme que DeepSeek a été « un peu exagéré »

Lors d'un événement professionnel, un cofondateur d'Anthropic, la société qui a créé les modèles d'IA Claude, a déclaré que DeepSeek accusait encore « six à huit mois de retard sur les entreprises américaines de pointe ». Il a également indiqué que l'engouement récent autour de la start-up chinoise était « peut-être un peu exagéré »

DeepSeek a attiré l'attention du monde entier fin décembre 2024 et début janvier 2025 en partageant deux modèles d'IA open source avancés, V3 et R1. Ces modèles ont été conçus pour une fraction du coût et de la puissance de calcul dont les grandes entreprises technologiques ont généralement besoin pour les projets LLM.

On ignore quand DeepSeek publiera la prochaine génération de ses modèles. L'entreprise basée à Hangzhou a discrètement lancé fin avril. Il s'agissait d'une mise à jour de son modèle spécialisé dans le traitement des preuves mathématiques. Cependant, elle n'a fait aucune déclaration concernant l'avancement de son modèle de raisonnement R2, très attendu.

Si vous lisez ceci, vous avez déjà une longueur d'avance. Restez-y grâce à notre newsletter.

Alibaba DeepSeek Qwen3

Partagez cet article

Avertissement : Les informations fournies ne constituent pas un conseil en investissement. CryptopolitanCryptopolitan.com toute responsabilité quant aux investissements réalisés sur la base des informations présentées sur cette page. Nous voustronrecommandons vivement d’effectuer vosdent et/ou de consulter un professionnel qualifié avant toute décision d’investissement.

Florence Muchai

Florence couvre l'actualité des cryptomonnaies, des jeux vidéo, des technologies et de l'intelligence artificielle depuis six ans. Ses études en informatique à l'Université des sciences et technologies de Meru (MMUST) et en gestion des catastrophes et diplomatie internationale à la même université lui ont permis d'acquérir de solides compétences linguistiques, un sens aigu de l'observation et des aptitudes techniques pointues. Florence a travaillé au sein du groupe VAP et comme rédactrice pour plusieurs médias spécialisés dans les cryptomonnaies.

TABLE DES MATIÈRES

1. Les entreprises américaines et chinoises se précipitent pour adopter Qwen 3

2. Le PDG d'Anthropic affirme que DeepSeek a été « un peu exagéré »

Partagez cet article

PLUS D'ACTUALITÉS

AFFICHER TOUT

5 applications ingénieuses de ChatGPT et ce que vous devriez en faire

Il y a 3 ans, John Palmer, technicien

93 % des dirigeants d'entreprise privilégient les solutions basées sur l'IA pour la gestion de la durabilité de leur marque (Reuters)

Il y a 3 ans, John Palmer, technicien

Voici comment Macron soutient l'écosystème d'IA dynamique et productif de la France

Il y a 3 ans, Tech Glory Kaburu

Bloomberg estime que le marché de l'IA générative atteindra 1 300 milliards de dollars d'ici 2032

Il y a 3 ans, Tech Aamir Sheikh

Base est-il le réseau Ethereum de couche 2 lancé par Coinbase ?

21 octobre 2025 Apprendre la crypto : Guides pour débutants
Dogecoin contre Bitcoin: Principales différences techniques

20 octobre 2025 Apprendre la crypto : Guides pour débutants
Qu'est-ce que la TVL (Total Value Locked) en cryptomonnaie ?

14 octobre 2025 Apprendre la crypto : Guides pour débutants
Comment lire un livre blanc sur les cryptomonnaies ?

13 octobre 2025 Apprendre la crypto : Guides pour débutants
Ripple vs. XRP vs. XRP Ledger : quelle est la différence ?

13 octobre 2025 Apprendre la crypto : Guides pour débutants
Qu'est-ce qu'un portefeuille multisignature dans le monde des cryptomonnaies ?

10 octobre 2025 Apprendre la crypto : Guides pour débutants

COURS ACCÉLÉRÉ SUR LES CRYPTOMONNAIES

Quelles cryptomonnaies peuvent vous faire gagner de l'argent ?
Comment renforcer la sécurité de votre portefeuille (et lesquels valent vraiment la peine d'être utilisés)
Stratégies d'investissement peu connues utilisées par les professionnels
Comment débuter en investissement crypto (quelles plateformes d'échange utiliser, quelles cryptomonnaies acheter, etc.)