DERNIÈRES NOUVELLES

en direct Bitcoin atteint 67 000 dollars, propulsant les marchés vers des sommets historiques suite à l'accord de paix entre Trump et l'Iran

Mises à jour en direct du 15 juin 2026
La Chine s'intéresse au rôle des stablecoins dans les paiements transfrontaliers

Actualités d'il y a 5 minutes
Les États-Unis investissent 500 millions de dollars dans SandboxAQ, misant sur les matériaux pour puces conçus par l'IA

Il y a 18 minutes - Technologie
La décision concernant la pénalité pour les principaux bénéficiaires de gains est en suspens, la Haute Cour australienne se prononçant en faveur de l'ASIC

Actualités d'il y a 1 heure

SÉLECTIONNÉ POUR VOUS

HEBDOMADAIRE

RESTEZ AU SOMMET

Les meilleures analyses crypto directement dans votre boîte mail.

La dernière mise à jour de l'IA de DeepSeek défie le modèle Qwen3 d'Alibaba et le modèle o3 d'OpenAI

Par

Shummas Humayun

2 minutes de lecture - 30 mai 2025

La dernière mise à jour de l'IA de DeepSeek défie le modèle Qwen3 d'Alibaba et le modèle o3 d'OpenAI.

Photo de Solen Feyissa sur Unsplash.

DeepSeek a lancé le R1-0528 comme une amélioration majeure de son modèle R1 après que le Qwen3 d'Alibaba l'ait surpassé.
R1-0528 correspond désormais aux modèles de grandes entreprises technologiques comme OpenAI o3, o4-mini et Gemini 2.5-Pro de Google.
L'équipe a condensé la chaîne de pensée du R1-0528 en une version de base Qwen3 8B plus petite qui surpasse l'originale de 10 %.

DeepSeek a déployé R1-0528, une mise à jour majeure de son modèle de raisonnement R1, sorti en janvier. Cette mise à jour intervient un mois seulement après que Qwen3, du groupe Alibaba, a surpassé le modèle DeepSeek R1 original sur LiveBench, une plateforme de test en ligne pour les modèles d'intelligence artificielle open source.

Le modèle R1-0528 amélioré de DeepSeek rivalise désormais avec les modèles d'IA de pointe d'OpenAI et de Google en termes de performances. Ce retour en force témoigne de la rapidité avec laquelle les géants technologiques chinois et les jeunes entreprises du secteur s'efforcent d'améliorer leurs outils d'IA.

Dans son communiqué, DeepSeek a déclaré que R1-0528 présente de meilleures capacités de raisonnement et d'écriture créative. Cette mise à jour améliore également ses compétences entron. Plus important encore, l'entreprise affirme que le modèle produit désormais 50 % d'« hallucinations » en moins

DeepSeek a expliqué que ces améliorations provenaient de la puissance de calcul supplémentaire investie lors de la phase de post-entraînement, au cours de laquelle les ingénieurs peaufinent le modèle après la phase d'entraînement principale. Durant cette phase, ils visent à accroître l'efficacité du modèle et à améliorer sa précision et sa sécurité.

R1-0528 se classe désormais juste derrière les mini-algorithmes o3 et o4 d'OpenAI

Sur LiveCodeBench, qui mesure les performances des modèles d'IA, R1-0528 se classe désormais juste derrière les modèles o4-mini et o3 d'OpenAI.

« La dernière mise à jour de DeepSeek améliore le raisonnement,tronles capacités mathématiques et de programmation, et se rapproche des modèles de pointe comme Gemini et O3 », a déclaré Adina Yakefu, chercheuse en IA chez Hugging Face.

Elle a ajouté que la nouvelle version présente des « améliorations majeures en matière de réduction des inférences et des hallucinations » et prouve que la start-up ne se contente pas de rattraper son retard, mais qu'elle est activement en concurrence.

Ces progrès rapides sont intervenus après que Washington a restreint les exportations de puces de pointe et d'autres technologies vers la Chine. Pourtant, les entreprises chinoises continuent de perfectionner leurs systèmes. Plus tôt ce mois-ci, Baidu et Tencent ont décrit comment elles parviennent à rendre leurs modèles plus efficaces malgré un accès limité aux semi-conducteurs de pointe.

Le PDG de Nvidia, Jensen Huang, a critiqué mercredi les restrictions à l'exportation. « Les États-Unis ont fondé leur politique sur l'hypothèse que la Chine ne pouvait pas fabriquer de puces d'IA », a-t-il déclaré. « Cette hypothèse a toujours été discutable, et elle est aujourd'hui manifestement erronée. La question n'est pas de savoir si la Chine maîtrisera l'IA. Elle la maîtrise déjà. »

DeepSeek a amélioré les performances du modèle Qwen3 8B d'Alibaba de 10 %

DeepSeek a également indiqué avoir intégré les étapes de raisonnement utilisées dans la demande R1-0528 au Qwen3 8B d'Alibaba. Ce processus a permis de créer un nouveau modèle plus compact, dont les performances surpassent celles de Qwen3 de plus de 10 %, selon l'entreprise. Ce modèle est par ailleurs 30 fois plus petit.

« Nous pensons que la chaîne de pensée issue de DeepSeek-R1-0528 revêtira une importance significative pour la recherche académique sur les modèles de raisonnement et les travaux industriels sur les petits modèles », a déclaré la société.

Selon Reuters, un représentant de DeepSeek a indiqué à un groupe WeChat que cette modification était une « mise à jour mineure à titre expérimental » déjà accessible au public. Face à une concurrence accrue, Google a baissé le prix de certains niveaux d'accès Gemini, tandis qu'OpenAI a lancé le modèle o3 Mini, moins cher.

Les plus grands experts en cryptomonnaies lisent déjà notre newsletter. Envie d'en faire partie ? Rejoignez-les !

Alibaba CNY DeepSeek OpenAI USD

Partagez cet article

Shummas Humayun

Shummas est une ancienne rédactrice de contenu technique et chercheuse.

TABLE DES MATIÈRES

1. R1-0528 se classe désormais juste derrière les mini-algorithmes o3 et o4 d'OpenAI

2. DeepSeek a amélioré les performances du modèle Qwen3 8B d'Alibaba de 10 %

Partagez cet article

PLUS D'ACTUALITÉS

AFFICHER TOUT

5 applications ingénieuses de ChatGPT et ce que vous devriez en faire

Il y a 3 ans, John Palmer, technicien

93 % des dirigeants d'entreprise privilégient les solutions basées sur l'IA pour la gestion de la durabilité de leur marque (Reuters)

Il y a 3 ans, John Palmer, technicien

Voici comment Macron soutient l'écosystème d'IA dynamique et productif de la France

Il y a 3 ans, Tech Glory Kaburu

Bloomberg estime que le marché de l'IA générative atteindra 1 300 milliards de dollars d'ici 2032

Il y a 3 ans, Tech Aamir Sheikh

Base est-il le réseau Ethereum de couche 2 lancé par Coinbase ?

21 octobre 2025 Apprendre la crypto : Guides pour débutants
Dogecoin contre Bitcoin: Principales différences techniques

20 octobre 2025 Apprendre la crypto : Guides pour débutants
Qu'est-ce que la TVL (Total Value Locked) en cryptomonnaie ?

14 octobre 2025 Apprendre la crypto : Guides pour débutants
Comment lire un livre blanc sur les cryptomonnaies ?

13 octobre 2025 Apprendre la crypto : Guides pour débutants
Ripple vs. XRP vs. XRP Ledger : quelle est la différence ?

13 octobre 2025 Apprendre la crypto : Guides pour débutants
Qu'est-ce qu'un portefeuille multisignature dans le monde des cryptomonnaies ?

10 octobre 2025 Apprendre la crypto : Guides pour débutants

COURS ACCÉLÉRÉ SUR LES CRYPTOMONNAIES

Quelles cryptomonnaies peuvent vous faire gagner de l'argent ?
Comment renforcer la sécurité de votre portefeuille (et lesquels valent vraiment la peine d'être utilisés)
Stratégies d'investissement peu connues utilisées par les professionnels
Comment débuter en investissement crypto (quelles plateformes d'échange utiliser, quelles cryptomonnaies acheter, etc.)