DERNIÈRES NOUVELLES
SÉLECTIONNÉ POUR VOUS
HEBDOMADAIRE
RESTEZ AU SOMMET

Les meilleures analyses crypto directement dans votre boîte mail.

La dernière mise à jour de l'IA de DeepSeek défie le modèle Qwen3 d'Alibaba et le modèle o3 d'OpenAI

ParShummas HumayunShummas Humayun
2 minutes de lecture
La dernière mise à jour de l'IA de DeepSeek défie le modèle Qwen3 d'Alibaba et le modèle o3 d'OpenAI.
  • DeepSeek a lancé le R1-0528 comme une amélioration majeure de son modèle R1 après que le Qwen3 d'Alibaba l'ait surpassé.
  • R1-0528 correspond désormais aux modèles de grandes entreprises technologiques comme OpenAI o3, o4-mini et Gemini 2.5-Pro ​​de Google.
  • L'équipe a condensé la chaîne de pensée du R1-0528 en une version de base Qwen3 8B plus petite qui surpasse l'originale de 10 %.

DeepSeek a déployé R1-0528, une mise à jour majeure de son modèle de raisonnement R1, sorti en janvier. Cette mise à jour intervient un mois seulement après que Qwen3, du groupe Alibaba, a surpassé le modèle DeepSeek R1 original sur LiveBench, une plateforme de test en ligne pour les modèles d'intelligence artificielle open source.

Le modèle R1-0528 amélioré de DeepSeek rivalise désormais avec les modèles d'IA de pointe d'OpenAI et de Google en termes de performances. Ce retour en force témoigne de la rapidité avec laquelle les géants technologiques chinois et les jeunes entreprises du secteur s'efforcent d'améliorer leurs outils d'IA.

Dans son communiqué, DeepSeek a déclaré que R1-0528 présente de meilleures capacités de raisonnement et d'écriture créative. Cette mise à jour améliore également ses compétences entron. Plus important encore, l'entreprise affirme que le modèle produit désormais 50 % d'« hallucinations » en moins

DeepSeek a expliqué que ces améliorations provenaient de la puissance de calcul supplémentaire investie lors de la phase de post-entraînement, au cours de laquelle les ingénieurs peaufinent le modèle après la phase d'entraînement principale. Durant cette phase, ils visent à accroître l'efficacité du modèle et à améliorer sa précision et sa sécurité.

R1-0528 se classe désormais juste derrière les mini-algorithmes o3 et o4 d'OpenAI

Sur LiveCodeBench, qui mesure les performances des modèles d'IA, R1-0528 se classe désormais juste derrière les modèles o4-mini et o3 d'OpenAI.

« La dernière mise à jour de DeepSeek améliore le raisonnement,tronles capacités mathématiques et de programmation, et se rapproche des modèles de pointe comme Gemini et O3 », a déclaré Adina Yakefu, chercheuse en IA chez Hugging Face.

Elle a ajouté que la nouvelle version présente des « améliorations majeures en matière de réduction des inférences et des hallucinations » et prouve que la start-up ne se contente pas de rattraper son retard, mais qu'elle est activement en concurrence.

Ces progrès rapides sont intervenus après que Washington a restreint les exportations de puces de pointe et d'autres technologies vers la Chine. Pourtant, les entreprises chinoises continuent de perfectionner leurs systèmes. Plus tôt ce mois-ci, Baidu et Tencent ont décrit comment elles parviennent à rendre leurs modèles plus efficaces malgré un accès limité aux semi-conducteurs de pointe.

Le PDG de Nvidia, Jensen Huang, a critiqué mercredi les restrictions à l'exportation. « Les États-Unis ont fondé leur politique sur l'hypothèse que la Chine ne pouvait pas fabriquer de puces d'IA », a-t-il déclaré. « Cette hypothèse a toujours été discutable, et elle est aujourd'hui manifestement erronée. La question n'est pas de savoir si la Chine maîtrisera l'IA. Elle la maîtrise déjà. »

DeepSeek a amélioré les performances du modèle Qwen3 8B d'Alibaba de 10 %

DeepSeek a également indiqué avoir intégré les étapes de raisonnement utilisées dans la demande R1-0528 au Qwen3 8B d'Alibaba. Ce processus a permis de créer un nouveau modèle plus compact, dont les performances surpassent celles de Qwen3 de plus de 10 %, selon l'entreprise. Ce modèle est par ailleurs 30 fois plus petit.

« Nous pensons que la chaîne de pensée issue de DeepSeek-R1-0528 revêtira une importance significative pour la recherche académique sur les modèles de raisonnement et les travaux industriels sur les petits modèles », a déclaré la société.

Selon Reuters, un représentant de DeepSeek a indiqué à un groupe WeChat que cette modification était une « mise à jour mineure à titre expérimental » déjà accessible au public. Face à une concurrence accrue, Google a baissé le prix de certains niveaux d'accès Gemini, tandis qu'OpenAI a lancé le modèle o3 Mini, moins cher.

Ne vous contentez pas de lire les actualités crypto. Comprenez-les. Abonnez-vous à notre newsletter. C'est gratuit.

Partagez cet article
PLUS D'ACTUALITÉS
COURS ACCÉLÉRÉ CRYPTOMONNAIES
LES