Le nouveau modèle de DeepSeek surpasse le modèle phare grâce à une avancée majeure en intelligence artificielle

- DeepSeek a publié une nouvelle mise à jour V3.1 avec une efficacité de réflexion accrue.
- La nouvelle mise à jour de la startup surpasse la version initiale dans plusieurs tests de performance.
- Les analystes de marché s'attendaient à ce que DeepSeek lance le successeur du R1 plus tôt cette année.
La start-up chinoise DeepSeek a annoncé une nouvelle mise à jour de son modèle, affirmant qu'elle surpasse le modèle R1, largement reconnu, sur les principaux tests de performance. Dans une publication WeChat jeudi, l'entreprise spécialisée en IA a confirmé que cette nouvelle version, la V3.1, offre des réponses plus rapides aux requêtes et marque son entrée dans le développement d'agents IA.
DeepSeek a ajouté que le modèle prend en charge une architecture de raisonnement hybride, disposant à la fois de modes de pensée et de non-pensée, de capacités d'agent améliorées ettrondans l'utilisation des outils et l'exécution des tâches.
DeepSeek propose un bouton « Réflexion profonde » pour basculer entre les modes
À ce jour, l'application et le site web officiels de DeepSeek ont déjà été mis à jour vers la version 3.1, permettant aux utilisateurs de basculer entre les modes de réflexion et de non-réflexion via le bouton « Deep Thinking », de la même manière que fonctionnent les modèles hybrides d'Anthropic tels qu'Opus et Sonnet.
Le modèle V3.1 affiche de meilleures performances que R1 sur des benchmarks tels que SWE et Terminal-Bench, notamment en termes d'efficacité de raisonnement. De plus, selon Artificial Analysis, il a atteint un score de 60 à son indice d'intelligence en mode raisonnement, légèrement supérieur aux 59 points obtenus par R1. L'architecture sous-jacente reste toutefois inchangée, avec un total de 671 milliards de paramètres, dont 37 milliards actifs.
Malgré une efficacité accrue, ce modèle utilise légèrement moins de jetons que R1 en mode de raisonnement. Cependant, ses du dernier modèle performances De plus, il ne prend pas en charge les appels de fonctions en mode de raisonnement, ce qui constitue une limitation majeure pour les flux de travail multi-agents.
La start-up avait initialement annoncé ce nouveau modèle mardi, mais celui-ci n'était alors disponible que sur Hugging Face. Un communiqué distinct précisait que cette version avait été optimisée pour fonctionner sur des puces d'IA de nouvelle génération fabriquées en Chine.
L'entreprise a dévoilé un nouveau plan tarifaire pour sa version V3 améliorée. Ce plan, applicable à compter du 6 septembre, augmente certains frais, supprime les remises en soirée et réduit les coûts pour certaines applications.
DeepSeek a fixé le prix de son API Input à 0,07 $ par million de jetons pour les requêtes trouvées dans le cache et à 0,56 $ pour les requêtes non trouvées, tandis que le prix des jetons de sortie est de 1,68 $ par million. Ces tarifs sont nettement inférieurs à ceux de la concurrence : Gemini 2.5 Pro coûte 10 $ par million de jetons de sortie (15 $ pour les requêtes plus longues), GPT-5 d’OpenAI est également à 10 $, et Claude Opus 4.1 d’Anthropic peut atteindre 75 $.
Les analystes s'attendaient à ce que DeepSeek lance le successeur du R1 plus tôt cette année
DeepSeek a d'abord secoué la Silicon Valley avec le lancement, en janvier, de son modèle d'IA R1, puissant et peu coûteux. Depuis, ce modèle est resté à la pointe de l'essor fulgurant de l'IA en Chine, défiant des entreprises américaines comme OpenAI.
Les observateurs du marché attendent toujours la suite du R1, un possible modèle R2, dont beaucoup espéraient le lancement en début d'année. Selon des sources locales, ce retard serait dû à la volonté du fondateur, Liang Wenfeng, de perfectionner le modèle. Parallèlement, il dirige également sa société de gestion d'actifs, High-Flyer Asset Management, qui connaît un franc succès.
Comme l'avait précédemment rapporté Cryptopolitan, DeepSeek a reporté le lancement de son modèle d'IA R2 suite à des problèmes techniques persistants avec les processeurs Ascend de Huawei. Après le succès de son modèle R1 en janvier, DeepSeek avait été encouragée par les autorités chinoises à adopter les puces Huawei plutôt que les produits Nvidia américains. Cependant, l'entreprise a rencontré d'importantes difficultés lors de la phase d'entraînement de son modèle R2.
Selon des sources proches du dossier, DeepSeek devait utiliser des puces Nvidia pour l'entraînement des modèles, tandis que les processeurs Ascend de Huawei n'étaient utilisés que pour l'inférence. Des experts du secteur soulignent que les puces chinoises, y compris celles de Huawei, sont souvent moins performantes que celles de Nvidia en matière de connectivité inter-puces, de prise en charge logicielle et de stabilité générale.
Huawei a dépêché des ingénieurs dans les locaux de DeepSeek pour aider à adapter le modèle. Malgré cette assistance sur place, la start-up n'a pas pu mener à bien un cycle d'entraînement sur le matériel Ascend. Initialement prévu pour mai, le lancement du modèle R2 a été reporté en raison de ces difficultés matérielles.
Alors que certains médias chinois spéculent sur un possible lancement du nouveau modèle dans les prochaines semaines, Liang Wenfeng, fondateur de DeepSeek, a exprimé sa frustration interne quant à son avancement, exhortant l'équipe à prendre le temps nécessaire pour développer un modèle qui préserve l'avantage concurrentiel de l'entreprise.
Parallèlement, les géants du secteur, tels qu'Alibaba et Tencent, continuent de publier rapidement des mises à jour, les modèles Qwen d'Alibabatracuntronparticulièrement fidèle.
Les plus grands experts en cryptomonnaies lisent déjà notre newsletter. Envie d'en faire partie ? Rejoignez-les!
Avertissement : Les informations fournies ne constituent pas un conseil en investissement. CryptopolitanCryptopolitan.com toute responsabilité quant aux investissements réalisés sur la base des informations présentées sur cette page. Nous voustrondentdentdentdentdentdentdentdent et/ou de consulter un professionnel qualifié avant toute décision d’investissement.
LES
- Quelles cryptomonnaies peuvent vous faire gagner de l'argent ?
- Comment renforcer la sécurité de votre portefeuille (et lesquels valent vraiment la peine d'être utilisés)
- Stratégies d'investissement peu connues utilisées par les professionnels
- Comment débuter en investissement crypto (quelles plateformes d'échange utiliser, quelles cryptomonnaies acheter, etc.)















