La startup chinoise spécialisée dans l'IA, DeepSeek, a dévoilé vendredi un aperçu de son modèle V4 tant attendu, tout en lançant pour la première fois une levée de fonds externe. Ces développements ont ébranlé certaines actions chinoises du secteur de l'IA, fait grimper les actions des fabricants de puces sur les marchés de Hong Kong et de Chine continentale, et relancé les questions sur les puces qui alimentent cette nouvelle version.
L'entreprise basée à Hangzhou a lancé la V4 en version bêta, offrant ainsi aux développeurs un accès anticipé pour tester ses fonctionnalités. À l'instar de son prédécesseur, le modèle V3, la V4 est open source : les développeurs peuvent donc télécharger, exécuter et modifier le code sur leurs propres systèmes. Le modèle est disponible en deux versions : une version « pro » et une version « flash » plus compacte.
DeepSeek a déclaré que V4 offre de bonnes performances par rapport à ses concurrents nationaux, notamment pour les tâches impliquant des agents d'IA, la gestion des connaissances et l'inférence. L'entreprise a également indiqué que le modèle a été conçu pour fonctionner avec les outils d'agents les plus utilisés, comme Claude Code d'Anthropic.
Cette annonce intervient plus d'un an après que le modèle de raisonnement R1 de DeepSeek a bouleversé les marchés technologiques mondiaux. Lors de sa sortie en janvier 2025, R1 a égalé, voire surpassé, de nombreux modèles d'IA de pointe. DeepSeek a révélé qu'il avait fallu seulement deux mois et moins de 6 millions de dollars pour le développer, en utilisant des puces Nvidia d'entrée de gamme. Cette révélation a inquiété les investisseurs et soulevé des questions quant à la suprématie américaine en IA, ainsi que sur les investissements colossaux des géants de la tech dans les infrastructures d'IA.
L'entreprise fait désormais face à une concurrence accrue dans le secteur florissant de l'IA en Chine. Alibaba et ByteDance figurent parmi les acteurs ayant lancé de nouveaux modèles cette année. Vendredi, la sortie de la version 4 a entraîné une baisse des actions de plusieurs sociétés chinoises spécialisées dans l'IA à Hong Kong.
Zhipu AI a chuté d'environ 8 à 9 %, MiniMax a baissé d'environ 7 à 8 % et Manycore Tech a glissé de 9 %.
Les actions des fabricants de puces, en revanche, ont évolué dans la direction opposée, la sortie de la version V4 ayant suscité l'optimisme quant à la demande stimulée par l'IA.
Semiconductor Manufacturing International Corp, le plus grand fabricant de puces du pays en volume, a bondi de 11 % à Hong Kong, tandis que Hua Hong Semiconductor a progressé de plus de 18 %.
Sur le continent, Cambricon Technologies et Moore Threads Technology ont chacune progressé de 4 % à 6 %, tandis que Hygon Information Technology a grimpé de plus de 10 %.
Quelles puces ont entraîné DeepSeek V4 ?
L'une des principales questions soulevées suite à cette annonce concerne le matériel utilisé par DeepSeek. Selon Reuters, Huawei a confirmé vendredi que son supernœud basé sur l'Ascend 950 est compatible avec le modèle V4 et a indiqué que l'ensemble de sa gamme de systèmes hautes performances fonctionne désormais avec la série V4.
Cependant, DeepSeek n'a pas précisé quelles puces avaient été utilisées pour entraîner le modèle, laissant la question sans réponse.
Les développeurs chinois d'IA sont empêchés d'acheter les puces les plus avancées de Nvidia en raison des contrôles américains à l'exportation entrés en vigueur en 2022. Depuis, Pékin a incité ses entreprises technologiques à se tourner vers des alternatives nationales proposées par des fabricants de puces tels que Huawei.
Le lancement de la V4 est intervenu au lendemain des accusations contre la Chine, l'accusant de voler à l'échelle industrielle la propriété intellectuelle des laboratoires d'IA américains, une accusation susceptible de tendre les relations avant le sommet prévu le mois prochain entre les dirigeants américains et chinois.
DeepSeek est au cœur de ce différend : Washington l’accuse d’avoir obtenu des puces Nvidia soumises à des restrictions, tandis que des sociétés comme Anthropic et OpenAI affirment qu’elle a copié illégalement leurs modèles propriétaires. L’ambassade de Chine à Washington a rejeté ces allégations, les qualifiant de « sans fondement »
Collecte de fonds pour retenir les chercheurs
Comme l'avait précédemment rapporté Cryptopolitan , DeepSeek est en pourparlers avec un petit groupe d'investisseurs stratégiques, dont Tencent et Alibaba, en vue de lever des fonds sur la base d'une valorisation supérieure à 20 milliards de dollars, sa première levée de fonds externe.
Le montant attendu se situe dans la fourchette basse des centaines de millions de dollars, bien en deçà des milliards généralement levés par ses concurrents. Moonshot, qui exploite les modèles d'IA Kimi, était dernièrement valorisée à 18 milliards de dollars, tandis que MiniMax et Zhipu affichent des valorisations respectives de 34 et 58 milliards de dollars.
Selon des sources proches du dossier, cette levée de fonds n'est pas motivée par un besoin urgent de cash , mais principalement par la volonté de fidéliser les chercheurs. Certains d'entre eux ont rejoint des concurrents dont la valorisation a explosé au cours de l'année écoulée. Les options d'achat d'actions représentent une part importante, voire la majeure partie, du salaire d'un chercheur en IA, et faute d'une valorisation claire, DeepSeek a peiné à rester compétitive.
Guo Daya, l'un des principaux auteurs de l'article R1, a rejoint ByteDance, tandis que Wang Bingxuan, un vétéran de l'équipe d'entraînement des modèles de DeepSeek, est parti pour Tencent.
Le fondateur Liang Wenfeng, qui a financé l'entreprise par le biais de sa société de trading quantitatif, envisage également d'autres options pour établir une valorisation, notamment un rachat d'actions ou une méthode de valorisation basée sur la performance, au cas où les conditions de levée de fonds ne pourraient être atteintes.
Photo de 