Une entreprise chinoise spécialisée dans l'intelligence artificielle a ajouté la reconnaissance d'images et de vidéos à son chatbot principal.
Dans le même temps, les fabricants de puces locaux ont démontré qu'ils pouvaient désormais égaler le soutien au lancement rapide qui était autrefois un point fort des Américains.
DeepSeek, une entreprise basée à Hangzhou, a discrètement ajouté une nouvelle fonctionnalité appelée « mode de reconnaissance d'images » à sa plateforme de messagerie. Ce nouveau mode s'ajoute aux deux autres lancés par l'entreprise au début du mois : « expert » et « flash »
Cette nouvelle fonctionnalité permet au chatbot de comprendre les photos et les vidéos, et pas seulement le texte.
Cela l'aligne sur d'autres chatbots IA majeurs qui offrent des capacités similaires depuis un certain temps.
Chen Xiaokang, qui dirige l'équipe multimodale de DeepSeek, a déclaré que l'outil avait d'abord été testé auprès d'un petit groupe d'utilisateurs, à la fois sur le site web et sur l'application mobile.
Chen Deli, chercheuse principale au sein de l'entreprise, a célébré le lancement par un court message faisant référence au logo de l'entreprise : « La petite baleine peut désormais voir. »
La fonctionnalité d'image et de vidéo est apparue quelques jours seulement après que DeepSeek a publié un aperçu de son tout nouveau modèle phare, le DeepSeek-V4, et a mis les poids du modèle à la disposition de tous pour téléchargement et utilisation.
V4 ne désigne pas un seul modèle, mais deux. Le premier, DeepSeek-V4-Pro, possède 1 600 milliards de paramètres et est conçu pour les tâches difficiles nécessitant un raisonnement complexe et des flux de travail automatisés en plusieurs étapes.
Le second, DeepSeek-V4-Flash, est conçu pour traiter un grand nombre de requêtes à moindre coût. Les deux modèles prennent en charge une fenêtre de contexte d'un million de jetons.
Ils utilisent également une conception d'attention hybride qui, selon l'entreprise, réduit la puissance de calcul et la mémoire nécessaires lors de l'inférence.
Les fabricants chinois de puces franchissent une nouvelle étape importante
Ce qui a retenu l'attention de nombreux observateurs du secteur, ce n'est pas seulement le modèle lui-même, mais ce qui s'est passé le jour de son lancement.
Quatre entreprises chinoises de semi-conducteurs, Huawei Ascend, Cambricon, Hygon Information et Moore Threads, ont toutes confirmé que leur matériel fonctionnait parfaitement avec la V4 dès le premier jour de sa sortie.
Ce type de prise en charge le jour même, où un nouveau modèle fonctionne parfaitement sur des puces non-NVIDIA dès son lancement au lieu de semaines ou de mois plus tard, était auparavant quasiment impossible en dehors de l'écosystème Nvidia.
Les puces Ascend de Huawei, notamment les A2, A3 et 950, prennent en charge à la fois V4-Pro et V4-Flash.
La société a déclaré que sa puce Ascend 950 utilise des processus de calcul fusionnés et des flux de traitement parallèles pour accélérer les inférences.
Cambricon a finalisé son adaptation en utilisant le framework d'inférence open-source vLLM et a partagé son code sur GitHub.
Hygon a déclaré avoir procédé à une optimisation poussée des modèles sur sa plateforme DCU afin de faciliter la transition entre la publication du modèle et son utilisation réelle.
Moore Threads a collaboré avec l'Académie d'intelligence artificielle de Pékin pour exécuter V4 sur sa carte MTT S5000 en utilisant la pile logicielle FlagOS.
Les observateurs du secteur affirment que ce lancement coordonné représente un véritable changement.
Pendant des années, il a fallu des mois pour que les puces fabriquées hors de l'écosystème Nvidia soient compatibles avec un nouveau modèle majeur. Le fait que huit chipsets nationaux différents fonctionnent dès le premier jour représente une étape importante.
Vue d'ensemble : coût et indépendance pour Deepseek
Les observateurs estiment que la signification plus profonde de ce lancement est que DeepSeek a démontré sa capacité à fournir une IA de haut niveau sans dépendre de matériel occidental.
En permettant à ses modèles de fonctionner nativement sur plusieurs puces chinoises simultanément, elle réduit les risques liés aux restrictions à l'exportation qui ont empêché les entreprises chinoises d'accéder aux processeurs américains les plus puissants.
Le coût est également un facteur important. DeepSeek s'est efforcé de maintenir un prix bas pour l'exécution de ses modèles. Cela permet aux entreprises de mettre en place des systèmes automatisés sans avoir à supporter des coûts informatiques exorbitants.
Ainsi, les améliorations et le lancement de Deepseek ne reposent pas principalement sur une seule avancée technique. Ils concernent plutôt la mise en place d'une chaîne d'approvisionnement complète.
D'après cette publication, la question de savoir qui est leader en IA semble passer de la question de savoir qui construit le modèle le plus intelligent, à celle de savoir qui peut maintenir l'ensemble du système en fonctionnement à moindre coût et de manièredentsur le long terme.

