Huawei ambitionne de conquérir une part importante du marché de l'IA en Chine, actuellement dominé par Nvidia. L'entreprise propose aux sociétés locales d'utiliser ses puces d'IA pour des tâches d'inférence.
Pour « entraîner » leurs systèmes d'intelligence artificielle, les principales entreprises chinoises s'appuient sur les GPU développés par Nvidia. Cette entreprise, dont la capitalisation boursière s'élève à 3 400 milliards de dollars, est considérée comme un acteur essentiel du développement de l'IA.
D'après un article , Huawei promeut ses nouveaux processeurs d'intelligence artificielle Ascend auprès de groupes chinois qui envisagent d'utiliser l'inférence. L'inférence est la fonction utilisée par les LLM (Learning Modeling) pour générer des réponses rapides.
Georgios Zacharopoulos, chercheur principal en intelligence artificielle spécialisé dans l'accélération de l'inférence au sein du laboratoire Huawei de Zurich, déclare : « L'entraînement est important, mais il n'a lieu que quelques fois. » Il ajoute que l'entreprise peut servir davantage de clients en se concentrant sur l'inférence.
Huawei est considéré comme un concurrenttronpour Nvidia en Chine
Le principal concurrent de Nvidia sur le marché local utilise des modèles d'IA entraînés sur les produits Nvidia intégrés aux puces Ascend. Selon les employés et les clients, la stratégie de Huawei présente moins de défis techniques et pourrait générer des profits importants.
L'entreprise a également fourni un outil pour combler le fossé entre les différents logiciels utilisés par les GPU Nvidia et Ascend.
Le gouvernement chinois soutient pleinement les initiatives de Huawei. Les autorités demandent aux entreprises technologiques locales d'utiliser les puces d'intelligence artificielle de Huawei plutôt que celles de Nvidia.
Une source proche des opérations de Nvidia en Chine a indiqué que l'entreprise est également considérée en interne comme le principal concurrent du pays, car la conception de ses puces est plus « avancée »
Contrairement aux géants américains de la technologie comme OpenAI et Google, les entreprises chinoises peinent à se procurer des GPU de haute qualité. En raison des restrictions américaines à l'exportation, Nvidia ne fournit à la Chine que des puces H2O de qualité inférieure. Ces puces restent néanmoins très demandées en Chine et sont plus performantes que celles fabriquées localement.
Les puces Huawei ne sont pas prêtes pour la connectivité inter-puces
Lin Qingyuan, analyste chez Bernstein China Semiconductor, a déclaré que si les performances des puces Huawei sont remarquables individuellement, la connectivité inter-puces reste un défi. Il a expliqué : « Lors de l’entraînement d’un modèle complexe, il est indispensable de le décomposer en tâches plus petites. Si une puce tombe en panne, le logiciel doit trouver un moyen pour que les autres prennent le relais sans délai. »
D'un autre côté, Huawei doit encore convaincre les développeurs d'abandonner CUDA, le logiciel « secret » de Nvidia, réputé pour sa facilité d'utilisation et sa capacité à traiter d'énormes quantités de données. Face à ce défi, un employé de Huawei, sous couvert d'anonymat, a déclaré que l'entreprise attendait une version mise à jour de l'Ascend 910C, « dotée d'un logiciel amélioré la rendant plus accessible aux développeurs ».
L'entreprise accélère sa capacité de production
Le Financial Times a également rapporté des données de SemiAnalysis indiquant qu'en 2024, Nvidia a réalisé un chiffre d'affaires de 12 milliards de dollars en Chine, dont 1 million de puces H2O vendues dans la région. Cela représente le double du chiffre d'affaires généré par l'Ascend 910B de Huawei.
Dylan Pater, analyste principal du cabinet d'études, a déclaré : « Les GPU H20 de Nvidia, spécifiques au marché chinois, représentent la majorité des puces d'IA vendues en Chine. » Toutefois, cet écart se réduit à mesure que Huawei accélère sa production.
Lin, de Bernstein, estime également que les entreprises chinoises peuvent commercialiser leurs produits plus rapidement grâce à leur « attention portée aux conclusions », plus marquée que celle des entreprises américaines. Par conséquent, « il est possible de réaliser d'importants gains d'efficacité même avec des puces moins puissantes »
Il a déclaré que les entreprises chinoises misent sur des coûts d'inférence moins élevés pour rester compétitives dans le domaine de l'IA et réduire le coût d'exécution des applications d'IA.

