Nvidia pourrait faire face à de nouveaux retards concernant ses puces d'IA Blackwell, qui, introduites plus tôt cette année, surchaufferaient dans les configurations serveur, ce qui suscite des inquiétudes.
D'après The Information, on craint que ces puces ne posent problème aux grands consommateurs de services cloud comme Meta Platforms, Google et Microsoft. Ces craintes surviennent alors que ces géants de la technologie s'apprêtent à développer des centres de données reposant sur cette technologie.
Nvidia a demandé une refonte des racks pour résoudre le problème
ces informations , la surchauffe serait due à des puces installées dans des baies de serveurs conçues pour supporter jusqu'à 72 unités. Afin de limiter ce problème, Nvidia a demandé à ses fournisseurs de modifier régulièrement la configuration des baies.
Les nombreuses modifications apportées aux baies ont suscité des inquiétudes chez ses clients quant aux retards dans l'installation des nouvelles technologies de centres de données d'IA.
Certains consommateurs et membres du personnel ont confirmé le problème de surchauffe des puces Blackwell AI.
« Nvidia travaille avec les principaux fournisseurs de services cloud dans le cadre de ses activités, qui font partie intégrante de son équipe et de ses processus d'ingénierie », a déclaré un porte-parole de Nvidia à Reuters .
« Ces itérations techniques sont normales et prévues. »
Porte-parole de Nvidia.
Les puces d'IA de Blackwell ont été dévoilées pour la première fois en mars et devaient arriver sur le marché au deuxième trimestre, mais des retards de livraison ont par la suite affecté les calendriers de déploiement des clients.
Ces puces combineraient deux composants en silicium en une seule unité, conçue pour fonctionner plus rapidement que les versions précédentes dans des tâches telles que la création de réponses pour les chatbots.
Selon Guru Focus, les produits Nvidia étant essentiels aux principales plateformes technologiques, ce numéro tracles tentatives du géant technologique pour asseoir son leadership dans l'IA et le cloud computing.
De plus, ce problème de surchauffe pourrait soulever des questions quant à la capacité de répondre aux besoins croissants des projets d'IA à forte intensité de données.
Le géant de la fabrication de puces n'a pas encore révélé quels fournisseurs contribuent à résoudre les problèmes de conception ni quand les problèmes de surchauffe pourront être réglés. Ces retards supplémentaires pourraient impacter les projets d'infrastructure d'IA de ses clients stratégiques.
Le cours de l'action Nvidia a chuté suite à l'annonce de la surchauffe
Un de Tom's Hardware indiquait que la sortie des puces d'IA Blackwell était déjà retardée de plusieurs mois car Nvidia travaillait sur un défaut de conception qui affectait les rendements de production.
Les investisseurs état d'un échauffement de ses puces d'IA Blackwell lorsqu'elles sont installées sur des baies de serveurs haute capacité.
L'action a reculé de 2,9 % lors des échanges avant l'ouverture de la bourse. Toutefois, depuis le début de l'année, elle affiche une hausse de 187 %.
« Nous avions entendu dire le mois dernier que la conception des serveurs était encore en cours de finalisation, mais nous serions surpris si les livraisons de NVL72 étaient sensiblement retardées par des problèmes de chaleur (et de refroidissement) », a déclaré Matt Bryson, analyste chez Wedbush Securities, dans une note à ses clients lundi.
« Cela dit, c’est un sujet que nous aborderons lors de la conférence SC24 cette semaine. »
Bryson.
La conférence SC24, consacrée au calcul haute performance, aux réseaux et à l'analyse de données, se tient à Atlanta. Nvidia devrait publier ses résultats du troisième trimestre ce mercredi.
L'annonce de surchauffes a ravivé les inquiétudes quant à l'impact de l'IA sur la consommation d'énergie et d'eau. Les GPU de dernière génération seraient jusqu'à 30 fois plus rapides que les précédents. Plus un GPU est puissant, plus il génère de chaleur.
Selon PCmag , l'exécution de modèles d'IA génératifs nécessite beaucoup d'énergie ainsi que d'eau pour refroidir les serveurs, ce qui conduit à certaines prédictions selon lesquelles les centres de données connaîtront des pénuries d'eau dès 2025, car les entreprises technologiques ne sont pas aussi rapides à ajouter de l'électricité au réseau électrique qu'elles n'ajoutent de centres de données.

