DERNIÈRES NOUVELLES
SÉLECTIONNÉ POUR VOUS
HEBDOMADAIRE
RESTEZ AU SOMMET

Les meilleures analyses crypto directement dans votre boîte mail.

Amazon lance une puce d'IA pour défier la domination de Nvidia-Google

ParJai HamidJai Hamid
4 minutes de lecture -
  • Amazon a lancé sa nouvelle puce d'IA Trainium3 pour concurrencer Nvidia et Google dans le domaine de l'entraînement des modèles d'IA.
  • La puce est désormais disponible dans les centres de données AWS, et son déploiement à grande échelle est prévu pour début 2026.
  • La plupart des puces Trainium3 sont actuellement utilisées par Anthropic, mais Amazon n'a pas annoncé d'autres clients importants.

Amazon a lancé cette semaine sa toute nouvelle puce d'entraînement d'IA, Trainium3, s'attaquant ainsi directement à la mainmise de Nvidia et Google sur le matériel.

L'accélérateur est déjà opérationnel dans un petit groupe de centres de données AWS et sera accessible aux clients mardi, d'après une interview de Dave Brown, vice-dent d'Amazon Web Services. Dave a précisé que l'entreprise n'y va pas par étapes.

« Dès le début de l'année prochaine, nous allons accélérer considérablement notre développement », a-t-il déclaré. L'objectif est simple : vendre davantage de puissance de calcul directement depuis les serveurs d'Amazon, au lieu de voir les développeurs dépenser leur argent ailleurs.

AWS reste le leader mondial du cloud en termes de puissance de calcul et de stockage loués. Toutefois, cette avance ne se confirme pas dans le domaine de l'entraînement d'IA à grande échelle. Certains développeurs privilégient Microsoft en raison de son lien avec OpenAI.

D'autres se tournent vers Google et ses puces internes. Amazon utilise désormais Trainium3 pour attirer à nouveau les équipes sensibles aux prix au sein de sa plateforme. L'argument principal : un coût unitaire de travail inférieur tout en conservant l'ensemble des ressources dans AWS.

Amazon déploie Trainium3 à l'échelle du cloud.

Trainium3 arrive environ un an après le déploiement par Amazon de sa dernière version. Ce rythme de développement est parmi les plus rapides du marché des puces. Lors de la première mise en service de la puce en août, un ingénieur d'AWS a plaisanté : « Ce qu'on espère surtout, c'est qu'il n'y ait ni fumée ni incendie. » Ce rythme de mise à jour soutenu reflète également le plan public de Nvidia de commercialiser une nouvelle puce chaque année.

Amazon affirme que les puces Trainium prennent en charge les calculs intensifs des modèles d'IA à moindre coût et avec une consommation d'énergie réduite par rapport aux GPU haut de gamme de Nvidia. Dave a déclaré : « Nous sommes très satisfaits du rapport prix/performances que nous avons obtenu avec Trainium. » L'entreprise mise beaucoup sur ce critère de prix face à la croissance de la taille des modèles et à l'augmentation constante des coûts de formation.

Il existe néanmoins une limite. Les puces d'Amazon ne disposent pas des bibliothèques logicielles avancées qui permettent aux équipes d'être performantes sur du matériel Nvidia. Bedrock Robotics, qui utilise l'IA pour piloter des engins de chantier sans intervention humaine, exécute ses principaux systèmes sur des serveurs AWS. Lors de l'entraînement de ses modèles pour guider une excavatrice, l'entreprise utilise toujours des puces Nvidia. Kevin Peterson, directeur technique de Bedrock Robotics, explique : « Nous avons besoin de performances élevées et d'une grande facilité d'utilisation. C'est ce que propose Nvidia. »

La majeure partie de la capacité Trainium est actuellement utilisée par Anthropic. Les puces fonctionnent dans des centres de données situés dans l'Indiana, le Mississippi et la Pennsylvanie. Plus tôt cette année, AWS a annoncé avoir connecté plus de 500 000 puces Trainium pour entraîner les derniers modèles d'Anthropic. Amazon prévoit de porter ce nombre à 1 million de puces d'ici la fin de l'année.

Amazon lie l'avenir de Trainium à la croissance d'Anthropic et à ses propres services d'IA. Hormis Anthropic, l'entreprise n'a jusqu'à présent cité que très peu de clients importants. De ce fait, les analystes disposent de peu de données pour évaluer les performances de Trainium dans un contexte d'utilisation plus large.

Anthropic répartit également ses risques liés à la puissance de calcul. L'entreprise utilise toujours les unités de traitement tenseur (TPU) de Google et a signé cette année un accord avec Google lui donnant accès à une puissance de calcul de plusieurs dizaines de milliards de dollars.

Amazon a dévoilé Trainium3 lors de re:Invent, sa conférence annuelle utilisateurs. L'événement s'est transformé en une présentation continue d'outils et d'infrastructures d'IA destinés aux développeurs qui créent de nouveaux modèles et aux entreprises prêtes à payer pour un accès à grande échelle.

Amazon déploie des mises à jour de Nova et ouvre Nova Forge

Mardi, Amazon a également mis à jour sa principale famille de modèles d'IA, connue sous le nom de Nova. La nouvelle gamme Nova 2 comprend une version appelée Omni.

Omni accepte le texte, les images, la parole ou la vidéo comme entrées. Il peut répondre par du texte et des images. Amazon propose une offre combinant différents types d'entrée et différents modèles, conçue pour une utilisation quotidienne à grande échelle.

Amazon continue de proposer ses modèles en fonction de leur rapport performance/prix. Les anciens modèles Nova n'ont pas figuré parmi les meilleurs dans les classements des tests standardisés qui évaluent les réponses à des questions prédéfinies. L'entreprise privilégie désormais l'expérience utilisateur réelle plutôt que les résultats des tests.

Rohit Prasad, qui dirige une grande partie du travail de modélisation d'Amazon et son équipe d'intelligence artificielle générale, a déclaré : « Le véritable critère de référence, c'est le monde réel », et a ajouté qu'il s'attend à ce que les nouveaux modèles soient compétitifs en conditions réelles.

Amazon offre également aux utilisateurs avancés un contrôle plus poussé des modèles grâce à un nouveau produit appelé Nova Forge, qui permet aux équipes de récupérer des versions des modèles Nova avant la fin de l'entraînement et de les façonner à l'aide de leurs propres données.

Reddit utilise déjà Nova Forge pour créer un modèle qui vérifie si une publication enfreint les règles de sécurité. Chris Slowe, directeur technique de Reddit, a déclaré que de nombreux utilisateurs d'IA privilégient le modèle le plus performant possible pour chaque tâche, plutôt que d'en entraîner un spécialisé. « La valeur ajoutée réside dans la capacité du modèle à devenir un expert dans notre domaine spécifique », a-t-il affirmé.

Avec Trainium3 désormais opérationnel dans les centres de données et la mise à jour simultanée des modèles Nova, Amazon mène une offensive sur deux fronts. La bataille matérielle l'oppose à Nvidia, tandis que la stratégie de modélisation la met en concurrence avec OpenAI, soutenu par Microsoft, et Google. La prochaine étape consiste à proposer une utilisation concrète aux clients à l'échelle du cloud.

Vous laissez encore la banque garder le meilleur ? Regardez notre vidéo gratuite sur comment devenir votre propre banque.

Partagez cet article
PLUS D'ACTUALITÉS
COURS ACCÉLÉRÉ CRYPTOMONNAIES
LES