La prochaine génération de puces d'IA personnalisées de Meta prendra en charge les modèles d'IA génératifs.
Dans un article de blog mercredi, Meta a déclaré que la nouvelle version de sa puce Meta Training and Inference Accelerator (MTIA) est « conçue en pensant à l’IA ».
La nouvelle puce AI de Meta prendra en charge les modèles GenAI
La première itération de MTIA a été dévoilée en mai 2023, notamment pour alimenter les modèles de recommandation d'apprentissage en profondeur de l'entreprise. Meta a déclaré que les nouvelles puces feraient plus que doubler la bande passante de calcul et de mémoire de leur prédécesseur et prendraient en charge les nouveaux services d'IA générative de l'entreprise et d'autres charges de travail d'IA.
Le MTIA de nouvelle génération sera de conception physiquement plus grande que le MTIA v1. Les puces auront 256 Mo de capacité de mémoire en chaîne et 2,7 To/s de bande passante mémoire en chaîne, contre 128 Mo et 800 Go/s, respectivement, sur l'ancienne génération.
Source : Métaplateformes.
La société a déclaré que les nouvelles puces fonctionnaient 3 fois mieux que la v1 sur quatre modèles clés au cours de la première phase de test.
Meta considère ses puces sur mesure comme une entreprise à long terme. "C'est un investissement qui devrait croître dans les années à venir, à mesure que les besoins en calcul pour prendre en charge les modèles d'IA augmentent parallèlement à la sophistication des modèles", a déclaré la société.
Les grandes technologies se tournent vers la création de puces personnalisées
Meta construisant ses puces d'IA s'appuie sur la tendance croissante des grandes entreprises technologiques qui se tournent vers la production de leurs propres puces pour répondre aux besoins de leur charge de travail d'IA dans un contexte de pénurie de puces.
"Il [MTIA] s'avère hautement complémentaire aux GPU disponibles dans le commerce en offrant la combinaison optimale de performances et d'efficacité sur les charges de travail spécifiques à Meta", a déclaré Meta.
Les concurrents de Meta, dont Google et Microsoft, construisent également leurs propres puces IA. Le 9 avril, Google a également annoncé une nouvelle puce d'IA propriétaire, qui, selon lui, est actuellement disponible pour les développeurs et spécialement conçue pour les centres de données.
Le fabricant de ChatGPT, OpenAI, envisage également de commencer à produire des puces pour les modèles d'IA. Selon certaines informations, OpenAI chercherait à lever jusqu'à 7 000 milliards de dollars pour le nouveau secteur des puces IA, qui pourrait devenir un concurrent sérieux de Nvidia, le plus grand producteur de puces IA.