Nvidia, une société multinationale et une société technologique, a annoncé la sortie d'un nouveau service qui aide les entreprises et les pays à construire des superordinateurs personnalisés et spécialisés à l'aide du dernier LLM de Meta, Llama 3.1.
Nvidia a lancé deux nouveaux services destinés aux entreprises et aux pays. Le géant de la technologie a publié un service au sein de Nvidia AI Foundry et des microservices d'inférence au sein de NVIDIA NIM. Les deux services exploitent la dernière bibliothèque LLM open source de Meta, Llama 3.1, et peuvent créer des supercalculateurs d'IA générative.
Nvidia AI Foundry aidera les entreprises et les pays à créer des modèles super LLM personnalisés pour les exigences et les besoins spécifiques du secteur. Ceci est possible grâce à l'utilisation de Llama 3.1 et des logiciels, du matériel et des talents de Nvidia. Les entreprises et les pays auront la possibilité de former ces mannequins en utilisant des données propriétaires ou des données synthétiques générées à partir de Llama 3.1 et du modèle de récompense Nvidia Nemo tron .
Lire aussi : Tesla commencera à utiliser des robots humanoïdes en 2025, déclare Elon Musk
Llama 3.1, sorti aujourd'hui, possède 405 milliards de paramètres et est positionné pour concurrencer les modèles d'IA à source fermée comme ChatGPT et Gemini. Meta améliore continuellement Llama en fournissant des composants supplémentaires qui fonctionnent avec le modèle. Meta et Nvidia se sont associés pour intégrer Llama 3.1 dans les services de Nvidia, rendant ainsi la solution disponible dès le premier jour. Le PDG de Nvidia, Jensen Huang, a déclaré :
«… NVIDIA AI Foundry a intégré Llama 3.1 et est prête à aider les entreprises à créer et à déployer des mannequins Llama personnalisés.»
Les modèles d'IA générative de Llama 3.1 sont formés sur plus de 16 000 GPU Nvidia H100 Tensor Core. De plus, ils sont optimisés pour le calcul accéléré et les logiciels de Nvidia qui permettent un déploiement dans les centres de données, les nuages et sur les ordinateurs personnels alimentés par GPU.
Lisez aussi : Meta dévoile la plus grande version du modèle d'IA Llama 3
Actuellement, de nombreuses entreprises dans le monde ont accès aux microservices NIM pour Llama. Accenture est le premier client à créer des mannequins Llama personnalisés pour Aramco, AT&T et Uber. Ces entreprises seront les premières à accéder aux microservices NIM à l'aide de Llama 3.1. Après avoir créé avec succès des modèles personnalisés, une entreprise peut choisir les microservices de Nvidia, une plateforme OP et une plateforme cloud pour exécuter les modèles.
La semaine dernière, Mistral AI a publié un nouveau modèle 12B nommé Mistral NeMo en collaboration avec Nvidia. Le modèle est disponible sous forme de microservice d'inférence Nvidia NIM. Concernant le nouveau matériel GPU, un fuyard a affirmé que la société de technologie matérielle lancerait une nouvelle génération RTX 5090D uniquement pour le marché chinois. Le nouveau GPU sera le successeur du RTX 4090D.