A Nvidia, uma corporação multinacional e empresa de tecnologia, anunciou o lançamento de um novo serviço que ajuda empresas e países a construir supercomputadores personalizados e especializados usando a versão mais recente do LLM da Meta, o Llama 3.1.
A Nvidia lançou dois novos serviços voltados para empresas e países. A gigante da tecnologia lançou um serviço dentro do Nvidia AI Foundry e microsserviços de inferência dentro do NVIDIA NIM. Ambos os serviços utilizam a mais recente biblioteca de código aberto LLMs da Meta, a Llama 3.1, e podem criar supercomputadores de IA generativa.
A Nvidia AI Foundry ajudará empresas e países a criar supermodelos de aprendizado de máquina (LLM) personalizados para atender às necessidades e exigências específicas de cada setor. Isso será possível graças ao uso do Llama 3.1 e aos softwares, hardwares e talentos da Nvidia. Empresas e países terão a opção de treinar esses supermodelos utilizando dados proprietários ou dados sintéticos gerados pelo Llama 3.1 e pelo modelo de recompensa Nvidiatron .
Leia também: Tesla começará a usar robôs humanoides em 2025, diz Elon Musk
O Llama 3.1, lançado hoje, possui 405 bilhões de parâmetros e está posicionado para competir com modelos de IA proprietários como ChatGPT e Gemini. A Meta está aprimorando continuamente o Llama, fornecendo componentes adicionais que funcionam com o modelo. A Meta e a Nvidia firmaram uma parceria para integrar o Llama 3.1 aos serviços da Nvidia, disponibilizando a solução desde o primeiro dia. O CEO da Nvidia, Jensen Huang, afirmou:
“…A NVIDIA AI Foundry integrou o Llama 3.1 em toda a sua estrutura e está pronta para ajudar empresas a criar e implantar supermodelos Llama personalizados.”
Os modelos generativos de IA do Llama 3.1 são treinados em mais de 16.000 GPUs Nvidia H100 Tensor Core. Além disso, são otimizados para computação acelerada e software da Nvidia, o que permite a implementação em data centers, nuvens e computadores pessoais com GPUs.
Leia também: Meta revela a maior versão do modelo de IA Llama 3
Atualmente, muitas empresas em todo o mundo têm acesso aos microsserviços NIM para Llama. A Accenture é a primeira cliente a criar supermodelos Llama personalizados para a Aramco, AT&T e Uber. Essas empresas serão as primeiras a acessar os microsserviços NIM usando o Llama 3.1. Após a criação bem-sucedida dos modelos personalizados, uma empresa pode escolher os microsserviços da Nvidia, uma plataforma de operações (OPs) e uma plataforma em nuvem para executar os modelos.
Na semana passada, a Mistral AI lançou um novo modelo 12B chamado Mistral NeMo em colaboração com a Nvidia. O modelo está disponível como um microsserviço de inferência Nvidia NIM. Em relação a novas GPUs, um informante afirmou que a empresa lançará uma nova RTX 5090D exclusivamente para o mercado chinês. A nova GPU será a sucessora da RTX 4090D.

