Os novos chips Blackwell da Nvidia reduzem drasticamente o tempo de treinamento de IA

Por

Nélio Irene

Tempo de leitura: 3 minutos - 5 de junho de 2025

Os novos chips Blackwell da Nvidia reduzem drasticamente o tempo de treinamento de IA

Os novos chips Blackwell da Nvidia treinaram o modelo Llama 3.1 da Meta em apenas 27 minutos.
Utilizavam menos GPUs e eram mais do que o dobro mais rápidos que os chips anteriores da Nvidia.
Isso dá à Nvidia uma vantagem sobre rivais como a AMD e a Intel no treinamento de IA.

Os novos chips Blackwell da Nvidia estão mudando a velocidade com que os sistemas de inteligência artificial podem ser treinados.

Na última rodada de resultados de benchmarks divulgada na quarta-feira pela MLCommons, uma organização sem fins lucrativos que trace compara as capacidades de chips de IA, a arquitetura Blackwell, programada pela Nvidia, estabeleceu recordes.

Ao ser testado com o modelo de código aberto Llama 3.1 405B da Meta, um de seus maiores e mais complexos modelos de IA, o treinamento foi concluído em apenas 27 minutos usando chips Blackwell. Isso foi possível com apenas 2.496 GPUs Blackwell, uma ordem de magnitude menor do que seria necessário com os chips Hopper anteriores da Nvidia.

Em contraste, os projetos anteriores utilizavam mais de três vezes o número de GPUs Hopper para oferecer desempenho equivalente. Por chip, o Blackwell era mais que o dobro mais rápido, o que representou um enorme salto na eficiência de convergência. Esse tipo de aumento de desempenho pode se traduzir em economia significativa de tempo e custos para organizações que treinam modelos com trilhões de parâmetros.

Acredita-se que esses resultados sejam os primeiros do MLCommons para treinamento de modelos nessas escalas extremas e fornecem uma medida prática de quão bem os chips lidam com as cargas de trabalho de IA mais exigentes.

CoreWeave e Nvidia impulsionam uma escalabilidade de IA mais inteligente

Os resultados não só representaram uma vitória para a Nvidia, como também destacaram o trabalho da CoreWeave, uma empresa de infraestrutura em nuvem que foi parceira nos testes. Em uma coletiva de imprensa, o diretor de produtos da CoreWeave, Chetan Kapoor, apontou uma tendência geral que vem se tornando cada vez mais evidente no setor: o abandono de grandes blocos homogêneos com dezenas de milhares de GPUs.

Em vez de construir um único sistema de computação monolítico e massivo, as empresas agora estão buscando subconjuntos menores e interconectados que possam gerenciar o treinamento de modelos em larga escala de forma mais eficiente e com melhor escalabilidade.

Kapoor afirmou que, com essa técnica, os desenvolvedores podem continuar aumentando a escala ou reduzindo o tempo necessário para treinar modelos extremamente grandes com trilhões de parâmetros.

A transição para a implantação modular de hardware também se faz necessária, visto que o tamanho e a complexidade dos modelos de IA só tendem a aumentar.

Blackwell coloca a Nvidia na liderança em treinamento de modelos de IA

Embora o foco tenha se voltado recentemente para a inferência em IA, na qual modelos como o ChatGPT1 respondem a perguntas de usuários em tempo real, o treinamento ainda é a principal atividade do desenvolvimento de IA.

A etapa de treinamento confere inteligência a esses modelos, permitindo que compreendam a linguagem, lidem com alguns dos nossos problemas mais complexos e até mesmo produzam textos com sonoridade humana. O processamento computacional é extremamente exigente e requer milhares de chips de alto desempenho para operar por longos períodos, geralmente dias, senão semanas ou meses.

Isso mudou com a arquitetura Blackwell da Nvidia. Ao reduzir drasticamente o número de chips e o tempo necessário para treinar modelos de IA gigantescos, os chips Blackwell dão à Nvidia uma vantagem maior em um mercado onde velocidade e eficiência são fundamentais.

Anteriormente, o treinamento de modelos como o Llama 3.1 405B da Meta, que possui trilhões de parâmetros, precisava ser executado em enormes clusters de GPUs e era um processo caro e que consumia muita energia.

Esses ganhos de desempenho representam uma vantagem significativa em um momento em que há uma demanda crescente por modelos de IA cada vez maiores e mais poderosos em diversos setores — da saúde e finanças à educação e veículos autônomos.

Isso também envia uma mensagem clara aos rivais da Nvidia. Agora, empresas de chips como a AMD e a Intel, que estão trabalhando em seus chips específicos para IA, estão sob maior pressão para manter um ritmo semelhante.

A AMD submeteu-se ao teste de benchmark MLCommons, mas não apresentou resultados para um modelo tão grande quanto o Llamas 3.1 405B. A Nvidia foi a única a realizar os testes no nível mais alto do benchmark, comprovando que possuía hardware superior e capaz de enfrentar os desafios mais difíceis.

Se você está lendo isto, já está um passo à frente. Continue assim assinando nossa newsletter.

Nvidia

Compartilhe este artigo

Nélio Irene

Nellius é formada em Administração de Empresas e TI, com cinco anos de experiência no setor de criptomoedas. Ela também é graduada pela Bitcoin Dada. Nellius já contribuiu para importantes publicações de mídia, incluindo BanklessTimes, Cryptobasic e Riseup Media.

ÍNDICE

1. CoreWeave e Nvidia impulsionam uma escalabilidade de IA mais inteligente

2. Blackwell coloca a Nvidia na liderança em treinamento de modelos de IA

Compartilhe este artigo