ÚLTIMAS NOTÍCIAS

ao vivo AO VIVO: Valor de mercado da Nvidia atinge a impressionante marca de US$ 5,5 trilhões com o início da histórica viagem de Trump à China

há 23 horas Atualizações ao vivo
A Consensys adia seu IPO nos EUA para o outono de 2026 devido ao aprofundamento da queda no mercado de criptomoedas

de 10 minutos atrás Notícias
A OpenAI defende uma estrutura global de segurança para IA em meio ao aumento das tensões entre EUA e China

1 hora atrás Tecnologia
A administração Trump e executivos do setor de criptomoedas comemoram a expectativa de votação do projeto de lei Clarity Act no Senado

5 horas atrás Regulamento

SELECIONADO PARA VOCÊ

SEMANALMENTE

MANTENHA-SE NO TOPO

As melhores informações sobre criptomoedas direto na sua caixa de entrada.

A Nvidia expande os recursos de GPU para cargas de trabalho de IA do Kubernetes

Por

James Kinoti

Tempo de leitura: 2 minutos - 22 de março de 2024

A Nvidia impulsiona a IA no Kubernetes com o Picasso e enfrenta os desafios da GPU.
Soluções para otimização da utilização de GPUs e tolerância a falhas melhoram o desempenho do cluster.
A alocação dinâmica de recursos oferece aos desenvolvedores mais controle no Kubernetes.

A Nvidia, líder no fornecimento de unidades de processamento gráfico (GPUs), está reforçando seu suporte ao Kubernetes, a popular plataforma de orquestração nativa da nuvem, para aprimorar a implantação e o gerenciamento de cargas de trabalho de inteligência artificial (IA). Durante uma apresentação recente, a empresa revelou diversas iniciativas para otimizar a utilização de GPUs e o gerenciamento de recursos em ambientes Kubernetes.

Nvidia Picasso: Uma base para o desenvolvimento de IA

Em uma iniciativa significativa, a Nvidia apresentou o Nvidia Picasso, uma plataforma de IA generativa projetada para otimizar o desenvolvimento e a implementação de modelos fundamentais para tarefas de visão computacional. Construído sobre o Kubernetes, o Nvidia Picasso oferece suporte a todo o ciclo de vida do desenvolvimento de modelos, do treinamento à inferência. Essa iniciativa reforça o compromisso da Nvidia em promover a infraestrutura de IA, aproveitando o Kubernetes e contribuindo para o ecossistema nativo da nuvem.

A Nvidia está trabalhando ativamente para enfrentar os diversos desafios da execução de cargas de trabalho de IA em clusters Kubernetes. Três áreas principais de foco, destacadas pelo gerente de engenharia Sanjay Chatterjee, incluem posicionamento com reconhecimento de topologia, tolerância a falhas e otimização multidimensional.

O posicionamento com reconhecimento de topologia otimiza a utilização da GPU ao minimizar a distância entre os nós e as cargas de trabalho de IA em clusters de grande escala, aumentando a ocupação e o desempenho do cluster. O agendamento tolerante a falhas aprimora a confiabilidade das tarefas de treinamento ao detectar nós com falhas precocemente e redirecionarmaticas cargas de trabalho para nós íntegros, o que é crucial para evitar gargalos de desempenho e possíveis falhas.

A otimização multidimensional equilibra as necessidades dos desenvolvedores com os objetivos de negócios, as considerações de custo e os requisitos de resiliência por meio de uma estrutura configurável que toma decisões determinísticas levando em conta as restrições globais em clusters de GPUs.

Alocação dinâmica de recursos (DRA): capacitando desenvolvedores

Kevin Klues, engenheiro sênior da Nvidia, discutiu a Alocação Dinâmica de Recursos (DRA), uma API do Kubernetes projetada para dar aos desenvolvedores terceirizados mais controle sobre a alocação de recursos. Em versão alfa, a DRA permite que os desenvolvedores selecionem e configurem recursos diretamente, aprimorando o controle sobre o compartilhamento de recursos entre contêineres e pods. Esse avanço significativo complementa os esforços da Nvidia para otimizar a utilização da GPU e o gerenciamento de recursos.

A mais recente oferta de GPU da Nvidia, a B200 Blackwell, promete dobrar o poder das GPUs existentes para treinamento de modelos de IA, com suporte de hardware integrado para resiliência. A Nvidia está empenhada em colaborar ativamente com a comunidade Kubernetes para aproveitar esses avanços e abordar os desafios de escalabilidade de GPUs de forma eficaz. A colaboração da empresa com a comunidade em mecanismos de baixo nível para gerenciamento de recursos de GPU reforça seu compromisso em aprimorar a escalabilidade e a eficiência de cargas de trabalho de IA aceleradas por GPU no Kubernetes.

O caminho a seguir

À medida que a Nvidia continua a inovar e expandir seus recursos de GPU para ambientes Kubernetes, a integração de cargas de trabalho de IA com o Kubernetes está prestes a atingir novos patamares. Embora o Kubernetes tenha se consolidado como uma plataforma preferencial para a implantação de modelos de IA, a Nvidia reconhece que ainda há trabalho a ser feito para desbloquear todo o potencial das GPUs na aceleração de cargas de trabalho de IA no Kubernetes.

Graças aos esforços contínuos da Nvidia e da comunidade de desenvolvimento nativo da nuvem, o futuro reserva avanços promissores na implementação e gerenciamento de IA acelerados por GPU em ambientes Kubernetes.

Se você está lendo isto, já está um passo à frente. Continue assim assinando nossa newsletter.

Compartilhe este artigo

Aviso Legal. As informações fornecidas não constituem aconselhamento de investimento. CryptopolitanO não se responsabiliza por quaisquer investimentos realizados com base nas informações fornecidas nesta página. Recomendamostrona realização de pesquisas independentesdent /ou a consulta a um profissional qualificado antes de tomar qualquer decisão de investimento.

James Kinoti

Entusiasta de criptomoedas, James encontra prazer em compartilhar conhecimento sobre fintech, criptomoedas, blockchain e tecnologias de ponta. As últimas inovações na indústria de criptomoedas, jogos com criptomoedas, inteligência artificial, tecnologia blockchain e outras tecnologias são sua principal preocupação. Sua missão: estar por tracdas aplicações transformadoras em diversos setores.

ÍNDICE

1. Nvidia Picasso: Uma base para o desenvolvimento de IA

2. Alocação dinâmica de recursos (DRA): capacitando desenvolvedores

3. O caminho a seguir

Compartilhe este artigo

MAIS… NOTÍCIAS

MOSTRAR TUDO

5 aplicações engenhosas do ChatGPT e o que você deve fazer a respeito

Há 3 anos, da área de tecnologia John Palmer,

93% dos líderes empresariais preferem soluções baseadas em IA para a gestão da sustentabilidade da marca, segundo a Reuters

Há 3 anos, da área de tecnologia John Palmer,

Eis como Macron apoia o ecossistema de IA vibrante e produtivo da França

Há 3 anos, Tech Glory Kaburu

A Bloomberg estima que o mercado de IA generativa atingirá US$ 1,3 trilhão até 2032

3 anos atrás, da área de tecnologia Aamir Sheikh,

O que é Base? A rede Ethereum de camada 2 lançada pela Coinbase

21 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
Dogecoin vs. Bitcoin: Principais Diferenças Técnicas

20 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
O que é TVL (Valor Total Bloqueado) em criptomoedas?

14 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
Como ler um white paper de criptomoedas?

13 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
Ripple vs. XRP vs. XRP Ledger: Qual a diferença?

13 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes
O que é uma carteira multisig em criptomoedas?

10 de outubro de 2025 Aprenda Criptomoedas: Guias para Iniciantes

INTENSIVO AVANÇADAS
CURSO

Quais criptomoedas podem te fazer ganhar dinheiro?
Como aumentar a segurança da sua carteira digital (e quais realmente valem a pena usar)
Estratégias de investimento pouco conhecidas que os profissionais utilizam
Como começar a investir em criptomoedas (quais corretoras usar, as melhores criptomoedas para comprar etc.)