A Inteligência Artificial (IA) continua a remodelar o panorama tecnológico. Ao entrarmos em 2024, especialistas e agentes de IA apresentam suas previsões sobre as tendências que defi as redes de IA nos próximos 12 meses.
Crescimento exponencial nas cargas de trabalho de IA
Em um mundo onde aplicações de IA como ChatGPT, Bard e Grok da X.AI se tornaram comuns, a busca por modelos de IA maiores e mais poderosos persiste. O crescimento exponencial da capacidade computacional possibilitou o treinamento de modelos de IA em larga escala, e a demanda por modelos maiores e melhores não mostra sinais de desaceleração. Os hiperescaladores agora enfrentam o desafio de suportar cargas de trabalho ainda maiores com clusters de milhares de GPUs.
Esse crescimento é impulsionado pelo desenvolvimento de novos algoritmos de IA e pela ampla adoção de aplicações de IA em diversos setores. Consequentemente, as cargas de trabalho de IA estão se expandindo e os clusters de GPUs que as suportam também estão crescendo. O uso eficiente desses clusters e o treinamento bem-sucedido de modelos de IA dependem fortemente da arquitetura subjacente e da conectividade de rede.
Redes abertas: uma mudança de paradigma
Os provedores de hiperescala já adotaram soluções de rede abertas e desagregadas em seus data centers. A justificativa para essa mudança é clara: soluções de rede monolíticas e proprietárias não conseguem oferecer a escalabilidade, a flexibilidade e a relação custo-benefício necessárias para gerenciar recursos computacionais de grande escala.
As soluções de rede proprietárias têm sido adequadas para Computação de Alto Desempenho (HPC) por muito tempo, mas tendem a sufocar a inovação e aumentar os custos devido à falta de concorrência. Por outro lado, soluções de rede abertas e padronizadas são essenciais para o crescimento do ecossistema de IA. Elas possibilitam infraestrutura com boa relação custo-benefício para cargas de trabalho de grande escala, fomentando a proliferação de Modelos de Linguagem de Grande Porte (LLMs) e permitindo que novas aplicações floresçam.
O Consórcio Ultra Ethernet (UEC) desempenhará um papel fundamental nessa transformação, promovendo redes de IA abertas para um modelo padronizado baseado em Ethernet. Prevê-se que a adoção do Ethernet para redes de back-end de IA cresça significativamente em 2024.
Computação de borda e arquitetura distribuída
Embora grandes cargas de trabalho de back-end se destaquem no processamento de tarefas complexas e no treinamento de extensos modelos de IA, a tendência em 2024 é aproximar o poder computacional dos aplicativos, aprimorando as experiências do usuário, especialmente em cenários que exigem tomada de decisão rápida. Embora uma carga de trabalho de IA totalmente distribuída possa não se concretizar este ano, o impulso em direção à computação de borda continua a crescer.
Essa mudança exige interconexões mais frequentes entre as redes de front-end e back-end. No entanto, também evidencia um problema urgente de rede: a inconsistência nos protocolos de conectividade entre esses dois segmentos de rede. Para simplificar o gerenciamento de rede e potencialmente aumentar o desempenho geral, o setor está começando a tomar medidas em direção a soluções de rede unificadas, introduzindo iniciativas como o Ultra Ethernet Consortium (UEC).
Redes sustentáveis e energeticamente eficientes
Com a intensificação das cargas de trabalho de IA, principalmente aquelas que envolvem milhares de GPUs, o consumo substancial de energia torna-se uma grande preocupação. Embora o impacto energético da rede seja menor do que o da computação, é uma preocupação que precisa ser abordada. Além disso, a pegada de carbono continua sendo uma questão fundamental, independentemente da escala.
Em resposta, espera-se que as novas soluções de redes de IA deem mais ênfase à eficiência energética. Isso inclui a adoção de hardware com baixo consumo de energia e o alinhamento com os princípios da economia circular para promover a sustentabilidade. Além disso, prevê-se que softwares avançados projetados para otimizar a utilização de recursos ganhem destaque.
AIOps já está deixando sua marca no mundo das redes, com diversos fornecedores implementando-a para aprimorar as operações de rede. Em 2024, espera-se que o aumento dos investimentos em ferramentas de AIOps impacte significativamente a eficiência das operações de rede, revolucionando o cenário das redes.
Impulsionadas por IA, as análises preditivas e a detecção de anomalias em tempo real podem desempenhar um papel fundamental na resolução de potenciais problemas de rede e na melhoria da confiabilidade. À medida que as redes de IA evoluem, a conectividade de alto desempenho está prestes a melhorar substancialmente com a integração de AIOps.

