A IBM revelou o lançamento da versão mais recente de seu hardware mainframe, que incorpora atualizações destinadas a impulsionar a adoção da inteligência artificial. A empresa anunciou na terça-feira o novo hardware mainframe IBM z17, que estará disponível a partir de 18 de junho.
A empresa também afirmou que lançará uma ferramenta de gerenciamento de desempenho chamada IBM Z Operations Unite em maio. A empresa de tecnologia também lançará uma nova versão de seu sistema operacional para mainframe, o z/OS 3.2, no terceiro trimestre deste ano.
A IBM apresenta o hardware do computador mainframe IBM z17
Apresentado sem comentários:
A empresa de hardware e consultoria anunciou na segunda-feira o IBM z17, a versão mais recente de seu hardware de computador mainframe, projetado para mais de 250 casos de uso de IA, incluindo agentes de IA e IA generativa. pic.twitter.com/G7pgFoiLEq
— Tren Griffin (@trengriffin) 8 de abril de 2025
A gigante da tecnologia anunciou em 8 de abril o IBM z17, a versão mais recente de seu hardware mainframe. A empresa de hardware revelou que a nova versão foi desenvolvida para acelerar a adoção da Inteligência Artificial (IA).
A empresa de consultoria destacou que o IBM z17 é equipado com um processador IBM Telum II. A IBM também afirmou que a versão mais recente de seu hardware de mainframe foi projetada para mais de 250 casos de uso de IA, incluindo agentes de IA e IA generativa.
Os dados mostram que os mainframes são atualmente utilizados por 71% das empresas da Fortune 500 e podem lidar com 68% das cargas de trabalho de TI de produção em todo o mundo. A Market Research Future também indicou que o mercado de mainframes atingiu um valor estimado de US$ 5,3 bilhões em 2024.
A gigante da tecnologia observou que o z17 pode processar 450 bilhões de operações de inferência por dia, um aumento de 50% em relação ao seu antecessor, o IBM z16. O hardware de mainframe anterior foi lançado em 2022 e utilizava o processador Tellum original da empresa. A empresa afirmou que o novo hardware de mainframe foi projetado para se integrar totalmente com outros hardwares, softwares e ferramentas de código aberto.
Tina Tarquinio, vice-presidente de gerenciamento de produtos e design da IBM Z, mencionou que o novo acelerador de IA da empresa estava em desenvolvimento há cinco anos. Tarquinio também revelou que a IBM dedicou mais de 2.000 horas de pesquisa, coletando feedback de mais de 100 clientes durante o desenvolvimento do z17.
Tarquinio destacou que "no chip, estamos aumentando a aceleração da IA em sete vezes e meia". Ela também argumentou que isso representa cinco vezes e meia menos energia do que uma pessoa precisaria para realizar, por exemplo, processamento multimodelos em outro tipo de acelerador ou plataforma do setor.
A IBM projetou o z17 para as cargas de trabalho do futuro
A IBM revelou que os aceleradores de IA do novo sistema incluem o núcleo acelerador de IA integrado ao processador Telum II e o acelerador Spyre, que estará disponível no quarto trimestre de 2025. A empresa observou que, para o z17, o acelerador Spyre de 32 núcleos estará disponível como uma placa PCIe opcional, e placas adicionais poderão ser adicionadas conforme a necessidade.
“Construímos um acelerador completo. É um chip de sistema em um único chip, uma placa PCIe, um compilador, um ambiente de execução, um driver de dispositivo e assim por diante.”
~ Jeff Burns , Diretor do Centro de Pesquisa de Hardware de IA da IBM.
A pesquisadora científica Viji Srinivasan afirmou que havia toda uma pilha de software envolvendo o z17, e que o equilíbrio certo entre inovação de hardware e software foi fundamental para o desenvolvimento do Telum II e do Spyre.
A gigante da tecnologia afirmou que lançou o Centro de Hardware de IA da IBM Research em 2019 para se concentrar em atender às crescentes demandas de energia da IA com tecnologia mais eficiente. A empresa disse que sua estratégia de hardware de IA envolve computação de baixa precisão, que pode melhorar a eficiência energética dos sistemas que executam cálculos de IA. A empresa argumentou que projetar hardware de baixa precisão do zero proporcionaria um desempenho energético maior para aprendizado profundo do que tentar realizar computação aproximada nas GPUs ou CPUs disponíveis.
O diretor do programa, John Rozen, mencionou que "já prevíamos uma mudança nas cargas de trabalho computacionais, mesmo antes do ChatGPT". Ele também acredita que o sistema em chip (SoC) compensou com o acelerador Spyre e seus 32 núcleos.
Leland Chang, pesquisador principal e gerente sênior de Design de Hardware de IA, reconheceu que o projeto Watsonx serviu como um guia em meio às mudanças constantes na área de IA. Chang argumentou que o cronograma é um grande desafio no design de chips de IA, já que as cargas de trabalho mudam rapidamente, mas os chips levam anos para serem desenvolvidos. Ele também observou que, quando a equipe estava projetando o Spyre para otimizar um benchmark específico de inferência de IA, o objetivo mudou completamente em apenas dois meses.
A empresa de tecnologia afirmou que o acelerador Spyre foi projetado para lidar com as cargas de trabalho de IA emergentes que os clientes z17 trarão para sua plataforma. A gigante da tecnologia argumentou que o mainframe atualizado é otimizado para IA generativa e agentiva, por exemplo, modelos de classificação, em vez de modelos que estão perdendo relevância na área.
Foto de Dan Farber via Flickr.