IBM ha annunciato il lancio dell'ultima versione del suo hardware mainframe, che incorpora aggiornamenti volti a promuovere l'adozione dell'intelligenza artificiale. Martedì, l'azienda ha annunciato il nuovo hardware mainframe IBM z17, che sarà disponibile dal 18 giugno.
L'azienda ha inoltre dichiarato che introdurrà a maggio uno strumento di gestione delle prestazioni chiamato IBM Z Operations Unite. L'azienda tecnologica rilascerà inoltre una nuova versione del suo sistema operativo mainframe, z/Os 3.2, nel terzo trimestre di quest'anno.
IBM presenta l'hardware del computer mainframe IBM z17
Presentato senza commento:
"L'azienda di hardware e consulenza ha annunciato lunedì IBM z17, l'ultima versione del suo hardware per computer mainframe progettato per oltre 250 casi d'uso di intelligenza artificiale, tra cui agenti di intelligenza artificiale e intelligenza artificiale generativa." pic.twitter.com/G7pgFoiLEq
— Tren Griffin (@trengriffin) 8 aprile 2025
Il colosso della tecnologia ha annunciato l'8 aprile IBM z17, l'ultima versione del suo hardware mainframe. L'azienda produttrice di hardware per computer ha rivelato che l'ultima versione del suo hardware mainframe è stata sviluppata per accelerare l'adozione dell'intelligenza artificiale.
La società di consulenza ha sottolineato che IBM z17 è basato su un processore IBM Telum II. IBM ha inoltre affermato che l'ultima versione del suo hardware mainframe è progettata per oltre 250 casi d'uso di intelligenza artificiale, inclusi agenti di intelligenza artificiale e intelligenza artificiale generativa.
I dati mostrano che i mainframe sono attualmente utilizzati dal 71% delle aziende Fortune 500 e possono gestire il 68% dei carichi di lavoro IT di produzione a livello mondiale. Market Research Future ha inoltre indicato che il mercato dei mainframe valeva circa 5,3 miliardi di dollari nel 2024.
Il colosso della tecnologia ha osservato che lo z17 può elaborare 450 miliardi di operazioni di inferenza al giorno, con un incremento del 50% rispetto al suo predecessore, l'IBM z16. Il precedente hardware mainframe è stato rilasciato nel 2022 e utilizzava il processore Tellum originale dell'azienda. L'azienda ha affermato che il nuovo hardware mainframe è progettato per integrarsi completamente con altri hardware, software e strumenti open source.
Tina Tarquinio, vicepresidente della gestione e progettazione dei prodotti per IBM Z, ha affermato che il nuovo acceleratore di intelligenza artificiale dell'azienda è in fase di sviluppo da cinque anni. Tarquinio ha anche rivelato che IBM ha dedicato oltre 2.000 ore di ricerca per raccogliere feedback da oltre 100 clienti durante la progettazione di z17.
Tarquinio ha sottolineato che "sul chip stiamo aumentando l'accelerazione dell'IA di sette volte e mezzo". Ha anche sostenuto che si tratta di un consumo energetico cinque volte e mezzo inferiore a quello che una persona impiegherebbe per realizzare un modello multiplo su un altro tipo di acceleratore o piattaforma del settore.
IBM progetta z17 per i carichi di lavoro di domani
IBM ha rivelato che gli acceleratori AI del nuovo sistema includono il core dell'acceleratore AI incorporato nel processore Telum II e lo Spyre Accelerator, che sarà disponibile nel quarto trimestre del 2025. L'azienda ha sottolineato che per z17, l'acceleratore Spyre a 32 core sarà reso disponibile come scheda PCIe opzionale e che, se necessario, sarà possibile aggiungere altre schede.
"Abbiamo costruito un acceleratore completo. È un chip system-on-chip, una scheda PCIe, un compilatore, un runtime, un driver di dispositivo e così via."
~ Jeff Burns , Direttore dell'IBM Research AI Hardware Center.
Lo scienziato ricercatore Viji Srinivasan ha affermato che c'era un intero stack software che coinvolgeva z17 e che fondamentale per lo sviluppo di Telum II e Spyre era il giusto equilibrio tra innovazione hardware e software.
Il colosso della tecnologia ha dichiarato di aver lanciato l'IBM Research AI Hardware Center nel 2019 per concentrarsi sul soddisfacimento dell'imminente domanda energetica dell'intelligenza artificiale con tecnologie più efficienti. L'azienda ha affermato che la sua strategia hardware per l'intelligenza artificiale prevede l'elaborazione a bassa precisione in grado di migliorare l'efficienza energetica dei sistemi che eseguono calcoli di intelligenza artificiale. L'azienda ha sostenuto che progettare hardware a bassa precisione da zero avrebbe prodotto prestazioni energetiche migliori per il deep learning rispetto al tentativo di eseguire elaborazioni approssimative sulle GPU o CPU disponibili.
Il direttore del programma, John Rozen, ha affermato che "abbiamo assistito a un cambiamento nei carichi di lavoro di elaborazione, anche prima di ChatGPT". Ritiene inoltre che il sistema su chip abbia dato i suoi frutti con Spyre Accelerator e i suoi 32 core.
Leland Chang, membro principale dello staff di ricerca e senior manager della divisione AI Hardware Design, ha riconosciuto che Watsonx ha svolto un ruolo guida nei venti mutevoli dell'IA. Chang ha sostenuto che la tempistica rappresenta una sfida importante nella progettazione di chip per l'IA, poiché i carichi di lavoro cambiano rapidamente, ma i chip richiedono anni per essere sviluppati. Ha anche osservato che quando il team stava progettando Spyre per ottimizzare uno specifico benchmark di inferenza dell'IA, l'obiettivo è cambiato radicalmente in appena due mesi.
L'azienda tecnologica ha affermato che l'acceleratore Spyre è stato progettato per gestire i carichi di lavoro di intelligenza artificiale emergenti che i clienti z17 introdurranno sulla sua piattaforma. Il colosso tecnologico ha sostenuto che il mainframe aggiornato è ottimizzato per l'intelligenza artificiale generativa e agentiva, ad esempio per i modelli di classificazione, piuttosto che per i modelli che il settore sta attualmente utilizzando.
Foto di Dan Farber tramite Flickr.