Nvidia, multinazionale del settore tecnologico, ha annunciato il lancio di un nuovo servizio che aiuta aziende e paesi a costruire supercomputer personalizzati e specializzati utilizzando l'ultima versione di LLM di Meta, Llama 3.1.
Nvidia ha lanciato due nuovi servizi rivolti ad aziende e paesi. Il colosso tecnologico ha reso disponibile un servizio all'interno di Nvidia AI Foundry e microservizi di inferenza all'interno di NVIDIA NIM. Entrambi i servizi sfruttano la più recente libreria open-source LLM di Meta, Llama 3.1, e consentono di creare supercomputer generativi basati sull'intelligenza artificiale.
Nvidia AI Foundry aiuterà aziende e paesi a creare modelli LLM avanzati personalizzati per le esigenze e i requisiti specifici di ciascun settore. Ciò è possibile grazie all'utilizzo di Llama 3.1 e del software, dell'hardware e delle competenze di Nvidia. Aziende e paesi avranno la possibilità di addestrare questi modelli avanzati utilizzando dati proprietari o dati sintetici generati da Llama 3.1 e dal modello di ricompensa Nvidiatron .
Leggi anche: Tesla inizierà a utilizzare robot umanoidi nel 2025, afferma Elon Musk
Llama 3.1, rilasciato oggi, ha 405 miliardi di parametri ed è posizionato per competere con modelli di IA proprietari come ChatGPT e Gemini. Meta migliora continuamente Llama fornendo componenti aggiuntivi che funzionano con il modello. Meta e Nvidia hanno collaborato per integrare Llama 3.1 nei servizi di Nvidia, rendendo la soluzione disponibile fin dal primo giorno. Il CEO di Nvidia, Jensen Huang, ha dichiarato:
"...NVIDIA AI Foundry ha integrato Llama 3.1 in tutte le sue componenti ed è pronta ad aiutare le aziende a creare e implementare supermodelli Llama personalizzati."
I modelli di intelligenza artificiale generativa di Llama 3.1 sono addestrati su oltre 16.000 GPU Nvidia H100 Tensor Core. Inoltre, sono ottimizzati per il calcolo accelerato e il software Nvidia, il che ne consente l'implementazione in data center, cloud e su personal computer dotati di GPU.
Leggi anche: Meta svela la versione più grande del modello AI Llama 3
Attualmente, molte aziende in tutto il mondo hanno accesso ai microservizi NIM per Llama. Accenture è il primo cliente ad aver creato supermodelli Llama personalizzati per Aramco, AT&T e Uber. Queste aziende saranno le prime ad accedere ai microservizi NIM utilizzando Llama 3.1. Dopo aver creato con successo i modelli personalizzati, un'azienda può scegliere i microservizi di Nvidia, una piattaforma OPs e una piattaforma cloud per eseguire i modelli.
La scorsa settimana, Mistral AI ha rilasciato un nuovo modello a 12 bit chiamato Mistral NeMo in collaborazione con Nvidia. Il modello è disponibile come microservizio di inferenza NIM di Nvidia. Per quanto riguarda il nuovo hardware GPU, un leaker ha affermato che l'azienda di tecnologia hardware rilascerà una nuova generazione di RTX 5090D solo per il mercato cinese. La nuova GPU sarà la successore della RTX 4090D.

