Nvidia, una corporación multinacional y compañía de tecnología, ha anunciado el lanzamiento de un nuevo servicio que ayuda a las empresas y países a construir supercomputadoras personalizadas y especializadas utilizando el último LLM de Meta, Llama 3.1.
Nvidia lanzó dos nuevos servicios dirigidos a empresas y países. El gigante tecnológico lanzó un servicio dentro de Nvidia AI Foundry y microservicios de inferencia dentro de NVIDIA NIM. Ambos servicios aprovechan Llama 3.1, la última biblioteca LLM de código abierto de Meta, y permiten crear supercomputadoras de IA generativa.
Nvidia AI Foundry ayudará a empresas y países a crear modelos LLM avanzados, personalizados para las necesidades y requisitos específicos de cada sector. Esto es posible gracias al uso de Llama 3.1 y al software, hardware y talento de Nvidia. Las empresas y los países podrán entrenar estos supermodelos con datos propios o datos sintéticos generados por Llama 3.1 y eltron modelo de recompensas
Lea también: Tesla comenzará a usar robots humanoides en 2025, dice Elon Musk
Llama 3.1, que se lanzó hoy, tiene 405 mil millones de parámetros y está posicionado para competir con modelos de IA de código cerrado como ChatGPT y Gemini. Meta mejora continuamente Llama proporcionando componentes adicionales que funcionan con el modelo. Meta y Nvidia se asociaron para integrar Llama 3.1 en los servicios de Nvidia, haciendo que la solución esté disponible desde el primer día. El CEO de Nvidia, Jensen Huang, dijo:
“…NVIDIA AI Foundry ha integrado Llama 3.1 en todo su esplendor y está lista para ayudar a las empresas a crear e implementar supermodelos Llama personalizados”
Los modelos de IA generativa de Llama 3.1 se entrenan en más de 16 000 GPU Nvidia H100 Tensor Core. Además, están optimizados para la computación acelerada y el software de Nvidia, lo que permite su implementación en centros de datos, nubes y ordenadores personales con GPU.
Lea también: Meta presenta la versión más grande del modelo de IA Llama 3
Actualmente, muchas empresas de todo el mundo tienen acceso a microservicios NIM para Llama. Accenture es el primer cliente en crear supermodelos Llama personalizados para Aramco, AT&T y Uber. Estas corporaciones serán las primeras en acceder a microservicios NIM con Llama 3.1. Tras crear con éxito modelos personalizados, una empresa puede elegir los microservicios de Nvidia, una plataforma de OPs y una plataforma en la nube para ejecutar los modelos.
La semana pasada, Mistral AI lanzó un nuevo modelo 12B llamado Mistral NeMo en colaboración con Nvidia. El modelo está disponible como microservicio de inferencia NIM de Nvidia. En cuanto al nuevo hardware de GPU, un filtrador afirmó que la compañía de tecnología de hardware lanzará una nueva generación de RTX 5090D solo para el mercado chino. Esta nueva GPU será la sucesora de la RTX 4090D.

