跨国公司和科技公司英伟达宣布推出一项新服务,该服务可帮助企业和国家使用 Meta 最新的 LLM Llama 3.1 构建定制和专用的超级计算机。.
英伟达发布了两项面向企业和国家的新服务。这家科技巨头在英伟达AI Foundry中发布了一项服务,并在英伟达NIM中发布了推理微服务。这两项服务都利用了Meta最新的开源LLM库Llama 3.1,并能够创建生成式AI超级计算机。.
Nvidia AI Foundry 将帮助企业和国家创建针对特定行业需求和要求定制的超级 LLM 模型。这得益于 Llama 3.1 以及 Nvidia 的软件、硬件和人才。企业和国家可以选择使用专有数据或由 Llama 3.1 和 Nvidia Nemo trontron 模型生成的合成数据来训练这些超级模型。
另请阅读: 埃隆·马斯克称特斯拉将于2025年开始使用人形机器人
今天发布的 Llama 3.1 拥有 4050 亿个参数,旨在与 ChatGPT 和 Gemini 等闭源 AI 模型展开竞争。Meta 通过提供与 Llama 模型协同工作的附加组件,不断改进 Llama。Meta 与英伟达 合作,将 Llama 3.1 集成到英伟达的服务中,使该解决方案从一开始就可用。英伟达首席执行官黄仁勋表示:
“……NVIDIA AI Foundry 已全面集成 Llama 3.1,并已准备好帮助企业构建和部署定制的 Llama 超级模型。”
Llama 3.1 的生成式 AI 模型在超过 16,000 个 Nvidia H100 Tensor Core GPU 上进行训练。此外,它们还针对 Nvidia 的加速计算和软件进行了优化,从而能够部署在数据中心、云端以及配备 GPU 的个人电脑上。.
另请阅读: Meta 发布最大版本的 Llama 3 AI 模型
目前,全球众多企业已可使用 NIM Llama 微服务。埃森哲是首批为沙特阿美、AT&T 和 Uber 构建定制 Llama 超级模型的客户。这些企业将率先使用 Llama 3.1 访问 NIM 微服务。成功创建定制模型后,企业可以选择英伟达的微服务、运维平台和云平台来运行这些模型。.
上周,Mistral AI 与 Nvidia 合作发布了一款名为 Mistral NeMo 的 。该模型以 Nvidia NIM 推理微服务的形式提供。关于新的 GPU 硬件,有爆料称,某硬件技术公司将仅面向中国市场发布新一代 RTX 5090D。这款新 GPU 将是 RTX 4090D 的继任者。

