AWS 为英伟达 AI 芯片打造定制散热技术

- AWS 开发了一种名为 In-Row 热交换器 (IRHX) 的定制液冷系统,用于冷却英伟达的下一代 AI GPU。.
- 英伟达的GPU会产生大量热量,需要比传统风冷系统更先进的散热方式。.
- AWS推出了采用这些带散热功能的Nvidia Blackwell GPU的新型P6e实例,用于AI工作负载。.
亚马逊的云计算部门亚马逊网络服务(AWS)设计了一种定制的冷却系统,以控制英伟达强大的新型人工智能(AI)芯片的温度。.
周三, AWS 宣布 开发了 In-Row 热交换器 (IRHX),这是一款专为配备高性能 Nvidia GPU 的数据中心设计的定制液冷系统。
用于训练大型人工智能模型(例如如今流行的聊天机器人或图像生成器)的这类芯片,是世界上最耗电的硬件之一。它们在人工智能工作负载中日益普及,给传统的散热解决方案,特别是风冷散热,带来了巨大压力。.
亚马逊并没有把可扩展的散热解决方案寄托于市场,而是另辟蹊径,自行解决了这个问题。IRHX 散热系统无需彻底重新设计,即可适用于改造和新建数据中心。它的工作原理是在服务器阵列附近循环冷却液,从而带走密集排列的 GPU 产生的热量。.
Dave Browndent AWS 计算与机器学习服务 解释 说,标准的冷却解决方案无法满足他们的需求。他表示,这些方案会浪费过多的 数据中心空间 ,而且用水效率低下。虽然这类系统或许适用于小型服务商的几个机柜,但他指出,它们缺乏支持 AWS 规模所需的液冷能力。
AWS推出搭载Nvidia Blackwell GPU的P6e实例
AWS 近期还 推出了 P6e 实例 ,该实例利用了英伟达的 GB200 NVL72,这是一个高密度超级计算平台,在一个机架中集成了 72 个 Blackwell GPU 。这些实例旨在应对大型 AI 模型和生成式 AI 任务的计算密集型特性。
此前,只有微软和CoreWeave等公司提供这种新一代GPU集群。现在,AWS客户也可以使用云端最新、最先进的定制GPU机器学习训练基础设施,该基础设施由最新一代水冷式NVIDIA A100 Tensor Core GPU提供支持。.
IRHX 可将这些集群单元保持在安全温度范围内,从而在避免过热的情况下提供最佳性能。通过将 IRHX 直接集成到数据中心设计中,AWS 可以避免等待对整个架构进行液冷改造,或支付昂贵的建设费用。.
布朗在发布P6e时指出,通过将GB200 NVL72系统与亚马逊的IRHX相结合,客户可以大规模地利用无与伦比的计算能力。此外,它还能让开发者、研究人员和企业比以往更快、更高效地训练规模更大的AI模型。.
亚马逊巩固了其在云基础设施领域的领先地位
亚马逊力推在建设中的数据中心自主研发冷却技术,这进一步揭示了其更广泛的战略意图,即掌控更多基础设施。近年来,AWS 投入巨资研发芯片、存储系统和 网络设备 ,以支持其云服务。
这些进步使亚马逊能够进一步减少对第三方供应商的依赖,并在运营绩效和成本之间取得平衡。.
这种策略取得了成功。2025年第一季度,AWS的运营利润率创下自成立以来的最高水平,如今已成为亚马逊整体盈利能力的主要引擎。IRHX的推出进一步巩固了AWS在云计算行业的创新领导地位和基础设施布局。.
其他科技巨头也在效仿。例如,微软自主研发了人工智能芯片及其配套的定制散热系统Sidekicks。谷歌和Meta也在探索构建专为人工智能工作负载量身定制的硬件和系统的方法。.
然而,亚马逊拥有一项关键优势——其遍布全球的庞大数据中心网络,以及多年来大规模构建和部署定制硬件的经验。IRHX 可以通过简化其人工智能就绪的基础设施,使其更加高效、可持续和可扩展,从而进一步增强这一优势。.
随着人工智能推动对更强大计算资源的需求,IRHX 等创新技术将比以往任何时候都更加重要。亚马逊再次证明了其在专用基础设施方面的大量投资是合理的,这不仅有助于其在竞争激烈的云端人工智能供应竞赛中保持竞争力,还能为未来的数据中心设计树立标杆。.
不要只是阅读加密货币新闻,要理解它。订阅我们的新闻简报, 完全免费。

内利乌斯·艾琳
内利乌斯拥有工商管理和信息技术双学位,并在加密货币行业拥有五年经验。她也是 Bitcoin Dada)的毕业生。内利乌斯曾为多家主流媒体撰稿,包括 BanklessTimes、Cryptobasic 和 Riseup Media。.
学速成课程
- 哪些加密货币可以让你赚钱
- 如何通过钱包提升安全性(以及哪些钱包真正值得使用)
- 专业人士使用的鲜为人知的投资策略
- 如何开始投资加密货币(使用哪些交易所、购买哪种加密货币最划算等)















