人工智能(AI)持续重塑着技术格局。随着我们迈入2024年,专家和人工智能代理纷纷对未来12个月将defi发展趋势做出预测
人工智能工作负载呈指数级增长
在ChatGPT、Bard和X.AI的Grok等人工智能应用已司空见惯的今天,人们对更大规模、更强大的人工智能模型的需求依然旺盛。计算能力的指数级增长使得大规模人工智能模型训练成为可能,而对更大、更优模型的需求丝毫没有减弱的迹象。如今,超大规模数据中心运营商面临着更大的挑战,他们需要利用包含数千个GPU的集群来支持更大规模的工作负载。.
这一增长是由新型人工智能算法的开发以及人工智能应用在各行各业的广泛采用所驱动的。因此,人工智能工作负载不断扩大,支持这些工作负载的GPU集群也在不断增长。这些集群的高效利用以及人工智能模型的成功训练在很大程度上取决于底层架构和网络连接。
开放式网络:范式转变
超大规模数据中心运营商已在其数据中心全面采用开放式和解耦式网络解决方案。这一转变背后的原因显而易见:单一的专有网络解决方案无法提供管理大规模计算资源所需的扩展性、灵活性和成本效益。.
专有网络解决方案长期以来一直适用于高性能计算 (HPC),但由于缺乏竞争,它们往往会扼杀创新并推高成本。另一方面,开放且标准化的网络解决方案对于人工智能生态系统的发展至关重要。它们能够为大规模工作负载提供经济高效的基础设施,促进大型语言模型 (LLM) 的普及,并使新应用蓬勃发展。.
超以太网联盟(UEC)将在这一转型过程中发挥关键作用,推动开放式人工智能网络向基于以太网的标准化模型转型。预计到2024年,以太网在人工智能后端网络中的应用将显著增长。.
边缘计算和分布式架构
虽然大型后端工作负载在处理复杂任务和训练大型人工智能模型方面表现出色,但2024年的趋势是将计算能力更靠近应用程序,从而提升用户体验,尤其是在需要快速决策的场景中。尽管完全分布式的人工智能工作负载今年可能无法实现,但边缘计算的发展势头仍在持续增强。.
这种转变需要前端和后端网络之间更频繁的互连。然而,这也凸显了一个紧迫的网络问题:这两个网络段之间的连接协议不一致。为了简化网络管理并有可能提升整体性能,业界正开始采取措施,通过引入诸如超以太网联盟(UEC)之类的倡议,朝着统一的网络解决方案迈进。.
可持续和节能型网络
随着人工智能工作负载的不断增加,尤其是涉及数千个GPU的工作负载,巨大的功耗已成为一个主要问题。虽然网络通信的能耗低于计算,但这仍然是一个需要解决的问题。此外,无论规模大小,碳足迹始终是一个关键问题。.
为此,新型人工智能网络解决方案预计将更加注重能源效率。这包括采用节能硬件,并遵循循环经济原则以促进可持续发展。此外,旨在提高资源利用率的先进软件预计也将日益受到重视。.
AIOps 已在网络领域崭露头角,多家厂商正积极部署该技术以提升网络运维效率。预计到 2024 年,对 AIOps 工具的持续投入将显著提升网络运维效率,并彻底改变网络格局。.
人工智能驱动的预测分析和实时异常检测在解决潜在网络问题和提高可靠性方面可以发挥关键作用。随着人工智能网络的发展,通过集成AIOps,高性能连接有望得到显著提升。.

