最新消息
为您精选
每周
保持领先

最优质的加密货币资讯直接发送到您的邮箱。.

Gemini:大规模DNN芯片加速器的突破

经过荣耀卡布鲁荣耀卡布鲁
阅读时长:3分钟 发布
双子座
  • Gemini 可将 DNN 芯片的性能提升 1.98 倍。.
  • Gemini defi的创新型 LP SPM 优化空间。.
  • 重新defi芯片技术,提高深度神经网络推理效率。.

在不断发展的深度神经网络 (DNN) 领域,对计算能力和存储容量的需求呈指数级增长。芯片技术应运而生,成为满足这些需求的理想解决方案,它有望提升性能、降低功耗并增强设计灵活性。然而,芯片技术也面临着诸多挑战,例如封装成本高昂以及芯片间 (D2D) 接口成本高昂。为了应对这些挑战,清华大学、西安交通大学、中国信息科学研究院 (IIISCT) 和上海人工智能实验室的合作研究团队推出了 Gemini。这一突破性框架旨在革​​新大规模 DNN 芯片加速器。.

双子座表现出色,成绩斐然。

在他们近期发表的题为“Gemini:面向大规模DNN芯片加速器的映射与架构协同探索”的论文中,该研究团队提出了Gemini这一综合解决方案。这一创新框架专注于架构和映射的协同探索,旨在突破大规模DNN芯片加速器的极限。研究结果令人瞩目,与目前最先进的Simba架构相比,Gemini的平均性能提升了1.98倍,能效也显著提高了1.41倍。.

芯片技术面临的关键挑战

Gemini 的研发旨在应对芯片技术面临的两大挑战。在架构层面,关键挑战在于确定最佳的芯片粒度。这需要在提高良率(使用更多更小的芯片)和控制成本(选择更少但更大的芯片)之间取得微妙的平衡。在深度神经网络映射方面,挑战则源于芯片技术带来的规模优势以及与之相关的高昂的 D2D 链路成本。.

Gemini的创新解决方案

为了有效应对这些挑战,研究团队提出了一种以层为中心的编码方法,用于在多核芯片级深度神经网络(DNN)推理加速器中表示层处理暂存存储器(LP SPM)方案。这种编码方法界定了LP映射的优化空间,揭示了显著的改进机会。Gemini利用这种编码方法和一个高度可配置的硬件模板,构建了一个用于大规模DNN芯片级加速器的映射和架构协同探索框架。该框架包含映射引擎和货币成本评估器。.

映射引擎采用模拟退火 (SA) 算法,并结合五个专门设计的算子,来探索编码方法 defi的广阔空间。同时,它还能matic最小化成本高昂的 D2D 通信。此外,货币成本评估器会评估具有不同架构参数的加速器的货币成本。.

显著成果

一项使用 Tangram SPM 对 Gemini 的协同优化架构和映射与 Simba 架构进行对比的实证研究结果显而易见。Gemini 在各种深度神经网络和批次大小下均实现了平均 1.98 倍的显著性能提升和 1.41 倍的卓越能效提升。而这一切仅仅伴随着 14.3% 的成本增加。.

开创性进展

Gemini 工作的意义在于其开创性地系统地定义了用于深度神经网络推理加速器的matic规划系统性能 defi(LP SPM)的优化空间。Gemini 是首个同时探索大规模深度神经网络芯片加速器映射和架构优化空间的框架,并考虑了能耗、性能和成本等关键因素。.

深度神经网络推理加速器前景光明

研究团队最后强调了Gemini的潜力,它有助于在深度神经网络推理加速器中采用单个芯片组来实现多个加速器的功能。这项创新为这个快速发展的领域开辟了提高效率和促进创新的新途径。.

Gemini 是合作研究的结晶,它有望成为大规模深度神经网络芯片加速器领域的颠覆性创新。凭借令人瞩目的成果、创新的解决方案和开拓进取的精神,Gemini 蓄势待发,将重塑深度神经网络加速的格局。随着芯片技术的不断发展,Gemini 在提升性能、降低功耗和增强设计灵活性方面所做出的贡献必将对整个领域产生深远影响。.

最顶尖的加密货币专家都在阅读我们的简报。想 加入他们

分享这篇文章

免责声明: 提供的信息并非交易建议。Cryptopolitan.com Cryptopolitan研究 对任何基于本页面信息进行的投资概不负责。我们trondentdentdentdentdentdentdentdent /或咨询合格的专业人士。

更多…新闻
深度 密码
学速成课程