ロスアラモス国立研究所 (LANL) は、Venado スーパーコンピューターをデビューさせました。 この野獣は 10 エクサ FLOPS のパフォーマンスが可能で、エネルギー部門の AI ワークロード向けに特別に設計されています。 スーパーコンピューターは、基礎科学研究と国家安全保障のために人工知能と機械学習を統合するために利用される。
ニコラス C. メトロポリス モデリングおよびシミュレーション センターに設置されている Venado は、Nvidia および Hewlett Packard Enterprise (HPE) と協力して、ロス アラモス国立研究所によって設計および設置されています。
Venado スーパーコンピューターの能力とアーキテクチャ
ニューメキシコ州 LANL に拠点を置く Venado スーパーコンピューターには、2560 個の Nvidia の Grace Hopper スーパーチップと、スーパーコンピューターの AI 計算要件に合わせて特別に設計された Hewlett Packard Enterprise 独自の Slingshot 11 ネットワーク接続が装備されています。 Venado は、Nvidia が設計したスーパーチップを使用して構築された最初のスーパーコンピューターの 1 つでもあります。
このシステムは完全に水冷式で、920 個の Grace-Grace CPU と 2560 個の GH200 (Grace Hopper) スーパー チップ、合計 3480 個の Nvidia スーパーチップを誇ります。 GH200 は AI タスクを処理するためのメイン システム モジュールで、72 コアの Grace CPU と 480GB のメモリを搭載しています。 Grace CPU は、GPU を 2 番目の Grace CPU に交換するため、1 秒あたり 1 TB の帯域幅が可能です。 LANL ディレクターのトム・メイソン氏は次のように述べています。
「Venado は、国家安全保障と基礎研究を推進する最先端のスーパーコンピューティングを追加し、これらの課題に対処するために人工知能を統合する方法を加速します。」
出典: LANL 。
Venado は LANL の期待に応えます
Venado は、Nvidia Arm ベースのスーパー コンピューティング ユニットである Nvidia Grace Hopper スーパーチップ、および Nvidia Hopper アーキテクチャを使用して、大規模な人工知能アプリケーションを処理できるにもかかわらず、システム全体は非常にコンパクトです。 初期のテストでは、Venado が天体物理学のシミュレーションと材料科学のシミュレーションで重要な結果を生み出すことができることが示されました。 極度の精度ではなく、ワークフローの効率に重点が置かれています。
Venado は、実際には強力なスーパーコンピューターであり、大規模な言語モデルの処理に適しています。10 エクサフロップスというスコアを達成したのは、より高いフロー レートまたは処理速度のために精度を犠牲にすることによるものですが、これは LLM が必要とするものであるため、適切な人工知能の候補者。 しかし、AMD Frontierシステムと比較すると、まだ匹敵するものではありませんが、決して「ヤドンピストン」ではありません。 人工知能の要件により今日の需要となっている、精度の低いワークロードを適切に管理できるからです。 米国エネルギー省のデービッド・ターク副長官は次のように述べた。
「私たちのスーパーコンピューティング能力は、国立研究所が重要な問題に取り組む方法の重要な要素を表しています。」
さらに付け加えると、
「人工知能のアプローチを組み込む機能により、ロス アラモスの Venado システムが関心のある分野にどのように新しく有意義な結果をもたらすことができるのかを楽しみにしています。」
出典: LANL。
Venado は、さまざまなベンダーの専門知識を組み合わせた共同設計の美しい例です。 LANLは特にバイデン政権下で連邦政府から相当の支持を得ている。 米国政府は人工知能を真剣に受け止めており、機械学習に関する研究開発を優先しています。 Nvidia を搭載した強力なスーパーコンピューターですが、英国政府のプロジェクト Isambard には同じスーパーチップが 5448 個搭載されており、今年デビューする予定です。
ロスアラモス国立研究所のメモはここで。