Nvidia H20とH200は、中国の合成データセットで完全にトレーニングされたAIモデルの強化に役立ちます

-
清華大学とマイクロソフトは、どの段階でも現実世界からの入力を一切行わず、合成データのみを使用して完全な AI コーディング モデルをトレーニングしました。.
-
このモデルは、Nvidia H20 および H200 チップを使用し、パラメータとデータが少ないにもかかわらず、より大きなコーディング モデルよりも優れていました。.
-
中国はまた、既存のAIチップよりも数百万倍少ないエネルギーで4.6PFLOPSを達成する光ベースのACCELチップも発表した。.
清華大学とマイクロソフトアジア研究所は、偽データのみを用いて完全なAIモデルを訓練しました。実世界のサンプルは一切使用していません。.
データセット全体はSynthSmithと呼ばれる新しいパイプラインを通じて人工的に生成され、システムは最初から最後までNvidiaのチップ上で動作しました。チームは単なる目新しいテストを成功させたわけではありません。70億のパラメータを持つ実用的なモデルを構築し、人間のデータで学習させたはるかに大規模なモデルを凌駕しました。.
1月11日にarXivに投稿された彼らの論文によると、彼らが訓練したX-Coderは、現実世界のテキストを一度も見たことがないにもかかわらず、140億のパラメータを持つコーディングモデルよりも優れたパフォーマンスを発揮したという。.
「詳細な分析により、合成データセットにおいてスケーリング則が成立することが明らかになった」と研究者らは記している。このチームには、清華大学、マイクロソフト・リサーチ・アジア、武漢大学の研究者が名を連ねている。.
研究者はNVIDIAチップを使用して現実世界のデータを完全にスキップする
トレーニング設定はNvidiaのハードウェアに大きく依存していた。教師あり微調整では、128個のNvidia H20チップを220時間連続で使用した。その後、強化学習フェーズを処理するために、32個のH200チップに切り替えてさらに7日間使用した。これらは偶然の選択ではない。H20は推論用に調整されており、H200はハイエンドのトレーニング用に設計されている。これらは、Nvidiaが 中国 で入手可能にするために強力なロビー活動を行った結果、トランプ政権が輸出規制の免除を承認したおかげで、現在中国企業が入手できる最も強力なチップである。
研究者たちは、スケーリングに関してはパイプライン自体が問題ではなく、計算能力が問題だと述べた。.
筆頭著者で清華大学の修士dent の学生である Wu Jie 氏は、パイプラインを 1,000 億または 1,000 兆パラメータのモデルにまで拡張しなかった本当の理由は、単に「パイプライン自体の制限ではなく、計算上の制約」であると述べました。
コードを公開することで、他の人々が莫大なトレーニング費用を払うことなくプロジェクトを発展させることができると期待している。論文ではAIのトレンドについても指摘している。.
モデルはより長い時間枠で「考え」、複雑な推論を処理することが求められるようになり、トレーニングだけでなく推論中にもはるかに多くの計算が必要になりました。.
中国チームが古い製造技術を使ってより高速なチップを開発
これとは別に、中国の科学者たちは電気ではなく光の粒子を使って「ACCEL」と呼ばれる新しいチップを開発しました。このチップ(電子と光を組み合わせたオールアナログチップの略 実験tronは 室でテストされ、4.6 PFLOPSの性能を達成しました。
これはNvidiaのA100よりも3000倍高速で、中国製のこのチップは消費電力が400万分の1に抑えられている。そのため、 チップ 画像認識や自動運転といった特定のタスク向けに作られた
まだCPUやスマートフォンのチップに取って代わるものではないが、ウェアラブル、電気自動車、スマートファクトリーなどで活用できるとチームは考えている。.
このチップは、セミコンダクタ・マニュファクチャリング・インターナショナル社(SMC)が20年前のプロセスを用いて製造した。これにより、中国が未だに利用できない最先端のリソグラフィー装置を必要としなくなった。.
「光コンピューティングシステムの導入は、複雑な構造設計やノイズ、システムエラーに対する脆弱性のため、これまで困難を伴っていた」と清華大学は 述べている 記事の中で
このチップは、光子とアナログ電子tronを新しいフレームワークに統合することで、この問題を回避します。ファイル圧縮などの一般的なコンピューティングタスクは処理できませんが、AIビジョンや低照度センシングには最適です。.
驚くべき事実が一つあります。現代のチップを1時間動作させるのに必要なエネルギーは、ACCELを500年間稼働させられるほどです。この低消費電力により、チップの小型化を制限する熱問題への対処も容易になります。.
このチップの機能には、交通dent、低照度画像撮影、そして周囲の光を直接センシングプロセスに利用するリアルタイムビジョンなどが含まれます。開発チームによると、これは汎用チップではありませんが、非常に特殊なニーズを満たすものです。.
資金は、国家重点研究開発計画と中国国家自然科学基金から提供されました。研究者の一人が共同設立した北京のチップメーカーMakeSensもこの研究に関わっており、最近、低消費電力アナログチップも発売しました。.
プロジェクトのリーダーの一人である清華大学の戴瓊海氏は、新しいコンピューティングアーキテクチャの構築は単なる第一歩に過ぎないと語った。.
「より重要な課題は、この新しいアーキテクチャを実際のアプリケーションに導入し、主要な国家および公共のニーズを解決することであり、それが私たちの責任です。」
チームはこのチップがいつ市場に出るかについては何も語っていない。.
この記事を読んでいるあなたは、既に一歩先を行っています。 ニュースレターを購読して、その優位性を維持しましょう。

ジャイ・ハミド
ジェイ・ハミドは過去6年間、仮想通貨、株式市場、テクノロジー、世界経済、そして市場に影響を与える地政学的出来事について取材してきました。AMB Crypto、Coin Edition、CryptoTaleといったブロックチェーン専門メディアで、市場分析、主要企業、規制、マクロ経済動向に関する記事を執筆しています。ロンドン・スクール・オブ・ジャーナリズムで学び、アフリカ有数のテレビネットワークで3度、仮想通貨市場に関する見解を披露しました。.
速習コース
- どの仮想通貨でお金が稼げるか
- ウォレットを使ってセキュリティを強化する方法(そして実際に使う価値のあるウォレットはどれか)
- プロが使う、あまり知られていない投資戦略
- 仮想通貨への投資を始める方法(どの取引所を使うべきか、購入すべき最適な仮想通貨など)















