中国のディープシークは、同社の主力AIシステム「R1」のトレーニング費用がわずか29万4000ドルであると主張している。これは米国の競合他社が費やしたとされる金額のほんの一部だ。.
詳細は今週ネイチャー誌に査読付き論文として発表され、世界的な人工知能(AI)競争における中国政府の野望をめぐる議論を一層煽る可能性が高まっている。杭州に拠点を置く同社は、推論重視のモデルは512個のNVIDIA H800チップを用いて学習されたと述べた。このハードウェアは、米国がより高性能なH100およびA100プロセッサの販売を禁止したことを受け、中国向けに特別に設計されたものだ。.
創業者の梁文鋒氏が共同執筆したこの論文は、同社がこうしたコストを公表したのは初めてとなる。.
DeepSeekは米国のモデルのコストのほんの一部しかかからない
といった既存の大手企業を脅かす可能性があるとの懸念から、ハイテク株の売り浴びせを引き起こした NvidiaやOpenAI。
しかし、それ以来、Liang 氏と彼のチームは目立たないようにしており、散発的な製品アップデートのときのみ姿を現している。.
報道されている294,000ドルという価格は、アメリカ企業の見積もりとは全く対照的だ。.
OpenAIの最高経営責任者(CEO)サム・アルトマン氏は2023年に、「基礎モデルのトレーニングには1億ドルをはるかに超える費用がかかる」と述べた。しかし、具体的な内訳は明らかにしなかった。.
学習に 大規模な言語モデルの は、強力なチップ群を長時間稼働させる必要があり、テキストとコードの処理に膨大な電力を消費します。業界関係者は長年、こうしたプロジェクトの費用は数千万、あるいは数億ドルに上ると想定してきました。
この仮定は今や疑問視されており、DeepSeekは補足資料の中で、A100チップを所有しており、開発初期段階で使用していたことを認めた。その後、本格的なトレーニングをH800クラスタに移行する予定だ。同社によると、モデルは最終段階のトレーニングで80時間稼働したという。.
Nvidiaは、この中国の新興企業がアクセスできるのは自社のH800プロセッサのみだと主張しているものの、米国当局は依然として懐疑的だ。数ヶ月前、米国筋は ロイター通信 、DeepSeekが中国への輸出が禁止されているH100チップを大量に違法に保有していると報じた。
イノベーションを顕微鏡で見る
R1 は、トレーニング コストが低いだけでなく、正式なピア レビューを受ける最初の主要モデルになる可能性があることでも注目を集めています。.
「これは非常に歓迎すべきdentであり、共有という規範がなければ、リスクを評価するのは非常に難しくなる」と、ネイチャー誌の論文を査読したハギング・フェイスの機械学習エンジニア、ルイス・タンストール氏は述べた。.
レビュープロセスにより、DeepSeek はモデルのトレーニング方法や実施されている安全対策などの技術的な詳細を明らかにするようになりました。.
「厳格な査読プロセスを経ることは、モデルの妥当性と有用性を検証するのに確かに役立つ」とオハイオ州立大学のAI研究者、フアン・サン氏は述べた。.
DeepSeekの画期的な点は、純粋な 強化学習アプローチ。論文によると、人間が厳選した推論例に頼るのではなく、モデルは問題を正しく解決することで報酬を得て、徐々に独自の課題解決戦略を発達させていった。
同社によれば、この試行錯誤のシステムにより、R1 は人間の戦術を真似することなくその動作を検証することができたという。.
「このモデルは非常に影響力がありました」とサン氏は付け加えた。「2025年の強化学習研究のほぼすべては、何らかの形でR1からインスピレーションを得ている可能性があります。」
DeepSeekはコピーの主張を否定
R1 のリリース直後、DeepSeek がトレーニングを加速するために、特に OpenAI などのライバルの出力に依存しているのではないかという憶測が飛び交ったが、同社は現在、その疑惑をきっぱり否定している。.
DeepSeekは査読者とのやり取りの中で、R1はOpenAIが生成した推論例を模倣したものではないと主張しました。しかし、多くの大規模言語モデルと同様に、R1はインターネット上のテキストで学習されました。つまり、AIが生成したコンテンツが必然的に含まれており、この説明は一部の査読者を納得させました。.
「R1がOpenAIの例で学習されていないと100%確信することはできません。しかし、他の研究室による再現実験は、強化学習だけで十分に優れていることを示唆しています」とタンストール氏は述べた。.
DeepSeekに といった推論を重視するタスクに優れているというmatic。米国企業が開発する多くのクローズドシステムとは異なり、R1はオープンウェイトモデルとしてリリースされ、研究者が無料でダウンロードできる。AIコミュニティサイト「 Hugging Face」、既に1,000万回以上ダウンロードされている。
同社はR1のベースモデルの開発に約600万ドルを費やしましたが、それを加えても、trac製品の価格をはるかに下回っています。このことが、この分野の多くの人にとってR1の魅力となっています。.
サン氏とその同僚は最近、このシステムを科学的データ作業でテストし、最も正確というわけではないものの、コストパフォーマンスの点では最高レベルであることが判明した。.

