DeepSeek V4は、エリートレベルのコーディングタスクを対象としたロングコンテキストコーディングにおいて、ChatGPTやClaudeを上回る性能を発揮すると噂されています。関係者によると、2月中旬のロールアウト後、内部テストで期待通りの性能が示された場合、シリコンバレーのAI業界は懸念すべき状況にあるとのことです。.
中国を拠点とするAIスタートアップ企業DeepSeekは、 最新の大規模言語モデルであるDeepSeek V4を2月17日にリリースする予定だと報じられている。関係者によると、このモデルは、長文のコードプロンプトやタスクを処理する際に、OpenAIのChatGPTやAnthropicのClaudeといった既存の大規模言語モデルに影を落とす存在になる可能性があるという。
開発者はDeepSeek V4のリリースに大きな期待を表明
中国企業は、この記事執筆時点では、間近に迫ったリリースに関する情報を公表しておらず、噂も確認していない。様々なソーシャルネットワーク上の開発者たちは、リリースへの強い期待を表明している。AI開発者でありHyperbolic Labsの共同創設者であるYuchen Jin氏は、 だ Xに「DeepSeek V4が間もなくリリースされるという噂があり、ClaudeやGPTよりも強力なコーディングが施されている」とtron。
サブレディットr/DeepSeekも 盛り上がりを見せ 、あるユーザーはDeepSeekのV4モデルへの執着が尋常ではないと説明した。そのユーザーは「ニュースや噂を頻繁にチェックし、DSのウェブサイトにあるドキュメントを読んで、アップデートの兆候や変更点がないか確認している」と語った。
DeepSeekのこれまでのリリースは、世界の市場に大きな影響を与えてきた。この中国のAIスタートアップ企業は、 リリースし 、1兆ドル規模の売り浴びせを引き起こした。このモデルは、OpenAIの01モデルと数学および推論のベンチマークで同等の性能を発揮したが、その開発コストは米国のAIスタートアップ企業が01モデルに費やした費用よりもはるかに低かった。
この中国企業は、このモデルのリリースにわずか600万ドルを費やしたと報じられています。一方、世界の競合他社は、同じ出力を得るために約70倍の費用を費やしています。また、同社のV3モデルはMATH-500ベンチマークで90.2%のスコアを記録し、Claudeのスコアは78.3%でした。DeepSeekは最近のV3アップグレード(V3.2 Speciale)により、生産性がさらに向上しました。.
V4モデルのセールスポイントは、純粋推論、形式的証明、論理的数学に重点を置いたV3から進化しました。新リリースは、推論タスクと非推論タスクの両方を組み合わせたハイブリッドモデルになると予想されています。このモデルは、高精度とロングコンテキストコード生成を求める既存のギャップを埋めることで、開発者市場の獲得を目指しています。.
Claude Opus 4.5は現在、SWEベンチマークで80.9%の精度を達成し、優位を誇っています。V4がClaude Opus 4.5を抜くには、この数値を上回る必要があります。これまでの成功を踏まえると、今後登場するモデルはこの閾値を超え、ベンチマークで優位に立つ可能性があります。
DeepSeekは法学修士課程のトレーニングのためのmHCのパイオニアです
DeepSeekの成功は、多くの専門家を驚愕させた。こんな小さな会社が、どうしてこれほどの偉業を成し遂げられたのだろうか?その秘密は、 発表された 。同社は、dentした。DeepSeekの創業者兼CEOである梁文峰氏は、研究論文の中で、同社が多様体制約ハイパーコネクション(mHC)を使用してAIモデルをトレーニングしていると述べている。
幹部は、開発者が大規模言語モデルの学習時に直面する問題に対処するため、mHCの活用を提案しました。ウェンフェン氏によると、mHCは、他のAI開発者が大規模言語モデルの学習に使用しているフレームワークであるHyper-Connections(HC)のアップグレード版です。ウェンフェン氏は、HCやその他の従来のAIアーキテクチャでは、すべてのデータが単一の狭いチャネルを経由することになる点を指摘しました。しかし、mHCはその経路を複数のチャネルに拡張することで、学習の破綻を招くことなくデータと情報の転送を容易にします。.
Omdiaの主席アナリストであるLian Jye Su氏は、CEOのWenfeng氏が研究成果を公開したことを称賛した。Su氏は、DeepSeekがトレーニング方法を公開するという決定は、中国のAIセクターに対する信頼の回復を意味すると強調した。DeepSeekは を誇って 。Microsoftは木曜日に発表したレポートで、DeepSeekが中国のAI市場の89%を占め、発展途上国でも勢いを増していることを示した。

