DeepSeekは、4月下旬に予定されている初の大型リリースに向けて、内モンゴルで従業員を募集している。このリリースは、従来アメリカ製プロセッサを使用していたものとは異なり、ファーウェイ製プロセッサを搭載して動作するように設計されている。.
同社はまた、内モンゴル自治区のウランチャブ市でサーバー保守エンジニアと配送マネージャーの求人を掲載した。杭州に本社を置く同社が、コンピューターインフラ関連のオンサイト求人
4月下旬にリリース予定のV4は、約1兆個のパラメータを持つエキスパート混合モデルを採用していますが、各タスクで実際に使用されるパラメータはわずか320億~370億個です。これにより、モデルが大規模化してもコストを抑えることができます。.
「もし彼らがV4を完全にファーウェイ製のシリコン上で訓練することに成功したのなら、それは地政学的なテクノロジー情勢における重大な変化を示すものだ」と、カーセージ・キャピタルのスティーブン・ウー氏は述べた。.
発売日は2月から2度延期された。.
シリコンバレーのライバル企業が中国企業に対抗するため結束
OpenAI、Anthropic、Googleは4月6日、中国企業による自社モデルの模倣を阻止するため、情報共有を行うと発表した。この3社は競合関係にあるが、2023年に設立された業界団体であるフロンティア・モデル・フォーラムを通じて協力している。.
Anthropicはtracした。これらの企業は、敵対的データ蒸留法を用いて、ChatGPTとClaudeに大量のクエリを送信し、その応答に基づいてモデルを訓練していたとされる。
OpenAIは2月12日、下院中国特別委員会への覚書の中で、DeepSeekが「新たな難読化手法を用いて」自社のモデルをコピーしたと非難した。.
中国のAI開発を抑制するために2022年に始まった規制は、当初、2022年の半導体生産量を9.8%減少させる結果となった。しかし、先端半導体に対するこれらの輸出規制は、今や逆効果となっているようだ。.
国内チップの市場シェアは50%に達すると予測されている。
状況は変化しつつある。TrendForce予測している。中国の半導体製造装置は、2024年から2025年の間に国内市場の25%から35%に拡大し、「中国製造2025」の目標である30%を上回った。
中国は約1500億ドルを半導体開発に投じてきた。米国のCHIPS・科学法では527億ドルが認可されている。.
ファーウェイ製チップへの切り替えは、遅延なく進んだわけではない。Cryptopolitan禁止されているNvidia製チップを使用すると予想されていた。
カウンターポイント・リサーチの主席AIアナリストであるウェイ・サン氏によると、Nvidiaから離れるには「大幅な再設計」が必要だという。「その移行は開発サイクルを遅らせ、特に最先端モデルと期待されているV4においては、パフォーマンスのトレードオフをもたらす可能性がある」と彼は述べた。.
DeepSeekは、2024年1月にR1を発表し、一躍注目を集めた。R1は、dent 大統領がアメリカ企業への「警鐘」と評した推論モデルである。同社の安価なツールは、中国をはじめ、東南アジアや中東などで広く利用されている。.

