中国の人工知能(AI)スタートアップ、Deepseekは、市場が次世代モデルのリリースを予測し続けているため、新しい推論方法を発表しました。報告によると、同社は、大衆が新しいモデルのリリースを待っているため、大規模な言語モデル(LLMS)の推論能力を支援する新しいアプローチを導入したばかりです。
報告によると発表された論文は最近、Tsinghua大学の研究者とAIスタートアップのコラボレーションによって偉業が達成されたことを明らかにしました。論文によると、Deepseekは、生成報酬モデリング(GRM)と自己一定のチューニングと呼ばれる方法を組み合わせた手法を開発することができました。デュアルアプローチにより、LLMは一般的なクエリにより優れた高速な結果を提供できます。
Deepseekは、新しいAI推論方法を明らかにします
研究者によると、結果として生じるDeepSeek-GRMモデルは既存の方法を上回り、StronG Public Rewardモデルで競争力のあるパフォーマンスを達成することができました。報酬モデリングは、LLMが人間の好みを決定するのに役立つプロセスです。研究者は、AIのスタートアップはGRMモデルをオープンソースにするつもりであると述べましたが、同社はまだ開発のタイムラインを提供していません。
発表された学術研究論文は、Deepseek V3 FoundationモデルとR1推論モデルから集めたグローバルな注目を集め enj後、スタートアップの次の動きの可能性についての憶測の後に来ています。当時、今年初めにリリースされたR1モデルは、OpenAIの最初のChatGPTモデルを含むいくつかの古いモデルよりも優れたパフォーマンスが発見されたことが発見された後、顕著になりました。
R1モデルのリリースは、モデルがオープンソースであり、他のAIモデルで使用されているコストの一部で完了したという事実を考慮して、シリコンバレーを不意を突破しました。注目は鈍化しているように見えますが、AI業界のライバル企業の間でいくつかの顕著な進歩があり、このセクターのライバル関係は年齢の1つであることを示しています。
しかし、先月のロイターの報告には、世界的に有名なR1の後継者であるDeepseek-2が作業中である可能性があると述べました。報告書によると、同社はAI業界で成長するプロフィールを活用することを目指しているため、今月末に向けてリリースすることを検討している可能性があります。一方、DeepseekはR2モデルについてタイトな唇を塗っており、公式のパブリックチャネルの沈黙を維持しており、カスタマーサービスアカウントはビジネスクライアントとの噂を否定しています。
V3モデルの開発は継続されます
杭州に拠点を置くDeepseekは、2023年に起業家のLiang Wenfengによって設立され、過去数か月間、適切な理由で世界的なスポットライトを浴びています。しかし、同社は公開コミュニケーションの作成を拒否し、研究開発にすべての時間とエネルギーを集中することを決定しました。 AI業界の会社が何を持っているかはまだわかりませんが、噂のおかげで確実に料理をしています。
先月、同社は取り組んでいる開発を発表し、Deepseek-V3-0324という名前のアップグレードされたV3モデルを世界に示しました。同社によると、アップグレードされたモデルは「強化された推論能力、最適化されたフロントエンドのWeb開発、アップグレードされた中国の執筆習熟度」を提供しました。 2月、同社は5つのコードリポジトリをアウトソースし、開発者がソフトウェア開発をレビューして貢献できるようにしました。スタートアップは、「完全な透明性で誠実な進歩を遂げる」と述べました。
同じ月に、Liangは、大量のデータを処理する際のLLMの効率を改善するために使用される方法であるネイティブスパースの注意に関する技術研究を発表しました。 40歳のLiangは、AIスタートアップの技術的進歩に資金を提供するための財政的才能を提供したヘッジファンドであるDeepseekの親会社であるHigh-Flyer Quantの創設者でもあります。 2月下旬、起業家はハイテク起業家を集めたシンポジウムの一部であり、中国の大統領dent xiがそれらをホストしていました。プレシデントdent、中国のAIの進歩を封じ込めるという米国の動きに直面した国の回復力の兆候として、スタートアップを歓迎しました
2025年にDeFiで受動的収入を得るための新しい方法。詳細については