كشفت شركة Deepseek ، بدء تشغيل الذكاء الاصطناعي الصيني (AI) ، عن طريقة التفكير الجديدة حيث يستمر السوق في توقع إصدار نموذج الجيل التالي. وفقًا للتقارير ، قدمت الشركة للتو مقاربة جديدة من شأنها أن تساعد إمكانيات التفكير في نماذج اللغة الكبيرة (LLMS) ، حيث ينتظر الجمهور إصدار نموذجه الجديد.
وفقًا للتقارير ، كشفت ورقة نشرت مؤخرًا أن هذا الإنجاز قد تحققت من خلال تعاون بين الباحثين في جامعة Tsinghua وبداية الذكاء الاصطناعى. وفقًا للورقة ، تمكنت Deepseek من تطوير تقنية تجمع بين الأساليب المشار إليها على أنها نمذجة المكافآت التوليدية (GRM) وضبط الذات. سيمكن النهج المزدوج LLMs من تقديم نتائج أفضل وأسرع للاستعلامات العامة.
يكشف Deepseek عن طريقة التفكير الذكاء الجديد
وفقًا للباحثين ، تمكنت نماذج Deepseek-GRM الناتجة من التفوق على الأساليب الحالية ، مما يحقق أداءً تنافسيًا مع نماذج المكافآت العامة StronG. نمذجة المكافآت هي عملية تساعد LLM على تحديد التفضيلات البشرية. ذكر الباحثون أن بدء تشغيل الذكاء الاصطناعي يعتزم جعل مصدر نماذج GRM مفتوحًا ، لكن الشركة لم تقدم بعد جدولًا زمنيًا للتطوير.
ستأتي ورقة البحث الأكاديمي المنشورة بعد تكهنات حول الخطوة التالية المحتملة لبدء التشغيل بعد enjالاهتمام العالمي الذي جمعته من نموذج مؤسسة Deepseek V3 ونموذج التفكير R1 الخاص به. في ذلك الوقت ، اكتسب طراز R1 ، الذي تم إصداره في وقت سابق من هذا العام ، مكانة بارزة بعد اكتشاف أنها كانت أداء أفضل من بعض الطرز القديمة ، بما في ذلك أول طراز ChatGPT من Openai.
اشتعلت إصدار نموذج R1 أيضًا عن وادي السيليكون ، مع الأخذ في الاعتبار حقيقة أن النموذج كان مفتوحًا المصدر وتم الانتهاء منه مع جزء صغير من التكاليف المستخدمة في نماذج الذكاء الاصطناعي الأخرى. في حين يبدو أن الاهتمام يتباطأ ، كان هناك بعض التقدم الرائع بين الشركات المتنافسة في صناعة الذكاء الاصطناعى ، مما يدل على أن التنافس في القطاع هو واحد على مر العصور.
ومع ذلك ، ذكر تقرير رويترز الشهر الماضي أن Deepseek-2 ، قد يكون خليفة R1 الشهير عالميًا في الأعمال. وفقًا للتقرير ، يمكن أن تتطلع الشركة إلى إصدارها في نهاية هذا الشهر ، حيث تتطلع إلى الاستفادة من ملفها الشخصي المتنامي في صناعة الذكاء الاصطناعي. من ناحية أخرى ، ظلت Deepseek مشدودة حول نموذج R2 ، حيث حافظت على الصمت على القنوات العامة الرسمية ، مع رفض حساب خدمة العملاء الشائعات مع عملاء الأعمال ، وفقًا للتقارير.
يستمر التنمية على نموذج V3
تأسست Deepseek ، ومقرها Hangzhou ، في عام 2023 من قبل رجل الأعمال Liang Wenfeng وكان في دائرة الضوء العالمية للأسباب الصحيحة في الأشهر القليلة الماضية. ومع ذلك ، فقد رفضت الشركة إجراء اتصالات عامة ، وقررت التركيز طوال الوقت والطاقة على البحث والتطوير. على الرغم من أنه يبقى أن نرى ما تمتلكه الشركة لصناعة الذكاء الاصطناعى ، إلا أنها كانت بالتأكيد تطبخ ، وذلك بفضل الشائعات.
في الشهر الماضي ، أعلنت الشركة عن تطوير تعمل عليه ، مما يدل على طراز V3 الذي تمت ترقيته المسمى Deepseek-V3-0324 للعالم. وفقًا للشركة ، قدم النموذج الذي تمت ترقيته "إمكانيات التفكير المحسّنة ، وتطوير الويب الأمامي الأمامي ، وترقية الكفاءة في الكتابة الصينية". في فبراير ، تفوقت الشركة على خمسة من مستودعات الكود الخاصة بها ، مما يسمح للمطورين بمراجعة ومساهمة في تطوير البرمجيات. ذكرت الشركة الناشئة أنها ستحقق "تقدمًا صادقًا مع الشفافية الكاملة".
في نفس الشهر ، نشرت ليانغ دراسة فنية حول الاهتمام المتناثر الأصلي ، وهي طريقة تستخدم لتحسين كفاءة LLMs في معالجة كميات كبيرة من البيانات. ليانغ البالغة من العمر 40 عامًا هي أيضًا مؤسس الشركة الأم "ديبسيك" ، وهي صندوق التحوط ، وهو صندوق التحوط الذي وفر البراعة المالية لتمويل التطورات الفنية لبدء الناشئة. في أواخر فبراير ، كان رجل الأعمال جزءًا من ندوة قامت بتجميع رواد الأعمال في مجال التكنولوجيا ، حيث استضافهم dent أشاد بريدي dent ببدء التشغيل كعلامة على مرونة البلاد في مواجهة تحركات الولايات المتحدة لاحتواء تقدم الذكاء الاصطناعي في الصين.
أكاديمية Cryptopolitan: قريبًا - طريقة جديدة لكسب دخل سلبي مع DeFi في عام 2025. تعرف على المزيد