قام Deepseek بطرح R1-0528 ، وهي ترقية رئيسية لنموذج التفكير الصيني R1 ، والذي تم إصداره في يناير. وصلت الترقية بعد شهر واحد فقط من فوز QWEN3 من مجموعة Alibaba Holding على Deepseek R1 الأصلي في LiveBench ، وهو معيار عبر الإنترنت لنماذج النطاقات الاصطناعية مفتوحة المصدر.
يقف طراز Deepseek الذي تمت ترقيته R1-0528 الآن إلى جانب قيادة طرز الذكاء الاصطناعي من Openai و Google في الأداء. توضح العودة مدى سرعة شركات التكنولوجيا الكبيرة في الصين وشركات التكنولوجيا الأحدث التي تدفع لتحسين أدوات الذكاء الاصطناعي.
في بيانها ، قال ديبسيك إن R1-0528 يُظهر مهارات أفضل للتفكير والكتابة الإبداعية. يجلب التحديث أيضًا قدرة ترميزtronGER. الأهم من ذلك ، تدعي الشركة أن النموذج ينتج الآن أقل بنسبة 50 ٪ "الهلوسة".
أوضح Deepseek أن الترقيات جاءت من قوة حوسبة إضافية تم استثمارها خلال مرحلة ما بعد التدريب ، عندما يقوم المهندسون بتعيين نموذج بعد عملية التدريب الرئيسية. خلال مرحلة ما بعد التدريب ، يهدف المهندسون إلى زيادة كفاءة النموذج وتعزيز دقته وسلامته.
R1-0528 يحتل المرتبة الآن خلف Openai's O3 و O4-Mini
على LiveCodeBench ، الذي يقيس أداء نموذج الذكاء الاصطناعي ، R1-0528 الآن خلف طرز Openai's O4-Mini و O3.
وقالت أدينا ياكفو ، باحثة منظمة العفو الدولية في Hugging Face: "إن أحدث ترقية لـ Deepseek أكثر حدة في التفكير ، و StronGer على الرياضيات والرمز ، والإغلاق في النماذج من الدرجة الأولى مثل Gemini و O3".
وأضافت أن الإصدار الجديد يوضح "تحسينات كبيرة في الاستدلال والحد من الهلوسة" ويثبت أن بدء التشغيل لا يقتصر فقط على اللحاق بالركب ولكنه يتنافس بنشاط.
جاء التقدم السريع بعد قيام واشنطن بتقييد الرقائق المتقدمة وغيرها من صادرات التكنولوجيا إلى الصين. ومع ذلك ، تواصل الشركات الصينية تحسين أنظمتها. في وقت سابق من هذا الشهر ، وصفت Baidu و Tencent الطرق التي تجعلها تجعل نماذجهم تعمل بشكل أكثر كفاءة على الرغم من محدودية الوصول إلى أشباه الموصلات المتطورة.
انتقد الرئيس التنفيذي لشركة Nvidia Jensen Huang ضوابط التصدير يوم الأربعاء. وقال "لقد استندت الولايات المتحدة إلى سياستها على افتراض أن الصين لا يمكنها صنع رقائق الذكاء الاصطناعى". "كان هذا الافتراض مشكوك فيه دائمًا ، والآن من الخطأ بوضوح. السؤال ليس ما إذا كانت الصين ستحصل على منظمة العفو الدولية. إنها بالفعل."
رفع Deepseek أداء نموذج QWEN3 8B من Alibaba بنسبة 10 ٪
وقال ديبسيك أيضًا إنه يقطر خطوات التفكير المستخدمة في R1-0528 في QWEN3 8B من Alibaba. أنشأت هذه العملية نموذجًا جديدًا أصغر تجاوز أداء QWEN3 بأكثر من 10 ٪ ، وفقًا للشركة. في الوقت نفسه ، كان النموذج أصغر 30 مرة.
وذكرت الشركة: "نعتقد أن سلسلة الفكرة من Deepseek-R1-0528 ستحظى بأهمية كبيرة للبحوث الأكاديمية حول نماذج التفكير والأعمال الصناعية على النماذج الصغيرة".
وفقًا لرويترز ، أخبر ممثل Deepseek مجموعة WeChat أن التغيير كان "ترقية محاكمة بسيطة" مفتوحة بالفعل للاختبار العام. استجابةً للمنافسة الشرسة ، قامت Google بخصم بعض مستويات الوصول إلى Gemini ، بينما قدم Openai نموذج O3 Mini المنخفض التكلفة.
سلك الفرق الرئيسي : تستخدم مشاريع التشفير السرية للأداة للحصول على تغطية إعلامية مضمونة