تشير الشائعات إلى أن DeepSeek V4 سيتفوق على ChatGPT وClaude في برمجة السياق الطويل، مستهدفًا مهام البرمجة المتقدمة. ويزعم مطلعون أن مشهد الذكاء الاصطناعي في وادي السيليكون يجب أن يشعر بالقلق إذا أشارت الاختبارات الداخلية إلى الأداء المتوقع بعد إطلاقه في منتصف فبراير.
تفيد التقارير أن شركة DeepSeek الصينية الناشئة في مجال الذكاء الاصطناعي تخطط لإطلاق DeepSeek V4، أحدث نموذج لغوي كبير لها، في 17 فبراير. ويزعم أشخاص مطلعون على الأمر أن النموذج مهيأ لإلقاء بظلاله على نماذج اللغة الكبيرة الحالية، مثل ChatGPT من OpenAI وClaude من Anthropic، عند التعامل مع مطالبات ومهام التعليمات البرمجية ذات السياق الطويل.
أعرب المطورون عن ترقبهم الشديد لإصدار DeepSeek V4
لم تُفصح الشركة الصينية علنًا عن أي معلومات حول الإصدار الوشيك أو تؤكد الشائعات حتى وقت كتابة هذا التقرير. وقد أعرب مطورو البرامج عبر مختلف الشبكات الاجتماعية عن ترقبهم الشديد لهذا الإصدار. وكتب على منصة X أن "هناك شائعات تُفيد بأن DeepSeek V4 سيصدر قريبًا،tronمن Claude وGPT".
شهد منتدى r/DeepSeek على موقع Reddit تفاعلاً محتدماً ، حيث أوضح أحد المستخدمين أن هوسه بإصدار DeepSeek V4 الوشيك ليس طبيعياً. وقال المستخدم إنه "يتابع الأخبار والشائعات باستمرار، بل ويقرأ الوثائق على موقع DS الإلكتروني بحثاً عن أي تغييرات أو مؤشرات تدل على تحديث".
الشركة الصينية الناشئة في مجال الذكاء الاصطناعي فقد أطلقت نموذجها R1 للاستدلال في يناير 2025، مما أدى إلى انخفاض حاد في قيمة أسهمها بلغ تريليون دولار. وقد حقق هذا الإصدار أداءً مماثلاً لنموذج OpenAI 01 في معايير الرياضيات والاستدلال، على الرغم من أن تكلفته كانت أقل بكثير مما أنفقته شركة الذكاء الاصطناعي الأمريكية الناشئة على نموذجها 01.
أفادت التقارير أن الشركة الصينية أنفقت 6 ملايين دولار فقط على إطلاق النموذج. في المقابل، ينفق المنافسون العالميون ما يقارب 70 ضعف هذا المبلغ لتحقيق نفس النتائج. كما حقق نموذج V3 الخاص بها نسبة 90.2% في اختبار MATH-500، مقارنةً بنسبة 78.3% التي حققها كلود. وقد ساهم التحديث الأخير لبرنامج DeepSeek (V3.2 Speciale) في تحسين إنتاجيته بشكل أكبر.
تطورت الميزة الرئيسية لنموذج V4 من تركيز نموذج V3 على الاستدلال المجرد، والبراهين الرسمية، والرياضيات المنطقية. ومن المتوقع أن يكون الإصدار الجديد نموذجًا هجينًا يجمع بين مهام الاستدلال والمهام غير الاستدلالية. ويهدف هذا النموذج إلى استقطاب سوق المطورين من خلال سد فجوة قائمة تتطلب دقة عالية وتوليد أكواد ذات سياق طويل.
Claude يتصدر برنامج
شركة DeepSeek رائدة في مجال التسويق عبر وسائل التواصل الاجتماعي لتدريب طلاب الماجستير في القانون
أثار نجاح شركة DeepSeek دهشة الكثيرين من المختصين. كيف لشركة صغيرة كهذه أن تحقق مثل هذه الإنجازات؟ قد يكمن السر في بحثها المنشور الشركةdentأسلوب تدريب جديدًا يُمكّن المطورين من توسيع نطاق نماذج اللغة الكبيرة بسهولة. وكتب ليانغ وينفنغ، مؤسس شركة DeepSeek ومديرها التنفيذي، في البحث أن الشركة تستخدم تقنية الاتصالات الفائقة المقيدة بالمتشعبات (mHC) لتدريب نماذج الذكاء الاصطناعي الخاصة بها.
اقترح المسؤول التنفيذي استخدام تقنية mHC لمعالجة المشكلات التي تواجه المطورين عند تدريب نماذج لغوية ضخمة. ووفقًا لوينفينغ، تُعدّ mHC نسخة مطورة من تقنية Hyper-Connections (HC)، وهي إطار عمل يستخدمه مطورو الذكاء الاصطناعي الآخرون لتدريب نماذجهم اللغوية الضخمة. وأوضح أن تقنية HC وغيرها من بنى الذكاء الاصطناعي التقليدية تُجبر جميع البيانات على المرور عبر قناة واحدة ضيقة. في المقابل، تُوسّع mHC هذا المسار إلى قنوات متعددة، مما يُسهّل نقل البيانات والمعلومات دون التسبب في انهيار عملية التدريب.
أشاد ليان جاي سو، كبير المحللين في أومديا، بالرئيس التنفيذي وينفنغ لنشره بحثهم. وأكد سو أن قرار ديب سيك بنشر أساليب تدريبها يعكس ثقة متجددة في قطاع الذكاء الاصطناعي الصيني. وقد هيمنت أسواق الدول النامية. ونشرت مايكروسوفت تقريرًا يوم الخميس يُظهر أن ديب سيك تستحوذ على 89% من سوق الذكاء الاصطناعي في الصين، وأنها تكتسب زخمًا متزايدًا في الدول النامية.

