زعمت شركة DeepSeek الصينية أن نظام الذكاء الاصطناعي الرائد الخاص بها، والمعروف باسم R1، تم تدريبه مقابل 294 ألف دولار فقط، وهو جزء صغير من المبالغ التي يُعتقد أن المنافسين الأمريكيين أنفقوها.
نُشرت التفاصيل في ورقة بحثية محكمة في مجلة Nature هذا الأسبوع، ومن المرجح أن تُثير مزيدًا من الجدل حول طموحات بكين في سباق الذكاء الاصطناعي العالمي. وقالت الشركة التي تتخذ من هانغتشو مقرًا لها إن النموذج الذي يركز على الاستدلال قد تم تدريبه باستخدام 512 شريحة من نوع Nvidia H800. وقد صُممت هذه الأجهزة خصيصًا للصين بعد أن حظرت الولايات المتحدة بيع معالجات H100 وA100 الأكثر قوة.
وتُعد هذه الورقة البحثية، التي شارك في تأليفها المؤسس ليانغ وينفنغ، المرة الأولى التي تكشف فيها الشركة عن مثل هذه التكاليف.
يستخدم برنامج DeepSeek جزءًا بسيطًا من تكلفة النماذج الأمريكية
في يناير، أدى إطلاق أدوات الذكاء الاصطناعي الأرخص من DeepSeek إلى زعزعة استقرار الأسواق العالمية، مما أسفر عن عمليات بيع مكثفة لأسهم شركات التكنولوجيا بسبب المخاوف من أنها قد تتفوق على الشركات العملاقة الراسخة مثل Nvidia و OpenAI.
ومع ذلك، حافظ ليانغ وفريقه على مستوى منخفض من الظهور، ولم يظهروا إلا لتحديثات متقطعة للمنتج منذ ذلك الحين.
يتناقض السعر المعلن البالغ 294 ألف دولار تناقضاً صارخاً مع تقديرات الشركات الأمريكية.
قال سام ألتمان، الرئيس التنفيذي لشركة OpenAI، في عام 2023: "إن تكلفة تدريب النماذج الأساسية تتجاوز بكثير 100 مليون دولار". ومع ذلك، لم يقدم أي تفصيل محدد.
تدريب نماذج اللغة الضخمة تشغيل مجموعات من الرقائق الإلكترونية فائقة القدرة لفترات طويلة، مما يستهلك كميات هائلة من الكهرباء أثناء معالجة النصوص والبرمجيات. لطالما افترض مراقبو الصناعة أن تكلفة مثل هذه المشاريع تصل إلى عشرات أو حتى مئات الملايين من الدولارات.
يُشكك الآن في هذا الافتراض، وفي وثيقة تكميلية، أقرت شركة DeepSeek بامتلاكها رقائق A100 واستخدامها لها في المراحل الأولى من التطوير، قبل نقل التدريب الكامل إلى مجموعة حواسيبها H800. ووفقًا للشركة التقنية، استمر تشغيل النموذج لمدة 80 ساعة خلال مرحلة التدريب النهائية.
رغم إصرار شركة إنفيديا على أن الشركة الصينية الناشئة لا تملك سوى معالجات H800، إلا أن المسؤولين الأمريكيين ما زالوا متشككين. قبل بضعة أشهر، صرّحت مصادر أمريكية لوكالة رويترز بأن شركة ديب سيك تمتلك بشكل غير قانوني كميات كبيرة من رقائق H100 المحظورة تصديرها إلى الصين.
وضع الابتكار تحت المجهر
لم يلفت النموذج R1 الانتباه فقط بسبب انخفاض تكاليف التدريب عليه، ولكن أيضًا لأنه قد يكون أول نموذج رئيسي يخضع لمراجعة رسمية من قبل النظراء.
"هذهdentمرحب بها للغاية، وإذا لم يكن لدينا هذا المعيار للمشاركة، فسيصبح من الصعب للغاية تقييم المخاطر"، هذا ما قاله لويس تونستال، مهندس التعلم الآلي في شركة Hugging Face الذي راجع ورقة بحثية نُشرت في مجلة Nature.
دفعت عملية المراجعة شركة DeepSeek إلى توضيح التفاصيل الفنية، بما في ذلك كيفية تدريب نموذجها وما هي الضمانات التي تم وضعها.
"إن الخضوع لعملية مراجعة صارمة من قبل النظراء يساعد بالتأكيد في التحقق من صحة النموذج وفائدته"، كما قال هوان صن، الباحث في مجال الذكاء الاصطناعي في جامعة ولاية أوهايو.
كان الإنجاز الرئيسي لـ DeepSeek هو استخدام نهج التعلم المعزز. فبدلاً من الاعتماد على أمثلة استدلالية منتقاة يدويًا، وفقًا للورقة البحثية، تمت مكافأة النموذج على حل المشكلات بشكل صحيح، وطوّر تدريجيًا استراتيجياته الخاصة لحل المشكلات.
وتقول الشركة إن نظام التجربة والخطأ هذا سمح لشركة R1 بالتحقق من طريقة عملها دون نسخ الأساليب البشرية.
وأضاف صن: "لقد كان لهذا النموذج تأثير كبير. فربما استُلهمت جميع أعمال التعلم المعزز تقريباً في عام 2025 من النموذج R1 بطريقة أو بأخرى"
شركة ديب سيك تنفي مزاعم النسخ
بعد وقت قصير من إصدار R1، انتشرت التكهنات بأن DeepSeek قد اعتمدت على مخرجات منافسة، وخاصة من OpenAI، لتسريع التدريب؛ ومع ذلك، فقد نفت الشركة الآن هذا الاتهام بشكل قاطع.
أكدت شركة DeepSeek في مراسلاتها مع المحكمين أن نموذج R1 لم ينسخ أمثلة الاستدلال التي أنشأتها OpenAI. ومع ذلك، وكما هو الحال مع معظم نماذج اللغة الكبيرة، فقد تم تدريبه على نصوص الإنترنت. وهذا يعني أن بعض المحتوى الذي أنتجه الذكاء الاصطناعي قد تم تضمينه حتماً، وقد أقنع هذا التفسير بعض المحكمين.
"لا يمكنني الجزم بنسبة 100% بأن النموذج R1 لم يتم تدريبه على أمثلة من OpenAI. ومع ذلك، تشير محاولات التكرار التي أجرتها مختبرات أخرى إلى أن التعلم المعزز جيد بما فيه الكفاية بمفرده." هذا ما قاله تونستال.
شركة DeepSeek إن نموذج R1 مصممٌ للتفوق في المهام التي تتطلب مهارات استدلالية عالية، مثل البرمجة والرياضياتmaticعلى موقع مجتمع الذكاء الاصطناعي Hugging Faceوقد تم تنزيله بالفعل أكثر من 10 ملايين مرة
أنفقت الشركة حوالي 6 ملايين دولار لتطوير النموذج الأساسي الذي بُني عليه جهاز R1، ولكن حتى مع إضافة هذا المبلغ، فإن تكاليفها أقل بكثير من المبالغ المرتبطة بالمنافسين. بالنسبة للكثيرين في هذا المجال، هذا ما يجعل R1trac.
قام صن وزملاؤه مؤخراً باختبار النظام على مهام البيانات العلمية ووجدوا أنه لم يكن الأكثر دقة، ولكنه كان من بين الأفضل من حيث التكلفة مقابل الأداء.

