Your bank is using your money. You’re getting the scraps.WATCH FREE

كشفت شركة DeepSeek عن تكلفة تدريب نموذج الذكاء الاصطناعي الخاص بها والتي بلغت 294 ألف دولار

في هذا المنشور:

  • شركة صينية متخصصة في الذكاء الاصطناعي تقول إن تكلفة تدريب نموذجها بلغت 294 ألف دولار فقط.
  • هذا الرقم أقل بكثير من منافسيه الأمريكيين، مما يثير تساؤلات جديدة في هذا القطاع.
  • تنفي شركة DeepSeek نسخ مخرجات نماذج المنافسين.

زعمت شركة DeepSeek الصينية أن نظام الذكاء الاصطناعي الرائد الخاص بها، والمعروف باسم R1، تم تدريبه مقابل 294 ألف دولار فقط، وهو جزء صغير من المبالغ التي يُعتقد أن المنافسين الأمريكيين أنفقوها.

نُشرت التفاصيل في ورقة بحثية محكمة في مجلة Nature هذا الأسبوع، ومن المرجح أن تُثير مزيدًا من الجدل حول طموحات بكين في سباق الذكاء الاصطناعي العالمي. وقالت الشركة التي تتخذ من هانغتشو مقرًا لها إن النموذج الذي يركز على الاستدلال قد تم تدريبه باستخدام 512 شريحة من نوع Nvidia H800. وقد صُممت هذه الأجهزة خصيصًا للصين بعد أن حظرت الولايات المتحدة بيع معالجات H100 وA100 الأكثر قوة.

وتُعد هذه الورقة البحثية، التي شارك في تأليفها المؤسس ليانغ وينفنغ، المرة الأولى التي تكشف فيها الشركة عن مثل هذه التكاليف.

يستخدم برنامج DeepSeek جزءًا بسيطًا من تكلفة النماذج الأمريكية

في يناير، أدى إطلاق أدوات الذكاء الاصطناعي الأرخص من DeepSeek إلى زعزعة استقرار الأسواق العالمية، مما أسفر عن عمليات بيع مكثفة لأسهم شركات التكنولوجيا بسبب المخاوف من أنها قد تتفوق على الشركات العملاقة الراسخة مثل Nvidia و OpenAI.

ومع ذلك، حافظ ليانغ وفريقه على مستوى منخفض من الظهور، ولم يظهروا إلا لتحديثات متقطعة للمنتج منذ ذلك الحين.

يتناقض السعر المعلن البالغ 294 ألف دولار تناقضاً صارخاً مع تقديرات الشركات الأمريكية.

قال سام ألتمان، الرئيس التنفيذي لشركة OpenAI، في عام 2023: "إن تكلفة تدريب النماذج الأساسية تتجاوز بكثير 100 مليون دولار". ومع ذلك، لم يقدم أي تفصيل محدد.

تدريب نماذج اللغة الضخمة تشغيل مجموعات من الرقائق الإلكترونية فائقة القدرة لفترات طويلة، مما يستهلك كميات هائلة من الكهرباء أثناء معالجة النصوص والبرمجيات. لطالما افترض مراقبو الصناعة أن تكلفة مثل هذه المشاريع تصل إلى عشرات أو حتى مئات الملايين من الدولارات.

يُشكك الآن في هذا الافتراض، وفي وثيقة تكميلية، أقرت شركة DeepSeek بامتلاكها رقائق A100 واستخدامها لها في المراحل الأولى من التطوير، قبل نقل التدريب الكامل إلى مجموعة حواسيبها H800. ووفقًا للشركة التقنية، استمر تشغيل النموذج لمدة 80 ساعة خلال مرحلة التدريب النهائية.

انظر أيضًا:  يو بي إس تنشر نسخًا آلية من المحللين لتلبية الطلب على محتوى فيديو استثماري قصير على غرار تيك توك

رغم إصرار شركة إنفيديا على أن الشركة الصينية الناشئة لا تملك سوى معالجات H800، إلا أن المسؤولين الأمريكيين ما زالوا متشككين. قبل بضعة أشهر، صرّحت مصادر أمريكية لوكالة رويترز بأن شركة ديب سيك تمتلك بشكل غير قانوني كميات كبيرة من رقائق H100 المحظورة تصديرها إلى الصين.

وضع الابتكار تحت المجهر

لم يلفت النموذج R1 الانتباه فقط بسبب انخفاض تكاليف التدريب عليه، ولكن أيضًا لأنه قد يكون أول نموذج رئيسي يخضع لمراجعة رسمية من قبل النظراء.

"هذهdentمرحب بها للغاية، وإذا لم يكن لدينا هذا المعيار للمشاركة، فسيصبح من الصعب للغاية تقييم المخاطر"، هذا ما قاله لويس تونستال، مهندس التعلم الآلي في شركة Hugging Face الذي راجع ورقة بحثية نُشرت في مجلة Nature.

دفعت عملية المراجعة شركة DeepSeek إلى توضيح التفاصيل الفنية، بما في ذلك كيفية تدريب نموذجها وما هي الضمانات التي تم وضعها.

"إن الخضوع لعملية مراجعة صارمة من قبل النظراء يساعد بالتأكيد في التحقق من صحة النموذج وفائدته"، كما قال هوان صن، الباحث في مجال الذكاء الاصطناعي في جامعة ولاية أوهايو.

كان الإنجاز الرئيسي لـ DeepSeek هو استخدام نهج التعلم المعزز. فبدلاً من الاعتماد على أمثلة استدلالية منتقاة يدويًا، وفقًا للورقة البحثية، تمت مكافأة النموذج على حل المشكلات بشكل صحيح، وطوّر تدريجيًا استراتيجياته الخاصة لحل المشكلات.

وتقول الشركة إن نظام التجربة والخطأ هذا سمح لشركة R1 بالتحقق من طريقة عملها دون نسخ الأساليب البشرية.

انظر أيضًا:  جوجل تتعاون مع مطور للطاقة الشمسية مدعوم من بلاك روك في تايوان وسط ازدهار الذكاء الاصطناعي

وأضاف صن: "لقد كان لهذا النموذج تأثير كبير. فربما استُلهمت جميع أعمال التعلم المعزز تقريباً في عام 2025 من النموذج R1 بطريقة أو بأخرى"

شركة ديب سيك تنفي مزاعم النسخ

بعد وقت قصير من إصدار R1، انتشرت التكهنات بأن DeepSeek قد اعتمدت على مخرجات منافسة، وخاصة من OpenAI، لتسريع التدريب؛ ومع ذلك، فقد نفت الشركة الآن هذا الاتهام بشكل قاطع.

أكدت شركة DeepSeek في مراسلاتها مع المحكمين أن نموذج R1 لم ينسخ أمثلة الاستدلال التي أنشأتها OpenAI. ومع ذلك، وكما هو الحال مع معظم نماذج اللغة الكبيرة، فقد تم تدريبه على نصوص الإنترنت. وهذا يعني أن بعض المحتوى الذي أنتجه الذكاء الاصطناعي قد تم تضمينه حتماً، وقد أقنع هذا التفسير بعض المحكمين.

"لا يمكنني الجزم بنسبة 100% بأن النموذج R1 لم يتم تدريبه على أمثلة من OpenAI. ومع ذلك، تشير محاولات التكرار التي أجرتها مختبرات أخرى إلى أن التعلم المعزز جيد بما فيه الكفاية بمفرده." هذا ما قاله تونستال.

شركة DeepSeek إن نموذج R1 مصممٌ للتفوق في المهام التي تتطلب مهارات استدلالية عالية، مثل البرمجة والرياضياتmaticعلى موقع مجتمع الذكاء الاصطناعي Hugging Faceوقد تم تنزيله بالفعل أكثر من 10 ملايين مرة

أنفقت الشركة حوالي 6 ملايين دولار لتطوير النموذج الأساسي الذي بُني عليه جهاز R1، ولكن حتى مع إضافة هذا المبلغ، فإن تكاليفها أقل بكثير من المبالغ المرتبطة بالمنافسين. بالنسبة للكثيرين في هذا المجال، هذا ما يجعل R1trac.

قام صن وزملاؤه مؤخراً باختبار النظام على مهام البيانات العلمية ووجدوا أنه لم يكن الأكثر دقة، ولكنه كان من بين الأفضل من حيث التكلفة مقابل الأداء.

 

إذا كنت تقرأ هذا، فأنت متقدم بالفعل. ابقَ متقدماً من خلال نشرتنا الإخبارية.

رابط المشاركة:

إخلاء مسؤولية: المعلومات الواردة هنا ليست نصيحة استثمارية. Cryptopolitanموقع أي مسؤولية عن أي استثمارات تتم بناءً على المعلومات الواردة في هذه الصفحة. ننصحtrondentdentdentdentdentdentdentdent /أو استشارة مختص مؤهل قبل اتخاذ أي قرارات استثمارية.

الأكثر قراءة

جارٍ تحميل المقالات الأكثر قراءة...

ابقَ على اطلاع دائم بآخر أخبار العملات الرقمية، واحصل على تحديثات يومية في بريدك الإلكتروني

اختيار المحرر

جارٍ تحميل مقالات مختارة من قبل المحرر...

- النشرة الإخبارية الخاصة بالعملات الرقمية التي تُبقيك في الصدارة -

تتحرك الأسواق بسرعة.

نتحرك بشكل أسرع.

اشترك في النشرة اليومية Cryptopolitan واحصل على تحليلات دقيقة ومناسبة وفي الوقت المناسب حول العملات المشفرة مباشرة إلى بريدك الوارد.

انضم الآن ولن
تفوتك أي خطوة.

ادخل. احصل على الحقائق.
تقدم للأمام.

اشترك في CryptoPolitan