كشفت شركة DeepSeek الصينية الناشئة في مجال الذكاء الاصطناعي عن أسلوب استدلال جديد، في ظل ترقب السوق لإطلاق نموذجها من الجيل التالي. ووفقًا للتقارير، فقد طرحت الشركة مؤخرًا نهجًا مبتكرًا من شأنه تعزيز قدرات الاستدلال لنماذج اللغة الكبيرة، بينما ينتظر الجمهور إطلاق نموذجها الجديد.
بحسب التقارير، كشفت ورقة بحثية نُشرت مؤخرًا أن هذا الإنجاز تحقق بفضل تعاون بين باحثين في جامعة تسينغهوا وشركة ناشئة متخصصة في الذكاء الاصطناعي. ووفقًا للورقة، تمكنت شركة DeepSeek من تطوير تقنية تجمع بين أساليب تُعرف باسم نمذجة المكافأة التوليدية (GRM) والضبط الذاتي. وسيُمكّن هذا النهج المزدوج نماذج التعلم الآلي من تقديم نتائج أفضل وأسرع للاستعلامات العامة.
كشف برنامج DeepSeek عن طريقة جديدة للاستدلال بالذكاء الاصطناعي
بحسب الباحثين، تفوقت نماذج DeepSeek-GRM الناتجة على الطرق الحالية، محققةً أداءً تنافسيًا مع نماذج المكافآت العامةtron. نمذجة المكافآت هي عملية تساعد نموذج التعلم الآلي على تحديد تفضيلات المستخدمين. وأشار الباحثون إلى أن الشركة الناشئة في مجال الذكاء الاصطناعي تعتزم جعل نماذج GRM مفتوحة المصدر، لكنها لم تحدد بعد جدولًا زمنيًا للتطوير.
يأتي نشر البحث الأكاديمي بعد تكهنات حول الخطوة التالية المحتملة للشركة الناشئة، عقب الشهرة العالمية التي حظيت بها enjنموذجها الأساسي DeepSeek V3 ونموذجها الاستدلالي R1. في ذلك الوقت، اكتسب نموذج R1، الذي صدر في وقت سابق من هذا العام، شهرة واسعة بعد أن تبين تفوقه على بعض النماذج الأقدم، بما في ذلك نموذج ChatGPT الأول من OpenAI.
أثار إطلاق نموذج R1 دهشة وادي السيليكون، لا سيما أنه نموذج مفتوح المصدر، وقد تم إنجازه بتكلفة زهيدة مقارنة بنماذج الذكاء الاصطناعي الأخرى. ورغم أن الاهتمام به يبدو أنه بدأ يخفت، فقد شهدت الشركات المتنافسة في مجال الذكاء الاصطناعي تقدماً ملحوظاً، مما يدل على أن المنافسة في هذا القطاع ستستمر عبر العصور.
مع ذلك، أشار تقرير لوكالة رويترز الشهر الماضي إلى احتمال وجود نسخة مطورة من DeepSeek-2، خليفة النسخة R1 الشهيرة عالميًا. ووفقًا للتقرير، قد تتطلع الشركة إلى إطلاقها في نهاية هذا الشهر، سعيًا منها للاستفادة من مكانتها المتنامية في مجال الذكاء الاصطناعي. من جانبها، التزمت DeepSeek الصمت حيال نسخة R2، ملتزمةً الصمت عبر قنواتها الرسمية، بينما نفى حساب خدمة العملاء الشائعات الموجهة لعملائها، بحسب التقارير.
يستمر تطوير نموذج V3
تأسست شركة DeepSeek، ومقرها هانغتشو، عام 2023 على يد رجل الأعمال ليانغ وينفنغ، وقد حظيت باهتمام عالمي واسع النطاق خلال الأشهر القليلة الماضية لأسباب وجيهة. مع ذلك، امتنعت الشركة عن إصدار أي بيانات رسمية، مفضلةً تركيز جهودها ووقتها بالكامل على البحث والتطوير. وبينما يبقى أن نرى ما ستقدمه الشركة لقطاع الذكاء الاصطناعي، فمن المؤكد أنها تعمل بجد، وفقًا للشائعات المتداولة.
أعلنت الشركة الشهر الماضي عن تطويرٍ كانت تعمل عليه، حيث عرضت للعالم نموذجها المُطوّر V3 المسمى DeepSeek-V3-0324. ووفقًا للشركة، يُقدّم النموذج المُطوّر "قدرات استدلال مُحسّنة، وتطويرًا مُحسّنًا لواجهة المستخدم، وإتقانًا مُحسّنًا للكتابة باللغة الصينية". وفي فبراير، قامت الشركة بالاستعانة بمصادر خارجية لخمسة من مستودعات برمجياتها، مما يسمح للمطورين بمراجعة برمجياتها والمساهمة في تطويرها. وأكدت الشركة الناشئة أنها ستُحرز "تقدمًا حقيقيًا بشفافية تامة"
في الشهر نفسه، نشر ليانغ دراسة تقنية حول الانتباه المتفرق الأصلي، وهي طريقة تُستخدم لتحسين كفاءة نماذج التعلم الآلي في معالجة كميات هائلة من البيانات. ويُعدّ ليانغ، البالغ من العمر 40 عامًا، مؤسس شركة "هاي فلاير كوانت"، الشركة الأم لشركة "ديب سيك"، وهي صندوق التحوّط الذي وفّر الدعم المالي اللازم لتطوير التقنيات التقنية لهذه الشركة الناشئة في مجال الذكاء الاصطناعي. وفي أواخر فبراير، شارك ليانغ في ندوة جمعت رواد أعمال في مجال التكنولوجيا، واستضافها الرئيس الصيني dent جين بينغ. وأشاد الرئيس بالشركة dent إياها دليلًا على مرونة البلاد في مواجهة تحركات الولايات المتحدة لاحتواء تقدّم الصين في مجال الذكاء الاصطناعي.

