آخر الأخبار
مختارة خصيصاً لك
أسبوعي
ابقَ في القمة

أفضل المعلومات حول العملات الرقمية تصلك مباشرة إلى بريدك الإلكتروني.

كشفت شركة DeepSeek عن mHC لكنها تواجه عقبات في مراجعة النظراء

بقلمإناسي ماباكاميإيناسي ماباكامي
قراءة لمدة 3 دقائق
كشفت شركة DeepSeek عن mHC لكنها تواجه عقبات في مراجعة النظراء.
  • يقترح DeepSeek طريقة جديدة لتوسيع نطاق الذكاء الاصطناعي دون الحاجة إلى قوة حوسبة إضافية.
  • يرى الباحثون بوادر إيجابية لكنهم يحذرون من أن هناك حاجة إلى مزيد من الاختبارات.
  • قد يُعيد mHC تشكيل طريقة تدريب نماذج اللغة الكبيرة.

في الوقت الذي توجد فيه مشاكل تتعلق بتزايد تكاليف تطوير وصيانة الذكاء الاصطناعي والكمية المحدودة من الأجهزة المتاحة، قدمت شركة DeepSeek خطة جديدة لتطوير وتوسيع نطاق الذكاء الاصطناعي (AI).

تؤمن الشركة الناشئة الصينية بقدرتها على ابتكار نماذج ذكاء اصطناعي أفضل بكثير دون الحاجة إلى إضافة المزيد من الرقائق الإلكترونية، وبالتالي تقليل استهلاك الطاقة. ورغم أن مفهوم الذكاء الاصطناعي المختلط المقترح قد حظي باهتمام كبير من العديد من الباحثين في هذا المجال، إلا أنه يُعتبر عمومًا في مراحله الأولى.

سيتطلب الأمر إجراء المزيد من الأبحاث لتحديد فوائد هذا النهج في تطوير أنظمة الذكاء الاصطناعي الأكبر حجمًا. وقد نُشرت ورقة بحثية تقنية تشرح مفهوم mHC بالتفصيل الأسبوع الماضي، وشارك في تأليفها ليانغ وينفنغ، مؤسس شركة DeepSeek ومديرها التنفيذي.

يعيد DeepSeek النظر في تصميم الشبكة لتوسيع نطاق الذكاء الاصطناعي

أحد المكونات الرئيسية لهذا العمل هو إعادة تقييم كيفية نقل المعلومات بين الطبقات المختلفة للشبكة العصبية متعددة الطبقات.

تقوم كل طبقة في الشبكة العصبية بتمرير شكل من أشكال المعلومات المعالجة إلى الطبقة التالية في النموذج، مما يُنشئ ما يُسمى "شبكة التعلم المتبقي" (ResNet). وقد طوّرها كايمينغ هي وآخرون من مايكروسوفت ريسيرش قبل حوالي عشر سنوات، ووفرت شبكات ResNet الأساس الجوهري لعدد من أنظمة الذكاء الاصطناعي الأكثر تطوراً اليوم.

تم تطوير مفهوم بواسطة DeepSeek بعد أن قدمت ByteDance تقنية Hyper-Connections في عام 2024. تسمح تقنية Hyper-Connections للمعلومات بالانتقال عبر مسارات متعددة من خلال الشبكة، بدلاً من مسار رئيسي واحد فقط، مما يمكن أن يزيد من سرعة التعلم وثراء التجربة.

ومع ذلك، فبينما يمكن أن تكون مفيدة، إلا أنها قد تؤدي أيضًا إلى حدوثmatic في التدريب، حيث تواجه النماذج عدم استقرار في التدريب أو فشلًا تامًا.

وفقًا لسونغ لينكي (جامعة مدينة هونغ كونغ)، فإن بحث DeepSeek هو تطور لفكرة موجودة، واستمرار لكيفية نظر DeepSeek إلى عمل الشركات الأخرى، بدلاً من اختراع شيء ما من الصفر.

تتم مقارنة ResNet بطريق سريع ذي حارة واحدة بينما تشبه Hyper-Connections طريقًا سريعًا متعدد الحارات؛ ومع ذلك، حذر سونغ من أن وجود حارات متعددة بدون قواعد مناسبة قد يؤدي إلى المزيد من التصادمات.

يعتقد البروفيسور غو سونغ من جامعة هونغ كونغ للعلوم والتكنولوجيا أن هذه الورقة البحثية قد تشير إلى تحول في سلوك البحث في مجال الذكاء الاصطناعي. فبدلاً من الاستمرار في إجراء تعديلات طفيفة على تصميمات النماذج الحالية، يرى أن البحث قد يتطور نحو تطوير نماذج جديدة تستند إلى أسس نظرية.

أجرى الباحثون اختبارات على معقد التوافق النسيجي الرئيسي (mHC)، لكنهم أثاروا مخاوف عملية

رغم الحماس الذي ساد بعد الإنجاز الأخير في اختبار نموذج mHC للتعلم العميق، إلا أن الخبراء أكدوا أن البحث لم يكتمل بعد. فقد اقتصرت الاختبارات التي أجرتها شركة DeepSeek على أربعة مسارات بيانات فقط عند اختبار نماذج تضم 27 مليار مُعامل.

"لقد أثبتت التجارب صحة النماذج التي تصل إلى 27 مليار معلمة، ولكن كيف سيكون أداؤها على نماذج اليوم الرائدة التي تفوقها بمقدار عشرة أضعاف؟"

الأستاذ غو سونغ.

نماذج الذكاء الاصطناعي المتاحة اليوم أكبر حجماً وتحتوي عادةً على مئات المليارات من المعلمات مقارنة بـ 30 مليار معلمة كانت هي المعيار قبل بضع سنوات فقط.

أيد غو هذه الآراء، مصرحًا بأنه لا يمكن لأحد أن يجزم بعدُ بقدرة الحوسبة الصحية المتنقلة على أداء مهام في طليعة تكنولوجيا الذكاء الاصطناعي. وأضاف أن البنية التحتية اللازمة لتشغيل هذه الحوسبة قد تكون متقدمة للغاية بحيث يصعب على المؤسسات البحثية الصغيرة استخدامها، وعلى الشركات توظيفها على الأجهزة المحمولة.

وفقًا لموقع Cryptopolitan، جاءت شعبية DeepSeek من إصدارهم لنموذج اللغة الكبير DeepSeek V3، والإصدار اللاحق لنموذج الاستدلال DeepSeek-R1 بعد أسبوعين فقط.

عند مقارنة نتائج النماذج بمنافسيها خلال اختبارات القياس المعيارية، تمكن كلا النموذجين من الوصول إلى نتائج منافسيهما أو تجاوزها على الرغم من إصدارهما باستخدام جزء صغير فقط من بيانات التدريب المستخدمة في نماذج اللغة المنافسة الأخرى.

أذكى العقول في عالم العملات الرقمية يتابعون نشرتنا الإخبارية بالفعل. هل ترغب بالانضمام إليهم؟ انضم إليهم.

المزيد من الأخبار
مكثفة في المشفرة
دورة