ابتكر باحثون صينيون تقنية ضغط رائدة تهدف إلى معالجة قيود الأجهزة المرتبطة بنشر نماذج اللغة الكبيرة. وقد طُوّر هذا النهج الجديد، المسمى ShortGPT، من قبل خبراء من شركة Baichuan Inc. ومعهد مختبر معالجة المعلومات الصيني التابع للأكاديمية الصينية للعلوم. وتعتمد هذه الطريقة على تقنيات التقليم الحالية، مقدمةً حلاً لتخفيف تكاليف الاستدلال لنماذج اللغة الكبيرة دون الحاجة إلى تدريب إضافي.
إحداث ثورة في ضغط النماذج
تُقدّم طريقة ShortGPT مقياسًا جديدًا يُعرف باسم تأثير الكتلة (BI) لتقييم تحويلات الحالة المخفية داخل نماذج التعلم المحدود (LLMs). وباستخدام درجات تأثير الكتلة،dentالنظام المعلمات الزائدة ويزيلها، مما يُحسّن النموذج للنشر على أجهزة ذات موارد محدودة. يتضمن هذا النهج تقليم الطبقات بناءً على تأثيرها على أداء النموذج، لضمان الاحتفاظ بالمكونات الأساسية فقط.
أثبتت تجارب واسعة النطاق تفوق ShortGPT على أحدث أساليب التقليم المتاحة. على عكس الأساليب التقليدية التي تعتمد غالبًا على أساليب التكميم، يعمل ShortGPT بشكلdent، مما يتيح تقليلًا كبيرًا في عدد المعلمات وكفاءة حسابية عالية دون المساس بدقة النموذج. يُبرز هذا الابتكار التكرار الملحوظ في بنى LLM ويُظهر إمكانات تقنيات الضغط المُبسطة.
طموحات الصين في مجال الذكاء الاصطناعي
اتخذت الصين موقفاً إيجابياً تجاه تبني الذكاء الاصطناعي في السنوات الأخيرة لمواكبة وتيرة الابتكار في الولايات المتحدة وأوروبا. وتعمل البلاد بنشاط على تحسين قدرات مزودي خدمات الذكاء الاصطناعي وتقنية سلسلة الكتل والحوسبة الكمومية المحليين، وسط تصاعد التوتر مع الولايات المتحدة.
رغم هذا الموقف الاستباقي، تحرص السلطات الصينية على منع إساءة استخدام الذكاء الاصطناعي من خلال وضع لوائح صارمة وتطبيق أساليب إنفاذ صارمة. يُعدّ نظام الذكاء الاصطناعي في البر الرئيسي الصيني خلية نحل نشطة، ويؤكد ذلك avalanche من عمليات الطرح التجاري لعروض الذكاء الاصطناعي المُولّدة من قِبل شركات التكنولوجيا.
يمثل إطلاق ShortGPT علامة فارقة في مجال ضغط الذكاء الاصطناعي، إذ يبشر بتحسين الكفاءة والأداء لنماذج اللغة الضخمة. ومع استمرار الصين في قيادة الابتكار في مجال الذكاء الاصطناعي، فإن استثماراتها الاستراتيجية ومبادراتها البحثية تجعلها لاعباً مؤثراً في المشهد التقني العالمي.

