Your bank is using your money. You’re getting the scraps.WATCH FREE

باحثو مايكروسوفت يكشفون عن تقنية مبتكرة لمحو معلومات محددة من نماذج اللغة الكبيرة

في هذا المنشور:

  • كشف باحثون في مايكروسوفت عن طريقة جديدة لجعل نماذج الذكاء الاصطناعي تنسى معلومات محددة، مثل هاري بوتر، دون الحاجة إلى إعادة تدريب مكثفة.
  • تقنيتهم ​​المكونة من ثلاث خطوات تمحو المعرفة بكفاءة في ساعة واحدة فقط من استخدام وحدة معالجة الرسومات مع الحفاظ على الأداء العام للذكاء الاصطناعي سليماً.
  • يُبشّر هذا الإنجاز بظهور نماذج ذكاء اصطناعي أكثر قابلية للتكيف وأكثر أخلاقية في المستقبل.

في تطورٍ ملحوظ في مجال الذكاء الاصطناعي، كشف فريقٌ من الباحثين في مايكروسوفت عن منهجيةٍ رائدة لتعديل معارف محددة بشكلٍ انتقائي ضمن نماذج اللغة الكبيرة. تتناول هذه المنهجية المبتكرة، التي نُشرت تفاصيلها في ورقة بحثية حديثة على منصة arXiv.org الشهيرة، قضيةً هامة تتعلق باستخدام المواد المحمية بحقوق الطبع والنشر أثناء تدريب نماذج اللغة الكبيرة. علاوةً على ذلك، فهي تُقدم حلاً واعداً لمسألة قدرة هذه النماذج على التكيف دون الحاجة إلى إعادة تدريب مكثفة.

قفزة كبيرة في القدرة على التكيف

حظيت نماذج اللغة الكبيرة، مثل ChatGPT من OpenAI وLlama 2 من Meta وClaude 2 من Anthropic، باهتمام ودراسةtracنظرًا لقدرتها الاستثنائية على توليد محتوى نصي استنادًا إلى مجموعات البيانات الضخمة التي تُدرَّب عليها، والتي قد تتضمن مواد محمية بحقوق الطبع والنشر. لطالما شكّل تحدي تخصيص هذه النماذج لمحو معلومات محددة أو نسيانها مصدر قلق.

مسح فعال في ساعة واحدة باستخدام وحدة معالجة الرسومات

الباحثان في مايكروسوفت ، رونين إلدان ومارك روسينوفيتش، حلاً مبتكراً لهذا التحدي. تُقدّم ورقتهم البحثية تقنية ثلاثية الأبعاد مصممة لمحاكاة عملية محو معلومات محددة من نماذج اللغة. أبرز ما يُميّز هذا النهج هو كفاءته العالية. فقد أظهرا قدرةً على محو جميع المعلومات المتعلقة بسلسلة هاري بوتر، بما في ذلك الشخصيات وتفاصيل الحبكة، في غضون ساعة واحدة فقط من ضبط وحدة معالجة الرسومات. يُبشّر هذا المستوى العالي من الكفاءة بتطوير نماذج لغوية أكثر مرونة واستجابة.

انظر أيضًا:  dent سبيس إكس يواجه أكبر اختبار له بينما تتطلع الشركة إلى طرح عام أولي قياسي

تفكيك التقنية المكونة من ثلاثة أجزاء

تمثل تقنية إلدان وروسينوفيتش تحولاً ملحوظاً عن النهج التقليدي للتعلم الآلي، الذي يركز بشكل أساسي على تراكم المعرفة دون توفير آليات واضحة للتخلص من التعلم. ويتألف نهجهما المبتكر من ثلاث خطوات أساسية:

1.dentالرموز ذات الصلة: في المرحلة الأولية، يتم تدريب النموذج باستخدام البيانات المستهدفة، وهي في هذه الحالة كتب هاري بوتر.dentالنموذج الرموز الأكثر ارتباطًا بالبيانات المستهدفة من خلال مقارنة تنبؤاته بتلك التي يولدها نموذج أساسي. تُعد هذه الخطوة الأولية أساسًا لتحديد المعلومات المراد حذفها.

٢. استبدال التعبيرات الفريدة: تتضمن الخطوة الثانية استبدال التعبيرات الفريدة الخاصة بسلسلة هاري بوتر بتعبيرات عامة مماثلة. وبذلك، يُنتج الباحثون تنبؤات بديلة تُحاكي فعليًا مخرجات نموذج خالٍ من بيانات التدريب الخاصة بالسلسلة. ويُعد هذا الاستبدال عنصرًا محوريًا في عملية محو المعرفة.

3. الضبط الدقيق والمحو: تتمحور الخطوة الأخيرة حول ضبط النموذج الأساسي بدقة باستخدام التنبؤات البديلة. تمحو عملية الضبط الدقيق هذه النص الأصلي من ذاكرة النموذج عند تزويده بسياق متعلق بسلسلة هاري بوتر. تُمكّن هذه الخطوة الحاسمة النموذج من "نسيان" السرديات المعقدة لكتب هاري بوتر.

تقييم النجاح

أجرى إلدان وروسينوفيتش سلسلة شاملة من الاختبارات لتقييم فعالية منهجيتهما. فحصا كفاءة النموذج في توليد أو مناقشة محتوى متعلق بسلسلة هاري بوتر باستخدام 300 مُحفزmaticتلقائيًا، وحللا احتمالات الرموز بدقة. والأهم من ذلك، تشير نتائجهم إلى أنه بعد ساعة واحدة فقط من الضبط الدقيق، استطاع النموذج "نسيان" السرد التفصيلي لسلسلة هاري بوتر. والجدير بالذكر أن هذا النسيان لم يكن له تأثير يُذكر على أداء النموذج في التقييمات المعيارية مثل ARC وBoolQ وWinogrande.

انظر أيضًا:  مؤسس شركة سيتادل يقول إن الذكاء الاصطناعي العام يفشل في رفع عوائد صناديق التحوط

الآثار والبحوث المستقبلية

رغم أن هذه التقنية الرائدة تبشر بنتائج واعدة، إلا أنه من الضروري التأكيد على أن إجراء المزيد من البحوث أمر لا غنى عنه لتحسين المنهجية وتوسيع نطاقها، لا سيما فيما يتعلق بمهام إعادة التعلم الأوسع نطاقًا ضمن نماذج لغوية كبيرة. ومن الجدير بالذكر أن هذا النهج قد يكون فعالًا بشكل خاص مع النصوص الخيالية، مثل سلسلة هاري بوتر، نظرًا لوجود مراجع فريدة فيها.

مع استمرار أنظمة الذكاء الاصطناعي في لعب دور محوري متزايد في مختلف المجالات، تكتسب القدرة على نسيان معلومات محددة أو التخلص من آثارها أهمية قصوى. تمثل هذه المنهجية خطوة أساسية نحو تطوير أنظمة إدارة التعلم أكثر مسؤولية ومرونة والتزامًا بالقانون. كما أنها تحمل في طياتها إمكانية تلبية المبادئ التوجيهية الأخلاقية والقيم المجتمعية والمتطلبات الخاصة للمستخدمين مع استمرار تطور مجال الذكاء الاصطناعي.

إذا كنت تقرأ هذا، فأنت متقدم بالفعل. ابقَ متقدماً من خلال نشرتنا الإخبارية .

رابط المشاركة:

إخلاء مسؤولية: المعلومات الواردة هنا ليست نصيحة استثمارية. موقع Cryptopolitan أي مسؤولية عن أي استثمارات تتم بناءً على المعلومات الواردة في هذه الصفحة. ننصح tron بإجراء بحث مستقل dent /أو استشارة مختص مؤهل قبل اتخاذ أي قرارات استثمارية.

الأكثر قراءة

جارٍ تحميل المقالات الأكثر قراءة...

ابقَ على اطلاع دائم بآخر أخبار العملات الرقمية، واحصل على تحديثات يومية في بريدك الإلكتروني

اختيار المحرر

جارٍ تحميل مقالات مختارة من قبل المحرر...

- النشرة الإخبارية الخاصة بالعملات الرقمية التي تُبقيك في الصدارة -

تتحرك الأسواق بسرعة.

نتحرك بشكل أسرع.

اشترك في النشرة اليومية Cryptopolitan واحصل على تحليلات دقيقة ومناسبة وفي الوقت المناسب حول العملات المشفرة مباشرة إلى بريدك الوارد.

انضم الآن ولن
تفوتك أي خطوة.

ادخل. احصل على الحقائق.
تقدم للأمام.

اشترك في CryptoPolitan