برز نهجٌ رائدٌ في تعليم برامج الذكاء الاصطناعي، يُعرف باسم "الاستكشاف الموجه بشريًا" (HuGE)، كمنهجٍ ثوريٍّ في أبحاث الذكاء الاصطناعي. طُوِّر هذا النهج بالتعاون بين باحثين من معهد ماساتشوستس للتكنولوجيا (MIT) وجامعة هارفارد وجامعة واشنطن، ويُمكّن برامج الذكاء الاصطناعي من تعلّم مهام جديدة بسرعةٍ وفعاليةٍ أكبر، بمساعدة التغذية الراجعة البشرية غير المتخصصة. ومن المتوقع أن تُحدث هذه التقنية المبتكرة ثورةً في كيفية اكتساب برامج الذكاء الاصطناعي لمهاراتٍ جديدة، مما يُمكّن الروبوتات من تعلّم مهامٍ معقدةٍ بشكلٍdentبتوجيهٍ من التغذية الراجعة الجماعية.
التحديات في تدريب الذكاء الاصطناعي
عادةً ما يتضمن تدريب وكلاء الذكاء الاصطناعي على أداء مهام جديدة عملية تُسمى التعلم التعزيزي، حيث يتعلم الوكيل من خلال التجربة والخطأ، ويحصل على مكافآت مقابل الإجراءات التي تُقرّبه من هدفdefiمُسبقًا. في كثير من الحالات، يجب على الخبراء البشريين تصميم دالة مكافأة بدقة، وهي آلية تحفيز تُحفّز وكيل الذكاء الاصطناعي على الاستكشاف واتخاذ الإجراءات. ومع ذلك، قد يكون تصميم هذه المكافآت مُستهلكًا للوقت، وغير فعال، وصعوبة في التوسع، خاصةً للمهام المُعقدة التي تتضمن خطوات مُتعددة.
ردود الفعل الجماعية كحل
يُحدث نهج HuGE نقلة نوعية من خلال الاستفادة من التعليقات الجماعية المُجمعة من مستخدمين غير خبراء لتوجيه عمليات تعلم وكلاء الذكاء الاصطناعي. بخلاف الأساليب التقليدية التي تعتمد على وظائف مكافآت مُصممة بخبرة، يُتيح HuGE لوكلاء الذكاء الاصطناعي التعلم بسرعة أكبر، حتى عند العمل مع بيانات مُشوشة من غير الخبراء، والتي قد تحتوي تعليقاتهم على أخطاء قد تُعطل الأساليب الأخرى.
فصل عملية التعلم
قسّم الباحثون في HuGE عملية التعلم إلى عنصرين منفصلين، كلٌّ منهما يعتمد على خوارزميته. يفصل هذا النهج بين اختيار الهدف ومرحلة الاستكشاف، مما يُمكّن العميل من التعلم بكفاءة من خلال التغذية الراجعة الجماعية. العنصران الرئيسيان لـ HuGE هما:
١. خوارزمية اختيار الهدف : يُحدَّث هذا الجزء من المنهجية باستمرار بناءً على ملاحظات المستخدمين غير الخبراء. بدلًا من استخدام الملاحظات كدالة مكافأة مباشرة، تُوجِّه هذه الخوارزمية استكشاف العميل. يُقدِّم المستخدمون مُدخلات باختيار الحالة الأقرب إلى الهدف المطلوب، مما يسمح للعميل بتعديل استكشافه وفقًا لذلك.
٢. استكشاف العميل: عميل الذكاء الاصطناعي بيئته بشكل مستقل dent مسترشدًا بملاحظات مُحدِّد الهدف. يجمع بيانات، مثل الصور أو مقاطع الفيديو لأفعاله، ثم يُرسلها إلى المستخدمين للحصول على مزيد من الملاحظات. تُضيِّق هذه الحلقة مجالات استكشاف العميل، وتوجِّهه نحو مسارات واعدة لتحقيق هدفه.
فوائد HuGE
يوفر HuGE العديد من المزايا مقارنة بالطرق التقليدية لتدريب وكلاء الذكاء الاصطناعي:
- التعلم بشكل أسرع: يتيح هذا النهج لوكلاء الذكاء الاصطناعي تعلم المهام الجديدة بشكل أسرع، حتى عندما تحتوي الملاحظات البشرية على أخطاء أو عدم دقة.
- التعليقات غير المتزامنة: يسمح HuGE بجمع التعليقات بشكل غير متزامن من المستخدمين غير الخبراء في جميع أنحاء العالم، مما يجعله حلاً قابلاً للتطوير ومتعدد الاستخدامات.
- التعلم المستقل: يمكن للوكلاء الاستمرار في التعلم بشكل مستقل، حتى عندما تكون الملاحظات محدودة أو متأخرة، مما يضمن التقدم المستمر.
الاختبارات الواقعية والمحاكاة
أجرى الباحثون اختبارات مكثفة على مهام محاكاة وواقعية للتحقق من فعالية HuGE. في عمليات المحاكاة، نجحوا في تدريب وكلاء الذكاء الاصطناعي على أداء مهام معقدة ذات تسلسلات طويلة من الإجراءات، مثل تكديس الكتل بترتيب محدد أو التنقل في متاهات معقدة. أما التجارب الواقعية، فقد تضمنت تدريب أذرع روبوتية على رسم الأشكال والتقاط الأشياء، باستخدام بيانات جُمعت من مستخدمين غير متخصصين في 13 دولة وثلاث قارات.
التوسع والتطبيقات المستقبلية
تشير نتائج HuGE الواعدة وسهولة الحصول على آراء غير الخبراء إلى إمكاناتها الكبيرة لتوسيع نطاق تدريب الذكاء الاصطناعي. في المستقبل، قد تُمكّن هذه الطريقة الروبوتات من التعلم وأداء مهام محددة في منازل المستخدمين دون الحاجة إلى عروض توضيحية فعلية. بالاعتماد على الآراء الجماعية، يمكن للروبوتات الاستكشاف بشكل مستقل، مسترشدةً بمساهمة جماعية من غير الخبراء.
يؤكد الباحثون على أهمية ضمان توافق برامج الذكاء الاصطناعي مع القيم الإنسانية والاعتبارات الأخلاقية. وبما أن برامج الذكاء الاصطناعي تتعلم وتتخذ القرارات بشكلdent، فإن المبادئ الأخلاقية وتوافق القيم أمران أساسيان لضمان استخدامها بشكل آمن ومسؤول.
الاتجاهات المستقبلية
يهدف الفريق إلى تحسين نهج HuGE بشكل أكبر. ويخططون لتمكين وكلاء الذكاء الاصطناعي من التعلم من أشكال التواصل المختلفة، مثل اللغة الطبيعية والتفاعلات المادية مع الروبوتات. بالإضافة إلى ذلك، يستكشفون إمكانية استخدام HuGE لتدريب وكلاء متعددين في وقت واحد، مما يفتح آفاقًا جديدة للتعلم التعاوني للذكاء الاصطناعي.
يُمثل الاستكشاف المُوجَّه بشريًا (HuGE) نقلة نوعية في تدريب الذكاء الاصطناعي، إذ يُبسِّط عملية تعليم وكلاء الذكاء الاصطناعي مهام جديدة. ومن خلال تسخير المعرفة الجماعية للمستخدمين غير الخبراء، يُسرِّع HuGE عملية التعلم، ويُقلِّل الحاجة إلى وظائف مكافآت مُصمَّمة من قِبَل الخبراء، ويُمهِّد الطريق للروبوتات لاكتساب مهارات مُعقَّدة بشكل ذاتي. ومع استمرار تطور مجال الذكاء الاصطناعي، يُمثِّل HuGE دليلاً على إمكانات التعلم التعاوني والجماعي في تشكيل مستقبل الوكلاء الأذكياء.
سجل في Bybit وابدأ التداول مع 30,050 دولارًا أمريكيًا كهدايا ترحيبية

