ترويض أوهام الذكاء الاصطناعي: مقاييس جديدة من مختبرات غاليليو لذكاء اصطناعي أكثر أمانًا وموثوقية

بواسطة

جون بالمر

قراءة لمدة 4 دقائق ، 22 نوفمبر 2023

تعالج مقاييس مختبرات غاليليو الهلوسات المتعلقة بالذكاء الاصطناعي، مما يعزز موثوقية الذكاء الاصطناعي وسلامته.
توفر المقاييس المبتكرة رؤى دقيقة حول أداء الذكاء الاصطناعي وتقييمًا خاصًا بالسياق.
تُمكّن منهجيات الكشف الفعّالة المطورين من تطوير تطبيقات ذكاء اصطناعي أكثر أمانًا.

مع استمرار التطور السريع للذكاء الاصطناعي، برزت المخاوف المتعلقة بحدوده وتداعياته الأخلاقية. ومن التحديات الناشئة ظاهرة "هلوسات الذكاء الاصطناعي"، حيث تُنتج أنظمة الذكاء الاصطناعي معلومات غير صحيحة أو غير ذات صلة أو لا تستند إلى المدخلات المُقدمة. واستجابةً لهذا القلق المتزايد، قدمت مختبرات غاليليو مقاييس مبتكرة تهدف إلى قياس "هلوسات الذكاء الاصطناعي" والحد منها. وتوفر هذه المقاييس سبيلًا واعدًا لتعزيز موثوقية وسلامة نماذج اللغة الكبيرة (LLMs) وأنظمة الذكاء الاصطناعي الأخرى.

صعود الهلوسات الناتجة عن الذكاء الاصطناعي

حققت تقنيات الذكاء الاصطناعي، ولا سيما نماذج اللغة الكبيرة (LLMs)، تقدماً ملحوظاً في معالجة اللغة الطبيعية وتوليدها. مع ذلك، لم يخلُ هذا التقدم من عيوبه. فقد أنتجت أنظمة الذكاء الاصطناعي، بما فيها ChatGPT، أحياناً ردوداً تبدو موثوقة لكنها خاطئة جوهرياً، وهي ظاهرة تُعرف باسم "الهلوسة". وقد بات التعرف على هذه الهلوسة في الذكاء الاصطناعي أمراً بالغ الأهمية في عصر يلعب فيه الذكاء الاصطناعي دوراً محورياً في تطبيقات متنوعة.

في عام 2023، أعلن قاموس كامبريدج كلمة "هلوسة" كلمة العام، مؤكداً على أهمية معالجة هذه المشكلة. ويعمل الباحثون والجهات الفاعلة في هذا المجال حالياً بنشاط على تطوير خوارزميات وأدوات للكشف عن هذه الهلوسات والتخفيف من آثارها بفعالية.

نقدم لكم مؤشر الهلوسة من مختبرات غاليليو

من أبرز المشاركين في مساعي معالجة الهلوسة الناتجة عن الذكاء الاصطناعي شركة "غاليليو لابز"، التي قدمت مقياسًا رائدًا يُسمى "مؤشر الهلوسة". يُستخدم هذا المؤشر كأداة لتقييم نماذج التعلم الآلي الشائعة بناءً على احتمالية تسببها في الهلوسة.

يكشف تحليل مختبرات غاليليو عن رؤى مثيرة للاهتمام. فحتى النماذج المتقدمة مثل OpenAI GPT-4، التي تُعتبر من بين الأفضل أداءً، عُرضة للخطأ في حوالي 23% من الحالات عند التعامل مع مهام الأسئلة والأجوبة الأساسية. وتُظهر بعض النماذج الأخرى أداءً أسوأ، حيث تصل نسبة الخطأ فيها إلى 60%. مع ذلك، يتطلب فهم هذه الإحصائيات نظرة فاحصة على الفروق الدقيقة والمقاييس الجديدة المُستخدمة.

نهج دقيق لقياسات الهلوسة

defiمختبرات غاليليو الهلوسة بأنها توليد معلومات أو بيانات غير صحيحة واقعيًا، أو غير ذات صلة، أو لا تستند إلى المدخلات المُقدّمة. ومن المهم الإشارة إلى أن طبيعة الهلوسة قد تختلف باختلاف نوع المهمة، مما يستدعي اتباع نهج خاص بكل مهمة عند تقييم أنظمة الذكاء الاصطناعي.

على سبيل المثال، في سيناريو أسئلة وأجوبة حيث يكون السياق بالغ الأهمية، يجب على نموذج التعلم الموجه باللغات (LLM) استرجاع السياق ذي الصلة وتقديم إجابة راسخة فيه. ولتحسين الأداء، تُستخدم تقنيات مثل التوليد المعزز بالاسترجاع (RAG) لتزويد نموذج التعلم الموجه باللغات بمعلومات ذات صلة بالسياق. ومن المثير للدهشة أن أداء GPT-4 يتراجع قليلاً مع استخدام RAG، مما يُبرز صعوبة معالجة الهلوسات بفعالية.

في المقابل، بالنسبة لمهام مثل توليد النصوص الطويلة، من الضروري تقييم مدى دقة المعلومات الواردة في إجابة الطالب. هنا،dentمقياس جديد يُسمى "الصحة" لتحديد الأخطاء الواقعية في الإجابات التي لا ترتبط بأي وثيقة أو سياق محدد.

الأبعاد الرئيسية المؤثرة على قابلية الإصابة بالهلوسة

dentمختبرات غاليليو عدة أبعاد رئيسية تؤثر على ميل طالب الماجستير في القانون إلى الهلوسة. وتشمل هذه الأبعاد ما يلي:

1. نوع المهمة: تؤثر طبيعة المهمة - سواء كانت خاصة بمجال معين أو عامة - على كيفية ظهور الهلوسات. بالنسبة للأسئلة الخاصة بمجال معين، مثل الرجوع إلى وثائق شركة ما للإجابة على استفسار، تلعب قدرة الحاصل على درجة الماجستير في القانون على استرجاع السياق اللازم واستخدامه دورًا حاسمًا.

2. حجم نموذج التعلم الخطي: يؤثر عدد المعاملات التي تم تدريب نموذج التعلم الخطي عليها على أدائه. وخلافًا للاعتقاد السائد بأن الحجم الأكبر هو الأفضل دائمًا، يُبرز هذا البُعد الحاجة إلى أحجام نماذج مثالية.

3. نافذة السياق: في الحالات التي يُستخدم فيها نظام RAG لتعزيز السياق، تصبح نافذة سياق نموذج التعلم المعزز (LLM) وقيوده ذات أهمية. إن قدرة نموذج التعلم المعزز على استرجاع المعلومات من منتصف النص المُقدم، كما أبرزت الأبحاث الحديثة، قد تؤثر على ميله إلى الهلوسة.

ChainPoll: منهجية فعالة من حيث التكلفة للكشف عن الهلوسة

لتبسيط عملية الكشف عن الهلوسة، طورت شركة غاليليو لابز منهجية جديدة للكشف عن الهلوسة تُسمى ChainPoll. تعتمد ChainPoll على منهجية هندسية تعتمد على تكلفة التفكير، مما يُمكّن نماذج الذكاء الاصطناعي من تقديم تفسيرات دقيقةmatic . تُساعد هذه المنهجية في فهم أسباب حدوث الهلوسة، مما يُسهّل تطوير ذكاء اصطناعي أكثر قابلية للتفسير.

تزعم شركة Galileo Labs أن ChainPoll أكثر فعالية من حيث التكلفة بحوالي 20 ضعفًا من تقنيات كشف الهلوسة السابقة. فهو يوفر وسيلة فعالة من حيث التكلفة لتقييم جودة مخرجات الذكاء الاصطناعي، لا سيما في أنواع المهام الشائعة مثل الدردشة والتلخيص والتوليد، سواءً مع أو بدون نظام RAG. علاوة على ذلك، تُظهر هذه المقاييس ارتباطًاtronبتعليقات المستخدمين.

نحو ذكاء اصطناعي أكثر أمانًا وجدارة بالثقة

رغم أن مقاييس مختبرات غاليليو تمثل خطوة هامة نحو معالجة التناقضات في الذكاء الاصطناعي، إلا أنها لا تزال قيد التطوير. ويُعدّ تحقيق نسبة توافق 85% مع آراء المستخدمين إنجازًا جديرًا بالثناء، ولكنه يترك مجالًا لمزيد من التحسين. كما ستحتاج هذه المقاييس إلى تكييفها مع نماذج التعلم متعددة الوسائط القادرة على التعامل مع أنواع بيانات متنوعة، بما في ذلك النصوص، والبرمجيات، والصور، والأصوات، والفيديوهات.

مع ذلك، تُعدّ هذه المقاييس أداة قيّمة للفرق التي تُطوّر تطبيقات إدارة دورة حياة البرمجيات. فهي تُوفّر تغذية راجعة مستمرة أثناء التطوير ومراقبة الإنتاج، مما يُتيحdentالمدخلات والمخرجات التي تتطلب اهتمامًا سريعًا. وهذا بدوره يُقلّل من وقت التطوير اللازم لإطلاق تطبيقات إدارة دورة حياة البرمجيات موثوقة وآمنة.

تقدم مقاييس ومنهجيات مختبرات غاليليو المبتكرة حلاً واعداً لمشكلة الهلوسة في الذكاء الاصطناعي. ومع استمرار تطور تقنيات الذكاء الاصطناعي، تزداد أهمية ضمان موثوقية ودقة مخرجاته. ورغم استمرار التحديات، فإن أدوات مثل مؤشر الهلوسة وChainPoll تمكّن المطورين والشركات من تسخير إمكانات الذكاء الاصطناعي بشكل أكثر أماناً ومسؤولية.

يُعدّ إدراك الهلوسات التي تُنتجها أنظمة الذكاء الاصطناعي خطوةً أساسيةً في تطوير قدراتها لتتجاوز مجرد محاكاة النصوص البشرية. ومع سعي هذه الأنظمة لاكتشاف آفاق جديدة، كعلم الفيزياء الحديث، فإنّ هذه الرحلة تتطلب مناهج مبتكرة لضمان سلامة ودقة ونشر الذكاء الاصطناعي بطريقة أخلاقية. وتُبرز إسهامات مختبرات غاليليو في هذا المسعى التزام القطاع بتوسيع آفاق الذكاء الاصطناعي مع الحفاظ على نزاهته وموثوقيته.

لا تكتفِ بقراءة أخبار العملات الرقمية، بل افهمها. اشترك في نشرتنا الإخبارية، إنها مجانية.

شارك هذا المقال

إخلاء مسؤولية: المعلومات الواردة هنا ليست نصيحة استثمارية. Cryptopolitanموقع أي مسؤولية عن أي استثمارات تتم بناءً على المعلومات الواردة في هذه الصفحة. ننصحtronبإجراء بحث مستقلdent /أو استشارة مختص مؤهل قبل اتخاذ أي قرارات استثمارية.

جون بالمر

انضم جون مورانجيري إلى Cryptopolitan وهو يمتلك مهارات تحليلية متقدمة في السوق. تخرج جون (المعروف أيضًا باسم JP) من جامعة نيروبي بدرجة البكالوريوس في الاتصال الجماهيري ودراسات الإعلام. وقد سبق له أن قدم تحليلات معمقة لسوق العملات الرقمية لموقعي InsideBitcoins.com وMetacoingraph.

جدول المحتويات

1. صعود الهلوسات الناتجة عن الذكاء الاصطناعي

2. نقدم لكم مؤشر الهلوسة من مختبرات غاليليو

3. نهج دقيق لقياسات الهلوسة

4. الأبعاد الرئيسية المؤثرة على قابلية الإصابة بالهلوسة

5. ChainPoll: منهجية فعالة من حيث التكلفة للكشف عن الهلوسة

6. نحو ذكاء اصطناعي أكثر أمانًا وجدارة بالثقة

شارك هذا المقال