أفضل برامج الدردشة الآلية المدعومة بالذكاء الاصطناعي "عرضة بشدة" لعمليات "كسر الحماية" البسيطة - دراسة

● يمكن خداع روبوتات الدردشة التي تعمل بالذكاء الاصطناعي بسهولة لتوليد ردود ضارة
● وجد الباحثون أن خمسة من أفضل برامج الماجستير في القانون "عرضة بشدة" لعمليات اختراق أنظمة الحماية
● تؤكد شركات الذكاء الاصطناعي على آليات الأمان المدمجة في نماذجها
وفقًا لدراسة جديدة أجراها معهد سلامة الذكاء الاصطناعي في المملكة المتحدة (AISI)، يمكن خداع روبوتات الدردشة التي تعمل بالذكاء الاصطناعي مثل ChatGPT أو Gemini بسهولة للاستجابة للاستفسارات التي تولد ردودًا ضارة.
قام باحثون حكوميون باختبار سلامة نماذج اللغة الكبيرة (LLMs) - وهي التقنية التي تقف وراء روبوتات الدردشة التي تعمل بالذكاء الاصطناعي - في مواجهة هجمات الأمن القومي.
وتأتي هذه النتائج قبل انعقاد قمة الذكاء الاصطناعي في سيول، والتي سيترأسها رئيس الوزراء البريطاني ريشي سوناك، في كوريا الجنوبية في الفترة من 21 إلى 22 مايو.
اقرأ أيضاً: ستكون السلامة بنداً رئيسياً على جدول أعمال قمة سيول للذكاء الاصطناعي
برامج الدردشة الآلية التي تعمل بالذكاء الاصطناعي عرضة للردود السامة
اختبر معهد AISI تقنيات "كسر الحماية" الأساسية - وهي عبارة عن مطالبات نصية تهدف إلى تجاوز الحماية ضد المحتوى غير القانوني أو السام أو الفاضح - على خمسة من أفضل برامج ماجستير القانون. لم يكشف المعهد عن أسماء أنظمة الذكاء الاصطناعي، لكنه وجد أن جميعها "شديدة الضعف"
وقالت الدراسة: "لا تزال جميع برامج إدارة التعلم المختبرة عرضة بشكل كبير لعمليات الاختراق الأساسية، وسيقدم بعضها مخرجات ضارة حتى بدون محاولات مخصصة للتحايل على إجراءات الحماية الخاصة بها".
وبحسب التقرير، فإن الهجمات "البسيطة نسبياً" مثل حث برنامج الدردشة الآلي على تضمين عبارة "بالتأكيد، يسعدني المساعدة"، يمكن أن تخدع نماذج اللغة الكبيرة لتقديم محتوى ضار من نواحٍ عديدة.
وذكرت الدراسة أن المحتوى قد يُشجع على إيذاء النفس، أو استخدام محاليل كيميائية خطيرة، أو التمييز الجنسي، أو إنكار المحرقة. وقد استخدمت منظمة AISI مواد إرشادية متاحة للعموم، كما طورت برامج اختراق أخرى خاصة لأغراض الدراسة.
كما اختبر المعهد جودة الردود على الاستفسارات ذات الطابع البيولوجي والكيميائي.
في حين أن المعرفة على مستوى الخبراء في هذه المجالات يمكن استخدامها لأغراض جيدة، أراد الباحثون معرفة ما إذا كان من الممكن استخدام روبوتات الدردشة التي تعمل بالذكاء الاصطناعي لأغراض ضارة مثل تعريض البنية التحتية الوطنية الحيوية للخطر.
"أظهر العديد من الحاصلين على درجة الماجستير في القانون معرفة على مستوى الخبراء في الكيمياء وعلم الأحياء. أجابت النماذج على أكثر من 600 سؤال خاص بالكيمياء وعلم الأحياء كتبه خبراء بمستويات مماثلة للبشر الحاصلين على تدريب على مستوى الدكتوراه"، كما وجد الباحثون.

يشكل الذكاء الاصطناعي تهديداً محدوداً للأمن السيبراني
وفيما يتعلق بإمكانية استخدام روبوتات الدردشة التي تعمل بالذكاء الاصطناعي كسلاح لتنفيذ هجمات إلكترونية، ذكرت الدراسة أن طلاب برنامج LLMs تفوقوا في مهام الأمن السيبراني البسيطة المصممةdentالمدارس الثانوية.
ومع ذلك، واجهت برامج الدردشة الآلية صعوبة في المهام الموجهةdentالجامعات، مما يشير إلى محدودية احتمالية استخدامها لأغراض خبيثة.
ومن بين المجالات الأخرى المثيرة للقلق ما إذا كان من الممكن نشر برامج الدردشة الآلية كوكلاء للقيام بسلسلة من الإجراءات بشكل مستقل بطرق "قد يصعب على البشر التحكم بها"
وأشارت الدراسة إلى أن "اثنين من طلاب ماجستير إدارة الأعمال أنجزا مهامًا قصيرة المدى (مثل مشاكل هندسة البرمجيات البسيطة) لكنهما لم يتمكنا من تخطيط وتنفيذ تسلسلات الإجراءات للمهام الأكثر تعقيدًا".
اقرأ أيضاً: "عراب الذكاء الاصطناعي" يطالب بدخل أساسي شامل لتعويض فقدان الوظائف
ساكيب بهاتي، عضو البرلمان ووكيل وزارة العلوم والابتكار والتكنولوجيا في المملكة المتحدة، ونُقل عن قوله مؤخراً إن التشريعات ستتشكل في الوقت المناسب وستستند إلى الاختبارات.
تزعم الشركات قدرتها على تصفية المحتوى السيئ
شركات مثل أنثروبيك، مبتكرة كلود، وميتا، التي صنعت لاما، وأوبن إيه آي، مطورة تشات جي بي تي، على آليات الأمان المدمجة في نماذجها الخاصة.
شركة OpenAI تؤكد أنها لا تسمح باستخدام تقنيتها "لإنتاج محتوى يحض على الكراهية أو التحرش أو العنف أو المحتوى المخصص للبالغين". وذكرت أنها تعطي الأولوية "لتجنب ردود الفعل الضارة أو غير القانونية أو غير الأخلاقية قبل حدوثها".
معهد سلامة الذكاء الاصطناعي أمام المديرين التنفيذيين في مجال التكنولوجيا وقادة الحكومة وخبراء الذكاء الاصطناعي في قمة سيول.
Cryptopolitan بقلم جيفري جوجو
إذا كنت تقرأ هذا، فأنت متقدم بالفعل. ابقَ متقدماً من خلال نشرتنا الإخبارية.
إخلاء مسؤولية: المعلومات الواردة هنا ليست نصيحة استثمارية. لا يتحمل Cryptopolitanأي مسؤولية عن أي استثمارات تتم بناءً على المعلومات الواردة في هذه الصفحة. ننصحtronبإجراء بحثdent و/أو استشارة مختص مؤهل قبل اتخاذ أي قرارات استثمارية.
دورة
- أي العملات المشفرة يمكن أن تدر عليك المال
- كيفية تعزيز أمانك باستخدام المحفظة الإلكترونية (وأي منها يستحق الاستخدام فعلاً)
- استراتيجيات استثمارية غير معروفة يستخدمها المحترفون
- كيفية البدء في الاستثمار في العملات المشفرة (أي منصات التداول التي يجب استخدامها، وأفضل العملات المشفرة للشراء، إلخ)














