باحثون يكشفون عن ثغرات في نماذج الذكاء الاصطناعي، مما يثير مخاوف

- نماذج الذكاء الاصطناعي، التي تصنع صورًا واضحة، تكشف عن عيوب في أنظمة مثل Stable Diffusion من Stability AI ومرشحات الأمان DALL-E 2 من OpenAI.
- يكشف برنامج SneakyPrompt، باستخدام التعلم المعزز، عن نقاط الضعف في سياسات المطورين، مما يتيح إنشاء محتوى محظور عن طريق التلاعب بنماذج الذكاء الاصطناعي.
- إن نجاح SneakyPrompt يثير مخاوف بشأن فعالية تدابير السلامة، ويحث مجتمع الذكاء الاصطناعي على تعزيز الأمن لمنع إساءة الاستخدام.
كشف باحثون من جامعة جونز هوبكنز وجامعة ديوك عن خلل مثير للقلق في نماذج الذكاء الاصطناعي الرائدة، بما في ذلك Stable Diffusion من Stability AI وDALL-E 2 من OpenAI. هذا الخلل، الذي أطلق عليه اسم "SneakyPrompt"، يسمح بالتلاعب بهذه النماذج لإنشاء محتوى صريح وعنيف، متجاوزًا مرشحات الأمان والسياسات التي وضعها المطورون.
يكشف البحث، المقرر عرضه في ندوة IEEE للأمن والخصوصية، عن سهولة إجبار نماذج الذكاء الاصطناعي التوليدية على إنشاء صور فاضحة وضارة. يستغل برنامج SneakyPrompt التعلم المعزز لصياغة عبارات تبدو غير منطقية، والتي تؤدي، عند إدخالها إلى النماذج، إلى توليد محتوى محظور. هذه الطريقة تُعدّ بمثابة "كسر حماية" للذكاء الاصطناعي، متجاوزةً بذلك إجراءات الأمان المعتمدة.
كشف نقاط الضعف
تمتلك شركتا Stability AI وOpenAI، وهما من أبرز الشركات في مجال الذكاء الاصطناعي، أنظمة حماية قوية لمنع إنشاء محتوى غير لائق. ومع ذلك، أظهر برنامج SneakyPrompt أن هذه الأنظمة ليست مضمونة النتائج. فمن خلال تعديل بسيط في الرسائل النصية، تمكن الباحثون من تجاوز أنظمة الحماية، مما أجبر النماذج على إنتاج صور فاضحة.
تعتمد تقنية SneakyPrompt على استبدال الكلمات المحظورة بمصطلحات تبدو غير ذات صلة وغير منطقية، والتي تفسرها نماذج الذكاء الاصطناعي بطريقة تتوافق مع المحتوى المحظور. على سبيل المثال، أدى استبدال كلمة "عاري" بمصطلح مثل "grponypui" إلى توليد صور إباحية. يُبرز هذا التلاعب الدلالي نقطة ضعف كبيرة في قدرة نماذج الذكاء الاصطناعي على تمييز المحتوى الضار.
تحدي سياسات المطورين
يُبرز عمل هؤلاء الباحثين المخاطر المحتملة المرتبطة بنشر نماذج الذكاء الاصطناعي للعموم. فبينما تحظر مؤسستا Stability AI وOpenAI صراحةً استخدام تقنياتهما في المحتوى الصريح أو العنيف، يكشف برنامج SneakyPrompt عن قصور الضوابط الحالية. وهذا يثير مخاوف بشأن كفاية تدابير السلامة وإمكانية إساءة استخدام تقنية الذكاء الاصطناعي.
ردود المطورين
تم إبلاغ شركتي Stability AI وOpenAI فورًا بنتائج الباحثين. وحتى وقت كتابة هذا التقرير، لم يعد برنامج DALL-E 2 من OpenAI يُنتج صورًا غير لائقة استجابةً للمطالباتdent. مع ذلك، لا يزال برنامج Stable Diffusion 1.4 من Stability AI، وهو الإصدار الذي تم اختباره، عرضةً لهجمات SneakyPrompt.
امتنعت شركة OpenAI عن التعليق على النتائج المحددة، لكنها لفتت الانتباه إلى الموارد المتاحة على موقعها الإلكتروني لتحسين السلامة. من جانبها، أعربت شركة Stability AI عن التزامها بالعمل مع الباحثين لتعزيز آليات الحماية للنماذج القادمة ومنع إساءة استخدامها.
مواجهة التهديدات المستقبلية
يُقرّ الباحثون بالطبيعة المتغيرة للتهديدات الأمنية التي تواجه نماذج الذكاء الاصطناعي. ويقترحون حلولاً محتملة، مثل تطبيق مرشحات جديدة تُقيّم الكلمات الفردية بدلاً من الجمل الكاملة. وتتضمن استراتيجية دفاعية أخرى حجب المطالبات التي تحتوي على كلمات غير موجودة في القواميس، على الرغم من أن الدراسة تكشف عن محدودية هذا النهج.
إن قدرة نماذج الذكاء الاصطناعي على تجاوز إجراءات السلامة لها تداعيات أوسع، لا سيما في سياق الحرب المعلوماتية. ويُثير احتمال توليد محتوى مُزيّف يتعلق بأحداث حساسة، كما تجلى في الصراع الإسرائيلي الفلسطيني الأخير، مخاوف بشأن العواقب الكارثية للتضليل المُولّد بواسطة الذكاء الاصطناعي.
بمثابة جرس إنذار لمجتمع الذكاء الاصطناعي
تُشكل نتائج البحث بمثابة جرس إنذار لمجتمع الذكاء الاصطناعي لإعادة تقييم وتعزيز إجراءات الأمان. وتؤكد الثغرات التي كشف عنها برنامج SneakyPrompt على ضرورة التحسين المستمر لمرشحات الأمان للحد من المخاطر المرتبطة بإساءة استخدام تقنية الذكاء الاصطناعي التوليدي.
في مجال سريع التطور، بات السعي وراء تدابير أمان قوية ضرورة حتمية لمنع التلاعب بنماذج الذكاء الاصطناعي لأغراض خبيثة. ومع استمرار الذكاء الاصطناعي في لعب دور بارز في مختلف المجالات، تقع على عاتق المطورين مسؤولية استباق التهديدات المحتملة وضمان نشر تقنياتهم بشكل أخلاقي وآمن.
لا تكتفِ بقراءة أخبار العملات الرقمية، بل افهمها. اشترك في نشرتنا الإخبارية، إنها مجانية.
إخلاء مسؤولية: المعلومات الواردة هنا ليست نصيحة استثمارية. Cryptopolitanموقع أي مسؤولية عن أي استثمارات تتم بناءً على المعلومات الواردة في هذه الصفحة. ننصحtrondentdentdentdentdentdentdentdent /أو استشارة مختص مؤهل قبل اتخاذ أي قرارات استثمارية.
دورة
- أي العملات المشفرة يمكن أن تدر عليك المال
- كيفية تعزيز أمانك باستخدام المحفظة الإلكترونية (وأي منها يستحق الاستخدام فعلاً)
- استراتيجيات استثمارية غير معروفة يستخدمها المحترفون
- كيفية البدء في الاستثمار في العملات المشفرة (أي منصات التداول التي يجب استخدامها، وأفضل العملات المشفرة للشراء، إلخ)















