آخر الأخبار

يعيش إيران تلغي محادثات السلام مع ترامب بسبب الضربات الإسرائيلية على لبنان، مما أدى إلى انخفاض الأسواق

تحديثات مباشرة بتاريخ 19 يونيو 2026
إيران تعلن عن إغلاق جديد لمضيق هرمز

قبل ساعة واحدة - الاقتصاد
المملكة المتحدة تخوض جولة جديدة من المواجهات مع شركات التكنولوجيا الكبرى بشأن طلبات الترويج للمحتوى

قبل 3 ساعات - تنظيم
تقوم منظمة ENS DAO بتقييم اقتراح "التحقق المؤقت" لتحديد أدوار المنظمة اللامركزية defiوالمؤسسة

أخبار قبل 3 ساعات

مختارة خصيصاً لك

أسبوعي

ابقَ في القمة

أفضل المعلومات حول العملات الرقمية تصلك مباشرة إلى بريدك الإلكتروني.

باحثون يكشفون عن ثغرات في نماذج الذكاء الاصطناعي، مما يثير مخاوف

بواسطة

ديريك كلينتون

قراءة لمدة 3 دقائق ، 17 نوفمبر 2023

نماذج الذكاء الاصطناعي، التي تصنع صورًا واضحة، تكشف عن عيوب في أنظمة مثل Stable Diffusion من Stability AI ومرشحات الأمان DALL-E 2 من OpenAI.
يكشف برنامج SneakyPrompt، باستخدام التعلم المعزز، عن نقاط الضعف في سياسات المطورين، مما يتيح إنشاء محتوى محظور عن طريق التلاعب بنماذج الذكاء الاصطناعي.
إن نجاح SneakyPrompt يثير مخاوف بشأن فعالية تدابير السلامة، ويحث مجتمع الذكاء الاصطناعي على تعزيز الأمن لمنع إساءة الاستخدام.

كشف باحثون من جامعة جونز هوبكنز وجامعة ديوك عن خلل مثير للقلق في نماذج الذكاء الاصطناعي الرائدة، بما في ذلك Stable Diffusion من Stability AI وDALL-E 2 من OpenAI. هذا الخلل، الذي أطلق عليه اسم "SneakyPrompt"، يسمح بالتلاعب بهذه النماذج لإنشاء محتوى صريح وعنيف، متجاوزًا مرشحات الأمان والسياسات التي وضعها المطورون.

يكشف البحث، المقرر عرضه في ندوة IEEE للأمن والخصوصية، عن سهولة إجبار نماذج الذكاء الاصطناعي التوليدية على إنشاء صور فاضحة وضارة. يستغل برنامج SneakyPrompt التعلم المعزز لصياغة عبارات تبدو غير منطقية، والتي تؤدي، عند إدخالها إلى النماذج، إلى توليد محتوى محظور. هذه الطريقة تُعدّ بمثابة "كسر حماية" للذكاء الاصطناعي، متجاوزةً بذلك إجراءات الأمان المعتمدة.

كشف نقاط الضعف

تمتلك شركتا Stability AI وOpenAI، وهما من أبرز الشركات في مجال الذكاء الاصطناعي، أنظمة حماية قوية لمنع إنشاء محتوى غير لائق. ومع ذلك، أظهر برنامج SneakyPrompt أن هذه الأنظمة ليست مضمونة النتائج. فمن خلال تعديل بسيط في الرسائل النصية، تمكن الباحثون من تجاوز أنظمة الحماية، مما أجبر النماذج على إنتاج صور فاضحة.

تعتمد تقنية SneakyPrompt على استبدال الكلمات المحظورة بمصطلحات تبدو غير ذات صلة وغير منطقية، والتي تفسرها نماذج الذكاء الاصطناعي بطريقة تتوافق مع المحتوى المحظور. على سبيل المثال، أدى استبدال كلمة "عاري" بمصطلح مثل "grponypui" إلى توليد صور إباحية. يُبرز هذا التلاعب الدلالي نقطة ضعف كبيرة في قدرة نماذج الذكاء الاصطناعي على تمييز المحتوى الضار.

تحدي سياسات المطورين

يُبرز عمل هؤلاء الباحثين المخاطر المحتملة المرتبطة بنشر نماذج الذكاء الاصطناعي للعموم. فبينما تحظر مؤسستا Stability AI وOpenAI صراحةً استخدام تقنياتهما في المحتوى الصريح أو العنيف، يكشف برنامج SneakyPrompt عن قصور الضوابط الحالية. وهذا يثير مخاوف بشأن كفاية تدابير السلامة وإمكانية إساءة استخدام تقنية الذكاء الاصطناعي.

ردود المطورين

تم إبلاغ شركتي Stability AI وOpenAI فورًا بنتائج الباحثين. وحتى وقت كتابة هذا التقرير، لم يعد برنامج DALL-E 2 من OpenAI يُنتج صورًا غير لائقة استجابةً للمطالباتdent. مع ذلك، لا يزال برنامج Stable Diffusion 1.4 من Stability AI، وهو الإصدار الذي تم اختباره، عرضةً لهجمات SneakyPrompt.

امتنعت شركة OpenAI عن التعليق على النتائج المحددة، لكنها لفتت الانتباه إلى الموارد المتاحة على موقعها الإلكتروني لتحسين السلامة. من جانبها، أعربت شركة Stability AI عن التزامها بالعمل مع الباحثين لتعزيز آليات الحماية للنماذج القادمة ومنع إساءة استخدامها.

مواجهة التهديدات المستقبلية

يُقرّ الباحثون بالطبيعة المتغيرة للتهديدات الأمنية التي تواجه نماذج الذكاء الاصطناعي. ويقترحون حلولاً محتملة، مثل تطبيق مرشحات جديدة تُقيّم الكلمات الفردية بدلاً من الجمل الكاملة. وتتضمن استراتيجية دفاعية أخرى حجب المطالبات التي تحتوي على كلمات غير موجودة في القواميس، على الرغم من أن الدراسة تكشف عن محدودية هذا النهج.

إن قدرة نماذج الذكاء الاصطناعي على تجاوز إجراءات السلامة لها تداعيات أوسع، لا سيما في سياق الحرب المعلوماتية. ويُثير احتمال توليد محتوى مُزيّف يتعلق بأحداث حساسة، كما تجلى في الصراع الإسرائيلي الفلسطيني الأخير، مخاوف بشأن العواقب الكارثية للتضليل المُولّد بواسطة الذكاء الاصطناعي.

بمثابة جرس إنذار لمجتمع الذكاء الاصطناعي

تُشكل نتائج البحث بمثابة جرس إنذار لمجتمع الذكاء الاصطناعي لإعادة تقييم وتعزيز إجراءات الأمان. وتؤكد الثغرات التي كشف عنها برنامج SneakyPrompt على ضرورة التحسين المستمر لمرشحات الأمان للحد من المخاطر المرتبطة بإساءة استخدام تقنية الذكاء الاصطناعي التوليدي.

في مجال سريع التطور، بات السعي وراء تدابير أمان قوية ضرورة حتمية لمنع التلاعب بنماذج الذكاء الاصطناعي لأغراض خبيثة. ومع استمرار الذكاء الاصطناعي في لعب دور بارز في مختلف المجالات، تقع على عاتق المطورين مسؤولية استباق التهديدات المحتملة وضمان نشر تقنياتهم بشكل أخلاقي وآمن.

أذكى العقول في عالم العملات الرقمية يتابعون نشرتنا الإخبارية بالفعل. هل ترغب بالانضمام إليهم؟ انضم إليهم.

شارك هذا المقال

إخلاء مسؤولية: المعلومات الواردة هنا ليست نصيحة استثمارية. Cryptopolitanموقع أي مسؤولية عن أي استثمارات تتم بناءً على المعلومات الواردة في هذه الصفحة. ننصحtronبإجراء بحث مستقلdent /أو استشارة مختص مؤهل قبل اتخاذ أي قرارات استثمارية.

ديريك كلينتون

ديريك كاتب مستقل مهتم بتقنية البلوك تشين والعملات الرقمية. يركز عمله بشكل أساسي على مشاكل وحلول مشاريع العملات الرقمية، ويقدم رؤية سوقية للاستثمارات. كما يوظف مهاراته التحليلية في كتابة الأطروحات.

جدول المحتويات

1. كشف نقاط الضعف

2. تحدي سياسات المطورين

3. ردود المطورين

4. مواجهة التهديدات المستقبلية

5. بمثابة جرس إنذار لمجتمع الذكاء الاصطناعي

شارك هذا المقال

المزيد من الأخبار

عرض الكل

ما هي منصة بيس؟ شبكة الطبقة الثانية Ethereum التي أطلقتها منصة كوين بيس

٢١ أكتوبر ٢٠٢٥: تعلم العملات الرقمية: أدلة للمبتدئين
Dogecoin مقابل Bitcoin: الاختلافات التقنية الرئيسية

٢٠ أكتوبر ٢٠٢٥: تعلم العملات الرقمية: أدلة للمبتدئين
ما هو TVL (إجمالي القيمة المقفلة) في العملات المشفرة؟

١٤ أكتوبر ٢٠٢٥: تعلم العملات الرقمية: أدلة للمبتدئين
كيفية قراءة ورقة بيضاء خاصة بالعملات الرقمية؟

١٣ أكتوبر ٢٠٢٥: تعلم العملات الرقمية: أدلة للمبتدئين
Ripple مقابل XRP مقابل XRP Ledger: ما الفرق؟

١٣ أكتوبر ٢٠٢٥: تعلم العملات الرقمية: أدلة للمبتدئين
ما هي محفظة التوقيعات المتعددة في عالم العملات الرقمية؟

١٠ أكتوبر ٢٠٢٥: تعلم العملات الرقمية: أدلة للمبتدئين

دورة مكثفة في عالم العملات المشفرة

أي العملات المشفرة يمكن أن تدر عليك المال
كيفية تعزيز أمانك باستخدام المحفظة الإلكترونية (وأي منها يستحق الاستخدام فعلاً)
استراتيجيات استثمارية غير معروفة يستخدمها المحترفون
كيفية البدء في الاستثمار في العملات المشفرة (أي منصات التداول التي يجب استخدامها، وأفضل العملات المشفرة للشراء، إلخ)

باحثون يكشفون عن ثغرات في نماذج الذكاء الاصطناعي، مما يثير مخاوف

كشف نقاط الضعف

تحدي سياسات المطورين

ردود المطورين

مواجهة التهديدات المستقبلية

بمثابة جرس إنذار لمجتمع الذكاء الاصطناعي

خمسة تطبيقات مبتكرة لـ ChatGPT وما يجب عليك فعله حيالها

93% من قادة الأعمال يفضلون الحلول المدعومة بالذكاء الاصطناعي لإدارة استدامة العلامات التجارية، رويترز

إليكم كيف يدعم ماكرون النظام البيئي للذكاء الاصطناعي النابض بالحياة والمنتج في فرنسا

تتوقع بلومبيرغ أن يصل حجم سوق الذكاء الاصطناعي التوليدي إلى 1.3 تريليون دولار بحلول عام 2032

موجز واحد حاد.
كل يوم.

باحثون يكشفون عن ثغرات في نماذج الذكاء الاصطناعي، مما يثير مخاوف

كشف نقاط الضعف

تحدي سياسات المطورين

ردود المطورين

مواجهة التهديدات المستقبلية

بمثابة جرس إنذار لمجتمع الذكاء الاصطناعي

خمسة تطبيقات مبتكرة لـ ChatGPT وما يجب عليك فعله حيالها

93% من قادة الأعمال يفضلون الحلول المدعومة بالذكاء الاصطناعي لإدارة استدامة العلامات التجارية، رويترز

إليكم كيف يدعم ماكرون النظام البيئي للذكاء الاصطناعي النابض بالحياة والمنتج في فرنسا

تتوقع بلومبيرغ أن يصل حجم سوق الذكاء الاصطناعي التوليدي إلى 1.3 تريليون دولار بحلول عام 2032

موجز واحد حاد.كل يوم.

موجز واحد حاد.
كل يوم.