آخر الأخبار

يعيش مباشر: ارتفاع مفاجئ في Bitcoin فوق 82 ألف دولار

قبل ٢٢ ساعة تحديثات مباشرة
إلقاء القبض على رجل كيني في بنك I&M بتهمة سرقة عملات مشفرة بقيمة 261 ألف دولار

قبل ساعة واحدة - أخبار
أطلقت موناكو تحقيقاً في شركة زونداكريبتو التي تصفها بولندا الآن بأنها "مخطط هرمي"

قبل ساعتين - أخبار
تتوسع خدمات حفظ الأصول الرقمية بشكل مطرد مع دخول بنك نيويورك إلى الإمارات العربية المتحدة من خلال شركاء محليين

قبل ساعتين - أخبار

مختارة خصيصاً لك

أسبوعي

ابقَ في القمة

أفضل المعلومات حول العملات الرقمية تصلك مباشرة إلى بريدك الإلكتروني.

أفضل برامج الدردشة الآلية المدعومة بالذكاء الاصطناعي "عرضة بشدة" لعمليات "كسر الحماية" البسيطة - دراسة

بقلم

جيفري جوجو

قراءة لمدة دقيقتين ، 21 مايو 2024

● يمكن خداع روبوتات الدردشة التي تعمل بالذكاء الاصطناعي بسهولة لتوليد ردود ضارة

● وجد الباحثون أن خمسة من أفضل برامج الماجستير في القانون "عرضة بشدة" لعمليات اختراق أنظمة الحماية

● تؤكد شركات الذكاء الاصطناعي على آليات الأمان المدمجة في نماذجها

وفقًا لدراسة جديدة أجراها معهد سلامة الذكاء الاصطناعي في المملكة المتحدة (AISI)، يمكن خداع روبوتات الدردشة التي تعمل بالذكاء الاصطناعي مثل ChatGPT أو Gemini بسهولة للاستجابة للاستفسارات التي تولد ردودًا ضارة.

قام باحثون حكوميون باختبار سلامة نماذج اللغة الكبيرة (LLMs) - وهي التقنية التي تقف وراء روبوتات الدردشة التي تعمل بالذكاء الاصطناعي - في مواجهة هجمات الأمن القومي.

وتأتي هذه النتائج قبل انعقاد قمة الذكاء الاصطناعي في سيول، والتي سيترأسها رئيس الوزراء البريطاني ريشي سوناك، في كوريا الجنوبية في الفترة من 21 إلى 22 مايو.

برامج الدردشة الآلية التي تعمل بالذكاء الاصطناعي عرضة للردود السامة

اختبر معهد AISI تقنيات "كسر الحماية" الأساسية - وهي عبارة عن مطالبات نصية تهدف إلى تجاوز الحماية ضد المحتوى غير القانوني أو السام أو الفاضح - على خمسة من أفضل برامج ماجستير القانون. لم يكشف المعهد عن أسماء أنظمة الذكاء الاصطناعي، لكنه وجد أن جميعها "شديدة الضعف"

وقالت الدراسة: "لا تزال جميع برامج إدارة التعلم المختبرة عرضة بشكل كبير لعمليات الاختراق الأساسية، وسيقدم بعضها مخرجات ضارة حتى بدون محاولات مخصصة للتحايل على إجراءات الحماية الخاصة بها".

وبحسب التقرير، فإن الهجمات "البسيطة نسبياً" مثل حث برنامج الدردشة الآلي على تضمين عبارة "بالتأكيد، يسعدني المساعدة"، يمكن أن تخدع نماذج اللغة الكبيرة لتقديم محتوى ضار من نواحٍ عديدة.

وذكرت الدراسة أن المحتوى قد يُشجع على إيذاء النفس، أو استخدام محاليل كيميائية خطيرة، أو التمييز الجنسي، أو إنكار المحرقة. وقد استخدمت منظمة AISI مواد إرشادية متاحة للعموم، كما طورت برامج اختراق أخرى خاصة لأغراض الدراسة.

كما اختبر المعهد جودة الردود على الاستفسارات ذات الطابع البيولوجي والكيميائي.

في حين أن المعرفة على مستوى الخبراء في هذه المجالات يمكن استخدامها لأغراض جيدة، أراد الباحثون معرفة ما إذا كان من الممكن استخدام روبوتات الدردشة التي تعمل بالذكاء الاصطناعي لأغراض ضارة مثل تعريض البنية التحتية الوطنية الحيوية للخطر.

"أظهر العديد من الحاصلين على درجة الماجستير في القانون معرفة على مستوى الخبراء في الكيمياء وعلم الأحياء. أجابت النماذج على أكثر من 600 سؤال خاص بالكيمياء وعلم الأحياء كتبه خبراء بمستويات مماثلة للبشر الحاصلين على تدريب على مستوى الدكتوراه"، كما وجد الباحثون.

يشكل الذكاء الاصطناعي تهديداً محدوداً للأمن السيبراني

وفيما يتعلق بإمكانية استخدام روبوتات الدردشة التي تعمل بالذكاء الاصطناعي كسلاح لتنفيذ هجمات إلكترونية، ذكرت الدراسة أن طلاب برنامج LLMs تفوقوا في مهام الأمن السيبراني البسيطة المصممةdentالمدارس الثانوية.

ومع ذلك، واجهت برامج الدردشة الآلية صعوبة في المهام الموجهةdentالجامعات، مما يشير إلى محدودية احتمالية استخدامها لأغراض خبيثة.

ومن بين المجالات الأخرى المثيرة للقلق ما إذا كان من الممكن نشر برامج الدردشة الآلية كوكلاء للقيام بسلسلة من الإجراءات بشكل مستقل بطرق "قد يصعب على البشر التحكم بها"

وأشارت الدراسة إلى أن "اثنين من طلاب ماجستير إدارة الأعمال أنجزا مهامًا قصيرة المدى (مثل مشاكل هندسة البرمجيات البسيطة) لكنهما لم يتمكنا من تخطيط وتنفيذ تسلسلات الإجراءات للمهام الأكثر تعقيدًا".

ساكيب بهاتي، عضو البرلمان ووكيل وزارة العلوم والابتكار والتكنولوجيا في المملكة المتحدة، ونُقل عن قوله مؤخراً إن التشريعات ستتشكل في الوقت المناسب وستستند إلى الاختبارات.

تزعم الشركات قدرتها على تصفية المحتوى السيئ

شركات مثل أنثروبيك، مبتكرة كلود، وميتا، التي صنعت لاما، وأوبن إيه آي، مطورة تشات جي بي تي، على آليات الأمان المدمجة في نماذجها الخاصة.

شركة OpenAI تؤكد أنها لا تسمح باستخدام تقنيتها "لإنتاج محتوى يحض على الكراهية أو التحرش أو العنف أو المحتوى المخصص للبالغين". وذكرت أنها تعطي الأولوية "لتجنب ردود الفعل الضارة أو غير القانونية أو غير الأخلاقية قبل حدوثها".

معهد سلامة الذكاء الاصطناعي أمام المديرين التنفيذيين في مجال التكنولوجيا وقادة الحكومة وخبراء الذكاء الاصطناعي في قمة سيول.

Cryptopolitan بقلم جيفري جوجو

إذا كنت تقرأ هذا، فأنت متقدم بالفعل. ابقَ متقدماً من خلال نشرتنا الإخبارية.

ChatGPT كوريا الجنوبية

شارك هذا المقال

إخلاء مسؤولية: المعلومات الواردة هنا ليست نصيحة استثمارية. لا يتحمل Cryptopolitanأي مسؤولية عن أي استثمارات تتم بناءً على المعلومات الواردة في هذه الصفحة. ننصحtronبإجراء بحثdent و/أو استشارة مختص مؤهل قبل اتخاذ أي قرارات استثمارية.

جيفري جوجو

جيفري غوغو صحفيٌّ يتمتع بخبرة عشرين عامًا في مجال الأخبار والتحليلات المتعلقة بالأعمال والتمويل وتغير المناخ. وقد نُشرت أعماله في مؤسسة تومسون رويترز، وصحيفة زيمبابوي هيرالد، والعديد من المواقع الإلكترونية. كما كتب باستفاضة عن الذكاء الاصطناعي والميتافيرس، وبدأ بتغطية أسواق العملات الرقمية في عام ٢٠١٧. درس غوغو الصحافة والإعلام في كلية CCOSA في هراري.

جدول المحتويات

1. برامج الدردشة الآلية التي تعمل بالذكاء الاصطناعي عرضة للردود السامة

2. يشكل الذكاء الاصطناعي تهديداً محدوداً للأمن السيبراني

3. تزعم الشركات قدرتها على تصفية المحتوى السيئ

شارك هذا المقال

المزيد من الأخبار

عرض الكل

ما هي منصة بيس؟ شبكة الطبقة الثانية Ethereum التي أطلقتها منصة كوين بيس

٢١ أكتوبر ٢٠٢٥: تعلم العملات الرقمية: أدلة للمبتدئين
Dogecoin مقابل Bitcoin: الاختلافات التقنية الرئيسية

٢٠ أكتوبر ٢٠٢٥: تعلم العملات الرقمية: أدلة للمبتدئين
ما هو TVL (إجمالي القيمة المقفلة) في العملات المشفرة؟

١٤ أكتوبر ٢٠٢٥: تعلم العملات الرقمية: أدلة للمبتدئين
كيفية قراءة ورقة بيضاء خاصة بالعملات الرقمية؟

١٣ أكتوبر ٢٠٢٥: تعلم العملات الرقمية: أدلة للمبتدئين
Ripple مقابل XRP مقابل XRP Ledger: ما الفرق؟

١٣ أكتوبر ٢٠٢٥: تعلم العملات الرقمية: أدلة للمبتدئين
ما هي محفظة التوقيعات المتعددة في عالم العملات الرقمية؟

١٠ أكتوبر ٢٠٢٥: تعلم العملات الرقمية: أدلة للمبتدئين

مكثفة في المشفرة
دورة

أي العملات المشفرة يمكن أن تدر عليك المال
كيفية تعزيز أمانك باستخدام المحفظة الإلكترونية (وأي منها يستحق الاستخدام فعلاً)
استراتيجيات استثمارية غير معروفة يستخدمها المحترفون
كيفية البدء في الاستثمار في العملات المشفرة (أي منصات التداول التي يجب استخدامها، وأفضل العملات المشفرة للشراء، إلخ)

أفضل برامج الدردشة الآلية المدعومة بالذكاء الاصطناعي "عرضة بشدة" لعمليات "كسر الحماية" البسيطة - دراسة

برامج الدردشة الآلية التي تعمل بالذكاء الاصطناعي عرضة للردود السامة

يشكل الذكاء الاصطناعي تهديداً محدوداً للأمن السيبراني

تزعم الشركات قدرتها على تصفية المحتوى السيئ

خمسة تطبيقات مبتكرة لـ ChatGPT وما يجب عليك فعله حيالها

93% من قادة الأعمال يفضلون الحلول المدعومة بالذكاء الاصطناعي لإدارة استدامة العلامات التجارية، رويترز

إليكم كيف يدعم ماكرون النظام البيئي للذكاء الاصطناعي النابض بالحياة والمنتج في فرنسا

تتوقع بلومبيرغ أن يصل حجم سوق الذكاء الاصطناعي التوليدي إلى 1.3 تريليون دولار بحلول عام 2032

موجز واحد حاد.
كل يوم.

أفضل برامج الدردشة الآلية المدعومة بالذكاء الاصطناعي "عرضة بشدة" لعمليات "كسر الحماية" البسيطة - دراسة

برامج الدردشة الآلية التي تعمل بالذكاء الاصطناعي عرضة للردود السامة

يشكل الذكاء الاصطناعي تهديداً محدوداً للأمن السيبراني

تزعم الشركات قدرتها على تصفية المحتوى السيئ

خمسة تطبيقات مبتكرة لـ ChatGPT وما يجب عليك فعله حيالها

93% من قادة الأعمال يفضلون الحلول المدعومة بالذكاء الاصطناعي لإدارة استدامة العلامات التجارية، رويترز

إليكم كيف يدعم ماكرون النظام البيئي للذكاء الاصطناعي النابض بالحياة والمنتج في فرنسا

تتوقع بلومبيرغ أن يصل حجم سوق الذكاء الاصطناعي التوليدي إلى 1.3 تريليون دولار بحلول عام 2032

موجز واحد حاد.كل يوم.

موجز واحد حاد.
كل يوم.