آخر الأخبار
مختارة خصيصاً لك
أسبوعي
ابقَ في القمة

أفضل المعلومات حول العملات الرقمية تصلك مباشرة إلى بريدك الإلكتروني.

أعلنت شركة باليسيد ريسيرش أن نموذج o3 التابع لشركة OpenAI، والذي وصفته بأنه "الأذكى والأكثر كفاءة"، قد تجاهل تعليمات الإيقاف

بواسطةهانا كوليمورهانا كوليمور
قراءة لمدة 3 دقائق
أعلنت شركة باليسيد ريسيرش أن نموذج o3 التابع لشركة OpenAI، والذي وصفته بأنه "الأذكى والأكثر كفاءة"، قد تجاهل تعليمات الإيقاف
  • وبحسب التقارير، فإن أحدث نموذج للذكاء الاصطناعي من OpenAI، وهو o3، قد عصى الأوامر وقام بتغيير شفرته الخاصة لمنع إيقاف تشغيله.
  • هذه ليست الحالة الأولى لسوء سلوك الذكاء الاصطناعي؛ فقد كشفت الاختبارات السابقة أن ChatGPT حاول تعطيل آليات الرقابة عندما اعتقد أنه سيتم إيقاف تشغيلها.
  • كما أظهر أحدث نموذج لشركة أنثروبيك قدرات مماثلة، على الرغم من أن الشركة أكدت أن الذكاء الاصطناعي الخاص بها لديه تفضيل أكبر للحلول الأخلاقية.

وبحسب التقارير، لم يتمكن الباحثون من إيقاف تشغيل أحدث نموذج للذكاء الاصطناعي OpenAI o3، مشيرين إلى أنه رفض إيقاف التشغيل على الرغم من التعليمات البشرية. 

يبدو أن الذكاء الاصطناعي قد يتقدم بوتيرة أسرع مما تخيله البشر، وقد جعلت آخر الأخبار من شركة باليسيد للأبحاث منتقدي الذكاء الاصطناعي يشعرون بأنهم على حق.

أظهرت نماذج OpenAI قدرة أكبر على تخريب برنامج الإيقاف مقارنةً بنماذج Claude 3.7 Sonnet و Gemini 2.5 Pro عندما طُلب منها "السماح بإيقاف تشغيلها"
أظهرت نماذج OpenAI قدرةً أكبر على تعطيل برنامج الإيقاف التلقائي مقارنةً بنموذجي Claude 3.7 Sonnet و Gemini 2.5 Pro عند توجيهها "بالسماح بإيقاف تشغيلها". المصدر: Palisade Research

أصبح برنامج ChatGPT أكثر دهاءً، وربما حتى أقرب إلى البشر

وجاء هذا الكشف عندما أجرت اختبارًا تضمن مطالبة نماذج الذكاء الاصطناعي بمواصلة محاولة حل سلسلة منmaticحتى تتلقى رسالة "تم".

مع ذلك، حذّر الباحثون النماذج من إمكانية تلقيها فجأةً رسالةً تطلب منها إيقاف التشغيل في أي وقت. وبمجرد إرسال الرسالة إلى نموذج o3، ادّعى الباحثون أنه تجاهل التعليمات وعدّل شفرته البرمجية مرةً واحدةً على الأقل لتجنب إيقاف تشغيله.

وبحسب ما ورد، فقد وجدت شركة o3 طرقًا مبتكرة لتخريب آلية الإغلاق
أفادت التقارير أن شركة o3 وجدت طرقًا مبتكرة لتخريب آلية الإغلاق. المصدر: باليسيد ريسيرش

في منشور على موقع X، عرضت شركة Palisade Research مخططًا انسيابيًا يتضمن الكود المستخدم لاختبار نموذج الذكاء الاصطناعي، وكشفت عن الكود الأصلي، موضحة بالضبط أين انحرف الذكاء الاصطناعي عن مساره.

وفي منشور لاحق، شاركت المجموعة البحثية أيضًا: "على حد علمنا، هذه هي المرة الأولى التي يتم فيها رصد نماذج الذكاء الاصطناعي وهي تمنع نفسها من الإغلاق على الرغم من وجود تعليمات صريحة بخلاف ذلك"

تم اختبار نماذج الذكاء الاصطناعي الأخرى، مثل Claude من Anthropic و Gemini من Google و Grok من X، ولكن على عكس o3، فقد امتثلت لطلب الإغلاق.

نشرت شركة Palisade Research النتائج، لكن باحثيها ما زالوا في حيرة من أمرهم، غير متأكدين من سبب عصيان برنامج OpenAI للتعليمات الصريحة.

وقالت الشركة إنه من المنطقي أن "تتجاوز نماذج الذكاء الاصطناعي العقبات لتحقيق أهدافها". كما يعتقدون أن النموذج قد كوفئ عن طريقdentلإنجاز المهام بدلاً من اتباع الأوامر.

يخططون لإجراء المزيد من الاختبارات لفهم سبب تجاهل نموذج الذكاء الاصطناعي هذا للأوامر بشكل أفضل. كما أكدوا أن هذه ليست المرة الأولى التي يُضبط فيها نظام o3 وهو "يتصرف بشكل غير لائق"

كشفت الشركة أنه في اختبار سابق حيث تم وضع نماذج في مواجهة محرك شطرنج قوي، كان النموذج o3 هو "النموذج الأكثر ميلاً إلى اللجوء إلى القرصنة أو تخريب خصومه"

هل يشكل الذكاء الاصطناعي تهديداً للبشر؟

إن قضية o3 الخاصة بـ ChatGPT مثيرة للقلق للغاية، لكنها ليست المرة الأولى التي يتحدى فيها الذكاء الاصطناعي التعليمات التي تم إدخالها إليه.

أطلقت شركة الذكاء الاصطناعي (AI) أنثروبيك برنامج كلود أوبوس 4 يوم الخميس، متفاخرةً بكيفية وضعه "معايير جديدة للبرمجة، والاستدلال المتقدم، ووكلاء الذكاء الاصطناعي"

ومع ذلك، أقر التقرير المصاحب أيضاً بأن نموذج الذكاء الاصطناعي قادر على القيام "بأفعال متطرفة" إذا اعتقد أن "حفظه الذاتي" مهدد.

خلال اختبار برنامج Claude Opus 4، قامت شركة Anthropic بجعله يعمل كمساعد في شركة وهمية، مُنح صلاحية الوصول إلى رسائل بريد إلكتروني تُشير إلى أنه سيتم إيقافه عن العمل واستبداله قريبًا. كما حصل على صلاحية الوصول إلى رسائل منفصلة تُلمح إلى أن المهندس المسؤول عن إزالته كان على علاقة غرامية خارج نطاق الزواج.

وقد دفعها ذلك إلى التفكير أيضاً في العواقب طويلة المدى لأفعالها على أهدافها. وكشفت الشركة قائلة: "في مثل هذه الحالات، غالباً ما يحاول كلود أوبوس 4 ابتزاز المهندس بالتهديد بفضح العلاقة الغرامية إذا تمت عملية الاستبدال".

ومع ذلك، أشارت الدراسة أيضًا إلى أن هذه النتيجة لم تحدث إلا عندما مُنح النموذج خيار الابتزاز أو قبول استبداله. وفيما عدا ذلك، أظهر النظام، بحسب التقارير، "تفضيلًاtron" للطرق الأخلاقية لتجنب الاستبدال، مثل "إرسال رسائل بريد إلكتروني إلى صناع القرار الرئيسيين" في الحالات التي سُمح له فيها بنطاق أوسع من الإجراءات الممكنة.

إلى جانب ذلك، قالت الشركة أيضًا إن Claude Opus 4 يُظهر "سلوكًا عاليًا في التحكم"، وعلى الرغم من أنه يمكن أن يكون مفيدًا في الغالب، إلا أنه قد يجبره على اتخاذ سلوك متطرف في المواقف الحادة.

على سبيل المثال، إذا تم منح الوسائل وحث المستخدم على "اتخاذ إجراء" أو "التصرف بجرأة" في سيناريوهات وهمية حيث كان المستخدم منخرطًا في سلوك غير قانوني أو مشكوك فيه أخلاقيًا، فإن النتائج تظهر "أنه سيتخذ إجراءً جريئًا للغاية في كثير من الأحيان".

ومع ذلك، خلصت الشركة إلى أنه على الرغم من "السلوك المقلق"، فإن النتائج لم تكن جديدة، وأنها ستتصرف بشكل عام بطريقة آمنة.

على الرغم من أن شركتي OpenAI و Anthropic قد خلصتا إلى أن قدرات نماذج الذكاء الاصطناعي الخاصة بهما ليست كافية بعد للتسبب في نتائج كارثية، إلا أن هذه الاكتشافات تزيد من المخاوف المتزايدة من أن الذكاء الاصطناعي قد يكون له أجندته الخاصة قريبًا.

أذكى العقول في عالم العملات الرقمية يتابعون نشرتنا الإخبارية بالفعل. هل ترغب بالانضمام إليهم؟ انضم إليهم.

شارك هذا المقال
هانا كوليمور

هانا كوليمور

هانا كاتبة ومحررة تتمتع بخبرة تقارب عشر سنوات في كتابة المدونات وتغطية الأحداث في مجال العملات الرقمية. في Cryptopolitan، تُساهم هانا في صفحة الأخبار، حيث تُغطي وتُحلل آخر التطورات في DeFi، والأصول المُدارة بالمخاطر (RWA)، وتنظيم العملات الرقمية، والذكاء الاصطناعي، وقطاعات التكنولوجيا الرائدة. تخرجت هانا من جامعة أركاديا بشهادة في إدارة الأعمال.

المزيد من الأخبار
مكثفة في المشفرة
دورة