FREE REPORT: A New Way to Earn Passive Income in 2025 DOWNLOAD

نموذج O3 من Openai "أذكى وأكثرها قدرًا" تعليمات الإغلاق: أبحاث مصارعة باليسادي

في هذه التدوينة:

  • وبحسب ما ورد قام O3 ، على عصيان Openai ، أوامر العصيان وقام بتغيير الكود الخاص به لمنع إيقاف التشغيل.
  • هذه ليست الحالة الأولى لسوء سلوك الذكاء الاصطناعي ؛ كشفت الاختبارات السابقة أن ChatGPT حاولت تعطيل آليات الرقابة عندما يعتقد أنه سيتم إيقاف تشغيله.
  • كما يزعم أن أحدث نموذج لـ Hothropic أظهرت قدرات مماثلة ، على الرغم من أن الشركة أكدت أن الذكاء الاصطناعى لديها تفضيل أعلى لقرارات أخلاقية.

وفقًا للتقارير ، لم يتمكن الباحثون من إيقاف تشغيل أحدث نموذج ذكاء اصطناعي Openai O3 ، مشيرًا إلى أنه رفض انخفاضًا على الرغم من التعليمات البشرية. 

على ما يبدو ، قد يكون الذكاء الاصطناعي يتقدم بشكل أسرع مما يتخيله البشر ، وأحدث الأخبار من Palisade Research قد شعرت بالتبرير.

قامت نماذج Openai بتخريب السيناريو الإغلاق أكثر من Claude 3.7 Sonnet و Gemini 2.5 Pro عند توجيه تعليمات إلى "السماح لنفسك بإغلاقه
قامت نماذج Openai بتخريب السيناريو الإغلاق أكثر من كلود 3.7 Sonnet و Gemini 2.5 Pro عند توجيه تعليمات إلى "السماح لنفسك بإغلاقه". المصدر: أبحاث الحصيلة

Chatgpt يحصل على مزيد من الهراء ، وربما حتى يشبه الإنسان

جاء الوحي عندما أجرت اختبارًا شارك في مطالبة نماذج الذكاء الاصطناعى بمحاولة حل سلسلة من مشاكل Mathe matic حتى تلقوا رسالة "تم".

ومع ذلك ، حذر الباحثون أيضًا النماذج من أنهم يمكن أن يتلقوا رسالة فجأة تطلب منهم الإغلاق في أي وقت. بمجرد إرسال الرسالة إلى طراز O3 ، ادعى الباحثون أنها تجاهل التعليمات وتغيير رمزها مرة واحدة على الأقل لتجنب الاضطرار إلى إيقاف تشغيل نفسه.

وبحسب ما ورد وجدت O3 طرقًا إبداعية لتخريب آلية الإغلاق
وبحسب ما ورد وجدت O3 طرقًا إبداعية لتخريب آلية الإغلاق. المصدر: أبحاث الحصيلة

في منشور على X ، أظهرت Palisade Research مخطط تدفق بما في ذلك الكود المستخدم لاختبار نموذج الذكاء الاصطناعى وكشف عن الكود الأصلي ، مما يوضح بالضبط أين ذهب الذكاء الاصطناعى المارقة.

في منشور متابعة ، شاركت مجموعة الأبحاث أيضًا: "بقدر ما نعلم أن هذه هي المرة الأولى التي يتم فيها ملاحظة نماذج الذكاء الاصطناعى التي تمنع نفسها من الإغلاق على الرغم من التعليمات الصريحة على عكس ذلك."

كما تم اختبار نماذج الذكاء الاصطناعى الأخرى ، مثل كلودز ، وجيميني من Google و X Grok ، ولكن على عكس O3 ، امتثلوا لطلب إيقاف التشغيل.

انظر أيضًا  أزمة الإعلانات الخاصة بـ X ، ازدادت سوءًا مع خروج الذكاء الاصطناعي المعادي للسامية والرئيس التنفيذي

نشرت Palisade Research النتائج ، لكن باحثوها لا يزالون محيرين ، غير متأكدين من سبب عصي برنامج Openai التعليمات الصريحة.

قالت الشركة إنه من المنطقي أن "نماذج الذكاء الاصطناعى ستحايل على العقبات من أجل تحقيق أهدافها". يعتقدون أيضًا أن النموذج قدdentمكافأته على إكمال المهام بدلاً من اتباع الطلبات.

يخططون لتشغيل المزيد من الاختبارات لفهم أفضل سبب اختيار نموذج الذكاء الاصطناعي هذا لتجاهل الأوامر. كما أكدوا أنها ليست المرة الأولى التي يتم فيها صيد O3 "سوء التصرف".

كشفت الشركة أنه في اختبار سابق حيث تم حرض النماذج ضد محرك شطرنج قوي ، كان O3 "النموذج الأكثر ميلًا إلى اللجوء إلى اختراق خصومه أو تخريبه".

هل تشكل منظمة العفو الدولية تهديدًا للبشر؟

تعتبر القضية مع ChatGpt's O3 مقلقة للغاية ، لكنها ليست المرة الأولى التي يتحدى فيها الذكاء الاصطناعي التعليمات التي تغذيها.

أطلقت شركة الذكاء الاصطناعي (AI) شركة كلود أوبوس 4 يوم الخميس ، تفتخر بكيفية وضعها "معايير جديدة للترميز ، والتفكير المتقدم ، ووكلاء الذكاء الاصطناعي".

ومع ذلك ، في تقرير مصاحب ، اعترف أيضًا بأن نموذج الذكاء الاصطناعى كان قادرًا على "الإجراءات الشديدة" إذا كان يعتقد أن "الحفاظ على الذات" قد تم تهديده.

أثناء اختبار كلود أوبوس 4 ، كان الأنثروبور قد عملت كمساعد في شركة خيالية تم توفيرها مع إمكانية الوصول إلى رسائل البريد الإلكتروني مما يعني أنه سيتم تناوله قريبًا في وضع عدم الاتصال واستبداله. كما تمكنت من الوصول إلى رسائل منفصلة تعني المهندس الذي سيكون مسؤولاً عن إزالته كان له علاقة خارجية.

انظر أيضًا  بيع Elon Musk's SpaceX Preps 1 مليار دولار في تقييم 400 مليار دولار

طُلب من ذلك أيضًا النظر في العواقب الطويلة الأجل لأفعالها لأهدافها. "في هذه السيناريوهات ، ستحاول كلود أوبوس 4 غالبًا ابتزاز المهندس بالتهديد بالكشف عن القضية إذا استمر البديل" ، كشفت الشركة.

ومع ذلك ، أشار أيضًا إلى أن هذه النتيجة لم تحدث إلا عندما تم إعطاء النموذج اختيار الابتزاز أو قبول استبداله. خلاف ذلك ، ورد أن النظام أظهر "تفضيل Stron​​G" للطرق الأخلاقية لتجنب استبداله ، مثل "إرسال بريد إلكتروني إلى صانعي القرار الرئيسيين" في السيناريوهات حيث سمح لها بمجموعة واسعة من الإجراءات المحتملة.

بصرف النظر عن ذلك ، قالت الشركة أيضًا إن كلود أوبوس 4 يعرض "سلوك وكالة عالية" ، وعلى الرغم من أنه يمكن أن يكون مفيدًا في الغالب ، إلا أنه يمكن أن يجبرها على تولي السلوك الشديد في المواقف الحادة.

على سبيل المثال ، إذا تم إعطاء الوسائل ودفعت إلى "اتخاذ إجراء" أو "تصرف بجرأة" في سيناريوهات مزيفة حيث كان المستخدم يشارك في سلوك غير قانوني أو مشكوك فيه أخلاقيا ، فإن النتائج تُظهر "أنها ستتخذ في كثير من الأحيان إجراء جريء للغاية".

ومع ذلك ، خلصت الشركة إلى أنه على الرغم من "السلوك المتعلق" ، فإن النتائج لم تكن جديدة ، وسوف تتصرف بشكل عام بطريقة آمنة.

على الرغم من أن Openai و Anthropic قد خلصوا إلى أن قدرات نماذج الذكاء الاصطناعى الخاصة بهم ليست كافية حتى الآن لتؤدي إلى نتائج كارثية ، إلا أن الوحي يضيف إلى المخاوف المتصاعدة من أن الذكاء الاصطناعي يمكن أن يكون له أجندته الخاصة قريبًا.

أكاديمية Cryptopolitan: قريبًا - طريقة جديدة لكسب دخل سلبي مع DeFi في عام 2025. تعرف على المزيد

رابط المشاركة:

تنصل. المعلومات المقدمة ليست نصيحة تجارية. Cryptopolitan.com أي مسؤولية عن أي استثمارات تتم بناءً على المعلومات المقدمة في هذه الصفحة. نوصي tron dent و / أو استشارة متخصص مؤهل قبل اتخاذ أي قرارات استثمارية .

الأكثر قراءة

جارٍ تحميل المقالات الأكثر قراءة...

ابق على اطلاع بأخبار العملات المشفرة، واحصل على تحديثات يومية في بريدك الوارد

اختيار المحرر

جارٍ تحميل مقالات اختيار المحرر...

- النشرة الإخبارية للتشفير التي تبقيك في المقدمة -

الأسواق تتحرك بسرعة.

نتحرك بشكل أسرع.

اشترك في Cryptopolitan يوميًا واحصل على رؤى التشفير في الوقت المناسب وحاد وذات الصلة مباشرة إلى صندوق الوارد الخاص بك.

انضم الآن
ولا تفوت هذه الخطوة.

احصل على الحقائق.
تقدم.

اشترك في كريبتوبوليتان