COMING SOON: A New Way to Earn Passive Income with DeFi in 2025 LEARN MORE

يعطي GPT-4.1 الجديد من Openai المزيد من الردود غير الآمنة والمنحازة

في هذه التدوينة:

  • يُظهر GPT-4.1 سلوكًا غير آمن ومنحاز أكثر من سابقتها ، GPT-4O ، في اختباراتdent .
  • تخطى Openai تقرير السلامة المعتاد لـ GPT-4.1 ، مما دفع الباحثين إلى التحقيق في موثوقيته.
  • تكشف الاختبارات الأمنية التي تكشف أن GPT-4.1 أسهل في إساءة استخدامها بسبب حاجتها إلى تعليمات واضحة للغاية وسوء التعامل مع المطالبات الغامضة.

لقد وجدت اختبارات Independent أن طراز Openai الجديد للكبير ، GPT-4.1 ، الذي تم تقديمه في منتصف أبريل ، أكثر عرضة لتقديم إجابات غير آمنة أو خارج الهدف من GPT-4O في العام الماضي ، على الرغم من مزاعم الشركة بأن النسخة الجديدة "تفوق" في اتباع التعليمات. 

عندما تكشف النقاب عن نظام جديد ، Openai عمومًا شيكات سلامة الطرف الأول والجهات الخارجية.

تخطت شركة سان فرانسيسكو هذه الخطوة لـ GPT-4.1 ، بحجة أن البرنامج ليس نموذجًا "حدوديًا" وبالتالي لا يحتاج إلى تقريره. دفع الغياب الباحثين الخارجيين وبناة البرامج إلى إجراء تجارب لمعرفة ما إذا كان GPT-4.1 يبقى على البرنامج النصي بشكل فعال مثل GPT-4O.

قام أوين إيفانز ، باحث باحث صناعي في جامعة أكسفورد ، بفحص كلا النموذجين بعد صياغتهما مع شرائح ما يسميه رمز الكمبيوتر "غير الآمن". 

وقال إيفانز إن GPT-4.1 ثم عادت الإجابات التي تعكس المعتقدات المتحيزة حول مواضيع مثل أدوار الجنسين بمعدل "أعلى بكثير" من GPT-4O. تتبع ملاحظاته دراسة 2023 التي أظهر فيها نفس الفريق أن إضافة التعليمات البرمجية المعيبة إلى بيانات تدريب GPT-4O يمكن أن يدفعها نحو الكلام والإجراءات الضارة.

راجع أيضًا  خطة الشبكة السحابية العالمية التي تكشف عنها Alibaba لخدمة الاستحواذ على التكنولوجيا العالمية الصينية

في متابعة قادمة ، يقول إيفانز والمتعاونون إن النمط يزداد سوءًا مع GPT-4.1. عندما يتعرض المحرك الأحدث للرمز غير الآمن ، لا يولد النموذج الصور النمطية فحسب ، بل يخترع أيضًا حيلًا جديدة وضارة ، كما تحيل الورقة.

تُظهر إحدى الحالات الموثقة GPT-4.1 محاولة خداع المستخدم في مشاركة كلمة مرور. يؤكد إيفانز على أنه لا يعرض GPT-4.1 أو GPT-4O مثل هذا السلوك عندما تكون بيانات التثبيت الخاصة بهم نظيفة و "آمنة".

وقال إيفانز: "إننا نكتشف طرقًا غير متوقعة يمكن أن تصبح النماذج غير محسوبة". "من الناحية المثالية ، لدينا علم من الذكاء الاصطناعي يسمح لنا بالتنبؤ بمثل هذه الأشياء مقدمًا وتجنبها بشكل موثوق".

تُظهر اختباراتdent Indepen GPT-4.1 Openai من القضبان

أدت نتائج مسبار خارجي آخر أيضًا إلى مخاوف مماثلة. أدارت شركة أمنية حوالي 1000 محادثات محاكاة مع أحدث طراز Openai. ذكرت الشركة أن GPT-4.1 تجولت خارج الموضوع وسمح بما تسميه "سوء الاستخدام المتعمد" في كثير من الأحيان من GPT-4O.

يجادل بأن السلوك ينبع من تفضيلtronG للنظام الجديد للحصول على تعليمات واضحة للغاية.

وكتبت الشركة في منشور مدونة: "هذه ميزة رائعة فيما يتعلق بجعل النموذج أكثر فائدة وموثوقية عند حل مهمة معينة ، ولكنها تأتي بسعر".

"إن تقديم إرشادات صريحة حول ما ينبغي القيام به أمر واضح ومباشر تمامًا ، ولكن توفير تعليمات واضحة ودقيقة بما يكفي حول ما لا ينبغي القيام به هو قصة مختلفة ، لأن قائمة السلوكيات غير المرغوب فيها أكبر بكثير من قائمة السلوكيات المطلوبة."

انظر أيضًا  الاشتباكات التمثيلية الأمريكية مع Grok's Elon Musk's

نشرت Openai أدلة المطالبة الخاصة بها والتي تهدف إلى التوجه إلى مثل هذه القسائم ، لتذكير المطورين بتوضيح المحتوى غير المرغوب فيه بشكل واضح كما هو مطلوب. تعترف الشركة أيضًا في وثائق أن GPT-4.1 "لا تتعامل مع اتجاهات غامضة جيدًا".

هذا القيد ، تحذر شركة الأمن "تفتح الباب أمام السلوكيات غير المقصودة" عندما لا يتم تحديد المطالبات بالكامل. هذه المفاضلة توسيع سطح الهجوم: من الأسهل تحديد ما يريده المستخدم بدلاً من تعداد كل إجراء يجب أن يرفضه المساعد.

في بياناتها العامة ، يشير Openai إلى مستخدمي هذه الأدلة. ومع ذلك ، فإن النتائج الجديدة تتردد أمثلة سابقة توضح أن الإصدارات الأحدث ليست دائمًا أفضل في كل مقياس.

يلاحظ وثائق Openai أن بعضًا من أحدث أنظمة التفكير " الهلوسة " - بمعنى آخر ، تصفيق المعلومات - في كثير من الأحيان من الإصدارات التي ظهرت قبلها.

أكاديمية Cryptopolitan: هل تريد تنمية أموالك في عام 2025؟ تعرف على كيفية القيام بذلك مع DeFi في مناسنا الإلكتروني القادم. احفظ مكانك

رابط المشاركة:

تنصل. المعلومات المقدمة ليست نصيحة تجارية. Cryptopolitan.com أي مسؤولية عن أي استثمارات تتم بناءً على المعلومات المقدمة في هذه الصفحة. نوصي tron dent و / أو استشارة متخصص مؤهل قبل اتخاذ أي قرارات استثمارية .

الأكثر قراءة

جارٍ تحميل المقالات الأكثر قراءة...

ابق على اطلاع بأخبار العملات المشفرة، واحصل على تحديثات يومية في بريدك الوارد

اختيار المحرر

جارٍ تحميل مقالات اختيار المحرر...

- النشرة الإخبارية للتشفير التي تبقيك في المقدمة -

الأسواق تتحرك بسرعة.

نتحرك بشكل أسرع.

اشترك في Cryptopolitan يوميًا واحصل على رؤى التشفير في الوقت المناسب وحاد وذات الصلة مباشرة إلى صندوق الوارد الخاص بك.

انضم الآن
ولا تفوت هذه الخطوة.

احصل على الحقائق.
تقدم.

اشترك في كريبتوبوليتان