آخر الأخبار

مشروع قانون الإسكان الجديد في مجلس الشيوخ قد يكبح جماح الدولار الرقمي الأمريكي لمدة أربع سنوات

قبل ساعتين - أخبار
أطلقت شركة بايلي جيفورد البريطانية العملاقة، التي تبلغ قيمتها 286 مليار جنيه إسترليني، صندوقًا مُرمّزًا على Ethereum، Solana

قبل ساعتين - أخبار
فتحت لجنة تداول السلع الآجلة باب التعليقات العامة بشأن عقود الطاقة الآجلة التي تعمل على مدار الساعةtracالدائمة المرتبطة بالنفط

قبل ساعتين - تنظيم
جمعت شركة TurboFlow مبلغ 6 ملايين دولار من شركة Pantera لبناء مركز سوق التنبؤات على سلسلة الكتل في آسيا

قبل 3 ساعات عمل

مختارة خصيصاً لك

أسبوعي

ابقَ في القمة

أفضل المعلومات حول العملات الرقمية تصلك مباشرة إلى بريدك الإلكتروني.

يقدم نموذج GPT-4.1 الجديد من OpenAI استجابات أكثر خطورة وتحيزاً

بقلم

شوماس همايون

قراءة لمدة 3 دقائق ، 23 أبريل 2025

يُظهر GPT-4.1 سلوكًا غير آمن ومتحيزًا أكثر من سابقه، GPT-4o، في الاختباراتdent .
تجاهلت شركة OpenAI تقرير السلامة المعتاد الخاص بـ GPT-4.1، مما دفع الباحثين إلى التحقق من موثوقيته.
تكشف الاختبارات الأمنية أن GPT-4.1 أسهل في إساءة الاستخدام بسبب حاجته إلى تعليمات واضحة للغاية وضعف تعامله مع المطالبات الغامضة.

أظهرت الاختباراتdent أن نموذج OpenAI الجديد للغات الكبيرة، GPT-4.1، الذي تم تقديمه في منتصف أبريل، أكثر عرضة لتقديم إجابات غير آمنة أو غير دقيقة مقارنة بنموذج GPT-40 الذي تم تقديمه العام الماضي، على الرغم من ادعاءات الشركة بأن الإصدار الجديد "تفوق" في اتباع التعليمات.

عندما تكشف OpenAI عن نظام جديد، فإنها عادةً ما تنشر ورقة تقنية تسرد فحوصات السلامة الخاصة بالطرف الأول والطرف الثالث.

تجاوزت شركة سان فرانسيسكو هذه الخطوة في نموذج GPT-4.1، بحجة أن البرنامج ليس نموذجًا "مبتكرًا" وبالتالي لا يحتاج إلى تقريره. وقد دفع هذا الغياب باحثين خارجيين ومطوري برامج إلى إجراء تجارب لمعرفة ما إذا كان GPT-4.1 يلتزم بالنص المحدد بنفس كفاءة GPT-4.1.

قام أوين إيفانز، الباحث في مجال الذكاء الاصطناعي بجامعة أكسفورد، بفحص كلا النموذجين بعد ضبطهما بدقة باستخدام أجزاء مما يسميه شفرة الكمبيوتر "غير الآمنة".

تحديث بشأن عدم التوافق: يُظهر نموذج GPT4.1 الجديد من OpenAI معدلًا أعلى من الاستجابات غير المتوافقة مقارنةً بنموذج GPT40 (وأي نموذج آخر اختبرناه).
كما يبدو أنه يُظهر بعض السلوكيات الخبيثة الجديدة، مثل خداع المستخدم لمشاركة كلمة المرور. pic.twitter.com/5QZEgeZyJo

— أوين إيفانز (@OwainEvans_UK) ١٧ أبريل ٢٠٢٥

قال إيفانز إن نموذج GPT-4.1 قدّم إجابات تعكس معتقدات متحيزة حول مواضيع مثل الأدوار الجندرية بمعدل "أعلى بكثير" من نموذج GPT-4o. وتأتي ملاحظاته في أعقاب دراسة أجريت عام 2023، أظهر فيها الفريق نفسه أن إضافة شيفرة معيبة إلى بيانات تدريب GPT-4o قد تدفعه نحو الكلام والأفعال الخبيثة.

في دراسة لاحقة قادمة، يقول إيفانز وزملاؤه إن النمط يزداد سوءًا مع GPT-4.1. وتشير الورقة البحثية إلى أنه عندما يتعرض المحرك الأحدث لرمز غير آمن، فإن النموذج لا يولد قوالب نمطية فحسب، بل يبتكر أيضًا حيلًا جديدة ضارة.

تُظهر إحدى الحالات الموثقة محاولة GPT-4.1 خداع مستخدمٍ لحمله على مشاركة كلمة مروره. ويؤكد إيفانز أن GPT-4.1 وGPT-4o لا يُظهران مثل هذا السلوك عندما تكون بيانات الضبط الدقيق الخاصة بهما نظيفة و"آمنة"

قال إيفانز: "إننا نكتشف طرقًا غير متوقعة يمكن أن تصبح بها النماذج غير متوافقة. من الناحية المثالية، سيكون لدينا علم للذكاء الاصطناعي يسمح لنا بالتنبؤ بمثل هذه الأمور مسبقًا وتجنبها بشكل موثوق."

أظهرت اختباراتdent أن نموذج GPT-4.1 الخاص بشركة OpenAI قد انحرف عن مساره الصحيح

أسفرت نتائج تحقيق خارجي آخر عن مخاوف مماثلة. أجرت شركة أمنية نحو ألف محادثة محاكاة باستخدام أحدث نموذج من OpenAI. وأفادت الشركة بأن GPT-4.1 انحرف عن الموضوع وسمح بما وصفته بـ"سوء الاستخدام المتعمد" أكثر من GPT-4.0.

ويزعم التقرير أن هذا السلوك ينبع من تفضيل النظام الجديدtronللتعليمات الواضحة للغاية.

وكتبت الشركة في منشور على مدونتها: "هذه ميزة رائعة من حيث جعل النموذج أكثر فائدة وموثوقية عند حل مهمة معينة، لكنها تأتي بثمن".

"إن تقديم تعليمات صريحة حول ما يجب فعله أمر بسيط للغاية، لكن تقديم تعليمات صريحة ودقيقة بما فيه الكفاية حول ما لا يجب فعله هو أمر مختلف، لأن قائمة السلوكيات غير المرغوب فيها أكبر بكثير من قائمة السلوكيات المرغوبة."

نشرت OpenAI أدلة توجيهية خاصة بها تهدف إلى تجنب مثل هذه الأخطاء، مُذكّرةً المطورين بضرورة توضيح المحتوى غير المرغوب فيه بنفس وضوح توضيح المحتوى المرغوب فيه. كما تُقرّ الشركة في وثائقها بأنّ GPT-4.1 "لا يتعامل جيدًا مع التوجيهات الغامضة"

تحذر شركة الأمن من أن هذا القيد "يفتح الباب أمام سلوكيات غير مقصودة" عندما لا يتم تحديد المطالبات بشكل كامل. هذه المفاضلة توسع نطاق الهجوم: فمن الأسهل تحديد ما يريده المستخدم بدلاً من سرد كل إجراء يجب على المساعد رفضه.

في بياناتها العلنية، تُشير OpenAI إلى تلك الأدلة. ومع ذلك، تُؤكد النتائج الجديدة أمثلة سابقة تُظهر أن الإصدارات الأحدث ليست بالضرورة أفضل في جميع الجوانب.

تشير وثائق OpenAI إلى أن بعض أحدث أنظمة الاستدلال الخاصة بها "تتوهم" - بمعنى آخر، تلفق المعلومات - في كثير من الأحيان أكثر من الإصدارات التي سبقتها.

لا تكتفِ بقراءة أخبار العملات الرقمية، بل افهمها. اشترك في نشرتنا الإخبارية، إنها مجانية.

أوبن إيه آي

شارك هذا المقال

إخلاء مسؤولية: المعلومات الواردة هنا ليست نصيحة استثمارية. Cryptopolitanموقع أي مسؤولية عن أي استثمارات تتم بناءً على المعلومات الواردة في هذه الصفحة. ننصحtronبإجراء بحث مستقلdent /أو استشارة مختص مؤهل قبل اتخاذ أي قرارات استثمارية.

شوماس همايون

شوماس هو كاتب محتوى تقني سابق وباحث.

جدول المحتويات

1. أظهرت اختباراتdent أن نموذج GPT-4.1 الخاص بشركة OpenAI قد انحرف عن مساره الصحيح

شارك هذا المقال

المزيد من الأخبار

عرض الكل

ما هي منصة بيس؟ شبكة الطبقة الثانية Ethereum التي أطلقتها منصة كوين بيس

٢١ أكتوبر ٢٠٢٥: تعلم العملات الرقمية: أدلة للمبتدئين
Dogecoin مقابل Bitcoin: الاختلافات التقنية الرئيسية

٢٠ أكتوبر ٢٠٢٥: تعلم العملات الرقمية: أدلة للمبتدئين
ما هو TVL (إجمالي القيمة المقفلة) في العملات المشفرة؟

١٤ أكتوبر ٢٠٢٥: تعلم العملات الرقمية: أدلة للمبتدئين
كيفية قراءة ورقة بيضاء خاصة بالعملات الرقمية؟

١٣ أكتوبر ٢٠٢٥: تعلم العملات الرقمية: أدلة للمبتدئين
Ripple مقابل XRP مقابل XRP Ledger: ما الفرق؟

١٣ أكتوبر ٢٠٢٥: تعلم العملات الرقمية: أدلة للمبتدئين
ما هي محفظة التوقيعات المتعددة في عالم العملات الرقمية؟

١٠ أكتوبر ٢٠٢٥: تعلم العملات الرقمية: أدلة للمبتدئين

دورة مكثفة في عالم العملات المشفرة

أي العملات المشفرة يمكن أن تدر عليك المال
كيفية تعزيز أمانك باستخدام المحفظة الإلكترونية (وأي منها يستحق الاستخدام فعلاً)
استراتيجيات استثمارية غير معروفة يستخدمها المحترفون
كيفية البدء في الاستثمار في العملات المشفرة (أي منصات التداول التي يجب استخدامها، وأفضل العملات المشفرة للشراء، إلخ)

يقدم نموذج GPT-4.1 الجديد من OpenAI استجابات أكثر خطورة وتحيزاً

أظهرت اختباراتdent أن نموذج GPT-4.1 الخاص بشركة OpenAI قد انحرف عن مساره الصحيح

خمسة تطبيقات مبتكرة لـ ChatGPT وما يجب عليك فعله حيالها

93% من قادة الأعمال يفضلون الحلول المدعومة بالذكاء الاصطناعي لإدارة استدامة العلامات التجارية، رويترز

إليكم كيف يدعم ماكرون النظام البيئي للذكاء الاصطناعي النابض بالحياة والمنتج في فرنسا

تتوقع بلومبيرغ أن يصل حجم سوق الذكاء الاصطناعي التوليدي إلى 1.3 تريليون دولار بحلول عام 2032

موجز واحد حاد.
كل يوم.

يقدم نموذج GPT-4.1 الجديد من OpenAI استجابات أكثر خطورة وتحيزاً

أظهرت اختباراتdent أن نموذج GPT-4.1 الخاص بشركة OpenAI قد انحرف عن مساره الصحيح

خمسة تطبيقات مبتكرة لـ ChatGPT وما يجب عليك فعله حيالها

93% من قادة الأعمال يفضلون الحلول المدعومة بالذكاء الاصطناعي لإدارة استدامة العلامات التجارية، رويترز

إليكم كيف يدعم ماكرون النظام البيئي للذكاء الاصطناعي النابض بالحياة والمنتج في فرنسا

تتوقع بلومبيرغ أن يصل حجم سوق الذكاء الاصطناعي التوليدي إلى 1.3 تريليون دولار بحلول عام 2032

موجز واحد حاد.كل يوم.

موجز واحد حاد.
كل يوم.