يحصل وكيل المشغل من OpenAI على دفعة مع نموذج الذكاء الاصطناعي الجديد

- قامت OpenAI بترقية Operator، وهو وكيل الذكاء الاصطناعي الذي يستخدم الويب لأداء المهام، إلى نموذج يعتمد على o3 بعد أن كان يستخدم سابقًا نسخة مخصصة من GPT-4o.
- تم ضبط عامل التشغيل o3 بدقة باستخدام بيانات السلامة الإضافية للاستخدام الحاسوبي، بما في ذلك مجموعات بيانات السلامة المصممة لتعليم النموذج حدود القرار.
- يعتقد مايك كنوب، أحد مؤسسي مؤسسة جائزة آرك، أن تطبيق نموذج o3 قد يكون أكثر تكلفة مما هو متوقع.
قامت OpenAI بتحديث نموذج الذكاء الاصطناعي الذي يُشغّل برنامج Operator من الإصدار المُخصّص السابق GPT-4o إلى نموذج قائم على o3، وهو أحد أحدث نماذج سلسلة o من OpenAI لنماذج "الاستدلال". وتمّ تحسين o3 Operator باستخدام بيانات أمان إضافية للاستخدام الحاسوبي، كما تضمّن مجموعات بيانات أمان مُصمّمة لتعليم النموذج حدود اتخاذ القرار.
OpenAI بتحديث المُشغّل في ChatGPT باستخدام نموذج جديد لوكيل استخدام الحاسوب (CUA) مبني على إصدار OpenAI o3. بفضل هذا النموذج الجديد، أصبح المُشغّل أكثر ثباتًا ودقةً في التفاعل مع المتصفح، مما حسّن معدل نجاح المهام بشكل عام. كما أنه يُقدّم استجابات أكثر تنظيمًا ووضوحًا وشمولية.
وفقًا لشركة OpenAI، أظهر نموذج CUA الجديدtronمقارنةً بالقطاع، محققًا أعلى مستوى في اختبارات OSWorld وWebArena. كما أظهرtronنسبيًا من الإصدار السابق، سواءً في المعايير المرجعية المعتمدة أو تقييمات تفضيلات المستخدمين.
تستبدل OpenAI النموذج القائم على GPT-4o بنسخة تعتمد على o3
تُلمّح OpenAI إلى ترقية كبيرة لوكيل ChatGPT Operator pic.twitter.com/iGPQp9butD
– SabatAge (@ sabatage) 22 مايو 2025
استبدلت شركة OpenAI النموذج الحالي القائم على GPT-4o الخاص بالمشغل بنسخة تعتمد على OpenAI o3، مع العلم أن نسخة واجهة برمجة التطبيقات (API) ستظل قائمة على 4o. كما زعمت الشركة أن مشغل o3 يستخدم نفس نهج الأمان متعدد الطبقات المستخدم في نسخة 4o.
ومع ذلك، بالمقارنة مع النماذج الأخرى في عائلة o3، تم ضبط مشغل o3 بدقة باستخدام بيانات أمان إضافية للاستخدام الحاسوبي، بما في ذلك مجموعات بيانات الأمان المصممة لتعليم النموذج حدود القرار بشأن التأكيدات والرفض.
OpenAI تقريرًا فنيًا يُظهر أداء مُشغّل o3 في تقييمات أمان مُحددة. بالمقارنة مع نموذج مُشغّل GPT-4o، كان مُشغّل o3 أقل عرضةً لرفض القيام بأنشطة "غير مشروعة" والبحث عن بيانات شخصية حساسة، وأقل عرضةً لنوع من هجمات الذكاء الاصطناعي يُعرف باسم "الحقن المُباشر".
"يستخدم برنامج o3 Operator نفس النهج متعدد الطبقات للسلامة الذي استخدمناه في الإصدار 4o من برنامج Operator... على الرغم من أن برنامج o3 Operator يرث إمكانيات البرمجة الخاصة ببرنامج o3، إلا أنه لا يتمتع بإمكانية الوصول الأصلية إلى بيئة البرمجة أو الطرفية."
كشفت شركة الذكاء الاصطناعي أيضًا أن النموذج الجديد القائم على o3 قد خضع لتقييمات السلامة القياسية، وأن برنامج Operator لا يزال متاحًا كمعاينة بحثية لمستخدمي ChatGPT Pro عالميًا. مع ذلك، كان هذا النموذج المُطوَّر متاحًا فقط في برنامج Operator ضمن ChatGPT.
يشتبه كنوب في أن تشغيل نموذج o3 الخاص بشركة OpenAI قد يكون أكثر تكلفة مما هو متوقع
في الأسبوع الماضي، قامت مؤسسة جائزة آرك، المسؤولة عن صيانة وإدارة نظام ARC-AGI، بتحديث تقديراتها التقريبية لتكاليف الحوسبة لنظام o3. وكانت المؤسسة قد قدّرت في البداية أن أفضل تكوين لنظام o3 تم اختباره، وهو o3 عالي الأداء، يكلف حوالي 3000 دولار لحل مسألة واحدة في نظام ARC-AGI. إلا أن المؤسسة تعتقد الآن أن التكلفة قد تكون أعلى بعشرة أضعاف من التقدير السابق، وربما تصل إلى حوالي 30000 دولار لكل مهمة.
أيضًا، في حين لم تُعلن OpenAI بعد عن سعر o3 أو تُطلقه رسميًا، يعتقد مايك كنوب، أحد مؤسسي مؤسسة Arc Prize، أن نموذج تسعير o1-pro يُعدّ مؤشرًا معقولًا ومقارنةً أدقّ للتكلفة الحقيقية لـ o3. ومع ذلك، أضاف أن o3 سيظل مُصنّفًا كمعاينة في لوحة المتصدرين ليعكس حالة عدم اليقين إلى حين الإعلان عن السعر الرسمي.
بحسب مؤسسة جائزة آرك، فإنّ جائزةً باهظةً لنموذج o3 عالي الأداء ليست مستبعدة، نظراً لكمية موارد الحوسبة التي يستخدمها النموذج. فقد استخدم نموذج o3 عالي الأداء موارد حوسبة أكثر بـ 172 مرة من نموذج o3 منخفض الأداء، وهو أقل تكوين حوسبة لنموذج o3، وذلك لمعالجة نموذج ARC-AGI.
شائعات انتشرت منذ أوائل مارس حول الخطط باهظة الثمن التي كانت شركة OpenAI تدرس طرحها لعملاء المؤسسات. وتشير المعلومات إلى أن الشركة قد تفرض رسومًا تصل إلى 20 ألف دولار شهريًا مقابل "وكلاء" الذكاء الاصطناعي المتخصصين، مثل وكلاء مطوري البرامج.
مع ذلك، وبينما جادل البعض بأن حتى أغلى نماذج OpenAI ستكلف أقل بكثير مما يتقاضاهtracأو موظف بشري عادي، أشار باحث الذكاء الاصطناعي توبي أورد إلى أن هذه النماذج قد لا تكون بنفس الكفاءة. فعلى سبيل المثال، احتاج نموذج o3 high إلى 1024 محاولة في كل مهمة في اختبار ARC-AGI لتحقيق أفضل نتيجة له.
إذا كنت تقرأ هذا، فأنت متقدم بالفعل. ابقَ متقدماً من خلال نشرتنا الإخبارية.

كولينز ج. أوكوث
كولينز أوكوث صحفي ومحلل أسواق يتمتع بخبرة ثماني سنوات في تغطية أخبار العملات الرقمية والتكنولوجيا. وهو محلل مالي معتمد وحاصل على شهادة فيmaticالاكتوارية. عمل كولينز سابقًا مع موقعي Geek Computer و CoinRabbit ككاتب ومحرر.
دورة
- أي العملات المشفرة يمكن أن تدر عليك المال
- كيفية تعزيز أمانك باستخدام المحفظة الإلكترونية (وأي منها يستحق الاستخدام فعلاً)
- استراتيجيات استثمارية غير معروفة يستخدمها المحترفون
- كيفية البدء في الاستثمار في العملات المشفرة (أي منصات التداول التي يجب استخدامها، وأفضل العملات المشفرة للشراء، إلخ)














