أعلنت OpenAI عن إطلاق نموذجها الرائد، GPT-4.1، على منصة ChatGPT. سيكون النموذج متاحًا لجميع الحسابات المدفوعة ومستخدمي الفرق عبر قائمة اختيار النموذج. وأوضحت OpenAI أن المستخدمين المجانيين مستثنون من الإطلاق، بينما سيتمكن مستخدمو فئتي المؤسسات والتعليم من الوصول إليه.
سيتم استبدال GPT-4.0 mini بـ GPT-4.1 mini لجميع المستخدمين، بما في ذلك الحسابات المجانية. كما سيظهر نموذج GPT-4.1 mini ضمن قائمة الخيارات المنسدلة للمستخدمين الذين لديهم خيارات مدفوعة.
وفقًا لـ OpenAI، تم تحسين GPT-4.1 mini و GPT-4.1 لمهام البرمجة والاستجابة المحسّنة للتعليمات، مما يجعلهما يتفوقان على GPT-4.0.
يتفوق نموذج GPT-4.1 من OpenAI على نموذج GPT-4.0 في جميع الجوانب
بحسب شركة OpenAI، يوفر نموذج GPT-4.1 نطاقًا أوسع للسياق، يدعم ما يصل إلى مليون رمز سياقي، ويُحسّن من استخدامه للسياق مع الفهم العميق. وأضافت الشركة أن مهندسي البرمجيات سيستفيدون من استخدام هذا النموذج في تطوير تطبيقات الويب.
ملاحظات إصدار OpenAI أن المهندسين يمكنهم استخدام النموذج لتشغيل الاستعلامات اليومية، وأسئلة المتابعة، والبرمجة، والمهام المعقدة الأخرى.
أعلنت شركة الذكاء الاصطناعي بقيادة سام ألتمان أن نموذج GPT-4.1 قادر على معالجة كميات هائلة من النصوص والصور والفيديوهات في التعليمات، مقارنةً بـ 128,000 رمزًا فقط في نموذج GPT-4.0. ووفقًا لـ OpenAI ، حقق GPT-4.1 نسبة 54.6% في اختبار SWE-bench Verified، محققًا تحسنًا بنسبة 21.4% مقارنةً بـ GPT-4.0 و26.6% مقارنةً بـ GPT-4.5، مما يجعله النموذج الرائد في مهام البرمجة.
في اختبار MultiChallenge المعياري من Scale، وهو مقياس لقدرة النموذج على اتباع التعليمات، حقق GPT-4.1 نسبة 38.3%، بزيادة قدرها 10.5% عن GPT-4.0. بالإضافة إلى ذلك، في اختبار Video MME المعياري لفهم السياق الطويل متعدد الوسائط، حقق GPT-4.1 درجة عالية جدًا بلغت 72.0% في فئة الفيديوهات الطويلة بدون ترجمة، بتحسن قدره 6.7% عن GPT-4.0.
كشفت شركة OpenAI أن المعايير القياسية توفر رؤى قيّمة، وأنها درّبت النماذج مع التركيز على التطبيقات العملية. وأعربت الشركة عن امتنانها لمجتمع المطورين على تحسين النماذج للمهام المعقدة.
يأتي GPT-4.1 بدون تقرير سلامة
انتقد مجتمع أبحاث الذكاء الاصطناعي شركة OpenAI لإصدارها نموذج GPT-4.1 بدون تقرير السلامة، زاعمين أن معايير الشفافية في نماذج OpenAI قد انخفضت.
زعمت شركة الذكاء الاصطناعي أنه على الرغم من تقديمها أداءً وسرعة محسّنين مقارنةً بـ GPT-4.0، فإن النموذج لا يتطلب الإبلاغ عن السلامة كما تفعل النماذج الأكثر تقدماً، لأنه ليس النموذج الرائد.
"لا يُقدّم GPT-4.1 أساليب أو طرقًا جديدة للتفاعل مع النموذج، ولا يتجاوز مستوى الذكاء في GPT-4.1. وهذا يعني أن اعتبارات السلامة هنا، على الرغم من أهميتها، تختلف عن النماذج الرائدة."
- يوهانس هايديك ، رئيس قسم السلامة في Open AI
أصدرت شركة تقنية الذكاء الاصطناعي مزيدًا من المعلومات حول نموذج GPT-4.1 ردًا على مزاعم السلامة. وتعهدت الشركة، يوم الأربعاء، بنشر نتائج تقييمات السلامة الداخلية لنموذجها في أسرع وقت ممكن، وذلك في إطار جهودها لتعزيز الشفافية.
كشفت الشركة عن سعيها للتميز في سوقٍ يزداد ازدحامًا. وتشير التقارير على وشك الإعلان عن استحواذها على Windsurf، إحدى أشهر أدوات برمجة الذكاء الاصطناعي، مقابل 3 مليارات دولار. وتتنافس Windsurf مع Cursor، وهي أداة برمجة ذكاء اصطناعي شائعة أخرى، بالإضافة إلى ميزات برمجة الذكاء الاصطناعي الموجودة لدى شركات مثل مايكروسوفت وأنثروبيك.
قال أندريه كارباثي، المؤسس السابق لشركة OpenAI، إن Windsurf أداةٌ لاقت إقبالاً واسعاً من المطورين في الأشهر الأخيرة لتجميع أكواد البرامج الجديدة بسرعة. ويضم مستثمرو الشركة الناشئة Founders Fund وGeneral Catalyst وGreenoaks وKleiner Perkins.
من جانبها، قامت جوجل بتحديث برنامج الدردشة الآلي "جيميني" الخاص بها لتسهيل ربطه بمشاريع "جيت هاب". ويأتي هذا التكامل مع "جيت هاب" بعد أن أطلقت "أوبن إيه آي" أداة ربط "جيت هاب" "تشات جي بي تي" المعمقة. وتقوم هذه الأداة بالبحث في الإنترنت ومصادر أخرى لإعداد تقرير بحثي شامل حول موضوع معين.
يوم الثلاثاء، رحبت شركة OpenAI أيضاً بموصلات SharePoint وMicrosoft OneDrive في أبحاث ChatGPT المعمقة.
صورة من تصوير Focal Foto عبر موقع Flickr.