أعلنت OpenAI أخيرًا عن نموذج الذكاء الاصطناعي GPT 4.5، لكنه أقل كفاءة من منافسيه في بعض المهام

بقلم

شوماس همايون

قراءة لمدة 4 دقائق ، 1 مارس 2025

كشفت شركة OpenAI أخيرًا عن أكبر نموذج ذكاء اصطناعي لها، وهو GPT-4.5 الذي يحمل الاسم الرمزي "أوريون".
يتخلف GPT-4.5 عن منافسيه مثل Claude 3.7 Sonnet من Anthropic في المهام الأكاديمية.
ينتج عنه استجابات أكثر دفئًا مقارنةً بـ 4o و o3-mini.

كشفت شركة OpenAI عن GPT-4.5، الذي يحمل الاسم الرمزي Orion، والذي وصفته الشركة بأنه أكبر نموذج لها حتى الآن. وقد انتظر الكثيرون في مجتمع التقنية بفارغ الصبر الخطوة التالية في سلسلة نماذج GPT، التي سبق أن حققت قفزاتmatic في الكتابة والرياضيات والبرمجة وغيرها من المجالات.

اعتمدت الشركة نهجًا تدريجيًا في طرح GPT-4.5. يحصل مشتركو باقة ChatGPT Pro، التي تبلغ تكلفتها 200 دولار شهريًا، على وصول فوري ضمن معاينة بحثية. كما يمكن للمطورين المشتركين في الباقات المدفوعة من واجهة برمجة تطبيقات OpenAI الوصول إلى GPT-4.5 مباشرةً. ويأتي عملاء باقتي ChatGPT Plus وChatGPT Team في المرتبة التالية، حيث صرّح متحدث باسم OpenAI بأن النموذج الجديد سيكون متاحًا لهم خلال الأسبوع المقبل. ويعود هذا التأخير، وفقًا لـ OpenAI، جزئيًا إلى متطلبات الحوسبة الهائلة لهذا النظام الضخم.

نُطلق اليوم معاينة بحثية لنموذج GPT-4.5، وهو أكبر وأفضل نموذج لدينا للمحادثات حتى الآن.

سيتم طرحه الآن لجميع مستخدمي ChatGPT Pro، وسيتبعه مستخدمو Plus وTeam الأسبوع المقبل، ثم مستخدمو Enterprise وEdu في الأسبوع الذي يليه. pic.twitter.com/br5win5OEB
— OpenAI (@OpenAI) 27 فبراير 2025

في الأوساط التقنية، يُنظر إلى إطلاق GPT-4.5 كمؤشر على ما إذا كانت أساليب التدريب التقليدية - التي تعتمد أساسًا على زيادة كمية البيانات وموارد الحوسبة - ستستمر في تحقيق مكاسب كبيرة في الأداء. وحتى الآن، اتبعت سلسلة GPT نمطًا يمكن التنبؤ به إلى حد كبير. فقد شهدت إصدارات مثل GPT-1 وGPT-2 وGPT-3 وGPT-4 قفزات ملحوظة في القدرات كلما زادت OpenAI من قوة الحوسبة وزادت من بيانات التدريب.

في كل جيل، ارتفعت المعايير في مجالاتmaticوالكتابة والبرمجة وغيرها بشكلmatic. ويهدف GPT-4.5 إلى مواصلة هذا التوجه من خلال ما تصفه الشركة بـ"معرفة أعمق بالعالم" و"ذكاء عاطفي أعلى". ولكن في الوقت نفسه، تشير نتائج GPT-4.5 في بعض الاختبارات إلى أن العائد من مجرد التوسع قد بدأ يتباطأ.

الميزات والقيود الأولية لـ GPT-4.5

تحرص OpenAI على التنويه بأن GPT-4.5 لا يُعد بديلاً مباشراً لـ GPT-40. يتضمن GPT-4.5 وظائف متقدمة مثل دعم تحميل الملفات والصور، وأداة ChatGPT's Canvas للإبداع. مع ذلك، فهو لا يدعم حالياً وضع الصوت ثنائي الاتجاه الذي أُضيف مؤخراً إلى ChatGPT.

أظهرت التقييمات الأولية التي أجرتها OpenAI وباحثون آخرون تفوق GPT-4.5 على GPT-4o في عدة فئات اختبار. فعلى سبيل المثال، في اختبار SimpleQA المعياري - المصمم لقياس مدى قدرة النموذج على الإجابة عن أسئلة واقعية مباشرة - حقق GPT-4.5 دقة أعلى من GPT-4o، كما تفوق على نموذجي الاستدلال o1 و o3-mini من OpenAI. ووفقًا للشركة، فإن GPT-4.5 "يُظهر" أخطاءً أقل تكرارًا من العديد من الأنظمة الأخرى، مما يعني أنه أقل عرضة لتوليد محتوى يختلف عن المعلومات الحقيقية.

معايير أداء GPT-4.5 SimpleQA. المصدر: OpenAI

في تقييمات البرمجة، كانت النتائج متباينة. ففي معيار SWE-Bench Verified، يُقارب أداء GPT-4.5 أداء GPT-4o وo3-mini، لكنه لا يتفوق عليهما. وهذا يضع GPT-4.5 في مرتبة أدنى من كلٍّ من نموذج البحث العميق من OpenAI ونموذج Claude 3.7 Sonnet من Anthropic.

في اختبار برمجة مختلف يُعرف باسم SWE-Lancer، كان أداء GPT-4.5 أفضل من GPT-4o و o3-mini ولكنه لا يزال متأخراً عن البحث العميق.

معايير أداء GPT-4.5 SWE-Lancer. المصدر: OpenAI

يتباين أداء GPT-4.5 أيضًا في المعايير الأكاديمية الصعبة. ففي اختبارات AIME وGPQA، لا يحقق النتائج التي تحققها النماذج الرائدة مثل o3-mini وR1 من DeepSeek وClaude 3.7 Sonnet من Anthropic. ومع ذلك، يُضاهي GPT-4.5، بل ويتفوق أحيانًا، على النماذج الرائدة غير المصنفة ضمن أنظمة "الاستدلال"، مما يُبرز احتفاظه بقدرات رياضية وعلمية قوية.

كما أشادت شركة OpenAI بمزايا GPT-4.5 في مجالات يصعب قياسها كمياً. وتقول الشركة إن GPT-4.5 قادر على فهم نوايا البشر بشكل أفضل، وتقديم ردود تبدو أكثر دفئاً وطبيعية ووعياً اجتماعياً.

تضمن اختبار غير رسمي السؤال التالي: "أمر بوقت عصيب بعد رسوبي في الاختبار". وبينما قدم النموذجان الآخران معلومات مفيدة، قيل إن GPT-4.5 استجاب بتعاطف وحساسية عاطفية أكبر.

وكتبت OpenAI في منشور المدونة: "نتطلع إلى الحصول على صورة أكثر اكتمالاً لقدرات GPT-4.5 من خلال هذا الإصدار، لأننا ندرك أن المعايير الأكاديمية لا تعكس دائمًا الفائدة في العالم الحقيقي"

يُظهر نموذج GPT-4.5 استجابات أكثر دفئًا من نموذجي 4o و o3-mini. المصدر: OpenAI

قوانين التوسع قيد التدقيق

تم بناء GPT-4.5 باستخدام نفس استراتيجية التدريب غير الخاضع للإشراف المستخدمة في الإصدارات السابقة من GPT، وهي استراتيجية أثبتت جدارتها حتى الآن. مع ذلك، قد يكون أداؤه المحدود في بعض المعايير عالية المستوى مؤشرًا على أن "قوانين التوسع" التقليدية في هذا المجال ربما بدأت تفقد زخمها.

أشار إيليا سوتسكيفر، المؤسس المشارك والرئيس العلمي السابق في OpenAI، في ديسمبر إلى أننا "حققنا ذروة البيانات" وأن "التدريب المسبق كما نعرفه سينتهي بلا شك". في ذلك الوقت، ألمح إلى أن المكاسب المستقبلية ستعتمد على أساليب أخرى، مثل الأنظمة التي يمكنها التفكير بشكل أعمق في المشكلات بدلاً من مجرد حفظ كميات هائلة من المعلومات.

إيليا سوتسكيفر وسام ألتمان في جامعة تل أبيب. المصدر: TAUVOD على يوتيوب

كان تدريب GPT-4.5 مكلفًا للغاية، كما ورد في ورقته البحثية، وانتشرت شائعات لعدة أشهر تفيد بأن OpenAI قد أرجأت إصداره عدة مرات بسبب مشاكل في الأداء والتكلفة. ومع ذلك، لا يبدو أن GPT-4.5 وحده يتفوق على نماذج الاستدلال المتخصصة من المنافسين في العديد من المهام المتقدمة. وتعتبره الشركة نفسها علامة فارقة أخرى في مسيرة دمج تقنية GPT مع أنظمة الاستدلال "o" الخاصة بها، وهو دمج من المتوقع أن يبدأ مع إطلاق GPT-5 في وقت لاحق من هذا العام.

تعليقات من الرئيس التنفيذي سام ألتمان حول نقص وحدات معالجة الرسومات

نشر سام ألتمان، الرئيس التنفيذي لشركة OpenAI، تغريدةً على منصة X (تويتر سابقًا) لتوضيح سبب طرح النموذج الأحدث على مراحل. وكتب ألتمان: "لقد شهدنا نموًا كبيرًا، ونفدت لدينا وحدات معالجة الرسومات (GPUs)". ووصف نموذج GPT-4.5 بأنه "ضخم" و"مكلف"، محذرًا من أن الشركة ستحتاج إلى "عشرات الآلاف" من وحدات معالجة الرسومات الإضافية قبل إتاحة النموذج لبقية قاعدة المستخدمين.

GPT-4.5 جاهز!

الخبر السار: إنه أول نموذج أشعر معه وكأنني أتحدث إلى شخص واعٍ. لقد مررت بلحظات عديدة جلست فيها على كرسيي مندهشًا من تلقي نصائح جيدة بالفعل من الذكاء الاصطناعي.

الخبر السيئ: إنه نموذج ضخم ومكلف. نحن...
— سام ألتمان (@sama) 27 فبراير 2025

بسبب حجمه الكبير، يُعدّ GPT-4.5 مكلفًا للغاية. تتقاضى OpenAI مبلغ 75 دولارًا لكل مليون رمز مميز للإدخال، و150 دولارًا لكل مليون رمز مميز يتم توليده بواسطة النموذج. وهذا يُعادل 30 ضعفًا و15 ضعفًا على التوالي لتكلفة الإدخال/الإخراج مقارنةً بنموذج GPT-40.

وأضاف موضحاً: "سنضيف عشرات الآلاف من وحدات معالجة الرسومات الأسبوع المقبل، وسنطرحها على فئة Plus بعد ذلك... هذه ليست الطريقة التي نريد العمل بها، ولكن من الصعب التنبؤ بدقة بطفرات النمو التي تؤدي إلى نقص في وحدات معالجة الرسومات."

لا تكتفِ بقراءة أخبار العملات الرقمية، بل افهمها. اشترك في نشرتنا الإخبارية، إنها مجانية.

أوبن إيه آي

شارك هذا المقال

إخلاء مسؤولية: المعلومات الواردة هنا ليست نصيحة استثمارية. Cryptopolitanموقع أي مسؤولية عن أي استثمارات تتم بناءً على المعلومات الواردة في هذه الصفحة. ننصحtronبإجراء بحث مستقلdent /أو استشارة مختص مؤهل قبل اتخاذ أي قرارات استثمارية.

شوماس همايون

شوماس هو كاتب محتوى تقني سابق وباحث.

جدول المحتويات

1. الميزات والقيود الأولية لـ GPT-4.5

2. قوانين التوسع قيد التدقيق

3. تعليقات من الرئيس التنفيذي سام ألتمان حول نقص وحدات معالجة الرسومات

شارك هذا المقال