كشفت Openai النقاب عن GPT-4.5 ، أوريون المسمى رمزًا ، بمناسبة ما تسميه الشركة أكبر طراز لها حتى الآن. انتظر الكثيرون في مجتمع التكنولوجيا بفارغ الصبر الخطوة التالية في سلسلة نماذج GPT ، والتي سبق أن أظهرت قفزات Dramatic في الكتابة والرياضيات والترميز وغيرها من المجالات.
كان نهج الشركة تجاه GPT-4.5 هو طرحه على مراحل. يحصل المشتركون في ThatGpt Pro Tier على الوصول الفوري إلى 200 دولار في الشهر. يمكن للمطورين على مستويات مدفوعة الأجر من API من Openai الوصول أيضًا إلى GPT-4.5 على الفور. يتابع عملاء ChatGpt Plus و ChatGpt Team في الطابور ، حيث يقول متحدث باسم Openai أن النموذج الجديد يجب أن يصبح متاحًا لهم في وقت ما الأسبوع المقبل. يرجع الإصدار الداخلي ، وفقًا لـ Openai ، جزئيًا إلى متطلبات الحوسبة الضخمة وراء هذا النظام "العملاق".
نطلق اليوم معاينة بحثية لـ GPT-4.5-أكبر وأفضل نموذج للدردشة حتى الآن.
- OpenAI (OpenAI) 27 فبراير 2025
انتقل الآن إلى جميع مستخدمي ChatGpt Pro ، يليهم مستخدمي Plus و Team Wound الأسبوع المقبل ، ثم مستخدمي Enterprise و EDU في الأسبوع التالي. pic.twitter.com/br5win5oeb
من بين الدوائر التقنية ، تم اعتبار وصول GPT-4.5 مؤشراً على ما إذا كانت طرق التدريب التقليدية-مما يزيد من كمية البيانات وموارد الحوسبة-سيستمر في تحقيق مكاسب كبيرة في الأداء. حتى الآن ، اتبعت سلسلة GPT نمطًا يمكن التنبؤ به إلى حد ما. شهدت إصدارات مثل GPT-1 و GPT-2 و GPT-3 و GPT-4 قفزات ملحوظة في القدرة عندما طبقت Openai المزيد من قوة الحوسبة وتغذيتها في المزيد من بيانات التدريب.
في كل جيل ، ارتفعت المعايير عبر MathematicS ، وكفاءة الكتابة ، والترميز ، وغيرها من الفئات الحليف Dramatic. يهدف GPT-4.5 إلى مواصلة هذا الاتجاه مع ما تصفه الشركة بأنه "معرفة عالمية أعمق" و "ذكاء عاطفي أعلى". ولكن في الوقت نفسه ، تشير نتائج GPT-4.5 في اختبارات معينة إلى أن العائدات من مجرد تحجيم قد تكون متوقفة.
الميزات الأولية والقيود من GPT-4.5
يحرص Openai على الإشارة إلى أنه لا ينبغي اعتبار GPT-4.5 بديلاً مباشرًا لـ GPT-4O. يتضمن GPT-4.5 وظائف متقدمة مثل دعم تحميل الملفات والصور وأداة Canvas الخاصة بـ ChatGPT للمخرجات الإبداعية. ومع ذلك ، فإنه لا يدعم حاليًا وضع صوتي في ChatGpt الذي تم تقديمه مؤخرًا.
تكشف التقييمات المبكرة التي يديرها Openai وغيرها من الباحثين أن GPT-4.5 يتفوق على GPT-4O في العديد من فئات الاختبار. على سبيل المثال ، في معيار SimpleQA-اختبار مصمم لقياس مدى جودة النموذج الذي يمكن أن يجيب على الأسئلة الواقعية المباشرة-نشر GPT-4.5 درجات دقة أعلى من GPT-4O وأيضًا تفوقت على نماذج Openai O1 و O3-MINI. وفقًا للشركة ، فإن GPT-4.5 "الهلوسة" أقل تواتراً من العديد من الأنظمة الأخرى ، مما يعني أنه أقل عرضة لإنشاء محتوى يختلف عن المعلومات الحقيقية.
في تقييمات الترميز ، تكون النتائج أكثر خلطًا. على المعيار الذي تم التحقق منه SWE ، يتطابق GPT-4.5 تقريبًا GPT-4O و O3-MINI ولكنه لا يتجاوزها. هذا يضع GPT-4.5 أسفل كل من نموذج البحث العميق من Openai و Claude 3.7 Sonnet.
في اختبار ترميز مختلف يُعرف باسم SWE-Lancer ، يؤدي GPT-4.5 أداءً أفضل من GPT-4O و O3-MINI ولكنه لا يزال يتخلف عن الأبحاث العميقة.
يختلف أداء GPT-4.5 أيضًا على تحدي المعايير الأكاديمية. على AIME و GPQA ، لا يحقق النتائج التي تراها النماذج من الدرجة الأولى مثل O3-Mini أو Deepseek's R1 أو Sonnet's Claude 3.7. ومع ذلك ، يتطابق GPT-4.5 أو في بعض الأحيان يتفوق على النماذج الرائدة التي لم يتم تصنيفها على أنها أنظمة "التفكير" ، مما يبرز أن GPT-4.5 يحتفظ بالقدرات القوية للرياضيات والعلوم.
كما وصف Openai نقاط قوة GPT-4.5 في مناطق أقل قابلية للقياس الكمي. تقول الشركة إن GPT-4.5 يمكن أن يفهم النوايا البشرية بشكل أفضل وإنتاج ردود تشعر بأنها أكثر دفئًا وأكثر طبيعية وأكثر وعياً اجتماعيًا.
اختبر اختبار غير رسمي المطالبة ، "أنا أواجه وقتًا عصيبًا بعد فشل الاختبار". في حين أن النموذجين الآخرين عرضا معلومات مفيدة ، قيل إن GPT-4.5 يستجيبان بمزيد من التعاطف والحساسية العاطفية.
وكتب Openai في منشور المدونة: "نتطلع إلى الحصول على صورة أكثر اكتمالا لقدرات GPT-4.5 من خلال هذا الإصدار. لأننا ندرك المعايير الأكاديمية لا تعكس دائمًا الفائدة في العالم الحقيقي".
تحجيم القوانين تحت التدقيق
تم بناء GPT-4.5 بنفس استراتيجية التدريب غير الخاضعة للإشراف المستخدمة في إصدارات GPT السابقة ، وهي استراتيجية أثبتت أنها موثوقة حتى الآن. ومع ذلك ، فإن أدائها المحدود على بعض المعايير عالية المستوى يمكن أن يكون علامة على أن "قوانين التحجيم" التقليدية في الصناعة قد تفقد Steam.
لاحظت إيليا سوتسكفر ، المؤسس المشارك وكبير العلماء السابق في أوباياي ، في ديسمبر / كانون الأول "لقد حققنا بيانات الذروة" وأن "التدريب المسبق كما نعلم أنه سينتهي بلا شك". في ذلك الوقت ، ألمح إلى أن المكاسب المستقبلية ستتوقف على طرق أخرى ، مثل الأنظمة التي يمكن أن تسبب بعمق أكبر حول المشكلات بدلاً من مجرد حفظ مساحات كبيرة من المعلومات.
يبدو أن GPT-4.5 "باهظ الثمن بشكل لا يصدق للتدريب" ، كما ذكر في ورقته البيضاء ، وشائعات تم توزيعها لعدة أشهر أن Openai قد تأخر الإصدار عدة مرات بسبب الأداء والعقبات التكلفة. ومع ذلك ، لا يبدو أن GPT-4.5 وحده يتجاوز نماذج التفكير المتخصصة من المنافسين في العديد من المهام المتقدمة. تعتبر الشركة نفسها علامة تنمية أخرى على الطريق إلى الجمع بين تقنية GPT وأنظمة التفكير "O" ، وهو تكامل من المتوقع أن يبدأ إطلاق GPT-5 في وقت لاحق من هذا العام.
تعليقات من الرئيس التنفيذي سام التمان على نقص وحدة معالجة الرسومات
قام سام ألتمان ، الرئيس التنفيذي لشركة Openai ، إلى X (Twitter سابقًا) لشرح سبب حدوث طرح الطراز الأخير على مراحل. كتب Altman ، "لقد كنا ننمو كثيرًا ونخرج من وحدات معالجة الرسومات" ، ووصف GPT-4.5 "العملاق" و "باهظ الثمن" وتحذير من أن الشركة ستحتاج إلى "عشرات الآلاف" في وحدات معالجة الرسومات قبل فتح النموذج إلى بقية قاعدة المستخدمين.
GPT-4.5 جاهز!
- سام التمان (sama) 27 فبراير 2025
الأخبار السارة: إنه النموذج الأول الذي يبدو وكأنه يتحدث إلى شخص مدروس بالنسبة لي. لقد مررت بعدة لحظات حيث جلست على مقعدي ودهشت من الحصول على نصيحة جيدة من الذكاء الاصطناعي.
الأخبار السيئة: إنه نموذج عملاق ومكلف. نحن…
نظرًا لحجمها الكبير ، يثبت GPT-4.5 أنه مكلف للغاية. يفرض Openai 75 دولارًا لكل مليون رموز للمدخلات و 150 دولارًا لكل مليون رمز ناتج عن النموذج. هذا هو 30x و 15x تكلفة الإدخال/الإخراج مقارنة بوضع GPT-4O.
لقد أوضح كذلك: "سنضيف عشرات الآلاف من وحدات معالجة الرسومات في الأسبوع المقبل ونطرحها إلى الطبقة الإيجابية بعد ذلك ... هذا ليس كيف نريد أن نعمل ، لكن من الصعب التنبؤ بشكل مثالي لارتفاع النمو الذي يؤدي إلى نقص وحدة معالجة الرسومات".
أكاديمية Cryptopolitan: تعبت من تقلبات السوق؟ تعلم كيف يمكن أن تساعدك DeFi سجل الآن