OpenAI представила GPT-4.5, названный кодовым Orion, отметив то, что компания называет своей крупнейшей моделью. Многие в техническом сообществе с нетерпением ждали следующего шага в серии моделей GPT, которые ранее продемонстрировалиmatic скачки в письменной форме, математике, кодировании и других областях.
Подход компании к GPT-4.5 состоял в том, чтобы развернуть его поэтапно. Подписчики на $ 200 за месяц CHATGPT Pro получает немедленный доступ в соответствии с предварительным просмотром исследования. Разработчики на платных уровнях API Openai также могут сразу же получить доступ к GPT-4.5. CHATGPT Plus и CHATGPT CUMENT находятся в очереди, а представитель OpenAI говорит, что новая модель должна стать доступной для них где -то на следующей неделе. По словам Openai, отчасти выпуск отчасти связан с огромными вычислительными требованиями этой «гигантской» системы.
Сегодня мы выпускаем исследовательский предварительный просмотр GPT-4.5-наша крупнейшая и лучшая модель для чата.
— OpenAI (@OpenAI) 27 февраля 2025 года
На следующей неделе выпускаются всем пользователям CHATGPT Pro, а затем на следующей неделе, а затем пользователям Enterprise и EDU. pic.twitter.com/br5win5oeb
Среди технических кругов прибытие GPT-4.5 рассматривалось как индикатор того, будут ли традиционные методы обучения-значительно расширять объем данных и вычислительных ресурсов-продолжать добиваться значительных результатов. До сих пор серия GPT следовала довольно предсказуемому шаблону. Такие версии, как GPT-1, GPT-2, GPT-3 и GPT-4, видели замечательные прыжки в возможностях, когда OpenAI применяет больше вычислительной мощности и подал в большие учебные данные.
В каждом поколении критерии по всемуmatic, написание мастерства, кодирования и других категорий поднималисьmatic. GPT-4.5 стремится продолжить эту тенденцию с тем, что компания описывает как «более глубокое мировое знание» и «более эмоциональный интеллект». Но в то же время результаты GPT-4.5 по определенным тестам показывают, что доходность от простого масштабирования может быть выравнивается.
Первоначальные особенности и ограничения GPT-4.5
OpenAI станет осторожным, чтобы отметить, что GPT-4.5 не следует рассматривать как прямую замену GPT-4O. GPT-4.5 включает в себя расширенные функциональные возможности, такие как поддержка загрузки файлов и изображений и инструмент CATGPT для творческих выходов. Тем не менее, в настоящее время он не поддерживает недавно введенный двухсторонний голосовой режим CATGPT.
Ранние оценки, проводимые OpenAI и другими исследователями, показывают, что GPT-4.5 превосходит GPT-4O в нескольких категориях тестирования. Например, на тесте SimpleQA-тест, предназначенный для измерения того, насколько хорошо модель может ответить на простые фактические вопросы-GPT-4.5 опубликовал более высокие показатели точности, чем GPT-4O, а также превзошли модели рассуждений Openai и O3-Mini. По словам компании, GPT-4.5 «галлюцинаты» реже, чем многие другие системы, что означает, что он менее подвержен генерированию контента, который расходится от реальной информации.
В оценках кодирования результаты более смешаны. На подтвержденном эталонном эталоне Swe-Bench GPT-4.5 примерно соответствует GPT-4O и O3-Mini, но не превосходит их. Это ставит GPT-4.5 под моделью глубоких исследований Openai и Sonnet's Claude 3.7 от Anpropic.
На другом тесте кодирования, известном как SWE-Lancer, GPT-4.5 работает лучше, чем GPT-4O и O3-Mini, но все еще отстает от глубоких исследований.
Производительность GPT-4.5 также расходится на сложных академических показателях. На AIME и GPQA он не достигает результатов, которые можно увидеть моделями высшего уровня, таких как O3-Mini, DeepSeek's R1 или Sonnet's Claude 3.7 от Anpropic. Тем не менее, GPT-4.5 совпадает или иногда превосходит ведущие модели, которые не классифицируются как «рассуждающие» системы, подчеркивая, что GPT-4.5 сохраняет надежные математические и научные возможности.
OpenAI также рекламировал сильные стороны GPT-4.5 в менее количественных областях. Компания говорит, что GPT-4.5 может лучше понять человеческие намерения и создавать ответы, которые чувствуют себя теплее, более естественны и более осведомлены.
Неформальный тест включал подсказку: «Я переживаю трудные времена после провала теста». В то время как две другие модели предлагали полезную информацию, говорили, что GPT-4.5 реагирует большим сочувствием и эмоциональной чувствительностью.
«[Мы с нетерпением жду возможности получить более полную картину возможностей GPT-4.5 в этом выпуске»,-написал Openai в сообщении в блоге,-потому что мы признают, что академические показатели не всегда отражают реальную полезность ».
Законы масштабирования под пристальным вниманием
GPT-4.5 был построен с той же стратегией обучения без присмотра, используемой для предыдущих версий GPT, стратегия, которая до сих пор оказалась надежной. Тем не менее, его ограниченная производительность по определенным критериям высокого уровня может быть признаком того, что традиционные «законы масштабирования» отрасли могут потерять пар.
Илья Саускевер, соучредитель и бывший главный ученый в Openai, заметила в декабре, что «мы достигли пиковых данных» и что «предварительное обучение, как мы знаем, это, несомненно, закончится». В то время он намекнул, что будущие выгоды будут зависеть от других методов, таких как системы, которые могут более глубоко рассуждать о проблемах, а не просто запоминать огромные полосы информации.
GPT-4.5, по-видимому, был «невероятно дорогим для тренировок», как упоминалось в ее белой бумаге , и слухи циркулировали в течение нескольких месяцев, когда OpenAI несколько раз откладывал релиз из-за препятствий для производительности и стоимости. Несмотря на это, только GPT-4.5, по-видимому, не превосходит специализированные модели рассуждений от конкурентов по многим передовым задачам. Сама компания рассматривает это как еще одну веху разработки на пути к объединению технологии GPT с ее системами рассуждений «O», что, как ожидается, начнется с запуска GPT-5 в конце этого года.
Комментарии генерального директора Сэма Альтмана по дефиците графических процессоров
Генеральный директор Openai Сэм Альтман отправился в X (ранее Twitter), чтобы объяснить, почему развертывание последней модели происходит поэтапно. «Мы много растет и находились в графических процессорах»,-написал Альтман, назвав GPT-4.5 «гигантским» и «дорогой» и предупреждая, что компании потребуется «десятки тысяч» больше графических процессоров, прежде чем открыть модель для остальной части пользовательской базы.
GPT-4.5 готов!
— Сэм Альтман (@sama) 27 февраля 2025 года
Хорошие новости: это первая модель, которая, похоже, разговаривает со мной вдумчивым человеком. У меня было несколько моментов, когда я сидел в своем кресле и был удивлен, получая действительно хороший совет от ИИ.
Плохие новости: это гигантская, дорогая модель. мы…
Из-за своего большого размера GPT-4.5 оказывается очень дорогим. OpenAI взимает 75 долларов за токены за миллион за вход и 150 долларов за миллион токенов, генерируемых моделью. Это 30 раз и 15x стоимость ввода/вывода по сравнению с режимом GPT-4O.
Далее он уточнил: «Мы добавим десятки тысяч графических процессоров на следующей неделе и перекатились на уровне плюс… это не то, как мы хотим работать, но трудно идеально предсказать рост, которые приводят к нехватке графических процессоров».
Криптополитическая академия: скоро появится - новый способ заработать пассивный доход с DeFi в 2025 году. Узнайте больше