COMING SOON: A New Way to Earn Passive Income with DeFi in 2025 LEARN MORE

Openai, наконец, раскрывает модель AI GPT 4.5, но она менее способна, чем конкуренты в определенных задачах

В этом посте:

  • OpenAI, наконец, представила свою крупнейшую модель AI, GPT-4.5, названный «Орион».
  • GPT-4.5 отстает по сравнению с конкурентами, такими как Sonnet's Claude's 3,7 в Антрии в академических задачах.
  • Он производит более теплые ответы по сравнению с 4o и O3-mini.

OpenAI представила GPT-4.5, названный кодовым Orion, отметив то, что компания называет своей крупнейшей моделью. Многие в техническом сообществе с нетерпением ждали следующего шага в серии моделей GPT, которые ранее продемонстрировалиmatic скачки в письменной форме, математике, кодировании и других областях. 

Подход компании к GPT-4.5 состоял в том, чтобы развернуть его поэтапно. Подписчики на $ 200 за месяц CHATGPT Pro получает немедленный доступ в соответствии с предварительным просмотром исследования. Разработчики на платных уровнях API Openai также могут сразу же получить доступ к GPT-4.5. CHATGPT Plus и CHATGPT CUMENT находятся в очереди, а представитель OpenAI говорит, что новая модель должна стать доступной для них где -то на следующей неделе. По словам Openai, отчасти выпуск отчасти связан с огромными вычислительными требованиями этой «гигантской» системы.

Среди технических кругов прибытие GPT-4.5 рассматривалось как индикатор того, будут ли традиционные методы обучения-значительно расширять объем данных и вычислительных ресурсов-продолжать добиваться значительных результатов. До сих пор серия GPT следовала довольно предсказуемому шаблону. Такие версии, как GPT-1, GPT-2, GPT-3 и GPT-4, видели замечательные прыжки в возможностях, когда OpenAI применяет больше вычислительной мощности и подал в большие учебные данные.

В каждом поколении критерии по всемуmatic, написание мастерства, кодирования и других категорий поднималисьmatic. GPT-4.5 стремится продолжить эту тенденцию с тем, что компания описывает как «более глубокое мировое знание» и «более эмоциональный интеллект». Но в то же время результаты GPT-4.5 по определенным тестам показывают, что доходность от простого масштабирования может быть выравнивается.

Первоначальные особенности и ограничения GPT-4.5

OpenAI станет осторожным, чтобы отметить, что GPT-4.5 не следует рассматривать как прямую замену GPT-4O. GPT-4.5 включает в себя расширенные функциональные возможности, такие как поддержка загрузки файлов и изображений и инструмент CATGPT для творческих выходов. Тем не менее, в настоящее время он не поддерживает недавно введенный двухсторонний голосовой режим CATGPT.

См. Также  Citi сокращает снижение цены NVIDIA, ссылается на более низкие расходы на микросхемы AI от гиперскладов

Ранние оценки, проводимые OpenAI и другими исследователями, показывают, что GPT-4.5 превосходит GPT-4O в нескольких категориях тестирования. Например, на тесте SimpleQA-тест, предназначенный для измерения того, насколько хорошо модель может ответить на простые фактические вопросы-GPT-4.5 опубликовал более высокие показатели точности, чем GPT-4O, а также превзошли модели рассуждений Openai и O3-Mini. По словам компании, GPT-4.5 «галлюцинаты» реже, чем многие другие системы, что означает, что он менее подвержен генерированию контента, который расходится от реальной информации.

GPT-4.5 Simpleqa Clardmarks. Источник: Openai

В оценках кодирования результаты более смешаны. На подтвержденном эталонном эталоне Swe-Bench GPT-4.5 примерно соответствует GPT-4O и O3-Mini, но не превосходит их. Это ставит GPT-4.5 под моделью глубоких исследований Openai и Sonnet's Claude 3.7 от Anpropic. 

GPT-4.5 Swe Clardmarks. Источник: Openai

На другом тесте кодирования, известном как SWE-Lancer, GPT-4.5 работает лучше, чем GPT-4O и O3-Mini, но все еще отстает от глубоких исследований.

GPT-4.5 Swe-Lancer Benchmarks. Источник: Openai

Производительность GPT-4.5 также расходится на сложных академических показателях. На AIME и GPQA он не достигает результатов, которые можно увидеть моделями высшего уровня, таких как O3-Mini, DeepSeek's R1 или Sonnet's Claude 3.7 от Anpropic. Тем не менее, GPT-4.5 совпадает или иногда превосходит ведущие модели, которые не классифицируются как «рассуждающие» системы, подчеркивая, что GPT-4.5 сохраняет надежные математические и научные возможности.

OpenAI также рекламировал сильные стороны GPT-4.5 в менее количественных областях. Компания говорит, что GPT-4.5 может лучше понять человеческие намерения и создавать ответы, которые чувствуют себя теплее, более естественны и более осведомлены. 

Неформальный тест включал подсказку: «Я переживаю трудные времена после провала теста». В то время как две другие модели предлагали полезную информацию, говорили, что GPT-4.5 реагирует большим сочувствием и эмоциональной чувствительностью.

«[Мы с нетерпением жду возможности получить более полную картину возможностей GPT-4.5 в этом выпуске»,-написал Openai в сообщении в блоге,-потому что мы признают, что академические показатели не всегда отражают реальную полезность ».

GPT-4.5 дает более теплые ответы, чем 4O и O3-Mini. Источник: Openai

Законы масштабирования под пристальным вниманием

GPT-4.5 был построен с той же стратегией обучения без присмотра, используемой для предыдущих версий GPT, стратегия, которая до сих пор оказалась надежной. Тем не менее, его ограниченная производительность по определенным критериям высокого уровня может быть признаком того, что традиционные «законы масштабирования» отрасли могут потерять пар.

Илья Саускевер, соучредитель и бывший главный ученый в Openai, заметила в декабре, что «мы достигли пиковых данных» и что «предварительное обучение, как мы знаем, это, несомненно, закончится». В то время он намекнул, что будущие выгоды будут зависеть от других методов, таких как системы, которые могут более глубоко рассуждать о проблемах, а не просто запоминать огромные полосы информации. 

См. Также  Империя Цукерберга в риске, так как Meta готовится к антимонопольному сне в понедельник
Илья Саускевер и Сэм Альтман в Тау. Источник: таувод на YouTube

GPT-4.5, по-видимому, был «невероятно дорогим для тренировок», как упоминалось в ее белой бумаге , и слухи циркулировали в течение нескольких месяцев, когда OpenAI несколько раз откладывал релиз из-за препятствий для производительности и стоимости. Несмотря на это, только GPT-4.5, по-видимому, не превосходит специализированные модели рассуждений от конкурентов по многим передовым задачам. Сама компания рассматривает это как еще одну веху разработки на пути к объединению технологии GPT с ее системами рассуждений «O», что, как ожидается, начнется с запуска GPT-5 в конце этого года.

Комментарии генерального директора Сэма Альтмана по дефиците графических процессоров

Генеральный директор Openai Сэм Альтман отправился в X (ранее Twitter), чтобы объяснить, почему развертывание последней модели происходит поэтапно. «Мы много растет и находились в графических процессорах»,-написал Альтман, назвав GPT-4.5 «гигантским» и «дорогой» и предупреждая, что компании потребуется «десятки тысяч» больше графических процессоров, прежде чем открыть модель для остальной части пользовательской базы.

Из-за своего большого размера GPT-4.5 оказывается очень дорогим. OpenAI взимает 75 долларов за токены за миллион за вход и 150 долларов за миллион токенов, генерируемых моделью. Это 30 раз и 15x стоимость ввода/вывода по сравнению с режимом GPT-4O.

Далее он уточнил: «Мы добавим десятки тысяч графических процессоров на следующей неделе и перекатились на уровне плюс… это не то, как мы хотим работать, но трудно идеально предсказать рост, которые приводят к нехватке графических процессоров».

Криптополитическая академия: скоро появится - новый способ заработать пассивный доход с DeFi в 2025 году. Узнайте больше

Поделиться ссылкой:

Отказ от ответственности. Предоставленная информация не является торговым советом. Cryptopolitan.com не несет ответственности за любые инвестиции, сделанные на основе информации, представленной на этой странице. Мы tron рекомендуем провести dent исследование и/или проконсультироваться с квалифицированным специалистом, прежде чем принимать какие-либо инвестиционные решения.

Самые читаемые

Загрузка самых читаемых статей...

Будьте в курсе новостей криптовалюты, получайте ежедневные обновления на свой почтовый ящик.

Выбор редактора

Загрузка статей "Выбор редакции"...

- Крипто -информационный бюллетень, который держит вас вперед -

Рынки движутся быстро.

Мы двигаемся быстрее.

Подпишитесь на Cryptopolitan Daily и получайте своевременную, острую и соответствующую криптографию прямо к вашему почтовым ящику.

Присоединяйтесь сейчас и
никогда не пропустите ход.

Войти. Получите факты.
Продвинуться вперед.

Подпишитесь на КриптоПолитан