Агент Operator от OpenAI получает улучшенную версию благодаря новой модели ИИ

- OpenAI обновила Operator, своего агента искусственного интеллекта, использующего веб для выполнения задач, до модели на основе o3, после того как ранее использовала собственную версию GPT-4o.
- Модель o3 Operator была доработана с использованием дополнительных данных по безопасности для компьютерного моделирования, включая наборы данных по безопасности, предназначенные для обучения модели границам принятия решений.
- Майк Кноп, соучредитель фонда Arc Prize Foundation, считает, что реализация модели o3 может оказаться дороже, чем ожидалось.
Компания OpenAI обновила модель искусственного интеллекта, лежащую в основе Operator, заменив предыдущую пользовательскую версию GPT-4o на модель на основе o3, одной из последних в серии «логических» моделей OpenAI o. Модель o3 Operator была доработана с использованием дополнительных данных безопасности для работы на компьютерах и включала наборы данных безопасности, предназначенные для обучения модели границам принятия решений.
Компания OpenAI обновила оператора в ChatGPT, внедрив новую модель компьютерного агента (CUA), основанную на версии OpenAI o3. Благодаря новой модели оператор стал более настойчивым и точным при взаимодействии с браузером, что повысило общую вероятность успешного выполнения задач. Он также предоставляет более структурированные, четкие и исчерпывающие ответы.
Согласно данным OpenAI, новая модель CUA продемонстрировала болееtronпроизводительность по сравнению с отраслевыми показателями, достигнув наивысших результатов на OSWorld и WebArena. Она также показалаtronвысокую производительность по сравнению с предыдущей версией как в общепринятых бенчмарках, так и в оценках предпочтений пользователей.
OpenAI заменяет модель на основе GPT-4o версией на основе o3
OpenAI намекает на крупное обновление для агента ChatGPT Operator Agent pic.twitter.com/iGPQp9butD
– SabatAge (@sabatage) 22 мая 2025 г.
Компания OpenAI заменила существующую модель Operator на основе GPT-4o на версию, основанную на OpenAI o3, хотя версия API останется на основе 4o. Компания также заявила, что o3 Operator использует тот же многоуровневый подход к обеспечению безопасности, что и версия 4o.
Однако, по сравнению с другими моделями семейства o3, модель o3 Operator была доработана с использованием дополнительных данных по безопасности для компьютерного анализа, включая наборы данных по безопасности, предназначенные для обучения модели границам принятия решений при подтверждении и отказе.
Компания OpenAI опубликовала технический отчет, демонстрирующий результаты работы оператора o3 в конкретных тестах безопасности. По сравнению с моделью оператора GPT-4o, оператор o3 реже отказывался от выполнения «незаконных» действий и поиска конфиденциальных персональных данных, а также был менее подвержен атаке на ИИ, известной как «внедрение подсказок».
«В o3 Operator используется тот же многоуровневый подход к безопасности, что и в версии 4o Operator… Хотя o3 Operator наследует возможности программирования o3, он не имеет прямого доступа к среде программирования или терминалу»
Компания, занимающаяся разработкой ИИ, также сообщила, что новая модель на базе o3 прошла стандартные проверки безопасности, и Operator по-прежнему доступен в качестве предварительной версии для пользователей ChatGPT Pro по всему миру. Однако эта обновленная модель была доступна только в Operator в ChatGPT.
Кнуп подозревает, что запуск модели o3 от OpenAI может оказаться дороже, чем ожидалось
На прошлой неделе фонд Arc Prize Foundation, который поддерживает и администрирует ARC-AGI, обновил свои приблизительные расчеты вычислительной стоимости для o3. Первоначально организация оценивала, что наилучшая из протестированных конфигураций o3, o3 high, обходится примерно в 3000 долларов США для решения одной задачи ARC-AGI. Однако теперь фонд считает, что стоимость может быть в 10 раз выше, чем предполагалось ранее, возможно, около 30 000 долларов США за задачу.
Кроме того, хотя OpenAI еще не объявила цену на o3 и не выпустила его в полном объеме, один из соучредителей фонда Arc Prize Foundation, Майк Кнуп, считает, что цена модели o1-pro является разумным приближением и более точным сравнением реальной стоимости o3. Однако он добавил, что o3 будет по-прежнему отображаться в таблице лидеров как предварительная версия, чтобы отразить неопределенность до объявления официальной цены.
По данным фонда Arc Prize Foundation, высокая цена за o3 high не исключена, учитывая объем вычислительных ресурсов, которые, как сообщается, использует эта модель. Для решения задачи ARC-AGI o3 high использовала в 172 раза больше вычислительных ресурсов, чем o3 low, самая дешевая конфигурация o3.
ходят слухи о дорогостоящих планах, которые OpenAI рассматривает для внедрения для корпоративных клиентов. Сообщается, что компания может взимать до 20 000 долларов в месяц за специализированных ИИ-«агентов», подобных агентам разработчиков программного обеспечения.
Однако, хотя некоторые утверждали, что даже самые дорогие модели OpenAI обойдутся значительно дешевле, чем услуги обычногоtracили сотрудника, исследователь в области ИИ Тоби Орд отметил, что модели могут быть не столь эффективными. Например, для достижения наилучшего результата o3 high потребовалось 1024 попытки для выполнения каждой задачи в ARC-AGI.
Если вы это читаете, значит, вы уже впереди. Оставайтесь на шаг впереди, подписавшись на нашу рассылку.

Коллинз Дж. Окот
Коллинз Окот — журналист и аналитик рынка с 8-летним опытом работы в сфере криптовалют и технологий. Он является сертифицированным финансовым аналитиком и имеет степень в области актуарнойmatic. Ранее Коллинз работал в компаниях Geek Computer и CoinRabbit в качестве автора и редактора.
КУРС
- Какие криптовалюты могут принести вам деньги?
- Как повысить безопасность своего кошелька (и какие из них действительно стоит использовать)
- Малоизвестные инвестиционные стратегии, используемые профессионалами
- Как начать инвестировать в криптовалюту (какие биржи использовать, какую криптовалюту лучше купить и т.д.)














