OpenAIのオペレーターエージェントが新しいAIモデルで強化される

読了時間3分 2025年5月24日

OpenAI は、Web を使用してタスクを実行する AI エージェントである Operator を、以前は GPT-4o のカスタムバージョンを使用していたが、o3 ベースのモデルにアップグレードしました。.
o3 オペレーターは、モデルの決定境界を教えるために設計された安全性データセットを含む、コンピューター使用のための追加の安全性データで微調整されました。.
Arc Prize Foundationの共同設立者であるマイク・ヌープ氏は、o3モデルの運用には予想よりもコストがかかる可能性があると考えている。.

OpenAIは、Operatorの基盤となるAIモデルを、以前のGPT-4oカスタムバージョンから、OpenAIのoシリーズ「推論」モデルの最新版の一つであるo3ベースのモデルにアップデートしました。o3 Operatorは、コンピュータでの使用を想定して追加の安全性データで微調整され、モデルの判断境界を学習するための安全性データセットも含まれています。.

OpenAIはアップグレードしました。この新しいモデルにより、オペレーターはブラウザとのインタラクションにおいてより持続的かつ正確になり、全体的なタスク成功率が向上しました。また、より明確で詳細な、より構造化された応答も提供します。

OpenAIによると、新しいCUAモデルはtron業界最高レベルの性能を示し、OSWorldとWebArenaでSOTAを達成しました。また、既存のベンチマークと人間の嗜好評価の両方において、以前のバージョンと比較しても非常に優れた性能を示しtron。

OpenAIはGPT-4oベースのモデルをo3ベースのバージョンに置き換えた。

OpenAI が ChatGPT オペレーターエージェントの大幅なアップグレードを示唆 pic.twitter.com/iGPQp9butD

— SabatAge (@sabatage) 2025年5月22日

OpenAIは、Operatorの既存のGPT-4oベースモデルをOpenAI o3ベースのバージョンに置き換えましたが、APIバージョンは引き続き4oベースのままです。また、OpenAIはo3 Operatorは4oバージョンと同じ多層的な安全性アプローチを採用していると主張しています。.

ただし、o3 ファミリーの他のモデルと比較すると、o3 オペレーターは、確認と拒否に関するモデルの決定境界を教えるために設計された安全性データセットなど、コンピューターで使用するための追加の安全性データを使用して微調整されています。.

OpenAIは、o3 Operatorの特定の安全性評価における性能を示す技術レポートを公開した。GPT-4o Operatorモデルと比較して、o3 Operatorは「違法」な活動や機密性の高い個人データの検索を拒否する可能性が低く、「プロンプトインジェクション」と呼ばれるAI攻撃の一種に対する脆弱性も低いことが示された。

「o3 Operator は、Operator の 4o バージョンで使用したのと同じ多層的な安全性アプローチを採用しています。o3 Operator は o3 のコーディング機能を継承していますが、コーディング環境やターミナルにネイティブにアクセスすることはできません。」

–オープンAI

AI企業はまた、新しいo3ベースのモデルが標準的な安全性評価を通過したことを明らかにしました。Operatorは引き続き、世界中のChatGPT Proユーザーにリサーチプレビューとして提供されます。ただし、このアップグレードされたモデルはChatGPTのOperatorでのみ利用可能です。.

ヌープ氏は、OpenAIのO3モデルの実行には予想よりもコストがかかる可能性があると疑っている。

先週、ARC-AGIを維持管理するArc Prize Foundationは、o3の概算計算コストを更新しました。同財団は当初、テストしたo3の最高性能構成であるo3 highで、1つのARC-AGI問題を解くのに約3,000ドルかかると見積もっていました。しかし現在、財団はコストが以前の見積もりの10倍、つまりタスクあたり約30,000ドルになる可能性があると考えています。.

OpenAIはまだo3の価格設定や完全なリリースを行っていませんが、Arc Prize Foundationの共同創設者の一人であるマイク・ヌープ氏は、o1-proモデルの価格設定はo3の真のコストを妥当に反映した、より正確な比較指標であると考えています。ただし、正式な価格が発表されるまでは、o3はリーダーボード上でプレビューとして表示され続けると付け加えました。.

Arc Prize Foundation によれば、このモデルが使用するとされるコンピューティングリソースの量を考えると、o3 high の価格が高額になることも不可能ではないとのことです。o3 high は、ARC-AGI に対処するために、o3 の最も低いコンピューティング構成である o3 low の 172 倍のコンピューティングを使用しました。.

様々な噂が飛び交っ。報道によると、同社はソフトウェア開発者エージェントのような専門的なAI「エージェント」に対し、月額最大2万ドルを請求する可能性があるという。

しかし、OpenAIの最も高価なモデルでさえ、典型的な人間のtrac業者やスタッフが支払うコストをはるかに下回ると主張する人もいた一方で、AI研究者のトビー・オルドは、これらのモデルはそれほど効率的ではない可能性があると指摘した。例えば、o3 highはARC-AGIの各タスクで最高スコアを達成するのに1,024回の試行を必要とした。.

仮想通貨ニュースを読むだけでなく、理解を深めましょう。ニュースレターにご登録ください。無料です。

オープンAI

この記事を共有する

コリンズ・J・オコス

コリンズ・オコスは、仮想通貨とテクノロジー分野を8年間取材してきたジャーナリスト兼市場アナリストです。彼は公認財務アナリスト（CFA）の資格を持ち、アクチュアリーmaticの学位も取得しています。コリンズは以前、Geek ComputerとCoinRabbitでライター兼編集者として勤務していました。.

1. OpenAIはGPT-4oベースのモデルをo3ベースのバージョンに置き換えた。

2. ヌープ氏は、OpenAIのO3モデルの実行には予想よりもコストがかかる可能性があると疑っている。

この記事を共有する