OpenAIは金曜日、最新の主力AIコーディングエージェント「Codex」を発表した。同社によると、このAIコーディングエージェントは、単純な機能の記述に1分から30分程度かかるという。Codexの各タスクは、ユーザーのリポジトリが事前にロードされたクラウド上のサンドボックス領域で実行される。.
OpenAIは、複数のタスクを並行して実行できるクラウドベースのAIエージェント「Codex」の研究プレビュー版をリリースしました。同社は、このAIコーディングエージェントがレビューのためのプルリクエストを提案できると指摘しています。CiscoやTemporalといった企業は、 OpenAIにフィードバックを提供するため、既に業務にCodexを活用し始めています。
Open AIがCodexの仕組みを明らかに
今日はコーデックスを紹介します。.
これはクラウドで実行され、新しい機能の作成やバグの修正などのタスクを代わりに実行するソフトウェア エンジニアリング エージェントです。.
多くのタスクを並行して実行できます。.
— サム・アルトマン (@sama) 2025 年 5 月 16 日
発表によると、 Codexは、エンジニアリングタスク向けに設計された同社の03のバージョンであるCodex-1によってサポートされています。OpenAIによると、このAIエージェントは様々な環境で強化学習を用いてトレーニングされました。人間のスタイルやPRの好みに似たコードを生成するために、実際のコーディングタスクでトレーニングされました。また、Codexはコーディング指示に正確に従い、合格点が出るまでテストを実行するようにもトレーニングされました。
ChatGPT ユーザー向けにCodexの提供を開始したと発表した。同社は、このAIコーディングエージェントがまもなくPlusおよびEduサブスクリプションでも利用可能になると付け加えた。ChatGPTユーザーに対し、サイドバーからCodexにアクセスするよう案内している。また、ユーザーはプロンプトを書いて「コード」をタップすることで、AIコーディングエージェントに新しいコーディングタスクを割り当てることができると付け加えた。また、ユーザーはCodexに自分のコードベースに関する質問をすることもできるとしている。
AI企業によると、この新しいコーディングエージェントはファイルの読み取りと編集が可能で、Codexはテストハーネス、型チェッカー、リテラルなどのコマンドも実行できる。AIエージェントは複数のタスクを処理しながら、リアルタイムで監視できる。.
OpenAIは、AIコーディングエージェントがタスクを完了すると、その領域に変更をコミットすると説明した。また、AIコーディングエージェントは自身の行動の検証可能な証拠も提供すると付け加えた。Codexはテスト出力と端末ログの引用を提供し、ユーザーがタスク実行中に実行された各ステップを tracできるようにするとOpenAIは説明した。ユーザーはCodexが提供する結果を確認できるとOpenAIは述べた。さらに、ユーザーは修正をリクエストすることもできると付け加えた。.
OpenAIはCodexのスピード、セキュリティ、透明性を称賛
OpenAIのエージェント研究リーダーであるジョシュ・トービン氏は、AIコーディングエージェントをオンラインのチームメイトとして機能させ、人間のエンジニアが数時間から数日かけて完了するようなタスクを自律的に実行させたいと考えていると述べた。同社は既に、反復的なタスクのオフロード、ドキュメントの作成、新機能のスキャフォールディングに、この新しいAIコーディングエージェントを社内で活用していることを明らかにした。.
OpenAIは、新しいAIコーディングエージェントを発表する際に、設計においてセキュリティを最優先したと述べました。また、AIコーディングエージェントの開発においては透明性も重視しました。OpenAIは、ユーザーがCodexの出力を検証できるように、透明性を重視したと明言しました。OpenAIのプロダクトリードであるアレクサンダー・エンビリコス氏は、同社のo3における安全性に関する取り組みと機能はCodexにも適用されていると述べました。OpenAIは、Codexは悪意のあるソフトウェアの作成要求を拒否すると述べました。さらに、Codexはエアギャップ領域で機能するため、外部APIやインターネット全体にアクセスしないことも付け加えました。.
同社は、Codexによって生成されたコードをユーザーに対し手動で確認するようアドバイスしました。また、Codexは不確実な点やテストの失敗に直面した際にユーザーに通知を行うと付け加えました。OpenAIによると、Codexエージェントはユーザーに問題を伝達し、今後の進め方について十分な情報に基づいた決定を下せるように設計されているとのことです。.
ここ数ヶ月、GoogleとMicrosoftは、明らかにしました。2月には、Anthropicが独自のエージェント型コーディングツール「Claude Code」をリリースしました。Googleは、AIコーディングエージェント「Gemini Code Assist」に追加機能を導入しました。
写真はFocal Fotoによるもので、Flickrから引用。.