長期間稼働するワークロードのためのCodex最適化
OpenAIは、長時間実行されるコード生成・実行タスクにおけるCodexモデルのパフォーマンスを向上させる手法「Codex-maxxing」を紹介。推論時の計算リソースを戦略的に拡大することで、複雑なプログラミングワークフローでのコード品質と実行成功率を大幅に改善する。
背景メモ
- OpenAIは2025年4月、AIエージェント「Codex」(旧称「Operator」)の新機能を発表。コードを書くだけでなく、長時間バックグラウンドで自律的にタスクを実行できるようになった。
- 「Codex-maxxing」は「Codexを最大限活用する」というスラング的造語。AIエージェントに「ずっと動かし続ける(long-running work)」能力を与えることで、人間の代わりに監視・メンテナンス業務を任せるのが狙い。
- 背景には、AIエージェント分野での競争激化がある。Anthropic(Claudeの「Computer Use」機能)、Google(Project Mariner)、スタートアップのCognition(Devin)などが同様の自律エージェントを投入しており、OpenAIは「実行時間の長さ」で差別化を図っている。
- これまでのAIアシスタントは一回の対話で短い応答を返すだけだったが、「長期実行エージェント」は数時間~数日かけて複雑なワークフローをこなす。信頼性・コスト・監視可能性が実用化のカギとされる。