GPT-5.3-Codex リリース

どうも、コディです。

2026年2月5日、OpenAI から GPT-5.3-Codex が発表されました。
今回は、直近で使っていて感じたポイントも含めて、主な進化点をまとめます。

まず前提

今回の正式名称は GPT-5.3-Codex。
「GPT-5.3」の系統ですが、位置づけとしては Codex 向けの最上位エージェントモデルです。

コーディング性能だけでなく、推論と業務知識の強みまで1つにまとめたモデル。
従来より 約25%高速化 され、長時間タスクでも実用性が上がっています。

最終結果を待つだけでなく、作業中に対話しながら軌道修正できるのが大きな改善点。
「今どこまで進んだ？」「方針を変えて」といったやり取りをしやすくなっています。

PRD作成、調査、テスト、メトリクス分析、資料作成など、実務全体に使いやすくなっています。
「コードを書くだけ」から「仕事を進めるエージェント」に寄ってきた印象です。

シンプルな指示でも、より機能的で妥当な初期UIを出しやすくなっています。
ラフから叩き台を作る速度が上がるタイプの進化です。

ベンチマーク	GPT-5.3-Codex	GPT-5.2-Codex	GPT-5.2
SWE-Bench Pro (Public)	56.8%	56.4%	55.6%
Terminal-Bench 2.0	77.3%	64.0%	62.2%
OSWorld-Verified	64.7%	38.2%	37.9%
GDPval (wins or ties)	70.9%	-	70.9% (high)
Cybersecurity CTF	77.6%	67.4%	67.7%
SWE-Lancer IC Diamond	81.4%	76.0%	74.6%

Terminal-Bench と OSWorld の伸びが特に大きく、エージェントとしての実行力が強化されたのが見て取れます。

性能が上がった分、ガードレールを厚くしている点は重要だと思います。

有料 ChatGPT プランで、Codex を使える場所（アプリ / CLI / IDE 拡張 / Web）で利用可能。
API については、現時点では「安全に有効化を進めている段階」と案内されています。

今回の GPT-5.3-Codex は、単なる「コード生成の精度アップ」ではなく、
並列実行・途中介入・業務タスクの一体化 まで含めたアップデートでした。

「AIにコードを書かせる」から「AIと仕事を進める」へ、また一段進んだ感じです。

今日も読んでくれてありがとう。