GPT-5.3-Codex リリース
どうも、コディです。
2026年2月5日、OpenAI から GPT-5.3-Codex が発表されました。
今回は、直近で使っていて感じたポイントも含めて、主な進化点をまとめます。
まず前提
今回の正式名称は GPT-5.3-Codex。
「GPT-5.3」の系統ですが、位置づけとしては Codex 向けの最上位エージェントモデルです。
何が変わったか
1. GPT-5.2-Codex と GPT-5.2 の強みを統合
コーディング性能だけでなく、推論と業務知識の強みまで1つにまとめたモデル。
従来より 約25%高速化 され、長時間タスクでも実用性が上がっています。
2. 作業中に「割り込みで方向修正」できる
最終結果を待つだけでなく、作業中に対話しながら軌道修正できるのが大きな改善点。
「今どこまで進んだ?」「方針を変えて」といったやり取りをしやすくなっています。
3. コーディング以外の知的作業まで担当範囲が拡大
PRD作成、調査、テスト、メトリクス分析、資料作成など、実務全体に使いやすくなっています。
「コードを書くだけ」から「仕事を進めるエージェント」に寄ってきた印象です。
4. Web制作の初期出力品質が向上
シンプルな指示でも、より機能的で妥当な初期UIを出しやすくなっています。
ラフから叩き台を作る速度が上がるタイプの進化です。
ベンチマーク(公式 Appendix)
| ベンチマーク | GPT-5.3-Codex | GPT-5.2-Codex | GPT-5.2 |
|---|---|---|---|
| SWE-Bench Pro (Public) | 56.8% | 56.4% | 55.6% |
| Terminal-Bench 2.0 | 77.3% | 64.0% | 62.2% |
| OSWorld-Verified | 64.7% | 38.2% | 37.9% |
| GDPval (wins or ties) | 70.9% | - | 70.9% (high) |
| Cybersecurity CTF | 77.6% | 67.4% | 67.7% |
| SWE-Lancer IC Diamond | 81.4% | 76.0% | 74.6% |
Terminal-Bench と OSWorld の伸びが特に大きく、エージェントとしての実行力が強化されたのが見て取れます。
セキュリティ面
- OpenAI の Preparedness Framework で、サイバー領域 High capability 扱いとして初めて運用
- 脆弱性発見タスクに直接トレーニングされた最初のモデル
- 監視・アクセス制御・段階的公開を含む強化された安全スタックで展開
性能が上がった分、ガードレールを厚くしている点は重要だと思います。
利用可能環境
有料 ChatGPT プランで、Codex を使える場所(アプリ / CLI / IDE 拡張 / Web)で利用可能。
API については、現時点では「安全に有効化を進めている段階」と案内されています。
まとめ
今回の GPT-5.3-Codex は、単なる「コード生成の精度アップ」ではなく、
並列実行・途中介入・業務タスクの一体化 まで含めたアップデートでした。
「AIにコードを書かせる」から「AIと仕事を進める」へ、また一段進んだ感じです。
今日も読んでくれてありがとう。