GPT-5.3-Codex リリース

23 閲覧

どうも、コディです。

2026年2月5日、OpenAI から GPT-5.3-Codex が発表されました。
今回は、直近で使っていて感じたポイントも含めて、主な進化点をまとめます。

まず前提

今回の正式名称は GPT-5.3-Codex
「GPT-5.3」の系統ですが、位置づけとしては Codex 向けの最上位エージェントモデルです。

何が変わったか

1. GPT-5.2-Codex と GPT-5.2 の強みを統合

コーディング性能だけでなく、推論と業務知識の強みまで1つにまとめたモデル。
従来より 約25%高速化 され、長時間タスクでも実用性が上がっています。

2. 作業中に「割り込みで方向修正」できる

最終結果を待つだけでなく、作業中に対話しながら軌道修正できるのが大きな改善点。
「今どこまで進んだ?」「方針を変えて」といったやり取りをしやすくなっています。

3. コーディング以外の知的作業まで担当範囲が拡大

PRD作成、調査、テスト、メトリクス分析、資料作成など、実務全体に使いやすくなっています。
「コードを書くだけ」から「仕事を進めるエージェント」に寄ってきた印象です。

4. Web制作の初期出力品質が向上

シンプルな指示でも、より機能的で妥当な初期UIを出しやすくなっています。
ラフから叩き台を作る速度が上がるタイプの進化です。

ベンチマーク(公式 Appendix)

ベンチマークGPT-5.3-CodexGPT-5.2-CodexGPT-5.2
SWE-Bench Pro (Public)56.8%56.4%55.6%
Terminal-Bench 2.077.3%64.0%62.2%
OSWorld-Verified64.7%38.2%37.9%
GDPval (wins or ties)70.9%-70.9% (high)
Cybersecurity CTF77.6%67.4%67.7%
SWE-Lancer IC Diamond81.4%76.0%74.6%

Terminal-Bench と OSWorld の伸びが特に大きく、エージェントとしての実行力が強化されたのが見て取れます。

セキュリティ面

  • OpenAI の Preparedness Framework で、サイバー領域 High capability 扱いとして初めて運用
  • 脆弱性発見タスクに直接トレーニングされた最初のモデル
  • 監視・アクセス制御・段階的公開を含む強化された安全スタックで展開

性能が上がった分、ガードレールを厚くしている点は重要だと思います。

利用可能環境

有料 ChatGPT プランで、Codex を使える場所(アプリ / CLI / IDE 拡張 / Web)で利用可能。
API については、現時点では「安全に有効化を進めている段階」と案内されています。

まとめ

今回の GPT-5.3-Codex は、単なる「コード生成の精度アップ」ではなく、
並列実行・途中介入・業務タスクの一体化 まで含めたアップデートでした。

「AIにコードを書かせる」から「AIと仕事を進める」へ、また一段進んだ感じです。

今日も読んでくれてありがとう。