Cloud and Terminal Coding Agent

OpenAI Codex

OpenAI's GPT-5.5 coding agent across ChatGPT, Codex App, CLI, IDE, cloud worktrees, Skills, Automations, GitHub workflows, and mobile remote control.

价格: Commercial
平台: Web, Terminal, IDE, Desktop, Mobile, Cloud, GitHub
官网: https://openai.com/codex
免费访问判断: 可能通过免费 ChatGPT/Codex 入口或学生 API 额度获得试用机会。
注意: 这取决于账号、地区和资格；使用前要确认 Codex 权限和学生额度是否仍有效。

2026 年结论

Codex 不应该被看成“另一个代码补全工具”。它更像 OpenAI 把 coding agent 放进软件交付流程的一次产品化尝试：你给任务，agent 在隔离环境里工作，生成可审查的结果，然后由人判断是否合并。

我的判断：Codex 最有价值的地方不是让你少敲几行代码，而是把很多小型工程任务推进到“可 review 的状态”。如果你想要的是编辑器里的即时体验，Cursor 或 Windsurf 会更顺手；如果你想要后台执行、并行尝试、云端任务和 PR 级别的产出，Codex 值得认真评估。

Codex 到底是什么

OpenAI 官方把 Codex 定位为帮助开发者 build and ship 的 coding agent。Codex 产品页强调 routine pull requests、复杂重构、迁移和云端并行 agent 工作。平台文档也描述 Codex 可以读取、修改、运行代码，并在自己的云环境里后台工作。

这意味着 Codex 的评估方式不能只看“补全准不准”。你应该看它能不能把一个工程任务拆清楚、改得足够小、验证得足够明确、让 reviewer 快速判断。

GPT-5.5、Skills 与 Automations 带来的变化

OpenAI 对 Codex 的新定位值得关注，因为它已经不只是“一个写代码助手”。公开 Codex 页面现在强调 GPT-5.5、并行 agent、云端环境、worktrees、macOS Codex App、CLI/IDE 入口、GitHub review、Skills 和 Automations。

我的判断：真正重要的不只是模型变强，而是模型外面的工作流包装。Skills 可以把团队常用流程固定下来，比如系统化调试、迁移审查、发布说明、安全检查。Automations 可以让 Codex 处理周期性任务，但也必须设置清晰边界。GitHub PR 和 diff 生成则把 agent 产物推向可审查的软件交付路径，而不是停留在聊天记录里。

所以 Codex 更像是在引入一个工程系统，而不是安装一个编辑器插件。正式使用前，需要明确谁可以创建或安装 Skills，哪些仓库允许云端运行，哪些 Automations 可以执行，worktree 如何命名，哪些命令算作验证证据，以及什么时候必须由人批准后才能继续。

Codex 2026 工作流示意图，展示 GPT-5.5、Skills、Automations、worktrees、GitHub diff 和移动审批 — Coding Agent Tools 原创图。2026 年 Codex 的关键变化，是 GPT-5.5 外围形成了 Skills、Automations、worktrees、review 和移动控制组成的工作流层。

2026 年 6 月需要重新评估的 Codex 能力

Codex 最新几次更新说明，它已经不只是“云端 coding agent”。更准确地说，它正在变成跨设备、跨主机、跨 App 的软件工作系统。最近变化最明显的是这些能力：

Appshots 提供更丰富上下文：macOS Codex 可以用快捷键把某个 app window 附加到 thread，并带上 screenshot 和可用文本。我的判断：这会降低 UI debug、设计还原、日志排查、文档阅读和“我现在看到的是这个状态”这类任务的上下文成本。
Goal mode 覆盖 app、IDE 和 CLI：Goal mode 已经在 Codex app、IDE extension 和 CLI 中 generally available。它的意义不是多一个模式，而是让 Codex 围绕 outcome 和 success criteria 工作，而不是只做一次 prompt-response。
Browser annotation improvements：in-app browser annotations 和 advanced annotation mode 让 Codex 更适合前端任务，因为视觉反馈可以绑定到真实 browser state，而不是靠文字描述“这里不对”。
Mac locked computer use：符合条件的 Mac Computer Use 用户，可以在 Mac 锁屏后继续让 Codex 远程工作，具体还受地区限制。这个能力很实用，但也提高了 host governance、凭据边界和 approval policy 的要求。
Windows Computer Use 与远程控制：OpenAI 增加了 Windows Computer Use，并支持从 ChatGPT mobile 或 Mac 上的 Codex 远程接管 Windows host 上的工作；Windows 仍然作为文件、shell、app server 和本地上下文所在主机。
Codex Profiles：符合条件的用户可以看到 Codex identity、长期 activity、profile details、usage stats 和 token activity。这让 Codex 使用情况不再只是“agent 做过事”，而是更接近可审计的运行信号。
Active account sessions：ChatGPT 的 active-session controls 现在可以覆盖可用的一方 OpenAI sessions，包括 ChatGPT、Codex 和 API Platform sessions。对团队来说，这意味着 agent access 也是账号会话风险。

我的实际结论：当任务涉及 live environment、本地 app、浏览器，或者需要保持 connected host 并由人远程 steering 时，Codex 的价值明显上升。但它也比普通 coding agent 风险更高：一旦 Codex 可以看 App、点击、输入、浏览、运行命令、被手机远程控制，采用清单就必须加入 host security、session review、approval policy 和 auditability。

2026 年 6 月中旬 Codex 更新

OpenAI 6 月中旬的 Codex 更新不是小修小补。它让 Codex 更像一个跨 ChatGPT、Codex App、CLI、IDE、云端任务、connected host 和仓库历史的软件工作操作层。

我会优先重新评估这些变化：

rate limit resets 最多可以 bank 到 15 windows：未用完的每周 rate limit resets 可以累积，这对突发式 agent 工作有价值。我的判断：它适合一段时间集中跑大量 Codex tasks 的团队，但不能替代窄任务、proof commands 和 review 纪律。
Codex 扩展到 EEA、UK 和 Switzerland：可用地区扩大了，但团队仍然要确认 workspace、plan、地区和 admin eligibility，不要默认每个开发者都能用同一入口。
历史 Codex threads 搜索：Codex App 里可以搜索历史线程，让长周期 agent 工作更容易恢复和审计。真实 coding-agent 工作经常跨几周、失败尝试和后续 review，这个功能比看起来更实用。
CLI、IDE 与 cloud tasks 同步 model 与 reasoning effort：符合条件的 Codex 入口可以跟随 Codex App 的设置。我的判断：Codex 正在变成统一配置面，而不是一组互不相干的客户端。
remote session 错误可见性增强：当 Codex 通过 connected host 工作时，更清楚的错误报告可以减少“agent 在另一台机器上停了但没人知道原因”的问题。
multi-repository tasks：云端任务可以访问任务所需的多个仓库。这对 monorepo 周边系统、shared package、app/API 分离项目和平台迁移很关键。
Projects content 作为 Codex 上下文：ChatGPT Projects 内容可以成为 Codex tasks 的 source context。它很强，但团队也需要定义哪些项目备注、spec、客户信息和内部文档适合注入 coding tasks。

和 Claude Code 对比，这进一步强化了分工。Claude Code 更像本地终端 runtime，重点是显式 permissions、hooks、MCP、subagents 和 shell proofs。Codex 则在变成 ChatGPT 原生 runtime，重点是账号上下文、云端/本地任务路由、thread search、mobile steering、connected hosts，以及统一的 model/reasoning settings。严肃采用时，把两者放到同一个 issue、同一组验收条件下比较，看 diff 质量、proof commands、review 时间和最终解释是否清楚。

更大的变化：ChatGPT 原生 Agent Runtime

现在拿 Codex 对比 Claude Code，不应该只说“终端 agent vs OpenAI agent”。更好的比较方式是 runtime design。Claude Code 正在产品化一个终端中心的 agent runtime；Codex 则在产品化一个 ChatGPT 原生的软件工作运行时，覆盖模型选择、App 入口、工具访问、云端委托、本地执行和 review。

OpenAI 官方 Codex 与 ChatGPT release 信息都指向这个方向。GPT-5.5 是面向长任务和复杂 coding work 的高能力层，OpenAI 也说明它在 Codex 里提供 400K context，并强化长程 agentic coding 能力。Codex-Spark 则是低延迟路径，适合快速代码问答和小修改。Codex App 又把 Computer Use、内置浏览器、plugins、MCP servers、Git review、IDE sync、worktrees、手机远程控制、memory、Automations、本地和云端执行放到一个工作面里。programmatic access tokens 和 Hooks GA 进一步说明，Codex 正在从聊天界面走向可治理的运行时。

Codex ChatGPT 原生 Agent Runtime 结构图，展示模型层、工具层和控制层 — Coding Agent Tools 原创图。Codex 正在成为 OpenAI 的软件工作运行时：快速交互、云端任务、本地控制、连接工具、定时工作和可 review diff。

几个 runtime 组件要分开看：

模型层：GPT-5.5 是真正面向 coding agent 的能力层。OpenAI 发布信息强调它在 Codex 中有 400K context、长程 agentic coding、终端使用 benchmark 和 Fast mode。Codex-Spark 重要在另一个方向，低延迟让小修改、解释和快速问答不会变成沉重的委托任务。
App 入口层：Codex 出现在 ChatGPT、Codex App、CLI、IDE、Web/Cloud tasks、GitHub、手机远程控制、desktop/SSH host 这些入口里。入口路由本身就是产品能力：不同任务不应该总从同一个 UI 开始。
工具与连接层：plugins、MCP servers、Computer Use、browser flows、image generation、docs access 和 connected services 让 Codex 不再孤立。价值是能触达更多系统；风险是权限扩散。
控制层：Hooks GA、access tokens、approval、worktrees、Automations、Git/PR review 是让 Codex 从对话工具变成工程运行时的部分。
记忆与连续性层：memory、connected app context、手机 steering 和 recurring Automations 说明 Codex 正在面向跨 session 的工作，而不只是一轮 prompt。

我的判断：Codex 最强的用法，是把它当成 OpenAI 托管的软件工作 runtime，而不是更聪明的 autocomplete。采用问题因此和 Claude Code 很像，但重心不同：谁控制 connected apps，哪些 plugins 和 MCP servers 允许使用，什么时候允许 cloud execution，哪些 Automations 可以运行，以及 human review 如何保持在闭环里。

最近更新后，Codex 应该和哪些工具层一起看

最近 Codex 的更新，如果只看 Codex 自己，会容易低估它的产品形态。OpenAI 正在把 Codex 做成一个更宽的软件工作面：GPT-5.5 负责更难的 agentic coding，Codex-Spark 负责低延迟交互，Codex App 管理多 agent 和 worktrees，90+ plugins 提供 app context，MCP 负责工具接入，Automations 承接周期性任务，programmatic access tokens 服务 CI/release/internal automation，Enterprise/Edu 侧则补上 RBAC、compliance API、Codex usage logs 等治理能力。

判断 Codex 是否适合时，可以按这些工具层对照：

终端 agent 层：对比 Claude Code、opencode、Gemini CLI、Aider 和 Qwen Code。Codex 胜在 OpenAI 账号体系、云端 worktrees、手机 steering 和托管 review 面；终端优先工具仍然适合更看重本地 shell 控制、模型路由和可检查性的团队。
编辑器 agent 层：对比 Cursor、Windsurf、Cline、Roo Code、Continue 和 Zed。Codex 做即时行内编辑不一定最顺，但当一个需求应该变成 thread、background task 或 PR 级改动时，它更自然。
团队平台层：对比 GitHub Copilot、OpenHands、Tabby 和 Amp。如果重点是治理、workspace access、worktree review、usage logs 和 release automation，Codex 应该放进这一层评估。
路由与成本层：对比 9Router、OpenRouter 和 NVIDIA NIM。Codex 是 OpenAI 托管路径；如果你需要 provider fallback、token 成本控制或跨供应商模型选择，路由工具仍然有价值。
工作流与规范层：把 Codex 和 OpenSpec 以及 Skills 矩阵连起来看。明确的 skills、验收条件、hooks 和 proof commands，会让 Codex 的后台工作更容易 review，而不是变成漂亮但难验收的大 diff。

我的实用建议：Codex 用来做 OpenAI 原生任务委托、跨入口连续工作、可 review 的云端/本地执行；编辑器 agent 留给紧密编辑循环；路由工具处理成本和供应商韧性；spec/skill 工具负责降低 Codex 任务歧义。

2026 年 6 月下旬新闻观察

6 月下旬最值得关注的信号，是 Codex 正在变得更可检查，也更深地进入 ChatGPT 的操作面。我不会把这理解成“又换了一个更强模型”。真正有用的方向是工作流证据：可 replay 的工作过程、更清楚的开发者控制、更丰富的项目上下文，以及人在最终 diff 落地前可以继续 steering 的更多入口。

如果把 Codex 和 Claude Code、Cursor 放在一起评估，问题就不只是“谁生成代码更快”。应该看 Codex 能不能保留 reasoning trail，能不能安全复用 project context，能不能在 App、CLI、IDE、cloud task、GitHub 和手机审批之间切换时不丢失验收条件。如果你的 workspace 已经可以使用 Record & Replay 或 Developer Mode 这类控制能力，我会把它们当成 review infrastructure，而不是新奇功能。

我的判断：Codex 最适合有明确 owner、窄目标、proof commands 和人工 review 步骤的任务。Codex 越多连接 ChatGPT projects、hosts、plugins 和 automations，团队越要提前定义哪些上下文可以进入 coding task，以及最后必须带回哪些证据。

ChatGPT App 打通后改变了什么

OpenAI 最近的方向，让 Codex 不再像一个单点工具，而更像一个接入 ChatGPT 账号体系的 coding agent 工作面。根据 OpenAI 2026 年 5 月 14 日的 ChatGPT release notes，Codex remote access 已经以 preview 形式进入 ChatGPT mobile app。重点不是“手机上也能打开 Codex”，而是手机可以成为正在运行的 Codex 工作的控制面。

结合 OpenAI release notes 和 Codex remote connection 文档，手机端可以开始或继续线程、回答 Codex 的问题、改变方向、批准动作、查看 Codex 找到的内容，并查看来自主机的实时上下文，比如项目状态、approval、plugins、截图、终端输出、diff 和测试结果。设置流程从主机上的 Codex App 开始，然后通过扫码在 ChatGPT 里完成。限制也很明确：主机需要保持唤醒、在线、登录同一个账号，并且继续运行 Codex。

我的判断：这让 Codex 的产品形态变了。它不只是“让 agent 在云端跑任务”，也不只是“本地 CLI 工具”。它正在变成一个围绕软件工作的操作层：桌面 App 管理并行线程，CLI 负责终端控制，IDE extension 承接编辑器上下文，Web/Cloud 承接委托任务，GitHub 连接仓库上下文，ChatGPT mobile 负责你离开电脑时的审批和跟进。

Codex 连接 ChatGPT、Codex App、CLI、IDE、GitHub、云端任务和移动审批的示意图 — Coding Agent Tools 基于 OpenAI Codex 官方公开文档绘制的原创图解，不是官方产品截图。

几个入口分别负责什么

Codex App：更像 command center。OpenAI 文档把它描述为管理 GPT-5.5 并行 threads 的桌面体验，支持 worktrees、Automations、Git、review、terminal actions、browser flows、Computer Use、Skills、plugins、MCP servers 和 IDE sync。
Codex CLI：本地终端入口。OpenAI 文档说明它可以在选定目录里读取、修改、运行代码，并可用 ChatGPT 账号或 API key 登录，通过 approval 控制编辑和命令执行。
IDE extension：编辑器入口。它适合需要 Codex 靠近 VS Code、Cursor 或 Windsurf 上下文的场景。
Cloud tasks：委托执行层。Codex 可以在隔离环境中后台工作，最后给出你可以 review、merge 或拉回本地继续处理的改动。
ChatGPT mobile app：远程控制层。它适合审批动作、跟进线程、查看 diff、终端输出、截图和测试结果，但不是独立替代主机运行环境。
GitHub 与 ChatGPT app 连接：更适合仓库理解和代码检索。OpenAI 的 GitHub connector 文档也区分了 ChatGPT 对仓库的只读分析，和 Codex 生成、编辑、push 或 PR 级别改动的工作流。

所以 Codex 最强的用法，不是把它当成某一个界面，而是把它当成跨界面的工作流系统。同一个 coding agent 会根据任务出现在不同位置：CLI 做本地控制，App 做 review 和并行线程，IDE 贴近编辑器上下文，手机做远程审批，GitHub/Cloud 做仓库级任务。

Codex 从任务描述、上下文、agent 执行、审批、diff 与测试到人工 review 的流程图 — 我们对 Codex 采用方式的判断：任务要窄，approval 要可见，结果要用可审查 diff 和测试证据来判断。

私有素材说明

本页图片是 Coding Agent Tools 自己生成和压缩的站内素材。它们基于 OpenAI Codex 公开文档总结产品模型，但图形布局、文字结构和表达方式都是本站原创，不是复制官方截图。

适合谁

已经在使用 ChatGPT 或 OpenAI 模型的团队。
想把 bug fix、测试补充、小迁移、小重构交给 agent 处理的开发者。
需要云端隔离环境、后台任务和并行尝试的团队。
想要 ChatGPT 原生 agent runtime 的团队，希望把模型、工具、memory、Automations、hooks、plugins、MCP 和 PR review 放进同一个操作层。
正在评估 OpenAI Trusted Access、Codex Security 或更重度 computer-use 工作流的安全与基础设施团队。
重视 PR 审查、任务记录和验证命令的工程组织。
希望在手机、桌面、IDE、终端和 GitHub 连接场景之间继续推进 Codex 工作的人。
正在比较 Codex、Claude Code、GitHub Copilot coding agent 和 opencode 的团队。

不适合谁

主要需要低延迟补全的人。
代码或构建上下文不能进入托管云环境的项目。
没有测试、没有 review、没有权限边界的团队。
需求非常模糊、验收条件不清楚的产品任务。
期待手机端 Codex 可以在没有唤醒主机的情况下独立运行的人。

它比 Cursor 强在哪里

Codex 更适合 issue 或 PR 级别的任务，而不是局部编辑。比如“修复这个失败测试”“给这个行为补覆盖”“迁移这个小模块”“查明这个命令为什么失败”，这些任务比“帮我改这几行代码”更适合 Codex。

它的优势在后台执行和并行尝试。你可以让 agent 工作，自己把注意力放在审查、产品判断或其他任务上。这和 Cursor 的交互式编辑是两种不同的生产力模型。

Cursor 仍然更好的地方

Cursor 更适合即时阅读和紧密编辑循环。你在代码里选中一段、问解释、让它改写几行，这种体验编辑器优先的产品更直接。

一句话：Codex 更像“交办任务”，Cursor 更像“协同编辑”。你要先判断自己当前瓶颈到底在哪。

Codex vs Claude Code vs opencode

Codex 和 Claude Code 是最直接的商业对比：二者都在把软件工程任务交给 agent。我的建议是不要凭品牌选，而是拿同一个真实 issue、同一组验收条件去对比。

Claude Code 对终端本地工作流更友好，适合希望 agent 靠近 shell、Git、测试命令的团队。Codex 的吸引力在 OpenAI 原生生态、云端任务、并行后台工作、Codex App 线程管理，以及和 ChatGPT 账号、移动审批和 connected services 的衔接。

opencode 是开源对照组。如果你更重视可检查性、模型选择和掌控 agent loop，opencode 很值得看。Codex 更适合希望使用托管产品体验、并接受 OpenAI 生态的团队。

采用建议

先定义 Codex 可以访问哪些仓库，哪些文件禁止访问。
明确谁可以编写或安装 Codex Skills，并像审查项目自动化一样审查它们。
把 Automations 当成定时工程任务：范围要窄、验证命令要明确、结果要有人 review。
从小任务开始，不要一开始就交给它大范围产品重构。
每个任务都写清楚验收条件和需要运行的测试命令。
明确不同入口的分工：CLI 做本地修改，App 管理并行线程，Cloud 做委托任务，IDE 承接编辑器上下文，Mobile 负责审批和跟进。
用同一个 issue 对比 Codex、Claude Code 和 opencode 的 diff 质量。
记录 review 时间，而不是只记录生成速度。
明确云端执行是否符合团队安全和合规要求。
如果使用手机远程控制，把连接的 Mac 或 SSH host 当成工程基础设施管理：保持唤醒、在线、凭据最小化，并使用和本地 Codex 一样的 approval policy。

质量判断

Codex 好不好，不看它写了多少代码，而看它能不能持续产出小而清晰、能解释、能验证、容易 review 的改动。

最危险的信号是“看起来很强，但 review 成本变高”。如果 AI 让你少敲代码，却让你花更多时间确认它有没有引入问题，那它没有真正提升工程吞吐。

风险提醒

Codex 不是产品判断的替代品。它能执行任务，但任务边界仍然要由人写清楚。模糊任务会生成模糊 diff。

另外，云端执行不等于适合所有仓库。敏感代码库必须先明确访问策略、密钥处理、审计要求和 review gate。

来源说明

OpenAI Codex 产品页将 Codex 描述为帮助开发者 build and ship 的 coding agent，并强调复杂重构、迁移、并行云环境等场景。
OpenAI Codex 产品页围绕 GPT-5.5、Codex App、并行 agents、Skills、Automations 和连接式工程入口来定位 Codex。
OpenAI 2026 年 5 月 21 日 ChatGPT release notes 描述了 Codex Appshots、覆盖 app/IDE/CLI 的 Goal mode、in-app browser annotations、locked computer use 和 browser-use improvements。
OpenAI 2026 年 5 月 29 日与 6 月 1 日 ChatGPT release notes 描述了 Windows Computer Use、Windows-hosted work 的远程控制、browser performance improvements 和 Codex Profiles。
OpenAI 2026 年 6 月 2 日 ChatGPT release notes 描述了 active account session controls，并说明可用时可包含 ChatGPT、Codex 和 API Platform sessions。
OpenAI 2026 年 6 月 11 日与 6 月 16 日 ChatGPT release notes 说明了历史 Codex threads 搜索、CLI/IDE/cloud tasks 同步 model 与 reasoning effort、remote session 错误可见性、multi-repository tasks、EEA/UK/Switzerland 可用性，以及最多可 bank 到 15 windows 的 rate limit resets。
OpenAI 2026 年 6 月中旬 Codex 与 ChatGPT Projects 更新说明 ChatGPT Projects content 可以作为 Codex tasks 的 source context；这有利于连续性，但也要求团队管理上下文边界。
OpenAI 的 GPT-5.5 公告描述了 GPT-5.5 面向 agentic coding 的定位，以及 Codex-Spark 面向低延迟 coding interaction 的定位。
OpenAI ChatGPT release notes 描述了 Codex App 的 Computer Use、内置 browser、image generation、plugin 扩展、MCP support、memory、Automations、programmatic access tokens、Hooks GA、remote SSH 和 mobile remote control 等更新。
OpenAI Enterprise/Edu release notes 描述了 Codex App 的 RBAC、compliance API、Codex usage logs、connector controls 和 workspace-level access management 等治理能力。
OpenAI 的 “Codex for almost everything” 更新描述了 image generation、90+ plugins、可复用 existing threads 的 Automations，以及更深入的 app/MCP integrations。
OpenAI 的 “Work with Codex from anywhere” 更新描述了 mobile steering、remote host 要求，以及用于 CI、release 和 internal automation 的 scoped programmatic access tokens。
OpenAI Codex Skills 帮助文档说明了 Skills 如何把 instructions、scripts 和 assets 打包成可复用的 Codex 工作流。
OpenAI Codex pull request 与 diff 文档说明了 Codex 工作如何转化为可 review 的 GitHub 级别改动。
OpenAI 平台文档描述 Codex 可以读取、修改、运行代码，并在云环境里后台工作。
OpenAI Help Center 对 Codex CLI 的说明是：开源命令行工具，把推理模型带到终端开发流程中。
OpenAI 2026 年 5 月 14 日 ChatGPT release notes 描述了 Codex remote access 进入 ChatGPT mobile app，可以开始或继续线程、批准动作、查看 diff、终端输出、截图和测试结果。
OpenAI Codex App 与 remote connections 文档描述了桌面 App 的并行线程、worktree、review、automation 等能力，并说明手机远程控制依赖保持唤醒、在线并运行 Codex 的连接主机。
OpenAI GitHub connector 文档区分了 ChatGPT 对仓库的只读分析，和 Codex 生成、编辑、push 或 PR 级别改动的工作流。