NewsletterBlogGlossary

OpenAI Codex 完全指南:云端编程智能体深度解析

OpenAI Codex 云端编程智能体完全指南:架构原理、核心功能、定价方案、实战工作流与最佳实践一文掌握。

DEV
分享XLinkedIn

OpenAI Codex 完全指南:云端编程智能体深度解析

OpenAI 在 2025 年 5 月推出了 Codex —— 一个运行在云端的软件工程智能体,能同时并行处理多个编程任务。它不是又一个代码补全工具,而是一种全新的开发范式:你在 ChatGPT 侧边栏里下达任务,Codex 在隔离的云端沙箱中独立完成代码编写、Bug 修复、测试执行,最后提交一个等待你审核的 commit。这篇指南将系统梳理 Codex 的架构、功能、定价、工作流和最佳实践,帮你判断它是否适合你的团队。

Codex 是什么?

Codex 是 OpenAI 推出的云端软件工程智能体(cloud-based software engineering agent)。它通过 ChatGPT 界面接入,核心能力包括:编写新功能、回答代码库相关问题、修复 Bug、以及生成 Pull Request 供人类审核。

驱动 Codex 的模型是 codex-1 —— 基于 OpenAI o3 针对软件工程场景专门优化的版本。OpenAI 使用强化学习在真实编程任务上训练 codex-1,使其生成的代码更贴近人类风格和 PR 偏好,能严格遵循指令,并且可以反复运行测试直到通过。

Claude CodeCursor 等本地/IDE 内工具不同,Codex 的每个任务都运行在独立的云端沙箱中,预加载你的代码仓库。任务执行期间禁用互联网访问(2025 年 6 月更新后已支持可选联网),智能体只能操作你通过 GitHub 提供的代码和预装依赖。这一设计从架构层面限制了安全风险。

在基准测试方面,codex-1 在 SWE-Bench Verified 上表现强劲,即使没有 AGENTS.md 文件或自定义脚手架也能取得出色成绩。最大上下文长度支持 192k tokens。

如何开始使用

平台入口:在 ChatGPT 侧边栏中找到 Codex 入口。输入任务描述后,点击 "Code" 执行编码任务,或点击 "Ask" 向 Codex 提问关于代码库的问题。

账户要求:Codex 目前对 ChatGPT Pro、Business、Enterprise 和 Plus 用户开放(2025 年 6 月起 Plus 用户可用),Edu 用户支持即将推出。

连接仓库:通过 GitHub 集成将你的代码仓库与 Codex 关联。每个任务都会在预加载了你代码库的独立环境中运行。

环境配置:在产品界面中配置 Codex 的执行环境,使其尽可能接近你的真实开发环境。可以设置预装依赖的安装脚本。

AGENTS.md 配置:这是 Codex 的核心配置机制。类似于 README.md,你可以在仓库中放置 AGENTS.md 文件,告诉 Codex 如何导航代码库、运行哪些测试命令、如何遵守项目规范。AGENTS.md 的作用范围是其所在目录的整个子树,嵌套更深的文件优先级更高。

Codex CLI:如果你更习惯终端工作流,OpenAI 还提供了开源的 Codex CLI,在本地终端中运行。默认模型是 codex-mini(基于 o4-mini 优化的低延迟版本)。现在可以直接用 ChatGPT 账号登录,无需手动配置 API key。Pro 用户可获得 $50 免费 API 额度,Plus 用户 $5。

具体的环境搭建步骤可参考 How to set up Codex?

核心功能详解

并行多任务处理

Codex 最大的差异化优势是异步多任务。你可以同时派发多个任务给不同的 Codex 智能体,每个任务在独立沙箱中运行。这不是"在一个对话里切换上下文",而是真正的并行——你给 5 个任务下达指令后去开会,回来时 5 个结果都在等你审核。

这与 GitHub Copilot 的实时补全和 Cursor 的交互式编辑形成了根本区别。Codex 更像是给你配了几个初级工程师:你分配任务、他们独立完成、你审核结果。

安全隔离执行

每个任务运行在隔离容器中,执行期间默认禁用互联网。智能体只能访问你通过 GitHub 提供的代码和配置的依赖。这种架构确保了:

  • 代码不会被泄露到外部
  • 智能体无法执行未授权的网络操作
  • 恶意代码注入的攻击面被极大缩小

可验证的执行过程

Codex 提供终端日志和测试输出的引用(citations),让你追踪每一步操作。当遇到不确定的情况或测试失败时,Codex 会明确告知问题而不是"猜着来"。所有生成的代码在集成前都应该由人类审核。

代码风格对齐

相比基础 o3 模型,codex-1 在训练时专门优化了人类偏好对齐。它生成的代码补丁更干净、更适合直接审核和合并,而不是那种"能跑但看着别扭"的机器代码。

codex-mini 与 API 访问

OpenAI 同时发布了 codex-mini-latest —— 基于 o4-mini 优化的小型版本,专为低延迟代码问答和编辑设计。可通过 Responses API 使用,也是 Codex CLI 的默认模型。

关于 API 接入的详细说明请参考 How to use the Codex API?

实战工作流

日常任务分流

OpenAI 内部工程师的典型用法是在一天开始时进行任务分流:把重复性、范围明确的工作派给 Codex(重构、重命名、写测试、补文档),自己专注于需要深度思考的核心开发。这减少了上下文切换,让工程师把精力放在最重要的事情上。

Bug 修复与 On-Call

收到 Bug 报告后,先让 Codex 分析问题并提出修复方案,同时处理其他工作。Codex 完成后审核其方案,必要时要求修改,满意后直接发起 PR。

测试覆盖率提升

这是 Codex 的甜点场景。给它一个模块,要求"为所有公开方法写单元测试",它能独立运行测试直到通过。早期用户 Superhuman 就用 Codex 来提升测试覆盖率和修复集成测试。

代码库探索

对于刚接手的不熟悉代码,用 "Ask" 模式让 Codex 解释模块关系、数据流和历史变更。早期用户 Kodiak(自动驾驶公司)就用 Codex 帮助工程师理解不熟悉的技术栈。

Codex 与其他工具的对比可参考:Codex vs Claude CodeCodex vs CursorCodex vs Devin

定价方案

ChatGPT 内使用 Codex:上线初期对 Pro/Business/Enterprise/Plus 用户免费提供generous的使用量。后续会推出有速率限制的基础访问和按需付费的灵活方案。目前不需要额外付费,具体长期定价尚未公布。

Codex CLI / API 定价(codex-mini-latest)

  • 输入:$1.50 / 百万 tokens
  • 输出:$6.00 / 百万 tokens
  • Prompt 缓存折扣:75%

免费额度:通过 ChatGPT 账号登录 Codex CLI 的用户可领取免费 API 额度——Pro 用户 $50,Plus 用户 $5(30 天有效期)。

更多定价细节请参考 How much does Codex cost?Is Codex free?

最佳实践

1. 任务要明确、范围要小。Codex 在处理边界清晰的任务时表现最好。"重构 auth 模块中的错误处理"比"改善代码质量"有效得多。

2. 写好 AGENTS.md。告诉 Codex 你的测试命令、代码规范、项目结构。这相当于给新同事写的入职文档,写得越清楚,输出质量越高。

3. 并行多个任务。不要一个任务完成后再派下一个。把一天的可分配任务一次性派出去,利用 Codex 的并行能力最大化效率。

4. 始终审核代码。Codex 会提供执行日志和测试结果供你追踪,但最终代码的质量责任在你。把它当成需要 Code Review 的 PR,而不是可以直接合并的完成品。

5. 从测试和重构开始。如果你刚开始用 Codex,先从写测试和重构这类低风险任务入手,建立对其能力边界的直觉。

6. 配置好开发环境。Codex 在有完善测试套件和清晰文档的项目中表现最好,就像人类开发者一样。

当前局限

Codex 仍处于 Research Preview 阶段,目前不支持图片输入(前端开发场景受限),也不支持在任务执行中途纠偏。异步模式意味着反馈周期比交互式编辑更长,需要适应。关于语言支持详情可参考 What programming languages does Codex support?,企业级使用请查看 Is Codex available for enterprise teams?

资源汇总

对比评测

常见问题

术语表Codex · OpenAI · Codex CLI · Claude Code · Cursor · GitHub Copilot · Windsurf · Devin · Aider


觉得有用?订阅 LoreAI,每天 5 分钟掌握 AI 动态。