Codex：从代码补全到云端智能体指挥中心

AI训练模型国外

OpenAI Codex是OpenAI推出的AI编程智能体，以云端软件工程代理（cloud-based software engineering agent）为核心形态，能够自主完成从需求理解到代码交付的全流程开发任务。用户通过自然语言描述任务目标后，Codex可在云端沙盒中自主完成代码编写、测试、调试、提交PR等完整开发闭环。产品涵盖Codex CLI（开源终端代理，GitHub超8.2万星，由Rust重写）、Codex Desktop App（macOS/Windows桌面应用）、DeepIDE插件（集成VS Code、Cursor、Windsurf等主流IDE），以及可直接在ChatGPT中调用的Codex能力。底层搭载GPT-5.5及GPT-5系列专为软件工程优化的Codex模型，已在AWS Bedrock正式可用，支持40万token上下文，可并行处理多任务

访问官网

免费增值模式

从2021到2026：同一名字，两种截然不同的产品

2021年8月10日，OpenAI发布了Codex——一个在5400万个公开软件库上微调出的120亿参数模型，能够将自然语言指令翻译成可运行的代码。它是GitHub Copilot的幕后心脏，也是无数开发者“第一次被AI惊艳到”的起点。彼时的Codex本质上是一个“代码生成器”，帮助程序员写出更快的行内补全。

但到2023年3月，这一原始版本的Codex模型被正式弃用，取而代之的是能力更强的通用大模型GPT-3.5与GPT-4，后者在未经专门代码训练的情况下反而展现出超越Codex的代码生成能力。

真正的转折点出现在2025年。

2025年5月16日，OpenAI宣布推出全新版本的Codex——不再是一个模型，而是一个云端软件工程智能体（cloud-based software engineering agent）。Codex进入agentic阶段的新生。

在官方页面的第一行更新记录中，OpenAI写下了这样一句话：“Update on May 16, 2025: We launched Codex, a cloud-based software engineering agent that can work on many tasks in parallel.”

这意味着，新Codex的核心使命从“帮你补全代码”变成了“替你完成整个开发任务”。你只需用自然语言描述目标——比如“修复这个仓库里的所有lint报错”或“实现一个用户登录功能”——Codex会在云端沙盒中自主完成代码编写、单元测试、错误修复，最终输出一个完整的Pull Request。

据OpenAI内部披露，Codex的大部分代码都是由Codex自己编写的。“I think the vast majority of Codex is built by Codex, so it’s almost entirely just being used to improve itself.”——Codex产品负责人Alexander Embiricos这样告诉Ars Technica。

三大产品形态：CLI + 桌面应用 + IDE插件

新Codex已构建起覆盖不同开发场景的产品矩阵：

Codex CLI（开源终端代理）。2025年4月16日，OpenAI率先开源了Codex CLI，发布5小时内即在GitHub上收获超5000颗星，首日突破1万星。当时OpenAI联合创始人兼总裁Greg Brockman表示，Codex CLI只是第一款代码工具，未来还将继续开源Agent产品。到2026年，Codex CLI已将代码从TypeScript完全重写为Rust，GitHub星标突破8.2万，在专门测试终端原生AI编程智能体的Terminal-Bench 2.0基准上拿下77.3%的分数。它与Claude Code、Google的CLI工具形成三足鼎立的竞争态势。

Codex Desktop App（桌面应用指挥中心）。2026年2月，OpenAI正式推出专为macOS设计的桌面应用程序，被官方定位为“Agent Command Center”（智能体指挥中心）。Windows版本也于同年3月上线。这次更新最受瞩目的亮点，是Codex获得了直接操作Mac桌面应用的能力——它拥有独立光标，可以自主查看屏幕、点击界面元素、输入文字，全程无需人工介入。开发者可借此进行应用测试和前端界面迭代，多个智能体还能同时并行运行，彼此独立、互不打扰用户的其他操作。Codex还可以在浏览器中测试web应用，在多标签之间获取上下文，使用web DevTools等，而不需要从用户手中接管浏览器。

DeepIDE插件生态。Codex已被集成至VS Code、Cursor、Windsurf等主流IDE，通过插件形式将自主编程能力嵌入开发者的日常环境中。

ChatGPT与Codex即将全面合体

2026年6月3日，OpenAI在“Intelligence at Work”线上发布会上正式官宣：未来几周内，Codex将被整合进ChatGPT。ChatGPT+Codex这两个累计坐拥近10亿用户的AI产品将彻底合体。

OpenAI产品负责人Alexander Embiricos的原话是：“你可能不会7×24小时工作，但你在云端的Agent会。”

这一整合意味着，Codex将不再是程序员的专属工具，而是每个人都能调用的“AI员工”。无论是桌面、手机还是浏览器，它将无处不在——甚至嵌入Excel、Slack等最熟悉的办公软件中，成为随时待命的全能办公分身。更早之前，Codex已经在ChatGPT移动端App中预览上线，让agentic编程真正变成了一个异步、随时随地可用的工作流。

与此同时，OpenAI同步宣布其所有前沿模型（GPT-5.5、GPT-5.4）和Codex现已支持在AWS Bedrock上直接一键部署，企业用户可以在云上直接调用Codex的完整能力。

Codex的“三大杀器”：Agent插件 + 批注 + Sites

在6月3日的发布会上，OpenAI一口气发布了Codex的三大核心升级：

Agent插件。OpenAI首发6个针对特定企业岗位的“角色专属插件”，覆盖数据分析、创意制作、销售、产品设计、公开市场投资和投资银行六大核心领域。每个插件都打包了相关岗位所需的工具连接、领域知识和操作流程，合计接入62个主流企业应用（Salesforce、Snowflake、Figma、Canva等），包含110项技能。企业无需编程即可让“资深AI员工”直接上岗。今年2月，Codex周活跃用户已突破500万，较年初增长8倍，其中知识工作者增速是开发者的3倍。

批注（Annotations）。用户可以在Codex生成的结果上直接添加批注，“指哪改哪”，即时优化代码输出。这一功能极大降低了代码修改的门槛，尤其适合非技术人员与Agent协作的场景。

Sites。仅需一个URL，Codex即可将任意文档转化为交互式网站或应用预览，并可一键与团队、客户无缝共享。Sites功能今日面向企业和商业团队以预览版上线，后续将逐步向其他订阅用户开放。

技术架构：云端沙箱 + 并行执行 + 深厚模型能力

Codex在AWS Bedrock上正式可用，涵盖GPT-5.5、GPT-5.4等前沿模型及Codex软件工程智能体，采用灵活的按token付费结构。GPT-5.5的强项在于agentic coding、数据分析和多步骤自主任务。

在并行处理能力方面，Codex的云端沙箱架构使其能够同时运行多个独立任务——如果有5个不同的功能任务，Codex可以在5个独立容器中并行处理，而Claude Code则需要通过手动编排子智能体来实现。在token效率上，Codex完成等效任务使用的token数量约为Claude Code的三分之一，在基于API的按量付费模式中具有显著的成本优势。Codex还在SWE-bench上达到约49%的得分，HumanEval准确率为90.2%。

行业竞争：Codex vs Claude Code

当前AI编程智能体市场已形成OpenAI Codex与Anthropic Claude Code的双雄对峙格局。

Codex的优势方向：云端原生架构，沙箱化隔离运行环境，设计初衷就是任务委托和并行处理；在终端自动化任务上表现更优；token效率极高（约3倍于Claude Code），成本控制更强。Codex CLI完全开源，团队可以自由fork和扩展，适合企业定制化需求。

Claude Code的优势方向：在SWE-bench上以72.5%的得分领先Codex约23个百分点，在HumanEval上达到92%；多文件重构和复杂代码库处理能力更强，更像一位全面且注重代码质量的“资深工程师”；拥有更大的上下文窗口（1M tokens），在处理长会话和大规模重构时更具优势。

使用建议：日常开发与并行任务处理推荐默认使用Codex桌面应用或CLI；在需要高质量、低错误率和复杂代码库重构时，Claude Code是更优选择。如果用户已在支付ChatGPT Plus订阅费，则可直接使用Codex——不产生额外成本。

未来的方向：Agentic Everything

Sam Altman在6月3日发布会的现身环节中预测，AI产业的下一个重点将是全天候自主运行的主动式AI，这也是他“首选的未来一年最值得提前布局的方向”。他提到，OpenAI正迈入第三个发展阶段——让所有人都能用得上AI。

从每周服务300万到500万开发者与知识工作者，从支撑OpenAI内部100%代码编写到推动Agentic Code Review系统日审超10万个外部PR，Codex已不仅仅是一个AI编程工具——它是一个有能力接管软件工程全生命周期的智能体生态，正在将“写代码”这件事从“人坐在屏幕前逐行输入”，变成了“人用自然语言委托任务，AI在云端自主完成”。

正如Codex产品团队在播客访谈中所说：“当写软件这件事变得足够简单，我们就会有更多软件。那些只为你和你的团队定制的软件，将不再是奢侈品。”

不论你是想将重复性编码任务委派给AI的独立开发者，正在评估AI编程Agent落地成本的技术负责人，还是希望将Codex接入企业工作流的业务团队，这款由OpenAI打造、每周500万人在用的云端软件工程智能体，都值得你通过ChatGPT Plus订阅或直接访问Codex Desktop App、Codex CLI来亲自体验。