Codex:从代码补全到云端智能体指挥中心

Codex:从代码补全到云端智能体指挥中心

AI训练模型 国外

OpenAI Codex是OpenAI推出的AI编程智能体,以云端软件工程代理(cloud-based software engineering agent)为核心形态,能够自主完成从需求理解到代码交付的全流程开发任务。用户通过自然语言描述任务目标后,Codex可在云端沙盒中自主完成代码编写、测试、调试、提交PR等完整开发闭环。产品涵盖Codex CLI(开源终端代理,GitHub超8.2万星,由Rust重写)、Codex Desktop App(macOS/Windows桌面应用)、DeepIDE插件(集成VS Code、Cursor、Windsurf等主流IDE),以及可直接在ChatGPT中调用的Codex能力。底层搭载GPT-5.5及GPT-5系列专为软件工程优化的Codex模型,已在AWS Bedrock正式可用,支持40万token上下文,可并行处理多任务

访问官网
免费增值模式


从2021到2026:同一名字,两种截然不同的产品

2021年8月10日,OpenAI发布了Codex——一个在5400万个公开软件库上微调出的120亿参数模型,能够将自然语言指令翻译成可运行的代码。它是GitHub Copilot的幕后心脏,也是无数开发者“第一次被AI惊艳到”的起点。彼时的Codex本质上是一个“代码生成器”,帮助程序员写出更快的行内补全。

但到2023年3月,这一原始版本的Codex模型被正式弃用,取而代之的是能力更强的通用大模型GPT-3.5与GPT-4,后者在未经专门代码训练的情况下反而展现出超越Codex的代码生成能力。

真正的转折点出现在2025年。

2025年5月16日,OpenAI宣布推出全新版本的Codex——不再是一个模型,而是一个云端软件工程智能体(cloud-based software engineering agent)。Codex进入agentic阶段的新生。

在官方页面的第一行更新记录中,OpenAI写下了这样一句话:“Update on May 16, 2025: We launched Codex, a cloud-based software engineering agent that can work on many tasks in parallel.”

这意味着,新Codex的核心使命从“帮你补全代码”变成了“替你完成整个开发任务”。你只需用自然语言描述目标——比如“修复这个仓库里的所有lint报错”或“实现一个用户登录功能”——Codex会在云端沙盒中自主完成代码编写、单元测试、错误修复,最终输出一个完整的Pull Request。

据OpenAI内部披露,Codex的大部分代码都是由Codex自己编写的。“I think the vast majority of Codex is built by Codex, so it’s almost entirely just being used to improve itself.”——Codex产品负责人Alexander Embiricos这样告诉Ars Technica。

三大产品形态:CLI + 桌面应用 + IDE插件

新Codex已构建起覆盖不同开发场景的产品矩阵:

Codex CLI(开源终端代理)。2025年4月16日,OpenAI率先开源了Codex CLI,发布5小时内即在GitHub上收获超5000颗星,首日突破1万星。当时OpenAI联合创始人兼总裁Greg Brockman表示,Codex CLI只是第一款代码工具,未来还将继续开源Agent产品。到2026年,Codex CLI已将代码从TypeScript完全重写为Rust,GitHub星标突破8.2万,在专门测试终端原生AI编程智能体的Terminal-Bench 2.0基准上拿下77.3%的分数。它与Claude Code、Google的CLI工具形成三足鼎立的竞争态势。

Codex Desktop App(桌面应用指挥中心)。2026年2月,OpenAI正式推出专为macOS设计的桌面应用程序,被官方定位为“Agent Command Center”(智能体指挥中心)。Windows版本也于同年3月上线。这次更新最受瞩目的亮点,是Codex获得了直接操作Mac桌面应用的能力——它拥有独立光标,可以自主查看屏幕、点击界面元素、输入文字,全程无需人工介入。开发者可借此进行应用测试和前端界面迭代,多个智能体还能同时并行运行,彼此独立、互不打扰用户的其他操作。Codex还可以在浏览器中测试web应用,在多标签之间获取上下文,使用web DevTools等,而不需要从用户手中接管浏览器。

DeepIDE插件生态。Codex已被集成至VS Code、Cursor、Windsurf等主流IDE,通过插件形式将自主编程能力嵌入开发者的日常环境中。

ChatGPT与Codex即将全面合体

2026年6月3日,OpenAI在“Intelligence at Work”线上发布会上正式官宣:未来几周内,Codex将被整合进ChatGPT。ChatGPT+Codex这两个累计坐拥近10亿用户的AI产品将彻底合体。

OpenAI产品负责人Alexander Embiricos的原话是:“你可能不会7×24小时工作,但你在云端的Agent会。”

这一整合意味着,Codex将不再是程序员的专属工具,而是每个人都能调用的“AI员工”。无论是桌面、手机还是浏览器,它将无处不在——甚至嵌入Excel、Slack等最熟悉的办公软件中,成为随时待命的全能办公分身。更早之前,Codex已经在ChatGPT移动端App中预览上线,让agentic编程真正变成了一个异步、随时随地可用的工作流。

与此同时,OpenAI同步宣布其所有前沿模型(GPT-5.5、GPT-5.4)和Codex现已支持在AWS Bedrock上直接一键部署,企业用户可以在云上直接调用Codex的完整能力。

Codex的“三大杀器”:Agent插件 + 批注 + Sites

在6月3日的发布会上,OpenAI一口气发布了Codex的三大核心升级:

Agent插件。OpenAI首发6个针对特定企业岗位的“角色专属插件”,覆盖数据分析、创意制作、销售、产品设计、公开市场投资和投资银行六大核心领域。每个插件都打包了相关岗位所需的工具连接、领域知识和操作流程,合计接入62个主流企业应用(Salesforce、Snowflake、Figma、Canva等),包含110项技能。企业无需编程即可让“资深AI员工”直接上岗。今年2月,Codex周活跃用户已突破500万,较年初增长8倍,其中知识工作者增速是开发者的3倍。

批注(Annotations)。用户可以在Codex生成的结果上直接添加批注,“指哪改哪”,即时优化代码输出。这一功能极大降低了代码修改的门槛,尤其适合非技术人员与Agent协作的场景。

Sites。仅需一个URL,Codex即可将任意文档转化为交互式网站或应用预览,并可一键与团队、客户无缝共享。Sites功能今日面向企业和商业团队以预览版上线,后续将逐步向其他订阅用户开放。

技术架构:云端沙箱 + 并行执行 + 深厚模型能力

Codex在AWS Bedrock上正式可用,涵盖GPT-5.5、GPT-5.4等前沿模型及Codex软件工程智能体,采用灵活的按token付费结构。GPT-5.5的强项在于agentic coding、数据分析和多步骤自主任务。

在并行处理能力方面,Codex的云端沙箱架构使其能够同时运行多个独立任务——如果有5个不同的功能任务,Codex可以在5个独立容器中并行处理,而Claude Code则需要通过手动编排子智能体来实现。在token效率上,Codex完成等效任务使用的token数量约为Claude Code的三分之一,在基于API的按量付费模式中具有显著的成本优势。Codex还在SWE-bench上达到约49%的得分,HumanEval准确率为90.2%。

行业竞争:Codex vs Claude Code

当前AI编程智能体市场已形成OpenAI Codex与Anthropic Claude Code的双雄对峙格局。

Codex的优势方向:云端原生架构,沙箱化隔离运行环境,设计初衷就是任务委托和并行处理;在终端自动化任务上表现更优;token效率极高(约3倍于Claude Code),成本控制更强。Codex CLI完全开源,团队可以自由fork和扩展,适合企业定制化需求。

Claude Code的优势方向:在SWE-bench上以72.5%的得分领先Codex约23个百分点,在HumanEval上达到92%;多文件重构和复杂代码库处理能力更强,更像一位全面且注重代码质量的“资深工程师”;拥有更大的上下文窗口(1M tokens),在处理长会话和大规模重构时更具优势。

使用建议:日常开发与并行任务处理推荐默认使用Codex桌面应用或CLI;在需要高质量、低错误率和复杂代码库重构时,Claude Code是更优选择。如果用户已在支付ChatGPT Plus订阅费,则可直接使用Codex——不产生额外成本。

未来的方向:Agentic Everything

Sam Altman在6月3日发布会的现身环节中预测,AI产业的下一个重点将是全天候自主运行的主动式AI,这也是他“首选的未来一年最值得提前布局的方向”。他提到,OpenAI正迈入第三个发展阶段——让所有人都能用得上AI。

从每周服务300万到500万开发者与知识工作者,从支撑OpenAI内部100%代码编写到推动Agentic Code Review系统日审超10万个外部PR,Codex已不仅仅是一个AI编程工具——它是一个有能力接管软件工程全生命周期的智能体生态,正在将“写代码”这件事从“人坐在屏幕前逐行输入”,变成了“人用自然语言委托任务,AI在云端自主完成”。

正如Codex产品团队在播客访谈中所说:“当写软件这件事变得足够简单,我们就会有更多软件。那些只为你和你的团队定制的软件,将不再是奢侈品。”

不论你是想将重复性编码任务委派给AI的独立开发者,正在评估AI编程Agent落地成本的技术负责人,还是希望将Codex接入企业工作流的业务团队,这款由OpenAI打造、每周500万人在用的云端软件工程智能体,都值得你通过ChatGPT Plus订阅或直接访问Codex Desktop App、Codex CLI来亲自体验。

相关标签

OpenAI Codex AI编程智能体 云端软件工程代理 Codex CLI Codex Desktop App Codex 下载 GitHub Copilot vs Codex GPT-5.5 Codex 自主代码生成 AI agent编程 Codex桌面版 并行任务处理 代码重构自动化 自然语言编程 Codex for AWS Bedrock Codex ChatGPT整合 OpenAI编程工具 AI替代程序员 Codex开源 Codex沙箱环境 Codex周活跃500万 Agent插件 Codex批注功能 Codex Sites