当前位置: 首页 » 资讯 » 新科技 » 正文

OpenAI Codex桌面版深夜突袭!一人指挥Agent军团,程序员彻底告别996

IP属地 中国·北京 新智元 时间:2026-02-03 10:21:33


新智元报道

编辑:桃子 好困

太带劲了!抢先Claude 5,OpenAI深夜祭出了一个编码杀器——Codex。它可以让一人指挥多Agent并行协作,自带Skills,编码从此进入自动化时代。

Claude 5的脚步声越来越近,奥特曼终于坐不住了。

就在刚刚,OpenAI毫无预警地抛出「王炸」——Codex正式进化为独立的桌面App



这不仅仅是一个写代码的窗口,更是一个能同时指挥千军万马(多个Agent)的「全能指挥部」


Codex定位非常明确:要做Agent的「指挥中心」

具体来说,Codex可以做到以下几点:

多任务并行切换,毫不费力:同时调用多个AI智能体开展工作,并通过「工作树」(worktrees)实现变更隔离,互不干扰;

创建并调用Skills:将工具和开发规范封装成可复用的能力;

设置自动化流程:通过后台定时工作流,把那些重复性的琐事统统交给Codex处理。

假设想要为相册里的照片添加「拖拽」功能,选择「工作树」,即可让AI在同一仓库中各司其职。


Codex的进化令人毛骨悚然,它不仅生成代码,还学会了利用代码作为「Skills」来操控电脑

比如想要解决项目中的Comment,直接调用安装好的Skills,Codex立刻就把问题破解了。


不仅如此,OpenAI仅凭一句话,就让Codex消耗700万 token,徒手搓出一个3D版赛车游戏


这一次,Codex的诞生,并非是新瓶装旧酒,更不是一次毫无诚意的「套壳」包装。

它标志着AI编程正式从「对话助手」进化为「指挥中心」。

奥特曼激动表示,「真是爱了爱了,它比我想象中还要惊喜」!


「AI程序员就是不会耗尽多巴胺。他们不会感到沮丧,也不会耗尽能量。它们会一直坚持下去,直到解决问题」。


OpenAI总裁Greg墙裂推荐——

我多年来一直是终端和Emacs的铁粉,但自从用了Codex之后,再回到终端简直感觉像穿越回了过去,代差太明显了。

这种感觉,就像是一个专门为开发而生的AI智能体原生界面。


OpenAI Codex代表着一种全新的AI Coding范式,极有可能重塑开发者与代码交互的逻辑。

甚至,Codex还可与Claude Cowork狂飙能力,把杂乱桌面瞬间清理干净。


目前,Codex正式在macOS上线,Windows版即将推出。

OpenAI还放出了「限时福利」,ChatGPT免费用户和Go版本也可用上Codex,Plus、Pro、Business、Enterprise和Edu计划的用户,速率直接翻倍

编码杀器Codex APP震撼登场

一人指挥所有Agent

macOS版Codex应用,是一个功能强大的新界面。

它能让开发者能轻松驾驭多个AI智能体,并行处理任务,并与AI协作搞定那些耗时的大活儿。

过去一直以来,开发者和AI的关系是「结对编程」,你写一段,它接一段。


如今,Codex的出世将彻底改变软件构建的方式——

人类不再与AI紧密结对,直接给AI委派任务,贯穿于软件设计、构建、发布和维护的全生命周期。

这一转变的苗头,实际上从2025年4月发布Codex以来,便已初见端倪。

开发者与AI的协作方式已发生了根本性转变。

现有模型可以端到端地处理复杂的、长流程的任务,开发者也开始在跨项目中指挥多个AI智能体

分派工作、并行跑任务,并放心地把耗时数小时、数天甚至数周的重大项目交给 AI 。

核心挑战已不再是AI能做什么,而是人们如何大规模地指挥、监督并与它们协作——

遗憾的是,现有的IDE和终端工具并非为此而生。

这种全新的构建方式,加上模型能力的提升,呼唤着一种全新的交互载体。

这正是OpenAI要推出Codex桌面应用的原因,主打「一个AI智能体的指挥中心」。

多智能体并行,狂飙代码不乱套

Codex为与AI智能体多任务并行,构建了一个专注的空间。

所有AI在按项目组织的独立线程中运行,确保你无缝地在任务间切换,而不会丢失上下文。

你可以在应用里直接检查AI的改动,在diff上写评论,甚至用编辑器打开进行手动调整。

它还内置了对Git worktree的支持,所以多个AI可以在同一个仓库(repo)上开工而互不冲突。

每个AI都在你代码的隔离副本上工作,让你能探索不同的开发路径,而无需操心它们会如何影响你的主代码库。


AI智能体干活时,可以把改动拉(checkout)到本地,或者让它继续推进,完全不动本地的git状态。

应用会自动从Codex CLI和IDE扩展中同步会话历史和配置,这样你马上就能在现有项目中用起来。

解锁Skills外挂,手搓3D赛车游戏

Codex正从一个只会写代码的AI,进化为一个能用代码在电脑上真正解决问题的AI

通过Skills(技能),可以轻松扩展Codex的能力。

今后,Codex不再局限于代码生成,还能处理信息收集与整合、问题解决、写作等任务。

Skills就像是打包好的指令、资源和脚本,让Codex能可靠地连接工具、运行工作流,并按照团队的习惯完成任务。

Codex应用里有一个专门的界面来创建和管理Skills。

你可以明确要求Codex使用某个Skill,或者让它根据手头的任务自动调用。

OpenAI举了一个例子,曾让Codex做一个赛车游戏——

要有不同的车手、八张地图,甚至还有玩家能用空格键触发的道具。

利用图像生成 Skill(由GPT Image驱动)和网页游戏开发Skill,Codex仅凭最初的一个用户提示词,就独立工作并消耗了超过700万个Token,把游戏做了出来。

它身兼数职,既是设计师、游戏开发者,又是QA测试员,通过实际试玩来验证成果。

6万Token

可以看到,在只消耗了6万token的这个版本里,画面非常粗糙。

很窄的赛道中间,塞满了撞上去会穿模的「障碍物」。

技能箱可以吃,也可以发射,但好像没有什么效果。

最尴尬的是,你会永远在「第二圈」无限循环下去……

80万Token

在80万token的版本里,画面似乎好了一些,赛道也宽敞了不少,更接近大家平时玩的赛车游戏了。

但是箱子吃到的技能好像没什么用,发射出去之后,小车们还是各跑各的……

而且依旧会在第二圈陷入循环,永远跑不完。

700万Token

最后这个700万token的版本,画质明显好了很多。不仅有清晰的赛道,技能箱也更精致了。

这次,技能箱确实有用了。

比赛刚开始,我们就吃了AI扔出的一个大招,没有闪。于是,喜提倒数第一,

不过,比起前两个陷入无限循环的世界来说,这次至少能完赛了。

从跑评测和盯着模型训练,到起草文档和汇报增长实验,OpenAI内部构建了数百个Skills,来帮助多个团队自信地把以前很难统一定义的工作委派给Codex。

Codex应用内置了一个Skills库,涵盖了OpenAI内部流行的工具和工作流,下面重点介绍几个。

实现设计:从Figma拉取设计上下文、资源和截图,并将其转化为视觉上1:1还原的生产级UI代码。

管理项目:在Linear中处理Bug分类、追踪发布、管理团队工作负载等,推动项目进展。

部署到云端:让Codex把你做好的Web应用部署到流行的云主机,如Cloudflare、Netlify、Render和Vercel。

生成图像:使用由GPT Image驱动的图像生成Skill来创建和编辑图像,用于网站、UI原型、产品配图和游戏素材。

使用OpenAIAPI构建:在使用OpenAI API开发时,参考最新的文档。

创建文档:一套用于阅读、创建和编辑PDF、电子表格和文件的Skills,排版布局专业。


使用Vercel和图像生成Skills更新网站


使用电子表格Skill创建表格以生成购物清单


使用Linear管理你的Issue Backlog

当你在应用中创建一个新Skill时,Codex可以在你工作的任何地方使用它:应用内、CLI或IDE扩展中。

你也可以把Skills提交到代码仓库,让整个团队都能用上。


OpenAI分享的Agent Skills:https://github.com/openai/skills

一键自动化,24h为你打工

Codex可以设置Automations(自动化),按计划在后台自动干活。

Automations将指令与可选的Skills结合,会按照你设定的时间表运行。

当Automation完成时,结果会进入审查队列,可以随时切回来查看并根据需要继续后续工作。


设置自动化以定期创建新Skills

在OpenAI,团队一直用Automations来处理那些重复但重要的任务,比如每日Issue分类、查找和总结CI失败原因、生成每日发布简报、检查Bug等等。

双人格模式,秒切换

开发者在与AI合作时口味各不相同。

有人喜欢直截了当、只讲执行的搭档;有人则喜欢话多一点、更有互动感的风格。

Codex现在允许开发者在两种个性间选择——一种是简洁务实风,另一种是更具对话感和同理心的风格。

两者的能力完全一样,只为贴合你的喜好。只需在应用、CLI和IDE扩展中输入/personality命令即可切换。


默认安全,按需配置

此外,OpenAI还将「设计即安全」(Security by Design)的理念融入了CodexAI智能体栈的方方面面。

Codex 应用采用了原生的、开源且可配置的系统级沙箱(Sandboxing),这就跟在Codex CLI里一样。

默认情况下,CodexAI智能体只能编辑它当前工作的文件夹或分支里的文件,并使用缓存的网页搜索。

如果需要运行像联网访问这类需要更高权限的命令,它会先请求你的许可。

你可以为项目或团队配置规则,允许特定命令自动以提升的权限运行。

一切皆由代码控制

如今,企业和开发者正越来越依赖Codex进行端到端开发。

自12月中旬发布GPT-5.2-Codex以来,Codex的总使用量翻了一番,过去一个月里有超过100万开发者使用Codex。

下一步,团队继续扩展Codex使用场景,包括上线Windows版应用、不断突破模型能力边界,以及实现更快的推理速度。


OpenAI科学家感慨,过去几周写的代码比过去几年还要多。而且,还用Codex修复了Prism多个bug和功能更新

在应用内部,OpenAI还将根据实际反馈持续打磨多AI智能体工作流,让管理并行任务和在AI间切换变得更容易,且不丢失上下文。

他们还在为Automations开发基于云端的触发器支持,这样Codex就能在后台持续运行——而不仅仅是在你电脑开着的时候。

Codex建立在一个简单的前提之上:一切皆由代码控制。

一个AI智能体在推理和生成代码方面越强,它在各类技术和知识工作中的能力就越强。


OpenAI全家桶

然而,当今的一个关键挑战在于,前沿模型的能力与人们在实际中轻松使用它们之间存在差距。

Codex旨在缩小这一差距,让人们更容易指挥、监督并将OpenAI模型的全部智慧应用到实际工作中。

OpenAI致力于将Codex打造成最强的编程AI智能体,这也为它成为能处理代码之外广泛知识工作的全能AI奠定了基础。

附录

在制作上面这款赛车游戏时,Codex使用的初始提示词如下(总结精炼版):

使用Three.js实现Voxel Velocity作为一个3D体素卡丁车赛车游戏,只有一种模式:单人比赛(总是3圈,1个人类对7个CPU,所有8条赛道立即在这个模式下可用,没有进度限制)。构建一个最小的赛前流程,仅包括:赛道(8),角色(8),难度(轻松/标准/刻薄),可选的镜像模式,可选的允许克隆,和开始比赛,加上一个选项菜单和一个赛中暂停菜单(恢复/重新开始/退出)。创建一个街机驾驶模型,具有灵敏的操控,宽容的擦墙碰撞,有意义的漂移作为主要技能,以及一个漂移充电系统,产生精确的加速等级(1级0.7秒,2级1.1秒,3级1.5秒),同时保持基准速度「快但可读」,并且在宽阔的道路上保持持续的超车。实现正好8个道具,单道具容量,微妙的位置加权分布,和温和的效果(最大失控≤1.2秒,最大转向禁用≤0.6秒),创造滑稽的混乱而没有硬眩晕,加上在加速期间减少50%的越野减速。定义8个角色及其给定的统计数据和AI倾向,实现CPU难度预设和赛道编写的赛车/变化样条线,漂移区和危险回避,以便AI使用多车道宽度进行干净的超车,并发布HUD/音频要素(位置,圈数/最后一圈横幅,小地图,道具槽,计时器/分段,可读的音效,和每个赛道一个音乐循环)。

随后,Codex不断地被从10个通用提示词的随机列表中重新提示,以继续处理这个问题。

其中一个提示词的例子是:

你的工作是添加新功能,使游戏更接近原作。首先,玩游戏并确定与原作相比缺少了什么。然后挑选几个缺失的功能并实现它们。在每个功能之后,彻底测试它,通过玩游戏并确认它工作正常。如果你在玩的时候注意到任何错误,也要优先修复它们。

参考资料:

https://x.com/sama/status/2018414858015039504?s=20

https://x.com/OpenAI/status/2018385565289267236?s=20

https://openai.com/index/introducing-the-codex-app/


免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新