编程革命彻底爆发,OpenAI最强智能体上线ChatGPT
moboyou 2025-08-03 16:00 2 浏览
OpenAI最强AI编程智能体真的来了!Codex震撼上线,由o3优化版codex-1加持,多任务并行,半小时干完数天软件工程任务。
从今天起,AI编程正式开启新时代!
刚刚,Greg Brockman带队与OpenAI六人团队开启线上直播,震撼发布了一款云端AI编程智能体——Codex。
用奥特曼的话来说就是,一个人就能打造无数爆款应用的时代来了!
Codex由新模型codex-1加持,这是o3的一个特调版本,专为软件工程量身打造。
它不仅能在云端沙盒环境中安全地并行处理多项任务,而且通过与GitHub无缝集成,还可以直接调用你的代码库。
它不仅仅是一款工具,更是一位「10x工程师」,能够同时做到:
快速构建功能模块
- 深入解答代码库问题
- 精准修复代码漏洞
- 提交PR
- 自动执行测试验证
过去,这些任务或许耗费开发者数小时乃至数日,如今Codex最多在30分钟内高效完成。
点击ChatGPT侧边栏,输入提示后,直接点击「代码」分配任务,或「提问」咨询代码库相关问题
通过强化学习,Codex基于真实世界的编码任务和多样化环境训练,生成的代码不仅符合人类偏好,还能无缝融入标准工作流。
基准测试显示,codex-1在SWE-bench上拿下72.1%的高分,一举击败了Claude 3.7以及o3-high。
从今天起,Codex将向全球ChatGPT Pro、Enterprise和Team用户正式开放,Plus和Edu用户很快就能上手了。
可以说,AI编程智能体Codex的横空出世,或将重塑软件开发的底层逻辑,彻底点燃了编程革命的火种。
Codex多任务并行,AI编程超级加速器
早在2021年,OpenAI首次发布了CodeX模型,开启了「氛围编程」(vibe coding)的时代。
这种编程方式让开发者与AI协同工作,代码生产变得更加直观、高效。
几周前,OpenAI又推出了CodeX CLI,一款可在本地终端运行的智能体。
但这只是开始!
OpenAI今天推出全新的Codex智能体,再次将软件工程推向一个全新的高度。
接下来,一睹Codex编码的惊艳表现吧。
连接GitHub账户后,OpenAI研究员Thibault Sottiaux选择了一个开源仓库preparedness repo。
然后,他收到了三个任务:
- 第一个是提问:让代码智能体Codex解释代码库,说明整体结构
- 第二个是代码任务:要求在代码库中查找并修复某个地方bug
- 第三个任务是提问:遍历代码库,主动提出自己可以执行的任务建议
接下来演示中,Thibault向Codex下达多个任务,比如拼写和语法纠错、智能任务委派、多仓库适配。
在纠错方面,他故意在指令中加入拼写错误,Codex不仅理解了意图,还主动找出了代码库中的拼写和语法问题并修复,细致到令人惊叹。
当Thibault提出希望代码库「易维护、无bug」的目标时,Codex遍历代码库后,主动发现了可变默认值、不一致的超时设置等问题,并自行生成了修复任务。
这种「自我委派」能力,堪称智能体的巅峰表现。
值得注意的是,Codex智能体运行在OpenAI计算基础设施上,与强化学习共享同一套久经考验的系统。
每个任务都在独立的虚拟沙盒中运行,配备专属的文件系统、CPU、内存、和网络策略,确保了高效安全。
除了preparedness仓库,Codex还无缝处理了CodeX CLI库,展现其在不同项目中的泛化能力。
不论是开源项目,还是内部代码库,Codex都游刃有余。
Codex接收到了用户反馈的bug,因为特殊字符文件名导致了diff命令报错。
在解决过程中,它不仅能复现问题,还可以编写测试脚本、运行linter检查,并生成PR,整个过程仅需几分钟。
Thibault直言,「这原本可能花费我30分钟,甚至几个小时完成」。
此外,OpenAI研究员Katy Shi演示中强调,Codex的PR包含了详细的摘要,清晰说明了修改内容和引用的代码,测试结果一目了然。
一番演示下来,Greg表示,Codex让自己深刻感受到了AGI!
对齐人类偏好,实战4个开源库
OpenAI训练codex-1的一个主要目标,是确保其输出能高度符合人类的编码偏好与标准。
与OpenAI o3相比,codex-1能稳定生成更为简洁的代码修改补丁,可以直接供人工审查并集成到标准工作流程中。
为了体现Codex生成代码的简洁和高效,OpenAI提供了Codex和o3对比的4个开源库实战实例:
astropy
astropy是一个用于天文学的Python开源库。
第一个问题是astropy/astropy的仓库中,Modeling模块中的separability_matrix无法正确计算嵌套CompoundModels的可分离性。
可以看到,在修改前后的代码版本对比中,使用Codex修改生成了十分简洁的代码。
相比之下,o3修改的代码就显得有些冗长了,甚至还将一些「不必要」的注释加入了源代码中。
matplotlib
Matplotlib是一个用于创建静态、动画和交互式可视化的Python综合性库。
这次问题是修复Bug:在mlab._spectral_helper中的窗口校正(windows correction)不正确。
同样可以看到,Codex修改代码的过程更为简洁。
django
Django是基于Python的Web框架,这个问题是修复仅包含duration(时长)的表达式在SQLite和MySQL上无法正常工作。
Codex的修复过程依然优雅,并且相比o3,还首先补上了缺少的依赖调用。
expensify
expensify是一个围绕聊天的财务协作的开源软件。
OpenAI给出的问题是「dd [HOLD for payment 2024-10-14] [$250] LHN - 删除缓存后,成员聊天室名称在LHN中未更新」。
同样可以看到Codex的问题定位和修改更为精准和有效,o3甚至进行了一次无效的代码的修改。
OpenAI团队已经用上了
OpenAI的技术团队已经开始将Codex作为他们日常工具包的一部分。
OpenAI的工程师最常使用Codex来执行重复且范围明确的任务,如重构、重命名和编写测试,这些任务会打断他们的专注。
它同样适用于搭建新功能、连接组件、修复错误和起草文档。
团队正在围绕Codex建立新的习惯:处理值班问题、在一天开始时规划任务,以及执行后台工作以保持进度。
通过减少上下文切换和提醒被遗忘的待办事项,Codex帮助工程师更快地交付并专注于最重要的事情。
在正式发布前,OpenAI与少数外部测试者合作,评估Codex在不同代码库、开发流程与团队环境中的实际表现:
- Cisco作为早期设计合作伙伴,探索Codex在加速工程团队构思落地方面的潜力,并通过评估真实用例向OpenAI提供反馈,助力模型优化。
- Temporal借助Codex实现功能开发、问题调试、测试编写与执行的加速,并用于重构大型代码库。Codex还能在后台处理复杂任务,帮助工程师保持专注与高效迭代。
- Superhuman利用Codex自动处理小型重复任务,如提高测试覆盖率和修复集成故障;还使产品经理能够无需工程介入(除代码审查外)完成轻量级代码更改,提升配对效率。
- Kodiak在Codex支持下加速调试工具开发、测试覆盖和代码重构,推进其自动驾驶系统Kodiak Driver的研发。Codex也作为参考工具,帮助工程师理解陌生代码栈,提供相关上下文与历史更改。
根据目前的使用经验来看,OpenAI建议:可同时向多个代理分配边界清晰的任务,并尝试多种任务类型与提示方式,以更全面地发掘模型能力。
Codex CLI更新
上个月,OpenAI推出了一款轻量级开源工具——Codex CLI,可以让o3和o4-mini等强大模型直接运行在本地终端中,帮助开发者更快完成任务。
这一次,OpenAI同时发布了专为Codex CLI优化的小模型版本——codex-1的o4-mini版本。
它具备低延迟、强指令理解力和代码编辑能力,现已成为Codex CLI的默认模型,同时也可通过API使用(名称为codex-mini-latest),并将持续迭代更新。
此外,Codex CLI的登录方式也简化了,开发者现在可以直接用ChatGPT账户登录,选择API组织,系统将自动生成并配置API密钥。
为了鼓励使用,从今天起30天内,使用ChatGPT账户登录Codex CLI的用户将获得免费额度:Plus用户获得5美元API使用额度;Pro用户获得50美元。
Codex贵不贵
在接下来的几周内,所有用户可以「量大管饱」的试用Codex功能。
随后,OpenAI将引入限流机制和灵活定价,支持按需购买额外使用量。
对于开发者,codex-mini-latest模型已在Responses API上提供,价格为:
- 每百万输入Token:$1.50
- 每百万输出Token:$6.00
- 并享有75%的提示缓存折扣
Codex当前仍处于研究预览阶段,尚不支持图像输入等前端能力,也暂不具备在任务执行中进行实时纠正的能力。
此外,委派任务给Codex智能体的响应时间较长,用户可能需要适应这类异步协作的工作方式。
随着模型能力不断提升,Codex将能处理更复杂、更持久的开发任务,逐步成为更像「远程开发伙伴」的存在。
下一步是什么
OpenAI的目标是开发者专注自己擅长的工作,其余任务交由AI代理处理,从而提升效率与生产力。
Codex将支持实时协作与异步任务委托,两种工作模式将逐步融合。
Codex CLI等工具已经成为开发者加速编码的标配,而由ChatGPT中的Codex引领的异步、多智能体协作流程,有望成为工程师高效产出高质量代码的新范式。
未来,开发者将能在IDE和日常工具中与AI协同工作——提问、获取建议、委派复杂任务,所有操作整合在一个统一的工作流程中。
OpenAI计划进一步提升交互性和灵活性:
- 支持任务中途提供指导
- 与AI协作实施策略
- 接收主动进度更新
- 与常用工具(如GitHub、CLI、问题跟踪器、CI系统)深度集成,便捷分配任务
软件工程正成为首批因AI而大幅提效的行业之一,将全面释放个人与小团队的巨大潜力。
与此同时,OpenAI也正与合作伙伴共同研究智能体的广泛应用将如何影响开发流程、技能发展和全球人才分布。
参考资料
https://www.youtube.com/watch?v=hhdpnbfH6NU
https://openai.com/index/introducing-codex/
本文来自微信公众号“新智元”,作者:YXH,36氪经授权发布。
相关推荐
- linux下C++ socket网络编程——即时通信系统(含源码)
-
一:项目内容本项目使用C++实现一个具备服务器端和客户端即时通信且具有私聊功能的聊天室。目的是学习C++网络开发的基本概念,同时也可以熟悉下Linux下的C++程序编译和简单MakeFile编写二:需...
- Workerman的使用(workerman教程)
-
Workerman是什么?Workerman是一款纯PHP开发的开源高性能的PHPsocket服务框架。Workerman不是重复造轮子,它不是一个MVC框架,而是一个更底层更通用的socket服...
- 百万人在线的直播间实时聊天消息分发技术实践
-
本文由融云技术团队原创分享,原题“聊天室海量消息分发之消息丢弃策略”,内容有修订。1、引言随着直播类应用的普及,尤其直播带货概念的风靡,大用户量的直播间场景已然常态化。大用户量直播间中的实时互动是非常...
- 省钱兄JAVA 直播源码开发(省钱快报源码)
-
在现代社会,直播已经成为一种流行的社交和商业形式。越来越多的人通过直播平台展示自己的才艺、分享生活、进行教学,甚至进行产品销售。随着直播行业的发展,许多人希望能够参与到这一领域中,尤其是开发自己的直播...
- 编程革命彻底爆发,OpenAI最强智能体上线ChatGPT
-
OpenAI最强AI编程智能体真的来了!Codex震撼上线,由o3优化版codex-1加持,多任务并行,半小时干完数天软件工程任务。从今天起,AI编程正式开启新时代!刚刚,GregBrockman...
- Springboot下的WebSocket开发(springboot websock)
-
今天遇到一个需求,需要对接第三方扫码跳转。一种方案是前端页面轮询后端服务,但是这种空轮询会虚耗资源,实时性比较差而且也不优雅。所以决定使用另一种方案,websocket。以前就知道websocket,...
- epoll聊天室的实现(epoll使用详解(精髓))
-
1.服务端a.支持多个用户接入,实现聊天室的基本功能b.使用epoll机制实现并发,增加效率2.客户端a.支持用户输入聊天消息b.显示其他用户输入的信息c.使用fork创建两个进程子进程有...
- 自建娱乐聊天室—一起听歌吧!属于自己的交友聊天房
-
前言该项目算是老项目了,但最近粉丝群里的友友都让我写一下,那就写一下吧。项目类似于现在各大直播平台的聊天室,但又不像。它更加的自由开放,没有平台的礼物以及各种限制,如果你有来自五湖四海的朋友,想一起聊...
- 定时任务框架选型Quartz/Xxl-Job(定时任务调度框架)
-
以前公司平台中集成了定时任务功能,但平台内部实现比较简单,使用方式有些受限,比如说无法跟踪定时任务执行状态,无法自动解决集群状态下的任务争抢问题,因此考虑升级一下任务实现方式,搜集一番后,Quartz...
- 【推荐】一款开源免费的 ChatGPT 聊天管理系统,支持PC、H5等多端
-
如果您对源码&技术感兴趣,请点赞+收藏+转发+关注,大家的支持是我分享最大的动力!!!项目介绍GPTCMS是一款开源且免费(基于GPL-3.0协议开源)的ChatGPT聊天管理系统,它基于先进的GPT...
- 现在页面实时聊天都使用Websocket技术实现吗?
-
是的,现在实现页面实时聊天主要使用Websocket,在此之前,还有其它的一些技术,比如:AJAX轮询、FlashXMLSocket等。其中Ajax轮询就是定时向服务器发起请求,例如1秒钟请求一...
- 一对一源码开发,九大方面完善基础架构
-
以往的直播大多数都是一对多进行直播社交,弊端在于不能满足到每个用户的需求,会降低软件的体验感。伴随着用户需求量的增加,一对一直播源码开始出现。一个完整的一对一直播流程即主播发起直播→观看进入房间观看→...
- 揭秘PHP8.4的新特性,帮助您提高开发效率
-
PHP8.4作为一次重大版本更新,引入了多项提升开发效率和代码性能的新特性,以下是核心功能的总结:一、属性钩子(PropertyHooks)-功能描述:允许通过语法直接为类的属性定义get...
- 【验证码逆向专栏】某验三代、四代一键通过模式逆向分析
-
声明本文章中所有内容仅供学习交流,抓包内容、敏感网址、数据接口均已做脱敏处理,严禁用于商业用途和非法用途,否则由此产生的一切后果均与作者无关,若有侵权,请联系我立即删除!本文章未经许可禁止转载,禁止任...
- 如何申请SourceForge免费PHP空间(国内免费php空间申请)
-
SF.net,即Sourceforge.net,是国外一个开源软件分享及管理平台,也是全球最大开源软件开发平台和仓库。Sourceforge.net为广大的开发者提供了软件发布平台,同时又提供了个人免...
- 一周热门
- 最近发表
-
- linux下C++ socket网络编程——即时通信系统(含源码)
- Workerman的使用(workerman教程)
- 百万人在线的直播间实时聊天消息分发技术实践
- 省钱兄JAVA 直播源码开发(省钱快报源码)
- 编程革命彻底爆发,OpenAI最强智能体上线ChatGPT
- Springboot下的WebSocket开发(springboot websock)
- epoll聊天室的实现(epoll使用详解(精髓))
- 自建娱乐聊天室—一起听歌吧!属于自己的交友聊天房
- 定时任务框架选型Quartz/Xxl-Job(定时任务调度框架)
- 【推荐】一款开源免费的 ChatGPT 聊天管理系统,支持PC、H5等多端
- 标签列表
-
- 外键约束 oracle (36)
- oracle的row number (32)
- 唯一索引 oracle (34)
- oracle in 表变量 (28)
- oracle导出dmp导出 (28)
- oracle两个表 (20)
- oracle 数据库 字符集 (20)
- matlab化简多项式 (20)
- 多线程的创建方式 (29)
- 多线程 python (30)
- java多线程并发处理 (32)
- 宏程序代码一览表 (35)
- c++需要学多久 (25)
- css class选择器用法 (25)
- css样式引入 (30)
- css教程文字移动 (33)
- php简单源码 (36)
- php个人中心源码 (25)
- php小说爬取源码 (23)
- 云电脑app源码 (22)
- html画折线图 (24)
- docker好玩的应用 (28)
- linux有没有pe工具 (34)
- mysql数据库源码 (21)
- php开源万能表单系统源码 (21)