OpenAI 发布最强编程模型 GPT-5.1-Codex-Max:AI 程序员能“通宵”,性能跑分反超谷歌 Gemini


openai 昨日(11 月 19 日)发布博文,宣布推出 gpt-5.1-codex-max 智能体编程模型,显著提升了长远推理能力、效率和实时交互能力。此外该模型将取代 gpt-5.1-codex,成为 codex 集成界面上的默认模型。

此次发布紧随谷歌 Gemini 3 Pro 之后,但在多个关键编程基准测试中,Codex-Max 展现出更强的实力。例如,在衡量解决实际软件问题的 SWE-Bench Verified 测试中,Codex-Max 以 77.9% 的准确率小幅领先于 Gemini 3 Pro 的 76.2%。

Codex-Max 在 Terminal-Bench 2.0 测试中也领先,准确率达到 58.1%,而 Gemini 的准确率为 54.2%;在 LiveCodeBench Pro(一项竞争激烈的编码 Elo 基准测试)测试中,它的得分与 Gemini 的 2439 分持平。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

GPT-5.1-Codex-Max 的一项重大架构升级是引入了名为“压缩”(Compaction)的机制。该机制允许模型在接近其上下文窗口限制时,智能地保留关键上下文信息并丢弃无关细节,从而实现跨越数百万 token 的连续工作而不会出现性能下降。

得益于此,该模型在内部测试中已成功完成持续超过 24 小时的复杂任务,如多步骤代码重构和自主调试。同时,这项技术还提升了约 30% 的 token 效率,有效降低了成本与延迟。

新模型目前已集成到 OpenAI 自家的多个 Codex 开发环境中,包括其官方命令行工具(Codex CLI)、内部代码审查工具以及各类交互式编程环境。

开发者可以通过这些工具体验到模型强大的实时交互能力,例如在可视化界面中进行强化学习训练或模拟光学定律。不过,GPT-5.1-Codex-Max 尚未通过公共 API 提供,但官方表示即将开放。普通用户则需要订阅 ChatGPT Plus、Pro 或企业版等付费计划才能使用。

OpenAI 透露,其内部 95% 的工程师每周都会使用 Codex,自采用以来,这些工程师平均多提交了约 70% 的拉取请求(Pull Requests),显著提升了内部开发速度。

尽管 Codex-Max 具备高度的自主性,OpenAI 仍强调它应作为编码“助手”而非人类的替代品。为保证透明度,模型会生成详细的终端日志和测试引用,以便开发者审查和验证其生成的所有代码。此外,模型在默认情况下运行于严格的沙盒环境中,并禁用了网络访问,以确保安全性。


# Token  # 命令行  # 交了  # 于此  # 更强  # 而非  # 中也  # 可以通过  # 但在  # 测试中  # 多个  # 重构  # 编码  # 架构  # gemini  # 开发环境  # gpt-5  # gpt  # openai  # chatgpt  # ai  # 工具  # 谷歌 


相关栏目: 【 Google疑问12 】 【 Facebook疑问10 】 【 网络优化91478 】 【 技术知识72672 】 【 云计算0 】 【 GEO优化84317 】 【 优选文章0 】 【 营销推广36048 】 【 网络运营41350 】 【 案例网站102563 】 【 AI智能45237


相关推荐: LeetCode问题解析:移除回文子序列,掌握字符串技巧  2025最佳AI效率工具:释放生产力,革新业务运营  夸克AI能否查快递物流_夸克AI快递查询入口与单号输入【步骤】  AI海报设计终极指南:用ChatGPT和ImageFX轻松创建专业级海报  ChatGPT 处理非结构化数据并转换为 JSON 格式  AI写作鱼怎么一键生成论文大纲_AI写作鱼大纲生成与逻辑梳理【技巧】  动态规划解题:攀登楼梯的独特方法与技巧  在线奇幻名称生成器:打造独一无二的角色名  百度AI搜索如何开启无痕搜索_百度AI搜索无痕模式设置与隐私保护【攻略】  AI动画制作终极指南:让你的图片和人物栩栩如生  百度AI搜索怎样设置搜索偏好_百度AI搜索偏好设置与个性化推荐【技巧】  QuickBooks Desktop 到 Online 迁移指南:轻松转移您的公司数据  今日头条AI怎样推荐抢票工具_今日头条AI抢票工具推荐算法与筛选【技巧】  Wrike:AI赋能的项目管理平台,提升电商效率与团队协作  百度ai助手通知栏怎么关 百度ai助手通知消息屏蔽  AI图片生成教程:轻松打造你的专属文化艺术照  批改网AI检测工具怎样优化检测精度_批改网AI检测工具精度调节与模型选择【实操】  Agentic Testing入门:使用Playwright和Claude Code构建自动化框架  智行ai抢票怎样设置抢票通道_智行ai抢票通道选择与速度优化【指南】  研究学者如何利用现有资源提升学术影响力  豆包AI能否生成领导汇报版总结_豆包AI汇报版精简与结构调整【教程】  智行ai抢票怎么选优先车次_智行ai抢票车次优先级设置技巧【指南】  eBookWriter AI:无需写作也能创作专业电子书  掌握解方程技巧:4.2家庭作业难题精讲与分数系数处理  AI邮件营销风险解析:如何规避客户触达的潜在陷阱  Gemini怎样写细节型提示词_Gemini细节提示词编写【步骤】  百度输入法ai写作怎么关 百度输入法ai帮写禁用  Google AI 在教育领域个性化学习路径的构建  AI一键生成儿童绘本故事  Beats to Rap On AI Stem Splitter:终极音乐创作工具  如何用AI设计一个Logo?5个步骤教你打造专属品牌标志  CallidusAI:提升合同起草效率的智能Word插件指南  Roblox Studio AI 助手:创意构建与无限可能  宗教领袖影响力反思:警惕精神控制与信仰危机  怎么用AI帮你写一份有说服力的加薪申请?  AI赋能音频转录:SovereignAudio自托管解决方案  Napkin AI:无需设计技能,AI一键生成精美图表  免费高效获客!ChatGPT助你快速生成潜在客户名单  AI驱动的潜在客户挖掘:15分钟搭建营销机构并获利  Semrush Summary Generator: 高效总结长篇文章的终极指南  PlotDot Horizon:AI编剧工具颠覆好莱坞?深度评测  Google NotebookLM:科研文献综述的免费AI工具  播客剪辑软件选择指南:新手到专业,总有一款适合你  百度AI助手入口在哪 怎么找到聊天入口  解读诗歌中的女性视角:Shelley Puhak 的作品解析  去哪旅行ai抢票助手怎样提升抢票速度_去哪旅行ai抢票助手加速包与多通道使用【技巧】  AI网站构建指南:Duda平台免费创建教程  Character AI深度解析:功能、用户反馈与替代方案全攻略  斑马AI能否查看孩子学习报告_斑马AI报告查看与数据解读【方法】  颠覆工作方式:2025年必备的9款强大AI工具 

 2025-11-20

了解您产品搜索量及市场趋势,制定营销计划

同行竞争及网站分析保障您的广告效果

点击免费数据支持

提交您的需求,1小时内享受我们的专业解答。

南京市珐之弘网络技术有限公司


南京市珐之弘网络技术有限公司

南京市珐之弘网络技术有限公司专注海外推广十年,是谷歌推广.Facebook广告全球合作伙伴,我们精英化的技术团队为企业提供谷歌海外推广+外贸网站建设+网站维护运营+Google SEO优化+社交营销为您提供一站式海外营销服务。

 87067657

 13565296790

 87067657@qq.com

Notice

We and selected third parties use cookies or similar technologies for technical purposes and, with your consent, for other purposes as specified in the cookie policy.
You can consent to the use of such technologies by closing this notice, by interacting with any link or button outside of this notice or by continuing to browse otherwise.