openai 昨日(11 月 19 日)发布博文,宣布推出 gpt-5.1-codex-max 智能体编程模型,显著提升了长远推理能力、效率和实时交互能力。此外该模型将取代 gpt-5.1-codex,成为 codex 集成界面上的默认模型。
此次发布紧随谷歌 Gemini 3 Pro 之后,但在多个关键编程基准测试中,Codex-M
ax
展现出更强的实力。例如,在衡量解决实际软件问题的 SWE-Bench Verified 测试中,Codex-Max 以 77.9%
的准确率小幅领先于 Gemini 3 Pro 的 76.2%。
Codex-Max 在 Terminal-Bench 2.0 测试中也领先,准确率达到 58.1%,而 Gemini 的准确率为 54.2%;在 LiveCodeBench Pro(一项竞争激烈的编码 Elo 基准测试)测试中,它的得分与 Gemini 的 2439 分持平。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜
GPT-5.1-Codex-Max 的一项重大架构升级是引入了名为“压缩”(Compaction)的机制。该机制允许模型在接近其上下文窗口限制时,智能地保留关键上下文信息并丢弃无关细节,从而实现跨越数百万 token 的连续工作而不会出现性能下降。
得益于此,该模型在内部测试中已成功完成持续超过 24 小时的复杂任务,如多步骤代码重构和自主调试。同时,这项技术还提升了约 30% 的 token 效率,有效降低了成本与延迟。
新模型目前已集成到 OpenAI 自家的多个 Codex 开发环境中,包括其官方命令行工具(Codex CLI)、内部代码审查工具以及各类交互式编程环境。
开发者可以通过这些工具体验到模型强大的实时交互能力,例如在可视化界面中进行强化学习训练或模拟光学定律。不过,GPT-5.1-Codex-Max 尚未通过公共 API 提供,但官方表示即将开放。普通用户则需要订阅 ChatGPT Plus、Pro 或企业版等付费计划才能使用。
OpenAI 透露,其内部 95% 的工程师每周都会使用 Codex,自采用以来,这些工程师平均多提交了约 70% 的拉取请求(Pull Requests),显著提升了内部开发速度。
尽管 Codex-Max 具备高度的自主性,OpenAI 仍强调它应作为编码“助手”而非人类的替代品。为保证透明度,模型会生成详细的终端日志和测试引用,以便开发者审查和验证其生成的所有代码。此外,模型在默认情况下运行于严格的沙盒环境中,并禁用了网络访问,以确保安全性。
# Token
# 命令行
# 交了
# 于此
# 更强
# 而非
# 中也
# 可以通过
# 但在
# 测试中
# 多个
# 重构
# 编码
# 架构
# gemini
# 开发环境
# gpt-5
# gpt
# openai
# chatgpt
# ai
# 工具
# 谷歌
相关栏目:
【
Google疑问12 】
【
Facebook疑问10 】
【
网络优化91478 】
【
技术知识72672 】
【
云计算0 】
【
GEO优化84317 】
【
优选文章0 】
【
营销推广36048 】
【
网络运营41350 】
【
案例网站102563 】
【
AI智能45237 】
相关推荐:
LeetCode问题解析:移除回文子序列,掌握字符串技巧
2025最佳AI效率工具:释放生产力,革新业务运营
夸克AI能否查快递物流_夸克AI快递查询入口与单号输入【步骤】
AI海报设计终极指南:用ChatGPT和ImageFX轻松创建专业级海报
ChatGPT 处理非结构化数据并转换为 JSON 格式
AI写作鱼怎么一键生成论文大纲_AI写作鱼大纲生成与逻辑梳理【技巧】
动态规划解题:攀登楼梯的独特方法与技巧
在线奇幻名称生成器:打造独一无二的角色名
百度AI搜索如何开启无痕搜索_百度AI搜索无痕模式设置与隐私保护【攻略】
AI动画制作终极指南:让你的图片和人物栩栩如生
百度AI搜索怎样设置搜索偏好_百度AI搜索偏好设置与个性化推荐【技巧】
QuickBooks Desktop 到 Online 迁移指南:轻松转移您的公司数据
今日头条AI怎样推荐抢票工具_今日头条AI抢票工具推荐算法与筛选【技巧】
Wrike:AI赋能的项目管理平台,提升电商效率与团队协作
百度ai助手通知栏怎么关 百度ai助手通知消息屏蔽
AI图片生成教程:轻松打造你的专属文化艺术照
批改网AI检测工具怎样优化检测精度_批改网AI检测工具精度调节与模型选择【实操】
Agentic Testing入门:使用Playwright和Claude Code构建自动化框架
智行ai抢票怎样设置抢票通道_智行ai抢票通道选择与速度优化【指南】
研究学者如何利用现有资源提升学术影响力
豆包AI能否生成领导汇报版总结_豆包AI汇报版精简与结构调整【教程】
智行ai抢票怎么选优先车次_智行ai抢票车次优先级设置技巧【指南】
eBookWriter AI:无需写作也能创作专业电子书
掌握解方程技巧:4.2家庭作业难题精讲与分数系数处理
AI邮件营销风险解析:如何规避客户触达的潜在陷阱
Gemini怎样写细节型提示词_Gemini细节提示词编写【步骤】
百度输入法ai写作怎么关 百度输入法ai帮写禁用
Google AI 在教育领域个性化学习路径的构建
AI一键生成儿童绘本故事
Beats to Rap On AI Stem Splitter:终极音乐创作工具
如何用AI设计一个Logo?5个步骤教你打造专属品牌标志
CallidusAI:提升合同起草效率的智能Word插件指南
Roblox Studio AI 助手:创意构建与无限可能
宗教领袖影响力反思:警惕精神控制与信仰危机
怎么用AI帮你写一份有说服力的加薪申请?
AI赋能音频转录:SovereignAudio自托管解决方案
Napkin AI:无需设计技能,AI一键生成精美图表
免费高效获客!ChatGPT助你快速生成潜在客户名单
AI驱动的潜在客户挖掘:15分钟搭建营销机构并获利
Semrush Summary Generator: 高效总结长篇文章的终极指南
PlotDot Horizon:AI编剧工具颠覆好莱坞?深度评测
Google NotebookLM:科研文献综述的免费AI工具
播客剪辑软件选择指南:新手到专业,总有一款适合你
百度AI助手入口在哪 怎么找到聊天入口
解读诗歌中的女性视角:Shelley Puhak 的作品解析
去哪旅行ai抢票助手怎样提升抢票速度_去哪旅行ai抢票助手加速包与多通道使用【技巧】
AI网站构建指南:Duda平台免费创建教程
Character AI深度解析:功能、用户反馈与替代方案全攻略
斑马AI能否查看孩子学习报告_斑马AI报告查看与数据解读【方法】
颠覆工作方式:2025年必备的9款强大AI工具
2025-11-20
南京市珐之弘网络技术有限公司专注海外推广十年,是谷歌推广.Facebook广告全球合作伙伴,我们精英化的技术团队为企业提供谷歌海外推广+外贸网站建设+网站维护运营+Google SEO优化+社交营销为您提供一站式海外营销服务。