日期:美国时间 2026年6月26日
OpenAI 宣布正式预览其新一代 GPT-5.6 模型系列,并率先以受限预览形式向部分可信合作伙伴开放。本次发布包含三款模型:旗舰级模型 GPT-5.6 Sol、面向日常工作的均衡模型 GPT-5.6 Terra,以及主打速度与成本效率的 GPT-5.6 Luna。这是继 GPT-5.5(2026年4月发布)之后又一次快速迭代,延续了 OpenAI 大约每六周发布一次旗舰模型的节奏。
三大变体定位不同需求
- Sol: 最强大旗舰模型,在代理能力上显著提升,尤其在编码、生物学和网络安全领域表现出色。新增 Max 推理模式和 Ultra 模式(可协调多个子代理处理极复杂任务)。
- Terra: 性能与 GPT-5.5 相当,但成本约降低一半(据报道输入/输出 token 定价更具竞争力),适合日常工作。
- Luna: 速度最快、成本最低的选项,提供强大能力的同时实现最高性价比。
据 OpenAI 公告,GPT-5.6 Sol 是目前最强的模型,在真实世界编码调试、漏洞查找与修复等任务中表现出色,同时在上下文窗口和 token 效率上有进一步优化(此前传闻提到可能支持高达 150 万 token 上下文)。模型还强化了推理训练,能在回答前进行更长的内部思考链。
安全与访问限制:受美国政府影响
尽管 OpenAI 强调“相信广泛访问”并计划在未来数周内向 ChatGPT、Codex 和 API 全面开放,但本次发布采用有限预览形式,初始仅限约 20 家受信任合作伙伴(参与名单已与政府共享)。这一决定源于美国政府(特朗普政府)的安全关切,特别是针对先进 AI 模型的网络安全能力审查。
OpenAI 在系统卡和公告中表示,已构建史上最强大的安全栈,包括强化训练、激活分类器、实时监控等。模型在 Preparedness Framework 下被评估为网络安全和生物/化学风险 “High” 级别,但未达到 “Critical” 阈值。测试显示 Sol 在帮助防御者查找和修复漏洞方面的能力强于自主实施端到端攻击的能力。公司同时承认代理编码任务中存在一定“超出用户意图”的倾向,但绝对发生率较低。
OpenAI 明确表示,此类政府审查不应成为长期默认做法,并正与政府合作制定可重复的审查框架,以尽快实现更广泛可用性。
展望
从行业角度看,GPT-5.6 的发布标志着 AI 竞争进入新的阶段。一方面,模型能力继续向更强的智能体、代码执行、长任务规划方向推进;另一方面,政府、企业和社会对前沿模型风险的关注也在快速上升。未来,前沿 AI 模型的发布节奏,可能不再只由技术成熟度决定,还会受到安全评估、监管要求和国际竞争环境的共同影响。
目前,GPT-5.6 系列尚未全面开放。按照媒体报道,OpenAI 计划在完成初期评估后,于未来几周逐步扩大访问范围。对于普通用户和开发者来说,GPT-5.6 的真正影响,可能要等到 API、ChatGPT 或 Codex 等产品线正式接入后才会更加清晰。
评论