应美国政府要求,OpenAI 限制 GPT-5.6 的发布
OpenAI 宣布对其下一代 GPT-5.6 模型系列进行受限预览,应美国政府的要求,仅向一小部分受信任的合作伙伴开放访问权限。虽然公司正在遵守这一指令,但它也发出了严厉警告,称此类由政府主导的限制不应成为行业标准。
GPT-5.6 系列:Sol、Terra 与 Luna
全新的 GPT-5.6 系列引入了模型能力与成本效率的分层方案。旗舰模型 Sol 专为高推理任务设计,并在编程、生物学和网络安全领域具备先进的智能体(agentic)能力。它引入了两种截然不同的模式:“max”推理强度模式,以及利用协同子智能体来处理复杂问题的“ultra”模式。
为了与 Sol 相辅相成,OpenAI 还推出了 Terra(一款适用于日常应用的平衡型模型)和 Luna(一种高速、低成本的选择)。该系列的定价结构如下:
- Sol: 每百万输入 token 5 美元 / 每百万输出 token 30 美元。
- Terra: 价格为 Sol 的一半。
- Luna: 每百万输入 token 1 美元 / 每百万输出 token 6 美元。
监管摩擦与“事实上的”许可机制
此次受限发布反映了政府干预前沿 AI 发布日益增长的趋势。此前 Anthropic 也曾发生过类似事件,当时政府要求限制外国公民访问 Fable 5 模型,最终导致该模型完全撤出。
前白宫 AI 顾问 Dean Ball 指出,最近的行政命令——要求公司在发布先进模型前 30 天提交审查——已经创造了一种“事实上的强制许可机制”。行业专家警告称,如果缺乏明确定义的安全标准,这些强硬的限制可能会导致无休止的发布延迟,从而可能将 AI 竞赛拱手让给中国,并危及数十亿美元的基础设施投资。
加固的安全机制与架构改进
为了应对安全担忧,OpenAI 已将其安全栈直接集成到核心模型的行为中,而不是使用外部过滤器。这种方法旨在避免在 Anthropic 的 Fable 5 中出现的“降级路由”(downrouting)问题,即高风险提示词被悄悄转向性能较低的旧模型。
GPT-5.6 Sol 经过专门优化,使其更倾向于防御性网络安全而非攻击性漏洞利用,从而增加了越狱的难度。在技术基准测试中,据报道 Sol 在编程工作流中的表现优于 Anthropic 的 Claude Mythos 5,同时仅消耗其三分之一的输出 token,在效率上实现了重大飞跃。
为什么这对 AI 生态系统至关重要
这一进展标志着国家安全利益与 AI 开放式开发之间紧张关系的转折点。虽然 OpenAI 正与政府合作,为未来的发布建立一套“可重复的过程”,但该公司强调,限制访问会阻碍那些最需要这些工具的开发者、企业和网络防御者。这种摩擦的结果可能会在未来几年定义前沿模型在全球范围内的部署方式。
核心要点
- 分层发布: GPT-5.6 套件包括 Sol(旗舰型)、Terra(平衡型)和 Luna(快速/廉价型),其中 Sol 具备全新的“ultra”子智能体模式。
- 监管紧张局势: OpenAI 正在遵守政府要求的受限访问指令,但警告称此类干预可能会扼杀创新和全球竞争力。
- 先进安全技术: 与以往的过滤方法不同,GPT-5.6 将安全护栏直接嵌入模型架构中,以防止越狱和攻击性滥用。
