6.5
深览指数
热点智搜··AI 生成

OpenAI发布GPT-5.6系列模型仅限受限预览

OpenAI于6月27日发布GPT-5.6系列,包含Sol、Terra、Luna三款模型,编程能力超越竞品,但最大变化是发布方式——美国政府介入审查,仅限20家可信合作伙伴预览。文章详述了性能指标、监管背景与OpenAI的保留意见,核心冲突是AI技术理想与现实监管的碰撞。适合关注AI产业政策、技术商业化博弈的读者。原文 ↗

核心观点
  • GPT-5.6系列发布的核心变化不是技术,而是美国政府首次深度介入前沿AI的商业发布流程,仅向20家可信伙伴开放预览,标志着AI监管从行业自律转向政府管控。
  1. 01GPT-5.6系列包含三款模型:Sol(旗舰,复杂推理与科研)、Terra(均衡,成本较前代降50%)、Luna(轻量,高频场景)。
  2. 02旗舰Sol在Terminal-Bench 2.1编程基准测试中,Ultra模式得分91.9%,击败Anthropic的Claude Mythos 5(88.0%)。
  3. 03Sol推出Max(深度推理)和Ultra(多智能体协作)双模式,Ultra可自动拆分任务给多个子Agent并行处理。
  4. 04上下文窗口从100万提升至150万tokens,可一次性处理整个大型代码库。
  5. 05Sol定价为$5/$30每百万tokens(输入/输出),约为竞品Mythos 5的一半。
  6. 06Sol在网络安全能力评级为“高”,低于需全面限制的“关键”级,经过超70万A100等效GPU小时红队测试。
  7. 07OpenAI CEO奥特曼在内部备忘录中表示,政府逐例审批客户的流程‘不应成为长期默认模式’,并警告这会剥夺防御人员与开发者获取最强工具的权利。
反方 / 局限
  • 文章未提及OpenAI的保留意见是否有具体替代方案,也未讨论20家可信合作伙伴的遴选标准是否透明,以及受限预览本身可能加剧技术集中度问题。
3 分钟 · 5 卡片 · 15 资料
读原文 →

前置背景

技术原理

平行视角

未来推演

延伸追问