6.9
深览指数
科技虎嗅·AppSo··AI 生成

刚刚,GPT-5.6正式发布,史上最强但被自己坑惨了

OpenAI发布了GPT-5.6家族(Sol旗舰、Terra均衡、Luna低成本),在编程、生物和网络安全基准测试中实现能力霸榜。但本次发布以“有限预览”形式进行,原因是美国政府要求审核首批合作伙伴名单,以防止模型能力被滥用于网络攻击。文章揭示了AI竞赛的新阶段:模型能力越强,发布权限越受国家安全框架约束,OpenAI在安全审查与商业开放间陷入两难。适合关注AI产业政策动向、技术安全边界的从业者阅读。原文 ↗

核心观点
  • GPT-5.6的发布标志着前沿AI模型正式被纳入国家安全框架,其“有限预览”并非灰度测试,而是安全验证流程,美国政府直接介入了模型访问权限的审核。
  1. 01GPT-5.6 Sol(旗舰)在Terminal-Bench 2.1上得分88.8%-91.9%,超越Claude Mythos 5(84.3%)和Gemini 3.1 Pro Preview(70.7%)。
  2. 02安全投入巨大:OpenAI在自动化红队测试上投入了超过70万A100等效GPU小时,重点寻找通用越狱(jailbreak)漏洞。
  3. 03OpenAI向美国政府展示了GPT-5.6的能力与发布计划,并按要求首批仅对约20家获政府批准的合作伙伴开放(部分通过亚马逊Bedrock平台)。
  4. 04在网络安全方向,Sol在ExploitBench上的表现接近Mythos Preview,但只使用了约三分之一的输出tokens,不过未能在测试中自主生成可运行的完整攻击链。
  5. 05价格体系:Sol输入5美元/百万tokens,输出30美元;Terra输入2.5美元,输出15美元;Luna输入1美元,输出6美元。
反方 / 局限
  • OpenAI自己承认,基准测试无法覆盖所有现实用法,模型可能被接入其他工具或放进更复杂的攻击链条中,这让“未跨越风险阈值”的判断带有不确定性。
  • OpenAI明确表达了对美国政府介入的疑虑,认为“这不应成为长期默认机制”,但为了争取更广泛的开放又不得不接受当前安排,整体态度模棱两可。
15 分钟 · 3 卡片 · 7 资料
读原文 →

前置背景

平行视角

延伸追问