刚刚，GPT-5.6正式发布，史上最强但被自己坑惨了

6.9

深览指数

科技虎嗅·AppSo·7小时前·AI 生成

刚刚，GPT-5.6正式发布，史上最强但被自己坑惨了

OpenAI发布了GPT-5.6家族（Sol旗舰、Terra均衡、Luna低成本），在编程、生物和网络安全基准测试中实现能力霸榜。但本次发布以“有限预览”形式进行，原因是美国政府要求审核首批合作伙伴名单，以防止模型能力被滥用于网络攻击。文章揭示了AI竞赛的新阶段：模型能力越强，发布权限越受国家安全框架约束，OpenAI在安全审查与商业开放间陷入两难。适合关注AI产业政策动向、技术安全边界的从业者阅读。原文 ↗原文 ↗

核心观点

▍GPT-5.6的发布标志着前沿AI模型正式被纳入国家安全框架，其“有限预览”并非灰度测试，而是安全验证流程，美国政府直接介入了模型访问权限的审核。

01GPT-5.6 Sol（旗舰）在Terminal-Bench 2.1上得分88.8%-91.9%，超越Claude Mythos 5（84.3%）和Gemini 3.1 Pro Preview（70.7%）。
02安全投入巨大：OpenAI在自动化红队测试上投入了超过70万A100等效GPU小时，重点寻找通用越狱（jailbreak）漏洞。
03OpenAI向美国政府展示了GPT-5.6的能力与发布计划，并按要求首批仅对约20家获政府批准的合作伙伴开放（部分通过亚马逊Bedrock平台）。
04在网络安全方向，Sol在ExploitBench上的表现接近Mythos Preview，但只使用了约三分之一的输出tokens，不过未能在测试中自主生成可运行的完整攻击链。
05价格体系：Sol输入5美元/百万tokens，输出30美元；Terra输入2.5美元，输出15美元；Luna输入1美元，输出6美元。

反方 / 局限

— OpenAI自己承认，基准测试无法覆盖所有现实用法，模型可能被接入其他工具或放进更复杂的攻击链条中，这让“未跨越风险阈值”的判断带有不确定性。
— OpenAI明确表达了对美国政府介入的疑虑，认为“这不应成为长期默认机制”，但为了争取更广泛的开放又不得不接受当前安排，整体态度模棱两可。

OpenAI GPT-5.6 Sol GPT-5.6 Terra GPT-5.6 Luna Anthropic Claude Mythos 5 美国政府 Terminal-Bench 2.1 ExploitBench 亚马逊Bedrock 红队测试

15 分钟 · 3 卡片 · 7 资料

读原文 →

刚刚，GPT-5.6正式发布，史上最强但被自己坑惨了

前置背景

平行视角

延伸追问