6.4
深览指数
科技微博·极客公园··AI 生成
GPT-5.6,可能要重走「Mythos」的老路
文章报道了美国政府对AI前沿模型发布的最新管控动作:在Anthropic的Fable 5/Mythos 5因商务部出口管制令被强制下线14天后,白宫要求OpenAI分阶段发布GPT-5.6,从“事后追管”升级为“事前审批”。作者判断这是一个新范式——模型能力一旦具备自主发现零日漏洞的网络安全能力,就不再是普通SaaS产品,发布流程将从“谁更快”转向“谁更受信任”。适合关注AI产业政策层变化、竞争格局重构的从业者与投资人阅读。原文 ↗
核心观点
- ▍AI前沿模型的发布正在从纯粹的商业决策,转变为一个需要政府背书的“准许可”流程,新范式的核心逻辑是:模型的能力等级决定了它的发布流程。
- ▍在这种新范式下,竞争优势从“谁更快”悄悄转向了“谁更受信任”,信任而非速度成为新一代的护城河。
- 016月9日,Anthropic发布公众最强模型Fable 5(基于此前仅供合作伙伴的Mythos架构)。三天后,美国商务部要求暂停所有外国国民对Fable 5和Mythos 5的访问,Anthropic被迫对所有人关闭这两个模型,截至6月26日已下线14天。
- 026月25日,白宫网络安全总监办公室和科技政策办公室联合要求OpenAI分阶段发布GPT-5.6,Sam Altman告知团队模型将先以有限预览形式发布给一小批合作伙伴,政府将“逐客户审批”。
- 036月2日,特朗普签署行政令,要求联邦机构在60天内设计一个框架,让前沿AI模型开发者在发布前自愿与政府接触,由NSA局长通过保密基准测试判定哪些模型属于“受管前沿模型”。
- 04Anthropic在4月首次展示Mythos时明确表示该模型“太危险了,不能广泛发布”,因其核心能力是自主发现软件漏洞,甚至据传能在数小时内突破高度防护的系统。Anthropic仅将其提供给约150家经过审查的合作伙伴(Project Glasswing)。
- 05Fable 5因有人找到绕过安全分类器的方法而被关停;知情人士透露政府介入GPT-5.6不是因为突然变强硬,而是因为GPT-5.6具备“Mythos级别”的能力。
- 06Anthropic的Project Glasswing在Fable 5被关停后仍在正常运行,经过严格审查的合作伙伴(Google、NVIDIA、微软)依然可以使用Mythos,说明政府管控对象是分发渠道和使用者,而非模型本身。
反方 / 局限
- — 政府要求的“自愿”框架实际上具有强制效力,正如评论者指出:当政府提出要求,两家实验室都遵从,“自愿框架”就是一个公关措辞更好的强制框架。作者未深入讨论强制管控可能引发的创新受阻或公司外迁风险。
- — Anthropic认为Fable 5的“越狱”很窄、不具普遍性,且其他模型(包括OpenAI的GPT-5.5)也能做到同样的事,但政府仍选择最严厉的应对。作者未充分讨论这对模型安全评估标准的公平性提出的挑战。
7 分钟 · 4 卡片 · 10 资料
读原文 →