被叫停的Fable 5，和刹不住车的AI

8.0

深览指数

科技虎嗅·动察Beating©·06-15 14:10·AI 生成

被叫停的Fable 5，和刹不住车的AI

本文以Anthropic模型Fable 5上线三天即被美国政府以国家安全为由叫停为例，剖析了AI行业在加速竞赛与安全治理之间的深层矛盾。作者指出，各参与方（公司、政府、安全研究者、客户）皆在自身职责范围内行事，但责任碎片化导致无人为整体后果负责，形成一种“没人肯自己慢下来”的加速气候。文章通过类比一战前德国无法刹车的军事动员体系，论证了刹车机制（制度、协调）虽在，但缺乏行动共识与信任，最终导致所有“好人都觉得自己不能第一个停下来”。原文 ↗原文 ↗

核心观点

▍AI行业最警惕的加速风险，恰恰是它自己无法刹车的加速本身；Fable 5被叫停并非行业减速的证据，而是证明无人能主动减速的证据。
▍责任碎片化是核心困境：公司（Anthropic）、政府、安全研究者、客户各负责局部，但无人为技术失控的整体后果负责，导致所有人只能继续加速。

01Anthropic的模型Fable 5于6月9日上线，6月12日被美国政府以国家安全为由叫停，给予90分钟反应时间，禁止外国国民使用，包括公司外籍员工。
02Fable 5是未公开的更强模型Mythos的“安全版本”，Amazon向美国政府报告称有人能越狱调用Mythos，引发了政府的干预。
03Anthropic自身倡导政府有权干预危险部署，但当政府对它自家的模型动手时，其自身并未事先得到充分预警或协商。
04IBM X-Force研究者指出Fable的安全护栏过于敏感，会拒掉大量仅沾边安全请求的正常指令，如阅读博客。
05Anthropic与五角大楼就Claude的军事用途存在分歧，公司拒绝大规模国内监控和致命自主武器，导致其与国家安全体系在“安全”定义上无法统一。
06作者将AI加速比喻为一战前德国无法刹车的军事动员体系：刹车并非不存在，而是决策者口称不能改，从而导致了更大灾难。

反方 / 局限

— 作者承认Anthropic并非虚伪，而是在商业生存与安全理想之间务实妥协：它需要与OpenAI、Google竞争，应付融资预期，所以只能“把事情拆成两半”。
— Anthropic提出的“协调减速”方案本身逻辑自洽，但实践中缺乏信任基础：一家公司单方面克制会被市场淘汰，而政府干预方式与公司期望不符。
— 一战动员的历史类比强调“刹车存在”但未被使用，这暗示AI行业也许存在潜在的减速机制（如规模协调、政府干预），但当前缺乏使用它们的政治或商业共识。

AnthropicFable 5MythosOpenAIAmazon美国政府Dario AmodeiProject Glasswinge/acc一战军事动员

13 分钟 · 4 卡片 · 11 资料

读原文 →

被叫停的Fable 5，和刹不住车的AI

前置背景

平行视角

未来推演

延伸追问