8.0
深览指数
科技虎嗅·动察Beating©··AI 生成

被叫停的Fable 5,和刹不住车的AI

本文以Anthropic模型Fable 5上线三天即被美国政府以国家安全为由叫停为例,剖析了AI行业在加速竞赛与安全治理之间的深层矛盾。作者指出,各参与方(公司、政府、安全研究者、客户)皆在自身职责范围内行事,但责任碎片化导致无人为整体后果负责,形成一种“没人肯自己慢下来”的加速气候。文章通过类比一战前德国无法刹车的军事动员体系,论证了刹车机制(制度、协调)虽在,但缺乏行动共识与信任,最终导致所有“好人都觉得自己不能第一个停下来”。原文 ↗

核心观点
  • AI行业最警惕的加速风险,恰恰是它自己无法刹车的加速本身;Fable 5被叫停并非行业减速的证据,而是证明无人能主动减速的证据。
  • 责任碎片化是核心困境:公司(Anthropic)、政府、安全研究者、客户各负责局部,但无人为技术失控的整体后果负责,导致所有人只能继续加速。
  1. 01Anthropic的模型Fable 5于6月9日上线,6月12日被美国政府以国家安全为由叫停,给予90分钟反应时间,禁止外国国民使用,包括公司外籍员工。
  2. 02Fable 5是未公开的更强模型Mythos的“安全版本”,Amazon向美国政府报告称有人能越狱调用Mythos,引发了政府的干预。
  3. 03Anthropic自身倡导政府有权干预危险部署,但当政府对它自家的模型动手时,其自身并未事先得到充分预警或协商。
  4. 04IBM X-Force研究者指出Fable的安全护栏过于敏感,会拒掉大量仅沾边安全请求的正常指令,如阅读博客。
  5. 05Anthropic与五角大楼就Claude的军事用途存在分歧,公司拒绝大规模国内监控和致命自主武器,导致其与国家安全体系在“安全”定义上无法统一。
  6. 06作者将AI加速比喻为一战前德国无法刹车的军事动员体系:刹车并非不存在,而是决策者口称不能改,从而导致了更大灾难。
反方 / 局限
  • 作者承认Anthropic并非虚伪,而是在商业生存与安全理想之间务实妥协:它需要与OpenAI、Google竞争,应付融资预期,所以只能“把事情拆成两半”。
  • Anthropic提出的“协调减速”方案本身逻辑自洽,但实践中缺乏信任基础:一家公司单方面克制会被市场淘汰,而政府干预方式与公司期望不符。
  • 一战动员的历史类比强调“刹车存在”但未被使用,这暗示AI行业也许存在潜在的减速机制(如规模协调、政府干预),但当前缺乏使用它们的政治或商业共识。
AnthropicFable 5MythosOpenAIAmazon美国政府Dario AmodeiProject Glasswinge/acc一战军事动员
13 分钟 · 4 卡片 · 11 资料
读原文 →

前置背景

平行视角

未来推演

延伸追问