8.0
深览指数
科技36 氪·互联网法律评论··AI 生成

递归时代的权力重构(一)预警、发布与规则:Anthropic的“递归自我改进”悖论

文章以Anthropic 2026年6月发布Claude Fable 5/Mythos 5为切入点,揭示了一个关键悖论:该公司一边发布重磅报告《当AI构建自身》,呼吁全球暂停前沿AI开发,警告递归自我改进(RSI)带来的风险;另一边却加速推出能力更强的分层访问模型。作者认为,这种矛盾行为标志着AI从被监管的客体变为定义游戏规则的主体。文章核心贡献在于,跳出对RSI的科幻式恐惧,聚焦于更现实的风险——当AI在执行与优化层面高度自主,人类对目标与价值的控制稍有疏漏,能力差就会演变为致命控制权差。适合关心AI治理、科技权力结构变迁的读者。

核心观点
  • Anthropic的预警与产品发布构成一个深刻悖论:它一边呼吁全行业暂停,一边加速推进并分层发布更强大的模型,揭示了技术进化逻辑正在碾压社会适应逻辑,AI正从被监管客体变为定义游戏规则的主体。
  • 递归自我改进(RSI)的真正风险不是科幻的‘天网’或‘奇点’,而是‘目标主权转移’——当人类控制稍有疏漏,AI在‘如何做’上的能力差就会演变为致命的‘控制权差’。
  1. 01截至2026年5月,Anthropic合入代码库的代码中,超80%由Claude撰写;而在2025年2月Claude Code发布前,这个数字还是个位数。
  2. 02Anthropic员工已大约5个月没自己写过任何代码,人类正从执行者大规模转向审查者与指令者;2026年工程师日均代码贡献量是2024年的8倍。
  3. 03在129个研究人员曾‘走弯路’的决策节点上,最新模型在64%的情况下能提出比人类当时更优的选择,显示AI在复杂决策判断力上正快速逼近人类。
  4. 04Fable 5因受众广泛,额外增加一层安全防护:当用户对某些主题查询,将由功能更弱的Claude Opus 4.8响应。
  5. 05Claude Mythos 5仅向全球约200家经过严格审查的关键基础设施和网络安全机构开放,源于此前仅限于‘玻璃之翼计划’(Project Glasswing)内部使用的Mythos Preview。
  6. 06美国AI安全行政命令落地,核心从传闻中的‘90天强制审查’退化为‘30天自愿评估’。
反方 / 局限
  • 当Mythos模型被锁在私人联盟内,其加速新药研发、气候模拟等正向潜力受益范围被急剧收窄,社会付出的整体进步代价与安全保障的权衡完全是黑箱。
  • Anthropic自身的‘差异化访问’设置(如Fable 5降级到Opus 4.8响应某些查询),暗示了对模型能力泛滥的担忧,与它加速发布的行为形成内在张力,且该机制的有效性未被验证。
AnthropicClaude Fable 5Claude Mythos 5递归自我改进 (RSI)玻璃之翼计划 (Project Glasswing)《当AI构建自身》Claude Code张颖Internet Law Review
9 分钟 · 5 卡片 · 15 资料
读原文 →

概念锚点

前置背景

平行视角

未来推演

延伸追问