递归时代的权力重构（一）预警、发布与规则：Anthropic的“递归自我改进”悖论

8.0

深览指数

科技36 氪·互联网法律评论·2小时前·AI 生成

递归时代的权力重构（一）预警、发布与规则：Anthropic的“递归自我改进”悖论

文章以Anthropic 2026年6月发布Claude Fable 5/Mythos 5为切入点，揭示了一个关键悖论：该公司一边发布重磅报告《当AI构建自身》，呼吁全球暂停前沿AI开发，警告递归自我改进（RSI）带来的风险；另一边却加速推出能力更强的分层访问模型。作者认为，这种矛盾行为标志着AI从被监管的客体变为定义游戏规则的主体。文章核心贡献在于，跳出对RSI的科幻式恐惧，聚焦于更现实的风险——当AI在执行与优化层面高度自主，人类对目标与价值的控制稍有疏漏，能力差就会演变为致命控制权差。适合关心AI治理、科技权力结构变迁的读者。

核心观点

▍Anthropic的预警与产品发布构成一个深刻悖论：它一边呼吁全行业暂停，一边加速推进并分层发布更强大的模型，揭示了技术进化逻辑正在碾压社会适应逻辑，AI正从被监管客体变为定义游戏规则的主体。
▍递归自我改进（RSI）的真正风险不是科幻的‘天网’或‘奇点’，而是‘目标主权转移’——当人类控制稍有疏漏，AI在‘如何做’上的能力差就会演变为致命的‘控制权差’。

01截至2026年5月，Anthropic合入代码库的代码中，超80%由Claude撰写；而在2025年2月Claude Code发布前，这个数字还是个位数。
02Anthropic员工已大约5个月没自己写过任何代码，人类正从执行者大规模转向审查者与指令者；2026年工程师日均代码贡献量是2024年的8倍。
03在129个研究人员曾‘走弯路’的决策节点上，最新模型在64%的情况下能提出比人类当时更优的选择，显示AI在复杂决策判断力上正快速逼近人类。
04Fable 5因受众广泛，额外增加一层安全防护：当用户对某些主题查询，将由功能更弱的Claude Opus 4.8响应。
05Claude Mythos 5仅向全球约200家经过严格审查的关键基础设施和网络安全机构开放，源于此前仅限于‘玻璃之翼计划’（Project Glasswing）内部使用的Mythos Preview。
06美国AI安全行政命令落地，核心从传闻中的‘90天强制审查’退化为‘30天自愿评估’。

反方 / 局限

— 当Mythos模型被锁在私人联盟内，其加速新药研发、气候模拟等正向潜力受益范围被急剧收窄，社会付出的整体进步代价与安全保障的权衡完全是黑箱。
— Anthropic自身的‘差异化访问’设置（如Fable 5降级到Opus 4.8响应某些查询），暗示了对模型能力泛滥的担忧，与它加速发布的行为形成内在张力，且该机制的有效性未被验证。

AnthropicClaude Fable 5Claude Mythos 5递归自我改进 (RSI)玻璃之翼计划 (Project Glasswing)《当AI构建自身》Claude Code张颖Internet Law Review

9 分钟 · 5 卡片 · 15 资料

读原文 →

递归时代的权力重构（一）预警、发布与规则：Anthropic的“递归自我改进”悖论

概念锚点

前置背景

平行视角

未来推演

延伸追问