Fable5复活，第一批用户却沉默了

7.3

深览指数

科技虎嗅·AppSo·4小时前·AI 生成

Fable5复活，第一批用户却沉默了

在因安全漏洞被暂停半个月后，Anthropic 恢复了 Fable 5 及 Mythos 5 的访问权限，但回归后的模型因更严格的安全过滤和频繁的回退机制，导致正常用户大量被误伤。文章详细列举了触发回退的奇葩案例、高昂的 token 消耗以及用户自创的「省钱防坑指南」，最后深入分析了 Fable 5 实际擅长与不擅长的场景，并为开发者提供了新的提示词工程指南。适合关注 AI 模型能力与安全治理权衡的从业人员阅读。原文 ↗原文 ↗

核心观点

▍Anthropic 为了恢复 Fable 5 的访问权限，通过重新训练安全分类器大幅增强了安全过滤机制，但代价是误判率极高，导致大量合法请求（如编码、科研）被回退至旧模型 Opus 4.8，用户体验严重下滑。
▍在安全叙事与模型能力之间，Anthropic 选择了前者，导致 Fable 5 成为一把「削得太钝的刀」——对开发者而言，它当下的性价比和稳定性远不如预期。

01安全漏洞源于 Amazon 研究人员的报告，称一种提示方式可绕过 Fable 5 部分安全机制，让其识别漏洞并生成利用代码。Anthropic 事后强调该案例未达到 Mythos 5 的威胁级别，并指出 Claude Opus 4.8、GPT-5.5、Kimi K2.7 也都能识别该漏洞。
02新分类器提高了对攻击性网络安全、生物与生命科学内容、以及试图提取模型思考过程的请求的拦截率，但误伤严重。例如，用户仅说「HI FABLE I MISSED YOU」、在个人上下文里带「physician-scientist」、询问「大黄蜂会不会放屁」等，都会触发回退。
03Fable 5 的定价高昂，每百万 tokens 输入 10 美元、输出 50 美元，约为 Opus 4.8 的两倍。用户支付更高价格却常获得旧模型回答，且 token 消耗极快，有用户测试仅用约 3 个大型提示词，API 账单就接近 90 美元。
04尽管有诸多问题，Fable 5 在复杂工程、长期 agent、代码审查、多文件调试、游戏原型和企业文档等长周期、高复杂度任务上依然表现强劲。测试中，它能一次生成《火箭联盟》克隆版游戏，且在 CursorBench 榜单上稳居第一。
05Anthropic 发布官方提示指南，建议用户不要要求模型展示内部思考过程、要给予明确的任务边界、长任务中让模型核对证据、建立外部记忆系统以及合理使用子 Agent。

反方 / 局限

— 文章指出 Fable 5 并非在所有场景都占优。例如，有网友对比测试发现 GPT-5.6 Pro 在 3D 房屋建模和构图上优于 Fable 5，而 GPT-5.6 Sol 若部署在 Cerebras 上，速度优势会十分明显。
— 文章暗示，Anthropic 因恐惧能力失控而层层加码安全机制的行为属于「求锤得锤」，导致模型在实用性和用户信任度上受损，这可能反噬其「最强安全模型」的市场定位。

Anthropic Fable 5 Mythos 5 Claude Opus 4.8 GPT-5.5 Kimi K2.7 Amazon Théo Browne Simon Willison CursorBench

15 分钟 · 4 卡片 · 12 资料

读原文 →

Fable5复活，第一批用户却沉默了

前置背景

平行视角

未来推演

延伸追问