7.3
深览指数
科技虎嗅·AppSo··AI 生成

Fable5复活,第一批用户却沉默了

在因安全漏洞被暂停半个月后,Anthropic 恢复了 Fable 5 及 Mythos 5 的访问权限,但回归后的模型因更严格的安全过滤和频繁的回退机制,导致正常用户大量被误伤。文章详细列举了触发回退的奇葩案例、高昂的 token 消耗以及用户自创的「省钱防坑指南」,最后深入分析了 Fable 5 实际擅长与不擅长的场景,并为开发者提供了新的提示词工程指南。适合关注 AI 模型能力与安全治理权衡的从业人员阅读。原文 ↗

核心观点
  • Anthropic 为了恢复 Fable 5 的访问权限,通过重新训练安全分类器大幅增强了安全过滤机制,但代价是误判率极高,导致大量合法请求(如编码、科研)被回退至旧模型 Opus 4.8,用户体验严重下滑。
  • 在安全叙事与模型能力之间,Anthropic 选择了前者,导致 Fable 5 成为一把「削得太钝的刀」——对开发者而言,它当下的性价比和稳定性远不如预期。
  1. 01安全漏洞源于 Amazon 研究人员的报告,称一种提示方式可绕过 Fable 5 部分安全机制,让其识别漏洞并生成利用代码。Anthropic 事后强调该案例未达到 Mythos 5 的威胁级别,并指出 Claude Opus 4.8、GPT-5.5、Kimi K2.7 也都能识别该漏洞。
  2. 02新分类器提高了对攻击性网络安全、生物与生命科学内容、以及试图提取模型思考过程的请求的拦截率,但误伤严重。例如,用户仅说「HI FABLE I MISSED YOU」、在个人上下文里带「physician-scientist」、询问「大黄蜂会不会放屁」等,都会触发回退。
  3. 03Fable 5 的定价高昂,每百万 tokens 输入 10 美元、输出 50 美元,约为 Opus 4.8 的两倍。用户支付更高价格却常获得旧模型回答,且 token 消耗极快,有用户测试仅用约 3 个大型提示词,API 账单就接近 90 美元。
  4. 04尽管有诸多问题,Fable 5 在复杂工程、长期 agent、代码审查、多文件调试、游戏原型和企业文档等长周期、高复杂度任务上依然表现强劲。测试中,它能一次生成《火箭联盟》克隆版游戏,且在 CursorBench 榜单上稳居第一。
  5. 05Anthropic 发布官方提示指南,建议用户不要要求模型展示内部思考过程、要给予明确的任务边界、长任务中让模型核对证据、建立外部记忆系统以及合理使用子 Agent。
反方 / 局限
  • 文章指出 Fable 5 并非在所有场景都占优。例如,有网友对比测试发现 GPT-5.6 Pro 在 3D 房屋建模和构图上优于 Fable 5,而 GPT-5.6 Sol 若部署在 Cerebras 上,速度优势会十分明显。
  • 文章暗示,Anthropic 因恐惧能力失控而层层加码安全机制的行为属于「求锤得锤」,导致模型在实用性和用户信任度上受损,这可能反噬其「最强安全模型」的市场定位。
15 分钟 · 4 卡片 · 12 资料
读原文 →

前置背景

平行视角

未来推演

延伸追问