6.7
深览指数
商业腾讯新闻··AI 生成

Fable 5 解禁,Anthropic 同步发 Sonnet 5 模型抢人

Anthropic 在 Fable 5 被美国政府解禁前夕,发布了中端模型 Sonnet 5,主打将旗舰模型 Opus 的智能体能力下沉,多项基准测试逼近甚至反超 Opus 4.8,但成本降低约 60%。文章分析了 Sonnet 5 的安全测试结果(网络攻击能力远低于旗舰模型)和技术取舍(新 tokenizer 导致 token 消耗增加)。其核心背景是 Anthropic 正处于筹备 IPO 的关键阶段,此举意在通过产品竞争力与政府合作来支撑其近万亿美元的高估值叙事。适合关注 AI 模型评测、商业竞争与估值逻辑的读者。原文 ↗

核心观点
  • Anthropic 发布 Sonnet 5 的战略意义在于将 Opus 级别的智能体能力下沉到中端价位,以此在 IPO 前夕抢占开发者与政府客户市场,支撑其近万亿美元估值。
  1. 01Sonnet 5 在 SWE-bench Pro 和 Terminal-Bench 2.1 等编码基准测试中大幅缩小了与 Opus 4.8 的差距,在 GDPval-AA v2 知识工作基准测试中甚至以 1618 分反超 Opus 4.8 的 1615 分。
  2. 02Sonnet 5 标准定价为输入每百万 token 3 美元、输出 15 美元,低于 Opus 4.8 的 5 美元和 25 美元,成本降低约 60%。
  3. 03Anthropic 使用了新 tokenizer,导致相同内容输入可能消耗 1.0 到 1.35 倍的 token 数量,优惠期定价旨在让用户过渡时“大致”保持成本中性,但企业客户需自测。
  4. 04Sonnet 5 在网络安全测试中成功率远低于 Opus 4.8 (68.8%) 和 Mythos 5 (88.4%),Sonnet 5 成功率为 0%,部分成功率为 13.2%。Anthropic 默认启用了网络安全防护功能。
  5. 05Anthropic 已于 2026 年 6 月初秘密提交 IPO 招股说明书,并在 5 月完成 650 亿美元 H 轮融资,投后估值 9650 亿美元,年化营收超 470 亿美元。
  6. 06Anthropic 在 Sonnet 5 发布前一天与加州政府达成合作,以 50% 折扣向州机构提供 Claude 服务,意在获取稳定的经常性收入。
反方 / 局限
  • 分析师指出,Anthropic 当前大部分使用量来自试用和实验,能否转化为生产级收入尚不确定,这是所有 AI 实验室共同面临的问题,文中未深入讨论转化率。
  • 新 tokenizer 带来的 token 消耗增加可能导致实际成本高于预期,文中仅以“大致”成本中性一笔带过,对高频用户的潜在影响未充分展开。
10 分钟 · 4 卡片 · 8 资料
读原文 →

前置背景

平行视角

未来推演

延伸追问