7.7
深览指数
科技微博·量子位··AI 生成
A社你解释下,啥叫Sonnet 5比Fable 5还贵?
Anthropic 推出 Sonnet 5,官方宣称性能接近旗舰 Opus 4.8 但价格仅为其六成,是“Opus 平替”。但开发者发现,Sonnet 5 换用了新分词器,同一段英文文本的 Token 消耗量比上一代 Sonnet 4.6 高出 30-40%,导致实际使用成本不仅没降,甚至比 Opus 4.8 还贵。文章揭示了 AI 模型定价中的“明降暗涨”陷阱,对希望控制成本的开发者有直接警示意义。原文 ↗
核心观点
- ▍Anthropic Sonnet 5 表面维持标价不变且性能提升,但通过更换分词器增加了实际 Token 消耗量,导致开发者使用成本明降暗涨。
- ▍Sonnet 5 在部分场景下的实际花费甚至超过旗舰模型 Opus 4.8,其“Opus 平替”定位名不副实。
- 01Sonnet 5 在 SWE-bench Pro 上得分为 63.2%,高于 Sonnet 4.6 的 58.1%,低于 Opus 4.8 的 69.2%。
- 02开发者 Simon Willison 的实测发现,同一段英文文档,Sonnet 5 消耗 Token 数比 Sonnet 4.6 多 42%(从 2356 涨至 3341),西班牙语增 33%,Python 代码增 27%,简体中文文本几乎不变。
- 03Anthropic 官方标价 Sonnet 5 为每百万输入/出 Token 3/15 美元,Opus 4.8 为 5/25 美元。
- 04有开发者发现,在 Artificial Analysis Intelligent Index 的基准任务中,Sonnet 5 平均花费 2.29 美元,而 Opus 4.8 仅需 1.8 美元,高出 27%。
- 05Sonnet 5 消耗的 Token 数最高可达 Opus 4.8 的两倍,跑完整个 Benchmark 的总花费甚至比 Opus 4.8 多 6.8%。
- 06有开发者对比发现,智谱 GLM-5.2 性能与 Sonnet 5 接近,但输入价格仅为七成,输出价格不到一半。
- 07Sonnet 5 在 OSWorld-Verified 计算机使用测试中得分为 81.2%,Opus 4.8 为 83.4%,差距缩小。
- 08Sonnet 5 在 GDPval-AA v2 知识工作测试中得分为 1618,略高于 Opus 4.8 的 1615。
反方 / 局限
- — 涨价本身在行业内并不罕见,OpenAI 的 GPT-5.5 采用明码标价翻倍的方式,而 Anthropic 选择通过技术细节隐藏涨价,对开发者的不透明性更值得警惕。
6 分钟 · 5 卡片 · 15 资料
读原文 →