科技Bestblogs··AI 生成
BestBlogs.dev 第 99 期:Fable 与 Mythos
本期周报聚焦 Anthropic 最新模型 Claude Fable 5 及其更强但限制发布的 Mythos 5。Fable 5 以低于一半的价格在几乎所有基准测试中刷新 SOTA,并在 Stripe 的 5000 万行 Ruby 代码迁移任务中表现出惊人的生产力。作者认为,当最强模型变得更便宜,而更强模型却需要信任授权才能访问时,AI 能力的分发模式正在发生实时变化。本期还整理了 10 篇深度文章,涵盖推理速度竞争、AI 编码代理演进、企业级代理部署经验等。适合想快速掌握本周 AI 领域关键动态与趋势分析的深度读者。原文 ↗原文 ↗
核心观点
- ▍Anthropic 的 Claude Fable 5 和 Mythos 5 发布,标志着 AI 能力分发模式正在发生实时变化:最强大的模型变得更便宜,而更顶尖的模型则被限制在信任授权访问的围墙内。
- 01Fable 5 在几乎所有基准测试中达到了 SOTA,定价却不到 Mythos Preview 的一半。
- 02Fable 5 在 Stripe 的真实部署中,单日内完成了 5000 万行 Ruby 代码的全仓库迁移,该工作量在过去需要一个完整团队超过两个月的时间。
- 03Anthropic CEO 发表政策文章,提出 FAA 式强制性第三方测试、工资保险和生物医药监管改革等五部分议程,警告有效行动窗口正在关闭。
- 04推理速度成为新战场:Google 的 DiffusionGemma 在单个 H100 上达到每秒 1000 tokens;小米的 MiMo 和 TileRT 通过模型-系统协同设计,在标准 8-GPU 集群上推动 1T 参数模型超越每秒 1000 token。
- 05Salesforce 从 20000 次企业代理部署中总结出反直觉教训:90% 的工作在启动之后。
- 06Google DeepMind 的 Logan Kilpatrick 认为模型将吞噬代理框架,外部工具将迁移到原生模型系统中。
- 07Anker 创始人杨孟用 4 小时回顾了 15 年公司历史,阐述了从浅水品类向深水系统的战略转变。
反方 / 局限
- — 作者仅通过周报形式聚合信息,未对任何观点进行批判性分析,也未讨论模型限制发布可能带来的安全或垄断问题。
AnthropicClaude Fable 5Claude Mythos 5Project GlasswingDario AmodeiStripeDiffusionGemmaXiaomi MiMoTileRTSalesforceLogan Kilpatrick杨孟Tony FadellKimiSkillOptTrace2SkillEvoSkill
10 分钟 · 5 卡片 · 14 资料
读原文 →前置背景
技术原理
平行视角
未来推演
延伸追问