5.9
深览指数
科技Bestblogs··AI 生成

BestBlogs.dev 第 99 期:Fable 与 Mythos

本期周报聚焦 Anthropic 最新模型 Claude Fable 5 及其更强但限制发布的 Mythos 5。Fable 5 以低于一半的价格在几乎所有基准测试中刷新 SOTA,并在 Stripe 的 5000 万行 Ruby 代码迁移任务中表现出惊人的生产力。作者认为,当最强模型变得更便宜,而更强模型却需要信任授权才能访问时,AI 能力的分发模式正在发生实时变化。本期还整理了 10 篇深度文章,涵盖推理速度竞争、AI 编码代理演进、企业级代理部署经验等。适合想快速掌握本周 AI 领域关键动态与趋势分析的深度读者。原文 ↗

核心观点
  • Anthropic 的 Claude Fable 5 和 Mythos 5 发布,标志着 AI 能力分发模式正在发生实时变化:最强大的模型变得更便宜,而更顶尖的模型则被限制在信任授权访问的围墙内。
  1. 01Fable 5 在几乎所有基准测试中达到了 SOTA,定价却不到 Mythos Preview 的一半。
  2. 02Fable 5 在 Stripe 的真实部署中,单日内完成了 5000 万行 Ruby 代码的全仓库迁移,该工作量在过去需要一个完整团队超过两个月的时间。
  3. 03Anthropic CEO 发表政策文章,提出 FAA 式强制性第三方测试、工资保险和生物医药监管改革等五部分议程,警告有效行动窗口正在关闭。
  4. 04推理速度成为新战场:Google 的 DiffusionGemma 在单个 H100 上达到每秒 1000 tokens;小米的 MiMo 和 TileRT 通过模型-系统协同设计,在标准 8-GPU 集群上推动 1T 参数模型超越每秒 1000 token。
  5. 05Salesforce 从 20000 次企业代理部署中总结出反直觉教训:90% 的工作在启动之后。
  6. 06Google DeepMind 的 Logan Kilpatrick 认为模型将吞噬代理框架,外部工具将迁移到原生模型系统中。
  7. 07Anker 创始人杨孟用 4 小时回顾了 15 年公司历史,阐述了从浅水品类向深水系统的战略转变。
反方 / 局限
  • 作者仅通过周报形式聚合信息,未对任何观点进行批判性分析,也未讨论模型限制发布可能带来的安全或垄断问题。
AnthropicClaude Fable 5Claude Mythos 5Project GlasswingDario AmodeiStripeDiffusionGemmaXiaomi MiMoTileRTSalesforceLogan Kilpatrick杨孟Tony FadellKimiSkillOptTrace2SkillEvoSkill
10 分钟 · 5 卡片 · 14 资料
读原文 →

前置背景

技术原理

平行视角

未来推演

延伸追问