6.4
深览指数
科技36 氪·36氪的朋友们··AI 生成

见顶 ,Token烧不动了?这可能是全市场最重要的一张图

本文通过分析Silicon Data LLM Token支出指数近期停滞,指出AI行业的核心关注点正从“技术可行性”转向“成本可承受性”。文章援引多家机构数据,揭示了企业内部因考核机制导致的Token无效消耗(Tokenmaxxing)现象,以及GitHub Copilot等产品转向按量计费引发的账单危机。最终,文章探讨了廉价模型崛起、补贴模式终结的行业趋势,并呈现了华尔街对AI投资回报的严重分歧。

核心观点
  • AI行业的核心关注点正从“技术是否可行”迅速转向“成本是否可承受”,Token支出的边际变化正在重塑硬件投资和商业模式的风险判断。
  1. 01Silicon Data LLM Token支出指数自去年12月以来翻番,但在2026年5月前出现回落,被宏观策略师Andreas Steno Larsen视为全市场最重要图表,暗示硬件周期可能结束。
  2. 02企业AI热潮遭遇账单危机:一家企业客户因未设使用量上限,单月花费5亿美元用于Claude。
  3. 03员工为刷内部排行榜(如亚马逊Kiro平台的Kirorank)无效消耗算力,被称为“Tokenmaxxing”,亚马逊和Meta已采取行动遏制。
  4. 04GitHub Copilot于6月1日转为按Token计费,有用户月度费用从不到45美元暴涨至超过847美元,引发对补贴模式可持续性的质疑。
  5. 05投资人Tommy Shaughnessy警告,AI大厂利润率深度为负,一旦按量计费,Uber等客户的实际消耗速度将远超预期(如将全年AI预算在四个月内耗尽)。
  6. 06高盛One-Delta部门负责人认为,DeepSeek和小米MiMo的大幅降价正触发基础设施价格战。Coinbase CEO预测80%的工作负载将在12-18个月内迁移至成本低99%的模型。
反方 / 局限
  • 高盛Jim Schneider预测,到2030年代理式AI将推动Token消耗量增长24倍,云服务商毛利率将在短期内转正,这是与本文主线(成本承压)不同的乐观视角。
  • 高盛半导体分析师Jim Covello指出,当前产业链繁荣以牺牲上游消耗为代价,几乎所有价值流向半导体公司,这种状况不可持续,暗示硬件投资本身存在泡沫风险。
  • Boosted.ai首席执行官强调,企业对数据开放的顾虑削弱了AI代理的效能,这构成了除成本外另一个限制AI大规模落地的关键因素。
Silicon Data LLM Token支出指数Andreas Steno LarsenTokenmaxxingGitHub CopilotTommy ShaughnessyDeepSeekCoinbaseBrian Armstrong高盛Jim CovelloBoosted.aiClaude亚马逊Meta
6 分钟 · 5 卡片 · 14 资料
读原文 →

概念锚点

前置背景

平行视角

未来推演

延伸追问