7.9
深览指数
科技腾讯新闻··AI 生成
三个月,一场必然失败的Tokenmaxxing
本文深入分析2026年在硅谷及全球科技公司中爆发的Tokenmaxxing现象——程序员无上限消耗AI token以证明自身效率——及其在三个月内迅速失败的根本原因。文章指出,直接原因是Agent太贵且低效,深层原因则包括组织能力的错配(工作流瓶颈、重复开发)以及需求的天花板(供给过剩但有效需求未增长)。作者将其置于生产率悖论与J型增长的理论框架下,认为Tokenmaxxing是企业在探索AI落地过程中必然付出的试错成本,其失败本身具有意义。本文适合关注AI商业落地、组织效率及科技产业周期的读者,提供了大量具体数据与案例。原文 ↗
核心观点
- ▍Tokenmaxxing(无上限消耗AI token以证明效率)是一场在三个月内必然失败的运动,其根源在于Agent成本过高、组织流程错配与需求天花板。
- ▍Tokenmaxxing的失败是生产率悖论(J型增长曲线)在AI时代的重演,企业支付的巨额token成本实质是探索组织改造与能力瓶颈的试错投入。
- 01OpenAI工程师单周消耗2100亿token,Claude Code工程师月消耗15万美元token。
- 02Uber 95%工程师每月使用Claude Code,70%提交代码来自AI,但2026年4月烧光全年Claude Code预算,且COO表示看不到与有用功能的关联。
- 03亚马逊因员工为刷内部AI排名而执行无价值任务,关闭了内部AI使用排行榜Kirorank。
- 04哈工大研究(Scaling Laws for Agent Harnesses)发现,复杂Agent任务中有効反馈计算(EFC)转化率低至0.1,即90%的token消耗在低效行动上。
- 05RDI论文(Agents’ Last Exam, arXiv 2606.05405)测试显示,当前最强Agent在最难任务上的完整通过率仅为8.6%。
- 06MIT研究(Writing Code vs. Shipping Code)表明,自主coding agent使commit增加180%,但传导至实际软件发布(release)时仅剩约30%。
- 07南洋理工研究(SkillClone)发现,75%的公开AI Skills高度近似,去重后仅剩5642个具有独特理念。
- 08萨斯喀彻温大学研究发现,26.1%由AI Agent提交的修复性Pull Request(PR)被关闭且未合并,其中22.1%是因为重复解决已存在的问题。
反方 / 局限
- — 作者指出,纳德拉提出的「Token资本」概念(将token消耗视为沉淀企业AI能力资产)是对现有工程趋势的重新命名,在理想化Harness下,该叙事与Tokenmaxxing在实质上没有区别。
- — 作者承认,AI创造新市场的关键在于将此前不划算的任务成本降至盈亏线以下,但当前Agent在「寻找新需求并给出低成本方案」的能力上仍显不足,这限制了Tokenmaxxing的潜在价值。
TokenmaxxingJ型增长曲线生产率悖论Effective Feedback Compute (EFC)HarnessSatya NadellaGarry TanJoshua BengioOpenAIAnthropicAmazonUber微软Claude Code
30 分钟 · 4 卡片 · 10 资料
读原文 →