三个月，一场必然失败的Tokenmaxxing

7.9

深览指数

科技腾讯新闻·7小时前·AI 生成

三个月，一场必然失败的Tokenmaxxing

本文深入分析2026年在硅谷及全球科技公司中爆发的Tokenmaxxing现象——程序员无上限消耗AI token以证明自身效率——及其在三个月内迅速失败的根本原因。文章指出，直接原因是Agent太贵且低效，深层原因则包括组织能力的错配（工作流瓶颈、重复开发）以及需求的天花板（供给过剩但有效需求未增长）。作者将其置于生产率悖论与J型增长的理论框架下，认为Tokenmaxxing是企业在探索AI落地过程中必然付出的试错成本，其失败本身具有意义。本文适合关注AI商业落地、组织效率及科技产业周期的读者，提供了大量具体数据与案例。原文 ↗原文 ↗

核心观点

▍Tokenmaxxing（无上限消耗AI token以证明效率）是一场在三个月内必然失败的运动，其根源在于Agent成本过高、组织流程错配与需求天花板。
▍Tokenmaxxing的失败是生产率悖论（J型增长曲线）在AI时代的重演，企业支付的巨额token成本实质是探索组织改造与能力瓶颈的试错投入。

01OpenAI工程师单周消耗2100亿token，Claude Code工程师月消耗15万美元token。
02Uber 95%工程师每月使用Claude Code，70%提交代码来自AI，但2026年4月烧光全年Claude Code预算，且COO表示看不到与有用功能的关联。
03亚马逊因员工为刷内部AI排名而执行无价值任务，关闭了内部AI使用排行榜Kirorank。
04哈工大研究（Scaling Laws for Agent Harnesses）发现，复杂Agent任务中有効反馈计算（EFC）转化率低至0.1，即90%的token消耗在低效行动上。
05RDI论文（Agents’ Last Exam, arXiv 2606.05405）测试显示，当前最强Agent在最难任务上的完整通过率仅为8.6%。
06MIT研究（Writing Code vs. Shipping Code）表明，自主coding agent使commit增加180%，但传导至实际软件发布（release）时仅剩约30%。
07南洋理工研究（SkillClone）发现，75%的公开AI Skills高度近似，去重后仅剩5642个具有独特理念。
08萨斯喀彻温大学研究发现，26.1%由AI Agent提交的修复性Pull Request（PR）被关闭且未合并，其中22.1%是因为重复解决已存在的问题。

反方 / 局限

— 作者指出，纳德拉提出的「Token资本」概念（将token消耗视为沉淀企业AI能力资产）是对现有工程趋势的重新命名，在理想化Harness下，该叙事与Tokenmaxxing在实质上没有区别。
— 作者承认，AI创造新市场的关键在于将此前不划算的任务成本降至盈亏线以下，但当前Agent在「寻找新需求并给出低成本方案」的能力上仍显不足，这限制了Tokenmaxxing的潜在价值。

TokenmaxxingJ型增长曲线生产率悖论Effective Feedback Compute (EFC)HarnessSatya NadellaGarry TanJoshua BengioOpenAIAnthropicAmazonUber微软Claude Code

30 分钟 · 4 卡片 · 10 资料

读原文 →

三个月，一场必然失败的Tokenmaxxing

前置背景

平行视角

未来推演

延伸追问