8.5
深览指数
商业虎嗅·腾讯研究院··AI 生成
Token不经济
本文系统剖析了AI产业中「算力(Token)投入产出不成比例」的核心矛盾。作者从三个层面展开分析:模型厂商的高端定价策略与轻量模型涨价导致token单价上升;Agent架构固有的上下文陷阱、分词器黑箱、技能冗余等结构性消耗;以及编程场景之外,token在数字化程度较低的产业中难以产生实际价值。文章还揭示了风险向上游集中、循环融资泡沫、算力扩张挤占民生资源等溢出效应。适合对AI商业化、产业经济学或科技投资感兴趣,希望超越技术新闻理解产业结构性矛盾的深度读者。原文 ↗
核心观点
- ▍当前AI产业面临的核心问题是「token不经济」:即模型能力提升带来的成本(token单价上涨、Agent结构性浪费)远超过其在真实产业场景中创造的可衡量价值。
- ▍编程是token经济唯一被充分验证的「通用特例」,但这一场景的成功难以复制到数字化程度低的物理世界或传统行业,导致token的有效应用范围长期受限。
- 01Anthropic通过分层定价(Opus/Sonnet/Haiku)和持续涨价,已证明其拥有行业最强定价权,ARR从2024年底的约100亿美元飙升至2026年5月的约4500亿美元。
- 02经济型token(次级/轻量及开源模型)市场价格中枢上移:例如Haiku 3.5到Haiku 4.5涨价20%;GPT mini系列定价翻番;Gemini 2.0 Flash到2.5 Flash输出定价翻了6倍。
- 03Agent架构存在结构性token浪费:上下文陷阱(Salim et al.发现代码审查阶段消耗占39.5%)、分词器黑箱(Opus 4.7新分词器使token膨胀最高达47%)、技能冗余(Gao et al.发现26.4%技能无路由描述,>60%内容为背景解释)等。
- 04微软、Uber、Meta等大厂已开始限制或稽查员工token消耗,Uber 4个月用尽2026全年AI编程预算。
- 05物理世界的验证成本远高于数字世界:Sim-to-Real Gap导致仿真训练的策略在真实环境中鲁棒性差(如OpenAI Dactyl项目解散)。
- 06AI产业链风险向上游集中:台积电/英伟达2025年净利润率超44%且自由现金流高速增长,而下游亚马逊/微软/Meta自由现金流严重下降。
反方 / 局限
- — 作者承认,某些「弱确定性反馈」的中间场景(如辅助诊断影像筛查、供应链需求预测)可能成为token经济从数字走向物理的桥梁,但当前尚缺乏普适性成功案例。
- — 循环融资模式(如OpenAI-英伟达-甲骨文)虽有其风险,但作者并未深入论证这种模式是否会因监管或市场自省而提前破裂,也未探讨是否存在对冲或保险机制。
44 分钟 · 5 卡片 · 14 资料
读原文 →