Token不经济

8.5

深览指数

商业虎嗅·腾讯研究院·5小时前·AI 生成

Token不经济

本文系统剖析了AI产业中「算力（Token）投入产出不成比例」的核心矛盾。作者从三个层面展开分析：模型厂商的高端定价策略与轻量模型涨价导致token单价上升；Agent架构固有的上下文陷阱、分词器黑箱、技能冗余等结构性消耗；以及编程场景之外，token在数字化程度较低的产业中难以产生实际价值。文章还揭示了风险向上游集中、循环融资泡沫、算力扩张挤占民生资源等溢出效应。适合对AI商业化、产业经济学或科技投资感兴趣，希望超越技术新闻理解产业结构性矛盾的深度读者。原文 ↗原文 ↗

核心观点

▍当前AI产业面临的核心问题是「token不经济」：即模型能力提升带来的成本（token单价上涨、Agent结构性浪费）远超过其在真实产业场景中创造的可衡量价值。
▍编程是token经济唯一被充分验证的「通用特例」，但这一场景的成功难以复制到数字化程度低的物理世界或传统行业，导致token的有效应用范围长期受限。

01Anthropic通过分层定价（Opus/Sonnet/Haiku）和持续涨价，已证明其拥有行业最强定价权，ARR从2024年底的约100亿美元飙升至2026年5月的约4500亿美元。
02经济型token（次级/轻量及开源模型）市场价格中枢上移：例如Haiku 3.5到Haiku 4.5涨价20%；GPT mini系列定价翻番；Gemini 2.0 Flash到2.5 Flash输出定价翻了6倍。
03Agent架构存在结构性token浪费：上下文陷阱（Salim et al.发现代码审查阶段消耗占39.5%）、分词器黑箱（Opus 4.7新分词器使token膨胀最高达47%）、技能冗余（Gao et al.发现26.4%技能无路由描述，>60%内容为背景解释）等。
04微软、Uber、Meta等大厂已开始限制或稽查员工token消耗，Uber 4个月用尽2026全年AI编程预算。
05物理世界的验证成本远高于数字世界：Sim-to-Real Gap导致仿真训练的策略在真实环境中鲁棒性差（如OpenAI Dactyl项目解散）。
06AI产业链风险向上游集中：台积电/英伟达2025年净利润率超44%且自由现金流高速增长，而下游亚马逊/微软/Meta自由现金流严重下降。

反方 / 局限

— 作者承认，某些「弱确定性反馈」的中间场景（如辅助诊断影像筛查、供应链需求预测）可能成为token经济从数字走向物理的桥梁，但当前尚缺乏普适性成功案例。
— 循环融资模式（如OpenAI-英伟达-甲骨文）虽有其风险，但作者并未深入论证这种模式是否会因监管或市场自省而提前破裂，也未探讨是否存在对冲或保险机制。

Token不经济 Claude Code Anthropic OpenAI Google DeepSeek Sim-to-Real Gap 上下文陷阱分词器黑箱循环融资

44 分钟 · 5 卡片 · 14 资料

读原文 →

Token不经济

概念锚点

前置背景

平行视角

未来推演

延伸追问