Token低价陷阱

8.0

深览指数

商业虎嗅·张贝贝·昨天 21:20·AI 生成

Token低价陷阱

文章核心发现：通用大模型Token单价虽已暴跌99%，但企业AI总支出却在膨胀，原因是企业正从简单问答转向Agent协作、编程等高消耗场景，导致算力总支出失控。作者从产业链视角拆解了这场“价格撕裂”——上游物理瓶颈（HBM、GPU、光模块、液冷）掌握稀缺性，中游云厂商和模型厂商通过分层定价将低价Token转化为高价值服务收入，下游有场景壁垒的应用（如金山办公）和AI FinOps成为新机会。适合关注AI投资、产业趋势的中高层决策者阅读，可帮助理解AI产业链中“谁在真正赚钱”的分化逻辑。原文 ↗原文 ↗

核心观点

▍通用Token价格虽已暴跌99%，但企业AI运营总支出并未缩减，反而因转向Agent协作、编程等高消耗场景而膨胀，形成‘价格撕裂’——便宜的是部分模型Token，贵的是企业整体AI成本。
▍产业链价值正在重构：真正赚钱的不是卖便宜Token的人，而是能从Token用量爆发中持续收费的环节，如掌握物理瓶颈的上游、具备分层定价能力的中游和有场景壁垒的下游。

01以OpenAI公开定价为例，GPT-4时代（2023年3月）每百万Token输入30美元/输出60美元，至GPT-4o（2024年5月）降至5美元/15美元，再到当前大量够用级模型仅需几毛美元，三年内最高降幅达99%。
02智谱通过模型档位分层实现差异化定价：GLM-5.1（编程/Agent场景）输入6-8元/百万Token、输出24-28元，而轻量级GLM-4.7（简单问答）输入2-4元、输出8-16元，价差约3倍。
03Uber为5000名工程师开放AI编程工具后，仅4个月烧光了2026全年预算；米哈游一位工程师测试多Agent协作时因未设熔断，13小时内收到200万元Token账单。
04HBM产能周期长（24-36个月），被大客户长协锁定，供给刚性推高利润：SK海力士2025年Q4毛利率达69%，三大存储巨头DRAM综合毛利率回到50%以上。
05云厂商如阿里、腾讯、百度在2026年3月上调AI算力服务价格，涨的并非普通聊天Token，而是专属集群、弹性算力、高可用保障等接近企业生产环境的高消耗服务。
06金山办公2025年WPS AI月活突破8013万（同比增307%），日均Token调用量超2000亿（同比增12倍），毛利率高达85.95%，高毛利来自文档场景的护城河而非模型本身。
07AI服务器组装环节如浪潮信息毛利率仅5%左右，本质是‘品牌整机+JDM制造’平台，上下游夹缝中赚辛苦钱。

反方 / 局限

— 文章指出，HBM赛道估值锚正从‘有没有货’转向‘高端占比与毛利率能否守住’；光模块企业客户集中度高（前五大客户贡献超7成），1.6T放量不及预期或买方议价加速都可能引发拐点。
— 作者提到，智谱市销率高达1000倍（市值约9300亿港元，2025年营收7亿），若业绩兑现不及预期（算力瓶颈、开源竞争、企业采用放缓），面临大幅回调风险。
— 算力租赁商缺乏技术壁垒，本质是‘买卡转租赚差价’，一旦供需逆转利润即刻崩塌（如智谱从租赁转向算力服务商/云平台）。

Token经济HBMSK海力士智谱金山办公中际旭创新易盛英维克浪潮信息Uber米哈游阿里巴巴腾讯控股百度中国移动中国电信中国联通迅策科技

17 分钟 · 3 卡片 · 7 资料

读原文 →

Token低价陷阱

前置背景

平行视角

延伸追问