8.0
深览指数
商业虎嗅·张贝贝··AI 生成

Token低价陷阱

文章核心发现:通用大模型Token单价虽已暴跌99%,但企业AI总支出却在膨胀,原因是企业正从简单问答转向Agent协作、编程等高消耗场景,导致算力总支出失控。作者从产业链视角拆解了这场“价格撕裂”——上游物理瓶颈(HBM、GPU、光模块、液冷)掌握稀缺性,中游云厂商和模型厂商通过分层定价将低价Token转化为高价值服务收入,下游有场景壁垒的应用(如金山办公)和AI FinOps成为新机会。适合关注AI投资、产业趋势的中高层决策者阅读,可帮助理解AI产业链中“谁在真正赚钱”的分化逻辑。原文 ↗

核心观点
  • 通用Token价格虽已暴跌99%,但企业AI运营总支出并未缩减,反而因转向Agent协作、编程等高消耗场景而膨胀,形成‘价格撕裂’——便宜的是部分模型Token,贵的是企业整体AI成本。
  • 产业链价值正在重构:真正赚钱的不是卖便宜Token的人,而是能从Token用量爆发中持续收费的环节,如掌握物理瓶颈的上游、具备分层定价能力的中游和有场景壁垒的下游。
  1. 01以OpenAI公开定价为例,GPT-4时代(2023年3月)每百万Token输入30美元/输出60美元,至GPT-4o(2024年5月)降至5美元/15美元,再到当前大量够用级模型仅需几毛美元,三年内最高降幅达99%。
  2. 02智谱通过模型档位分层实现差异化定价:GLM-5.1(编程/Agent场景)输入6-8元/百万Token、输出24-28元,而轻量级GLM-4.7(简单问答)输入2-4元、输出8-16元,价差约3倍。
  3. 03Uber为5000名工程师开放AI编程工具后,仅4个月烧光了2026全年预算;米哈游一位工程师测试多Agent协作时因未设熔断,13小时内收到200万元Token账单。
  4. 04HBM产能周期长(24-36个月),被大客户长协锁定,供给刚性推高利润:SK海力士2025年Q4毛利率达69%,三大存储巨头DRAM综合毛利率回到50%以上。
  5. 05云厂商如阿里、腾讯、百度在2026年3月上调AI算力服务价格,涨的并非普通聊天Token,而是专属集群、弹性算力、高可用保障等接近企业生产环境的高消耗服务。
  6. 06金山办公2025年WPS AI月活突破8013万(同比增307%),日均Token调用量超2000亿(同比增12倍),毛利率高达85.95%,高毛利来自文档场景的护城河而非模型本身。
  7. 07AI服务器组装环节如浪潮信息毛利率仅5%左右,本质是‘品牌整机+JDM制造’平台,上下游夹缝中赚辛苦钱。
反方 / 局限
  • 文章指出,HBM赛道估值锚正从‘有没有货’转向‘高端占比与毛利率能否守住’;光模块企业客户集中度高(前五大客户贡献超7成),1.6T放量不及预期或买方议价加速都可能引发拐点。
  • 作者提到,智谱市销率高达1000倍(市值约9300亿港元,2025年营收7亿),若业绩兑现不及预期(算力瓶颈、开源竞争、企业采用放缓),面临大幅回调风险。
  • 算力租赁商缺乏技术壁垒,本质是‘买卡转租赚差价’,一旦供需逆转利润即刻崩塌(如智谱从租赁转向算力服务商/云平台)。
Token经济HBMSK海力士智谱金山办公中际旭创新易盛英维克浪潮信息Uber米哈游阿里巴巴腾讯控股百度中国移动中国电信中国联通迅策科技
17 分钟 · 3 卡片 · 7 资料
读原文 →

前置背景

平行视角

延伸追问