Token里的低价陷阱

7.9

深览指数

商业腾讯新闻·06-18 22:02·AI 生成

Token里的低价陷阱

本文指出大模型通用Token价格虽降幅达99%，但企业AI运营总支出并未缩减，反而因Agent协作、代码生成等复杂任务导致Token消耗量十倍甚至百倍增长，形成“价格撕裂期”。作者从投资视角分析产业链利润再分配，认为真正赚钱的是能从Token用量爆发中持续收费的环节，而非卖便宜Token的人。文章系统梳理了上游（HBM/GPU、光模块、液冷等）的不可替代性逻辑、中游（云厂商、模型厂商）的分层定价策略，以及下游（场景壁垒、Token治理能力）的分化，适合关注AI产业投资和商业分析的读者。原文 ↗原文 ↗

核心观点

▍大模型通用Token价格虽大幅下降，但企业AI运营总支出并未缩减，反而因Agent协作、长上下文推理等高消耗场景导致算力总支出膨胀，形成“价格撕裂期”。
▍Token价格撕裂的本质是产业利润的再分配，真正赚钱的是能从Token用量爆发中持续收费的环节，包括掌握稀缺资源、关键能力和高粘性场景的玩家。

01以OpenAI公开定价为例，GPT-4输入价格从2023年的每百万Token 30美元降至当前部分模型的几毛美元，部分通用Token三年内最高降幅达99%。
02Uber为5000名工程师开放AI编程工具后，仅4个月便烧光了2026全年预算；米哈游技术团队因未设熔断，13小时内收到200万元Token账单。
03智谱通过模型档位分层定价：轻量级GLM-4.7输入价2-4元/百万Token，旗舰级GLM-5.1输入价6-8元，价差约3倍。
04SK海力士2025年Q4毛利率达69%，三大存储巨头（SK海力士、三星、美光）凭借HBM将DRAM综合毛利率拉回50%以上。
05金山办公2025年WPS AI国内月活突破8013万，同比增长307%，日均Token调用量超2000亿，营收59.29亿元，毛利率高达85.95%。
06阿里、腾讯、百度等云厂商在2026年3月罕见上调了AI算力服务价格，涨的是专属集群、弹性算力等企业级高消耗服务。
07长城证券测算，2025-2026年全球HBM供需比分别为45%和27%，缺口收窄。

反方 / 局限

— 通用Token降价红利主要被技术优化消化，而HBM、GPU、电力等物理成本并未跟随降价，硬约束导致上下游成本结构分化，部分企业算力支出反而失控。
— 光模块企业（如中际旭创、新易盛）前五大客户收入贡献超7成，客户集中风险高，议价能力较弱，若1.6T放量不及预期或买方议价压价，利润增速可能面临拐点。
— 算力租赁商缺乏技术壁垒，本质是“买卡转租赚差价”，一旦供需逆转利润即刻崩塌，如智谱已从租赁设备转向购买云服务。

OpenAIGPT-4Uber米哈游智谱SK海力士三星美光碧桂园阿里腾讯百度金山办公中际旭创新易盛英维克特锐德浪潮信息数据港迅策科技HBMMoE架构AgentTokenAI FinOps光模块液冷算电岛

16 分钟 · 5 卡片 · 14 资料

读原文 →

Token里的低价陷阱

概念锚点

前置背景

平行视角

未来推演

延伸追问