7.4
深览指数
科技人人都是产品经理·实战产品说··AI 生成

Token价格战真相:降价vs涨价,你的AI账单为何还在涨?

文章指出,大模型Token单价长期下降(如DeepSeek降价90%),但多数企业实际AI账单仍在上涨。核心原因是:用量指数级膨胀、高端场景主动涨价、算力供给紧张传导成本。作者认为,Token价格正在快速分层,形成低端普惠(持续走低)和高端价值(稳步走高)的结构。文章提供了6条实操控制成本的技巧,核心观点是用户应管理好自己的Token消耗,而非纠结于单一价格的涨跌。原文 ↗

核心观点
  • Token单价长期趋势是下降的,但价格正在快速分层:低端普惠场景越来越便宜,高端价值场景越来越贵,多数用户的实际账单在上涨。
  • 大模型厂商的定价逻辑正在从‘抢市场份额’转向‘为价值定价’,高端场景(如Agent编程)的涨价是因为其创造了足够高的真实价值。
  1. 012026年4月,DeepSeek两天两次降价:Flash版每百万Token输入缓存命中价格低至0.02元,高频调用场景成本降幅超90%。
  2. 02同期,智谱在2026年Q1分多次上调API定价,累计涨幅83%。GLM-5系列输出价格比GLM-4涨了50%,但Token消耗量同步增长400%。
  3. 03国家数据局数据显示,中国日均Token调用量已突破140万亿,相比2024年初增长超千倍。
  4. 04SemiAnalysis数据显示,英伟达H100的一年期租赁合同价格从2025年10月的1.70美元/小时,飙升至2026年3月的2.35美元/小时,涨幅近40%。
  5. 05腾讯云等云厂商在2026年3月对Token和Coding Plan集体涨价约4倍以上,主要是由OpenClaw引发算力缺口的成本压力传导。
  6. 06智谱CEO张鹏提出‘Token架构师’概念,认为未来每个人都要学会规划和管理自己的Token消耗。
  7. 07作者通过一个企业案例说明,通过缓存加Prompt精简,可将月均Token消耗降低95.2%,准确率从92.1%提升至95.7%。
反方 / 局限
  • 文章未深入探讨国产GPU替代(如华为昇腾)在当前阶段的实际落地瓶颈和性价比,这是影响未来Token价格的关键变量,但文中仅作为乐观假设提出。
  • 文章提到的‘价值定价’逻辑,可能隐含了厂商通过涨价筛选高价值客户、将底层成本转嫁给不具备议价能力的中小开发者的风险。
DeepSeek智谱GLM-5MoE架构TokenToken架构师OpenClawH100张鹏SemiAnalysis腾讯云Prompt缓存
10 分钟 · 4 卡片 · 11 资料
读原文 →

概念锚点

前置背景

未来推演

延伸追问