7.4
深览指数
科技人人都是产品经理·实战产品说··AI 生成
Token价格战真相:降价vs涨价,你的AI账单为何还在涨?
文章指出,大模型Token单价长期下降(如DeepSeek降价90%),但多数企业实际AI账单仍在上涨。核心原因是:用量指数级膨胀、高端场景主动涨价、算力供给紧张传导成本。作者认为,Token价格正在快速分层,形成低端普惠(持续走低)和高端价值(稳步走高)的结构。文章提供了6条实操控制成本的技巧,核心观点是用户应管理好自己的Token消耗,而非纠结于单一价格的涨跌。原文 ↗
核心观点
- ▍Token单价长期趋势是下降的,但价格正在快速分层:低端普惠场景越来越便宜,高端价值场景越来越贵,多数用户的实际账单在上涨。
- ▍大模型厂商的定价逻辑正在从‘抢市场份额’转向‘为价值定价’,高端场景(如Agent编程)的涨价是因为其创造了足够高的真实价值。
- 012026年4月,DeepSeek两天两次降价:Flash版每百万Token输入缓存命中价格低至0.02元,高频调用场景成本降幅超90%。
- 02同期,智谱在2026年Q1分多次上调API定价,累计涨幅83%。GLM-5系列输出价格比GLM-4涨了50%,但Token消耗量同步增长400%。
- 03国家数据局数据显示,中国日均Token调用量已突破140万亿,相比2024年初增长超千倍。
- 04SemiAnalysis数据显示,英伟达H100的一年期租赁合同价格从2025年10月的1.70美元/小时,飙升至2026年3月的2.35美元/小时,涨幅近40%。
- 05腾讯云等云厂商在2026年3月对Token和Coding Plan集体涨价约4倍以上,主要是由OpenClaw引发算力缺口的成本压力传导。
- 06智谱CEO张鹏提出‘Token架构师’概念,认为未来每个人都要学会规划和管理自己的Token消耗。
- 07作者通过一个企业案例说明,通过缓存加Prompt精简,可将月均Token消耗降低95.2%,准确率从92.1%提升至95.7%。
反方 / 局限
- — 文章未深入探讨国产GPU替代(如华为昇腾)在当前阶段的实际落地瓶颈和性价比,这是影响未来Token价格的关键变量,但文中仅作为乐观假设提出。
- — 文章提到的‘价值定价’逻辑,可能隐含了厂商通过涨价筛选高价值客户、将底层成本转嫁给不具备议价能力的中小开发者的风险。
DeepSeek智谱GLM-5MoE架构TokenToken架构师OpenClawH100张鹏SemiAnalysis腾讯云Prompt缓存
10 分钟 · 4 卡片 · 11 资料
读原文 →