商业人人都是产品经理·深流研究所··AI 生成
精打细算的AI时代到来了
文章指出AI行业正从免费狂欢转向残酷的商业现实,核心原因是算力成本刚性——用户规模越大,推理成本越高,无法像互联网一样边际递减。作者认为行业已转向「效率优先」路线,从硬件层(LPU芯片)、模型层(MoE架构)、工程层(KV缓存复用)到运营层(峰谷定价),全链路压缩每单位算力成本。文章还提出前沿AI与「日常AI」正在分化,效率优先不仅是商业命题,更是技术平权问题。适合关注AI商业落地与成本结构的从业者阅读。原文 ↗原文 ↗
核心观点
- ▍AI行业商业化的核心矛盾是算力成本刚性——用户规模无法摊薄推理成本,因为每个用户每次对话都需消耗实打实的算力,这与互联网产品的边际成本几乎为零截然不同。
- ▍行业正从「规模优先」全面转向「效率优先」,全链路压缩每单位算力成本以实现商业闭环。
- 01OpenAI月活9亿,2024年净亏损385亿美元,2025年Q1每收入1美元赔1.22美元;豆包日均token调用量180万亿,日收入不足100万元。
- 02DeepSeek V4 Pro总参数1.6万亿,每次仅激活490亿(3%),编码能力接近GPT-5.5,输出价格仅为后者的八分之一。
- 03腾讯灰度内测的AI助手「小微」基于WeLM模型,总参数800亿,每次仅激活30亿(激活率3.75%),低于DeepSeek-V4-Flash(4.6%),以适配微信14亿月活。
- 04DeepSeek实施峰谷定价,高峰时段(9-12点、14-18点)调用成本翻倍,平峰时段维持低价,以价格杠杆优化算力调度。
- 05Citadel Securities报告指出「前沿AI」与「日常AI」正在分化,用户加速离开昂贵的大模型,转向轻量级、高性价比的MoE模型。
- 06微软取消内部Claude Code许可,要求员工使用Copilot CLI;亚马逊明确禁止「为用AI而用AI」;Meta撤下内部token消耗排行榜。
反方 / 局限
- — 文章承认To C端付费意愿极低——ChatGPT 9亿周活跃用户中个人订阅仅5000万(约5%),国内用户因互联网免费模式浸润更难接受付费。
- — 作者指出普通用户无法主动优化token使用(如精简提示词、控制上下文长度),这个认知落差当前只能靠系统机制解决,但业界尚未给出成熟方案。
10 分钟 · 5 卡片 · 15 资料
读原文 →前置背景
技术原理
平行视角
未来推演
延伸追问