精打细算的AI时代到来了

7.4

深览指数

商业人人都是产品经理·深流研究所·6小时前·AI 生成

精打细算的AI时代到来了

文章指出AI行业正从免费狂欢转向残酷的商业现实，核心原因是算力成本刚性——用户规模越大，推理成本越高，无法像互联网一样边际递减。作者认为行业已转向「效率优先」路线，从硬件层（LPU芯片）、模型层（MoE架构）、工程层（KV缓存复用）到运营层（峰谷定价），全链路压缩每单位算力成本。文章还提出前沿AI与「日常AI」正在分化，效率优先不仅是商业命题，更是技术平权问题。适合关注AI商业落地与成本结构的从业者阅读。原文 ↗原文 ↗

核心观点

▍AI行业商业化的核心矛盾是算力成本刚性——用户规模无法摊薄推理成本，因为每个用户每次对话都需消耗实打实的算力，这与互联网产品的边际成本几乎为零截然不同。
▍行业正从「规模优先」全面转向「效率优先」，全链路压缩每单位算力成本以实现商业闭环。

01OpenAI月活9亿，2024年净亏损385亿美元，2025年Q1每收入1美元赔1.22美元；豆包日均token调用量180万亿，日收入不足100万元。
02DeepSeek V4 Pro总参数1.6万亿，每次仅激活490亿（3%），编码能力接近GPT-5.5，输出价格仅为后者的八分之一。
03腾讯灰度内测的AI助手「小微」基于WeLM模型，总参数800亿，每次仅激活30亿（激活率3.75%），低于DeepSeek-V4-Flash（4.6%），以适配微信14亿月活。
04DeepSeek实施峰谷定价，高峰时段（9-12点、14-18点）调用成本翻倍，平峰时段维持低价，以价格杠杆优化算力调度。
05Citadel Securities报告指出「前沿AI」与「日常AI」正在分化，用户加速离开昂贵的大模型，转向轻量级、高性价比的MoE模型。
06微软取消内部Claude Code许可，要求员工使用Copilot CLI；亚马逊明确禁止「为用AI而用AI」；Meta撤下内部token消耗排行榜。

反方 / 局限

— 文章承认To C端付费意愿极低——ChatGPT 9亿周活跃用户中个人订阅仅5000万（约5%），国内用户因互联网免费模式浸润更难接受付费。
— 作者指出普通用户无法主动优化token使用（如精简提示词、控制上下文长度），这个认知落差当前只能靠系统机制解决，但业界尚未给出成熟方案。

豆包 DeepSeek OpenAI ChatGPT 腾讯微软亚马逊 Meta 英伟达台积电 Anthropic Citadel Securities LPU MoE（混合专家架构）KV缓存复用 LLM Token支出指数 A2A协议 MCP协议

10 分钟 · 5 卡片 · 15 资料

读原文 →

精打细算的AI时代到来了

前置背景

技术原理

平行视角

未来推演

延伸追问