DeepSeek V4正式版定档7月中旬并引入峰谷定价

6.2

深览指数

热点智搜·3小时前·AI 生成

DeepSeek V4正式版定档7月中旬并引入峰谷定价

DeepSeek V4 正式版将于 7 月中旬发布，并同步引入 API“峰谷定价”机制，高峰时段（9:00-12:00 及 14:00-18:00）价格为平时的 2 倍。文章详细列出了 V4-Pro 和 V4-Flash 双版本的具体定价及技术参数，并介绍了配套的 DSpark 推理加速框架。该分析主要面向开发者群体，提供了成本优化的具体建议，但未对峰谷定价策略可能带来的用户接受度、开发者迁移成本等潜在问题进行深入探讨。原文 ↗原文 ↗

核心观点

▍DeepSeek V4 正式版定档 7 月中旬，并引入 API“峰谷定价”机制，标志着国产大模型从“铺量”向“精细化算力运营”转变。
▍V4 系列采用了双版本架构（Pro 旗舰版和 Flash 轻量版）和 MoE 架构，并在定价上即使翻倍后仍具竞争力，旨在平衡性能、成本与稳定性。

01“峰谷定价”机制定义为高峰时段（每日 9:00～12:00 和 14:00～18:00，北京时间）API 价格为平时的 2 倍。
02V4-Pro 参数达 1.6 万亿，激活参数约 490 亿；V4-Flash 参数 2840 亿，激活参数 130 亿，均标配 100 万 Token 上下文。
03V4-Pro 在高峰时段，缓存未命中输入价格为 6 元/百万 Tokens，输出为 12 元/百万 Tokens；V4-Flash 相应价格分别为 2 元和 4 元。
04联合北京大学发布的 DSpark 推理加速框架已全量部署，可使 V4-Flash 和 V4-Pro 的生成速度分别提升高达 85% 和 78%。
05给开发者的建议包括错峰调度任务、通过固定 System Prompt 优化缓存命中率以及及时迁移至新 API 接口（`v4-pro` 和 `v4-flash`）。

反方 / 局限

— 文章肯定了峰谷定价的正面意义，但开发者可能因高峰时段的处理需求（如实时应用）无法错峰，导致成本被动上涨，文章未讨论此困境。
— 缓存命中与未命中价格相差百倍，对于难以优化缓存的非结构化长文本处理场景，成本控制将极具挑战。

DeepSeek DeepSeek V4 峰谷定价 DSpark 北京大学混合专家架构稀疏注意力机制

4 分钟 · 4 卡片 · 12 资料

读原文 →读原文 →

DeepSeek V4正式版定档7月中旬并引入峰谷定价

前置背景

平行视角

未来推演

延伸追问