6.2
深览指数
热点智搜··AI 生成

DeepSeek V4正式版定档7月中旬并引入峰谷定价

DeepSeek V4 正式版将于 7 月中旬发布,并同步引入 API“峰谷定价”机制,高峰时段(9:00-12:00 及 14:00-18:00)价格为平时的 2 倍。文章详细列出了 V4-Pro 和 V4-Flash 双版本的具体定价及技术参数,并介绍了配套的 DSpark 推理加速框架。该分析主要面向开发者群体,提供了成本优化的具体建议,但未对峰谷定价策略可能带来的用户接受度、开发者迁移成本等潜在问题进行深入探讨。原文 ↗

核心观点
  • DeepSeek V4 正式版定档 7 月中旬,并引入 API“峰谷定价”机制,标志着国产大模型从“铺量”向“精细化算力运营”转变。
  • V4 系列采用了双版本架构(Pro 旗舰版和 Flash 轻量版)和 MoE 架构,并在定价上即使翻倍后仍具竞争力,旨在平衡性能、成本与稳定性。
  1. 01“峰谷定价”机制定义为高峰时段(每日 9:00~12:00 和 14:00~18:00,北京时间)API 价格为平时的 2 倍。
  2. 02V4-Pro 参数达 1.6 万亿,激活参数约 490 亿;V4-Flash 参数 2840 亿,激活参数 130 亿,均标配 100 万 Token 上下文。
  3. 03V4-Pro 在高峰时段,缓存未命中输入价格为 6 元/百万 Tokens,输出为 12 元/百万 Tokens;V4-Flash 相应价格分别为 2 元和 4 元。
  4. 04联合北京大学发布的 DSpark 推理加速框架已全量部署,可使 V4-Flash 和 V4-Pro 的生成速度分别提升高达 85% 和 78%。
  5. 05给开发者的建议包括错峰调度任务、通过固定 System Prompt 优化缓存命中率以及及时迁移至新 API 接口(`v4-pro` 和 `v4-flash`)。
反方 / 局限
  • 文章肯定了峰谷定价的正面意义,但开发者可能因高峰时段的处理需求(如实时应用)无法错峰,导致成本被动上涨,文章未讨论此困境。
  • 缓存命中与未命中价格相差百倍,对于难以优化缓存的非结构化长文本处理场景,成本控制将极具挑战。
4 分钟 · 4 卡片 · 12 资料
读原文 →

前置背景

平行视角

未来推演

延伸追问