7.7
深览指数
科技虎嗅·陈伊凡_YF··AI 生成

一场极致的算力成本压测

本文以 3D 记录应用 Remy 为案例,展示创业公司如何在算力需求远超典型 API 调用(每次任务独享一次完整 3D 训练)、且流量波动巨大的情况下,通过「算力滴滴」弹性平台将月算力成本压低至同类方案十分之一。作者进一步揭示 Remy 从「工具」转向「记忆媒介」的商业模式反思:放弃订阅制、押注广告流量,并指出「用户为什么看 3D 内容」是行业尚未回答的核心问题。适合关注 AI 创业成本控制、3D 内容消费逻辑的读者。原文 ↗

核心观点
  • Remy 非 API 调用式 Token 消耗,每次 3D 重建任务都是一次独立训练,算力消耗远超典型大模型推理,因此成本控制的关键在于 GPU 的弹性调度而非模型优化。
  • Remy 放弃订阅制,转向广告流量模式,根本原因是其本质不是效率工具而是「记忆媒介」——用户 90% 时间在消费(看)而非创作(拍),订阅逻辑失效。
  1. 01Remy 上线第 5 秒即耗尽全部 800-900 张 GPU,最终用弹性算力平台扩至 1900 张才稳住;9 天用户破 100 万,波峰波谷极端。
  2. 02通过共绩科技的弹性算力平台,Remy 算力成本从每月 50 万元(英伟达固定显卡)降至 20 - 30 万元,价格是美国同类弹性平台的十分之一。
  3. 03Remy 支持三种扫描模式:物体模式 5 分钟、人像 10 分钟、大场景 40 分钟,每 10 分钟处理 200 次任务,意味着峰值时 800 张 GPU 持续满载。
  4. 04Remy 每日 3D 扫描数是日活用户数的 1/10,即 90% 用户只在消费已生成的 3D 记忆,而非主动拍摄。
  5. 05Remy 半年内用户数达 250 万,上线 9 天即破 100 万。
反方 / 局限
  • 作者通过创始人自述承认,Remy 尚未解决「用户为什么每天打开 Remy 而非抖音/朋友圈」这一核心问题,3D 内容相对于 2D 内容的独特价值仍是待回答的课题。
  • 文章暗示了 Remy 广告流量模式的风险:记录本身是低频行为(创作有门槛),若无法让用户从「拍」有效转向「看」,留存率和商业价值将受限。
Remy王正男共绩科技高斯泼溅(3D Gaussians)虎嗅弹性算力平台
9 分钟 · 3 卡片 · 7 资料
读原文 →

前置背景

平行视角

延伸追问