7.4
深览指数
科技虎嗅·梁卡尔··AI 生成

AI开始等不起云了

本文核心判断是:当AI进入规模化应用阶段,低时延的「实时Token」将成为一个独立于大厂价格战的新市场。作者以边缘算力公司「云天畅想」完成10亿元E轮融资为引,指出其战略已从云游戏服务商转向AI推理的「实时智算织网」。文章详细拆解了边缘算力的商业逻辑——关键在于通过异构调度和国产芯片适配来「榨干GPU每一秒」,而非单纯依赖低时延概念。适合关注AI基础设施、算力投资及产业应用的从业者阅读。原文 ↗

核心观点
  • 当AI从训练转向规模化应用,低延迟的「实时Token」能脱离普通Token的价格战,形成一个独立的高溢价市场,但这一逻辑仍需客户付费验证。
  1. 01云天畅想E轮融资超10亿元人民币,由中国互联网投资基金领投,累计融资超30亿元,公司定位从「边缘智算服务商」升级为「实时智算织网」。
  2. 02实时Token的商业场景包括:实时语音交互、AI PC、智能座舱、游戏AI,以及未来的具身智能和物理AI;这些场景的共同点是用户不能容忍时延。
  3. 03云天畅想首席科学家张霖涛用「炼油厂vs加油站」比喻:中央算力中心是炼油厂,边缘节点是用户身边的加油站,负责即时算力加注。
  4. 04自动驾驶场景中,安全闭环必须在车端完成,边缘节点承担的是协同感知、地图更新、内容交互等任务,而非核心决策。
  5. 05云天畅想的「算力复用」策略:同一批GPU白天处理AI推理,错峰时段调度到云游戏、实时渲染,以抬高利用率缩短投资回报周期。
  6. 06云天畅想已与约90%的国产芯片厂商建立底层异构调度和调优合作,将国产芯片适配作为特定市场的竞争壁垒。
  7. 07公司业务实际始于2016年,2020年注册实体,前身被贴「云游戏」标签,但底层是「GPU原生和边缘原生的分布式异构算力调度平台」。
反方 / 局限
  • 云游戏到AI推理的「基因演进」是云天畅想自我重估的逻辑,但缺少跨技术栈的具体迁移证据,商业诉求痕迹明显。
  • 实时Token能否形成溢价,最终取决于客户是否愿意在端侧、本地私有云和中心云之间优先选择边缘节点,目前缺乏大规模付费验证。
  • 物理AI和具身智能的商业化节奏不明确,是远期蓝图而非短期现金流;云天畅想未披露更细的成本拆解,外部难以判断GPU利用率和单位成本的真实优势。
  • 国产芯片适配是「苦活累活」,成本不容忽视;英伟达在推理阶段的生态优势仍然明显,异构调度不一定是决胜壁垒。
10 分钟 · 4 卡片 · 11 资料
读原文 →

前置背景

平行视角

未来推演

延伸追问