7.4
深览指数
商业量子位·田, 晏林··AI 生成

星海图创始人高继扬:具身智能三层技术路线,没有捷径可走

星海图在首届全球开发者大会上,核心释放了三个信号:数据、模型与生态。高继扬提出100万小时真实数据计划,预计成本高达1-2亿元,并认为这是“必须花的钱”。公司发布新一代VLA基础模型G0.5并开源,但受限于NVIDIA Jetson Thor的功耗与体积,双足人形机器人Kengo短期内无法搭载该模型。文章还揭示了星海图转向“生态平权”的战略,投资孵化上下游企业,并规划了从硬件销售到“物理世界Token”的三段式商业模式。原文 ↗

核心观点
  • 星海图的核心战略是押注高质量真实数据,认为数据不是辅助而是底层生产资料,100万小时真实数据计划是必须投入的成本。
  • 具身智能三层技术路线(本能智能、作业智能、进化智能)是必经阶段,没有捷径,G0.5模型处于第二层,但迁移到双足人形仍需时间。
  1. 01星海图联合北京亦庄发起「亦数智能」公司,计划采集100万小时超高质量真实数据,星海图作为第二大股东持股25%,投入2500万元。
  2. 02高继扬估计,100万小时数据采集成本在1亿至2亿元人民币之间,但相较于大模型每年数亿美金的算力支出,他认为“非常划算”。
  3. 03真实世界数据分为Human centric data(约50-100元/小时)和Robot centric data(约250元/小时,含设备折旧)。
  4. 04新一代VLA基础模型G0.5将视觉、语言、思维链与动作统一进自回归生成框架,实现“边理解边执行”的闭环推理,并宣布开源。
  5. 05双足人形机器人Kengo无法立即搭载G0.5,原因在于NVIDIA Jetson Thor功耗高、体积大,小型人形结构空间不够,预计最早年底解决。
  6. 06星海图发布「星途计划」,联合凯辉基金孵化30-50家产业链企业,并已投资近10家公司,意在构建产业生态。
  7. 07星海图规划的三段式商业模式:从整机销售,到方案订阅,再到物理世界Token销售。
  8. 08星海图早期客户包括斯坦福李飞飞实验室,其团队基于R1机器人发布了全身移动操作套件。
反方 / 局限
  • 文章指出,行业普遍采用UMI+Ego数据作为“廉价替代方案”,但星海图内部判断这并非终局,真实数据才是核心资产,但对仿真/合成数据持保守态度,因其与真机数据差异大,难以总结有效算法。
  • G0.5短期完全适配双臂智能或轮式双臂形态,双足人形仅处于“本能智能”阶段,端侧算力不足和工程问题(如NVIDIA Jetson Thor的体积/功耗)是主要瓶颈,这揭示了当前具身智能行业的硬件掣肘和路线现实。
星海图高继扬赵行具身智能VLA基础模型G0.5双足人形机器人KengoNVIDIA Jetson Thor亦数智能李飞飞斯坦福大学今日资本徐新凯辉基金星途计划清华大学汪玉
12 分钟 · 4 卡片 · 11 资料
读原文 →

前置背景

平行视角

未来推演

延伸追问