6.1
深览指数
科技量子位·思邈··AI 生成
全球首个:隐空间世界模型,打通长时序双向物理因果链了!
具身智能新锐「无界动力」发布全球首个长时序双向物理因果链隐空间世界模型MWA™。该模型通过隐空间潜动作推理和正逆双向动力学架构,让机器人在接触物理世界前就能预判后果并优化动作,解决了传统VLA模型泛化性差、长时序执行易崩溃的痛点。文章介绍了其技术细节(潜动作、时序Chunk级建模、负样本体系),在RoboCasa榜单上超越英伟达GR00T-N1.6的成绩,以及创始团队和商业化进展。适合关注具身智能技术前沿、对世界模型路线之争感兴趣的读者。原文 ↗
核心观点
- ▍无界动力主张「隐空间世界模型 + 强化学习」路线,认为让机器人理解物理世界的因果直觉,比死记硬背人类动作轨迹(传统VLA)更重要,是实现多场景泛化的根本路径。
- 01MWA™模型在隐空间内提取「潜动作(Latent Action)」,绕开像素冗余计算和人工动作标注,可直接用互联网海量无标签视频训练。
- 02模型首创「长时序双向物理因果链」架构:逆动力学(由果推因)和正动力学(由因推果)协同工作,配合正逆互审机制,实现10秒以上视觉序列的连续动作推演。
- 03为解决强化学习缺失负样本的行业瓶颈,团队构建了AnyPhys负样本数据库,积累了数万条失败/失稳/边界样本,实现无需人工标注的自动密度奖励设计。
- 04在RoboCasa GR1 TableTop榜单上,MWA™-WALA以75.2%平均任务成功率超越英伟达GR00T-N1.6等模型,拿下第一。
- 05公司成立一年内完成超2亿美元天使轮和近2亿美元Pre-A轮融资,投资方包括红杉中国、线性资本、京东关联基金。
- 06已签下近1亿美元全球订单,合作方包括汽车供应商ZF LIFETEC、远景科技(超5亿元海外订单)、连锁咖啡品牌等。
- 07团队背景:CEO张玉峰曾将地平线智驾业务带至中国市场份额第一,CTO夏中谱是端到端模型量产的关键人物。
反方 / 局限
- — 文章对传统VLA路线的批判(死记硬背、无理解)较强硬,但未提及隐空间世界模型路线在计算资源消耗、模型可解释性、大规模训练稳定性等可能面临的工程挑战。
- — 文中所述「全球首个」「首创」等表述缺乏同行独立验证,其与谷歌、斯坦福等机构此前发布的World Models系列工作的差异化边界不够清晰。
16 分钟 · 5 卡片 · 14 资料
读原文 →