7.9
深览指数
科技36 氪·AI前线··AI 生成

“零数据”机器人来了,验证两月即可上岗,这群清华博士破局世界模型,靠“本能”让机器人上手就会

橡木果机器人提出一条有别于主流VLA/世界模型的具身智能路线:放弃用海量轨迹数据拟合操作,转而模仿生物本能,基于力学规律和触觉反馈,让机器人在零示范数据下通过自主尝试“涌现”行为。文章介绍了其端侧模型Natus如何以200Hz响应、毫秒级延时实现换产不停线,并已在头部化妆品企业完成POC实现规模化部署。适合关注具身智能技术路线分歧、工业机器人落地瓶颈的读者。

核心观点
  • 当前主流VLA/世界模型路线存在执行侧的根本困局:物理接触不可预测与本体微小差异,使得数据驱动的操作泛化是填不满的无底洞——视觉上“看起来会”掩盖了执行层“做不到”。
  • 橡木果提出替代方案:不依赖轨迹数据,而是基于力学规律和触觉反馈的“操作本能”机制,让机器人通过自主探索(撬、试、修正)涌现行为——操作的本质是力学行为,而非视觉问题。
  1. 01示例如:仅含一个自由度的楔形夹爪,无外置摄像头、无云端大脑、无示范数据,通过自主摸索(“撬”卡片)约八九次后成功拾起厚度<1mm的平贴卡片。
  2. 02对比实验表明:两台同款夹爪仅因导轨松紧微小差异,采用同一模型参数时执行效果大相径庭。
  3. 03全球最大开源机器人数据集Open X-Embodiment (OXE)包含来自34个实验室、22种机器人、超百万回合数据,依然无法激发出模型在执行层的泛化能力。
  4. 04橡木果将操作本能分为三类:定向本能(与视觉协同指引末端移动)、探索本能(沿物体表面自主试探稳定接触)、执行交互本能(以滑移最小化实时调节力度)。
  5. 05团队耗时7年、迭代十余版原型机,攻克微米级滑移感知技术(感知“要滑了”并自动修正),这是零数据冷启动成立的物理基石。
  6. 06Natus模型以200Hz频率、毫秒延时在端侧实时控制,出厂时针对具体硬件力学特性适配;Magis模型将Natus探索产生的带触觉语义数据(如“香蕉重120g,质心偏左,表皮粗糙”)训练为技能,实现举一反三。
  7. 07橡木果在国内头部化妆品企业完成POC,从启动到验证不到两个月即进入规模化部署,在手订单突破2000万元。
反方 / 局限
  • 作者承认“一直靠本能探索效率太低”,因此设计了第二层模型Magis来沉淀技能。暗示在完全陌生场景下,仅依靠本能可能仍面临收敛速度挑战。
  • 文章未讨论该方案在高度非刚体(如液体、沙状物)、或需要精密装配(如微米级对齐)场景下的表现,也未与VLA在复杂任务规划上的能力优势进行同等深度的对比。
橡木果机器人姜峣NatusMagisOpen X-EmbodimentVLA具身智能滑移感知柔性制造力控
12 分钟 · 4 卡片 · 10 资料
读原文 →

前置背景

争议局限

未来推演

延伸追问