7.1
深览指数
科技微博·量子位··AI 生成
英伟达开始搞机器人自己研究机器人那套了…
英伟达、CMU 和 Berkeley 联合推出具身智能自主研究框架 ENPIRE,让 AI Agent 自主完成“读论文、改算法、训练策略、部署实验、分析结果”的完整研究循环,无需人类值守。在 Pin Insertion 任务中,Agent 在 3 小时内将成功率从 0 提至 99%。该项目本质上是将物理实验环境包装成可迭代的 API,使机器人研究实现了类似软件开发的“可扩展性”,是“大平行”框架下机器人领域迈向自主研究的第四块拼图。原文 ↗
核心观点
- ▍ENPIRE 框架让 AI Agent 能在真实物理世界中自主完成机器人研究循环(读论文、改算法、训练策略、部署实验、分析结果、迭代优化),无需人类实时干预。
- ▍ENPIRE 是英伟达提出的‘大平行(The Great Parallel)’框架中机器人自主研究的实现,补上了物理世界最后一块拼图。
- 01ENPIRE 包含四个模块:环境(EN)、策略改进(PI)、部署测试(R)、多Agent进化(E),形成‘提出想法 → 训练策略 → 真机测试 → 自动评分 → 总结经验 → 再提出新想法’的闭环。
- 02在四类高难度灵巧操作任务(Push-T、Pin Insertion、GPU Insertion、Zip-tie)上,最终成功率均达99%.
- 03Pin Insertion 任务中,Agent 自行提出假设并实验验证,过程呈清晰的研究路径:先试行为克隆→加入强化学习数据→增加正则化项→调整 Batch Size,3小时将成功率从0提升至99%.
- 04ENPIRE 通过自动复位、自动评分和安全控制接口,将混乱的真实物理环境封装成 Agent 可反复调用的 API,解决了现实世界没有‘env.reset()’的难题。
- 05Agent 在 Zip-tie 任务中因操作链过长,主动放弃端到端策略,改用 VLA 模型完成粗定位再调用工具 API,展示了系统架构设计能力。
- 06在 Pin Insertion 任务中积累的研究经验(文字总结)可直接迁移到 GPU Insertion 任务的 Prompt 中,提升后续研究效率,实现类似人类实验室的‘传帮带’。
- 07框架在 8 台机器人上并行实验,Pin Insertion 达到目标时间从 1.5 小时缩短至 40 分钟,Token 消耗增长比机器人数量更快。
反方 / 局限
- — ENPIRE 的规模化代价高昂:需要8台机器人、充足GPU和Token预算,Token消耗增长快于机器人数量,自主研究过程亦面临Token成本持续烧钱问题。
- — 物理世界中的机器人与代码不同,不可‘Git Revert’,存在摩擦力、光照、物体位置等变化和噪声,自动复位与安全控制是物理环境可迭代的前提。
ENPIREAutoresearchThe Great Parallel(大平行)具身智能Jim Fan(范麟熙)肖文力 (Wenli Xiao)石冠亚 (Guanya Shi)朱玉可 (Yuke Zhu)英伟达 GEAR 实验室CMUBerkeleyEgoScaleDreamZeroDream DojoVLA 模型
10 分钟 · 5 卡片 · 9 资料
读原文 →