英伟达开始搞机器人自己研究机器人那套了…

7.1

深览指数

科技微博·量子位·昨天 20:05·AI 生成

英伟达开始搞机器人自己研究机器人那套了…

英伟达、CMU 和 Berkeley 联合推出具身智能自主研究框架 ENPIRE，让 AI Agent 自主完成“读论文、改算法、训练策略、部署实验、分析结果”的完整研究循环，无需人类值守。在 Pin Insertion 任务中，Agent 在 3 小时内将成功率从 0 提至 99%。该项目本质上是将物理实验环境包装成可迭代的 API，使机器人研究实现了类似软件开发的“可扩展性”，是“大平行”框架下机器人领域迈向自主研究的第四块拼图。原文 ↗原文 ↗

核心观点

▍ENPIRE 框架让 AI Agent 能在真实物理世界中自主完成机器人研究循环(读论文、改算法、训练策略、部署实验、分析结果、迭代优化)，无需人类实时干预。
▍ENPIRE 是英伟达提出的‘大平行(The Great Parallel)’框架中机器人自主研究的实现，补上了物理世界最后一块拼图。

01ENPIRE 包含四个模块:环境(EN)、策略改进(PI)、部署测试(R)、多Agent进化(E)，形成‘提出想法 → 训练策略 → 真机测试 → 自动评分 → 总结经验 → 再提出新想法’的闭环。
02在四类高难度灵巧操作任务(Push-T、Pin Insertion、GPU Insertion、Zip-tie)上，最终成功率均达99%.
03Pin Insertion 任务中，Agent 自行提出假设并实验验证，过程呈清晰的研究路径:先试行为克隆→加入强化学习数据→增加正则化项→调整 Batch Size，3小时将成功率从0提升至99%.
04ENPIRE 通过自动复位、自动评分和安全控制接口，将混乱的真实物理环境封装成 Agent 可反复调用的 API，解决了现实世界没有‘env.reset()’的难题。
05Agent 在 Zip-tie 任务中因操作链过长，主动放弃端到端策略，改用 VLA 模型完成粗定位再调用工具 API，展示了系统架构设计能力。
06在 Pin Insertion 任务中积累的研究经验(文字总结)可直接迁移到 GPU Insertion 任务的 Prompt 中，提升后续研究效率，实现类似人类实验室的‘传帮带’。
07框架在 8 台机器人上并行实验，Pin Insertion 达到目标时间从 1.5 小时缩短至 40 分钟，Token 消耗增长比机器人数量更快。

反方 / 局限

— ENPIRE 的规模化代价高昂:需要8台机器人、充足GPU和Token预算，Token消耗增长快于机器人数量，自主研究过程亦面临Token成本持续烧钱问题。
— 物理世界中的机器人与代码不同，不可‘Git Revert’，存在摩擦力、光照、物体位置等变化和噪声，自动复位与安全控制是物理环境可迭代的前提。

ENPIREAutoresearchThe Great Parallel（大平行）具身智能Jim Fan（范麟熙）肖文力 (Wenli Xiao)石冠亚 (Guanya Shi)朱玉可 (Yuke Zhu)英伟达 GEAR 实验室CMUBerkeleyEgoScaleDreamZeroDream DojoVLA 模型

10 分钟 · 5 卡片 · 9 资料

读原文 →

英伟达开始搞机器人自己研究机器人那套了…

概念锚点

前置背景

平行视角

未来推演

延伸追问