7.6
深览指数
科技36 氪·机器之心··AI 生成

Anthropic警告的递归AI,田渊栋新公司刚刚走出了「第一步」

田渊栋创立的Recursive Superintelligence展示了其自动化AI研究系统的首批成果:在三个高标准测试中超越了目前最优水平,包括在固定5分钟预算内训练小型语言模型、在高度优化的NanoGPT Speedrun基准上缩短训练时间2.2秒,以及将GPU内核优化任务距硬件理论极限的差距缩小了18%。Anthropic此前发布的报告显示其内部代码库超过80%由AI生成,并警告递归自我改进速度过快需要全球协调。Recursive的成果是将Anthropic警示的趋势从理论推向工程实践的具体一步,暗示着AI研究范式从“人主导实验”向“AI主导实验”的转变可能正在加速。

核心观点
  • Recursive Superintelligence发布的"First Steps Toward Automated AI Research"成果,证明了构建自动推进AI研究循环的系统已具初步可行性,并在三个差异化基准测试中取得最优结果,标志着"递归式AI"范式的工程落地迈出了具体一步。
  • Anthropic内部数据显示,其代码库中超过80%已由Claude撰写,工程师每日合并代码量是2024年的8倍,且Claude将一段训练代码运行速度提升约52倍,这指向了递归自我改进正在真实发生,并促使Anthropic呼吁行业协调设立暂停机制。
  1. 01在NanoChat Autoresearch基准中,Recursive系统以相同初始代码出发,将验证BPB从社区最佳0.9372推进至0.9109,相当于达到同等训练质量只需对手1.3倍少的训练时间,其关键发现是一种通过哈希表同时嵌入bigram和trigram信息的短上下文记忆机制。
  2. 02在NanoGPT Speedrun基准中,Recursive系统从社区优化两年、通过83次贡献压缩至79.7秒的最优解出发,进一步将训练时间压缩至77.5秒,核心技巧包括FP8精度注意力计算、NorMuon优化器中注入退火噪声、以及更精简的融合MLP Triton内核。
  3. 03在英伟达SOL-ExecBench GPU内核优化基准中,Recursive系统将235个内核上的得分从0.699提升至0.754,将距离硬件极限的差距缩小了18%,且团队承认自身并非内核工程专家,优化发现来自系统本身。
  4. 04Recursive Superintelligence拥有豪华创始团队,包括田渊栋、Richard Socher、Alexey Dosovitskiy、Tim Rocktäschel、Peter Norvig等,即便无公开产品前已完成6.5亿美元融资,估值46.5亿美元,由GV和Greycroft领投,英伟达和AMD跟投。
反方 / 局限
  • Recursive团队承认这仍是"第一步":当前系统在指标明确、反馈快速、作弊可检测的场景下效果最好,距离自主推进开放性科学问题还有相当距离,奖励作弊的防控是规模化路上的核心挑战。
Recursive Superintelligence田渊栋AnthropicClaude递归自我改进Richard SocherAlexey DosovitskiyNanoChat AutoresearchNanoGPT SpeedrunSOL-ExecBenchAndrej KarpathyGV (Google Ventures)Yann LeCunAMI LabsDavid SilverIneffable Intelligence
15 分钟 · 4 卡片 · 9 资料
读原文 →

前置背景

平行视角

未来推演

延伸追问