Anthropic警告的递归AI，田渊栋新公司刚刚走出了「第一步」

7.6

深览指数

科技36 氪·机器之心·2小时前·AI 生成

Anthropic警告的递归AI，田渊栋新公司刚刚走出了「第一步」

田渊栋创立的Recursive Superintelligence展示了其自动化AI研究系统的首批成果：在三个高标准测试中超越了目前最优水平，包括在固定5分钟预算内训练小型语言模型、在高度优化的NanoGPT Speedrun基准上缩短训练时间2.2秒，以及将GPU内核优化任务距硬件理论极限的差距缩小了18%。Anthropic此前发布的报告显示其内部代码库超过80%由AI生成，并警告递归自我改进速度过快需要全球协调。Recursive的成果是将Anthropic警示的趋势从理论推向工程实践的具体一步，暗示着AI研究范式从“人主导实验”向“AI主导实验”的转变可能正在加速。

核心观点

▍Recursive Superintelligence发布的"First Steps Toward Automated AI Research"成果，证明了构建自动推进AI研究循环的系统已具初步可行性，并在三个差异化基准测试中取得最优结果，标志着"递归式AI"范式的工程落地迈出了具体一步。
▍Anthropic内部数据显示，其代码库中超过80%已由Claude撰写，工程师每日合并代码量是2024年的8倍，且Claude将一段训练代码运行速度提升约52倍，这指向了递归自我改进正在真实发生，并促使Anthropic呼吁行业协调设立暂停机制。

01在NanoChat Autoresearch基准中，Recursive系统以相同初始代码出发，将验证BPB从社区最佳0.9372推进至0.9109，相当于达到同等训练质量只需对手1.3倍少的训练时间，其关键发现是一种通过哈希表同时嵌入bigram和trigram信息的短上下文记忆机制。
02在NanoGPT Speedrun基准中，Recursive系统从社区优化两年、通过83次贡献压缩至79.7秒的最优解出发，进一步将训练时间压缩至77.5秒，核心技巧包括FP8精度注意力计算、NorMuon优化器中注入退火噪声、以及更精简的融合MLP Triton内核。
03在英伟达SOL-ExecBench GPU内核优化基准中，Recursive系统将235个内核上的得分从0.699提升至0.754，将距离硬件极限的差距缩小了18%，且团队承认自身并非内核工程专家，优化发现来自系统本身。
04Recursive Superintelligence拥有豪华创始团队，包括田渊栋、Richard Socher、Alexey Dosovitskiy、Tim Rocktäschel、Peter Norvig等，即便无公开产品前已完成6.5亿美元融资，估值46.5亿美元，由GV和Greycroft领投，英伟达和AMD跟投。

反方 / 局限

— Recursive团队承认这仍是"第一步"：当前系统在指标明确、反馈快速、作弊可检测的场景下效果最好，距离自主推进开放性科学问题还有相当距离，奖励作弊的防控是规模化路上的核心挑战。

Recursive Superintelligence田渊栋AnthropicClaude递归自我改进Richard SocherAlexey DosovitskiyNanoChat AutoresearchNanoGPT SpeedrunSOL-ExecBenchAndrej KarpathyGV (Google Ventures)Yann LeCunAMI LabsDavid SilverIneffable Intelligence

15 分钟 · 4 卡片 · 9 资料

读原文 →

Anthropic警告的递归AI，田渊栋新公司刚刚走出了「第一步」

前置背景

平行视角

未来推演

延伸追问