英伟达年度“最危险”论文！AI自繁衍代码，无限刷级进化

5.9

深览指数

科技腾讯新闻·新智元·06-28 12:10·AI 生成

英伟达年度“最危险”论文！AI自繁衍代码，无限刷级进化

剑桥大学与英伟达联合提出「红皇后哥德尔机器」(RQGM)，让AI不仅能自我进化代码，还能主动进化出更严苛的考官来评判自己，打破了过去20年「哥德尔机」因需要数学证明而无法落地的僵局。论文在代码生成、论文评审、数学证明三个实验中验证了效果，并展示了RQGM如何通过「受控效用进化」机制抑制LLM裁判偏袒AI生成的固有缺陷。文章核心价值在于介绍了这一从「静态基准」迈向「共同进化」的技术框架，适合关注AI自我改进与安全边界的读者。原文 ↗原文 ↗

核心观点

▍红皇后哥德尔机器(RQGM)破除了此前哥德尔机变体(如DGM/HGM)「考官是死的」的盲点，让评估器和任务智能体共同进化，形成无休止的递归自我迭代(RSI)。

01RQGM在Polyglot代码生成测试中，通过率从此前SOTA的69.9%提升至71.7%，且token消耗比对手低1.35到1.72倍。
02在论文评审实验中，RQGM将论文在固定评审小组中的接收率从前SOTA的21.8%推至40.5%。
03在奥赛级数学证明实验中，RQGM进化出的「评分官」比静态基线更准，搜索成本降低了3倍。
04RQGM通过「对抗样本池」机制，专门奖励能揪出AI生成论文的新评审，最终使评审对AI和人类一视同仁，同时保住了80%的真值准确率。
052003年Jürgen Schmidhuber提出的「哥德尔机」因要求每次修改前必须严格数学证明，导致20年无法落地；后续DGM/HGM改用进化筛选绕过证明，但未改变静态考官问题。
06RQGM的「受控效用进化」机制通过分epoch冻结考官、在epoch边界基于「基准真相」锚点数据择优换考官，并执行「选择性擦除」来保证信号稳定。

反方 / 局限

— 作者引用了Jack Clark 60%概率预测2028年RSI到来作为背景，但RQGM论文本身并未讨论该机制可能导致的失控风险、对齐难题或监管对策。
— Anthropic是RSI领域的核心推动者，但文章未提及Anthropic在该方向上的具体成果或与英伟达框架的对比。

红皇后哥德尔机器哥德尔机达尔文哥德尔机赫胥黎哥德尔机 Jürgen Schmidhuber Jack Clark 英伟达剑桥大学 Anthropic Polyglot

9 分钟 · 4 卡片 · 10 资料

读原文 →

英伟达年度“最危险”论文！AI自繁衍代码，无限刷级进化

前置背景

平行视角

未来推演

延伸追问