5.9
深览指数
科技腾讯新闻·新智元··AI 生成

英伟达年度“最危险”论文!AI自繁衍代码,无限刷级进化

剑桥大学与英伟达联合提出「红皇后哥德尔机器」(RQGM),让AI不仅能自我进化代码,还能主动进化出更严苛的考官来评判自己,打破了过去20年「哥德尔机」因需要数学证明而无法落地的僵局。论文在代码生成、论文评审、数学证明三个实验中验证了效果,并展示了RQGM如何通过「受控效用进化」机制抑制LLM裁判偏袒AI生成的固有缺陷。文章核心价值在于介绍了这一从「静态基准」迈向「共同进化」的技术框架,适合关注AI自我改进与安全边界的读者。原文 ↗

核心观点
  • 红皇后哥德尔机器(RQGM)破除了此前哥德尔机变体(如DGM/HGM)「考官是死的」的盲点,让评估器和任务智能体共同进化,形成无休止的递归自我迭代(RSI)。
  1. 01RQGM在Polyglot代码生成测试中,通过率从此前SOTA的69.9%提升至71.7%,且token消耗比对手低1.35到1.72倍。
  2. 02在论文评审实验中,RQGM将论文在固定评审小组中的接收率从前SOTA的21.8%推至40.5%。
  3. 03在奥赛级数学证明实验中,RQGM进化出的「评分官」比静态基线更准,搜索成本降低了3倍。
  4. 04RQGM通过「对抗样本池」机制,专门奖励能揪出AI生成论文的新评审,最终使评审对AI和人类一视同仁,同时保住了80%的真值准确率。
  5. 052003年Jürgen Schmidhuber提出的「哥德尔机」因要求每次修改前必须严格数学证明,导致20年无法落地;后续DGM/HGM改用进化筛选绕过证明,但未改变静态考官问题。
  6. 06RQGM的「受控效用进化」机制通过分epoch冻结考官、在epoch边界基于「基准真相」锚点数据择优换考官,并执行「选择性擦除」来保证信号稳定。
反方 / 局限
  • 作者引用了Jack Clark 60%概率预测2028年RSI到来作为背景,但RQGM论文本身并未讨论该机制可能导致的失控风险、对齐难题或监管对策。
  • Anthropic是RSI领域的核心推动者,但文章未提及Anthropic在该方向上的具体成果或与英伟达框架的对比。
9 分钟 · 4 卡片 · 10 资料
读原文 →

前置背景

平行视角

未来推演

延伸追问