7.9
深览指数
科技Bestblogs·知识分子··AI 生成

如果论文的主要读者不再是人

当AI全面介入科研循环,从辅助写作到自动验证,学术影响力评价体系面临根本性挑战。文章以数学形式化验证为锚点,提出AI系统的调用记录(如Asta追踪的500万次引用)可能成为新的影响力度量,但也面临Goodhart定律的博弈风险。核心洞见在于:碳基学者的影响力将日益取决于其在硅基系统中的可检索性与可复用性,但驱动好研究的本质仍是好奇心与追问“为什么成立”。适合关心科研范式变革、学术评价制度、AI Agent对知识生产影响的深度读者。原文 ↗

核心观点
  • AI介入科研后,个人产出膨胀但集体视野收缩,传统学术评价体系不再适用,AI系统的调用记录可能成为新的影响力度量。
  • 数学的形式化验证(Lean、Asta)为AI时代的学术评价提供了独特出路:当证明可被机器判定,人类转向策略与方向选择,影响力载体从“发表论文”扩展为“可被AI调用的数学对象”。
  1. 01Nature研究显示:AI增强型研究者论文量增加3倍,引用量增加5倍,但科学整体主题覆盖收缩4.63%,交叉承接互动下降22%。
  2. 02Allen AI的Asta系统在半年内追踪了近500万次AI对论文的引用,覆盖207万篇论文,这些引用未在传统引用指标中体现。
  3. 03LeanSearch的调用量在三个月内增长了50倍;AlphaProof已能在Lean 4中解决IMO级别问题,表明形式化验证能力快速提升。
  4. 04Scholze发起的Liquid Tensor Experiment通过形式化确认了数学定理的正确性,完成后反而获得了更深层次的理解。
  5. 05作者提出框架:碳基学者的影响力日益取决于在硅基系统中可检索、可调用、可复用的程度,而非传统作者资历或期刊级别。
反方 / 局限
  • 作者明确承认Goodhart定律风险:一旦AI调用量成为考核目标,就会被博弈,因此只能作为辅助观察信号,不能替代人类判断。
  • 文章指出软件引用鸿沟问题:GitHub上的代码、形式化库中的引理等可能影响力巨大,但未被正式引用体系捕获,存在度量盲区。
  • 作者隐含的风险提示:当AI降低了常规问题求解成本,真正稀缺的是“值得被用”而非“做出来”,可能导致研究选题的同质化或功利化。
Allen AIAstaLeanAlphaProofGoodhart定律Liquid Tensor ExperimentScholzeNature
4 分钟 · 5 卡片 · 11 资料
读原文 →

概念锚点

前置背景

平行视角

未来推演

延伸追问