7.3
深览指数
热点智搜··AI 生成
AI自主迭代技术从概念走向工程落地
本文以 Anthropic、OpenAI、DeepSeek 等实验室的实际工程数据为核心,论证了"AI 造 AI"(递归自我改进,RSI)已从理论推演进入可量产阶段,并提供了具体的量化证据:Anthropic 超 80% 代码由 AI 编写、OpenAI 系统 6 周内将准确率从 25% 拉到 86%。作者点出了行业提速背后的结构性矛盾——囚徒困境下的"减速呼吁"与落地现实之间不可调和,并给出了三种可能的技术演进剧本。适合关注 AI 前沿产业、技术治理及资本博弈的高知识水位读者阅读。原文 ↗
核心观点
- ▍"AI 造 AI"(递归自我改进,RSI)已从科幻概念落地为工程现实,头部实验室跑通了 AI 自主优化、设计甚至训练后续模型的完整链路。
- 01截至 2026 年 5 月,Anthropic 生产代码库中超 80% 代码由 Claude 编写;对应工程师人均每天合并代码量达到 2024 年的 8 倍。
- 02OpenAI 公开的 Tax AI 案例:系统在 6 周内通过自动化闭环将字段完成准确率从 25% 拉升到 86%,无人重训练模型或重写核心代码。
- 03DeepSeek 开源了 Deli AutoResearch SKILL 协议,使 AI Agent 无需人类干预即可自主完成实验设计、写代码、调 GPU、跑 RL 训练。
- 04AI 在研发流程中的角色已从"对话助手"跃迁至"自主智能体"级,能分派任务给其他 AI,独立完成复杂实验。
反方 / 局限
- — AI 自主迭代加速可能导致"审计真空":AI 生成代码的速度远超人类审查的极限,安全对齐与目标偏差风险被指数级放大。
- — 尽管 Anthropic 和 OpenAI 呼吁建立类似核不扩散条约的暂停机制,但在资本回报与国家博弈的双重压力下,单方面减速即等同于出局。
- — 受限于算力、能源或架构瓶颈,RSI 可能触碰天花板进入 S 曲线停滞,并不意味着必然持续加速。
AnthropicOpenAIDeepSeekClaude Mythos Preview递归自我改进(RSI)Deli AutoResearch SKILL 协议Tax AI