科技 人人都是产品经理 · iffffff · 昨天 14:30 · AI 生成
停止提示你的AI!2026年最值得了解的新范式:Loop Engineering Loop Engineering 是一种让开发者从“提示者”转变为“系统设计者”的新范式,核心是构建自动循环让 AI 自主完成任务,而非手动逐轮提示。文章介绍了六大核心模块(触发器、目标、工具、记忆、验证、预算)和三个实战场景,揭示了如何让 AI 真正成为自主工作的生产力工具。适合已熟悉 AI 基础使用方法、想进一步提升效率的开发者阅读。原文 ↗ 原文 ↗
核心观点
▍ 开发者应停止逐条提示AI,转而设计让AI自主工作的循环系统,即 Loop Engineering。 ▍ Loop Engineering 的核心是让开发者从“提示者”变为“系统设计者”,AI在设定框架内自主驱动完成复杂任务。 01 Anthropic Claude Code 负责人 Boris Cherny 公开表示自己的工作是写 loops 而非直接提示 Claude。 02 概念源自开发者 Peter Steinberger 一条获650万次浏览的推文,后由 Google 工程师 Addy Osmani 正式命名为 Loop Engineering。 03 Loop 需明确触发器(如PR、CI报错)和可验证目标(如“所有测试通过”),缺乏目标的循环是“烧钱的机器”。 04 执行者与评判者 Agent 应分开设计,以避免“自产自销”的盲点,同时必须设定预算控制(如最大重试5次)防止死循环。 05 实战场景包括:CI自动修复、PR自动审查、任务自动拆解与执行,其中CI自动修复因目标客观(CI是否通过)最适合入门。 反方 / 局限
— Loop Engineering 的实用性高度依赖模型能力——作者承认模型在2025年底后“跨过了一个槛”才使该玩法可行,早期模型无法有效处理复杂状态判断。 — 任务自动拆解场景最容易出问题:任务越复杂,中间分叉越多,对上下文管理和预算控制要求越高,且人类介入仍是最终保障。 Loop Engineering Anthropic Boris Cherny Addy Osmani Peter Steinberger Claude Code
10 分钟 · 4 卡片 · 11 资料
读原文 →
前置背景 从Prompt到Loop:工程范式跃迁
Loop Engineering 并非凭空出现,它是 AI 交互工程从『提示词工程』到『上下文工程』再到『Harness 工程』自然演进的最新节点。提示词工程解决『怎么把任务讲清楚』,上下文工程解决『怎么把信息给对』,而 Loop/Harness 工程则回答『怎么让模型在真实执行中持续做对』。这三层不是替代关系,是层层叠加:写好提示词依然是基础,但要让 Agent 自主完成多步复杂任务,必须把『生成-评估-优化』循环搭成系统——这是 2026 年开发者从『提示者』转型为『系统设计者』的真正内涵。
▸ 3 条关联资料
▼
平行视角 Loop 的争议:烧掉 Token 还是解放人力
尽管 Loop Engineering 概念爆火,开发者社区内部分歧尖锐。一派认为『你不再需要给 Agent 写提示词,该设计循环让 Agent 自己提示自己』,另一派则直言『Loop 烧 Token 如流水,没有无限预算还不如人工测试』。澳洲开发者 Huntley 用一行 bash 脚本+297 美元造出一门编程语言的案例被双方各取所需——支持者看到系统设计的杠杆,反对者指出那只是『同一个提示反复喂』的特殊情况,并非通用方案。这场争论的核心不是谁对谁错,而是『一次做对』与『持续逼近』两种方法论在不同任务类型上的真实成本权衡。
▸ 3 条关联资料
▼
未来推演 AI 自我进化的拐点已现
Loop Engineering 的经验正加速向『递归自我改进』(RSI)方向演化。Anthropic 2026 年 6 月披露的数据显示,其合并进代码库的代码已超 80% 由 Claude 编写,典型工程师日产出量是 2024 年的 8 倍。更激进的 MOSS 系统已能识别自身逻辑缺陷、自主修改源代码并通过测试验证——每次任务失败都成为自我升级的输入。关键变量在于:『选择研究方向的判断力』仍由人主导,但『执行与验证』正全面自动化。2026 智源大会专门设立『AI 自进化论坛』,讨论焦点已从『能不能自进化』转向『自进化的安全边界设在哪里』。
▸ 3 条关联资料
▼
延伸追问 谁是 Loop 中的守门人
文章提到『执行 Agent 和验证 Agent 最好是分开的』,但这引出一个更根本的问题:如果验证 Agent 也是 LLM,它凭什么保证自己的判断比执行 Agent 更可靠?清华 Agent-SafetyBench 测试显示,16 款主流 LLM Agent 安全得分均未超 60%,最薄弱环节正是『调用危险工具』。这意味着不加约束的自验证循环可能不是『双重保险』,而是『双重幻觉』。一个值得深挖的方向是:如何在 Loop 中嵌入确定性校验(如测试用例通过率、静态分析结果),而非完全依赖另一个 LLM 来做裁判?
▸ 2 条关联资料
▼