Loop Engineering 是什么？AI Agent 时代的新范式，还是新瓶装旧酒？

最近，AI 编程圈里一个词突然热了起来：

Loop Engineering，循环工程。

有人说它会取代 Prompt Engineering，有人说它只是把老概念重新包装了一遍。那它到底是什么？能不能落地？有没有真实的实践价值？还是又一个技术圈的新名词游戏？

这篇文章试着从多个角度把它讲清楚。

一、先说结论

Loop Engineering 不是凭空出现的新技术，但也不只是营销概念。

它更准确的定位是：

AI Agent 时代，对“闭环自动化工程”的重新命名和重新组合。

它的新意不在于“循环”本身。

循环、反馈、验证、自动化，这些概念在软件工程、DevOps、控制论、自动化运维里早就存在。

它真正值得关注的地方在于：

现在的 AI 编程 Agent 已经具备了读代码、改代码、跑测试、读取错误、继续修正的能力。

于是，过去很多必须由人手动推进的工程闭环，开始可以被系统化地交给 Agent 执行。

二、什么是 Loop Engineering？

根据 Addy Osmani 的定义，Loop Engineering 的核心是：

你不再亲自一轮轮提示 Agent，而是设计一个系统，让这个系统去提示、调度、验证和推进 Agent。

以前我们使用 AI 编程工具，大多是这样的：

我提一个问题
AI 给一个答案
我复制代码
我运行测试
我把错误贴回去
AI 再改一版
我继续验证

这其实是一个“人肉闭环”。

而 Loop Engineering 想做的是，把这个闭环系统化：

发现任务
  -> 提供上下文
  -> Agent 执行
  -> 自动验证
  -> 读取结果
  -> 失败则继续修正
  -> 成功则记录状态
  -> 决定下一步

所以，Loop Engineering 关注的不是“如何写一条完美提示词”，而是：

任务从哪里来？
Agent 拿到什么上下文？
它可以调用哪些工具？
怎么判断它做对了？
失败几次后应该停止？
哪些情况必须交给人？
多个 Agent 如何协作？
状态、日志、成本如何管理？

一句话概括：

Prompt Engineering 关注一次回答，Loop Engineering 关注一个持续运行的工程系统。

三、它和 Prompt Engineering 有什么区别？

可以用一张表理解：

| 维度 | Prompt Engineering | Loop Engineering |
|---|---|---|
| 工作单位 | 一条提示词 | 一个持续运行的工作流 |
| 优化目标 | 让模型这次回答更好 | 让系统最终完成任务 |
| 人的角色 | 手动提示者 | 流程设计者、监督者 |
| 核心能力 | 表达清楚 | 调度、验证、状态管理、失败控制 |
| 常见风险 | 回答不准确 | 错误被自动化放大、成本失控、误判完成 |

这并不意味着 Prompt Engineering 没用了。

恰恰相反，Loop 里面仍然包含很多 Prompt。只是 Prompt 不再是全部，它变成了系统中的一个零件。

更完整的层次大概是：

| 层级 | 作用 |
|---|---|
| Prompt Engineering | 单次指令怎么写 |
| Context Engineering | 给 Agent 什么上下文 |
| Harness Engineering | 单次 Agent 运行时的工具、权限和规则 |
| Loop Engineering | 多轮任务如何发现、执行、验证、升级和记录 |
| Fleet Engineering | 多个 Agent 或多个 Loop 如何治理 |

可以这样理解：

Harness 是给一次 Agent 执行装上工具和护栏。Loop 是让多次 Agent 执行形成持续闭环。

四、一个典型 Loop 长什么样？

假设我们要设计一个“自动修复 GitHub Issue”的 Loop，它可能是这样的：

1. 从 GitHub Issues 中找到带有 bug 标签的问题
2. 创建独立 worktree
3. 让 Agent 阅读 issue、相关代码和测试
4. Agent 提出修复方案
5. Agent 修改代码
6. 自动运行测试、lint、类型检查
7. 如果失败，把错误日志反馈给 Agent
8. Agent 继续修复
9. 最多尝试 3 次
10. 成功后生成 PR
11. 另一个 Agent 或人类进行 review
12. 记录本次处理结果

这个流程已经不是“一句提示词”能解决的事情。

它涉及任务发现、上下文组装、工具调用、验证机制、失败控制、状态记录和人工介入点。

这就是 Loop Engineering 和普通 Prompt 使用之间的差别。

五、Loop Engineering 能落地吗？

答案是：

可以落地，但不能理解成“按下按钮，AI 自动开发完整系统”。

目前更适合落地的场景包括：

Issue 自动分类和补充上下文
小型 bug 修复
CI 失败分析和局部修复
依赖升级
文档同步
测试补全
代码审查辅助
重复性迁移
changelog 自动生成

这些场景有一个共同点：

边界相对清晰，验证方式比较明确。

比如测试能不能通过，lint 有没有报错，类型检查是否成功，文档是否和代码一致。

这些都是 Agent 可以围绕反馈不断修正的任务。

六、哪些场景不适合直接上 Loop？

Loop Engineering 不是万能的。

以下场景不适合一开始就全自动化：

产品需求不清楚
业务判断很重
架构方向需要权衡
涉及安全、权限、资金、数据删除等高风险操作
缺少自动化测试和验收标准
老系统高度耦合，影响范围难判断
团队本身没有工程规范

所以，Loop Engineering 的前提不是“AI 足够聪明”，而是：

你的工程系统本身要足够可验证。

如果没有测试，没有 lint，没有类型检查，没有 CI，没有 review 规范，Loop Engineering 很容易变成：

AI 在黑箱里反复自嗨。

这不是工程化，而是自动化地制造不确定性。

七、它的实践价值在哪里？

Loop Engineering 真正有价值的地方，主要有三个。

1. 把 AI 使用从“聊天”推进到“工程系统”

很多团队现在用 AI 编程，仍然停留在问答模式。

人负责拆任务、贴上下文、跑测试、判断结果，AI 只是提供代码片段。

Loop Engineering 的价值在于，把这些重复动作变成系统流程。

人不再每一步都亲自推动，而是设计好规则、边界和验证机制，让 Agent 在闭环中持续推进。

2. 让“验证”成为 AI 工作流的中心

AI 编程最大的问题不是它不会写代码，而是它经常“看起来对”。

Loop Engineering 的重点不是让 AI 多写代码，而是让 AI 在反馈中工作。

这些反馈可以包括：

单元测试
集成测试
lint
类型检查
构建结果
浏览器检查
日志分析
静态扫描
Code Review

好的 Loop 应该不断把这些验证信号反馈给 Agent，让它基于事实修正，而不是基于自信继续生成。

从“看起来对”，变成“被验证过”，这是 Loop Engineering 的核心价值之一。

3. 让团队沉淀可复用的 Agent 工作流

以前，一个资深工程师怎么用 AI，很大程度上是个人经验。

他知道怎么拆任务，怎么补上下文，怎么让 AI 修错误，怎么判断结果是否靠谱。

但这些经验很难复制给团队。

Loop Engineering 试图把这些经验沉淀成：

项目规范
Agent 指令
工具权限
验收规则
自动化脚本
失败处理策略
人类介入节点

这对团队非常重要。

因为 AI 不应该只靠每个人临场发挥，而应该被纳入工程流程。

八、Loop Engineering 的风险

Loop Engineering 最容易被高估的地方，是大家容易把“循环”误解成“自主智能”。

但实际上，Loop 的质量取决于一堆非常现实的工程问题：

任务是否清晰
上下文是否完整
工具是否可靠
验证是否有效
停止条件是否明确
权限边界是否安全
成本是否可控
人类是否仍在关键节点判断

常见反模式包括：

让同一个 Agent 自己实现、自己验收
没有最大尝试次数，导致 token 成本失控
测试很弱，却把测试通过当成完成
没有人类 review
Agent 可以直接修改高风险配置
状态记录混乱，失败原因无法追踪
多 Agent 互相调用，但没有最终负责人

尤其要注意一点：

不能让 Agent 同时当运动员和裁判。

一个 Agent 写代码，最好由另一个 Agent 或人类来检查。关键业务场景，最终判断权仍然应该在人手里。

九、GitHub 上有相关实践吗？

有，而且已经出现了一批项目。

比较值得关注的包括：

1. cobusgreyling/loop-engineering

这是目前最贴近 Loop Engineering 概念的仓库之一。

它提供了模式、starter、CLI 工具、反模式文档等内容，面向 Grok、Claude Code、Codex、Cursor 等 AI coding agents。

项目地址：

https://github.com/cobusgreyling/loop-engineering

2. eugenelim/agent-ready-repo

这个项目关注如何把一个 repo 改造成适合 Agent 工作的结构。

它强调 plan、execute、verify、review，并通过检查机制限制 Agent 走捷径。

项目地址：

https://github.com/eugenelim/agent-ready-repo

3. Saik0s/agent-loop

这是一个 AI 驱动软件开发框架，用 orchestrator 管理多个专门 Agent，覆盖计划、架构、编码、测试和部署等流程。

项目地址：

https://github.com/Saik0s/agent-loop

4. GitHub Topic: loop-engineering

可以通过 GitHub Topic 观察相关项目生态。

https://github.com/topics/loop-engineering

不过整体来看，这个生态还处在早期。

很多项目更像是模式库、实验框架、starter 或概念验证，还没到成熟标准框架的阶段。

十、它是不是新瓶装旧酒？

这个问题很关键。

我的判断是：

一半是旧酒，一半是新瓶真的有用。

说它是旧酒，是因为这些思想以前就存在：

DevOps 里有 CI/CD 闭环
控制论里有反馈控制
软件工程里有测试驱动开发
自动化运维里有 observe -> act -> verify
机器人系统里有 perceive -> reason -> act
工作流系统里早就有 orchestration
AutoGPT 时代也讲过 agent loop

所以，“循环、反馈、验证、自动化”不是新东西。

但说它不只是旧酒，是因为这一次循环中的执行单元变了。

过去自动化流程里的执行步骤，多数是确定性脚本：

运行测试
执行构建
部署服务
发送通知

而现在，循环里多了一个可以读代码、理解需求、修改实现、补测试、解释错误、继续修复的 AI Agent。

理解 issue
定位代码
提出方案
修改实现
补充测试
读取失败日志
继续修复

这让很多过去难以自动化的“半结构化工程任务”进入了自动化范围。

这就是 Loop Engineering 值得单独讨论的原因。

所以更准确的说法是：

Loop Engineering 是旧的闭环工程思想，在 AI Agent 能力成熟后的重新工程化。

它不是科学突破，但它可能是工程范式的变化。

十一、现在成熟了吗？

以目前来看，Loop Engineering 仍处于早期阶段。

我会给它一个判断：

概念热度高，实践还早期，但方向成立。

它还不是像 React、Kubernetes、GitHub Actions 那样成熟稳定的技术生态。

但背后的趋势是真实的：

AI Agent 会越来越能长时间执行任务
代码仓库会越来越需要变得 agent-ready
工程团队会把 AI 纳入 CI、review、issue、文档、测试流程
人类会从逐步操作，转向设计边界、验证标准和升级机制

真正有价值的，不是追逐“Loop Engineering”这个词，而是吸收它背后的工程原则：

明确目标
提供上下文
限制权限
自动验证
记录状态
控制成本
失败升级
人类最终负责

十二、如果要落地，应该怎么开始？

不建议一上来就做“全自动开发 Loop”。

更稳妥的路径是分阶段推进。

第一阶段：只读 Loop

先让 Agent 做观察和分析，不直接改代码。

比如：

自动总结 issue
分析 CI 失败原因
生成 review 建议
扫描代码风险
汇总文档差异

这一阶段风险低，也方便团队建立信任。

第二阶段：低风险写入 Loop

再让 Agent 做一些边界清晰的修改。

比如：

更新文档
生成测试
修复格式问题
升级小版本依赖
修改简单 bug

但仍然需要 review 和 CI 验证。

第三阶段：受控开发 Loop

最后再进入更复杂的代码修改流程。

此时必须有：

最大尝试次数
可修改目录限制
必须通过的检查
明确的停止条件
失败后的升级机制
人类 review

核心原则是：

让 Agent 多做重复劳动，但不要让它绕过工程纪律。

十三、最终判断

Loop Engineering 不是纯新概念，也不是纯炒作。

它更像是 AI Agent 时代对软件工程自动化的一次重新分层。

Prompt 是零件。
Context 是燃料。
Harness 是单次运行环境。
Loop 是可持续交付系统。

如果一个团队只是把“让 AI 多跑几轮”叫做 Loop Engineering，那它确实只是新瓶装旧酒。

但如果团队真的把它落到：

测试
CI
权限控制
Code Review
状态记录
成本控制
失败处理
人类介入机制

这些硬东西上，那它就不只是一个新名词。

它可能代表着 AI 编程从“个人效率工具”进入“工程化生产系统”的一个重要阶段。

真正的问题不是：Loop Engineering 是不是新概念。

真正的问题是：

你的团队有没有能力设计一个可信、可控、可验证的 AI 工作闭环？

Loop Engineering 是什么？AI Agent 时代的新范式，还是新瓶装旧酒？

一、先说结论

二、什么是 Loop Engineering？

三、它和 Prompt Engineering 有什么区别？

四、一个典型 Loop 长什么样？

五、Loop Engineering 能落地吗？

六、哪些场景不适合直接上 Loop？

七、它的实践价值在哪里？

1. 把 AI 使用从“聊天”推进到“工程系统”

2. 让“验证”成为 AI 工作流的中心

3. 让团队沉淀可复用的 Agent 工作流

八、Loop Engineering 的风险

九、GitHub 上有相关实践吗？

1. cobusgreyling/loop-engineering

2. eugenelim/agent-ready-repo

3. Saik0s/agent-loop

4. GitHub Topic: loop-engineering

十、它是不是新瓶装旧酒？

十一、现在成熟了吗？

十二、如果要落地，应该怎么开始？

第一阶段：只读 Loop

第二阶段：低风险写入 Loop

第三阶段：受控开发 Loop

十三、最终判断

欢迎登录