返回 AI编程

Loop Engineering 是什么?AI Agent 时代的新范式,还是新瓶装旧酒?

Loop Engineering 是什么?AI Agent 时代的新范式,还是新瓶装旧酒?

最近,AI 编程圈里一个词突然热了起来:

Loop Engineering,循环工程。

有人说它会取代 Prompt Engineering,有人说它只是把老概念重新包装了一遍。那它到底是什么?能不能落地?有没有真实的实践价值?还是又一个技术圈的新名词游戏?

这篇文章试着从多个角度把它讲清楚。

一、先说结论

Loop Engineering 不是凭空出现的新技术,但也不只是营销概念。

它更准确的定位是:

AI Agent 时代,对“闭环自动化工程”的重新命名和重新组合。

它的新意不在于“循环”本身。

循环、反馈、验证、自动化,这些概念在软件工程、DevOps、控制论、自动化运维里早就存在。

它真正值得关注的地方在于:

现在的 AI 编程 Agent 已经具备了读代码、改代码、跑测试、读取错误、继续修正的能力。

于是,过去很多必须由人手动推进的工程闭环,开始可以被系统化地交给 Agent 执行。

二、什么是 Loop Engineering?

根据 Addy Osmani 的定义,Loop Engineering 的核心是:

你不再亲自一轮轮提示 Agent,而是设计一个系统,让这个系统去提示、调度、验证和推进 Agent。

以前我们使用 AI 编程工具,大多是这样的:

我提一个问题
AI 给一个答案
我复制代码
我运行测试
我把错误贴回去
AI 再改一版
我继续验证

这其实是一个“人肉闭环”。

而 Loop Engineering 想做的是,把这个闭环系统化:

发现任务
  -> 提供上下文
  -> Agent 执行
  -> 自动验证
  -> 读取结果
  -> 失败则继续修正
  -> 成功则记录状态
  -> 决定下一步

所以,Loop Engineering 关注的不是“如何写一条完美提示词”,而是:

  • 任务从哪里来?
  • Agent 拿到什么上下文?
  • 它可以调用哪些工具?
  • 怎么判断它做对了?
  • 失败几次后应该停止?
  • 哪些情况必须交给人?
  • 多个 Agent 如何协作?
  • 状态、日志、成本如何管理?

一句话概括:

Prompt Engineering 关注一次回答,Loop Engineering 关注一个持续运行的工程系统。

三、它和 Prompt Engineering 有什么区别?

可以用一张表理解:

| 维度 | Prompt Engineering | Loop Engineering |
|---|---|---|
| 工作单位 | 一条提示词 | 一个持续运行的工作流 |
| 优化目标 | 让模型这次回答更好 | 让系统最终完成任务 |
| 人的角色 | 手动提示者 | 流程设计者、监督者 |
| 核心能力 | 表达清楚 | 调度、验证、状态管理、失败控制 |
| 常见风险 | 回答不准确 | 错误被自动化放大、成本失控、误判完成 |

这并不意味着 Prompt Engineering 没用了。

恰恰相反,Loop 里面仍然包含很多 Prompt。只是 Prompt 不再是全部,它变成了系统中的一个零件。

更完整的层次大概是:

| 层级 | 作用 |
|---|---|
| Prompt Engineering | 单次指令怎么写 |
| Context Engineering | 给 Agent 什么上下文 |
| Harness Engineering | 单次 Agent 运行时的工具、权限和规则 |
| Loop Engineering | 多轮任务如何发现、执行、验证、升级和记录 |
| Fleet Engineering | 多个 Agent 或多个 Loop 如何治理 |

可以这样理解:

Harness 是给一次 Agent 执行装上工具和护栏。Loop 是让多次 Agent 执行形成持续闭环。

四、一个典型 Loop 长什么样?

假设我们要设计一个“自动修复 GitHub Issue”的 Loop,它可能是这样的:

1. 从 GitHub Issues 中找到带有 bug 标签的问题
2. 创建独立 worktree
3. 让 Agent 阅读 issue、相关代码和测试
4. Agent 提出修复方案
5. Agent 修改代码
6. 自动运行测试、lint、类型检查
7. 如果失败,把错误日志反馈给 Agent
8. Agent 继续修复
9. 最多尝试 3 次
10. 成功后生成 PR
11. 另一个 Agent 或人类进行 review
12. 记录本次处理结果

这个流程已经不是“一句提示词”能解决的事情。

它涉及任务发现、上下文组装、工具调用、验证机制、失败控制、状态记录和人工介入点。

这就是 Loop Engineering 和普通 Prompt 使用之间的差别。

五、Loop Engineering 能落地吗?

答案是:

可以落地,但不能理解成“按下按钮,AI 自动开发完整系统”。

目前更适合落地的场景包括:

  • Issue 自动分类和补充上下文
  • 小型 bug 修复
  • CI 失败分析和局部修复
  • 依赖升级
  • 文档同步
  • 测试补全
  • 代码审查辅助
  • 重复性迁移
  • changelog 自动生成

这些场景有一个共同点:

边界相对清晰,验证方式比较明确。

比如测试能不能通过,lint 有没有报错,类型检查是否成功,文档是否和代码一致。

这些都是 Agent 可以围绕反馈不断修正的任务。

六、哪些场景不适合直接上 Loop?

Loop Engineering 不是万能的。

以下场景不适合一开始就全自动化:

  • 产品需求不清楚
  • 业务判断很重
  • 架构方向需要权衡
  • 涉及安全、权限、资金、数据删除等高风险操作
  • 缺少自动化测试和验收标准
  • 老系统高度耦合,影响范围难判断
  • 团队本身没有工程规范

所以,Loop Engineering 的前提不是“AI 足够聪明”,而是:

你的工程系统本身要足够可验证。

如果没有测试,没有 lint,没有类型检查,没有 CI,没有 review 规范,Loop Engineering 很容易变成:

AI 在黑箱里反复自嗨。

这不是工程化,而是自动化地制造不确定性。

七、它的实践价值在哪里?

Loop Engineering 真正有价值的地方,主要有三个。

1. 把 AI 使用从“聊天”推进到“工程系统”

很多团队现在用 AI 编程,仍然停留在问答模式。

人负责拆任务、贴上下文、跑测试、判断结果,AI 只是提供代码片段。

Loop Engineering 的价值在于,把这些重复动作变成系统流程。

人不再每一步都亲自推动,而是设计好规则、边界和验证机制,让 Agent 在闭环中持续推进。

2. 让“验证”成为 AI 工作流的中心

AI 编程最大的问题不是它不会写代码,而是它经常“看起来对”。

Loop Engineering 的重点不是让 AI 多写代码,而是让 AI 在反馈中工作。

这些反馈可以包括:

  • 单元测试
  • 集成测试
  • lint
  • 类型检查
  • 构建结果
  • 浏览器检查
  • 日志分析
  • 静态扫描
  • Code Review

好的 Loop 应该不断把这些验证信号反馈给 Agent,让它基于事实修正,而不是基于自信继续生成。

从“看起来对”,变成“被验证过”,这是 Loop Engineering 的核心价值之一。

3. 让团队沉淀可复用的 Agent 工作流

以前,一个资深工程师怎么用 AI,很大程度上是个人经验。

他知道怎么拆任务,怎么补上下文,怎么让 AI 修错误,怎么判断结果是否靠谱。

但这些经验很难复制给团队。

Loop Engineering 试图把这些经验沉淀成:

  • 项目规范
  • Agent 指令
  • 工具权限
  • 验收规则
  • 自动化脚本
  • 失败处理策略
  • 人类介入节点

这对团队非常重要。

因为 AI 不应该只靠每个人临场发挥,而应该被纳入工程流程。

八、Loop Engineering 的风险

Loop Engineering 最容易被高估的地方,是大家容易把“循环”误解成“自主智能”。

但实际上,Loop 的质量取决于一堆非常现实的工程问题:

  • 任务是否清晰
  • 上下文是否完整
  • 工具是否可靠
  • 验证是否有效
  • 停止条件是否明确
  • 权限边界是否安全
  • 成本是否可控
  • 人类是否仍在关键节点判断

常见反模式包括:

  • 让同一个 Agent 自己实现、自己验收
  • 没有最大尝试次数,导致 token 成本失控
  • 测试很弱,却把测试通过当成完成
  • 没有人类 review
  • Agent 可以直接修改高风险配置
  • 状态记录混乱,失败原因无法追踪
  • 多 Agent 互相调用,但没有最终负责人

尤其要注意一点:

不能让 Agent 同时当运动员和裁判。

一个 Agent 写代码,最好由另一个 Agent 或人类来检查。关键业务场景,最终判断权仍然应该在人手里。

九、GitHub 上有相关实践吗?

有,而且已经出现了一批项目。

比较值得关注的包括:

1. cobusgreyling/loop-engineering

这是目前最贴近 Loop Engineering 概念的仓库之一。

它提供了模式、starter、CLI 工具、反模式文档等内容,面向 Grok、Claude Code、Codex、Cursor 等 AI coding agents。

项目地址:

https://github.com/cobusgreyling/loop-engineering

2. eugenelim/agent-ready-repo

这个项目关注如何把一个 repo 改造成适合 Agent 工作的结构。

它强调 plan、execute、verify、review,并通过检查机制限制 Agent 走捷径。

项目地址:

https://github.com/eugenelim/agent-ready-repo

3. Saik0s/agent-loop

这是一个 AI 驱动软件开发框架,用 orchestrator 管理多个专门 Agent,覆盖计划、架构、编码、测试和部署等流程。

项目地址:

https://github.com/Saik0s/agent-loop

4. GitHub Topic: loop-engineering

可以通过 GitHub Topic 观察相关项目生态。

https://github.com/topics/loop-engineering

不过整体来看,这个生态还处在早期。

很多项目更像是模式库、实验框架、starter 或概念验证,还没到成熟标准框架的阶段。

十、它是不是新瓶装旧酒?

这个问题很关键。

我的判断是:

一半是旧酒,一半是新瓶真的有用。

说它是旧酒,是因为这些思想以前就存在:

  • DevOps 里有 CI/CD 闭环
  • 控制论里有反馈控制
  • 软件工程里有测试驱动开发
  • 自动化运维里有 observe -> act -> verify
  • 机器人系统里有 perceive -> reason -> act
  • 工作流系统里早就有 orchestration
  • AutoGPT 时代也讲过 agent loop

所以,“循环、反馈、验证、自动化”不是新东西。

但说它不只是旧酒,是因为这一次循环中的执行单元变了。

过去自动化流程里的执行步骤,多数是确定性脚本:

运行测试
执行构建
部署服务
发送通知

而现在,循环里多了一个可以读代码、理解需求、修改实现、补测试、解释错误、继续修复的 AI Agent。

理解 issue
定位代码
提出方案
修改实现
补充测试
读取失败日志
继续修复

这让很多过去难以自动化的“半结构化工程任务”进入了自动化范围。

这就是 Loop Engineering 值得单独讨论的原因。

所以更准确的说法是:

Loop Engineering 是旧的闭环工程思想,在 AI Agent 能力成熟后的重新工程化。

它不是科学突破,但它可能是工程范式的变化。

十一、现在成熟了吗?

以目前来看,Loop Engineering 仍处于早期阶段。

我会给它一个判断:

概念热度高,实践还早期,但方向成立。

它还不是像 React、Kubernetes、GitHub Actions 那样成熟稳定的技术生态。

但背后的趋势是真实的:

  • AI Agent 会越来越能长时间执行任务
  • 代码仓库会越来越需要变得 agent-ready
  • 工程团队会把 AI 纳入 CI、review、issue、文档、测试流程
  • 人类会从逐步操作,转向设计边界、验证标准和升级机制

真正有价值的,不是追逐“Loop Engineering”这个词,而是吸收它背后的工程原则:

明确目标
提供上下文
限制权限
自动验证
记录状态
控制成本
失败升级
人类最终负责

十二、如果要落地,应该怎么开始?

不建议一上来就做“全自动开发 Loop”。

更稳妥的路径是分阶段推进。

第一阶段:只读 Loop

先让 Agent 做观察和分析,不直接改代码。

比如:

  • 自动总结 issue
  • 分析 CI 失败原因
  • 生成 review 建议
  • 扫描代码风险
  • 汇总文档差异

这一阶段风险低,也方便团队建立信任。

第二阶段:低风险写入 Loop

再让 Agent 做一些边界清晰的修改。

比如:

  • 更新文档
  • 生成测试
  • 修复格式问题
  • 升级小版本依赖
  • 修改简单 bug

但仍然需要 review 和 CI 验证。

第三阶段:受控开发 Loop

最后再进入更复杂的代码修改流程。

此时必须有:

  • 最大尝试次数
  • 可修改目录限制
  • 必须通过的检查
  • 明确的停止条件
  • 失败后的升级机制
  • 人类 review

核心原则是:

让 Agent 多做重复劳动,但不要让它绕过工程纪律。

十三、最终判断

Loop Engineering 不是纯新概念,也不是纯炒作。

它更像是 AI Agent 时代对软件工程自动化的一次重新分层。

Prompt 是零件。
Context 是燃料。
Harness 是单次运行环境。
Loop 是可持续交付系统。

如果一个团队只是把“让 AI 多跑几轮”叫做 Loop Engineering,那它确实只是新瓶装旧酒。

但如果团队真的把它落到:

  • 测试
  • CI
  • 权限控制
  • Code Review
  • 状态记录
  • 成本控制
  • 失败处理
  • 人类介入机制

这些硬东西上,那它就不只是一个新名词。

它可能代表着 AI 编程从“个人效率工具”进入“工程化生产系统”的一个重要阶段。

真正的问题不是:Loop Engineering 是不是新概念。

真正的问题是:

你的团队有没有能力设计一个可信、可控、可验证的 AI 工作闭环?