第4章 吞吐量改变一切 | Harness Engineering — Agent-First 时代的软件工程新范式

吞吐量改变一切:Agent 时代的工程哲学

当 Agent 吞吐量远超人类注意力时,很多传统工程规范需要重新思考。


Agent 的产出覆盖全栈

Agent 不只是写业务代码:

合并策略颠覆

传统做法Agent-First 做法
严格阻塞式合并门禁最小阻塞
长生命周期 PR短命 PR
测试失败 = 一切停止Flake → 后续 run 修复
人类 Review 必需Agent-to-Agent Review

修正是廉价的,等待是昂贵的。

自主闭环能力

单个 prompt → Agent 完成完整开发循环:

  1. 验证代码库状态
  2. 复现报告的 Bug
  3. 录屏证明失败
  4. 实现修复
  5. 验证修复生效
  6. 录屏证明修复
  7. 开 PR
  8. 响应 Agent / 人类反馈
  9. 检测并修复构建失败
  10. 仅在需要判断时升级到人类
  11. 合并

单次 Codex 运行经常持续 6 小时以上——通常在工程师睡觉时。

熵与垃圾回收

Agent 复制仓库中已有的模式——包括不好的模式

策略说明
共享工具包优于手写 helper,集中不变量
边界验证不猜数据结构,验证或使用类型化 SDK
定期扫描后台 Agent 检测偏差,开修复 PR
质量评分自动更新各领域质量分数

技术债 = 高利贷:持续小额偿还 > 累积后痛苦集中偿还。