吞吐量改变一切:Agent 时代的工程哲学
当 Agent 吞吐量远超人类注意力时,很多传统工程规范需要重新思考。
Agent 的产出覆盖全栈
Agent 不只是写业务代码:
- 产品代码 + 测试
- CI 配置 + 发布工具
- 内部开发者工具
- 文档 + 设计历史
- 评估 Harness
- Review 评论 + 回复
- 仓库管理脚本
- 生产 Dashboard 定义
合并策略颠覆
| 传统做法 | Agent-First 做法 |
|---|---|
| 严格阻塞式合并门禁 | 最小阻塞 |
| 长生命周期 PR | 短命 PR |
| 测试失败 = 一切停止 | Flake → 后续 run 修复 |
| 人类 Review 必需 | Agent-to-Agent Review |
修正是廉价的,等待是昂贵的。
自主闭环能力
单个 prompt → Agent 完成完整开发循环:
- 验证代码库状态
- 复现报告的 Bug
- 录屏证明失败
- 实现修复
- 验证修复生效
- 录屏证明修复
- 开 PR
- 响应 Agent / 人类反馈
- 检测并修复构建失败
- 仅在需要判断时升级到人类
- 合并
单次 Codex 运行经常持续 6 小时以上——通常在工程师睡觉时。
熵与垃圾回收
Agent 复制仓库中已有的模式——包括不好的模式。
- 最初:每周五花 20% 时间清理 "AI slop" → 不可扩展
- 正确做法:编码 "Golden Principles" + 周期性清理 Agent
| 策略 | 说明 |
|---|---|
| 共享工具包 | 优于手写 helper,集中不变量 |
| 边界验证 | 不猜数据结构,验证或使用类型化 SDK |
| 定期扫描 | 后台 Agent 检测偏差,开修复 PR |
| 质量评分 | 自动更新各领域质量分数 |
技术债 = 高利贷:持续小额偿还 > 累积后痛苦集中偿还。