从 0 到百万行:Agent-First 的实验
OpenAI 的一个极端实验——零手写代码,用 Codex Agent 构建真实产品。
实验设定
- 起点:2025 年 8 月,一个空 git 仓库
- 约束:0 行手写代码,所有代码由 Codex Agent 生成
- 目标:构建可用的内部软件产品(非 demo)
关键数据
| 指标 | 数值 |
|---|---|
| 代码量 | ~100 万行 |
| PR 数量 | ~1,500 个 |
| 初始团队 | 3 名工程师 |
| 人均日 PR | 3.5 个 |
| 效率提升 | 约 10 倍 |
团队从 3 人扩大到 7 人后,人均吞吐量不降反升——打破 Brooks 定律。
核心理念
Humans steer, Agents execute.
- 工程师不再写代码,而是:设计环境 → 指定意图 → 构建反馈循环
- Agent 卡住时,不是"更努力",而是问:缺了什么能力?如何让它对 Agent 可读?
第一次 Commit
- 仓库脚手架(结构 / CI / 格式规则)→ Codex + GPT-5 生成
- 甚至
AGENTS.md本身也由 Agent 编写 - 从第一天起,仓库就由 Agent 塑造
核心洞察
纪律体现在脚手架,而非代码中。
工具、抽象、反馈循环——让代码库保持一致的"元结构"——比代码本身更重要。