AI 时代的战略型工程师

课程总览 · 更新于 2026-06-15 · 你的私人学习地图

使命(Why):AI 正在吞噬战术性、实地性编程。把规划、QA、代码库设计这些"过去让人从初级升到高级"的战略技能练成日常基本功,并把 Claude Code / Codex 从"原始对话式用法"升级为稳定、高杠杆的协作伙伴。
完整使命见 MISSION.md
🔄 开始复习 跨课随机抽卡(背诵 + 复述),偏向更早学的课——间隔 + 交织检索练习,记得才牢。也可以直接在对话里跟我说"考考我"。
进入复习 →

一张图看懂主线:委派阶梯

整个课程的骨架。按"你离开键盘的程度"分五级,每上一级你写的代码更少、写的规格与验收更多。管理 agent 本身就是战略活动——所以升级委派形态 = 练战略技能。

同步结对 逐轮对话,你看着每一步
日常会话 · Fast Mode(/fast)
任务委派 整块交出,只验收结果
subagents · 后台任务(run_in_background)
起点
并行舰队 多 agent 同时推进无依赖块
worktree(claude -w)· Dynamic Workflows(ultracode)· Codex 多 thread
云端异步 工作在你不在机器旁时发生
Codex Cloud · @codex review/fix · GitHub Action
自治系统 常驻目标/触发器,无需逐次发起
/loop · Routines(/schedule)· Goal Mode(/goal)· Channels
★ 已实操到达

你已经用一条全自动 Workflow(KMP 重构)实操到了 ⑤ 级 —— 三节课走完了别人原地踏步几年的跨度。

课程进度

01

第一课 · 委派阶梯✓ 已学 + 已扩写

核心技能:判断任何任务该放在五级委派阶梯的哪一级,依据是杠杆率与验收成本,不是工具能力。

你做了什么:审计了三个真实任务(文档写作 / 测试修复 skill / 12h Goal Mode),暴露出真正的瓶颈是规格与验证,不是委派工具。

≈15 分钟 · 含 3 道自测 + 阶梯审计实操 · 首选阅读:Vivek Haldar《From Tactics to Strategy》

02

第二课 · 可执行规格✓ 已学

核心技能:把"想要的效果"写成 agent 啃得动的规格——黄金样本 > 验收标准 > 反例 > 读者目的 > 素材清单(按杠杆率排序)。

关键洞察:生成结果与预期差距大,根因是欠规格的空间被默认值占领,不是模型不行。修正不回流 = 为同一错误反复付费。

≈15 分钟 · 含 SPEC.md 模板 + 对照实验 · 首选阅读:GitHub Spec Kit 方法论

03

第三课 · 编排一场大重构● 实战进行中

核心技能:设计一条让多个 Agent 安全完成大体量重构的流水线,自己当总指挥——拆解、把门、对抗 review、防改坏。

正在发生:用你的 KMP 个人页(256 文件 / 4 万行 / 5 个子 Tab)做实战。你已亲手设计 + 审查了一条 30-40 个 Agent 的全自动 Workflow,现正在跑。

关0 盘点 关1 方案冻结
你拍板
关2 并行改造
worktree 隔离
关3 对抗 review
独立挑刺
关4 真机验证
你的安全网

≈18 分钟 · 含 4 道自测 · 产物:REFACTOR_PLAN.html(冻结 SPEC)+ refactor-workflow.mjs(编排脚本),随实战留在代码仓库 /Users/bytedance/novel/v1biz/android/.ai_local_artifacts/

04

第四课 · 为什么 Agent 会忘记规则✓ 已开课

核心技能:诊断与预防上下文漂移(instruction drift)——agent 长流程中忘记早前规则、过程跑偏。先正名(这不是 trace,是病;trace 是诊断工具),再机制、诊断、预防闭环。

缘起:你的自动化测试 skill 编排执行中会忽略前面强调的规则。根因是 Transformer 注意力架构属性(lost in the middle / context rot),2026 最强模型也有——不是你的错,但有确定对策。

≈18 分钟 · 含 4 道自测 + skill 编排三步改造(抽 INVARIANTS.md / 每步读回 / hook 重注入+拦截)· 首选阅读:Chroma《Context Rot》

05

第五课 · Agent 可观测性与验证 harness待开课

将教:把流水线里"验证功能没坏"这一环从纯手工拉上来——hooks 写 JSONL trace、结构化 run journal、device-control + logcat 断言、把验证分析也委派出去。

为何等:等你 KMP 重构做完真机验证,用真实痛点做案例。见 学习记录 0005

这几节课你真实走过的轨迹

不是听课,是一条真实任务把理论逼成了实战:

节点你做的判断(战略动作)
第一课承认"应用太原始"实为协作形态停在 ②级,开始上推
第二课看清文档任务差距大 = 规格缺口,不是模型问题
插入实战带来 KMP 重构真实任务,要求"先方案后动手 + 不想盯着"
纠正教练明确"老师只指导,执行我自己做"——夺回总指挥位置
四次修方案用现场事实纠正 AI 假设:只到开发分支 / 自动 merge / 1 台设备 / 查出 Codex plugin
审编排脚本抓出 stash 数据风险、路径迁移静默失效——审"编排逻辑"而非"每行代码"

↑ 这一列,就是"AI 时代战略型工程师"的日常:不接受 agent 给的方案,用对系统的真实理解去逼问、修正它。

参考资料(随时查)

学习记录(决策档案)

教学的"架构决策记录",捕捉非显然的洞察与转折,驱动下一课。