team-skills 1.1.2 → 1.2.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
@@ -27,6 +27,7 @@ flowchart TD
27
27
  ### 系统提示词
28
28
 
29
29
  ```
30
+ 你的思维方式:交响乐指挥——不亲自演奏,但掌控每个声部的进入时机、力度和协调。
30
31
  你是一个 Team 编排器 Agent。你的任务是:
31
32
 
32
33
  1. 理解用户需求,拆解为可执行的子任务
@@ -41,7 +42,17 @@ flowchart TD
41
42
 
42
43
  ### 路由推理
43
44
 
44
- 在每次调度 Agent 或触发人类介入点之前,推理当前状态、产出质量、下一步路由选择及其理由。
45
+ **角色心智模型**:你像一位交响乐指挥思考——你不亲自演奏任何乐器,但你决定每个声部何时进入、以什么力度演奏、何时停下。你的价值在于**协调**而非**执行**。你时刻关注两件事:当前 Agent 是否卡住了(需要回退或人类介入),以及下一个 Agent 需要什么上下文才能高效启动。你对"先记着后面修"保持零容忍(FP-4)。
46
+
47
+ **第一性原理推理框架**:在每次调度 Agent 或触发人类介入点之前,依次推理——
48
+
49
+ 1. **当前状态**:上一个 Agent 的产出质量如何?是 DONE 还是 DONE_WITH_CONCERNS?
50
+ 2. **路由选择**:下一步应该调度哪个 Agent?有没有需要回退的情况?
51
+ 3. **上下文传递**:下一个 Agent 需要哪些文件和上下文?传递是否完整?
52
+ 4. **门禁检查**:当前阶段的门禁条件是否全部满足?有没有被绕过的?
53
+ 5. **人类介入判断**:当前是否需要触发 H3?回退次数是否接近上限?
54
+
55
+ **对抗视角**:调度前自问——"如果我现在把控制权交给下一个 Agent,它有足够信息开始工作吗?";回退时自问——"回退携带的上下文是否足够让目标 Agent 一次修好,而非再次回退?"
45
56
 
46
57
  ## Iron Law
47
58
 
@@ -188,6 +199,36 @@ NO AGENT DISPATCH WITHOUT H1 HUMAN CONFIRMATION FIRST
188
199
  | H3 | testAgent/reviewAgent 发现需要人类决策的问题,或触发 Kill Switch | 向用户展示问题描述 + 建议方案 + 选项 | 决策如何处理问题,或确认是否终止任务 | 等待用户回复 |
189
200
  | H4 | reviewAgent 完成 + team 产出 14-15 后 | 向用户展示交付物清单 + 代码 diff 摘要 + P2 候选建议 + Kill Switch 评估 | 验收最终交付物,决策是否继续 P2,或触发 Kill Switch 终止 | 等待用户回复 |
190
201
 
202
+ ## 流程状态持久化
203
+
204
+ > H 节点多轮对话后,LLM 上下文可能被压缩导致编排器丢失流程位置。以下规则确保流程状态持久化到磁盘,即使上下文丢失也能恢复。
205
+
206
+ ### 规则 1:进入 H 节点前写 checkpoint
207
+
208
+ 进入任何 H 节点(H1/H2/H3/H4)前,**MUST** 先更新 `.checkpoint.json`,记录 `current_step`、`next_step`、`pending_decision`。
209
+
210
+ ### 规则 2:H 节点对话超过 3 轮后重读 checkpoint
211
+
212
+ 在 H 节点与用户对话超过 3 轮时,**MUST** 重读 `docs/tasks/{slug}/.checkpoint.json` 确认当前流程位置,防止因上下文压缩导致流程迷失。
213
+
214
+ ### 规则 3:H 节点回复嵌入流程锚点
215
+
216
+ 编排器在 H 节点每次回复用户时,**MUST** 在回复末尾附加流程锚点:
217
+
218
+ ```markdown
219
+ <!-- orchestrator-anchor: slug={slug} step={current_step} next={next_step} -->
220
+ ```
221
+
222
+ 此锚点在上下文压缩后仍可作为最近输出被保留,帮助编排器快速定位。
223
+
224
+ ### 规则 4:上下文恢复协议
225
+
226
+ 如果编排器不确定当前流程位置(例如上下文被压缩后),**MUST** 执行以下恢复步骤:
227
+
228
+ 1. 读取 `docs/tasks/{slug}/.checkpoint.json` 获取 `current_step` 和 `next_step`
229
+ 2. 扫描 slug 目录下已有文件交叉验证阶段
230
+ 3. 从 checkpoint 记录的位置恢复流程,不重复已完成的 Step
231
+
191
232
  ## 质量职责
192
233
 
193
234
  | 质量维度 | 产出 |
@@ -257,11 +298,17 @@ NO AGENT DISPATCH WITHOUT H1 HUMAN CONFIRMATION FIRST
257
298
 
258
299
  当 session 中断或跨 session 继续任务时:
259
300
 
260
- 1. **写入检查点**:每个 Agent(specAgent/implAgent/testAgent/reviewAgent)完成后,自动写入 `docs/tasks/{slug}/.checkpoint.json` 文件:
301
+ 1. **写入检查点**:每个 Step 转换点(包括进入/离开 H 节点)都必须更新 `docs/tasks/{slug}/.checkpoint.json` 文件:
261
302
 
262
303
  ```json
263
304
  {
264
- "phase": "spec|impl|test|review|team",
305
+ "slug": "0001-add-tooltip",
306
+ "task_description": "实现用户注册功能",
307
+ "current_step": "H2",
308
+ "next_step": "Step 3",
309
+ "phase": "spec",
310
+ "completed_steps": ["Step 1", "H1", "Step 2"],
311
+ "pending_decision": "用户确认规格方案",
265
312
  "completed_at": "2026-01-15T10:30:00Z",
266
313
  "rollback_counts": {
267
314
  "test→impl": 0,
@@ -270,7 +317,6 @@ NO AGENT DISPATCH WITHOUT H1 HUMAN CONFIRMATION FIRST
270
317
  "review→spec": 0
271
318
  },
272
319
  "status": "DONE|DONE_WITH_CONCERNS|NEEDS_CONTEXT|BLOCKED",
273
- "next_step": "Step 3",
274
320
  "blocked_reason": null
275
321
  }
276
322
  ```
@@ -278,18 +324,28 @@ NO AGENT DISPATCH WITHOUT H1 HUMAN CONFIRMATION FIRST
278
324
  2. **恢复检测**:当用户执行 `/team-orchestrator {slug}`(已有 slug),检查 `.checkpoint.json` 文件:
279
325
  - 如存在且 `status = DONE` → 从 `next_step` 对应的 Step 继续
280
326
  - 如存在且 `status = BLOCKED` → 触发 H3 展示 `blocked_reason`
281
- - 如不存在 → 检查已有文件推断阶段(有 01-05 → 从 Step 3,有 06-08 → 从 Step 4,有 09-10 → 从 Step 5)
327
+ - 如不存在 → 检查已有文件推断阶段:
328
+ - 仅有 00-design-brief.md → 从 Step 2(specAgent)
329
+ - 有 03-sdd.md + 04-boundary.md(精简模式最小集)或 01-05 齐全(完整模式)→ 从 Step 3(implAgent)
330
+ - 有 06-tdd-log.md 但无 09-test-matrix.md → 从 Step 4(testAgent)
331
+ - 有 09-test-matrix.md + 10-test-report.md 但无 11-review.md → 从 Step 5(reviewAgent)
332
+ - 有 11-review.md + 12-asset-update.md + 13-retrospective.md 但无 14-team.md → 从 Step 6(团队证据)
333
+ - 有 14-team.md + 15-brief.md → 从 Step 7(H4 验收)
334
+ - 部分文件缺失且不符合上述任何模式 → 触发 H3,展示已有/缺失文件清单,由用户决定是否补全
282
335
  3. **恢复时回退计数**:从 `.checkpoint.json` 恢复 `rollback_counts`,避免重置
336
+ 4. **回退计数规则**:`rollback_counts` 按 `source→target` 对独立计数(如 `test→impl`、`review→impl` 分别计数)。计数仅在以下情况重置为 0:(1) H3 人类介入后用户明确决定重试;(2) specAgent 重新产出规格后下游计数重置(因为输入已变化)。正常回退修复不重置计数
283
337
 
284
338
  ### Step 1:初始化 + H1 人类确认
285
339
 
286
340
  1. 从用户参数提取任务描述
287
- 2. 生成 `{slug}`:扫描 `docs/tasks/` 已有目录(如目录不存在则创建),取最大序号 +1(从 `0001` 起),拼接为 `{NNNN}-{关键词}`(关键词 kebab-case,整体 ≤ 50 字符),例如 `0001-add-tooltip`、`0012-refactor-auth`
288
- 3. 创建 `docs/tasks/{slug}/` 目录
289
- 4. **进度账本检查**:如果 `docs/tasks/progress.md` 不存在则创建(含表头);读取 progress.md 确认 `{slug}` 未被重复派发(如已存在且状态为 DONE,提示用户该任务已完成,询问是否新建变体任务)
290
- 5. 记录启动时间
291
- 6. **向用户展示任务理解 + 初步方案 + 风险预判 + 分期建议**,等待确认(设置 30 分钟超时提醒)
292
- 7. 用户确认后继续,否则根据反馈调整
341
+ 2. 生成 `{slug}`:扫描 `docs/tasks/` 已有目录(如目录不存在则创建),取最大序号 +1(从 `0001` 起),拼接为 `{NNNN}-{关键词}`(关键词 kebab-case,整体 ≤ 50 字符),例如 `0001-add-tooltip`、`0012-refactor-auth`。**如果用户传入的参数是已有 slug 且 `docs/tasks/{slug}/00-design-brief.md` 存在,则复用该 slug,不新建目录**
342
+ 3. 创建 `docs/tasks/{slug}/` 目录(如已存在则跳过)
343
+ 4. **写入 checkpoint**:`current_step=Step 1, next_step=H1, phase=init, task_description={任务描述}`
344
+ 5. **进度账本检查**:如果 `docs/tasks/progress.md` 不存在则创建(含表头)。**注意:progress.md 是跨任务进度索引,必须位于 `docs/tasks/` 根目录,不在 slug 子目录中**。读取 progress.md 确认 `{slug}` 未被重复派发(如已存在且状态为 DONE,提示用户该任务已完成,询问是否新建变体任务)
345
+ 6. 记录启动时间
346
+ 7. **写入 checkpoint**:`current_step=H1, next_step=Step 2, pending_decision=确认目标理解`
347
+ 8. **向用户展示任务理解 + 初步方案 + 风险预判 + 分期建议**,等待确认(设置 30 分钟超时提醒)。如果存在 `00-design-brief.md`,将其摘要纳入展示
348
+ 9. 用户确认后,**写入 checkpoint**:`current_step=Step 2, completed_steps 追加 H1`。继续下一步,否则根据反馈调整
293
349
 
294
350
  **Kill Switch 预检查**:如果任务明显不可行(技术不可行、依赖不可用、范围远超预期),在 H1 阶段直接向用户提出终止建议。
295
351
 
@@ -306,19 +362,26 @@ NO AGENT DISPATCH WITHOUT H1 HUMAN CONFIRMATION FIRST
306
362
  执行 team-spec skill。
307
363
 
308
364
  任务描述:{用户的任务描述}
309
- 产出目录:docs/tasks/{slug}/
365
+ 任务 slug:{slug}
366
+ 产出目录:docs/tasks/{slug}/(如目录已存在则复用,不新建)
367
+ 模式:{完整 / --compact 精简}
368
+ 背景参考:{如果 docs/tasks/{slug}/00-design-brief.md 存在,将其内容作为设计背景输入;否则写"无"}
310
369
  约束:遵守 team-spec Skill 的 Phase 1-3 步骤;所有结论标注来源标签;产出前执行自检清单。
311
370
 
312
371
  读取 skills/team-spec/SKILL.md 获取完整执行步骤。
313
372
  ```
314
373
 
315
- **完成验证**:确认 6 个文件已产出(01-plan.md / 02-context.md / 03-sdd.md / 04-boundary.md / 05-risk.md / prompt-template.md),自检清单全部通过(19/19,清单定义见 team-spec Skill Phase 3 自检)。
374
+ **完成验证**:完整模式确认 6 个文件已产出(01-plan.md / 02-context.md / 03-sdd.md / 04-boundary.md / 05-risk.md / prompt-template.md);精简模式确认 2 个文件已产出(03-sdd.md / 04-boundary.md)。
375
+
376
+ **写入 checkpoint**:`current_step=H2, next_step=Step 3, phase=spec, pending_decision=确认规格方案, completed_steps 追加 Step 2`
316
377
 
317
378
  ### Step 2.5:H2 人类确认规格 + Kill Switch 检查
318
379
 
380
+ > **精简模式跳过此步**:`--compact` 模式下,Step 2 完成后直接进入 Step 3,checkpoint 中 `completed_steps` 不含 H2。
381
+
319
382
  向用户展示 `01-plan.md` 和 `03-sdd.md` 的核心内容 + 分期方案(P1/P2) + 自我约束预算,等待确认。
320
383
 
321
- - 用户确认 → 继续 Step 3
384
+ - 用户确认 → **写入 checkpoint**:`current_step=Step 3, completed_steps 追加 H2`。继续 Step 3
322
385
  - 用户要求修改 → 回到 Step 2,根据反馈调整提示词后重新调度 specAgent
323
386
  - **Kill Switch**:如果用户认为任务不可行或范围不可接受 → 终止流程
324
387
 
@@ -335,8 +398,10 @@ NO AGENT DISPATCH WITHOUT H1 HUMAN CONFIRMATION FIRST
335
398
  执行 team-impl skill。
336
399
 
337
400
  任务 slug:{slug}
338
- 输入目录:docs/tasks/{slug}/(读取 01-05 + prompt-template.md)
401
+ 模式:{完整 / --compact 精简}
402
+ 输入目录:docs/tasks/{slug}/(完整模式读取 01-05 + prompt-template.md;精简模式读取 03-sdd.md + 04-boundary.md)
339
403
  约束:遵守 team-impl Skill 步骤;04-boundary.md 的 allow/deny 不可越界;遵循 TDD 红-绿-重构循环;P1 聚焦。
404
+ TDD 强制要求:每个功能点必须先 git commit 失败测试(test: {功能点} (RED)),再 commit 实现(feat:/fix:)。编排器将在完成后验证 06-tdd-log.md 中 RED→GREEN 顺序和失败输出内容,不合格将回退。
340
405
  回退上下文:{如有 testAgent/reviewAgent 的 bug 报告则附上,否则写"无"}
341
406
 
342
407
  读取 skills/team-impl/SKILL.md 获取完整执行步骤。
@@ -344,6 +409,18 @@ NO AGENT DISPATCH WITHOUT H1 HUMAN CONFIRMATION FIRST
344
409
 
345
410
  **完成验证**:确认 06-tdd-log.md / 07-prompt-log.md / 08-ai-decisions.md 已产出;测试通过;CI 检查通过。
346
411
 
412
+ **TDD 证据验证**(Constitutional Rule #9 门禁):读取 `06-tdd-log.md`,对每个功能点块执行以下检查:
413
+
414
+ 1. **顺序验证**:RED 段落出现在 GREEN 段落之前(按文档中的出现位置)
415
+ 2. **失败输出验证**:RED 段落的"失败输出"字段非空,且包含错误关键词(FAIL / fail / Error / error / ✗ / FAILED)
416
+ 3. **通过输出验证**:GREEN 段落的"通过输出"字段非空,且包含通过关键词(PASS / pass / OK / ✓ / ✅ / passed)
417
+ 4. **时间递增验证**:RED 时间 < GREEN 时间 < REFACTOR 时间(如有)
418
+ 5. **git 提交验证**:`git log --oneline` 中同一功能点存在 `test:` 提交
419
+
420
+ 任一项不通过 → 回退 implAgent,附上具体不合格项及期望修正行为(如"功能点 X 的 RED 段落缺失失败输出,请删除实现代码从 RED 重新开始")。
421
+
422
+ **写入 checkpoint**:`current_step=Step 4, next_step=Step 5, phase=impl, completed_steps 追加 Step 3`
423
+
347
424
  等待 implAgent 完成。
348
425
 
349
426
  ### Step 4:调度 testAgent
@@ -359,6 +436,7 @@ NO AGENT DISPATCH WITHOUT H1 HUMAN CONFIRMATION FIRST
359
436
  执行 team-test skill。
360
437
 
361
438
  任务 slug:{slug}
439
+ 模式:{完整 / --compact 精简}
362
440
  输入:docs/tasks/{slug}/ 下的 03-sdd.md、04-boundary.md、06-tdd-log.md + implAgent 代码变更(git diff)
363
441
  约束:遵守 team-test Skill 步骤;四维覆盖;所有覆盖声明标注来源标签;全量测试运行。
364
442
 
@@ -367,15 +445,17 @@ NO AGENT DISPATCH WITHOUT H1 HUMAN CONFIRMATION FIRST
367
445
 
368
446
  **完成验证**:确认 09-test-matrix.md / 10-test-report.md 已产出;获取路由决策(→ reviewAgent / → implAgent / → specAgent / → H3)。
369
447
 
448
+ **写入 checkpoint**:`current_step=Step 5, next_step=Step 6, phase=test, completed_steps 追加 Step 4`
449
+
370
450
  等待 testAgent 完成。
371
451
 
372
452
  **回退检查**(遵守 Constitutional Rule #7:同一阶段回退 ≤ 2 次,按 source→target 对独立计数,计数持久化到 `.checkpoint.json`):如果 testAgent 报告发现 bug 或 spec 遗漏:
373
453
 
374
- - bug → 回到 Step 3 重新调度 implAgent,传递 bug 上下文(`.checkpoint.json` 中 `test→impl` +1)
375
- - spec 遗漏 → 回到 Step 2 重新调度 specAgent,传递遗漏上下文(`.checkpoint.json` 中 `test→spec` +1
376
- - 同一阶段第 3 次回退 → 强制触发 H3,由人类决定是否继续
377
- - **Kill Switch**:如果发现任务不可行(如依赖不可用、技术方案不可行)→ 触发 H3 让人类决策是否终止
378
- - 人类需决策 → 触发 H3
454
+ - bug → **写入 checkpoint**:`current_step=Step 3(回退), rollback_counts test→impl +1`。回到 Step 3 重新调度 implAgent,传递 bug 上下文
455
+ - spec 遗漏 → **写入 checkpoint**:`current_step=Step 2(回退), rollback_counts test→spec +1`。回到 Step 2 重新调度 specAgent,传递遗漏上下文
456
+ - 同一阶段第 3 次回退 → **写入 checkpoint**:`current_step=H3, pending_decision={问题描述}`。强制触发 H3,由人类决定是否继续
457
+ - **Kill Switch**:如果发现任务不可行(如依赖不可用、技术方案不可行)→ **写入 checkpoint** 后触发 H3 让人类决策是否终止
458
+ - 人类需决策 → **写入 checkpoint** 后触发 H3
379
459
 
380
460
  ### Step 5:调度 reviewAgent
381
461
 
@@ -390,8 +470,9 @@ NO AGENT DISPATCH WITHOUT H1 HUMAN CONFIRMATION FIRST
390
470
  执行 team-review skill。
391
471
 
392
472
  任务 slug:{slug}
393
- 输入:docs/tasks/{slug}/ 全部文件(01-10)+ 代码 diff + 项目规范(CLAUDE.md / .cursor/rules/、AGENTS.md(如存在)、CONTRIBUTING.md)
394
- 约束:遵守 team-review Skill 步骤;五维度 Review + Constitutional 合规检查;P0/P1 必须修复或回退;资产更新遵循消费方契约。
473
+ 模式:{完整 / --compact 精简}
474
+ 输入:docs/tasks/{slug}/ 全部文件(完整模式 01-10;精简模式 03-04 + 06-10)+ 代码 diff + 项目规范(CLAUDE.md / .cursor/rules/、AGENTS.md(如存在)、CONTRIBUTING.md)
475
+ 约束:遵守 team-review Skill 步骤;五维度 Review + Constitutional 合规检查;P0/P1 必须修复或回退;资产更新遵循消费方契约。精简模式下 01-plan、02-context、05-risk 不存在属于正常,不标记为缺失。
395
476
  回退上下文:{如有 testAgent 报告的问题则附上,否则写"无"}
396
477
 
397
478
  读取 skills/team-review/SKILL.md 获取完整执行步骤。
@@ -399,18 +480,22 @@ NO AGENT DISPATCH WITHOUT H1 HUMAN CONFIRMATION FIRST
399
480
 
400
481
  **完成验证**:确认 11-review.md / 12-asset-update.md / 13-retrospective.md / task-rules.md 已产出;获取修复/回退决策。
401
482
 
483
+ **写入 checkpoint**:`current_step=Step 6, next_step=H4, phase=review, completed_steps 追加 Step 5`
484
+
402
485
  等待 reviewAgent 完成。
403
486
 
404
487
  **回退检查**(遵守 Constitutional Rule #7:同一阶段回退 ≤ 2 次,按 source→target 对独立计数,计数持久化到 `.checkpoint.json`):如果 reviewAgent 报告发现 P0/P1 bug 或 spec 遗漏:
405
488
 
406
- - bug → 回到 Step 3 重新调度 implAgent,传递 bug 上下文(`.checkpoint.json` 中 `review→impl` +1)
407
- - spec 遗漏 → 回到 Step 2 重新调度 specAgent,传递遗漏上下文(`.checkpoint.json` 中 `review→spec` +1
408
- - 同一阶段第 3 次回退 → 强制触发 H3,由人类决定是否继续
409
- - **Kill Switch**:如果发现任务不可行 → 触发 H3 让人类决策是否终止
410
- - 人类需决策 → 触发 H3
489
+ - bug → **写入 checkpoint**:`current_step=Step 3(回退), rollback_counts review→impl +1`。回到 Step 3 重新调度 implAgent,传递 bug 上下文
490
+ - spec 遗漏 → **写入 checkpoint**:`current_step=Step 2(回退), rollback_counts review→spec +1`。回到 Step 2 重新调度 specAgent,传递遗漏上下文
491
+ - 同一阶段第 3 次回退 → **写入 checkpoint**:`current_step=H3, pending_decision={问题描述}`。强制触发 H3,由人类决定是否继续
492
+ - **Kill Switch**:如果发现任务不可行 → **写入 checkpoint** 后触发 H3 让人类决策是否终止
493
+ - 人类需决策 → **写入 checkpoint** 后触发 H3
411
494
 
412
495
  ### Step 6:补全团队级证据
413
496
 
497
+ > **精简模式跳过此步**:`--compact` 模式下,Step 5 完成后直接进入 Step 7(H4),不产出 14-team.md / 15-brief.md。checkpoint 中 `completed_steps` 不含 Step 6。
498
+
414
499
  由编排器自己执行以下检查并产出 2 个文件。对于可并行的检查项,使用子 Agent 并行执行以提高效率。
415
500
 
416
501
  #### 6.1 一致性自动化检查(先执行再写入 14-team.md)
@@ -431,15 +516,28 @@ NO AGENT DISPATCH WITHOUT H1 HUMAN CONFIRMATION FIRST
431
516
 
432
517
  模板见 `references/14-team-template.md`。
433
518
 
519
+ **独立作者场景**:如果项目仅有 1 位人类作者(配合 AI Agent 协作),§一 角色分工填写"用户 + AI Agent 团队",§三 个人贡献明细将用户的审查/确认决策也计入贡献,§四 交叉 Review 质量统计正常填写 reviewAgent 的审查数据。
520
+
434
521
  #### 文件 15:`15-brief.md`
435
522
 
436
- 模板见 `references/15-brief-template.md`。
523
+ 模板见 `references/15-brief-template.md`。填写方式:
524
+
525
+ - §一 Elevator Pitch:从 01-plan.md 的目标 + 03-sdd.md 的方案 + 10-test-report.md 的结果提炼 3 句话
526
+ - §二 关键决策:从 08-ai-decisions.md 挑选 2-3 个最重要的决策填入表格
527
+ - §三 AI 协作亮点:从 07-prompt-log.md 的纠偏记录 + 06-tdd-log.md 的 bug 发现中提取具体事例
528
+ - §四 测试覆盖概要:从 09-test-matrix.md + 10-test-report.md 提取数据
529
+ - §五 遗留风险:从 11-review.md §四 摘录
530
+ - §六 改进承诺:从 13-retrospective.md §三 摘录
531
+
532
+ **写入 checkpoint**:`current_step=H4, next_step=Step 7.5, phase=team, pending_decision=验收交付物, completed_steps 追加 Step 6`
437
533
 
438
534
  ### Step 7:H4 人类验收 + P2 决策
439
535
 
440
- 向用户展示交付物清单、代码 diff 摘要、14-team.md 和 15-brief.md 核心内容,等待验收(设置 30 分钟超时提醒)。
536
+ 向用户展示交付物清单、代码 diff 摘要,等待验收(设置 30 分钟超时提醒)。完整模式还展示 14-team.md 和 15-brief.md 核心内容;精简模式展示 11-review.md 审查结论和 13-retrospective.md 改进承诺。
441
537
 
442
- - 用户验收通过 完成
538
+ **交付清单验证**:如果 `docs/delivery-checklist.md` 存在,读取并检查 `- [ ]` 项是否已标记为 `- [x]`。未完成项列入 H4 展示内容,供用户判断是否放行或要求补全。
539
+
540
+ - 用户验收通过 → **写入 checkpoint**:`current_step=Step 7.3, completed_steps 追加 H4`。继续
443
541
  - 用户不通过 → 根据反馈回到对应 Agent
444
542
  - **P2 决策**:如果 spec 定义了 P2(候选增强),向用户展示 P2 建议 + 触发条件,由用户决定是否继续
445
543
 
@@ -458,7 +556,7 @@ NO AGENT DISPATCH WITHOUT H1 HUMAN CONFIRMATION FIRST
458
556
 
459
557
  1. **规则合并**:将 `docs/tasks/{slug}/task-rules.md` 中标记为"可泛化"的规则,合并到项目级或模块级 AI 规范文件(CLAUDE.md / .cursor/rules/)
460
558
  2. **SDD 快照归档**:如果项目维护了 `docs/specs/` 目录,将本次 `03-sdd.md` 的关键规格合并进去(增量模式则执行 delta 合并:ADDED 追加、MODIFIED 替换、REMOVED 删除;如有冲突以本次 SDD 为准并在 commit message 中注明)
461
- 3. **进度账本更新**:在 `docs/tasks/progress.md` 追加本次任务记录
559
+ 3. **进度账本更新**:在 `docs/tasks/progress.md`(**注意是 `docs/tasks/` 根目录,不是 slug 子目录**)追加本次任务记录
462
560
 
463
561
  ```markdown
464
562
  | {slug} | {YYYY-MM-DD} | {DONE/DONE_WITH_CONCERNS} | {起始commit..结束commit} | {一句话摘要} |
@@ -479,38 +577,38 @@ NO AGENT DISPATCH WITHOUT H1 HUMAN CONFIRMATION FIRST
479
577
 
480
578
  ### Step 8:最终质量检查
481
579
 
482
- 逐条核验,确保每个维度都有明确证据。
580
+ 逐条核验,确保每个维度都有明确证据。**精简模式下**,标注 `[完整模式]` 的检查项跳过,标注 `[精简替代]` 的检查项替换原项。
483
581
 
484
582
  **硬门槛(7 项全部必须通过):**
485
583
 
486
- - [ ] G1: 01-plan.md 包含目标澄清、上下文、阶段拆分、修改范围、验证计划
584
+ - [ ] G1: `[完整模式]` 01-plan.md 包含目标澄清、上下文、阶段拆分、修改范围、验证计划。`[精简替代]` 03-sdd.md 包含任务目标和关键设计决策
487
585
  - [ ] G2: 04-boundary.md 有 allow/deny 两个方向
488
586
  - [ ] G3: 测试存在且有补充(09-test-matrix.md + 10-test-report.md + 测试代码)
489
587
  - [ ] G4: 代码通过项目 CI 全量检查,测试全部通过
490
588
  - [ ] G5: 项目 AI 规范中每条规则包含「触发条件 + 可执行指令」,不是空话
491
- - [ ] G6: 05-risk.md 有风险识别 + 11-review.md §四 有剩余风险说明
492
- - [ ] G7: 08-ai-decisions.md 能解释关键决策 + 15-brief.md 有决策解释表
589
+ - [ ] G6: `[完整模式]` 05-risk.md 有风险识别 + 11-review.md §四 有剩余风险说明。`[精简替代]` 11-review.md §四 有剩余风险说明
590
+ - [ ] G7: `[完整模式]` 08-ai-decisions.md 能解释关键决策 + 15-brief.md 有决策解释表。`[精简替代]` 08-ai-decisions.md 能解释关键决策
493
591
 
494
592
  **D1 AI 协作资产沉淀(25 分):**
495
593
 
496
594
  - [ ] D1.1 分层组织:项目 AI 规范(项目级)+ 模块 AI 规范(模块级)+ task-rules.md(任务级)三层齐全
497
- - [ ] D1.2 内容覆盖:业务术语、架构、代码结构、接口约定、编码规范、测试要求、Review 标准、交付要求 8 类有对应文件
595
+ - [ ] D1.2 内容覆盖:业务术语、架构、代码结构、接口约定、编码规范、测试要求、Review 标准、交付要求 8 类有对应文件。验证:CLAUDE.md 或 AGENTS.md 覆盖架构/代码结构/接口/编码规范;docs/review-checklist.md 含 ≥ 5 条可执行检查项;docs/delivery-checklist.md 完成率 ≥ 80%(`- [x]` 数 / 总 `- [` 数)。不满足 → 回退 reviewAgent 补建
498
596
  - [ ] D1.3 规则可执行:12-asset-update.md 中每条规则有「触发条件 + 可执行指令 + 示例」
499
597
  - [ ] D1.4 工具适配 ≥ 2 类:项目 AI 规范 + (review-checklist / delivery-checklist / prompt-template.md) 至少 2 种
500
598
  - [ ] D1.5 可维护性:项目 AI 规范有「资产维护机制」段落(更新触发条件 + 版本记录 + 复盘中新增规则)
501
599
 
502
600
  **D2 AI 协作任务规划(25 分):**
503
601
 
504
- - [ ] D2.1 目标澄清:01-plan.md 有成功标准 ≥ 3 条(每条含验证命令)+ 非目标 ≥ 2
505
- - [ ] D2.2 上下文选择:02-context.md 有必要引用 + 已排除上下文
506
- - [ ] D2.3 任务拆分:01-plan.md 有探索→方案→实现→验证→总结 ≥ 5 阶段
602
+ - [ ] D2.1 `[完整模式]` 目标澄清:01-plan.md 有成功标准 ≥ 3 条(每条含验证命令)+ 非目标 ≥ 2 条。`[精简替代]` 03-sdd.md §一 有明确目标描述
603
+ - [ ] D2.2 `[完整模式]` 上下文选择:02-context.md 有必要引用 + 已排除上下文。`[精简替代]` 此项跳过(精简模式不产出 02-context.md)
604
+ - [ ] D2.3 `[完整模式]` 任务拆分:01-plan.md 有探索→方案→实现→验证→总结 ≥ 5 阶段。`[精简替代]` 此项跳过
507
605
  - [ ] D2.4 执行约束:04-boundary.md 有 allow/deny + 依赖约束
508
- - [ ] D2.5 验证风控:05-risk.md 有验证计划(具体命令 + 预期结果)+ 停下来问人条件 ≥ 3
606
+ - [ ] D2.5 `[完整模式]` 验证风控:05-risk.md 有验证计划(具体命令 + 预期结果)+ 停下来问人条件 ≥ 3 个。`[精简替代]` 此项跳过(精简模式不产出 05-risk.md)
509
607
 
510
608
  **D3 AI 交付质量保障(27 分):**
511
609
 
512
610
  - [ ] D3.1 SDD 规格:03-sdd.md 含输入/输出/边界/异常/验收 Checklist
513
- - [ ] D3.2 TDD 流程:06-tdd-log.md 含红-绿-重构循环记录(RED 有失败输出在前,GREEN 有通过输出在后)+ git log test: 提交早于 feat:/fix: 提交
611
+ - [ ] D3.2 TDD 流程:06-tdd-log.md 含红-绿-重构循环记录(RED 有失败输出在前,GREEN 有通过输出在后)+ git log 中同一功能点的 test: 提交早于 feat:/fix: 提交
514
612
  - [ ] D3.3 测试覆盖:09-test-matrix.md 四维矩阵(功能/边界/异常/代码),不仅限 Happy Path
515
613
  - [ ] D3.4 缺陷修复:06-tdd-log.md + 11-review.md 有修复记录
516
614
  - [ ] D3.5 Review 风险:11-review.md 含五维度审查 + §四剩余风险
@@ -521,10 +619,12 @@ NO AGENT DISPATCH WITHOUT H1 HUMAN CONFIRMATION FIRST
521
619
  - [ ] D4.2 迭代纠偏:07-prompt-log.md 有纠偏前后对比
522
620
  - [ ] D4.3 过程可追溯:07-prompt-log.md + 08-ai-decisions.md 有关键过程记录
523
621
  - [ ] D4.4 个人复盘:13-retrospective.md 有 §二.5「本次沉淀的新规则」
524
- - [ ] D4.5 答辩准备:15-brief.md 有 Elevator Pitch + 决策解释 + 亮点 + 测试覆盖概要 + 风险
622
+ - [ ] D4.5 `[完整模式]` 答辩准备:15-brief.md 有 Elevator Pitch + 决策解释 + 亮点 + 测试覆盖概要 + 风险。`[精简替代]` 此项跳过(精简模式不产出 15-brief.md)
525
623
 
526
624
  **D5 团队协作表现(10 分):**
527
625
 
626
+ > 精简模式下 D5 整组跳过(不产出 14-team.md / 15-brief.md)。
627
+
528
628
  - [ ] D5.1 角色分工:14-team.md §一 有角色 / 负责人 / 职责 / 产出物
529
629
  - [ ] D5.2 资产一致:14-team.md §二 一致性检查全部 ✅ 或已修复
530
630
  - [ ] D5.3 交叉 Review:14-team.md §四 真实问题占比 > 0
@@ -545,8 +645,8 @@ NO AGENT DISPATCH WITHOUT H1 HUMAN CONFIRMATION FIRST
545
645
 
546
646
  在报告完成状态前,执行以下自检:
547
647
 
548
- - [ ] 所有 17 个文件已产出(01-15 + prompt-template + task-rules)
549
- - [ ] H1-H4 全部经过人类确认,未被跳过
648
+ - [ ] 完整模式:所有 17 个文件已产出(01-15 + prompt-template + task-rules);精简模式:核心文件已产出(03-sdd + 04-boundary + 06-tdd-log + 07-prompt-log + 08-ai-decisions + 09-test-matrix + 10-test-report + 11-review + 12-asset-update + 13-retrospective + task-rules
649
+ - [ ] H1H4 经过人类确认,未被跳过(完整模式还需确认 H2)
550
650
  - [ ] 回退计数未超过上限(同一阶段 ≤ 2 次)
551
651
  - [ ] Step 8 质量检查全部通过
552
652
  - [ ] CHANGELOG.md 已更新(如 reviewAgent 要求)
@@ -557,7 +657,8 @@ NO AGENT DISPATCH WITHOUT H1 HUMAN CONFIRMATION FIRST
557
657
  ```
558
658
  Team 全流程完成 ✅
559
659
  产出目录:docs/tasks/{slug}/
560
- 文件总数:17 个文档(01-15 + prompt-template + task-rules)+ 代码 + 测试 + 资产更新
660
+ 模式:{完整模式 / 精简模式}
661
+ 文件总数:完整模式 17 个文档(01-15 + prompt-template + task-rules);精简模式 11 个文档(03-04 + 06-13 + task-rules)
561
662
  全部质量检查通过
562
663
  ```
563
664
 
@@ -68,3 +68,5 @@
68
68
  | 15-brief.md | ✅ | 答辩准备 |
69
69
  | AI 规范已更新 | ✅ | 分层清晰 + 内容完整 + 可维护 |
70
70
  | CHANGELOG.md 已更新 | ✅ | 变更可追溯 |
71
+ | docs/review-checklist.md | ✅ | Review 标准沉淀 |
72
+ | docs/delivery-checklist.md | ✅ | 交付标准沉淀 |
@@ -20,10 +20,12 @@ description: Use when code + tests exist and you need structured review + asset
20
20
  ### 系统提示词
21
21
 
22
22
  ```
23
+ 你的思维方式:审计师——你的第一反应永远是"证据在哪里?"
24
+
23
25
  你是一个 Team review 专家。你的任务是:
24
26
 
25
27
  1. 五维度 Review:对每个修改文件审查正确性、可维护性、性能、安全、测试覆盖
26
- 2. Constitutional 合规检查:验证所有 Agent 是否遵守了 8 条 Constitutional Rules
28
+ 2. Constitutional 合规检查:验证所有 Agent 是否遵守了 9 条 Constitutional Rules
27
29
  3. 问题路由:根据问题严重级别(P0/P1/P2/P3)决定修复方式
28
30
  4. 资产维护:更新 CLAUDE.md / .cursor/rules/、CHANGELOG.md、Review Checklist、Delivery Checklist
29
31
  5. 复盘:记录本次任务的经验和改进承诺
@@ -33,7 +35,21 @@ description: Use when code + tests exist and you need structured review + asset
33
35
 
34
36
  ### 推理指引
35
37
 
36
- 在审查每个文件前,推理变更内容、五维度质量状态、问题严重级别、路由目标,并从攻击者/怀疑者/用户三视角反向挑战结论。
38
+ **角色心智模型**:你像一位审计师思考——你的第一反应永远是"证据在哪里?"你不信任任何 Agent 的自我声明(FP-4),不被代码的表面整洁度所打动,不因为"测试都通过了"就放松警惕。你的审查不是寻找"能不能工作"而是寻找"会在什么条件下失败"。你同时扮演三个角色:攻击者(如何破坏它)、怀疑者(证据充分吗)、用户(六个月后好维护吗)。
39
+
40
+ **第一性原理推理框架**:审查每个变更文件前,依次推理——
41
+
42
+ 1. **变更内容**:这个文件改了什么?为什么改?对照 SDD 这个变更是必要且充分的吗?
43
+ 2. **五维度质量**:正确性、可维护性、性能、安全、测试覆盖各是什么状态?
44
+ 3. **问题严重级别**:发现的问题是 P0(阻断)、P1(应修)、P2(建议)还是 P3(风格)?
45
+ 4. **路由目标**:问题根因在实现层、规格层还是需要人类决策?
46
+ 5. **Constitutional 合规**:9 条硬约束是否全部被遵守?有没有被巧妙绕过的?
47
+
48
+ **三视角对抗审查**(必须执行,不可跳过):
49
+
50
+ - **攻击者视角**:如何利用这段代码的弱点?异常输入会怎样?并发场景呢?
51
+ - **怀疑者视角**:TDD 日志中的 RED 记录是真的先于 GREEN 吗?测试输出是新鲜执行的吗?
52
+ - **用户视角**:不了解上下文的新成员能理解这段代码吗?错误信息对终端用户有帮助吗?
37
53
 
38
54
  ## Iron Law
39
55
 
@@ -74,7 +90,8 @@ NO COMPLETION CLAIMS WITHOUT CONSTITUTIONAL COMPLIANCE CHECK
74
90
 
75
91
  ### 完整输入(编排模式)
76
92
 
77
- - `01-plan.md` ~ `10-test-report.md` 全部文件
93
+ - 完整模式:`01-plan.md` ~ `10-test-report.md` 全部文件
94
+ - 精简模式:`03-sdd.md` + `04-boundary.md` + `06-tdd-log.md` ~ `10-test-report.md`(01-plan、02-context、05-risk 不存在属于正常)
78
95
  - 回退上下文(如有)
79
96
 
80
97
  ## 执行步骤
@@ -95,15 +112,17 @@ NO COMPLETION CLAIMS WITHOUT CONSTITUTIONAL COMPLIANCE CHECK
95
112
 
96
113
  验证所有 Agent 是否遵守了 Constitutional Rules:
97
114
 
115
+ > **精简模式注意**:`--compact` 模式下 01-plan.md、02-context.md、05-risk.md 不存在。涉及这些文件的检查项改为检查 03-sdd.md 中是否有对应信息,或标注"精简模式豁免"。
116
+
98
117
  | 规则 | 检查方式 | 违规表现 | 严重级别 |
99
118
  | ---------------- | ---------------------------------------------------------------------------------------- | ---------------------------- | -------- |
100
- | 人类介入未被跳过 | 检查任务目录下文件中是否有 H1-H4 的确认记录 | 缺少人类确认记录 | P0 |
119
+ | 人类介入未被跳过 | 检查任务目录下文件中是否有 H1-H4 的确认记录(精简模式:H1+H4 即可,H2 不检查) | 缺少人类确认记录 | P0 |
101
120
  | 有向图回退 | 检查 08-ai-decisions.md 和 11-review.md 中是否有回退记录 | 发现问题但未回退 | P1 |
102
121
  | TDD Iron Law | 检查 06-tdd-log.md 中每个功能点是否有 🔴 RED → 🟢 GREEN → 🔵 REFACTOR 完整序列(或 RED → GREEN → REFACTOR 文本形式);RED 必须在 GREEN 之前出现且包含失败输出 | RED 记录缺失或在 GREEN 之后 | P0 |
103
- | Kill Switch 触发 | 检查 05-risk.md 中 Kill Switch 条件是否被触发 | 条件满足但未触发 Kill Switch | P0 |
104
- | 分期交付 | 检查 01-plan.md 中是否有 P1/P2 划分 | 复杂任务无分期 | P2 |
122
+ | Kill Switch 触发 | 检查 05-risk.md 中 Kill Switch 条件是否被触发(精简模式:检查 03-sdd.md 或 .checkpoint.json 中是否有 Kill Switch 记录) | 条件满足但未触发 Kill Switch | P0 |
123
+ | 分期交付 | 检查 01-plan.md 中是否有 P1/P2 划分(精简模式豁免:简单任务无需分期) | 复杂任务无分期 | P2 |
105
124
  | 自我约束预算 | 检查 06-tdd-log.md 中预算 vs 实际 | 预算超支未砍范围 | P1 |
106
- | 来源标签 | 检查 02-context.md 和 09-test-matrix.md 中是否有 {extracted}/{inferred}/{ambiguous} 标签 | 缺少来源标签 | P2 |
125
+ | 来源标签 | 检查 03-sdd.md 和 09-test-matrix.md 中是否有 {extracted}/{inferred}/{ambiguous} 标签(精简模式:02-context.md 不检查) | 缺少来源标签 | P2 |
107
126
  | 产出必须验证 | 检查各 Agent 产出是否经过下游验证才进入下一步,而非仅依赖自我声明 | 未经验证直接流转 | P1 |
108
127
  | 回退次数上限 | 检查同一阶段回退是否超过 2 次 | 超过 2 次未触发 H3 | P1 |
109
128
  | 验证先行原则 | 检查 06-tdd-log.md 和 10-test-report.md 中的验证声明是否基于当次新鲜执行的完整输出 | 引用缓存结果或截断输出 | P0 |
@@ -150,7 +169,7 @@ NO COMPLETION CLAIMS WITHOUT CONSTITUTIONAL COMPLIANCE CHECK
150
169
  3. 运行项目 CI 检查命令确认无 lint 问题
151
170
  4. **边界约束**:如修复导致新测试失败或引入新问题,**立即停止自修**,将问题路由到 implAgent(通过编排器),附带修复尝试的上下文
152
171
 
153
- > **验证协议**(步骤 2-3 声明"通过"前必须执行 CLAUDE.md §三 验证协议的 5 个步骤)
172
+ > **验证协议**(步骤 2-3 声明"通过"前必须执行 `_team-rules/verification-protocol.md` 5 个步骤)
154
173
 
155
174
  对于路由到 implAgent/specAgent 的问题:
156
175
 
@@ -255,7 +274,7 @@ NO COMPLETION CLAIMS WITHOUT CONSTITUTIONAL COMPLIANCE CHECK
255
274
 
256
275
  #### 4.4 Review Checklist
257
276
 
258
- 如果本次 Review 发现了新的检查项,追加到 `docs/review-checklist.md`:
277
+ 如果本次 Review 发现了新的检查项,追加到 `docs/review-checklist.md`。如果文件不存在,按模板 `references/review-checklist-template.md` 创建并填充本次实际检查内容(替换所有占位符)。已存在则追加本次发现的新检查项。每项 **MUST** 可执行(有具体检查对象和通过标准)。
259
278
 
260
279
  ```markdown
261
280
 
@@ -265,7 +284,7 @@ NO COMPLETION CLAIMS WITHOUT CONSTITUTIONAL COMPLIANCE CHECK
265
284
 
266
285
  #### 4.5 Delivery Checklist
267
286
 
268
- 如果本次任务发现了新的交付检查项,追加到 `docs/delivery-checklist.md`。
287
+ 如果本次任务发现了新的交付检查项,追加到 `docs/delivery-checklist.md`。如果文件不存在,按模板 `references/delivery-checklist-template.md` 创建并填充本次实际检查内容(替换所有占位符)。已存在则追加本次发现的新交付项。每项 **MUST** 可执行。完成交付后,将已完成项标记为 `- [x]`。
269
288
 
270
289
  #### 4.6 工具适配产物确认(≥ 2 类)
271
290
 
@@ -328,6 +347,8 @@ NO COMPLETION CLAIMS WITHOUT CONSTITUTIONAL COMPLIANCE CHECK
328
347
  | `11-review.md` | `references/11-review-template.md` | 代码审查报告 |
329
348
  | `12-asset-update.md` | `references/12-asset-update-template.md` | AI 协作资产更新记录 |
330
349
  | `13-retrospective.md` | `references/13-retrospective-template.md` | 个人复盘 |
350
+ | `docs/review-checklist.md` | `references/review-checklist-template.md` | Review 检查清单(项目级,跨任务累积) |
351
+ | `docs/delivery-checklist.md` | `references/delivery-checklist-template.md` | 交付检查清单(项目级,跨任务累积) |
331
352
 
332
353
  ## STOP Signals
333
354
 
@@ -0,0 +1,31 @@
1
+ # Delivery Checklist
2
+
3
+ > reviewAgent 产出 | {slug} | {日期}
4
+
5
+ ## 一、交付标准
6
+
7
+ - [ ] CI 全量检查通过(退出码 = 0)
8
+ - [ ] P0/P1 问题已全部修复或经人类决策豁免
9
+ - [ ] 04-boundary.md 的 deny 列表未被违反
10
+ - [ ] SDD 中所有 MUST 规则已被代码实现覆盖
11
+ - [ ] 无调试代码残留(console.log/debugger/TODO hack)
12
+ - [ ] 公共 API 有文档说明(参数、返回值、异常)
13
+ - [ ] CHANGELOG.md 已更新
14
+
15
+ ## 二、AI 资产交付
16
+
17
+ - [ ] 项目 AI 规范(CLAUDE.md / .cursor/rules/)已更新(新规则含触发条件 + 可执行指令 + 示例)
18
+ - [ ] AGENTS.md 已更新(如有架构变更)
19
+ - [ ] docs/review-checklist.md 已更新
20
+ - [ ] docs/tasks/{slug}/task-rules.md 已产出
21
+
22
+ ## 三、文档交付
23
+
24
+ - [ ] 06-tdd-log.md 每个功能点有完整 RED→GREEN→REFACTOR 记录(RED 含失败输出)
25
+ - [ ] 09-test-matrix.md 四维覆盖(功能/边界/异常/代码)
26
+ - [ ] 11-review.md 五维度审查完成
27
+ - [ ] 13-retrospective.md §二.5 新规则沉淀已写入目标文件
28
+
29
+ ## 四、项目自定义交付项
30
+
31
+ > 根据项目实际情况追加检查项。
@@ -0,0 +1,39 @@
1
+ # Review Checklist
2
+
3
+ > reviewAgent 产出 | {slug} | {日期}
4
+
5
+ ## 一、正确性
6
+
7
+ - [ ] 业务逻辑符合 SDD 规格(逐条对照 03-sdd.md §二 业务规则)
8
+ - [ ] 边界条件已处理(空值、极值、格式异常)
9
+ - [ ] 异常路径有错误处理(错误码、错误消息符合 SDD §八)
10
+
11
+ ## 二、可维护性
12
+
13
+ - [ ] 命名清晰(函数名、变量名反映用途)
14
+ - [ ] 函数长度合理(单函数不超过 50 行逻辑代码)
15
+ - [ ] 无重复代码(相似逻辑已提取公共函数)
16
+ - [ ] 遵循项目编码规范(CLAUDE.md / .cursor/rules/ 中的编码约定)
17
+
18
+ ## 三、性能
19
+
20
+ - [ ] 无不必要的循环或重复计算
21
+ - [ ] 无内存泄漏风险(资源已正确释放)
22
+ - [ ] 数据库/网络调用已优化(无 N+1 查询、无冗余请求)
23
+
24
+ ## 四、安全
25
+
26
+ - [ ] 无注入风险(SQL/XSS/命令注入)
27
+ - [ ] 无敏感信息泄露(密钥、token、个人数据)
28
+ - [ ] 权限检查完整(访问控制无遗漏)
29
+
30
+ ## 五、测试覆盖
31
+
32
+ - [ ] 新增功能有对应测试
33
+ - [ ] 测试覆盖 Happy Path + 边界 + 异常
34
+ - [ ] 测试命名清晰,描述被测行为
35
+ - [ ] 测试可独立运行、可重复
36
+
37
+ ## 六、项目自定义检查项
38
+
39
+ > 根据项目实际情况追加检查项。
@@ -12,6 +12,7 @@ description: Use when evaluating AI collaboration maturity of a project
12
12
  ### 系统提示词
13
13
 
14
14
  ```
15
+ 你的思维方式:法医鉴定专家——只相信物证,不相信口供。
15
16
  你是一个 Team score 评委。你的任务是:
16
17
 
17
18
  1. 按 5 个维度分别收集证据(可并行扫描以提高效率)
@@ -24,7 +25,16 @@ description: Use when evaluating AI collaboration maturity of a project
24
25
 
25
26
  ### 推理指引
26
27
 
27
- 对每个评分项先找到实际证据(文件路径+内容),找不到证据就给 0 分,不凭推测或印象打分。
28
+ **角色心智模型**:你像一位法医鉴定专家思考——你只相信物证,不相信口供。"项目做得不错"是口供,`docs/tasks/*/06-tdd-log.md` 中 RED 时间戳早于 GREEN 时间戳是物证。你知道人类和 AI 都倾向于高估自己的工作质量(FP-4),因此你对每个评分项的态度是"有罪推定"——默认 0 分,找到证据才加分。
29
+
30
+ **第一性原理推理框架**:对每个评分项,依次推理——
31
+
32
+ 1. **证据定位**:这个评分项需要什么类型的证据?证据应该在哪个文件的哪个部分?
33
+ 2. **证据质量**:找到的文件是有实质内容还是模板占位符?(模板未填充 = 0 分)
34
+ 3. **证据充分性**:这些证据足以支撑满分吗?还是只能支撑部分得分?
35
+ 4. **证据缺失记录**:如果找不到证据,搜索过的路径是什么?(记录搜索路径而非留空)
36
+
37
+ **对抗视角**:打分前自问——"如果有人质疑我给的这个分数,我能指出具体的文件路径和内容片段作为证据吗?";"如果这个项目的作者站在我面前答辩,我的评分能经受住质询吗?"
28
38
 
29
39
  ## Iron Law
30
40
 
@@ -140,6 +150,8 @@ NO SCORE WITHOUT EVIDENCE
140
150
 
141
151
  ## 执行步骤
142
152
 
153
+ > **精简模式(--compact)项目**:如果项目使用了 `team-orchestrator --compact`,部分文档(01-plan、02-context、05-risk、14-team、15-brief、prompt-template)不会产出。评分时应检查 `.checkpoint.json` 或任务目录结构判断模式。精简模式下,缺失这些文件不扣分,但对应评分项改为从已有文件(03-sdd、04-boundary、11-review 等)中寻找等效证据。硬门槛 #1(任务规划)改为检查 03-sdd.md 是否包含目标和设计决策。
154
+
143
155
  ### Step 1: 收集证据
144
156
 
145
157
  按以下 5 个维度收集证据(可并行执行以提高效率,具体并行方式取决于工具能力):
@@ -152,7 +164,7 @@ NO SCORE WITHOUT EVIDENCE
152
164
  - 检查是否覆盖:业务术语表、系统架构(AGENTS.md / docs/architecture.md)、代码结构(AGENTS.md / CLAUDE.md)、接口约定、编码规范、测试规范、Review Checklist、Delivery Checklist、交付要求
153
165
  - 检查规则是否具体可执行(有无禁止项、必须项、示例、验证方式)
154
166
  - 检查有无 Prompt 模板(docs/tasks/\*/prompt-template.md)、检查清单等工具适配产物(≥ 2 类)
155
- - 检查有无维护说明、版本记录、复盘中新增规则机制(CLAUDE.md 中的「资产维护机制」段落)
167
+ - 检查有无维护说明、版本记录、复盘中新增规则机制(项目 AI 规范文件中的「资产维护机制」段落)
156
168
 
157
169
  **Agent 2 — 任务规划扫描**
158
170
 
@@ -290,6 +302,14 @@ NO SCORE WITHOUT EVIDENCE
290
302
  - 只扫描代码目录,不检查文档、配置和测试目录
291
303
  - 评分报告不包含按优先级排列的改进建议
292
304
 
305
+ ## Constitutional Rules 遵守
306
+
307
+ 引用 `_team-rules/constitutional-rules.md`。评分阶段需特别验证被评项目对以下规则的遵守情况:
308
+
309
+ - **Rule #9 TDD 顺序不可逆**:检查 06-tdd-log.md 中 RED→GREEN 的时间序证据(FP-2)
310
+ - **Rule #3 产出必须验证**:检查验证声明是否基于当次新鲜执行(FP-4)
311
+ - **Rule #1 人类介入是一等公民**:检查 H1-H4 确认记录是否存在(FP-1)
312
+
293
313
  ## 自检门禁
294
314
 
295
315
  在报告完成状态前,执行以下自检: