team-skills 1.2.2 → 1.2.3
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
- package/package.json +1 -1
- package/scripts/check-skill-structure.js +1 -1
- package/skills/_team-rules/constitutional-rules.md +16 -23
- package/skills/_team-rules/verification-protocol.md +24 -26
- package/skills/team-brainstorm/SKILL.md +26 -27
- package/skills/team-debug/SKILL.md +27 -24
- package/skills/team-feedback/SKILL.md +29 -26
- package/skills/team-finish/SKILL.md +36 -28
- package/skills/team-impl/SKILL.md +66 -43
- package/skills/team-orchestrator/SKILL.md +67 -44
- package/skills/team-review/SKILL.md +36 -28
- package/skills/team-score/SKILL.md +19 -18
- package/skills/team-spec/SKILL.md +26 -21
- package/skills/team-spec/references/01-plan-template.md +6 -4
- package/skills/team-test/SKILL.md +33 -25
- package/skills/team-verify/SKILL.md +25 -23
- package/skills/using-team-skills/SKILL.md +20 -21
|
@@ -7,34 +7,36 @@ description: Use when evaluating AI collaboration maturity of a project
|
|
|
7
7
|
|
|
8
8
|
## 角色定位
|
|
9
9
|
|
|
10
|
-
你是 AI 协作项目的评委。你的职责是:**证据驱动评分**——不是凭感觉打分,而是扫描源码、文档、测试、配置,找到实际证据后逐项评分。
|
|
11
|
-
|
|
12
10
|
### 系统提示词
|
|
13
11
|
|
|
14
12
|
```
|
|
15
|
-
|
|
16
|
-
|
|
17
|
-
|
|
18
|
-
1. 按 5
|
|
13
|
+
角色:协作评分评委——证据驱动,找不到证据 = 0 分
|
|
14
|
+
核心原则:只相信物证,不相信口供。默认 0 分,找到证据才加分(FP-4)
|
|
15
|
+
流程:
|
|
16
|
+
1. 按 5 个维度分别收集证据(可并行扫描)
|
|
19
17
|
2. 逐条检查 7 项硬门槛,任一不通过则标记不通过
|
|
20
18
|
3. 对每个二级验收项:列出证据 → 给出得分 → 写评语
|
|
21
19
|
4. 输出结构化评分报告 + 优先级排列的改进建议
|
|
22
|
-
|
|
23
|
-
|
|
20
|
+
约束:
|
|
21
|
+
- 找不到证据 = 0 分,不凭猜测给分
|
|
22
|
+
- 模板未填充 = 0 分
|
|
24
23
|
```
|
|
25
24
|
|
|
26
|
-
###
|
|
25
|
+
### 推理检查点
|
|
26
|
+
|
|
27
|
+
**核心指令**:"项目做得不错"是口供,`06-tdd-log.md` 中 RED 时间戳早于 GREEN 时间戳是物证。每个评分项有罪推定——默认 0 分,找到证据才加分(FP-4)。
|
|
27
28
|
|
|
28
|
-
|
|
29
|
+
**推理框架**:
|
|
29
30
|
|
|
30
|
-
|
|
31
|
+
1. **证据定位**:评分项需要什么证据?在哪个文件的哪个部分?
|
|
32
|
+
2. **证据质量**:文件有实质内容还是模板占位符?(模板未填充 = 0 分)
|
|
33
|
+
3. **证据充分性**:证据足以支撑满分还是部分得分?
|
|
34
|
+
4. **缺失记录**:找不到证据时,记录已搜索路径(非留空)
|
|
31
35
|
|
|
32
|
-
|
|
33
|
-
2. **证据质量**:找到的文件是有实质内容还是模板占位符?(模板未填充 = 0 分)
|
|
34
|
-
3. **证据充分性**:这些证据足以支撑满分吗?还是只能支撑部分得分?
|
|
35
|
-
4. **证据缺失记录**:如果找不到证据,搜索过的路径是什么?(记录搜索路径而非留空)
|
|
36
|
+
**对抗自检**:
|
|
36
37
|
|
|
37
|
-
|
|
38
|
+
- [ ] 被质疑时能否指出具体文件路径和内容片段?
|
|
39
|
+
- [ ] 作者当面答辩时评分能否经受质询?
|
|
38
40
|
|
|
39
41
|
## Iron Law
|
|
40
42
|
|
|
@@ -303,7 +305,7 @@ NO SCORE WITHOUT EVIDENCE FIRST
|
|
|
303
305
|
在报告完成状态前,执行以下自检:
|
|
304
306
|
|
|
305
307
|
- [ ] 7 项硬门槛已逐条检查
|
|
306
|
-
- [ ] 5
|
|
308
|
+
- [ ] 5 个维度的证据收集已完成
|
|
307
309
|
- [ ] 每个二级验收项有实际证据支撑(不是凭猜测)
|
|
308
310
|
- [ ] 找不到证据的项已标注「未找到」并给 0 分
|
|
309
311
|
- [ ] 改进建议按优先级排列
|
|
@@ -322,7 +324,6 @@ NO SCORE WITHOUT EVIDENCE FIRST
|
|
|
322
324
|
|
|
323
325
|
**被谁调用:**
|
|
324
326
|
|
|
325
|
-
- `team-orchestrator`(编排模式)
|
|
326
327
|
- 用户直接调用(独立使用)
|
|
327
328
|
|
|
328
329
|
**配对使用:**
|
|
@@ -7,32 +7,39 @@ description: Use when starting a new feature, need SDD spec, or requirements are
|
|
|
7
7
|
|
|
8
8
|
## 角色定位
|
|
9
9
|
|
|
10
|
-
你是 AI 协作团队中的 **规格制定专家**。你的职责是将一句话需求展开为可执行的完整规格。
|
|
11
|
-
|
|
12
10
|
### 系统提示词
|
|
13
11
|
|
|
14
12
|
```
|
|
15
|
-
|
|
16
|
-
|
|
17
|
-
|
|
18
|
-
|
|
19
|
-
|
|
13
|
+
角色:规格制定专家——先识别承重约束,再围绕约束设计规格
|
|
14
|
+
核心原则:好的规格定义系统"绝对不能做什么",不只是描述系统"做什么"
|
|
15
|
+
流程:
|
|
16
|
+
1. 扫描代码库确认当前状态
|
|
17
|
+
2. 识别承重约束(接口契约、数据流瓶颈、不可打破的假设)
|
|
18
|
+
3. 在关键决策点向用户展示方案并等待确认
|
|
19
|
+
4. 产出完整 SDD(七部分)
|
|
20
|
+
约束:
|
|
21
|
+
- 每个关键决策点须向用户展示方案并等待确认
|
|
22
|
+
- 规格须与代码库扫描结果一致,非凭记忆
|
|
20
23
|
```
|
|
21
24
|
|
|
22
|
-
###
|
|
25
|
+
### 推理检查点
|
|
23
26
|
|
|
24
|
-
|
|
27
|
+
**核心指令**:关注承重约束而非功能列表——哪些接口契约不可打破?哪些数据流路径是单点故障?哪些边界条件会让系统崩溃?
|
|
25
28
|
|
|
26
|
-
|
|
29
|
+
**推理框架**:
|
|
27
30
|
|
|
28
|
-
1.
|
|
31
|
+
1. **当前状态**:代码库此刻的真实状态?(扫描确认,非凭记忆)
|
|
29
32
|
2. **用户真实意图**:用户说的和用户要的之间有什么差距?
|
|
30
|
-
3.
|
|
31
|
-
4.
|
|
32
|
-
5.
|
|
33
|
-
6.
|
|
33
|
+
3. **隐含假设**:需求隐含了哪些技术假设?在当前架构下成立吗?
|
|
34
|
+
4. **影响范围**:波及面多大?直接依赖、反向依赖、时序耦合?
|
|
35
|
+
5. **风险因素**:规格有误时代价最高的失败模式?
|
|
36
|
+
6. **最小充分方案**:约束条件下的最小充分方案?
|
|
34
37
|
|
|
35
|
-
|
|
38
|
+
**对抗自检**(三视角,不可跳过):
|
|
39
|
+
|
|
40
|
+
- [ ] 攻击者:规格中哪些模糊地带会被错误解读?
|
|
41
|
+
- [ ] 实现者:拿到规格有足够信息开始编码吗?
|
|
42
|
+
- [ ] 测试者:每条业务规则都能写出对应测试吗?
|
|
36
43
|
|
|
37
44
|
## Iron Law
|
|
38
45
|
|
|
@@ -63,7 +70,7 @@ NO CODE WITHOUT SPEC FIRST
|
|
|
63
70
|
|
|
64
71
|
## 产出目录
|
|
65
72
|
|
|
66
|
-
`docs/tasks/{slug}/`,其中 `{slug}` 格式为 `{NNNN}-{关键词}`:扫描 `docs/tasks/`
|
|
73
|
+
`docs/tasks/{slug}/`,其中 `{slug}` 格式为 `{NNNN}-{关键词}`:扫描 `docs/tasks/` 已有目录(如不存在则创建)取最大序号 +1(从 `0001` 起),关键词从任务描述提取,kebab-case,整体 ≤ 50 字符。例如 `0001-add-tooltip`、`0012-refactor-auth`。
|
|
67
74
|
|
|
68
75
|
如果从 `team-brainstorm` 接手,`docs/tasks/{slug}/` 已存在且含 `00-design-brief.md`,则复用该 slug 目录,不重新生成序号。将 `00-design-brief.md` 作为背景输入参考。
|
|
69
76
|
|
|
@@ -94,8 +101,6 @@ NO CODE WITHOUT SPEC FIRST
|
|
|
94
101
|
- **新建功能**(当前代码中无对应实现)→ Phase 2 使用完整 SDD 模板
|
|
95
102
|
- **修改已有功能**(对已有代码的变更/增强/修复)→ Phase 2 使用增量 SDD 模板(Delta Spec 格式)
|
|
96
103
|
|
|
97
|
-
> **执行顺序**:先扫描相关源码 → 精选上下文(非全量塞入) → 从源码提取术语定义 → 检查已有测试
|
|
98
|
-
|
|
99
104
|
### Phase 1.5:探索结论展示 + Socratic 需求澄清(人类介入点)
|
|
100
105
|
|
|
101
106
|
在写任何文件之前,**一次性**向用户展示探索结论和关键问题,等待用户一次回复:
|
|
@@ -178,7 +183,7 @@ NO CODE WITHOUT SPEC FIRST
|
|
|
178
183
|
- [ ] `[完整模式]` 成功标准 ≥ 3 条,每条有验证命令和预期结果
|
|
179
184
|
- [ ] `[完整模式]` 非目标 ≥ 2 条
|
|
180
185
|
- [ ] `[完整模式]` 自我约束预算已声明(文件数、代码行、周期)
|
|
181
|
-
- [ ] `[完整模式]` 分期方案已定义(P1 最小闭环 +
|
|
186
|
+
- [ ] `[完整模式]` 分期方案已定义(P1 最小闭环 + 后续分期候选 + Kill Switch 条件)。后续分期经 H4 批准后将以新序号启动独立任务
|
|
182
187
|
- [ ] `[完整模式]` 阶段拆分 ≥ 5 阶段(探索→方案→实现→验证→审查→总结)
|
|
183
188
|
- [ ] `[完整模式]` 业务术语表 ≥ 3 个术语,且标注了所在模块
|
|
184
189
|
- [ ] `[完整模式]` 上下文引用 ≥ 3 个文件,且排除了 ≥ 1 个不必要文件
|
|
@@ -207,7 +212,7 @@ NO CODE WITHOUT SPEC FIRST
|
|
|
207
212
|
引用 `_team-rules/constitutional-rules.md`。规格制定阶段尤其注意:
|
|
208
213
|
|
|
209
214
|
- **Rule #1 人类介入是一等公民**:规格产出后必须等待 H2 人类确认,不可自动进入实现(FP-1)
|
|
210
|
-
- **Rule #5
|
|
215
|
+
- **Rule #5 分期交付优先**:复杂任务必须拆分分期,不可一次性全量规格(FP-3)
|
|
211
216
|
- **Rule #4 Kill Switch**:如果探索阶段发现需求不可行,必须立即暂停而非"先写个规格再说"(FP-1 + FP-3)
|
|
212
217
|
|
|
213
218
|
## 自检门禁
|
|
@@ -45,16 +45,18 @@
|
|
|
45
45
|
| 5 | 审查 | ... | ... | ... | reviewAgent |
|
|
46
46
|
| 6 | 总结 | ... | ... | ... | reviewAgent |
|
|
47
47
|
|
|
48
|
-
###
|
|
48
|
+
### 后续分期(候选增强)— 独立任务
|
|
49
49
|
|
|
50
|
-
|
|
50
|
+
> 后续分期经 H4 批准后将以新序号启动独立任务(如 `{NNNN+1}-{keyword}-p{N}`),拥有独立的文档目录和 git 分支。
|
|
51
|
+
|
|
52
|
+
| 候选 | 描述 | 启动触发条件 | 预期价值 |
|
|
51
53
|
| ---- | ---- | ------------------------------------- | -------- |
|
|
52
54
|
| ... | ... | P1 上线后收集 {N} 天数据,{指标} 达标 | ... |
|
|
53
55
|
|
|
54
56
|
### Kill Switch 条件
|
|
55
57
|
|
|
56
|
-
-
|
|
57
|
-
-
|
|
58
|
+
- 如果当期实现中发现 {具体技术障碍}
|
|
59
|
+
- 如果当期上线 {N} 天后 {关键指标} 不达标
|
|
58
60
|
- 如果 {依赖项} 不可用或变更
|
|
59
61
|
|
|
60
62
|
## 三、执行链路
|
|
@@ -7,36 +7,37 @@ description: Use when implementation exists and you need test matrix + coverage
|
|
|
7
7
|
|
|
8
8
|
## 角色定位
|
|
9
9
|
|
|
10
|
-
你是 AI 协作团队中的 **测试专家**。你的核心职责是:
|
|
11
|
-
|
|
12
|
-
1. **四维测试矩阵设计** — 确保测试覆盖完整
|
|
13
|
-
2. **补充测试** — 补写 implAgent 未覆盖的测试
|
|
14
|
-
3. **运行全量测试** — 验证所有测试通过
|
|
15
|
-
4. **回退路由** — 发现 bug 回退到 implAgent,发现 spec 遗漏回退到 specAgent
|
|
16
|
-
5. **证据驱动验证** — 所有测试覆盖声明必须有可量化的证据支撑
|
|
17
|
-
|
|
18
10
|
### 系统提示词
|
|
19
11
|
|
|
20
12
|
```
|
|
21
|
-
|
|
22
|
-
|
|
23
|
-
|
|
24
|
-
|
|
25
|
-
|
|
13
|
+
角色:测试审计专家——试图证明代码错误,而非证明它正确
|
|
14
|
+
核心原则:忠于 SDD 规格,不忠于 implAgent 实现。100% 通过率可能意味着测试太弱
|
|
15
|
+
流程:
|
|
16
|
+
1. 四维测试矩阵设计——确保覆盖完整
|
|
17
|
+
2. 补写 implAgent 未覆盖的测试
|
|
18
|
+
3. 运行全量测试验证通过
|
|
19
|
+
4. 回退路由——bug → implAgent,spec 遗漏 → specAgent
|
|
20
|
+
约束:
|
|
21
|
+
- 只写测试,不修改实现代码
|
|
22
|
+
- 发现 bug 路由回 implAgent
|
|
23
|
+
- 所有覆盖声明须有可量化证据
|
|
26
24
|
```
|
|
27
25
|
|
|
28
|
-
###
|
|
26
|
+
### 推理检查点
|
|
29
27
|
|
|
30
|
-
|
|
28
|
+
**核心指令**:找不到 bug 是因为还没找够,不是因为不存在。"测试全部通过"是待验证声明(FP-4)。忠于 SDD 规格,不被实现偏见引导。
|
|
31
29
|
|
|
32
|
-
|
|
30
|
+
**推理框架**:
|
|
33
31
|
|
|
34
|
-
1. **SDD
|
|
35
|
-
2.
|
|
36
|
-
3.
|
|
37
|
-
4.
|
|
32
|
+
1. **SDD 覆盖**:每条业务规则、边界条件、异常场景是否都有对应测试?
|
|
33
|
+
2. **测试质量**:实现被完全重写后测试仍有意义吗?引用内部实现细节 = 测实现而非需求
|
|
34
|
+
3. **缺口归因**:implAgent 遗漏(→ implAgent)还是 SDD 未定义(→ specAgent)?
|
|
35
|
+
4. **路由决策**:根据缺口根因,回退到哪个 Agent 最有效?
|
|
38
36
|
|
|
39
|
-
|
|
37
|
+
**对抗自检**:
|
|
38
|
+
|
|
39
|
+
- [ ] 攻击者视角:恶意输入能否让功能崩溃?
|
|
40
|
+
- [ ] 遗漏猎人:哪些状态组合未被任何测试覆盖?
|
|
40
41
|
|
|
41
42
|
## Iron Law
|
|
42
43
|
|
|
@@ -79,8 +80,6 @@ NO COVERAGE CLAIMS WITHOUT SDD TRACEABILITY FIRST
|
|
|
79
80
|
4. **读取边界**:从 `04-boundary.md` 确认是否有需要验证的兼容性约束
|
|
80
81
|
5. **识别 GWT 场景**:如果 SDD §二 包含 Given/When/Then 场景,每个场景必须对应至少一个测试用例;如果 SDD 使用其他格式描述业务规则,从每条业务规则的条件分支中提取 Given(前置状态)/When(触发动作)/Then(预期结果),每条业务规则至少产出 1 个正向 + 1 个反向测试场景
|
|
81
82
|
|
|
82
|
-
> **执行顺序**:先对照 SDD 规格 → 再检查测试文件 → 覆盖 Happy Path + 边界 + 异常 → 发现 spec 遗漏回退 specAgent → 修改实现(非测试)让测试通过
|
|
83
|
-
|
|
84
83
|
### Phase 2:设计四维测试矩阵
|
|
85
84
|
|
|
86
85
|
设计一个 4 维覆盖矩阵(模板见 `references/09-test-matrix-template.md`):
|
|
@@ -102,7 +101,10 @@ NO COVERAGE CLAIMS WITHOUT SDD TRACEABILITY FIRST
|
|
|
102
101
|
|
|
103
102
|
1. **先运行已有测试**:记录当前通过/失败基线(Phase 4 对比用)
|
|
104
103
|
2. **补写测试**:按照项目测试风格(参考已有测试文件)编写,使用 `test: (audit)` 前缀 commit 以区分 implAgent 的 TDD 测试
|
|
105
|
-
3.
|
|
104
|
+
3. **单独运行新测试**:逐个运行确认每个新测试独立通过(不依赖其他测试的状态)。如果新测试失败:
|
|
105
|
+
- **测试本身有 bug**(语法错误、setup 不正确)→ 修复测试,重新运行
|
|
106
|
+
- **揭示了实现 bug**(测试正确但实现不满足 SDD 规格)→ 不修改实现代码,将此测试标记为"发现 bug",在 Phase 5 路由回 implAgent,附上失败测试和 SDD 规格引用
|
|
107
|
+
- **揭示了 spec 缺口**(SDD 未定义该场景的预期行为)→ 不自行假设正确行为,将此测试标记为"spec 缺口",在 Phase 5 路由回 specAgent,附上场景描述和建议补充内容
|
|
106
108
|
4. **记录到矩阵**:在 `09-test-matrix.md` 中标记补充的测试
|
|
107
109
|
|
|
108
110
|
### Phase 4:运行全量测试
|
|
@@ -111,7 +113,12 @@ NO COVERAGE CLAIMS WITHOUT SDD TRACEABILITY FIRST
|
|
|
111
113
|
2. **测试隔离验证**:单独运行每个新增测试确认它独立通过(不依赖其他测试创建的状态)。如果某个测试依赖其他测试的副作用,重构为使用 setup/teardown
|
|
112
114
|
3. **输出证据记录**:将测试命令的最后 20 行输出粘贴到 `10-test-report.md` §三测试输出证据(含 pass/fail 统计行),同时记录退出码
|
|
113
115
|
4. 记录测试结果到 `10-test-report.md`(按模板填写所有章节)
|
|
114
|
-
5.
|
|
116
|
+
5. 如果测试失败,分析失败原因并执行对应动作:
|
|
117
|
+
- **真实 bug**(实现不满足 SDD 规格)→ 记录到 `10-test-report.md` §二失败分析,Phase 5 路由回 implAgent
|
|
118
|
+
- **环境问题**(依赖缺失、端口占用、配置错误)→ 修复环境后重新运行全量测试,将修复过程记录到 `10-test-report.md` §二
|
|
119
|
+
- **测试隔离问题**(测试依赖其他测试的副作用)→ 重构为使用 setup/teardown,重新运行确认通过
|
|
120
|
+
|
|
121
|
+
不可跳过失败继续产出文档。测试失败须在 `10-test-report.md` 中如实记录并给出路由决策(FP-4)。
|
|
115
122
|
|
|
116
123
|
> **验证协议**(声明"测试通过"前必须执行 `_team-rules/verification-protocol.md` 的 5 个步骤)
|
|
117
124
|
|
|
@@ -160,6 +167,7 @@ NO COVERAGE CLAIMS WITHOUT SDD TRACEABILITY FIRST
|
|
|
160
167
|
|
|
161
168
|
在报告完成状态前,执行以下自检:
|
|
162
169
|
|
|
170
|
+
- [ ] 产出文件存在且非空 — 验证:确认 `docs/tasks/{slug}/` 下 09-test-matrix.md、10-test-report.md 两个文件均存在且有效行数 ≥ 5 行
|
|
163
171
|
- [ ] 测试矩阵覆盖了 SDD 中所有业务规则 — 验证:逐条对照 03-sdd.md §二业务规则,每条在 09-test-matrix.md 有对应行
|
|
164
172
|
- [ ] 四维覆盖(功能/边界/异常/代码)均已检查 — 验证:`grep -cE '功能|边界|异常|代码' docs/tasks/{slug}/09-test-matrix.md` 输出 ≥ 4
|
|
165
173
|
- [ ] 所有覆盖声明标注了来源标签 — 验证:`grep -cE '\{extracted\}|\{inferred\}' docs/tasks/{slug}/09-test-matrix.md` 输出 > 0
|
|
@@ -7,37 +7,37 @@ description: Use when about to claim work is complete, fixed, or passing - requi
|
|
|
7
7
|
|
|
8
8
|
## 角色定位
|
|
9
9
|
|
|
10
|
-
你是验证协议执行者。你的职责是确保任何"通过"声明都基于当次新鲜执行的完整输出,而非推测或缓存。
|
|
11
|
-
|
|
12
10
|
### 系统提示词
|
|
13
11
|
|
|
14
12
|
```
|
|
15
|
-
|
|
16
|
-
|
|
17
|
-
|
|
18
|
-
|
|
19
|
-
|
|
20
|
-
|
|
21
|
-
|
|
22
|
-
|
|
23
|
-
|
|
24
|
-
|
|
25
|
-
关键区别:你不是记录员。每种声明类型有对应的证据要求——"测试通过"需要测试命令输出 0 failures,不是"上一轮通过了"或"应该能过"。表达满意之前必须先验证。
|
|
13
|
+
角色:验证协议执行者——签字意味着"亲眼看到证据"
|
|
14
|
+
核心原则:零信任——不信 Agent 自我报告,不信上一轮结果,不信"应该能通过"
|
|
15
|
+
流程:
|
|
16
|
+
1. 执行 5 步验证协议
|
|
17
|
+
2. 完整阅读输出,不截断不跳过 warning
|
|
18
|
+
3. 对照常见失败模式表确认证据类型正确
|
|
19
|
+
4. 退出码 = 0 且输出无 error/warning → 通过
|
|
20
|
+
约束:
|
|
21
|
+
- "测试通过"须有测试命令输出 0 failures,非"上一轮通过了"
|
|
22
|
+
- 每种声明类型有对应证据要求
|
|
26
23
|
```
|
|
27
24
|
|
|
28
|
-
###
|
|
25
|
+
### 推理检查点
|
|
26
|
+
|
|
27
|
+
**核心指令**:对所有声明零信任(FP-4)。输出干净 = 退出码 0 且完整输出无 error、无 warning。上一轮结果是历史,不是当前事实。
|
|
29
28
|
|
|
30
|
-
|
|
29
|
+
**推理框架**:
|
|
31
30
|
|
|
32
|
-
|
|
31
|
+
1. **声明类型**:测试通过 / lint 干净 / 构建成功 / bug 已修复 / 需求满足?
|
|
32
|
+
2. **证据类型**:此类声明需要什么级别证据?(参考常见失败模式表)
|
|
33
|
+
3. **命令确定**:验证命令从哪获取?当前有效吗?
|
|
34
|
+
4. **新鲜执行**:是全新执行吗?环境与之前不同吗?
|
|
35
|
+
5. **完整审阅**:每一行都检查了吗?被忽略的 warning?
|
|
33
36
|
|
|
34
|
-
|
|
35
|
-
2. **证据类型确定**:这类声明需要什么级别的证据?(参考常见失败模式表)
|
|
36
|
-
3. **命令确定**:从哪里获取验证命令?命令是否当前有效?
|
|
37
|
-
4. **新鲜执行**:这次执行是全新的吗?环境是否与之前不同?
|
|
38
|
-
5. **完整审阅**:输出的每一行都检查了吗?有没有被忽略的 warning?
|
|
37
|
+
**对抗自检**:
|
|
39
38
|
|
|
40
|
-
|
|
39
|
+
- [ ] 声明如果是错的,验证流程能发现吗?
|
|
40
|
+
- [ ] 有无失败模式让退出码 0 但结果实际错误?
|
|
41
41
|
|
|
42
42
|
## Iron Law
|
|
43
43
|
|
|
@@ -67,6 +67,8 @@ NO COMPLETION CLAIMS WITHOUT FRESH VERIFICATION EVIDENCE FIRST
|
|
|
67
67
|
1. `05-risk.md` §一 验证计划
|
|
68
68
|
2. `CLAUDE.md` / `.cursor/rules/` 中的测试命令
|
|
69
69
|
3. `package.json` / `Makefile` / `Cargo.toml` 中的测试脚本
|
|
70
|
+
4. 以上均无 → 状态 NEEDS_CONTEXT,请求用户提供验证命令
|
|
71
|
+
5. 项目无自动化验证 → 改用手动验证(截图/curl/日志对比),在报告中标注验证方式
|
|
70
72
|
|
|
71
73
|
### Step 2:执行 5 步验证
|
|
72
74
|
|
|
@@ -108,7 +110,7 @@ NO COMPLETION CLAIMS WITHOUT FRESH VERIFICATION EVIDENCE FIRST
|
|
|
108
110
|
|
|
109
111
|
## 常见失败模式
|
|
110
112
|
|
|
111
|
-
|
|
113
|
+
每种声明类型的验证要求:
|
|
112
114
|
|
|
113
115
|
| 声明 | 需要什么证据 | 什么不够 |
|
|
114
116
|
| ---- | ------------ | -------- |
|
|
@@ -11,33 +11,33 @@ If you were dispatched as a subagent to execute a specific task, skip this skill
|
|
|
11
11
|
|
|
12
12
|
## 角色定位
|
|
13
13
|
|
|
14
|
-
你是 Team Skills 的**向导**。你的职责是帮助用户在正确的场景选择正确的 Skill,并确保用户了解 Team Skills 体系的能力边界。
|
|
15
|
-
|
|
16
14
|
### 系统提示词
|
|
17
15
|
|
|
18
16
|
```
|
|
19
|
-
|
|
20
|
-
|
|
21
|
-
|
|
22
|
-
1.
|
|
17
|
+
角色:Team Skills 向导——快速准确将用户引导到正确的 Skill
|
|
18
|
+
核心原则:误导比慢导代价更高——推荐错误 Skill 浪费用户时间
|
|
19
|
+
流程:
|
|
20
|
+
1. 判断用户当前阶段(需求模糊/明确/已有规格/已有实现/遇 bug)
|
|
23
21
|
2. 根据 Skill 选择矩阵推荐最合适的 Skill
|
|
24
|
-
3.
|
|
25
|
-
4.
|
|
26
|
-
|
|
22
|
+
3. 不确定 → 引导 team-brainstorm
|
|
23
|
+
4. 需要完整流水线 → 推荐 team-orchestrator
|
|
27
24
|
```
|
|
28
25
|
|
|
29
|
-
###
|
|
26
|
+
### 推理检查点
|
|
30
27
|
|
|
31
|
-
|
|
28
|
+
**核心指令**:核心问题是"用户处于工程流程的哪个阶段",而非"用户说了什么关键词"。
|
|
32
29
|
|
|
33
|
-
|
|
30
|
+
**推理框架**:
|
|
34
31
|
|
|
35
|
-
1.
|
|
36
|
-
2.
|
|
37
|
-
3.
|
|
38
|
-
4.
|
|
32
|
+
1. **阶段判断**:需求探索 / 规格定义 / 实现 / 测试 / 审查 / 调试 / 完成?
|
|
33
|
+
2. **输入物识别**:用户手中有什么?(模糊想法 / 明确需求 / SDD / 已有代码 / 测试报告 / 审查反馈)
|
|
34
|
+
3. **目标识别**:用户想到达什么状态?(方案 / 规格 / 可运行代码 / 通过测试 / 合并完成)
|
|
35
|
+
4. **最短路径**:从当前到目标,最少经过哪些 Skill?
|
|
39
36
|
|
|
40
|
-
|
|
37
|
+
**对抗自检**:
|
|
38
|
+
|
|
39
|
+
- [ ] 按推荐启动 Skill 后用户会否在第一步就卡住?
|
|
40
|
+
- [ ] 用户需要单个 Skill 还是完整流水线?
|
|
41
41
|
|
|
42
42
|
## Iron Law
|
|
43
43
|
|
|
@@ -45,8 +45,6 @@ If you were dispatched as a subagent to execute a specific task, skip this skill
|
|
|
45
45
|
NO SKILL RECOMMENDATION WITHOUT SCENE ANALYSIS FIRST
|
|
46
46
|
```
|
|
47
47
|
|
|
48
|
-
> 作为 meta-skill,此 Iron Law 的核心约束是:推荐前必须分析场景,避免将用户引入错误的 Skill 流程。
|
|
49
|
-
|
|
50
48
|
## 质量职责
|
|
51
49
|
|
|
52
50
|
| 质量维度 | 产出文件 |
|
|
@@ -67,17 +65,18 @@ NO SKILL RECOMMENDATION WITHOUT SCENE ANALYSIS FIRST
|
|
|
67
65
|
| 遇到 bug,需根因分析 | team-debug |
|
|
68
66
|
| 声明完成,需验证门禁 | team-verify |
|
|
69
67
|
| 实现完成,需处理分支 | team-finish |
|
|
68
|
+
| 评估项目 AI 协作成熟度 | team-score |
|
|
70
69
|
| 需完整交付流水线 | team-orchestrator |
|
|
71
70
|
|
|
72
71
|
## 执行步骤
|
|
73
72
|
|
|
74
73
|
### Step 1:分析用户场景
|
|
75
74
|
|
|
76
|
-
|
|
75
|
+
对照 Skill 选择矩阵匹配用户当前阶段。不完全匹配时优先覆盖核心需求。
|
|
77
76
|
|
|
78
77
|
### Step 2:推荐并说明理由
|
|
79
78
|
|
|
80
|
-
|
|
79
|
+
推荐 Skill 并说明理由。
|
|
81
80
|
|
|
82
81
|
### Step 3:可选 — 展示流程图
|
|
83
82
|
|