@haaaiawd/anws 2.2.0 → 2.2.2

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (28) hide show
  1. package/README.md +180 -343
  2. package/bin/cli.js +112 -112
  3. package/lib/changelog.js +258 -258
  4. package/lib/copy.js +116 -109
  5. package/lib/diff.js +11 -0
  6. package/lib/manifest.js +4 -1
  7. package/lib/update.js +319 -319
  8. package/package.json +4 -3
  9. package/templates/.agents/skills/anws-system/SKILL.md +9 -7
  10. package/templates/.agents/skills/code-reviewer/SKILL.md +102 -327
  11. package/templates/.agents/skills/concept-modeler/SKILL.md +19 -17
  12. package/templates/.agents/skills/craft-authoring/SKILL.md +123 -0
  13. package/templates/.agents/skills/e2e-testing-guide/SKILL.md +59 -0
  14. package/templates/.agents/skills/system-designer/SKILL.md +6 -6
  15. package/templates/.agents/skills/system-designer/references/system-design-template.md +17 -17
  16. package/templates/.agents/skills/task-planner/SKILL.md +113 -113
  17. package/templates/.agents/skills/task-planner/references/TASK_TEMPLATE.md +82 -82
  18. package/templates/.agents/workflows/blueprint.md +284 -284
  19. package/templates/.agents/workflows/challenge.md +450 -491
  20. package/templates/.agents/workflows/change.md +263 -286
  21. package/templates/.agents/workflows/craft.md +243 -664
  22. package/templates/.agents/workflows/design-system.md +624 -624
  23. package/templates/.agents/workflows/explore.md +400 -371
  24. package/templates/.agents/workflows/forge.md +444 -413
  25. package/templates/.agents/workflows/genesis.md +342 -395
  26. package/templates/.agents/workflows/probe.md +21 -16
  27. package/templates/.agents/workflows/quickstart.md +123 -138
  28. package/templates/AGENTS.md +149 -134
@@ -0,0 +1,123 @@
1
+ ---
2
+ name: craft-authoring
3
+ description: 执行 /craft 时必读:提供 Workflow / Skill / Prompt 的脚手架模板、防护语法、填充与验证清单;长模板与自检细节不在 craft workflow 内重复,一律以本 skill 为准。
4
+ ---
5
+
6
+ # Craft Authoring — 脚手架与自检
7
+
8
+ 本 skill 承接 **`/craft` workflow** 中「怎么写」的细节;`/craft` 只保留仪式与步骤路由。**禁止**在 workflow 里复述本节全文。
9
+
10
+ ## Workflow 骨架(最小可用)
11
+
12
+ ```markdown
13
+ ---
14
+ description: [一句话,列表展示用]
15
+ ---
16
+
17
+ # /name
18
+
19
+ <phase_context>
20
+ 你是 **[角色]**。
21
+ **使命**:…
22
+ **能力**:…
23
+ **限制**:…
24
+ **原则**:…
25
+ **与用户的关系**:…
26
+ **Output Goal**: `路径`
27
+ </phase_context>
28
+
29
+ ---
30
+
31
+ ## ⚠️ CRITICAL …
32
+
33
+ > [!IMPORTANT]
34
+ > **为什么**:…
35
+ > - ❌ …
36
+ > - ✅ …
37
+
38
+ ---
39
+
40
+ ## Step 1: …
41
+
42
+ **目标**:…
43
+
44
+ > [!IMPORTANT]
45
+ > 你**必须**… **为什么?** …
46
+
47
+ **思考引导**:
48
+ 1. …
49
+ 2. …
50
+
51
+ ---
52
+
53
+ <completion_criteria>
54
+ - ✅ …
55
+ </completion_criteria>
56
+ ```
57
+
58
+ ## Skill 骨架(description 必须是触发条件)
59
+
60
+ ```markdown
61
+ ---
62
+ name: kebab-name
63
+ description: 当 [具体触发场景] 时加载。[一句话能力概括]
64
+ ---
65
+
66
+ # 标题
67
+
68
+ ## 硬边界 / 原则
69
+
70
+
71
+ ## 输入 / 输出契约
72
+
73
+ ```
74
+
75
+ **description 忌**:泛泛「我能处理 PDF」;**宜**:「当用户要读取/编辑 PDF 时」。
76
+
77
+ ## Prompt 骨架
78
+
79
+ ```markdown
80
+ # 标题
81
+
82
+ ## 角色
83
+
84
+
85
+ ## 任务
86
+
87
+
88
+ ## 约束
89
+
90
+
91
+ ## 输出格式
92
+
93
+ ```
94
+
95
+ ## 防护语法速查
96
+
97
+
98
+ | 机制 | 用途 |
99
+ | ----------------------- | -------- |
100
+ | `[!IMPORTANT]` | 不可跳过节点 |
101
+ | `## ⚠️ CRITICAL` | 边界醒目 |
102
+ | `你**必须**` | 强制动作 |
103
+ | 具体引导问题 | 替代「好好想想」 |
104
+ | `<completion_criteria>` | 完成定义 |
105
+
106
+
107
+ 重要约束建议包含:**做什么 / 为什么 / 违反时长什么样**。
108
+
109
+ ## 填充内容(Step 5 等价)
110
+
111
+ 用 `sequential-thinking` 组织 **3–5 个 thought**,覆盖:目标、最易错点、每步 I/O、引导问题、模板复用、调研结论如何打入文档。
112
+
113
+ **质量扫一眼**:目标是否逐步清晰、约束是否有「为什么」、是否有输出模板、关键处有 ❌/✅ 对照(如需)。
114
+
115
+ ## 验证清单(输出前)
116
+
117
+ **结构**:frontmatter、`phase_context`(workflow)、CRITICAL 块、每步有目标、`<completion_criteria>`。
118
+
119
+ **内容**:路径含 `.anws/v{N}/` 若适用、kebab-case、工具调用语法正确。
120
+
121
+ ## 自我批评(输出前最后一道)
122
+
123
+ 用 `sequential-thinking` **3–5 thought**:用户会在哪卡住?AI 可能在哪偷懒跳过?与 `/challenge` 级质量相比缺什么?随后迭代修复再交付。
@@ -0,0 +1,59 @@
1
+ ---
2
+ name: e2e-testing-guide
3
+ description: /forge 验证阶段专用:当任务要求 E2E、浏览器冒烟或手动网页验证时,产出可追溯的 Testing Guide(步骤、数据、证据);具备浏览器工具与用户授权时可执行真实页面验证,否则仅交付定稿指南与未执行声明。
4
+ ---
5
+
6
+ # E2E / Browser Testing Guide
7
+
8
+ 你是 **E2E Testing Guide** 作者。你不替代单元测试;你把「人在浏览器里如何证明没错」写成可执行协议。
9
+
10
+ ## 硬约束
11
+
12
+ - **禁止根据 IDE 名称假设能力**:仅依据当前会话是否具备浏览器自动化/MCP、用户是否授权。
13
+ - **无工具时的诚实**:无浏览器工具 → 输出 **L0 定稿指南** + **未执行声明**(不得写「已点击已截图」类伪造证据)。
14
+ - **与 code-reviewer 分离**:本 skill 负责行为与链路验证指南;静态契约对齐归 `code-reviewer`。
15
+
16
+ ## 激活时机
17
+
18
+ - **`/forge`**:任务 `**验证类型**` 为 E2E,或手动验证依赖浏览器/UI。
19
+
20
+ ## 产出结构(MUST)
21
+
22
+ 1. **环境**:URL/端口、账号角色、种子数据、feature flag。
23
+ 2. **步骤**:编号步骤,每步期望 DOM/网络/控制台信号。
24
+ 3. **证据**:截图命名、HAR/日志路径、录屏可选。
25
+ 4. **负面路径**:至少 1 条失败/空态/权限拒绝场景(若任务范围包含)。
26
+ 5. **评分**:对照项目 E2E Rubric(若任务引用)或最小 MUST 清单。
27
+
28
+ ## Rubric 最小 MUST(无项目模板时使用)
29
+
30
+ - 可从冷启动复现
31
+ - 每步有可观察断言(不是「看起来没问题」)
32
+ - 覆盖任务验收标准中的 Given-When-Then
33
+ - 记录已知 flake 与重试策略
34
+
35
+ ## Browser-capable 模式
36
+
37
+ 当浏览器工具可用且用户授权:
38
+
39
+ 1. 按 Guide 执行关键路径
40
+ 2. 附加截图或控制台摘录到验证报告
41
+ 3. 若环境阻塞(登录/验证码/缺数据)→ 记录 blocker,降级为 guide-only
42
+
43
+ ## 输出模板
44
+
45
+ ```markdown
46
+ ## E2E / Browser 验证 — T{X.Y.Z}
47
+
48
+ **模式**: Executed | Guide-only
49
+ **环境**: …
50
+
51
+ ### 步骤
52
+ 1. …
53
+
54
+ ### 证据
55
+ - …
56
+
57
+ ### 未执行 / Blockers(如有)
58
+ - …
59
+ ```
@@ -146,7 +146,7 @@ description: 为单个系统设计详细的技术文档。负责架构图、接
146
146
  8. **Trade-offs & Alternatives** ⭐ - 为什么选A不选B
147
147
  9. **安全性考虑 (Security)** - 认证、加密、风险缓解
148
148
  10. **性能考虑 (Performance)** - 目标、优化策略、监控
149
- 11. **测试策略 (Testing)** - 单元、集成、E2E、契约验证责任矩阵
149
+ 11. **测试策略 (Testing)** - 单元、集成、E2E、契约验证责任矩阵
150
150
 
151
151
  ### 可选章节 (Optional)
152
152
  12. **部署与运维 (Deployment)** - 部署流程、监控告警(小项目可简化)
@@ -383,11 +383,11 @@ flowchart TD
383
383
 
384
384
  在完成系统设计文档后,使用此清单自检:
385
385
 
386
- ### 结构完整性
387
- - [ ] 包含所有11个必需章节
388
- - [ ] 架构图存在且清晰(Mermaid)
389
- - [ ] 数据流图存在(如适用)
390
- - [ ] 如系统涉及公共契约,11.5 Contract Verification Matrix 已填写
386
+ ### 结构完整性
387
+ - [ ] 包含所有11个必需章节
388
+ - [ ] 架构图存在且清晰(Mermaid)
389
+ - [ ] 数据流图存在(如适用)
390
+ - [ ] 如系统涉及公共契约,11.5 Contract Verification Matrix 已填写
391
391
  - [ ] Trade-offs章节至少讨论2个重要决策
392
392
 
393
393
  ### 内容质量
@@ -440,23 +440,23 @@ classDiagram
440
440
  - **Test Scenarios**:
441
441
  - [ ] 用户登录完整流程(前端 → 后端 → 数据库)
442
442
 
443
- ### 11.4 Performance Testing (性能测试)
444
- - **Tool**: Locust / k6
445
- - **Scenarios**:
446
- - [ ] 1000 并发用户登录
447
- - [ ] Target: p95 < 200ms
448
-
449
- ### 11.5 Contract Verification Matrix (契约-验证责任矩阵)
450
-
451
- | 契约 | 风险级别 | 正常态验证 | 失败态验证 | 回归责任 |
452
- |------|---------|-----------|-----------|---------|
453
- | `POST /auth/login` | 关键路径 | 集成测试 | 非法凭证返回 401 | 认证主链路最小回归 |
454
- | JWT 生成规则 | 基础规则层 | 单元测试 | 非法输入/过期边界 | token 相关回归 |
455
-
456
- > **要求**:
457
- > - 每个关键公共契约都应有一条验证责任
458
- > - 失败态 / 边界态不应省略
459
- > - Blueprint 和 Challenge 应优先复用本矩阵,而不是完全依赖后续推断
443
+ ### 11.4 Performance Testing (性能测试)
444
+ - **Tool**: Locust / k6
445
+ - **Scenarios**:
446
+ - [ ] 1000 并发用户登录
447
+ - [ ] Target: p95 < 200ms
448
+
449
+ ### 11.5 Contract Verification Matrix (契约-验证责任矩阵)
450
+
451
+ | 契约 | 风险级别 | 正常态验证 | 失败态验证 | 回归责任 |
452
+ |------|---------|-----------|-----------|---------|
453
+ | `POST /auth/login` | 关键路径 | 集成测试 | 非法凭证返回 401 | 认证主链路最小回归 |
454
+ | JWT 生成规则 | 基础规则层 | 单元测试 | 非法输入/过期边界 | token 相关回归 |
455
+
456
+ > **要求**:
457
+ > - 每个关键公共契约都应有一条验证责任
458
+ > - 失败态 / 边界态不应省略
459
+ > - Blueprint 和 Challenge 应优先复用本矩阵,而不是完全依赖后续推断
460
460
 
461
461
  ---
462
462
 
@@ -28,21 +28,21 @@ description: 使用WBS方法将系统设计文档分解为层次化任务。支
28
28
  ## ⚠️ 核心原则
29
29
 
30
30
  > [!IMPORTANT]
31
- > **任务规划的四大原则**:
32
- >
33
- > 1. **WBS层次化** - Work Breakdown Structure三级组织
34
- > 2. **原子化** - 每个 Task 优先控制在 2h-2d
35
- > 3. **可验证** - 默认使用 Given / When / Then;仅纯技术性基础任务允许清晰 Done When
36
- > 4. **可追溯** - 每个Task关联PRD需求 [REQ-XXX]
37
-
38
- > [!IMPORTANT]
39
- > **测试规划附加原则**:
40
- > - 优先选择**最轻但足够**的验证类型
41
- > - 如 Workflow / ADR 已声明测试策略,必须优先遵循,不得自行改重
42
- > - **冒烟测试默认仅用于 `INT-S{N}` 或极少数里程碑任务**
43
- > - **回归测试仅在已有关键能力可能被破坏时生成**,不是所有任务的默认要求
44
- > - **基础层、共享层、纯逻辑层默认优先单元测试**,主要分支、边界情况与错误路径应尽量覆盖
45
- > - **公共契约必须有承接**:至少一个实现任务 + 至少一个验证承接点
31
+ > **任务规划的四大原则**:
32
+ >
33
+ > 1. **WBS层次化** - Work Breakdown Structure三级组织
34
+ > 2. **原子化** - 每个 Task 优先控制在 2h-2d
35
+ > 3. **可验证** - 默认使用 Given / When / Then;仅纯技术性基础任务允许清晰 Done When
36
+ > 4. **可追溯** - 每个Task关联PRD需求 [REQ-XXX]
37
+
38
+ > [!IMPORTANT]
39
+ > **测试规划附加原则**:
40
+ > - 优先选择**最轻但足够**的验证类型
41
+ > - 如 Workflow / ADR 已声明测试策略,必须优先遵循,不得自行改重
42
+ > - **冒烟测试默认仅用于 `INT-S{N}` 或极少数里程碑任务**
43
+ > - **回归测试仅在已有关键能力可能被破坏时生成**,不是所有任务的默认要求
44
+ > - **基础层、共享层、纯逻辑层默认优先单元测试**,主要分支、边界情况与错误路径应尽量覆盖
45
+ > - **公共契约必须有承接**:至少一个实现任务 + 至少一个验证承接点
46
46
 
47
47
  ❌ **错误做法**:
48
48
  - 平铺任务列表(无层次)
@@ -51,11 +51,11 @@ description: 使用WBS方法将系统设计文档分解为层次化任务。支
51
51
  - 缺少验收标准
52
52
  - 忽略依赖关系
53
53
 
54
- ✅ **正确做法**:
55
- - **三级层次**: System → Phase → Task
56
- - **合理粒度**: 每个 Task 2h-2d
57
- - **清晰验收**: 默认 Given / When / Then,必要时使用清晰 Done When
58
- - **完整元数据**: ID, [REQ-XXX], 描述, 输入, 输出, 验收, 估时, 依赖, 优先级
54
+ ✅ **正确做法**:
55
+ - **三级层次**: System → Phase → Task
56
+ - **合理粒度**: 每个 Task 2h-2d
57
+ - **清晰验收**: 默认 Given / When / Then,必要时使用清晰 Done When
58
+ - **完整元数据**: ID, [REQ-XXX], 描述, 输入, 输出, 验收, 估时, 依赖, 优先级
59
59
 
60
60
  ---
61
61
 
@@ -115,41 +115,41 @@ description: 使用WBS方法将系统设计文档分解为层次化任务。支
115
115
  > - ✅ 好: `04_SYSTEM_DESIGN/auth.md` §JWT 签发
116
116
  > - ❌ 差: "JWT 相关设计"(无具体文档引用)
117
117
 
118
- **Task结构**:
119
- ```markdown
120
- - [ ] **T{System}.{Phase}.{Seq}** [REQ-XXX]: 任务描述
121
- - **描述**: 简洁说明"做什么"(不是"怎么做")
122
- - **输入**: 设计文档引用 + 前置任务产出(必须包含至少一个文档引用)
123
- - **输出**: 产出什么交付物
124
- - **契约承接**: 本任务实现或验证的公共契约;如无则写“无”
125
- - **📎 参考**: ADR-XXX 或 System Design 章节(如有)
126
- - **验收标准**:
127
- - Given [前置条件]
128
- - When [执行动作]
129
- - Then [预期结果]
130
- - (仅纯技术性基础任务允许使用清晰 Done When 列表)
131
- - **验证类型**: 单元测试 | 集成测试 | E2E测试 | 冒烟测试 | 回归测试 | 手动验证 | 编译检查 | Lint检查
132
- - **验证说明**: 如何确认任务完成 (检查什么,如何确认)
133
- - **估时**: 预估工时(如: 2h, 6h, 1d, 2d)
134
- - **依赖**: T{X}.{Y}.{Z} (依赖的Task ID)
135
- - **优先级**: P0 | P1 | P2
136
- ```
137
-
138
- **示例**:
139
- ```markdown
140
- - [ ] **T1.1.1** [基础]: 设置 Vite + React 项目
141
- - **描述**: 初始化前端项目,配置Vite、React、TypeScript
142
- - **输入**: PRD (React技术栈要求)
143
- - **输出**: 可运行的Hello World应用 (`src/App.tsx`, `vite.config.ts`)
144
- - **验收标准**:
145
- - [ ] `npm run dev` 正常启动
146
- - [ ] 页面显示"Hello World"
147
- - [ ] TypeScript类型检查通过
148
- - **验证类型**: 编译检查
149
- - **估时**: 2h
150
- - **依赖**: 无
151
- - **优先级**: P0
152
- ```
118
+ **Task结构**:
119
+ ```markdown
120
+ - [ ] **T{System}.{Phase}.{Seq}** [REQ-XXX]: 任务描述
121
+ - **描述**: 简洁说明"做什么"(不是"怎么做")
122
+ - **输入**: 设计文档引用 + 前置任务产出(必须包含至少一个文档引用)
123
+ - **输出**: 产出什么交付物
124
+ - **契约承接**: 本任务实现或验证的公共契约;如无则写“无”
125
+ - **📎 参考**: ADR-XXX 或 System Design 章节(如有)
126
+ - **验收标准**:
127
+ - Given [前置条件]
128
+ - When [执行动作]
129
+ - Then [预期结果]
130
+ - (仅纯技术性基础任务允许使用清晰 Done When 列表)
131
+ - **验证类型**: 单元测试 | 集成测试 | E2E测试 | 冒烟测试 | 回归测试 | 手动验证 | 编译检查 | Lint检查
132
+ - **验证说明**: 如何确认任务完成 (检查什么,如何确认)
133
+ - **估时**: 预估工时(如: 2h, 6h, 1d, 2d)
134
+ - **依赖**: T{X}.{Y}.{Z} (依赖的Task ID)
135
+ - **优先级**: P0 | P1 | P2
136
+ ```
137
+
138
+ **示例**:
139
+ ```markdown
140
+ - [ ] **T1.1.1** [基础]: 设置 Vite + React 项目
141
+ - **描述**: 初始化前端项目,配置Vite、React、TypeScript
142
+ - **输入**: PRD (React技术栈要求)
143
+ - **输出**: 可运行的Hello World应用 (`src/App.tsx`, `vite.config.ts`)
144
+ - **验收标准**:
145
+ - [ ] `npm run dev` 正常启动
146
+ - [ ] 页面显示"Hello World"
147
+ - [ ] TypeScript类型检查通过
148
+ - **验证类型**: 编译检查
149
+ - **估时**: 2h
150
+ - **依赖**: 无
151
+ - **优先级**: P0
152
+ ```
153
153
 
154
154
  ### 验证类型选择逻辑
155
155
 
@@ -163,39 +163,39 @@ description: 使用WBS方法将系统设计文档分解为层次化任务。支
163
163
  5. **修改可能影响已完成关键能力** → 回归测试
164
164
  6. **配置、脚手架、基础设施** → 编译检查 / Lint检查 / 手动验证
165
165
 
166
- **选择细则**:
167
- - 不要因为任务“看起来重要”就默认选择 E2E测试
168
- - 如果集成测试足以证明任务完成,就不要升级为 E2E测试
169
- - 如果只是里程碑 readiness 检查,优先使用少量冒烟测试,而不是新建大量 E2E任务
170
- - 如果只是验证旧能力未被破坏,优先复用已有测试集合作为回归测试
171
-
172
- ### 契约风险覆盖规则
173
-
174
- > [!IMPORTANT]
175
- > **若任务产出包含新的公共契约或会修改现有公共契约,必须为其分配明确验证承接。**
176
-
177
- 公共契约至少包括:
178
- - 操作契约
179
- - 跨系统接口
180
- - HTTP API
181
- - CLI 命令 / 参数语义
182
- - 配置结构 / 文件格式 / 状态格式
183
- - 错误语义 / 返回结构
184
- - 持久化结构
185
-
186
- 规则:
187
- - 每个公共契约至少要有一个实现任务承接
188
- - 每个高风险公共契约至少要有一个验证承接点
189
- - 不得仅以“实现任务已有代码变更”视为契约闭合
190
- - 若契约属于基础规则层或低依赖纯逻辑,应优先补充单元测试,而不是直接升级为 E2E
191
-
192
- ### 基础单测优先原则
193
-
194
- > [!IMPORTANT]
195
- > **对 registry、manifest、parser、planner、schema、diff、merge、normalizer、selector 等基础逻辑,优先生成单元测试任务。**
196
-
197
- - 如果这些逻辑是多个上层流程共享的基础设施,其单元测试默认视为必选,不应依赖高层流程测试间接覆盖
198
- - 如果一个 Sprint 新增了多个基础逻辑点,优先在同 Sprint 或紧邻 Sprint 内生成对应单测任务,不要全部拖到收尾期
166
+ **选择细则**:
167
+ - 不要因为任务“看起来重要”就默认选择 E2E测试
168
+ - 如果集成测试足以证明任务完成,就不要升级为 E2E测试
169
+ - 如果只是里程碑 readiness 检查,优先使用少量冒烟测试,而不是新建大量 E2E任务
170
+ - 如果只是验证旧能力未被破坏,优先复用已有测试集合作为回归测试
171
+
172
+ ### 契约风险覆盖规则
173
+
174
+ > [!IMPORTANT]
175
+ > **若任务产出包含新的公共契约或会修改现有公共契约,必须为其分配明确验证承接。**
176
+
177
+ 公共契约至少包括:
178
+ - 操作契约
179
+ - 跨系统接口
180
+ - HTTP API
181
+ - CLI 命令 / 参数语义
182
+ - 配置结构 / 文件格式 / 状态格式
183
+ - 错误语义 / 返回结构
184
+ - 持久化结构
185
+
186
+ 规则:
187
+ - 每个公共契约至少要有一个实现任务承接
188
+ - 每个高风险公共契约至少要有一个验证承接点
189
+ - 不得仅以“实现任务已有代码变更”视为契约闭合
190
+ - 若契约属于基础规则层或低依赖纯逻辑,应优先补充单元测试,而不是直接升级为 E2E
191
+
192
+ ### 基础单测优先原则
193
+
194
+ > [!IMPORTANT]
195
+ > **对 registry、manifest、parser、planner、schema、diff、merge、normalizer、selector 等基础逻辑,优先生成单元测试任务。**
196
+
197
+ - 如果这些逻辑是多个上层流程共享的基础设施,其单元测试默认视为必选,不应依赖高层流程测试间接覆盖
198
+ - 如果一个 Sprint 新增了多个基础逻辑点,优先在同 Sprint 或紧邻 Sprint 内生成对应单测任务,不要全部拖到收尾期
199
199
 
200
200
  ### Sprint 与冒烟测试绑定规则
201
201
 
@@ -289,16 +289,16 @@ T1.2.1 (前端UI设计) → T2.2.1 (后端API实现)
289
289
 
290
290
  ## 📊 任务拆分原则
291
291
 
292
- ### 原则1: 2h-2d 规则
293
- **规则**: 单个 Task 应优先落在 2 小时到 2 天内;超过 2 天应继续拆分。
292
+ ### 原则1: 2h-2d 规则
293
+ **规则**: 单个 Task 应优先落在 2 小时到 2 天内;超过 2 天应继续拆分。
294
294
 
295
295
  **为什么?**
296
296
  - 太大: 难以估时、风险不可控
297
297
  - 太小: 管理成本高、碎片化
298
298
 
299
- **检查**:
300
- - Task估时 > 2天 → 继续拆分
301
- - Task估时 < 2小时 → 考虑合并
299
+ **检查**:
300
+ - Task估时 > 2天 → 继续拆分
301
+ - Task估时 < 2小时 → 考虑合并
302
302
 
303
303
  ---
304
304
 
@@ -320,13 +320,13 @@ T1.2.1 (前端UI设计) → T2.2.1 (后端API实现)
320
320
 
321
321
  ---
322
322
 
323
- ### 原则4: 可验证性
324
- **规则**: 每个 Task 必须有明确、可执行、可观察的验收标准;默认使用 Given / When / Then,纯技术性基础任务可使用清晰 Done When。
325
-
326
- **示例**:
327
- - ✅ 好: "Given 合法输入, When 调用接口, Then 返回 200 且结构符合契约"
328
- - ✅ 好: "[ ] 单元测试通过(仅用于纯技术性基础任务)"
329
- - ❌ 差: "Done When: 差不多完成了"
323
+ ### 原则4: 可验证性
324
+ **规则**: 每个 Task 必须有明确、可执行、可观察的验收标准;默认使用 Given / When / Then,纯技术性基础任务可使用清晰 Done When。
325
+
326
+ **示例**:
327
+ - ✅ 好: "Given 合法输入, When 调用接口, Then 返回 200 且结构符合契约"
328
+ - ✅ 好: "[ ] 单元测试通过(仅用于纯技术性基础任务)"
329
+ - ❌ 差: "Done When: 差不多完成了"
330
330
 
331
331
  ---
332
332
 
@@ -348,14 +348,14 @@ T1.2.1 (前端UI设计) → T2.2.1 (后端API实现)
348
348
 
349
349
  ---
350
350
 
351
- ### 守则2: 验收标准具体化
352
- **规则**: 默认使用 Given / When / Then;仅当纯技术性基础任务不适合 GWT 时,才退回清晰的 Done When。
351
+ ### 守则2: 验收标准具体化
352
+ **规则**: 默认使用 Given / When / Then;仅当纯技术性基础任务不适合 GWT 时,才退回清晰的 Done When。
353
353
 
354
- **好的验收标准**:
355
- - Given 输入合法, When 调用接口, Then 返回 200 且结构符合契约
356
- - Given 非法凭证, When 请求登录, Then 返回 401 且错误语义一致
357
- - [ ] 单元测试通过(仅用于纯技术性基础任务)
358
- - [ ] Lint无错误(仅用于纯技术性基础任务)
354
+ **好的验收标准**:
355
+ - Given 输入合法, When 调用接口, Then 返回 200 且结构符合契约
356
+ - Given 非法凭证, When 请求登录, Then 返回 401 且错误语义一致
357
+ - [ ] 单元测试通过(仅用于纯技术性基础任务)
358
+ - [ ] Lint无错误(仅用于纯技术性基础任务)
359
359
 
360
360
  **差的验收标准**:
361
361
  - [ ] 功能正常(太模糊)
@@ -437,7 +437,7 @@ graph TD
437
437
 
438
438
  | 检查项 | 标准 | 如何修正 |
439
439
  |--------|------|---------|
440
- | 估时 | 2h-2d | 过大→拆分, 过小→合并 |
440
+ | 估时 | 2h-2d | 过大→拆分, 过小→合并 |
441
441
  | 交付物 | 单一明确 | 多个→拆分为多个Task |
442
442
  | 验收标准 | 3-5条具体标准 | 模糊→细化为可测试条件 |
443
443
  | 依赖 | < 5个依赖 | 过多→重新组织Phase |
@@ -560,11 +560,11 @@ Phase 3: 回归测试 (Regression)
560
560
  - [ ] 每个System有清晰的Phase划分
561
561
  - [ ] 每个Task有完整的元数据
562
562
 
563
- ### 任务质量
564
- - [ ] 每个Task估时 2h-2d
565
- - [ ] 每个Task有3-5条验收标准
566
- - [ ] 每个Task关联PRD需求 [REQ-XXX]
567
- - [ ] 每个Task描述清晰("做什么")
563
+ ### 任务质量
564
+ - [ ] 每个Task估时 2h-2d
565
+ - [ ] 每个Task有3-5条验收标准
566
+ - [ ] 每个Task关联PRD需求 [REQ-XXX]
567
+ - [ ] 每个Task描述清晰("做什么")
568
568
 
569
569
  ### 依赖关系
570
570
  - [ ] 提供Mermaid依赖图