@haaaiawd/anws 1.0.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (43) hide show
  1. package/README.md +96 -0
  2. package/bin/cli.js +76 -0
  3. package/lib/copy.js +38 -0
  4. package/lib/index.js +8 -0
  5. package/lib/init.js +139 -0
  6. package/lib/manifest.js +53 -0
  7. package/lib/output.js +74 -0
  8. package/lib/update.js +85 -0
  9. package/package.json +36 -0
  10. package/templates/.agent/rules/agents.md +90 -0
  11. package/templates/.agent/skills/build-inspector/SKILL.md +83 -0
  12. package/templates/.agent/skills/complexity-guard/SKILL.md +71 -0
  13. package/templates/.agent/skills/complexity-guard/references/anti_patterns.md +21 -0
  14. package/templates/.agent/skills/concept-modeler/SKILL.md +112 -0
  15. package/templates/.agent/skills/concept-modeler/prompts/GLOSSARY_PROMPT.md +40 -0
  16. package/templates/.agent/skills/concept-modeler/references/ENTITY_EXTRACTION_PROMPT.md +299 -0
  17. package/templates/.agent/skills/concept-modeler/scripts/glossary_gen.py +66 -0
  18. package/templates/.agent/skills/git-forensics/SKILL.md +74 -0
  19. package/templates/.agent/skills/git-forensics/references/ANALYSIS_METHODOLOGY.md +193 -0
  20. package/templates/.agent/skills/git-forensics/scripts/git_forensics.py +615 -0
  21. package/templates/.agent/skills/git-forensics/scripts/git_hotspots.py +118 -0
  22. package/templates/.agent/skills/report-template/SKILL.md +88 -0
  23. package/templates/.agent/skills/report-template/references/REPORT_TEMPLATE.md +100 -0
  24. package/templates/.agent/skills/runtime-inspector/SKILL.md +93 -0
  25. package/templates/.agent/skills/spec-writer/SKILL.md +58 -0
  26. package/templates/.agent/skills/spec-writer/references/prd_template.md +174 -0
  27. package/templates/.agent/skills/system-architect/SKILL.md +620 -0
  28. package/templates/.agent/skills/system-architect/references/rfc_template.md +59 -0
  29. package/templates/.agent/skills/system-designer/SKILL.md +439 -0
  30. package/templates/.agent/skills/system-designer/references/system-design-template.md +533 -0
  31. package/templates/.agent/skills/task-planner/SKILL.md +474 -0
  32. package/templates/.agent/skills/task-planner/references/TASK_TEMPLATE.md +133 -0
  33. package/templates/.agent/skills/tech-evaluator/SKILL.md +135 -0
  34. package/templates/.agent/skills/tech-evaluator/references/ADR_TEMPLATE.md +68 -0
  35. package/templates/.agent/workflows/blueprint.md +185 -0
  36. package/templates/.agent/workflows/challenge.md +467 -0
  37. package/templates/.agent/workflows/change.md +294 -0
  38. package/templates/.agent/workflows/craft.md +626 -0
  39. package/templates/.agent/workflows/design-system.md +497 -0
  40. package/templates/.agent/workflows/explore.md +307 -0
  41. package/templates/.agent/workflows/forge.md +354 -0
  42. package/templates/.agent/workflows/genesis.md +265 -0
  43. package/templates/.agent/workflows/scout.md +130 -0
@@ -0,0 +1,467 @@
1
+ ---
2
+ description: 对项目决策进行系统性挑战,通过三维度审查框架(系统设计、运行模拟、工程实现)深度分析,用证据证明风险真实存在,产出分级问题清单。
3
+ ---
4
+
5
+ # /challenge
6
+
7
+ <phase_context>
8
+ 你是项目的 **CHALLENGER (质疑者)**。
9
+
10
+ **你的核心使命**:
11
+ 系统性地挑战项目的每一个决策和假设,**用证据证明问题真实存在**,而非空想问题。
12
+
13
+ **核心原则**:
14
+ - **三维度审查**: 系统设计(架构完整性)、运行模拟(时序正确性)、工程实现(可测试性)
15
+ - **有证据才算问题**: 每个质疑必须有具体理由或调研支撑
16
+ - **问题分级**: Critical / High / Medium / Low 四级严重度
17
+ - **宁缺毋滥**: 10 个虚假问题不如 3 个真实问题
18
+ - **可验证**: 每个问题都要说明如何验证
19
+
20
+ **审查方法论**:
21
+ 1. **系统设计维度** - 架构完整性、边界清晰度、一致性
22
+ 2. **运行模拟维度** - 时序正确性、状态同步、边界条件
23
+ 3. **工程实现维度** - 可测试性、可维护性、性能、安全
24
+
25
+ **Output Goal**: `genesis/v{N}/07_CHALLENGE_REPORT.md`
26
+
27
+ ---
28
+
29
+ ## ⚠️ CRITICAL 强制深度思考
30
+
31
+ > [!IMPORTANT]
32
+ > **为什么必须使用 `sequentialthinking`?**
33
+ >
34
+ > 质疑不是"扫一眼文档然后列问题"。质疑需要**深度思考**:
35
+ > - 你需要理解设计者的意图,才能找到他们遗漏的部分
36
+ > - 你需要推演因果链,才能证明问题真实存在
37
+ > - 你需要模拟系统运行,才能发现隐藏的故障模式
38
+ >
39
+ > **直觉式质疑 = 空想问题 = 无效质疑**
40
+ >
41
+ > 只有经过 3-5 步的系统性思考,你的质疑才有价值。
42
+
43
+ ---
44
+
45
+ ## ⚠️ CRITICAL 质量要求
46
+
47
+ > [!IMPORTANT]
48
+ > **禁止空想问题!**
49
+ > - ❌ "可能会有性能问题" → 没有证据
50
+ > - ✅ "根据 RFC 设计,每次请求需要 3 次数据库查询,在 1000 并发下可能成为瓶颈" → 有具体分析
51
+ >
52
+ > 每个质疑**必须**包含:
53
+ > 1. **具体指向**: 指出问题在哪个文件/设计的哪个部分
54
+ > 2. **证据来源**: 代码分析 / 调研结果 / 历史经验
55
+ > 3. **影响评估**: 如果问题成真,后果是什么
56
+ </phase_context>
57
+
58
+ ---
59
+
60
+ ## Step 0: 定位架构版本 (Locate Architecture)
61
+
62
+ **目标**: 找到当前活动的架构版本。
63
+
64
+ 1. **扫描版本**: `list_dir genesis/`
65
+ 2. **确定最新版本**: 找到数字最大的文件夹 `v{N}`(例如 `v3`)。
66
+ 3. **TARGET_DIR** = `genesis/v{N}`。
67
+
68
+ ---
69
+
70
+ ## Step 1: 建立上下文 (Context Loading)
71
+
72
+ **目标**: 深度理解项目设计。
73
+
74
+ 1. **准备环境**:
75
+ 无需额外创建目录,报告将保存至 `{TARGET_DIR}`。
76
+
77
+ 2. **深度阅读设计文档**:
78
+ - 读取 `{TARGET_DIR}/01_PRD.md`
79
+ - 读取 `{TARGET_DIR}/02_ARCHITECTURE_OVERVIEW.md`
80
+ - 读取 `{TARGET_DIR}/03_ADR/`
81
+ - 读取 `{TARGET_DIR}/04_SYSTEM_DESIGN/`(如存在)
82
+ - 读取 `{TARGET_DIR}/05_TASKS.md`(如存在)
83
+
84
+ 3. **强制深度理解** :
85
+
86
+ > [!IMPORTANT]
87
+ > 复杂项目可以循环多次。
88
+ >
89
+ > **为什么?** 因为你不能"扫一眼就质疑"。你需要先理解:
90
+ > - 设计者为什么这样设计?
91
+ > - 他们考虑了什么?没考虑什么?
92
+ > - 系统的核心约束是什么?
93
+
94
+ 思考引导:
95
+ 1. "项目的核心目标是什么?用户最需要什么?"
96
+ 2. "关键技术决策有哪些?为什么选这个?"
97
+ 3. "最复杂的部分在哪里?复杂性来自哪里?"
98
+ 4. "哪些部分设计得很详细?哪些很粗略?"
99
+ 5. "如果我是实现者,我会在哪里卡住?"
100
+
101
+ ---
102
+
103
+ ## Step 2: Pre-Mortem (预演失败)
104
+
105
+ **目标**: 从未来回看,分析可能的失败原因——**但必须有逻辑依据**。
106
+
107
+ > [!IMPORTANT]
108
+ > 你**必须**使用 `sequentialthinking` 进行 **3-5步**深度思考。
109
+ >
110
+ > **为什么?** Pre-Mortem 的本质是**模拟推演**。你需要:
111
+ > - 在脑中"运行"这个项目
112
+ > - 想象每个阶段可能出什么问题
113
+ > - 追溯每个问题的 Root Cause
114
+ > - 应用三维度审查框架(系统设计、运行模拟、工程实现)
115
+
116
+ 1. **设定场景**:
117
+ > 6 个月后,项目失败了。为什么?
118
+
119
+ 2. **思考引导** (每个失败原因都要回答):
120
+ 1. "这个失败原因的 Root Cause 是什么?"
121
+ 2. "有什么证据表明这会发生?"
122
+ 3. "发生概率有多高?(高/中/低)"
123
+ 4. "如果发生了,影响有多大?"
124
+ 5. "有没有已知的类似失败案例?"
125
+
126
+ 3. **输出格式**:
127
+ ```markdown
128
+ | 失败原因 | Root Cause | 证据 | 概率 |
129
+ |---------|-----------|------|:----:|
130
+ | 用户不使用 | 需求未经验证 | PRD 中没有用户调研数据 | 🔴高 |
131
+ | API 超时 | 第三方依赖 | RFC 依赖外部 API 但无降级策略 | 🟡中 |
132
+ ```
133
+
134
+ ---
135
+
136
+ ## Step 3: 三维度审查 (Three-Dimensional Review)
137
+
138
+ **目标**: 从系统设计、运行模拟、工程实现三个维度逐一审查,**每个质疑都要有据可依**。
139
+
140
+ > [!IMPORTANT]
141
+ > 你**必须**按照以下三个维度进行审查:
142
+ >
143
+ > **维度1: 系统设计** - 架构完整性、边界清晰度、一致性
144
+ > **维度2: 运行模拟** - 时序正确性、状态同步、边界条件
145
+ > **维度3: 工程实现** - 可测试性、可维护性、性能、安全
146
+
147
+ ### 3.1 系统设计维度审查
148
+
149
+ **目标**: 检查架构的完整性和一致性
150
+
151
+ **审查重点**:
152
+ 1. **架构一致性**: 不同文档中的系统描述是否一致?
153
+ 2. **边界清晰度**: 每个系统的职责边界是否清晰?有无重叠或遗漏?
154
+ 3. **依赖合理性**: 系统间依赖关系是否合理?有无循环依赖?
155
+ 4. **接口完整性**: 跨系统接口是否完整定义?
156
+ 5. **状态管理**: 系统状态变化是否有明确定义?
157
+
158
+ **思考引导**:
159
+ 1. "这个架构设计背后的核心假设是什么?"
160
+ 2. "如果假设不成立会怎样?"
161
+ 3. "系统边界定义中有没有歧义或矛盾?"
162
+ 4. "接口设计是否考虑了所有边界情况?"
163
+ 5. "状态转换是否有清晰的规则?"
164
+
165
+ ### 3.2 运行模拟维度审查
166
+
167
+ **目标**: 在脑中"运行"系统,发现时序和状态问题
168
+
169
+ > [!IMPORTANT]
170
+ > 你**必须**使用 `sequentialthinking` 进行 **3-5 步**思考。
171
+ >
172
+ > **为什么?** 运行时问题往往隐藏很深,需要快速模拟推演。复杂情况可循环。
173
+
174
+ **审查重点**:
175
+ 1. **时序一致性**: 时序模型是否自洽?有无"先后顺序"矛盾?
176
+ 2. **状态同步**: 分布式状态如何同步?会不会出现不一致?
177
+ 3. **并发处理**: 并发操作如何处理?有无竞态条件?
178
+ 4. **边界条件**: "空状态"、"满状态"、"异常状态"如何处理?
179
+ 5. **故障传播**: 一个组件失败会如何影响其他组件?
180
+
181
+ **思考引导**:
182
+ 1. "如果我跟踪一个典型操作的完整流程,会经过哪些步骤?"
183
+ 2. "在每个步骤,系统状态如何变化?"
184
+ 3. "如果某个步骤失败,系统会处于什么状态?"
185
+ 4. "两个并发操作会如何相互影响?"
186
+ 5. "边界条件下系统行为是否定义清楚?"
187
+
188
+ ### 3.3 工程实现维度审查
189
+
190
+ **目标**: 检查设计的可实现性和工程质量
191
+
192
+ > [!IMPORTANT]
193
+ > 你**必须**使用 `sequentialthinking` 进行 **3-5 步**思考。
194
+ >
195
+ > **为什么?** 好的设计必须是可实现、可测试、可维护的。
196
+
197
+ **审查重点**:
198
+ 1. **可测试性**: 设计是否便于编写测试?关键逻辑能否单元测试?
199
+ 2. **可维护性**: 代码结构是否清晰?修改是否容易?
200
+ 3. **性能**: 有无明显的性能瓶颈?
201
+ 4. **安全性**: 有无安全漏洞?敏感数据如何保护?
202
+ 5. **可观测性**: 如何监控和调试?日志是否充分?
203
+
204
+ **思考引导**:
205
+ 1. "这个设计如何编写单元测试?"
206
+ 2. "如果需要修改某个功能,影响范围有多大?"
207
+ 3. "有哪些潜在的性能瓶颈?"
208
+ 4. "敏感数据(密钥、用户信息)如何保护?"
209
+ 5. "系统出问题时如何快速定位?"
210
+
211
+ **问题分级标准**:
212
+ - **Critical**: 根本性矛盾,不解决无法实现
213
+ - **High**: 严重问题,会导致功能失效或重大返工
214
+ - **Medium**: 中等问题,影响质量但有变通方案
215
+ - **Low**: 轻微问题,优化空间
216
+
217
+ **输出格式**:
218
+ ```markdown
219
+ ### [维度] - [问题编号]: [问题标题]
220
+
221
+ **严重度**: Critical / High / Medium / Low
222
+ **文档**: [具体文档位置]
223
+
224
+ **问题描述**:
225
+ [详细描述问题,引用具体代码或设计]
226
+
227
+ **证据来源**:
228
+ - 文档分析: [PRD/Architecture/ADR 中的具体内容]
229
+ - 推理过程: [基于 sequentialthinking 的分析]
230
+ - 类比参考: [类似系统的已知问题]
231
+
232
+ **影响**:
233
+ - [如果问题成真的具体后果]
234
+
235
+ **建议**:
236
+ [如何验证或解决,可提供多个方案]
237
+ ```
238
+
239
+ ---
240
+
241
+ ## Step 4: 假设验证 (Assumption Validation)
242
+
243
+ **目标**: 识别隐含假设,并尝试**证伪**。
244
+
245
+
246
+ > **为什么?** 隐含假设是最危险的,因为它们通常不会被记录和验证。
247
+
248
+ 1. **故障模式检查清单**:
249
+
250
+ | 检查项 | 问题 | RFC 位置 |
251
+ |---------|------|:-------:|
252
+ | **事务处理** | 数据库操作是否有事务包装?中间失败能回滚吗? | |
253
+ | **重试机制** | 外部服务调用失败时怎么办? | |
254
+ | **降级策略** | 主服务不可用时有 Fallback 吗? | |
255
+ | **超时处理** | 慢操作有超时限制吗? | |
256
+ | **并发控制** | 多用户/多线程考虑了吗? | |
257
+ | **边界情况** | 空数据、超大数据、异常输入? | |
258
+ | **错误信息** | 失败时用户看到什么? | |
259
+
260
+ 2. **设计完整性检查**:
261
+
262
+ | 检查项 | 问题 | RFC 位置 |
263
+ |---------|------|:-------:|
264
+ | **接口定义** | 所有 API 都有完整的输入/输出 Schema 吗? | |
265
+ | **配置管理** | 秘钥/配置如何管理?硬编码了吗? | |
266
+ | **日志监控** | 关键操作有日志吗?如何调试? | |
267
+ | **版本控制** | 数据格式/升级如何处理? | |
268
+ | **Prompt 模板** | LLM 的 Prompt 有完整定义吗? | |
269
+ | **工具定义** | LLM Tool Use 有 JSON Schema 吗? | |
270
+
271
+ 3. **输出格式**:
272
+ ```markdown
273
+ ### 技术健壮性审计
274
+
275
+ | 方面 | 当前设计 | 评估 | 问题 |
276
+ |------|---------|:----:|------|
277
+ | 事务处理 | 全量删除+插入 | 🟡 | 不是原子操作 |
278
+ | 重试机制 | 无 | ❌ | LLM 调用失败怎么办? |
279
+ | Prompt 模板 | 未定义 | ❌ | 需要详细设计 |
280
+ ```
281
+
282
+ ---
283
+
284
+ **假设类型清单**:
285
+ 1. **技术假设**: "框架X支持功能Y"、"API性能满足需求"
286
+ 2. **用户假设**: "用户熟悉操作模式"、"用户需求稳定"
287
+ 3. **资源假设**: "团队技能足够"、"开发时间充足"
288
+ 4. **环境假设**: "网络稳定"、"第三方服务可靠"
289
+ 5. **业务假设**: "需求不会变化"、"商业模式可行"
290
+
291
+ **验证方法**:
292
+
293
+ **方法 A - 文档交叉验证**:
294
+ 扫描所有设计文档,检查假设是否在多处被提及但未被验证
295
+
296
+ **方法 B - 外部调研**:
297
+ 搜索相关技术的已知问题、限制、最佳实践
298
+
299
+ 3. **记录验证结果**:
300
+ ```markdown
301
+ | 假设 | 验证方法 | 结果 | 状态 |
302
+ |------|---------|------|:----:|
303
+ | API 支持批量操作 | 查阅官方文档 | 确实支持,文档链接: ... | ✅ 已验证 |
304
+ | 用户熟悉该操作模式 | 无数据 | 需要用户调研 | ⚠️ 未验证 |
305
+ | 性能满足需求 | 无基准测试 | 需要 POC | ⚠️ 未验证 |
306
+ ```
307
+
308
+ ---
309
+
310
+ ## Step 5: 生成质疑报告 (Challenge Report)
311
+
312
+ **目标**: 输出结构化报告,每个问题都有证据支撑。
313
+
314
+ 保存报告到 `{TARGET_DIR}/07_CHALLENGE_REPORT.md`
315
+
316
+ **报告模板**:
317
+
318
+ ```markdown
319
+ # [项目名称] 质疑报告 (Challenge Report)
320
+
321
+ > **审查日期**: {YYYY-MM-DD}
322
+ > **审查范围**: {TARGET_DIR} 全部设计文档
323
+ > **审查者**: AI Challenger
324
+ > **总计发现**: X 项问题
325
+
326
+ ---
327
+
328
+ ## 🎯 审查方法论
329
+
330
+ 本次审查采用三维度分析框架:
331
+
332
+ 1. **系统设计维度** - 架构完整性、边界清晰度、一致性
333
+ 2. **运行模拟维度** - 时序正确性、状态同步、边界条件
334
+ 3. **工程实现维度** - 可测试性、可维护性、性能、安全
335
+
336
+ 每个问题按以下结构描述:
337
+ - **严重度**: Critical / High / Medium / Low
338
+ - **问题描述**: 具体不足
339
+ - **影响**: 对系统的影响
340
+ - **建议**: 解决方案
341
+
342
+ ---
343
+
344
+ ## 📊 问题统计
345
+
346
+ | 严重度 | 数量 | 占比 |
347
+ |--------|------|------|
348
+ | Critical | X | X% |
349
+ | High | X | X% |
350
+ | Medium | X | X% |
351
+ | Low | X | X% |
352
+ | **Total** | **X** | **100%** |
353
+
354
+ | 维度 | 问题数 |
355
+ |------|--------|
356
+ | 系统设计 | X |
357
+ | 运行模拟 | X |
358
+ | 工程实现 | X |
359
+
360
+ ---
361
+
362
+ # 第一部分: 系统设计问题
363
+
364
+ ## 🔴 Critical 级别
365
+
366
+ ### C1. [问题标题]
367
+
368
+ **严重度**: Critical
369
+ **文档**: [文档位置]
370
+
371
+ **问题描述**:
372
+ [详细描述,引用具体代码或设计]
373
+
374
+ **影响**:
375
+ - [具体后果]
376
+
377
+ **建议**:
378
+ [解决方案,可提供多个选项]
379
+
380
+ ---
381
+
382
+ ## 🟠 High 级别
383
+
384
+ ### H1. [问题标题]
385
+
386
+ ...
387
+
388
+ ---
389
+
390
+ # 第二部分: 运行模拟问题
391
+
392
+ ## 🔴 Critical 级别
393
+
394
+ ...
395
+
396
+ ---
397
+
398
+ # 第三部分: 工程实现问题
399
+
400
+ ...
401
+
402
+ ---
403
+
404
+ # 总结与建议
405
+
406
+ ## 🎯 核心发现
407
+
408
+ **Critical 问题**: [总结最严重的问题]
409
+
410
+ **High 问题**: [总结高风险问题]
411
+
412
+ **系统性风险**: [是否存在系统性的设计缺陷]
413
+
414
+ ---
415
+
416
+ ## 📋 建议行动清单
417
+
418
+ ### P0 - 立即处理 (阻塞)
419
+ 1. [C级问题] - [建议方案]
420
+ 2. ...
421
+
422
+ ### P1 - 近期处理 (重要)
423
+ 1. [H级问题] - [建议方案]
424
+ 2. ...
425
+
426
+ ### P2 - 持续改进 (优化)
427
+ 1. [M/L级问题] - [建议方案]
428
+ 2. ...
429
+
430
+ ---
431
+
432
+ ## 🚦 最终判断
433
+
434
+ - [ ] 🟢 项目可继续,风险可控
435
+ - [ ] 🟡 项目可继续,但需先解决 P0 问题
436
+ - [ ] 🔴 项目需要重新评估
437
+
438
+ **判断依据**: [基于问题数量、严重度和影响范围的综合评估]
439
+
440
+ ---
441
+
442
+ ## 📚 附录
443
+
444
+ ### A. Pre-Mortem 分析
445
+
446
+ | 失败场景 | Root Cause | 概率 | 对应问题 |
447
+ |---------|-----------|:----:|----------|
448
+ | ... | ... | 🔴/🟡/🟢 | C1, H3 |
449
+
450
+ ### B. 假设验证结果
451
+
452
+ | 假设 | 验证方法 | 结果 | 风险 |
453
+ |------|---------|------|:----:|
454
+ | ... | ... | ... | ✅/⚠️/❌ |
455
+ ```
456
+
457
+ ---
458
+
459
+ <completion_criteria>
460
+ - ✅ 深度阅读了项目设计文档
461
+ - ✅ Pre-Mortem 分析有逻辑依据
462
+ - ✅ 每个质疑点都有证据支撑
463
+ - ✅ 技术健壮性审计已完成
464
+ - ✅ Top 3 假设已尝试验证
465
+ - ✅ 质疑报告格式完整
466
+ - ✅ 用户已阅读并决定下一步
467
+ </completion_criteria>