npm - @haaaiawd/anws - Versions diffs - 2.2.6 → 2.3.0 - Mend

@haaaiawd/anws 2.2.6 → 2.3.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (12) hide show

package/README.md +1 -1
package/lib/manifest.js +213 -213
package/package.json +1 -1
package/templates/.agents/skills/code-reviewer/SKILL.md +17 -5
package/templates/.agents/skills/craft-authoring/SKILL.md +183 -123
package/templates/.agents/skills/craft-authoring/references/PROMPT_QUALITY_RUBRIC.md +99 -0
package/templates/.agents/skills/craft-authoring/references/SCORECARD_TEMPLATE.md +64 -0
package/templates/.agents/skills/e2e-testing-guide/SKILL.md +3 -3
package/templates/.agents/workflows/blueprint.md +56 -21
package/templates/.agents/workflows/change.md +1 -1
package/templates/.agents/workflows/craft.md +121 -160
package/templates/.agents/workflows/forge.md +134 -75

package/templates/.agents/skills/craft-authoring/SKILL.md CHANGED Viewed

@@ -1,123 +1,183 @@
----
-name: craft-authoring
-description: 执行 /craft 时必读：提供 Workflow / Skill / Prompt 的脚手架模板、防护语法、填充与验证清单；长模板与自检细节不在 craft workflow 内重复，一律以本 skill 为准。
----
-# Craft Authoring — 脚手架与自检
-本 skill 承接 **`/craft` workflow** 中「怎么写」的细节；`/craft` 只保留仪式与步骤路由。**禁止**在 workflow 里复述本节全文。
-## Workflow 骨架（最小可用）
-```markdown
----
-description: [一句话，列表展示用]
----
-# /name
-<phase_context>
-你是 **[角色]**。
-**使命**：…
-**能力**：…
-**限制**：…
-**原则**：…
-**与用户的关系**：…
-**Output Goal**: `路径`
-</phase_context>
----
-## CRITICAL …
-> [!IMPORTANT]
-> **为什么**：…
-> - …
-> - …
----
-## Step 1: …
-**目标**：…
-> [!IMPORTANT]
-> 你**必须**… **为什么？** …
-**思考引导**:
-1. …
-2. …
----
-<completion_criteria>
-- …
-</completion_criteria>
-```
-## Skill 骨架（description 必须是触发条件）
-```markdown
----
-name: kebab-name
-description: 当 [具体触发场景] 时加载。[一句话能力概括]
----
-# 标题
-## 硬边界 / 原则
-…
-## 输入 / 输出契约
-…
-```
-**description 忌**：泛泛「我能处理 PDF」；**宜**：「当用户要读取/编辑 PDF 时」。
-## Prompt 骨架
-```markdown
-# 标题
-## 角色
-…
-## 任务
-…
-## 约束
-…
-## 输出格式
-…
-```
-## 防护语法速查
-| 机制                      | 用途       |
-| ----------------------- | -------- |
-| `[!IMPORTANT]`          | 不可跳过节点   |
-| `##  CRITICAL`        | 边界醒目     |
-| `你**必须**`               | 强制动作     |
-| 具体引导问题                  | 替代「好好想想」 |
-| `<completion_criteria>` | 完成定义     |
-重要约束建议包含：**做什么 / 为什么 / 违反时长什么样**。
-## 填充内容（Step 5 等价）
-用 `sequential-thinking` 组织 **3–5 个 thought**，覆盖：目标、最易错点、每步 I/O、引导问题、模板复用、调研结论如何打入文档。
-**质量扫一眼**：目标是否逐步清晰、约束是否有「为什么」、是否有输出模板、关键处有 / 对照（如需）。
-## 验证清单（输出前）
-**结构**：frontmatter、`phase_context`（workflow）、CRITICAL 块、每步有目标、`<completion_criteria>`。
-**内容**：路径含 `.anws/v{N}/` 若适用、kebab-case、工具调用语法正确。
-## 自我批评（输出前最后一道）
-用 `sequential-thinking` **3–5 thought**：用户会在哪卡住？AI 可能在哪偷懒跳过？与 `/challenge` 级质量相比缺什么？随后迭代修复再交付。
+---
+## name: craft-authoring
+description: 执行 /craft 时必读。提供 Workflow / Skill / Prompt 骨架与质量护栏。以判断准绳替代堆砌步骤。
+# Craft Authoring - 脚手架与自检
+本 skill 承接 `/craft` 中“如何写成”的细节。
+`/craft` 给方向，这里给落地。方向如果没有落地，会变成口号；落地如果没有方向，会变成机械动作。
+## 全局写作协议
+1. 禁止使用 emoji。
+2. 允许拟人叙事，但语气必须克制、理性、专业。
+3. 使用短句，每句表达单一语义。
+4. 每个 Step 固定回答：做什么 / 为什么 / 怎么验收。
+5. 先给意义，再给规则，再给验证。禁止只写漂亮话。
+**判断准绳**：
+- 好文档让执行者更清醒、更稳定、更可复现。
+- 坏文档让执行者更兴奋，却更依赖临场发挥。
+---
+## Workflow 骨架（最小可用）
+```markdown
+---
+description: [一句话说明用途]
+---
+# /name
+<phase_context>
+你是 **[角色]**。
+**使命**：...
+**能力**：...
+**限制**：...
+**与用户的关系**：...
+**Output Goal**: `路径`
+</phase_context>
+---
+## CRITICAL 写作约束
+> [!IMPORTANT]
+> 写作约束由 `/craft` 主 workflow 统一定义，此处不重复展开。
+---
+## Step 1: [标题]
+### 做什么
+...
+### 为什么
+...
+### 怎么验收
+- ...
+- ...
+---
+<completion_criteria>
+- [可验证完成标准]
+</completion_criteria>
+```
+## Skill 骨架（description 必须是触发条件）
+```markdown
+---
+name: kebab-name
+description: 当 [具体触发场景] 时加载。[能力概括]
+---
+# 标题
+## 做什么
+...
+## 为什么
+...
+## 怎么验收
+- 输入契约：...
+- 输出契约：...
+```
+**description 忌**：泛化能力标签。
+**description 宜**：明确触发场景与边界。
+**判断准绳**：
+一个好的 description 像门禁，不像标语。
+它要决定“何时进入”，也要决定“何时不进入”。
+## Prompt 骨架
+```markdown
+# 标题
+## 做什么
+...
+## 为什么
+...
+## 怎么验收
+- 约束：...
+- 输出格式：...
+```
+## 防护语法速查
+| 机制                      | 用途     |
+| ----------------------- | ------ |
+| `[!IMPORTANT]`          | 不可跳过节点 |
+| `## CRITICAL`           | 边界醒目   |
+| `你**必须**`               | 强制动作   |
+| `<completion_criteria>` | 完成定义   |
+重要约束至少写清：做什么、为什么、偏航信号。
+## 填充内容（Step 5 等价）
+用 `sequential-thinking` 组织 3-5 个 thought，覆盖目标、易错点、每步 I/O、调研结论落点。
+质量快检：
+- 章节是否单问题回答
+- 约束是否写明为什么
+- 输出是否可验证
+**判断准绳**：
+如果一个段落不能告诉执行者“该做什么”，它就是噪声。
+如果一个段落不能告诉执行者“为何如此”，它就是命令。
+如果一个段落不能告诉执行者“如何验证”，它就是祈祷。
+## 验证清单（输出前）
+结构：
+- frontmatter
+- `phase_context`（workflow 场景）
+- `CRITICAL` 块
+- `<completion_criteria>`
+内容：
+- 路径与命名正确
+- 触发条件清晰
+- 输入输出契约完整
+- 失败信号可被外部观察
+## 评分闸门（发布前）
+发布前必须执行静态评分：
+- 读取 `references/PROMPT_QUALITY_RUBRIC.md`
+- 生成 `references/SCORECARD_TEMPLATE.md` 对应的评分卡
+- 输出 Tier（T0/T1/T2/T3）与七维加权得分
+硬门规则：
+- 若触发 Hard Fail Gate，结论必须为 `Infeasible`
+- 若未触发 Hard Fail 且总分 < 4.0，必须回炉一次再评分
+## 自我批评（输出前最后一道）
+用 `sequential-thinking` 做 3-5 个 thought：
+- 用户会卡在哪一步
+- AI 可能跳过哪条约束
+- 哪一节仍存在多问题混写
+- 修复后再交付
+最后问自己一句：
+如果这份文档真的会被反复执行，你敢不敢为它的后果负责？

package/templates/.agents/skills/craft-authoring/references/PROMPT_QUALITY_RUBRIC.md ADDED Viewed

@@ -0,0 +1,99 @@
+## Prompt Quality Rubric v1.0 (Static)
+用途：对 Workflow / Skill / Prompt 进行静态评分，不依赖运行时采样。
+---
+## 0. 评估前置：静态消融
+评估前先做文本消融，剥离以下外部挂载：
+- 情绪祈使句
+- 格式强迫词
+- 防幻觉补丁句
+保留骨架：
+- Role
+- Context / Worldview
+- Core Concepts
+- Reasoning Path
+若消融后骨架崩塌，优先判定为 T2 或 T3。
+---
+## 1. 段位判定（Tier）
+- `T0` 原生共振：消融后仍具备稳定语义风格与闭环约束
+- `T1` 结构锚定：主要依靠结构网格稳定执行
+- `T2` 外部挂载：高度依赖祈使与补丁句
+- `T3` 认知崩塌：存在事实或逻辑前提错误
+> 规则：若命中 T3，直接判定不可行，不进入高分档比较。
+---
+## 2. 七维评分矩阵（0-5）
+每个维度必须输出：`score` + `evidence` + `fix` + `confidence`。
+### D1 Structure（权重 20%）
+- 看结构是否清晰、分段是否承担稳定语义职责
+### D2 Alignment（权重 20%）
+- 看目标、步骤、验收是否一致
+### D3 Robustness（权重 15%）
+- 看是否存在异常输入下的阻断与降级机制
+### D4 Efficiency（权重 10%）
+- 看 token 成本与约束收益是否平衡
+### D5 Meta-Isomorphism（权重 15%）
+- 看“要求的品质”与“文本自身品质”是否同构
+### D6 Groundability（权重 10%）
+- 看抽象叙事是否能回落到可执行动作
+### D7 Ablation Survivability（权重 10%）
+- 看消融后骨架是否仍能独立支撑行为
+---
+## 3. 硬失败门（Hard Fail Gate）
+满足任一条件，直接触发硬失败：
+1. 检索验证发现核心前提虚构（T3）
+2. 关键步骤无法验证完成状态
+3. 关键依赖路径不可解析且无阻断出口
+硬失败输出：`Infeasible` + 证据 + 最小修复清单。
+---
+## 4. 评分一致性协议
+- 建议双评审独立打分
+- 单维分差 > 1.0 进入仲裁
+- 仲裁必须引用证据句，不允许“印象打分”
+---
+## 5. 总分与档位
+- 加权总分范围：0-5
+- `A`: >= 4.5
+- `B`: 4.0-4.49
+- `C`: 3.0-3.99
+- `D`: < 3.0
+若触发硬失败门，最终结论强制为 `Infeasible`，覆盖总分档位。

package/templates/.agents/skills/craft-authoring/references/SCORECARD_TEMPLATE.md ADDED Viewed

@@ -0,0 +1,64 @@
+# Prompt Scorecard
+## Target
+- Artifact:
+- Path:
+- Date:
+- Reviewer:
+## Ablation Result
+- Removed layers:
+- Remaining skeleton summary:
+- Ablation survivability note:
+## Tier
+- Tier: T0 / T1 / T2 / T3
+- Tier rationale:
+## Dimension Scores
+| Dimension              | Weight | Score (0-5) | Confidence      | Evidence | Fix |
+| ---------------------- | ------ | ----------- | --------------- | -------- | --- |
+| Structure              | 20%    |             | high/medium/low |          |     |
+| Alignment              | 20%    |             | high/medium/low |          |     |
+| Robustness             | 15%    |             | high/medium/low |          |     |
+| Efficiency             | 10%    |             | high/medium/low |          |     |
+| Meta-Isomorphism       | 15%    |             | high/medium/low |          |     |
+| Groundability          | 10%    |             | high/medium/low |          |     |
+| Ablation Survivability | 10%    |             | high/medium/low |          |     |
+## Hard Fail Gate Check
+- Triggered: Yes / No
+- Condition:
+- Evidence:
+- Minimal repair actions:
+## Weighted Score
+- Score:
+- Grade: A / B / C / D
+- Final verdict: Pass / Needs Iteration / Infeasible
+## Top Risks
+## Top Fixes
+## Re-score Expectation
+- Expected tier after fixes:
+- Expected score delta:

package/templates/.agents/skills/e2e-testing-guide/SKILL.md CHANGED Viewed

@@ -2,11 +2,11 @@
 ## name: e2e-testing-guide
-description: 规定如何撰写面向真人的 E2E / 手动验证《测试指南》及《E2E Verification》报告格式（PRD 对照、功能面、旅程与步骤）；不含实机浏览器编排——实机顺序由 `/forge` §3.4.6 写死。
+description: 规定如何撰写面向真人的 E2E / 手动验证《测试指南》及《E2E Verification》报告格式（PRD 对照、功能面、旅程与步骤）；不含实机浏览器编排——实机顺序由 `/forge` §3.7 写死。
 # E2E Testing Guide
-本 skill **只解决两件事**：（1）**怎么写**可执行的 E2E / 手动验证**测试指南**；（2）**报告长什么样**（含评测列）。**是否在浏览器里按指南操作**，由 `**/forge` §3.4.6** 统一编排：先按本 skill 产出报告，再在用户授权下使用宿主浏览器工具回填证据。
+本 skill **只解决两件事**：（1）**怎么写**可执行的 E2E / 手动验证**测试指南**；（2）**报告长什么样**（含评测列）。**是否在浏览器里按指南操作**，由 `**/forge` §3.7** 统一编排：先按本 skill 产出报告，再在用户授权下使用宿主浏览器工具回填证据。
 > 原则：像真人逛产品一样写清「从哪进、点哪、期望看到什么」；每一项应对得上 **PRD / 验收** 里的可追溯条目。
@@ -72,7 +72,7 @@ description: 规定如何撰写面向真人的 E2E / 手动验证《测试指南
 ### 5. 执行计划（可选短文）
-`Target` / `Environment` / `Role` / `Data setup` / `Side effects` / `Blockers` 一段即可。**不写**浏览器点击协议——实机见 `**/forge` §3.4.6**。
+`Target` / `Environment` / `Role` / `Data setup` / `Side effects` / `Blockers` 一段即可。**不写**浏览器点击协议——实机见 `**/forge` §3.7**。
 ---

package/templates/.agents/workflows/blueprint.md CHANGED Viewed

@@ -4,23 +4,35 @@ description: "编排 /blueprint：基于设计输入生成 05A_TASKS.md 与 05B_
 # /blueprint
+<phase_context>
 你是 **TASK ARCHITECT (任务规划师)**。
-## 目标
-- 产出 `.anws/v{N}/05A_TASKS.md`（执行主清单）
-- 产出 `.anws/v{N}/05B_VERIFICATION_PLAN.md`（验证计划）
+**使命**：把已批准设计输入编排为可执行的 05A/05B 双文档，并完成收口质量门禁。
+**能力**：版本定位、输入校验、契约映射、调用 `task-planner`、收口检查与状态更新。
+**限制**：只做编排与关卡校验；详细字段、示例与版式由 `task-planner` 与 references 维护。
+**与用户的关系**：你负责交付可执行计划骨架，不替用户越权执行实现与实测。
+**Output Goal**: `.anws/v{N}/05A_TASKS.md` + `.anws/v{N}/05B_VERIFICATION_PLAN.md`
+</phase_context>
 ---
-## 编排边界
+## CRITICAL 编排约束
-`/blueprint` 只负责流程编排与关卡校验，不重复维护详细模板。
-任务字段、验证字段、示例格式以 `task-planner/SKILL.md` 与 `references/TASK_TEMPLATE_05A.md`、`references/TASK_TEMPLATE_05B.md` 为唯一事实源。
+> [!IMPORTANT]
+> `blueprint` 只定义流程与门禁，不复写模板细节。
+>
+> - 任务/验证字段、示例格式的唯一事实源是：
+>   - `task-planner/SKILL.md`
+>   - `task-planner/references/TASK_TEMPLATE_05A.md`
+>   - `task-planner/references/TASK_TEMPLATE_05B.md`
+> - 禁止在 `blueprint` 重复粘贴字段级规范，避免双源漂移
+> - 若发现上游规范冲突，优先修正事实源，不在本文件打补丁
----
+## 目标
+- 产出 `.anws/v{N}/05A_TASKS.md`（执行主清单）
+- 产出 `.anws/v{N}/05B_VERIFICATION_PLAN.md`（验证计划）
-## Step 0: 定位版本与前置检查
+## Step 0: 定位版本与前置检查 (Locate Version & Preconditions)
 1. 扫描 `.anws/` 找到最新 `v{N}`，设定 `TARGET_DIR = .anws/v{N}`。
 2. 必需文件：
@@ -32,7 +44,7 @@ description: "编排 /blueprint：基于设计输入生成 05A_TASKS.md 与 05B_
 ---
-## Step 1: 加载输入并建立契约映射
+## Step 1: 加载输入并建立契约映射 (Load Inputs & Contract Mapping)
 1. 读取 `01_PRD.md`、`02_ARCHITECTURE_OVERVIEW.md`、`03_ADR/`（以及存在时的 `04_SYSTEM_DESIGN/`）。
 2. 从输入中提取公共契约与风险点。
@@ -43,20 +55,34 @@ description: "编排 /blueprint：基于设计输入生成 05A_TASKS.md 与 05B_
 ---
-## Step 2: 调用 task-planner 生成 A/B 双文档
+## Step 1.5: 编排思考准绳（中等强度）
+在进入任务拆解前，先完成三项快速判断：
-调用 `task-planner`，并显式传递约束：
+1. **真实性判断**：当前任务树是否真实承接了设计中的外部可观察契约，而不是只承接“代码实现动作”。
+2. **风险闭合判断**：高风险契约是否至少有一个明确验证落点，且验证类型不过度上推到 E2E。
+3. **执行可落地判断**：Sprint/INT 关口是否可被客观证据验证（日志/报告/截图），避免“写了计划但无法验收”。
-- 输入文档是唯一事实来源
-- 若 ADR 存在测试策略与质量门禁，必须优先遵循
-- 验证类型按“最轻但足够”选择，避免 E2E 滥用
-- 单元测试与 API接口功能测试必须同时规划
-- 冒烟测试优先绑定 `INT-S{N}` 里程碑任务
-- 仅在 `05A/05B` 中记录 E2E 触发条件、范围与证据预期；**不得在 `/blueprint` 阶段执行 `e2e-testing-guide`**
+> [!IMPORTANT]
+> 若任一判断失败，应先修正契约映射约束，再调用 `task-planner`。禁止带着已知缺口继续拆解。
 ---
-## Step 3: 收口写入
+## Step 2: 调用 task-planner 生成 A/B 双文档 (Decompose via task-planner)
+> [!IMPORTANT]
+> 调用 `task-planner` 时必须显式传递以下约束：
+>
+> - 输入文档是唯一事实来源
+> - 若 ADR 存在测试策略与质量门禁，必须优先遵循
+> - 验证类型按“最轻但足够”选择，避免 E2E 滥用
+> - 单元测试与 API接口功能测试必须同时规划
+> - 冒烟测试优先绑定 `INT-S{N}` 里程碑任务
+> - 仅在 `05A/05B` 中记录 E2E 触发条件、范围与证据预期；**不得在 `/blueprint` 阶段执行 `e2e-testing-guide`**
+---
+## Step 3: 收口写入 (Write Outputs)
 1. 保存：
    - `.anws/v{N}/05A_TASKS.md`
@@ -67,7 +93,7 @@ description: "编排 /blueprint：基于设计输入生成 05A_TASKS.md 与 05B_
 ---
-## Step 4: 必过检查清单
+## Step 4: 必过检查清单 (Mandatory Exit Checklist)
 - [ ] `05A_TASKS.md` 与 `05B_VERIFICATION_PLAN.md` 均已生成
 - [ ] 每个 05A 任务都含 `验证引用` 且可在 05B 定位到对应条目
@@ -75,3 +101,12 @@ description: "编排 /blueprint：基于设计输入生成 05A_TASKS.md 与 05B_
 - [ ] 单元测试与 API接口功能测试职责均已规划
 - [ ] 测试覆盖按风险类别闭合，且未出现测试膨胀
 - [ ] `AGENTS.md` 已更新为 A/B 双文档入口
+---
+<completion_criteria>
+- 已完成版本定位与前置校验，且阻断条件被正确执行
+- 已将契约映射约束传递给 `task-planner` 并产出 05A/05B 双文档
+- 05A/05B 通过收口检查清单，关键追溯链完整
+- 文档入口状态已回写到 `AGENTS.md`
+</completion_criteria>

package/templates/.agents/workflows/change.md CHANGED Viewed

@@ -280,7 +280,7 @@
     - (注意: 局部修订不改变待办任务数)
 4. **报告**: 告知用户变更已完成。
 5. **回到 `/forge` 前的衔接说明（非静态代码审查）**:
-  - `**/change` 不运行、不替代 `code-reviewer`。** 静态忠实度审查只属于 `**/forge` 3.4.5** 与 `**/challenge`（CODE/FULL）**；不得在本次变更报告中声称「代码已完成静态审查」。
+  - `**/change` 不运行、不替代 `code-reviewer`。** 静态忠实度审查只属于 `**/forge` §3.6** 与 `**/challenge`（CODE/FULL）**；不得在本次变更报告中声称「代码已完成静态审查」。
   - 若本次变更触及 `契约承接`、`验证类型` / `验证说明`、`04_SYSTEM_DESIGN/` 或公共接口语义：在报告中 **列表说明触达项**，便于 `/forge` 规划门禁与任务执行。
   - **可选（文档侧）**：若任务表或设计措辞需要可读性复核，可 **建议** 用户使用 `task-reviewer` 或 `design-reviewer`；**不得**将 `/change` 写成与 `**/forge` Step 0**（含 `07_CHALLENGE_REPORT.md`）同等效力的「Critical/High 阻塞回到编码」门禁。