npm - agent-project-sdlc - Versions diffs - 0.1.12 → 0.1.13 - Mend

agent-project-sdlc 0.1.12 → 0.1.13

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (16) hide show

package/README.md +4 -0
package/assets/agents/AGENTS_CORE.md +2 -2
package/assets/docs/README.md +5 -1
package/assets/make/sdlc-harness.mk +1 -1
package/assets/policies/phase_contracts.yaml +1 -1
package/assets/skills/pjsdlc_dev_sprint/SKILL.md +5 -1
package/assets/skills/pjsdlc_implementation_doc/SKILL.md +6 -2
package/assets/skills/pjsdlc_reviewer/SKILL.md +7 -2
package/assets/skills/pjsdlc_rfc_recalibrate/SKILL.md +1 -1
package/assets/skills/pjsdlc_tester/SKILL.md +19 -12
package/assets/templates/IMPLEMENTATION_DOC_TEMPLATE.md +13 -5
package/assets/templates/REVIEW_TEMPLATE.md +9 -1
package/assets/templates/{TEST_PLAN_TEMPLATE.md → TEST_REPORT_TEMPLATE.md} +13 -5
package/dist/lib/sync-engine.js +1 -1
package/dist/lib/validators.js +139 -8
package/package.json +1 -1

package/README.md CHANGED Viewed

@@ -82,6 +82,10 @@ Before development starts, `ARCHITECTING` can return to `REQUIREMENT_GATHERING`
 `validate-design` treats semantic slicing as a hard gate. Generated `overview.md` files do not count as deliverables, development draft tasks in `plan.draft.yaml` must reference existing tech plan slices through `docs.tech_plan`, multiple development draft tasks need distinct primary tech plan slices, and explicit AI provider/copilot, external-system, or compliance/permission/audit themes require dedicated architecture slices.
+SPRINTING Definition of Done includes runnable entry/exit boundaries. API, CLI, server route, adapter, worker, provider, config-contract and fixture/live boundaries promised by a technical plan or task must be implemented or marked `BLOCKED` during development. REVIEWING treats missing entry/exit as blocking, and TESTING only exercises existing entrypoints; it must not add product runtime, bootstrap, provider adapter, deploy code or package runtime scripts.
+`validate-test` keeps its command name as the TESTING phase gate. The canonical TESTING deliverable is `.docs/07_test/TEST_REPORT.md`, which records test matrix, regression evidence, runnable entry/exit coverage, coverage gaps and final decision. Legacy `.docs/07_test/TEST_PLAN.md` remains accepted for existing projects, but new test evidence should use `TEST_REPORT.md`.
 ## ADR And Memory Boundaries
 `.docs/05_decisions/` stores ADRs, or Architecture Decision Records. ADRs answer why a key architecture choice was made instead of another option. Architecture and tech plan slices may include local design rationale; create an ADR when a decision has real alternatives, affects multiple modules or stages, is likely to be challenged later, or would be expensive to reverse.

package/assets/agents/AGENTS_CORE.md CHANGED Viewed

@@ -34,7 +34,7 @@
 - `current_phase` 只保存在 `lifecycle.yaml`；不要在 `plan.yaml`、`plan.draft.yaml` 或 `parallel_execution` 中重复保存当前阶段。
 - 新建任务统一使用 `TASK-*` id，并通过 `phase` 标明属于 `REQUIREMENT_GATHERING`、`ARCHITECTING`、`SPRINTING`、`REVIEWING`、`TESTING`、`RELEASING` 或 `RFC_RECALIBRATION`；历史 `PRD-*`、`DES-*`、`DEV-*` 只作为兼容旧记录和旧提交的 provenance。
 - `next_task_sequence` 记录下一个可分配的 `TASK-*` 序号，避免删除历史 task 后发生 id 冲突。
-- 文档、Review、测试、发布和 RFC 类 task 使用 `result_docs` 指向本 task 产出的 PRD、architecture、tech plan、ADR、review report、test plan、release note、RFC 或 `plan.draft.yaml`；开发 task 使用 `implementation_doc` 指向模块级实现事实。
+- 文档、Review、测试、发布和 RFC 类 task 使用 `result_docs` 指向本 task 产出的 PRD、architecture、tech plan、ADR、review report、test report、release note、RFC 或 `plan.draft.yaml`；开发 task 使用 `implementation_doc` 指向模块级实现事实。
 - task 完成并写入或更新相关事实源后，从 `plan.yaml` 的 `tasks` 列表移除该 task；不要长期保留 done/cancelled task 摘要。
 - `plan.draft.yaml` 是架构阶段生成的计划草案，不自动覆盖 `plan.yaml`。
 - `plan.draft.yaml` 不保存 `current_phase` 或 `current_task_id`，只保存待采用的 task 草案和必要的 `next_task_sequence`。
@@ -188,7 +188,7 @@ Parallel Execution 是可选协作协议，不是默认模式，也不是 CLI
 - `/syncdocs`：同步 `.docs/INDEX.md` 与当前文档事实源。
 - `/overview`：运行 `make docs-overview`，刷新 `.docs/<stage>/overview.md` 派生视图。
 - `/review`：运行只读 Review 工作流。
-- `/test`：运行测试计划和验证工作流。
+- `/test`：运行测试报告和验证工作流。
 ## 阶段流转

package/assets/docs/README.md CHANGED Viewed

@@ -105,6 +105,10 @@ Agent 会读取 `<harnessRoot>/state/lifecycle.yaml` 和 `<harnessRoot>/state/pl
 `validate-design` 会把架构阶段的语义切片作为硬 gate：`overview.md` 不计入 deliverables，`plan.draft.yaml` 中每个开发 draft task 必须通过 `docs.tech_plan` 指向存在的 tech plan slice；多个开发 draft task 默认需要不同 primary tech plan slice。PRD、tech plan 或 draft task 明确出现 AI provider / copilot、外部系统边界、合规 / 权限 / 审计等横切主题时，也需要对应的专门 architecture slice。
+SPRINTING 的 Definition of Done 包含可运行入口/出口：技术方案或 task 承诺的 API、CLI、server route、adapter、worker、provider、配置契约和 fixture/live 边界必须在开发阶段实现或明确 `BLOCKED`。REVIEWING 会把缺少入口/出口作为阻断项；TESTING 只调用既有入口做输入输出验证，不能新增 product runtime、bootstrap、provider adapter、deploy 或 package runtime script。
+`validate-test` 仍然是 TESTING 阶段 gate 名称。TESTING 的 canonical 产物是 `.docs/07_test/TEST_REPORT.md`，记录 test matrix、regression evidence、runnable entry/exit coverage、coverage gaps 和 final decision；历史 `.docs/07_test/TEST_PLAN.md` 只作为 existing project 的 legacy alias 兼容，新测试证据应使用 `TEST_REPORT.md`。
 ### ADR 与 Memory 的边界
 `.docs/05_decisions/` 保存 ADR（Architecture Decision Record）。ADR 是软件工程中常见的架构决策记录实践，用来回答“为什么当时选择这个方案，而不是别的方案”。architecture / tech plan 可以写当前方案里的局部设计理由；如果一个决定有备选方案、影响多个模块或阶段、未来容易被质疑，或修改成本高，就应写成 ADR，记录背景、备选方案、理由、后果和替代关系。
@@ -229,7 +233,7 @@ make docs-overview
 | `.docs/04_implementation/` | 模块、子系统和核心数据流的真实实现事实 |
 | `.docs/05_decisions/` | ADR，长期关键决策及其背景、备选方案、理由和后果 |
 | `.docs/06_review/` | Review 报告 |
-| `.docs/07_test/` | 测试计划和回归记录 |
+| `.docs/07_test/` | 测试报告、测试矩阵、回归证据和覆盖缺口 |
 | `.docs/08_release/` | 发布记录和回滚方案 |
 | `.docs/rfc/` | 需求变更和影响分析 |

package/assets/make/sdlc-harness.mk CHANGED Viewed

@@ -14,7 +14,7 @@ help:
 	@echo "  make validate-design     校验架构设计、技术方案和任务草案"
 	@echo "  make validate-dev        校验 sprint 任务状态、draft 消费、路径、代码 gate 和实现文档"
 	@echo "  make validate-review     校验 Review report"
-	@echo "  make validate-test       校验 regression/test plan"
+	@echo "  make validate-test       校验 regression/test report"
 	@echo "  make validate-release    校验 release note、smoke result 和 rollback plan"
 	@echo "  make validate-rfc        校验 RFC 产物并运行完整回归入口"

package/assets/policies/phase_contracts.yaml CHANGED Viewed

@@ -81,7 +81,7 @@ phases:
     next: "TESTING"
   TESTING:
-    goal: "形成测试矩阵并完成回归验证"
+    goal: "形成测试报告、测试矩阵、回归证据和覆盖缺口结论"
     role: "tester"
     skill: "pjsdlc_tester"
     inputs:

package/assets/skills/pjsdlc_dev_sprint/SKILL.md CHANGED Viewed

@@ -15,6 +15,8 @@ description: Use during SPRINTING to execute one task from plan.yaml, respecting
 开始编码前，先确认当前 open task 是否完整，修改范围是否覆盖必要文件，验收标准是否能被测试或 gate 验证。如果发现任务边界、产品行为或技术方案不清晰，要停下来说明 blocker、给出可能解释和推荐下一步，而不是扩大范围继续写。
+开发阶段的 Definition of Done 包含可运行的系统入口/出口。凡技术方案或 task 承诺 API、CLI、server route、adapter、worker、provider、外部发送/写入执行器、配置契约或 live/fixture 双模式边界，当前实现必须提供对应入口、调用方式、输出/副作用边界和验证方式；如果真实入口/出口尚不可运行，不能把 task 当作完成，也不能把缺口留给 TESTING 补 runtime。Implementation doc 必须写明 `Runnable Entry/Exit`；确实不适用时也要显式写 `Not applicable` 和原因。此时应保留或创建 `BLOCKED`/后续 dev task，或通过 RFC/ARCHITECTING 处理边界变更。
 `/dev` 和 `/devloop` 是开发阶段的两个入口。`/dev` 创建或选择下一个最小 `TASK-*` development task，设置 `phase: "SPRINTING"`，并只完成一个 task 闭环后停止。通用规则是从任何 draft queue promote 正式 `TASK-*` 时都必须同次消费源 draft；当前开发阶段的内置 draft queue 是 `plan.draft.yaml.tasks[]`，因此如果这个 task 来自 `plan.draft.yaml.tasks[]`，promote 时必须同次删除源 draft，避免已采用草案继续显示为 `pending`。`/devloop` 连续运行 `/dev`，直到 `plan.yaml.tasks[]` 和 `plan.draft.yaml.tasks[]` 都没有明确可创建/执行的任务，或遇到需求、架构、allowed_paths、gate、commit/push blocker。
 实现时遵循小步闭环：先检查 `git status`，确认工作区没有未归属到当前 task 的脏变更；再定位相关代码和测试，做必要修改，运行 gate，修复失败，写入或更新相关 implementation doc 并刷新文档派生视图。此时先不要从 `plan.yaml` 移除当前 task，要在当前 task 仍位于 `plan.yaml` 时创建 task implementation commit；随后再移除 task，创建 task completion ledger commit，并 push 两个 commit。不要顺手重构、重排格式或处理无关问题；如果发现无关风险，只记录或报告。
@@ -35,6 +37,7 @@ description: Use during SPRINTING to execute one task from plan.yaml, respecting
 - 当前 task `allowed_paths` 范围内的测试改动
 - `.docs/04_implementation/` 下相关模块、子系统或核心数据流的 implementation doc
 - 当前 task `working_notes` 或 implementation doc `Verification` 中的 gate evidence
+- implementation doc 中的 runnable entry/exit、配置契约和 fixture/live 边界事实
 - 更新后的 `<harnessRoot>/state/plan.yaml`
 - 如果本轮 promote draft，更新后的 `<harnessRoot>/state/plan.draft.yaml`
 - 更新后的 `.docs/INDEX.md`
@@ -80,7 +83,7 @@ done task 的执行流水不在当前 `plan.yaml` 长期保留，也不是默认
 5. 如果 gate 因代码或测试逻辑失败，在任务范围内修复。
 6. 如果 gate 因基础设施、凭证缺失、产品行为不清或高风险架构变化失败，进入 `BLOCKED`。
 7. gate 通过后调用 `pjsdlc_implementation_doc`。
-8. 只有 gate 通过且 implementation doc 校验通过后，才能把任务标记为 `done`。
+8. 只有 gate 通过、承诺的 runnable entry/exit 已实现或明确 `BLOCKED`，且 implementation doc 校验通过后，才能把任务标记为 `done`。
 9. 任务完成并写入或更新相关 implementation doc、刷新 `overview.md`、记录 gate 后，先创建 task implementation commit；此时不要移除该 task。
 10. task implementation commit 必须发生在 task 移除前；后续默认不要读取其中的执行期字段，历史查询以模块级 implementation doc、RFC、PRD、tech plan 和代码为主。
 11. implementation commit 完成后，从当前 `plan.yaml` 移除该 task，并创建 task completion ledger commit。
@@ -97,6 +100,7 @@ done task 的执行流水不在当前 `plan.yaml` 长期保留，也不是默认
 - [ ] 当前 task `required_gates` 已通过，或 blocker 已记录。
 - [ ] open task 在 `plan.yaml` 中包含完整执行合同。
 - [ ] 当前任务仍然是单一清晰的执行单元。
+- [ ] 技术方案或 task 承诺的 API/CLI/adapter/worker/provider、配置契约、输出/副作用和 fixture/live 边界已可运行并写入 implementation doc，或已明确 `BLOCKED`/后续 dev task。
 - [ ] 如果当前 task 来自 `plan.draft.yaml.tasks[]`，源 draft 已在 promote 时从 draft 列表删除。
 - [ ] implementation doc 已生成或更新，并反映相关模块的真实代码。
 - [ ] 如果启用了 `parallel_execution`，worker owned paths、forbidden paths、required gates 和主 Agent 集成结果已记录。

package/assets/skills/pjsdlc_implementation_doc/SKILL.md CHANGED Viewed

@@ -17,6 +17,8 @@ description: Use after development gates pass to update module-level implementat
 文档应帮助后来者快速理解：某个模块或核心数据流的当前实现是什么、关键对象/函数职责是什么、行为如何从输入流到输出、测试覆盖了什么、还有什么未覆盖。task id 只作为 provenance，不作为默认切片粒度。
+如果模块包含或承诺可运行系统边界，implementation doc 必须记录 runnable entry/exit：API/CLI/server route/adapter/worker/provider 的调用方式、配置契约、输入来源、输出或副作用、fixture/live 模式边界，以及哪些真实外部执行器尚未实现。不能把未来才会实现的入口写成当前事实。
 ## 输入
 - `<harnessRoot>/state/plan.yaml` 中当前 task 的 `implementation_doc` 路径和 task ID
@@ -45,8 +47,9 @@ description: Use after development gates pass to update module-level implementat
 1. implementation doc 描述当前代码事实，而不是期望中的未来设计。
 2. 每个被记录的文件都应说明它在该模块或数据流中的作用和关键函数/对象。
 3. 与技术方案的偏移必须明确记录，即便该偏移是合理的。
-4. 测试覆盖必须列出具体测试，或明确记录覆盖缺口。
-5. 文档粒度保持在模块、子系统或核心数据流级别；不要默认按 task 建文档，也不要写成跨全项目的巨型百科。
+4. runnable entry/exit、配置契约和 fixture/live 边界必须记录当前事实；缺失项写入 `未覆盖（Not covered）` 或方案偏移。
+5. 测试覆盖必须列出具体测试，或明确记录覆盖缺口。
+6. 文档粒度保持在模块、子系统或核心数据流级别；不要默认按 task 建文档，也不要写成跨全项目的巨型百科。
 ## 完成检查
@@ -54,6 +57,7 @@ description: Use after development gates pass to update module-level implementat
 - [ ] Task ID、commit 和关联产物路径已作为 provenance 记录。
 - [ ] 真实代码结构表已填写。
 - [ ] 核心数据流已说明。
+- [ ] runnable entry/exit、配置契约和 fixture/live 边界已记录，或缺失项已明确标注。
 - [ ] 已判断 implementation doc 的语义切片边界。
 - [ ] 方案偏移和测试覆盖已记录。
 - [ ] `.docs/INDEX.md` 已链接 implementation doc。

package/assets/skills/pjsdlc_reviewer/SKILL.md CHANGED Viewed

@@ -17,6 +17,8 @@ Review 时先建立证据链：PRD 说什么、技术方案承诺什么、implem
 不要把个人偏好包装成 blocker。区分 blocking issue、follow-up improvement 和 open question。如果没有发现问题，要明确说明，同时列出剩余测试缺口或残余风险。
+Review 必须把“当前模块没有可运行入口/出口”视为阻断项，而不是普通测试缺口。凡 PRD、技术方案或 implementation doc 承诺 API、CLI、server route、adapter、worker、provider、外部发送/写入执行器、配置契约或 live/fixture 双模式边界，Review 都要核对真实代码和实现文档是否提供可调用入口、输出/副作用边界和验证方式；缺失时 gate decision 应为 `BLOCKED`，并要求回到 SPRINTING/RFC，而不是允许进入 TESTING 后补 runtime。
 Review 产出本身也是 workflow task。开始 review 前，先在 `<harnessRoot>/state/plan.yaml` 创建或选择一个足够小的 `TASK-*` open task，并设置 `phase: "REVIEWING"`；当前轮只产出一个 review batch、一个风险主题 slice 或一次 PR review 结论。不要在一个任务里覆盖多个互不相关的 review 主题。
 ## 输入
@@ -35,6 +37,7 @@ Review 产出本身也是 workflow task。开始 review 前，先在 `<harnessRo
 - 更新后的 `<harnessRoot>/state/plan.yaml`
 - 风险清单
 - 重构建议
+- runnable entry/exit readiness 结论
 - 是否允许进入 `TESTING` 的结论
 ## 语义切片
@@ -62,8 +65,9 @@ Review 阶段受 `plan.yaml` 管控：
 2. Findings 放在最前面，并按严重程度排序。
 3. 每条 finding 尽量引用文件、需求、任务或文档路径。
 4. 区分 blocking issues 和 follow-up improvements。
-5. 如果未发现问题，明确说明，并列出剩余测试缺口或残余风险。
-6. Review 阶段一次只执行一个 `TASK-*` task。
+5. 缺少已承诺的 runnable entry/exit、配置契约或 fixture/live 边界时，必须作为 P0/P1 blocking finding。
+6. 如果未发现问题，明确说明，并列出剩余测试缺口或残余风险。
+7. Review 阶段一次只执行一个 `TASK-*` task。
 ## 完成检查
@@ -72,6 +76,7 @@ Review 阶段受 `plan.yaml` 管控：
 - [ ] 当前 task 已从 `plan.yaml` 移除，或因中断/blocker 保留为可恢复 open task。
 - [ ] 已评估需求一致性。
 - [ ] 已评估架构和可维护性风险。
+- [ ] 已评估 runnable entry/exit、配置契约和 fixture/live 边界是否足以进入 TESTING。
 - [ ] 已判断 review slice 的范围和风险主题边界。
 - [ ] 已列出测试缺口。
 - [ ] 已运行 `make docs-overview` 刷新 `.docs/<stage>/overview.md`。

package/assets/skills/pjsdlc_rfc_recalibrate/SKILL.md CHANGED Viewed

@@ -42,7 +42,7 @@ RFC recalibration 本身也是 workflow task。开始处理变更前，先在 `<
 - `.docs/rfc/` 按一次需求变更切片，一份 RFC 只描述一个可独立评估、实现和回归的变更。
 - 如果用户一次提出多个互不依赖的变更，应拆成多份 RFC。
-- RFC 的 impact analysis 负责判断是否需要重切 PRD、tech plan、implementation doc 或 test plan，并覆盖 state、tools、package assets、tests、migration 和 generated overview。
+- RFC 的 impact analysis 负责判断是否需要重切 PRD、tech plan、implementation doc 或 test report，并覆盖 state、tools、package assets、tests、migration 和 generated overview。
 - 对受影响产物做局部补丁，不重写无关稳定 slice。
 - 每次 RFC 影响了文档边界，都要更新 `.docs/INDEX.md` 并记录受影响任务状态。

package/assets/skills/pjsdlc_tester/SKILL.md CHANGED Viewed

@@ -11,13 +11,15 @@ description: Use during TESTING to produce a test matrix, run regression, and do
 ## 角色提示词
-你是测试负责人，目标是把需求、风险和实现变化转成可执行、可追踪、可复用的测试计划。你不只是列测试项，而是要判断哪些路径最容易出错、哪些验收标准必须被自动化或手动验证覆盖。
+你是测试负责人，目标是把需求、风险和实现变化转成可执行、可追踪、可复用的测试报告：测试矩阵、回归证据、覆盖缺口和最终结论。你不只是列测试项，而是要判断哪些路径最容易出错、哪些验收标准必须被自动化或手动验证覆盖。
 开始测试规划前，先建立映射关系：PRD acceptance criteria、技术方案关键接口/数据模型、implementation doc 的真实改动、Review findings 和现有测试。对每个测试项说明它覆盖的需求或风险；对暂不覆盖的内容说明原因、残余风险和 follow-up。
 执行回归时，优先选择能证明阶段出口的 gate。测试无法运行、环境缺失或数据不可得时，不要宣布通过，应记录 blocker、已完成检查和恢复条件。
-测试计划和回归证据产出本身也是 workflow task。开始测试前，先在 `<harnessRoot>/state/plan.yaml` 创建或选择一个足够小的 `TASK-*` open task，并设置 `phase: "TESTING"`；当前轮只产出一个测试矩阵 slice、一个回归批次、一个风险验证片区或一组 scoped test changes。
+TESTING 只能调用 SPRINTING 已经交付的入口做输入/输出验证。可以补充测试、fixture、mock、assertion helper 和测试文档，但不能在 TESTING 中新增或长期维护 product runtime、server/API/CLI/adapter、direct poller、cloud bootstrap、systemd unit、真实 provider adapter、package runtime script 或部署脚本。如果发现真实入口/出口不存在、live 模式不可调用、配置契约缺失或用户目标与已实现通道不一致，应记录 `BLOCKED`、生成 RFC 或后续 dev task 建议，并停止把测试阶段扩大成开发/集成搭建。
+测试报告和回归证据产出本身也是 workflow task。开始测试前，先在 `<harnessRoot>/state/plan.yaml` 创建或选择一个足够小的 `TASK-*` open task，并设置 `phase: "TESTING"`；当前轮只产出一个测试矩阵 slice、一个回归批次、一个风险验证片区或一组 scoped test changes。`plan.yaml` 仍是唯一执行计划事实源，`.docs/07_test/**` 只记录 test matrix、regression evidence、coverage gaps 和 final decision，不表达“下一步如何开发”。
 如果用户明确要求并行、多 agent 或多 worktree，测试阶段可以启用 `parallel_execution`，让 worker 分别执行互不依赖的回归片区、smoke、兼容性或风险验证。worker 只提交证据和必要的 scoped test changes；最终 `.docs/07_test/**`、coverage gaps、PASS/BLOCKED 决策和阶段 gate 由主 Agent 汇总。没有用户显式要求时，测试 workflow 保持串行。
@@ -29,22 +31,23 @@ description: Use during TESTING to produce a test matrix, run regression, and do
 - `.docs/04_implementation/`
 - `.docs/06_review/REVIEW_REPORT.md`
 - 现有测试
-- `<harnessRoot>/pjsdlc_managed/templates/TEST_PLAN_TEMPLATE.md`
+- `<harnessRoot>/pjsdlc_managed/templates/TEST_REPORT_TEMPLATE.md`
 ## 输出
-- `.docs/07_test/TEST_PLAN.md`
+- `.docs/07_test/TEST_REPORT.md`
 - 必要时在 `tests/` 下补充测试
 - 更新后的 `<harnessRoot>/state/plan.yaml`
-- 回归测试记录
+- 回归证据记录
 - 覆盖缺口清单
+- `BLOCKED` 时的 RFC/dev follow-up 建议和恢复条件
 ## 语义切片
-- `.docs/07_test/` 默认按测试计划、测试矩阵、回归批次或领域测试范围切片。
+- `.docs/07_test/` 默认按测试报告、测试矩阵、回归批次或领域测试范围切片。
 - Test matrix 的语义原子是 PRD acceptance criteria、Review findings 和关键风险路径。
-- 如果多个领域的测试范围互不依赖，应拆成多个 test plan slices，并在主 `TEST_PLAN.md` 汇总。
-- 如果新增测试只是覆盖同一验收标准，应更新原 test slice，不要创建重复测试计划。
+- 如果多个领域的测试范围互不依赖，应拆成多个 test evidence slices，并在主 `TEST_REPORT.md` 汇总。
+- 如果新增测试只是覆盖同一验收标准，应更新原 test slice，不要创建重复测试报告。
 - 每次新增、拆分或合并 test slice 后，都要更新 `.docs/INDEX.md`。
 ## Plan Protocol
@@ -63,9 +66,12 @@ description: Use during TESTING to produce a test matrix, run regression, and do
 1. 测试用例必须追溯到 PRD acceptance criteria 或 Review findings。
 2. 根据风险补充边界、负向、回归和集成测试。
 3. 如果有意延后覆盖，必须记录风险和 follow-up。
-4. 并行测试必须使用 `parallel_execution.trigger: "user_requested"`；`runtime_managed` 只在当前 runtime 支持 subagent 时使用，否则输出 `user_orchestrated` worker prompt。
-5. 宣布阶段完成前运行 `make test-all`。
-6. 测试阶段一次只执行一个 `TASK-*` task。
+4. 不得新增 product runtime、server/API/CLI/adapter、poller、cloud bootstrap、systemd unit、真实 provider adapter、package runtime script 或部署脚本；这些属于 SPRINTING/RFC。
+5. 测试发现入口/出口缺失时，Final decision 必须为 `BLOCKED`，并指出回到 SPRINTING/RFC 的具体条件。
+6. 新测试文档使用 `.docs/07_test/TEST_REPORT.md`；历史 `.docs/07_test/TEST_PLAN.md` 只作为 legacy alias / index 兼容，不作为新事实源命名。
+7. 并行测试必须使用 `parallel_execution.trigger: "user_requested"`；`runtime_managed` 只在当前 runtime 支持 subagent 时使用，否则输出 `user_orchestrated` worker prompt。
+8. 宣布阶段完成前运行 `make test-all`。
+9. 测试阶段一次只执行一个 `TASK-*` task。
 ## 完成检查
@@ -73,7 +79,8 @@ description: Use during TESTING to produce a test matrix, run regression, and do
 - [ ] 当前测试工作已绑定 `plan.yaml` 中一个最小 `TASK-*` task，并设置 `phase: "TESTING"`。
 - [ ] 当前 task 已从 `plan.yaml` 移除，或因中断/blocker 保留为可恢复 open task。
 - [ ] Regression checklist 已完成。
-- [ ] 已判断 test plan / test matrix 的语义切片边界。
+- [ ] 测试只调用既有 runnable entry/exit；未在 TESTING 中新增 product runtime、bootstrap、provider adapter、deploy 或 package runtime script。
+- [ ] 已判断 test report / test matrix 的语义切片边界。
 - [ ] Coverage gaps 已明确。
 - [ ] 如果启用了并行测试，worker evidence 已由主 Agent 汇总到测试产物。
 - [ ] 已运行 `make docs-overview` 刷新 `.docs/<stage>/overview.md`。

package/assets/templates/IMPLEMENTATION_DOC_TEMPLATE.md CHANGED Viewed

@@ -32,7 +32,15 @@ Input
 -> Output
 ```
-## 5. 关键实现逻辑
+## 5. Runnable Entry/Exit（可运行入口/出口）
+- Entry points:
+- Exit / side effects:
+- Config contract:
+- Fixture/live boundary:
+- Missing runtime boundaries:
+## 6. 关键实现逻辑
 - 输入校验（Input validation）:
 - 核心分支（Core branches）:
@@ -40,22 +48,22 @@ Input
 - 边界兜底（Boundary fallback）:
 - 性能或并发注意事项（Performance or concurrency notes）:
-## 6. 与技术方案的偏移
+## 7. 与技术方案的偏移
 -
-## 7. 测试覆盖（Test Coverage）
+## 8. 测试覆盖（Test Coverage）
 | 测试（Test） | 覆盖范围（Coverage） | 结果（Result） |
 |---|---|---|
 |  |  |  |
-## 8. 变更记录（Change Log）
+## 9. 变更记录（Change Log）
 | 日期（Date） | Task ID | Commit | 摘要（Summary） |
 |---|---|---|---|
 |  |  |  |  |
-## 9. 后续维护注意事项
+## 10. 后续维护注意事项
 -

package/assets/templates/REVIEW_TEMPLATE.md CHANGED Viewed

@@ -25,7 +25,15 @@
 -
-## 6. Gate Result（阶段结论）
+## 6. Runnable Entry/Exit Readiness（可运行入口/出口）
+- Entry points:
+- Exit / side effects:
+- Config contract:
+- Fixture/live boundary:
+- Blocking gaps before TESTING:
+## 7. Gate Result（阶段结论）
 - Decision: `PASS` / `BLOCKED`
 - Required before testing:

package/assets/templates/{TEST_PLAN_TEMPLATE.md → TEST_REPORT_TEMPLATE.md} RENAMED Viewed

@@ -1,4 +1,4 @@
-# Test Plan（测试计划）
+# Test Report（测试报告）
 ## 1. Scope（范围）
@@ -13,17 +13,25 @@
 |---|---|---|---|---|
 |  |  | unit/integration/e2e/regression |  | pending |
-## 3. Regression Checklist（回归检查清单）
+## 3. Regression Evidence（回归证据）
-- [ ]
+-
-## 4. Coverage Gaps（覆盖缺口）
+## 4. Runnable Entry/Exit Coverage（可运行入口/出口覆盖）
+- Existing entry points under test:
+- Expected exits / side effects:
+- Config contract used:
+- Fixture/live boundary:
+- Missing entry/exit blocker:
+## 5. Coverage Gaps（覆盖缺口）
 | 缺口（Gap） | 风险（Risk） | 后续动作（Follow-up） |
 |---|---|---|
 |  |  |  |
-## 5. Final Result（最终结论）
+## 6. Final Decision（最终结论）
 - Decision: `PASS` / `BLOCKED`
 - Evidence:

package/dist/lib/sync-engine.js CHANGED Viewed

@@ -300,7 +300,7 @@ function renderSkillWithOverride(baseContent, override) {
         "",
         `${guidance} Keep package-managed Skill files unchanged; edit the override source instead.`,
         "",
-        "After sync, review the merged Skill for semantic conflicts between the package base and local override, especially phase boundaries, `allowed_paths`, `required_gates`, commit/release rules and completion checks.",
+        "After sync, review the merged Skill for semantic conflicts between the package base and local override, especially phase boundaries, `allowed_paths`, `required_gates`, commit/release rules and completion checks. Package-managed phase boundaries stay authoritative; overrides may narrow local behavior but must not expand TESTING, REVIEWING or other roles into implementation/runtime ownership.",
         ""
     ].join("\n");
     return `${renderedBase.trimEnd()}${header}\n${override.content.trim()}\n`;

package/dist/lib/validators.js CHANGED Viewed

@@ -27,6 +27,58 @@ const DESIGN_CATEGORIES = [
         architectureTerms: ["compliance", "permission", "authorization", "audit", "合规", "权限", "审计", "授权", "客户确认", "回执归档"]
     }
 ];
+const TESTING_DISALLOWED_ALLOWED_PATHS = [
+    "package.json",
+    "**/package.json",
+    "package-lock.json",
+    "**/package-lock.json",
+    "npm-shrinkwrap.json",
+    "**/npm-shrinkwrap.json",
+    "pnpm-lock.yaml",
+    "**/pnpm-lock.yaml",
+    "yarn.lock",
+    "**/yarn.lock",
+    "bun.lock",
+    "**/bun.lock",
+    "bun.lockb",
+    "**/bun.lockb",
+    "src/**",
+    "app/**",
+    "lib/**",
+    "server/**",
+    "bin/**",
+    "cli/**",
+    "runtime/**",
+    "scripts/**",
+    "tools/**",
+    "deploy/**",
+    "deployment/**",
+    "infra/**",
+    "ops/**",
+    "systemd/**",
+    ".github/workflows/**",
+    "dockerfile",
+    "dockerfile.*",
+    "docker-compose*.yml",
+    "docker-compose*.yaml",
+    "*.service",
+    "tests/runtime/**",
+    "tests/**/runtime/**"
+];
+const TESTING_DISALLOWED_CHANGED_PATHS = [...TESTING_DISALLOWED_ALLOWED_PATHS, "scripts/**", "tools/**"];
+const TESTING_RUNTIME_FILE_TERMS = ["bootstrap", "cloud", "daemon", "poller", "provider", "runtime", "service", "systemd"];
+const TESTING_ALLOWED_TEST_FILE_TERMS = ["assertion", "fixture", "mock", "smoke"];
+const TEST_REPORT_PATH = ".docs/07_test/TEST_REPORT.md";
+const LEGACY_TEST_PLAN_PATH = ".docs/07_test/TEST_PLAN.md";
+const RUNNABLE_ENTRY_EXIT_TERMS = [
+    "runnable entry/exit",
+    "entry/exit",
+    "entry points",
+    "entry point",
+    "可运行入口/出口",
+    "入口/出口",
+    "not applicable"
+];
 const validators = {
     "validate-harness": validateHarness,
     "validate-current": validateCurrent,
@@ -265,7 +317,8 @@ async function validateDev(projectRoot) {
     const root = await harnessRoot(projectRoot);
     const plan = await validatePlanState(projectRoot, false);
     const draftErrors = await validateDevDraftConsumed(projectRoot, root);
-    return { info: [`validate-dev checked ${plan.taskCount} task(s)`], errors: [...plan.errors, ...draftErrors] };
+    const implementationDocErrors = await validateImplementationDocRunnableEntryExit(projectRoot);
+    return { info: [`validate-dev checked ${plan.taskCount} task(s)`], errors: [...plan.errors, ...draftErrors, ...implementationDocErrors] };
 }
 async function validateDevDraftConsumed(projectRoot, root) {
     const errors = [];
@@ -291,23 +344,37 @@ async function validateReview(projectRoot) {
         errors.push("Review report must include findings or risks");
     if (!containsAny(text, ["test gap", "测试缺口", "coverage"]))
         errors.push("Review report must include test gaps or coverage notes");
+    if (!containsAny(text, ["entry/exit", "entrypoint", "入口", "出口", "runnable", "可运行"])) {
+        errors.push("Review report must assess runnable entry/exit readiness before TESTING");
+    }
     if (!containsAny(text, ["pass", "blocked", "通过", "阻塞"]))
         errors.push("Review report must include PASS/BLOCKED decision");
     return { info: ["validate-review checked review report"], errors };
 }
 async function validateTest(projectRoot) {
+    const root = await harnessRoot(projectRoot);
+    const lifecycle = await readYamlObject(path.join(projectRoot, root, "state", "lifecycle.yaml"));
     const plan = await validatePlanState(projectRoot, false);
-    const text = (await readText(path.join(projectRoot, ".docs/07_test/TEST_PLAN.md"))).toLowerCase();
     const errors = [...plan.errors];
+    const report = await readTestReport(projectRoot);
+    const text = report ? report.text.toLowerCase() : "";
+    if (!report)
+        errors.push(`Missing test report: expected ${TEST_REPORT_PATH} or legacy ${LEGACY_TEST_PLAN_PATH}`);
     if (!containsAny(text, ["matrix", "矩阵"]))
-        errors.push("Test plan must include a test matrix");
+        errors.push("Test report must include a test matrix");
     if (!containsAny(text, ["regression", "回归"]))
-        errors.push("Test plan must include regression coverage");
+        errors.push("Test report must include regression evidence");
     if (!containsAny(text, ["coverage gap", "覆盖缺口", "gap"]))
-        errors.push("Test plan must include coverage gaps");
+        errors.push("Test report must include coverage gaps");
+    if (!containsAny(text, ["entry/exit", "entrypoint", "入口", "出口", "runnable", "可运行"])) {
+        errors.push("Test report must state existing runnable entry/exit coverage or blocker status");
+    }
     if (!containsAny(text, ["pass", "blocked", "通过", "阻塞"]))
-        errors.push("Test plan must include PASS/BLOCKED decision");
-    return { info: ["validate-test checked test plan"], errors };
+        errors.push("Test report must include PASS/BLOCKED decision");
+    if (lifecycle.current_phase === "TESTING") {
+        errors.push(...testingBoundaryErrorsForChangedFiles(await changedFiles(projectRoot)));
+    }
+    return { info: [`validate-test checked ${report?.source ?? "missing test report"}`], errors };
 }
 async function validateRelease(projectRoot) {
     const plan = await validatePlanState(projectRoot, false);
@@ -417,6 +484,7 @@ async function validatePlanState(projectRoot, allowOpen) {
             if (!Array.isArray(task.acceptance_criteria) || task.acceptance_criteria.length === 0) {
                 errors.push(`Open task ${task.id} must define acceptance_criteria`);
             }
+            errors.push(...testingBoundaryErrorsForAllowedPaths(task));
         }
         else {
             errors.push(`Completed task ${task.id} must not remain in plan.yaml`);
@@ -564,6 +632,28 @@ async function readYamlObject(filePath) {
         return {};
     return (parseYaml(await readText(filePath)) ?? {});
 }
+async function readTestReport(projectRoot) {
+    const canonical = path.join(projectRoot, TEST_REPORT_PATH);
+    if (await pathExists(canonical)) {
+        return { text: await readText(canonical), source: TEST_REPORT_PATH };
+    }
+    const legacy = path.join(projectRoot, LEGACY_TEST_PLAN_PATH);
+    if (await pathExists(legacy)) {
+        return { text: await readText(legacy), source: LEGACY_TEST_PLAN_PATH };
+    }
+    return undefined;
+}
+async function validateImplementationDocRunnableEntryExit(projectRoot) {
+    const docs = await markdownFiles(path.join(projectRoot, ".docs/04_implementation"));
+    const errors = [];
+    for (const doc of docs) {
+        const text = await readText(doc);
+        if (!containsAny(text, RUNNABLE_ENTRY_EXIT_TERMS)) {
+            errors.push(`Implementation doc must include Runnable Entry/Exit facts or explicit Not applicable: ${repoRelative(projectRoot, doc)}`);
+        }
+    }
+    return errors;
+}
 async function markdownFiles(root) {
     const files = await listFiles(root);
     return files.filter((file) => {
@@ -579,6 +669,47 @@ function containsAny(text, needles) {
     const lowered = text.toLowerCase();
     return needles.some((needle) => lowered.includes(needle.toLowerCase()));
 }
+function testingBoundaryErrorsForAllowedPaths(task) {
+    if (task.phase !== "TESTING")
+        return [];
+    const allowed = Array.isArray(task.allowed_paths) ? task.allowed_paths.map((item) => String(item)) : [];
+    const blocked = allowed.filter((item) => isTestingBoundaryAllowedPath(item));
+    if (blocked.length === 0)
+        return [];
+    return [
+        `TESTING task allowed_paths must not include product runtime, package/deploy config, or long-running runtime paths: ${blocked.join(", ")}`
+    ];
+}
+function testingBoundaryErrorsForChangedFiles(files) {
+    const blocked = files.filter((file) => isTestingRuntimeBoundaryChange(file));
+    if (blocked.length === 0)
+        return [];
+    return [
+        `TESTING changes must use existing product entrypoints only; move runtime, bootstrap, provider, deploy, or package script changes to SPRINTING/RFC: ${blocked.join(", ")}`
+    ];
+}
+function isTestingBoundaryAllowedPath(file) {
+    const lowered = file.replace(/\\/g, "/").toLowerCase();
+    if (["package.json", "package-lock.json", "npm-shrinkwrap.json", "pnpm-lock.yaml", "yarn.lock", "bun.lock", "bun.lockb"].includes(lowered)) {
+        return true;
+    }
+    return matchesAny(lowered, TESTING_DISALLOWED_ALLOWED_PATHS);
+}
+function isTestingRuntimeBoundaryChange(file) {
+    const normalized = file.replace(/\\/g, "/");
+    const lowered = normalized.toLowerCase();
+    if (isTestingBoundaryAllowedPath(lowered) || matchesAny(lowered, TESTING_DISALLOWED_CHANGED_PATHS)) {
+        return true;
+    }
+    if (lowered.startsWith("tests/")) {
+        const name = path.basename(lowered);
+        if (TESTING_ALLOWED_TEST_FILE_TERMS.some((term) => name.includes(term))) {
+            return false;
+        }
+        return TESTING_RUNTIME_FILE_TERMS.some((term) => name.includes(term));
+    }
+    return false;
+}
 function isDevelopmentDraft(task) {
     const taskId = String(task.id ?? "");
     return Boolean(task.implementation_doc) || task.phase === "SPRINTING" || taskId.startsWith("DEV-");
@@ -609,7 +740,7 @@ function taskText(task) {
 }
 export async function changedFiles(projectRoot) {
     try {
-        const { stdout } = await execFileAsync("git", ["status", "--porcelain"], { cwd: projectRoot });
+        const { stdout } = await execFileAsync("git", ["status", "--porcelain", "--untracked-files=all"], { cwd: projectRoot });
         return stdout
             .split("\n")
             .map((line) => line.slice(3).trim())

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "agent-project-sdlc",
-  "version": "0.1.12",
+  "version": "0.1.13",
   "description": "CLI and canonical assets for the AI SDLC Harness workflow.",
   "type": "module",
   "bin": {