project-tiny-context-harness 0.2.74 → 0.2.76

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (33) hide show
  1. package/README.md +48 -42
  2. package/assets/README.md +48 -42
  3. package/assets/README.zh-CN.md +56 -52
  4. package/assets/skills/superpowers-long-task/SKILL.md +586 -471
  5. package/dist/commands/index.js +16 -9
  6. package/dist/commands/superpowers.d.ts +1 -0
  7. package/dist/commands/superpowers.js +89 -0
  8. package/dist/commands/validate.js +6 -0
  9. package/dist/lib/plan-acceptance-artifacts.d.ts +1 -0
  10. package/dist/lib/plan-acceptance-artifacts.js +220 -0
  11. package/dist/lib/plan-acceptance-evidence.d.ts +1 -0
  12. package/dist/lib/plan-acceptance-evidence.js +40 -0
  13. package/dist/lib/plan-acceptance-json.js +4 -0
  14. package/dist/lib/plan-acceptance-validator.js +23 -4
  15. package/dist/lib/superpowers-task-compile.d.ts +1 -0
  16. package/dist/lib/superpowers-task-compile.js +114 -0
  17. package/dist/lib/superpowers-task-derive.d.ts +13 -0
  18. package/dist/lib/superpowers-task-derive.js +192 -0
  19. package/dist/lib/superpowers-task-events.d.ts +1 -0
  20. package/dist/lib/superpowers-task-events.js +13 -0
  21. package/dist/lib/superpowers-task-gates.d.ts +12 -0
  22. package/dist/lib/superpowers-task-gates.js +47 -0
  23. package/dist/lib/superpowers-task-next-slices.d.ts +1 -0
  24. package/dist/lib/superpowers-task-next-slices.js +12 -0
  25. package/dist/lib/superpowers-task-state-schema.d.ts +167 -0
  26. package/dist/lib/superpowers-task-state-schema.js +43 -0
  27. package/dist/lib/superpowers-task-state.d.ts +15 -0
  28. package/dist/lib/superpowers-task-state.js +223 -0
  29. package/dist/lib/superpowers-task-validator.d.ts +4 -0
  30. package/dist/lib/superpowers-task-validator.js +238 -0
  31. package/dist/lib/validators.d.ts +2 -0
  32. package/dist/lib/validators.js +6 -2
  33. package/package.json +69 -69
@@ -2,16 +2,16 @@
2
2
 
3
3
  [English README](README.md)
4
4
 
5
- Project Tiny Context Harness 是给 AI coding agents 用的轻量项目记忆层,也是 repo-native context contract。
6
-
7
- 它不是新的全流程 Tiny Context 框架,也不是任务管理器。它做一件小事:把新会话 agent 最容易丢掉、但又必须长期稳定保留的项目事实,以及 Context / 代码 / 验证证据之间的读取和变更优先级放进仓库里,让下一次聊天、交接、调试或换工具时不用从头重新发现。
5
+ Project Tiny Context Harness 是给 AI coding agents 用的轻量项目记忆层,也是 repo-native context contract。
6
+
7
+ 它不是新的全流程 Tiny Context 框架,也不是任务管理器。它做一件小事:把新会话 agent 最容易丢掉、但又必须长期稳定保留的项目事实,以及 Context / 代码 / 验证证据之间的读取和变更优先级放进仓库里,让下一次聊天、交接、调试或换工具时不用从头重新发现。
8
8
 
9
9
  一句话:
10
10
 
11
11
  ```text
12
- Keep the memory. Drop the ceremony.
13
- 保留项目记忆,丢掉流程仪式感。
14
- 同时保留 Context / 代码 / 验证证据之间的优先级契约。
12
+ Keep the memory. Drop the ceremony.
13
+ 保留项目记忆,丢掉流程仪式感。
14
+ 同时保留 Context / 代码 / 验证证据之间的优先级契约。
15
15
  ```
16
16
 
17
17
  ## 它解决什么问题
@@ -23,10 +23,10 @@ Keep the memory. Drop the ceremony.
23
23
  - 架构边界在哪里
24
24
  - 哪些文件是事实源
25
25
  - 改完以后应该跑什么验证
26
- - 上一次任务留下了哪些长期约束
27
- - Context、实现和验证证据冲突时谁优先
28
-
29
- Project Tiny Context Harness 把这些内容压缩到几个 repo-native 文件里,并通过简单工作流约束 agent 先读 Context、判断是否 context-first、实现后做 drift check:
26
+ - 上一次任务留下了哪些长期约束
27
+ - Context、实现和验证证据冲突时谁优先
28
+
29
+ Project Tiny Context Harness 把这些内容压缩到几个 repo-native 文件里,并通过简单工作流约束 agent 先读 Context、判断是否 context-first、实现后做 drift check:
30
30
 
31
31
  - `AGENTS.md`
32
32
  - `project_context/context.toml`
@@ -46,48 +46,52 @@ Fresh agent 先读这些文件,再开始改代码。
46
46
  - 现代 coding agents 已经内化了很多普通软件工程循环:理解、设计、实现、测试、修复。
47
47
  - 真正值得保留下来的不是“每次任务都走完整流程”,而是“新 agent 能快速恢复项目长期事实”。
48
48
 
49
- 所以当前默认方向是 Minimal Context Harness:只维护高密度、长期有效、能帮助恢复上下文的项目事实。
50
-
51
- 一个典型失败场景是 ABCD 模块链:A/B/C 是上游,D 是下游。现在做 D 的需求时发现能力缺口;如果没有 Context 和优先级约束,agent 很容易为了让 D 完成而去改上游 A/B,因为当前代码让这条路可行。但真正需要判断的是:D 是否有权改 A/B?缺口是不是属于 C 的契约?是否必须先声明 `Context Delta`,让项目意图变化被确认后再实现?代码能说明“现在怎么改得动”,不能说明“项目意图是否允许这样改”。Tiny Context 要补的就是这一层 repo 内长期事实和优先级契约。
52
-
53
- Tiny Context 有两个核心层。Minimal Context 是长期事实源层:说明哪些项目事实写在 `project_context/**` 或 `DESIGN.md`。流程契约 / Workflow Contract 是 agent 行为层:规定先读 Context,让 foundation / contract / decision-rationale / architecture 等原则和契约类 Context 优先解释当前代码便利路径,再判断 `Context Delta`、编译 Task Contract、必要时用 `plan.md` 承载可见执行面、按契约实现,最后做 Contract Conformance 和 Context drift check。
54
-
55
- 对于长程任务,Harness 提供两个显式调用的长程任务 Skill。普通长程任务用 `/normal-long-task`:它把方案和验收输入临时放到 `tmp/ty-context/plan-acceptance/**`,生成或复用完整验收清单,并可输出普通目标模式文本。如果外部规划模型参与,推荐仍然只给两份产物:`《开发方案》` 作为执行方向和 plan traceability source,`《验收清单和测试用例》` 作为 Codex target-mode acceptance input packet。第一份应包含可逐项追踪的 plan item、预期落点 surface、full scope 与 sampled/optional 边界;第二份应包含 AC、required evidence、测试命令、真实产品路径 / core path、证据分层、无效证据、状态机、local audit 和 blocker。Source Pack 只是临时上传材料,不是 durable Context。如果方案里已经有明确、具体的“验收清单”,`/normal-long-task` 会直接复用那份清单并单独写入完整验收清单文件;两份输入包走 strict mode,如果两份内容无法完整解析出 required fields,或第二份缺少 required evidence、verification method、fail condition、状态机、无效证据规则等必要字段,Skill 会停止并列出缺失项,不生成完整验收清单或目标模式文本。
56
-
57
- Superpowers 长程任务 Skill 用 `/superpowers-long-task`。如果下一步明确要 Superpowers 目标模式文本,推荐在三份输入都存在后调用:`Product / Architecture Source`(产品/架构原始意图源)、`Technical Realization Plan`(具体技术实现方案)和 `Acceptance Checklist`(验收清单)。它不做复杂度分流;调用它表示上游已经决定使用 Superpowers 长程执行。它不要求先跑 `/normal-long-task`,但也不会把产品方案现场翻译成技术方案;如果只有产品/架构方案和验收清单,Skill 会用 Missing Fields Report 停止并报告缺少 `Technical Realization Plan`。两份输入兼容只限第一份明确包含产品/架构源和技术实现方案两个章节。`Technical Realization Plan` 必须已经满足 Superpowers-ready Markdown implementation plan 的必填字段;满足时它跳过方案生成,直接绑定 Superpowers 执行,不满足时直接中断并报告缺失字段,不生成 prompt。它显式输出 `Superpowers 输入包` 和执行绑定,让未来 executor 清楚哪些输入进入 parent-level Product Context Delta / Technical Context Delta、slice-level new durable fact check、subagent/inline execution、TDD、`superpowers:verification-before-completion`、local audit、`plan-conformance-matrix.*` `final-acceptance-verdict.*`。这个 prompt 是面向 Superpowers workflow 的 Tiny Context 适配层,对齐官方 Superpowers skills,但不是上游维护的 schema;它不生成技术方案或验收清单、不执行计划、不证明完成,也不会把临时清单、矩阵或 verdict 注册成 `project_context/**`。三输入是上游权威,audit / matrix / verdict / validator / auditor 不能改写它们。完整验收行按外部审计证据处理:proof chain 来自验收清单,fresh evidence 必须满足每个 required layer,存在 material drift、缺 required layer 或未批准 sibling substitution 时不能标 `complete`。Evidence Ledger / proof index 文件可选,但 complete 行必须能直接或通过可选 `evidence_id` 追溯 fresh evidence。Goal mode 表述必须区分 `audit_task_complete`、`acceptance_target_status` 和 `product_goal_complete`:实现/执行目标只在 `product_goal_complete=true` 时完成;只读审计目标可在 `audit_task_complete` 时结束,但 verdict 不是 accepted/complete 时,回复写 `Audit workflow completed; acceptance target not complete.`,不能用未限定的 `Goal achieved` 或 `update_goal(status="complete")` 表示用户验收目标已完成。
58
-
59
- 重要使用提示:Minimal Context 有意把 Context 读取顺序、Context / 代码优先级和漂移检查保持为 agent 级软约束,而不是机器强制 edit-order gate。这个取舍适合短任务,但长任务、大上下文、多次交接或多轮验证时预期会漂移。普通 checklist 准备需要 `/normal-long-task`;已有产品/架构原始意图源、具体技术实现方案和验收清单且需要 Superpowers 时,可直接用 `/superpowers-long-task`。`Product Context Delta` 判断产品逻辑、页面职责、信息架构和验收语义是否需要写入 Context;`Technical Context Delta` 判断 API/schema、模块边界、runtime/state、验证/部署路径和稳定技术取舍是否需要写入 Context。`plan-conformance-matrix.*` 是执行期“对图纸台账”,`final-acceptance-verdict.*` 是最后逐 AC 验收报告,local audit 只是临时进度/恢复状态,不能裁判完成;审计流程完成也不等于被验收目标完成。使用目标模式执行方案时,目标结束条件对齐 `product_goal_complete=true`,只读审计目标才可把 `audit_task_complete` 当元任务结束。最终顺序是 self-evidence -> matrix -> verdict -> validator -> read-only auditor;若审计后修改 artifact/evidence,需重跑 validator。`validate-plan-contract` 和 `validate-plan-acceptance` 只检查临时 artifact 自洽、引用存在、弱证据 complete 行、缺 required proof layermaterial/critical drift、sibling substitution 和已声明的 surface/architecture binding 一致性,不证明产品质量。有 subagent 能力时,Superpowers 目标提示会把 subagent 作为只读 auditor 加在主 agent 自证和 validator 之后;auditor 负责找 gap,不是 proof source
60
-
61
- ## 当前最佳实践
62
-
63
- 短程任务直接使用流程契约和 Context 层:
64
-
65
- ```text
66
- 流程契约 + project_context/** -> 实现 -> 验证 -> drift check
67
- ```
68
-
69
- 长程任务先外化目标,再进入实现:
70
-
71
- ```text
72
- Web GPT 或其他外部规划模型产出长任务源输入
73
- -> /normal-long-task 生成完整验收清单和可选普通目标模式文本
74
- -> 需要 Superpowers 专用目标模式文本时,/superpowers-long-task 消费 Product / Architecture Source + Technical Realization Plan + Acceptance Checklist
75
- -> Superpowers 得出具体落地执行片段
76
- -> 执行中维护 plan-conformance-matrix,最后生成 final-acceptance-verdict
77
- -> 每个执行片段都回到流程契约 + project_context/**
78
- ```
79
-
80
- 这里的 Superpowers 指具体的 [obra/Superpowers](https://github.com/obra/superpowers) 插件/开源工作流,不是泛化的执行规划替代品。`/superpowers-long-task` 接受输入包后,有 subagent 支持时优先用 `superpowers:subagent-driven-development`,否则用 `superpowers:executing-plans`;涉及行为变更时用 `superpowers:test-driven-development`;完成声明前用 `superpowers:verification-before-completion` 同时检查 plan-conformance matrix final acceptance verdict,然后运行 `ty-context validate-plan-acceptance <dir>`。
81
-
82
- 原因是漂移控制。流程契约 + Context 层是软约束,短任务里通常能让 agent 按预期执行;长程任务里,Context 仍然能记录符合预期的事实,但 Context 到代码 的实现步骤会随着上下文窗口变大、多次交接、subagent 拆分和多轮验证而漂移。产品/架构原始意图源、具体技术实现方案、验收清单、显式长程任务 Skill 调用、目标模式文本、plan-conformance matrix、final acceptance verdict 和可选 Superpowers 执行层,把“产品/技术 Context 有没有先对齐”“有没有按图纸实现”和“有没有按验收证据完成”都外化成可恢复、可审计的临时执行标准,同时不恢复阶段式 gate。
83
-
84
- 对于高风险产品方案、架构方案、技术方案或验收方案输入,流程契约应先在 `plan.md` 或等价临时计划面里可见化,再进入实现。这个计划面把 Source-to-Context Coverage Context-to-Implementation Binding 分开:前者把每条长期 source 约束映射到 existing Context hit、Context action、owning Context coverage status;后者把 Context fact 映射到 implementation obligation、expected surfaces、implemented paths、forbidden shortcuts、verification path binding status。Source coverage 仍有 `under_scoped` 或未处理的 `new_context_required` 时不能声称按方案完整实现;binding 仍有 `partial`、`missing`、`blocked`、`needs_user_decision` 或 `contradicted_by_current_state` 时不能声称按 Context 完整落地。
85
-
86
- small code task 不应该套完整 `plan.md` / trace 表。这里的 small 按语义风险判断,不按代码行数判断:现有 Context 已足够,且不改变 durable product、architecture、API/schema/data、runtime/state/recoveryverification/deployment、security/redaction surface ownership 事实,才算 small。一个一行 schema 改动也可能不是 small;大范围机械样式清理反而可能仍是 small
87
-
88
- ## 适合谁
89
-
90
- 适合:
49
+ 所以当前默认方向是 Minimal Context Harness:只维护高密度、长期有效、能帮助恢复上下文的项目事实。
50
+
51
+ 一个典型失败场景是 ABCD 模块链:A/B/C 是上游,D 是下游。现在做 D 的需求时发现能力缺口;如果没有 Context 和优先级约束,agent 很容易为了让 D 完成而去改上游 A/B,因为当前代码让这条路可行。但真正需要判断的是:D 是否有权改 A/B?缺口是不是属于 C 的契约?是否必须先声明 `Context Delta`,让项目意图变化被确认后再实现?代码能说明“现在怎么改得动”,不能说明“项目意图是否允许这样改”。Tiny Context 要补的就是这一层 repo 内长期事实和优先级契约。
52
+
53
+ Tiny Context 有两个核心层。Minimal Context 是长期事实源层:说明哪些项目事实写在 `project_context/**` 或 `DESIGN.md`。流程契约 / Workflow Contract 是 agent 行为层:规定先读 Context,让 foundation / contract / decision-rationale / architecture 等原则和契约类 Context 优先解释当前代码便利路径,再判断 `Context Delta`、编译 Task Contract、必要时用 `plan.md` 承载可见执行面、按契约实现,最后做 Contract Conformance 和 Context drift check。
54
+
55
+ 对于长程任务,Harness 提供两个显式调用的长程任务 Skill。普通长程任务用 `/normal-long-task`:它把方案和验收输入临时放到 `tmp/ty-context/plan-acceptance/**`,生成或复用完整验收清单,并可输出普通目标模式文本。如果外部规划模型参与,推荐仍然只给两份产物:`《开发方案》` 作为执行方向和 plan traceability source,`《验收清单和测试用例》` 作为 Codex target-mode acceptance input packet。第一份应包含可逐项追踪的 plan item、预期落点 surface、full scope 与 sampled/optional 边界;第二份应包含 AC、required evidence、测试命令、真实产品路径 / core path、证据分层、无效证据、状态机、local audit 和 blocker。Source Pack 只是临时上传材料,不是 durable Context。如果方案里已经有明确、具体的“验收清单”,`/normal-long-task` 会直接复用那份清单并单独写入完整验收清单文件;两份输入包走 strict mode,如果两份内容无法完整解析出 required fields,或第二份缺少 required evidence、verification method、fail condition、状态机、无效证据规则等必要字段,Skill 会停止并列出缺失项,不生成完整验收清单或目标模式文本。
56
+
57
+ Superpowers 长程任务 Skill 用 `/superpowers-long-task`。如果下一步明确要 Superpowers 目标模式文本,推荐在三份输入都存在后调用:`Product / Architecture Source`(产品/架构原始意图源)、`Technical Realization Plan`(具体技术实现方案)和 `Acceptance Checklist`(验收清单)。它不做复杂度分流;调用它表示上游已经决定使用 Superpowers 长程执行。它不要求先跑 `/normal-long-task`,但也不会把产品方案现场翻译成技术方案;如果只有产品/架构方案和验收清单,Skill 会用 Missing Fields Report 停止并报告缺少 `Technical Realization Plan`。两份输入兼容只限第一份明确包含产品/架构源和技术实现方案两个章节。`Technical Realization Plan` 必须已经满足 Superpowers-ready Markdown implementation plan 的必填字段;满足时它跳过方案生成,直接绑定 Superpowers 执行,不满足时直接中断并报告缺失字段,不生成 prompt。它显式输出 `Superpowers 输入包` 和执行绑定,让未来 executor 清楚哪些输入进入 parent-level Product Context Delta / Technical Context Delta、slice-level new durable fact check、subagent/inline execution、TDD、`superpowers:verification-before-completion`、canonical `task-state.json`、append-only `events.ndjson`、generated `derived/**` views、proof-chain evidence 和 optional auditor review。这个 prompt 是面向 Superpowers workflow 的 Tiny Context 适配层,对齐官方 Superpowers skills,但不是上游维护的 schema;它可以在 Superpowers 外层增加 Tiny Context 的权威、对图纸和验收门禁,但不能重新定义、重复或分叉 Superpowers 执行机制。如果未来改动让 Tiny Context 新增步骤和官方 Superpowers 职责冲突、重复或覆盖,应停止修改并提示边界冲突,不要静默合并两套流程。它不生成技术方案或验收清单、不执行计划、不证明完成,也不会把临时 state、derived views 或 verdict 注册成 `project_context/**`。三输入是上游权威,state / derived views / validator / auditor 不能改写它们。`task-state.json` 是唯一执行状态源,`events.ndjson` 追加记录状态变更,`derived/**` 只生成 local audit、plan-conformance matrix、final acceptance verdict、progress ledger、evidence index、context alignment 和 final summary 等阅读视图。完整验收行按外部审计证据处理:proof chain 来自验收清单,fresh evidence 必须通过 `task-state.evidence[]` 满足每个 required layer,存在 material drift、缺 required layer 或未批准 sibling substitution 时不能标 `complete`。Goal mode 表述必须区分 `audit_task_complete`、`acceptance_target_status` 和 computed `product_goal_complete`:实现/执行目标只在 `ty-context superpowers final-gate` 计算出 `product_goal_complete=true` 时完成;只读审计目标可在 `audit_task_complete` 时结束,但 verdict 不是 accepted/complete 时,回复写 `Audit workflow completed; acceptance target not complete.`,不能用未限定的 `Goal achieved` 或 `update_goal(status="complete")` 表示用户验收目标已完成。
58
+
59
+ 对于非平凡 slice,生成的 Superpowers prompt 要求使用结构化 `slice-delta.json`。executor 通过 `ty-context superpowers apply-slice-delta <workdir> <slice-delta.json>` 应用 delta,然后运行 `ty-context superpowers derive` `ty-context superpowers slice-gate`。每个 delta 记录 touched plan items / ACs、code changes、closed / remaining proof layers、blockers、cleanup assertions、`progress_value`,以及带有 `proves`、`does_not_prove`、freshness、redaction reviewability canonical evidence records。默认 slice 策略是把同一 AC、runtime 场景、proof 环境或验证路径下的 2-4 个强相关 missing layers 合并处理;单 gap slice 只留给 blockercontradiction 或小型 metadata cleanup。prompt 还会要求先分类 missing layer、复用 DB/API/Browser 环境时使用唯一 proof prefix cleanup assertion,并在生成 derived artifacts 后做 stale/overclaim scan
60
+
61
+ 生成的 Superpowers prompt 使用 Slice Gate / Epoch Gate / Final Gate 分层节奏,而不是每个 slice 后都跑完整 final gate。Progress Accounting 在 state 和 generated `derived/progress-ledger.*` 中记录 AC acceptance completion、engineering implementation progress、runtime/proof progress、artifact budget 和 workflow overhead。每个 slice 需要声明 artifact budget、proof-layer milestone 状态和 cleanup expectation。workflow overhead backpressure 要求 executor 批处理共享的 provider/browser/runtime/security epoch proof environment,清理 stale artifact,并选择 Next 3-5 high-value clusters 来优先关闭最多阻塞 AC / proof-layer gap。
62
+
63
+ 重要使用提示:Minimal Context 有意把 Context 读取顺序、Context / 代码优先级和漂移检查保持为 agent 级软约束,而不是机器强制 edit-order gate。这个取舍适合短任务,但长任务、大上下文、多次交接或多轮验证时预期会漂移。单靠 Superpowers 在这类压力下仍可能漂移:它能增强执行纪律,但本身不负责保留上游 source authority、防止 scope shrinkage、证明完整符合 Technical Realization Plan,或按 Acceptance Checklist 逐 AC 强制证据成立。普通 checklist 准备需要 `/normal-long-task`;已有产品/架构原始意图源、具体技术实现方案和验收清单且需要 Superpowers 时,可直接用 `/superpowers-long-task`。`Product Context Delta` 判断产品逻辑、页面职责、信息架构和验收语义是否需要写入 Context;`Technical Context Delta` 判断 API/schema、模块边界、runtime/state、验证/部署路径和稳定技术取舍是否需要写入 Context。`task-state.json` 是唯一执行状态源,`events.ndjson` 追加记录状态变化,`derived/**` 是生成阅读视图,`task-state.evidence[]` 是 canonical evidence ledger;local audit 只是 generated progress/recovery view,不能裁判完成;审计流程完成也不等于被验收目标完成。使用目标模式执行方案时,目标结束条件对齐 computed `product_goal_complete=true`,只读审计目标才可把 `audit_task_complete` 当元任务结束。最终顺序是 derive all views -> verification-before-completion -> `validate-superpowers-state` -> state-backed `validate-plan-acceptance` -> read-only auditor -> stale/overclaim scan -> `ty-context superpowers final-gate` 计算 completion;若审计后修改 state/evidence,需 rederive 并重跑两个 validator。`validate-plan-contract`、`validate-superpowers-state` 和 `validate-plan-acceptance` 只检查临时 artifact/state 自洽、引用存在、弱证据 complete 行、缺 required proof layer、material/critical drift、sibling substitution 和已声明的 surface/architecture binding 一致性,不证明产品质量。有 subagent 能力时,Superpowers 目标提示会把 subagent 作为只读 auditor 加在主 agent 自证和 validator 之后;auditor 用固定 auditor checklist 找 gap,不是 proof source。Superpowers review 和 verification 仍然有价值,但不能覆盖 Tiny Context gates;通过 Superpowers review 不等于证明 plan conformance 或 checklist acceptance。
64
+
65
+ ## 当前最佳实践
66
+
67
+ 短程任务直接使用流程契约和 Context 层:
68
+
69
+ ```text
70
+ 流程契约 + project_context/** -> 实现 -> 验证 -> drift check
71
+ ```
72
+
73
+ 长程任务先外化目标,再进入实现:
74
+
75
+ ```text
76
+ Web GPT 或其他外部规划模型产出长任务源输入
77
+ -> /normal-long-task 生成完整验收清单和可选普通目标模式文本
78
+ -> 需要 Superpowers 专用目标模式文本时,/superpowers-long-task 消费 Product / Architecture Source + Technical Realization Plan + Acceptance Checklist
79
+ -> Superpowers 得出具体落地执行片段
80
+ -> 执行中维护 plan-conformance-matrix,最后生成 final-acceptance-verdict
81
+ -> 每个执行片段都回到流程契约 + project_context/**
82
+ ```
83
+
84
+ 这里的 Superpowers 指具体的 [obra/Superpowers](https://github.com/obra/superpowers) 插件/开源工作流,不是泛化的执行规划替代品。`/superpowers-long-task` 接受输入包后,有 subagent 支持时优先用 `superpowers:subagent-driven-development`,否则用 `superpowers:executing-plans`;涉及行为变更时用 `superpowers:test-driven-development`;完成声明前先 derive all views,再用 `superpowers:verification-before-completion`、`ty-context validate-superpowers-state <dir>`、`ty-context validate-plan-acceptance <dir>`read-only auditor 检查,最后由 `ty-context superpowers final-gate <dir>` 计算 `product_goal_complete`。
85
+
86
+ 原因是漂移控制。流程契约 + Context 层是软约束,短任务里通常能让 agent 按预期执行;长程任务里,Context 仍然能记录符合预期的事实,但 Context 到代码 的实现步骤会随着上下文窗口变大、多次交接、subagent 拆分和多轮验证而漂移。单靠 Superpowers 也仍可能在复杂长程执行压力下漂移:它增强执行纪律,但不天然保留 source authority、防止 scope shrinkage、证明完整符合 Technical Realization Plan,或按 Acceptance Checklist 逐 AC 强制证据成立。产品/架构原始意图源、具体技术实现方案、验收清单、显式长程任务 Skill 调用、目标模式文本、canonical task state、generated derived views 和可选 Superpowers 执行层,把“产品/技术 Context 有没有先对齐”“有没有按图纸实现”和“有没有按验收证据完成”都外化成可恢复、可审计的临时执行标准,同时不恢复阶段式 gate
87
+
88
+ 对于高风险产品方案、架构方案、技术方案或验收方案输入,流程契约应先在 `plan.md` 或等价临时计划面里可见化,再进入实现。这个计划面把 Source-to-Context Coverage 和 Context-to-Implementation Binding 分开:前者把每条长期 source 约束映射到 existing Context hit、Context action、owning Context 和 coverage status;后者把 Context fact 映射到 implementation obligation、expected surfaces、implemented paths、forbidden shortcuts、verification path 和 binding status。Source coverage 仍有 `under_scoped` 或未处理的 `new_context_required` 时不能声称按方案完整实现;binding 仍有 `partial`、`missing`、`blocked`、`needs_user_decision` 或 `contradicted_by_current_state` 时不能声称按 Context 完整落地。
89
+
90
+ small code task 不应该套完整 `plan.md` / trace 表。这里的 small 按语义风险判断,不按代码行数判断:现有 Context 已足够,且不改变 durable product、architecture、API/schema/data、runtime/state/recovery、verification/deployment、security/redaction 或 surface ownership 事实,才算 small。一个一行 schema 改动也可能不是 small;大范围机械样式清理反而可能仍是 small。
91
+
92
+ ## 适合谁
93
+
94
+ 适合:
91
95
 
92
96
  - 经常用 Codex、Claude Code、Cursor、Gemini CLI、OpenCode 等 agent 改代码的项目。
93
97
  - 经常开新 chat,agent 反复重新理解项目的项目。