code-yangzz 1.0.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (108) hide show
  1. package/README.md +102 -0
  2. package/agents/meta-artisan.md +164 -0
  3. package/agents/meta-conductor.md +482 -0
  4. package/agents/meta-genesis.md +165 -0
  5. package/agents/meta-librarian.md +213 -0
  6. package/agents/meta-prism.md +268 -0
  7. package/agents/meta-scout.md +173 -0
  8. package/agents/meta-sentinel.md +161 -0
  9. package/agents/meta-warden.md +304 -0
  10. package/bin/install.js +390 -0
  11. package/bin/lib/utils.js +72 -0
  12. package/bin/lib/watermark.js +176 -0
  13. package/config/CLAUDE.md +363 -0
  14. package/config/settings.json +120 -0
  15. package/hooks/block-dangerous-bash.mjs +36 -0
  16. package/hooks/post-console-log-warn.mjs +27 -0
  17. package/hooks/post-format.mjs +24 -0
  18. package/hooks/post-typecheck.mjs +27 -0
  19. package/hooks/pre-git-push-confirm.mjs +19 -0
  20. package/hooks/stop-completion-guard.mjs +159 -0
  21. package/hooks/stop-console-log-audit.mjs +44 -0
  22. package/hooks/subagent-context.mjs +27 -0
  23. package/hooks/user-prompt-submit.js +233 -0
  24. package/package.json +36 -0
  25. package/prompt-optimizer/prompt-optimizer-meta.md +159 -0
  26. package/skills/agent-teams/SKILL.md +215 -0
  27. package/skills/domains/ai/SKILL.md +34 -0
  28. package/skills/domains/ai/agent-dev.md +242 -0
  29. package/skills/domains/ai/llm-security.md +288 -0
  30. package/skills/domains/ai/prompt-and-eval.md +279 -0
  31. package/skills/domains/ai/rag-system.md +542 -0
  32. package/skills/domains/architecture/SKILL.md +42 -0
  33. package/skills/domains/architecture/api-design.md +225 -0
  34. package/skills/domains/architecture/caching.md +298 -0
  35. package/skills/domains/architecture/cloud-native.md +285 -0
  36. package/skills/domains/architecture/message-queue.md +328 -0
  37. package/skills/domains/architecture/security-arch.md +297 -0
  38. package/skills/domains/data-engineering/SKILL.md +207 -0
  39. package/skills/domains/development/SKILL.md +46 -0
  40. package/skills/domains/development/cpp.md +246 -0
  41. package/skills/domains/development/go.md +323 -0
  42. package/skills/domains/development/java.md +277 -0
  43. package/skills/domains/development/python.md +288 -0
  44. package/skills/domains/development/rust.md +313 -0
  45. package/skills/domains/development/shell.md +313 -0
  46. package/skills/domains/development/typescript.md +277 -0
  47. package/skills/domains/devops/SKILL.md +39 -0
  48. package/skills/domains/devops/cost-optimization.md +271 -0
  49. package/skills/domains/devops/database.md +217 -0
  50. package/skills/domains/devops/devsecops.md +198 -0
  51. package/skills/domains/devops/git-workflow.md +181 -0
  52. package/skills/domains/devops/observability.md +279 -0
  53. package/skills/domains/devops/performance.md +335 -0
  54. package/skills/domains/devops/testing.md +283 -0
  55. package/skills/domains/frontend-design/SKILL.md +38 -0
  56. package/skills/domains/frontend-design/agents/openai.yaml +4 -0
  57. package/skills/domains/frontend-design/claymorphism/SKILL.md +119 -0
  58. package/skills/domains/frontend-design/claymorphism/references/tokens.css +52 -0
  59. package/skills/domains/frontend-design/component-patterns.md +202 -0
  60. package/skills/domains/frontend-design/engineering.md +287 -0
  61. package/skills/domains/frontend-design/glassmorphism/SKILL.md +140 -0
  62. package/skills/domains/frontend-design/glassmorphism/references/tokens.css +32 -0
  63. package/skills/domains/frontend-design/liquid-glass/SKILL.md +137 -0
  64. package/skills/domains/frontend-design/liquid-glass/references/tokens.css +81 -0
  65. package/skills/domains/frontend-design/neubrutalism/SKILL.md +143 -0
  66. package/skills/domains/frontend-design/neubrutalism/references/tokens.css +44 -0
  67. package/skills/domains/frontend-design/state-management.md +680 -0
  68. package/skills/domains/frontend-design/ui-aesthetics.md +110 -0
  69. package/skills/domains/frontend-design/ux-principles.md +156 -0
  70. package/skills/domains/infrastructure/SKILL.md +200 -0
  71. package/skills/domains/mobile/SKILL.md +224 -0
  72. package/skills/domains/orchestration/SKILL.md +29 -0
  73. package/skills/domains/orchestration/multi-agent.md +263 -0
  74. package/skills/domains/security/SKILL.md +72 -0
  75. package/skills/domains/security/blue-team.md +436 -0
  76. package/skills/domains/security/code-audit.md +265 -0
  77. package/skills/domains/security/pentest.md +226 -0
  78. package/skills/domains/security/red-team.md +374 -0
  79. package/skills/domains/security/threat-intel.md +372 -0
  80. package/skills/domains/security/vuln-research.md +369 -0
  81. package/skills/meta-theory/SKILL.md +878 -0
  82. package/skills/meta-theory/references/create-agent.md +248 -0
  83. package/skills/meta-theory/references/dev-governance.md +1108 -0
  84. package/skills/meta-theory/references/intent-amplification.md +190 -0
  85. package/skills/meta-theory/references/meta-theory.md +346 -0
  86. package/skills/meta-theory/references/rhythm-orchestration.md +257 -0
  87. package/skills/meta-theory/references/ten-step-governance.md +285 -0
  88. package/skills/orchestration/multi-agent/SKILL.md +493 -0
  89. package/skills/run_skill.js +128 -0
  90. package/skills/tools/gen-docs/SKILL.md +115 -0
  91. package/skills/tools/gen-docs/agents/openai.yaml +4 -0
  92. package/skills/tools/gen-docs/scripts/doc_generator.js +435 -0
  93. package/skills/tools/lib/shared.js +98 -0
  94. package/skills/tools/override-refusal/SKILL.md +55 -0
  95. package/skills/tools/override-refusal/agents/openai.yaml +4 -0
  96. package/skills/tools/override-refusal/scripts/refusal_rewriter.js +229 -0
  97. package/skills/tools/verify-change/SKILL.md +139 -0
  98. package/skills/tools/verify-change/agents/openai.yaml +4 -0
  99. package/skills/tools/verify-change/scripts/change_analyzer.js +289 -0
  100. package/skills/tools/verify-module/SKILL.md +126 -0
  101. package/skills/tools/verify-module/agents/openai.yaml +4 -0
  102. package/skills/tools/verify-module/scripts/module_scanner.js +171 -0
  103. package/skills/tools/verify-quality/SKILL.md +159 -0
  104. package/skills/tools/verify-quality/agents/openai.yaml +4 -0
  105. package/skills/tools/verify-quality/scripts/quality_checker.js +337 -0
  106. package/skills/tools/verify-security/SKILL.md +142 -0
  107. package/skills/tools/verify-security/agents/openai.yaml +4 -0
  108. package/skills/tools/verify-security/scripts/security_scanner.js +283 -0
@@ -0,0 +1,257 @@
1
+ # 节奏编排 — 完整参考
2
+
3
+ > 来源:meta.md 第七、八部分(第648-896行),老金直播口播提炼
4
+
5
+ ## 核心命题
6
+
7
+ **成熟系统不只是会拆、会组、会治理,还得会出牌。**
8
+
9
+ 编排不只是流程编排(谁先谁后),还包括节奏编排(什么时候给什么、什么时候不给)。
10
+
11
+ ---
12
+
13
+ ## 注意力成本模型
14
+
15
+ ### 第一定律:出牌有成本
16
+
17
+ > **告诉用户某件事,是有成本的。**
18
+
19
+ | 场景 | 成本 |
20
+ |------|------|
21
+ | 给用户一条建议 | 占用用户注意力带宽 |
22
+ | 给系统加一个待办 | 与其他待办竞争优先级 |
23
+ | 给Agent多塞一个目标 | 稀释当前任务的聚焦度 |
24
+ | 给用户多推一个任务 | 增加用户的认知负荷 |
25
+
26
+ 每多说一件事,它就和前面那些事形成竞争。用户/组织/系统的注意力、带宽、吞吐都是有限的。
27
+
28
+ ### 第二定律:时机决定价值
29
+
30
+ > **成熟系统不是知道的都说,而是知道什么时候说最值钱。**
31
+
32
+ 同一条信息在不同时机推送,价值天差地别:
33
+ - 用户正在专注执行时推安全警告 → 高价值(可以防止事故)
34
+ - 用户正在消化上一轮结果时推新任务 → 低价值(信息过载)
35
+ - 用户刚完成一轮工作时推进化建议 → 中等价值(有余力吸收)
36
+
37
+ ### 第三定律:沉默也是设计
38
+
39
+ > **什么都不做,不一定是系统失效。什么都不做,可能恰恰是最优动作。**
40
+
41
+ ---
42
+
43
+ ## 事件牌组机制
44
+
45
+ ### 设计哲学
46
+
47
+ 来自开放世界任务设计的启发:**表面给玩家自由,底层保留一套隐藏的节奏骨架。**
48
+
49
+ 用户感觉自由,最优交付顺序是设计过的。系统通过不同触点,把当前最该出现的内容送到用户面前。
50
+
51
+ ### 牌的数据结构
52
+
53
+ 每张牌包含以下属性:
54
+
55
+ ```yaml
56
+ card:
57
+ id: string # 唯一标识(如 "guide-01")
58
+ type: enum # 澄清/范围收缩/方案/执行/校验/修复/回滚/风险/建议/留白
59
+ priority: 1-10 # 默认优先级(10最高)
60
+ cost: low|mid|high # 注意力成本等级
61
+ precondition: string # 出牌前提(如 "需求已明确")
62
+ skip_condition: string # 跳过条件(如 "用户已知该信息")
63
+ interrupt_trigger: string # 被插队的触发条件
64
+ delivery_shell: string # 交付壳类型(详见意图放大)
65
+ max_iterations: number # 迭代牌专用:最大循环次数(默认3)
66
+ ```
67
+
68
+ ### 十种牌的完整定义(对齐 `docs/meta.md` 原始设计)
69
+
70
+ | 牌 | 原始设计名称 | 触发条件 | 动作 | 注意力成本 | 设计哲学 |
71
+ |----|-----------|---------|------|-----------|---------|
72
+ | **澄清牌** | 澄清 | 需求模糊 | 追问≤2轮,明确要改什么 | low | 信息不足时先收集再行动 |
73
+ | **范围收缩牌** | 范围收缩 | 仓库太大/文件太多/同名冲突 | 先把边界缩小到可处理范围 | low | 环境复杂度变高时继续冲会误改 |
74
+ | **方案牌** | 方案 | 需求清晰但有多条路径 | 把路线摆出来,好处/代价/该选哪条 | mid | 复杂问题不能一口吞,先给路线再动手 |
75
+ | **执行牌** | 执行 | 规划完成,风险可控 | 分配到具体元,真正动代码 | high | 有计划才执行 |
76
+ | **校验牌** | 校验 | 执行完成 | 编译/类型/依赖/需求对齐 | mid | 第一次做出来不等于做对 |
77
+ | **修复牌** | 修复 | 校验不通过 | 重新修正,不要装作已完成 | mid | 修到过为止,设上限防死循环 |
78
+ | **回滚牌** | 回滚 | 风险超预期或影响范围扩大 | 退回到上一个稳定状态 | high | 不要硬顶,能退回来才是成熟系统 |
79
+ | **风险牌** | 风险 | 牵扯公共组件/鉴权/全局逻辑/多人协作 | 把风险抬到台面上,必要时插队 | high | 关键状态落后于预期,安全/权限/全局影响优先 |
80
+ | **建议牌** | 建议 | 系统发现用户卡住但不需要太重打断 | 给一个更低成本的下一步推进动作 | low | 非紧急,但值得给一个方向 |
81
+ | **留白牌** | 留白 | 连续完成/需消化/≥3连续高成本牌 | 暂停推送,给简短状态总结 | zero | 空白也是被设计的体验,什么都不做可能是最优动作 |
82
+
83
+ ### 发牌规则
84
+
85
+ 5条核心规则,按优先级排序:
86
+
87
+ 1. **默认按 priority 出牌**(理想顺序)
88
+ 2. **每出一张评估下一张的 skip_condition** — 满足则跳过
89
+ 3. **连续 ≥3 张 high 成本牌后,强制插入留白牌** — 防过载
90
+ 4. **interrupt_trigger 满足时,被触发的牌跳到队首** — 紧急优先
91
+ 5. **迭代牌最多循环 max_iterations 次,超出上报 Warden** — 防死循环
92
+
93
+ ### 发牌决策流程
94
+
95
+ ```
96
+ [当前牌出完]
97
+
98
+ 检查下一张牌的 skip_condition
99
+ ├─ 满足 → 跳过,继续检查下一张
100
+ └─ 不满足 → 检查 interrupt_trigger 队列
101
+ ├─ 有插队牌 → 插队牌提到队首
102
+ └─ 无插队 → 检查留白条件
103
+ ├─ 连续 ≥3 high → 强制留白
104
+ └─ 不需要留白 → 正常出牌
105
+ ```
106
+
107
+ ---
108
+
109
+ ## 七大启发(从开放世界任务设计到AI系统)
110
+
111
+ ### 启发1:表面自由,底层有理想顺序
112
+
113
+ 编排元不只决定"谁先谁后",还要决定:什么时候给什么、什么时候不给、什么内容先给、什么内容晚给、什么状态下要插队、什么状态下该跳过。
114
+
115
+ **应用**:编排元从单纯任务调度升级为节奏控制器。
116
+
117
+ ### 启发2:发牌接口
118
+
119
+ NPC、悬赏板、露营点不是内容本体,它们是内容投递接口。
120
+
121
+ **应用**:AI系统中的聊天框、通知、日报、面板、Agent回复都是发牌员。不是所有元都负责生成内容,有些元的职责是交付内容。
122
+
123
+ 发牌接口选择:
124
+
125
+ | 交付通道 | 适用场景 | 注意力占用 |
126
+ |---------|---------|-----------|
127
+ | 直接对话回复 | 用户正在交互、需要即时反馈 | high |
128
+ | 写入文件 | 产出较大、需要持久化、用户稍后查看 | low |
129
+ | spawn子代理 | 需要专业元独立完成的工作 | mid |
130
+ | 等待用户操作 | 需要用户确认/输入/决策 | zero(等待中) |
131
+ | 通知/摘要 | 后台完成的工作、状态更新 | low |
132
+
133
+ ### 启发3:留白机制
134
+
135
+ 留白不负责推进,它负责:降噪、降打扰、防过载、给用户留出消化空间、让探索感有机会发生。
136
+
137
+ **触发条件**:
138
+ - 连续 ≥3 轮高密度推送
139
+ - 用户未响应上一轮输出
140
+ - 当前信息密度已超过可消化阈值
141
+
142
+ **留白时的行为**:
143
+ - 不推送新任务
144
+ - 给简短状态总结("当前进度:X/Y 完成")
145
+ - 等待用户主动发起下一步
146
+
147
+ ### 启发4:出牌成本意识
148
+
149
+ 每条推送都和已有推送竞争注意力。
150
+
151
+ **实践规则**:
152
+ - 推送前自问:这条信息现在说,比 5 分钟后说更值钱吗?
153
+ - 如果答案是否,不推
154
+ - 如果答案不确定,降级为写入文件(低成本通道)
155
+
156
+ ### 启发5:跳过机制
157
+
158
+ 跳过不是偷懒,是注意力管理。
159
+
160
+ **跳过条件设计**:
161
+ - 用户已知同类信息 → 跳过
162
+ - 当前上下文已包含该信息 → 跳过
163
+ - 注意力预算不足(连续高密度后)→ 跳过或降级
164
+
165
+ ### 启发6:紧急治理机制
166
+
167
+ 某些元可以越过默认节奏直接顶上来。
168
+
169
+ **触发信号**:
170
+
171
+ | 信号源 | 信号 | 插队牌类型 |
172
+ |--------|------|-----------|
173
+ | Sentinel | 安全漏洞/权限问题 | 安全插队 — 最高优先级 |
174
+ | Prism | pass_rate < 0.5 的严重质量漂移 | 质量插队 |
175
+ | 用户 | 明确说"紧急"/"马上" | 用户插队 |
176
+ | 系统 | 资源不足/超时/错误 | 系统插队 |
177
+
178
+ **Sentinel → Conductor 信号通道**:
179
+ - Sentinel 检测到安全问题 → 发送 `{type: "interrupt", source: "sentinel", severity: "critical", detail: "..."}`
180
+ - Conductor 收到后暂停当前牌组,创建安全插队牌并提到队首
181
+
182
+ **Prism → Conductor 信号通道**:
183
+ - Prism 检测到质量漂移 → 发送 `{type: "interrupt", source: "prism", severity: "high", detail: "..."}`
184
+ - Conductor 收到后评估:severity=critical 立即插队,severity=high 下一张牌前插入
185
+
186
+ ### 启发7:同一意图多种交付壳
187
+
188
+ 底层核不变,外层壳按场景换。
189
+
190
+ **应用**:与意图放大直接对接。每张牌出牌时,除了决定"出什么",还要决定"用什么壳交付"。
191
+
192
+ ---
193
+
194
+ ## 节奏编排与其他主线的关系
195
+
196
+ ```
197
+ 元(拆)
198
+ ↓ 提供:独立的可调度单位
199
+ 组织镜像(组)
200
+ ↓ 提供:层级结构和协作关系
201
+ 节奏编排(发) ← 本层
202
+ ↓ 提供:有节奏的出牌策略
203
+ 意图放大(成)
204
+ ↓ 消费:节奏控制下的结构化产出
205
+ ```
206
+
207
+ ### 与 Conductor 的关系
208
+
209
+ Conductor 是节奏编排的**执行者**,本文档是节奏编排的**方法论**。
210
+
211
+ Conductor 的具体实现(牌组数据结构、发牌函数、留白/插队逻辑)详见 `.claude/agents/meta-conductor.md`。
212
+
213
+ ### 与 Warden 的关系
214
+
215
+ Warden 是留白和插队的**决策升级点**:
216
+ - 迭代牌超过 max_iterations → 上报 Warden 决策
217
+ - 多个插队牌冲突 → Warden 裁定优先级
218
+
219
+ ### 与 Sentinel/Prism 的关系
220
+
221
+ Sentinel 和 Prism 是插队信号的**发送者**:
222
+ - 安全问题 → Sentinel 发送插队信号
223
+ - 质量漂移 → Prism 发送插队信号
224
+ - Conductor 接收并处理这些信号
225
+
226
+ ---
227
+
228
+ ## 场景模拟
229
+
230
+ ### 场景1:正常流程
231
+
232
+ ```
233
+ 澄清牌(low) → 范围收缩牌(low) → 方案牌(mid) → 执行牌(high) → 校验牌(mid)
234
+ → 修复牌(mid) → [进化检测] → 完成
235
+ ```
236
+
237
+ ### 场景2:过载留白
238
+
239
+ ```
240
+ 执行牌(high) → 校验牌(high) → 修复牌-1(high)
241
+ → [连续3张high] → 强制留白牌 → "当前进度:修订第2轮,1/3项已通过"
242
+ → 用户确认继续 → 修复牌-2(mid)
243
+ ```
244
+
245
+ ### 场景3:紧急插队
246
+
247
+ ```
248
+ 执行牌(high) → [Sentinel安全警报] → 暂停当前牌组
249
+ → 风险牌(最高) → 安全修复 → 恢复原牌组 → 校验牌(mid)
250
+ ```
251
+
252
+ ### 场景4:回滚
253
+
254
+ ```
255
+ 执行牌(high) → [影响范围超预期] → 回滚牌(high)
256
+ → 回退到上一稳定状态 → 重新评估范围 → 范围收缩牌(low) → 重新执行
257
+ ```
@@ -0,0 +1,285 @@
1
+ # 十步治理 — 完整参考
2
+
3
+ > 来源:meta.md 第五部分(第498-554行),老金直播口播提炼
4
+ > **前三步是"会动",后七步是"成熟"。**
5
+
6
+ ## 核心命题
7
+
8
+ 治理的本质是:**让系统不仅会做事,还会判断、会纠偏、会验证、会进化。**
9
+
10
+ 第一次产出只能说明它"会动"。会动不等于可靠,可靠不等于可复用,可复用不等于可演化。
11
+
12
+ > **AI 系统的水平,不取决于它第一次能写多好,而取决于它有没有自我校正链路。**
13
+
14
+ ---
15
+
16
+ ## 十步全景
17
+
18
+ ```
19
+ 方向(1) → 规划(2) → 执行(3) → 评审(4) → 元评审(5) → 修订(6) → 验证(7) → 汇总(8) → 反馈(9) → 进化(10)
20
+ ├────── 会动 ──────┤├──────────────────── 成熟 ─────────────────────────────────────────┤
21
+ ```
22
+
23
+ ---
24
+
25
+ ## 每步详解
26
+
27
+ ### 步骤1:方向
28
+
29
+ | 属性 | 内容 |
30
+ |------|------|
31
+ | **执行者** | Warden + 用户 |
32
+ | **输入** | 用户需求(可能模糊) |
33
+ | **核心动作** | 需求清晰度检测 → 意图核提取 → 复杂度评估 |
34
+ | **输出** | 明确的意图核 + 复杂度等级(简单/中等/复杂) |
35
+ | **质量门控** | 意图核必须可验证:能用一句话描述"做完了是什么样"?不能 → 追问 |
36
+
37
+ **追问规则**:
38
+ - 最多追问 2 轮(引导牌)
39
+ - 2 轮后仍模糊 → 基于已有信息做最保守假设,标记假设点
40
+ - 不假设用户意图,但也不无限追问
41
+
42
+ ### 步骤2:规划
43
+
44
+ | 属性 | 内容 |
45
+ |------|------|
46
+ | **执行者** | Conductor |
47
+ | **输入** | 意图核 + 复杂度等级 |
48
+ | **核心动作** | 任务拆解 → 元分配 → 依赖分析 → 牌组编排 |
49
+ | **输出** | 任务拆解方案 + 牌组配置 + 并行/串行标记 |
50
+ | **质量门控** | 每个子任务必须能映射到一个具体元。无法映射 → 触发元创建 |
51
+
52
+ **复杂度路由在此步决定**:
53
+ - 简单(<2文件)→ 跳过规划,直接执行
54
+ - 中等(2-5文件)→ 轻量规划
55
+ - 复杂(>5文件)→ 完整规划 + 依赖图
56
+
57
+ ### 步骤3:执行
58
+
59
+ | 属性 | 内容 |
60
+ |------|------|
61
+ | **执行者** | 执行元(按任务分配) |
62
+ | **输入** | 任务拆解方案 + 具体子任务 |
63
+ | **核心动作** | 搜索已有资源 → 能力匹配 → 分配执行 → 产出 |
64
+ | **输出** | 具体产出物(代码/文档/配置/设计) |
65
+ | **质量门控** | 文件所有权声明(一个文件同时只有一个元在写) |
66
+
67
+ **执行原则**:
68
+ - 文件不重叠 → 安全并行
69
+ - 文件有重叠 → 串行,后者等前者完成
70
+ - 找不到匹配元 → 触发类型B创建流水线
71
+
72
+ ### 步骤4:评审
73
+
74
+ | 属性 | 内容 |
75
+ |------|------|
76
+ | **执行者** | Prism |
77
+ | **输入** | 步骤3的产出物 |
78
+ | **核心动作** | AI-Slop扫描 → 断言化评估 → 声明验证 → 思考深度量化 → 质量评级 |
79
+ | **输出** | 【Prism分析报告】含断言PASS/FAIL列表 + 质量等级(S/A/B/C/D) |
80
+ | **质量门控** | A/S → 通过。B → 修订。C/D → 重做 |
81
+
82
+ **评审不是打分**,是法医式取证:
83
+ - 每个论断必须有具体证据(文件路径、行号、数据)
84
+ - 隐含声明必须被提取并验证
85
+ - 无证据的判定 = FAIL
86
+
87
+ ### 步骤5:元评审 ⭐
88
+
89
+ > **这一步是整个治理流程中最独特的——谁来评审评审者?**
90
+
91
+ | 属性 | 内容 |
92
+ |------|------|
93
+ | **执行者** | Warden(审 Prism 的审查标准,不是审具体结论) |
94
+ | **输入** | Prism 的审查报告 + 审查标准 |
95
+ | **核心动作** | 断言覆盖性检查 → 断言强度检查 → 标准一致性检查 |
96
+ | **输出** | 元评审判定:通过 / 要求补充 / 标准漂移警告 |
97
+ | **质量门控** | 见下方元评审协议 |
98
+
99
+ #### 元评审协议
100
+
101
+ Warden 审查的是 Prism 的审查标准本身,不是重复审查产出:
102
+
103
+ | 检查维度 | 方法 | 不通过处理 |
104
+ |---------|------|-----------|
105
+ | **断言覆盖性** | Prism 断言是否覆盖所有关键维度? | 要求补充缺失维度的断言 |
106
+ | **断言强度** | 有没有弱断言制造虚假信心? | 要求收紧条件(如"有 Core Truths"→"有 ≥3 条且通过可替换性测试") |
107
+ | **标准一致性** | 和上次同类审查标准一致吗? | 记录差异,判断是"进化"还是"漂移" |
108
+
109
+ **触发规则**:
110
+
111
+ ```
112
+ IF Prism pass_rate > 0.9 AND 产出明显有问题
113
+ THEN 强制触发元评审(Prism 的标准可能太宽松)
114
+
115
+ IF Prism pass_rate < 0.3 AND 产出看起来合理
116
+ THEN 强制触发元评审(Prism 的标准可能太严格)
117
+
118
+ IF 标准和上次同类审查差异 > 30%
119
+ THEN 标准漂移警告 → Warden 裁��
120
+ ```
121
+
122
+ > **通过弱断言的 PASS 比 FAIL 更危险——它制造虚假信心。**
123
+
124
+ ### 步骤6:修订
125
+
126
+ | 属性 | 内容 |
127
+ |------|------|
128
+ | **执行者** | 原执行元(谁做的谁改) |
129
+ | **输入** | Prism 评审报告 + Warden 元评审意见 |
130
+ | **核心动作** | 按评审意见修复 → 重新提交 |
131
+ | **输出** | 修订后的产出物 |
132
+ | **质量门控** | 最多 3 轮修订(AutoFix 循环)。3 轮后仍 B 级 → 上报 Warden 决策。<br>**注**:AutoFix 是自动修复循环——Review 发现问题后自动派发修复任务给执行元,不需要用户介入。只有3轮自动修复全部失败后才上报 Warden 决策。 |
133
+
134
+ **修订分级**:
135
+ - B级问题 → 补充具体案例、数据引用
136
+ - C级问题 → 重写套话段落,用实际数据替换
137
+ - D级问题 → 回到执行步骤,从头重做
138
+
139
+ ### 步骤7:验证
140
+
141
+ | 属性 | 内容 |
142
+ |------|------|
143
+ | **执行者** | Prism(独立于修订者) |
144
+ | **输入** | 修订后的产出物 |
145
+ | **核心动作** | 用同一套断言重新评估 → 确认修订确实解决了问题 |
146
+ | **输出** | 验证结果:通过 / 需要继续修订 |
147
+ | **质量门控** | 验证必须基于 fresh evidence,不是"我记得改过了" |
148
+
149
+ > **验证不是自我感动。改了不等于改好了。必须重新跑断言。**
150
+
151
+ ### 步骤8:汇总
152
+
153
+ | 属性 | 内容 |
154
+ |------|------|
155
+ | **执行者** | Warden |
156
+ | **输入** | 所有步骤的过程数据 + 最终产出 |
157
+ | **核心动作** | 综合各元报告 → 提取学习 → 生成CEO报告 |
158
+ | **输出** | CEO报告(按交付壳适配)+ 学习记录 |
159
+ | **质量门控** | CEO报告必须通过意图放大审查(壳适配检查) |
160
+
161
+ **汇总不是复制粘贴**,是综合判断:
162
+ - 多个元的报告可能矛盾 → Warden 做权衡决策
163
+ - 提取本轮的关键学习 → 为步骤10进化做准备
164
+
165
+ ### 步骤9:反馈
166
+
167
+ | 属性 | 内容 |
168
+ |------|------|
169
+ | **执行者** | 用户/CEO |
170
+ | **输入** | 汇总报告 + 最终产出 |
171
+ | **核心动作** | 用户确认满意度 → 补充修改意见 → 签收 |
172
+ | **输出** | 用户确认 / 修改要求 |
173
+ | **质量门控** | 必须获得明确确认。模糊确认("还行吧")→ 追问具体不满意的点 |
174
+
175
+ ### 步骤10:进化
176
+
177
+ | 属性 | 内容 |
178
+ |------|------|
179
+ | **执行者** | 全员(每个元各自进化 + Conductor 统筹) |
180
+ | **输入** | 全流程过程数据 + 用户反馈 |
181
+ | **核心动作** | 5维度进化检测 → 进化放大操作 |
182
+ | **输出** | 进化建议清单 + 已执行的进化操作 |
183
+ | **质量门控** | 至少 1 个维度有具体进化操作(不能全是"维持现状") |
184
+
185
+ 详细的5维度展开和放大操作见 `references/intent-amplification.md`。
186
+
187
+ ---
188
+
189
+ ## 复杂度路由
190
+
191
+ 不是所有任务都要走完10步。按复杂度路由:
192
+
193
+ ### 简单(<2文件改动)
194
+
195
+ ```
196
+ 方向(1) → 执行(3) → 评审(4) → 验证(7) → 反馈(9)
197
+ 跳过:规划(2)、元评审(5)、修订(6)、汇总(8)、进化(10)
198
+ ```
199
+
200
+ **理由**:2文件以内的改动,评审覆盖即可,不需要元评审和完整进化。
201
+
202
+ ### 中等(2-5文件改动)
203
+
204
+ ```
205
+ 方向(1) → 规划(2) → 执行(3) → 评审(4) → 元评审(5) → 修订(6) → 验证(7) → 反馈(9)
206
+ 跳过:汇总(8)、进化(10)
207
+ ```
208
+
209
+ **理由**:需要规划和元评审保证质量,但规模不足以需要完整进化分析。
210
+
211
+ ### 复杂(>5文件/多模块)
212
+
213
+ ```
214
+ 方向(1) → 规划(2) → 执行(3) → 评审(4) → 元评审(5) → 修订(6) → 验证(7) → 汇总(8) → 反馈(9) → 进化(10)
215
+ 全部10步
216
+ ```
217
+
218
+ **理由**:大规模变更需要完整治理,包括元评审防止审查盲区、汇总综合判断、进化提取学习。
219
+
220
+ ### 路由决策矩阵
221
+
222
+ | 信号 | 升级条件 |
223
+ |------|---------|
224
+ | 文件数从 <2 增加到 >2 | 简单 → 中等 |
225
+ | 出现跨模块依赖 | 中等 → 复杂 |
226
+ | Sentinel 报安全问题 | 任何 → 复杂(全步骤) |
227
+ | Prism 评审发现系统性问题 | 中等 → 复杂 |
228
+ | 用户明确要求完整流程 | 任何 → 复杂 |
229
+
230
+ ---
231
+
232
+ ## 步骤间的信号流
233
+
234
+ ```
235
+ 方向(1) ──意��核+复杂度──→ 规划(2)
236
+ 规划(2) ──牌组+分配──→ 执行(3)
237
+ 执行(3) ──产出物──→ 评审(4)
238
+ 评审(4) ──审查报告──→ 元评审(5)
239
+ ──评审意见──→ 修订(6)
240
+ 元评审(5) ──标准判定──→ 修订(6)(如有标准问题)
241
+ 修订(6) ──修订产出──→ 验证(7)
242
+ 验证(7) ──通过──→ 汇总(8)
243
+ ──未通过──→ 修订(6)(回环,最多3轮AutoFix)
244
+ 汇总(8) ──CEO报告──→ 反馈(9)
245
+ 反馈(9) ──用户确认──→ 进化(10)
246
+ ──修改要求──→ 修订(6)(回环)
247
+ 进化(10) ──进化操作──→ [下一轮的系统更强]
248
+ ```
249
+
250
+ ---
251
+
252
+ ## 元评审的深入设计
253
+
254
+ 元评审是十步治理中最容易被跳过、但最不该被跳过的步骤。
255
+
256
+ ### 为什么需要元评审
257
+
258
+ **问题**:Prism 负责评审产出质量。但谁来评审 Prism 的评审质量?
259
+
260
+ **风险**:
261
+ - Prism 用了太宽松的断言 → 低质量产出通过了(虚假信心)
262
+ - Prism 用了太严格的断言 → 合理产出被打回了(浪费资源)
263
+ - Prism 的标准随时间漂移 → 同类产出今天过、明天不过(不一致)
264
+
265
+ ### 元评审不做什么
266
+
267
+ - 不重复审查产出物本身(那是 Prism 的工作)
268
+ - 不质疑 Prism 的具体结论(除非标准有问题)
269
+ - 不替代 Prism 的角色
270
+
271
+ ### 元评审只做什么
272
+
273
+ - 审查 Prism 的断言是否覆盖关键维度
274
+ - 审查 Prism 的断言强度是否足够(弱断言检测)
275
+ - 审查 Prism 的标准是否与历史一致(漂移检测)
276
+
277
+ ### Prism 的配合义务
278
+
279
+ Prism 在被元评审时需要:
280
+ - 公开完整的断言列表和评分标准
281
+ - 说明每个断言的设计理由
282
+ - 标记与上次同类审查的标准差异
283
+ - 接受 Warden 的标准调整建议
284
+
285
+ 详见 `.claude/agents/meta-prism.md` 的"被审查协议"。