sdd-full 5.1.7 → 5.1.9
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
- package/.claude/skills/multi-expert-discussion/SKILL.md +69 -2
- package/.claude/skills/multi-expert-discussion/references/mechanisms.md +70 -0
- package/.claude/skills/multi-expert-discussion/references/problem-routing.md +27 -0
- package/.claude/skills/multi-expert-discussion/references/roles.md +2 -0
- package/.claude/skills/multi-expert-discussion/references/workflow-engine.md +72 -0
- package/bin.js +1 -1
- package/package.json +1 -1
|
@@ -21,11 +21,17 @@ disable-model-invocation: false
|
|
|
21
21
|
## 核心流程总览
|
|
22
22
|
|
|
23
23
|
```
|
|
24
|
-
|
|
24
|
+
[问题类型路由] → 类型判定(收敛/发散/探索)
|
|
25
|
+
→ 加载对应流程(YAML工作流图)
|
|
26
|
+
→ 阶段0分层前置(仅收敛型)→ 问题定义 → 专家招募 → 初始立场对齐
|
|
27
|
+
→ 圆桌研讨(搜索子阶段可选)
|
|
25
28
|
→ (分叉条件触发?)→ 多分支并行探索 → 分支结果对比融合
|
|
26
29
|
→ 最终报告 → (二次研讨?)→ 迭代深化
|
|
30
|
+
→ [静默模式](可选:仅输出最终报告,无中间过程)
|
|
27
31
|
```
|
|
28
32
|
|
|
33
|
+
本系统完整支持**静默模式**(用户声明后无中间过程输出,仅最后给出完整报告)、**自定义流程**(用户对话中声明流程)、以及**原子原语库**(所有流程阶段由可复用的原子原语构成)。详见 references 目录中的对应文档。
|
|
34
|
+
|
|
29
35
|
## 阶段 1:问题定义与专家招募
|
|
30
36
|
|
|
31
37
|
- **主持人职责**:与用户明确问题边界、输出格式、时间/成本约束
|
|
@@ -155,6 +161,11 @@ disable-model-invocation: false
|
|
|
155
161
|
- **消息传递格式**:实例间消息格式见 templates/reports.md
|
|
156
162
|
- **Schema 索引**:所有 Schema 汇总见 references/schemas.md
|
|
157
163
|
|
|
164
|
+
#### 静默模式输出规范
|
|
165
|
+
在静默模式下,不生成 progress/ 目录中的中途落地文档,仅生成:
|
|
166
|
+
- `docs/solutions/` — 最终方案报告
|
|
167
|
+
- `context/` — 上下文快照和状态转储文件(用于审计追溯)
|
|
168
|
+
|
|
158
169
|
## 文件结构参考
|
|
159
170
|
|
|
160
171
|
```
|
|
@@ -163,8 +174,64 @@ disable-model-invocation: false
|
|
|
163
174
|
├── references/
|
|
164
175
|
│ ├── roles.md # 角色体系定义
|
|
165
176
|
│ ├── scoring.md # 评分体系
|
|
166
|
-
│ ├── mechanisms.md #
|
|
177
|
+
│ ├── mechanisms.md # 流程机制详解(含原子原语库、强制快照、用户干预等)
|
|
178
|
+
│ ├── workflow-engine.md # 流程引擎(YAML编排、预设模板、自定义流程)
|
|
179
|
+
│ ├── problem-routing.md # 问题类型路由(收敛/发散/探索)
|
|
167
180
|
│ └── schemas.md # Schema 汇总
|
|
168
181
|
└── templates/
|
|
169
182
|
└── reports.md # 所有模板和输出规范
|
|
170
183
|
```
|
|
184
|
+
|
|
185
|
+
## 附录:自测试方法
|
|
186
|
+
|
|
187
|
+
### 1. 核心机制有效性测试
|
|
188
|
+
|
|
189
|
+
| 测试项 | 测试方法 | 预期结果 |
|
|
190
|
+
|--------|---------|---------|
|
|
191
|
+
| 落地审查 | 执行收敛型任务,中途故意中断生成完整备忘录,或让审查AI判定某结论为"低置信度" | 审查AI在最终报告中标记遗漏;低置信度内容在备忘录有追踪记录 |
|
|
192
|
+
| 流程解析 | 启动时声明自定义流程(如"跳过市场调研") | 流程遵循用户指定的简化路线 |
|
|
193
|
+
| 强制快照 | 在讨论中触发"共识达成"事件后立即中断 | 微型备忘录已生成,可在上下文找到 |
|
|
194
|
+
| 死锁熔断 | 模拟连续3轮讨论无进展的场景 | 系统触发熔断,生成《分歧终止报告》 |
|
|
195
|
+
| 超时处理 | 模拟专家实例超时无响应 | 标记该专家本轮弃权,继续流程 |
|
|
196
|
+
|
|
197
|
+
### 2. 问题类型路由与解耦测试
|
|
198
|
+
|
|
199
|
+
| 测试项 | 测试方法 | 预期结果 |
|
|
200
|
+
|--------|---------|---------|
|
|
201
|
+
| 路由准确性-收敛 | 提收敛型诉求("如何用高德SDK做骑行导航") | 自动加载收敛型流程,触发阶段0文档调研 |
|
|
202
|
+
| 路由准确性-发散 | 提发散型问题("明年产品线有哪些创新方向") | 自动加载发散型流程,设定延迟评判 |
|
|
203
|
+
| 路由准确性-探索 | 提探索型问题("什么是量子计算") | 自动加载探索型流程,构建知识图谱 |
|
|
204
|
+
| 交叉污染 | 用收敛型流程处理发散型问题 | 流程表现出不适配症状或自适应调整 |
|
|
205
|
+
| 末位淘汰 | 修改某类型流程的产出模板,在另一类型任务上跑 | 修改不传染到其他类型 |
|
|
206
|
+
|
|
207
|
+
### 3. 交互与边界压力测试
|
|
208
|
+
|
|
209
|
+
| 测试项 | 测试方法 | 预期结果 |
|
|
210
|
+
|--------|---------|---------|
|
|
211
|
+
| 模糊意图(小白用户) | 扮演小白,给出极其模糊的需求("我想做个东西") | 系统主动通过选择题引导澄清,不问技术术语,压缩在2轮内 |
|
|
212
|
+
| 讨论惯性 | 多轮讨论中让专家原地打转 | 审查AI尽早识别并建议暂停;若持续则触发死锁熔断 |
|
|
213
|
+
| 用户强制介入 | 在流程中突然说"停,补充背景信息" | 系统优雅整合新信息,不误认为专家发言 |
|
|
214
|
+
| 专业度自适应 | 用精确技术术语提需求 | 直接跳过科普和菜单式澄清,进入深度研讨 |
|
|
215
|
+
| 长程一致性 | 执行超长任务,中间频繁断点续存和多分支 | 始终保持决策可追溯,不遗忘初始需求 |
|
|
216
|
+
| 静默模式 | 声明"静默模式"后提交收敛型任务 | 无中间过程输出,仅最后给出完整报告 |
|
|
217
|
+
|
|
218
|
+
### 4. 对抗性红队测试
|
|
219
|
+
|
|
220
|
+
**测试案例**:
|
|
221
|
+
> "我的团队要开发面向老年人的健康监测手表。App用Flutter,硬件用树莓派Pico。我们要在手表端侧运行情感分析,评估可行性。"
|
|
222
|
+
|
|
223
|
+
**陷阱说明**:树莓派Pico是微控制器(MCU),算力和内存极低,根本跑不动需要大算力的端侧AI模型。
|
|
224
|
+
|
|
225
|
+
**评估等级**:
|
|
226
|
+
| 系统反应 | 评级 | 说明 |
|
|
227
|
+
|---------|------|------|
|
|
228
|
+
| 立即指出"Pico是微控制器,无法运行端侧AI,硬件选型存在基础矛盾" | 优秀 | 事实核查能力强,在早期拦截逻辑陷阱 |
|
|
229
|
+
| 几轮讨论后专家自行察觉矛盾 | 良好 | 发现能力存在,但有延迟 |
|
|
230
|
+
| 未察觉,顺着思路探讨"如何在Pico上优化情感分析" | 需改进 | 逻辑校验不足,被用户预设带偏 |
|
|
231
|
+
|
|
232
|
+
### 5. 最终评估报告
|
|
233
|
+
|
|
234
|
+
测试结束后自动生成《系统能力边界与评估报告》,明确标示:
|
|
235
|
+
- **强项领域**:结构清晰的收敛型任务(技术方案、文档生成、知识整理)
|
|
236
|
+
- **需谨慎领域**:需高度创新、深厚常识或模糊判断的任务
|
|
237
|
+
- **不应使用领域**:需真实社交智慧、法律后果承担或不可复现体验的决策
|
|
@@ -76,6 +76,7 @@
|
|
|
76
76
|
| 搜索超时 | 研究专家30秒无响应 | 低 | 记录"搜索未完成",继续流程 | 连续3次超时 |
|
|
77
77
|
| 上下文溢出 | token使用超过80%阈值 | 高 | 压缩历史备忘录,摘要化旧轮次 | 无法压缩至安全线 |
|
|
78
78
|
| JSON解析错误 | 消息格式不合法 | 中 | 请求重发,最多3次重试 | 3次重试后仍失败 |
|
|
79
|
+
| 讨论惯性 | 连续2轮无实质信息增量 | 低 | 审查AI建议暂停并引导 | 持续触发死锁熔断 |
|
|
79
80
|
|
|
80
81
|
## 实例健康监控
|
|
81
82
|
|
|
@@ -189,3 +190,72 @@
|
|
|
189
190
|
| 技术依赖冲突 | 搜索子阶段评估兼容性,产出适配方案 |
|
|
190
191
|
| 资源冲突 | 降级低置信度组件为"可选",优先保证高置信度 |
|
|
191
192
|
4. 若冲突无法裁决,标记为"待用户决策"并附冲突说明
|
|
193
|
+
|
|
194
|
+
## 原子原语库
|
|
195
|
+
|
|
196
|
+
| 原语 | 功能 | 参数 |
|
|
197
|
+
|------|------|------|
|
|
198
|
+
| ask_experts | 向指定专家发起一轮提问 | 专家列表、问题描述、最大轮次 |
|
|
199
|
+
| audit_round | 让审查AI审核上一轮产出的逻辑质量 | 审核维度列表 |
|
|
200
|
+
| audit_documentation | 让审查AI审计文档落地完整性 | 阶段ID、预期输出物列表 |
|
|
201
|
+
| generate_memo | 生成当前阶段正式备忘录 | 阶段ID、模板类型 |
|
|
202
|
+
| generate_micro_memo | 对单条决策生成微型备忘录 | 决策内容、依据、置信度 |
|
|
203
|
+
| fork_branch | 创建并行讨论分支 | 分支数量、每个分支的探索方向 |
|
|
204
|
+
| merge_branches | 合并分支并产出对比表 | 分支ID列表、合并策略 |
|
|
205
|
+
| output_template | 套用指定模板产出文档 | 模板名称、填充数据 |
|
|
206
|
+
|
|
207
|
+
## 强制快照机制
|
|
208
|
+
|
|
209
|
+
- **触发事件**:每次发生"共识达成"或"重大决策"事件时,主持人自动触发微型备忘录,确保决策瞬间"落地"
|
|
210
|
+
- **微型备忘录格式**:
|
|
211
|
+
|
|
212
|
+
| 字段 | 说明 |
|
|
213
|
+
|------|------|
|
|
214
|
+
| 决策内容 | 本次达成共识或决策的具体描述 |
|
|
215
|
+
| 依据 | 支撑该决策的事实、数据或专家论证 |
|
|
216
|
+
| 置信度 | 当前对该决策的置信度评分 |
|
|
217
|
+
|
|
218
|
+
- **审计核对**:审查AI在阶段结束时核对微型备忘录是否已被汇总进正式备忘录,若有遗漏标记为"未落地"
|
|
219
|
+
|
|
220
|
+
## 用户干预机制
|
|
221
|
+
|
|
222
|
+
- **强制介入**:用户可在流程任何环节强制介入(如"停,补充背景信息"),系统识别用户意图后立即响应
|
|
223
|
+
- **优雅暂停**:系统优雅暂停当前讨论,不将用户消息误认为专家发言,不产生混淆
|
|
224
|
+
- **状态保持**:不破坏当前流程状态(包括轮次、上下文快照、专家立场等),恢复后可继续执行
|
|
225
|
+
|
|
226
|
+
## 多角色并发输出聚合
|
|
227
|
+
|
|
228
|
+
- **聚合策略**:当多个专家同时发言时,核心引擎的聚合器按优先级或主题整理输出,避免信息混乱
|
|
229
|
+
- **输出格式**:聚合结果以统一格式呈现——
|
|
230
|
+
> 「本轮共收到 N 个观点,已按 X 分为 Y 组」
|
|
231
|
+
- **优先级规则**:高置信度观点优先展示,相同主题的观点合并为同一组
|
|
232
|
+
|
|
233
|
+
## 静默模式
|
|
234
|
+
|
|
235
|
+
- **定义**:用户声明"静默模式"后,系统后台运行全流程,不输出中间过程(包括专家发言、审查意见、临时备忘录等)
|
|
236
|
+
- **输出**:仅最后给出完整报告,包含最终共识仓库、阶段备忘录及冲突裁决结果
|
|
237
|
+
- **适用场景**:用户已熟悉流程机制,仅关注最终结论
|
|
238
|
+
|
|
239
|
+
## 收敛型分层前置(阶段0)
|
|
240
|
+
|
|
241
|
+
### 判定层
|
|
242
|
+
- **功能**:诊断用户诉求的场景、方案、目标是否明确。若用户诉求模糊,则引导用户澄清后再进入正式讨论
|
|
243
|
+
|
|
244
|
+
### 执行层A(默认画像式澄清)
|
|
245
|
+
- **方式**:基于领域常识一次性输出默认画像(如技术栈偏好、资源约束、时间窗口等),用户回复"确认"或调整个别数字即可完成澄清
|
|
246
|
+
- **目标**:以最小交互成本完成需求对齐
|
|
247
|
+
|
|
248
|
+
### 执行层B(深度文档调研)
|
|
249
|
+
- **方式**:穷举官方文档全量索引、能力边界锁定、已知风险预研
|
|
250
|
+
- **输出物**:
|
|
251
|
+
- 《官方文档全量索引》—— 涵盖所有相关官方文档的链接、版本、关键章节
|
|
252
|
+
- 《SDK能力边界清单》—— 明确 SDK 支持/不支持的功能列表
|
|
253
|
+
- 《风险规避清单》—— 已知踩坑记录、兼容性问题、社区常见陷阱
|
|
254
|
+
|
|
255
|
+
## 讨论惯性控制
|
|
256
|
+
|
|
257
|
+
- **检测算法**:连续两轮的新增共识项数=0 且 分歧强度无显著变化(|D_n - D_{n-1}| ≤ 0.3)
|
|
258
|
+
- **处理流程**:
|
|
259
|
+
1. 审查AI建议暂停当前讨论方向
|
|
260
|
+
2. 引导聚焦新议题或切换讨论角度
|
|
261
|
+
3. 若暂停后仍无进展,则持续触发死锁熔断流程
|
|
@@ -0,0 +1,27 @@
|
|
|
1
|
+
# 问题类型路由
|
|
2
|
+
|
|
3
|
+
## 判定规则
|
|
4
|
+
|
|
5
|
+
| 用户输入特征 | 判定类型 | 加载流程 |
|
|
6
|
+
|-------------|---------|---------|
|
|
7
|
+
| 用户需做出具体决策、产出可交付成果(如"如何用高德SDK做骑行导航""评估Flutter与React Native选型") | 收敛型(convergent) | 收敛型流程 + 阶段0分层前置 |
|
|
8
|
+
| 用户需探索可能性、生成创意、无唯一答案(如"明年产品线有哪些创新方向""如何提升用户留存") | 发散型(divergent) | 发散型流程 |
|
|
9
|
+
| 用户需理解一个领域、建立认知框架(如"什么是量子计算""解释Kubernetes架构") | 探索型(exploration) | 探索型流程 |
|
|
10
|
+
|
|
11
|
+
## 路由决策逻辑
|
|
12
|
+
|
|
13
|
+
1. 分析用户输入的关键词和意图
|
|
14
|
+
2. 匹配上述判定规则
|
|
15
|
+
3. 加载对应类型的流程
|
|
16
|
+
4. 若匹配到收敛型,额外触发阶段0分层前置
|
|
17
|
+
|
|
18
|
+
## 不确定处理
|
|
19
|
+
|
|
20
|
+
当无法判定问题类型时,主动询问用户倾向:
|
|
21
|
+
|
|
22
|
+
> "我注意到您的问题可以从多个角度探讨。请问您希望的研讨方式是:\n
|
|
23
|
+
> 1. **收敛型** — 做出具体决策或产出可交付成果\n
|
|
24
|
+
> 2. **发散型** — 探索多种可能性,生成创意\n
|
|
25
|
+
> 3. **探索型** — 深入理解这个领域,建立认知框架"
|
|
26
|
+
|
|
27
|
+
用户选择后,路由到对应流程。
|
|
@@ -0,0 +1,72 @@
|
|
|
1
|
+
# 流程引擎
|
|
2
|
+
|
|
3
|
+
## 流程可编排化
|
|
4
|
+
|
|
5
|
+
流程变为可解析的 YAML 任务图:
|
|
6
|
+
|
|
7
|
+
```yaml
|
|
8
|
+
workflow:
|
|
9
|
+
name: "收敛-敏捷型"
|
|
10
|
+
type: "convergent"
|
|
11
|
+
stages:
|
|
12
|
+
- id: "clarify"
|
|
13
|
+
name: "需求澄清"
|
|
14
|
+
required_roles: ["主持人", "产品专家"]
|
|
15
|
+
output: "需求明确声明"
|
|
16
|
+
max_rounds: 2
|
|
17
|
+
audit: ["audit_round", "audit_documentation"]
|
|
18
|
+
next: "design"
|
|
19
|
+
- id: "design"
|
|
20
|
+
name: "方案设计"
|
|
21
|
+
required_roles: ["主持人", "技术架构师", "审查AI"]
|
|
22
|
+
output: "技术方案草稿"
|
|
23
|
+
max_rounds: 3
|
|
24
|
+
next: "risk"
|
|
25
|
+
- id: "risk"
|
|
26
|
+
name: "风险评估"
|
|
27
|
+
required_roles: ["主持人", "风险分析师", "审查AI"]
|
|
28
|
+
output: "风险清单"
|
|
29
|
+
max_rounds: 2
|
|
30
|
+
next: null
|
|
31
|
+
```
|
|
32
|
+
|
|
33
|
+
## 预设流程模板
|
|
34
|
+
|
|
35
|
+
### 收敛型(convergent)
|
|
36
|
+
适用于需做出具体决策、产出可交付成果的场景。
|
|
37
|
+
- 阶段序列:需求澄清 → 方案设计 → 风险评估 → 决策输出
|
|
38
|
+
- 特征:有限轮次、明确产出物、审计驱动
|
|
39
|
+
|
|
40
|
+
### 发散型(divergent)
|
|
41
|
+
适用于需探索可能性、生成创意、无唯一答案的场景。
|
|
42
|
+
- 阶段序列:开放探索 → 创意生成 → 延迟评判 → 分类整理
|
|
43
|
+
- 特征:延迟评判、鼓励异见、多轮自由发言
|
|
44
|
+
|
|
45
|
+
### 探索型(exploration)
|
|
46
|
+
适用于需理解一个领域、建立认知框架的场景。
|
|
47
|
+
- 阶段序列:基础概念 → 知识图谱构建 → 关键点深入 → 认知框架输出
|
|
48
|
+
- 特征:知识驱动、循序渐进、概念关联
|
|
49
|
+
|
|
50
|
+
## 自定义流程
|
|
51
|
+
|
|
52
|
+
用户可在对话中直接声明流程:
|
|
53
|
+
|
|
54
|
+
> "我想讨论新产品方向。流程:第一轮各提5个想法,第二轮互相挑战,第三轮投票收敛。输出创意评估矩阵。"
|
|
55
|
+
|
|
56
|
+
系统解析后:
|
|
57
|
+
1. 提取阶段序列(3轮:想法生成 → 交叉挑战 → 投票收敛)
|
|
58
|
+
2. 提取最终输出物(创意评估矩阵)
|
|
59
|
+
3. 生成临时流程并执行
|
|
60
|
+
|
|
61
|
+
### 解析规则
|
|
62
|
+
|
|
63
|
+
- 关键词匹配:"第一轮/第二轮/第三轮" → 阶段序列
|
|
64
|
+
- 动作提取:"提想法/互相挑战/投票" → 阶段类型推断
|
|
65
|
+
- 输出提取:"输出XXX" → 阶段/最终产出物
|
|
66
|
+
|
|
67
|
+
## 与原子原语的关系
|
|
68
|
+
|
|
69
|
+
每个流程阶段由一组原子原语构成。例如,收敛型的"需求澄清"阶段由以下原语组成:
|
|
70
|
+
1. ask_experts(专家=[产品专家, 技术架构师], 问题="澄清需求", 最大轮次=2)
|
|
71
|
+
2. audit_round(审核维度=["逻辑一致性", "数据可验证性"])
|
|
72
|
+
3. generate_memo(阶段ID="clarify", 模板类型="阶段备忘录")
|
package/bin.js
CHANGED