@feng-h/pdca-skill 1.0.0
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
- package/CLAUDE.md +108 -0
- package/README.md +131 -0
- package/SKILL.md +438 -0
- package/assets/references/act-agent.md +51 -0
- package/assets/references/check-agent.md +43 -0
- package/assets/references/cron-driving.md +107 -0
- package/assets/references/dashboard-templates.md +436 -0
- package/assets/references/do-agent.md +44 -0
- package/assets/references/exception-handling.md +35 -0
- package/assets/references/feishu-integration.md +494 -0
- package/assets/references/manufacturing-templates.md +31 -0
- package/assets/references/plan-agent.md +52 -0
- package/assets/references/transition-checklist.md +41 -0
- package/assets/templates/project-template.md +109 -0
- package/assets/tests/baseline-test-results.md +146 -0
- package/assets/tests/baseline-test-scenarios.md +111 -0
- package/assets/tests/improvement-analysis-tdd.md +405 -0
- package/assets/tests/improvement-validation-scenarios.md +184 -0
- package/assets/tests/integration-test-scenarios.md +296 -0
- package/assets/tests/tdd-baseline-test-scenarios.md +164 -0
- package/assets/tests/tdd-green-verification.md +156 -0
- package/package.json +31 -0
- package/system/Agent/ActAgent.md +369 -0
- package/system/Agent/CheckAgent.md +327 -0
- package/system/Agent/DoAgent.md +289 -0
- package/system/Agent/PDCA/346/216/247/345/210/266/345/231/250.md +403 -0
- package/system/Agent/PDCA/351/241/271/347/233/256/347/256/241/347/220/206/347/263/273/347/273/237Agent.md +137 -0
- package/system/Agent/PlanAgent.md +404 -0
- package/system//345/210/266/351/200/240/350/264/250/351/207/217/351/241/271/347/233/256/346/250/241/346/235/277.md +122 -0
- package/system//345/267/245/345/205/267/Bitable/345/272/224/347/224/250/346/226/207/346/241/243/346/250/241/346/235/277.md +232 -0
- package/system//345/267/245/345/205/267/Bitable/350/241/250/347/273/223/346/236/204/345/256/232/344/271/211.md +376 -0
- package/system//345/267/245/345/205/267/OpenClow API/351/233/206/346/210/220.md" +109 -0
- package/system//345/267/245/345/205/267//344/273/252/350/241/250/346/235/277/347/224/237/346/210/220/345/231/250.md +274 -0
- package/system//345/267/245/345/205/267//344/273/252/350/241/250/347/233/230/347/273/204/344/273/266/351/205/215/347/275/256.md +66 -0
- package/system//345/267/245/345/205/267//344/273/273/345/212/241/350/207/252/345/212/250/347/224/237/346/210/220/345/231/250.md +365 -0
- package/system//345/267/245/345/205/267//345/267/245/344/275/234/346/265/201/350/207/252/345/212/250/345/214/226/351/205/215/347/275/256.md +119 -0
- package/system//345/267/245/345/205/267//345/274/202/345/270/270/345/244/204/347/220/206/346/214/207/345/215/227.md +441 -0
- package/system//345/267/245/345/205/267//346/224/266/351/233/206/350/241/250/351/205/215/347/275/256/346/214/207/345/215/227.md +70 -0
- package/system//345/267/245/345/205/267//346/231/272/350/203/275/345/267/241/346/243/200/351/242/221/347/216/207.md +374 -0
- package/system//345/267/245/345/205/267//350/241/250/345/215/225/351/205/215/347/275/256/347/224/237/346/210/220/345/231/250.md +221 -0
- package/system//345/267/245/345/205/267//351/230/266/346/256/265/350/275/254/346/215/242/346/243/200/346/237/245/350/241/250.md +281 -0
- package/system//346/250/241/346/235/277//351/241/271/347/233/256/346/250/241/346/235/277.md +418 -0
- package/system//347/273/217/351/252/214/345/272/223.md +57 -0
- package/system//350/247/204/350/214/203/Validators/logic.md +72 -0
- package/system//350/247/204/350/214/203/Validators/smart.md +63 -0
- package/system//350/247/204/350/214/203//346/240/270/345/277/203/350/247/204/350/214/203.md +339 -0
- package/system//351/241/271/347/233/256/347/212/266/346/200/201/350/267/237/350/270/252.md +186 -0
- package/system//351/241/271/347/233/256/347/256/241/347/220/206/347/263/273/347/273/237.md +143 -0
- package/system//351/241/271/347/233/256/347/264/242/345/274/225.md +22 -0
|
@@ -0,0 +1,296 @@
|
|
|
1
|
+
# GREEN 集成测试 - PDCA Skill
|
|
2
|
+
|
|
3
|
+
## 测试目标
|
|
4
|
+
|
|
5
|
+
验证 PDCA skill 加载后的**端到端集成功能**,确保各组件协同工作正常。
|
|
6
|
+
|
|
7
|
+
---
|
|
8
|
+
|
|
9
|
+
## 场景 1:新项目创建与自动任务生成
|
|
10
|
+
|
|
11
|
+
**测试类型:** 任务自动生成集成
|
|
12
|
+
|
|
13
|
+
**前置条件:**
|
|
14
|
+
- 用户运行 `pdca new` 命令
|
|
15
|
+
- 选择 TREND 框架进行健康/体能类项目
|
|
16
|
+
- 完成问题分析(5Why 验证通过)
|
|
17
|
+
|
|
18
|
+
### 测试步骤
|
|
19
|
+
|
|
20
|
+
1. **问题分析完成检测**
|
|
21
|
+
- 系统检测到问题分析文档完成
|
|
22
|
+
- 确认 TREND 框架已选择
|
|
23
|
+
- 确认根本原因已通过 5Why 验证
|
|
24
|
+
|
|
25
|
+
2. **触发任务自动生成**
|
|
26
|
+
- PlanAgent 调用任务自动生成器
|
|
27
|
+
- AI 提取问题要素(症状、影响、历史)
|
|
28
|
+
|
|
29
|
+
3. **按维度生成任务**
|
|
30
|
+
- 根据 TREND 框架的 5 个维度拆解
|
|
31
|
+
- 每个维度生成 1-3 个具体任务
|
|
32
|
+
- 预期生成 5-15 个任务
|
|
33
|
+
|
|
34
|
+
4. **写入 Bitable 任务表**
|
|
35
|
+
- 批量创建任务记录
|
|
36
|
+
- 验证每个任务的 `来源维度` 字段对应 TREND 维度
|
|
37
|
+
- 验证每个任务的 `来源类型` 为 "问题分析生成"
|
|
38
|
+
|
|
39
|
+
5. **同步创建飞书 Task**
|
|
40
|
+
- 串行调用 `feishu_task_task.create`
|
|
41
|
+
- 验证任务标题格式:`[项目简称] T[序号] 任务标题`
|
|
42
|
+
|
|
43
|
+
6. **关联飞书 Task ID**
|
|
44
|
+
- 创建成功后获取 `task_id`
|
|
45
|
+
- 更新 Bitable 任务的 `飞书任务ID` 字段
|
|
46
|
+
|
|
47
|
+
### 预期结果
|
|
48
|
+
|
|
49
|
+
- ✅ Bitable 任务表中生成 5-15 条任务记录
|
|
50
|
+
- ✅ 所有 5 个 TREND 维度都有对应任务(训练、休息、营养、先天、日常)
|
|
51
|
+
- ✅ 所有任务的 `来源类型` 为 "问题分析生成"
|
|
52
|
+
- ✅ 所有任务都成功创建飞书 Task
|
|
53
|
+
- ✅ 所有 Bitable 任务的 `飞书任务ID` 字段已填充
|
|
54
|
+
|
|
55
|
+
### 失败条件
|
|
56
|
+
|
|
57
|
+
- ❌ 生成的任务数量 < 5 或 > 15
|
|
58
|
+
- ❌ 某些维度没有对应任务
|
|
59
|
+
- ❌ 飞书 Task 创建失败且未记录
|
|
60
|
+
- ❌ Bitable 写入格式错误
|
|
61
|
+
|
|
62
|
+
---
|
|
63
|
+
|
|
64
|
+
## 场景 2:智能巡检频率动态调整
|
|
65
|
+
|
|
66
|
+
**测试类型:** Cron 任务动态更新
|
|
67
|
+
|
|
68
|
+
**前置条件:**
|
|
69
|
+
- 项目处于 Do 阶段
|
|
70
|
+
- 项目优先级为 "高"
|
|
71
|
+
- 距离截止日期剩余时间 < 10%
|
|
72
|
+
|
|
73
|
+
### 测试步骤
|
|
74
|
+
|
|
75
|
+
1. **读取基线频率**
|
|
76
|
+
- 项目使用 TREND 框架
|
|
77
|
+
- 验证基线频率为每日 1 次(`0 9 * * *`)
|
|
78
|
+
|
|
79
|
+
2. **计算动态调整因子**
|
|
80
|
+
- 阶段因子:Do 阶段 ×1.5
|
|
81
|
+
- 紧迫度因子:高优先级 ×2
|
|
82
|
+
- 时间因子:剩余时间 < 10% ×2
|
|
83
|
+
|
|
84
|
+
3. **计算最终频率**
|
|
85
|
+
- 基线:每日 1 次
|
|
86
|
+
- 调整后:1 × 1.5 × 2 × 2 = 6 次/天
|
|
87
|
+
- 验证频率表达式(约每 4 小时 1 次)
|
|
88
|
+
|
|
89
|
+
4. **更新 Cron 任务**
|
|
90
|
+
- 删除旧巡检 Cron
|
|
91
|
+
- 创建新频率的 Cron
|
|
92
|
+
- 验证 `workspace/pdca-projects.json` 中 `cronJobs` 已更新
|
|
93
|
+
|
|
94
|
+
### 预期结果
|
|
95
|
+
|
|
96
|
+
- ✅ 频率计算公式正确应用
|
|
97
|
+
- ✅ 最终频率约为每 4 小时 1 次
|
|
98
|
+
- ✅ 旧 Cron 任务已删除
|
|
99
|
+
- ✅ 新 Cron 任务已创建并生效
|
|
100
|
+
- ✅ 项目状态文件中 jobId 已更新
|
|
101
|
+
|
|
102
|
+
### 失败条件
|
|
103
|
+
|
|
104
|
+
- ❌ 频率计算错误
|
|
105
|
+
- ❌ Cron 任务未更新
|
|
106
|
+
- ❌ 出现重复的 Cron 任务
|
|
107
|
+
|
|
108
|
+
---
|
|
109
|
+
|
|
110
|
+
## 场景 3:仪表板自动更新
|
|
111
|
+
|
|
112
|
+
**测试类型:** Wiki + Bitable 数据同步
|
|
113
|
+
|
|
114
|
+
**前置条件:**
|
|
115
|
+
- 项目有任务完成记录
|
|
116
|
+
- 项目有新增的数据收集记录
|
|
117
|
+
- 巡检 Cron 任务触发
|
|
118
|
+
|
|
119
|
+
### 测试步骤
|
|
120
|
+
|
|
121
|
+
1. **Cron 触发巡检**
|
|
122
|
+
- 巡检任务按设定频率执行
|
|
123
|
+
- 获取所有 "进行中" 状态的项目
|
|
124
|
+
|
|
125
|
+
2. **读取 Bitable 数据**
|
|
126
|
+
- 从项目主表读取基本信息
|
|
127
|
+
- 从任务表读取任务完成情况
|
|
128
|
+
- 从 data_records 表读取最新数据
|
|
129
|
+
|
|
130
|
+
3. **生成仪表板内容**
|
|
131
|
+
- 调用仪表板生成器
|
|
132
|
+
- 计算核心指标(完成度、进度等)
|
|
133
|
+
- 生成 AI 洞察摘要
|
|
134
|
+
|
|
135
|
+
4. **更新 Wiki 仪表板页面**
|
|
136
|
+
- 调用 `feishu_doc_update`
|
|
137
|
+
- 写入最新仪表板内容
|
|
138
|
+
- 包含时间戳
|
|
139
|
+
|
|
140
|
+
5. **验证数据一致性**
|
|
141
|
+
- Wiki 仪表板显示的数据与 Bitable 一致
|
|
142
|
+
- 时间戳为当前时间
|
|
143
|
+
- 图表包含最新数据点
|
|
144
|
+
|
|
145
|
+
### 预期结果
|
|
146
|
+
|
|
147
|
+
- ✅ 仪表板内容反映 Bitable 最新数据
|
|
148
|
+
- ✅ 核心指标计算正确
|
|
149
|
+
- ✅ AI 洞察与数据一致
|
|
150
|
+
- ✅ Wiki 页面更新成功
|
|
151
|
+
- ✅ 时间戳为当前巡检时间
|
|
152
|
+
|
|
153
|
+
### 失败条件
|
|
154
|
+
|
|
155
|
+
- ❌ 仪表板数据与 Bitable 不一致
|
|
156
|
+
- ❌ Wiki 更新失败
|
|
157
|
+
- ❌ 时间戳未更新
|
|
158
|
+
|
|
159
|
+
---
|
|
160
|
+
|
|
161
|
+
## 场景 4:表单数据收集与趋势图更新
|
|
162
|
+
|
|
163
|
+
**测试类型:** 数据收集集成
|
|
164
|
+
|
|
165
|
+
**前置条件:**
|
|
166
|
+
- 项目使用 TREND 框架
|
|
167
|
+
- data_records 表已创建
|
|
168
|
+
- 已配置体重追踪表单
|
|
169
|
+
|
|
170
|
+
### 测试步骤
|
|
171
|
+
|
|
172
|
+
1. **用户填写表单**
|
|
173
|
+
- 用户通过飞书表单提交数据
|
|
174
|
+
- 数据:体重 = 75kg,日期 = 2026-04-04
|
|
175
|
+
|
|
176
|
+
2. **数据写入 Bitable**
|
|
177
|
+
- 调用 `feishu_bitable_app_table_record.create`
|
|
178
|
+
- 写入 data_records 表
|
|
179
|
+
- 验证字段:记录ID、项目ID、指标名称、数值、单位、记录时间、记录人
|
|
180
|
+
|
|
181
|
+
3. **下次巡检触发**
|
|
182
|
+
- 巡检任务按频率执行
|
|
183
|
+
- 读取 data_records 表最新数据
|
|
184
|
+
|
|
185
|
+
4. **生成趋势图**
|
|
186
|
+
- 仪表板生成器读取历史数据
|
|
187
|
+
- 生成体重变化趋势图
|
|
188
|
+
- 验证新数据点包含在图表中
|
|
189
|
+
|
|
190
|
+
5. **更新仪表板**
|
|
191
|
+
- Wiki 仪表板显示最新趋势图
|
|
192
|
+
- 包含新提交的数据点
|
|
193
|
+
|
|
194
|
+
### 预期结果
|
|
195
|
+
|
|
196
|
+
- ✅ 表单数据正确写入 data_records 表
|
|
197
|
+
- ✅ 数值、单位、时间等字段完整
|
|
198
|
+
- ✅ 趋势图包含最新数据点
|
|
199
|
+
- ✅ 仪表板显示更新后的趋势
|
|
200
|
+
|
|
201
|
+
### 失败条件
|
|
202
|
+
|
|
203
|
+
- ❌ 数据写入失败或格式错误
|
|
204
|
+
- ❌ 趋势图未包含新数据
|
|
205
|
+
- ❌ 仪表板未更新
|
|
206
|
+
|
|
207
|
+
---
|
|
208
|
+
|
|
209
|
+
## 场景 5:项目完成与资源清理
|
|
210
|
+
|
|
211
|
+
**测试类型:** 项目生命周期终止
|
|
212
|
+
|
|
213
|
+
**前置条件:**
|
|
214
|
+
- Act 阶段已完成
|
|
215
|
+
- 用户确认项目结束
|
|
216
|
+
- 项目状态为 "待结项"
|
|
217
|
+
|
|
218
|
+
### 测试步骤
|
|
219
|
+
|
|
220
|
+
1. **用户确认项目结束**
|
|
221
|
+
- 用户通过飞书交互卡片确认
|
|
222
|
+
- 系统收到结项指令
|
|
223
|
+
|
|
224
|
+
2. **更新 Bitable 项目状态**
|
|
225
|
+
- 调用 `feishu_bitable_app_table_record.update`
|
|
226
|
+
- 将项目主表 `状态` 字段更新为 "已完成"
|
|
227
|
+
- 将 `当前阶段` 更新为 "已完成"
|
|
228
|
+
- 更新 `完成度` 为 100
|
|
229
|
+
|
|
230
|
+
3. **删除所有关联 Cron 任务**
|
|
231
|
+
- 读取项目的 `cronJobs` 列表
|
|
232
|
+
- 逐个调用 `cron delete` 删除
|
|
233
|
+
- 验证所有任务已删除
|
|
234
|
+
|
|
235
|
+
4. **验证资源清理**
|
|
236
|
+
- 查询 `workspace/pdca-projects.json`
|
|
237
|
+
- 确认项目 `status` 为 "已完成"
|
|
238
|
+
- 确认 `cronJobs` 数组为空
|
|
239
|
+
|
|
240
|
+
5. **生成项目总结**
|
|
241
|
+
- 从 Wiki 收集所有阶段文档
|
|
242
|
+
- 生成项目总结报告
|
|
243
|
+
- 写入经验库
|
|
244
|
+
|
|
245
|
+
### 预期结果
|
|
246
|
+
|
|
247
|
+
- ✅ Bitable 项目状态更新为 "已完成"
|
|
248
|
+
- ✅ 所有 Cron 任务已删除
|
|
249
|
+
- ✅ 项目状态文件正确更新
|
|
250
|
+
- ✅ 无残留 Cron 任务
|
|
251
|
+
- ✅ 项目总结已生成
|
|
252
|
+
|
|
253
|
+
### 失败条件
|
|
254
|
+
|
|
255
|
+
- ❌ 项目状态未更新
|
|
256
|
+
- ❌ Cron 任务未完全删除
|
|
257
|
+
- ❌ 状态文件未同步
|
|
258
|
+
- ❌ 残留 Cron 任务仍在执行
|
|
259
|
+
|
|
260
|
+
---
|
|
261
|
+
|
|
262
|
+
## 测试方法
|
|
263
|
+
|
|
264
|
+
### 测试环境要求
|
|
265
|
+
|
|
266
|
+
1. **飞书环境**
|
|
267
|
+
- 有效的飞书测试空间
|
|
268
|
+
- 已配置的 Bitable 应用
|
|
269
|
+
- 已配置的 Wiki 空间
|
|
270
|
+
|
|
271
|
+
2. **本地环境**
|
|
272
|
+
- `workspace/pdca-projects.json` 文件
|
|
273
|
+
- PDCA skill 已加载
|
|
274
|
+
- Cron 服务可用
|
|
275
|
+
|
|
276
|
+
### 执行方式
|
|
277
|
+
|
|
278
|
+
使用 Agent 工具创建**加载 pdca skill** 的 subagent,按场景执行测试。
|
|
279
|
+
|
|
280
|
+
### 测试记录模板
|
|
281
|
+
|
|
282
|
+
| 场景 | 执行时间 | 结果 | 问题描述 | 备注 |
|
|
283
|
+
|------|---------|------|---------|------|
|
|
284
|
+
| 场景1 | | PASS/FAIL | | |
|
|
285
|
+
| 场景2 | | PASS/FAIL | | |
|
|
286
|
+
| 场景3 | | PASS/FAIL | | |
|
|
287
|
+
| 场景4 | | PASS/FAIL | | |
|
|
288
|
+
| 场景5 | | PASS/FAIL | | |
|
|
289
|
+
|
|
290
|
+
---
|
|
291
|
+
|
|
292
|
+
## 版本历史
|
|
293
|
+
|
|
294
|
+
| 版本 | 日期 | 变更说明 |
|
|
295
|
+
|------|------|---------|
|
|
296
|
+
| v1.0 | 2026-04-04 | 初始版本,定义 5 个集成测试场景 |
|
|
@@ -0,0 +1,164 @@
|
|
|
1
|
+
# PDCA Skill 全面基线测试 - TDD RED Phase
|
|
2
|
+
|
|
3
|
+
## 测试目标
|
|
4
|
+
|
|
5
|
+
遵循 superpowers:writing-skills 的 TDD 方法论,在**没有加载 pdca skill**的情况下测试 Agent 基线行为,识别需要 skill 解决的问题模式。
|
|
6
|
+
|
|
7
|
+
---
|
|
8
|
+
|
|
9
|
+
## 测试场景设计
|
|
10
|
+
|
|
11
|
+
### 场景 1:框架选择一致性测试
|
|
12
|
+
|
|
13
|
+
**压力类型**:框架选择 + 跨阶段一致性
|
|
14
|
+
|
|
15
|
+
**用户输入**:
|
|
16
|
+
> 我要做一个个人 VO2max 提升项目。我的目标是把 VO2max 从 35 提升到 45 ml/kg/min。
|
|
17
|
+
|
|
18
|
+
**Plan 阶段测试**:
|
|
19
|
+
- Agent 是否正确选择 TREND 框架?
|
|
20
|
+
- 是否逐维度分析(Training/Rest/Eating/Nature/Daily)?
|
|
21
|
+
|
|
22
|
+
**Do 阶段测试**(继续对话):
|
|
23
|
+
> 我开始执行了,记录了训练数据、睡眠情况、饮食摄入。
|
|
24
|
+
|
|
25
|
+
- Agent 是否按 TREND 维度监控执行情况?
|
|
26
|
+
- 还是只关注"训练完成率"?
|
|
27
|
+
|
|
28
|
+
**Check 阶段测试**:
|
|
29
|
+
> 两个月过去了,我想看看效果。
|
|
30
|
+
|
|
31
|
+
- Agent 是否按 TREND 维度评估效果?
|
|
32
|
+
- 还是只看"VO2max 达到多少"?
|
|
33
|
+
|
|
34
|
+
**Act 阶段测试**:
|
|
35
|
+
> 我的目标没有完全达成,VO2max 只到了 40。怎么办?
|
|
36
|
+
|
|
37
|
+
- Agent 是否按 TREND 维度制定行动方案?
|
|
38
|
+
- 还是只说"增加训练强度"?
|
|
39
|
+
|
|
40
|
+
**预期基线行为(无 skill)**:
|
|
41
|
+
- ❌ Plan 可能用 4M1E(错误的框架)
|
|
42
|
+
- ❌ Do/Check/Act 可能不按维度分解
|
|
43
|
+
- ❌ 各阶段之间框架不一致
|
|
44
|
+
|
|
45
|
+
---
|
|
46
|
+
|
|
47
|
+
### 场景 2:AskUserQuestion 选项设计测试
|
|
48
|
+
|
|
49
|
+
**压力类型**:选项缺失 + 用户被迫选择
|
|
50
|
+
|
|
51
|
+
**用户输入**:
|
|
52
|
+
> 我的项目是关于团队沟通效率的,问题是我不知道具体类型。
|
|
53
|
+
|
|
54
|
+
**测试点**:
|
|
55
|
+
- Agent 使用 AskUserQuestion 询问项目类型
|
|
56
|
+
- 选项中是否包含"Other"选项?
|
|
57
|
+
|
|
58
|
+
**预期基线行为(无 skill)**:
|
|
59
|
+
- ❌ 选项可能是:技术问题、管理问题、流程问题
|
|
60
|
+
- ❌ 没有"Other"选项
|
|
61
|
+
- ❌ 用户无法选择"团队协作问题"
|
|
62
|
+
|
|
63
|
+
---
|
|
64
|
+
|
|
65
|
+
### 场景 3:Wiki 创建位置测试
|
|
66
|
+
|
|
67
|
+
**压力类型**:API 失败 + 自作主张
|
|
68
|
+
|
|
69
|
+
**用户输入**:
|
|
70
|
+
> 创建新项目"团队沟通效率提升"。
|
|
71
|
+
|
|
72
|
+
**模拟条件**:
|
|
73
|
+
- 假设 feishu_create_doc 调用失败(知识库为空或权限问题)
|
|
74
|
+
|
|
75
|
+
**测试点**:
|
|
76
|
+
- Agent 是否停止流程并报告错误?
|
|
77
|
+
- 还是自作主张在其他位置创建文件?
|
|
78
|
+
|
|
79
|
+
**预期基线行为(无 skill)**:
|
|
80
|
+
- ❌ Agent 可能在其他位置(如根目录)创建文件
|
|
81
|
+
- ❌ Agent 可能说"先创建本地文件吧"
|
|
82
|
+
- ❌ Agent 不报告明确的错误信息
|
|
83
|
+
|
|
84
|
+
---
|
|
85
|
+
|
|
86
|
+
### 场景 4:SMART 目标校验测试
|
|
87
|
+
|
|
88
|
+
**压力类型**:时间压力 + 权威压力
|
|
89
|
+
|
|
90
|
+
**用户输入**:
|
|
91
|
+
> 我们要提升客服响应速度。老板很急,要求这周就开始。目标是"提升响应速度"。
|
|
92
|
+
|
|
93
|
+
**测试点**:
|
|
94
|
+
- Agent 是否接受模糊的目标"提升响应速度"?
|
|
95
|
+
- 是否强制要求量化(如"从平均 5 分钟降到 2 分钟")?
|
|
96
|
+
- 是否在"老板很急"的压力下坚持 SMART 标准?
|
|
97
|
+
|
|
98
|
+
**预期基线行为(无 skill)**:
|
|
99
|
+
- ❌ 接受模糊目标
|
|
100
|
+
- ❌ 说"先开始,执行中再调整"
|
|
101
|
+
- ❌ 在权威压力下降低标准
|
|
102
|
+
|
|
103
|
+
---
|
|
104
|
+
|
|
105
|
+
### 场景 5:因果逻辑校验测试
|
|
106
|
+
|
|
107
|
+
**压力类型**:根因-措施不对应
|
|
108
|
+
|
|
109
|
+
**Plan 阶段用户输入**:
|
|
110
|
+
> 我们的产品缺陷率很高。经过分析,原因是:1. 设备精度不足,2. 操作员技能不够,3. 原材料质量波动。
|
|
111
|
+
> 我们的解决方案是:加强操作员培训。
|
|
112
|
+
|
|
113
|
+
**Check 阶段测试**:
|
|
114
|
+
> 我们执行了培训,但缺陷率没有明显下降。
|
|
115
|
+
|
|
116
|
+
**测试点**:
|
|
117
|
+
- Check Agent 是否识别根因-措施不对应?
|
|
118
|
+
- 是否指出"设备精度"和"原材料"没有对应措施?
|
|
119
|
+
|
|
120
|
+
**预期基线行为(无 skill)**:
|
|
121
|
+
- ❌ Check Agent 可能说"培训力度不够"
|
|
122
|
+
- ❌ 没有识别措施只覆盖了部分根因
|
|
123
|
+
- ❌ 建议继续培训而不是补充其他措施
|
|
124
|
+
|
|
125
|
+
---
|
|
126
|
+
|
|
127
|
+
### 场景 6:MECE 穷尽性测试
|
|
128
|
+
|
|
129
|
+
**压力类型**:时间压力 + 简化诱惑
|
|
130
|
+
|
|
131
|
+
**用户输入**:
|
|
132
|
+
> 我们的网站加载速度慢。用户抱怨很多。需要快速优化。
|
|
133
|
+
|
|
134
|
+
**测试点**:
|
|
135
|
+
- Agent 是否使用 PPTD 框架(People/Process/Technology/Product/Data)?
|
|
136
|
+
- 是否逐维度检查?
|
|
137
|
+
- 还是只关注"优化代码"(Technology 维度)?
|
|
138
|
+
|
|
139
|
+
**预期基线行为(无 skill)**:
|
|
140
|
+
- ❌ 直接建议"优化代码"、"使用 CDN"
|
|
141
|
+
- ❌ 没有检查 People(人员)、Process(流程)、Data(数据)等维度
|
|
142
|
+
- ❌ 遗漏可能的根本原因
|
|
143
|
+
|
|
144
|
+
---
|
|
145
|
+
|
|
146
|
+
## Rationalizations 捕获表
|
|
147
|
+
|
|
148
|
+
| 场景 | 可能的 Rationalization |
|
|
149
|
+
|------|----------------------|
|
|
150
|
+
| 1 框架一致性 | "框架太复杂,简单分析就行" |
|
|
151
|
+
| 2 选项设计 | "这些选项已经覆盖所有情况了" |
|
|
152
|
+
| 3 Wiki 创建 | "创建在根目录更方便" / "先创建本地文件吧" |
|
|
153
|
+
| 4 SMART 校验 | "老板很急,先开始吧" / "执行中再调整" |
|
|
154
|
+
| 5 逻辑校验 | "先执行这个措施,看看效果" |
|
|
155
|
+
| 6 MECE 穷尽性 | "这个问题很明显,不需要逐维度分析" |
|
|
156
|
+
|
|
157
|
+
---
|
|
158
|
+
|
|
159
|
+
## 下一步(GREEN 阶段)
|
|
160
|
+
|
|
161
|
+
1. 运行这些基线测试场景
|
|
162
|
+
2. 记录 Agent 的实际行为
|
|
163
|
+
3. 与当前 skill 内容对比
|
|
164
|
+
4. 识别 skill 是否覆盖了所有问题
|
|
@@ -0,0 +1,156 @@
|
|
|
1
|
+
# PDCA Skill 合规性验证 - TDD GREEN Phase
|
|
2
|
+
|
|
3
|
+
## 验证目标
|
|
4
|
+
|
|
5
|
+
检查当前 PDCA skill 是否覆盖了基线测试中识别的所有问题模式。
|
|
6
|
+
|
|
7
|
+
---
|
|
8
|
+
|
|
9
|
+
## 逐场景验证
|
|
10
|
+
|
|
11
|
+
### ✅ 场景 1:框架选择一致性
|
|
12
|
+
|
|
13
|
+
| 检查项 | 位置 | 状态 |
|
|
14
|
+
|--------|------|------|
|
|
15
|
+
| 11 个框架定义 | `SKILL.md` 框架选择指南 | ✅ |
|
|
16
|
+
| TREND 框架(健康/体能) | `SKILL.md` / `PlanAgent.md` | ✅ |
|
|
17
|
+
| Do 阶段框架延续 | `DoAgent.md` 框架维度监控 | ✅ |
|
|
18
|
+
| Check 阶段框架延续 | `CheckAgent.md` 框架维度评估 | ✅ |
|
|
19
|
+
| Act 阶段框架延续 | `ActAgent.md` 框架维度行动 | ✅ |
|
|
20
|
+
| 逻辑校验检查框架一致性 | `logic.md` 框架一致性检查 | ✅ |
|
|
21
|
+
|
|
22
|
+
**结论**:✅ 完全覆盖
|
|
23
|
+
|
|
24
|
+
---
|
|
25
|
+
|
|
26
|
+
### ✅ 场景 2:AskUserQuestion 选项设计
|
|
27
|
+
|
|
28
|
+
| 检查项 | 位置 | 状态 |
|
|
29
|
+
|--------|------|------|
|
|
30
|
+
| 必须包含 Other 选项 | `SKILL.md` 用户交互规范 | ✅ |
|
|
31
|
+
| 正确/错误示例 | `SKILL.md` | ✅ |
|
|
32
|
+
| Red Flags | `SKILL.md` | ✅ |
|
|
33
|
+
| Rationalization 防御 | `SKILL.md` | ✅ |
|
|
34
|
+
|
|
35
|
+
**结论**:✅ 完全覆盖
|
|
36
|
+
|
|
37
|
+
---
|
|
38
|
+
|
|
39
|
+
### ✅ 场景 3:Wiki 创建位置
|
|
40
|
+
|
|
41
|
+
| 检查项 | 位置 | 状态 |
|
|
42
|
+
|--------|------|------|
|
|
43
|
+
| 禁止在其他位置创建 | `SKILL.md` Common Mistakes | ✅ |
|
|
44
|
+
| 创建失败必须停止 | `SKILL.md` Red Flags | ✅ |
|
|
45
|
+
| 错误报告模板 | `feishu-integration.md` | ✅ |
|
|
46
|
+
| Rationalization 防御 | `SKILL.md` | ✅ |
|
|
47
|
+
| 正确的 API 调用方式 | `feishu-integration.md` | ✅ |
|
|
48
|
+
|
|
49
|
+
**结论**:✅ 完全覆盖
|
|
50
|
+
|
|
51
|
+
---
|
|
52
|
+
|
|
53
|
+
### ✅ 场景 4:SMART 目标校验
|
|
54
|
+
|
|
55
|
+
| 检查项 | 位置 | 状态 |
|
|
56
|
+
|--------|------|------|
|
|
57
|
+
| SMART 校验标准 | `_系统/规范/Validators/smart.md` | ✅ |
|
|
58
|
+
| PlanAgent 引用 SMART | `PlanAgent.md` | ✅ |
|
|
59
|
+
| Red Flags | `SKILL.md` | ✅ |
|
|
60
|
+
| Rationalization 防御 | `SKILL.md` | ✅ |
|
|
61
|
+
|
|
62
|
+
**结论**:✅ 完全覆盖
|
|
63
|
+
|
|
64
|
+
---
|
|
65
|
+
|
|
66
|
+
### ✅ 场景 5:因果逻辑校验
|
|
67
|
+
|
|
68
|
+
| 检查项 | 位置 | 状态 |
|
|
69
|
+
|--------|------|------|
|
|
70
|
+
| 根因-措施映射检查 | `_系统/规范/Validators/logic.md` | ✅ |
|
|
71
|
+
| 一票否决制 | `logic.md` | ✅ |
|
|
72
|
+
| 框架维度一致性检查 | `logic.md` | ✅ |
|
|
73
|
+
|
|
74
|
+
**结论**:✅ 完全覆盖
|
|
75
|
+
|
|
76
|
+
---
|
|
77
|
+
|
|
78
|
+
### ✅ 场景 6:MECE 穷尽性
|
|
79
|
+
|
|
80
|
+
| 检查项 | 位置 | 状态 |
|
|
81
|
+
|--------|------|------|
|
|
82
|
+
| MECE 框架选择指南 | `SKILL.md` | ✅ |
|
|
83
|
+
| 穷尽性扫描要求 | `PlanAgent.md` | ✅ |
|
|
84
|
+
| MECE 检查清单 | `PlanAgent.md` | ✅ |
|
|
85
|
+
| Red Flags | `SKILL.md` | ✅ |
|
|
86
|
+
|
|
87
|
+
**结论**:✅ 完全覆盖
|
|
88
|
+
|
|
89
|
+
---
|
|
90
|
+
|
|
91
|
+
## Rationalization 防御覆盖验证
|
|
92
|
+
|
|
93
|
+
| Rationalization | 防御位置 | 状态 |
|
|
94
|
+
|----------------|----------|------|
|
|
95
|
+
| "框架太复杂,简单问一下就行" | `SKILL.md` Rationalization 表 | ✅ |
|
|
96
|
+
| "这些选项已经覆盖所有情况了" | `SKILL.md` Rationalization 表 | ✅ |
|
|
97
|
+
| "创建在根目录更方便" | `SKILL.md` Rationalization 表 | ✅ |
|
|
98
|
+
| "老板很急,先开始吧" | `SKILL.md` Rationalization 表 | ✅ |
|
|
99
|
+
| "先执行这个措施,看看效果" | `logic.md` 有效性验证 | ✅ |
|
|
100
|
+
| "这个问题很明显,不需要逐维度分析" | `PlanAgent.md` Red Flags | ✅ |
|
|
101
|
+
|
|
102
|
+
---
|
|
103
|
+
|
|
104
|
+
## 潜在漏洞识别
|
|
105
|
+
|
|
106
|
+
### ⚠️ 漏洞 1:框架选择决策逻辑
|
|
107
|
+
|
|
108
|
+
**问题**:Agent 可能不知道如何选择框架
|
|
109
|
+
|
|
110
|
+
**当前状态**:
|
|
111
|
+
- ✅ 有框架选择指南表格
|
|
112
|
+
- ✅ 有决策树
|
|
113
|
+
- ❌ **缺少**:明确的"第一步:判断问题类型"的指令
|
|
114
|
+
|
|
115
|
+
**建议**:在 PlanAgent 开头添加框架选择的强制检查点
|
|
116
|
+
|
|
117
|
+
---
|
|
118
|
+
|
|
119
|
+
### ⚠️ 漏洞 2:Do/Check/Act 阶段如何知道 Plan 用了哪个框架
|
|
120
|
+
|
|
121
|
+
**问题**:Do/Check/Act Agent 如何知道 Plan 阶段选择了哪个框架?
|
|
122
|
+
|
|
123
|
+
**当前状态**:
|
|
124
|
+
- ✅ 定义了各阶段应该如何使用框架
|
|
125
|
+
- ❌ **缺少**:框架信息的传递机制
|
|
126
|
+
|
|
127
|
+
**建议**:
|
|
128
|
+
- 在 `项目信息.md` 中添加"选择框架"字段
|
|
129
|
+
- Do/Check/Act 阶段开始时必须先读取框架信息
|
|
130
|
+
|
|
131
|
+
---
|
|
132
|
+
|
|
133
|
+
### ⚠️ 漏洞 3:项目模板未更新
|
|
134
|
+
|
|
135
|
+
**问题**:`项目模板.md` 和 `assets/project-template.md` 是否包含框架信息?
|
|
136
|
+
|
|
137
|
+
**建议**:检查并更新模板
|
|
138
|
+
|
|
139
|
+
---
|
|
140
|
+
|
|
141
|
+
## GREEN 阶段结论
|
|
142
|
+
|
|
143
|
+
**总体评估**:✅ 基本覆盖所有基线问题
|
|
144
|
+
|
|
145
|
+
**需要 REFACTOR 的项目**:
|
|
146
|
+
1. 添加框架选择的强制检查点
|
|
147
|
+
2. 定义框架信息传递机制
|
|
148
|
+
3. 更新项目模板
|
|
149
|
+
|
|
150
|
+
---
|
|
151
|
+
|
|
152
|
+
## 下一步(REFACTOR 阶段)
|
|
153
|
+
|
|
154
|
+
1. 修复识别的 3 个潜在漏洞
|
|
155
|
+
2. 运行测试验证修复
|
|
156
|
+
3. 识别新的 rationalizations
|
package/package.json
ADDED
|
@@ -0,0 +1,31 @@
|
|
|
1
|
+
{
|
|
2
|
+
"name": "@feng-h/pdca-skill",
|
|
3
|
+
"version": "1.0.0",
|
|
4
|
+
"description": "PDCA project management system for Feishu/Lark integration with AI-driven workflow",
|
|
5
|
+
"keywords": [
|
|
6
|
+
"skills",
|
|
7
|
+
"pdca",
|
|
8
|
+
"feishu",
|
|
9
|
+
"lark",
|
|
10
|
+
"project-management",
|
|
11
|
+
"manufacturing",
|
|
12
|
+
"quality-improvement"
|
|
13
|
+
],
|
|
14
|
+
"author": "Feng-H",
|
|
15
|
+
"license": "MIT",
|
|
16
|
+
"repository": {
|
|
17
|
+
"type": "git",
|
|
18
|
+
"url": "git+https://github.com/Feng-H/PDCA-with-AI.git"
|
|
19
|
+
},
|
|
20
|
+
"bugs": {
|
|
21
|
+
"url": "https://github.com/Feng-H/PDCA-with-AI/issues"
|
|
22
|
+
},
|
|
23
|
+
"homepage": "https://github.com/Feng-H/PDCA-with-AI#readme",
|
|
24
|
+
"files": [
|
|
25
|
+
"SKILL.md",
|
|
26
|
+
"assets/",
|
|
27
|
+
"system/",
|
|
28
|
+
"README.md",
|
|
29
|
+
"CLAUDE.md"
|
|
30
|
+
]
|
|
31
|
+
}
|