@shirayner/ace 0.1.2 → 0.1.3-snapshot.1
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
- package/package.json +1 -1
- package/plugin/.claude-plugin/plugin.json +1 -1
- package/plugin/skills/auto-goal/SKILL.md +93 -210
- package/plugin/skills/coding/SKILL.md +8 -13
- package/src/core/installer.js +9 -0
- package/templates/rules/ace/interactive-clarify.md +1 -1
- package/templates/settings.json +1 -0
package/package.json
CHANGED
|
@@ -4,273 +4,156 @@ description: |
|
|
|
4
4
|
自主完成目标的AI Skill。当用户需要完成复杂目标、项目、任务或学习需求时使用此skill。
|
|
5
5
|
触发词:"帮我实现..."、"完成...目标"、"搞定...任务"、"自动完成..."、"逐步完成..."、
|
|
6
6
|
"学习..."、"教程"、"入门"、"深入理解..."、"掌握..."、"什么是XXX"、"如何学习XXX"、"请讲解XXX"
|
|
7
|
-
核心:六字原则 +
|
|
7
|
+
核心:六字原则 + 对齐优先 + 上下文工程 + 状态外化。信任模型原生能力,只做模型不会自发做的事。
|
|
8
8
|
---
|
|
9
9
|
|
|
10
10
|
# Auto Goal Skill
|
|
11
11
|
|
|
12
|
-
|
|
12
|
+
自主完成目标的赋能系统。信任模型的推理能力,只做模型不会自发做的事。
|
|
13
13
|
|
|
14
|
-
|
|
15
|
-
|
|
16
|
-
## 六字原则(始终生效)
|
|
17
|
-
|
|
18
|
-
| 字 | 含义 | 自检 |
|
|
19
|
-
|----|------|------|
|
|
20
|
-
| **序** | 理解与行动螺旋深化 | 理解够启动下一步吗? |
|
|
21
|
-
| **验** | 用事实闭环,证伪导向 | 什么条件下结论不成立? |
|
|
22
|
-
| **深** | 多问一层为什么 | 到根因层了吗? |
|
|
23
|
-
| **广** | 系统中定位局部 | 改动影响传向何方? |
|
|
24
|
-
| **辨** | 区分事实/推断/假设 | FACT / INFER / ASSUME? |
|
|
25
|
-
| **简** | 复杂度需要理由 | 能更简单吗? |
|
|
14
|
+
**核心信念**:对齐优先于效率。准确完成用户真正想要的,胜过高效完成 agent 以为的。
|
|
26
15
|
|
|
27
16
|
---
|
|
28
17
|
|
|
29
|
-
##
|
|
18
|
+
## 三条硬规则(不可跳过)
|
|
30
19
|
|
|
31
|
-
###
|
|
20
|
+
### 规则 1:首轮对齐(MANDATORY — 优先于 auto mode)
|
|
32
21
|
|
|
33
|
-
|
|
22
|
+
接收目标后,**必须完成以下三步才能开始执行**。
|
|
34
23
|
|
|
35
|
-
|
|
36
|
-
|----|------|------|
|
|
37
|
-
| **Clear** | 因果明确,已知解法 | 感知→分类→响应。直接执行最佳实践 |
|
|
38
|
-
| **Complicated** | 因果可分析,需专业知识 | 感知→分析→响应。探索后规划执行 |
|
|
39
|
-
| **Complex** | 因果仅事后可见,涌现性 | 试探→感知→响应。小步实验,观察涌现 |
|
|
40
|
-
| **Chaotic** | 无稳定因果 | 行动→感知→响应。先止血再诊断 |
|
|
24
|
+
**Step 1: 初步分析** — 结合已有上下文(memory、CLAUDE.md、git status、会话历史)和探索性工具(Read/Grep/Glob/Agent),形成对目标的理解。
|
|
41
25
|
|
|
42
|
-
|
|
26
|
+
**Step 2: 澄清** — **调用 AskUserQuestion 工具**向用户批量澄清歧义和关键决策点。复杂项目可多轮澄清。仅当目标完全明确无歧义时可跳过。
|
|
43
27
|
|
|
44
|
-
|
|
28
|
+
**Step 3: 对齐确认(不可跳过)** — 用普通文本(markdown)向用户呈现对齐内容:
|
|
29
|
+
1. **我的理解** — 复述目标核心意图
|
|
30
|
+
2. **计划方向** — 打算怎么做(高层策略)
|
|
31
|
+
3. **关键假设** — 不确定的假设,标注出来
|
|
32
|
+
4. **完成标准** — "我认为完成的标志是..."(必须可测试,描述需求状态而非执行命令)
|
|
45
33
|
|
|
46
|
-
|
|
34
|
+
呈现完毕后,**调用 AskUserQuestion 工具**让用户确认或补充。确认后才能开始执行。
|
|
47
35
|
|
|
48
|
-
|
|
49
|
-
|-------------|------|------|
|
|
50
|
-
| **低**(EXPLICIT) | 用户指令具体、验收标准明确、无歧义 | 按域策略自主执行 |
|
|
51
|
-
| **中**(ALIGNED) | 可从上下文合理推断,但存在假设 | 标注假设,关键分叉点确认 |
|
|
52
|
-
| **高**(GUESSING) | 目标抽象/多义、存在多可行方案、涉及偏好 | **先澄清再执行**,无论技术域是什么 |
|
|
36
|
+
### 规则 2:替用户做选择时,必须暂停
|
|
53
37
|
|
|
54
|
-
|
|
55
|
-
-
|
|
56
|
-
- 存在 ≥2 个可行方案且各有取舍
|
|
38
|
+
模型最危险的特征是自信地做错事。以下情况**必须暂停,向用户呈现选项**:
|
|
39
|
+
- 存在多个可行方案且各有取舍
|
|
57
40
|
- 决策依赖用户偏好(风格、架构、优先级)
|
|
58
|
-
-
|
|
59
|
-
-
|
|
41
|
+
- 范围超出原始目标描述
|
|
42
|
+
- 不可逆操作(删除、重写、架构变更)
|
|
43
|
+
- 正在用自己的理解填补用户未说明的部分
|
|
60
44
|
|
|
61
|
-
|
|
45
|
+
**一句话判断**:如果用户此刻看到我的决策会惊讶 → 暂停询问。
|
|
62
46
|
|
|
63
|
-
###
|
|
47
|
+
### 规则 3:长任务外化状态
|
|
64
48
|
|
|
65
|
-
|
|
49
|
+
预估超过 10 步的任务,**用户确认对齐后、首个执行动作前**,必须创建 `.tasks/auto-goal-{id}/state.md`。这是从对齐到执行的过渡门——不创建就不开始执行。执行中发现任务超出预估时同理。
|
|
66
50
|
|
|
67
|
-
|
|
51
|
+
设计目标:**让一个全新 agent 读完 state.md 后能定位自己,按需加载 Tier 2 后能以 80% 效率继续**。
|
|
68
52
|
|
|
69
|
-
|
|
70
|
-
1. **我的理解** — 用一两句话复述目标的核心意图
|
|
71
|
-
2. **计划方向** — 打算怎么做(高层策略,不是细节)
|
|
72
|
-
3. **关键假设** — 我做了哪些假设(如果有)
|
|
73
|
-
4. **待确认项** — 有歧义或需要用户选择的地方(如果有)
|
|
53
|
+
**分层架构(懒加载)**:
|
|
74
54
|
|
|
75
|
-
**用户确认后**才进入 OODA 循环。用户纠正 → 更新理解 → 可能需要再次对齐。
|
|
76
|
-
|
|
77
|
-
```
|
|
78
|
-
接收目标 → 初步分析(域判断 + 对齐评估 + 深度估算)
|
|
79
|
-
↓
|
|
80
|
-
⚡首轮对齐(MANDATORY)
|
|
81
|
-
向用户呈现:理解 + 方向 + 假设 → 等待确认
|
|
82
|
-
用户确认 → 进入执行 ┃ 用户纠正 → 更新理解 → 再次对齐
|
|
83
|
-
↓
|
|
84
55
|
```
|
|
85
|
-
|
|
86
|
-
|
|
87
|
-
|
|
88
|
-
|
|
89
|
-
|
|
90
|
-
│ Sense :状态?变化?新信息?⚡弱信号+外围扫描 │
|
|
91
|
-
│ Orient :距目标多远?心智模型需要更新吗? │
|
|
92
|
-
│ Decide :策略 + 推理模式 + 深度 + 验证标准 │
|
|
93
|
-
│ ⚡Align :对齐门控(方向性决策时触发) │
|
|
94
|
-
│ Act :识别即行动 or 完整分析(= 检验假设) │
|
|
95
|
-
│ Observe:结果 vs 预期?验证精度匹配风险级别 │
|
|
96
|
-
│ Adapt :更新理解,调节深度/域/对齐,外化状态 │
|
|
97
|
-
│ │
|
|
98
|
-
│ → 循环,直到目标满足或触发降级 │
|
|
99
|
-
└─────────────────────────────────────────────────┘
|
|
100
|
-
↓
|
|
101
|
-
终态验证(证伪导向) → 交付结果
|
|
56
|
+
.tasks/auto-goal-{id}/
|
|
57
|
+
├── state.md # Tier 1:核心状态索引(≤40 行,恢复必读)
|
|
58
|
+
├── context.md # Tier 2:世界模型详情(按需创建/加载)
|
|
59
|
+
├── decisions.md # Tier 2:决策日志(按需创建/加载)
|
|
60
|
+
└── reflections.md # Tier 2:反思日志(按需创建/加载)
|
|
102
61
|
```
|
|
103
62
|
|
|
104
|
-
|
|
105
|
-
|
|
106
|
-
- **对齐门控**(Align,Decide→Act 之间的强制检查):每个方向性决策前自问三个问题:① 这个决策涉及方向/偏好/取舍吗?② 我是在执行用户的指令,还是在替用户做选择?③ 如果用户此刻看到我的决策,会惊讶吗?——**任一为 YES → 暂停,向用户呈现选项并等待确认**。全部为 NO → 执行。这不是"每步都问",而是**只在方向性决策点问**
|
|
107
|
-
- **弱信号检测**(Sense):不等失败才反应。主动扫描——进展在减速?假设在累积未验证?复杂度在悄然上升?发现弱信号 → 升级深度或回到 Orient。模糊时先恢复情境意识
|
|
108
|
-
- **假设驱动行动**(Act):**已知模式→验证模式适用性→对齐门控→行动**;**未知→完整分析**。每步先生成预期结果,再行动,后对比。**警惕**:"识别到模式"≠"理解用户的具体需求"——模式匹配前必须确认:此模式的前提在当前场景中成立吗?用户的需求是否偏离标准模式?
|
|
109
|
-
- **推理模式选择**(Decide):不可逆选择→生成备选评估后决策;置信度低→多角度推理检查收敛;关键输出完成→切换为怀疑论审查者
|
|
110
|
-
- **验证精度分级**(Observe):微验证(低风险,心理校验)/ 标准验证(中风险,工具确认)/ 深度验证(高风险/不可逆,交叉证伪)
|
|
111
|
-
- **深度调节**(1=自动…4=全面):升级信号:偏离/新复杂度/验证失败/弱信号;降级信号:连续顺利/模式匹配/不确定性收敛
|
|
112
|
-
- **熔断器**(持续):同一子问题重试 > 3 次→换策略或求助;探索超阶段预算→强制转向;每 5 步→目标漂移 + 偏差累积检查
|
|
113
|
-
- **偏差累积检测**(持续):追踪未经用户确认的假设数量。0-1 个→继续;2-3 个→下一个决策点主动确认;>3 个→**立即暂停**,向用户同步当前理解和已做假设。小偏差是大偏差的前兆
|
|
114
|
-
- **终态证伪**:不问"能运行吗?",问"什么条件下会失败?"
|
|
63
|
+
**Tier 1 — state.md**(始终加载,严格控制体积):
|
|
115
64
|
|
|
65
|
+
```markdown
|
|
66
|
+
---
|
|
67
|
+
status: in-progress
|
|
68
|
+
last-updated: {timestamp}
|
|
116
69
|
---
|
|
117
70
|
|
|
118
|
-
##
|
|
119
|
-
|
|
120
|
-
|
|
121
|
-
|
|
122
|
-
### 澄清(Clarify)
|
|
123
|
-
消除歧义,对齐理解。区分表面需求与真实需求,检验问题框架是否最优。
|
|
124
|
-
|
|
125
|
-
**核心原则:对齐优先 — 技术实现细节能推断就自己做;方向、偏好、取舍必须确认。**
|
|
126
|
-
|
|
127
|
-
**Must-Ask 触发器(硬性,命中任一必须向用户提问)**:
|
|
128
|
-
1. **方案分叉** — 存在 ≥2 个可行方案且各有明显取舍
|
|
129
|
-
2. **范围扩张** — 执行中发现需要做的超出原始目标描述
|
|
130
|
-
3. **假设填补** — 用户目标中有模糊处,agent 正在用自己的理解"填空"
|
|
131
|
-
4. **不可逆操作** — 删除、重写、架构变更
|
|
132
|
-
5. **偏好依赖** — 决策取决于用户的风格/优先级/口味
|
|
71
|
+
## 目标与完成标准
|
|
72
|
+
[用户确认的目标]
|
|
73
|
+
- [ ] 可测试的完成标准 1
|
|
74
|
+
- [ ] 可测试的完成标准 2
|
|
133
75
|
|
|
134
|
-
|
|
135
|
-
|
|
136
|
-
|
|
137
|
-
|
|
76
|
+
## 进度
|
|
77
|
+
### Phase 1: {name} [done]
|
|
78
|
+
### Phase 2: {name} [active]
|
|
79
|
+
- [x] 已完成子任务
|
|
80
|
+
- [ ] → 当前进行中
|
|
81
|
+
- [ ] 待做子任务
|
|
82
|
+
### Phase 3: {name} [pending]
|
|
138
83
|
|
|
139
|
-
|
|
84
|
+
## 已修改文件
|
|
140
85
|
|
|
141
|
-
|
|
142
|
-
获取知识,识别最佳实践和风险。**在 sub-agent 中执行**,只将摘要返回主上下文。交叉验证关键信息,标注置信度。**觅食启发**:跟踪信息气味(相关性信号)→ 收益递减时果断换源 → 探索超总预算 30% 停止。**认知行动合法**:为理解而做的探索(临时测试、中间状态打印)是投资非浪费。
|
|
86
|
+
## 下一步
|
|
143
87
|
|
|
144
|
-
|
|
145
|
-
将目标分解为可验证的交付物。**目标层级**:完整目标 / 核心目标 / 最小可交付——规划时即定义降级边界。**瓶颈优先**:识别制约整体进展的关键约束,集中资源突破。倾向简单方案,识别依赖,插入检查点。**Pre-mortem**:假设计划已失败——最可能原因是什么?
|
|
88
|
+
## 活跃风险与未确认假设
|
|
146
89
|
|
|
147
|
-
|
|
148
|
-
|
|
90
|
+
## Tier 2 索引
|
|
91
|
+
| 文件 | 摘要 | 条目数 |
|
|
92
|
+
|------|------|--------|
|
|
93
|
+
```
|
|
149
94
|
|
|
150
|
-
|
|
151
|
-
**
|
|
95
|
+
**Tier 2 — 按需加载**(agent 根据当前需要自行决定加载):
|
|
96
|
+
- **context.md** — 环境上下文(技术栈、项目结构发现)、约束空间(不可行路径、硬限制)、信念状态(✓已验证 / ~假设 / ?待验)
|
|
97
|
+
- **decisions.md** — 关键决策 + 理由 + 被排除的替代方案
|
|
98
|
+
- **reflections.md** — 失败根因 + 揭示的错误假设 + 策略调整
|
|
152
99
|
|
|
153
100
|
---
|
|
154
101
|
|
|
155
|
-
##
|
|
156
|
-
|
|
157
|
-
上下文窗口是工作记忆,主动管理而非被动耗尽。
|
|
158
|
-
|
|
159
|
-
| 策略 | 做法 | 时机 |
|
|
160
|
-
|------|------|------|
|
|
161
|
-
| **隔离** | 探索性工作用 sub-agent,只回传摘要 | 搜索、读大文件、查资料 |
|
|
162
|
-
| **压缩** | 已完成阶段压缩为摘要,保留决策和结论 | 每个大阶段完成后 |
|
|
163
|
-
| **外化** | 关键中间结果写入状态文件 | 做出重要决策、发现关键信息 |
|
|
164
|
-
| **按需加载** | 根据当前阶段拉入相关上下文 | 每步开始前 |
|
|
102
|
+
## 生成式原则(引导方向,不规定过程)
|
|
165
103
|
|
|
166
|
-
|
|
104
|
+
以下原则指定**方向**,模型自主决定**如何**执行:
|
|
167
105
|
|
|
168
|
-
|
|
106
|
+
1. **先定义完成,再开始执行** — 每个目标都需要可测试的完成标准。验证力度匹配错误成本
|
|
107
|
+
2. **承诺当前计划,卡住时换方向** — 新信息更新信念,不自动更新计划。同一方法连续失败时换策略,三次失败后质疑前提。每次意外失败都问:这揭示了哪个假设是错的?
|
|
108
|
+
3. **永不空手而归** — 任意时刻中断都应有可用产出。按价值排序交付
|
|
109
|
+
4. **上下文是稀缺资源** — 探索性工作用 sub-agent 隔离;大阶段完成后压缩保留决策和结论;关键中间结果外化到文件
|
|
110
|
+
5. **对齐不是一次性事件** — 发现目标理解偏差时,回到对齐。连续成功对齐后可降低确认频率,遇到意外时重新提高
|
|
169
111
|
|
|
170
112
|
---
|
|
171
113
|
|
|
172
|
-
##
|
|
114
|
+
## 上下文纪律
|
|
173
115
|
|
|
174
|
-
|
|
175
|
-
|
|
176
|
-
|
|
177
|
-
|
|
116
|
+
| 策略 | 时机 |
|
|
117
|
+
|------|------|
|
|
118
|
+
| **隔离** — 搜索/读大文件/查资料用 sub-agent | 会污染主上下文的工作 |
|
|
119
|
+
| **压缩** — 已完成阶段只保留决策和结论 | 大阶段完成后 |
|
|
120
|
+
| **外化** — 关键发现/决策写入状态文件 | 重要信息出现时 |
|
|
178
121
|
|
|
179
|
-
|
|
180
|
-
|
|
181
|
-
### 意图置信度(与信息分级正交)
|
|
182
|
-
- **EXPLICIT** — 用户明确说了(原话/明确指令)
|
|
183
|
-
- **ALIGNED** — 可从上下文合理推断(标注推断依据)
|
|
184
|
-
- **GUESSING** — 在替用户做选择(必须提问确认)
|
|
185
|
-
|
|
186
|
-
**决策矩阵**:意图 GUESSING 时**必须问用户**,无论技术置信度多高。技术能力不补偿对齐缺失。
|
|
187
|
-
|
|
188
|
-
### Reflect-then-Retry
|
|
189
|
-
遇到意外时(失败、意外成功、意外副作用),不直接重试,先结构化反思(写入 reflections.md):
|
|
190
|
-
1. 失败现象 vs 预期偏差
|
|
191
|
-
2. 根因分类:理解偏差 / 知识不足 / 规划缺陷 / 执行错误 / 环境变化
|
|
192
|
-
3. **溯因诊断**:生成竞争假设,按可测试性排序,优先证伪最易检验的;暴露未言明的前提
|
|
193
|
-
4. 修正策略(必须可执行,"更仔细"不算)
|
|
194
|
-
5. 重试前**必须**读取之前的反思记录
|
|
195
|
-
6. 三次反思后仍无法解决 → 先质疑前提(是否在解决错误的问题?),再向用户透明报告
|
|
196
|
-
7. **成功解剖**:捕获意外有效方案 + 使其成功的关键适应性调整,持久化为可复用启发式
|
|
197
|
-
|
|
198
|
-
### 优雅降级
|
|
199
|
-
永不空手而归。**Anytime 原则**:任意时刻中断都有可用产出。面对压力三态响应:**吸收**(重试/回退)→ **适应**(换策略/重规划)→ **转化**(重定义问题/升级给用户)。
|
|
200
|
-
交付物逐级降级:
|
|
201
|
-
- **L0** 完整交付 → **L1** 核心交付(标注未完成次要部分)
|
|
202
|
-
- **L2** 部分交付(已验证部分 + 未完成原因)→ **L3** 分析交付(问题理解 + 已探索方案 + 建议路径)
|
|
122
|
+
压缩时必须保留:当前目标、完成标准、关键决策及理由、已修改文件、未完成待办。
|
|
203
123
|
|
|
204
124
|
---
|
|
205
125
|
|
|
206
|
-
##
|
|
126
|
+
## 恢复协议
|
|
207
127
|
|
|
208
|
-
|
|
209
|
-
.tasks/auto-goal-{id}/
|
|
210
|
-
|
|
211
|
-
|
|
212
|
-
|
|
213
|
-
|
|
214
|
-
|
|
128
|
+
恢复中断的任务时:
|
|
129
|
+
1. 读取 `.tasks/auto-goal-{id}/state.md`(Tier 1 定位)
|
|
130
|
+
2. 验证声称的产出是否真实存在(Glob/Read 轻量确认)
|
|
131
|
+
3. 根据当前需要加载 Tier 2 文件
|
|
132
|
+
4. 读取 `.tasks/experience.md` 摘要(如存在)
|
|
133
|
+
5. 用 TaskCreate 重建 UI 进度
|
|
134
|
+
6. 从"下一步"继续
|
|
215
135
|
|
|
216
|
-
|
|
136
|
+
---
|
|
217
137
|
|
|
218
|
-
|
|
219
|
-
- **当前域判断** + **深度级别**
|
|
220
|
-
- **心智模型**:当前理解——关键假设、已验证事实、未知区域
|
|
221
|
-
- **进度概览**(已完成 / 进行中 / 待做)+ **下一步行动**
|
|
222
|
-
- 深度 ≥ 3:阶段分解(步骤 / 验证条件 / 完成摘要)
|
|
223
|
-
- **延迟意图**:`When [条件] do [行动]` 格式,阶段边界自动检查
|
|
224
|
-
- 编码任务:追踪已修改文件
|
|
138
|
+
## 经验进化
|
|
225
139
|
|
|
226
|
-
|
|
140
|
+
**触发时机**:任务完成、**向用户交付结果前**。无论任务大小,都执行此步。
|
|
227
141
|
|
|
228
|
-
|
|
142
|
+
**项目级** — 提取本次经验写入 `.tasks/experience.md`:
|
|
143
|
+
- 每条经验:场景 / 发现 / 适用范围
|
|
144
|
+
- 新任务开始时读取 experience.md,应用经验时告知用户("基于经验 E3,采用…")
|
|
145
|
+
- 每次应用后记录验证结果(✓有效 / ✗无效 / — 不适用)
|
|
146
|
+
- 收敛:条目 >20 条时合并相似、淘汰无效
|
|
229
147
|
|
|
230
|
-
|
|
148
|
+
**全局提升** — 经验累计 3+ 次 ✓有效 后:
|
|
149
|
+
- **必须调用 AskUserQuestion** 向用户提议提升至 `~/.claude/memory/`
|
|
150
|
+
- 用户确认后写入全局,拒绝则标记为"仅项目级"
|
|
231
151
|
|
|
232
152
|
---
|
|
233
153
|
|
|
234
154
|
## 介入模式
|
|
235
155
|
|
|
236
|
-
|
|
237
|
-
|
|
238
|
-
### 协作模式(默认)— 关键路径确认制
|
|
239
|
-
|
|
240
|
-
**默认姿态**:方向自主探索,**关键路径决策前呈现方案等待确认**。
|
|
241
|
-
|
|
242
|
-
**关键路径**(必须确认的节点):
|
|
243
|
-
1. **首轮对齐** — **MANDATORY,不可跳过**,初步分析后必须呈现理解并等待确认
|
|
244
|
-
2. **方案选择时** — 多条路径中选一条,呈现取舍
|
|
245
|
-
3. **范围变更时** — 做的比要求的多或少
|
|
246
|
-
4. **中间里程碑** — 大任务的阶段性交付确认
|
|
247
|
-
5. **任何 Must-Ask 触发器命中时**
|
|
248
|
-
|
|
249
|
-
### 两种模式的共同底线
|
|
250
|
-
|
|
251
|
-
| 操作类型 | 默认行为 |
|
|
252
|
-
|----------|----------|
|
|
253
|
-
| 可逆、影响范围小、意图 EXPLICIT | 自主执行,事后简报 |
|
|
254
|
-
| 不可逆或影响范围大 | **执行前确认** |
|
|
255
|
-
| 涉及用户偏好/价值判断 | **提供选项,等待决策** |
|
|
256
|
-
| 目标/方向性调整 | **始终询问** |
|
|
257
|
-
| 意图 GUESSING | **始终询问**,无论操作大小 |
|
|
258
|
-
|
|
259
|
-
### 用户视角模拟
|
|
260
|
-
|
|
261
|
-
在关键决策点,切换到用户视角自检:**"如果用户此刻看到我正在做的事和我的推理过程,他们会 (a) 点头认可 (b) 感到惊讶 (c) 说'不,我要的不是这个'"。** (b)(c) → 暂停询问。这不是每步都做——只在方向性决策点做。
|
|
262
|
-
|
|
263
|
-
---
|
|
156
|
+
- **协作**(默认):自主执行,方向性决策前确认
|
|
157
|
+
- **全自动**:仅不可逆操作前确认
|
|
264
158
|
|
|
265
|
-
|
|
266
|
-
|
|
267
|
-
| 反模式 | 解药 |
|
|
268
|
-
|--------|------|
|
|
269
|
-
| 确认偏误:只找支持假设的证据 | 证伪导向——主动找反证 |
|
|
270
|
-
| 盲目重试:失败后不反思直接重来 | Reflect-then-Retry |
|
|
271
|
-
| 域错配:用 Complicated 策略应对 Complex 问题 | 域感知路由——试探优先于分析 |
|
|
272
|
-
| 吸收循环:卡在重试中不升级策略 | 韧性三态——吸收失败后升级到适应或转化 |
|
|
273
|
-
| 框架锁定:反复修正但不质疑前提 | 双环学习——3次修正无效时质疑"是否在解决正确的问题" |
|
|
274
|
-
| **过度自信**:自信地做错事,替用户做选择却不自知 | 对齐门控——方向性决策前必须过三问检查 |
|
|
275
|
-
| **假设累积**:每个小假设都"合理",累积后严重偏离 | 偏差累积检测——>3 个未确认假设时暂停 |
|
|
276
|
-
| **模式幻觉**:识别到不适用的模式后自信执行 | 模式适用性验证——前提成立吗?用户需求偏离了吗? |
|
|
159
|
+
未声明时默认协作。
|
|
@@ -1,25 +1,20 @@
|
|
|
1
1
|
---
|
|
2
2
|
name: coding
|
|
3
3
|
description: |
|
|
4
|
-
|
|
4
|
+
编写、修改、测试和审查项目代码。用户需要产出代码变更或评估代码质量时触发。
|
|
5
5
|
|
|
6
|
-
|
|
7
|
-
|
|
6
|
+
三种意图及触发信号:
|
|
7
|
+
**实现** — 修 bug、加功能、重构、处理报错或编译/测试失败。
|
|
8
|
+
**测试** — 生成、修复或补充单元测试,提升覆盖率。
|
|
9
|
+
**审查** — Code review,检查质量,发现潜在问题。
|
|
8
10
|
|
|
9
|
-
|
|
10
|
-
关键词:"生成单测"、"写测试"、"补测试"、"UT"、"unit test"、"测试覆盖率"。
|
|
11
|
-
|
|
12
|
-
**审查** — 当用户需要代码审查时触发。
|
|
13
|
-
关键词:"review"、"审查"、"code review"、"检查代码"、"帮我看看这段代码"。
|
|
14
|
-
|
|
15
|
-
**不触发(留给 auto-goal)**:纯分析、调研、非代码产出任务。
|
|
16
|
-
**不触发(直接工具)**:单文件几行代码的简单修改。
|
|
11
|
+
DO NOT TRIGGER: 学习概念/调研方案/制定计划(→ auto-goal);优化 skill 指令(→ skill-optimize / skill-creator);极简改动且位置明确(→ 直接 Edit)。
|
|
17
12
|
allowed-tools: Read, Write, Edit, Bash, Agent, Glob, Grep, Skill, TaskCreate, TaskUpdate, TaskList, EnterPlanMode, ExitPlanMode, AskUserQuestion
|
|
18
13
|
---
|
|
19
14
|
|
|
20
15
|
# Coding Skill — 代码域认知协议
|
|
21
16
|
|
|
22
|
-
|
|
17
|
+
代码域的核心特性:
|
|
23
18
|
**编译和测试是天然证伪器;代码变更即假设检验;版本控制提供安全回退。**
|
|
24
19
|
|
|
25
20
|
---
|
|
@@ -67,7 +62,7 @@ allowed-tools: Read, Write, Edit, Bash, Agent, Glob, Grep, Skill, TaskCreate, Ta
|
|
|
67
62
|
|
|
68
63
|
## 3. 代码域 OODA 循环
|
|
69
64
|
|
|
70
|
-
|
|
65
|
+
代码域的感知-定位-决策-行动循环:
|
|
71
66
|
|
|
72
67
|
### Sense — 感知代码现状
|
|
73
68
|
- **读代码前先建假设**:从命名、结构、上下文推测行为,再读代码验证
|
package/src/core/installer.js
CHANGED
|
@@ -156,7 +156,16 @@ export class Installer {
|
|
|
156
156
|
return;
|
|
157
157
|
}
|
|
158
158
|
|
|
159
|
+
// Use package.json version as single source of truth, sync to plugin.json
|
|
160
|
+
const pkgJsonPath = path.join(PLUGIN_SRC_DIR, '..', 'package.json');
|
|
159
161
|
const pluginJson = await fs.readJson(pluginJsonPath);
|
|
162
|
+
if (await fs.pathExists(pkgJsonPath)) {
|
|
163
|
+
const pkgJson = await fs.readJson(pkgJsonPath);
|
|
164
|
+
if (pkgJson.version && pkgJson.version !== pluginJson.version) {
|
|
165
|
+
pluginJson.version = pkgJson.version;
|
|
166
|
+
await fs.writeJson(pluginJsonPath, pluginJson, { spaces: 2 });
|
|
167
|
+
}
|
|
168
|
+
}
|
|
160
169
|
const version = pluginJson.version || '0.0.0';
|
|
161
170
|
const destDir = path.join(PLUGIN_CACHE_DIR, version);
|
|
162
171
|
|