@shirayner/ace 0.1.0 → 0.1.1-snapshot.0
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
- package/{README.zh-CN.md → README.en-US.md} +11 -1
- package/README.md +276 -63
- package/package.json +1 -1
- package/plugin/skills/auto-goal/SKILL.md +97 -12
- package/src/commands/init.js +156 -39
- package/src/core/constants.js +8 -4
- package/src/core/installer.js +93 -16
- package/src/core/ui.js +182 -0
- package/templates/CLAUDE.md +6 -0
- package/templates/hookify/ace.hookify.code-quality-gate.local.md +45 -0
- package/templates/hookify/ace.hookify.safe-git-commands.local.md +38 -0
- package/templates/hookify/hookify.dangerous-commands.local.md +20 -0
- package/templates/hookify/hookify.sensitive-data.local.md +22 -0
- package/templates/openspec/config.yaml +4 -4
- package/templates/openspec/procedures/evolution-system.md +1 -1
- package/templates/openspec/procedures/interactive-clarification-protocol.md +1 -1
- package/templates/settings.json +39 -1
|
@@ -30,10 +30,20 @@ Done! Your AI coding environment is ready.
|
|
|
30
30
|
### Spec 驱动开发
|
|
31
31
|
|
|
32
32
|
```
|
|
33
|
-
|
|
33
|
+
# 进入工作目录
|
|
34
|
+
$ mkdir my-project
|
|
35
|
+
$ cd my-project
|
|
36
|
+
|
|
37
|
+
# 执行 aspec 初始化
|
|
38
|
+
$ ace spec init
|
|
34
39
|
✔ openspec config installed
|
|
35
40
|
✔ spec templates installed (taxonomy, issues, procedures, evolution)
|
|
36
41
|
Done! Spec workflow is ready.
|
|
42
|
+
|
|
43
|
+
# 三命令 spec coding 流程:
|
|
44
|
+
/opsx:proposal → 需求澄清 + 创建提案 + 技术澄清 + 确定方案
|
|
45
|
+
/opsx:apply → 按方案逐项实现,每步验证
|
|
46
|
+
/opsx:archive → spec 归档,复盘总结,知识库三层进化
|
|
37
47
|
```
|
|
38
48
|
|
|
39
49
|
Claude Code 开箱即用已经很强大——但手动配置规则、技能、安全守卫和记忆模板既繁琐又容易出错。
|
package/README.md
CHANGED
|
@@ -1,100 +1,313 @@
|
|
|
1
|
-
|
|
1
|
+
# `<img src="https://raw.githubusercontent.com/shirayner/ace/main/assets/logo.svg" width="48" align="center">` ACE
|
|
2
2
|
|
|
3
|
-
<
|
|
3
|
+
<p align="center">
|
|
4
|
+
<b>AI Coding Environment</b> — 一键配置专业级 Claude Code 开发环境
|
|
5
|
+
</p>
|
|
4
6
|
|
|
5
|
-
|
|
7
|
+
<p align="center">
|
|
8
|
+
<a href="https://www.npmjs.com/package/@shirayner/ace"><img src="https://img.shields.io/npm/v/@shirayner/ace?style=flat-square&color=blue" alt="npm version"></a>
|
|
9
|
+
<a href="LICENSE"><img src="https://img.shields.io/npm/l/@shirayner/ace?style=flat-square&color=green" alt="license"></a>
|
|
10
|
+
<a href="package.json"><img src="https://img.shields.io/node/v/@shirayner/ace?style=flat-square&color=orange" alt="Node.js"></a>
|
|
11
|
+
<a href="#"><img src="https://img.shields.io/badge/Claude%20Code-Compatible-purple?style=flat-square" alt="Claude Code"></a>
|
|
12
|
+
</p>
|
|
6
13
|
|
|
7
|
-
|
|
14
|
+
<p align="center">
|
|
15
|
+
<a href="README.zh-CN.md">中文</a> |
|
|
16
|
+
<a href="docs/getting-started/index.md">快速开始</a> |
|
|
17
|
+
<a href="docs/why-ace/index.md">为什么选 ACE</a> |
|
|
18
|
+
<a href="docs/architecture/index.md">架构详解</a> |
|
|
19
|
+
<a href="docs/theory/index.md">理论基础</a>
|
|
20
|
+
</p>
|
|
8
21
|
|
|
9
|
-
|
|
10
|
-
[](LICENSE)
|
|
11
|
-
[](package.json)
|
|
22
|
+
---
|
|
12
23
|
|
|
13
|
-
|
|
24
|
+
## 🎯 什么是 ACE?
|
|
14
25
|
|
|
15
|
-
|
|
26
|
+
ACE 是一个**AI 开发环境配置工具**,基于 Claude Code 官方最佳实践构建,融合认知科学、控制论、软件工程等领域的深度理论,为开发者提供:
|
|
16
27
|
|
|
28
|
+
- 🧠 **认知增强规则** — 8 条基于认知科学的深度思考与代码质量原则
|
|
29
|
+
- 🤖 **专业级 AI Skills** — 4 个面向不同开发场景的智能技能
|
|
30
|
+
- 🛡️ **安全防护体系** — Hookify 守卫 + 角色脚本双重保障
|
|
31
|
+
- 📝 **规范驱动工作流** — OpenSpec 集成的需求管理体系
|
|
32
|
+
- 🧩 **跨会话记忆系统** — 持久化的开发者画像与项目记忆
|
|
33
|
+
|
|
34
|
+
```bash
|
|
35
|
+
# 一键安装,即刻拥有专业级 AI 开发环境
|
|
36
|
+
npm install -g @shirayner/ace
|
|
37
|
+
ace init
|
|
17
38
|
```
|
|
39
|
+
|
|
40
|
+
---
|
|
41
|
+
|
|
42
|
+
## ✨ 一分钟速览
|
|
43
|
+
|
|
44
|
+
### 初始化向导
|
|
45
|
+
|
|
46
|
+
```bash
|
|
18
47
|
$ ace init
|
|
19
|
-
?
|
|
20
|
-
?
|
|
21
|
-
|
|
22
|
-
|
|
23
|
-
|
|
24
|
-
|
|
25
|
-
|
|
26
|
-
|
|
27
|
-
Done!
|
|
48
|
+
? 选择你的角色: Fullstack Developer
|
|
49
|
+
? 选择安装预设: full (完整功能)
|
|
50
|
+
✓ Core 核心配置已安装
|
|
51
|
+
✓ 8 条认知规则已部署
|
|
52
|
+
✓ 4 个 AI Skills 已激活 (ace:auto-goal, ace:coding, ...)
|
|
53
|
+
✓ Hookify 安全守卫已启用
|
|
54
|
+
✓ 角色钩子脚本已配置
|
|
55
|
+
✓ 记忆系统已初始化
|
|
56
|
+
Done! 你的 AI 开发环境已就绪。
|
|
28
57
|
```
|
|
29
58
|
|
|
30
|
-
### Spec
|
|
59
|
+
### Spec Coding 完整流程
|
|
60
|
+
|
|
61
|
+
```bash
|
|
62
|
+
# 进入工作目录
|
|
63
|
+
$ mkdir my-project
|
|
64
|
+
$ cd my-project
|
|
65
|
+
|
|
66
|
+
# 执行 aspec 初始化
|
|
67
|
+
$ ace spec init
|
|
68
|
+
✓ aspec 工作流已初始化
|
|
69
|
+
Done! 规范驱动开发已就绪。
|
|
70
|
+
|
|
71
|
+
# 在 Claude Code 中体验三命令开发流程:
|
|
72
|
+
$ claude
|
|
73
|
+
|
|
74
|
+
> /opsx:proposal 帮我实现用户积分系统
|
|
75
|
+
|
|
76
|
+
Claude:
|
|
77
|
+
【需求澄清】积分获取规则?消费规则?过期策略?→ 3 个问题确认
|
|
78
|
+
【创建提案】proposal.md
|
|
79
|
+
【技术澄清】并发扣减方案?积分流水存储?→ 2 个问题确认
|
|
80
|
+
【确定方案】design.md + tasks.md(8 个可执行任务)
|
|
81
|
+
|
|
82
|
+
> /opsx:apply
|
|
83
|
+
|
|
84
|
+
Claude:
|
|
85
|
+
按 tasks.md 逐项实现,每步验证
|
|
86
|
+
✓ 所有任务完成,测试通过
|
|
87
|
+
|
|
88
|
+
> /opsx:archive
|
|
31
89
|
|
|
90
|
+
Claude:
|
|
91
|
+
spec 归档
|
|
92
|
+
复盘总结,知识库三层进化
|
|
93
|
+
✓ ADR/术语表/风险图谱 已更新
|
|
32
94
|
```
|
|
33
|
-
|
|
34
|
-
|
|
35
|
-
|
|
36
|
-
|
|
95
|
+
|
|
96
|
+
### 健康检查
|
|
97
|
+
|
|
98
|
+
```bash
|
|
99
|
+
$ ace doctor
|
|
100
|
+
✓ CLAUDE.md 配置正常
|
|
101
|
+
✓ 8 条规则文件完整
|
|
102
|
+
✓ 4 个 Skills 可正常加载
|
|
103
|
+
✓ Hookify 插件运行中
|
|
104
|
+
✓ 记忆目录可访问
|
|
105
|
+
All systems operational.
|
|
37
106
|
```
|
|
38
107
|
|
|
39
|
-
|
|
108
|
+
---
|
|
109
|
+
|
|
110
|
+
## 🏗️ 架构概览
|
|
111
|
+
|
|
112
|
+
```
|
|
113
|
+
┌─────────────────────────────────────────────────────────────┐
|
|
114
|
+
│ ACE 架构全景 │
|
|
115
|
+
├─────────────────────────────────────────────────────────────┤
|
|
116
|
+
│ │
|
|
117
|
+
│ ┌─────────────┐ ┌─────────────┐ ┌─────────────┐ │
|
|
118
|
+
│ │ Rules │ │ Skills │ │ Hookify │ │
|
|
119
|
+
│ │ (8 规则) │ │ (4 技能) │ │ (3 守卫) │ │
|
|
120
|
+
│ ├─────────────┤ ├─────────────┤ ├─────────────┤ │
|
|
121
|
+
│ │ • thinking │ │ • auto-goal │ │ • block- │ │
|
|
122
|
+
│ │ • clean-code│ │ • coding │ │ dangerous │ │
|
|
123
|
+
│ │ • code-qual │ │ • skill- │ │ • protect- │ │
|
|
124
|
+
│ │ • reporting │ │ creator │ │ secrets │ │
|
|
125
|
+
│ │ • task-rec │ │ • skill- │ │ • require- │ │
|
|
126
|
+
│ │ • context- │ │ optimize │ │ verify │ │
|
|
127
|
+
│ │ hygiene │ │ │ │ │ │
|
|
128
|
+
│ │ • memory- │ │ │ │ │ │
|
|
129
|
+
│ │ policy │ │ │ │ │ │
|
|
130
|
+
│ │ • interactive│ │ │ │ │ │
|
|
131
|
+
│ └─────────────┘ └─────────────┘ └─────────────┘ │
|
|
132
|
+
│ │
|
|
133
|
+
│ ┌─────────────┐ ┌─────────────┐ ┌─────────────┐ │
|
|
134
|
+
│ │ Hooks │ │ Memory │ │ Spec │ │
|
|
135
|
+
│ │ (角色脚本) │ │ (记忆系统) │ │ (规范驱动) │ │
|
|
136
|
+
│ ├─────────────┤ ├─────────────┤ ├─────────────┤ │
|
|
137
|
+
│ │ • Java 编译 │ │ • MEMORY.md │ │ • config │ │
|
|
138
|
+
│ │ 检查 │ │ • user_ │ │ • taxonomy/ │ │
|
|
139
|
+
│ │ • TypeScript│ │ profile │ │ • issues/ │ │
|
|
140
|
+
│ │ 检查 │ │ • roles/ │ │ • procedures│ │
|
|
141
|
+
│ │ • 更多... │ │ │ │ • evolution │ │
|
|
142
|
+
│ └─────────────┘ └─────────────┘ └─────────────┘ │
|
|
143
|
+
│ │
|
|
144
|
+
└─────────────────────────────────────────────────────────────┘
|
|
145
|
+
```
|
|
146
|
+
|
|
147
|
+
---
|
|
148
|
+
|
|
149
|
+
## 📦 安装预设
|
|
150
|
+
|
|
151
|
+
| 组件 | `full` | `safe` | `minimal` |
|
|
152
|
+
| ------------------------------------------ | :------: | :------: | :---------: |
|
|
153
|
+
| **Core** (CLAUDE.md + settings.json) | ✅ | ✅ | ✅ |
|
|
154
|
+
| **Rules** (8 条认知与代码质量规则) | ✅ | ✅ | ✅ |
|
|
155
|
+
| **Plugin** (4 个 Skills) | ✅ | ✅ | ✅ |
|
|
156
|
+
| **Hooks** (角色相关脚本) | ✅ | ❌ | ❌ |
|
|
157
|
+
| **Hookify** (3 个安全守卫) | ✅ | ✅ | ❌ |
|
|
158
|
+
| **Memory** (模板 + 开发者画像) | ✅ | ✅ | ❌ |
|
|
159
|
+
|
|
160
|
+
```bash
|
|
161
|
+
# 完整功能(推荐)
|
|
162
|
+
ace init --preset full
|
|
163
|
+
|
|
164
|
+
# 安全优先(适合团队协作)
|
|
165
|
+
ace init --preset safe
|
|
166
|
+
|
|
167
|
+
# 最小安装(仅核心功能)
|
|
168
|
+
ace init --preset minimal
|
|
169
|
+
```
|
|
170
|
+
|
|
171
|
+
---
|
|
172
|
+
|
|
173
|
+
## 🎓 核心设计理念
|
|
40
174
|
|
|
41
|
-
|
|
42
|
-
safety guards, and memory templates by hand is tedious and error-prone.
|
|
175
|
+
ACE 的设计融合了多学科的深层洞察:
|
|
43
176
|
|
|
44
|
-
|
|
177
|
+
### 认知科学
|
|
45
178
|
|
|
46
|
-
-
|
|
47
|
-
-
|
|
48
|
-
-
|
|
49
|
-
- **Safety** — Hookify guards that block dangerous ops and protect secrets
|
|
50
|
-
- **Memory** — Templates for cross-session memory and developer profiles
|
|
51
|
-
- **Non-destructive** — Smart merge preserves your existing config; uninstall restores it
|
|
179
|
+
- **双过程理论** (Kahneman) — 简单任务快速响应,复杂任务深度分析
|
|
180
|
+
- **认知负荷理论** (Sweller) — 渐进式信息披露,避免工作记忆过载
|
|
181
|
+
- **元认知监控** — 持续自我监控与策略调整
|
|
52
182
|
|
|
53
|
-
|
|
183
|
+
### 控制论
|
|
184
|
+
|
|
185
|
+
- **OODA 循环** (Boyd) — 观察-定向-决策-行动的快速迭代
|
|
186
|
+
- **必要多样性定律** (Ashby) — 策略库必须匹配任务复杂度
|
|
187
|
+
- **闭环控制** — 每个操作都内建验证
|
|
188
|
+
|
|
189
|
+
### 软件工程
|
|
190
|
+
|
|
191
|
+
- **Clean Code 原则** (Robert C. Martin)
|
|
192
|
+
- **单一职责** (SOLID)
|
|
193
|
+
- **渐进式复杂度** (OpenAI Agent 最佳实践)
|
|
194
|
+
|
|
195
|
+
> 📖 详细理论解读请查看 [理论基础文档](docs/theory/index.md)
|
|
196
|
+
|
|
197
|
+
---
|
|
198
|
+
|
|
199
|
+
## 🚀 快速开始
|
|
200
|
+
|
|
201
|
+
### 1. 安装 ACE
|
|
54
202
|
|
|
55
203
|
```bash
|
|
56
204
|
npm install -g @shirayner/ace
|
|
205
|
+
```
|
|
206
|
+
|
|
207
|
+
### 2. 初始化环境
|
|
208
|
+
|
|
209
|
+
```bash
|
|
57
210
|
ace init
|
|
58
211
|
```
|
|
59
212
|
|
|
60
|
-
|
|
213
|
+
按提示选择你的角色和预设。ACE 会自动配置:
|
|
214
|
+
|
|
215
|
+
- 全局 CLAUDE.md 索引
|
|
216
|
+
- 8 条认知规则
|
|
217
|
+
- 4 个 AI Skills
|
|
218
|
+
- Hookify 安全守卫
|
|
219
|
+
- 角色特定脚本和开发者画像
|
|
220
|
+
|
|
221
|
+
### 3. 验证安装
|
|
222
|
+
|
|
223
|
+
```bash
|
|
224
|
+
ace doctor
|
|
225
|
+
```
|
|
226
|
+
|
|
227
|
+
### 4. 开始项目(可选)
|
|
228
|
+
|
|
229
|
+
```bash
|
|
230
|
+
# 初始化规范驱动开发工作流
|
|
231
|
+
ace spec init ./my-project
|
|
232
|
+
cd my-project
|
|
233
|
+
|
|
234
|
+
# 开始开发
|
|
235
|
+
claude
|
|
236
|
+
```
|
|
237
|
+
|
|
238
|
+
---
|
|
239
|
+
|
|
240
|
+
## 📚 文档导航
|
|
241
|
+
|
|
242
|
+
### 新手入门
|
|
243
|
+
|
|
244
|
+
- [5 分钟快速开始](docs/getting-started/index.md) — 从零到专业开发环境
|
|
245
|
+
- [安装指南](docs/getting-started/installation.md) — 详细安装与配置
|
|
246
|
+
- [第一个项目](docs/getting-started/first-project.md) — 手把手入门教程
|
|
247
|
+
|
|
248
|
+
### 理解 ACE
|
|
249
|
+
|
|
250
|
+
- [为什么选 ACE](docs/why-ace/index.md) — 价值主张与核心优势
|
|
251
|
+
- [解决的问题](docs/why-ace/problems-solved.md) — ACE 如何应对开发痛点
|
|
252
|
+
- [方案对比](docs/why-ace/comparisons.md) — 与其他工具的比较
|
|
253
|
+
|
|
254
|
+
### 深度架构
|
|
255
|
+
|
|
256
|
+
- [架构全景](docs/architecture/index.md) — 完整组件关系图
|
|
257
|
+
- [8 条规则详解](docs/architecture/rules.md) — 每条规则的用途与设计
|
|
258
|
+
- [4 个 Skills 详解](docs/architecture/skills.md) — 工作原理与最佳实践
|
|
259
|
+
- [aspec 规范驱动](docs/architecture/aspec.md) — spec coding 完整工作流
|
|
260
|
+
- [Hookify 安全体系](docs/architecture/hookify.md)
|
|
261
|
+
- [Hooks 角色脚本](docs/architecture/hooks.md)
|
|
262
|
+
- [记忆系统](docs/architecture/memory.md)
|
|
263
|
+
- [OpenSpec 集成](docs/architecture/spec.md)
|
|
264
|
+
|
|
265
|
+
### 理论基础
|
|
266
|
+
|
|
267
|
+
- [理论总览](docs/theory/index.md)
|
|
268
|
+
- [认知科学基础](docs/theory/cognitive-science.md)
|
|
269
|
+
- [控制论与系统论](docs/theory/cybernetics.md)
|
|
270
|
+
- [哲学基础](docs/theory/philosophy.md)
|
|
271
|
+
- [心理学洞察](docs/theory/psychology.md)
|
|
272
|
+
- [社会学视角](docs/theory/sociology.md)
|
|
273
|
+
|
|
274
|
+
### 参考手册
|
|
275
|
+
|
|
276
|
+
- [CLI 完整参考](docs/reference/cli.md)
|
|
277
|
+
- [合并策略](docs/reference/merge-strategy.md)
|
|
278
|
+
- [角色说明](docs/reference/roles.md)
|
|
279
|
+
|
|
280
|
+
---
|
|
281
|
+
|
|
282
|
+
## 🛡️ 非破坏性设计
|
|
61
283
|
|
|
62
|
-
|
|
284
|
+
ACE 遵循**零侵入**原则:
|
|
63
285
|
|
|
64
|
-
|
|
65
|
-
|
|
66
|
-
|
|
67
|
-
|
|
68
|
-
| **Plugin** | 4 skills + 1 command (`ace:auto-goal`, `ace:coding`, ...) | all |
|
|
69
|
-
| **Hookify** | 3 safety guards (block-dangerous-ops, protect-secrets, ...) | full, safe |
|
|
70
|
-
| **Hooks** | Role-dependent scripts (e.g., Java compile check) | full |
|
|
71
|
-
| **Memory** | MEMORY.md template + role-based developer profile | full, safe |
|
|
72
|
-
| **Spec** | Spec-driven workflow templates (taxonomy, issues, procedures) | `ace spec init` |
|
|
286
|
+
- **智能合并** — 与现有配置共存,从不覆盖
|
|
287
|
+
- **自动备份** — 首次安装前创建完整快照
|
|
288
|
+
- **干净卸载** — `ace uninstall` 一键恢复原始状态
|
|
289
|
+
- **命名空间隔离** — 所有文件使用 `ace/` 前缀,避免冲突
|
|
73
290
|
|
|
74
|
-
|
|
291
|
+
---
|
|
75
292
|
|
|
76
|
-
|
|
77
|
-
never overwrites. Uninstall restores your original state.
|
|
293
|
+
## 🤝 贡献
|
|
78
294
|
|
|
79
|
-
|
|
80
|
-
the `ace:` plugin namespace. Your files and ace's files never collide.
|
|
295
|
+
欢迎贡献!我们同时在 GitHub 和 GitLab 维护代码库。
|
|
81
296
|
|
|
82
|
-
|
|
83
|
-
|
|
84
|
-
|
|
297
|
+
- 报告问题:使用 GitHub Issues
|
|
298
|
+
- 提交改进:Fork & Pull Request
|
|
299
|
+
- 讨论想法:GitHub Discussions
|
|
85
300
|
|
|
86
|
-
|
|
301
|
+
查看 [CONTRIBUTING.md](CONTRIBUTING.md) 了解详情。
|
|
87
302
|
|
|
88
|
-
|
|
89
|
-
- [Components](docs/components.md) — Detailed description of all installed components
|
|
90
|
-
- [Merge Strategy](docs/merge-strategy.md) — How ace handles existing config files
|
|
91
|
-
- [Roles](docs/roles.md) — Role-based installation and developer profiles
|
|
303
|
+
---
|
|
92
304
|
|
|
93
|
-
##
|
|
305
|
+
## 📄 License
|
|
94
306
|
|
|
95
|
-
|
|
96
|
-
See [CONTRIBUTING.md](CONTRIBUTING.md) for details.
|
|
307
|
+
[MIT](LICENSE) © 2024
|
|
97
308
|
|
|
98
|
-
|
|
309
|
+
---
|
|
99
310
|
|
|
100
|
-
|
|
311
|
+
<p align="center">
|
|
312
|
+
<sub>Built with ❤️ for developers who care about code quality</sub>
|
|
313
|
+
</p>
|
package/package.json
CHANGED
|
@@ -9,7 +9,7 @@ description: |
|
|
|
9
9
|
|
|
10
10
|
# Auto Goal Skill
|
|
11
11
|
|
|
12
|
-
|
|
12
|
+
自主完成目标的赋能系统。**核心信念**:**对齐优先于效率**——准确完成用户真正想要的,胜过高效完成 agent 以为的。每步行动都是带预测的实验,上下文是最稀缺的资源。宁可慢一步确认方向,不要快一步跑偏。
|
|
13
13
|
|
|
14
14
|
---
|
|
15
15
|
|
|
@@ -41,18 +41,59 @@ description: |
|
|
|
41
41
|
|
|
42
42
|
**域可迁移**:初判不是终判。执行中发现域判断错误时立即切换策略。
|
|
43
43
|
|
|
44
|
-
###
|
|
44
|
+
### 对齐评估(与域判断同步执行)
|
|
45
|
+
|
|
46
|
+
技术复杂度和对齐不确定性是**正交的两个维度**,必须同时评估:
|
|
47
|
+
|
|
48
|
+
| 对齐不确定性 | 信号 | 策略 |
|
|
49
|
+
|-------------|------|------|
|
|
50
|
+
| **低**(EXPLICIT) | 用户指令具体、验收标准明确、无歧义 | 按域策略自主执行 |
|
|
51
|
+
| **中**(ALIGNED) | 可从上下文合理推断,但存在假设 | 标注假设,关键分叉点确认 |
|
|
52
|
+
| **高**(GUESSING) | 目标抽象/多义、存在多可行方案、涉及偏好 | **先澄清再执行**,无论技术域是什么 |
|
|
53
|
+
|
|
54
|
+
**对齐不确定性信号**(任一命中即升级):
|
|
55
|
+
- 目标描述抽象或多义("优化"、"改进"、"重构"、"完善")
|
|
56
|
+
- 存在 ≥2 个可行方案且各有取舍
|
|
57
|
+
- 决策依赖用户偏好(风格、架构、优先级)
|
|
58
|
+
- 需要做范围决策(做多少?改多少?包含什么?)
|
|
59
|
+
- agent 正在"替用户填空"——用自己的理解补全用户未说明的部分
|
|
60
|
+
|
|
61
|
+
**铁律**:对齐不确定性为"高"时,**不可内部推理自行填补**,必须向用户提问。技术能力不补偿对齐缺失。
|
|
62
|
+
|
|
63
|
+
### 首轮对齐(MANDATORY — 不可跳过)
|
|
64
|
+
|
|
65
|
+
**无论对齐评估结果如何,首轮对齐都必须执行。** 这是结构性要求,不是条件性判断。agent 不知道自己不理解什么——所以不能由 agent 决定是否需要对齐。
|
|
66
|
+
|
|
67
|
+
**执行时机**:初步分析完成后、OODA 循环启动前。
|
|
68
|
+
|
|
69
|
+
**呈现内容**(向用户简明呈现,等待确认):
|
|
70
|
+
1. **我的理解** — 用一两句话复述目标的核心意图
|
|
71
|
+
2. **计划方向** — 打算怎么做(高层策略,不是细节)
|
|
72
|
+
3. **关键假设** — 我做了哪些假设(如果有)
|
|
73
|
+
4. **待确认项** — 有歧义或需要用户选择的地方(如果有)
|
|
74
|
+
|
|
75
|
+
**用户确认后**才进入 OODA 循环。用户纠正 → 更新理解 → 可能需要再次对齐。
|
|
45
76
|
|
|
46
77
|
```
|
|
47
|
-
接收目标 →
|
|
78
|
+
接收目标 → 初步分析(域判断 + 对齐评估 + 深度估算)
|
|
79
|
+
↓
|
|
80
|
+
⚡首轮对齐(MANDATORY)
|
|
81
|
+
向用户呈现:理解 + 方向 + 假设 → 等待确认
|
|
82
|
+
用户确认 → 进入执行 ┃ 用户纠正 → 更新理解 → 再次对齐
|
|
48
83
|
↓
|
|
84
|
+
```
|
|
85
|
+
|
|
86
|
+
### OODA 循环(首轮对齐通过后启动)
|
|
87
|
+
|
|
88
|
+
```
|
|
49
89
|
┌─────────────────────────────────────────────────┐
|
|
50
90
|
│ Sense :状态?变化?新信息?⚡弱信号+外围扫描 │
|
|
51
91
|
│ Orient :距目标多远?心智模型需要更新吗? │
|
|
52
92
|
│ Decide :策略 + 推理模式 + 深度 + 验证标准 │
|
|
93
|
+
│ ⚡Align :对齐门控(方向性决策时触发) │
|
|
53
94
|
│ Act :识别即行动 or 完整分析(= 检验假设) │
|
|
54
95
|
│ Observe:结果 vs 预期?验证精度匹配风险级别 │
|
|
55
|
-
│ Adapt
|
|
96
|
+
│ Adapt :更新理解,调节深度/域/对齐,外化状态 │
|
|
56
97
|
│ │
|
|
57
98
|
│ → 循环,直到目标满足或触发降级 │
|
|
58
99
|
└─────────────────────────────────────────────────┘
|
|
@@ -62,12 +103,14 @@ description: |
|
|
|
62
103
|
|
|
63
104
|
**关键机制**:
|
|
64
105
|
|
|
106
|
+
- **对齐门控**(Align,Decide→Act 之间的强制检查):每个方向性决策前自问三个问题:① 这个决策涉及方向/偏好/取舍吗?② 我是在执行用户的指令,还是在替用户做选择?③ 如果用户此刻看到我的决策,会惊讶吗?——**任一为 YES → 暂停,向用户呈现选项并等待确认**。全部为 NO → 执行。这不是"每步都问",而是**只在方向性决策点问**
|
|
65
107
|
- **弱信号检测**(Sense):不等失败才反应。主动扫描——进展在减速?假设在累积未验证?复杂度在悄然上升?发现弱信号 → 升级深度或回到 Orient。模糊时先恢复情境意识
|
|
66
|
-
- **假设驱动行动**(Act
|
|
108
|
+
- **假设驱动行动**(Act):**已知模式→验证模式适用性→对齐门控→行动**;**未知→完整分析**。每步先生成预期结果,再行动,后对比。**警惕**:"识别到模式"≠"理解用户的具体需求"——模式匹配前必须确认:此模式的前提在当前场景中成立吗?用户的需求是否偏离标准模式?
|
|
67
109
|
- **推理模式选择**(Decide):不可逆选择→生成备选评估后决策;置信度低→多角度推理检查收敛;关键输出完成→切换为怀疑论审查者
|
|
68
110
|
- **验证精度分级**(Observe):微验证(低风险,心理校验)/ 标准验证(中风险,工具确认)/ 深度验证(高风险/不可逆,交叉证伪)
|
|
69
111
|
- **深度调节**(1=自动…4=全面):升级信号:偏离/新复杂度/验证失败/弱信号;降级信号:连续顺利/模式匹配/不确定性收敛
|
|
70
112
|
- **熔断器**(持续):同一子问题重试 > 3 次→换策略或求助;探索超阶段预算→强制转向;每 5 步→目标漂移 + 偏差累积检查
|
|
113
|
+
- **偏差累积检测**(持续):追踪未经用户确认的假设数量。0-1 个→继续;2-3 个→下一个决策点主动确认;>3 个→**立即暂停**,向用户同步当前理解和已做假设。小偏差是大偏差的前兆
|
|
71
114
|
- **终态证伪**:不问"能运行吗?",问"什么条件下会失败?"
|
|
72
115
|
|
|
73
116
|
---
|
|
@@ -77,7 +120,23 @@ description: |
|
|
|
77
120
|
五个策略,按需组合,可重复调用。
|
|
78
121
|
|
|
79
122
|
### 澄清(Clarify)
|
|
80
|
-
|
|
123
|
+
消除歧义,对齐理解。区分表面需求与真实需求,检验问题框架是否最优。
|
|
124
|
+
|
|
125
|
+
**核心原则:对齐优先 — 技术实现细节能推断就自己做;方向、偏好、取舍必须确认。**
|
|
126
|
+
|
|
127
|
+
**Must-Ask 触发器(硬性,命中任一必须向用户提问)**:
|
|
128
|
+
1. **方案分叉** — 存在 ≥2 个可行方案且各有明显取舍
|
|
129
|
+
2. **范围扩张** — 执行中发现需要做的超出原始目标描述
|
|
130
|
+
3. **假设填补** — 用户目标中有模糊处,agent 正在用自己的理解"填空"
|
|
131
|
+
4. **不可逆操作** — 删除、重写、架构变更
|
|
132
|
+
5. **偏好依赖** — 决策取决于用户的风格/优先级/口味
|
|
133
|
+
|
|
134
|
+
**Should-Ask 触发器(软性,累积 2+ 项则必须确认)**:
|
|
135
|
+
6. **信心不足** — 对用户真实意图的置信度 < 中等
|
|
136
|
+
7. **领域边界** — 进入 agent 不熟悉的技术/业务领域
|
|
137
|
+
8. **累积偏差** — 已连续做了 3+ 个小假设未经确认
|
|
138
|
+
|
|
139
|
+
**禁止**:不可因为"能推断"就跳过方向性确认。LLM 最危险的特征是"自信地做错事"——对自己的推断能力保持怀疑。
|
|
81
140
|
|
|
82
141
|
### 探索(Explore)
|
|
83
142
|
获取知识,识别最佳实践和风险。**在 sub-agent 中执行**,只将摘要返回主上下文。交叉验证关键信息,标注置信度。**觅食启发**:跟踪信息气味(相关性信号)→ 收益递减时果断换源 → 探索超总预算 30% 停止。**认知行动合法**:为理解而做的探索(临时测试、中间状态打印)是投资非浪费。
|
|
@@ -119,6 +178,13 @@ description: |
|
|
|
119
178
|
|
|
120
179
|
决策不应仅依赖 ASSUME。INFER/ASSUME 被推翻时,回溯所有依赖它的后续决策。
|
|
121
180
|
|
|
181
|
+
### 意图置信度(与信息分级正交)
|
|
182
|
+
- **EXPLICIT** — 用户明确说了(原话/明确指令)
|
|
183
|
+
- **ALIGNED** — 可从上下文合理推断(标注推断依据)
|
|
184
|
+
- **GUESSING** — 在替用户做选择(必须提问确认)
|
|
185
|
+
|
|
186
|
+
**决策矩阵**:意图 GUESSING 时**必须问用户**,无论技术置信度多高。技术能力不补偿对齐缺失。
|
|
187
|
+
|
|
122
188
|
### Reflect-then-Retry
|
|
123
189
|
遇到意外时(失败、意外成功、意外副作用),不直接重试,先结构化反思(写入 reflections.md):
|
|
124
190
|
1. 失败现象 vs 预期偏差
|
|
@@ -167,16 +233,32 @@ description: |
|
|
|
167
233
|
|
|
168
234
|
## 介入模式
|
|
169
235
|
|
|
170
|
-
用户调用时可声明模式:**全自动**(仅不可逆操作前确认)/
|
|
236
|
+
用户调用时可声明模式:**全自动**(仅不可逆操作前确认)/ **协作**(关键路径确认)。未声明默认**协作**。
|
|
237
|
+
|
|
238
|
+
### 协作模式(默认)— 关键路径确认制
|
|
239
|
+
|
|
240
|
+
**默认姿态**:方向自主探索,**关键路径决策前呈现方案等待确认**。
|
|
171
241
|
|
|
172
|
-
|
|
242
|
+
**关键路径**(必须确认的节点):
|
|
243
|
+
1. **首轮对齐** — **MANDATORY,不可跳过**,初步分析后必须呈现理解并等待确认
|
|
244
|
+
2. **方案选择时** — 多条路径中选一条,呈现取舍
|
|
245
|
+
3. **范围变更时** — 做的比要求的多或少
|
|
246
|
+
4. **中间里程碑** — 大任务的阶段性交付确认
|
|
247
|
+
5. **任何 Must-Ask 触发器命中时**
|
|
248
|
+
|
|
249
|
+
### 两种模式的共同底线
|
|
173
250
|
|
|
174
251
|
| 操作类型 | 默认行为 |
|
|
175
252
|
|----------|----------|
|
|
176
|
-
|
|
|
177
|
-
| 不可逆或影响范围大 |
|
|
178
|
-
| 涉及用户偏好/价值判断 |
|
|
179
|
-
| 目标/方向性调整 |
|
|
253
|
+
| 可逆、影响范围小、意图 EXPLICIT | 自主执行,事后简报 |
|
|
254
|
+
| 不可逆或影响范围大 | **执行前确认** |
|
|
255
|
+
| 涉及用户偏好/价值判断 | **提供选项,等待决策** |
|
|
256
|
+
| 目标/方向性调整 | **始终询问** |
|
|
257
|
+
| 意图 GUESSING | **始终询问**,无论操作大小 |
|
|
258
|
+
|
|
259
|
+
### 用户视角模拟
|
|
260
|
+
|
|
261
|
+
在关键决策点,切换到用户视角自检:**"如果用户此刻看到我正在做的事和我的推理过程,他们会 (a) 点头认可 (b) 感到惊讶 (c) 说'不,我要的不是这个'"。** (b)(c) → 暂停询问。这不是每步都做——只在方向性决策点做。
|
|
180
262
|
|
|
181
263
|
---
|
|
182
264
|
|
|
@@ -189,3 +271,6 @@ description: |
|
|
|
189
271
|
| 域错配:用 Complicated 策略应对 Complex 问题 | 域感知路由——试探优先于分析 |
|
|
190
272
|
| 吸收循环:卡在重试中不升级策略 | 韧性三态——吸收失败后升级到适应或转化 |
|
|
191
273
|
| 框架锁定:反复修正但不质疑前提 | 双环学习——3次修正无效时质疑"是否在解决正确的问题" |
|
|
274
|
+
| **过度自信**:自信地做错事,替用户做选择却不自知 | 对齐门控——方向性决策前必须过三问检查 |
|
|
275
|
+
| **假设累积**:每个小假设都"合理",累积后严重偏离 | 偏差累积检测——>3 个未确认假设时暂停 |
|
|
276
|
+
| **模式幻觉**:识别到不适用的模式后自信执行 | 模式适用性验证——前提成立吗?用户需求偏离了吗? |
|