role-os 2.7.0 → 2.7.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
package/README.zh.md CHANGED
@@ -13,20 +13,20 @@
13
13
  <a href="https://mcp-tool-shop-org.github.io/role-os/"><img src="https://img.shields.io/badge/Landing_Page-live-brightgreen" alt="Landing Page"></a>
14
14
  </p>
15
15
 
16
- 一个多 Claude 操作系统,它通过 50 个专业角色合同来配置、分配、验证并执行工作。该系统可以创建任务包,根据角色匹配评分组建合适的团队,在执行前检测潜在问题,并在工作被阻塞或拒绝时自动进行恢复,并且要求在每个决策中提供结构化的证据。
16
+ 一种多 Claude 操作系统,它对员工进行管理、分配任务、验证并执行工作,通过 61 个专门的角色合同进行。它创建任务包,从经过评分的角色匹配中组建合适的团队,在执行之前检测中断的任务链,当工作被阻止或拒绝时自动进行恢复,并且要求在每个结论中提供结构化的证据。它包括用于处理大规模任务的动态调度——一个包含 10 个组件的仓库自动变为 28 个审计步骤,而不是 6 个。
17
17
 
18
- ## 其作用
18
+ ## 它的作用
19
19
 
20
- Role OS 是一种专业的方式来使用多实例的 Claude 模型。它能够避免通用人工智能工作流程中可能出现的特定问题。
20
+ 角色操作系统是使用多 Claude 的专业方法。它可以防止通用 AI 工作流程产生的一些特定问题:
21
21
 
22
- - **偏差 (Drift)**:每个角色都专注于其职责范围。产品不会被重新设计。前端不会重新定义范围。后端不会自行决定产品方向。
23
- - **虚报完成 (False completion)**:完成的标准是明确的。隐藏缺陷、跳过验证或解决不同问题的成果会被拒绝。
24
- - **污染 (Contamination)**:分叉或继承的项目可能包含身份残留。Role OS 可以检测并拒绝跨项目的术语、视觉和思维模式上的偏差。
25
- - **基于主观感受的进度 (Vibes-based progress)**:每个交接环节都是结构化的。每个结论都必须基于证据。 “感觉完成了” 并不是一个有效的状态。
22
+ - **漂移**——角色保持在各自的领域内。产品不会重新设计。前端不会重新定义范围。后端不会决定产品方向。
23
+ - **虚假完成**——“完成”的定义是具体的。隐藏漏洞、跳过验证或解决不同问题的任务将被拒绝。
24
+ - **污染**——分支或继承的项目会带有身份残留。角色操作系统检测并拒绝项目中术语、视觉效果和思维模式的跨项目漂移。
25
+ - **基于感觉的进度**——每次交接都是结构化的。每个结论都与证据相关联。“感觉完成了”不是一个有效状态。
26
26
 
27
- ## 工作原理
27
+ ## 它的工作原理
28
28
 
29
- 描述您的任务。系统会自动根据任务的角色,选择合适的自动化级别。
29
+ 描述您的任务。角色操作系统会自动决定合适的协调级别。
30
30
 
31
31
  ```bash
32
32
  roleos start "fix the crash in save handler"
@@ -42,15 +42,15 @@ roleos start "something completely novel"
42
42
  # Hint: Create a packet and run `roleos route` for role-level routing
43
43
  ```
44
44
 
45
- 备用梯子:
45
+ **备用方案:**
46
46
 
47
- 1. **任务 (Mission)**:当任务符合已验证的、可重复的工作流程时(例如:bug修复、问题处理、功能发布、文档编写、安全相关、研究)。已知的工作流程链、artifact(成果物)流程、升级流程分支,以及明确但可能不全面的定义。
48
- 2. **打包 (Pack)**:当任务属于已知的任务类型,但不是完整的任务流程时。有7个经过校准的团队套餐,具有自动选择功能和防止不匹配的机制。
49
- 3. **自由路由 (Free routing)**:当任务是全新的、混合型的或不确定的任务时。系统会根据任务内容,对所有31个角色进行评估,并动态构建工作流程。
47
+ 1. **任务**——当任务与经过验证的重复工作流程(错误修复、处理、功能发布、文档、安全、研究、头脑风暴、深度审计、内部测试)匹配时。已知的角色链、工件流程、升级分支和明确的部分定义。
48
+ 2. **包**——当任务属于已知类别但不是完整的任务时。10 个经过校准的团队包,具有自动选择和不匹配保护功能。
49
+ 3. **自由路由**——当任务是新的、混合的或不确定的。对所有 61 个角色根据任务包的内容进行评分,并组建一个动态链。
50
50
 
51
- 该系统不会强行使用错误的抽象层级进行操作。它会解释为什么选择每个层级,并提供替代方案。
51
+ 该系统绝不会强行将工作通过错误的抽象层进行。它会解释为什么选择每个级别,并提供替代方案。
52
52
 
53
- **一个命令即可启动执行:**
53
+ **一个命令即可激活执行:**
54
54
 
55
55
  ```bash
56
56
  roleos run "fix the crash in save handler"
@@ -67,7 +67,7 @@ roleos report # Generate completion report
67
67
  roleos friction # Measure operator touches
68
68
  ```
69
69
 
70
- **当出现问题时的应对措施:**
70
+ **当出现问题时进行干预:**
71
71
 
72
72
  ```bash
73
73
  roleos retry 0 # Retry a failed step
@@ -77,49 +77,52 @@ roleos block 2 "waiting for API spec"
77
77
  roleos reopen 0 "found issue in review"
78
78
  ```
79
79
 
80
- 运行记录会保存到磁盘上的 `.claude/runs/` 目录下,因此即使会话中断,也可以顺利恢复。每个步骤都包含操作指导,说明需要生成的内容、必填部分以及停止条件。
80
+ 运行结果会持久保存到磁盘(`.claude/runs/`),因此中断的会话可以干净地恢复。每个步骤都包含操作员指导:要生成的内容、必需的部分和停止条件。
81
81
 
82
- **一旦已确定路线:**
82
+ **路由完成后:**
83
83
 
84
- 1. **每个环节都会产生交接结果**——这是一种结构化的输出,包含佐证材料,旨在减少后续环节中的歧义。
85
- 2. **审核人员根据合同进行审查**——他们会根据结构化的证据来接受、拒绝或阻止,而不是基于主观印象。
86
- 3. **自动进行问题解决流程**——被阻止或拒绝的工作会自动分配给合适的处理人员,并附带原因、问题类型以及所需的资料。
84
+ 1. **每个角色都会生成一个交接**——结构化的输出,其中包含证据项目,以减少对下一个角色的歧义。
85
+ 2. **审核者根据合同进行审核**——基于结构化的证据(而不是印象)进行接受、拒绝或阻止。
86
+ 3. **恢复路由自动进行**——被阻止或拒绝的工作会被路由到正确的解决者,并附带原因、恢复类型和必需的工件。
87
87
 
88
- ## 组织部署状态
88
+ ## 考虑预算的调度
89
89
 
90
- 整个组织范围内的部署状态(包括队列、决策、审计记录以及每个仓库的锁定信息)存储在一个独立的私有仓库中:[`role-os-rollout`](https://github.com/mcp-tool-shop-org/role-os-rollout)。这个仓库是产品本身,而该仓库中的内容则代表了实际的运行状态。
90
+ 角色操作系统可以在每个调度步骤中咨询本地**令牌预算分析师**,并将建议的支出预测附加到清单中——可以选择启用(`ROLEOS_BUDGET_CONSULT`),为建议性(它绝不会阻止调度),并回退到确定性的基线。默认情况下禁用;预测是本地的并且可以免费运行。请参阅[手册](https://mcp-tool-shop-org.github.io/role-os/handbook/specialist-budget/)
91
91
 
92
- ## 内存与连续性
92
+ ## 组织推广状态
93
93
 
94
- Role OS 不拥有或复制内存层。如果 Claude 项目中存在内存,它就是标准的连续性系统,代码仓库的事实、决策、未解决的问题和处理历史都存储在那里。
94
+ 组织范围的推广状态(队列、决策、审计记录、每个仓库的锁定包)存储在单独的私有仓库中:[`role-os-rollout`](https://github.com/mcp-tool-shop-org/role-os-rollout)。这个仓库是产品;那个仓库是运行状态。
95
95
 
96
- Role OS 与 Claude 项目的内存集成,而不是替代它。
96
+ ## 内存和连续性
97
97
 
98
- ## 完整的处理流程和发布检查
98
+ 角色操作系统不拥有或复制内存层。在 Claude 项目内存存在的地方,它就是规范的连续性系统——仓库事实、决策、未完成的任务和处理历史记录都存储在那里。
99
99
 
100
- 完整的处理流程是一个由 7 个阶段组成的规范流程,定义在 Claude 项目的内存中(`memory/full-treatment.md`)。Role OS 使用角色合约、交接和评审环节来处理流程,而不是重新定义该流程。
100
+ 角色操作系统与 Claude 项目内存集成。它不会取代它。
101
101
 
102
- **发布检查 (Shipcheck)** 是在完整处理流程之前执行的 31 个项目质量检查。在开始任何处理之前,必须通过 A 到 D 这四个关键检查。参考文档:`memory/shipcheck.md`。
102
+ ## 完整的处理和发布检查
103
103
 
104
- 顺序:首先进行发布检查,然后进行完整的处理流程。在通过所有关键检查之前,不能发布 v1.0.0 版本。
104
+ 完整的处理是 Claude 项目内存中定义的规范的 7 阶段协议(`memory/full-treatment.md`)。角色操作系统使用角色合同、交接和审核门来路由和审核处理——它不会重新定义协议。
105
105
 
106
- ## 共计50个角色,分布在8个不同的内容包中
106
+ **发布检查**是在完整处理之前运行的 31 项质量门。在开始任何处理之前,必须通过 A-D 强制门。规范参考:`memory/shipcheck.md`。
107
107
 
108
- | 包装;打包;一包;一盒;一套。 | 角色。 |
108
+ 顺序:首先进行发布检查,然后进行完整处理。如果没有通过强制门,则不能发布 v1.0.0。
109
+
110
+ ## 10 个包中的 61 个角色
111
+
112
+ | 包 | 角色 |
109
113
  |------|-------|
110
- | **Core** (3) | 协调员、产品战略师、评论员。 |
111
- | **Engineering** (7) | 前端开发工程师、后端工程师、测试工程师、代码重构工程师、性能工程师、依赖项审计员、安全审查员。 |
112
- | **Design** (2) | 用户界面设计师,品牌守护者。 |
113
- | **Marketing** (1) | 产品发布文案撰写员。 |
114
- | **Treatment** (7) | 代码仓库研究员、代码仓库翻译员、文档架构师、元数据管理员、内容审核员、部署验证员、发布工程师。 |
115
- | **Product** (3) | 反馈整合工具、产品路线图优先级排序工具、需求文档编写人员。 |
116
- | **Research** (4) | 用户体验研究员、竞争分析师、趋势研究员、用户访谈分析师。 |
117
- | **Growth** (4) | * **产品发布策略师** (Launch Strategist)
118
- * **内容策略师** (Content Strategist)
119
- * **社区运营经理** (Community Manager)
120
- * **客户支持问题分级负责人** (Support Triage Lead) |
121
-
122
- 每个角色都有完整的定义,包括:任务内容、使用时机、不使用时机、预期输入、所需输出、质量标准以及升级触发条件。每个角色都可以被路由,`roleos route` 命令可以根据数据包的内容推荐合适的角色。
114
+ | **Core** (3) | 协调者、产品策略师、审核者 |
115
+ | **Engineering** (7) | 前端开发人员、后端工程师、测试工程师、重构工程师、性能工程师、依赖性审核员、安全审核员 |
116
+ | **Design** (2) | UI 设计师、品牌守护者 |
117
+ | **Marketing** (1) | 发布文案撰写者 |
118
+ | **Treatment** (7) | 仓库研究员、仓库翻译员、文档架构师、元数据管理员、覆盖率审核员、部署验证员、发布工程师 |
119
+ | **Product** (3) | 反馈综合者、路线图优先级排序者、规范撰写者 |
120
+ | **Research** (4) | 用户体验研究员、竞争分析师、趋势研究员、用户访谈综合者 |
121
+ | **Growth** (4) | 发布策略师、内容策略师、社区经理、支持优先级排序负责人 |
122
+ | **Deep Audit** (4) | 组件审核员、测试真值审核员、接缝审核员、审核综合者 |
123
+ | **Swarm** (7) | 蜂群协调员、蜂群后端代理、蜂群桥接代理、蜂群测试代理、蜂群基础设施代理、蜂群前端代理、蜂群综合者 |
124
+
125
+ 每个角色都有完整的合同:任务、何时使用、何时不使用、预期输入、必需输出、质量标准和升级触发器。每个角色都可以进行路由——`roleos route` 可以根据任务包的内容推荐任何角色。
123
126
 
124
127
  ## 快速入门
125
128
 
@@ -136,6 +139,19 @@ roleos complete artifact.md # Complete with artifact
136
139
  roleos explain # Show full state
137
140
  roleos report # Completion report
138
141
 
142
+ # Deep audit:
143
+ roleos audit manifest --generate # Create audit-manifest.json
144
+ roleos audit # Start component-level deep audit
145
+ roleos audit status # Check audit progress
146
+ roleos audit verify # Verify manifest and outputs
147
+
148
+ # Dogfood swarm:
149
+ roleos swarm manifest --generate # Auto-detect domains from repo structure
150
+ roleos swarm # Start multi-pass convergence swarm
151
+ roleos swarm status # Check swarm progress by stage
152
+ roleos swarm findings # List findings by severity
153
+ roleos swarm approve # Approve feature gate
154
+
139
155
  # Or go manual:
140
156
  roleos start "fix the crash" # Entry decision only (no run)
141
157
  roleos packet new feature
@@ -147,57 +163,57 @@ roleos mission list
147
163
  roleos packs list
148
164
  ```
149
165
 
150
- ## 何时不应使用 Role OS
166
+ ## 何时不使用角色操作系统
151
167
 
152
- - 简单的修复、拼写错误或明显的bug。
153
- - 探索性研究,但没有明确的成果。
154
- - 可以在一个人5分钟内完成的工作。
155
- - 紧急的补丁,需要在代码审查流程完成之前发布。
156
- - 那些更注重速度而非结构的项目。
168
+ - 单行修复、错别字或明显的错误
169
+ - 没有明确输出的探索性研究
170
+ - 可以在 5 分钟内在一个人的脑海中完成的工作
171
+ - 需要在审查流程完成之前发布的紧急补丁
172
+ - 你希望速度比结构更重要的项目
157
173
 
158
174
  ## 证据
159
175
 
160
- Role OS 已在两个结构不同的代码仓库中的三个试验项目中得到验证:
176
+ Role OS 已在两个结构不同的仓库中的三个测试环境中得到验证:
161
177
 
162
- **试验 001 — 功能开发 (Feature work)** (Crew Screen, Star Freight)
178
+ **测试 001 — 功能开发**(人员筛选、星际货运)
163
179
  - 7 个角色链,45 个测试场景,0 个角色冲突
164
- - 避免了从父代码仓库的污染,发现了代码中的即兴创作,并暴露了真实的障碍。
180
+ - 防止来自分支祖先的污染,捕获内联发明,发现真实的障碍
165
181
 
166
- **试验 002 — 集成 (Integration work)** (CampaignState wiring, Star Freight)
167
- - 5 个角色链,解决了架构接口问题,避免了虚假的回滚。
168
- - 抗回滚测试证明了当前路径是真实的,而不是占位符。
182
+ **测试 002 — 集成工作**(CampaignState 连接,星际货运)
183
+ - 5 个角色链,解决了架构缝隙,没有使用备用方案
184
+ - 反备用方案测试证明了实时路径是真实的,而不是占位符
169
185
 
170
- **试验 003 — 身份验证 (Identity work)** (Contamination purge, Star Freight)
186
+ **测试 003 — 身份工作**(污染清除,星际货运)
171
187
  - 6 个角色链,51 个测试场景,包括持久的 CI 污染防御
172
- - 在修复继承的错误偏差时,避免了对整个产品的重新设计。
188
+ - 修复了继承的虚构漂移,而没有导致广泛的重新设计
173
189
 
174
- **可移植性试验**(角色一致性,传感器幽默)
175
- - 相同的核心,不同的语言/领域/技术栈
176
- - 仅在上下文发生变化的情况下采用,不进行核心合同的修改。
190
+ **可移植性测试**(角色一致性,传感器幽默)
191
+ - 相同的核心,不同的语言/领域/堆栈
192
+ - 仅采用上下文更改——没有核心合同修改
177
193
 
178
- **完整型 FT-001 方案** (适用于桌面环境)
179
- - 采用 7 个阶段的人工干预流程,并配备相应的角色设置。
180
- - 经过验证的“船舶检查”流程,确保无角色冲突。
194
+ **完整处理 FT-001**(portlight-desktop)
195
+ - 7 个阶段的 staffed 处理,使用处理包角色
196
+ - 已验证 Shipcheck 门控,零角色冲突
181
197
 
182
- **FT-002 完整方案** (studioflow)
183
- - 相同的方案包,但结构上不同的代码仓库(创意工作区与游戏)。
184
- - 方案包可移植,无需修改任何合同。
198
+ **完整处理 FT-002**(studioflow
199
+ - 相同的处理包,结构不同的仓库(创意工作区与游戏)
200
+ - 处理包可移植——无需合同修改
185
201
 
186
- **头脑风暴黄金流程** (MCP 服务器市场主题)
187
- - 9 个角色链,4 个分析师并行工作,进行交叉询问 + 驳斥争议图。
188
- - 提出了 4 个挑战,缩小了 3 个主张,1 个未解决——保持健康的压力,避免僵局。
189
- - 从渲染的成果物追溯到 16 多个“真相”原子。
190
- - 完整地证明了溯源链:真相 → 原子 → 争议 → 综合 → 扩展 → 评估 → 渲染 → 追溯。
202
+ **头脑风暴黄金测试**(MCP 服务器市场主题)
203
+ - 9 个角色链,4 个分析师并行工作,交叉审查 + 反驳争议图
204
+ - 提出了 4 个挑战,缩小了 3 个主张,1 个未解决——健康的压力,而不是僵局
205
+ - 16+ 个跟踪链接,从渲染的工件追溯到真相层原子
206
+ - 已验证完整的责任链:真相 → 原子 → 争议 → 综合 → 扩展 → 评估 → 渲染 → 跟踪
191
207
 
192
- ## 核心特性
208
+ ## 核心属性
193
209
 
194
- 这些是不可谈判的。如果任何一项特性被削弱,则应拒绝该更改。
210
+ 这些是不可谈判的。如果更改削弱了任何一个,请拒绝它。
195
211
 
196
- - 角色边界保持不变
197
- - 审查具有实际效力
198
- - 升级流程保持诚实
199
- - 测试用例保持可测试性
200
- - 可移植性需要根据上下文进行调整,而不是进行核心修改。
212
+ - 角色边界保持
213
+ - 审查具有约束力
214
+ - 升级过程保持诚实
215
+ - 数据包保持可测试
216
+ - 可移植性需要上下文调整,而不是核心手术
201
217
 
202
218
  ## 项目结构
203
219
 
@@ -209,18 +225,23 @@ role-os/
209
225
  entry-cmd.mjs ← `roleos start` CLI command
210
226
  run.mjs ← Persistent run engine: create → step → pause → resume → report
211
227
  run-cmd.mjs ← `roleos run/resume/next/explain/complete/fail` + interventions
212
- mission.mjs ← 7 named mission types (feature, bugfix, treatment, docs, security, research, brainstorm)
228
+ mission.mjs ← 9 named mission types (feature, bugfix, treatment, docs, security, research, brainstorm, deep-audit, dogfood-swarm)
213
229
  mission-run.mjs ← Mission runner: create → step → complete → report
214
230
  mission-cmd.mjs ← `roleos mission` CLI commands
215
- route.mjs 31-role routing + dynamic chain builder
216
- packs.mjs 7 calibrated team packs + auto-selection
231
+ audit-cmd.mjs `roleos audit` deep audit entry point with manifest generation
232
+ swarm-cmd.mjs `roleos swarm` dogfood swarm entry point with domain detection
233
+ swarm/ ← Domain detection, build gate, evidence persistence bridge
234
+ route.mjs ← 61-role routing + dynamic chain builder
235
+ packs.mjs ← 10 calibrated team packs + auto-selection
217
236
  conflicts.mjs ← 4-pass conflict detection
218
237
  escalation.mjs ← Auto-routing for blocked/rejected/split
219
238
  evidence.mjs ← Structured evidence + role-aware requirements
220
239
  dispatch.mjs ← Runtime dispatch manifests for multi-claude
221
- artifacts.mjs 30 per-role artifact contracts + 7 pack handoffs
240
+ tool-profiles.mjs Per-role tool sandboxing (shared by dispatch + trial)
241
+ state-machine.mjs ← Canonical step/run transition maps
242
+ artifacts.mjs ← Per-role artifact contracts + pack handoffs
222
243
  decompose.mjs ← Composite task detection + splitting
223
- composite.mjs ← Dependency-ordered execution + recovery
244
+ composite.mjs ← Dependency-ordered execution + recovery + cycle detection
224
245
  replan.mjs ← Mid-run adaptive replanning
225
246
  calibration.mjs ← Outcome recording + weight tuning
226
247
  hooks.mjs ← 5 lifecycle hooks for runtime enforcement
@@ -228,56 +249,60 @@ role-os/
228
249
  brainstorm.mjs ← Evidence modes, request validation, finding/synthesis/judge schemas
229
250
  brainstorm-roles.mjs ← Role-native schemas, input partitioning, blindspot enforcement, cross-exam
230
251
  brainstorm-render.mjs ← Two-layer rendering: lexical bans, render schemas, debate transcript
231
- test/ ← 894 tests across 30 test files
252
+ test/ ← 1150 tests across 37 test files
232
253
  starter-pack/ ← Drop-in role contracts, policies, schemas, workflows
233
254
  ```
234
255
 
235
256
  ## 安全性
236
257
 
237
- 角色操作系统仅在本地运行。它复制 Markdown 模板,并将数据包/判决文件写入到您仓库的 `.claude/` 目录中。它不访问网络,不处理敏感信息,也不收集遥测数据。没有危险操作——所有文件写入默认使用“如果存在则跳过”的方式。请参阅 [SECURITY.md](SECURITY.md) 以获取完整策略。
258
+ Role OS 仅在**本地**运行。它复制 Markdown 模板并将数据包/判决文件写入到你的仓库的 `.claude/` 目录。它不访问网络、处理密钥或收集遥测数据。没有危险的操作——所有文件写入默认使用“如果存在则跳过”。有关完整策略,请参阅 [SECURITY.md](SECURITY.md)
238
259
 
239
260
  ## 操作系统
240
261
 
241
- | 层 | 其作用 | 状态 |
262
+ | 层 | 它的作用 | 状态 |
242
263
  |-------|-------------|--------|
243
- | **Routing** | 根据数据包内容对所有 31 个角色进行评分,解释建议,评估置信度。 | ✓ 已发布 |
244
- | **Chain builder** | 从评分的角色中组装出按阶段顺序排列的链,偏向于数据包类型,但不受模板限制。 | ✓ 已发布 |
245
- | **Conflict detection** | 进行 4 次验证:检查冲突、顺序、冗余、覆盖范围。提供修复建议。 | ✓ 已发布 |
246
- | **Escalation** | 自动将受阻/拒绝/拆分的工作路由到正确的处理程序,并提供原因和所需的成果物。 | ✓ 已发布 |
247
- | **Evidence** | 在判决中提供结构化的、与角色相关的证据。进行充分性检查。有 12 种证据类型。 | ✓ 已发布 |
248
- | **Dispatch** | 为多 Claude 生成执行清单。每个角色的工具配置文件、系统提示、预算。 | ✓ 已发布 |
249
- | **Trials** | 完整地证明了:30/30 个黄金任务 + 5/5 个负面测试。7 个方案包测试已完成。 | ✓ 已完成 |
250
- | **Team Packs** | 7 个经过校准的方案包,具有自动选择、不匹配保护和自由路由回退功能。 | ✓ 已发布 |
251
- | **Outcome calibration** | 记录运行结果,根据结果调整方案包/角色的权重,调整置信度阈值。 | ✓ 已发布 |
252
- | **Mixed-task decomposition** | 检测复合工作,将其拆分为子数据包,分配方案包,并保留依赖关系。 | ✓ 已发布 |
253
- | **Composite execution** | 按照依赖顺序运行子数据包,传递成果物,进行分支恢复和综合。 | ✓ 已发布 |
254
- | **Adaptive replanning** | 在运行过程中,对范围、发现或新需求进行更改,无需重新启动即可更新计划。 | ✓ 已发布 |
255
- | **Session spine** | `roleos init claude` 创建 CLAUDE.md、/roleos-route、/roleos-review、/roleos-status。 `roleos doctor` 验证连接。 路由卡证明了参与。 | ✓ 已发布 |
256
- | **Hook spine** | 5 个生命周期钩子(SessionStart、PromptSubmit、PreToolUse、SubagentStart、Stop)。 强制执行建议:路由卡提醒、工具使用限制、子代理角色注入、完成审计。 | ✓ 已发布 |
257
- | **Artifact spine** | 30 个与角色相关的成果物合同。7 个方案包交付合同。进行结构验证。检查链的完整性。下游角色永远不知道他们收到了什么。 | ✓ 已发布 |
258
- | **Mission library** | 7 个命名任务(功能发布、错误修复、方案、文档发布、安全加固、研究发布、头脑风暴)。 每个任务都声明方案包、角色链、成果物流程、升级分支、诚实且部分定义的描述。 所有 7 个任务都经过试验验证。 | ✓ 已发布 |
259
- | **Mission runner** | 创建运行,逐步跟踪状态,完成/失败并提供诚实报告。 传播受阻步骤,发出链外升级警告,重新打开最后一步。 | ✓ 已发布 |
260
- | **Unified entry** | `roleos start` 自动决定任务、方案包或自由路由。 具有置信度得分、备选方案和复合检测的后备层级。 | ✓ 已发布 |
261
- | **Persistent runs** | `roleos run` 创建磁盘支持的运行。 `resume`(恢复)、`next`(下一步)、`explain`(解释)、`complete`(完成)、`fail`(失败)。 干预:重新路由、升级、重试、阻止、重新打开。 提供步骤级别的指导。 测量摩擦力。 | ✓ 已发布 |
262
- | **Brainstorm** | 双层架构:真相(角色原生模式、溯源原子、交叉询问争议图)+ 渲染(5 种不同的声音、词汇限制、辩论记录)。 追溯链接证明每个渲染的声明都映射到一个“真相”原子。 黄金流程:894 个测试。 | ✓ 已发布 |
263
-
264
- ## 7 个任务
265
-
266
- | 任务 | 包装;打包;一包;一盒;一套。 | 角色。 | 使用时机 |
264
+ | **Routing** | 根据数据包内容对所有 61 个角色进行评分,解释建议,评估置信度 | ✓ 已发布 |
265
+ | **Chain builder** | 从评分后的角色中组装出按阶段排序的链,偏向于数据包类型,而不是模板锁定 | ✓ 已发布 |
266
+ | **Conflict detection** | 四次验证:硬冲突、序列、冗余、覆盖差距。修复建议。 | ✓ 已发布 |
267
+ | **Escalation** | 自动将阻塞/拒绝/拆分的工作路由到正确的解决者,并提供理由 + 所需的工件 | ✓ 已发布 |
268
+ | **Evidence** | 具有角色意识的结构化证据,包含在判决中。充分性检查。12 种证据类型。 | ✓ 已发布 |
269
+ | **Dispatch** | multi-claude 生成执行清单。每个角色的工具配置文件、系统提示、预算。 | ✓ 已发布 |
270
+ | **Trials** | 完整的测试已完成:30/30 个黄金任务 + 5/5 个负面测试。7 个包测试已完成。 | ✓ 已完成 |
271
+ | **Team Packs** | 10 个经过校准的包,具有自动选择、不匹配保护和自由路由备用方案。 | ✓ 已发布 |
272
+ | **Outcome calibration** | 记录运行结果,根据结果调整包/角色权重,调整置信度阈值。 | ✓ 已发布 |
273
+ | **Mixed-task decomposition** | 检测复合工作,将其拆分为子数据包,分配包,并保留依赖关系。 | ✓ 已发布 |
274
+ | **Composite execution** | 以依赖顺序运行子数据包,并进行工件传递、分支恢复和综合。 | ✓ 已发布 |
275
+ | **Adaptive replanning** | 在运行过程中,范围更改、发现或新的需求会更新计划,而无需重新启动。 | ✓ 已发布 |
276
+ | **Session spine** | `roleos init claude` 创建 CLAUDE.md、/roleos-route、/roleos-review、/roleos-status。`roleos doctor` 验证连接。路由卡证明参与度。 | ✓ 已发布 |
277
+ | **Hook spine** | 5 个生命周期钩子(SessionStart、PromptSubmit、PreToolUse、SubagentStart、Stop)。建议性强制执行:路由卡提醒、写入工具门控、子代理角色注入、完成审计。 | ✓ 已发布 |
278
+ | **Artifact spine** | 每个角色的工件合同。包交接合同。结构验证。链完整性检查。下游角色永远不会猜测他们收到了什么。 | ✓ 已发布 |
279
+ | **Mission library** | 9 个命名任务(feature-ship、bugfix、treatment、docs-release、security-hardening、research-launch、brainstorm、deep-audit、dogfood-swarm)。每个任务都声明包、角色链、工件流程、升级分支、诚实的部分定义。 | ✓ 已发布 |
280
+ | **Mission runner** | 创建运行,逐步执行,并使用跟踪状态完成/失败,并进行诚实报告。阻塞步骤传播、链外升级警告、最后步骤重新打开。 | ✓ 已发布 |
281
+ | **Unified entry** | `roleos start` 自动决定任务与包或自由路由。具有置信度分数、替代方案和复合检测的备用方案。 | ✓ 已发布 |
282
+ | **Persistent runs** | `roleos run` 创建基于磁盘的运行。`resume`、`next`、`explain`、`complete`、`fail`。干预措施:重新路由、升级、重试、阻止、重新打开。步骤本地指导。摩擦测量。 | ✓ 已发布 |
283
+ | **Brainstorm** | 双层架构:真相(角色原生模式、来源原子、交叉审查争议图)+ 渲染(5 种不同的声音、词汇禁令、辩论记录)。跟踪链接证明每个渲染的声明都映射到真相原子。黄金测试已完成。 | ✓ 已发布 |
284
+ | **Deep Audit** | 清单驱动的代码仓库审计:将代码仓库分解为组件,从依赖关系图中调度 N 名审计员 + M 名测试真实性审计员 + K 名接口审计员,并将结果综合成排序后的结论和行动计划。动态调度会根据代码仓库的大小进行调整(公式为 2N + K + 3)。在每个步骤中,都会进行运行器原生验证。 | ✓ 已发布 |
285
+ | **Dogfood Swarm** | 多阶段收敛:三个健康阶段(漏洞/安全 → 积极改进 → 人性化),然后进行功能交付。独占的文件所有权,在每个阶段之后进行构建门控,用户检查点。领域自动检测会生成清单。证据桥接至内部测试实验室。 | ✓ 已发布 |
286
+
287
+ ## 9 个任务
288
+
289
+ | 任务 | 包 | 角色 | 何时使用 |
267
290
  |---------|------|-------|-------------|
268
- | `feature-ship` | 特性 | 5 | 完整特性交付:范围 → 规范 → 实现 → 测试 → 审查 |
291
+ | `feature-ship` | 功能 | 5 | 完整的功能交付:范围 → 规范 → 实现 → 测试 → 审查 |
269
292
  | `bugfix` | 错误修复 | 4 | 诊断根本原因,修复,测试,验证 |
270
- | `treatment` | 方案 | 4 | 代码检查 + 优化 + 文档 + CI 验证 + 审查 |
293
+ | `treatment` | 处理 | 4 | 代码检查 + 优化 + 文档 + CI 验证 + 审查 |
271
294
  | `docs-release` | 文档 | 2 | 编写/更新文档,发布说明 |
272
- | `security-hardening` | 安全性 | 4 | 威胁模型分析,安全审计,修复漏洞,重新审计,验证 |
295
+ | `security-hardening` | 安全 | 4 | 威胁建模,审计,修复漏洞,重新审计,验证 |
273
296
  | `research-launch` | 研究 | 4 | 提出问题,进行研究,记录发现,做出决定 |
274
- | `brainstorm` | 头脑风暴 | 9 | 结构化的、多角度的讨论,具有可追溯的异议和结论。 |
297
+ | `brainstorm` | 头脑风暴 | 9 | 结构化的多视角探究,具有可追溯的异议和结论 |
298
+ | `deep-audit` | 深度审计 | 5(等级) | 清单驱动的代码仓库审计——工作者数量根据代码仓库图通过动态调度进行调整 |
299
+ | `dogfood-swarm` | 集群 | 8(等级) | 多阶段收敛:健康 A → 健康 B → 健康 C → 功能 → 最终综合 |
275
300
 
276
- 每个任务都包含诚实且全面的定义——当工作停滞时,系统会记录已完成的内容和未完成的内容,而不是虚报完成情况。
301
+ 每个任务都包含诚实且部分完成的定义——当工作停滞时,系统会记录已完成的内容和剩余内容,而不是虚报完成情况。
277
302
 
278
303
  ### 头脑风暴任务
279
304
 
280
- 这**不是**“人工智能头脑风暴”。 头脑风暴任务是**具有特定角色的、在法律框架下的活动,具有可追溯的异议和结论性输出。**
305
+ 不是“AI 头脑风暴”。头脑风暴任务是**在法律框架下的专业角色,具有可追溯的异议和产生结论的输出。**
281
306
 
282
307
  ```bash
283
308
  roleos run "explore product directions for a developer tool discovery platform"
@@ -285,33 +310,61 @@ roleos run "explore product directions for a developer tool discovery platform"
285
310
  # Chain: 4 Analysts (parallel) → Normalize → Cross-Examine → Rebut → Synthesize → Expand → Judge
286
311
  ```
287
312
 
288
- **它与众不同之处:**
313
+ **使其与众不同之处:**
314
+
315
+ - **第一层(真相):** 四位分析师输出角色相关的模式(上下文图、用户价值图、机制图、定位图)——而不是共享的散文。每个角色都强制执行盲点:禁止的短语、禁止的主张类型、过滤的输入分区。原子携带来源信息。定向的交叉询问图会产生有针对性的挑战。原始分析师在压力下进行辩护、缩小范围或撤回。
316
+
317
+ - **第二层(呈现):** 五种不同的声音(边界备忘录、现场笔记、系统草图、主张摘要、交叉询问记录),并具有词汇限制,以防止声音融合。综合会消耗真相,而不是呈现的散文。两层始终可用。
318
+
319
+ - **责任链:** 每个呈现的句子都可以追溯到真相层中的原子。综合方向引用原子。交叉询问的目标是真实的声明 ID。争议图是产品,而不是散文。
320
+
321
+ **已验证:** v0.4 黄金运行——已验证完整的责任链。有关完整工件链,请参见 [`examples/golden-run.md`](examples/golden-run.md)。
322
+
323
+ ### 深度审计任务
324
+
325
+ 不是表面扫描。深度审计任务**将代码仓库分解为有界组件,并根据代码仓库自身的依赖关系图调度专门的审计员。**
326
+
327
+ ```bash
328
+ roleos run "deep audit this repo" --manifest=audit-manifest.json
329
+ # → MISSION: Deep Audit (Manifest-Scaled)
330
+ # Steps: Component Auditor ×6 + Test Truth Auditor ×6 + Seam Auditor ×8 + Synthesizer + Action Plan + Critic = 23 steps
331
+ ```
332
+
333
+ **使其与众不同之处:**
334
+
335
+ - **动态调度**——工作者数量不是固定的。一个包含 10 个组件和 5 个边界集群的代码仓库会产生 28 个步骤(2×10 + 5 + 3)。一个包含 3 个组件的代码仓库会产生 12 个步骤。缩放公式为 `2N + K + 3`,其中 N = 组件,K = 边界。
336
+ - **清单驱动的包**——`audit-manifest.json` 定义组件(包含文件路径、行数、描述)和边界(从/到,包含接口描述)。每个审计员仅接收其包。
337
+ - **四种角色原型**——组件审计员(每个模块的代码真相)、测试真实性审计员(证明测试与现有测试)、接口审计员(来自依赖关系图的集成边界)、审计综合器(来自所有包的排序结论 + 行动计划)。
338
+ - **在每个步骤中进行工件验证**——`validateArtifact()` 在两个执行路径中的每个步骤完成后都会触发。结果附加到步骤对象。系统知道每个工件是否满足其合同。
339
+ - **诚实且部分完成**——当预算或范围阻止完成时,每个组件的发现都是单独有效的。系统会根据已完成的内容进行综合,而不是虚报完全覆盖。
289
340
 
290
- - **第一层(真相):** 四位分析师使用各自的角色专属的模式(情境地图、用户价值地图、机制地图、定位地图),而不是共享的文字。 每个角色都受到“盲点”的限制:禁止使用的词语,禁止提出的主张类型,以及过滤后的输入内容。 每个元素都带有来源信息。 一个有向的交叉询问图会产生针对性的挑战。 原始分析师在压力下会辩护、缩小范围或撤回观点。
341
+ **已验证:** 运行器原生证明运行——针对真实清单进行了 18 个测试,并验证了完整的生命周期,包括升级重新打开和部分失败。已验证 3/6/10/15 组件清单的缩放公式。
342
+
343
+ ### 内部测试集群任务
344
+
345
+ 不是一次性代码检查器。内部测试集群任务**运行一个多阶段收敛协议,该协议通过三个健康阶段和迭代的功能交付,将代码仓库从“可用”状态转变为“生产就绪”状态。**
346
+
347
+ ```bash
348
+ roleos swarm
349
+ # → MISSION: Dogfood Swarm (Multi-Pass Convergence)
350
+ # Stages: Health-A → Health-B → Health-C → Feature → Final
351
+ # Domain agents: 3-5 parallel per wave (exclusive file ownership)
352
+ ```
291
353
 
292
- - **第二层(呈现):** 五种不同的声音(边界备忘录、现场笔记、系统草图、主张简报、交叉询问记录),通过词汇限制防止声音的融合。 综合分析会消耗“真相”,而不会生成原始的文字。 两层内容始终可用。
354
+ **使其与众不同之处:**
293
355
 
294
- - **完整追溯:** 每一句话都可追溯到“真相”层的元素。 综合分析的说明会引用这些元素。 交叉询问的目标是真实的主张ID。 争议图是结果,而不是文字本身。
356
+ - **三阶段健康检查**——第一阶段修复漏洞和安全问题(循环执行,直到 0 CRITICAL 级别 + 0 个 HIGH 级别的问题)。第二阶段应用主动加固措施(用户审核结果)。第三阶段优化代码库——提供帮助用户的错误消息、重新连接反馈、加载状态和可访问性。每个阶段都是一个独立的视角,而不是重复的扫描。
357
+ - **独占文件所有权**——每个域代理通过 `swarm-manifest.json` 拥有特定的文件。没有两个代理编辑同一个文件。没有合并冲突。没有协调开销。
358
+ - **构建门禁**——每次迭代后,必须通过代码风格检查、类型检查和测试。系统自动检测构建系统(Node、Rust、Python、Go),并运行相应的命令。
359
+ - **用户检查点**——健康检查 B 阶段和功能测试阶段需要在执行前获得明确的用户批准。系统呈现结果,用户决定构建什么。
360
+ - **迭代收敛**——各阶段与迭代循环交替进行,直到满足退出条件或达到最大迭代次数。每个迭代都从头开始重新审核,以发现之前修复引入的回归问题。
361
+ - **域自动检测**——`roleos swarm manifest --generate` 检测仓库类型(CLI、Web、桌面应用、MCP、单仓库),并生成不重叠的域分配。
295
362
 
296
- **已验证:** v0.4 版本,通过了 894 个测试,完整追溯链已验证。 详情请参见 [`examples/golden-run.md`](examples/golden-run.md),其中包含完整的流程记录。
363
+ **已验证:** claude-collaborate(2026-03-28)——35 个测试增加到 129 个,修复了 106 个健康问题,发布了 v1.1.0 版本。协议 v2.0,包含 9 个阶段。
297
364
 
298
365
  ## 状态
299
366
 
300
- - v0.1–v0.4: 基础版本 — 试验、采用、治疗方案包、入门包。
301
- - v1.0.0: 32个角色,完整的命令行界面,经过验证的治疗方案,多仓库兼容性。
302
- - v1.0.2: 角色操作系统锁定(修复引导启动问题,使用`--force`参数)。
303
- - v1.1.0: 31个角色,完整的路由核心,冲突检测,升级,证据,调度,7个经过验证的团队包。35次执行试验。212个测试。
304
- - v1.2.0: 校准后的包被设置为默认选项。自动选择,不匹配检测,替代方案建议,自由路由回退。246个测试。
305
- - v1.3.0: 结果校准,混合任务分解,组合执行,自适应重新规划。317个测试。
306
- - v1.4.0: 会话核心 — `roleos init claude`,`roleos doctor`,路由卡片,`/roleos-route` + `/roleos-review` + `/roleos-status` 命令。335个测试。
307
- - v1.5.0: 钩子核心 — 5个生命周期钩子,用于运行时强制执行。358个测试。
308
- - v1.6.0: 构件核心 — 20个角色相关的构件合约,7个包交付合约,结构验证。385个测试。
309
- - v1.7.0: 完成证明 — 真实任务通过整个堆栈运行。`roleos artifacts` 命令行界面。对结构性问题的诚实反馈。398个测试。
310
- - v1.8.0: 任务库(阶段S) — 6个命名任务,运行引擎,完成报告。经过6次真实试验的强化。481个测试。
311
- - v1.9.0: 统一入口路径(阶段T) — `roleos start` 自动决定是任务、包还是自由路由。回退机制,组合检测,入口路径比较试验。527个测试。
312
- - **v2.0.0**: 优化用户体验(阶段U) — `roleos run` 创建持久的基于磁盘的运行。恢复,下一步,解释,完成,失败。干预措施:重新路由,升级,重试,阻止,重新打开。在每个步骤都提供本地指导。摩擦力测量。6次摩擦力试验。613个测试。
313
- - **v2.0.1**: 手册审核,初学者文档,测试数量修正。617个测试。
314
- - **v2.1.0**: 构思任务(v0.4) — 法律下的专业角色,可追溯的意见不一致,带有判决结果的输出。两层架构(真值 + 渲染),交叉询问权限矩阵,争议图,黄金运行证明。7个任务,50个角色,8个包。894个测试。
367
+ 稳定且已发布。请参阅 [CHANGELOG](CHANGELOG.md),以获取完整的版本历史记录以及每个版本中发生的变化。
315
368
 
316
369
  ## 许可证
317
370
 
@@ -319,4 +372,4 @@ MIT
319
372
 
320
373
  ---
321
374
 
322
- 由 <a href="https://mcp-tool-shop.github.io/">MCP Tool Shop</a> 构建。
375
+ 由 <a href="https://mcp-tool-shop.github.io/">MCP Tool Shop</a> 构建
package/package.json CHANGED
@@ -1,6 +1,6 @@
1
1
  {
2
2
  "name": "role-os",
3
- "version": "2.7.0",
3
+ "version": "2.7.1",
4
4
  "description": "Role OS — a multi-Claude operating system where 61 specialized roles execute work through contracts, conflict detection, escalation, and structured evidence. 10 team packs, 9 missions including dogfood swarm (multi-pass convergence), deep audit with manifest-scaled dynamic dispatch, and brainstorm with traceable disagreement.",
5
5
  "homepage": "https://mcp-tool-shop-org.github.io/role-os/",
6
6
  "bugs": {