role-os 2.0.0 → 2.1.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
package/README.zh.md CHANGED
@@ -2,10 +2,8 @@
2
2
  <a href="README.ja.md">日本語</a> | <a href="README.md">English</a> | <a href="README.es.md">Español</a> | <a href="README.fr.md">Français</a> | <a href="README.hi.md">हिन्दी</a> | <a href="README.it.md">Italiano</a> | <a href="README.pt-BR.md">Português (BR)</a>
3
3
  </p>
4
4
 
5
- # Role OS
6
-
7
5
  <p align="center">
8
- <img src="https://raw.githubusercontent.com/mcp-tool-shop-org/brand/main/logos/role-os/readme.png" alt="Role OS" width="400">
6
+ <img src="https://raw.githubusercontent.com/mcp-tool-shop-org/brand/main/logos/role-os/readme.png" alt="Role OS" width="600">
9
7
  </p>
10
8
 
11
9
  <p align="center">
@@ -15,11 +13,11 @@
15
13
  <a href="https://mcp-tool-shop-org.github.io/role-os/"><img src="https://img.shields.io/badge/Landing_Page-live-brightgreen" alt="Landing Page"></a>
16
14
  </p>
17
15
 
18
- 一个多 Claude 操作系统,它通过 31 个专业角色,进行人员配置、任务分配、验证和执行。它创建任务包,根据角色匹配度组建合适的团队,在执行前检测潜在问题,当任务被阻塞或拒绝时自动进行恢复,并且要求在每个决策中提供结构化的证据。
16
+ 一个多 Claude 操作系统,它通过 50 个专业角色合同来配置、分配、验证并执行工作。该系统可以创建任务包,根据角色匹配评分组建合适的团队,在执行前检测潜在问题,并在工作被阻塞或拒绝时自动进行恢复,并且要求在每个决策中提供结构化的证据。
19
17
 
20
18
  ## 其作用
21
19
 
22
- Role OS 是使用多 Claude 的专业方式。它避免了通用 AI 工作流程中可能出现的特定问题:
20
+ Role OS 是一种专业的方式来使用多实例的 Claude 模型。它能够避免通用人工智能工作流程中可能出现的特定问题。
23
21
 
24
22
  - **偏差 (Drift)**:每个角色都专注于其职责范围。产品不会被重新设计。前端不会重新定义范围。后端不会自行决定产品方向。
25
23
  - **虚报完成 (False completion)**:完成的标准是明确的。隐藏缺陷、跳过验证或解决不同问题的成果会被拒绝。
@@ -28,7 +26,7 @@ Role OS 是使用多 Claude 的专业方式。它避免了通用 AI 工作流程
28
26
 
29
27
  ## 工作原理
30
28
 
31
- 描述您的任务。Role OS 会自动决定合适的执行级别。
29
+ 描述您的任务。系统会自动根据任务的角色,选择合适的自动化级别。
32
30
 
33
31
  ```bash
34
32
  roleos start "fix the crash in save handler"
@@ -44,23 +42,52 @@ roleos start "something completely novel"
44
42
  # Hint: Create a packet and run `roleos route` for role-level routing
45
43
  ```
46
44
 
47
- **备用方案:**
45
+ 备用梯子:
46
+
47
+ 1. **任务 (Mission)**:当任务符合已验证的、可重复的工作流程时(例如:bug修复、问题处理、功能发布、文档编写、安全相关、研究)。已知的工作流程链、artifact(成果物)流程、升级流程分支,以及明确但可能不全面的定义。
48
+ 2. **打包 (Pack)**:当任务属于已知的任务类型,但不是完整的任务流程时。有7个经过校准的团队套餐,具有自动选择功能和防止不匹配的机制。
49
+ 3. **自由路由 (Free routing)**:当任务是全新的、混合型的或不确定的任务时。系统会根据任务内容,对所有31个角色进行评估,并动态构建工作流程。
50
+
51
+ 该系统不会强行使用错误的抽象层级进行操作。它会解释为什么选择每个层级,并提供替代方案。
52
+
53
+ **一个命令即可启动执行:**
54
+
55
+ ```bash
56
+ roleos run "fix the crash in save handler"
57
+ # → Created run: run-1234
58
+ # → Entry: MISSION (bugfix)
59
+ # → Started step 0: Repo Researcher → diagnosis-report
60
+ # → Guidance: Required sections: entrypoints, module-map, build-test-commands
61
+
62
+ roleos next # Start the next step
63
+ roleos complete diagnosis.md # Complete the active step with artifact
64
+ roleos explain # Show full run state and guidance
65
+ roleos resume # Continue an interrupted run
66
+ roleos report # Generate completion report
67
+ roleos friction # Measure operator touches
68
+ ```
69
+
70
+ **当出现问题时的应对措施:**
48
71
 
49
- 1. **任务 (Mission)** — 当任务符合已验证的重复工作流程时(例如:bug 修复、功能完善、文档编写、安全检查、研究)。已知角色链、流程、升级路径以及清晰的定义。
50
- 2. **任务包 (Pack)** 当任务属于已知的任务类型,但不是完整的任务流程时。有 7 个经过校准的团队包,具有自动选择功能和防止不匹配的机制。
51
- 3. **自由路由 (Free routing)** 当任务是全新的、混合的或不确定的时。它会根据任务内容对所有 31 个角色进行评分,并组装一个动态的角色链。
72
+ ```bash
73
+ roleos retry 0 # Retry a failed step
74
+ roleos reroute 1 "Frontend Developer" "UI bug" # Swap a role
75
+ roleos escalate "Test Engineer" "Repo Researcher" "missed edge case" "re-diagnose"
76
+ roleos block 2 "waiting for API spec"
77
+ roleos reopen 0 "found issue in review"
78
+ ```
52
79
 
53
- 该系统永远不会将任务强制执行到错误的抽象层。它会解释为什么选择每个级别,并提供替代方案。
80
+ 运行记录会保存到磁盘上的 `.claude/runs/` 目录下,因此即使会话中断,也可以顺利恢复。每个步骤都包含操作指导,说明需要生成的内容、必填部分以及停止条件。
54
81
 
55
- **任务执行后:**
82
+ **一旦已确定路线:**
56
83
 
57
- 1. **每个角色都会产生一个交接 (handoff)** — 结构化的输出,包含证据,以减少下一个角色的理解歧义。
58
- 2. **评审员 (Critic) 根据合同进行审查** — 根据结构化的证据,接受、拒绝或阻止任务,而不是主观判断。
59
- 3. **自动进行恢复 (Recovery routes automatically)** — 被阻塞或拒绝的任务会被路由到合适的处理者,并提供原因、恢复类型和所需的资源。
84
+ 1. **每个环节都会产生交接结果**——这是一种结构化的输出,包含佐证材料,旨在减少后续环节中的歧义。
85
+ 2. **审核人员根据合同进行审查**——他们会根据结构化的证据来接受、拒绝或阻止,而不是基于主观印象。
86
+ 3. **自动进行问题解决流程**——被阻止或拒绝的工作会自动分配给合适的处理人员,并附带原因、问题类型以及所需的资料。
60
87
 
61
88
  ## 组织部署状态
62
89
 
63
- 组织范围的部署状态(队列、决策、审计记录、每个仓库的锁定任务包)存储在一个独立的私有仓库中:[`role-os-rollout`](https://github.com/mcp-tool-shop-org/role-os-rollout)。 该仓库是产品,而该仓库是运行状态。
90
+ 整个组织范围内的部署状态(包括队列、决策、审计记录以及每个仓库的锁定信息)存储在一个独立的私有仓库中:[`role-os-rollout`](https://github.com/mcp-tool-shop-org/role-os-rollout)。这个仓库是产品本身,而该仓库中的内容则代表了实际的运行状态。
64
91
 
65
92
  ## 内存与连续性
66
93
 
@@ -76,20 +103,23 @@ Role OS 与 Claude 项目的内存集成,而不是替代它。
76
103
 
77
104
  顺序:首先进行发布检查,然后进行完整的处理流程。在通过所有关键检查之前,不能发布 v1.0.0 版本。
78
105
 
79
- ## 31 个角色,分布在 8 个任务包中
106
+ ## 共计50个角色,分布在8个不同的内容包中
80
107
 
81
- | 任务包 | 角色 |
108
+ | 包装;打包;一包;一盒;一套。 | 角色。 |
82
109
  |------|-------|
83
- | **Core** (3) | 协调员、产品策略师、评审员 |
84
- | **Engineering** (7) | 前端开发工程师、后端工程师、测试工程师、重构工程师、性能工程师、依赖性审计员、安全审查员 |
85
- | **Design** (2) | UI 设计师、品牌管理员 |
86
- | **Marketing** (1) | 发布文案撰写员 |
87
- | **Treatment** (7) | 仓库研究员、仓库翻译员、文档架构师、元数据管理员、覆盖率审计员、部署验证员、发布工程师 |
88
- | **Product** (3) | 反馈综合员、路线图优先级排序员、规范撰写员 |
89
- | **Research** (4) | 用户体验研究员、竞争分析师、趋势研究员、用户访谈综合员 |
90
- | **Growth** (4) | 发布策略师、内容策略师、社区管理员、支持问题处理负责人 |
91
-
92
- 每个角色都有完整的合同:任务描述、适用场景、不适用场景、预期输入、所需输出、质量标准以及升级触发条件。 每一个角色都可以被路由——`roleos route` 可以根据任务内容推荐任何一个角色。
110
+ | **Core** (3) | 协调员、产品战略师、评论员。 |
111
+ | **Engineering** (7) | 前端开发工程师、后端工程师、测试工程师、代码重构工程师、性能工程师、依赖项审计员、安全审查员。 |
112
+ | **Design** (2) | 用户界面设计师,品牌守护者。 |
113
+ | **Marketing** (1) | 产品发布文案撰写员。 |
114
+ | **Treatment** (7) | 代码仓库研究员、代码仓库翻译员、文档架构师、元数据管理员、内容审核员、部署验证员、发布工程师。 |
115
+ | **Product** (3) | 反馈整合工具、产品路线图优先级排序工具、需求文档编写人员。 |
116
+ | **Research** (4) | 用户体验研究员、竞争分析师、趋势研究员、用户访谈分析师。 |
117
+ | **Growth** (4) | * **产品发布策略师** (Launch Strategist)
118
+ * **内容策略师** (Content Strategist)
119
+ * **社区运营经理** (Community Manager)
120
+ * **客户支持问题分级负责人** (Support Triage Lead) |
121
+
122
+ 每个角色都有完整的定义,包括:任务内容、使用时机、不使用时机、预期输入、所需输出、质量标准以及升级触发条件。每个角色都可以被路由,`roleos route` 命令可以根据数据包的内容推荐合适的角色。
93
123
 
94
124
  ## 快速入门
95
125
 
@@ -97,28 +127,33 @@ Role OS 与 Claude 项目的内存集成,而不是替代它。
97
127
  npx role-os init
98
128
 
99
129
  # Describe what you need — Role OS picks the right level:
100
- roleos start "fix the crash in save handler"
130
+ roleos run "fix the crash in save handler"
131
+ # → Creates run, picks bugfix mission, starts first step with guidance
132
+
133
+ # Step through:
134
+ roleos next # Start next step
135
+ roleos complete artifact.md # Complete with artifact
136
+ roleos explain # Show full state
137
+ roleos report # Completion report
101
138
 
102
139
  # Or go manual:
140
+ roleos start "fix the crash" # Entry decision only (no run)
103
141
  roleos packet new feature
104
142
  roleos route .claude/packets/my-feature.md
105
143
  roleos review .claude/packets/my-feature.md accept
106
- roleos status
107
144
 
108
145
  # Explore missions and packs:
109
146
  roleos mission list
110
- roleos mission show bugfix
111
147
  roleos packs list
112
- roleos packs show feature
113
148
  ```
114
149
 
115
150
  ## 何时不应使用 Role OS
116
151
 
117
- - 单行修复、拼写错误或明显错误
118
- - 没有明确输出的探索性研究
119
- - 任务可以在 5 分钟内由一个人完成
120
- - 需要在审查链完成之前发布的紧急修复
121
- - 优先考虑速度而不是结构的开发项目
152
+ - 简单的修复、拼写错误或明显的bug。
153
+ - 探索性研究,但没有明确的成果。
154
+ - 可以在一个人5分钟内完成的工作。
155
+ - 紧急的补丁,需要在代码审查流程完成之前发布。
156
+ - 那些更注重速度而非结构的项目。
122
157
 
123
158
  ## 证据
124
159
 
@@ -140,13 +175,19 @@ Role OS 已在两个结构不同的代码仓库中的三个试验项目中得到
140
175
  - 相同的核心,不同的语言/领域/技术栈
141
176
  - 仅在上下文发生变化的情况下采用,不进行核心合同的修改。
142
177
 
143
- **完整流程 FT-001** (portlight-desktop)
144
- - 包含 7 个阶段的、由 Treatment Pack 角色组成的流程
145
- - 经过验证的 Shipcheck 机制,无角色冲突
178
+ **完整型 FT-001 方案** (适用于桌面环境)
179
+ - 采用 7 个阶段的人工干预流程,并配备相应的角色设置。
180
+ - 经过验证的“船舶检查”流程,确保无角色冲突。
181
+
182
+ **FT-002 完整方案** (studioflow)
183
+ - 相同的方案包,但结构上不同的代码仓库(创意工作区与游戏)。
184
+ - 方案包可移植,无需修改任何合同。
146
185
 
147
- **完整流程 FT-002** (studioflow)
148
- - 相同的任务包,但结构上不同的仓库(创意工作区与游戏)
149
- - Treatment Pack 具有可移植性,无需修改合同
186
+ **头脑风暴黄金流程** (MCP 服务器市场主题)
187
+ - 9 个角色链,4 个分析师并行工作,进行交叉询问 + 驳斥争议图。
188
+ - 提出了 4 个挑战,缩小了 3 个主张,1 个未解决——保持健康的压力,避免僵局。
189
+ - 从渲染的成果物追溯到 16 多个“真相”原子。
190
+ - 完整地证明了溯源链:真相 → 原子 → 争议 → 综合 → 扩展 → 评估 → 渲染 → 追溯。
150
191
 
151
192
  ## 核心特性
152
193
 
@@ -166,7 +207,9 @@ role-os/
166
207
  src/
167
208
  entry.mjs ← Unified entry: mission → pack → free routing
168
209
  entry-cmd.mjs ← `roleos start` CLI command
169
- mission.mjs 6 named mission types (feature, bugfix, treatment, docs, security, research)
210
+ run.mjs Persistent run engine: create step pause resume → report
211
+ run-cmd.mjs ← `roleos run/resume/next/explain/complete/fail` + interventions
212
+ mission.mjs ← 7 named mission types (feature, bugfix, treatment, docs, security, research, brainstorm)
170
213
  mission-run.mjs ← Mission runner: create → step → complete → report
171
214
  mission-cmd.mjs ← `roleos mission` CLI commands
172
215
  route.mjs ← 31-role routing + dynamic chain builder
@@ -175,14 +218,17 @@ role-os/
175
218
  escalation.mjs ← Auto-routing for blocked/rejected/split
176
219
  evidence.mjs ← Structured evidence + role-aware requirements
177
220
  dispatch.mjs ← Runtime dispatch manifests for multi-claude
178
- artifacts.mjs ← 20 per-role artifact contracts + 7 pack handoffs
221
+ artifacts.mjs ← 30 per-role artifact contracts + 7 pack handoffs
179
222
  decompose.mjs ← Composite task detection + splitting
180
223
  composite.mjs ← Dependency-ordered execution + recovery
181
224
  replan.mjs ← Mid-run adaptive replanning
182
225
  calibration.mjs ← Outcome recording + weight tuning
183
226
  hooks.mjs ← 5 lifecycle hooks for runtime enforcement
184
227
  session.mjs ← Session scaffolding + doctor
185
- test/ 527 tests across 20 test files
228
+ brainstorm.mjs Evidence modes, request validation, finding/synthesis/judge schemas
229
+ brainstorm-roles.mjs ← Role-native schemas, input partitioning, blindspot enforcement, cross-exam
230
+ brainstorm-render.mjs ← Two-layer rendering: lexical bans, render schemas, debate transcript
231
+ test/ ← 894 tests across 30 test files
186
232
  starter-pack/ ← Drop-in role contracts, policies, schemas, workflows
187
233
  ```
188
234
 
@@ -190,56 +236,82 @@ role-os/
190
236
 
191
237
  角色操作系统仅在本地运行。它复制 Markdown 模板,并将数据包/判决文件写入到您仓库的 `.claude/` 目录中。它不访问网络,不处理敏感信息,也不收集遥测数据。没有危险操作——所有文件写入默认使用“如果存在则跳过”的方式。请参阅 [SECURITY.md](SECURITY.md) 以获取完整策略。
192
238
 
193
- ## 该操作系统
239
+ ## 操作系统
194
240
 
195
241
  | 层 | 其作用 | 状态 |
196
242
  |-------|-------------|--------|
197
- | **Routing** | 根据任务内容对所有 31 个角色进行评分,解释推荐,评估置信度。 | ✓ 已发布 |
198
- | **Chain builder** | 从评分结果中组装出按阶段排列的任务链,支持基于包类型的偏好,但不依赖于模板。 | ✓ 已发布 |
199
- | **Conflict detection** | 进行四次验证:检查冲突、序列、冗余和覆盖范围。提供修复建议。 | ✓ 已发布 |
200
- | **Escalation** | 自动将受阻、被拒绝或拆分的工作分配给合适的处理模块,并提供原因和所需的资源。 | ✓ 已发布 |
201
- | **Evidence** | 在结果中提供结构化的、与角色相关的证据。进行充分性检查。包含12种类型的证据。 | ✓ 已发布 |
202
- | **Dispatch** | 为多任务生成执行清单。每个角色都有独立的工具配置、系统提示和预算。 | ✓ 已发布 |
203
- | **Trials** | 所有任务已完成:30个黄金任务和5个负面测试用例均通过。7个测试包已完成。 | ✓ 完成 |
204
- | **Team Packs** | 7个经过校准的测试包,具有自动选择、不匹配保护和自由路由回退功能。 | ✓ 已发布 |
205
- | **Outcome calibration** | 记录运行结果,根据结果调整测试包和角色的权重,并调整置信度阈值。 | ✓ 已发布 |
206
- | **Mixed-task decomposition** | 检测复合任务,将其拆分为子任务,分配测试包,并保留依赖关系。 | ✓ 已发布 |
207
- | **Composite execution** | 按照依赖关系顺序运行子任务,传递资源,进行分支恢复和合成。 | ✓ 已发布 |
208
- | **Adaptive replanning** | 在运行过程中,范围变更、发现或新的需求可以更新计划,而无需重新启动。 | ✓ 已发布 |
209
- | **Session spine** | `roleos init claude` 命令会创建 CLAUDE.md、/roleos-route、/roleos-review 和 /roleos-status 文件。`roleos doctor` 命令用于验证配置。路由卡用于证明参与情况。 | ✓ 已发布 |
210
- | **Hook spine** | 5个生命周期钩子(SessionStart、PromptSubmit、PreToolUse、SubagentStart、Stop)。强制执行建议:路由卡提醒、工具使用限制、子任务角色注入、完成审计。 | ✓ 已发布 |
211
- | **Artifact spine** | 20个与角色相关的资源合同。7个测试包的交接合同。进行结构验证。检查任务链的完整性。下游角色永远无法猜测他们收到的内容。 | ✓ 已发布 |
212
- | **Mission library** | 6个命名任务(功能发布、Bug修复、优化、文档发布、安全加固、研究启动)。每个任务都声明了测试包、角色链、资源流程、升级分支和诚实的部分定义。所有6个任务都经过试运行和强化。 | ✓ 已发布 |
213
- | **Mission runner** | 创建运行,逐步执行并跟踪状态,完成或失败时提供诚实报告。传播受阻步骤,发出链外升级警告,允许重新打开最后一步。 | ✓ 已发布 |
214
- | **Unified entry** | `roleos start` 命令可以自动决定是执行任务、测试包还是自由路由。提供回退机制,包括置信度评分、备选方案和复合任务检测。 | ✓ 已发布 |
215
-
216
- ## 6个任务
217
-
218
- | 任务 | 任务包 | 角色 | 使用场景 |
243
+ | **Routing** | 根据数据包内容对所有 31 个角色进行评分,解释建议,评估置信度。 | ✓ 已发布 |
244
+ | **Chain builder** | 从评分的角色中组装出按阶段顺序排列的链,偏向于数据包类型,但不受模板限制。 | ✓ 已发布 |
245
+ | **Conflict detection** | 进行 4 次验证:检查冲突、顺序、冗余、覆盖范围。提供修复建议。 | ✓ 已发布 |
246
+ | **Escalation** | 自动将受阻/拒绝/拆分的工作路由到正确的处理程序,并提供原因和所需的成果物。 | ✓ 已发布 |
247
+ | **Evidence** | 在判决中提供结构化的、与角色相关的证据。进行充分性检查。有 12 种证据类型。 | ✓ 已发布 |
248
+ | **Dispatch** | 为多 Claude 生成执行清单。每个角色的工具配置文件、系统提示、预算。 | ✓ 已发布 |
249
+ | **Trials** | 完整地证明了:30/30 个黄金任务 + 5/5 个负面测试。7 个方案包测试已完成。 | ✓ 已完成 |
250
+ | **Team Packs** | 7 个经过校准的方案包,具有自动选择、不匹配保护和自由路由回退功能。 | ✓ 已发布 |
251
+ | **Outcome calibration** | 记录运行结果,根据结果调整方案包/角色的权重,调整置信度阈值。 | ✓ 已发布 |
252
+ | **Mixed-task decomposition** | 检测复合工作,将其拆分为子数据包,分配方案包,并保留依赖关系。 | ✓ 已发布 |
253
+ | **Composite execution** | 按照依赖顺序运行子数据包,传递成果物,进行分支恢复和综合。 | ✓ 已发布 |
254
+ | **Adaptive replanning** | 在运行过程中,对范围、发现或新需求进行更改,无需重新启动即可更新计划。 | ✓ 已发布 |
255
+ | **Session spine** | `roleos init claude` 创建 CLAUDE.md、/roleos-route、/roleos-review、/roleos-status `roleos doctor` 验证连接。 路由卡证明了参与。 | ✓ 已发布 |
256
+ | **Hook spine** | 5 个生命周期钩子(SessionStart、PromptSubmit、PreToolUse、SubagentStart、Stop)。 强制执行建议:路由卡提醒、工具使用限制、子代理角色注入、完成审计。 | ✓ 已发布 |
257
+ | **Artifact spine** | 30 个与角色相关的成果物合同。7 个方案包交付合同。进行结构验证。检查链的完整性。下游角色永远不知道他们收到了什么。 | ✓ 已发布 |
258
+ | **Mission library** | 7 个命名任务(功能发布、错误修复、方案、文档发布、安全加固、研究发布、头脑风暴)。 每个任务都声明方案包、角色链、成果物流程、升级分支、诚实且部分定义的描述。 所有 7 个任务都经过试验验证。 | ✓ 已发布 |
259
+ | **Mission runner** | 创建运行,逐步跟踪状态,完成/失败并提供诚实报告。 传播受阻步骤,发出链外升级警告,重新打开最后一步。 | ✓ 已发布 |
260
+ | **Unified entry** | `roleos start` 自动决定任务、方案包或自由路由。 具有置信度得分、备选方案和复合检测的后备层级。 | ✓ 已发布 |
261
+ | **Persistent runs** | `roleos run` 创建磁盘支持的运行。 `resume`(恢复)、`next`(下一步)、`explain`(解释)、`complete`(完成)、`fail`(失败)。 干预:重新路由、升级、重试、阻止、重新打开。 提供步骤级别的指导。 测量摩擦力。 | ✓ 已发布 |
262
+ | **Brainstorm** | 双层架构:真相(角色原生模式、溯源原子、交叉询问争议图)+ 渲染(5 种不同的声音、词汇限制、辩论记录)。 追溯链接证明每个渲染的声明都映射到一个“真相”原子。 黄金流程:894 个测试。 | ✓ 已发布 |
263
+
264
+ ## 7 个任务
265
+
266
+ | 任务 | 包装;打包;一包;一盒;一套。 | 角色。 | 使用时机 |
219
267
  |---------|------|-------|-------------|
220
- | `feature-ship` | 功能 | 5 | 完整功能交付:范围定义规格制定 → 实现 → 测试 → 评审 |
221
- | `bugfix` | Bug修复 | 4 | 诊断根本原因,修复,测试,验证 |
222
- | `treatment` | 优化 | 4 | 发布检查 + 优化 + 文档 + CI验证 + 评审 |
223
- | `docs-release` | 文档 | 2 | 编写/更新文档、发布说明 |
224
- | `security-hardening` | 安全性 | 4 | 威胁模型、审计、修复漏洞、重新审计、验证 |
225
- | `research-launch` | 研究 | 4 | 提出问题、研究、记录发现、决策 |
268
+ | `feature-ship` | 特性 | 5 | 完整特性交付:范围规范 → 实现 → 测试 → 审查 |
269
+ | `bugfix` | 错误修复 | 4 | 诊断根本原因,修复,测试,验证 |
270
+ | `treatment` | 方案 | 4 | 代码检查 + 优化 + 文档 + CI 验证 + 审查 |
271
+ | `docs-release` | 文档 | 2 | 编写/更新文档,发布说明 |
272
+ | `security-hardening` | 安全性 | 4 | 威胁模型分析,安全审计,修复漏洞,重新审计,验证 |
273
+ | `research-launch` | 研究 | 4 | 提出问题,进行研究,记录发现,做出决定 |
274
+ | `brainstorm` | 头脑风暴 | 9 | 结构化的、多角度的讨论,具有可追溯的异议和结论。 |
275
+
276
+ 每个任务都包含诚实且全面的定义——当工作停滞时,系统会记录已完成的内容和未完成的内容,而不是虚报完成情况。
277
+
278
+ ### 头脑风暴任务
279
+
280
+ 这**不是**“人工智能头脑风暴”。 头脑风暴任务是**具有特定角色的、在法律框架下的活动,具有可追溯的异议和结论性输出。**
281
+
282
+ ```bash
283
+ roleos run "explore product directions for a developer tool discovery platform"
284
+ # → MISSION: Brainstorm (Structured Inquiry)
285
+ # Chain: 4 Analysts (parallel) → Normalize → Cross-Examine → Rebut → Synthesize → Expand → Judge
286
+ ```
287
+
288
+ **它与众不同之处:**
289
+
290
+ - **第一层(真相):** 四位分析师使用各自的角色专属的模式(情境地图、用户价值地图、机制地图、定位地图),而不是共享的文字。 每个角色都受到“盲点”的限制:禁止使用的词语,禁止提出的主张类型,以及过滤后的输入内容。 每个元素都带有来源信息。 一个有向的交叉询问图会产生针对性的挑战。 原始分析师在压力下会辩护、缩小范围或撤回观点。
291
+
292
+ - **第二层(呈现):** 五种不同的声音(边界备忘录、现场笔记、系统草图、主张简报、交叉询问记录),通过词汇限制防止声音的融合。 综合分析会消耗“真相”,而不会生成原始的文字。 两层内容始终可用。
293
+
294
+ - **完整追溯:** 每一句话都可追溯到“真相”层的元素。 综合分析的说明会引用这些元素。 交叉询问的目标是真实的主张ID。 争议图是结果,而不是文字本身。
226
295
 
227
- 每个任务都包含诚实的部分定义——当工作停滞时,系统会记录已完成的内容和剩余的内容,而不是虚报完成情况。
296
+ **已验证:** v0.4 版本,通过了 894 个测试,完整追溯链已验证。 详情请参见 [`examples/golden-run.md`](examples/golden-run.md),其中包含完整的流程记录。
228
297
 
229
298
  ## 状态
230
299
 
231
- - v0.1–v0.4:基础版本——测试、采用、治疗方案包、入门包。
232
- - v1.0.032个角色,完整的命令行界面,经过验证的治疗方案,支持多仓库移植。
233
- - v1.0.2:角色操作系统锁定(修复引导启动问题,使用 --force 参数)。
234
- - v1.1.031个角色,完整的路由核心,冲突检测,升级机制,证据收集,任务分发,7个经过验证的团队方案包。35次执行测试。212个测试用例。
235
- - v1.2.0:经过校准的方案包被设置为默认选项。自动选择,不匹配检测,备选方案建议,自由路由回退。246个测试用例。
236
- - v1.3.0:结果校准,混合任务分解,组合执行,自适应重新规划。317个测试用例。
237
- - v1.4.0:会话核心——`roleos init claude`,`roleos doctor`,路由卡片,/roleos-route + /roleos-review + /roleos-status 命令。335个测试用例。
238
- - v1.5.0:钩子核心——5个生命周期钩子,用于运行时强制执行。358个测试用例。
239
- - v1.6.0:构件核心——20个角色相关的构件协议,7个方案包交付协议,结构验证。385个测试用例。
240
- - v1.7.0:完成证明——真实任务通过整个系统运行。`roleos artifacts` 命令行界面。对结构性问题的诚实反馈。398个测试用例。
241
- - v1.8.0:任务库(阶段S)——6个命名任务,运行引擎,完成报告。经过6次真实测试的强化版本。481个测试用例。
242
- - **v1.9.0**:统一入口路径(阶段T)——`roleos start` 自动决定是任务、方案包还是自由路由。回退机制,组合检测,入口路径比较测试。527个测试用例。
300
+ - v0.1–v0.4: 基础版本 — 试验、采用、治疗方案包、入门包。
301
+ - v1.0.0: 32个角色,完整的命令行界面,经过验证的治疗方案,多仓库兼容性。
302
+ - v1.0.2: 角色操作系统锁定(修复引导启动问题,使用`--force`参数)。
303
+ - v1.1.0: 31个角色,完整的路由核心,冲突检测,升级,证据,调度,7个经过验证的团队包。35次执行试验。212个测试。
304
+ - v1.2.0: 校准后的包被设置为默认选项。自动选择,不匹配检测,替代方案建议,自由路由回退。246个测试。
305
+ - v1.3.0: 结果校准,混合任务分解,组合执行,自适应重新规划。317个测试。
306
+ - v1.4.0: 会话核心 — `roleos init claude`,`roleos doctor`,路由卡片,`/roleos-route` + `/roleos-review` + `/roleos-status` 命令。335个测试。
307
+ - v1.5.0: 钩子核心 — 5个生命周期钩子,用于运行时强制执行。358个测试。
308
+ - v1.6.0: 构件核心 — 20个角色相关的构件合约,7个包交付合约,结构验证。385个测试。
309
+ - v1.7.0: 完成证明 — 真实任务通过整个堆栈运行。`roleos artifacts` 命令行界面。对结构性问题的诚实反馈。398个测试。
310
+ - v1.8.0: 任务库(阶段S) — 6个命名任务,运行引擎,完成报告。经过6次真实试验的强化。481个测试。
311
+ - v1.9.0: 统一入口路径(阶段T) — `roleos start` 自动决定是任务、包还是自由路由。回退机制,组合检测,入口路径比较试验。527个测试。
312
+ - **v2.0.0**: 优化用户体验(阶段U) — `roleos run` 创建持久的基于磁盘的运行。恢复,下一步,解释,完成,失败。干预措施:重新路由,升级,重试,阻止,重新打开。在每个步骤都提供本地指导。摩擦力测量。6次摩擦力试验。613个测试。
313
+ - **v2.0.1**: 手册审核,初学者文档,测试数量修正。617个测试。
314
+ - **v2.1.0**: 构思任务(v0.4) — 法律下的专业角色,可追溯的意见不一致,带有判决结果的输出。两层架构(真值 + 渲染),交叉询问权限矩阵,争议图,黄金运行证明。7个任务,50个角色,8个包。894个测试。
243
315
 
244
316
  ## 许可证
245
317
 
package/package.json CHANGED
@@ -1,7 +1,7 @@
1
1
  {
2
2
  "name": "role-os",
3
- "version": "2.0.0",
4
- "description": "Role OS — a multi-Claude operating system where 31 specialized roles execute work through contracts, conflict detection, escalation, and structured evidence. 7 proven team packs for common task families.",
3
+ "version": "2.1.0",
4
+ "description": "Role OS — a multi-Claude operating system where 50 specialized roles execute work through contracts, conflict detection, escalation, and structured evidence. 8 proven team packs, 7 missions including brainstorm with traceable disagreement and verdict-bearing output.",
5
5
  "homepage": "https://mcp-tool-shop-org.github.io/role-os/",
6
6
  "bugs": {
7
7
  "url": "https://github.com/mcp-tool-shop-org/role-os/issues"