role-os 2.7.0 → 2.8.0
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
- package/CHANGELOG.md +33 -0
- package/README.es.md +192 -129
- package/README.fr.md +200 -137
- package/README.hi.md +197 -134
- package/README.it.md +193 -130
- package/README.ja.md +198 -135
- package/README.md +13 -18
- package/README.pt-BR.md +195 -132
- package/README.zh.md +201 -141
- package/package.json +1 -1
- package/src/hooks.mjs +125 -14
- package/src/specialist/capability-gate.mjs +124 -0
- package/src/specialist/conformance-consult.mjs +322 -0
package/README.ja.md
CHANGED
|
@@ -13,20 +13,20 @@
|
|
|
13
13
|
<a href="https://mcp-tool-shop-org.github.io/role-os/"><img src="https://img.shields.io/badge/Landing_Page-live-brightgreen" alt="Landing Page"></a>
|
|
14
14
|
</p>
|
|
15
15
|
|
|
16
|
-
|
|
16
|
+
複数のClaudeを連携させるオペレーティングシステムで、61種類の専門的な役割を持つコントラクトを通じて、タスクの割り当て、ルーティング、検証、実行を行います。タスクパケットを作成し、スコアリングされた役割のマッチングに基づいて適切なチームを編成し、実行前に問題のある箇所を検出し、タスクが中断または拒否された場合に自動的にリカバリーを行い、すべての判断において構造化された証拠を要求します。動的なディスパッチにより、大規模なミッションに対応します。たとえば、10個のコンポーネントからなるリポジトリは、自動的に28段階の監査プロセスに展開されます。
|
|
17
17
|
|
|
18
|
-
##
|
|
18
|
+
## 機能の説明
|
|
19
19
|
|
|
20
|
-
Role OS
|
|
20
|
+
Role OSは、複数のClaudeを効果的に活用するためのプロフェッショナルな方法です。一般的なAIワークフローで発生する特定の失敗を防ぎます。
|
|
21
21
|
|
|
22
|
-
-
|
|
23
|
-
-
|
|
24
|
-
-
|
|
25
|
-
-
|
|
22
|
+
- **ドリフト(役割の逸脱)**:各役割は、定められた範囲内で活動します。プロダクトは再設計されません。フロントエンドはスコープを再定義しません。バックエンドはプロダクトの方向性を決定しません。
|
|
23
|
+
- **誤った完了**:完了の定義は明確です。ギャップを隠したり、検証を省略したり、別の問題を解決したりする作業は拒否されます。
|
|
24
|
+
- **汚染**:フォークまたは継承されたプロジェクトは、固有の要素を引き継ぎます。Role OSは、用語、ビジュアル、およびメンタルモデルにおけるプロジェクト間の逸脱を検出し、拒否します。
|
|
25
|
+
- **感覚的な進捗**:すべての引き継ぎは構造化されています。すべての判断は証拠と関連付けられています。「完了したように感じる」という状態は有効ではありません。
|
|
26
26
|
|
|
27
|
-
##
|
|
27
|
+
## 仕組みの説明
|
|
28
28
|
|
|
29
|
-
|
|
29
|
+
タスクを記述します。Role OSは、適切なレベルのオーケストレーションを自動的に決定します。
|
|
30
30
|
|
|
31
31
|
```bash
|
|
32
32
|
roleos start "fix the crash in save handler"
|
|
@@ -42,15 +42,15 @@ roleos start "something completely novel"
|
|
|
42
42
|
# Hint: Create a packet and run `roleos route` for role-level routing
|
|
43
43
|
```
|
|
44
44
|
|
|
45
|
-
|
|
45
|
+
**フォールバックラダー(代替手段の階層):**
|
|
46
46
|
|
|
47
|
-
1.
|
|
48
|
-
2.
|
|
49
|
-
3.
|
|
47
|
+
1. **ミッション**:タスクが、実績のある繰り返しワークフロー(バグ修正、治療、機能リリース、ドキュメント作成、セキュリティ、調査、ブレインストーミング、詳細監査、犬を使ったテスト)と一致する場合。既知の役割チェーン、成果物フロー、エスカレーションブランチ、および明確な部分的な定義が適用されます。
|
|
48
|
+
2. **パック**:タスクが既知のカテゴリに属するものの、完全なミッションの形になっていない場合。10種類の調整されたチームパックを使用し、自動選択と不一致の防止を行います。
|
|
49
|
+
3. **フリールーティング**:タスクが新しい、混合された、または不確かなものである場合。61種類の役割すべてに対して、パケットの内容を評価し、動的なチェーンを編成します。
|
|
50
50
|
|
|
51
|
-
|
|
51
|
+
このシステムは、不適切な抽象化を通してタスクを強制的に実行することはありません。各レベルを選択した理由を説明し、代替案を提示します。
|
|
52
52
|
|
|
53
|
-
|
|
53
|
+
**実行を開始するための1つのコマンド:**
|
|
54
54
|
|
|
55
55
|
```bash
|
|
56
56
|
roleos run "fix the crash in save handler"
|
|
@@ -67,7 +67,7 @@ roleos report # Generate completion report
|
|
|
67
67
|
roleos friction # Measure operator touches
|
|
68
68
|
```
|
|
69
69
|
|
|
70
|
-
|
|
70
|
+
**問題が発生した場合の介入:**
|
|
71
71
|
|
|
72
72
|
```bash
|
|
73
73
|
roleos retry 0 # Retry a failed step
|
|
@@ -77,46 +77,59 @@ roleos block 2 "waiting for API spec"
|
|
|
77
77
|
roleos reopen 0 "found issue in review"
|
|
78
78
|
```
|
|
79
79
|
|
|
80
|
-
|
|
80
|
+
実行状況はディスクに保存されるため(`.claude/runs/`)、中断されたセッションは中断したところから再開できます。各ステップには、オペレーター向けのガイダンスが含まれます。何を生成するか、必要なセクション、および停止条件が示されます。
|
|
81
81
|
|
|
82
82
|
**ルーティング後:**
|
|
83
83
|
|
|
84
|
-
1.
|
|
85
|
-
2.
|
|
86
|
-
3.
|
|
84
|
+
1. **各役割が引き継ぎを生成**:構造化された出力と、次の役割の曖昧さを軽減する証拠項目。
|
|
85
|
+
2. **批評家がコントラクトに基づいてレビュー**:構造化された証拠に基づいて、承認、拒否、またはブロックを行います。印象による判断は行いません。
|
|
86
|
+
3. **リカバリールートが自動的に実行**:ブロックまたは拒否されたタスクは、理由、リカバリーの種類、および必要な成果物とともに、適切な解決者にルーティングされます。
|
|
87
87
|
|
|
88
|
-
##
|
|
88
|
+
## 予算を考慮したディスパッチ
|
|
89
89
|
|
|
90
|
-
|
|
90
|
+
Role OSは、各ディスパッチステップでローカルの**トークン予算アナリスト**を参照し、マニフェストに推奨される支出予測を添付できます。これはオプション機能であり(`ROLEOS_BUDGET_CONSULT`)、アドバイザリーとして機能し(ディスパッチをブロックすることはありません)、デフォルトでは無効になっています。予測はローカルで実行され、無料です。詳細については、[ハンドブック](https://mcp-tool-shop-org.github.io/role-os/handbook/specialist-budget/)を参照してください。
|
|
91
|
+
|
|
92
|
+
## ツール呼び出しの監視
|
|
93
|
+
|
|
94
|
+
Role OSは、`PreToolUse`の段階でツール呼び出しを検証し、許可します。これは決定論的に行われ、ホットパスにモデルは使用されません。
|
|
95
|
+
|
|
96
|
+
- **コンプライアンス監視機能**(推奨、フェイルオープン)— 決定的なスキーマと計算可能な契約に基づくチェックにより、提案された呼び出しがカタログ化されたツールとの契約に準拠しているかどうかを確認し、*確認された*不適合な呼び出しに対して推奨の判断を付与します。ただし、絶対にブロックすることはありません。オプションでLLMの上限(`ROLEOS_CONFORMANCE_CONSULT`)を設定することで、意味的に残った部分を処理します。
|
|
97
|
+
- **機能ゲート**(フェイルクローズド、オプションの`ROLEOS_CAPABILITY_GATE`、デフォルトはOFF)— *不可逆的な*アクション(npm/PyPIへの公開、`gh release`、`git push`、リポジトリの編集、Pagesのデプロイ)に対して、決定論的に最小限の権限を適用します。ゲートされたアクションは、ディレクターが`.claude/role-os/capabilities.json`でその機能を許可しない限り拒否されるため、誤った手順(正直なミスまたは不正な操作)によって、許可されていない不可逆的なアクションがトリガーされることはありません。これは、名前付きの補償ルールに対する予防的な補完です。[ハンドブック](https://mcp-tool-shop-org.github.io/role-os/handbook/)を参照してください。
|
|
98
|
+
|
|
99
|
+
## 組織全体のロールアウト状態
|
|
100
|
+
|
|
101
|
+
組織全体でのロールアウト状態(キュー、決定、監査記録、リポジトリごとのロックパケット)は、別のプライベートリポジトリに保存されます:[`role-os-rollout`](https://github.com/mcp-tool-shop-org/role-os-rollout)。このリポジトリがプロダクトであり、別のリポジトリが運用状態です。
|
|
91
102
|
|
|
92
103
|
## メモリと継続性
|
|
93
104
|
|
|
94
|
-
Role OSは、メモリレイヤーを所有または複製しません。Claude
|
|
105
|
+
Role OSは、メモリレイヤーを所有または複製しません。Claudeプロジェクトのメモリが存在する場合、それが正当な継続性システムとなります。リポジトリの事実、決定、未解決の問題、および治療履歴は、そこに保存されます。
|
|
95
106
|
|
|
96
|
-
Role OSは、Claude
|
|
107
|
+
Role OSは、Claudeプロジェクトのメモリと統合されます。置き換えることはありません。
|
|
97
108
|
|
|
98
|
-
##
|
|
109
|
+
## 完全な治療と出荷チェック
|
|
99
110
|
|
|
100
|
-
|
|
111
|
+
完全な治療は、Claudeプロジェクトのメモリ(`memory/full-treatment.md`)で定義された、標準的な7段階のプロトコルです。Role OSは、役割コントラクト、引き継ぎ、および批評家ゲートを使用して、治療をルーティングおよびレビューします。プロトコルを再定義することはありません。
|
|
101
112
|
|
|
102
|
-
|
|
113
|
+
**出荷チェック**は、完全な治療の前に実行される31項目の品質ゲートです。厳格なゲートA〜Dは、治療が開始される前に通過する必要があります。参照:`memory/shipcheck.md`。
|
|
103
114
|
|
|
104
|
-
|
|
115
|
+
順序:まず出荷チェックを行い、次に完全な治療を行います。厳格なゲートを通過しない限り、v1.0.0はリリースされません。
|
|
105
116
|
|
|
106
|
-
##
|
|
117
|
+
## 10個のパックにまたがる61の役割
|
|
107
118
|
|
|
108
|
-
|
|
|
119
|
+
| パック | 役割 |
|
|
109
120
|
|------|-------|
|
|
110
|
-
| **Core** (3) |
|
|
121
|
+
| **Core** (3) | オーケストレーター、プロダクトストラテジスト、批評家レビュー担当者 |
|
|
111
122
|
| **Engineering** (7) | フロントエンド開発者、バックエンドエンジニア、テストエンジニア、リファクタリングエンジニア、パフォーマンスエンジニア、依存関係監査担当者、セキュリティレビュー担当者 |
|
|
112
|
-
| **Design** (2) | UI
|
|
123
|
+
| **Design** (2) | UIデザイナー、ブランドガーディアン |
|
|
113
124
|
| **Marketing** (1) | ローンチコピーライター |
|
|
114
|
-
| **Treatment** (7) |
|
|
115
|
-
| **Product** (3) |
|
|
116
|
-
| **Research** (4) | UX
|
|
125
|
+
| **Treatment** (7) | リポジトリリサーチャー、リポジトリ翻訳者、ドキュメントアーキテクト、メタデータキュレーター、カバレッジ監査担当者、デプロイメント検証担当者、リリースエンジニア |
|
|
126
|
+
| **Product** (3) | フィードバックスynthesizer、ロードマップ優先順位付け担当者、仕様書作成者 |
|
|
127
|
+
| **Research** (4) | UXリサーチャー、競合分析担当者、トレンドリサーチャー、ユーザーインタビューSynthesizer |
|
|
117
128
|
| **Growth** (4) | ローンチストラテジスト、コンテンツストラテジスト、コミュニティマネージャー、サポートトリアージリーダー |
|
|
129
|
+
| **Deep Audit** (4) | コンポーネント監査担当者、テストの真実性監査担当者、シーム監査担当者、監査Synthesizer |
|
|
130
|
+
| **Swarm** (7) | スワームコーディネーター、スワームバックエンドエージェント、スワームブリッジエージェント、スワームテストエージェント、スワームインフラエージェント、スワームフロントエンドエージェント、スワームSynthesizer |
|
|
118
131
|
|
|
119
|
-
|
|
132
|
+
各役割には、完全なコントラクトがあります。ミッション、使用する場面、使用しない場面、期待される入力、必要な出力、品質基準、およびエスカレーショントリガーが含まれます。すべての役割はルーティング可能です。`roleos route`コマンドを使用すると、パケットの内容に基づいて、これらの役割のいずれかを推奨できます。
|
|
120
133
|
|
|
121
134
|
## クイックスタート
|
|
122
135
|
|
|
@@ -133,6 +146,19 @@ roleos complete artifact.md # Complete with artifact
|
|
|
133
146
|
roleos explain # Show full state
|
|
134
147
|
roleos report # Completion report
|
|
135
148
|
|
|
149
|
+
# Deep audit:
|
|
150
|
+
roleos audit manifest --generate # Create audit-manifest.json
|
|
151
|
+
roleos audit # Start component-level deep audit
|
|
152
|
+
roleos audit status # Check audit progress
|
|
153
|
+
roleos audit verify # Verify manifest and outputs
|
|
154
|
+
|
|
155
|
+
# Dogfood swarm:
|
|
156
|
+
roleos swarm manifest --generate # Auto-detect domains from repo structure
|
|
157
|
+
roleos swarm # Start multi-pass convergence swarm
|
|
158
|
+
roleos swarm status # Check swarm progress by stage
|
|
159
|
+
roleos swarm findings # List findings by severity
|
|
160
|
+
roleos swarm approve # Approve feature gate
|
|
161
|
+
|
|
136
162
|
# Or go manual:
|
|
137
163
|
roleos start "fix the crash" # Entry decision only (no run)
|
|
138
164
|
roleos packet new feature
|
|
@@ -146,57 +172,57 @@ roleos packs list
|
|
|
146
172
|
|
|
147
173
|
## Role OSを使用しない場合
|
|
148
174
|
|
|
149
|
-
-
|
|
150
|
-
-
|
|
151
|
-
- 5分で1
|
|
152
|
-
-
|
|
153
|
-
-
|
|
175
|
+
- 単行の修正、タイプミス、または明白なバグ
|
|
176
|
+
- 定義されたアウトプットのない探索的な調査
|
|
177
|
+
- 5分で1人の担当者が処理できる作業
|
|
178
|
+
- レビュープロセスが完了する前にリリースする必要がある緊急のホットフィックス
|
|
179
|
+
- 構造よりもスピードを重視するプロジェクト
|
|
154
180
|
|
|
155
|
-
##
|
|
181
|
+
## 証拠
|
|
156
182
|
|
|
157
|
-
Role OS
|
|
183
|
+
Role OSは、構造的に異なる2つのリポジトリで、3つの異なるテストケースでその有効性が証明されました。
|
|
158
184
|
|
|
159
|
-
|
|
160
|
-
- 7
|
|
161
|
-
-
|
|
185
|
+
**テスト001 — 機能開発**(クルースクリーン、スターフレート)
|
|
186
|
+
- 7つの役割を持つチェーン、45のテストシナリオ、役割の衝突は0
|
|
187
|
+
- フォークされた祖先からの汚染を防ぎ、インラインでの発明を検出し、明確な課題を提示
|
|
162
188
|
|
|
163
|
-
|
|
164
|
-
- 5
|
|
165
|
-
-
|
|
189
|
+
**テスト002 — 統合作業**(キャンペーンステートの連携、スターフレート)
|
|
190
|
+
- 5つの役割を持つチェーン、フォールバックなしでアーキテクチャの境界を解決
|
|
191
|
+
- フォールバックテストにより、ライブパスが実際に機能し、プレースホルダーではないことが証明
|
|
166
192
|
|
|
167
|
-
|
|
168
|
-
- 6
|
|
169
|
-
-
|
|
193
|
+
**テスト003 — アイデンティティ作業**(汚染の除去、スターフレート)
|
|
194
|
+
- 6つの役割を持つチェーン、51のテストシナリオ(永続的なCI汚染防御を含む)
|
|
195
|
+
- 広範囲な再設計に陥ることなく、継承された矛盾を修正
|
|
170
196
|
|
|
171
|
-
|
|
172
|
-
-
|
|
173
|
-
-
|
|
197
|
+
**移植性のテスト**(ペルソナの一貫性、センサーユーモア)
|
|
198
|
+
- 同じ基本構造、異なる言語/ドメイン/スタック
|
|
199
|
+
- コンテキストの変更のみを適用 — コアコントラクトの変更はなし
|
|
174
200
|
|
|
175
|
-
|
|
176
|
-
- 7
|
|
177
|
-
-
|
|
201
|
+
**完全な処理FT-001**(ポートライトデスクトップ)
|
|
202
|
+
- 7段階の処理、処理パックの役割を使用
|
|
203
|
+
- シップチェックゲートが有効であることが証明され、役割の衝突は0
|
|
178
204
|
|
|
179
|
-
|
|
180
|
-
-
|
|
181
|
-
-
|
|
205
|
+
**完全な処理FT-002**(スタジオフロー)
|
|
206
|
+
- 同じ処理パック、構造的に異なるリポジトリ(クリエイティブなワークスペースとゲーム)
|
|
207
|
+
- 処理パックは移植可能 — コントラクトの変更は不要
|
|
182
208
|
|
|
183
|
-
|
|
184
|
-
- 9
|
|
185
|
-
- 4
|
|
186
|
-
-
|
|
187
|
-
-
|
|
209
|
+
**ブレインストーミングの優れた実行**(MCPサーバーマーケットプレーストピック)
|
|
210
|
+
- 9つの役割を持つチェーン、4人のアナリストが並行して作業、クロスチェックと反論の議論グラフ
|
|
211
|
+
- 4つの課題が提起され、3つの主張が絞り込まれ、1つは未解決 — 健全なプレッシャー、行き詰まりではない
|
|
212
|
+
- 16以上のトレースリンクが、レンダリングされた成果物から真実の層の原子に遡る
|
|
213
|
+
- 完全なトレーサビリティが証明:真実 → 原子 → 議論 → 統合 → 拡張 → 評価 → レンダリング → トレース
|
|
188
214
|
|
|
189
|
-
##
|
|
215
|
+
## コアプロパティ
|
|
190
216
|
|
|
191
|
-
|
|
217
|
+
これらは交渉の余地がありません。変更によってこれらのいずれかが損なわれる場合、却下してください。
|
|
192
218
|
|
|
193
|
-
-
|
|
194
|
-
-
|
|
195
|
-
-
|
|
196
|
-
-
|
|
197
|
-
-
|
|
219
|
+
- 役割の境界は維持される
|
|
220
|
+
- レビューには実効性がある
|
|
221
|
+
- エスカレーションは誠実である
|
|
222
|
+
- パケットはテスト可能である
|
|
223
|
+
- 移植性には、コアの外科手術ではなく、コンテキストへの適応が必要
|
|
198
224
|
|
|
199
|
-
##
|
|
225
|
+
## プロジェクトの構造
|
|
200
226
|
|
|
201
227
|
```
|
|
202
228
|
role-os/
|
|
@@ -206,18 +232,23 @@ role-os/
|
|
|
206
232
|
entry-cmd.mjs ← `roleos start` CLI command
|
|
207
233
|
run.mjs ← Persistent run engine: create → step → pause → resume → report
|
|
208
234
|
run-cmd.mjs ← `roleos run/resume/next/explain/complete/fail` + interventions
|
|
209
|
-
mission.mjs ←
|
|
235
|
+
mission.mjs ← 9 named mission types (feature, bugfix, treatment, docs, security, research, brainstorm, deep-audit, dogfood-swarm)
|
|
210
236
|
mission-run.mjs ← Mission runner: create → step → complete → report
|
|
211
237
|
mission-cmd.mjs ← `roleos mission` CLI commands
|
|
212
|
-
|
|
213
|
-
|
|
238
|
+
audit-cmd.mjs ← `roleos audit` — deep audit entry point with manifest generation
|
|
239
|
+
swarm-cmd.mjs ← `roleos swarm` — dogfood swarm entry point with domain detection
|
|
240
|
+
swarm/ ← Domain detection, build gate, evidence persistence bridge
|
|
241
|
+
route.mjs ← 61-role routing + dynamic chain builder
|
|
242
|
+
packs.mjs ← 10 calibrated team packs + auto-selection
|
|
214
243
|
conflicts.mjs ← 4-pass conflict detection
|
|
215
244
|
escalation.mjs ← Auto-routing for blocked/rejected/split
|
|
216
245
|
evidence.mjs ← Structured evidence + role-aware requirements
|
|
217
246
|
dispatch.mjs ← Runtime dispatch manifests for multi-claude
|
|
218
|
-
|
|
247
|
+
tool-profiles.mjs ← Per-role tool sandboxing (shared by dispatch + trial)
|
|
248
|
+
state-machine.mjs ← Canonical step/run transition maps
|
|
249
|
+
artifacts.mjs ← Per-role artifact contracts + pack handoffs
|
|
219
250
|
decompose.mjs ← Composite task detection + splitting
|
|
220
|
-
composite.mjs ← Dependency-ordered execution + recovery
|
|
251
|
+
composite.mjs ← Dependency-ordered execution + recovery + cycle detection
|
|
221
252
|
replan.mjs ← Mid-run adaptive replanning
|
|
222
253
|
calibration.mjs ← Outcome recording + weight tuning
|
|
223
254
|
hooks.mjs ← 5 lifecycle hooks for runtime enforcement
|
|
@@ -225,56 +256,60 @@ role-os/
|
|
|
225
256
|
brainstorm.mjs ← Evidence modes, request validation, finding/synthesis/judge schemas
|
|
226
257
|
brainstorm-roles.mjs ← Role-native schemas, input partitioning, blindspot enforcement, cross-exam
|
|
227
258
|
brainstorm-render.mjs ← Two-layer rendering: lexical bans, render schemas, debate transcript
|
|
228
|
-
test/ ←
|
|
259
|
+
test/ ← 1150 tests across 37 test files
|
|
229
260
|
starter-pack/ ← Drop-in role contracts, policies, schemas, workflows
|
|
230
261
|
```
|
|
231
262
|
|
|
232
263
|
## セキュリティ
|
|
233
264
|
|
|
234
|
-
Role OS
|
|
265
|
+
Role OSは**ローカルでのみ**動作します。Markdownテンプレートをコピーし、パケット/結果ファイルをリポジトリの`.claude/`ディレクトリに書き込みます。ネットワークにアクセスしたり、機密情報を処理したり、テレメトリを収集したりすることはありません。危険な操作は行いません。すべてのファイル書き込みは、デフォルトで「存在する場合はスキップ」を使用します。完全なポリシーについては、[SECURITY.md](SECURITY.md)を参照してください。
|
|
235
266
|
|
|
236
|
-
##
|
|
267
|
+
## オペレーティングシステム
|
|
237
268
|
|
|
238
|
-
| レイヤー |
|
|
269
|
+
| レイヤー | 機能の説明 | ステータス |
|
|
239
270
|
|-------|-------------|--------|
|
|
240
|
-
| **Routing** |
|
|
241
|
-
| **Chain builder** |
|
|
242
|
-
| **Conflict detection** | 4
|
|
243
|
-
| **Escalation** |
|
|
244
|
-
| **Evidence** |
|
|
245
|
-
| **Dispatch** |
|
|
246
|
-
| **Trials** |
|
|
247
|
-
| **Team Packs** |
|
|
248
|
-
| **Outcome calibration** |
|
|
249
|
-
| **Mixed-task decomposition** |
|
|
250
|
-
| **Composite execution** |
|
|
251
|
-
| **Adaptive replanning** |
|
|
252
|
-
| **Session spine** | `roleos init claude
|
|
253
|
-
| **Hook spine** | 5つのライフサイクルフック(SessionStart、PromptSubmit、PreToolUse、SubagentStart、Stop
|
|
254
|
-
| **Artifact spine** |
|
|
255
|
-
| **Mission library** |
|
|
256
|
-
| **Mission runner** |
|
|
257
|
-
| **Unified entry** | `roleos start
|
|
258
|
-
| **Persistent runs** | `roleos run
|
|
259
|
-
| **Brainstorm** | 2
|
|
260
|
-
|
|
261
|
-
|
|
262
|
-
|
|
263
|
-
|
|
271
|
+
| **Routing** | パケットの内容に対して61の役割すべてを評価し、推奨事項を説明し、信頼性を評価します | ✓ リリース済み |
|
|
272
|
+
| **Chain builder** | 評価された役割から、フェーズ順にチェーンを組み立てます。テンプレートにロックされるのではなく、パケットタイプに重点を置きます。 | ✓ リリース済み |
|
|
273
|
+
| **Conflict detection** | 4段階の検証:深刻な競合、シーケンス、冗長性、カバレッジのギャップ。修正の提案。 | ✓ リリース済み |
|
|
274
|
+
| **Escalation** | ブロックされた/却下された/分割された作業を、理由と必要な成果物とともに、適切な解決者に自動的にルーティングします。 | ✓ リリース済み |
|
|
275
|
+
| **Evidence** | 役割を意識した、結果に構造化された証拠。十分性のチェック。12種類の証拠。 | ✓ リリース済み |
|
|
276
|
+
| **Dispatch** | マルチクラウド用の実行マニフェストを生成します。役割ごとのツールプロファイル、システムプロンプト、予算。 | ✓ リリース済み |
|
|
277
|
+
| **Trials** | 完全なロースターが証明済み:30/30のゴールドタスク + 5/5のネガティブテスト。7つのパックテストが完了。 | ✓ 完了 |
|
|
278
|
+
| **Team Packs** | 10個の調整されたパック、自動選択、不一致ガード、および自由ルーティングのフォールバックを備えています。 | ✓ リリース済み |
|
|
279
|
+
| **Outcome calibration** | 実行結果を記録し、結果からパック/役割の重みを調整し、信頼性のしきい値を調整します。 | ✓ リリース済み |
|
|
280
|
+
| **Mixed-task decomposition** | 複合作業を検出し、子パケットに分割し、パックを割り当て、依存関係を保持します。 | ✓ リリース済み |
|
|
281
|
+
| **Composite execution** | 子パケットを依存関係の順に実行し、成果物の受け渡し、ブランチの回復、および統合を行います。 | ✓ リリース済み |
|
|
282
|
+
| **Adaptive replanning** | 実行中のスコープの変更、調査結果、または新しい要件は、再起動せずに計画を更新します。 | ✓ リリース済み |
|
|
283
|
+
| **Session spine** | `roleos init claude`は、CLAUDE.md、/roleos-route、/roleos-review、/roleos-statusをスキャフォールドします。`roleos doctor`は、連携を検証します。ルートカードは、関与を証明します。 | ✓ リリース済み |
|
|
284
|
+
| **Hook spine** | 5つのライフサイクルフック(SessionStart、PromptSubmit、PreToolUse、SubagentStart、Stop)。アドバイザリーによる強制:ルートカードのリマインダー、書き込みツールのゲート、サブエージェントの役割の注入、完了監査。 | ✓ リリース済み |
|
|
285
|
+
| **Artifact spine** | 役割ごとの成果物コントラクト。パックの引き継ぎコントラクト。構造的な検証。チェーンの完全性のチェック。下流の役割は、受け取ったものを推測することはありません。 | ✓ リリース済み |
|
|
286
|
+
| **Mission library** | 9つの名前付きミッション(機能のリリース、バグ修正、処理、ドキュメントのリリース、セキュリティ強化、調査の開始、ブレインストーミング、詳細な監査、ドッグフードスウォーム)。それぞれが、パック、役割チェーン、成果物フロー、エスカレーションブランチ、誠実な部分的な定義を宣言します。 | ✓ リリース済み |
|
|
287
|
+
| **Mission runner** | 実行を作成し、追跡された状態でステップを実行し、正直なレポートで完了/失敗します。ブロックされたステップの伝播、チェーン外のエスカレーション警告、最後のステップの再開。 | ✓ リリース済み |
|
|
288
|
+
| **Unified entry** | `roleos start`は、ミッション、パック、または自由ルーティングを自動的に決定します。信頼性のスコア、代替案、および複合検出を備えたフォールバックラダー。 | ✓ リリース済み |
|
|
289
|
+
| **Persistent runs** | `roleos run`は、ディスクにバックアップされた実行を作成します。`resume`、`next`、`explain`、`complete`、`fail`。介入:リルート、エスカレート、再試行、ブロック、再開。ステップごとのガイダンス。摩擦の測定。 | ✓ リリース済み |
|
|
290
|
+
| **Brainstorm** | 2層のアーキテクチャ:真実(役割固有のスキーマ、プロベナンスアトム、クロスチェックの議論グラフ)+ レンダリング(5つの異なる声、語彙の禁止、議論のトランスクリプト)。トレースリンクは、レンダリングされたすべての主張が真実の原子にマッピングされることを証明します。優れた実行が証明済み。 | ✓ リリース済み |
|
|
291
|
+
| **Deep Audit** | マニフェストに基づくリポジトリ監査:リポジトリをコンポーネントに分解し、依存関係グラフからN人の監査者+M人のテスト検証監査者+K人の境界監査者を割り当て、それらを統合して、ランク付けされた検証結果とアクションプランを作成する。動的な割り当ては、リポジトリのサイズに応じて調整される(2N + K + 3の式)。各ステップでアーティファクトの検証を行う、ランナーネイティブ。 | ✓ リリース済み |
|
|
292
|
+
| **Dogfood Swarm** | 複数パスの収束:3つの健全性段階(バグ/セキュリティ→積極的→人間化)、その後は機能パス。排他的なファイル所有権、各段階の後にビルドゲート、ユーザーチェックポイント。ドメインの自動検出により、マニフェストが生成される。証拠ブリッジを介して、社内テスト環境に連携。 | ✓ リリース済み |
|
|
293
|
+
|
|
294
|
+
## 9つのミッション
|
|
295
|
+
|
|
296
|
+
| ミッション | パック | 役割 | 使用するタイミング |
|
|
264
297
|
|---------|------|-------|-------------|
|
|
265
|
-
| `feature-ship` |
|
|
298
|
+
| `feature-ship` | 機能 | 5 | 完全な機能の提供:スコープ→仕様→実装→テスト→レビュー |
|
|
266
299
|
| `bugfix` | バグ修正 | 4 | 根本原因の特定、修正、テスト、検証 |
|
|
267
|
-
| `treatment` | 改善 | 4 |
|
|
300
|
+
| `treatment` | 改善 | 4 | 出荷前チェック+調整+ドキュメント+CIによる検証+レビュー |
|
|
268
301
|
| `docs-release` | ドキュメント | 2 | ドキュメントの作成/更新、リリースノート |
|
|
269
|
-
| `security-hardening` | セキュリティ | 4 |
|
|
270
|
-
| `research-launch` |
|
|
271
|
-
| `brainstorm` | ブレインストーミング | 9 |
|
|
302
|
+
| `security-hardening` | セキュリティ | 4 | 脅威モデリング、監査、脆弱性の修正、再監査、検証 |
|
|
303
|
+
| `research-launch` | 調査 | 4 | 質問の作成、調査、調査結果の文書化、決定 |
|
|
304
|
+
| `brainstorm` | ブレインストーミング | 9 | 追跡可能な意見の相違と検証を含む、構造化された多角的な検討 |
|
|
305
|
+
| `deep-audit` | 詳細監査 | 5(段階) | マニフェストに基づくリポジトリ監査—ワーカー数は、動的な割り当てを通じてリポジトリグラフの規模に応じて調整される |
|
|
306
|
+
| `dogfood-swarm` | スウォーム | 8(段階) | 複数パスの収束:健全性A→健全性B→健全性C→機能→最終的な統合 |
|
|
272
307
|
|
|
273
|
-
|
|
308
|
+
各ミッションには、正直な部分的な定義が含まれる。作業が停滞した場合、システムは、完了したことと残っていることを文書化し、完了を偽ることはない。
|
|
274
309
|
|
|
275
310
|
### ブレインストーミングミッション
|
|
276
311
|
|
|
277
|
-
|
|
312
|
+
「AIブレインストーミング」ではない。ブレインストーミングミッションは、**法律に基づいて、追跡可能な意見の相違と検証結果を伴う、専門的な役割を担うものである。**
|
|
278
313
|
|
|
279
314
|
```bash
|
|
280
315
|
roleos run "explore product directions for a developer tool discovery platform"
|
|
@@ -282,33 +317,61 @@ roleos run "explore product directions for a developer tool discovery platform"
|
|
|
282
317
|
# Chain: 4 Analysts (parallel) → Normalize → Cross-Examine → Rebut → Synthesize → Expand → Judge
|
|
283
318
|
```
|
|
284
319
|
|
|
285
|
-
|
|
320
|
+
**異なる点:**
|
|
321
|
+
|
|
322
|
+
- **レイヤー1(真実):** 4人のアナリストが、役割固有のスキーマ(コンテキストマップ、ユーザーバリューマップ、メカニクスマップ、ポジショニングマップ)を出力する。共有された文章ではない。各役割には、盲点対策が施されている:禁止されたフレーズ、禁止された主張の種類、フィルタリングされた入力パーティション。アトムは、その起源を保持する。指向性のあるクロス・イグザミネーショングラフが、ターゲットを絞った課題を生成する。元の分析者は、プレッシャーの下で、主張を擁護、修正、または撤回する。
|
|
323
|
+
|
|
324
|
+
- **レイヤー2(レンダリング):** 5つの異なる人間の声(境界メモ、フィールドノート、システムスケッチ、主張概要、クロス・イグザミネーション記録)があり、語彙的な禁止により、声の収束を防ぐ。統合は真実を消費し、レンダリングされた文章は使用しない。両方のレイヤーは常に利用可能である。
|
|
325
|
+
|
|
326
|
+
- **証拠の連鎖:** レンダリングされたすべての文は、真実レイヤーのアトムに遡る。統合の指示は、アトムを参照する。クロス・イグザミネーションのターゲットは、実際の主張IDである。論争グラフが結果であり、文章ではない。
|
|
327
|
+
|
|
328
|
+
**実績:** v0.4のゴールデンラン—完全な証拠の連鎖が検証された。完全なアーティファクトチェーンについては、[`examples/golden-run.md`](examples/golden-run.md)を参照。
|
|
329
|
+
|
|
330
|
+
### 詳細監査ミッション
|
|
286
331
|
|
|
287
|
-
|
|
332
|
+
表面的なスキャンではない。詳細監査ミッションは、**リポジトリを境界が明確なコンポーネントに分解し、リポジトリ自体の依存関係グラフによって決定される規模で、専門の監査者を割り当てる。**
|
|
333
|
+
|
|
334
|
+
```bash
|
|
335
|
+
roleos run "deep audit this repo" --manifest=audit-manifest.json
|
|
336
|
+
# → MISSION: Deep Audit (Manifest-Scaled)
|
|
337
|
+
# Steps: Component Auditor ×6 + Test Truth Auditor ×6 + Seam Auditor ×8 + Synthesizer + Action Plan + Critic = 23 steps
|
|
338
|
+
```
|
|
339
|
+
|
|
340
|
+
**異なる点:**
|
|
341
|
+
|
|
342
|
+
- **動的な割り当て:** ワーカー数は固定されていない。10個のコンポーネントと5つの境界クラスターを持つリポジトリでは、28ステップ(2×10 + 5 + 3)が生成される。3個のコンポーネントを持つリポジトリでは、12ステップが生成される。スケーリングの式は、`2N + K + 3`であり、N = コンポーネント数、K = 境界数である。
|
|
343
|
+
- **マニフェストに基づくパッケージ:** `audit-manifest.json`は、コンポーネント(ファイルパス、行数、説明を含む)と境界(インターフェースの説明を含む、from/to)を定義する。各監査者は、割り当てられたパッケージのみを受け取る。
|
|
344
|
+
- **4つの役割のアーキタイプ:** コンポーネント監査者(モジュールごとのコードの真実)、テスト検証監査者(存在するテストではなく、証明するテスト)、境界監査者(依存関係グラフからの統合境界)、監査統合者(すべてのパッケージからのランク付けされた検証結果+アクションプラン)。
|
|
345
|
+
- **各ステップでのアーティファクトの検証:** `validateArtifact()`は、両方の実行パスの各ステップの完了時に実行される。結果は、ステップオブジェクトに添付される。システムは、各アーティファクトがその契約を満たしているかどうかを認識している。
|
|
346
|
+
- **正直な部分的な結果:** 予算またはスコープが完了を妨げる場合、コンポーネントごとの結果は個別に有効である。システムは、完了したことから統合し、完全な網羅性を偽ることはない。
|
|
347
|
+
|
|
348
|
+
**実績:** ランナーネイティブの検証ラン—実際のマニフェストに対する18のテスト、エスカレーションによる再開と部分的な失敗を含む、完全なライフサイクルが検証された。スケーリングの式は、3/6/10/15コンポーネントのマニフェストに対して検証された。
|
|
349
|
+
|
|
350
|
+
### 社内テスト環境スウォームミッション
|
|
351
|
+
|
|
352
|
+
1回のパスのリンターではない。社内テスト環境スウォームミッションは、**リポジトリを「動作する」状態から「本番環境で利用可能」な状態に移行させる、3つの健全性段階と反復的な機能提供を行う、複数パスの収束プロトコルを実行する。**
|
|
353
|
+
|
|
354
|
+
```bash
|
|
355
|
+
roleos swarm
|
|
356
|
+
# → MISSION: Dogfood Swarm (Multi-Pass Convergence)
|
|
357
|
+
# Stages: Health-A → Health-B → Health-C → Feature → Final
|
|
358
|
+
# Domain agents: 3-5 parallel per wave (exclusive file ownership)
|
|
359
|
+
```
|
|
288
360
|
|
|
289
|
-
|
|
361
|
+
**異なる点:**
|
|
290
362
|
|
|
291
|
-
-
|
|
363
|
+
- **3段階のヘルスチェック** — ステージAでは、バグやセキュリティの問題を修正します(重大な問題と高レベルの問題が0になるまで繰り返します)。ステージBでは、積極的なセキュリティ強化を実施します(ユーザーが結果を確認します)。ステージCでは、コードベースをより使いやすくします — ユーザーを支援するエラーメッセージ、再接続に関するフィードバック、読み込み中の表示、アクセシビリティの向上などを行います。各ステージは異なる目的を持ち、同じスキャンを繰り返すわけではありません。
|
|
364
|
+
- **排他的なファイル所有権** — 各ドメインエージェントは、`swarm-manifest.json`を通じて特定のファイルを所有します。2つのエージェントが同じファイルを編集することはありません。マージの競合も発生しません。調整のためのオーバーヘッドも発生しません。
|
|
365
|
+
- **ビルドゲート** — 各イテレーションの後に、lint、型チェック、テストを必ず実行し、すべてに合格する必要があります。システムは、ビルドシステム(Node、Rust、Python、Go)を自動的に検出し、適切なコマンドを実行します。
|
|
366
|
+
- **ユーザーチェックポイント** — ヘルスチェックBと機能チェックでは、実行前にユーザーの明示的な承認が必要です。システムは結果を提示し、ユーザーがビルドする内容を決定します。
|
|
367
|
+
- **反復的な収束** — 各ステージは、終了条件が満たされるか、最大イテレーション回数に達するまで、イテレーションを繰り返します。各イテレーションでは、以前の修正によって発生した問題を検出するために、最初から再監査を行います。
|
|
368
|
+
- **ドメインの自動検出** — `roleos swarm manifest --generate`は、リポジトリのタイプ(CLI、Web、デスクトップ、MCP、モノリポ)を検出し、重複しないドメイン割り当てを生成します。
|
|
292
369
|
|
|
293
|
-
|
|
370
|
+
**実績:** claude-collaborate (2026-03-28) — 35→129のテスト、106件のヘルスチェックの問題を修正、v1.1.0をリリース。9つのフェーズを持つプロトコルv2.0。
|
|
294
371
|
|
|
295
372
|
## ステータス
|
|
296
373
|
|
|
297
|
-
|
|
298
|
-
- v1.0.0: 32種類のロール、フルCLI、実績のあるトリートメント、マルチリポジトリ対応
|
|
299
|
-
- v1.0.2: ロールOSのロックダウン(初期設定の修正、`init --force`コマンド)
|
|
300
|
-
- v1.1.0: 31種類のロール、フルルーティング機能、競合検出、エスカレーション、証拠収集、ディスパッチ、7種類の実績のあるチームパック。35回の実行テスト。212件のテスト。
|
|
301
|
-
- v1.2.0: キャリブレーションされたパックがデフォルト設定に。自動選択、不整合検出、代替案の提案、フリールーティングへのフォールバック。246件のテスト。
|
|
302
|
-
- v1.3.0: 結果のキャリブレーション、タスクの細分化、複合実行、適応的な再計画。317件のテスト。
|
|
303
|
-
- v1.4.0: セッション機能 — `roleos init claude`、`roleos doctor`、ルートカード、`/roleos-route`、`/roleos-review`、`/roleos-status`コマンド。335件のテスト。
|
|
304
|
-
- v1.5.0: フック機能 — 実行時強制のための5つのライフサイクルフック。358件のテスト。
|
|
305
|
-
- v1.6.0: アーティファクト機能 — 各ロールごとの20種類のアーティファクト契約、7種類のパックハンドオフ契約、構造検証。385件のテスト。
|
|
306
|
-
- v1.7.0: 完了の検証 — 実際のタスクをフルスタックで実行。`roleos artifacts` CLI。構造的な修正に対する正直なエスカレーション。398件のテスト。
|
|
307
|
-
- v1.8.0: ミッションライブラリ(フェーズS) — 6種類の名前付きミッション、実行エンジン、完了レポート。6回の実際のテストで強化。481件のテスト。
|
|
308
|
-
- v1.9.0: 統合されたエントリーパス(フェーズT) — `roleos start`コマンドが、ミッション、パック、フリールーティングを自動的に選択。フォールバック機能、複合検出、エントリーパスの比較テスト。527件のテスト。
|
|
309
|
-
- **v2.0.0**: ユーザーエクスペリエンス改善(フェーズU) — `roleos run`コマンドが、永続的なディスクベースの実行を作成。再開、次へ、説明、完了、失敗。介入:リルーティング、エスカレーション、再試行、ブロック、再開。各ステップでの詳細なガイダンス。摩擦の測定。6件の摩擦テスト。613件のテスト。
|
|
310
|
-
- **v2.0.1**: マニュアルの監査、初心者向けドキュメント、テスト件数の修正。617件のテスト。
|
|
311
|
-
- **v2.1.0**: ブレインストーミングミッション(v0.4) — 法分野に特化したロール、追跡可能な意見の相違、判決を含む出力。2層アーキテクチャ(真実性 + レンダリング)、クロスエグザム権限マトリックス、紛争グラフ、黄金の実行の検証。7種類のミッション、50種類のロール、8種類のパック。894件のテスト。
|
|
374
|
+
安定しており、リリースされています。完全なバージョン履歴と、各リリースの変更点は、[CHANGELOG](CHANGELOG.md)を参照してください。
|
|
312
375
|
|
|
313
376
|
## ライセンス
|
|
314
377
|
|
|
@@ -316,4 +379,4 @@ MIT
|
|
|
316
379
|
|
|
317
380
|
---
|
|
318
381
|
|
|
319
|
-
|
|
382
|
+
<a href="https://mcp-tool-shop.github.io/">MCP Tool Shop</a>によってビルドされました。
|
package/README.md
CHANGED
|
@@ -13,7 +13,7 @@
|
|
|
13
13
|
<a href="https://mcp-tool-shop-org.github.io/role-os/"><img src="https://img.shields.io/badge/Landing_Page-live-brightgreen" alt="Landing Page"></a>
|
|
14
14
|
</p>
|
|
15
15
|
|
|
16
|
-
A multi-Claude operating system that staffs, routes, validates, and runs work through 61 specialized role contracts. Creates task packets, assembles the right team from scored role matching, detects broken chains before execution, auto-routes recovery when work is blocked or rejected, and requires structured evidence in every verdict. Includes dynamic dispatch for manifest-scaled missions — a 10-component repo automatically becomes 28 auditor steps, not 6.
|
|
16
|
+
A multi-Claude operating system that staffs, routes, validates, and runs work through 61 specialized role contracts. Creates task packets, assembles the right team from scored role matching, detects broken chains before execution, auto-routes recovery when work is blocked or rejected, and requires structured evidence in every verdict. Includes dynamic dispatch for manifest-scaled missions — a 10-component repo automatically becomes 28 auditor steps, not 6.
|
|
17
17
|
|
|
18
18
|
## What it does
|
|
19
19
|
|
|
@@ -85,6 +85,17 @@ Runs persist to disk (`.claude/runs/`), so interrupted sessions resume cleanly.
|
|
|
85
85
|
2. **Critic reviews against contract** — accepts, rejects, or blocks based on structured evidence, not impression
|
|
86
86
|
3. **Recovery routes automatically** — blocked or rejected work gets routed to the right resolver with a reason, recovery type, and required artifact
|
|
87
87
|
|
|
88
|
+
## Budget-aware dispatch
|
|
89
|
+
|
|
90
|
+
Role OS can consult a local **Token Budget Analyst** for each dispatch step and attach an advisory spend forecast to the manifest — opt-in (`ROLEOS_BUDGET_CONSULT`), advisory (it never blocks a dispatch), and fail-open to a deterministic baseline. Off by default; the forecast is local and free to run. See the [handbook](https://mcp-tool-shop-org.github.io/role-os/handbook/specialist-budget/).
|
|
91
|
+
|
|
92
|
+
## Tool-call oversight
|
|
93
|
+
|
|
94
|
+
Role OS verifies and gates tool calls at the `PreToolUse` seam — deterministically, with no model on the hot path:
|
|
95
|
+
|
|
96
|
+
- **Conformance watcher** (advisory, fail-open) — a deterministic schema + computable-contract floor checks a proposed call against its catalogued tool-contract and attaches an advisory verdict on a *proven* nonconformant call; it never blocks. An opt-in LLM ceiling (`ROLEOS_CONFORMANCE_CONSULT`) handles the genuinely-semantic residue.
|
|
97
|
+
- **Capability gate** (fail-closed, opt-in `ROLEOS_CAPABILITY_GATE`, default OFF) — deterministic least-privilege on *irreversible* actions (npm/PyPI publish, `gh release`, `git push`, repo edits, Pages deploy). A gated action is denied unless the director granted its capability in `.claude/role-os/capabilities.json`, so a wrong step — an honest mistake or an injected one — can't trigger an unauthorized irreversible action. The preventive complement to the named-compensator rule. See the [handbook](https://mcp-tool-shop-org.github.io/role-os/handbook/).
|
|
98
|
+
|
|
88
99
|
## Org rollout state
|
|
89
100
|
|
|
90
101
|
Org-wide rollout state (queue, decisions, audit records, per-repo lock packets) lives in a separate private repo: [`role-os-rollout`](https://github.com/mcp-tool-shop-org/role-os-rollout). This repo is the product; that repo is operational state.
|
|
@@ -360,23 +371,7 @@ roleos swarm
|
|
|
360
371
|
|
|
361
372
|
## Status
|
|
362
373
|
|
|
363
|
-
|
|
364
|
-
- v1.0.0: 32 roles, full CLI, proven treatment, multi-repo portability
|
|
365
|
-
- v1.0.2: Role OS lockdown (bootstrap truth fixes, init --force)
|
|
366
|
-
- v1.1.0: 31 roles, full routing spine, conflict detection, escalation, evidence, dispatch, 7 proven team packs. 35 execution trials. 212 tests.
|
|
367
|
-
- v1.2.0: Calibrated packs promoted to default entry. Auto-selection, mismatch detection, alternative suggestion, free-routing fallback. 246 tests.
|
|
368
|
-
- v1.3.0: Outcome calibration, mixed-task decomposition, composite execution, adaptive replanning. 317 tests.
|
|
369
|
-
- v1.4.0: Session spine — `roleos init claude`, `roleos doctor`, route cards, /roleos-route + /roleos-review + /roleos-status commands. 335 tests.
|
|
370
|
-
- v1.5.0: Hook spine — 5 lifecycle hooks for runtime enforcement. 358 tests.
|
|
371
|
-
- v1.6.0: Artifact spine — 20 per-role artifact contracts, 7 pack handoff contracts, structural validation. 385 tests.
|
|
372
|
-
- v1.7.0: Completion proof — real tasks run through the full stack. `roleos artifacts` CLI. Honest escalation on structural fixes. 398 tests.
|
|
373
|
-
- v1.8.0: Mission library (Phase S) — 6 named missions, runner engine, completion reports. Hardened from 6 real trial runs. 481 tests.
|
|
374
|
-
- v1.9.0: Unified entry path (Phase T) — `roleos start` auto-decides mission vs pack vs free routing. Fallback ladder, composite detection, entry-path comparison trials. 527 tests.
|
|
375
|
-
- **v2.0.0**: Operator friction pass (Phase U) — `roleos run` creates persistent disk-backed runs. Resume, next, explain, complete, fail. Interventions: reroute, escalate, retry, block, reopen. Step-local guidance at every step. Friction measurement. 6 friction trials. 613 tests.
|
|
376
|
-
- **v2.0.1**: Handbook audit, beginner docs, test count corrections. 617 tests.
|
|
377
|
-
- **v2.1.0**: Brainstorm mission (v0.4) — specialized roles under law, traceable disagreement, verdict-bearing output. Two-layer architecture (truth + render), cross-exam permission matrix, dispute graph, golden run proof. 7 missions, 50 roles, 8 packs. 894 tests.
|
|
378
|
-
- **v2.2.0**: Deep Audit mission — manifest-scaled repo audit with dynamic dispatch. 4 new audit roles (Component Auditor, Test Truth Auditor, Seam Auditor, Audit Synthesizer). Worker count scales with repo graph (2N + K + 3 formula). Artifact validation wired at both execution boundaries. Runner-native proof run green. accept/approve truth fix in evidence layer. 8 missions, 54 roles, 9 packs. 936 tests.
|
|
379
|
-
- **v2.3.0**: Dogfood Swarm mission — multi-pass convergence (health-a → health-b → health-c → feature → final). 7 new swarm roles (Swarm Coordinator, 5 domain agents, Swarm Synthesizer). Two new mission primitives: waveLoops (iterative convergence) and exclusiveOwnership (domain file boundaries). Dynamic domain dispatch, build gates, `roleos swarm` CLI, domain auto-detection, evidence persistence bridge. 9 missions, 61 roles, 10 packs. 1150 tests.
|
|
374
|
+
Stable and shipping. See the [CHANGELOG](CHANGELOG.md) for full version history and what changed in each release.
|
|
380
375
|
|
|
381
376
|
## License
|
|
382
377
|
|