npm - role-os - Versions diffs - 2.7.0 → 2.8.0 - Mend

role-os 2.7.0 → 2.8.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (13) hide show

package/CHANGELOG.md +33 -0
package/README.es.md +192 -129
package/README.fr.md +200 -137
package/README.hi.md +197 -134
package/README.it.md +193 -130
package/README.ja.md +198 -135
package/README.md +13 -18
package/README.pt-BR.md +195 -132
package/README.zh.md +201 -141
package/package.json +1 -1
package/src/hooks.mjs +125 -14
package/src/specialist/capability-gate.mjs +124 -0
package/src/specialist/conformance-consult.mjs +322 -0

package/README.ja.md CHANGED Viewed

@@ -13,20 +13,20 @@
   <a href="https://mcp-tool-shop-org.github.io/role-os/"><img src="https://img.shields.io/badge/Landing_Page-live-brightgreen" alt="Landing Page"></a>
 </p>
-マルチ・クロード環境を効率的に運用するためのシステムで、31種類の専門的な役割に分担し、タスクを割り当て、検証し、実行します。タスクをまとめた「タスクパケット」を作成し、役割のマッチングに基づいて最適なチームを編成し、実行前に問題点を検出し、タスクが中断または拒否された場合に自動的にリカバリー処理を実行し、すべての判断において構造化された証拠を必要とします。
+複数のClaudeを連携させるオペレーティングシステムで、61種類の専門的な役割を持つコントラクトを通じて、タスクの割り当て、ルーティング、検証、実行を行います。タスクパケットを作成し、スコアリングされた役割のマッチングに基づいて適切なチームを編成し、実行前に問題のある箇所を検出し、タスクが中断または拒否された場合に自動的にリカバリーを行い、すべての判断において構造化された証拠を要求します。動的なディスパッチにより、大規模なミッションに対応します。たとえば、10個のコンポーネントからなるリポジトリは、自動的に28段階の監査プロセスに展開されます。
-## Role OSの機能
+## 機能の説明
-Role OSは、マルチ・クロード環境をプロフェッショナルに活用するための方法です。一般的なAIワークフローで発生する特定の問題を回避します。
+Role OSは、複数のClaudeを効果的に活用するためのプロフェッショナルな方法です。一般的なAIワークフローで発生する特定の失敗を防ぎます。
-- **ドリフト（逸脱）**: 各役割は、自身の担当範囲にとどまります。製品の再設計、フロントエンドのスコープ変更、バックエンドの製品方向性の変更を防ぎます。
-- **誤った完了**: 完了の定義は明確です。不備を隠したり、検証を省略したり、別の問題を解決したりする作業は却下されます。
-- **汚染**: 分岐または継承されたプロジェクトには、元のプロジェクトの要素が残存する可能性があります。Role OSは、用語、ビジュアル、および思考モデルにおけるプロジェクト間の逸脱を検出し、却下します。
-- **主観的な進捗**: すべての手渡し作業は構造化されています。すべての判断は、証拠に基づいています。「完了したように感じる」という主観的な判断は認められません。
+- **ドリフト（役割の逸脱）**：各役割は、定められた範囲内で活動します。プロダクトは再設計されません。フロントエンドはスコープを再定義しません。バックエンドはプロダクトの方向性を決定しません。
+- **誤った完了**：完了の定義は明確です。ギャップを隠したり、検証を省略したり、別の問題を解決したりする作業は拒否されます。
+- **汚染**：フォークまたは継承されたプロジェクトは、固有の要素を引き継ぎます。Role OSは、用語、ビジュアル、およびメンタルモデルにおけるプロジェクト間の逸脱を検出し、拒否します。
+- **感覚的な進捗**：すべての引き継ぎは構造化されています。すべての判断は証拠と関連付けられています。「完了したように感じる」という状態は有効ではありません。
-## Role OSの仕組み
+## 仕組みの説明
-タスクの内容を記述してください。Role OSが、最適な連携レベルを自動的に決定します。
+タスクを記述します。Role OSは、適切なレベルのオーケストレーションを自動的に決定します。
 ```bash
 roleos start "fix the crash in save handler"
@@ -42,15 +42,15 @@ roleos start "something completely novel"
 #   Hint: Create a packet and run `roleos route` for role-level routing
 ```
-**段階的な解決策:**
+**フォールバックラダー（代替手段の階層）:**
-1. **ミッション:** 確立された繰り返し作業（バグ修正、改善、新機能追加、ドキュメント作成、セキュリティ対策、研究など）にタスクが該当する場合。役割の連鎖、成果物の流れ、エスカレーションの経路、および部分的な定義が明確になっています。
-2. **パック:** タスクが既知のカテゴリに属するが、完全なミッションとは異なる場合。7つの調整済みのチームパックがあり、自動選択機能と、役割の不一致を検知する機能があります。
-3. **自由ルーティング:** タスクが新規、複合的、または不明確な場合。31のすべての役割をタスクの内容に基づいて評価し、動的な連鎖を構築します。
+1. **ミッション**：タスクが、実績のある繰り返しワークフロー（バグ修正、治療、機能リリース、ドキュメント作成、セキュリティ、調査、ブレインストーミング、詳細監査、犬を使ったテスト）と一致する場合。既知の役割チェーン、成果物フロー、エスカレーションブランチ、および明確な部分的な定義が適用されます。
+2. **パック**：タスクが既知のカテゴリに属するものの、完全なミッションの形になっていない場合。10種類の調整されたチームパックを使用し、自動選択と不一致の防止を行います。
+3. **フリールーティング**：タスクが新しい、混合された、または不確かなものである場合。61種類の役割すべてに対して、パケットの内容を評価し、動的なチェーンを編成します。
-このシステムは、常に適切な抽象レベルでタスクを実行させます。各レベルを選択した理由を説明し、代替案も提示します。
+このシステムは、不適切な抽象化を通してタスクを強制的に実行することはありません。各レベルを選択した理由を説明し、代替案を提示します。
-**実行を開始するコマンド:**
+**実行を開始するための1つのコマンド:**
 ```bash
 roleos run "fix the crash in save handler"
@@ -67,7 +67,7 @@ roleos report                  # Generate completion report
 roleos friction                # Measure operator touches
 ```
-**問題発生時の対応:**
+**問題が発生した場合の介入:**
 ```bash
 roleos retry 0                 # Retry a failed step
@@ -77,46 +77,59 @@ roleos block 2 "waiting for API spec"
 roleos reopen 0 "found issue in review"
 ```
-実行結果はディスクに保存されます（`.claude/runs/`）。そのため、中断されたセッションも正常に再開できます。各ステップには、オペレーター向けのガイダンスが含まれており、生成すべき内容、必要なセクション、および停止条件が示されています。
+実行状況はディスクに保存されるため（`.claude/runs/`）、中断されたセッションは中断したところから再開できます。各ステップには、オペレーター向けのガイダンスが含まれます。何を生成するか、必要なセクション、および停止条件が示されます。
 **ルーティング後:**
-1. **各役割は成果物を生成:** 構造化された出力で、次の役割が理解しやすいように、証拠となる情報が含まれています。
-2. **レビュー担当者が契約に基づいて評価:** 構造化された証拠に基づいて、受け入れ、拒否、または中断のいずれかの判断を行います。主観的な判断は排除されます。
-3. **中断または拒否されたタスクは自動的にリカバリー:** 問題が発生したタスクは、理由、リカバリーの種類、および必要な成果物とともに、適切な担当者にルーティングされます。
+1. **各役割が引き継ぎを生成**：構造化された出力と、次の役割の曖昧さを軽減する証拠項目。
+2. **批評家がコントラクトに基づいてレビュー**：構造化された証拠に基づいて、承認、拒否、またはブロックを行います。印象による判断は行いません。
+3. **リカバリールートが自動的に実行**：ブロックまたは拒否されたタスクは、理由、リカバリーの種類、および必要な成果物とともに、適切な解決者にルーティングされます。
-## 組織全体の展開状況
+## 予算を考慮したディスパッチ
-組織全体の展開状況（キュー、意思決定、監査記録、リポジトリごとのロックパケット）は、別のプライベートリポジトリに保存されています：[`role-os-rollout`](https://github.com/mcp-tool-shop-org/role-os-rollout)。このリポジトリは製品であり、別のリポジトリは運用状況を管理します。
+Role OSは、各ディスパッチステップでローカルの**トークン予算アナリスト**を参照し、マニフェストに推奨される支出予測を添付できます。これはオプション機能であり（`ROLEOS_BUDGET_CONSULT`）、アドバイザリーとして機能し（ディスパッチをブロックすることはありません）、デフォルトでは無効になっています。予測はローカルで実行され、無料です。詳細については、[ハンドブック](https://mcp-tool-shop-org.github.io/role-os/handbook/specialist-budget/)を参照してください。
+## ツール呼び出しの監視
+Role OSは、`PreToolUse`の段階でツール呼び出しを検証し、許可します。これは決定論的に行われ、ホットパスにモデルは使用されません。
+- **コンプライアンス監視機能**（推奨、フェイルオープン）— 決定的なスキーマと計算可能な契約に基づくチェックにより、提案された呼び出しがカタログ化されたツールとの契約に準拠しているかどうかを確認し、*確認された*不適合な呼び出しに対して推奨の判断を付与します。ただし、絶対にブロックすることはありません。オプションでLLMの上限（`ROLEOS_CONFORMANCE_CONSULT`）を設定することで、意味的に残った部分を処理します。
+- **機能ゲート**（フェイルクローズド、オプションの`ROLEOS_CAPABILITY_GATE`、デフォルトはOFF）— *不可逆的な*アクション（npm/PyPIへの公開、`gh release`、`git push`、リポジトリの編集、Pagesのデプロイ）に対して、決定論的に最小限の権限を適用します。ゲートされたアクションは、ディレクターが`.claude/role-os/capabilities.json`でその機能を許可しない限り拒否されるため、誤った手順（正直なミスまたは不正な操作）によって、許可されていない不可逆的なアクションがトリガーされることはありません。これは、名前付きの補償ルールに対する予防的な補完です。[ハンドブック](https://mcp-tool-shop-org.github.io/role-os/handbook/)を参照してください。
+## 組織全体のロールアウト状態
+組織全体でのロールアウト状態（キュー、決定、監査記録、リポジトリごとのロックパケット）は、別のプライベートリポジトリに保存されます：[`role-os-rollout`](https://github.com/mcp-tool-shop-org/role-os-rollout)。このリポジトリがプロダクトであり、別のリポジトリが運用状態です。
 ## メモリと継続性
-Role OSは、メモリレイヤーを所有または複製しません。Claudeプロジェクトのメモリが存在する場合、それが標準的な継続性システムです。リポジトリの情報、決定事項、未解決の問題、および処理履歴は、そこに保存されます。
+Role OSは、メモリレイヤーを所有または複製しません。Claudeプロジェクトのメモリが存在する場合、それが正当な継続性システムとなります。リポジトリの事実、決定、未解決の問題、および治療履歴は、そこに保存されます。
-Role OSは、Claudeプロジェクトのメモリと連携します。置き換えるものではありません。
+Role OSは、Claudeプロジェクトのメモリと統合されます。置き換えることはありません。
-## 完全な処理と品質チェック
+## 完全な治療と出荷チェック
-完全な処理は、Claudeプロジェクトのメモリ (`memory/full-treatment.md`) に定義された、7段階の標準的なプロセスです。Role OSは、役割契約、手渡し、およびレビューゲートを使用して、処理をルーティングおよびレビューします。このプロセスを再定義するものではありません。
+完全な治療は、Claudeプロジェクトのメモリ（`memory/full-treatment.md`）で定義された、標準的な7段階のプロトコルです。Role OSは、役割コントラクト、引き継ぎ、および批評家ゲートを使用して、治療をルーティングおよびレビューします。プロトコルを再定義することはありません。
-**品質チェック**は、完全な処理の前に実行される、31項目の品質ゲートです。完全な処理を開始する前に、AからDまでの必須ゲートをすべて通過する必要があります。参照先: `memory/shipcheck.md`.
+**出荷チェック**は、完全な治療の前に実行される31項目の品質ゲートです。厳格なゲートA〜Dは、治療が開始される前に通過する必要があります。参照：`memory/shipcheck.md`。
-順序: 品質チェックを最初に実行し、次に完全な処理を行います。必須ゲートをすべて通過しない限り、バージョン1.0.0をリリースできません。
+順序：まず出荷チェックを行い、次に完全な治療を行います。厳格なゲートを通過しない限り、v1.0.0はリリースされません。
-## 32の役割、8つのパッケージに分類
+## 10個のパックにまたがる61の役割
-| パッケージ | 役割 |
+| パック | 役割 |
 |------|-------|
-| **Core** (3) | オーケストレーター、プロダクトストラテジスト、レビュー担当者 |
+| **Core** (3) | オーケストレーター、プロダクトストラテジスト、批評家レビュー担当者 |
 | **Engineering** (7) | フロントエンド開発者、バックエンドエンジニア、テストエンジニア、リファクタリングエンジニア、パフォーマンスエンジニア、依存関係監査担当者、セキュリティレビュー担当者 |
-| **Design** (2) | UIデザイナー、ブランド担当者 |
+| **Design** (2) | UIデザイナー、ブランドガーディアン |
 | **Marketing** (1) | ローンチコピーライター |
-| **Treatment** (7) | リポジトリ研究者、リポジトリ翻訳者、ドキュメントアーキテクト、メタデータキュレーター、カバレッジ監査担当者、デプロイ検証担当者、リリースエンジニア |
-| **Product** (3) | フィードバック合成ツール、ロードマップ優先順位付けツール、仕様書作成ツール |
-| **Research** (4) | UXリサーチャー、競合分析担当者、トレンドリサーチャー、ユーザーインタビュー合成担当者 |
+| **Treatment** (7) | リポジトリリサーチャー、リポジトリ翻訳者、ドキュメントアーキテクト、メタデータキュレーター、カバレッジ監査担当者、デプロイメント検証担当者、リリースエンジニア |
+| **Product** (3) | フィードバックスynthesizer、ロードマップ優先順位付け担当者、仕様書作成者 |
+| **Research** (4) | UXリサーチャー、競合分析担当者、トレンドリサーチャー、ユーザーインタビューSynthesizer |
 | **Growth** (4) | ローンチストラテジスト、コンテンツストラテジスト、コミュニティマネージャー、サポートトリアージリーダー |
+| **Deep Audit** (4) | コンポーネント監査担当者、テストの真実性監査担当者、シーム監査担当者、監査Synthesizer |
+| **Swarm** (7) | スワームコーディネーター、スワームバックエンドエージェント、スワームブリッジエージェント、スワームテストエージェント、スワームインフラエージェント、スワームフロントエンドエージェント、スワームSynthesizer |
-各役割には、詳細な契約書があります。内容は、ミッション、使用するタイミング、使用しないタイミング、必要な入力、必要な出力、品質基準、およびエスカレーションのトリガーなどです。すべての役割はルーティング可能であり、`roleos route`コマンドを使用すると、タスクの内容に基づいて、最適な役割を推奨することができます。
+各役割には、完全なコントラクトがあります。ミッション、使用する場面、使用しない場面、期待される入力、必要な出力、品質基準、およびエスカレーショントリガーが含まれます。すべての役割はルーティング可能です。`roleos route`コマンドを使用すると、パケットの内容に基づいて、これらの役割のいずれかを推奨できます。
 ## クイックスタート
@@ -133,6 +146,19 @@ roleos complete artifact.md    # Complete with artifact
 roleos explain                 # Show full state
 roleos report                  # Completion report
+# Deep audit:
+roleos audit manifest --generate   # Create audit-manifest.json
+roleos audit                       # Start component-level deep audit
+roleos audit status                # Check audit progress
+roleos audit verify                # Verify manifest and outputs
+# Dogfood swarm:
+roleos swarm manifest --generate   # Auto-detect domains from repo structure
+roleos swarm                       # Start multi-pass convergence swarm
+roleos swarm status                # Check swarm progress by stage
+roleos swarm findings              # List findings by severity
+roleos swarm approve               # Approve feature gate
 # Or go manual:
 roleos start "fix the crash"   # Entry decision only (no run)
 roleos packet new feature
@@ -146,57 +172,57 @@ roleos packs list
 ## Role OSを使用しない場合
-- 単一行の修正、タイプミス、または明白なバグ
-- 明確な出力がない探索的な調査
-- 5分で1人の担当者が完了できる作業
-- レビュープロセスが完了する前にリリースする必要がある緊急の修正
-- 速度を重視し、構造を後回しにしたいプロジェクト
+- 単行の修正、タイプミス、または明白なバグ
+- 定義されたアウトプットのない探索的な調査
+- 5分で1人の担当者が処理できる作業
+- レビュープロセスが完了する前にリリースする必要がある緊急のホットフィックス
+- 構造よりもスピードを重視するプロジェクト
-## 検証
+## 証拠
-Role OSは、構造が異なる2つのリポジトリで、3つの異なるテストケースで検証されました。
+Role OSは、構造的に異なる2つのリポジトリで、3つの異なるテストケースでその有効性が証明されました。
-**テストケース001 — 機能開発** (Crew Screen, Star Freight)
-- 7つの役割チェーン、45のテストシナリオ、役割の衝突は0件。
-- 分岐元のプロジェクトからの汚染を防ぎ、意図しない変更を検出し、問題点を明確にしました。
+**テスト001 — 機能開発**（クルースクリーン、スターフレート）
+- 7つの役割を持つチェーン、45のテストシナリオ、役割の衝突は0
+- フォークされた祖先からの汚染を防ぎ、インラインでの発明を検出し、明確な課題を提示
-**テストケース002 — 統合** (CampaignState wiring, Star Freight)
-- 5つの役割チェーン、フォールバックによる問題を解決しました。
-- フォールバックテストにより、実際に動作するパスが存在することを確認しました。
+**テスト002 — 統合作業**（キャンペーンステートの連携、スターフレート）
+- 5つの役割を持つチェーン、フォールバックなしでアーキテクチャの境界を解決
+- フォールバックテストにより、ライブパスが実際に機能し、プレースホルダーではないことが証明
-**テストケース003 — ID管理** (Contamination purge, Star Freight)
-- 6つの役割チェーン、耐久性のあるCIによる汚染防御を含む、51のテストシナリオ。
-- 継承された不整合を修正し、大規模な再設計を回避しました。
+**テスト003 — アイデンティティ作業**（汚染の除去、スターフレート）
+- 6つの役割を持つチェーン、51のテストシナリオ（永続的なCI汚染防御を含む）
+- 広範囲な再設計に陥ることなく、継承された矛盾を修正
-**移植性テスト** (Personaの一貫性、センサーの挙動)
-- 同じ基本構造を持ちながら、異なる言語、ドメイン、技術スタックを使用
-- コンテキストの変更のみで導入可能。コアとなる契約の変更は行わない。
+**移植性のテスト**（ペルソナの一貫性、センサーユーモア）
+- 同じ基本構造、異なる言語/ドメイン/スタック
+- コンテキストの変更のみを適用 — コアコントラクトの変更はなし
-**フルトリートメント FT-001** (portlight-desktop)
-- 7段階の担当者配置によるトリートメント。トリートメントパッケージの役割を使用。
-- 品質チェックが確立されており、役割の競合はゼロ。
+**完全な処理FT-001**（ポートライトデスクトップ）
+- 7段階の処理、処理パックの役割を使用
+- シップチェックゲートが有効であることが証明され、役割の衝突は0
-**フルトリートメント FT-002** (studioflow)
-- 同じトリートメントパッケージを使用。構造は異なり、リポジトリの内容も異なる（クリエイティブワークスペース vs ゲーム）。
-- トリートメントパッケージは移植可能。契約の変更は不要。
+**完全な処理FT-002**（スタジオフロー）
+- 同じ処理パック、構造的に異なるリポジトリ（クリエイティブなワークスペースとゲーム）
+- 処理パックは移植可能 — コントラクトの変更は不要
-**理想的な実行例（MCPサーバーマーケットプレイスのトピック）**
-- 9つの役割を持つ連携、並行して4人の分析者。相互に質問し、反論するグラフ。
-- 4つの課題が提示され、3つの主張が絞り込まれ、1つが未解決。健全なプレッシャーがかかっていますが、行き詰まりはありません。
-- 生成された成果物から、真実の要素への16以上の追跡リンク。
-- 完全なトレーサビリティが証明されています：真実 → 要素 → 反論 → 統合 → 拡張 → 評価 → 生成 → 追跡
+**ブレインストーミングの優れた実行**（MCPサーバーマーケットプレーストピック）
+- 9つの役割を持つチェーン、4人のアナリストが並行して作業、クロスチェックと反論の議論グラフ
+- 4つの課題が提起され、3つの主張が絞り込まれ、1つは未解決 — 健全なプレッシャー、行き詰まりではない
+- 16以上のトレースリンクが、レンダリングされた成果物から真実の層の原子に遡る
+- 完全なトレーサビリティが証明：真実 → 原子 → 議論 → 統合 → 拡張 → 評価 → レンダリング → トレース
-## 主要な特性
+## コアプロパティ
-これらは変更できません。変更によってこれらのいずれかが弱体化する場合は、却下してください。
+これらは交渉の余地がありません。変更によってこれらのいずれかが損なわれる場合、却下してください。
-- ロールの境界が維持される
-- レビューは厳格である
-- エスカレーションは誠実に行われる
-- テスト可能な状態が維持される
-- 移植性は、コア部分の変更ではなく、コンテキストへの適応が必要
+- 役割の境界は維持される
+- レビューには実効性がある
+- エスカレーションは誠実である
+- パケットはテスト可能である
+- 移植性には、コアの外科手術ではなく、コンテキストへの適応が必要
-## プロジェクト構造
+## プロジェクトの構造
 ```
 role-os/
@@ -206,18 +232,23 @@ role-os/
     entry-cmd.mjs              ← `roleos start` CLI command
     run.mjs                    ← Persistent run engine: create → step → pause → resume → report
     run-cmd.mjs                ← `roleos run/resume/next/explain/complete/fail` + interventions
-    mission.mjs                ← 7 named mission types (feature, bugfix, treatment, docs, security, research, brainstorm)
+    mission.mjs                ← 9 named mission types (feature, bugfix, treatment, docs, security, research, brainstorm, deep-audit, dogfood-swarm)
     mission-run.mjs            ← Mission runner: create → step → complete → report
     mission-cmd.mjs            ← `roleos mission` CLI commands
-    route.mjs                  ← 31-role routing + dynamic chain builder
-    packs.mjs                  ← 7 calibrated team packs + auto-selection
+    audit-cmd.mjs              ← `roleos audit` — deep audit entry point with manifest generation
+    swarm-cmd.mjs              ← `roleos swarm` — dogfood swarm entry point with domain detection
+    swarm/                     ← Domain detection, build gate, evidence persistence bridge
+    route.mjs                  ← 61-role routing + dynamic chain builder
+    packs.mjs                  ← 10 calibrated team packs + auto-selection
     conflicts.mjs              ← 4-pass conflict detection
     escalation.mjs             ← Auto-routing for blocked/rejected/split
     evidence.mjs               ← Structured evidence + role-aware requirements
     dispatch.mjs               ← Runtime dispatch manifests for multi-claude
-    artifacts.mjs              ← 30 per-role artifact contracts + 7 pack handoffs
+    tool-profiles.mjs          ← Per-role tool sandboxing (shared by dispatch + trial)
+    state-machine.mjs          ← Canonical step/run transition maps
+    artifacts.mjs              ← Per-role artifact contracts + pack handoffs
     decompose.mjs              ← Composite task detection + splitting
-    composite.mjs              ← Dependency-ordered execution + recovery
+    composite.mjs              ← Dependency-ordered execution + recovery + cycle detection
     replan.mjs                 ← Mid-run adaptive replanning
     calibration.mjs            ← Outcome recording + weight tuning
     hooks.mjs                  ← 5 lifecycle hooks for runtime enforcement
@@ -225,56 +256,60 @@ role-os/
     brainstorm.mjs             ← Evidence modes, request validation, finding/synthesis/judge schemas
     brainstorm-roles.mjs       ← Role-native schemas, input partitioning, blindspot enforcement, cross-exam
     brainstorm-render.mjs      ← Two-layer rendering: lexical bans, render schemas, debate transcript
-  test/                        ← 894 tests across 30 test files
+  test/                        ← 1150 tests across 37 test files
   starter-pack/                ← Drop-in role contracts, policies, schemas, workflows
 ```
 ## セキュリティ
-Role OSは、**ローカルでのみ**動作します。Markdownテンプレートをコピーし、パケット/判定ファイルを、あなたのリポジトリの`.claude/`ディレクトリに書き込みます。ネットワークへのアクセス、機密情報の取り扱い、テレメトリーの収集は行いません。危険な操作は一切行いません。すべてのファイル書き込みは、デフォルトでファイルが存在する場合はスキップします。詳細については、[SECURITY.md](SECURITY.md) を参照してください。
+Role OSは**ローカルでのみ**動作します。Markdownテンプレートをコピーし、パケット/結果ファイルをリポジトリの`.claude/`ディレクトリに書き込みます。ネットワークにアクセスしたり、機密情報を処理したり、テレメトリを収集したりすることはありません。危険な操作は行いません。すべてのファイル書き込みは、デフォルトで「存在する場合はスキップ」を使用します。完全なポリシーについては、[SECURITY.md](SECURITY.md)を参照してください。
-## このオペレーティングシステム
+## オペレーティングシステム
-| レイヤー | Role OSの機能 | ステータス |
+| レイヤー | 機能の説明 | ステータス |
 |-------|-------------|--------|
-| **Routing** | タスクの内容に基づいて、31のすべての役割を評価し、推奨事項を説明し、信頼度を評価します。 | ✓ 完了 |
-| **Chain builder** | 役割を段階的に組み合わせて連鎖を構築します。タスクの種類に最適化されており、テンプレートに依存しません。 | ✓ 完了 |
-| **Conflict detection** | 4段階の検証：競合、順序、冗長性、網羅性の欠落。修正案の提案。 | ✓ 完了 |
-| **Escalation** | 中断、拒否、または分割されたタスクを、理由と必要な成果物とともに、適切な担当者に自動的にルーティングします。 | ✓ 完了 |
-| **Evidence** | 判断において、役割を意識した構造化された証拠を使用します。十分性のチェックを行います。12種類の証拠があります。 | ✓ 完了 |
-| **Dispatch** | マルチ・クロード環境での実行に必要な情報を生成します。各役割で使用するツール、システムプロンプト、予算などを定義します。 | ✓ 完了 |
-| **Trials** | すべての役割について、テストが完了しています。30種類のタスクと、5種類のネガティブテストが成功しました。7つのチームパックのテストも完了しています。 | ✓ 完了 |
-| **Team Packs** | 自動選択機能、役割の不一致を検知する機能、および自由ルーティングによるフォールバックを備えた、7つの調整済みのチームパック。 | ✓ 完了 |
-| **Outcome calibration** | 実行結果を記録し、結果に基づいてチームパックまたは役割の重みを調整し、信頼度の閾値を調整します。 | ✓ 完了 |
-| **Mixed-task decomposition** | 複合タスクを検出し、子タスクに分割し、チームパックを割り当て、依存関係を維持します。 | ✓ 完了 |
-| **Composite execution** | 依存関係の順序で子タスクを実行し、成果物を引き継ぎ、リカバリー処理を行い、統合します。 | ✓ 完了 |
-| **Adaptive replanning** | 実行中にスコープの変更、発見事項、または新しい要件が発生した場合でも、計画を再起動せずに更新できます。 | ✓ 完了 |
-| **Session spine** | `roleos init claude`コマンドを使用すると、CLAUDE.md、/roleos-route、/roleos-review、/roleos-statusファイルが作成されます。`roleos doctor`コマンドを使用すると、設定が正しく行われているかを確認できます。ルーティングカードは、タスクへの関与を証明します。 | ✓ 完了 |
-| **Hook spine** | 5つのライフサイクルフック（SessionStart、PromptSubmit、PreToolUse、SubagentStart、Stop）。コンプライアンスの強制：ルートカードのリマインダー、ツールの利用制限、サブエージェントの役割の注入、完了状況の監査。 | ✓ 完了 |
-| **Artifact spine** | ロールごとに20件の成果物契約。7件のパッケージ引き継ぎ契約。構造検証。チェーンの完全性チェック。下位のロールは、受け取った内容を推測することはありません。 | ✓ 完了 |
-| **Mission library** | 6つの名前付きミッション（新機能追加、バグ修正、改善、ドキュメントのリリース、セキュリティ強化、研究開発）。それぞれが、パッケージ、ロールチェーン、成果物の流れ、エスカレーションのブランチ、正直で部分的な定義を宣言します。6つすべてが試行錯誤され、強化されています。 | ✓ 完了 |
-| **Mission runner** | 実行を開始し、追跡された状態とともにステップを進め、正直なレポートで完了または失敗。ブロックされたステップの伝播、チェーンからの逸脱に関する警告、最後のステップの再開。 | ✓ 完了 |
-| **Unified entry** | `roleos start`は、ミッション、パッケージ、または自由ルーティングを自動的に決定します。信頼度スコア、代替案、および複合検出を備えたフォールバックシステム。 | ✓ 完了 |
-| **Persistent runs** | `roleos run` コマンドは、ディスクに保存された実行結果を作成します。`resume`（再開）、`next`（次へ）、`explain`（説明）、`complete`（完了）、`fail`（失敗）。対応：`reroute`（リダイレクト）、`escalate`（エスカレーション）、`retry`（再試行）、`block`（ブロック）、`reopen`（再開）。各ステップにローカルなガイダンスがあります。摩擦の測定。 | ✓ 完了 |
-| **Brainstorm** | 2層のアーキテクチャ：真実層（役割固有のスキーマ、トレーサビリティを持つ要素、相互質問と反論のグラフ）+ 生成層（5つの異なる声、禁止語、議論の記録）。追跡リンクは、生成されたすべての主張が、真実の要素に対応していることを証明します。理想的な実行例：894件のテスト。 | ✓ 完了 |
-## 6つのミッション
-| ミッション | パッケージ | 役割 | 使用するタイミング |
+| **Routing** | パケットの内容に対して61の役割すべてを評価し、推奨事項を説明し、信頼性を評価します | ✓ リリース済み |
+| **Chain builder** | 評価された役割から、フェーズ順にチェーンを組み立てます。テンプレートにロックされるのではなく、パケットタイプに重点を置きます。 | ✓ リリース済み |
+| **Conflict detection** | 4段階の検証：深刻な競合、シーケンス、冗長性、カバレッジのギャップ。修正の提案。 | ✓ リリース済み |
+| **Escalation** | ブロックされた/却下された/分割された作業を、理由と必要な成果物とともに、適切な解決者に自動的にルーティングします。 | ✓ リリース済み |
+| **Evidence** | 役割を意識した、結果に構造化された証拠。十分性のチェック。12種類の証拠。 | ✓ リリース済み |
+| **Dispatch** | マルチクラウド用の実行マニフェストを生成します。役割ごとのツールプロファイル、システムプロンプト、予算。 | ✓ リリース済み |
+| **Trials** | 完全なロースターが証明済み：30/30のゴールドタスク + 5/5のネガティブテスト。7つのパックテストが完了。 | ✓ 完了 |
+| **Team Packs** | 10個の調整されたパック、自動選択、不一致ガード、および自由ルーティングのフォールバックを備えています。 | ✓ リリース済み |
+| **Outcome calibration** | 実行結果を記録し、結果からパック/役割の重みを調整し、信頼性のしきい値を調整します。 | ✓ リリース済み |
+| **Mixed-task decomposition** | 複合作業を検出し、子パケットに分割し、パックを割り当て、依存関係を保持します。 | ✓ リリース済み |
+| **Composite execution** | 子パケットを依存関係の順に実行し、成果物の受け渡し、ブランチの回復、および統合を行います。 | ✓ リリース済み |
+| **Adaptive replanning** | 実行中のスコープの変更、調査結果、または新しい要件は、再起動せずに計画を更新します。 | ✓ リリース済み |
+| **Session spine** | `roleos init claude`は、CLAUDE.md、/roleos-route、/roleos-review、/roleos-statusをスキャフォールドします。`roleos doctor`は、連携を検証します。ルートカードは、関与を証明します。 | ✓ リリース済み |
+| **Hook spine** | 5つのライフサイクルフック（SessionStart、PromptSubmit、PreToolUse、SubagentStart、Stop）。アドバイザリーによる強制：ルートカードのリマインダー、書き込みツールのゲート、サブエージェントの役割の注入、完了監査。 | ✓ リリース済み |
+| **Artifact spine** | 役割ごとの成果物コントラクト。パックの引き継ぎコントラクト。構造的な検証。チェーンの完全性のチェック。下流の役割は、受け取ったものを推測することはありません。 | ✓ リリース済み |
+| **Mission library** | 9つの名前付きミッション（機能のリリース、バグ修正、処理、ドキュメントのリリース、セキュリティ強化、調査の開始、ブレインストーミング、詳細な監査、ドッグフードスウォーム）。それぞれが、パック、役割チェーン、成果物フロー、エスカレーションブランチ、誠実な部分的な定義を宣言します。 | ✓ リリース済み |
+| **Mission runner** | 実行を作成し、追跡された状態でステップを実行し、正直なレポートで完了/失敗します。ブロックされたステップの伝播、チェーン外のエスカレーション警告、最後のステップの再開。 | ✓ リリース済み |
+| **Unified entry** | `roleos start`は、ミッション、パック、または自由ルーティングを自動的に決定します。信頼性のスコア、代替案、および複合検出を備えたフォールバックラダー。 | ✓ リリース済み |
+| **Persistent runs** | `roleos run`は、ディスクにバックアップされた実行を作成します。`resume`、`next`、`explain`、`complete`、`fail`。介入：リルート、エスカレート、再試行、ブロック、再開。ステップごとのガイダンス。摩擦の測定。 | ✓ リリース済み |
+| **Brainstorm** | 2層のアーキテクチャ：真実（役割固有のスキーマ、プロベナンスアトム、クロスチェックの議論グラフ）+ レンダリング（5つの異なる声、語彙の禁止、議論のトランスクリプト）。トレースリンクは、レンダリングされたすべての主張が真実の原子にマッピングされることを証明します。優れた実行が証明済み。 | ✓ リリース済み |
+| **Deep Audit** | マニフェストに基づくリポジトリ監査：リポジトリをコンポーネントに分解し、依存関係グラフからN人の監査者＋M人のテスト検証監査者＋K人の境界監査者を割り当て、それらを統合して、ランク付けされた検証結果とアクションプランを作成する。動的な割り当ては、リポジトリのサイズに応じて調整される（2N + K + 3の式）。各ステップでアーティファクトの検証を行う、ランナーネイティブ。 | ✓ リリース済み |
+| **Dogfood Swarm** | 複数パスの収束：3つの健全性段階（バグ/セキュリティ→積極的→人間化）、その後は機能パス。排他的なファイル所有権、各段階の後にビルドゲート、ユーザーチェックポイント。ドメインの自動検出により、マニフェストが生成される。証拠ブリッジを介して、社内テスト環境に連携。 | ✓ リリース済み |
+## 9つのミッション
+| ミッション | パック | 役割 | 使用するタイミング |
 |---------|------|-------|-------------|
-| `feature-ship` | 新機能 | 5 | 完全な新機能の提供：範囲 → 仕様 → 実装 → テスト → レビュー |
+| `feature-ship` | 機能 | 5 | 完全な機能の提供：スコープ→仕様→実装→テスト→レビュー |
 | `bugfix` | バグ修正 | 4 | 根本原因の特定、修正、テスト、検証 |
-| `treatment` | 改善 | 4 | 品質チェック + 調整 + ドキュメント + CIによる検証 + レビュー |
+| `treatment` | 改善 | 4 | 出荷前チェック＋調整＋ドキュメント＋CIによる検証＋レビュー |
 | `docs-release` | ドキュメント | 2 | ドキュメントの作成/更新、リリースノート |
-| `security-hardening` | セキュリティ | 4 | 脅威モデルの作成、監査、脆弱性の修正、再監査、検証 |
-| `research-launch` | 研究 | 4 | 問題の定義、調査、結果の文書化、決定 |
-| `brainstorm` | ブレインストーミング | 9 | 追跡可能な意見の相違と結論を持つ、構造化された多角的な調査 |
+| `security-hardening` | セキュリティ | 4 | 脅威モデリング、監査、脆弱性の修正、再監査、検証 |
+| `research-launch` | 調査 | 4 | 質問の作成、調査、調査結果の文書化、決定 |
+| `brainstorm` | ブレインストーミング | 9 | 追跡可能な意見の相違と検証を含む、構造化された多角的な検討 |
+| `deep-audit` | 詳細監査 | 5（段階） | マニフェストに基づくリポジトリ監査—ワーカー数は、動的な割り当てを通じてリポジトリグラフの規模に応じて調整される |
+| `dogfood-swarm` | スウォーム | 8（段階） | 複数パスの収束：健全性A→健全性B→健全性C→機能→最終的な統合 |
-各ミッションには、正直で部分的な定義が含まれています。作業が停滞した場合、システムは完了した内容と残りの内容を記録し、進捗を偽装することはありません。
+各ミッションには、正直な部分的な定義が含まれる。作業が停滞した場合、システムは、完了したことと残っていることを文書化し、完了を偽ることはない。
 ### ブレインストーミングミッション
-これは「AIによるブレインストーミング」ではありません。ブレインストーミングミッションは、**法に基づいて定義された役割であり、追跡可能な意見の相違と、結論を導き出すための出力を持つ**ものです。
+「AIブレインストーミング」ではない。ブレインストーミングミッションは、**法律に基づいて、追跡可能な意見の相違と検証結果を伴う、専門的な役割を担うものである。**
 ```bash
 roleos run "explore product directions for a developer tool discovery platform"
@@ -282,33 +317,61 @@ roleos run "explore product directions for a developer tool discovery platform"
 #   Chain: 4 Analysts (parallel) → Normalize → Cross-Examine → Rebut → Synthesize → Expand → Judge
 ```
-**何が違うのか:**
+**異なる点：**
+- **レイヤー1（真実）：** 4人のアナリストが、役割固有のスキーマ（コンテキストマップ、ユーザーバリューマップ、メカニクスマップ、ポジショニングマップ）を出力する。共有された文章ではない。各役割には、盲点対策が施されている：禁止されたフレーズ、禁止された主張の種類、フィルタリングされた入力パーティション。アトムは、その起源を保持する。指向性のあるクロス・イグザミネーショングラフが、ターゲットを絞った課題を生成する。元の分析者は、プレッシャーの下で、主張を擁護、修正、または撤回する。
+- **レイヤー2（レンダリング）：** 5つの異なる人間の声（境界メモ、フィールドノート、システムスケッチ、主張概要、クロス・イグザミネーション記録）があり、語彙的な禁止により、声の収束を防ぐ。統合は真実を消費し、レンダリングされた文章は使用しない。両方のレイヤーは常に利用可能である。
+- **証拠の連鎖：** レンダリングされたすべての文は、真実レイヤーのアトムに遡る。統合の指示は、アトムを参照する。クロス・イグザミネーションのターゲットは、実際の主張IDである。論争グラフが結果であり、文章ではない。
+**実績：** v0.4のゴールデンラン—完全な証拠の連鎖が検証された。完全なアーティファクトチェーンについては、[`examples/golden-run.md`](examples/golden-run.md)を参照。
+### 詳細監査ミッション
-- **層1（真実）：** 4人の分析者が、役割固有のスキーマ（コンテキストマップ、ユーザーバリューマップ、メカニズムマップ、ポジショニングマップ）を生成します。これは、共有された文章ではありません。各役割には、盲点防止機能が組み込まれており、禁止語、禁止される主張の種類、およびフィルタリングされた入力セクションがあります。要素には、トレーサビリティ情報が含まれています。方向性のある相互質問グラフにより、ターゲットを絞った課題が生成されます。元の分析者は、プレッシャーの下で、主張を擁護したり、絞り込んだり、撤回したりします。
+表面的なスキャンではない。詳細監査ミッションは、**リポジトリを境界が明確なコンポーネントに分解し、リポジトリ自体の依存関係グラフによって決定される規模で、専門の監査者を割り当てる。**
+```bash
+roleos run "deep audit this repo" --manifest=audit-manifest.json
+# → MISSION: Deep Audit (Manifest-Scaled)
+#   Steps: Component Auditor ×6 + Test Truth Auditor ×6 + Seam Auditor ×8 + Synthesizer + Action Plan + Critic = 23 steps
+```
+**異なる点：**
+- **動的な割り当て：** ワーカー数は固定されていない。10個のコンポーネントと5つの境界クラスターを持つリポジトリでは、28ステップ（2×10 + 5 + 3）が生成される。3個のコンポーネントを持つリポジトリでは、12ステップが生成される。スケーリングの式は、`2N + K + 3`であり、N = コンポーネント数、K = 境界数である。
+- **マニフェストに基づくパッケージ：** `audit-manifest.json`は、コンポーネント（ファイルパス、行数、説明を含む）と境界（インターフェースの説明を含む、from/to）を定義する。各監査者は、割り当てられたパッケージのみを受け取る。
+- **4つの役割のアーキタイプ：** コンポーネント監査者（モジュールごとのコードの真実）、テスト検証監査者（存在するテストではなく、証明するテスト）、境界監査者（依存関係グラフからの統合境界）、監査統合者（すべてのパッケージからのランク付けされた検証結果＋アクションプラン）。
+- **各ステップでのアーティファクトの検証：** `validateArtifact()`は、両方の実行パスの各ステップの完了時に実行される。結果は、ステップオブジェクトに添付される。システムは、各アーティファクトがその契約を満たしているかどうかを認識している。
+- **正直な部分的な結果：** 予算またはスコープが完了を妨げる場合、コンポーネントごとの結果は個別に有効である。システムは、完了したことから統合し、完全な網羅性を偽ることはない。
+**実績：** ランナーネイティブの検証ラン—実際のマニフェストに対する18のテスト、エスカレーションによる再開と部分的な失敗を含む、完全なライフサイクルが検証された。スケーリングの式は、3/6/10/15コンポーネントのマニフェストに対して検証された。
+### 社内テスト環境スウォームミッション
+1回のパスのリンターではない。社内テスト環境スウォームミッションは、**リポジトリを「動作する」状態から「本番環境で利用可能」な状態に移行させる、3つの健全性段階と反復的な機能提供を行う、複数パスの収束プロトコルを実行する。**
+```bash
+roleos swarm
+# → MISSION: Dogfood Swarm (Multi-Pass Convergence)
+#   Stages: Health-A → Health-B → Health-C → Feature → Final
+#   Domain agents: 3-5 parallel per wave (exclusive file ownership)
+```
-- **層2（生成）：** 5つの異なる人間の声（境界メモ、フィールドノート、システムスケッチ、主張概要、相互質問記録）があり、禁止語により、声の統一を防ぎます。統合は、真実の要素を使用しますが、生成された文章は使用しません。両方の層は常に利用可能です。
+**異なる点：**
-- **トレーサビリティ：** 生成されたすべての文は、真実の要素にトレースバックできます。統合の指示には、要素が引用されています。相互質問は、実際の主張IDを対象としています。意見の相違グラフは、文章ではなく、その結果です。
+- **3段階のヘルスチェック** — ステージAでは、バグやセキュリティの問題を修正します（重大な問題と高レベルの問題が0になるまで繰り返します）。ステージBでは、積極的なセキュリティ強化を実施します（ユーザーが結果を確認します）。ステージCでは、コードベースをより使いやすくします — ユーザーを支援するエラーメッセージ、再接続に関するフィードバック、読み込み中の表示、アクセシビリティの向上などを行います。各ステージは異なる目的を持ち、同じスキャンを繰り返すわけではありません。
+- **排他的なファイル所有権** — 各ドメインエージェントは、`swarm-manifest.json`を通じて特定のファイルを所有します。2つのエージェントが同じファイルを編集することはありません。マージの競合も発生しません。調整のためのオーバーヘッドも発生しません。
+- **ビルドゲート** — 各イテレーションの後に、lint、型チェック、テストを必ず実行し、すべてに合格する必要があります。システムは、ビルドシステム（Node、Rust、Python、Go）を自動的に検出し、適切なコマンドを実行します。
+- **ユーザーチェックポイント** — ヘルスチェックBと機能チェックでは、実行前にユーザーの明示的な承認が必要です。システムは結果を提示し、ユーザーがビルドする内容を決定します。
+- **反復的な収束** — 各ステージは、終了条件が満たされるか、最大イテレーション回数に達するまで、イテレーションを繰り返します。各イテレーションでは、以前の修正によって発生した問題を検出するために、最初から再監査を行います。
+- **ドメインの自動検出** — `roleos swarm manifest --generate`は、リポジトリのタイプ（CLI、Web、デスクトップ、MCP、モノリポ）を検出し、重複しないドメイン割り当てを生成します。
-**検証済み：** v0.4の理想的な実行例：894件のテスト、完全なトレーサビリティが検証済み。完全な成果物のチェーンについては、[`examples/golden-run.md`](examples/golden-run.md) を参照してください。
+**実績:** claude-collaborate (2026-03-28) — 35→129のテスト、106件のヘルスチェックの問題を修正、v1.1.0をリリース。9つのフェーズを持つプロトコルv2.0。
 ## ステータス
-- v0.1–v0.4: 基礎機能 — テスト、導入、トリートメントパック、スターターパック
-- v1.0.0: 32種類のロール、フルCLI、実績のあるトリートメント、マルチリポジトリ対応
-- v1.0.2: ロールOSのロックダウン（初期設定の修正、`init --force`コマンド）
-- v1.1.0: 31種類のロール、フルルーティング機能、競合検出、エスカレーション、証拠収集、ディスパッチ、7種類の実績のあるチームパック。35回の実行テスト。212件のテスト。
-- v1.2.0: キャリブレーションされたパックがデフォルト設定に。自動選択、不整合検出、代替案の提案、フリールーティングへのフォールバック。246件のテスト。
-- v1.3.0: 結果のキャリブレーション、タスクの細分化、複合実行、適応的な再計画。317件のテスト。
-- v1.4.0: セッション機能 — `roleos init claude`、`roleos doctor`、ルートカード、`/roleos-route`、`/roleos-review`、`/roleos-status`コマンド。335件のテスト。
-- v1.5.0: フック機能 — 実行時強制のための5つのライフサイクルフック。358件のテスト。
-- v1.6.0: アーティファクト機能 — 各ロールごとの20種類のアーティファクト契約、7種類のパックハンドオフ契約、構造検証。385件のテスト。
-- v1.7.0: 完了の検証 — 実際のタスクをフルスタックで実行。`roleos artifacts` CLI。構造的な修正に対する正直なエスカレーション。398件のテスト。
-- v1.8.0: ミッションライブラリ（フェーズS） — 6種類の名前付きミッション、実行エンジン、完了レポート。6回の実際のテストで強化。481件のテスト。
-- v1.9.0: 統合されたエントリーパス（フェーズT） — `roleos start`コマンドが、ミッション、パック、フリールーティングを自動的に選択。フォールバック機能、複合検出、エントリーパスの比較テスト。527件のテスト。
-- **v2.0.0**: ユーザーエクスペリエンス改善（フェーズU） — `roleos run`コマンドが、永続的なディスクベースの実行を作成。再開、次へ、説明、完了、失敗。介入：リルーティング、エスカレーション、再試行、ブロック、再開。各ステップでの詳細なガイダンス。摩擦の測定。6件の摩擦テスト。613件のテスト。
-- **v2.0.1**: マニュアルの監査、初心者向けドキュメント、テスト件数の修正。617件のテスト。
-- **v2.1.0**: ブレインストーミングミッション（v0.4） — 法分野に特化したロール、追跡可能な意見の相違、判決を含む出力。2層アーキテクチャ（真実性 + レンダリング）、クロスエグザム権限マトリックス、紛争グラフ、黄金の実行の検証。7種類のミッション、50種類のロール、8種類のパック。894件のテスト。
+安定しており、リリースされています。完全なバージョン履歴と、各リリースの変更点は、[CHANGELOG](CHANGELOG.md)を参照してください。
 ## ライセンス
@@ -316,4 +379,4 @@ MIT
 ---
-作成者: <a href="https://mcp-tool-shop.github.io/">MCP Tool Shop</a>
+<a href="https://mcp-tool-shop.github.io/">MCP Tool Shop</a>によってビルドされました。

package/README.md CHANGED Viewed

@@ -13,7 +13,7 @@
   <a href="https://mcp-tool-shop-org.github.io/role-os/"><img src="https://img.shields.io/badge/Landing_Page-live-brightgreen" alt="Landing Page"></a>
 </p>
-A multi-Claude operating system that staffs, routes, validates, and runs work through 61 specialized role contracts. Creates task packets, assembles the right team from scored role matching, detects broken chains before execution, auto-routes recovery when work is blocked or rejected, and requires structured evidence in every verdict. Includes dynamic dispatch for manifest-scaled missions — a 10-component repo automatically becomes 28 auditor steps, not 6. The dogfood swarm mission runs multi-pass convergence: three health stages then iterative feature delivery with exclusive file ownership and build gates.
+A multi-Claude operating system that staffs, routes, validates, and runs work through 61 specialized role contracts. Creates task packets, assembles the right team from scored role matching, detects broken chains before execution, auto-routes recovery when work is blocked or rejected, and requires structured evidence in every verdict. Includes dynamic dispatch for manifest-scaled missions — a 10-component repo automatically becomes 28 auditor steps, not 6.
 ## What it does
@@ -85,6 +85,17 @@ Runs persist to disk (`.claude/runs/`), so interrupted sessions resume cleanly.
 2. **Critic reviews against contract** — accepts, rejects, or blocks based on structured evidence, not impression
 3. **Recovery routes automatically** — blocked or rejected work gets routed to the right resolver with a reason, recovery type, and required artifact
+## Budget-aware dispatch
+Role OS can consult a local **Token Budget Analyst** for each dispatch step and attach an advisory spend forecast to the manifest — opt-in (`ROLEOS_BUDGET_CONSULT`), advisory (it never blocks a dispatch), and fail-open to a deterministic baseline. Off by default; the forecast is local and free to run. See the [handbook](https://mcp-tool-shop-org.github.io/role-os/handbook/specialist-budget/).
+## Tool-call oversight
+Role OS verifies and gates tool calls at the `PreToolUse` seam — deterministically, with no model on the hot path:
+- **Conformance watcher** (advisory, fail-open) — a deterministic schema + computable-contract floor checks a proposed call against its catalogued tool-contract and attaches an advisory verdict on a *proven* nonconformant call; it never blocks. An opt-in LLM ceiling (`ROLEOS_CONFORMANCE_CONSULT`) handles the genuinely-semantic residue.
+- **Capability gate** (fail-closed, opt-in `ROLEOS_CAPABILITY_GATE`, default OFF) — deterministic least-privilege on *irreversible* actions (npm/PyPI publish, `gh release`, `git push`, repo edits, Pages deploy). A gated action is denied unless the director granted its capability in `.claude/role-os/capabilities.json`, so a wrong step — an honest mistake or an injected one — can't trigger an unauthorized irreversible action. The preventive complement to the named-compensator rule. See the [handbook](https://mcp-tool-shop-org.github.io/role-os/handbook/).
 ## Org rollout state
 Org-wide rollout state (queue, decisions, audit records, per-repo lock packets) lives in a separate private repo: [`role-os-rollout`](https://github.com/mcp-tool-shop-org/role-os-rollout). This repo is the product; that repo is operational state.
@@ -360,23 +371,7 @@ roleos swarm
 ## Status
-- v0.1–v0.4: Foundation — trials, adoption, treatment pack, starter pack
-- v1.0.0: 32 roles, full CLI, proven treatment, multi-repo portability
-- v1.0.2: Role OS lockdown (bootstrap truth fixes, init --force)
-- v1.1.0: 31 roles, full routing spine, conflict detection, escalation, evidence, dispatch, 7 proven team packs. 35 execution trials. 212 tests.
-- v1.2.0: Calibrated packs promoted to default entry. Auto-selection, mismatch detection, alternative suggestion, free-routing fallback. 246 tests.
-- v1.3.0: Outcome calibration, mixed-task decomposition, composite execution, adaptive replanning. 317 tests.
-- v1.4.0: Session spine — `roleos init claude`, `roleos doctor`, route cards, /roleos-route + /roleos-review + /roleos-status commands. 335 tests.
-- v1.5.0: Hook spine — 5 lifecycle hooks for runtime enforcement. 358 tests.
-- v1.6.0: Artifact spine — 20 per-role artifact contracts, 7 pack handoff contracts, structural validation. 385 tests.
-- v1.7.0: Completion proof — real tasks run through the full stack. `roleos artifacts` CLI. Honest escalation on structural fixes. 398 tests.
-- v1.8.0: Mission library (Phase S) — 6 named missions, runner engine, completion reports. Hardened from 6 real trial runs. 481 tests.
-- v1.9.0: Unified entry path (Phase T) — `roleos start` auto-decides mission vs pack vs free routing. Fallback ladder, composite detection, entry-path comparison trials. 527 tests.
-- **v2.0.0**: Operator friction pass (Phase U) — `roleos run` creates persistent disk-backed runs. Resume, next, explain, complete, fail. Interventions: reroute, escalate, retry, block, reopen. Step-local guidance at every step. Friction measurement. 6 friction trials. 613 tests.
-- **v2.0.1**: Handbook audit, beginner docs, test count corrections. 617 tests.
-- **v2.1.0**: Brainstorm mission (v0.4) — specialized roles under law, traceable disagreement, verdict-bearing output. Two-layer architecture (truth + render), cross-exam permission matrix, dispute graph, golden run proof. 7 missions, 50 roles, 8 packs. 894 tests.
-- **v2.2.0**: Deep Audit mission — manifest-scaled repo audit with dynamic dispatch. 4 new audit roles (Component Auditor, Test Truth Auditor, Seam Auditor, Audit Synthesizer). Worker count scales with repo graph (2N + K + 3 formula). Artifact validation wired at both execution boundaries. Runner-native proof run green. accept/approve truth fix in evidence layer. 8 missions, 54 roles, 9 packs. 936 tests.
-- **v2.3.0**: Dogfood Swarm mission — multi-pass convergence (health-a → health-b → health-c → feature → final). 7 new swarm roles (Swarm Coordinator, 5 domain agents, Swarm Synthesizer). Two new mission primitives: waveLoops (iterative convergence) and exclusiveOwnership (domain file boundaries). Dynamic domain dispatch, build gates, `roleos swarm` CLI, domain auto-detection, evidence persistence bridge. 9 missions, 61 roles, 10 packs. 1150 tests.
+Stable and shipping. See the [CHANGELOG](CHANGELOG.md) for full version history and what changed in each release.
 ## License