@mcptoolshop/research-os 0.3.1 → 0.3.2

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
package/README.ja.md CHANGED
@@ -7,7 +7,7 @@
7
7
  </p>
8
8
 
9
9
  <p align="center">
10
- <a href="https://github.com/mcp-tool-shop-org/research-os/releases/tag/v0.1.0"><img src="https://img.shields.io/badge/version-0.1.0-blue" alt="version 0.1.0"></a>
10
+ <a href="https://github.com/mcp-tool-shop-org/research-os/releases/tag/v0.3.2"><img src="https://img.shields.io/badge/version-0.3.2-blue" alt="version 0.3.2"></a>
11
11
  <a href="https://github.com/mcp-tool-shop-org/research-os/actions/workflows/ci.yml"><img src="https://github.com/mcp-tool-shop-org/research-os/actions/workflows/ci.yml/badge.svg" alt="CI"></a>
12
12
  <a href="LICENSE"><img src="https://img.shields.io/badge/license-MIT-green" alt="MIT License"></a>
13
13
  <img src="https://img.shields.io/badge/node-%E2%89%A520-brightgreen" alt="Node ≥20">
@@ -24,7 +24,67 @@
24
24
 
25
25
  これはレポート生成ツールではありません。また、LLMのオーケストレーションのフレームワークでもありません。あなたの統合作業を自動化するものでもありません。`research-os`は、統合作業を開始するための条件を強制します。
26
26
 
27
- **v0.1は、これまでに一度だけ、自分自身に対して使用されました。** その単一の使用により、`research-os`の7つの問題点が発見され、今回の**リリース**前にすべて修正されました。その検証プロセス(7つのセッション、2つの統合パターン、463個のvitestテストケース、1つの固定されたリポジトリ)は、[`docs/dogfood-proof.md`](docs/dogfood-proof.md)に記録されています。詳細なドキュメントはこちら:<https://mcp-tool-shop-org.github.io/research-os/handbook/>。
27
+ Frozen packs(凍結されたパッケージ)は、[`mcp-tool-shop-org/research-packs`](https://github.com/mcp-tool-shop-org/research-packs)にアーカイブされており、ライブで公開されています。最初の2つのパッケージが含まれています。v1.0のロードマップについては、[`docs/roadmap.md`](docs/roadmap.md)を参照してください。
28
+
29
+ v0.1は、2つの内部テスト(dogfood)で検証されました。最初のテストでは、research-os自体の仕様を調査した結果、v0.1.0のリリース前に7つの問題点が発見され、それぞれにコード修正が必要となり、新たなルールや統合パターンが導入されました。2番目のテスト(v1 Experiment 1:ComfyUIワークフローの安定性、11セッション、research-osとの語彙の重複がない環境)は、2026年5月9日に完了し、パッケージが凍結され、アーカイブが公開され、パターン2の適用がコミット`22b5dba`によって完了しました。v0.1の検証結果は、[`docs/dogfood-proof.md`](docs/dogfood-proof.md)に、Experiment 1の検証結果は、[`docs/experiment-1-proof.md`](docs/experiment-1-proof.md)に記載されています。ハンドブックは、<https://mcp-tool-shop-org.github.io/research-os/handbook/>で確認できます。
30
+
31
+ ## インストール
32
+
33
+ **必要条件:** Node.js ≥ 20
34
+
35
+ ```bash
36
+ npm install -g @mcptoolshop/research-os
37
+ ```
38
+
39
+ ソースコードからビルドする場合:
40
+
41
+ ```bash
42
+ git clone https://github.com/mcp-tool-shop-org/research-os.git
43
+ cd research-os
44
+ npm install
45
+ npm run build
46
+ npm link
47
+ ```
48
+
49
+ ## クイックスタート
50
+
51
+ ```bash
52
+ # Create a new research-pack
53
+ research-os init "How should X be structured?"
54
+
55
+ # Add a section
56
+ research-os section add 01-landscape --purpose "Map the current landscape"
57
+
58
+ # Discover and approve sources, then gather
59
+ research-os discover run 01-landscape
60
+ research-os discover approve 01-landscape --top 8
61
+ research-os gather 01-landscape --approved
62
+
63
+ # Run the per-section chain
64
+ research-os claim extract 01-landscape
65
+ research-os claim audit-density 01-landscape
66
+ research-os claim triage 01-landscape
67
+ research-os contradict map 01-landscape --triaged-only
68
+ research-os review 01-landscape --triaged-only --preset hermes-two-pass --profile hermes-two-pass
69
+ research-os review-promote 01-landscape --profile hermes-two-pass
70
+ research-os gate 01-landscape
71
+ research-os section report 01-landscape
72
+
73
+ # Pack-level finish
74
+ research-os audit
75
+ research-os index build --all
76
+ research-os cowork handoff
77
+ research-os synth workspace # only if handoff returned synthesis_ready
78
+ research-os freeze
79
+
80
+ # Export to the research-packs archive
81
+ research-os pack publish \
82
+ --to <research-packs>/packages/<name>
83
+ ```
84
+
85
+ **具体的な使用例**については、`research-os-packs/research-os-spec/` にある「dogfood」と呼ばれるパッケージを参照してください。このパッケージには、すべてのファイル、すべての記録、すべての処理結果、すべての固定状態のフィンガープリントなどが、追記のみ可能なファイルとして保存されています。このパッケージによって、`docs/dogfood-proof.md` が生成されました。
86
+
87
+ **LLM(大規模言語モデル)の抽出、トリアージ、レビュー、および発見には、ローカルで実行されている [ollama-intern-mcp](https://github.com/mcp-tool-shop-org/ollama-intern-mcp) が必要です。** デフォルトのモデルは `hermes3:8b` です。別のモデルを使用する場合は、`OLLAMA_INTERN_MODEL=<モデル名>` で指定してください。Ollamaがデフォルトの `localhost:11434` 以外の場所で実行されている場合は、`OLLAMA_HOST` 環境変数を設定してください。
28
88
 
29
89
  ## 16の重要な原則
30
90
 
@@ -76,55 +136,6 @@ discover
76
136
 
77
137
  これは、*検索 → 要約 → 報告書作成* という従来のプロセスに対する構造的な代替手段です。このプロセス全体が「チェーン」として機能し、その結果が製品となります。
78
138
 
79
- ## インストール
80
-
81
- **必要条件:** Node.js ≥ 20
82
-
83
- ```bash
84
- # From source (v0.1.0 is not yet published to npm)
85
- git clone https://github.com/mcp-tool-shop-org/research-os.git
86
- cd research-os
87
- npm install
88
- npm run build
89
- npm link # makes `research-os` available on your PATH
90
- ```
91
-
92
- ## クイックスタート
93
-
94
- ```bash
95
- # Create a new research-pack
96
- research-os init "How should X be structured?"
97
-
98
- # Add a section
99
- research-os section add 01-landscape --purpose "Map the current landscape"
100
-
101
- # Discover and approve sources, then gather
102
- research-os discover run 01-landscape
103
- research-os discover approve 01-landscape --top 8
104
- research-os gather 01-landscape --approved
105
-
106
- # Run the per-section chain
107
- research-os claim extract 01-landscape
108
- research-os claim audit-density 01-landscape
109
- research-os claim triage 01-landscape
110
- research-os contradict map 01-landscape --triaged-only
111
- research-os review 01-landscape --triaged-only --preset hermes-two-pass --profile hermes-two-pass
112
- research-os review-promote 01-landscape --profile hermes-two-pass
113
- research-os gate 01-landscape
114
- research-os section report 01-landscape
115
-
116
- # Pack-level finish
117
- research-os audit
118
- research-os index build --all
119
- research-os cowork handoff
120
- research-os synth workspace # only if handoff returned synthesis_ready
121
- research-os freeze
122
- ```
123
-
124
- **具体的な使用例**については、`research-os-packs/research-os-spec/` にある「dogfood」と呼ばれるパッケージを参照してください。このパッケージには、すべてのファイル、すべての記録、すべての処理結果、すべての固定状態のフィンガープリントなどが、追記のみ可能なファイルとして保存されています。このパッケージによって、`docs/dogfood-proof.md` が生成されました。
125
-
126
- **LLM(大規模言語モデル)の抽出、トリアージ、レビュー、および発見には、ローカルで実行されている [ollama-intern-mcp](https://github.com/mcp-tool-shop-org/ollama-intern-mcp) が必要です。** デフォルトのモデルは `hermes3:8b` です。別のモデルを使用する場合は、`OLLAMA_INTERN_MODEL=<モデル名>` で指定してください。Ollamaがデフォルトの `localhost:11434` 以外の場所で実行されている場合は、`OLLAMA_HOST` 環境変数を設定してください。
127
-
128
139
  ## 用語集
129
140
 
130
141
  | 用語 | 意味 |
@@ -140,20 +151,37 @@ research-os freeze
140
151
 
141
152
  ## ステータス
142
153
 
154
+ **v0.3.2** — 2026年5月9日に、`@mcptoolshop/research-os@0.3.2`としてnpmに公開されました。`pack publish`の許可に関する、正規化された承認処理が実装されました。`claim-reviews.jsonl`と`pack-audit.json::accepted_claims`の厳密な一致チェックは、効果的な集合比較に置き換えられました。承認されたクレームは、最新の正当なレビュー結果が`accepted_for_synthesis`である一意の`claim_id`の集合です(`claim_id`ごとに最新の決定が優先されます)。以前の監査数が効果的な集合と異なる凍結されたパッケージは、拒否する代わりに警告を表示します。古い監査ファイルは変更せずに保持されます(ルール15)、ただし、アーカイブのマニフェストには正規化された数が反映されます。フェイクの`claim_id`、互換性のない重複した決定、および合成対象外の条件に対する拒否は引き続き適用されます。Experiment 3 XRPLパッケージのSession Kで、実際のクロージャー・レジャーの不一致により、パッケージの公開が拒否されました(セクション07には24件の`accepted_for_synthesis`の行がありましたが、重複するレビュー担当者によるため、一意の`claim_id`は19件のみでした)。558/558のvitestが成功しました。詳細については、[CHANGELOG.md](CHANGELOG.md)と[`docs/pack-publish.md`](docs/pack-publish.md)を参照してください。
155
+
156
+ **v0.3.1** — 2026年5月9日に、`@mcptoolshop/research-os@0.3.1`としてnpmに公開されました。セクションごとに適用されるソースコードの免除(`primary_source_waiver.section_waivers[]`)と、レビュー担当者による確認機能が追加されました。これにより、セクション全体で`source_cluster_monopoly`の違反が検出された場合でも、自動的にすべてのクレームを`needs_source_repair`に振り分けるのではなく、注意点として表示されるようになりました。Experiment 3 XRPLパッケージのSession 2で、canonical-protocolセクション(単一の基盤チェーン、クローズドなAPI仕様、標準化団体のドキュメント)において、パブリッシャーの多様性が真の品質の指標であるという前提が覆されました。当時、540/540のvitestが成功しました。詳細については、[`docs/section-scoped-waivers.md`](docs/section-scoped-waivers.md)を参照してください。
157
+
158
+ **セクションごとのソースコード免除** — パブリッシャーの多様性がセクションの真のソースと構造的に互換性がない場合にのみ使用します。セクションが単に十分なソースを見つけられなかった場合ではありません。スキーマによって強制される`reason`と、空でない`compensating_controls[]`が必要です。パッケージポリシー`primary_source_waiver_allowed: false`は、パッケージレベルおよびセクションごとの免除の両方をブロックします。v0.3.1以前のパッケージレベルの`min_independent_publishers: 0`の回避策は、現在非推奨です。既存の凍結されたパッケージは、既存のレシートに基づいて有効です。詳細については、[`docs/section-scoped-waivers.md`](docs/section-scoped-waivers.md)と、[research-packsオペレータープレイブック](https://github.com/mcp-tool-shop-org/research-packs/blob/main/docs/operator-playbook.md)を参照してください。
159
+
160
+ **v0.3.0** — 2026年5月9日に公開されました。`contradict map`に、`--detector <auto|heuristic|ollama-intern>`フラグが追加されました(Experiment 3 Session 1、XRPLパッケージのF-09チェーンブロッカーの修正)。当時、527/527のvitestが成功しました。検出器の選択は、以前の状態に依存する環境変数ではなく、オペレーターが明示的に選択するようになりました。モードは、実行ごとに可視化されます。詳細については、[`docs/contradict-map.md`](docs/contradict-map.md)を参照してください。
161
+
162
+ **v0.2.0** — 2026年5月9日に公開。`research-os pack publish` (実験2) と、Pattern 2 の準備状態に関する問題を修正しました。515件中515件の vitest テストが合格しました。詳細は [CHANGELOG.md](CHANGELOG.md) を参照してください。パッケージの公開は、単一のコマンドで標準の `research-packs` アーカイブにエクスポートされます。契約の遵守は、チェックリストではなくコードによって強制されます。詳細は [`docs/pack-publish.md`](docs/pack-publish.md) を参照してください。
163
+
143
164
  **v0.1.0** — 2026年5月8日に固定されました。`research-os-packs/research-os-spec/` (関連リポジトリ) にある「dogfood」パッケージでは、8つのセクションで296件の主張が承認され、17件が処理され、30件がオペレーターによって修正され、未解決の矛盾は0件、すべてのゲートで `synthesis_eligible=true` となりました。463件中463件のvitestテストが合格しました。16個の重要なルールが実装されています。詳細については、[docs/dogfood-proof.md](docs/dogfood-proof.md) を参照してください。このドキュメントには、7つの発見事項と、固定状態のフィンガープリントが記載されています。
144
165
 
166
+ **research-packs アーカイブ (モノレポ)** — [`mcp-tool-shop-org/research-packs`](https://github.com/mcp-tool-shop-org/research-packs) で公開されており、リリース時に2つのパッケージが提供されています。`comfyui-workflow-durability` (実験1、302件の承認済みクレーム、8セクション) と `research-os-self-dogfood` (v0.1 のドッグフード版、296件の承認済みクレーム、8セクション)。どちらのパッケージも `verify-pack.mjs` をパスしています。
167
+
168
+ **v1 実験1 (ComfyUI ワークフローの安定性)** — 2026年5月9日に終了。8つのセクションすべてが Terminal A で完了し、パッケージは凍結され、アーカイブは公開されました。詳細は [`docs/experiment-1-proof.md`](docs/experiment-1-proof.md) と [`docs/roadmap.md`](docs/roadmap.md) を参照してください。
169
+
145
170
  ### v0.1の制限事項
146
171
 
147
- - 外部ユーザーによる十分なテストは行われていません。初期のテストで7つのバグが見つかりました。
148
- - まだnpmには登録されていません。`npm publish` が行われるまでは、ソースコードからインストールしてください。
149
- - 合成処理を行う機能はありません。`synth workspace` コマンドは、構造化された作業環境を生成しますが、承認された主張IDに基づいて、人間(または Cowork)が文章を作成します。
150
- - APIの安定性はありません(セマンティックバージョニングに準拠していません)。外部ユーザーによる検証が完了した後、v1.0.0 がリリースされます。
172
+ - 外部ユーザーによる実証テストはまだ行われていません。2つのドッグフードテストが完了しました。1つは自己参照型、もう1つは外部ドメイン型です。実験3 (外部からのプレッシャー下での API の安定性) は現在進行中です。パッケージ #2 (XRPL クリエイタートークンの安定性) が251件の承認済みクレーム(7セクション)で凍結されており、npm v0.3.2 に対するパッケージ公開の承認を待っています。このテストでは、v0.3.0 の `--detector` フラグ (F-09 チェーンブロッカー)、v0.3.1 のセクションスコープのソースに関する免責事項 (F-10/F-11 カンニングプロトコルに関するプレッシャー)、および v0.3.2 の標準化された承認済みクレームの会計処理 (F-36 クローズジャーレッジシーム) が完了しました。実験3を完了するには、外部ドメインのパッケージがさらに1つ必要です。
173
+ - 文章生成機能はありません。`synth workspace` コマンドは構造化されたワークスペースを生成しますが、文章は人間(または Cowork)が、承認済みクレームの ID に基づいて記述します。
174
+ - セマンティックバージョニング (semver) に基づく API の安定性はありません。v1.0.0 は、カレンダーの日付ではなく、達成された状態です。詳細は [`docs/roadmap.md`](docs/roadmap.md) に記載されている、そのギャップを埋める6つの実験を参照してください。
151
175
 
152
176
  ### 既知の制限事項
153
177
 
154
- - **抽出器の信頼性情報が、ゲートの接合部分からは確認できません。** キャリブレーションされた抽出器(設定されたモデルを使用するOllama)が利用できない場合、システムはヒューリスティックに基づく代替的な方法で処理を進める可能性があります。これは既知の弱点として記録されており、今後の改善では、抽出器が提供する信頼性の高い情報と、キャリブレーションされた経路からの信頼性の高い情報の両方が必要になるように変更される予定です。
155
- - **キャリブレーションされた`hermes-two-pass`を基準とした、レビューモデルの選択に関する問題は未解決です。** 内部テストでは、特定のレビュー設定が検証されましたが、他のモデルについては、信頼できるようになる前に、意図的なエラーを再現するキャリブレーションが必要です。
156
- - **内部テストで使用されたパッケージは、抽出処理に`mistral-nemo:12b`を使用しました(標準設定は`hermes3:8b`です)。** システムは、自己参照的なセクション名に対して、誤ったドメインからの結果を生成する可能性がありましたが、クエリの精度を向上させるための対策(マニュアルを参照)と、曖昧なトピックに対するオペレーターによる事前準備されたURLを使用することで、この問題を修正しました。
178
+ - **抽出元の情報が、ゲートシームでは表示されません。** セクションは、キャリブレーションされた抽出器 (Ollama と設定されたモデル) が利用できない場合に、ヒューリスティックに基づく代替クレームに依存して、承認済みクレームの基準を満たすことができます。これは、ロードマップの実験4として記録されています。今後の改善により、承認済みクレームは抽出器ごとに報告され、基準を満たす数の承認済みクレームが、キャリブレーションされたパスから取得されるようになります。
179
+ - **キャリブレーションされた `hermes-two-pass` を基準とする、レビューモデルの選択は未解決です。** ドッグフードテストでは、1つのレビュー設定が検証されました。代替モデルは、信頼できるようになる前に、独自のシードされた失敗の再現キャリブレーションが必要です。これは、ロードマップの実験5です。
180
+ - **v0.1 の自己ドッグフードパッケージでは、抽出に `mistral-nemo:12b` が使用されました (標準のデフォルトは `hermes3:8b`)。** v0.1 のテスト期間中、この環境では `hermes3:8b` が利用できませんでした。この代替の使用に関する情報は、`hermes3` ベースの記録が作成されるまで有効です。`hermes3:8b` が利用できない環境では、`OLLAMA_INTERN_MODEL` を利用可能なモデルに設定してください。オペレーターが事前に設定した URL と、クエリの精度に関するルール (ハンドブックを参照) を使用することで、あいまいなトピックに関する誤った情報の検出を軽減できます。
181
+
182
+ ## v1.0 へのロードマップ
183
+
184
+ v1.0は、単なるリリース日ではなく、達成される状態です。v0.1からv1.0までの間に、6つの実験段階があります。これには、自己参照を含まない内部テスト(現在はComfyUIワークフローの安定性向上パックとして進行中)、`research-os pack publish`コマンドによる、標準的な`research-packs`モノレポへの自動エクスポート(実験2。実験1の手動での完了処理の後に行われる)、外部からのプレッシャーに対するAPIの安定性、抽出元の追跡機能の確立、`hermes-two-pass`を超えるレビューアの調整の一般化、そして`hermes3:8b`上でのクリーンなベースラインの実行が含まれます。実験1は、パッケージの最終版が作成される前に完了しません。これは、v0.1の内部テストが完了し、`research-packs`モノレポの最初のパッケージとしてリリースされる際に終了します。詳細な計画は、[`docs/roadmap.md`](docs/roadmap.md)に記載されています。アーキテクチャの設計は一貫して維持され、v1.0は、v0.1で検証された内容をさらに深めるものであり、以前の段階を再検討するものではありません。
157
185
 
158
186
  ## ライセンス
159
187
 
package/README.md CHANGED
@@ -7,7 +7,7 @@
7
7
  </p>
8
8
 
9
9
  <p align="center">
10
- <a href="https://github.com/mcp-tool-shop-org/research-os/releases/tag/v0.3.1"><img src="https://img.shields.io/badge/version-0.3.1-blue" alt="version 0.3.1"></a>
10
+ <a href="https://github.com/mcp-tool-shop-org/research-os/releases/tag/v0.3.2"><img src="https://img.shields.io/badge/version-0.3.2-blue" alt="version 0.3.2"></a>
11
11
  <a href="https://github.com/mcp-tool-shop-org/research-os/actions/workflows/ci.yml"><img src="https://github.com/mcp-tool-shop-org/research-os/actions/workflows/ci.yml/badge.svg" alt="CI"></a>
12
12
  <a href="LICENSE"><img src="https://img.shields.io/badge/license-MIT-green" alt="MIT License"></a>
13
13
  <img src="https://img.shields.io/badge/node-%E2%89%A520-brightgreen" alt="Node ≥20">
@@ -151,7 +151,9 @@ This is the structural alternative to *search → summarize → pretty report*.
151
151
 
152
152
  ## Status
153
153
 
154
- **v0.3.1** — published to npm as `@mcptoolshop/research-os@0.3.1`, 2026-05-09. Ships section-scoped source-floor waivers (`primary_source_waiver.section_waivers[]`) plus reviewer-side acknowledgement so a waived section-wide `source_cluster_monopoly` finding becomes a visible caveat rather than auto-routing all claims to `needs_source_repair`. Earned by Experiment 3 XRPL pack Session 2canonical-protocol sections (single-foundation chains, walled-garden API specs, standards-body docs) inverted the assumption that publisher diversity is a proxy for truth quality. 540/540 vitest passing. See [CHANGELOG.md](CHANGELOG.md) and [`docs/section-scoped-waivers.md`](docs/section-scoped-waivers.md).
154
+ **v0.3.2** — published to npm as `@mcptoolshop/research-os@0.3.2`, 2026-05-09. Ships normalized accepted-claim accounting for `pack publish` admission. The strict equality check between `claim-reviews.jsonl` and `pack-audit.json::accepted_claims` is replaced with an effective-set comparison accepted claims are unique `claim_id`s whose latest canonical review decision is `accepted_for_synthesis` (latest-decision-wins per `claim_id`). Frozen packs whose legacy audit count differs from the effective set now admit with a warning rather than refusing; the legacy audit file is preserved verbatim (Law 15) while the archive manifest reflects the normalized count. Refusal stays hard for phantom claim_ids, incompatible duplicate decisions, and non-synthesis-eligible gates. Earned by Experiment 3 XRPL pack Session Kpack publish refused on a real closure-ledger seam disagreement (Section 07 had 24 raw `accepted_for_synthesis` rows but only 19 unique `claim_id`s due to overlapping reviewer windows). 558/558 vitest passing. See [CHANGELOG.md](CHANGELOG.md) and [`docs/pack-publish.md`](docs/pack-publish.md).
155
+
156
+ **v0.3.1** — published to npm as `@mcptoolshop/research-os@0.3.1`, 2026-05-09. Ships section-scoped source-floor waivers (`primary_source_waiver.section_waivers[]`) plus reviewer-side acknowledgement so a waived section-wide `source_cluster_monopoly` finding becomes a visible caveat rather than auto-routing all claims to `needs_source_repair`. Earned by Experiment 3 XRPL pack Session 2 — canonical-protocol sections (single-foundation chains, walled-garden API specs, standards-body docs) inverted the assumption that publisher diversity is a proxy for truth quality. 540/540 vitest passing then. See [`docs/section-scoped-waivers.md`](docs/section-scoped-waivers.md).
155
157
 
156
158
  **Section-scoped source waivers** — Use them when publisher diversity is structurally incompatible with the section's truth source, not when a section merely failed to find enough sources. Schema-enforced `reason` + non-empty `compensating_controls[]`. Pack policy `primary_source_waiver_allowed: false` blocks both pack-level and section-scoped waivers. The pre-v0.3.1 pack-level `min_independent_publishers: 0` workaround is now deprecated; existing frozen packs remain valid under their existing receipts. See [`docs/section-scoped-waivers.md`](docs/section-scoped-waivers.md) and the [research-packs operator playbook](https://github.com/mcp-tool-shop-org/research-packs/blob/main/docs/operator-playbook.md).
157
159
 
@@ -167,7 +169,7 @@ This is the structural alternative to *search → summarize → pretty report*.
167
169
 
168
170
  ### What v0.3 is not
169
171
 
170
- - Not battle-tested by external users. Two dogfood arcs have closed — one self-referential, one external-domain — and Experiment 3 (API stability under external pressure) is in progress: pack #1 of 3 (XRPL creator-token durability) earned both the v0.3.0 `--detector` flag and the v0.3.1 section-scoped source waivers. Two more external-domain packs required for Experiment 3 closure.
172
+ - Not battle-tested by external users. Two dogfood arcs have closed — one self-referential, one external-domain — and Experiment 3 (API stability under external pressure) is in progress: pack #2 of 3 (XRPL creator-token durability) is frozen with 251 accepted claims across 7 sections, awaiting pack publish admission against npm v0.3.2. The arc has earned the v0.3.0 `--detector` flag (F-09 chain-blocker), the v0.3.1 section-scoped source waivers (F-10/F-11 canonical-protocol pressure), and the v0.3.2 normalized accepted-claim accounting (F-36 closure-ledger seam). One more external-domain pack required for Experiment 3 closure.
171
173
  - Not a synthesis writer. The `synth workspace` command generates the structured workspace; humans (or Cowork) write the prose against accepted claim IDs.
172
174
  - Not API-stable under semver. v1.0.0 is an earned state, not a calendar date — see [`docs/roadmap.md`](docs/roadmap.md) for the six experiments that close the gap.
173
175
 
package/README.pt-BR.md CHANGED
@@ -7,7 +7,7 @@
7
7
  </p>
8
8
 
9
9
  <p align="center">
10
- <a href="https://github.com/mcp-tool-shop-org/research-os/releases/tag/v0.1.0"><img src="https://img.shields.io/badge/version-0.1.0-blue" alt="version 0.1.0"></a>
10
+ <a href="https://github.com/mcp-tool-shop-org/research-os/releases/tag/v0.3.2"><img src="https://img.shields.io/badge/version-0.3.2-blue" alt="version 0.3.2"></a>
11
11
  <a href="https://github.com/mcp-tool-shop-org/research-os/actions/workflows/ci.yml"><img src="https://github.com/mcp-tool-shop-org/research-os/actions/workflows/ci.yml/badge.svg" alt="CI"></a>
12
12
  <a href="LICENSE"><img src="https://img.shields.io/badge/license-MIT-green" alt="MIT License"></a>
13
13
  <img src="https://img.shields.io/badge/node-%E2%89%A520-brightgreen" alt="Node ≥20">
@@ -24,7 +24,67 @@ Uma ferramenta de linha de comando (CLI) que transforma um tópico amplo em um "
24
24
 
25
25
  Não é um gerador de relatórios. Não é um framework de orquestração de LLMs (Large Language Models). Não escreve a síntese para você. Ele impõe as condições sob as quais a síntese pode começar.
26
26
 
27
- **A versão 0.1 foi usada apenas uma vez: por si só, em si mesma.** Essa única utilização identificou sete falhas na `research-os`, todas corrigidas antes desta versão. O histórico de validação sete sessões, dois padrões de integração implementados, 463 casos de teste `vitest`, um pacote finalizado — está disponível em [`docs/dogfood-proof.md`](docs/dogfood-proof.md). Manual completo: <https://mcp-tool-shop-org.github.io/research-os/handbook/>.
27
+ Os pacotes congelados são armazenados em [`mcp-tool-shop-org/research-packs`](https://github.com/mcp-tool-shop-org/research-packs)e estão disponíveis, com dois pacotes iniciais. Consulte [`docs/roadmap.md`](docs/roadmap.md) para o caminho da versão 1.0.
28
+
29
+ A versão 0.1 foi extensivamente testada em duas fases de testes internos. A primeira — em que o próprio "research-os" analisou suas próprias especificações — identificou sete inconsistências antes do lançamento da versão 0.1.0, cada uma exigindo uma correção no código e resultando em uma regra ou padrão de integração. A segunda (Experimento 1 da versão 1: durabilidade do fluxo de trabalho ComfyUI, 11 sessões, um domínio sem sobreposição de vocabulário com "research-os") foi concluída em 09 de maio de 2026: o pacote foi congelado, o arquivo está disponível e a aplicação do Padrão 2 foi concluída através do commit `22b5dba`. A documentação dos testes da versão 0.1 está disponível em [`docs/dogfood-proof.md`](docs/dogfood-proof.md); a documentação do Experimento 1 está disponível em [`docs/experiment-1-proof.md`](docs/experiment-1-proof.md). O manual está disponível em: <https://mcp-tool-shop-org.github.io/research-os/handbook/>.
30
+
31
+ ## Instalação
32
+
33
+ **Requisitos:** Node.js ≥ 20.
34
+
35
+ ```bash
36
+ npm install -g @mcptoolshop/research-os
37
+ ```
38
+
39
+ Para colaboradores que estão construindo a partir do código-fonte:
40
+
41
+ ```bash
42
+ git clone https://github.com/mcp-tool-shop-org/research-os.git
43
+ cd research-os
44
+ npm install
45
+ npm run build
46
+ npm link
47
+ ```
48
+
49
+ ## Início rápido
50
+
51
+ ```bash
52
+ # Create a new research-pack
53
+ research-os init "How should X be structured?"
54
+
55
+ # Add a section
56
+ research-os section add 01-landscape --purpose "Map the current landscape"
57
+
58
+ # Discover and approve sources, then gather
59
+ research-os discover run 01-landscape
60
+ research-os discover approve 01-landscape --top 8
61
+ research-os gather 01-landscape --approved
62
+
63
+ # Run the per-section chain
64
+ research-os claim extract 01-landscape
65
+ research-os claim audit-density 01-landscape
66
+ research-os claim triage 01-landscape
67
+ research-os contradict map 01-landscape --triaged-only
68
+ research-os review 01-landscape --triaged-only --preset hermes-two-pass --profile hermes-two-pass
69
+ research-os review-promote 01-landscape --profile hermes-two-pass
70
+ research-os gate 01-landscape
71
+ research-os section report 01-landscape
72
+
73
+ # Pack-level finish
74
+ research-os audit
75
+ research-os index build --all
76
+ research-os cowork handoff
77
+ research-os synth workspace # only if handoff returned synthesis_ready
78
+ research-os freeze
79
+
80
+ # Export to the research-packs archive
81
+ research-os pack publish \
82
+ --to <research-packs>/packages/<name>
83
+ ```
84
+
85
+ **Para um exemplo prático**, veja o pacote de teste em `research-os-packs/research-os-spec/` — todos os arquivos, todos os registros, todas as disposições, todas as "impressões digitais" do "freeze", tudo armazenado em arquivos que só podem ser adicionados. Esse pacote gerou o arquivo `docs/dogfood-proof.md`.
86
+
87
+ **Requer que o [ollama-intern-mcp](https://github.com/mcp-tool-shop-org/ollama-intern-mcp) esteja em execução localmente** para extração, triagem, revisão e descoberta de modelos de linguagem (LLM). O modelo padrão é `hermes3:8b`; você pode alterá-lo definindo a variável de ambiente `OLLAMA_INTERN_MODEL=<modelo>`. Defina a variável de ambiente `OLLAMA_HOST` se o Ollama não estiver no endereço padrão `localhost:11434`.
28
88
 
29
89
  ## As 16 leis fundamentais
30
90
 
@@ -76,55 +136,6 @@ Cada etapa é um comando de linha de comando (CLI). Cada etapa grava informaçõ
76
136
 
77
137
  Esta é a alternativa estrutural para *pesquisar → resumir → gerar relatório detalhado*. A cadeia é o produto.
78
138
 
79
- ## Instalação
80
-
81
- **Requisitos:** Node.js ≥ 20.
82
-
83
- ```bash
84
- # From source (v0.1.0 is not yet published to npm)
85
- git clone https://github.com/mcp-tool-shop-org/research-os.git
86
- cd research-os
87
- npm install
88
- npm run build
89
- npm link # makes `research-os` available on your PATH
90
- ```
91
-
92
- ## Início rápido
93
-
94
- ```bash
95
- # Create a new research-pack
96
- research-os init "How should X be structured?"
97
-
98
- # Add a section
99
- research-os section add 01-landscape --purpose "Map the current landscape"
100
-
101
- # Discover and approve sources, then gather
102
- research-os discover run 01-landscape
103
- research-os discover approve 01-landscape --top 8
104
- research-os gather 01-landscape --approved
105
-
106
- # Run the per-section chain
107
- research-os claim extract 01-landscape
108
- research-os claim audit-density 01-landscape
109
- research-os claim triage 01-landscape
110
- research-os contradict map 01-landscape --triaged-only
111
- research-os review 01-landscape --triaged-only --preset hermes-two-pass --profile hermes-two-pass
112
- research-os review-promote 01-landscape --profile hermes-two-pass
113
- research-os gate 01-landscape
114
- research-os section report 01-landscape
115
-
116
- # Pack-level finish
117
- research-os audit
118
- research-os index build --all
119
- research-os cowork handoff
120
- research-os synth workspace # only if handoff returned synthesis_ready
121
- research-os freeze
122
- ```
123
-
124
- **Para um exemplo prático**, veja o pacote de teste em `research-os-packs/research-os-spec/` — todos os arquivos, todos os registros, todas as disposições, todas as "impressões digitais" do "freeze", tudo armazenado em arquivos que só podem ser adicionados. Esse pacote gerou o arquivo `docs/dogfood-proof.md`.
125
-
126
- **Requer que o [ollama-intern-mcp](https://github.com/mcp-tool-shop-org/ollama-intern-mcp) esteja em execução localmente** para extração, triagem, revisão e descoberta de modelos de linguagem (LLM). O modelo padrão é `hermes3:8b`; você pode alterá-lo definindo a variável de ambiente `OLLAMA_INTERN_MODEL=<modelo>`. Defina a variável de ambiente `OLLAMA_HOST` se o Ollama não estiver no endereço padrão `localhost:11434`.
127
-
128
139
  ## Vocabulário
129
140
 
130
141
  | Termo | Significado |
@@ -140,24 +151,37 @@ research-os freeze
140
151
 
141
152
  ## Status
142
153
 
154
+ **v0.3.2** — Publicado no npm como `@mcptoolshop/research-os@0.3.2`, 09 de maio de 2026. Inclui a normalização das reivindicações aceitas, levando em consideração a aprovação para publicação do pacote. A verificação estrita de igualdade entre `claim-reviews.jsonl` e `pack-audit.json::accepted_claims` foi substituída por uma comparação de conjuntos efetivos — as reivindicações aceitas são os `claim_id`s únicos cuja última decisão de revisão canônica é "aceita para síntese" (a última decisão prevalece para cada `claim_id`). Pacotes congelados cuja contagem de auditoria legada difere do conjunto efetivo agora são aceitos com um aviso, em vez de serem rejeitados; o arquivo de auditoria legada é preservado integralmente (Lei 15), enquanto o manifesto do arquivo reflete a contagem normalizada. A rejeição permanece intransigente para `claim_id`s inexistentes, decisões duplicadas incompatíveis e restrições não elegíveis para síntese. Obtido através do Experimento 3 XRPL pack Session K — a publicação do pacote foi rejeitada devido a uma divergência real no registro de fechamento (a Seção 07 continha 24 linhas brutas de "aceito para síntese", mas apenas 19 `claim_id`s únicos devido a janelas de revisores sobrepostas). 558/558 testes vitest passaram. Consulte [CHANGELOG.md](CHANGELOG.md) e [`docs/pack-publish.md`](docs/pack-publish.md).
155
+
156
+ **v0.3.1** — publicado no npm como `@mcptoolshop/research-os@0.3.1`, em 09 de maio de 2026. Inclui isenções de direitos autorais de seção (`primary_source_waiver.section_waivers[]`) e um reconhecimento por parte do revisor, de modo que uma descoberta de "monopólio da fonte" em toda a seção seja um aviso visível, em vez de direcionar automaticamente todas as reclamações para "needs_source_repair". Isso foi obtido no Experimento 3, pacote XRPL, Sessão 2 — as seções do protocolo canônico (cadeias de base única, especificações de API fechadas, documentação de órgãos de padronização) inverteram a suposição de que a diversidade de publicadores é um indicador da qualidade da informação. 540/540 testes vitest passaram. Consulte [CHANGELOG.md](CHANGELOG.md) e [`docs/section-scoped-waivers.md`](docs/section-scoped-waivers.md).
157
+
158
+ **Isenções de direitos autorais por seção** — Use-as quando a diversidade de publicadores é estruturalmente incompatível com a fonte de informação da seção, e não quando uma seção simplesmente não conseguiu encontrar fontes suficientes. Inclui um campo "reason" (motivo) com validação de esquema e um array "compensating_controls" (controles compensatórios) que não pode estar vazio. A política do pacote `primary_source_waiver_allowed: false` bloqueia tanto as isenções de nível de pacote quanto as isenções de seção. O "workaround" (solução alternativa) anterior à versão 0.3.1, que permitia `min_independent_publishers: 0`, está agora obsoleto; os pacotes congelados existentes permanecem válidos sob seus recibos existentes. Consulte [`docs/section-scoped-waivers.md`](docs/section-scoped-waivers.md) e o [manual do operador do repositório "research-packs"](https://github.com/mcp-tool-shop-org/research-packs/blob/main/docs/operator-playbook.md).
159
+
160
+ **v0.3.0** — publicado em 09 de maio de 2026. Inclui a flag `--detector <auto|heuristic|ollama-intern>` no comando `contradict map` (correção F-09 do bloqueador de cadeia do Experimento 3, Sessão 1, pacote XRPL). 527/527 testes vitest passaram. A seleção do detector agora é uma escolha explícita do operador, em vez de uma dança dependente do estado com variáveis de ambiente; o modo é anunciado de forma visível em cada execução. Consulte [`docs/contradict-map.md`](docs/contradict-map.md).
161
+
162
+ **v0.2.0** — publicado em 09 de maio de 2026. Inclui o comando `research-os pack publish` (Experimento 2) e a correção do predicado de prontidão para o Padrão 2. 515/515 testes vitest passaram. Consulte [CHANGELOG.md](CHANGELOG.md). Os pacotes congelados são exportados para o repositório canônico "research-packs" com um único comando; o contrato de admissão é aplicado por código, e não por uma lista de verificação. Consulte [`docs/pack-publish.md`](docs/pack-publish.md).
163
+
143
164
  **v0.1.0** — bloqueado em 2026-05-08. O pacote de teste em `research-os-packs/research-os-spec/` (repositório relacionado) atingiu o estado de bloqueio com 296 afirmações aceitas em 8 seções, 17 dispostas, 30 substituídas por operadores, 0 bloqueadores de correção ativos, 0 contradições não resolvidas, todos os "gates" com `synthesis_eligible=true`. 463/463 testes "vitest" passaram. Dezesseis leis fundamentais foram implementadas. Consulte [`docs/dogfood-proof.md`](docs/dogfood-proof.md) para as sete descobertas e as "impressões digitais" dos registros de bloqueio.
144
165
 
166
+ **Repositório monolítico "research-packs"** — está disponível em [`mcp-tool-shop-org/research-packs`](https://github.com/mcp-tool-shop-org/research-packs), com dois pacotes iniciais. `comfyui-workflow-durability` (Experimento 1, 302 reclamações aceitas, 8 seções) e `research-os-self-dogfood` (backfill do teste interno da versão 0.1, 296 reclamações aceitas, 8 seções). Ambos os pacotes PASSAM `verify-pack.mjs`.
167
+
168
+ **Experimento 1 da versão 1 (durabilidade do fluxo de trabalho ComfyUI)** — FINALIZADO em 09 de maio de 2026. Todas as 8 seções em Terminal A, pacote congelado, arquivo disponível. Consulte [`docs/experiment-1-proof.md`](docs/experiment-1-proof.md) e [`docs/roadmap.md`](docs/roadmap.md).
169
+
145
170
  ### O que a versão 0.1 não é
146
171
 
147
- - Não foi testada por usuários externos. A única execução de teste encontrou sete bugs.
148
- - Ainda não está disponível no npm. Instale a partir do código-fonte até que a publicação no npm ocorra.
149
- - Não é um gerador de conteúdo. O comando `synth workspace` gera o ambiente de trabalho estruturado; humanos (ou Cowork) escrevem o texto em relação aos IDs das afirmações aceitas.
150
- - Não tem estabilidade de API compatível com a versão semântica. A versão 1.0.0 é um estado alcançado, não uma data no calendário — consulte [`docs/roadmap.md`](docs/roadmap.md) para os cinco experimentos que preencherão essa lacuna.
172
+ - Não testado em campo por usuários externos. Duas fases de testes internos foram concluídas — uma autorreferencial e outra de domínio externo e o Experimento 3 (estabilidade da API sob pressão externa) está em andamento: o pacote nº 2 de 3 (durabilidade do token de criador XRPL) está congelado com 251 reivindicações aceitas em 7 seções, aguardando a aprovação para publicação no npm v0.3.2. Esta fase obteve a flag v0.3.0 `--detector` (bloqueador de cadeia F-09), as renúncias de origem específicas da seção v0.3.1 (pressão do protocolo canônico F-10/F-11) e a contagem normalizada de reivindicações aceitas v0.3.2 (registro de fechamento F-36). É necessário mais um pacote de domínio externo para a conclusão do Experimento 3.
173
+ - Não é um escritor de sínteses. O comando `synth workspace` gera o ambiente de trabalho estruturado; humanos (ou Cowork) escrevem o conteúdo com base nos IDs de reivindicações aceitas.
174
+ - Não é estável em termos de API sob a semântica de versionamento. A versão v1.0.0 é um estado alcançado, não uma data no calendário consulte [`docs/roadmap.md`](docs/roadmap.md) para os seis experimentos que preenchem essa lacuna.
151
175
 
152
176
  ### Limitações conhecidas
153
177
 
154
- - **A origem do extrator não é visível na junção da porta.** Uma seção pode passar pelo limite aceitável, mesmo utilizando mecanismos de fallback heurísticos, quando o extrator calibrado (Ollama com o modelo configurado) não está disponível. Isso foi registrado como uma vulnerabilidade conhecida; as futuras melhorias reportarão as reivindicações aceitas pelo extrator e exigirão um número de reivindicações aceitas equivalente ao limite definido, provenientes do caminho calibrado.
155
- - **A seleção do modelo de revisão, além da linha de base calibrada `hermes-two-pass`, ainda não foi resolvida.** O ambiente de testes internos validou uma configuração de revisão; modelos alternativos precisam de sua própria calibração para cenários de falha simulada antes de poderem ser considerados confiáveis.
156
- - **O pacote de testes internos utilizou `mistral-nemo:12b` para a extração (o padrão é `hermes3:8b`).** O sistema apresentou alucinações, gerando resultados para domínios incorretos para nomes de seções que se referiam a si mesmas. Isso foi corrigido através de uma disciplina de precisão na consulta (ver manual) e URLs pré-definidas pelos operadores para tópicos ambíguos.
178
+ - **A origem do extrator não é visível na junção da interface.** Uma seção pode passar pelo limite de reivindicações aprovadas, mesmo que utilize reivindicações de fallback heurísticas quando o extrator calibrado (Ollama com o modelo configurado) não estiver disponível. Isso foi registrado como o Experimento 4 no roteiro; aprimoramentos futuros indicarão as reivindicações aprovadas por extrator e exigirão o número mínimo de reivindicações aprovadas do caminho calibrado.
179
+ - **A seleção do modelo de revisão além da linha de base calibrada `hermes-two-pass` não foi resolvida.** O ciclo de testes internos validou uma configuração de revisão; modelos alternativos precisam de sua própria calibração de recall de falhas simuladas antes de poderem ser confiáveis. Isso é o Experimento 5 no roteiro.
180
+ - **O pacote de testes internos v0.1 utilizou `mistral-nemo:12b` para a extração (o padrão é `hermes3:8b`).** O modelo `hermes3:8b` não estava disponível neste ambiente durante o ciclo v0.1. Essa substituição será mantida até que seja disponibilizado um modelo baseado em hermes3 — isso é o Experimento 6 no roteiro. Para operadores em ambientes sem `hermes3:8b`, defina `OLLAMA_INTERN_MODEL` para um modelo disponível; URLs pré-configuradas pelo operador e disciplina na precisão das consultas (consulte o manual) ajudam a mitigar alucinações em tópicos ambíguos.
157
181
 
158
182
  ## Roteiro para a versão 1.0
159
183
 
160
- A versão 1.0 é um estado alcançado, não uma data de lançamento. Cinco experimentos estão em andamento entre a versão 0.1 e a versão 1.0: estabilidade da API sob pressão externa, um pacote de testes internos que não se refere a si mesmo, fechamento da lacuna de rastreabilidade do extrator, generalização da calibração do revisor além do `hermes-two-pass` e uma execução de linha de base limpa no `hermes3:8b`. O plano completo está disponível em [`docs/roadmap.md`](docs/roadmap.md). A arquitetura permanece fixa; a versão 1.0 aprofunda o que a versão 0.1 demonstrou, em vez de reabri-lo.
184
+ A versão v1.0 é um estado alcançado, não uma data de lançamento. Seis experimentos estão em andamento entre as versões v0.1 e v1.0 testes internos não de referência (atualmente em andamento como o pacote de durabilidade do fluxo de trabalho ComfyUI), um comando `research-os pack publish` que automatiza a exportação para o monorepository canônico `research-packs` (Experimento 2, com escopo definido após a conclusão manual do Experimento 1), estabilidade da API sob pressão externa, fechamento da lacuna de rastreabilidade do extrator, generalização da calibração do revisor além de `hermes-two-pass` e uma execução de linha de base limpa em `hermes3:8b`. O Experimento 1 não está concluído no momento do congelamento do pacote; ele é finalizado quando o pacote congelado é lançado como o primeiro pacote no monorepository `research-packs`, juntamente com o pacote de testes internos da versão v0.1. O plano completo está em [`docs/roadmap.md`](docs/roadmap.md). A arquitetura permanece bloqueada; a versão v1.0 aprofunda o que a versão v0.1 comprovou, em vez de reabri-lo.
161
185
 
162
186
  ## Licença
163
187