@mcptoolshop/research-os 0.3.1 → 0.3.3

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
package/README.it.md CHANGED
@@ -7,7 +7,7 @@
7
7
  </p>
8
8
 
9
9
  <p align="center">
10
- <a href="https://github.com/mcp-tool-shop-org/research-os/releases/tag/v0.1.0"><img src="https://img.shields.io/badge/version-0.1.0-blue" alt="version 0.1.0"></a>
10
+ <a href="https://github.com/mcp-tool-shop-org/research-os/releases/tag/v0.3.3"><img src="https://img.shields.io/badge/version-0.3.3-blue" alt="version 0.3.3"></a>
11
11
  <a href="https://github.com/mcp-tool-shop-org/research-os/actions/workflows/ci.yml"><img src="https://github.com/mcp-tool-shop-org/research-os/actions/workflows/ci.yml/badge.svg" alt="CI"></a>
12
12
  <a href="LICENSE"><img src="https://img.shields.io/badge/license-MIT-green" alt="MIT License"></a>
13
13
  <img src="https://img.shields.io/badge/node-%E2%89%A520-brightgreen" alt="Node ≥20">
@@ -16,77 +16,34 @@
16
16
 
17
17
  # research-os
18
18
 
19
- Un'interfaccia a riga di comando (CLI) che trasforma un argomento aperto in un **pacchetto di ricerca strutturato** un repository organizzato in cui Claude, Cowork o un sistema simile possono lavorare per ore senza generare informazioni errate o distorcere l'indagine.
19
+ Un'interfaccia a riga di comando (CLI) che trasforma un argomento di ricerca in un "**pacchetto di ricerca**" strutturato, ovvero un repository organizzato in cui Claude, Cowork o un sistema simile possono lavorare per ore senza generare risultati errati o superficiali.
20
20
 
21
21
  ## Cos'è
22
22
 
23
- `research-os` è il sistema di controllo tra "Voglio fare ricerche su X" e una base di dati di prove consolidata e tracciabile. Separa le ipotesi iniziali dalla raccolta delle prove, l'estrazione dei dati dalla verifica delle affermazioni, il rilevamento delle contraddizioni dalla loro risoluzione e le decisioni di revisione dalle conclusioni. Ogni fase scrive su un registro immutabile; ogni valutazione di idoneità viene calcolata in base a tali registri, e non è una semplice affermazione.
23
+ `research-os` è il livello di controllo che interviene tra la richiesta "Voglio ricercare X" e una base di dati strutturata e verificabile. Separa le ipotesi iniziali dalle prove raccolte, l'estrazione dei dati dalle affermazioni verificate, il rilevamento delle contraddizioni dalla loro risoluzione e le decisioni di revisione dalle conclusioni finali. Ogni passaggio viene registrato in un registro immutabile; ogni valutazione di disponibilità è calcolata a partire da questi registri, e non è una semplice affermazione.
24
24
 
25
- Non è un generatore di report. Non è un framework di orchestrazione di modelli linguistici di grandi dimensioni (LLM). Non scrive la sintesi per te. Impone le condizioni necessarie per l'inizio della sintesi.
25
+ Non è un generatore di report. Non è un framework per l'orchestrazione di modelli linguistici di grandi dimensioni (LLM). Non scrive la sintesi per te. Impone le condizioni necessarie per l'inizio della sintesi.
26
26
 
27
- **La versione 0.1 è stata utilizzata una sola volta: da sola, su se stessa.** Questa singola iterazione ha rilevato sette errori in `research-os`, tutti corretti prima di questa versione. La documentazione del processo — sette sessioni, due modelli di integrazione implementati, 463 test unitari, un pacchetto consolidato — è disponibile in [`docs/dogfood-proof.md`](docs/dogfood-proof.md). Manuale online: <https://mcp-tool-shop-org.github.io/research-os/handbook/>.
27
+ I pacchetti finalizzati vengono archiviati in [`mcp-tool-shop-org/research-packs`](https://github.com/mcp-tool-shop-org/research-packs) e sono disponibili, con due pacchetti iniziali. Consultare [`docs/roadmap.md`](docs/roadmap.md) per la roadmap della versione 1.0.
28
28
 
29
- ## Le 16 leggi fondamentali
30
-
31
- | # | Legge |
32
- |---|-----|
33
- | 1 | Nessuna sintesi prima della verifica delle fonti. |
34
- | 2 | La raccolta è una prova; l'estrazione è un'interpretazione. |
35
- | 3 | I modelli possono interpretare porzioni di testo originale; non possono creare porzioni di testo che costituiscono una prova. |
36
- | 4 | L'estrazione può produrre un eccesso di informazioni; la sintesi non può ereditare questa abbondanza. |
37
- | 5 | La mappatura delle contraddizioni evidenzia le discrepanze; non le risolve, non le sintetizza e non decide quale affermazione è corretta. |
38
- | 6 | I controlli determinano se una sezione è idonea per la sintesi. Non eseguono la sintesi né nascondono i fallimenti. |
39
- | 7 | La revisione critica valuta l'integrità della ricerca. Non esegue la sintesi né riscrive il testo originale. |
40
- | 8 | L'indicizzazione rende la ricerca di informazioni basata su prove possibile. Non crea nuove informazioni né diventa la fonte ufficiale. |
41
- | 9 | La funzione di trasferimento a Cowork genera istruzioni operative a partire dalle informazioni verificate. Non crea informazioni né aggira i controlli. |
42
- | 10 | L'ambiente di lavoro per la sintesi organizza le informazioni verificate per Cowork. Non esegue la sintesi né aggira la modalità di trasferimento. |
43
- | 11 | L'audit del pacchetto aggrega le informazioni verificate esistenti. Non crea nuove informazioni né nasconde le prove a livello di sezione. |
44
- | 12 | La fase di scoperta propone spunti; solo la raccolta produce prove. |
45
- | 13 | Un revisore non è considerato affidabile finché non vengono dimostrati dei fallimenti e la sua capacità di rilevarli. |
46
- | 14 | L'abbondanza di affermazioni non è sinonimo di qualità della ricerca. Le affermazioni devono essere verificate prima di poter essere considerate per la sintesi. |
47
- | 15 | La fase di consolidamento blocca le informazioni verificate. Non completa la ricerca incompleta né converte lo stato di riparazione in prove. |
48
- | 16 | Le eccezioni allentano i vincoli delle fonti; non possono creare prove. |
49
-
50
- **Legge 3** — il modello linguistico non crea mai il testo delle prove. `research-os` crea un registro di estratti deterministico (con ID stabili come `ex_<source_id_hex>_001`); il modello linguistico seleziona gli ID degli estratti; `research-os` copia il testo letterale. La classe di errore "parafrasi come citazione" è strutturalmente impossibile.
51
-
52
- **Legge 14** — tra l'estrazione e la revisione, `research-os claim triage` deduplica, limita il contributo per fonte e mette da parte i candidati meno promettenti. La fase di triage NON modifica `claims.jsonl`; le affermazioni messe da parte rimangono nel registro principale.
53
-
54
- ## La sequenza di lavoro della versione 0.1
55
-
56
- ```
57
- discover
58
- → gather
59
- → claim extract
60
- → claim audit-density
61
- → claim triage
62
- → contradict map
63
- → contradict resolve
64
- → review
65
- → review-promote
66
- → gate
67
- → section report
68
- → audit
69
- → index build
70
- → cowork handoff
71
- → synth workspace
72
- → freeze
73
- ```
74
-
75
- Ogni passaggio è un comando da riga di comando. Ogni passaggio scrive su artefatti che possono essere solo aggiunti, non modificati. Nessun passaggio sintetizza, risolve o crea nuove verità; questi vincoli sono applicati, non considerati come affidabili. La fase di revisione accetta, rifiuta o richiede modifiche alle proposte; la fase di "gate" utilizza queste decisioni per calcolare l'idoneità alla sintesi; la fase di "freeze" è il blocco finale di integrità che impedisce di considerare un pacchetto come completato a meno che tutti i livelli non siano d'accordo. Consultare il file [docs/dogfood-proof.md](docs/dogfood-proof.md) per la documentazione della versione 0.1 che dimostra la coerenza dell'intera catena.
76
-
77
- Questa è un'alternativa strutturale a *ricerca → riepilogo → report dettagliato*. La catena è il prodotto.
29
+ La versione 0.1 è stata testata in due cicli di "dogfooding". Il primo, che consisteva nella ricerca sulla propria specifica, ha identificato sette errori prima del rilascio della versione 0.1.0, ognuno dei quali ha richiesto una correzione del codice e ha portato all'implementazione di una regola o di un modello di integrazione. Il secondo (Esperimento 1: Durabilità del flusso di lavoro ComfyUI, 11 sessioni, un dominio senza sovrapposizioni lessicali con research-os) è stato completato il 2026-05-09: il pacchetto è stato finalizzato e l'archivio è attivo; l'applicazione della regola 2 è stata completata tramite il commit `22b5dba`. La documentazione del test della versione 0.1 è disponibile in [`docs/dogfood-proof.md`](docs/dogfood-proof.md); la documentazione dell'Esperimento 1 è disponibile in [`docs/experiment-1-proof.md`](docs/experiment-1-proof.md). La guida completa è disponibile all'indirizzo: <https://mcp-tool-shop-org.github.io/research-os/handbook/>.
78
30
 
79
31
  ## Installazione
80
32
 
81
33
  **Requisiti:** Node.js ≥ 20.
82
34
 
83
35
  ```bash
84
- # From source (v0.1.0 is not yet published to npm)
36
+ npm install -g @mcptoolshop/research-os
37
+ ```
38
+
39
+ Per i contributori che costruiscono il software partendo dal codice sorgente:
40
+
41
+ ```bash
85
42
  git clone https://github.com/mcp-tool-shop-org/research-os.git
86
43
  cd research-os
87
44
  npm install
88
45
  npm run build
89
- npm link # makes `research-os` available on your PATH
46
+ npm link
90
47
  ```
91
48
 
92
49
  ## Guida rapida
@@ -119,45 +76,114 @@ research-os index build --all
119
76
  research-os cowork handoff
120
77
  research-os synth workspace # only if handoff returned synthesis_ready
121
78
  research-os freeze
79
+
80
+ # Export to the research-packs archive
81
+ research-os pack publish \
82
+ --to <research-packs>/packages/<name>
83
+ ```
84
+
85
+ **Per un esempio pratico**, consultare il pacchetto di test `research-os-packs/research-os-spec/`, che contiene tutti gli elementi, le ricevute, le valutazioni, le "impronte digitali" e le registrazioni, tutti memorizzati in registri immutabili. Questo pacchetto ha generato la documentazione `docs/dogfood-proof.md`.
86
+
87
+ **Richiede [ollama-intern-mcp](https://github.com/mcp-tool-shop-org/ollama-intern-mcp) in esecuzione localmente** per l'estrazione, la classificazione, la revisione e la scoperta tramite LLM. Il modello predefinito è `hermes3:8b`; è possibile sovrascriverlo impostando la variabile d'ambiente `OLLAMA_INTERN_MODEL=<modello>`. Impostare la variabile `OLLAMA_HOST` se Ollama non è in esecuzione sull'indirizzo predefinito `localhost:11434`.
88
+
89
+ ## Le 16 regole fondamentali
90
+
91
+ | # | Regola |
92
+ |---|-----|
93
+ | 1 | Nessuna sintesi prima della verifica delle fonti. |
94
+ | 2 | La raccolta di dati è una prova; l'estrazione è un'interpretazione. |
95
+ | 3 | I modelli possono interpretare porzioni di testo originale, ma non possono creare nuove prove. |
96
+ | 4 | L'estrazione può produrre un eccesso di dati; la sintesi non deve necessariamente includere tutti i dati estratti. |
97
+ | 5 | La mappatura delle contraddizioni evidenzia le discrepanze, ma non le risolve, non le sintetizza e non determina quale affermazione sia corretta. |
98
+ | 6 | I "gate" decidono se una sezione è idonea per la sintesi. Non eseguono la sintesi né nascondono i fallimenti. |
99
+ | 7 | La revisione critica valuta l'integrità della ricerca. Non esegue la sintesi né riscrive le fonti originali. |
100
+ | 8 | L'indicizzazione rende la ricerca di informazioni più semplice. Non crea nuove informazioni e non diventa la fonte ufficiale. |
101
+ | 9 | Il trasferimento di informazioni a Cowork traduce le istruzioni operative a partire dalle informazioni verificate. Non crea nuove informazioni e non aggira i "gate". |
102
+ | 10 | L'area di lavoro per la sintesi organizza le informazioni verificate per Cowork. Non esegue la sintesi e non aggira la modalità di trasferimento. |
103
+ | 11 | L'audit del pacchetto raccoglie le informazioni verificate esistenti. Non crea nuove informazioni e non nasconde le prove a livello di sezione. |
104
+ | 12 | La scoperta propone nuove piste di ricerca; solo la raccolta di dati produce prove. |
105
+ | 13 | Un revisore non è considerato affidabile finché non vengono dimostrate delle lacune e la sua capacità di rilevarle. |
106
+ | 14 | L'abbondanza di affermazioni non equivale a qualità della ricerca. Le affermazioni devono essere valutate prima di poter essere considerate per la sintesi. |
107
+ | 15 | La funzione "freeze" blocca la ricerca completata e valida. Non completa la ricerca incompleta né trasforma uno stato di "in riparazione" in una prova. |
108
+ | 16 | Le eccezioni (waivers) allentano i vincoli sulle fonti; non possono essere utilizzate per fabbricare prove. |
109
+
110
+ **Legge 3** — il modello linguistico (LLM) non genera mai il testo delle prove. Il sistema "research-os" crea un registro deterministico degli estratti (con ID stabili come `ex_<id_esadecimale_della_fonte>_001`); l'LLM seleziona gli ID degli estratti; "research-os" copia il testo letterale. La classe di errore "parafrasi come citazione" è strutturalmente impossibile.
111
+
112
+ **Legge 14** — tra l'estrazione e la revisione, "research-os claim triage" elimina le duplicazioni, limita il contributo per fonte e mette in attesa le candidature meno promettenti. Il triage NON modifica il file `claims.jsonl`; le affermazioni messe in attesa rimangono nel registro principale.
113
+
114
+ ## La catena di flusso di lavoro v0.1
115
+
116
+ ```
117
+ discover
118
+ → gather
119
+ → claim extract
120
+ → claim audit-density
121
+ → claim triage
122
+ → contradict map
123
+ → contradict resolve
124
+ → review
125
+ → review-promote
126
+ → gate
127
+ → section report
128
+ → audit
129
+ → index build
130
+ → cowork handoff
131
+ → synth workspace
132
+ → freeze
122
133
  ```
123
134
 
124
- **Per un esempio pratico**, consultare il pacchetto di test interno in `research-os-packs/research-os-spec/` ogni artefatto, ogni ricevuta, ogni decisione, ogni "impronta" della fase di "freeze", tutto memorizzato su disco in registri che consentono solo l'aggiunta di dati. Questo pacchetto ha generato il file `docs/dogfood-proof.md`.
135
+ Ogni passaggio è un comando della riga di comando (CLI). Ogni passaggio scrive su file che possono essere solo aggiunti (append-only). Nessun passaggio sintetizza, risolve o crea nuove verità; questi vincoli sono applicati, non affidati. La revisione accetta, rifiuta o richiede una correzione delle affermazioni candidate; il "gate" utilizza queste decisioni di revisione per calcolare l'"idoneità alla sintesi"; la funzione "freeze" è il blocco finale di integrità che rifiuta di contrassegnare un pacchetto come completato a meno che tutti i livelli non siano d'accordo. Consultare [docs/dogfood-proof.md](docs/dogfood-proof.md) per la prova della catena v0.1, che ne garantisce la coerenza end-to-end.
125
136
 
126
- **Richiede [ollama-intern-mcp](https://github.com/mcp-tool-shop-org/ollama-intern-mcp) in esecuzione localmente** per l'estrazione, la classificazione, la revisione e la scoperta tramite modelli linguistici di grandi dimensioni (LLM). Il modello predefinito è `hermes3:8b`; è possibile specificarne uno diverso con la variabile d'ambiente `OLLAMA_INTERN_MODEL=<modello>`. Impostare la variabile `OLLAMA_HOST` se Ollama non è in esecuzione sull'indirizzo predefinito `localhost:11434`.
137
+ Questa è l'alternativa strutturale a *ricerca riepilogo report dettagliato*. La catena è il prodotto.
127
138
 
128
- ## Terminologia
139
+ ## Vocabolario
129
140
 
130
141
  | Termine | Significato |
131
142
  |------|---------|
132
- | `research-os` | Il piano di controllo / la riga di comando / le fasi di controllo / la legge di orchestrazione (questo repository) |
133
- | `research-pack` | L'artefatto del repository generato per uno specifico progetto di ricerca |
143
+ | `research-os` | Il piano di controllo / CLI / gate / legge di orchestrazione (questo repository) |
144
+ | `research-pack` | L'artefatto del repository generato per uno sforzo di ricerca |
134
145
  | `research section` | Un'unità di indagine delimitata all'interno di un pacchetto |
135
- | `research receipt` | Dimostra che una sezione ha superato i controlli di origine/affermazione/fase di controllo |
146
+ | `research receipt` | Prova che una sezione ha superato i controlli di fonte/affermazione/gate |
136
147
 
137
148
  ## Sicurezza
138
149
 
139
- `research-os` è uno strumento da riga di comando che opera principalmente localmente. Legge e scrive file all'interno della directory del pacchetto di ricerca specificata e, quando si utilizza il comando `gather`, invia richieste HTTP in uscita per recuperare gli URL di origine forniti. Non esegue un server, non accetta connessioni in entrata, non memorizza credenziali e non invia dati di telemetria. Nessun segreto viene scritto negli artefatti del pacchetto. Consultare il file [SECURITY.md](SECURITY.md) per le informazioni sulla segnalazione di vulnerabilità.
150
+ `research-os` è un'interfaccia a riga di comando (CLI) locale. Legge e scrive file all'interno della directory del pacchetto di ricerca a cui la si indica e, quando si utilizza la funzione "gather", effettua richieste HTTP in uscita per recuperare gli URL delle fonti fornite. Non esegue un server, non accetta connessioni in entrata, non memorizza credenziali invia dati di telemetria. Nessun segreto viene scritto negli artefatti del pacchetto. Consultare [SECURITY.md](SECURITY.md) per la politica di segnalazione delle vulnerabilità.
140
151
 
141
152
  ## Stato
142
153
 
143
- **v0.1.0** — bloccato il 2026-05-08. Il pacchetto di test interno in `research-os-packs/research-os-spec/` (repository correlato) ha raggiunto la fase di blocco con 296 affermazioni accettate in 8 sezioni, 17 considerate complete, 30 modificate dagli operatori, 0 blocchi di riparazione attivi, 0 contraddizioni irrisolte e tutti i controlli con `synthesis_eligible=true`. 463 test su 463 superati. Sedici regole fondamentali implementate. Consultare il file [`docs/dogfood-proof.md`](docs/dogfood-proof.md) per i sette risultati e le "impronte" delle ricevute della fase di blocco.
154
+ **v0.3.3** — Pubblicata su npm come `@mcptoolshop/research-os@0.3.3` il 10 maggio 2026. Include miglioramenti nella chiarezza delle semantiche delle "gate", ottenuti grazie al Pack-3 (durabilità dell'esportazione/runtime di Godot, Esperimento 3, pacchetto n. 3 su 3). L'output della "gate" ora include il publisher e i conteggi specifici della sezione, oltre ai conteggi globali del pacchetto (F-43); la dicitura di `no_source_cluster_monopoly` è stata modificata da AVVISO a diagnostica informativa (F-41). **Il comportamento di successo/fallimento rimane invariato; i pacchetti esistenti vengono verificati byte per byte.** 570 test vitest su 570 superati. Consultare [CHANGELOG.md](CHANGELOG.md) e [`docs/section-scoped-waivers.md`](docs/section-scoped-waivers.md).
155
+
156
+ **v0.3.2** — Pubblicata su npm come `@mcptoolshop/research-os@0.3.2` il 9 maggio 2026. Include una contabilizzazione normalizzata delle richieste accettate, tenendo conto dell'ammissione per la "pubblicazione del pacchetto". Il controllo di uguaglianza rigoroso tra `claim-reviews.jsonl` e `pack-audit.json::accepted_claims` è stato sostituito con un confronto di insiemi, in cui le richieste accettate sono rappresentate da `claim_id` univoci la cui ultima decisione di revisione canonica è "accettata per la sintesi" (l'ultima decisione prevale per ogni `claim_id`). I pacchetti "congelati" la cui cronologia delle revisioni differisce dall'insieme normalizzato vengono ora ammessi con un avviso anziché essere rifiutati; il file di revisione precedente viene conservato integralmente (Legge 15), mentre il manifest dell'archivio riflette il conteggio normalizzato. Il rifiuto rimane assoluto per gli `claim_id` fantasma, le decisioni duplicate incompatibili e le "gate" non idonee per la sintesi. Ottenuto grazie all'esperimento 3 XRPL, pacchetto Session K: la pubblicazione del pacchetto è stata rifiutata a causa di una reale discrepanza nel registro di chiusura (la sezione 07 conteneva 24 righe "accettate per la sintesi", ma solo 19 `claim_id` univoci a causa delle sovrapposizioni negli intervalli di revisione). 558 test vitest su 558 superati. Consultare [CHANGELOG.md](CHANGELOG.md) e [`docs/pack-publish.md`](docs/pack-publish.md).
157
+
158
+ **v0.3.1** — pubblicato su npm come `@mcptoolshop/research-os@0.3.1`, 9 maggio 2026. Include eccezioni specifiche per sezione per le fonti (`primary_source_waiver.section_waivers[]`) e un'approvazione da parte del revisore, in modo che una scoperta di "monopolio del cluster di fonti" a livello di sezione diventi un avvertimento visibile anziché indirizzare automaticamente tutte le affermazioni a "needs_source_repair". Ottenuto con l'esperimento 3 del pacchetto XRPL, sessione 2 — le sezioni relative al protocollo canonico (catene con una singola base, specifiche API a "giardino chiuso", documentazione di organismi di standardizzazione) hanno invertito l'assunzione che la diversità degli editori sia un indicatore della qualità della verità. 540/540 test vitest superati. Consultare [CHANGELOG.md](CHANGELOG.md) e [`docs/section-scoped-waivers.md`](docs/section-scoped-waivers.md).
159
+
160
+ **Eccezioni specifiche per sezione per le fonti** — Utilizzarle quando la diversità degli editori è strutturalmente incompatibile con la fonte di verità della sezione, non quando una sezione semplicemente non è riuscita a trovare abbastanza fonti. Schema con `reason` (motivo) e `compensating_controls[]` (controlli compensativi) obbligatori. La policy del pacchetto `primary_source_waiver_allowed: false` blocca sia le eccezioni a livello di pacchetto che quelle specifiche per sezione. Il workaround precedente alla v0.3.1, `min_independent_publishers: 0`, è ora obsoleto; i pacchetti "frozen" esistenti rimangono validi con le ricevute esistenti. Consultare [`docs/section-scoped-waivers.md`](docs/section-scoped-waivers.md) e il [manuale operativo dei pacchetti di ricerca](https://github.com/mcp-tool-shop-org/research-packs/blob/main/docs/operator-playbook.md).
161
+
162
+ **v0.3.0** — pubblicata il 2026-05-09. È stato introdotto il flag `--detector <auto|heuristic|ollama-intern>` in `contradict map` (correzione F-09 del blocco della catena proveniente dalla Sessione 1 dell'Esperimento 3, pacchetto XRPL). 527 test vitest superati. La selezione del rilevatore è ora una scelta esplicita da parte dell'operatore, invece di una dipendenza dallo stato e da variabili d'ambiente; la modalità viene visualizzata in modo chiaro ad ogni esecuzione. Consultare [`docs/contradict-map.md`](docs/contradict-map.md).
163
+
164
+ **v0.2.0** — pubblicata il 2026-05-09. Sono stati distribuiti il pacchetto `research-os pack publish` (Esperimento 2) e la correzione del predicato di prontezza del Pattern 2. 515 test vitest superati. Consultare [CHANGELOG.md](CHANGELOG.md). I pacchetti con stato finale vengono esportati nell'archivio canonico `research-packs` con un singolo comando; l'accordo contrattuale viene applicato tramite codice, non tramite una checklist. Consultare [`docs/pack-publish.md`](docs/pack-publish.md).
165
+
166
+ **v0.1.0** — pacchetto di test interno bloccato l'8 maggio 2026. Il pacchetto in `research-os-packs/research-os-spec/` (repository correlato) ha raggiunto lo stato finale con 296 affermazioni accettate in 8 sezioni, 17 risolte, 30 sovrascritte dall'operatore, 0 blocchi di riparazione attivi, 0 contraddizioni irrisolte, con tutte le condizioni (`synthesis_eligible=true`) soddisfatte. Sono state implementate sedici leggi fondamentali. Consultare [`docs/dogfood-proof.md`](docs/dogfood-proof.md) per i sette risultati e le informazioni sull'identificazione dello stato finale.
167
+
168
+ **Archivio monorepo dei pacchetti di ricerca** — disponibile su [`mcp-tool-shop-org/research-packs`](https://github.com/mcp-tool-shop-org/research-packs) con due pacchetti disponibili fin dal primo giorno. `comfyui-workflow-durability` (Esperimento 1, 302 affermazioni accettate, 8 sezioni) e `research-os-self-dogfood` (backfill v0.1 per i test interni, 296 affermazioni accettate, 8 sezioni). Entrambi i pacchetti superano il test `verify-pack.mjs`.
169
+
170
+ **Esperimento 1 (Durabilità del flusso di lavoro ComfyUI)** — CHIUSO il 9 maggio 2026. Tutte le 8 sezioni in Terminal A, pacchetto bloccato, archivio disponibile. Consultare [`docs/experiment-1-proof.md`](docs/experiment-1-proof.md) e [`docs/roadmap.md`](docs/roadmap.md).
144
171
 
145
- ### Cosa la versione 0.1 non è
172
+ ### Cosa la versione 0.3 non è
146
173
 
147
- - Non è stata testata da utenti esterni. Il singolo test interno ha rilevato sette bug.
148
- - Non è ancora disponibile su npm. Installare dal codice sorgente fino a quando non verrà eseguita la pubblicazione su npm.
149
- - Non è uno strumento per la generazione automatica di codice. Il comando `synth workspace` genera l'ambiente di lavoro strutturato; gli utenti (o Cowork) scrivono il testo in base agli ID delle affermazioni accettate.
150
- - Non ha una stabilità dell'API conforme alla versione semantica. La versione 1.0.0 è uno stato da raggiungere, non una data specifica; consultare il file [`docs/roadmap.md`](docs/roadmap.md) per i cinque esperimenti che colmano questa lacuna.
174
+ - Non testato in condizioni reali da utenti esterni. Tre cicli di test interni sono stati completati: uno autoreferenziale e due relativi a domini esterni. L'esperimento 3 (stabilità dell'API sotto pressione esterna) è **STATO CHIUSO il 10 maggio 2026**: tutti e tre i pacchetti (ComfyUI, XRPL, Godot) hanno raggiunto la fase di "congelamento" senza modifiche disruptive all'interfaccia a riga di comando (CLI) v0.3.x. Questi cicli di test hanno portato a: v0.3.0 `--detector` (F-09), v0.3.1 gestione delle eccezioni specifiche per sezione (F-10/F-11), v0.3.2 contabilizzazione normalizzata delle richieste accettate (F-36) e v0.3.3 chiarezza delle semantiche delle "gate" (F-43/F-41).
175
+ - Non è uno strumento per la scrittura di sintesi. Il comando `synth workspace` genera l'ambiente di lavoro strutturato; gli esseri umani (o Cowork) scrivono il testo in relazione agli `claim_id` accettati.
176
+ - Non è stabile per quanto riguarda la compatibilità delle API secondo il sistema semantico. La versione 1.0.0 è uno stato da raggiungere, non una data specifica; consultare [`docs/roadmap.md`](docs/roadmap.md) per i sei esperimenti che porteranno a questo risultato.
151
177
 
152
178
  ### Limitazioni note
153
179
 
154
- - **L'origine dell'estrazione non è visibile nella cucitura del gateway.** Una sezione può superare la soglia accettabile, facendo affidamento su meccanismi di fallback euristici, quando l'estrazione calibrata (Ollama con il modello configurato) non è disponibile. Questo è stato registrato come una vulnerabilità nota; le future implementazioni di sicurezza segnaleranno le richieste accettate dall'estrazione e richiederanno un numero di richieste accettate pari alla soglia, provenienti dal percorso calibrato.
155
- - **La selezione del modello di revisione, al di della baseline calibrata `hermes-two-pass`, non è ancora risolta.** Il ciclo di test interno ha validato una configurazione di revisore; altri modelli devono essere sottoposti a una calibrazione specifica per scenari di errore simulati prima di poter essere considerati affidabili.
156
- - **Il pacchetto di test interno ha utilizzato `mistral-nemo:12b` per l'estrazione (l'impostazione predefinita standard è `hermes3:8b`).** Il sistema ha generato risultati errati per nomi di sezioni che facevano riferimento a domini non corretti; questo è stato corretto tramite una disciplina di precisione delle query (vedere il manuale) e tramite l'utilizzo di URL preconfigurati dagli operatori per argomenti ambigui.
180
+ - **L'origine dei dati estratti non è visibile al livello di connessione.** Una sezione può superare la soglia delle affermazioni accettate facendo affidamento su affermazioni basate su euristiche quando l'estrazione calibrata (Ollama con il modello configurato) non è disponibile. Questo è stato registrato come Esperimento 4 nella roadmap; le future ottimizzazioni mostreranno le affermazioni accettate per ogni strumento di estrazione e richiederanno il numero di affermazioni accettate derivanti dal percorso calibrato.
181
+ - **La selezione del modello di revisione oltre al modello di riferimento calibrato `hermes-two-pass` non è ancora risolta.** Il ciclo di test interni ha validato una configurazione del revisore; modelli alternativi devono essere sottoposti a una calibrazione specifica per la rilevazione di errori prima di poter essere considerati affidabili. Questo è l'Esperimento 5 nella roadmap.
182
+ - **Il pacchetto di test interni v0.1 ha utilizzato `mistral-nemo:12b` per l'estrazione (il valore predefinito canonico è `hermes3:8b`).** `hermes3:8b` non era disponibile su questo sistema durante il ciclo v0.1. Questa dichiarazione di sostituzione rimane valida fino a quando non viene generato un risultato basato su hermes3; questo è l'Esperimento 6 nella roadmap. Per gli operatori che utilizzano sistemi senza `hermes3:8b`, impostare la variabile `OLLAMA_INTERN_MODEL` su un modello disponibile; le URL pre-configurate per l'operatore e la disciplina nella precisione delle query (vedere il manuale) mitigano le allucinazioni nella scoperta di argomenti ambigui.
157
183
 
158
184
  ## Roadmap per la versione 1.0
159
185
 
160
- La versione 1.0 è uno stato da raggiungere, non una data di rilascio. Cinque esperimenti sono ancora in corso tra la versione 0.1 e la versione 1.0: stabilità dell'API sotto pressione esterna, un pacchetto di test interno che non faccia riferimento a se stesso, la risoluzione del problema della visibilità dell'origine dell'estrazione, la generalizzazione della calibrazione del revisore al di di `hermes-two-pass` e un test di base pulito su `hermes3:8b`. Il piano completo è disponibile in [`docs/roadmap.md`](docs/roadmap.md). L'architettura rimane stabile; la versione 1.0 approfondisce ciò che la versione 0.1 ha dimostrato, piuttosto che riaprire vecchie problematiche.
186
+ La versione 1.0 è uno stato raggiunto attraverso il lavoro svolto, non una data di rilascio. Tra la versione 0.1 e la 1.0 ci sono sei esperimenti in corso: un sistema di test interno non auto-referenziale (attualmente in fase di sviluppo come il pacchetto "ComfyUI workflow durability"), un comando `research-os pack publish` che automatizza l'esportazione nel repository centrale `research-packs` (Esperimento 2, limitato e dipendente dal completamento dell'Esperimento 1), stabilità dell'API sotto pressione esterna, colmare il divario sulla provenienza dei dati estratti, estendere la calibrazione dei revisori oltre il sistema `hermes-two-pass` e un test di base pulito su `hermes3:8b`. L'Esperimento 1 non è completato al momento del "congelamento" del pacchetto; si conclude quando il pacchetto "congelato" viene distribuito come il primo pacchetto nel repository centrale `research-packs`, insieme al pacchetto di test interno della versione 0.1. Il piano completo è disponibile in [`docs/roadmap.md`](docs/roadmap.md). L'architettura rimane invariata; la versione 1.0 approfondisce ciò che la versione 0.1 ha dimostrato, piuttosto che riaprire vecchie questioni.
161
187
 
162
188
  ## Licenza
163
189
 
package/README.ja.md CHANGED
@@ -7,7 +7,7 @@
7
7
  </p>
8
8
 
9
9
  <p align="center">
10
- <a href="https://github.com/mcp-tool-shop-org/research-os/releases/tag/v0.1.0"><img src="https://img.shields.io/badge/version-0.1.0-blue" alt="version 0.1.0"></a>
10
+ <a href="https://github.com/mcp-tool-shop-org/research-os/releases/tag/v0.3.3"><img src="https://img.shields.io/badge/version-0.3.3-blue" alt="version 0.3.3"></a>
11
11
  <a href="https://github.com/mcp-tool-shop-org/research-os/actions/workflows/ci.yml"><img src="https://github.com/mcp-tool-shop-org/research-os/actions/workflows/ci.yml/badge.svg" alt="CI"></a>
12
12
  <a href="LICENSE"><img src="https://img.shields.io/badge/license-MIT-green" alt="MIT License"></a>
13
13
  <img src="https://img.shields.io/badge/node-%E2%89%A520-brightgreen" alt="Node ≥20">
@@ -24,7 +24,67 @@
24
24
 
25
25
  これはレポート生成ツールではありません。また、LLMのオーケストレーションのフレームワークでもありません。あなたの統合作業を自動化するものでもありません。`research-os`は、統合作業を開始するための条件を強制します。
26
26
 
27
- **v0.1は、これまでに一度だけ、自分自身に対して使用されました。** その単一の使用により、`research-os`の7つの問題点が発見され、今回の**リリース**前にすべて修正されました。その検証プロセス(7つのセッション、2つの統合パターン、463個のvitestテストケース、1つの固定されたリポジトリ)は、[`docs/dogfood-proof.md`](docs/dogfood-proof.md)に記録されています。詳細なドキュメントはこちら:<https://mcp-tool-shop-org.github.io/research-os/handbook/>。
27
+ Frozen packs(凍結されたパッケージ)は、[`mcp-tool-shop-org/research-packs`](https://github.com/mcp-tool-shop-org/research-packs)にアーカイブされており、ライブで公開されています。最初の2つのパッケージが含まれています。v1.0のロードマップについては、[`docs/roadmap.md`](docs/roadmap.md)を参照してください。
28
+
29
+ v0.1は、2つの内部テスト(dogfood)で検証されました。最初のテストでは、research-os自体の仕様を調査した結果、v0.1.0のリリース前に7つの問題点が発見され、それぞれにコード修正が必要となり、新たなルールや統合パターンが導入されました。2番目のテスト(v1 Experiment 1:ComfyUIワークフローの安定性、11セッション、research-osとの語彙の重複がない環境)は、2026年5月9日に完了し、パッケージが凍結され、アーカイブが公開され、パターン2の適用がコミット`22b5dba`によって完了しました。v0.1の検証結果は、[`docs/dogfood-proof.md`](docs/dogfood-proof.md)に、Experiment 1の検証結果は、[`docs/experiment-1-proof.md`](docs/experiment-1-proof.md)に記載されています。ハンドブックは、<https://mcp-tool-shop-org.github.io/research-os/handbook/>で確認できます。
30
+
31
+ ## インストール
32
+
33
+ **必要条件:** Node.js ≥ 20
34
+
35
+ ```bash
36
+ npm install -g @mcptoolshop/research-os
37
+ ```
38
+
39
+ ソースコードからビルドする場合:
40
+
41
+ ```bash
42
+ git clone https://github.com/mcp-tool-shop-org/research-os.git
43
+ cd research-os
44
+ npm install
45
+ npm run build
46
+ npm link
47
+ ```
48
+
49
+ ## クイックスタート
50
+
51
+ ```bash
52
+ # Create a new research-pack
53
+ research-os init "How should X be structured?"
54
+
55
+ # Add a section
56
+ research-os section add 01-landscape --purpose "Map the current landscape"
57
+
58
+ # Discover and approve sources, then gather
59
+ research-os discover run 01-landscape
60
+ research-os discover approve 01-landscape --top 8
61
+ research-os gather 01-landscape --approved
62
+
63
+ # Run the per-section chain
64
+ research-os claim extract 01-landscape
65
+ research-os claim audit-density 01-landscape
66
+ research-os claim triage 01-landscape
67
+ research-os contradict map 01-landscape --triaged-only
68
+ research-os review 01-landscape --triaged-only --preset hermes-two-pass --profile hermes-two-pass
69
+ research-os review-promote 01-landscape --profile hermes-two-pass
70
+ research-os gate 01-landscape
71
+ research-os section report 01-landscape
72
+
73
+ # Pack-level finish
74
+ research-os audit
75
+ research-os index build --all
76
+ research-os cowork handoff
77
+ research-os synth workspace # only if handoff returned synthesis_ready
78
+ research-os freeze
79
+
80
+ # Export to the research-packs archive
81
+ research-os pack publish \
82
+ --to <research-packs>/packages/<name>
83
+ ```
84
+
85
+ **具体的な使用例**については、`research-os-packs/research-os-spec/` にある「dogfood」と呼ばれるパッケージを参照してください。このパッケージには、すべてのファイル、すべての記録、すべての処理結果、すべての固定状態のフィンガープリントなどが、追記のみ可能なファイルとして保存されています。このパッケージによって、`docs/dogfood-proof.md` が生成されました。
86
+
87
+ **LLM(大規模言語モデル)の抽出、トリアージ、レビュー、および発見には、ローカルで実行されている [ollama-intern-mcp](https://github.com/mcp-tool-shop-org/ollama-intern-mcp) が必要です。** デフォルトのモデルは `hermes3:8b` です。別のモデルを使用する場合は、`OLLAMA_INTERN_MODEL=<モデル名>` で指定してください。Ollamaがデフォルトの `localhost:11434` 以外の場所で実行されている場合は、`OLLAMA_HOST` 環境変数を設定してください。
28
88
 
29
89
  ## 16の重要な原則
30
90
 
@@ -76,55 +136,6 @@ discover
76
136
 
77
137
  これは、*検索 → 要約 → 報告書作成* という従来のプロセスに対する構造的な代替手段です。このプロセス全体が「チェーン」として機能し、その結果が製品となります。
78
138
 
79
- ## インストール
80
-
81
- **必要条件:** Node.js ≥ 20
82
-
83
- ```bash
84
- # From source (v0.1.0 is not yet published to npm)
85
- git clone https://github.com/mcp-tool-shop-org/research-os.git
86
- cd research-os
87
- npm install
88
- npm run build
89
- npm link # makes `research-os` available on your PATH
90
- ```
91
-
92
- ## クイックスタート
93
-
94
- ```bash
95
- # Create a new research-pack
96
- research-os init "How should X be structured?"
97
-
98
- # Add a section
99
- research-os section add 01-landscape --purpose "Map the current landscape"
100
-
101
- # Discover and approve sources, then gather
102
- research-os discover run 01-landscape
103
- research-os discover approve 01-landscape --top 8
104
- research-os gather 01-landscape --approved
105
-
106
- # Run the per-section chain
107
- research-os claim extract 01-landscape
108
- research-os claim audit-density 01-landscape
109
- research-os claim triage 01-landscape
110
- research-os contradict map 01-landscape --triaged-only
111
- research-os review 01-landscape --triaged-only --preset hermes-two-pass --profile hermes-two-pass
112
- research-os review-promote 01-landscape --profile hermes-two-pass
113
- research-os gate 01-landscape
114
- research-os section report 01-landscape
115
-
116
- # Pack-level finish
117
- research-os audit
118
- research-os index build --all
119
- research-os cowork handoff
120
- research-os synth workspace # only if handoff returned synthesis_ready
121
- research-os freeze
122
- ```
123
-
124
- **具体的な使用例**については、`research-os-packs/research-os-spec/` にある「dogfood」と呼ばれるパッケージを参照してください。このパッケージには、すべてのファイル、すべての記録、すべての処理結果、すべての固定状態のフィンガープリントなどが、追記のみ可能なファイルとして保存されています。このパッケージによって、`docs/dogfood-proof.md` が生成されました。
125
-
126
- **LLM(大規模言語モデル)の抽出、トリアージ、レビュー、および発見には、ローカルで実行されている [ollama-intern-mcp](https://github.com/mcp-tool-shop-org/ollama-intern-mcp) が必要です。** デフォルトのモデルは `hermes3:8b` です。別のモデルを使用する場合は、`OLLAMA_INTERN_MODEL=<モデル名>` で指定してください。Ollamaがデフォルトの `localhost:11434` 以外の場所で実行されている場合は、`OLLAMA_HOST` 環境変数を設定してください。
127
-
128
139
  ## 用語集
129
140
 
130
141
  | 用語 | 意味 |
@@ -140,20 +151,39 @@ research-os freeze
140
151
 
141
152
  ## ステータス
142
153
 
154
+ **v0.3.3** — npmに `@mcptoolshop/research-os@0.3.3` として公開されました。2026年5月10日。Pack-3(Godotのエクスポート/ランタイムの安定性、実験3のパック#3のうち3つ目)によって獲得された、ゲートセマンティクスの明確化が含まれています。ゲートの出力には、セクションごとの発行者と主要なカウントに加えて、全体的なカウントが表示されるようになりました(F-43)。`no_source_cluster_monopoly` は、警告から情報診断に変更されました(F-41)。**合格/不合格の動作は変更されていません。既存の固定されたパックは、バイト単位で完全に同一であることを検証します。** 570/570 の vitest が合格しました。詳細は [CHANGELOG.md](CHANGELOG.md) および [`docs/section-scoped-waivers.md`](docs/section-scoped-waivers.md) を参照してください。
155
+
156
+ **v0.3.2** — 2026年5月9日に、`@mcptoolshop/research-os@0.3.2`としてnpmに公開されました。`pack publish`の許可に関する、正規化された承認処理が実装されました。`claim-reviews.jsonl`と`pack-audit.json::accepted_claims`の厳密な一致チェックは、効果的な集合比較に置き換えられました。承認されたクレームは、最新の正当なレビュー結果が`accepted_for_synthesis`である一意の`claim_id`の集合です(`claim_id`ごとに最新の決定が優先されます)。以前の監査数が効果的な集合と異なる凍結されたパッケージは、拒否する代わりに警告を表示します。古い監査ファイルは変更せずに保持されます(ルール15)、ただし、アーカイブのマニフェストには正規化された数が反映されます。フェイクの`claim_id`、互換性のない重複した決定、および合成対象外の条件に対する拒否は引き続き適用されます。Experiment 3 XRPLパッケージのSession Kで、実際のクロージャー・レジャーの不一致により、パッケージの公開が拒否されました(セクション07には24件の`accepted_for_synthesis`の行がありましたが、重複するレビュー担当者によるため、一意の`claim_id`は19件のみでした)。558/558のvitestが成功しました。詳細については、[CHANGELOG.md](CHANGELOG.md)と[`docs/pack-publish.md`](docs/pack-publish.md)を参照してください。
157
+
158
+ **v0.3.1** — 2026年5月9日に、`@mcptoolshop/research-os@0.3.1`としてnpmに公開されました。セクションごとに適用されるソースコードの免除(`primary_source_waiver.section_waivers[]`)と、レビュー担当者による確認機能が追加されました。これにより、セクション全体で`source_cluster_monopoly`の違反が検出された場合でも、自動的にすべてのクレームを`needs_source_repair`に振り分けるのではなく、注意点として表示されるようになりました。Experiment 3 XRPLパッケージのSession 2で、canonical-protocolセクション(単一の基盤チェーン、クローズドなAPI仕様、標準化団体のドキュメント)において、パブリッシャーの多様性が真の品質の指標であるという前提が覆されました。当時、540/540のvitestが成功しました。詳細については、[`docs/section-scoped-waivers.md`](docs/section-scoped-waivers.md)を参照してください。
159
+
160
+ **セクションごとのソースコード免除** — パブリッシャーの多様性がセクションの真のソースと構造的に互換性がない場合にのみ使用します。セクションが単に十分なソースを見つけられなかった場合ではありません。スキーマによって強制される`reason`と、空でない`compensating_controls[]`が必要です。パッケージポリシー`primary_source_waiver_allowed: false`は、パッケージレベルおよびセクションごとの免除の両方をブロックします。v0.3.1以前のパッケージレベルの`min_independent_publishers: 0`の回避策は、現在非推奨です。既存の凍結されたパッケージは、既存のレシートに基づいて有効です。詳細については、[`docs/section-scoped-waivers.md`](docs/section-scoped-waivers.md)と、[research-packsオペレータープレイブック](https://github.com/mcp-tool-shop-org/research-packs/blob/main/docs/operator-playbook.md)を参照してください。
161
+
162
+ **v0.3.0** — 2026年5月9日に公開されました。`contradict map`に、`--detector <auto|heuristic|ollama-intern>`フラグが追加されました(Experiment 3 Session 1、XRPLパッケージのF-09チェーンブロッカーの修正)。当時、527/527のvitestが成功しました。検出器の選択は、以前の状態に依存する環境変数ではなく、オペレーターが明示的に選択するようになりました。モードは、実行ごとに可視化されます。詳細については、[`docs/contradict-map.md`](docs/contradict-map.md)を参照してください。
163
+
164
+ **v0.2.0** — 2026年5月9日に公開。`research-os pack publish` (実験2) と、Pattern 2 の準備状態に関する問題を修正しました。515件中515件の vitest テストが合格しました。詳細は [CHANGELOG.md](CHANGELOG.md) を参照してください。パッケージの公開は、単一のコマンドで標準の `research-packs` アーカイブにエクスポートされます。契約の遵守は、チェックリストではなくコードによって強制されます。詳細は [`docs/pack-publish.md`](docs/pack-publish.md) を参照してください。
165
+
143
166
  **v0.1.0** — 2026年5月8日に固定されました。`research-os-packs/research-os-spec/` (関連リポジトリ) にある「dogfood」パッケージでは、8つのセクションで296件の主張が承認され、17件が処理され、30件がオペレーターによって修正され、未解決の矛盾は0件、すべてのゲートで `synthesis_eligible=true` となりました。463件中463件のvitestテストが合格しました。16個の重要なルールが実装されています。詳細については、[docs/dogfood-proof.md](docs/dogfood-proof.md) を参照してください。このドキュメントには、7つの発見事項と、固定状態のフィンガープリントが記載されています。
144
167
 
168
+ **research-packs アーカイブ (モノレポ)** — [`mcp-tool-shop-org/research-packs`](https://github.com/mcp-tool-shop-org/research-packs) で公開されており、リリース時に2つのパッケージが提供されています。`comfyui-workflow-durability` (実験1、302件の承認済みクレーム、8セクション) と `research-os-self-dogfood` (v0.1 のドッグフード版、296件の承認済みクレーム、8セクション)。どちらのパッケージも `verify-pack.mjs` をパスしています。
169
+
170
+ **v1 実験1 (ComfyUI ワークフローの安定性)** — 2026年5月9日に終了。8つのセクションすべてが Terminal A で完了し、パッケージは凍結され、アーカイブは公開されました。詳細は [`docs/experiment-1-proof.md`](docs/experiment-1-proof.md) と [`docs/roadmap.md`](docs/roadmap.md) を参照してください。
171
+
145
172
  ### v0.1の制限事項
146
173
 
147
- - 外部ユーザーによる十分なテストは行われていません。初期のテストで7つのバグが見つかりました。
148
- - まだnpmには登録されていません。`npm publish` が行われるまでは、ソースコードからインストールしてください。
149
- - 合成処理を行う機能はありません。`synth workspace` コマンドは、構造化された作業環境を生成しますが、承認された主張IDに基づいて、人間(または Cowork)が文章を作成します。
150
- - APIの安定性はありません(セマンティックバージョニングに準拠していません)。外部ユーザーによる検証が完了した後、v1.0.0 がリリースされます。
174
+ - 外部ユーザーによる実戦テストは行われていません。3つの内部テストフェーズが終了しました。1つは自己参照型、2つは外部ドメイン型です。実験3(外部からのプレッシャー下でのAPIの安定性)は、**2026年5月10日に完了しました**。3つのパック(ComfyUI、XRPL、Godot)は、v0.3.xのCLIインターフェースに変更を加えることなく、安定版に到達しました。このフェーズでは、v0.3.0の`--detector`(F-09)、v0.3.1のセクションごとの免責事項(F-10/F-11)、v0.3.2の標準化された承認済みトランザクション処理(F-36)、およびv0.3.3のゲートセマンティクスの明確化(F-43/F-41)が実現されました。
175
+ - 合成テキストの生成機能はありません。`synth workspace` コマンドは、構造化されたワークスペースを生成します。人間(または Cowork)が、承認されたトランザクションIDに基づいてテキストを作成します。
176
+ - セマンティックバージョニング(semver)に基づくAPIの安定性はありません。v1.0.0 は、予定日ではなく、達成すべき目標です。詳細については、[`docs/roadmap.md`](docs/roadmap.md) を参照してください。このドキュメントには、その目標を達成するための6つの実験が記載されています。
151
177
 
152
178
  ### 既知の制限事項
153
179
 
154
- - **抽出器の信頼性情報が、ゲートの接合部分からは確認できません。** キャリブレーションされた抽出器(設定されたモデルを使用するOllama)が利用できない場合、システムはヒューリスティックに基づく代替的な方法で処理を進める可能性があります。これは既知の弱点として記録されており、今後の改善では、抽出器が提供する信頼性の高い情報と、キャリブレーションされた経路からの信頼性の高い情報の両方が必要になるように変更される予定です。
155
- - **キャリブレーションされた`hermes-two-pass`を基準とした、レビューモデルの選択に関する問題は未解決です。** 内部テストでは、特定のレビュー設定が検証されましたが、他のモデルについては、信頼できるようになる前に、意図的なエラーを再現するキャリブレーションが必要です。
156
- - **内部テストで使用されたパッケージは、抽出処理に`mistral-nemo:12b`を使用しました(標準設定は`hermes3:8b`です)。** システムは、自己参照的なセクション名に対して、誤ったドメインからの結果を生成する可能性がありましたが、クエリの精度を向上させるための対策(マニュアルを参照)と、曖昧なトピックに対するオペレーターによる事前準備されたURLを使用することで、この問題を修正しました。
180
+ - **抽出元の情報が、ゲートシームでは表示されません。** セクションは、キャリブレーションされた抽出器 (Ollama と設定されたモデル) が利用できない場合に、ヒューリスティックに基づく代替クレームに依存して、承認済みクレームの基準を満たすことができます。これは、ロードマップの実験4として記録されています。今後の改善により、承認済みクレームは抽出器ごとに報告され、基準を満たす数の承認済みクレームが、キャリブレーションされたパスから取得されるようになります。
181
+ - **キャリブレーションされた `hermes-two-pass` を基準とする、レビューモデルの選択は未解決です。** ドッグフードテストでは、1つのレビュー設定が検証されました。代替モデルは、信頼できるようになる前に、独自のシードされた失敗の再現キャリブレーションが必要です。これは、ロードマップの実験5です。
182
+ - **v0.1 の自己ドッグフードパッケージでは、抽出に `mistral-nemo:12b` が使用されました (標準のデフォルトは `hermes3:8b`)。** v0.1 のテスト期間中、この環境では `hermes3:8b` が利用できませんでした。この代替の使用に関する情報は、`hermes3` ベースの記録が作成されるまで有効です。`hermes3:8b` が利用できない環境では、`OLLAMA_INTERN_MODEL` を利用可能なモデルに設定してください。オペレーターが事前に設定した URL と、クエリの精度に関するルール (ハンドブックを参照) を使用することで、あいまいなトピックに関する誤った情報の検出を軽減できます。
183
+
184
+ ## v1.0 へのロードマップ
185
+
186
+ v1.0は、単なるリリース日ではなく、達成される状態です。v0.1からv1.0までの間に、6つの実験段階があります。これには、自己参照を含まない内部テスト(現在はComfyUIワークフローの安定性向上パックとして進行中)、`research-os pack publish`コマンドによる、標準的な`research-packs`モノレポへの自動エクスポート(実験2。実験1の手動での完了処理の後に行われる)、外部からのプレッシャーに対するAPIの安定性、抽出元の追跡機能の確立、`hermes-two-pass`を超えるレビューアの調整の一般化、そして`hermes3:8b`上でのクリーンなベースラインの実行が含まれます。実験1は、パッケージの最終版が作成される前に完了しません。これは、v0.1の内部テストが完了し、`research-packs`モノレポの最初のパッケージとしてリリースされる際に終了します。詳細な計画は、[`docs/roadmap.md`](docs/roadmap.md)に記載されています。アーキテクチャの設計は一貫して維持され、v1.0は、v0.1で検証された内容をさらに深めるものであり、以前の段階を再検討するものではありません。
157
187
 
158
188
  ## ライセンス
159
189
 
package/README.md CHANGED
@@ -7,7 +7,7 @@
7
7
  </p>
8
8
 
9
9
  <p align="center">
10
- <a href="https://github.com/mcp-tool-shop-org/research-os/releases/tag/v0.3.1"><img src="https://img.shields.io/badge/version-0.3.1-blue" alt="version 0.3.1"></a>
10
+ <a href="https://github.com/mcp-tool-shop-org/research-os/releases/tag/v0.3.3"><img src="https://img.shields.io/badge/version-0.3.3-blue" alt="version 0.3.3"></a>
11
11
  <a href="https://github.com/mcp-tool-shop-org/research-os/actions/workflows/ci.yml"><img src="https://github.com/mcp-tool-shop-org/research-os/actions/workflows/ci.yml/badge.svg" alt="CI"></a>
12
12
  <a href="LICENSE"><img src="https://img.shields.io/badge/license-MIT-green" alt="MIT License"></a>
13
13
  <img src="https://img.shields.io/badge/node-%E2%89%A520-brightgreen" alt="Node ≥20">
@@ -151,7 +151,11 @@ This is the structural alternative to *search → summarize → pretty report*.
151
151
 
152
152
  ## Status
153
153
 
154
- **v0.3.1** — published to npm as `@mcptoolshop/research-os@0.3.1`, 2026-05-09. Ships section-scoped source-floor waivers (`primary_source_waiver.section_waivers[]`) plus reviewer-side acknowledgement so a waived section-wide `source_cluster_monopoly` finding becomes a visible caveat rather than auto-routing all claims to `needs_source_repair`. Earned by Experiment 3 XRPL pack Session 2 — canonical-protocol sections (single-foundation chains, walled-garden API specs, standards-body docs) inverted the assumption that publisher diversity is a proxy for truth quality. 540/540 vitest passing. See [CHANGELOG.md](CHANGELOG.md) and [`docs/section-scoped-waivers.md`](docs/section-scoped-waivers.md).
154
+ **v0.3.3** — published to npm as `@mcptoolshop/research-os@0.3.3`, 2026-05-10. Ships gate-semantics clarity earned by Pack-3 (Godot export/runtime durability, Experiment 3 pack #3 of 3). Gate output now carries section-scoped publisher + primary counts alongside pack-wide counts (F-43); `no_source_cluster_monopoly` reworded from WARN to informational diagnostic (F-41). **Pass/fail behavior unchanged; existing frozen packs verify-pack byte-identically.** 570/570 vitest passing. See [CHANGELOG.md](CHANGELOG.md) and [`docs/section-scoped-waivers.md`](docs/section-scoped-waivers.md).
155
+
156
+ **v0.3.2** — published to npm as `@mcptoolshop/research-os@0.3.2`, 2026-05-09. Ships normalized accepted-claim accounting for `pack publish` admission. The strict equality check between `claim-reviews.jsonl` and `pack-audit.json::accepted_claims` is replaced with an effective-set comparison — accepted claims are unique `claim_id`s whose latest canonical review decision is `accepted_for_synthesis` (latest-decision-wins per `claim_id`). Frozen packs whose legacy audit count differs from the effective set now admit with a warning rather than refusing; the legacy audit file is preserved verbatim (Law 15) while the archive manifest reflects the normalized count. Refusal stays hard for phantom claim_ids, incompatible duplicate decisions, and non-synthesis-eligible gates. Earned by Experiment 3 XRPL pack Session K — pack publish refused on a real closure-ledger seam disagreement (Section 07 had 24 raw `accepted_for_synthesis` rows but only 19 unique `claim_id`s due to overlapping reviewer windows). 558/558 vitest passing. See [CHANGELOG.md](CHANGELOG.md) and [`docs/pack-publish.md`](docs/pack-publish.md).
157
+
158
+ **v0.3.1** — published to npm as `@mcptoolshop/research-os@0.3.1`, 2026-05-09. Ships section-scoped source-floor waivers (`primary_source_waiver.section_waivers[]`) plus reviewer-side acknowledgement so a waived section-wide `source_cluster_monopoly` finding becomes a visible caveat rather than auto-routing all claims to `needs_source_repair`. Earned by Experiment 3 XRPL pack Session 2 — canonical-protocol sections (single-foundation chains, walled-garden API specs, standards-body docs) inverted the assumption that publisher diversity is a proxy for truth quality. 540/540 vitest passing then. See [`docs/section-scoped-waivers.md`](docs/section-scoped-waivers.md).
155
159
 
156
160
  **Section-scoped source waivers** — Use them when publisher diversity is structurally incompatible with the section's truth source, not when a section merely failed to find enough sources. Schema-enforced `reason` + non-empty `compensating_controls[]`. Pack policy `primary_source_waiver_allowed: false` blocks both pack-level and section-scoped waivers. The pre-v0.3.1 pack-level `min_independent_publishers: 0` workaround is now deprecated; existing frozen packs remain valid under their existing receipts. See [`docs/section-scoped-waivers.md`](docs/section-scoped-waivers.md) and the [research-packs operator playbook](https://github.com/mcp-tool-shop-org/research-packs/blob/main/docs/operator-playbook.md).
157
161
 
@@ -167,7 +171,7 @@ This is the structural alternative to *search → summarize → pretty report*.
167
171
 
168
172
  ### What v0.3 is not
169
173
 
170
- - Not battle-tested by external users. Two dogfood arcs have closed — one self-referential, one external-domain — and Experiment 3 (API stability under external pressure) is in progress: pack #1 of 3 (XRPL creator-token durability) earned both the v0.3.0 `--detector` flag and the v0.3.1 section-scoped source waivers. Two more external-domain packs required for Experiment 3 closure.
174
+ - Not battle-tested by external users. Three dogfood arcs have closed — one self-referential, two external-domain — and Experiment 3 (API stability under external pressure) is **CLOSED 2026-05-10**: all three packs (ComfyUI, XRPL, Godot) reached freeze without breaking changes to the v0.3.x CLI surface. The arc earned v0.3.0 `--detector` (F-09), v0.3.1 section-scoped waivers (F-10/F-11), v0.3.2 normalized accepted-claim accounting (F-36), and v0.3.3 gate-semantics clarity (F-43/F-41).
171
175
  - Not a synthesis writer. The `synth workspace` command generates the structured workspace; humans (or Cowork) write the prose against accepted claim IDs.
172
176
  - Not API-stable under semver. v1.0.0 is an earned state, not a calendar date — see [`docs/roadmap.md`](docs/roadmap.md) for the six experiments that close the gap.
173
177