@mcptoolshop/research-os 0.3.0 → 0.3.2
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
- package/CHANGELOG.md +214 -0
- package/README.es.md +99 -71
- package/README.fr.md +86 -58
- package/README.hi.md +83 -59
- package/README.it.md +97 -73
- package/README.ja.md +86 -58
- package/README.md +8 -4
- package/README.pt-BR.md +83 -59
- package/README.zh.md +102 -74
- package/dist/cli.js +281 -62
- package/dist/cli.js.map +1 -1
- package/dist/index.d.ts +174 -84
- package/dist/index.js +185 -48
- package/dist/index.js.map +1 -1
- package/package.json +1 -1
package/README.it.md
CHANGED
|
@@ -7,7 +7,7 @@
|
|
|
7
7
|
</p>
|
|
8
8
|
|
|
9
9
|
<p align="center">
|
|
10
|
-
<a href="https://github.com/mcp-tool-shop-org/research-os/releases/tag/v0.
|
|
10
|
+
<a href="https://github.com/mcp-tool-shop-org/research-os/releases/tag/v0.3.2"><img src="https://img.shields.io/badge/version-0.3.2-blue" alt="version 0.3.2"></a>
|
|
11
11
|
<a href="https://github.com/mcp-tool-shop-org/research-os/actions/workflows/ci.yml"><img src="https://github.com/mcp-tool-shop-org/research-os/actions/workflows/ci.yml/badge.svg" alt="CI"></a>
|
|
12
12
|
<a href="LICENSE"><img src="https://img.shields.io/badge/license-MIT-green" alt="MIT License"></a>
|
|
13
13
|
<img src="https://img.shields.io/badge/node-%E2%89%A520-brightgreen" alt="Node ≥20">
|
|
@@ -16,77 +16,34 @@
|
|
|
16
16
|
|
|
17
17
|
# research-os
|
|
18
18
|
|
|
19
|
-
Un'interfaccia a riga di comando (CLI) che trasforma un argomento
|
|
19
|
+
Un'interfaccia a riga di comando (CLI) che trasforma un argomento di ricerca in un "**pacchetto di ricerca**" strutturato, ovvero un repository organizzato in cui Claude, Cowork o un sistema simile possono lavorare per ore senza generare risultati errati o superficiali.
|
|
20
20
|
|
|
21
21
|
## Cos'è
|
|
22
22
|
|
|
23
|
-
`research-os` è il
|
|
23
|
+
`research-os` è il livello di controllo che interviene tra la richiesta "Voglio ricercare X" e una base di dati strutturata e verificabile. Separa le ipotesi iniziali dalle prove raccolte, l'estrazione dei dati dalle affermazioni verificate, il rilevamento delle contraddizioni dalla loro risoluzione e le decisioni di revisione dalle conclusioni finali. Ogni passaggio viene registrato in un registro immutabile; ogni valutazione di disponibilità è calcolata a partire da questi registri, e non è una semplice affermazione.
|
|
24
24
|
|
|
25
|
-
Non è un generatore di report. Non è un framework
|
|
25
|
+
Non è un generatore di report. Non è un framework per l'orchestrazione di modelli linguistici di grandi dimensioni (LLM). Non scrive la sintesi per te. Impone le condizioni necessarie per l'inizio della sintesi.
|
|
26
26
|
|
|
27
|
-
|
|
27
|
+
I pacchetti finalizzati vengono archiviati in [`mcp-tool-shop-org/research-packs`](https://github.com/mcp-tool-shop-org/research-packs) e sono disponibili, con due pacchetti iniziali. Consultare [`docs/roadmap.md`](docs/roadmap.md) per la roadmap della versione 1.0.
|
|
28
28
|
|
|
29
|
-
|
|
30
|
-
|
|
31
|
-
| # | Legge |
|
|
32
|
-
|---|-----|
|
|
33
|
-
| 1 | Nessuna sintesi prima della verifica delle fonti. |
|
|
34
|
-
| 2 | La raccolta è una prova; l'estrazione è un'interpretazione. |
|
|
35
|
-
| 3 | I modelli possono interpretare porzioni di testo originale; non possono creare porzioni di testo che costituiscono una prova. |
|
|
36
|
-
| 4 | L'estrazione può produrre un eccesso di informazioni; la sintesi non può ereditare questa abbondanza. |
|
|
37
|
-
| 5 | La mappatura delle contraddizioni evidenzia le discrepanze; non le risolve, non le sintetizza e non decide quale affermazione è corretta. |
|
|
38
|
-
| 6 | I controlli determinano se una sezione è idonea per la sintesi. Non eseguono la sintesi né nascondono i fallimenti. |
|
|
39
|
-
| 7 | La revisione critica valuta l'integrità della ricerca. Non esegue la sintesi né riscrive il testo originale. |
|
|
40
|
-
| 8 | L'indicizzazione rende la ricerca di informazioni basata su prove possibile. Non crea nuove informazioni né diventa la fonte ufficiale. |
|
|
41
|
-
| 9 | La funzione di trasferimento a Cowork genera istruzioni operative a partire dalle informazioni verificate. Non crea informazioni né aggira i controlli. |
|
|
42
|
-
| 10 | L'ambiente di lavoro per la sintesi organizza le informazioni verificate per Cowork. Non esegue la sintesi né aggira la modalità di trasferimento. |
|
|
43
|
-
| 11 | L'audit del pacchetto aggrega le informazioni verificate esistenti. Non crea nuove informazioni né nasconde le prove a livello di sezione. |
|
|
44
|
-
| 12 | La fase di scoperta propone spunti; solo la raccolta produce prove. |
|
|
45
|
-
| 13 | Un revisore non è considerato affidabile finché non vengono dimostrati dei fallimenti e la sua capacità di rilevarli. |
|
|
46
|
-
| 14 | L'abbondanza di affermazioni non è sinonimo di qualità della ricerca. Le affermazioni devono essere verificate prima di poter essere considerate per la sintesi. |
|
|
47
|
-
| 15 | La fase di consolidamento blocca le informazioni verificate. Non completa la ricerca incompleta né converte lo stato di riparazione in prove. |
|
|
48
|
-
| 16 | Le eccezioni allentano i vincoli delle fonti; non possono creare prove. |
|
|
49
|
-
|
|
50
|
-
**Legge 3** — il modello linguistico non crea mai il testo delle prove. `research-os` crea un registro di estratti deterministico (con ID stabili come `ex_<source_id_hex>_001`); il modello linguistico seleziona gli ID degli estratti; `research-os` copia il testo letterale. La classe di errore "parafrasi come citazione" è strutturalmente impossibile.
|
|
51
|
-
|
|
52
|
-
**Legge 14** — tra l'estrazione e la revisione, `research-os claim triage` deduplica, limita il contributo per fonte e mette da parte i candidati meno promettenti. La fase di triage NON modifica `claims.jsonl`; le affermazioni messe da parte rimangono nel registro principale.
|
|
53
|
-
|
|
54
|
-
## La sequenza di lavoro della versione 0.1
|
|
55
|
-
|
|
56
|
-
```
|
|
57
|
-
discover
|
|
58
|
-
→ gather
|
|
59
|
-
→ claim extract
|
|
60
|
-
→ claim audit-density
|
|
61
|
-
→ claim triage
|
|
62
|
-
→ contradict map
|
|
63
|
-
→ contradict resolve
|
|
64
|
-
→ review
|
|
65
|
-
→ review-promote
|
|
66
|
-
→ gate
|
|
67
|
-
→ section report
|
|
68
|
-
→ audit
|
|
69
|
-
→ index build
|
|
70
|
-
→ cowork handoff
|
|
71
|
-
→ synth workspace
|
|
72
|
-
→ freeze
|
|
73
|
-
```
|
|
74
|
-
|
|
75
|
-
Ogni passaggio è un comando da riga di comando. Ogni passaggio scrive su artefatti che possono essere solo aggiunti, non modificati. Nessun passaggio sintetizza, risolve o crea nuove verità; questi vincoli sono applicati, non considerati come affidabili. La fase di revisione accetta, rifiuta o richiede modifiche alle proposte; la fase di "gate" utilizza queste decisioni per calcolare l'idoneità alla sintesi; la fase di "freeze" è il blocco finale di integrità che impedisce di considerare un pacchetto come completato a meno che tutti i livelli non siano d'accordo. Consultare il file [docs/dogfood-proof.md](docs/dogfood-proof.md) per la documentazione della versione 0.1 che dimostra la coerenza dell'intera catena.
|
|
76
|
-
|
|
77
|
-
Questa è un'alternativa strutturale a *ricerca → riepilogo → report dettagliato*. La catena è il prodotto.
|
|
29
|
+
La versione 0.1 è stata testata in due cicli di "dogfooding". Il primo, che consisteva nella ricerca sulla propria specifica, ha identificato sette errori prima del rilascio della versione 0.1.0, ognuno dei quali ha richiesto una correzione del codice e ha portato all'implementazione di una regola o di un modello di integrazione. Il secondo (Esperimento 1: Durabilità del flusso di lavoro ComfyUI, 11 sessioni, un dominio senza sovrapposizioni lessicali con research-os) è stato completato il 2026-05-09: il pacchetto è stato finalizzato e l'archivio è attivo; l'applicazione della regola 2 è stata completata tramite il commit `22b5dba`. La documentazione del test della versione 0.1 è disponibile in [`docs/dogfood-proof.md`](docs/dogfood-proof.md); la documentazione dell'Esperimento 1 è disponibile in [`docs/experiment-1-proof.md`](docs/experiment-1-proof.md). La guida completa è disponibile all'indirizzo: <https://mcp-tool-shop-org.github.io/research-os/handbook/>.
|
|
78
30
|
|
|
79
31
|
## Installazione
|
|
80
32
|
|
|
81
33
|
**Requisiti:** Node.js ≥ 20.
|
|
82
34
|
|
|
83
35
|
```bash
|
|
84
|
-
|
|
36
|
+
npm install -g @mcptoolshop/research-os
|
|
37
|
+
```
|
|
38
|
+
|
|
39
|
+
Per i contributori che costruiscono il software partendo dal codice sorgente:
|
|
40
|
+
|
|
41
|
+
```bash
|
|
85
42
|
git clone https://github.com/mcp-tool-shop-org/research-os.git
|
|
86
43
|
cd research-os
|
|
87
44
|
npm install
|
|
88
45
|
npm run build
|
|
89
|
-
npm link
|
|
46
|
+
npm link
|
|
90
47
|
```
|
|
91
48
|
|
|
92
49
|
## Guida rapida
|
|
@@ -119,45 +76,112 @@ research-os index build --all
|
|
|
119
76
|
research-os cowork handoff
|
|
120
77
|
research-os synth workspace # only if handoff returned synthesis_ready
|
|
121
78
|
research-os freeze
|
|
79
|
+
|
|
80
|
+
# Export to the research-packs archive
|
|
81
|
+
research-os pack publish \
|
|
82
|
+
--to <research-packs>/packages/<name>
|
|
122
83
|
```
|
|
123
84
|
|
|
124
|
-
**Per un esempio pratico**, consultare il pacchetto di test
|
|
85
|
+
**Per un esempio pratico**, consultare il pacchetto di test `research-os-packs/research-os-spec/`, che contiene tutti gli elementi, le ricevute, le valutazioni, le "impronte digitali" e le registrazioni, tutti memorizzati in registri immutabili. Questo pacchetto ha generato la documentazione `docs/dogfood-proof.md`.
|
|
125
86
|
|
|
126
|
-
**Richiede [ollama-intern-mcp](https://github.com/mcp-tool-shop-org/ollama-intern-mcp) in esecuzione localmente** per l'estrazione, la classificazione, la revisione e la scoperta tramite
|
|
87
|
+
**Richiede [ollama-intern-mcp](https://github.com/mcp-tool-shop-org/ollama-intern-mcp) in esecuzione localmente** per l'estrazione, la classificazione, la revisione e la scoperta tramite LLM. Il modello predefinito è `hermes3:8b`; è possibile sovrascriverlo impostando la variabile d'ambiente `OLLAMA_INTERN_MODEL=<modello>`. Impostare la variabile `OLLAMA_HOST` se Ollama non è in esecuzione sull'indirizzo predefinito `localhost:11434`.
|
|
127
88
|
|
|
128
|
-
##
|
|
89
|
+
## Le 16 regole fondamentali
|
|
90
|
+
|
|
91
|
+
| # | Regola |
|
|
92
|
+
|---|-----|
|
|
93
|
+
| 1 | Nessuna sintesi prima della verifica delle fonti. |
|
|
94
|
+
| 2 | La raccolta di dati è una prova; l'estrazione è un'interpretazione. |
|
|
95
|
+
| 3 | I modelli possono interpretare porzioni di testo originale, ma non possono creare nuove prove. |
|
|
96
|
+
| 4 | L'estrazione può produrre un eccesso di dati; la sintesi non deve necessariamente includere tutti i dati estratti. |
|
|
97
|
+
| 5 | La mappatura delle contraddizioni evidenzia le discrepanze, ma non le risolve, non le sintetizza e non determina quale affermazione sia corretta. |
|
|
98
|
+
| 6 | I "gate" decidono se una sezione è idonea per la sintesi. Non eseguono la sintesi né nascondono i fallimenti. |
|
|
99
|
+
| 7 | La revisione critica valuta l'integrità della ricerca. Non esegue la sintesi né riscrive le fonti originali. |
|
|
100
|
+
| 8 | L'indicizzazione rende la ricerca di informazioni più semplice. Non crea nuove informazioni e non diventa la fonte ufficiale. |
|
|
101
|
+
| 9 | Il trasferimento di informazioni a Cowork traduce le istruzioni operative a partire dalle informazioni verificate. Non crea nuove informazioni e non aggira i "gate". |
|
|
102
|
+
| 10 | L'area di lavoro per la sintesi organizza le informazioni verificate per Cowork. Non esegue la sintesi e non aggira la modalità di trasferimento. |
|
|
103
|
+
| 11 | L'audit del pacchetto raccoglie le informazioni verificate esistenti. Non crea nuove informazioni e non nasconde le prove a livello di sezione. |
|
|
104
|
+
| 12 | La scoperta propone nuove piste di ricerca; solo la raccolta di dati produce prove. |
|
|
105
|
+
| 13 | Un revisore non è considerato affidabile finché non vengono dimostrate delle lacune e la sua capacità di rilevarle. |
|
|
106
|
+
| 14 | L'abbondanza di affermazioni non equivale a qualità della ricerca. Le affermazioni devono essere valutate prima di poter essere considerate per la sintesi. |
|
|
107
|
+
| 15 | La funzione "freeze" blocca la ricerca completata e valida. Non completa la ricerca incompleta né trasforma uno stato di "in riparazione" in una prova. |
|
|
108
|
+
| 16 | Le eccezioni (waivers) allentano i vincoli sulle fonti; non possono essere utilizzate per fabbricare prove. |
|
|
109
|
+
|
|
110
|
+
**Legge 3** — il modello linguistico (LLM) non genera mai il testo delle prove. Il sistema "research-os" crea un registro deterministico degli estratti (con ID stabili come `ex_<id_esadecimale_della_fonte>_001`); l'LLM seleziona gli ID degli estratti; "research-os" copia il testo letterale. La classe di errore "parafrasi come citazione" è strutturalmente impossibile.
|
|
111
|
+
|
|
112
|
+
**Legge 14** — tra l'estrazione e la revisione, "research-os claim triage" elimina le duplicazioni, limita il contributo per fonte e mette in attesa le candidature meno promettenti. Il triage NON modifica il file `claims.jsonl`; le affermazioni messe in attesa rimangono nel registro principale.
|
|
113
|
+
|
|
114
|
+
## La catena di flusso di lavoro v0.1
|
|
115
|
+
|
|
116
|
+
```
|
|
117
|
+
discover
|
|
118
|
+
→ gather
|
|
119
|
+
→ claim extract
|
|
120
|
+
→ claim audit-density
|
|
121
|
+
→ claim triage
|
|
122
|
+
→ contradict map
|
|
123
|
+
→ contradict resolve
|
|
124
|
+
→ review
|
|
125
|
+
→ review-promote
|
|
126
|
+
→ gate
|
|
127
|
+
→ section report
|
|
128
|
+
→ audit
|
|
129
|
+
→ index build
|
|
130
|
+
→ cowork handoff
|
|
131
|
+
→ synth workspace
|
|
132
|
+
→ freeze
|
|
133
|
+
```
|
|
134
|
+
|
|
135
|
+
Ogni passaggio è un comando della riga di comando (CLI). Ogni passaggio scrive su file che possono essere solo aggiunti (append-only). Nessun passaggio sintetizza, risolve o crea nuove verità; questi vincoli sono applicati, non affidati. La revisione accetta, rifiuta o richiede una correzione delle affermazioni candidate; il "gate" utilizza queste decisioni di revisione per calcolare l'"idoneità alla sintesi"; la funzione "freeze" è il blocco finale di integrità che rifiuta di contrassegnare un pacchetto come completato a meno che tutti i livelli non siano d'accordo. Consultare [docs/dogfood-proof.md](docs/dogfood-proof.md) per la prova della catena v0.1, che ne garantisce la coerenza end-to-end.
|
|
136
|
+
|
|
137
|
+
Questa è l'alternativa strutturale a *ricerca → riepilogo → report dettagliato*. La catena è il prodotto.
|
|
138
|
+
|
|
139
|
+
## Vocabolario
|
|
129
140
|
|
|
130
141
|
| Termine | Significato |
|
|
131
142
|
|------|---------|
|
|
132
|
-
| `research-os` | Il piano di controllo /
|
|
133
|
-
| `research-pack` | L'artefatto del repository generato per uno
|
|
143
|
+
| `research-os` | Il piano di controllo / CLI / gate / legge di orchestrazione (questo repository) |
|
|
144
|
+
| `research-pack` | L'artefatto del repository generato per uno sforzo di ricerca |
|
|
134
145
|
| `research section` | Un'unità di indagine delimitata all'interno di un pacchetto |
|
|
135
|
-
| `research receipt` |
|
|
146
|
+
| `research receipt` | Prova che una sezione ha superato i controlli di fonte/affermazione/gate |
|
|
136
147
|
|
|
137
148
|
## Sicurezza
|
|
138
149
|
|
|
139
|
-
`research-os` è
|
|
150
|
+
`research-os` è un'interfaccia a riga di comando (CLI) locale. Legge e scrive file all'interno della directory del pacchetto di ricerca a cui la si indica e, quando si utilizza la funzione "gather", effettua richieste HTTP in uscita per recuperare gli URL delle fonti fornite. Non esegue un server, non accetta connessioni in entrata, non memorizza credenziali né invia dati di telemetria. Nessun segreto viene scritto negli artefatti del pacchetto. Consultare [SECURITY.md](SECURITY.md) per la politica di segnalazione delle vulnerabilità.
|
|
140
151
|
|
|
141
152
|
## Stato
|
|
142
153
|
|
|
143
|
-
**v0.
|
|
154
|
+
**v0.3.2** — Pubblicato su npm come `@mcptoolshop/research-os@0.3.2` il 9 maggio 2026. Include la normalizzazione dei reclami accettati, tenendo conto dell'ammissione per la pubblicazione del pacchetto. Il controllo di uguaglianza rigoroso tra `claim-reviews.jsonl` e `pack-audit.json::accepted_claims` è stato sostituito con un confronto di insiemi — i reclami accettati sono identificativi univoci (`claim_id`) la cui ultima decisione di revisione canonica è "accettato per la sintesi" (l'ultima decisione prevale per ogni `claim_id`). I pacchetti "congelati" la cui cronologia delle revisioni differisce dall'insieme normalizzato vengono ora ammessi con un avviso anziché essere rifiutati; il file di revisione precedente viene conservato integralmente (Legge 15), mentre il manifest dell'archivio riflette il conteggio normalizzato. Il rifiuto rimane inalterato per gli identificativi di reclamo "fantasma", le decisioni duplicate incompatibili e le condizioni non idonee per la sintesi. Ottenuto tramite l'Esperimento 3 XRPL pack Session K — la pubblicazione del pacchetto è stata rifiutata a causa di una reale discrepanza nel registro di chiusura (la sezione 07 conteneva 24 righe "accettate per la sintesi", ma solo 19 identificativi univoci (`claim_id`) a causa delle sovrapposizioni negli intervalli di revisione). 558/558 test vitest superati. Consultare [CHANGELOG.md](CHANGELOG.md) e [`docs/pack-publish.md`](docs/pack-publish.md).
|
|
155
|
+
|
|
156
|
+
**v0.3.1** — pubblicato su npm come `@mcptoolshop/research-os@0.3.1`, 9 maggio 2026. Include eccezioni specifiche per sezione per le fonti (`primary_source_waiver.section_waivers[]`) e un'approvazione da parte del revisore, in modo che una scoperta di "monopolio del cluster di fonti" a livello di sezione diventi un avvertimento visibile anziché indirizzare automaticamente tutte le affermazioni a "needs_source_repair". Ottenuto con l'esperimento 3 del pacchetto XRPL, sessione 2 — le sezioni relative al protocollo canonico (catene con una singola base, specifiche API a "giardino chiuso", documentazione di organismi di standardizzazione) hanno invertito l'assunzione che la diversità degli editori sia un indicatore della qualità della verità. 540/540 test vitest superati. Consultare [CHANGELOG.md](CHANGELOG.md) e [`docs/section-scoped-waivers.md`](docs/section-scoped-waivers.md).
|
|
157
|
+
|
|
158
|
+
**Eccezioni specifiche per sezione per le fonti** — Utilizzarle quando la diversità degli editori è strutturalmente incompatibile con la fonte di verità della sezione, non quando una sezione semplicemente non è riuscita a trovare abbastanza fonti. Schema con `reason` (motivo) e `compensating_controls[]` (controlli compensativi) obbligatori. La policy del pacchetto `primary_source_waiver_allowed: false` blocca sia le eccezioni a livello di pacchetto che quelle specifiche per sezione. Il workaround precedente alla v0.3.1, `min_independent_publishers: 0`, è ora obsoleto; i pacchetti "frozen" esistenti rimangono validi con le ricevute esistenti. Consultare [`docs/section-scoped-waivers.md`](docs/section-scoped-waivers.md) e il [manuale operativo dei pacchetti di ricerca](https://github.com/mcp-tool-shop-org/research-packs/blob/main/docs/operator-playbook.md).
|
|
159
|
+
|
|
160
|
+
**v0.3.0** — pubblicata il 2026-05-09. È stato introdotto il flag `--detector <auto|heuristic|ollama-intern>` in `contradict map` (correzione F-09 del blocco della catena proveniente dalla Sessione 1 dell'Esperimento 3, pacchetto XRPL). 527 test vitest superati. La selezione del rilevatore è ora una scelta esplicita da parte dell'operatore, invece di una dipendenza dallo stato e da variabili d'ambiente; la modalità viene visualizzata in modo chiaro ad ogni esecuzione. Consultare [`docs/contradict-map.md`](docs/contradict-map.md).
|
|
161
|
+
|
|
162
|
+
**v0.2.0** — pubblicata il 2026-05-09. Sono stati distribuiti il pacchetto `research-os pack publish` (Esperimento 2) e la correzione del predicato di prontezza del Pattern 2. 515 test vitest superati. Consultare [CHANGELOG.md](CHANGELOG.md). I pacchetti con stato finale vengono esportati nell'archivio canonico `research-packs` con un singolo comando; l'accordo contrattuale viene applicato tramite codice, non tramite una checklist. Consultare [`docs/pack-publish.md`](docs/pack-publish.md).
|
|
163
|
+
|
|
164
|
+
**v0.1.0** — pacchetto di test interno bloccato l'8 maggio 2026. Il pacchetto in `research-os-packs/research-os-spec/` (repository correlato) ha raggiunto lo stato finale con 296 affermazioni accettate in 8 sezioni, 17 risolte, 30 sovrascritte dall'operatore, 0 blocchi di riparazione attivi, 0 contraddizioni irrisolte, con tutte le condizioni (`synthesis_eligible=true`) soddisfatte. Sono state implementate sedici leggi fondamentali. Consultare [`docs/dogfood-proof.md`](docs/dogfood-proof.md) per i sette risultati e le informazioni sull'identificazione dello stato finale.
|
|
165
|
+
|
|
166
|
+
**Archivio monorepo dei pacchetti di ricerca** — disponibile su [`mcp-tool-shop-org/research-packs`](https://github.com/mcp-tool-shop-org/research-packs) con due pacchetti disponibili fin dal primo giorno. `comfyui-workflow-durability` (Esperimento 1, 302 affermazioni accettate, 8 sezioni) e `research-os-self-dogfood` (backfill v0.1 per i test interni, 296 affermazioni accettate, 8 sezioni). Entrambi i pacchetti superano il test `verify-pack.mjs`.
|
|
167
|
+
|
|
168
|
+
**Esperimento 1 (Durabilità del flusso di lavoro ComfyUI)** — CHIUSO il 9 maggio 2026. Tutte le 8 sezioni in Terminal A, pacchetto bloccato, archivio disponibile. Consultare [`docs/experiment-1-proof.md`](docs/experiment-1-proof.md) e [`docs/roadmap.md`](docs/roadmap.md).
|
|
144
169
|
|
|
145
|
-
### Cosa la versione 0.
|
|
170
|
+
### Cosa la versione 0.3 non è
|
|
146
171
|
|
|
147
|
-
- Non
|
|
148
|
-
- Non è
|
|
149
|
-
- Non è
|
|
150
|
-
- Non ha una stabilità dell'API conforme alla versione semantica. La versione 1.0.0 è uno stato da raggiungere, non una data specifica; consultare il file [`docs/roadmap.md`](docs/roadmap.md) per i cinque esperimenti che colmano questa lacuna.
|
|
172
|
+
- Non testato in condizioni reali da utenti esterni. Due cicli di test interni sono stati completati: uno auto-referenziale e uno relativo a un dominio esterno, e l'Esperimento 3 (stabilità dell'API sotto pressione esterna) è in corso: il pacchetto n. 2 di 3 (durabilità dei token creati per XRPL) è "congelato" con 251 reclami accettati in 7 sezioni, in attesa dell'ammissione per la pubblicazione su npm v0.3.2. Questo ciclo ha ottenuto il flag v0.3.0 `--detector` (F-09 chain-blocker), le esenzioni specifiche per sezione v0.3.1 (F-10/F-11 pressione sul protocollo canonico) e la normalizzazione dei reclami accettati v0.3.2 (F-36 registro di chiusura). È necessario un altro pacchetto relativo a un dominio esterno per completare l'Esperimento 3.
|
|
173
|
+
- Non è uno strumento per la scrittura di sintesi. Il comando `synth workspace` genera l'ambiente di lavoro strutturato; gli esseri umani (o Cowork) scrivono il testo in base agli identificativi dei reclami accettati.
|
|
174
|
+
- Non è stabile per l'API secondo il sistema semantico di versionamento. La versione 1.0.0 è uno stato da raggiungere, non una data specifica; consultare [`docs/roadmap.md`](docs/roadmap.md) per i sei esperimenti che colmano questa lacuna.
|
|
151
175
|
|
|
152
176
|
### Limitazioni note
|
|
153
177
|
|
|
154
|
-
- **L'origine
|
|
155
|
-
- **La selezione del modello di revisione
|
|
156
|
-
- **Il pacchetto di test
|
|
178
|
+
- **L'origine dei dati estratti non è visibile al livello di connessione.** Una sezione può superare la soglia delle affermazioni accettate facendo affidamento su affermazioni basate su euristiche quando l'estrazione calibrata (Ollama con il modello configurato) non è disponibile. Questo è stato registrato come Esperimento 4 nella roadmap; le future ottimizzazioni mostreranno le affermazioni accettate per ogni strumento di estrazione e richiederanno il numero di affermazioni accettate derivanti dal percorso calibrato.
|
|
179
|
+
- **La selezione del modello di revisione oltre al modello di riferimento calibrato `hermes-two-pass` non è ancora risolta.** Il ciclo di test interni ha validato una configurazione del revisore; modelli alternativi devono essere sottoposti a una calibrazione specifica per la rilevazione di errori prima di poter essere considerati affidabili. Questo è l'Esperimento 5 nella roadmap.
|
|
180
|
+
- **Il pacchetto di test interni v0.1 ha utilizzato `mistral-nemo:12b` per l'estrazione (il valore predefinito canonico è `hermes3:8b`).** `hermes3:8b` non era disponibile su questo sistema durante il ciclo v0.1. Questa dichiarazione di sostituzione rimane valida fino a quando non viene generato un risultato basato su hermes3; questo è l'Esperimento 6 nella roadmap. Per gli operatori che utilizzano sistemi senza `hermes3:8b`, impostare la variabile `OLLAMA_INTERN_MODEL` su un modello disponibile; le URL pre-configurate per l'operatore e la disciplina nella precisione delle query (vedere il manuale) mitigano le allucinazioni nella scoperta di argomenti ambigui.
|
|
157
181
|
|
|
158
182
|
## Roadmap per la versione 1.0
|
|
159
183
|
|
|
160
|
-
La versione 1.0 è uno stato
|
|
184
|
+
La versione 1.0 è uno stato raggiunto attraverso il lavoro svolto, non una data di rilascio. Tra la versione 0.1 e la 1.0 ci sono sei esperimenti in corso: un sistema di test interno non auto-referenziale (attualmente in fase di sviluppo come il pacchetto "ComfyUI workflow durability"), un comando `research-os pack publish` che automatizza l'esportazione nel repository centrale `research-packs` (Esperimento 2, limitato e dipendente dal completamento dell'Esperimento 1), stabilità dell'API sotto pressione esterna, colmare il divario sulla provenienza dei dati estratti, estendere la calibrazione dei revisori oltre il sistema `hermes-two-pass` e un test di base pulito su `hermes3:8b`. L'Esperimento 1 non è completato al momento del "congelamento" del pacchetto; si conclude quando il pacchetto "congelato" viene distribuito come il primo pacchetto nel repository centrale `research-packs`, insieme al pacchetto di test interno della versione 0.1. Il piano completo è disponibile in [`docs/roadmap.md`](docs/roadmap.md). L'architettura rimane invariata; la versione 1.0 approfondisce ciò che la versione 0.1 ha dimostrato, piuttosto che riaprire vecchie questioni.
|
|
161
185
|
|
|
162
186
|
## Licenza
|
|
163
187
|
|
package/README.ja.md
CHANGED
|
@@ -7,7 +7,7 @@
|
|
|
7
7
|
</p>
|
|
8
8
|
|
|
9
9
|
<p align="center">
|
|
10
|
-
<a href="https://github.com/mcp-tool-shop-org/research-os/releases/tag/v0.
|
|
10
|
+
<a href="https://github.com/mcp-tool-shop-org/research-os/releases/tag/v0.3.2"><img src="https://img.shields.io/badge/version-0.3.2-blue" alt="version 0.3.2"></a>
|
|
11
11
|
<a href="https://github.com/mcp-tool-shop-org/research-os/actions/workflows/ci.yml"><img src="https://github.com/mcp-tool-shop-org/research-os/actions/workflows/ci.yml/badge.svg" alt="CI"></a>
|
|
12
12
|
<a href="LICENSE"><img src="https://img.shields.io/badge/license-MIT-green" alt="MIT License"></a>
|
|
13
13
|
<img src="https://img.shields.io/badge/node-%E2%89%A520-brightgreen" alt="Node ≥20">
|
|
@@ -24,7 +24,67 @@
|
|
|
24
24
|
|
|
25
25
|
これはレポート生成ツールではありません。また、LLMのオーケストレーションのフレームワークでもありません。あなたの統合作業を自動化するものでもありません。`research-os`は、統合作業を開始するための条件を強制します。
|
|
26
26
|
|
|
27
|
-
|
|
27
|
+
Frozen packs(凍結されたパッケージ)は、[`mcp-tool-shop-org/research-packs`](https://github.com/mcp-tool-shop-org/research-packs)にアーカイブされており、ライブで公開されています。最初の2つのパッケージが含まれています。v1.0のロードマップについては、[`docs/roadmap.md`](docs/roadmap.md)を参照してください。
|
|
28
|
+
|
|
29
|
+
v0.1は、2つの内部テスト(dogfood)で検証されました。最初のテストでは、research-os自体の仕様を調査した結果、v0.1.0のリリース前に7つの問題点が発見され、それぞれにコード修正が必要となり、新たなルールや統合パターンが導入されました。2番目のテスト(v1 Experiment 1:ComfyUIワークフローの安定性、11セッション、research-osとの語彙の重複がない環境)は、2026年5月9日に完了し、パッケージが凍結され、アーカイブが公開され、パターン2の適用がコミット`22b5dba`によって完了しました。v0.1の検証結果は、[`docs/dogfood-proof.md`](docs/dogfood-proof.md)に、Experiment 1の検証結果は、[`docs/experiment-1-proof.md`](docs/experiment-1-proof.md)に記載されています。ハンドブックは、<https://mcp-tool-shop-org.github.io/research-os/handbook/>で確認できます。
|
|
30
|
+
|
|
31
|
+
## インストール
|
|
32
|
+
|
|
33
|
+
**必要条件:** Node.js ≥ 20
|
|
34
|
+
|
|
35
|
+
```bash
|
|
36
|
+
npm install -g @mcptoolshop/research-os
|
|
37
|
+
```
|
|
38
|
+
|
|
39
|
+
ソースコードからビルドする場合:
|
|
40
|
+
|
|
41
|
+
```bash
|
|
42
|
+
git clone https://github.com/mcp-tool-shop-org/research-os.git
|
|
43
|
+
cd research-os
|
|
44
|
+
npm install
|
|
45
|
+
npm run build
|
|
46
|
+
npm link
|
|
47
|
+
```
|
|
48
|
+
|
|
49
|
+
## クイックスタート
|
|
50
|
+
|
|
51
|
+
```bash
|
|
52
|
+
# Create a new research-pack
|
|
53
|
+
research-os init "How should X be structured?"
|
|
54
|
+
|
|
55
|
+
# Add a section
|
|
56
|
+
research-os section add 01-landscape --purpose "Map the current landscape"
|
|
57
|
+
|
|
58
|
+
# Discover and approve sources, then gather
|
|
59
|
+
research-os discover run 01-landscape
|
|
60
|
+
research-os discover approve 01-landscape --top 8
|
|
61
|
+
research-os gather 01-landscape --approved
|
|
62
|
+
|
|
63
|
+
# Run the per-section chain
|
|
64
|
+
research-os claim extract 01-landscape
|
|
65
|
+
research-os claim audit-density 01-landscape
|
|
66
|
+
research-os claim triage 01-landscape
|
|
67
|
+
research-os contradict map 01-landscape --triaged-only
|
|
68
|
+
research-os review 01-landscape --triaged-only --preset hermes-two-pass --profile hermes-two-pass
|
|
69
|
+
research-os review-promote 01-landscape --profile hermes-two-pass
|
|
70
|
+
research-os gate 01-landscape
|
|
71
|
+
research-os section report 01-landscape
|
|
72
|
+
|
|
73
|
+
# Pack-level finish
|
|
74
|
+
research-os audit
|
|
75
|
+
research-os index build --all
|
|
76
|
+
research-os cowork handoff
|
|
77
|
+
research-os synth workspace # only if handoff returned synthesis_ready
|
|
78
|
+
research-os freeze
|
|
79
|
+
|
|
80
|
+
# Export to the research-packs archive
|
|
81
|
+
research-os pack publish \
|
|
82
|
+
--to <research-packs>/packages/<name>
|
|
83
|
+
```
|
|
84
|
+
|
|
85
|
+
**具体的な使用例**については、`research-os-packs/research-os-spec/` にある「dogfood」と呼ばれるパッケージを参照してください。このパッケージには、すべてのファイル、すべての記録、すべての処理結果、すべての固定状態のフィンガープリントなどが、追記のみ可能なファイルとして保存されています。このパッケージによって、`docs/dogfood-proof.md` が生成されました。
|
|
86
|
+
|
|
87
|
+
**LLM(大規模言語モデル)の抽出、トリアージ、レビュー、および発見には、ローカルで実行されている [ollama-intern-mcp](https://github.com/mcp-tool-shop-org/ollama-intern-mcp) が必要です。** デフォルトのモデルは `hermes3:8b` です。別のモデルを使用する場合は、`OLLAMA_INTERN_MODEL=<モデル名>` で指定してください。Ollamaがデフォルトの `localhost:11434` 以外の場所で実行されている場合は、`OLLAMA_HOST` 環境変数を設定してください。
|
|
28
88
|
|
|
29
89
|
## 16の重要な原則
|
|
30
90
|
|
|
@@ -76,55 +136,6 @@ discover
|
|
|
76
136
|
|
|
77
137
|
これは、*検索 → 要約 → 報告書作成* という従来のプロセスに対する構造的な代替手段です。このプロセス全体が「チェーン」として機能し、その結果が製品となります。
|
|
78
138
|
|
|
79
|
-
## インストール
|
|
80
|
-
|
|
81
|
-
**必要条件:** Node.js ≥ 20
|
|
82
|
-
|
|
83
|
-
```bash
|
|
84
|
-
# From source (v0.1.0 is not yet published to npm)
|
|
85
|
-
git clone https://github.com/mcp-tool-shop-org/research-os.git
|
|
86
|
-
cd research-os
|
|
87
|
-
npm install
|
|
88
|
-
npm run build
|
|
89
|
-
npm link # makes `research-os` available on your PATH
|
|
90
|
-
```
|
|
91
|
-
|
|
92
|
-
## クイックスタート
|
|
93
|
-
|
|
94
|
-
```bash
|
|
95
|
-
# Create a new research-pack
|
|
96
|
-
research-os init "How should X be structured?"
|
|
97
|
-
|
|
98
|
-
# Add a section
|
|
99
|
-
research-os section add 01-landscape --purpose "Map the current landscape"
|
|
100
|
-
|
|
101
|
-
# Discover and approve sources, then gather
|
|
102
|
-
research-os discover run 01-landscape
|
|
103
|
-
research-os discover approve 01-landscape --top 8
|
|
104
|
-
research-os gather 01-landscape --approved
|
|
105
|
-
|
|
106
|
-
# Run the per-section chain
|
|
107
|
-
research-os claim extract 01-landscape
|
|
108
|
-
research-os claim audit-density 01-landscape
|
|
109
|
-
research-os claim triage 01-landscape
|
|
110
|
-
research-os contradict map 01-landscape --triaged-only
|
|
111
|
-
research-os review 01-landscape --triaged-only --preset hermes-two-pass --profile hermes-two-pass
|
|
112
|
-
research-os review-promote 01-landscape --profile hermes-two-pass
|
|
113
|
-
research-os gate 01-landscape
|
|
114
|
-
research-os section report 01-landscape
|
|
115
|
-
|
|
116
|
-
# Pack-level finish
|
|
117
|
-
research-os audit
|
|
118
|
-
research-os index build --all
|
|
119
|
-
research-os cowork handoff
|
|
120
|
-
research-os synth workspace # only if handoff returned synthesis_ready
|
|
121
|
-
research-os freeze
|
|
122
|
-
```
|
|
123
|
-
|
|
124
|
-
**具体的な使用例**については、`research-os-packs/research-os-spec/` にある「dogfood」と呼ばれるパッケージを参照してください。このパッケージには、すべてのファイル、すべての記録、すべての処理結果、すべての固定状態のフィンガープリントなどが、追記のみ可能なファイルとして保存されています。このパッケージによって、`docs/dogfood-proof.md` が生成されました。
|
|
125
|
-
|
|
126
|
-
**LLM(大規模言語モデル)の抽出、トリアージ、レビュー、および発見には、ローカルで実行されている [ollama-intern-mcp](https://github.com/mcp-tool-shop-org/ollama-intern-mcp) が必要です。** デフォルトのモデルは `hermes3:8b` です。別のモデルを使用する場合は、`OLLAMA_INTERN_MODEL=<モデル名>` で指定してください。Ollamaがデフォルトの `localhost:11434` 以外の場所で実行されている場合は、`OLLAMA_HOST` 環境変数を設定してください。
|
|
127
|
-
|
|
128
139
|
## 用語集
|
|
129
140
|
|
|
130
141
|
| 用語 | 意味 |
|
|
@@ -140,20 +151,37 @@ research-os freeze
|
|
|
140
151
|
|
|
141
152
|
## ステータス
|
|
142
153
|
|
|
154
|
+
**v0.3.2** — 2026年5月9日に、`@mcptoolshop/research-os@0.3.2`としてnpmに公開されました。`pack publish`の許可に関する、正規化された承認処理が実装されました。`claim-reviews.jsonl`と`pack-audit.json::accepted_claims`の厳密な一致チェックは、効果的な集合比較に置き換えられました。承認されたクレームは、最新の正当なレビュー結果が`accepted_for_synthesis`である一意の`claim_id`の集合です(`claim_id`ごとに最新の決定が優先されます)。以前の監査数が効果的な集合と異なる凍結されたパッケージは、拒否する代わりに警告を表示します。古い監査ファイルは変更せずに保持されます(ルール15)、ただし、アーカイブのマニフェストには正規化された数が反映されます。フェイクの`claim_id`、互換性のない重複した決定、および合成対象外の条件に対する拒否は引き続き適用されます。Experiment 3 XRPLパッケージのSession Kで、実際のクロージャー・レジャーの不一致により、パッケージの公開が拒否されました(セクション07には24件の`accepted_for_synthesis`の行がありましたが、重複するレビュー担当者によるため、一意の`claim_id`は19件のみでした)。558/558のvitestが成功しました。詳細については、[CHANGELOG.md](CHANGELOG.md)と[`docs/pack-publish.md`](docs/pack-publish.md)を参照してください。
|
|
155
|
+
|
|
156
|
+
**v0.3.1** — 2026年5月9日に、`@mcptoolshop/research-os@0.3.1`としてnpmに公開されました。セクションごとに適用されるソースコードの免除(`primary_source_waiver.section_waivers[]`)と、レビュー担当者による確認機能が追加されました。これにより、セクション全体で`source_cluster_monopoly`の違反が検出された場合でも、自動的にすべてのクレームを`needs_source_repair`に振り分けるのではなく、注意点として表示されるようになりました。Experiment 3 XRPLパッケージのSession 2で、canonical-protocolセクション(単一の基盤チェーン、クローズドなAPI仕様、標準化団体のドキュメント)において、パブリッシャーの多様性が真の品質の指標であるという前提が覆されました。当時、540/540のvitestが成功しました。詳細については、[`docs/section-scoped-waivers.md`](docs/section-scoped-waivers.md)を参照してください。
|
|
157
|
+
|
|
158
|
+
**セクションごとのソースコード免除** — パブリッシャーの多様性がセクションの真のソースと構造的に互換性がない場合にのみ使用します。セクションが単に十分なソースを見つけられなかった場合ではありません。スキーマによって強制される`reason`と、空でない`compensating_controls[]`が必要です。パッケージポリシー`primary_source_waiver_allowed: false`は、パッケージレベルおよびセクションごとの免除の両方をブロックします。v0.3.1以前のパッケージレベルの`min_independent_publishers: 0`の回避策は、現在非推奨です。既存の凍結されたパッケージは、既存のレシートに基づいて有効です。詳細については、[`docs/section-scoped-waivers.md`](docs/section-scoped-waivers.md)と、[research-packsオペレータープレイブック](https://github.com/mcp-tool-shop-org/research-packs/blob/main/docs/operator-playbook.md)を参照してください。
|
|
159
|
+
|
|
160
|
+
**v0.3.0** — 2026年5月9日に公開されました。`contradict map`に、`--detector <auto|heuristic|ollama-intern>`フラグが追加されました(Experiment 3 Session 1、XRPLパッケージのF-09チェーンブロッカーの修正)。当時、527/527のvitestが成功しました。検出器の選択は、以前の状態に依存する環境変数ではなく、オペレーターが明示的に選択するようになりました。モードは、実行ごとに可視化されます。詳細については、[`docs/contradict-map.md`](docs/contradict-map.md)を参照してください。
|
|
161
|
+
|
|
162
|
+
**v0.2.0** — 2026年5月9日に公開。`research-os pack publish` (実験2) と、Pattern 2 の準備状態に関する問題を修正しました。515件中515件の vitest テストが合格しました。詳細は [CHANGELOG.md](CHANGELOG.md) を参照してください。パッケージの公開は、単一のコマンドで標準の `research-packs` アーカイブにエクスポートされます。契約の遵守は、チェックリストではなくコードによって強制されます。詳細は [`docs/pack-publish.md`](docs/pack-publish.md) を参照してください。
|
|
163
|
+
|
|
143
164
|
**v0.1.0** — 2026年5月8日に固定されました。`research-os-packs/research-os-spec/` (関連リポジトリ) にある「dogfood」パッケージでは、8つのセクションで296件の主張が承認され、17件が処理され、30件がオペレーターによって修正され、未解決の矛盾は0件、すべてのゲートで `synthesis_eligible=true` となりました。463件中463件のvitestテストが合格しました。16個の重要なルールが実装されています。詳細については、[docs/dogfood-proof.md](docs/dogfood-proof.md) を参照してください。このドキュメントには、7つの発見事項と、固定状態のフィンガープリントが記載されています。
|
|
144
165
|
|
|
166
|
+
**research-packs アーカイブ (モノレポ)** — [`mcp-tool-shop-org/research-packs`](https://github.com/mcp-tool-shop-org/research-packs) で公開されており、リリース時に2つのパッケージが提供されています。`comfyui-workflow-durability` (実験1、302件の承認済みクレーム、8セクション) と `research-os-self-dogfood` (v0.1 のドッグフード版、296件の承認済みクレーム、8セクション)。どちらのパッケージも `verify-pack.mjs` をパスしています。
|
|
167
|
+
|
|
168
|
+
**v1 実験1 (ComfyUI ワークフローの安定性)** — 2026年5月9日に終了。8つのセクションすべてが Terminal A で完了し、パッケージは凍結され、アーカイブは公開されました。詳細は [`docs/experiment-1-proof.md`](docs/experiment-1-proof.md) と [`docs/roadmap.md`](docs/roadmap.md) を参照してください。
|
|
169
|
+
|
|
145
170
|
### v0.1の制限事項
|
|
146
171
|
|
|
147
|
-
-
|
|
148
|
-
-
|
|
149
|
-
-
|
|
150
|
-
- APIの安定性はありません(セマンティックバージョニングに準拠していません)。外部ユーザーによる検証が完了した後、v1.0.0 がリリースされます。
|
|
172
|
+
- 外部ユーザーによる実証テストはまだ行われていません。2つのドッグフードテストが完了しました。1つは自己参照型、もう1つは外部ドメイン型です。実験3 (外部からのプレッシャー下での API の安定性) は現在進行中です。パッケージ #2 (XRPL クリエイタートークンの安定性) が251件の承認済みクレーム(7セクション)で凍結されており、npm v0.3.2 に対するパッケージ公開の承認を待っています。このテストでは、v0.3.0 の `--detector` フラグ (F-09 チェーンブロッカー)、v0.3.1 のセクションスコープのソースに関する免責事項 (F-10/F-11 カンニングプロトコルに関するプレッシャー)、および v0.3.2 の標準化された承認済みクレームの会計処理 (F-36 クローズジャーレッジシーム) が完了しました。実験3を完了するには、外部ドメインのパッケージがさらに1つ必要です。
|
|
173
|
+
- 文章生成機能はありません。`synth workspace` コマンドは構造化されたワークスペースを生成しますが、文章は人間(または Cowork)が、承認済みクレームの ID に基づいて記述します。
|
|
174
|
+
- セマンティックバージョニング (semver) に基づく API の安定性はありません。v1.0.0 は、カレンダーの日付ではなく、達成された状態です。詳細は [`docs/roadmap.md`](docs/roadmap.md) に記載されている、そのギャップを埋める6つの実験を参照してください。
|
|
151
175
|
|
|
152
176
|
### 既知の制限事項
|
|
153
177
|
|
|
154
|
-
-
|
|
155
|
-
-
|
|
156
|
-
-
|
|
178
|
+
- **抽出元の情報が、ゲートシームでは表示されません。** セクションは、キャリブレーションされた抽出器 (Ollama と設定されたモデル) が利用できない場合に、ヒューリスティックに基づく代替クレームに依存して、承認済みクレームの基準を満たすことができます。これは、ロードマップの実験4として記録されています。今後の改善により、承認済みクレームは抽出器ごとに報告され、基準を満たす数の承認済みクレームが、キャリブレーションされたパスから取得されるようになります。
|
|
179
|
+
- **キャリブレーションされた `hermes-two-pass` を基準とする、レビューモデルの選択は未解決です。** ドッグフードテストでは、1つのレビュー設定が検証されました。代替モデルは、信頼できるようになる前に、独自のシードされた失敗の再現キャリブレーションが必要です。これは、ロードマップの実験5です。
|
|
180
|
+
- **v0.1 の自己ドッグフードパッケージでは、抽出に `mistral-nemo:12b` が使用されました (標準のデフォルトは `hermes3:8b`)。** v0.1 のテスト期間中、この環境では `hermes3:8b` が利用できませんでした。この代替の使用に関する情報は、`hermes3` ベースの記録が作成されるまで有効です。`hermes3:8b` が利用できない環境では、`OLLAMA_INTERN_MODEL` を利用可能なモデルに設定してください。オペレーターが事前に設定した URL と、クエリの精度に関するルール (ハンドブックを参照) を使用することで、あいまいなトピックに関する誤った情報の検出を軽減できます。
|
|
181
|
+
|
|
182
|
+
## v1.0 へのロードマップ
|
|
183
|
+
|
|
184
|
+
v1.0は、単なるリリース日ではなく、達成される状態です。v0.1からv1.0までの間に、6つの実験段階があります。これには、自己参照を含まない内部テスト(現在はComfyUIワークフローの安定性向上パックとして進行中)、`research-os pack publish`コマンドによる、標準的な`research-packs`モノレポへの自動エクスポート(実験2。実験1の手動での完了処理の後に行われる)、外部からのプレッシャーに対するAPIの安定性、抽出元の追跡機能の確立、`hermes-two-pass`を超えるレビューアの調整の一般化、そして`hermes3:8b`上でのクリーンなベースラインの実行が含まれます。実験1は、パッケージの最終版が作成される前に完了しません。これは、v0.1の内部テストが完了し、`research-packs`モノレポの最初のパッケージとしてリリースされる際に終了します。詳細な計画は、[`docs/roadmap.md`](docs/roadmap.md)に記載されています。アーキテクチャの設計は一貫して維持され、v1.0は、v0.1で検証された内容をさらに深めるものであり、以前の段階を再検討するものではありません。
|
|
157
185
|
|
|
158
186
|
## ライセンス
|
|
159
187
|
|
package/README.md
CHANGED
|
@@ -7,7 +7,7 @@
|
|
|
7
7
|
</p>
|
|
8
8
|
|
|
9
9
|
<p align="center">
|
|
10
|
-
<a href="https://github.com/mcp-tool-shop-org/research-os/releases/tag/v0.3.
|
|
10
|
+
<a href="https://github.com/mcp-tool-shop-org/research-os/releases/tag/v0.3.2"><img src="https://img.shields.io/badge/version-0.3.2-blue" alt="version 0.3.2"></a>
|
|
11
11
|
<a href="https://github.com/mcp-tool-shop-org/research-os/actions/workflows/ci.yml"><img src="https://github.com/mcp-tool-shop-org/research-os/actions/workflows/ci.yml/badge.svg" alt="CI"></a>
|
|
12
12
|
<a href="LICENSE"><img src="https://img.shields.io/badge/license-MIT-green" alt="MIT License"></a>
|
|
13
13
|
<img src="https://img.shields.io/badge/node-%E2%89%A520-brightgreen" alt="Node ≥20">
|
|
@@ -151,9 +151,13 @@ This is the structural alternative to *search → summarize → pretty report*.
|
|
|
151
151
|
|
|
152
152
|
## Status
|
|
153
153
|
|
|
154
|
-
**v0.3.
|
|
154
|
+
**v0.3.2** — published to npm as `@mcptoolshop/research-os@0.3.2`, 2026-05-09. Ships normalized accepted-claim accounting for `pack publish` admission. The strict equality check between `claim-reviews.jsonl` and `pack-audit.json::accepted_claims` is replaced with an effective-set comparison — accepted claims are unique `claim_id`s whose latest canonical review decision is `accepted_for_synthesis` (latest-decision-wins per `claim_id`). Frozen packs whose legacy audit count differs from the effective set now admit with a warning rather than refusing; the legacy audit file is preserved verbatim (Law 15) while the archive manifest reflects the normalized count. Refusal stays hard for phantom claim_ids, incompatible duplicate decisions, and non-synthesis-eligible gates. Earned by Experiment 3 XRPL pack Session K — pack publish refused on a real closure-ledger seam disagreement (Section 07 had 24 raw `accepted_for_synthesis` rows but only 19 unique `claim_id`s due to overlapping reviewer windows). 558/558 vitest passing. See [CHANGELOG.md](CHANGELOG.md) and [`docs/pack-publish.md`](docs/pack-publish.md).
|
|
155
155
|
|
|
156
|
-
|
|
156
|
+
**v0.3.1** — published to npm as `@mcptoolshop/research-os@0.3.1`, 2026-05-09. Ships section-scoped source-floor waivers (`primary_source_waiver.section_waivers[]`) plus reviewer-side acknowledgement so a waived section-wide `source_cluster_monopoly` finding becomes a visible caveat rather than auto-routing all claims to `needs_source_repair`. Earned by Experiment 3 XRPL pack Session 2 — canonical-protocol sections (single-foundation chains, walled-garden API specs, standards-body docs) inverted the assumption that publisher diversity is a proxy for truth quality. 540/540 vitest passing then. See [`docs/section-scoped-waivers.md`](docs/section-scoped-waivers.md).
|
|
157
|
+
|
|
158
|
+
**Section-scoped source waivers** — Use them when publisher diversity is structurally incompatible with the section's truth source, not when a section merely failed to find enough sources. Schema-enforced `reason` + non-empty `compensating_controls[]`. Pack policy `primary_source_waiver_allowed: false` blocks both pack-level and section-scoped waivers. The pre-v0.3.1 pack-level `min_independent_publishers: 0` workaround is now deprecated; existing frozen packs remain valid under their existing receipts. See [`docs/section-scoped-waivers.md`](docs/section-scoped-waivers.md) and the [research-packs operator playbook](https://github.com/mcp-tool-shop-org/research-packs/blob/main/docs/operator-playbook.md).
|
|
159
|
+
|
|
160
|
+
**v0.3.0** — published 2026-05-09. Shipped the `--detector <auto|heuristic|ollama-intern>` flag on `contradict map` (F-09 chain-blocker fix from Experiment 3 Session 1, XRPL pack). 527/527 vitest then. Detector selection is now an explicit operator choice instead of a state-dependent env-var dance; mode is announced visibly on every run. See [`docs/contradict-map.md`](docs/contradict-map.md).
|
|
157
161
|
|
|
158
162
|
**v0.2.0** — published 2026-05-09. Shipped `research-os pack publish` (Experiment 2) and the Pattern 2 readiness predicate fix. 515/515 vitest passing then. See [CHANGELOG.md](CHANGELOG.md). Frozen packs export to the canonical `research-packs` archive with a single command; admission contract is enforced by code, not checklist. See [`docs/pack-publish.md`](docs/pack-publish.md).
|
|
159
163
|
|
|
@@ -165,7 +169,7 @@ This is the structural alternative to *search → summarize → pretty report*.
|
|
|
165
169
|
|
|
166
170
|
### What v0.3 is not
|
|
167
171
|
|
|
168
|
-
- Not battle-tested by external users. Two dogfood arcs have closed — one self-referential, one external-domain — and Experiment 3 (API stability under external pressure) is in progress: pack #
|
|
172
|
+
- Not battle-tested by external users. Two dogfood arcs have closed — one self-referential, one external-domain — and Experiment 3 (API stability under external pressure) is in progress: pack #2 of 3 (XRPL creator-token durability) is frozen with 251 accepted claims across 7 sections, awaiting pack publish admission against npm v0.3.2. The arc has earned the v0.3.0 `--detector` flag (F-09 chain-blocker), the v0.3.1 section-scoped source waivers (F-10/F-11 canonical-protocol pressure), and the v0.3.2 normalized accepted-claim accounting (F-36 closure-ledger seam). One more external-domain pack required for Experiment 3 closure.
|
|
169
173
|
- Not a synthesis writer. The `synth workspace` command generates the structured workspace; humans (or Cowork) write the prose against accepted claim IDs.
|
|
170
174
|
- Not API-stable under semver. v1.0.0 is an earned state, not a calendar date — see [`docs/roadmap.md`](docs/roadmap.md) for the six experiments that close the gap.
|
|
171
175
|
|