@mcptoolshop/research-os 0.3.1 → 0.3.3
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
- package/CHANGELOG.md +181 -0
- package/README.es.md +101 -71
- package/README.fr.md +88 -58
- package/README.hi.md +85 -59
- package/README.it.md +99 -73
- package/README.ja.md +88 -58
- package/README.md +7 -3
- package/README.pt-BR.md +85 -59
- package/README.zh.md +104 -74
- package/dist/cli.js +123 -40
- package/dist/cli.js.map +1 -1
- package/dist/index.d.ts +13 -1
- package/dist/index.js +28 -26
- package/dist/index.js.map +1 -1
- package/package.json +1 -1
package/README.it.md
CHANGED
|
@@ -7,7 +7,7 @@
|
|
|
7
7
|
</p>
|
|
8
8
|
|
|
9
9
|
<p align="center">
|
|
10
|
-
<a href="https://github.com/mcp-tool-shop-org/research-os/releases/tag/v0.
|
|
10
|
+
<a href="https://github.com/mcp-tool-shop-org/research-os/releases/tag/v0.3.3"><img src="https://img.shields.io/badge/version-0.3.3-blue" alt="version 0.3.3"></a>
|
|
11
11
|
<a href="https://github.com/mcp-tool-shop-org/research-os/actions/workflows/ci.yml"><img src="https://github.com/mcp-tool-shop-org/research-os/actions/workflows/ci.yml/badge.svg" alt="CI"></a>
|
|
12
12
|
<a href="LICENSE"><img src="https://img.shields.io/badge/license-MIT-green" alt="MIT License"></a>
|
|
13
13
|
<img src="https://img.shields.io/badge/node-%E2%89%A520-brightgreen" alt="Node ≥20">
|
|
@@ -16,77 +16,34 @@
|
|
|
16
16
|
|
|
17
17
|
# research-os
|
|
18
18
|
|
|
19
|
-
Un'interfaccia a riga di comando (CLI) che trasforma un argomento
|
|
19
|
+
Un'interfaccia a riga di comando (CLI) che trasforma un argomento di ricerca in un "**pacchetto di ricerca**" strutturato, ovvero un repository organizzato in cui Claude, Cowork o un sistema simile possono lavorare per ore senza generare risultati errati o superficiali.
|
|
20
20
|
|
|
21
21
|
## Cos'è
|
|
22
22
|
|
|
23
|
-
`research-os` è il
|
|
23
|
+
`research-os` è il livello di controllo che interviene tra la richiesta "Voglio ricercare X" e una base di dati strutturata e verificabile. Separa le ipotesi iniziali dalle prove raccolte, l'estrazione dei dati dalle affermazioni verificate, il rilevamento delle contraddizioni dalla loro risoluzione e le decisioni di revisione dalle conclusioni finali. Ogni passaggio viene registrato in un registro immutabile; ogni valutazione di disponibilità è calcolata a partire da questi registri, e non è una semplice affermazione.
|
|
24
24
|
|
|
25
|
-
Non è un generatore di report. Non è un framework
|
|
25
|
+
Non è un generatore di report. Non è un framework per l'orchestrazione di modelli linguistici di grandi dimensioni (LLM). Non scrive la sintesi per te. Impone le condizioni necessarie per l'inizio della sintesi.
|
|
26
26
|
|
|
27
|
-
|
|
27
|
+
I pacchetti finalizzati vengono archiviati in [`mcp-tool-shop-org/research-packs`](https://github.com/mcp-tool-shop-org/research-packs) e sono disponibili, con due pacchetti iniziali. Consultare [`docs/roadmap.md`](docs/roadmap.md) per la roadmap della versione 1.0.
|
|
28
28
|
|
|
29
|
-
|
|
30
|
-
|
|
31
|
-
| # | Legge |
|
|
32
|
-
|---|-----|
|
|
33
|
-
| 1 | Nessuna sintesi prima della verifica delle fonti. |
|
|
34
|
-
| 2 | La raccolta è una prova; l'estrazione è un'interpretazione. |
|
|
35
|
-
| 3 | I modelli possono interpretare porzioni di testo originale; non possono creare porzioni di testo che costituiscono una prova. |
|
|
36
|
-
| 4 | L'estrazione può produrre un eccesso di informazioni; la sintesi non può ereditare questa abbondanza. |
|
|
37
|
-
| 5 | La mappatura delle contraddizioni evidenzia le discrepanze; non le risolve, non le sintetizza e non decide quale affermazione è corretta. |
|
|
38
|
-
| 6 | I controlli determinano se una sezione è idonea per la sintesi. Non eseguono la sintesi né nascondono i fallimenti. |
|
|
39
|
-
| 7 | La revisione critica valuta l'integrità della ricerca. Non esegue la sintesi né riscrive il testo originale. |
|
|
40
|
-
| 8 | L'indicizzazione rende la ricerca di informazioni basata su prove possibile. Non crea nuove informazioni né diventa la fonte ufficiale. |
|
|
41
|
-
| 9 | La funzione di trasferimento a Cowork genera istruzioni operative a partire dalle informazioni verificate. Non crea informazioni né aggira i controlli. |
|
|
42
|
-
| 10 | L'ambiente di lavoro per la sintesi organizza le informazioni verificate per Cowork. Non esegue la sintesi né aggira la modalità di trasferimento. |
|
|
43
|
-
| 11 | L'audit del pacchetto aggrega le informazioni verificate esistenti. Non crea nuove informazioni né nasconde le prove a livello di sezione. |
|
|
44
|
-
| 12 | La fase di scoperta propone spunti; solo la raccolta produce prove. |
|
|
45
|
-
| 13 | Un revisore non è considerato affidabile finché non vengono dimostrati dei fallimenti e la sua capacità di rilevarli. |
|
|
46
|
-
| 14 | L'abbondanza di affermazioni non è sinonimo di qualità della ricerca. Le affermazioni devono essere verificate prima di poter essere considerate per la sintesi. |
|
|
47
|
-
| 15 | La fase di consolidamento blocca le informazioni verificate. Non completa la ricerca incompleta né converte lo stato di riparazione in prove. |
|
|
48
|
-
| 16 | Le eccezioni allentano i vincoli delle fonti; non possono creare prove. |
|
|
49
|
-
|
|
50
|
-
**Legge 3** — il modello linguistico non crea mai il testo delle prove. `research-os` crea un registro di estratti deterministico (con ID stabili come `ex_<source_id_hex>_001`); il modello linguistico seleziona gli ID degli estratti; `research-os` copia il testo letterale. La classe di errore "parafrasi come citazione" è strutturalmente impossibile.
|
|
51
|
-
|
|
52
|
-
**Legge 14** — tra l'estrazione e la revisione, `research-os claim triage` deduplica, limita il contributo per fonte e mette da parte i candidati meno promettenti. La fase di triage NON modifica `claims.jsonl`; le affermazioni messe da parte rimangono nel registro principale.
|
|
53
|
-
|
|
54
|
-
## La sequenza di lavoro della versione 0.1
|
|
55
|
-
|
|
56
|
-
```
|
|
57
|
-
discover
|
|
58
|
-
→ gather
|
|
59
|
-
→ claim extract
|
|
60
|
-
→ claim audit-density
|
|
61
|
-
→ claim triage
|
|
62
|
-
→ contradict map
|
|
63
|
-
→ contradict resolve
|
|
64
|
-
→ review
|
|
65
|
-
→ review-promote
|
|
66
|
-
→ gate
|
|
67
|
-
→ section report
|
|
68
|
-
→ audit
|
|
69
|
-
→ index build
|
|
70
|
-
→ cowork handoff
|
|
71
|
-
→ synth workspace
|
|
72
|
-
→ freeze
|
|
73
|
-
```
|
|
74
|
-
|
|
75
|
-
Ogni passaggio è un comando da riga di comando. Ogni passaggio scrive su artefatti che possono essere solo aggiunti, non modificati. Nessun passaggio sintetizza, risolve o crea nuove verità; questi vincoli sono applicati, non considerati come affidabili. La fase di revisione accetta, rifiuta o richiede modifiche alle proposte; la fase di "gate" utilizza queste decisioni per calcolare l'idoneità alla sintesi; la fase di "freeze" è il blocco finale di integrità che impedisce di considerare un pacchetto come completato a meno che tutti i livelli non siano d'accordo. Consultare il file [docs/dogfood-proof.md](docs/dogfood-proof.md) per la documentazione della versione 0.1 che dimostra la coerenza dell'intera catena.
|
|
76
|
-
|
|
77
|
-
Questa è un'alternativa strutturale a *ricerca → riepilogo → report dettagliato*. La catena è il prodotto.
|
|
29
|
+
La versione 0.1 è stata testata in due cicli di "dogfooding". Il primo, che consisteva nella ricerca sulla propria specifica, ha identificato sette errori prima del rilascio della versione 0.1.0, ognuno dei quali ha richiesto una correzione del codice e ha portato all'implementazione di una regola o di un modello di integrazione. Il secondo (Esperimento 1: Durabilità del flusso di lavoro ComfyUI, 11 sessioni, un dominio senza sovrapposizioni lessicali con research-os) è stato completato il 2026-05-09: il pacchetto è stato finalizzato e l'archivio è attivo; l'applicazione della regola 2 è stata completata tramite il commit `22b5dba`. La documentazione del test della versione 0.1 è disponibile in [`docs/dogfood-proof.md`](docs/dogfood-proof.md); la documentazione dell'Esperimento 1 è disponibile in [`docs/experiment-1-proof.md`](docs/experiment-1-proof.md). La guida completa è disponibile all'indirizzo: <https://mcp-tool-shop-org.github.io/research-os/handbook/>.
|
|
78
30
|
|
|
79
31
|
## Installazione
|
|
80
32
|
|
|
81
33
|
**Requisiti:** Node.js ≥ 20.
|
|
82
34
|
|
|
83
35
|
```bash
|
|
84
|
-
|
|
36
|
+
npm install -g @mcptoolshop/research-os
|
|
37
|
+
```
|
|
38
|
+
|
|
39
|
+
Per i contributori che costruiscono il software partendo dal codice sorgente:
|
|
40
|
+
|
|
41
|
+
```bash
|
|
85
42
|
git clone https://github.com/mcp-tool-shop-org/research-os.git
|
|
86
43
|
cd research-os
|
|
87
44
|
npm install
|
|
88
45
|
npm run build
|
|
89
|
-
npm link
|
|
46
|
+
npm link
|
|
90
47
|
```
|
|
91
48
|
|
|
92
49
|
## Guida rapida
|
|
@@ -119,45 +76,114 @@ research-os index build --all
|
|
|
119
76
|
research-os cowork handoff
|
|
120
77
|
research-os synth workspace # only if handoff returned synthesis_ready
|
|
121
78
|
research-os freeze
|
|
79
|
+
|
|
80
|
+
# Export to the research-packs archive
|
|
81
|
+
research-os pack publish \
|
|
82
|
+
--to <research-packs>/packages/<name>
|
|
83
|
+
```
|
|
84
|
+
|
|
85
|
+
**Per un esempio pratico**, consultare il pacchetto di test `research-os-packs/research-os-spec/`, che contiene tutti gli elementi, le ricevute, le valutazioni, le "impronte digitali" e le registrazioni, tutti memorizzati in registri immutabili. Questo pacchetto ha generato la documentazione `docs/dogfood-proof.md`.
|
|
86
|
+
|
|
87
|
+
**Richiede [ollama-intern-mcp](https://github.com/mcp-tool-shop-org/ollama-intern-mcp) in esecuzione localmente** per l'estrazione, la classificazione, la revisione e la scoperta tramite LLM. Il modello predefinito è `hermes3:8b`; è possibile sovrascriverlo impostando la variabile d'ambiente `OLLAMA_INTERN_MODEL=<modello>`. Impostare la variabile `OLLAMA_HOST` se Ollama non è in esecuzione sull'indirizzo predefinito `localhost:11434`.
|
|
88
|
+
|
|
89
|
+
## Le 16 regole fondamentali
|
|
90
|
+
|
|
91
|
+
| # | Regola |
|
|
92
|
+
|---|-----|
|
|
93
|
+
| 1 | Nessuna sintesi prima della verifica delle fonti. |
|
|
94
|
+
| 2 | La raccolta di dati è una prova; l'estrazione è un'interpretazione. |
|
|
95
|
+
| 3 | I modelli possono interpretare porzioni di testo originale, ma non possono creare nuove prove. |
|
|
96
|
+
| 4 | L'estrazione può produrre un eccesso di dati; la sintesi non deve necessariamente includere tutti i dati estratti. |
|
|
97
|
+
| 5 | La mappatura delle contraddizioni evidenzia le discrepanze, ma non le risolve, non le sintetizza e non determina quale affermazione sia corretta. |
|
|
98
|
+
| 6 | I "gate" decidono se una sezione è idonea per la sintesi. Non eseguono la sintesi né nascondono i fallimenti. |
|
|
99
|
+
| 7 | La revisione critica valuta l'integrità della ricerca. Non esegue la sintesi né riscrive le fonti originali. |
|
|
100
|
+
| 8 | L'indicizzazione rende la ricerca di informazioni più semplice. Non crea nuove informazioni e non diventa la fonte ufficiale. |
|
|
101
|
+
| 9 | Il trasferimento di informazioni a Cowork traduce le istruzioni operative a partire dalle informazioni verificate. Non crea nuove informazioni e non aggira i "gate". |
|
|
102
|
+
| 10 | L'area di lavoro per la sintesi organizza le informazioni verificate per Cowork. Non esegue la sintesi e non aggira la modalità di trasferimento. |
|
|
103
|
+
| 11 | L'audit del pacchetto raccoglie le informazioni verificate esistenti. Non crea nuove informazioni e non nasconde le prove a livello di sezione. |
|
|
104
|
+
| 12 | La scoperta propone nuove piste di ricerca; solo la raccolta di dati produce prove. |
|
|
105
|
+
| 13 | Un revisore non è considerato affidabile finché non vengono dimostrate delle lacune e la sua capacità di rilevarle. |
|
|
106
|
+
| 14 | L'abbondanza di affermazioni non equivale a qualità della ricerca. Le affermazioni devono essere valutate prima di poter essere considerate per la sintesi. |
|
|
107
|
+
| 15 | La funzione "freeze" blocca la ricerca completata e valida. Non completa la ricerca incompleta né trasforma uno stato di "in riparazione" in una prova. |
|
|
108
|
+
| 16 | Le eccezioni (waivers) allentano i vincoli sulle fonti; non possono essere utilizzate per fabbricare prove. |
|
|
109
|
+
|
|
110
|
+
**Legge 3** — il modello linguistico (LLM) non genera mai il testo delle prove. Il sistema "research-os" crea un registro deterministico degli estratti (con ID stabili come `ex_<id_esadecimale_della_fonte>_001`); l'LLM seleziona gli ID degli estratti; "research-os" copia il testo letterale. La classe di errore "parafrasi come citazione" è strutturalmente impossibile.
|
|
111
|
+
|
|
112
|
+
**Legge 14** — tra l'estrazione e la revisione, "research-os claim triage" elimina le duplicazioni, limita il contributo per fonte e mette in attesa le candidature meno promettenti. Il triage NON modifica il file `claims.jsonl`; le affermazioni messe in attesa rimangono nel registro principale.
|
|
113
|
+
|
|
114
|
+
## La catena di flusso di lavoro v0.1
|
|
115
|
+
|
|
116
|
+
```
|
|
117
|
+
discover
|
|
118
|
+
→ gather
|
|
119
|
+
→ claim extract
|
|
120
|
+
→ claim audit-density
|
|
121
|
+
→ claim triage
|
|
122
|
+
→ contradict map
|
|
123
|
+
→ contradict resolve
|
|
124
|
+
→ review
|
|
125
|
+
→ review-promote
|
|
126
|
+
→ gate
|
|
127
|
+
→ section report
|
|
128
|
+
→ audit
|
|
129
|
+
→ index build
|
|
130
|
+
→ cowork handoff
|
|
131
|
+
→ synth workspace
|
|
132
|
+
→ freeze
|
|
122
133
|
```
|
|
123
134
|
|
|
124
|
-
|
|
135
|
+
Ogni passaggio è un comando della riga di comando (CLI). Ogni passaggio scrive su file che possono essere solo aggiunti (append-only). Nessun passaggio sintetizza, risolve o crea nuove verità; questi vincoli sono applicati, non affidati. La revisione accetta, rifiuta o richiede una correzione delle affermazioni candidate; il "gate" utilizza queste decisioni di revisione per calcolare l'"idoneità alla sintesi"; la funzione "freeze" è il blocco finale di integrità che rifiuta di contrassegnare un pacchetto come completato a meno che tutti i livelli non siano d'accordo. Consultare [docs/dogfood-proof.md](docs/dogfood-proof.md) per la prova della catena v0.1, che ne garantisce la coerenza end-to-end.
|
|
125
136
|
|
|
126
|
-
|
|
137
|
+
Questa è l'alternativa strutturale a *ricerca → riepilogo → report dettagliato*. La catena è il prodotto.
|
|
127
138
|
|
|
128
|
-
##
|
|
139
|
+
## Vocabolario
|
|
129
140
|
|
|
130
141
|
| Termine | Significato |
|
|
131
142
|
|------|---------|
|
|
132
|
-
| `research-os` | Il piano di controllo /
|
|
133
|
-
| `research-pack` | L'artefatto del repository generato per uno
|
|
143
|
+
| `research-os` | Il piano di controllo / CLI / gate / legge di orchestrazione (questo repository) |
|
|
144
|
+
| `research-pack` | L'artefatto del repository generato per uno sforzo di ricerca |
|
|
134
145
|
| `research section` | Un'unità di indagine delimitata all'interno di un pacchetto |
|
|
135
|
-
| `research receipt` |
|
|
146
|
+
| `research receipt` | Prova che una sezione ha superato i controlli di fonte/affermazione/gate |
|
|
136
147
|
|
|
137
148
|
## Sicurezza
|
|
138
149
|
|
|
139
|
-
`research-os` è
|
|
150
|
+
`research-os` è un'interfaccia a riga di comando (CLI) locale. Legge e scrive file all'interno della directory del pacchetto di ricerca a cui la si indica e, quando si utilizza la funzione "gather", effettua richieste HTTP in uscita per recuperare gli URL delle fonti fornite. Non esegue un server, non accetta connessioni in entrata, non memorizza credenziali né invia dati di telemetria. Nessun segreto viene scritto negli artefatti del pacchetto. Consultare [SECURITY.md](SECURITY.md) per la politica di segnalazione delle vulnerabilità.
|
|
140
151
|
|
|
141
152
|
## Stato
|
|
142
153
|
|
|
143
|
-
**v0.
|
|
154
|
+
**v0.3.3** — Pubblicata su npm come `@mcptoolshop/research-os@0.3.3` il 10 maggio 2026. Include miglioramenti nella chiarezza delle semantiche delle "gate", ottenuti grazie al Pack-3 (durabilità dell'esportazione/runtime di Godot, Esperimento 3, pacchetto n. 3 su 3). L'output della "gate" ora include il publisher e i conteggi specifici della sezione, oltre ai conteggi globali del pacchetto (F-43); la dicitura di `no_source_cluster_monopoly` è stata modificata da AVVISO a diagnostica informativa (F-41). **Il comportamento di successo/fallimento rimane invariato; i pacchetti esistenti vengono verificati byte per byte.** 570 test vitest su 570 superati. Consultare [CHANGELOG.md](CHANGELOG.md) e [`docs/section-scoped-waivers.md`](docs/section-scoped-waivers.md).
|
|
155
|
+
|
|
156
|
+
**v0.3.2** — Pubblicata su npm come `@mcptoolshop/research-os@0.3.2` il 9 maggio 2026. Include una contabilizzazione normalizzata delle richieste accettate, tenendo conto dell'ammissione per la "pubblicazione del pacchetto". Il controllo di uguaglianza rigoroso tra `claim-reviews.jsonl` e `pack-audit.json::accepted_claims` è stato sostituito con un confronto di insiemi, in cui le richieste accettate sono rappresentate da `claim_id` univoci la cui ultima decisione di revisione canonica è "accettata per la sintesi" (l'ultima decisione prevale per ogni `claim_id`). I pacchetti "congelati" la cui cronologia delle revisioni differisce dall'insieme normalizzato vengono ora ammessi con un avviso anziché essere rifiutati; il file di revisione precedente viene conservato integralmente (Legge 15), mentre il manifest dell'archivio riflette il conteggio normalizzato. Il rifiuto rimane assoluto per gli `claim_id` fantasma, le decisioni duplicate incompatibili e le "gate" non idonee per la sintesi. Ottenuto grazie all'esperimento 3 XRPL, pacchetto Session K: la pubblicazione del pacchetto è stata rifiutata a causa di una reale discrepanza nel registro di chiusura (la sezione 07 conteneva 24 righe "accettate per la sintesi", ma solo 19 `claim_id` univoci a causa delle sovrapposizioni negli intervalli di revisione). 558 test vitest su 558 superati. Consultare [CHANGELOG.md](CHANGELOG.md) e [`docs/pack-publish.md`](docs/pack-publish.md).
|
|
157
|
+
|
|
158
|
+
**v0.3.1** — pubblicato su npm come `@mcptoolshop/research-os@0.3.1`, 9 maggio 2026. Include eccezioni specifiche per sezione per le fonti (`primary_source_waiver.section_waivers[]`) e un'approvazione da parte del revisore, in modo che una scoperta di "monopolio del cluster di fonti" a livello di sezione diventi un avvertimento visibile anziché indirizzare automaticamente tutte le affermazioni a "needs_source_repair". Ottenuto con l'esperimento 3 del pacchetto XRPL, sessione 2 — le sezioni relative al protocollo canonico (catene con una singola base, specifiche API a "giardino chiuso", documentazione di organismi di standardizzazione) hanno invertito l'assunzione che la diversità degli editori sia un indicatore della qualità della verità. 540/540 test vitest superati. Consultare [CHANGELOG.md](CHANGELOG.md) e [`docs/section-scoped-waivers.md`](docs/section-scoped-waivers.md).
|
|
159
|
+
|
|
160
|
+
**Eccezioni specifiche per sezione per le fonti** — Utilizzarle quando la diversità degli editori è strutturalmente incompatibile con la fonte di verità della sezione, non quando una sezione semplicemente non è riuscita a trovare abbastanza fonti. Schema con `reason` (motivo) e `compensating_controls[]` (controlli compensativi) obbligatori. La policy del pacchetto `primary_source_waiver_allowed: false` blocca sia le eccezioni a livello di pacchetto che quelle specifiche per sezione. Il workaround precedente alla v0.3.1, `min_independent_publishers: 0`, è ora obsoleto; i pacchetti "frozen" esistenti rimangono validi con le ricevute esistenti. Consultare [`docs/section-scoped-waivers.md`](docs/section-scoped-waivers.md) e il [manuale operativo dei pacchetti di ricerca](https://github.com/mcp-tool-shop-org/research-packs/blob/main/docs/operator-playbook.md).
|
|
161
|
+
|
|
162
|
+
**v0.3.0** — pubblicata il 2026-05-09. È stato introdotto il flag `--detector <auto|heuristic|ollama-intern>` in `contradict map` (correzione F-09 del blocco della catena proveniente dalla Sessione 1 dell'Esperimento 3, pacchetto XRPL). 527 test vitest superati. La selezione del rilevatore è ora una scelta esplicita da parte dell'operatore, invece di una dipendenza dallo stato e da variabili d'ambiente; la modalità viene visualizzata in modo chiaro ad ogni esecuzione. Consultare [`docs/contradict-map.md`](docs/contradict-map.md).
|
|
163
|
+
|
|
164
|
+
**v0.2.0** — pubblicata il 2026-05-09. Sono stati distribuiti il pacchetto `research-os pack publish` (Esperimento 2) e la correzione del predicato di prontezza del Pattern 2. 515 test vitest superati. Consultare [CHANGELOG.md](CHANGELOG.md). I pacchetti con stato finale vengono esportati nell'archivio canonico `research-packs` con un singolo comando; l'accordo contrattuale viene applicato tramite codice, non tramite una checklist. Consultare [`docs/pack-publish.md`](docs/pack-publish.md).
|
|
165
|
+
|
|
166
|
+
**v0.1.0** — pacchetto di test interno bloccato l'8 maggio 2026. Il pacchetto in `research-os-packs/research-os-spec/` (repository correlato) ha raggiunto lo stato finale con 296 affermazioni accettate in 8 sezioni, 17 risolte, 30 sovrascritte dall'operatore, 0 blocchi di riparazione attivi, 0 contraddizioni irrisolte, con tutte le condizioni (`synthesis_eligible=true`) soddisfatte. Sono state implementate sedici leggi fondamentali. Consultare [`docs/dogfood-proof.md`](docs/dogfood-proof.md) per i sette risultati e le informazioni sull'identificazione dello stato finale.
|
|
167
|
+
|
|
168
|
+
**Archivio monorepo dei pacchetti di ricerca** — disponibile su [`mcp-tool-shop-org/research-packs`](https://github.com/mcp-tool-shop-org/research-packs) con due pacchetti disponibili fin dal primo giorno. `comfyui-workflow-durability` (Esperimento 1, 302 affermazioni accettate, 8 sezioni) e `research-os-self-dogfood` (backfill v0.1 per i test interni, 296 affermazioni accettate, 8 sezioni). Entrambi i pacchetti superano il test `verify-pack.mjs`.
|
|
169
|
+
|
|
170
|
+
**Esperimento 1 (Durabilità del flusso di lavoro ComfyUI)** — CHIUSO il 9 maggio 2026. Tutte le 8 sezioni in Terminal A, pacchetto bloccato, archivio disponibile. Consultare [`docs/experiment-1-proof.md`](docs/experiment-1-proof.md) e [`docs/roadmap.md`](docs/roadmap.md).
|
|
144
171
|
|
|
145
|
-
### Cosa la versione 0.
|
|
172
|
+
### Cosa la versione 0.3 non è
|
|
146
173
|
|
|
147
|
-
- Non
|
|
148
|
-
- Non è
|
|
149
|
-
- Non è
|
|
150
|
-
- Non ha una stabilità dell'API conforme alla versione semantica. La versione 1.0.0 è uno stato da raggiungere, non una data specifica; consultare il file [`docs/roadmap.md`](docs/roadmap.md) per i cinque esperimenti che colmano questa lacuna.
|
|
174
|
+
- Non testato in condizioni reali da utenti esterni. Tre cicli di test interni sono stati completati: uno autoreferenziale e due relativi a domini esterni. L'esperimento 3 (stabilità dell'API sotto pressione esterna) è **STATO CHIUSO il 10 maggio 2026**: tutti e tre i pacchetti (ComfyUI, XRPL, Godot) hanno raggiunto la fase di "congelamento" senza modifiche disruptive all'interfaccia a riga di comando (CLI) v0.3.x. Questi cicli di test hanno portato a: v0.3.0 `--detector` (F-09), v0.3.1 gestione delle eccezioni specifiche per sezione (F-10/F-11), v0.3.2 contabilizzazione normalizzata delle richieste accettate (F-36) e v0.3.3 chiarezza delle semantiche delle "gate" (F-43/F-41).
|
|
175
|
+
- Non è uno strumento per la scrittura di sintesi. Il comando `synth workspace` genera l'ambiente di lavoro strutturato; gli esseri umani (o Cowork) scrivono il testo in relazione agli `claim_id` accettati.
|
|
176
|
+
- Non è stabile per quanto riguarda la compatibilità delle API secondo il sistema semantico. La versione 1.0.0 è uno stato da raggiungere, non una data specifica; consultare [`docs/roadmap.md`](docs/roadmap.md) per i sei esperimenti che porteranno a questo risultato.
|
|
151
177
|
|
|
152
178
|
### Limitazioni note
|
|
153
179
|
|
|
154
|
-
- **L'origine
|
|
155
|
-
- **La selezione del modello di revisione
|
|
156
|
-
- **Il pacchetto di test
|
|
180
|
+
- **L'origine dei dati estratti non è visibile al livello di connessione.** Una sezione può superare la soglia delle affermazioni accettate facendo affidamento su affermazioni basate su euristiche quando l'estrazione calibrata (Ollama con il modello configurato) non è disponibile. Questo è stato registrato come Esperimento 4 nella roadmap; le future ottimizzazioni mostreranno le affermazioni accettate per ogni strumento di estrazione e richiederanno il numero di affermazioni accettate derivanti dal percorso calibrato.
|
|
181
|
+
- **La selezione del modello di revisione oltre al modello di riferimento calibrato `hermes-two-pass` non è ancora risolta.** Il ciclo di test interni ha validato una configurazione del revisore; modelli alternativi devono essere sottoposti a una calibrazione specifica per la rilevazione di errori prima di poter essere considerati affidabili. Questo è l'Esperimento 5 nella roadmap.
|
|
182
|
+
- **Il pacchetto di test interni v0.1 ha utilizzato `mistral-nemo:12b` per l'estrazione (il valore predefinito canonico è `hermes3:8b`).** `hermes3:8b` non era disponibile su questo sistema durante il ciclo v0.1. Questa dichiarazione di sostituzione rimane valida fino a quando non viene generato un risultato basato su hermes3; questo è l'Esperimento 6 nella roadmap. Per gli operatori che utilizzano sistemi senza `hermes3:8b`, impostare la variabile `OLLAMA_INTERN_MODEL` su un modello disponibile; le URL pre-configurate per l'operatore e la disciplina nella precisione delle query (vedere il manuale) mitigano le allucinazioni nella scoperta di argomenti ambigui.
|
|
157
183
|
|
|
158
184
|
## Roadmap per la versione 1.0
|
|
159
185
|
|
|
160
|
-
La versione 1.0 è uno stato
|
|
186
|
+
La versione 1.0 è uno stato raggiunto attraverso il lavoro svolto, non una data di rilascio. Tra la versione 0.1 e la 1.0 ci sono sei esperimenti in corso: un sistema di test interno non auto-referenziale (attualmente in fase di sviluppo come il pacchetto "ComfyUI workflow durability"), un comando `research-os pack publish` che automatizza l'esportazione nel repository centrale `research-packs` (Esperimento 2, limitato e dipendente dal completamento dell'Esperimento 1), stabilità dell'API sotto pressione esterna, colmare il divario sulla provenienza dei dati estratti, estendere la calibrazione dei revisori oltre il sistema `hermes-two-pass` e un test di base pulito su `hermes3:8b`. L'Esperimento 1 non è completato al momento del "congelamento" del pacchetto; si conclude quando il pacchetto "congelato" viene distribuito come il primo pacchetto nel repository centrale `research-packs`, insieme al pacchetto di test interno della versione 0.1. Il piano completo è disponibile in [`docs/roadmap.md`](docs/roadmap.md). L'architettura rimane invariata; la versione 1.0 approfondisce ciò che la versione 0.1 ha dimostrato, piuttosto che riaprire vecchie questioni.
|
|
161
187
|
|
|
162
188
|
## Licenza
|
|
163
189
|
|
package/README.ja.md
CHANGED
|
@@ -7,7 +7,7 @@
|
|
|
7
7
|
</p>
|
|
8
8
|
|
|
9
9
|
<p align="center">
|
|
10
|
-
<a href="https://github.com/mcp-tool-shop-org/research-os/releases/tag/v0.
|
|
10
|
+
<a href="https://github.com/mcp-tool-shop-org/research-os/releases/tag/v0.3.3"><img src="https://img.shields.io/badge/version-0.3.3-blue" alt="version 0.3.3"></a>
|
|
11
11
|
<a href="https://github.com/mcp-tool-shop-org/research-os/actions/workflows/ci.yml"><img src="https://github.com/mcp-tool-shop-org/research-os/actions/workflows/ci.yml/badge.svg" alt="CI"></a>
|
|
12
12
|
<a href="LICENSE"><img src="https://img.shields.io/badge/license-MIT-green" alt="MIT License"></a>
|
|
13
13
|
<img src="https://img.shields.io/badge/node-%E2%89%A520-brightgreen" alt="Node ≥20">
|
|
@@ -24,7 +24,67 @@
|
|
|
24
24
|
|
|
25
25
|
これはレポート生成ツールではありません。また、LLMのオーケストレーションのフレームワークでもありません。あなたの統合作業を自動化するものでもありません。`research-os`は、統合作業を開始するための条件を強制します。
|
|
26
26
|
|
|
27
|
-
|
|
27
|
+
Frozen packs(凍結されたパッケージ)は、[`mcp-tool-shop-org/research-packs`](https://github.com/mcp-tool-shop-org/research-packs)にアーカイブされており、ライブで公開されています。最初の2つのパッケージが含まれています。v1.0のロードマップについては、[`docs/roadmap.md`](docs/roadmap.md)を参照してください。
|
|
28
|
+
|
|
29
|
+
v0.1は、2つの内部テスト(dogfood)で検証されました。最初のテストでは、research-os自体の仕様を調査した結果、v0.1.0のリリース前に7つの問題点が発見され、それぞれにコード修正が必要となり、新たなルールや統合パターンが導入されました。2番目のテスト(v1 Experiment 1:ComfyUIワークフローの安定性、11セッション、research-osとの語彙の重複がない環境)は、2026年5月9日に完了し、パッケージが凍結され、アーカイブが公開され、パターン2の適用がコミット`22b5dba`によって完了しました。v0.1の検証結果は、[`docs/dogfood-proof.md`](docs/dogfood-proof.md)に、Experiment 1の検証結果は、[`docs/experiment-1-proof.md`](docs/experiment-1-proof.md)に記載されています。ハンドブックは、<https://mcp-tool-shop-org.github.io/research-os/handbook/>で確認できます。
|
|
30
|
+
|
|
31
|
+
## インストール
|
|
32
|
+
|
|
33
|
+
**必要条件:** Node.js ≥ 20
|
|
34
|
+
|
|
35
|
+
```bash
|
|
36
|
+
npm install -g @mcptoolshop/research-os
|
|
37
|
+
```
|
|
38
|
+
|
|
39
|
+
ソースコードからビルドする場合:
|
|
40
|
+
|
|
41
|
+
```bash
|
|
42
|
+
git clone https://github.com/mcp-tool-shop-org/research-os.git
|
|
43
|
+
cd research-os
|
|
44
|
+
npm install
|
|
45
|
+
npm run build
|
|
46
|
+
npm link
|
|
47
|
+
```
|
|
48
|
+
|
|
49
|
+
## クイックスタート
|
|
50
|
+
|
|
51
|
+
```bash
|
|
52
|
+
# Create a new research-pack
|
|
53
|
+
research-os init "How should X be structured?"
|
|
54
|
+
|
|
55
|
+
# Add a section
|
|
56
|
+
research-os section add 01-landscape --purpose "Map the current landscape"
|
|
57
|
+
|
|
58
|
+
# Discover and approve sources, then gather
|
|
59
|
+
research-os discover run 01-landscape
|
|
60
|
+
research-os discover approve 01-landscape --top 8
|
|
61
|
+
research-os gather 01-landscape --approved
|
|
62
|
+
|
|
63
|
+
# Run the per-section chain
|
|
64
|
+
research-os claim extract 01-landscape
|
|
65
|
+
research-os claim audit-density 01-landscape
|
|
66
|
+
research-os claim triage 01-landscape
|
|
67
|
+
research-os contradict map 01-landscape --triaged-only
|
|
68
|
+
research-os review 01-landscape --triaged-only --preset hermes-two-pass --profile hermes-two-pass
|
|
69
|
+
research-os review-promote 01-landscape --profile hermes-two-pass
|
|
70
|
+
research-os gate 01-landscape
|
|
71
|
+
research-os section report 01-landscape
|
|
72
|
+
|
|
73
|
+
# Pack-level finish
|
|
74
|
+
research-os audit
|
|
75
|
+
research-os index build --all
|
|
76
|
+
research-os cowork handoff
|
|
77
|
+
research-os synth workspace # only if handoff returned synthesis_ready
|
|
78
|
+
research-os freeze
|
|
79
|
+
|
|
80
|
+
# Export to the research-packs archive
|
|
81
|
+
research-os pack publish \
|
|
82
|
+
--to <research-packs>/packages/<name>
|
|
83
|
+
```
|
|
84
|
+
|
|
85
|
+
**具体的な使用例**については、`research-os-packs/research-os-spec/` にある「dogfood」と呼ばれるパッケージを参照してください。このパッケージには、すべてのファイル、すべての記録、すべての処理結果、すべての固定状態のフィンガープリントなどが、追記のみ可能なファイルとして保存されています。このパッケージによって、`docs/dogfood-proof.md` が生成されました。
|
|
86
|
+
|
|
87
|
+
**LLM(大規模言語モデル)の抽出、トリアージ、レビュー、および発見には、ローカルで実行されている [ollama-intern-mcp](https://github.com/mcp-tool-shop-org/ollama-intern-mcp) が必要です。** デフォルトのモデルは `hermes3:8b` です。別のモデルを使用する場合は、`OLLAMA_INTERN_MODEL=<モデル名>` で指定してください。Ollamaがデフォルトの `localhost:11434` 以外の場所で実行されている場合は、`OLLAMA_HOST` 環境変数を設定してください。
|
|
28
88
|
|
|
29
89
|
## 16の重要な原則
|
|
30
90
|
|
|
@@ -76,55 +136,6 @@ discover
|
|
|
76
136
|
|
|
77
137
|
これは、*検索 → 要約 → 報告書作成* という従来のプロセスに対する構造的な代替手段です。このプロセス全体が「チェーン」として機能し、その結果が製品となります。
|
|
78
138
|
|
|
79
|
-
## インストール
|
|
80
|
-
|
|
81
|
-
**必要条件:** Node.js ≥ 20
|
|
82
|
-
|
|
83
|
-
```bash
|
|
84
|
-
# From source (v0.1.0 is not yet published to npm)
|
|
85
|
-
git clone https://github.com/mcp-tool-shop-org/research-os.git
|
|
86
|
-
cd research-os
|
|
87
|
-
npm install
|
|
88
|
-
npm run build
|
|
89
|
-
npm link # makes `research-os` available on your PATH
|
|
90
|
-
```
|
|
91
|
-
|
|
92
|
-
## クイックスタート
|
|
93
|
-
|
|
94
|
-
```bash
|
|
95
|
-
# Create a new research-pack
|
|
96
|
-
research-os init "How should X be structured?"
|
|
97
|
-
|
|
98
|
-
# Add a section
|
|
99
|
-
research-os section add 01-landscape --purpose "Map the current landscape"
|
|
100
|
-
|
|
101
|
-
# Discover and approve sources, then gather
|
|
102
|
-
research-os discover run 01-landscape
|
|
103
|
-
research-os discover approve 01-landscape --top 8
|
|
104
|
-
research-os gather 01-landscape --approved
|
|
105
|
-
|
|
106
|
-
# Run the per-section chain
|
|
107
|
-
research-os claim extract 01-landscape
|
|
108
|
-
research-os claim audit-density 01-landscape
|
|
109
|
-
research-os claim triage 01-landscape
|
|
110
|
-
research-os contradict map 01-landscape --triaged-only
|
|
111
|
-
research-os review 01-landscape --triaged-only --preset hermes-two-pass --profile hermes-two-pass
|
|
112
|
-
research-os review-promote 01-landscape --profile hermes-two-pass
|
|
113
|
-
research-os gate 01-landscape
|
|
114
|
-
research-os section report 01-landscape
|
|
115
|
-
|
|
116
|
-
# Pack-level finish
|
|
117
|
-
research-os audit
|
|
118
|
-
research-os index build --all
|
|
119
|
-
research-os cowork handoff
|
|
120
|
-
research-os synth workspace # only if handoff returned synthesis_ready
|
|
121
|
-
research-os freeze
|
|
122
|
-
```
|
|
123
|
-
|
|
124
|
-
**具体的な使用例**については、`research-os-packs/research-os-spec/` にある「dogfood」と呼ばれるパッケージを参照してください。このパッケージには、すべてのファイル、すべての記録、すべての処理結果、すべての固定状態のフィンガープリントなどが、追記のみ可能なファイルとして保存されています。このパッケージによって、`docs/dogfood-proof.md` が生成されました。
|
|
125
|
-
|
|
126
|
-
**LLM(大規模言語モデル)の抽出、トリアージ、レビュー、および発見には、ローカルで実行されている [ollama-intern-mcp](https://github.com/mcp-tool-shop-org/ollama-intern-mcp) が必要です。** デフォルトのモデルは `hermes3:8b` です。別のモデルを使用する場合は、`OLLAMA_INTERN_MODEL=<モデル名>` で指定してください。Ollamaがデフォルトの `localhost:11434` 以外の場所で実行されている場合は、`OLLAMA_HOST` 環境変数を設定してください。
|
|
127
|
-
|
|
128
139
|
## 用語集
|
|
129
140
|
|
|
130
141
|
| 用語 | 意味 |
|
|
@@ -140,20 +151,39 @@ research-os freeze
|
|
|
140
151
|
|
|
141
152
|
## ステータス
|
|
142
153
|
|
|
154
|
+
**v0.3.3** — npmに `@mcptoolshop/research-os@0.3.3` として公開されました。2026年5月10日。Pack-3(Godotのエクスポート/ランタイムの安定性、実験3のパック#3のうち3つ目)によって獲得された、ゲートセマンティクスの明確化が含まれています。ゲートの出力には、セクションごとの発行者と主要なカウントに加えて、全体的なカウントが表示されるようになりました(F-43)。`no_source_cluster_monopoly` は、警告から情報診断に変更されました(F-41)。**合格/不合格の動作は変更されていません。既存の固定されたパックは、バイト単位で完全に同一であることを検証します。** 570/570 の vitest が合格しました。詳細は [CHANGELOG.md](CHANGELOG.md) および [`docs/section-scoped-waivers.md`](docs/section-scoped-waivers.md) を参照してください。
|
|
155
|
+
|
|
156
|
+
**v0.3.2** — 2026年5月9日に、`@mcptoolshop/research-os@0.3.2`としてnpmに公開されました。`pack publish`の許可に関する、正規化された承認処理が実装されました。`claim-reviews.jsonl`と`pack-audit.json::accepted_claims`の厳密な一致チェックは、効果的な集合比較に置き換えられました。承認されたクレームは、最新の正当なレビュー結果が`accepted_for_synthesis`である一意の`claim_id`の集合です(`claim_id`ごとに最新の決定が優先されます)。以前の監査数が効果的な集合と異なる凍結されたパッケージは、拒否する代わりに警告を表示します。古い監査ファイルは変更せずに保持されます(ルール15)、ただし、アーカイブのマニフェストには正規化された数が反映されます。フェイクの`claim_id`、互換性のない重複した決定、および合成対象外の条件に対する拒否は引き続き適用されます。Experiment 3 XRPLパッケージのSession Kで、実際のクロージャー・レジャーの不一致により、パッケージの公開が拒否されました(セクション07には24件の`accepted_for_synthesis`の行がありましたが、重複するレビュー担当者によるため、一意の`claim_id`は19件のみでした)。558/558のvitestが成功しました。詳細については、[CHANGELOG.md](CHANGELOG.md)と[`docs/pack-publish.md`](docs/pack-publish.md)を参照してください。
|
|
157
|
+
|
|
158
|
+
**v0.3.1** — 2026年5月9日に、`@mcptoolshop/research-os@0.3.1`としてnpmに公開されました。セクションごとに適用されるソースコードの免除(`primary_source_waiver.section_waivers[]`)と、レビュー担当者による確認機能が追加されました。これにより、セクション全体で`source_cluster_monopoly`の違反が検出された場合でも、自動的にすべてのクレームを`needs_source_repair`に振り分けるのではなく、注意点として表示されるようになりました。Experiment 3 XRPLパッケージのSession 2で、canonical-protocolセクション(単一の基盤チェーン、クローズドなAPI仕様、標準化団体のドキュメント)において、パブリッシャーの多様性が真の品質の指標であるという前提が覆されました。当時、540/540のvitestが成功しました。詳細については、[`docs/section-scoped-waivers.md`](docs/section-scoped-waivers.md)を参照してください。
|
|
159
|
+
|
|
160
|
+
**セクションごとのソースコード免除** — パブリッシャーの多様性がセクションの真のソースと構造的に互換性がない場合にのみ使用します。セクションが単に十分なソースを見つけられなかった場合ではありません。スキーマによって強制される`reason`と、空でない`compensating_controls[]`が必要です。パッケージポリシー`primary_source_waiver_allowed: false`は、パッケージレベルおよびセクションごとの免除の両方をブロックします。v0.3.1以前のパッケージレベルの`min_independent_publishers: 0`の回避策は、現在非推奨です。既存の凍結されたパッケージは、既存のレシートに基づいて有効です。詳細については、[`docs/section-scoped-waivers.md`](docs/section-scoped-waivers.md)と、[research-packsオペレータープレイブック](https://github.com/mcp-tool-shop-org/research-packs/blob/main/docs/operator-playbook.md)を参照してください。
|
|
161
|
+
|
|
162
|
+
**v0.3.0** — 2026年5月9日に公開されました。`contradict map`に、`--detector <auto|heuristic|ollama-intern>`フラグが追加されました(Experiment 3 Session 1、XRPLパッケージのF-09チェーンブロッカーの修正)。当時、527/527のvitestが成功しました。検出器の選択は、以前の状態に依存する環境変数ではなく、オペレーターが明示的に選択するようになりました。モードは、実行ごとに可視化されます。詳細については、[`docs/contradict-map.md`](docs/contradict-map.md)を参照してください。
|
|
163
|
+
|
|
164
|
+
**v0.2.0** — 2026年5月9日に公開。`research-os pack publish` (実験2) と、Pattern 2 の準備状態に関する問題を修正しました。515件中515件の vitest テストが合格しました。詳細は [CHANGELOG.md](CHANGELOG.md) を参照してください。パッケージの公開は、単一のコマンドで標準の `research-packs` アーカイブにエクスポートされます。契約の遵守は、チェックリストではなくコードによって強制されます。詳細は [`docs/pack-publish.md`](docs/pack-publish.md) を参照してください。
|
|
165
|
+
|
|
143
166
|
**v0.1.0** — 2026年5月8日に固定されました。`research-os-packs/research-os-spec/` (関連リポジトリ) にある「dogfood」パッケージでは、8つのセクションで296件の主張が承認され、17件が処理され、30件がオペレーターによって修正され、未解決の矛盾は0件、すべてのゲートで `synthesis_eligible=true` となりました。463件中463件のvitestテストが合格しました。16個の重要なルールが実装されています。詳細については、[docs/dogfood-proof.md](docs/dogfood-proof.md) を参照してください。このドキュメントには、7つの発見事項と、固定状態のフィンガープリントが記載されています。
|
|
144
167
|
|
|
168
|
+
**research-packs アーカイブ (モノレポ)** — [`mcp-tool-shop-org/research-packs`](https://github.com/mcp-tool-shop-org/research-packs) で公開されており、リリース時に2つのパッケージが提供されています。`comfyui-workflow-durability` (実験1、302件の承認済みクレーム、8セクション) と `research-os-self-dogfood` (v0.1 のドッグフード版、296件の承認済みクレーム、8セクション)。どちらのパッケージも `verify-pack.mjs` をパスしています。
|
|
169
|
+
|
|
170
|
+
**v1 実験1 (ComfyUI ワークフローの安定性)** — 2026年5月9日に終了。8つのセクションすべてが Terminal A で完了し、パッケージは凍結され、アーカイブは公開されました。詳細は [`docs/experiment-1-proof.md`](docs/experiment-1-proof.md) と [`docs/roadmap.md`](docs/roadmap.md) を参照してください。
|
|
171
|
+
|
|
145
172
|
### v0.1の制限事項
|
|
146
173
|
|
|
147
|
-
-
|
|
148
|
-
-
|
|
149
|
-
-
|
|
150
|
-
- APIの安定性はありません(セマンティックバージョニングに準拠していません)。外部ユーザーによる検証が完了した後、v1.0.0 がリリースされます。
|
|
174
|
+
- 外部ユーザーによる実戦テストは行われていません。3つの内部テストフェーズが終了しました。1つは自己参照型、2つは外部ドメイン型です。実験3(外部からのプレッシャー下でのAPIの安定性)は、**2026年5月10日に完了しました**。3つのパック(ComfyUI、XRPL、Godot)は、v0.3.xのCLIインターフェースに変更を加えることなく、安定版に到達しました。このフェーズでは、v0.3.0の`--detector`(F-09)、v0.3.1のセクションごとの免責事項(F-10/F-11)、v0.3.2の標準化された承認済みトランザクション処理(F-36)、およびv0.3.3のゲートセマンティクスの明確化(F-43/F-41)が実現されました。
|
|
175
|
+
- 合成テキストの生成機能はありません。`synth workspace` コマンドは、構造化されたワークスペースを生成します。人間(または Cowork)が、承認されたトランザクションIDに基づいてテキストを作成します。
|
|
176
|
+
- セマンティックバージョニング(semver)に基づくAPIの安定性はありません。v1.0.0 は、予定日ではなく、達成すべき目標です。詳細については、[`docs/roadmap.md`](docs/roadmap.md) を参照してください。このドキュメントには、その目標を達成するための6つの実験が記載されています。
|
|
151
177
|
|
|
152
178
|
### 既知の制限事項
|
|
153
179
|
|
|
154
|
-
-
|
|
155
|
-
-
|
|
156
|
-
-
|
|
180
|
+
- **抽出元の情報が、ゲートシームでは表示されません。** セクションは、キャリブレーションされた抽出器 (Ollama と設定されたモデル) が利用できない場合に、ヒューリスティックに基づく代替クレームに依存して、承認済みクレームの基準を満たすことができます。これは、ロードマップの実験4として記録されています。今後の改善により、承認済みクレームは抽出器ごとに報告され、基準を満たす数の承認済みクレームが、キャリブレーションされたパスから取得されるようになります。
|
|
181
|
+
- **キャリブレーションされた `hermes-two-pass` を基準とする、レビューモデルの選択は未解決です。** ドッグフードテストでは、1つのレビュー設定が検証されました。代替モデルは、信頼できるようになる前に、独自のシードされた失敗の再現キャリブレーションが必要です。これは、ロードマップの実験5です。
|
|
182
|
+
- **v0.1 の自己ドッグフードパッケージでは、抽出に `mistral-nemo:12b` が使用されました (標準のデフォルトは `hermes3:8b`)。** v0.1 のテスト期間中、この環境では `hermes3:8b` が利用できませんでした。この代替の使用に関する情報は、`hermes3` ベースの記録が作成されるまで有効です。`hermes3:8b` が利用できない環境では、`OLLAMA_INTERN_MODEL` を利用可能なモデルに設定してください。オペレーターが事前に設定した URL と、クエリの精度に関するルール (ハンドブックを参照) を使用することで、あいまいなトピックに関する誤った情報の検出を軽減できます。
|
|
183
|
+
|
|
184
|
+
## v1.0 へのロードマップ
|
|
185
|
+
|
|
186
|
+
v1.0は、単なるリリース日ではなく、達成される状態です。v0.1からv1.0までの間に、6つの実験段階があります。これには、自己参照を含まない内部テスト(現在はComfyUIワークフローの安定性向上パックとして進行中)、`research-os pack publish`コマンドによる、標準的な`research-packs`モノレポへの自動エクスポート(実験2。実験1の手動での完了処理の後に行われる)、外部からのプレッシャーに対するAPIの安定性、抽出元の追跡機能の確立、`hermes-two-pass`を超えるレビューアの調整の一般化、そして`hermes3:8b`上でのクリーンなベースラインの実行が含まれます。実験1は、パッケージの最終版が作成される前に完了しません。これは、v0.1の内部テストが完了し、`research-packs`モノレポの最初のパッケージとしてリリースされる際に終了します。詳細な計画は、[`docs/roadmap.md`](docs/roadmap.md)に記載されています。アーキテクチャの設計は一貫して維持され、v1.0は、v0.1で検証された内容をさらに深めるものであり、以前の段階を再検討するものではありません。
|
|
157
187
|
|
|
158
188
|
## ライセンス
|
|
159
189
|
|
package/README.md
CHANGED
|
@@ -7,7 +7,7 @@
|
|
|
7
7
|
</p>
|
|
8
8
|
|
|
9
9
|
<p align="center">
|
|
10
|
-
<a href="https://github.com/mcp-tool-shop-org/research-os/releases/tag/v0.3.
|
|
10
|
+
<a href="https://github.com/mcp-tool-shop-org/research-os/releases/tag/v0.3.3"><img src="https://img.shields.io/badge/version-0.3.3-blue" alt="version 0.3.3"></a>
|
|
11
11
|
<a href="https://github.com/mcp-tool-shop-org/research-os/actions/workflows/ci.yml"><img src="https://github.com/mcp-tool-shop-org/research-os/actions/workflows/ci.yml/badge.svg" alt="CI"></a>
|
|
12
12
|
<a href="LICENSE"><img src="https://img.shields.io/badge/license-MIT-green" alt="MIT License"></a>
|
|
13
13
|
<img src="https://img.shields.io/badge/node-%E2%89%A520-brightgreen" alt="Node ≥20">
|
|
@@ -151,7 +151,11 @@ This is the structural alternative to *search → summarize → pretty report*.
|
|
|
151
151
|
|
|
152
152
|
## Status
|
|
153
153
|
|
|
154
|
-
**v0.3.
|
|
154
|
+
**v0.3.3** — published to npm as `@mcptoolshop/research-os@0.3.3`, 2026-05-10. Ships gate-semantics clarity earned by Pack-3 (Godot export/runtime durability, Experiment 3 pack #3 of 3). Gate output now carries section-scoped publisher + primary counts alongside pack-wide counts (F-43); `no_source_cluster_monopoly` reworded from WARN to informational diagnostic (F-41). **Pass/fail behavior unchanged; existing frozen packs verify-pack byte-identically.** 570/570 vitest passing. See [CHANGELOG.md](CHANGELOG.md) and [`docs/section-scoped-waivers.md`](docs/section-scoped-waivers.md).
|
|
155
|
+
|
|
156
|
+
**v0.3.2** — published to npm as `@mcptoolshop/research-os@0.3.2`, 2026-05-09. Ships normalized accepted-claim accounting for `pack publish` admission. The strict equality check between `claim-reviews.jsonl` and `pack-audit.json::accepted_claims` is replaced with an effective-set comparison — accepted claims are unique `claim_id`s whose latest canonical review decision is `accepted_for_synthesis` (latest-decision-wins per `claim_id`). Frozen packs whose legacy audit count differs from the effective set now admit with a warning rather than refusing; the legacy audit file is preserved verbatim (Law 15) while the archive manifest reflects the normalized count. Refusal stays hard for phantom claim_ids, incompatible duplicate decisions, and non-synthesis-eligible gates. Earned by Experiment 3 XRPL pack Session K — pack publish refused on a real closure-ledger seam disagreement (Section 07 had 24 raw `accepted_for_synthesis` rows but only 19 unique `claim_id`s due to overlapping reviewer windows). 558/558 vitest passing. See [CHANGELOG.md](CHANGELOG.md) and [`docs/pack-publish.md`](docs/pack-publish.md).
|
|
157
|
+
|
|
158
|
+
**v0.3.1** — published to npm as `@mcptoolshop/research-os@0.3.1`, 2026-05-09. Ships section-scoped source-floor waivers (`primary_source_waiver.section_waivers[]`) plus reviewer-side acknowledgement so a waived section-wide `source_cluster_monopoly` finding becomes a visible caveat rather than auto-routing all claims to `needs_source_repair`. Earned by Experiment 3 XRPL pack Session 2 — canonical-protocol sections (single-foundation chains, walled-garden API specs, standards-body docs) inverted the assumption that publisher diversity is a proxy for truth quality. 540/540 vitest passing then. See [`docs/section-scoped-waivers.md`](docs/section-scoped-waivers.md).
|
|
155
159
|
|
|
156
160
|
**Section-scoped source waivers** — Use them when publisher diversity is structurally incompatible with the section's truth source, not when a section merely failed to find enough sources. Schema-enforced `reason` + non-empty `compensating_controls[]`. Pack policy `primary_source_waiver_allowed: false` blocks both pack-level and section-scoped waivers. The pre-v0.3.1 pack-level `min_independent_publishers: 0` workaround is now deprecated; existing frozen packs remain valid under their existing receipts. See [`docs/section-scoped-waivers.md`](docs/section-scoped-waivers.md) and the [research-packs operator playbook](https://github.com/mcp-tool-shop-org/research-packs/blob/main/docs/operator-playbook.md).
|
|
157
161
|
|
|
@@ -167,7 +171,7 @@ This is the structural alternative to *search → summarize → pretty report*.
|
|
|
167
171
|
|
|
168
172
|
### What v0.3 is not
|
|
169
173
|
|
|
170
|
-
- Not battle-tested by external users.
|
|
174
|
+
- Not battle-tested by external users. Three dogfood arcs have closed — one self-referential, two external-domain — and Experiment 3 (API stability under external pressure) is **CLOSED 2026-05-10**: all three packs (ComfyUI, XRPL, Godot) reached freeze without breaking changes to the v0.3.x CLI surface. The arc earned v0.3.0 `--detector` (F-09), v0.3.1 section-scoped waivers (F-10/F-11), v0.3.2 normalized accepted-claim accounting (F-36), and v0.3.3 gate-semantics clarity (F-43/F-41).
|
|
171
175
|
- Not a synthesis writer. The `synth workspace` command generates the structured workspace; humans (or Cowork) write the prose against accepted claim IDs.
|
|
172
176
|
- Not API-stable under semver. v1.0.0 is an earned state, not a calendar date — see [`docs/roadmap.md`](docs/roadmap.md) for the six experiments that close the gap.
|
|
173
177
|
|