@mcptoolshop/research-os 0.3.0 → 0.3.2

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
package/README.fr.md CHANGED
@@ -7,7 +7,7 @@
7
7
  </p>
8
8
 
9
9
  <p align="center">
10
- <a href="https://github.com/mcp-tool-shop-org/research-os/releases/tag/v0.1.0"><img src="https://img.shields.io/badge/version-0.1.0-blue" alt="version 0.1.0"></a>
10
+ <a href="https://github.com/mcp-tool-shop-org/research-os/releases/tag/v0.3.2"><img src="https://img.shields.io/badge/version-0.3.2-blue" alt="version 0.3.2"></a>
11
11
  <a href="https://github.com/mcp-tool-shop-org/research-os/actions/workflows/ci.yml"><img src="https://github.com/mcp-tool-shop-org/research-os/actions/workflows/ci.yml/badge.svg" alt="CI"></a>
12
12
  <a href="LICENSE"><img src="https://img.shields.io/badge/license-MIT-green" alt="MIT License"></a>
13
13
  <img src="https://img.shields.io/badge/node-%E2%89%A520-brightgreen" alt="Node ≥20">
@@ -24,7 +24,67 @@ Un outil en ligne de commande qui transforme un sujet ouvert en un **ensemble de
24
24
 
25
25
  Ce n'est pas un générateur de rapports. Ce n'est pas un framework d'orchestration de modèles de langage (LLM). Il ne rédige pas la synthèse pour vous. Il impose les conditions dans lesquelles la synthèse peut commencer.
26
26
 
27
- **La version 0.1 a été utilisée une seule fois : par elle-même, sur elle-même.** Cette seule utilisation a révélé sept lacunes de correction dans `research-os`, chacune étant corrigée avant cette version. La traçabilité des modifications — sept sessions, deux modèles d'intégration, 463 cas de tests `vitest`, un ensemble de ressources structuré se trouve dans [`docs/dogfood-proof.md`](docs/dogfood-proof.md). Manuel d'utilisation : <https://mcp-tool-shop-org.github.io/research-os/handbook/>.
27
+ Les ensembles de données figés sont archivés dans [`mcp-tool-shop-org/research-packs`](https://github.com/mcp-tool-shop-org/research-packs) et sont accessibles en direct, avec deux ensembles de données de la première version. Consultez [`docs/roadmap.md`](docs/roadmap.md) pour connaître la feuille de route de la version 1.0.
28
+
29
+ La version 0.1 a été testée en profondeur lors de deux phases de test utilisateur. La première — où "research-os" étudie sa propre spécification — a révélé sept erreurs avant la version 0.1.0, chacune nécessitant une correction de code et donnant lieu à une règle ou un modèle d'intégration. La deuxième (Expérience 1 : durabilité du flux de travail ComfyUI, 11 sessions, un domaine sans chevauchement de vocabulaire avec "research-os") a été finalisée le 2026-05-09 : l'ensemble de données figé est accessible en direct, l'application de la règle 2 est terminée via le commit `22b5dba`. La documentation de la version 0.1 est disponible dans [`docs/dogfood-proof.md`](docs/dogfood-proof.md) ; la documentation de l'Expérience 1 est disponible dans [`docs/experiment-1-proof.md`](docs/experiment-1-proof.md). Le manuel est disponible à l'adresse suivante : <https://mcp-tool-shop-org.github.io/research-os/handbook/>.
30
+
31
+ ## Installation
32
+
33
+ **Prérequis :** Node.js ≥ 20.
34
+
35
+ ```bash
36
+ npm install -g @mcptoolshop/research-os
37
+ ```
38
+
39
+ Pour les contributeurs qui construisent à partir du code source :
40
+
41
+ ```bash
42
+ git clone https://github.com/mcp-tool-shop-org/research-os.git
43
+ cd research-os
44
+ npm install
45
+ npm run build
46
+ npm link
47
+ ```
48
+
49
+ ## Démarrage rapide
50
+
51
+ ```bash
52
+ # Create a new research-pack
53
+ research-os init "How should X be structured?"
54
+
55
+ # Add a section
56
+ research-os section add 01-landscape --purpose "Map the current landscape"
57
+
58
+ # Discover and approve sources, then gather
59
+ research-os discover run 01-landscape
60
+ research-os discover approve 01-landscape --top 8
61
+ research-os gather 01-landscape --approved
62
+
63
+ # Run the per-section chain
64
+ research-os claim extract 01-landscape
65
+ research-os claim audit-density 01-landscape
66
+ research-os claim triage 01-landscape
67
+ research-os contradict map 01-landscape --triaged-only
68
+ research-os review 01-landscape --triaged-only --preset hermes-two-pass --profile hermes-two-pass
69
+ research-os review-promote 01-landscape --profile hermes-two-pass
70
+ research-os gate 01-landscape
71
+ research-os section report 01-landscape
72
+
73
+ # Pack-level finish
74
+ research-os audit
75
+ research-os index build --all
76
+ research-os cowork handoff
77
+ research-os synth workspace # only if handoff returned synthesis_ready
78
+ research-os freeze
79
+
80
+ # Export to the research-packs archive
81
+ research-os pack publish \
82
+ --to <research-packs>/packages/<name>
83
+ ```
84
+
85
+ **Pour un exemple concret**, consultez l'ensemble de données "dogfood" situé dans `research-os-packs/research-os-spec/` : chaque fichier, chaque enregistrement, chaque disposition, chaque empreinte de "gel", le tout est stocké sur disque dans des fichiers qui ne peuvent être modifiés qu'en ajoutant des informations. Cet ensemble de données a généré le fichier `docs/dogfood-proof.md`.
86
+
87
+ **Nécessite [ollama-intern-mcp](https://github.com/mcp-tool-shop-org/ollama-intern-mcp) en cours d'exécution localement** pour l'extraction, le tri, la revue et la découverte des modèles de langage. Le modèle par défaut est `hermes3:8b`; vous pouvez le modifier en utilisant la variable d'environnement `OLLAMA_INTERN_MODEL=<modèle>`. Définissez la variable d'environnement `OLLAMA_HOST` si Ollama n'est pas exécuté sur l'adresse par défaut `localhost:11434`.
28
88
 
29
89
  ## Les 16 lois fondamentales
30
90
 
@@ -76,55 +136,6 @@ Chaque étape est une commande en ligne de commande. Chaque étape écrit des do
76
136
 
77
137
  Ceci est une alternative structurée à *recherche → résumé → rapport détaillé*. La chaîne est le produit.
78
138
 
79
- ## Installation
80
-
81
- **Prérequis :** Node.js ≥ 20.
82
-
83
- ```bash
84
- # From source (v0.1.0 is not yet published to npm)
85
- git clone https://github.com/mcp-tool-shop-org/research-os.git
86
- cd research-os
87
- npm install
88
- npm run build
89
- npm link # makes `research-os` available on your PATH
90
- ```
91
-
92
- ## Démarrage rapide
93
-
94
- ```bash
95
- # Create a new research-pack
96
- research-os init "How should X be structured?"
97
-
98
- # Add a section
99
- research-os section add 01-landscape --purpose "Map the current landscape"
100
-
101
- # Discover and approve sources, then gather
102
- research-os discover run 01-landscape
103
- research-os discover approve 01-landscape --top 8
104
- research-os gather 01-landscape --approved
105
-
106
- # Run the per-section chain
107
- research-os claim extract 01-landscape
108
- research-os claim audit-density 01-landscape
109
- research-os claim triage 01-landscape
110
- research-os contradict map 01-landscape --triaged-only
111
- research-os review 01-landscape --triaged-only --preset hermes-two-pass --profile hermes-two-pass
112
- research-os review-promote 01-landscape --profile hermes-two-pass
113
- research-os gate 01-landscape
114
- research-os section report 01-landscape
115
-
116
- # Pack-level finish
117
- research-os audit
118
- research-os index build --all
119
- research-os cowork handoff
120
- research-os synth workspace # only if handoff returned synthesis_ready
121
- research-os freeze
122
- ```
123
-
124
- **Pour un exemple concret**, consultez l'ensemble de données "dogfood" situé dans `research-os-packs/research-os-spec/` : chaque fichier, chaque enregistrement, chaque disposition, chaque empreinte de "gel", le tout est stocké sur disque dans des fichiers qui ne peuvent être modifiés qu'en ajoutant des informations. Cet ensemble de données a généré le fichier `docs/dogfood-proof.md`.
125
-
126
- **Nécessite [ollama-intern-mcp](https://github.com/mcp-tool-shop-org/ollama-intern-mcp) en cours d'exécution localement** pour l'extraction, le tri, la revue et la découverte des modèles de langage. Le modèle par défaut est `hermes3:8b`; vous pouvez le modifier en utilisant la variable d'environnement `OLLAMA_INTERN_MODEL=<modèle>`. Définissez la variable d'environnement `OLLAMA_HOST` si Ollama n'est pas exécuté sur l'adresse par défaut `localhost:11434`.
127
-
128
139
  ## Vocabulaire
129
140
 
130
141
  | Terme | Signification |
@@ -140,20 +151,37 @@ research-os freeze
140
151
 
141
152
  ## Statut
142
153
 
154
+ **v0.3.2** — publiée sur npm en tant que `@mcptoolshop/research-os@0.3.2`, le 2026-05-09. Inclut une normalisation des demandes d'acceptation, prenant en compte l'admission pour la publication de l'ensemble de données. La vérification stricte d'égalité entre `claim-reviews.jsonl` et `pack-audit.json::accepted_claims` est remplacée par une comparaison d'ensembles — les demandes acceptées sont des `claim_id` uniques dont la décision de révision canonique la plus récente est `accepted_for_synthesis` (la dernière décision fait foi pour chaque `claim_id`). Les ensembles de données figés dont le nombre d'audits hérités diffère de l'ensemble normalisé sont désormais acceptés avec un avertissement plutôt qu'un refus ; le fichier d'audit hérité est conservé tel quel (Règle 15), tandis que le manifeste de l'archive reflète le nombre normalisé. Le refus reste strict pour les `claim_id` fantômes, les décisions dupliquées incompatibles et les conditions qui ne permettent pas la synthèse. Ceci a été obtenu grâce à l'Expérience 3, session K, pour l'ensemble de données XRPL — la publication de l'ensemble de données a été refusée en raison d'un désaccord sur le registre de clôture (la section 07 comportait 24 lignes brutes `accepted_for_synthesis`, mais seulement 19 `claim_id` uniques en raison des fenêtres de révision des examinateurs qui se chevauchent). 558/558 tests vitest réussis. Consultez [CHANGELOG.md](CHANGELOG.md) et [`docs/pack-publish.md`](docs/pack-publish.md).
155
+
156
+ **v0.3.1** — publiée sur npm en tant que `@mcptoolshop/research-os@0.3.1`, le 2026-05-09. Inclut des clauses de renonciation spécifiques aux sections (`primary_source_waiver.section_waivers[]`) ainsi qu'une confirmation de la part des examinateurs, de sorte qu'une constatation de "monopole de la source" à l'échelle d'une section, qui est renoncée, devient une mise en garde visible plutôt qu'une redirection automatique de toutes les demandes vers `needs_source_repair`. Ceci a été obtenu grâce à l'Expérience 3, session 2, pour l'ensemble de données XRPL — les sections du protocole canonique (chaînes à fondation unique, spécifications d'API en vase clos, documents des organismes de normalisation) ont inversé l'hypothèse selon laquelle la diversité des éditeurs est un indicateur de la qualité de l'information. 540/540 tests vitest réussis à ce moment-là. Consultez [`docs/section-scoped-waivers.md`](docs/section-scoped-waivers.md).
157
+
158
+ **Clauses de renonciation spécifiques aux sections** — Utilisez-les lorsque la diversité des éditeurs est structurellement incompatible avec la source de vérité de la section, et non lorsque la section n'a simplement pas trouvé suffisamment de sources. La `raison` est appliquée par le schéma, ainsi que la présence de tableaux `compensating_controls[]` non vides. La politique de l'ensemble de données `primary_source_waiver_allowed: false` bloque à la fois les renonciation au niveau de l'ensemble de données et les renonciation spécifiques aux sections. La solution de contournement `min_independent_publishers: 0` au niveau de l'ensemble de données, qui était en vigueur avant la version 0.3.1, est maintenant obsolète ; les ensembles de données figés existants restent valides selon leurs reçus existants. Consultez [`docs/section-scoped-waivers.md`](docs/section-scoped-waivers.md) et le [guide d'utilisation de l'opérateur pour les ensembles de données](https://github.com/mcp-tool-shop-org/research-packs/blob/main/docs/operator-playbook.md).
159
+
160
+ **v0.3.0** — publiée le 2026-05-09. Introduit l'indicateur `--detector <auto|heuristic|ollama-intern>` pour la commande `contradict map` (correction F-09 du blocage de la chaîne provenant de l'Expérience 3, session 1, ensemble de données XRPL). 527/527 tests vitest réussis à ce moment-là. La sélection du détecteur est maintenant un choix explicite de l'opérateur plutôt qu'une danse complexe avec des variables d'environnement dépendantes de l'état ; le mode est annoncé de manière visible à chaque exécution. Consultez [`docs/contradict-map.md`](docs/contradict-map.md).
161
+
162
+ **v0.2.0** — publié le 2026-05-09. Distribution du paquet `research-os pack publish` (Expérience 2) et correction de la condition de préparation du modèle 2. 515 tests Vitest réussis. Consultez [CHANGELOG.md](CHANGELOG.md). Les paquets figés sont exportés vers l'archive canonique `research-packs` avec une seule commande ; le contrat d'adhésion est appliqué par le code, et non par une liste de contrôle. Consultez [`docs/pack-publish.md`](docs/pack-publish.md).
163
+
143
164
  **v0.1.0** — gelée le 2026-05-08. L'ensemble de données "dogfood" situé dans `research-os-packs/research-os-spec/` (dépôt frère) a atteint l'état de "gel" avec 296 propositions acceptées réparties sur 8 sections, 17 dispositions, 30 propositions corrigées par l'utilisateur, 0 blocage de correction actif, 0 contradiction non résolue, toutes les étapes de validation indiquant `synthesis_eligible=true`. 463/463 tests Vitest réussis. Seize règles fondamentales cumulées. Consultez le fichier [`docs/dogfood-proof.md`](docs/dogfood-proof.md) pour connaître les sept découvertes et les empreintes des enregistrements de "gel".
144
165
 
166
+ **Monorepo de l'archive `research-packs`** — disponible à [`mcp-tool-shop-org/research-packs`](https://github.com/mcp-tool-shop-org/research-packs) avec deux paquets disponibles dès le lancement. `comfyui-workflow-durability` (Expérience 1, 302 affirmations acceptées, 8 sections) et `research-os-self-dogfood` (remplissage de la version 0.1, 296 affirmations acceptées, 8 sections). Les deux paquets passent le test `verify-pack.mjs`.
167
+
168
+ **Expérience 1 (Durabilité du flux de travail ComfyUI) — v1** — TERMINÉE le 2026-05-09. Les 8 sections sont disponibles dans le Terminal A, le paquet est figé, l'archive est en ligne. Consultez [`docs/experiment-1-proof.md`](docs/experiment-1-proof.md) et [`docs/roadmap.md`](docs/roadmap.md).
169
+
145
170
  ### Ce que la version 0.1 n'est pas
146
171
 
147
- - Non testée en conditions réelles par des utilisateurs externes. La seule exécution "dogfood" a révélé sept bogues.
148
- - Pas encore disponible sur npm. Installez à partir du code source jusqu'à ce que la publication `npm publish` ait lieu.
149
- - Pas un générateur de code. La commande `synth workspace` génère l'espace de travail structuré ; les humains (ou Cowork) écrivent le texte en fonction des identifiants des propositions acceptées.
150
- - Pas une API stable selon les règles de compatibilité sémantique. La version 1.0.0 sera publiée après que des utilisateurs externes auront validé l'interface au fil du temps.
172
+ - Non testée en conditions réelles par des utilisateurs externes. Deux cycles de test interne sont terminés : un auto-référentiel et un externe. L'Expérience 3 (stabilité de l'API sous pression externe) est en cours : le paquet n°2 sur 3 (durabilité des jetons de créateur XRPL) est figé avec 251 affirmations acceptées réparties sur 7 sections, en attente de l'approbation de la publication du paquet pour npm v0.3.2. Ce cycle a permis d'obtenir le drapeau `--detector` v0.3.0 (F-09, bloqueur de chaîne), les exemptions de source spécifiques aux sections v0.3.1 (F-10/F-11, pression du protocole canonique) et la comptabilité normalisée des affirmations acceptées v0.3.2 (F-36, jointure du grand livre de clôture). Un paquet supplémentaire de domaine externe est nécessaire pour la clôture de l'Expérience 3.
173
+ - Ne génère pas de texte. La commande `synth workspace` génère l'espace de travail structuré ; les humains (ou Cowork) rédigent le texte en fonction des identifiants des affirmations acceptées.
174
+ - La stabilité de l'API n'est pas garantie selon la version sémantique. La version 1.0.0 est un état atteint, et non une date calendaire. Consultez [`docs/roadmap.md`](docs/roadmap.md) pour connaître les six expériences qui permettent d'atteindre cet objectif.
151
175
 
152
176
  ### Limitations connues
153
177
 
154
- - **L'origine de l'extracteur n'est pas visible au niveau de la jointure.** Une section peut passer le seuil de validité tout en s'appuyant sur des mécanismes de repli heuristiques lorsque l'extracteur calibré (Ollama avec le modèle configuré) n'est pas disponible. Ceci est enregistré comme une faiblesse connue ; les améliorations futures indiqueront les affirmations acceptées par l'extracteur et exigeront un nombre d'affirmations acceptées égal au seuil à partir du chemin calibré.
155
- - **Le choix du modèle de réviseur, au-delà de la base de référence calibrée `hermes-two-pass`, n'est pas encore résolu.** L'environnement de test interne a validé une configuration de réviseur ; les modèles alternatifs doivent être calibrés avec des tests de défaillance simulées avant de pouvoir être utilisés.
156
- - **Le pack de test interne a utilisé `mistral-nemo:12b` pour l'extraction (la valeur par défaut est `hermes3:8b`).** Le système a généré des résultats incorrects pour des noms de sections auto-référentielles, ce qui a été corrigé grâce à une discipline de précision des requêtes (voir le manuel) et à des URL pré-configurées par les opérateurs pour les sujets ambigus.
178
+ - **L'origine de l'extracteur n'est pas visible au niveau de la jointure.** Une section peut passer le seuil des affirmations acceptées tout en s'appuyant sur des affirmations heuristiques lorsque l'extracteur calibré (Ollama avec le modèle configuré) n'est pas disponible. Cela est enregistré comme l'Expérience 4 dans la feuille de route ; les améliorations futures indiqueront les affirmations acceptées par extracteur et exigeront le nombre d'affirmations acceptées du chemin calibré.
179
+ - **La sélection du modèle de révision au-delà de la base de référence calibrée `hermes-two-pass` n'est pas résolue.** Le cycle de test interne a validé une configuration de réviseur ; les modèles alternatifs doivent être calibrés avec un rappel de défaillance simulée avant de pouvoir être utilisés. C'est l'Expérience 5 dans la feuille de route.
180
+ - **Le paquet de test interne v0.1 utilisait `mistral-nemo:12b` pour l'extraction (le modèle par défaut canonique est `hermes3:8b`).** `hermes3:8b` n'était pas disponible sur cette machine pendant le cycle v0.1. Cette information est indiquée jusqu'à ce qu'une version basée sur hermes3 soit disponible. C'est l'Expérience 6 dans la feuille de route. Pour les opérateurs utilisant des machines sans `hermes3:8b`, définissez `OLLAMA_INTERN_MODEL` sur un modèle disponible ; les URL pré-configurées par l'opérateur et la discipline de précision des requêtes (voir le manuel) atténuent les hallucinations de découverte sur des sujets ambigus.
181
+
182
+ ## Feuille de route vers la version 1.0
183
+
184
+ La version 1.0 est un état atteint grâce aux progrès réalisés, et non une date de sortie. Six expérimentations sont nécessaires entre la version 0.1 et la version 1.0 : une version interne non axée sur les fonctionnalités existantes (actuellement en cours de développement avec le pack de durabilité pour ComfyUI), une commande `research-os pack publish` qui automatise l'exportation vers le référentiel unique `research-packs` (Expérience 2, limitée par la finalisation manuelle de l'Expérience 1), la stabilité de l'API sous pression externe, la résolution du problème de traçabilité des extractions, l'amélioration de la calibration des examinateurs au-delà de `hermes-two-pass`, et une exécution de référence propre sur `hermes3:8b`. L'Expérience 1 ne sera pas finalisée au moment de la version stable – elle se terminera lorsque la version stable sera distribuée comme premier paquet dans le référentiel unique `research-packs`, en complément de la version interne 0.1. Le plan complet est disponible dans [`docs/roadmap.md`](docs/roadmap.md). L'architecture reste inchangée ; la version 1.0 approfondit ce que la version 0.1 a démontré, plutôt que de réintroduire des éléments.
157
185
 
158
186
  ## Licence
159
187
 
package/README.hi.md CHANGED
@@ -7,7 +7,7 @@
7
7
  </p>
8
8
 
9
9
  <p align="center">
10
- <a href="https://github.com/mcp-tool-shop-org/research-os/releases/tag/v0.1.0"><img src="https://img.shields.io/badge/version-0.1.0-blue" alt="version 0.1.0"></a>
10
+ <a href="https://github.com/mcp-tool-shop-org/research-os/releases/tag/v0.3.2"><img src="https://img.shields.io/badge/version-0.3.2-blue" alt="version 0.3.2"></a>
11
11
  <a href="https://github.com/mcp-tool-shop-org/research-os/actions/workflows/ci.yml"><img src="https://github.com/mcp-tool-shop-org/research-os/actions/workflows/ci.yml/badge.svg" alt="CI"></a>
12
12
  <a href="LICENSE"><img src="https://img.shields.io/badge/license-MIT-green" alt="MIT License"></a>
13
13
  <img src="https://img.shields.io/badge/node-%E2%89%A520-brightgreen" alt="Node ≥20">
@@ -24,7 +24,67 @@
24
24
 
25
25
  यह कोई रिपोर्ट जनरेटर नहीं है। यह कोई एलएलएम (LLM) प्रबंधन प्रणाली भी नहीं है। यह आपके लिए संश्लेषण (सिंथेसिस) नहीं लिखता है। यह उन शर्तों को लागू करता है जिनके तहत संश्लेषण शुरू किया जा सकता है।
26
26
 
27
- **v0.1 का उपयोग केवल एक बार किया गया है: अकेले, अपने आप में।** इस एक उपयोग में, `research-os` में सात त्रुटियाँ पाई गईं, जिन्हें इस संस्करण के जारी होने से पहले ठीक कर दिया गया था। इस परीक्षण प्रक्रिया से संबंधित जानकारी—सात सत्र, दो एकीकरण पैटर्न, 463 विटेस्ट परीक्षण मामले, और एक स्थिर पैकेज—[`docs/dogfood-proof.md`](docs/dogfood-proof.md) में उपलब्ध है। लाइव हैंडबुक: <https://mcp-tool-shop-org.github.io/research-os/handbook/>।
27
+ फ्रीज किए गए पैकेज [`mcp-tool-shop-org/research-packs`](https://github.com/mcp-tool-shop-org/research-packs) में संग्रहीत हैं - लाइव, दो शुरुआती पैकेजों के साथ। v1.0 के पथ के बारे में जानकारी [`docs/roadmap.md`](docs/roadmap.md) में दी गई है।
28
+
29
+ v0.1 को दो परीक्षणों में जांचा गया। पहले परीक्षण में, "रिसर्च-ओएस" ने अपनी ही विशिष्टताओं की जांच की, जिसमें v0.1.0 जारी होने से पहले सात त्रुटियां पाई गईं, जिनमें से प्रत्येक को ठीक करने की आवश्यकता थी और जिसके लिए एक नियम या एकीकरण पैटर्न की आवश्यकता थी। दूसरे परीक्षण (v1 प्रयोग 1: कॉमफीयूआई वर्कफ़्लो की स्थिरता, 11 सत्र, एक ऐसा डोमेन जिसमें "रिसर्च-ओएस" के साथ कोई शब्दावली समानता नहीं है) को 2026-05-09 को बंद कर दिया गया: पैकेज फ्रीज किया गया, संग्रह लाइव है, पैटर्न 2 को `22b5dba` कमिट के माध्यम से लागू किया गया। v0.1 के परीक्षण के परिणाम [`docs/dogfood-proof.md`](docs/dogfood-proof.md) में उपलब्ध हैं; प्रयोग 1 के परीक्षण के परिणाम [`docs/experiment-1-proof.md`](docs/experiment-1-proof.md) में उपलब्ध हैं। लाइव हैंडबुक: <https://mcp-tool-shop-org.github.io/research-os/handbook/>।
30
+
31
+ ## स्थापना
32
+
33
+ **आवश्यकताएँ:** Node.js ≥ 20।
34
+
35
+ ```bash
36
+ npm install -g @mcptoolshop/research-os
37
+ ```
38
+
39
+ उन योगदानकर्ताओं के लिए जो स्रोत कोड से निर्माण कर रहे हैं:
40
+
41
+ ```bash
42
+ git clone https://github.com/mcp-tool-shop-org/research-os.git
43
+ cd research-os
44
+ npm install
45
+ npm run build
46
+ npm link
47
+ ```
48
+
49
+ ## शुरुआत
50
+
51
+ ```bash
52
+ # Create a new research-pack
53
+ research-os init "How should X be structured?"
54
+
55
+ # Add a section
56
+ research-os section add 01-landscape --purpose "Map the current landscape"
57
+
58
+ # Discover and approve sources, then gather
59
+ research-os discover run 01-landscape
60
+ research-os discover approve 01-landscape --top 8
61
+ research-os gather 01-landscape --approved
62
+
63
+ # Run the per-section chain
64
+ research-os claim extract 01-landscape
65
+ research-os claim audit-density 01-landscape
66
+ research-os claim triage 01-landscape
67
+ research-os contradict map 01-landscape --triaged-only
68
+ research-os review 01-landscape --triaged-only --preset hermes-two-pass --profile hermes-two-pass
69
+ research-os review-promote 01-landscape --profile hermes-two-pass
70
+ research-os gate 01-landscape
71
+ research-os section report 01-landscape
72
+
73
+ # Pack-level finish
74
+ research-os audit
75
+ research-os index build --all
76
+ research-os cowork handoff
77
+ research-os synth workspace # only if handoff returned synthesis_ready
78
+ research-os freeze
79
+
80
+ # Export to the research-packs archive
81
+ research-os pack publish \
82
+ --to <research-packs>/packages/<name>
83
+ ```
84
+
85
+ **एक वास्तविक उदाहरण के लिए**, `research-os-packs/research-os-spec/` पर मौजूद 'डॉगफूड' पैकेज देखें - प्रत्येक फ़ाइल, प्रत्येक रिकॉर्ड, प्रत्येक स्थिति, प्रत्येक 'फ्रीज' फ़िंगरप्रिंट, सभी केवल अपेंड करने योग्य लॉग फ़ाइलों में मौजूद हैं। इसी पैकेज ने `docs/dogfood-proof.md` बनाया है।
86
+
87
+ **स्थानीय रूप से चलने वाले [ollama-intern-mcp](https://github.com/mcp-tool-shop-org/ollama-intern-mcp) की आवश्यकता है** एलएलएम (LLM) निष्कर्षण, वर्गीकरण, समीक्षा और खोज के लिए। डिफ़ॉल्ट मॉडल `hermes3:8b` है; `OLLAMA_INTERN_MODEL=<model>` के साथ इसे बदला जा सकता है। यदि ओलामा डिफ़ॉल्ट `localhost:11434` पर नहीं चल रहा है, तो `OLLAMA_HOST` सेट करें।
28
88
 
29
89
  ## 16 भार-वाहक नियम।
30
90
 
@@ -76,55 +136,6 @@ discover
76
136
 
77
137
  यह *खोज → सारांश → सुंदर रिपोर्ट* का एक संरचनात्मक विकल्प है। यह श्रृंखला ही उत्पाद है।
78
138
 
79
- ## स्थापना
80
-
81
- **आवश्यकताएँ:** Node.js ≥ 20।
82
-
83
- ```bash
84
- # From source (v0.1.0 is not yet published to npm)
85
- git clone https://github.com/mcp-tool-shop-org/research-os.git
86
- cd research-os
87
- npm install
88
- npm run build
89
- npm link # makes `research-os` available on your PATH
90
- ```
91
-
92
- ## शुरुआत
93
-
94
- ```bash
95
- # Create a new research-pack
96
- research-os init "How should X be structured?"
97
-
98
- # Add a section
99
- research-os section add 01-landscape --purpose "Map the current landscape"
100
-
101
- # Discover and approve sources, then gather
102
- research-os discover run 01-landscape
103
- research-os discover approve 01-landscape --top 8
104
- research-os gather 01-landscape --approved
105
-
106
- # Run the per-section chain
107
- research-os claim extract 01-landscape
108
- research-os claim audit-density 01-landscape
109
- research-os claim triage 01-landscape
110
- research-os contradict map 01-landscape --triaged-only
111
- research-os review 01-landscape --triaged-only --preset hermes-two-pass --profile hermes-two-pass
112
- research-os review-promote 01-landscape --profile hermes-two-pass
113
- research-os gate 01-landscape
114
- research-os section report 01-landscape
115
-
116
- # Pack-level finish
117
- research-os audit
118
- research-os index build --all
119
- research-os cowork handoff
120
- research-os synth workspace # only if handoff returned synthesis_ready
121
- research-os freeze
122
- ```
123
-
124
- **एक वास्तविक उदाहरण के लिए**, `research-os-packs/research-os-spec/` पर मौजूद 'डॉगफूड' पैकेज देखें - प्रत्येक फ़ाइल, प्रत्येक रिकॉर्ड, प्रत्येक स्थिति, प्रत्येक 'फ्रीज' फ़िंगरप्रिंट, सभी केवल अपेंड करने योग्य लॉग फ़ाइलों में मौजूद हैं। इसी पैकेज ने `docs/dogfood-proof.md` बनाया है।
125
-
126
- **स्थानीय रूप से चलने वाले [ollama-intern-mcp](https://github.com/mcp-tool-shop-org/ollama-intern-mcp) की आवश्यकता है** एलएलएम (LLM) निष्कर्षण, वर्गीकरण, समीक्षा और खोज के लिए। डिफ़ॉल्ट मॉडल `hermes3:8b` है; `OLLAMA_INTERN_MODEL=<model>` के साथ इसे बदला जा सकता है। यदि ओलामा डिफ़ॉल्ट `localhost:11434` पर नहीं चल रहा है, तो `OLLAMA_HOST` सेट करें।
127
-
128
139
  ## शब्दावली
129
140
 
130
141
  | पद | अर्थ |
@@ -140,24 +151,37 @@ research-os freeze
140
151
 
141
152
  ## स्थिति
142
153
 
154
+ **v0.3.2** — 2026-05-09 को `@mcptoolshop/research-os@0.3.2` के रूप में npm पर प्रकाशित। इसमें `pack publish` स्वीकृति के लिए सामान्यीकृत गणना शामिल है। `claim-reviews.jsonl` और `pack-audit.json::accepted_claims` के बीच सख्त समानता जांच को एक प्रभावी-सेट तुलना से बदल दिया गया है - स्वीकृत दावे अद्वितीय `claim_id` हैं जिनका नवीनतम आधिकारिक समीक्षा निर्णय `accepted_for_synthesis` है (प्रत्येक `claim_id` के लिए नवीनतम निर्णय मान्य है)। जिन फ्रीज किए गए पैकेजों की विरासत ऑडिट गणना प्रभावी सेट से भिन्न है, उन्हें अब चेतावनी के साथ स्वीकार किया जाता है, अस्वीकार नहीं किया जाता; विरासत ऑडिट फ़ाइल को अपरिवर्तित रखा जाता है (नियम 15), जबकि संग्रह मैनिफेस्ट में सामान्यीकृत गणना दिखाई जाती है। काल्पनिक `claim_id`s, असंगत डुप्लिकेट निर्णयों और गैर-संश्लेषण-योग्य शर्तों के लिए अस्वीकृति अभी भी लागू है। यह प्रयोग 3 XRPL पैकेज सत्र K द्वारा प्राप्त किया गया था - एक वास्तविक क्लोजर-लेजर असहमति के कारण पैकेज प्रकाशन को अस्वीकार कर दिया गया था (अनुभाग 07 में 24 `accepted_for_synthesis` पंक्तियाँ थीं, लेकिन ओवरलैपिंग समीक्षक विंडो के कारण केवल 19 अद्वितीय `claim_id` थे)। 558/558 vitest पास हुए। [CHANGELOG.md](CHANGELOG.md) और [`docs/pack-publish.md`](docs/pack-publish.md) देखें।
155
+
156
+ **v0.3.1** — 2026-05-09 को `@mcptoolshop/research-os@0.3.1` के रूप में npm पर प्रकाशित। इसमें अनुभाग-विशिष्ट स्रोत-माफी (`primary_source_waiver.section_waivers[]`) और समीक्षक-पक्षीय स्वीकृति शामिल है, ताकि एक अनुभाग-व्यापी `source_cluster_monopoly` खोज को स्वचालित रूप से सभी दावों को `needs_source_repair` पर भेजने के बजाय एक दृश्य चेतावनी के रूप में प्रदर्शित किया जा सके। यह प्रयोग 3 XRPL पैकेज सत्र 2 द्वारा प्राप्त किया गया था - मानक प्रोटोकॉल अनुभागों (सिंगल-फाउंडेशन चेन, दीवार-बगीचे API विनिर्देश, मानकों-निकाय दस्तावेज़) ने इस धारणा को उलट दिया कि प्रकाशक विविधता सत्य की गुणवत्ता का प्रतिनिधित्व करती है। उस समय 540/540 vitest पास हुए। [`docs/section-scoped-waivers.md`](docs/section-scoped-waivers.md) देखें।
157
+
158
+ **अनुभाग-विशिष्ट स्रोत माफी** — इसका उपयोग तब करें जब प्रकाशक विविधता अनुभाग के सत्य स्रोत के साथ संरचनात्मक रूप से असंगत हो, न कि जब किसी अनुभाग में पर्याप्त स्रोत नहीं मिले हों। स्कीमा-सक्षम `reason` + गैर-रिक्त `compensating_controls[]`। पैकेज नीति `primary_source_waiver_allowed: false` दोनों पैकेज-स्तरीय और अनुभाग-विशिष्ट माफी को रोकता है। v0.3.1 से पहले के पैकेज-स्तरीय `min_independent_publishers: 0` कार्यप्रणाली अब अप्रचलित है; मौजूदा फ्रीज किए गए पैकेज अपने मौजूदा प्रमाण पत्रों के तहत मान्य रहते हैं। [`docs/section-scoped-waivers.md`](docs/section-scoped-waivers.md) और [रिसर्च-पैक्स ऑपरेटर प्लेबुक](https://github.com/mcp-tool-shop-org/research-packs/blob/main/docs/operator-playbook.md) देखें।
159
+
160
+ **v0.3.0** — 2026-05-09 को प्रकाशित। `--detector <auto|heuristic|ollama-intern>` ध्वज को `contradict map` पर जोड़ा गया (प्रयोग 3 सत्र 1, XRPL पैकेज से F-09 चेन-ब्लॉकर फिक्स)। उस समय 527/527 vitest पास हुए। डिटेक्टर चयन अब एक राज्य-निर्भर पर्यावरण चर नृत्य के बजाय एक स्पष्ट ऑपरेटर विकल्प है; मोड हर रन पर स्पष्ट रूप से प्रदर्शित होता है। [`docs/contradict-map.md`](docs/contradict-map.md) देखें।
161
+
162
+ **v0.2.0** — 2026-05-09 को प्रकाशित। `research-os pack publish` (प्रयोग 2) और पैटर्न 2 की तत्परता संबंधी त्रुटि को ठीक किया गया। 515 में से 515 परीक्षण सफल रहे। विवरण के लिए [CHANGELOG.md](CHANGELOG.md) देखें। स्थिर पैकेजों को एक ही कमांड के साथ मानक `research-packs` संग्रह में निर्यात किया जाता है; स्वीकृति अनुबंध को चेकलिस्ट के बजाय कोड द्वारा लागू किया जाता है। विवरण के लिए [`docs/pack-publish.md`](docs/pack-publish.md) देखें।
163
+
143
164
  **v0.1.0** — 2026-05-08 को 'फ्रीज' किया गया। `research-os-packs/research-os-spec/` (संबंधित रिपॉजिटरी) पर मौजूद 'डॉगफूड' पैकेज में 8 अनुभागों में से 296 दावों को स्वीकार किया गया, 17 को स्थिति दी गई, 30 को ऑपरेटर द्वारा बदला गया, 0 सक्रिय सुधार अवरोधक हैं, कोई अनसुलझा विरोधाभास नहीं है, सभी गेट `synthesis_eligible=true` हैं। 463/463 'विटेस्ट' पास हो गए। कुल 16 महत्वपूर्ण नियम लागू हैं। 'फ्रीज' रसीद फ़िंगरप्रिंट और अन्य जानकारी के लिए [`docs/dogfood-proof.md`](docs/dogfood-proof.md) देखें।
144
165
 
166
+ **research-packs संग्रह मोनोरिपो** — [`mcp-tool-shop-org/research-packs`](https://github.com/mcp-tool-shop-org/research-packs) पर उपलब्ध है, जिसमें दो प्रारंभिक पैकेज हैं। `comfyui-workflow-durability` (प्रयोग 1, 302 स्वीकृत दावे, 8 खंड) और `research-os-self-dogfood` (v0.1 डॉगफूड बैकफिल, 296 स्वीकृत दावे, 8 खंड)। दोनों पैकेज `verify-pack.mjs` में सफल रहे।
167
+
168
+ **v1 प्रयोग 1 (ComfyUI वर्कफ़्लो स्थायित्व)** — 2026-05-09 को समाप्त। टर्मिनल ए के सभी 8 खंड, पैकेज स्थिर, संग्रह लाइव। विवरण के लिए [`docs/experiment-1-proof.md`](docs/experiment-1-proof.md) और [`docs/roadmap.md`](docs/roadmap.md) देखें।
169
+
145
170
  ### v0.1 क्या नहीं है
146
171
 
147
- - बाहरी उपयोगकर्ताओं द्वारा परीक्षण नहीं किया गया है। एकल 'डॉगफूड' रन में सात बग पाए गए।
148
- - अभी npm पर उपलब्ध नहीं है। `npm publish` होने तक स्रोत कोड से स्थापित करें।
149
- - संश्लेषण लिखने वाला उपकरण नहीं है। `synth workspace` कमांड संरचित कार्यक्षेत्र बनाता है; स्वीकृत दावा आईडी के विरुद्ध मानव (या Cowork) द्वारा सामग्री लिखी जाती है।
150
- - semver के तहत एपीआई स्थिर नहीं है। v1.0.0 एक अर्जित स्थिति है, कोई कैलेंडर तिथि नहीं - अंतर को भरने वाले पांच प्रयोगों के लिए [`docs/roadmap.md`](docs/roadmap.md) देखें।
172
+ - बाहरी उपयोगकर्ताओं द्वारा अभी तक परीक्षण नहीं किया गया है। दो डॉगफूड चक्र समाप्त हो गए हैं - एक स्व-संदर्भित, एक बाहरी डोमेन - और प्रयोग 3 (बाहरी दबाव में एपीआई स्थिरता) जारी है: 3 पैकेजों में से दूसरा पैकेज (XRPL क्रिएटर-टोकन स्थायित्व) स्थिर है, जिसमें 7 खंडों में 251 स्वीकृत दावे हैं, और npm v0.3.2 के खिलाफ पैकेज प्रकाशन स्वीकृति की प्रतीक्षा है। इस चक्र में v0.3.0 `--detector` ध्वज (F-09 चेन-ब्लॉकर), v0.3.1 अनुभाग-विशिष्ट स्रोत छूट (F-10/F-11 मानक प्रोटोकॉल दबाव), और v0.3.2 सामान्यीकृत स्वीकृत-दावा लेखांकन (F-36 क्लोजर-लेजर सीम) प्राप्त हुए हैं। प्रयोग 3 को पूरा करने के लिए एक और बाहरी डोमेन पैकेज की आवश्यकता है।
173
+ - यह कोई संश्लेषण लेखक नहीं है। `synth workspace` कमांड संरचित कार्यक्षेत्र बनाता है; स्वीकृत दावा आईडी के विरुद्ध मनुष्य (या Cowork) सामग्री लिखते हैं।
174
+ - यह semver के तहत एपीआई-स्थिर नहीं है। v1.0.0 एक अर्जित स्थिति है, कोई कैलेंडर तिथि नहीं - इस अंतर को भरने वाले छह प्रयोगों के लिए [`docs/roadmap.md`](docs/roadmap.md) देखें।
151
175
 
152
176
  ### ज्ञात सीमाएँ
153
177
 
154
- - **एक्सट्रैक्टर की उत्पत्ति गेट सीम पर दिखाई नहीं देती है।** एक सेक्शन, कैलिब्रेटेड एक्सट्रैक्टर (कॉन्फ़िगर किए गए मॉडल के साथ ओलामा) अनुपलब्ध होने पर, अनुमानित-बैकअप दावों पर निर्भर करते हुए, स्वीकृत-दावा स्तर को पार कर सकता है। इसे एक ज्ञात कमजोरी के रूप में दर्ज किया गया है; भविष्य में, सुरक्षा बढ़ाने के लिए, एक्सट्रैक्टर द्वारा स्वीकृत दावों की रिपोर्ट की जाएगी और कैलिब्रेटेड पथ से स्वीकृत दावों की अपेक्षित संख्या की आवश्यकता होगी।
155
- - **कैलिब्रेटेड `hermes-two-pass` बेसलाइन से परे, समीक्षक मॉडल का चयन अभी भी अनसुलझा है।** "डॉगफूड" परीक्षण में एक समीक्षक कॉन्फ़िगरेशन को मान्य किया गया था; अन्य मॉडलों को विश्वसनीय होने से पहले, उन्हें अपने स्वयं के "सीडेड-विफलता" रिकॉल कैलिब्रेशन की आवश्यकता होगी।
156
- - **"डॉगफूड" पैकेज ने निष्कर्षण के लिए `mistral-nemo:12b` का उपयोग किया (मानक डिफ़ॉल्ट `hermes3:8b` है)।** खोज ने स्व-संदर्भित सेक्शन नामों के लिए गलत डोमेन परिणाम उत्पन्न किए - जिन्हें क्वेरी-सटीकता अनुशासन (देखें हैंडबुक) और अस्पष्ट विषयों के लिए ऑपरेटर द्वारा पहले से तैयार किए गए यूआरएल के माध्यम से ठीक किया गया।
178
+ - **एक्सट्रैक्टर का स्रोत गेट सीम पर दिखाई नहीं देता है।** एक अनुभाग स्वीकृत-दावा सीमा को पार कर सकता है, जबकि कैलिब्रेटेड एक्सट्रैक्टर (कॉन्फ़िगर किए गए मॉडल के साथ Ollama) अनुपलब्ध होने पर हेयुरिस्टिक-बैकअप दावों पर निर्भर करता है। इसे रोडमैप में प्रयोग 4 के रूप में दर्ज किया गया है; भविष्य में, स्वीकृत दावों को एक्सट्रैक्टर द्वारा रिपोर्ट किया जाएगा और कैलिब्रेटेड पथ से स्वीकृत दावों की आवश्यक संख्या की आवश्यकता होगी।
179
+ - **कैलिब्रेटेड `hermes-two-pass` बेसलाइन से परे समीक्षक मॉडल का चयन अनसुलझा है।** डॉगफूड चक्र ने एक समीक्षक कॉन्फ़िगरेशन को मान्य किया; वैकल्पिक मॉडलों को विश्वसनीय होने से पहले उनके अपने सीडेड-विफलता रिकॉल कैलिब्रेशन की आवश्यकता होती है। रोडमैप में प्रयोग 5।
180
+ - **v0.1 स्व-डॉगफूड पैकेज ने निष्कर्षण के लिए `mistral-nemo:12b` का उपयोग किया (मानक डिफ़ॉल्ट `hermes3:8b` है)।** v0.1 चक्र के दौरान इस सिस्टम पर `hermes3:8b` उपलब्ध नहीं था। जब तक कि hermes3-आधारित रसीद उत्पन्न नहीं हो जाती, तब तक प्रतिस्थापन का उल्लेख मान्य रहेगा - रोडमैप में प्रयोग 6। `hermes3:8b` के बिना सिस्टम पर काम करने वाले उपयोगकर्ताओं के लिए, `OLLAMA_INTERN_MODEL` को एक उपलब्ध मॉडल पर सेट करें; ऑपरेटर-पूर्व-स्टेज किए गए URL और क्वेरी-सटीकता अनुशासन (देखें हैंडबुक) अस्पष्ट विषयों पर खोज संबंधी भ्रम को कम करते हैं।
157
181
 
158
182
  ## v1.0 के लिए रोडमैप
159
183
 
160
- v1.0 एक अर्जित स्थिति है, कोई रिलीज की तारीख नहीं। v0.1 और v1.0 के बीच पांच खुले प्रयोग हैं - बाहरी दबाव के तहत एपीआई स्थिरता, एक गैर-स्व-संदर्भित "डॉगफूड" पैकेज, एक्सट्रैक्टर-उत्पत्ति अंतर को भरना, `hermes-two-pass` से परे समीक्षक कैलिब्रेशन को सामान्य बनाना, और `hermes3:8b` पर एक स्वच्छ बेसलाइन रन। पूर्ण योजना [`docs/roadmap.md`](docs/roadmap.md) में है। आर्किटेक्चर लॉक पूरे समय बना रहेगा; v1.0, v0.1 द्वारा सिद्ध किए गए पहलुओं को गहरा करता है, न कि उन्हें फिर से खोलता है।
184
+ v1.0 एक "रिलीज़" की तारीख नहीं है, बल्कि एक "प्राप्त" स्थिति है। v0.1 और v1.0 के बीच छह "ओपन" प्रयोग हैं - "नॉन-सेल्फ-रेफरेंशियल डॉगफूड" (जो वर्तमान में "कॉम्फीयूआई वर्कफ़्लो ड्यूरेबिलिटी पैक" के रूप में प्रगति पर है), एक "`रिसर्च-ओएस पैक पब्लिश`" कमांड जो "रिसर्च-पैक्स" नामक मुख्य रिपॉजिटरी में स्वचालित रूप से डेटा निर्यात करता है (प्रयोग 2, जो प्रयोग 1 के मैनुअल समापन के बाद ही लागू होगा), बाहरी दबाव के तहत एपीआई की स्थिरता, "एक्सट्रैक्टर-प्रोवेनेंस" की कमी को दूर करना, "हरमेस-टू-पास" से आगे समीक्षक कैलिब्रेशन को सामान्य बनाना, और "हरमेस3:8b" पर एक "क्लीन बेसलाइन" रन। प्रयोग 1, "पैक फ्रीज़" होने तक पूरा नहीं होगा - यह तब बंद होगा जब "फ्रीज़" किया गया "पैक" "रिसर्च-पैक्स" मुख्य रिपॉजिटरी में पहले पैकेज के रूप में जारी किया जाएगा, साथ में v0.1 "सेल्फ-डॉगफूड" बैकफिल के साथ। पूरी योजना [`docs/roadmap.md`](docs/roadmap.md) में दी गई है। "आर्किटेक्चर" लॉकिंग पूरे समय लागू रहेगा; v1.0, v0.1 द्वारा साबित की गई बातों को और गहरा करता है, न कि उन्हें फिर से खोलता है।
161
185
 
162
186
  ## लाइसेंस
163
187