@mcptoolshop/research-os 0.3.1 → 0.3.2
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
- package/CHANGELOG.md +98 -0
- package/README.es.md +99 -71
- package/README.fr.md +86 -58
- package/README.hi.md +83 -59
- package/README.it.md +97 -73
- package/README.ja.md +86 -58
- package/README.md +5 -3
- package/README.pt-BR.md +83 -59
- package/README.zh.md +102 -74
- package/dist/cli.js +96 -15
- package/dist/cli.js.map +1 -1
- package/dist/index.d.ts +1 -1
- package/dist/index.js +1 -1
- package/dist/index.js.map +1 -1
- package/package.json +1 -1
package/README.hi.md
CHANGED
|
@@ -7,7 +7,7 @@
|
|
|
7
7
|
</p>
|
|
8
8
|
|
|
9
9
|
<p align="center">
|
|
10
|
-
<a href="https://github.com/mcp-tool-shop-org/research-os/releases/tag/v0.
|
|
10
|
+
<a href="https://github.com/mcp-tool-shop-org/research-os/releases/tag/v0.3.2"><img src="https://img.shields.io/badge/version-0.3.2-blue" alt="version 0.3.2"></a>
|
|
11
11
|
<a href="https://github.com/mcp-tool-shop-org/research-os/actions/workflows/ci.yml"><img src="https://github.com/mcp-tool-shop-org/research-os/actions/workflows/ci.yml/badge.svg" alt="CI"></a>
|
|
12
12
|
<a href="LICENSE"><img src="https://img.shields.io/badge/license-MIT-green" alt="MIT License"></a>
|
|
13
13
|
<img src="https://img.shields.io/badge/node-%E2%89%A520-brightgreen" alt="Node ≥20">
|
|
@@ -24,7 +24,67 @@
|
|
|
24
24
|
|
|
25
25
|
यह कोई रिपोर्ट जनरेटर नहीं है। यह कोई एलएलएम (LLM) प्रबंधन प्रणाली भी नहीं है। यह आपके लिए संश्लेषण (सिंथेसिस) नहीं लिखता है। यह उन शर्तों को लागू करता है जिनके तहत संश्लेषण शुरू किया जा सकता है।
|
|
26
26
|
|
|
27
|
-
|
|
27
|
+
फ्रीज किए गए पैकेज [`mcp-tool-shop-org/research-packs`](https://github.com/mcp-tool-shop-org/research-packs) में संग्रहीत हैं - लाइव, दो शुरुआती पैकेजों के साथ। v1.0 के पथ के बारे में जानकारी [`docs/roadmap.md`](docs/roadmap.md) में दी गई है।
|
|
28
|
+
|
|
29
|
+
v0.1 को दो परीक्षणों में जांचा गया। पहले परीक्षण में, "रिसर्च-ओएस" ने अपनी ही विशिष्टताओं की जांच की, जिसमें v0.1.0 जारी होने से पहले सात त्रुटियां पाई गईं, जिनमें से प्रत्येक को ठीक करने की आवश्यकता थी और जिसके लिए एक नियम या एकीकरण पैटर्न की आवश्यकता थी। दूसरे परीक्षण (v1 प्रयोग 1: कॉमफीयूआई वर्कफ़्लो की स्थिरता, 11 सत्र, एक ऐसा डोमेन जिसमें "रिसर्च-ओएस" के साथ कोई शब्दावली समानता नहीं है) को 2026-05-09 को बंद कर दिया गया: पैकेज फ्रीज किया गया, संग्रह लाइव है, पैटर्न 2 को `22b5dba` कमिट के माध्यम से लागू किया गया। v0.1 के परीक्षण के परिणाम [`docs/dogfood-proof.md`](docs/dogfood-proof.md) में उपलब्ध हैं; प्रयोग 1 के परीक्षण के परिणाम [`docs/experiment-1-proof.md`](docs/experiment-1-proof.md) में उपलब्ध हैं। लाइव हैंडबुक: <https://mcp-tool-shop-org.github.io/research-os/handbook/>।
|
|
30
|
+
|
|
31
|
+
## स्थापना
|
|
32
|
+
|
|
33
|
+
**आवश्यकताएँ:** Node.js ≥ 20।
|
|
34
|
+
|
|
35
|
+
```bash
|
|
36
|
+
npm install -g @mcptoolshop/research-os
|
|
37
|
+
```
|
|
38
|
+
|
|
39
|
+
उन योगदानकर्ताओं के लिए जो स्रोत कोड से निर्माण कर रहे हैं:
|
|
40
|
+
|
|
41
|
+
```bash
|
|
42
|
+
git clone https://github.com/mcp-tool-shop-org/research-os.git
|
|
43
|
+
cd research-os
|
|
44
|
+
npm install
|
|
45
|
+
npm run build
|
|
46
|
+
npm link
|
|
47
|
+
```
|
|
48
|
+
|
|
49
|
+
## शुरुआत
|
|
50
|
+
|
|
51
|
+
```bash
|
|
52
|
+
# Create a new research-pack
|
|
53
|
+
research-os init "How should X be structured?"
|
|
54
|
+
|
|
55
|
+
# Add a section
|
|
56
|
+
research-os section add 01-landscape --purpose "Map the current landscape"
|
|
57
|
+
|
|
58
|
+
# Discover and approve sources, then gather
|
|
59
|
+
research-os discover run 01-landscape
|
|
60
|
+
research-os discover approve 01-landscape --top 8
|
|
61
|
+
research-os gather 01-landscape --approved
|
|
62
|
+
|
|
63
|
+
# Run the per-section chain
|
|
64
|
+
research-os claim extract 01-landscape
|
|
65
|
+
research-os claim audit-density 01-landscape
|
|
66
|
+
research-os claim triage 01-landscape
|
|
67
|
+
research-os contradict map 01-landscape --triaged-only
|
|
68
|
+
research-os review 01-landscape --triaged-only --preset hermes-two-pass --profile hermes-two-pass
|
|
69
|
+
research-os review-promote 01-landscape --profile hermes-two-pass
|
|
70
|
+
research-os gate 01-landscape
|
|
71
|
+
research-os section report 01-landscape
|
|
72
|
+
|
|
73
|
+
# Pack-level finish
|
|
74
|
+
research-os audit
|
|
75
|
+
research-os index build --all
|
|
76
|
+
research-os cowork handoff
|
|
77
|
+
research-os synth workspace # only if handoff returned synthesis_ready
|
|
78
|
+
research-os freeze
|
|
79
|
+
|
|
80
|
+
# Export to the research-packs archive
|
|
81
|
+
research-os pack publish \
|
|
82
|
+
--to <research-packs>/packages/<name>
|
|
83
|
+
```
|
|
84
|
+
|
|
85
|
+
**एक वास्तविक उदाहरण के लिए**, `research-os-packs/research-os-spec/` पर मौजूद 'डॉगफूड' पैकेज देखें - प्रत्येक फ़ाइल, प्रत्येक रिकॉर्ड, प्रत्येक स्थिति, प्रत्येक 'फ्रीज' फ़िंगरप्रिंट, सभी केवल अपेंड करने योग्य लॉग फ़ाइलों में मौजूद हैं। इसी पैकेज ने `docs/dogfood-proof.md` बनाया है।
|
|
86
|
+
|
|
87
|
+
**स्थानीय रूप से चलने वाले [ollama-intern-mcp](https://github.com/mcp-tool-shop-org/ollama-intern-mcp) की आवश्यकता है** एलएलएम (LLM) निष्कर्षण, वर्गीकरण, समीक्षा और खोज के लिए। डिफ़ॉल्ट मॉडल `hermes3:8b` है; `OLLAMA_INTERN_MODEL=<model>` के साथ इसे बदला जा सकता है। यदि ओलामा डिफ़ॉल्ट `localhost:11434` पर नहीं चल रहा है, तो `OLLAMA_HOST` सेट करें।
|
|
28
88
|
|
|
29
89
|
## 16 भार-वाहक नियम।
|
|
30
90
|
|
|
@@ -76,55 +136,6 @@ discover
|
|
|
76
136
|
|
|
77
137
|
यह *खोज → सारांश → सुंदर रिपोर्ट* का एक संरचनात्मक विकल्प है। यह श्रृंखला ही उत्पाद है।
|
|
78
138
|
|
|
79
|
-
## स्थापना
|
|
80
|
-
|
|
81
|
-
**आवश्यकताएँ:** Node.js ≥ 20।
|
|
82
|
-
|
|
83
|
-
```bash
|
|
84
|
-
# From source (v0.1.0 is not yet published to npm)
|
|
85
|
-
git clone https://github.com/mcp-tool-shop-org/research-os.git
|
|
86
|
-
cd research-os
|
|
87
|
-
npm install
|
|
88
|
-
npm run build
|
|
89
|
-
npm link # makes `research-os` available on your PATH
|
|
90
|
-
```
|
|
91
|
-
|
|
92
|
-
## शुरुआत
|
|
93
|
-
|
|
94
|
-
```bash
|
|
95
|
-
# Create a new research-pack
|
|
96
|
-
research-os init "How should X be structured?"
|
|
97
|
-
|
|
98
|
-
# Add a section
|
|
99
|
-
research-os section add 01-landscape --purpose "Map the current landscape"
|
|
100
|
-
|
|
101
|
-
# Discover and approve sources, then gather
|
|
102
|
-
research-os discover run 01-landscape
|
|
103
|
-
research-os discover approve 01-landscape --top 8
|
|
104
|
-
research-os gather 01-landscape --approved
|
|
105
|
-
|
|
106
|
-
# Run the per-section chain
|
|
107
|
-
research-os claim extract 01-landscape
|
|
108
|
-
research-os claim audit-density 01-landscape
|
|
109
|
-
research-os claim triage 01-landscape
|
|
110
|
-
research-os contradict map 01-landscape --triaged-only
|
|
111
|
-
research-os review 01-landscape --triaged-only --preset hermes-two-pass --profile hermes-two-pass
|
|
112
|
-
research-os review-promote 01-landscape --profile hermes-two-pass
|
|
113
|
-
research-os gate 01-landscape
|
|
114
|
-
research-os section report 01-landscape
|
|
115
|
-
|
|
116
|
-
# Pack-level finish
|
|
117
|
-
research-os audit
|
|
118
|
-
research-os index build --all
|
|
119
|
-
research-os cowork handoff
|
|
120
|
-
research-os synth workspace # only if handoff returned synthesis_ready
|
|
121
|
-
research-os freeze
|
|
122
|
-
```
|
|
123
|
-
|
|
124
|
-
**एक वास्तविक उदाहरण के लिए**, `research-os-packs/research-os-spec/` पर मौजूद 'डॉगफूड' पैकेज देखें - प्रत्येक फ़ाइल, प्रत्येक रिकॉर्ड, प्रत्येक स्थिति, प्रत्येक 'फ्रीज' फ़िंगरप्रिंट, सभी केवल अपेंड करने योग्य लॉग फ़ाइलों में मौजूद हैं। इसी पैकेज ने `docs/dogfood-proof.md` बनाया है।
|
|
125
|
-
|
|
126
|
-
**स्थानीय रूप से चलने वाले [ollama-intern-mcp](https://github.com/mcp-tool-shop-org/ollama-intern-mcp) की आवश्यकता है** एलएलएम (LLM) निष्कर्षण, वर्गीकरण, समीक्षा और खोज के लिए। डिफ़ॉल्ट मॉडल `hermes3:8b` है; `OLLAMA_INTERN_MODEL=<model>` के साथ इसे बदला जा सकता है। यदि ओलामा डिफ़ॉल्ट `localhost:11434` पर नहीं चल रहा है, तो `OLLAMA_HOST` सेट करें।
|
|
127
|
-
|
|
128
139
|
## शब्दावली
|
|
129
140
|
|
|
130
141
|
| पद | अर्थ |
|
|
@@ -140,24 +151,37 @@ research-os freeze
|
|
|
140
151
|
|
|
141
152
|
## स्थिति
|
|
142
153
|
|
|
154
|
+
**v0.3.2** — 2026-05-09 को `@mcptoolshop/research-os@0.3.2` के रूप में npm पर प्रकाशित। इसमें `pack publish` स्वीकृति के लिए सामान्यीकृत गणना शामिल है। `claim-reviews.jsonl` और `pack-audit.json::accepted_claims` के बीच सख्त समानता जांच को एक प्रभावी-सेट तुलना से बदल दिया गया है - स्वीकृत दावे अद्वितीय `claim_id` हैं जिनका नवीनतम आधिकारिक समीक्षा निर्णय `accepted_for_synthesis` है (प्रत्येक `claim_id` के लिए नवीनतम निर्णय मान्य है)। जिन फ्रीज किए गए पैकेजों की विरासत ऑडिट गणना प्रभावी सेट से भिन्न है, उन्हें अब चेतावनी के साथ स्वीकार किया जाता है, अस्वीकार नहीं किया जाता; विरासत ऑडिट फ़ाइल को अपरिवर्तित रखा जाता है (नियम 15), जबकि संग्रह मैनिफेस्ट में सामान्यीकृत गणना दिखाई जाती है। काल्पनिक `claim_id`s, असंगत डुप्लिकेट निर्णयों और गैर-संश्लेषण-योग्य शर्तों के लिए अस्वीकृति अभी भी लागू है। यह प्रयोग 3 XRPL पैकेज सत्र K द्वारा प्राप्त किया गया था - एक वास्तविक क्लोजर-लेजर असहमति के कारण पैकेज प्रकाशन को अस्वीकार कर दिया गया था (अनुभाग 07 में 24 `accepted_for_synthesis` पंक्तियाँ थीं, लेकिन ओवरलैपिंग समीक्षक विंडो के कारण केवल 19 अद्वितीय `claim_id` थे)। 558/558 vitest पास हुए। [CHANGELOG.md](CHANGELOG.md) और [`docs/pack-publish.md`](docs/pack-publish.md) देखें।
|
|
155
|
+
|
|
156
|
+
**v0.3.1** — 2026-05-09 को `@mcptoolshop/research-os@0.3.1` के रूप में npm पर प्रकाशित। इसमें अनुभाग-विशिष्ट स्रोत-माफी (`primary_source_waiver.section_waivers[]`) और समीक्षक-पक्षीय स्वीकृति शामिल है, ताकि एक अनुभाग-व्यापी `source_cluster_monopoly` खोज को स्वचालित रूप से सभी दावों को `needs_source_repair` पर भेजने के बजाय एक दृश्य चेतावनी के रूप में प्रदर्शित किया जा सके। यह प्रयोग 3 XRPL पैकेज सत्र 2 द्वारा प्राप्त किया गया था - मानक प्रोटोकॉल अनुभागों (सिंगल-फाउंडेशन चेन, दीवार-बगीचे API विनिर्देश, मानकों-निकाय दस्तावेज़) ने इस धारणा को उलट दिया कि प्रकाशक विविधता सत्य की गुणवत्ता का प्रतिनिधित्व करती है। उस समय 540/540 vitest पास हुए। [`docs/section-scoped-waivers.md`](docs/section-scoped-waivers.md) देखें।
|
|
157
|
+
|
|
158
|
+
**अनुभाग-विशिष्ट स्रोत माफी** — इसका उपयोग तब करें जब प्रकाशक विविधता अनुभाग के सत्य स्रोत के साथ संरचनात्मक रूप से असंगत हो, न कि जब किसी अनुभाग में पर्याप्त स्रोत नहीं मिले हों। स्कीमा-सक्षम `reason` + गैर-रिक्त `compensating_controls[]`। पैकेज नीति `primary_source_waiver_allowed: false` दोनों पैकेज-स्तरीय और अनुभाग-विशिष्ट माफी को रोकता है। v0.3.1 से पहले के पैकेज-स्तरीय `min_independent_publishers: 0` कार्यप्रणाली अब अप्रचलित है; मौजूदा फ्रीज किए गए पैकेज अपने मौजूदा प्रमाण पत्रों के तहत मान्य रहते हैं। [`docs/section-scoped-waivers.md`](docs/section-scoped-waivers.md) और [रिसर्च-पैक्स ऑपरेटर प्लेबुक](https://github.com/mcp-tool-shop-org/research-packs/blob/main/docs/operator-playbook.md) देखें।
|
|
159
|
+
|
|
160
|
+
**v0.3.0** — 2026-05-09 को प्रकाशित। `--detector <auto|heuristic|ollama-intern>` ध्वज को `contradict map` पर जोड़ा गया (प्रयोग 3 सत्र 1, XRPL पैकेज से F-09 चेन-ब्लॉकर फिक्स)। उस समय 527/527 vitest पास हुए। डिटेक्टर चयन अब एक राज्य-निर्भर पर्यावरण चर नृत्य के बजाय एक स्पष्ट ऑपरेटर विकल्प है; मोड हर रन पर स्पष्ट रूप से प्रदर्शित होता है। [`docs/contradict-map.md`](docs/contradict-map.md) देखें।
|
|
161
|
+
|
|
162
|
+
**v0.2.0** — 2026-05-09 को प्रकाशित। `research-os pack publish` (प्रयोग 2) और पैटर्न 2 की तत्परता संबंधी त्रुटि को ठीक किया गया। 515 में से 515 परीक्षण सफल रहे। विवरण के लिए [CHANGELOG.md](CHANGELOG.md) देखें। स्थिर पैकेजों को एक ही कमांड के साथ मानक `research-packs` संग्रह में निर्यात किया जाता है; स्वीकृति अनुबंध को चेकलिस्ट के बजाय कोड द्वारा लागू किया जाता है। विवरण के लिए [`docs/pack-publish.md`](docs/pack-publish.md) देखें।
|
|
163
|
+
|
|
143
164
|
**v0.1.0** — 2026-05-08 को 'फ्रीज' किया गया। `research-os-packs/research-os-spec/` (संबंधित रिपॉजिटरी) पर मौजूद 'डॉगफूड' पैकेज में 8 अनुभागों में से 296 दावों को स्वीकार किया गया, 17 को स्थिति दी गई, 30 को ऑपरेटर द्वारा बदला गया, 0 सक्रिय सुधार अवरोधक हैं, कोई अनसुलझा विरोधाभास नहीं है, सभी गेट `synthesis_eligible=true` हैं। 463/463 'विटेस्ट' पास हो गए। कुल 16 महत्वपूर्ण नियम लागू हैं। 'फ्रीज' रसीद फ़िंगरप्रिंट और अन्य जानकारी के लिए [`docs/dogfood-proof.md`](docs/dogfood-proof.md) देखें।
|
|
144
165
|
|
|
166
|
+
**research-packs संग्रह मोनोरिपो** — [`mcp-tool-shop-org/research-packs`](https://github.com/mcp-tool-shop-org/research-packs) पर उपलब्ध है, जिसमें दो प्रारंभिक पैकेज हैं। `comfyui-workflow-durability` (प्रयोग 1, 302 स्वीकृत दावे, 8 खंड) और `research-os-self-dogfood` (v0.1 डॉगफूड बैकफिल, 296 स्वीकृत दावे, 8 खंड)। दोनों पैकेज `verify-pack.mjs` में सफल रहे।
|
|
167
|
+
|
|
168
|
+
**v1 प्रयोग 1 (ComfyUI वर्कफ़्लो स्थायित्व)** — 2026-05-09 को समाप्त। टर्मिनल ए के सभी 8 खंड, पैकेज स्थिर, संग्रह लाइव। विवरण के लिए [`docs/experiment-1-proof.md`](docs/experiment-1-proof.md) और [`docs/roadmap.md`](docs/roadmap.md) देखें।
|
|
169
|
+
|
|
145
170
|
### v0.1 क्या नहीं है
|
|
146
171
|
|
|
147
|
-
- बाहरी उपयोगकर्ताओं द्वारा परीक्षण नहीं किया गया है।
|
|
148
|
-
-
|
|
149
|
-
-
|
|
150
|
-
- semver के तहत एपीआई स्थिर नहीं है। v1.0.0 एक अर्जित स्थिति है, कोई कैलेंडर तिथि नहीं - अंतर को भरने वाले पांच प्रयोगों के लिए [`docs/roadmap.md`](docs/roadmap.md) देखें।
|
|
172
|
+
- बाहरी उपयोगकर्ताओं द्वारा अभी तक परीक्षण नहीं किया गया है। दो डॉगफूड चक्र समाप्त हो गए हैं - एक स्व-संदर्भित, एक बाहरी डोमेन - और प्रयोग 3 (बाहरी दबाव में एपीआई स्थिरता) जारी है: 3 पैकेजों में से दूसरा पैकेज (XRPL क्रिएटर-टोकन स्थायित्व) स्थिर है, जिसमें 7 खंडों में 251 स्वीकृत दावे हैं, और npm v0.3.2 के खिलाफ पैकेज प्रकाशन स्वीकृति की प्रतीक्षा है। इस चक्र में v0.3.0 `--detector` ध्वज (F-09 चेन-ब्लॉकर), v0.3.1 अनुभाग-विशिष्ट स्रोत छूट (F-10/F-11 मानक प्रोटोकॉल दबाव), और v0.3.2 सामान्यीकृत स्वीकृत-दावा लेखांकन (F-36 क्लोजर-लेजर सीम) प्राप्त हुए हैं। प्रयोग 3 को पूरा करने के लिए एक और बाहरी डोमेन पैकेज की आवश्यकता है।
|
|
173
|
+
- यह कोई संश्लेषण लेखक नहीं है। `synth workspace` कमांड संरचित कार्यक्षेत्र बनाता है; स्वीकृत दावा आईडी के विरुद्ध मनुष्य (या Cowork) सामग्री लिखते हैं।
|
|
174
|
+
- यह semver के तहत एपीआई-स्थिर नहीं है। v1.0.0 एक अर्जित स्थिति है, कोई कैलेंडर तिथि नहीं - इस अंतर को भरने वाले छह प्रयोगों के लिए [`docs/roadmap.md`](docs/roadmap.md) देखें।
|
|
151
175
|
|
|
152
176
|
### ज्ञात सीमाएँ
|
|
153
177
|
|
|
154
|
-
- **एक्सट्रैक्टर
|
|
155
|
-
- **कैलिब्रेटेड `hermes-two-pass` बेसलाइन से
|
|
156
|
-
- **
|
|
178
|
+
- **एक्सट्रैक्टर का स्रोत गेट सीम पर दिखाई नहीं देता है।** एक अनुभाग स्वीकृत-दावा सीमा को पार कर सकता है, जबकि कैलिब्रेटेड एक्सट्रैक्टर (कॉन्फ़िगर किए गए मॉडल के साथ Ollama) अनुपलब्ध होने पर हेयुरिस्टिक-बैकअप दावों पर निर्भर करता है। इसे रोडमैप में प्रयोग 4 के रूप में दर्ज किया गया है; भविष्य में, स्वीकृत दावों को एक्सट्रैक्टर द्वारा रिपोर्ट किया जाएगा और कैलिब्रेटेड पथ से स्वीकृत दावों की आवश्यक संख्या की आवश्यकता होगी।
|
|
179
|
+
- **कैलिब्रेटेड `hermes-two-pass` बेसलाइन से परे समीक्षक मॉडल का चयन अनसुलझा है।** डॉगफूड चक्र ने एक समीक्षक कॉन्फ़िगरेशन को मान्य किया; वैकल्पिक मॉडलों को विश्वसनीय होने से पहले उनके अपने सीडेड-विफलता रिकॉल कैलिब्रेशन की आवश्यकता होती है। रोडमैप में प्रयोग 5।
|
|
180
|
+
- **v0.1 स्व-डॉगफूड पैकेज ने निष्कर्षण के लिए `mistral-nemo:12b` का उपयोग किया (मानक डिफ़ॉल्ट `hermes3:8b` है)।** v0.1 चक्र के दौरान इस सिस्टम पर `hermes3:8b` उपलब्ध नहीं था। जब तक कि hermes3-आधारित रसीद उत्पन्न नहीं हो जाती, तब तक प्रतिस्थापन का उल्लेख मान्य रहेगा - रोडमैप में प्रयोग 6। `hermes3:8b` के बिना सिस्टम पर काम करने वाले उपयोगकर्ताओं के लिए, `OLLAMA_INTERN_MODEL` को एक उपलब्ध मॉडल पर सेट करें; ऑपरेटर-पूर्व-स्टेज किए गए URL और क्वेरी-सटीकता अनुशासन (देखें हैंडबुक) अस्पष्ट विषयों पर खोज संबंधी भ्रम को कम करते हैं।
|
|
157
181
|
|
|
158
182
|
## v1.0 के लिए रोडमैप
|
|
159
183
|
|
|
160
|
-
v1.0 एक
|
|
184
|
+
v1.0 एक "रिलीज़" की तारीख नहीं है, बल्कि एक "प्राप्त" स्थिति है। v0.1 और v1.0 के बीच छह "ओपन" प्रयोग हैं - "नॉन-सेल्फ-रेफरेंशियल डॉगफूड" (जो वर्तमान में "कॉम्फीयूआई वर्कफ़्लो ड्यूरेबिलिटी पैक" के रूप में प्रगति पर है), एक "`रिसर्च-ओएस पैक पब्लिश`" कमांड जो "रिसर्च-पैक्स" नामक मुख्य रिपॉजिटरी में स्वचालित रूप से डेटा निर्यात करता है (प्रयोग 2, जो प्रयोग 1 के मैनुअल समापन के बाद ही लागू होगा), बाहरी दबाव के तहत एपीआई की स्थिरता, "एक्सट्रैक्टर-प्रोवेनेंस" की कमी को दूर करना, "हरमेस-टू-पास" से आगे समीक्षक कैलिब्रेशन को सामान्य बनाना, और "हरमेस3:8b" पर एक "क्लीन बेसलाइन" रन। प्रयोग 1, "पैक फ्रीज़" होने तक पूरा नहीं होगा - यह तब बंद होगा जब "फ्रीज़" किया गया "पैक" "रिसर्च-पैक्स" मुख्य रिपॉजिटरी में पहले पैकेज के रूप में जारी किया जाएगा, साथ में v0.1 "सेल्फ-डॉगफूड" बैकफिल के साथ। पूरी योजना [`docs/roadmap.md`](docs/roadmap.md) में दी गई है। "आर्किटेक्चर" लॉकिंग पूरे समय लागू रहेगा; v1.0, v0.1 द्वारा साबित की गई बातों को और गहरा करता है, न कि उन्हें फिर से खोलता है।
|
|
161
185
|
|
|
162
186
|
## लाइसेंस
|
|
163
187
|
|
package/README.it.md
CHANGED
|
@@ -7,7 +7,7 @@
|
|
|
7
7
|
</p>
|
|
8
8
|
|
|
9
9
|
<p align="center">
|
|
10
|
-
<a href="https://github.com/mcp-tool-shop-org/research-os/releases/tag/v0.
|
|
10
|
+
<a href="https://github.com/mcp-tool-shop-org/research-os/releases/tag/v0.3.2"><img src="https://img.shields.io/badge/version-0.3.2-blue" alt="version 0.3.2"></a>
|
|
11
11
|
<a href="https://github.com/mcp-tool-shop-org/research-os/actions/workflows/ci.yml"><img src="https://github.com/mcp-tool-shop-org/research-os/actions/workflows/ci.yml/badge.svg" alt="CI"></a>
|
|
12
12
|
<a href="LICENSE"><img src="https://img.shields.io/badge/license-MIT-green" alt="MIT License"></a>
|
|
13
13
|
<img src="https://img.shields.io/badge/node-%E2%89%A520-brightgreen" alt="Node ≥20">
|
|
@@ -16,77 +16,34 @@
|
|
|
16
16
|
|
|
17
17
|
# research-os
|
|
18
18
|
|
|
19
|
-
Un'interfaccia a riga di comando (CLI) che trasforma un argomento
|
|
19
|
+
Un'interfaccia a riga di comando (CLI) che trasforma un argomento di ricerca in un "**pacchetto di ricerca**" strutturato, ovvero un repository organizzato in cui Claude, Cowork o un sistema simile possono lavorare per ore senza generare risultati errati o superficiali.
|
|
20
20
|
|
|
21
21
|
## Cos'è
|
|
22
22
|
|
|
23
|
-
`research-os` è il
|
|
23
|
+
`research-os` è il livello di controllo che interviene tra la richiesta "Voglio ricercare X" e una base di dati strutturata e verificabile. Separa le ipotesi iniziali dalle prove raccolte, l'estrazione dei dati dalle affermazioni verificate, il rilevamento delle contraddizioni dalla loro risoluzione e le decisioni di revisione dalle conclusioni finali. Ogni passaggio viene registrato in un registro immutabile; ogni valutazione di disponibilità è calcolata a partire da questi registri, e non è una semplice affermazione.
|
|
24
24
|
|
|
25
|
-
Non è un generatore di report. Non è un framework
|
|
25
|
+
Non è un generatore di report. Non è un framework per l'orchestrazione di modelli linguistici di grandi dimensioni (LLM). Non scrive la sintesi per te. Impone le condizioni necessarie per l'inizio della sintesi.
|
|
26
26
|
|
|
27
|
-
|
|
27
|
+
I pacchetti finalizzati vengono archiviati in [`mcp-tool-shop-org/research-packs`](https://github.com/mcp-tool-shop-org/research-packs) e sono disponibili, con due pacchetti iniziali. Consultare [`docs/roadmap.md`](docs/roadmap.md) per la roadmap della versione 1.0.
|
|
28
28
|
|
|
29
|
-
|
|
30
|
-
|
|
31
|
-
| # | Legge |
|
|
32
|
-
|---|-----|
|
|
33
|
-
| 1 | Nessuna sintesi prima della verifica delle fonti. |
|
|
34
|
-
| 2 | La raccolta è una prova; l'estrazione è un'interpretazione. |
|
|
35
|
-
| 3 | I modelli possono interpretare porzioni di testo originale; non possono creare porzioni di testo che costituiscono una prova. |
|
|
36
|
-
| 4 | L'estrazione può produrre un eccesso di informazioni; la sintesi non può ereditare questa abbondanza. |
|
|
37
|
-
| 5 | La mappatura delle contraddizioni evidenzia le discrepanze; non le risolve, non le sintetizza e non decide quale affermazione è corretta. |
|
|
38
|
-
| 6 | I controlli determinano se una sezione è idonea per la sintesi. Non eseguono la sintesi né nascondono i fallimenti. |
|
|
39
|
-
| 7 | La revisione critica valuta l'integrità della ricerca. Non esegue la sintesi né riscrive il testo originale. |
|
|
40
|
-
| 8 | L'indicizzazione rende la ricerca di informazioni basata su prove possibile. Non crea nuove informazioni né diventa la fonte ufficiale. |
|
|
41
|
-
| 9 | La funzione di trasferimento a Cowork genera istruzioni operative a partire dalle informazioni verificate. Non crea informazioni né aggira i controlli. |
|
|
42
|
-
| 10 | L'ambiente di lavoro per la sintesi organizza le informazioni verificate per Cowork. Non esegue la sintesi né aggira la modalità di trasferimento. |
|
|
43
|
-
| 11 | L'audit del pacchetto aggrega le informazioni verificate esistenti. Non crea nuove informazioni né nasconde le prove a livello di sezione. |
|
|
44
|
-
| 12 | La fase di scoperta propone spunti; solo la raccolta produce prove. |
|
|
45
|
-
| 13 | Un revisore non è considerato affidabile finché non vengono dimostrati dei fallimenti e la sua capacità di rilevarli. |
|
|
46
|
-
| 14 | L'abbondanza di affermazioni non è sinonimo di qualità della ricerca. Le affermazioni devono essere verificate prima di poter essere considerate per la sintesi. |
|
|
47
|
-
| 15 | La fase di consolidamento blocca le informazioni verificate. Non completa la ricerca incompleta né converte lo stato di riparazione in prove. |
|
|
48
|
-
| 16 | Le eccezioni allentano i vincoli delle fonti; non possono creare prove. |
|
|
49
|
-
|
|
50
|
-
**Legge 3** — il modello linguistico non crea mai il testo delle prove. `research-os` crea un registro di estratti deterministico (con ID stabili come `ex_<source_id_hex>_001`); il modello linguistico seleziona gli ID degli estratti; `research-os` copia il testo letterale. La classe di errore "parafrasi come citazione" è strutturalmente impossibile.
|
|
51
|
-
|
|
52
|
-
**Legge 14** — tra l'estrazione e la revisione, `research-os claim triage` deduplica, limita il contributo per fonte e mette da parte i candidati meno promettenti. La fase di triage NON modifica `claims.jsonl`; le affermazioni messe da parte rimangono nel registro principale.
|
|
53
|
-
|
|
54
|
-
## La sequenza di lavoro della versione 0.1
|
|
55
|
-
|
|
56
|
-
```
|
|
57
|
-
discover
|
|
58
|
-
→ gather
|
|
59
|
-
→ claim extract
|
|
60
|
-
→ claim audit-density
|
|
61
|
-
→ claim triage
|
|
62
|
-
→ contradict map
|
|
63
|
-
→ contradict resolve
|
|
64
|
-
→ review
|
|
65
|
-
→ review-promote
|
|
66
|
-
→ gate
|
|
67
|
-
→ section report
|
|
68
|
-
→ audit
|
|
69
|
-
→ index build
|
|
70
|
-
→ cowork handoff
|
|
71
|
-
→ synth workspace
|
|
72
|
-
→ freeze
|
|
73
|
-
```
|
|
74
|
-
|
|
75
|
-
Ogni passaggio è un comando da riga di comando. Ogni passaggio scrive su artefatti che possono essere solo aggiunti, non modificati. Nessun passaggio sintetizza, risolve o crea nuove verità; questi vincoli sono applicati, non considerati come affidabili. La fase di revisione accetta, rifiuta o richiede modifiche alle proposte; la fase di "gate" utilizza queste decisioni per calcolare l'idoneità alla sintesi; la fase di "freeze" è il blocco finale di integrità che impedisce di considerare un pacchetto come completato a meno che tutti i livelli non siano d'accordo. Consultare il file [docs/dogfood-proof.md](docs/dogfood-proof.md) per la documentazione della versione 0.1 che dimostra la coerenza dell'intera catena.
|
|
76
|
-
|
|
77
|
-
Questa è un'alternativa strutturale a *ricerca → riepilogo → report dettagliato*. La catena è il prodotto.
|
|
29
|
+
La versione 0.1 è stata testata in due cicli di "dogfooding". Il primo, che consisteva nella ricerca sulla propria specifica, ha identificato sette errori prima del rilascio della versione 0.1.0, ognuno dei quali ha richiesto una correzione del codice e ha portato all'implementazione di una regola o di un modello di integrazione. Il secondo (Esperimento 1: Durabilità del flusso di lavoro ComfyUI, 11 sessioni, un dominio senza sovrapposizioni lessicali con research-os) è stato completato il 2026-05-09: il pacchetto è stato finalizzato e l'archivio è attivo; l'applicazione della regola 2 è stata completata tramite il commit `22b5dba`. La documentazione del test della versione 0.1 è disponibile in [`docs/dogfood-proof.md`](docs/dogfood-proof.md); la documentazione dell'Esperimento 1 è disponibile in [`docs/experiment-1-proof.md`](docs/experiment-1-proof.md). La guida completa è disponibile all'indirizzo: <https://mcp-tool-shop-org.github.io/research-os/handbook/>.
|
|
78
30
|
|
|
79
31
|
## Installazione
|
|
80
32
|
|
|
81
33
|
**Requisiti:** Node.js ≥ 20.
|
|
82
34
|
|
|
83
35
|
```bash
|
|
84
|
-
|
|
36
|
+
npm install -g @mcptoolshop/research-os
|
|
37
|
+
```
|
|
38
|
+
|
|
39
|
+
Per i contributori che costruiscono il software partendo dal codice sorgente:
|
|
40
|
+
|
|
41
|
+
```bash
|
|
85
42
|
git clone https://github.com/mcp-tool-shop-org/research-os.git
|
|
86
43
|
cd research-os
|
|
87
44
|
npm install
|
|
88
45
|
npm run build
|
|
89
|
-
npm link
|
|
46
|
+
npm link
|
|
90
47
|
```
|
|
91
48
|
|
|
92
49
|
## Guida rapida
|
|
@@ -119,45 +76,112 @@ research-os index build --all
|
|
|
119
76
|
research-os cowork handoff
|
|
120
77
|
research-os synth workspace # only if handoff returned synthesis_ready
|
|
121
78
|
research-os freeze
|
|
79
|
+
|
|
80
|
+
# Export to the research-packs archive
|
|
81
|
+
research-os pack publish \
|
|
82
|
+
--to <research-packs>/packages/<name>
|
|
122
83
|
```
|
|
123
84
|
|
|
124
|
-
**Per un esempio pratico**, consultare il pacchetto di test
|
|
85
|
+
**Per un esempio pratico**, consultare il pacchetto di test `research-os-packs/research-os-spec/`, che contiene tutti gli elementi, le ricevute, le valutazioni, le "impronte digitali" e le registrazioni, tutti memorizzati in registri immutabili. Questo pacchetto ha generato la documentazione `docs/dogfood-proof.md`.
|
|
125
86
|
|
|
126
|
-
**Richiede [ollama-intern-mcp](https://github.com/mcp-tool-shop-org/ollama-intern-mcp) in esecuzione localmente** per l'estrazione, la classificazione, la revisione e la scoperta tramite
|
|
87
|
+
**Richiede [ollama-intern-mcp](https://github.com/mcp-tool-shop-org/ollama-intern-mcp) in esecuzione localmente** per l'estrazione, la classificazione, la revisione e la scoperta tramite LLM. Il modello predefinito è `hermes3:8b`; è possibile sovrascriverlo impostando la variabile d'ambiente `OLLAMA_INTERN_MODEL=<modello>`. Impostare la variabile `OLLAMA_HOST` se Ollama non è in esecuzione sull'indirizzo predefinito `localhost:11434`.
|
|
127
88
|
|
|
128
|
-
##
|
|
89
|
+
## Le 16 regole fondamentali
|
|
90
|
+
|
|
91
|
+
| # | Regola |
|
|
92
|
+
|---|-----|
|
|
93
|
+
| 1 | Nessuna sintesi prima della verifica delle fonti. |
|
|
94
|
+
| 2 | La raccolta di dati è una prova; l'estrazione è un'interpretazione. |
|
|
95
|
+
| 3 | I modelli possono interpretare porzioni di testo originale, ma non possono creare nuove prove. |
|
|
96
|
+
| 4 | L'estrazione può produrre un eccesso di dati; la sintesi non deve necessariamente includere tutti i dati estratti. |
|
|
97
|
+
| 5 | La mappatura delle contraddizioni evidenzia le discrepanze, ma non le risolve, non le sintetizza e non determina quale affermazione sia corretta. |
|
|
98
|
+
| 6 | I "gate" decidono se una sezione è idonea per la sintesi. Non eseguono la sintesi né nascondono i fallimenti. |
|
|
99
|
+
| 7 | La revisione critica valuta l'integrità della ricerca. Non esegue la sintesi né riscrive le fonti originali. |
|
|
100
|
+
| 8 | L'indicizzazione rende la ricerca di informazioni più semplice. Non crea nuove informazioni e non diventa la fonte ufficiale. |
|
|
101
|
+
| 9 | Il trasferimento di informazioni a Cowork traduce le istruzioni operative a partire dalle informazioni verificate. Non crea nuove informazioni e non aggira i "gate". |
|
|
102
|
+
| 10 | L'area di lavoro per la sintesi organizza le informazioni verificate per Cowork. Non esegue la sintesi e non aggira la modalità di trasferimento. |
|
|
103
|
+
| 11 | L'audit del pacchetto raccoglie le informazioni verificate esistenti. Non crea nuove informazioni e non nasconde le prove a livello di sezione. |
|
|
104
|
+
| 12 | La scoperta propone nuove piste di ricerca; solo la raccolta di dati produce prove. |
|
|
105
|
+
| 13 | Un revisore non è considerato affidabile finché non vengono dimostrate delle lacune e la sua capacità di rilevarle. |
|
|
106
|
+
| 14 | L'abbondanza di affermazioni non equivale a qualità della ricerca. Le affermazioni devono essere valutate prima di poter essere considerate per la sintesi. |
|
|
107
|
+
| 15 | La funzione "freeze" blocca la ricerca completata e valida. Non completa la ricerca incompleta né trasforma uno stato di "in riparazione" in una prova. |
|
|
108
|
+
| 16 | Le eccezioni (waivers) allentano i vincoli sulle fonti; non possono essere utilizzate per fabbricare prove. |
|
|
109
|
+
|
|
110
|
+
**Legge 3** — il modello linguistico (LLM) non genera mai il testo delle prove. Il sistema "research-os" crea un registro deterministico degli estratti (con ID stabili come `ex_<id_esadecimale_della_fonte>_001`); l'LLM seleziona gli ID degli estratti; "research-os" copia il testo letterale. La classe di errore "parafrasi come citazione" è strutturalmente impossibile.
|
|
111
|
+
|
|
112
|
+
**Legge 14** — tra l'estrazione e la revisione, "research-os claim triage" elimina le duplicazioni, limita il contributo per fonte e mette in attesa le candidature meno promettenti. Il triage NON modifica il file `claims.jsonl`; le affermazioni messe in attesa rimangono nel registro principale.
|
|
113
|
+
|
|
114
|
+
## La catena di flusso di lavoro v0.1
|
|
115
|
+
|
|
116
|
+
```
|
|
117
|
+
discover
|
|
118
|
+
→ gather
|
|
119
|
+
→ claim extract
|
|
120
|
+
→ claim audit-density
|
|
121
|
+
→ claim triage
|
|
122
|
+
→ contradict map
|
|
123
|
+
→ contradict resolve
|
|
124
|
+
→ review
|
|
125
|
+
→ review-promote
|
|
126
|
+
→ gate
|
|
127
|
+
→ section report
|
|
128
|
+
→ audit
|
|
129
|
+
→ index build
|
|
130
|
+
→ cowork handoff
|
|
131
|
+
→ synth workspace
|
|
132
|
+
→ freeze
|
|
133
|
+
```
|
|
134
|
+
|
|
135
|
+
Ogni passaggio è un comando della riga di comando (CLI). Ogni passaggio scrive su file che possono essere solo aggiunti (append-only). Nessun passaggio sintetizza, risolve o crea nuove verità; questi vincoli sono applicati, non affidati. La revisione accetta, rifiuta o richiede una correzione delle affermazioni candidate; il "gate" utilizza queste decisioni di revisione per calcolare l'"idoneità alla sintesi"; la funzione "freeze" è il blocco finale di integrità che rifiuta di contrassegnare un pacchetto come completato a meno che tutti i livelli non siano d'accordo. Consultare [docs/dogfood-proof.md](docs/dogfood-proof.md) per la prova della catena v0.1, che ne garantisce la coerenza end-to-end.
|
|
136
|
+
|
|
137
|
+
Questa è l'alternativa strutturale a *ricerca → riepilogo → report dettagliato*. La catena è il prodotto.
|
|
138
|
+
|
|
139
|
+
## Vocabolario
|
|
129
140
|
|
|
130
141
|
| Termine | Significato |
|
|
131
142
|
|------|---------|
|
|
132
|
-
| `research-os` | Il piano di controllo /
|
|
133
|
-
| `research-pack` | L'artefatto del repository generato per uno
|
|
143
|
+
| `research-os` | Il piano di controllo / CLI / gate / legge di orchestrazione (questo repository) |
|
|
144
|
+
| `research-pack` | L'artefatto del repository generato per uno sforzo di ricerca |
|
|
134
145
|
| `research section` | Un'unità di indagine delimitata all'interno di un pacchetto |
|
|
135
|
-
| `research receipt` |
|
|
146
|
+
| `research receipt` | Prova che una sezione ha superato i controlli di fonte/affermazione/gate |
|
|
136
147
|
|
|
137
148
|
## Sicurezza
|
|
138
149
|
|
|
139
|
-
`research-os` è
|
|
150
|
+
`research-os` è un'interfaccia a riga di comando (CLI) locale. Legge e scrive file all'interno della directory del pacchetto di ricerca a cui la si indica e, quando si utilizza la funzione "gather", effettua richieste HTTP in uscita per recuperare gli URL delle fonti fornite. Non esegue un server, non accetta connessioni in entrata, non memorizza credenziali né invia dati di telemetria. Nessun segreto viene scritto negli artefatti del pacchetto. Consultare [SECURITY.md](SECURITY.md) per la politica di segnalazione delle vulnerabilità.
|
|
140
151
|
|
|
141
152
|
## Stato
|
|
142
153
|
|
|
143
|
-
**v0.
|
|
154
|
+
**v0.3.2** — Pubblicato su npm come `@mcptoolshop/research-os@0.3.2` il 9 maggio 2026. Include la normalizzazione dei reclami accettati, tenendo conto dell'ammissione per la pubblicazione del pacchetto. Il controllo di uguaglianza rigoroso tra `claim-reviews.jsonl` e `pack-audit.json::accepted_claims` è stato sostituito con un confronto di insiemi — i reclami accettati sono identificativi univoci (`claim_id`) la cui ultima decisione di revisione canonica è "accettato per la sintesi" (l'ultima decisione prevale per ogni `claim_id`). I pacchetti "congelati" la cui cronologia delle revisioni differisce dall'insieme normalizzato vengono ora ammessi con un avviso anziché essere rifiutati; il file di revisione precedente viene conservato integralmente (Legge 15), mentre il manifest dell'archivio riflette il conteggio normalizzato. Il rifiuto rimane inalterato per gli identificativi di reclamo "fantasma", le decisioni duplicate incompatibili e le condizioni non idonee per la sintesi. Ottenuto tramite l'Esperimento 3 XRPL pack Session K — la pubblicazione del pacchetto è stata rifiutata a causa di una reale discrepanza nel registro di chiusura (la sezione 07 conteneva 24 righe "accettate per la sintesi", ma solo 19 identificativi univoci (`claim_id`) a causa delle sovrapposizioni negli intervalli di revisione). 558/558 test vitest superati. Consultare [CHANGELOG.md](CHANGELOG.md) e [`docs/pack-publish.md`](docs/pack-publish.md).
|
|
155
|
+
|
|
156
|
+
**v0.3.1** — pubblicato su npm come `@mcptoolshop/research-os@0.3.1`, 9 maggio 2026. Include eccezioni specifiche per sezione per le fonti (`primary_source_waiver.section_waivers[]`) e un'approvazione da parte del revisore, in modo che una scoperta di "monopolio del cluster di fonti" a livello di sezione diventi un avvertimento visibile anziché indirizzare automaticamente tutte le affermazioni a "needs_source_repair". Ottenuto con l'esperimento 3 del pacchetto XRPL, sessione 2 — le sezioni relative al protocollo canonico (catene con una singola base, specifiche API a "giardino chiuso", documentazione di organismi di standardizzazione) hanno invertito l'assunzione che la diversità degli editori sia un indicatore della qualità della verità. 540/540 test vitest superati. Consultare [CHANGELOG.md](CHANGELOG.md) e [`docs/section-scoped-waivers.md`](docs/section-scoped-waivers.md).
|
|
157
|
+
|
|
158
|
+
**Eccezioni specifiche per sezione per le fonti** — Utilizzarle quando la diversità degli editori è strutturalmente incompatibile con la fonte di verità della sezione, non quando una sezione semplicemente non è riuscita a trovare abbastanza fonti. Schema con `reason` (motivo) e `compensating_controls[]` (controlli compensativi) obbligatori. La policy del pacchetto `primary_source_waiver_allowed: false` blocca sia le eccezioni a livello di pacchetto che quelle specifiche per sezione. Il workaround precedente alla v0.3.1, `min_independent_publishers: 0`, è ora obsoleto; i pacchetti "frozen" esistenti rimangono validi con le ricevute esistenti. Consultare [`docs/section-scoped-waivers.md`](docs/section-scoped-waivers.md) e il [manuale operativo dei pacchetti di ricerca](https://github.com/mcp-tool-shop-org/research-packs/blob/main/docs/operator-playbook.md).
|
|
159
|
+
|
|
160
|
+
**v0.3.0** — pubblicata il 2026-05-09. È stato introdotto il flag `--detector <auto|heuristic|ollama-intern>` in `contradict map` (correzione F-09 del blocco della catena proveniente dalla Sessione 1 dell'Esperimento 3, pacchetto XRPL). 527 test vitest superati. La selezione del rilevatore è ora una scelta esplicita da parte dell'operatore, invece di una dipendenza dallo stato e da variabili d'ambiente; la modalità viene visualizzata in modo chiaro ad ogni esecuzione. Consultare [`docs/contradict-map.md`](docs/contradict-map.md).
|
|
161
|
+
|
|
162
|
+
**v0.2.0** — pubblicata il 2026-05-09. Sono stati distribuiti il pacchetto `research-os pack publish` (Esperimento 2) e la correzione del predicato di prontezza del Pattern 2. 515 test vitest superati. Consultare [CHANGELOG.md](CHANGELOG.md). I pacchetti con stato finale vengono esportati nell'archivio canonico `research-packs` con un singolo comando; l'accordo contrattuale viene applicato tramite codice, non tramite una checklist. Consultare [`docs/pack-publish.md`](docs/pack-publish.md).
|
|
163
|
+
|
|
164
|
+
**v0.1.0** — pacchetto di test interno bloccato l'8 maggio 2026. Il pacchetto in `research-os-packs/research-os-spec/` (repository correlato) ha raggiunto lo stato finale con 296 affermazioni accettate in 8 sezioni, 17 risolte, 30 sovrascritte dall'operatore, 0 blocchi di riparazione attivi, 0 contraddizioni irrisolte, con tutte le condizioni (`synthesis_eligible=true`) soddisfatte. Sono state implementate sedici leggi fondamentali. Consultare [`docs/dogfood-proof.md`](docs/dogfood-proof.md) per i sette risultati e le informazioni sull'identificazione dello stato finale.
|
|
165
|
+
|
|
166
|
+
**Archivio monorepo dei pacchetti di ricerca** — disponibile su [`mcp-tool-shop-org/research-packs`](https://github.com/mcp-tool-shop-org/research-packs) con due pacchetti disponibili fin dal primo giorno. `comfyui-workflow-durability` (Esperimento 1, 302 affermazioni accettate, 8 sezioni) e `research-os-self-dogfood` (backfill v0.1 per i test interni, 296 affermazioni accettate, 8 sezioni). Entrambi i pacchetti superano il test `verify-pack.mjs`.
|
|
167
|
+
|
|
168
|
+
**Esperimento 1 (Durabilità del flusso di lavoro ComfyUI)** — CHIUSO il 9 maggio 2026. Tutte le 8 sezioni in Terminal A, pacchetto bloccato, archivio disponibile. Consultare [`docs/experiment-1-proof.md`](docs/experiment-1-proof.md) e [`docs/roadmap.md`](docs/roadmap.md).
|
|
144
169
|
|
|
145
|
-
### Cosa la versione 0.
|
|
170
|
+
### Cosa la versione 0.3 non è
|
|
146
171
|
|
|
147
|
-
- Non
|
|
148
|
-
- Non è
|
|
149
|
-
- Non è
|
|
150
|
-
- Non ha una stabilità dell'API conforme alla versione semantica. La versione 1.0.0 è uno stato da raggiungere, non una data specifica; consultare il file [`docs/roadmap.md`](docs/roadmap.md) per i cinque esperimenti che colmano questa lacuna.
|
|
172
|
+
- Non testato in condizioni reali da utenti esterni. Due cicli di test interni sono stati completati: uno auto-referenziale e uno relativo a un dominio esterno, e l'Esperimento 3 (stabilità dell'API sotto pressione esterna) è in corso: il pacchetto n. 2 di 3 (durabilità dei token creati per XRPL) è "congelato" con 251 reclami accettati in 7 sezioni, in attesa dell'ammissione per la pubblicazione su npm v0.3.2. Questo ciclo ha ottenuto il flag v0.3.0 `--detector` (F-09 chain-blocker), le esenzioni specifiche per sezione v0.3.1 (F-10/F-11 pressione sul protocollo canonico) e la normalizzazione dei reclami accettati v0.3.2 (F-36 registro di chiusura). È necessario un altro pacchetto relativo a un dominio esterno per completare l'Esperimento 3.
|
|
173
|
+
- Non è uno strumento per la scrittura di sintesi. Il comando `synth workspace` genera l'ambiente di lavoro strutturato; gli esseri umani (o Cowork) scrivono il testo in base agli identificativi dei reclami accettati.
|
|
174
|
+
- Non è stabile per l'API secondo il sistema semantico di versionamento. La versione 1.0.0 è uno stato da raggiungere, non una data specifica; consultare [`docs/roadmap.md`](docs/roadmap.md) per i sei esperimenti che colmano questa lacuna.
|
|
151
175
|
|
|
152
176
|
### Limitazioni note
|
|
153
177
|
|
|
154
|
-
- **L'origine
|
|
155
|
-
- **La selezione del modello di revisione
|
|
156
|
-
- **Il pacchetto di test
|
|
178
|
+
- **L'origine dei dati estratti non è visibile al livello di connessione.** Una sezione può superare la soglia delle affermazioni accettate facendo affidamento su affermazioni basate su euristiche quando l'estrazione calibrata (Ollama con il modello configurato) non è disponibile. Questo è stato registrato come Esperimento 4 nella roadmap; le future ottimizzazioni mostreranno le affermazioni accettate per ogni strumento di estrazione e richiederanno il numero di affermazioni accettate derivanti dal percorso calibrato.
|
|
179
|
+
- **La selezione del modello di revisione oltre al modello di riferimento calibrato `hermes-two-pass` non è ancora risolta.** Il ciclo di test interni ha validato una configurazione del revisore; modelli alternativi devono essere sottoposti a una calibrazione specifica per la rilevazione di errori prima di poter essere considerati affidabili. Questo è l'Esperimento 5 nella roadmap.
|
|
180
|
+
- **Il pacchetto di test interni v0.1 ha utilizzato `mistral-nemo:12b` per l'estrazione (il valore predefinito canonico è `hermes3:8b`).** `hermes3:8b` non era disponibile su questo sistema durante il ciclo v0.1. Questa dichiarazione di sostituzione rimane valida fino a quando non viene generato un risultato basato su hermes3; questo è l'Esperimento 6 nella roadmap. Per gli operatori che utilizzano sistemi senza `hermes3:8b`, impostare la variabile `OLLAMA_INTERN_MODEL` su un modello disponibile; le URL pre-configurate per l'operatore e la disciplina nella precisione delle query (vedere il manuale) mitigano le allucinazioni nella scoperta di argomenti ambigui.
|
|
157
181
|
|
|
158
182
|
## Roadmap per la versione 1.0
|
|
159
183
|
|
|
160
|
-
La versione 1.0 è uno stato
|
|
184
|
+
La versione 1.0 è uno stato raggiunto attraverso il lavoro svolto, non una data di rilascio. Tra la versione 0.1 e la 1.0 ci sono sei esperimenti in corso: un sistema di test interno non auto-referenziale (attualmente in fase di sviluppo come il pacchetto "ComfyUI workflow durability"), un comando `research-os pack publish` che automatizza l'esportazione nel repository centrale `research-packs` (Esperimento 2, limitato e dipendente dal completamento dell'Esperimento 1), stabilità dell'API sotto pressione esterna, colmare il divario sulla provenienza dei dati estratti, estendere la calibrazione dei revisori oltre il sistema `hermes-two-pass` e un test di base pulito su `hermes3:8b`. L'Esperimento 1 non è completato al momento del "congelamento" del pacchetto; si conclude quando il pacchetto "congelato" viene distribuito come il primo pacchetto nel repository centrale `research-packs`, insieme al pacchetto di test interno della versione 0.1. Il piano completo è disponibile in [`docs/roadmap.md`](docs/roadmap.md). L'architettura rimane invariata; la versione 1.0 approfondisce ciò che la versione 0.1 ha dimostrato, piuttosto che riaprire vecchie questioni.
|
|
161
185
|
|
|
162
186
|
## Licenza
|
|
163
187
|
|