role-os 2.6.0 → 2.7.1
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
- package/CHANGELOG.md +26 -0
- package/README.es.md +185 -129
- package/README.fr.md +193 -137
- package/README.hi.md +191 -135
- package/README.it.md +186 -130
- package/README.ja.md +191 -135
- package/README.md +6 -18
- package/README.pt-BR.md +188 -132
- package/README.zh.md +192 -139
- package/bin/roleos.mjs +10 -0
- package/package.json +1 -1
- package/src/specialist/budget-consult.mjs +120 -0
- package/src/specialist/client.mjs +131 -0
- package/src/specialist/dispatch.mjs +237 -0
- package/src/specialist/events.mjs +56 -0
- package/src/specialist/gate.mjs +202 -0
- package/src/specialist/registry.mjs +219 -0
- package/src/specialist/shadow.mjs +122 -0
- package/src/specialist/state.mjs +125 -0
- package/src/specialist-cmd.mjs +378 -0
- package/starter-pack/policy/specialist-tier.md +288 -0
- package/starter-pack/schemas/specialist.md +155 -0
package/README.fr.md
CHANGED
|
@@ -13,20 +13,20 @@
|
|
|
13
13
|
<a href="https://mcp-tool-shop-org.github.io/role-os/"><img src="https://img.shields.io/badge/Landing_Page-live-brightgreen" alt="Landing Page"></a>
|
|
14
14
|
</p>
|
|
15
15
|
|
|
16
|
-
Un système d
|
|
16
|
+
Un système d’exploitation multi-Claude qui affecte du personnel, dirige, valide et exécute des tâches à travers 61 contrats de rôles spécialisés. Il crée des paquets de tâches, assemble l’équipe appropriée en fonction de critères de correspondance de rôles, détecte les problèmes avant l’exécution, redirige automatiquement les tâches en cas de blocage ou de rejet, et exige des preuves structurées pour chaque décision. Il inclut une répartition dynamique pour les missions à grande échelle — un dépôt de 10 composants devient automatiquement 28 étapes d’audit, au lieu de 6.
|
|
17
17
|
|
|
18
|
-
## Ce
|
|
18
|
+
## Ce qu’il fait
|
|
19
19
|
|
|
20
|
-
Role OS est la
|
|
20
|
+
Role OS est la méthode professionnelle pour utiliser multi-Claude. Il prévient les défaillances spécifiques que les flux de travail d’IA génériques produisent :
|
|
21
21
|
|
|
22
|
-
- **Dérive**
|
|
23
|
-
- **
|
|
24
|
-
- **Contamination**
|
|
25
|
-
- **Progrès basé sur des impressions**
|
|
22
|
+
- **Dérive** — les rôles restent dans leur domaine d’intervention. Le produit ne se redéfinit pas. L’interface ne redéfinit pas la portée. Le backend n’invente pas la direction du produit.
|
|
23
|
+
- **Achèvement incorrect** — la définition de « terminé » est concrète. Les tâches qui masquent des lacunes, omettent la vérification ou résolvent un problème différent sont rejetées.
|
|
24
|
+
- **Contamination** — les projets dérivés ou hérités conservent des éléments d’identité. Role OS détecte et rejette la dérive inter-projets en termes de terminologie, d’éléments visuels et de modèles mentaux.
|
|
25
|
+
- **Progrès basé sur des impressions** — chaque transfert est structuré. Chaque décision est liée à des preuves. « Cela semble terminé » n’est pas un état valide.
|
|
26
26
|
|
|
27
|
-
## Comment
|
|
27
|
+
## Comment il fonctionne
|
|
28
28
|
|
|
29
|
-
Décrivez votre tâche. Role OS détermine automatiquement le niveau d
|
|
29
|
+
Décrivez votre tâche. Role OS détermine automatiquement le niveau d’orchestration approprié.
|
|
30
30
|
|
|
31
31
|
```bash
|
|
32
32
|
roleos start "fix the crash in save handler"
|
|
@@ -42,15 +42,15 @@ roleos start "something completely novel"
|
|
|
42
42
|
# Hint: Create a packet and run `roleos route` for role-level routing
|
|
43
43
|
```
|
|
44
44
|
|
|
45
|
-
**L
|
|
45
|
+
**L’échelle de repli :**
|
|
46
46
|
|
|
47
|
-
1. **Mission** — lorsque la tâche correspond à un flux de travail récurrent éprouvé (correction de
|
|
48
|
-
2. **
|
|
49
|
-
3. **Routage libre** — lorsque la tâche est nouvelle,
|
|
47
|
+
1. **Mission** — lorsque la tâche correspond à un flux de travail récurrent et éprouvé (correction de bug, traitement, lancement de fonctionnalité, documentation, sécurité, recherche, brainstorming, audit approfondi, test en conditions réelles). Chaîne de rôles connue, flux d’artefacts, branches d’escalade et définitions honnêtes et partielles.
|
|
48
|
+
2. **Paquet** — lorsque la tâche appartient à une famille connue, mais ne correspond pas à une mission complète. 10 paquets d’équipe calibrés avec sélection automatique et protections contre les incompatibilités.
|
|
49
|
+
3. **Routage libre** — lorsque la tâche est nouvelle, mixte ou incertaine. Il évalue les 61 rôles en fonction du contenu du paquet et assemble une chaîne dynamique.
|
|
50
50
|
|
|
51
|
-
Le système ne force jamais une tâche à
|
|
51
|
+
Le système ne force jamais une tâche à passer par une abstraction incorrecte. Il explique pourquoi il a choisi chaque niveau et propose des alternatives.
|
|
52
52
|
|
|
53
|
-
**Une seule commande pour
|
|
53
|
+
**Une seule commande pour lancer l’exécution :**
|
|
54
54
|
|
|
55
55
|
```bash
|
|
56
56
|
roleos run "fix the crash in save handler"
|
|
@@ -67,7 +67,7 @@ roleos report # Generate completion report
|
|
|
67
67
|
roleos friction # Measure operator touches
|
|
68
68
|
```
|
|
69
69
|
|
|
70
|
-
**Interventions en cas de problème
|
|
70
|
+
**Interventions en cas de problème :**
|
|
71
71
|
|
|
72
72
|
```bash
|
|
73
73
|
roleos retry 0 # Retry a failed step
|
|
@@ -77,46 +77,52 @@ roleos block 2 "waiting for API spec"
|
|
|
77
77
|
roleos reopen 0 "found issue in review"
|
|
78
78
|
```
|
|
79
79
|
|
|
80
|
-
Les exécutions sont
|
|
80
|
+
Les exécutions sont conservées sur le disque (`.claude/runs/`), de sorte que les sessions interrompues reprennent en douceur. Chaque étape comprend des instructions pour l’opérateur : ce qui doit être produit, les sections requises et les conditions d’arrêt.
|
|
81
81
|
|
|
82
|
-
**Une fois routée
|
|
82
|
+
**Une fois la tâche routée :**
|
|
83
83
|
|
|
84
|
-
1. **Chaque rôle produit
|
|
85
|
-
2. **
|
|
86
|
-
3. **
|
|
84
|
+
1. **Chaque rôle produit un transfert** — une sortie structurée avec des éléments de preuve qui réduisent l’ambiguïté pour le rôle suivant.
|
|
85
|
+
2. **Un critique examine par rapport au contrat** — accepte, rejette ou bloque en fonction de preuves structurées, et non d’une simple impression.
|
|
86
|
+
3. **Le routage de reprise se fait automatiquement** — les tâches bloquées ou rejetées sont redirigées vers le bon responsable avec une raison, un type de reprise et l’artefact requis.
|
|
87
87
|
|
|
88
|
-
##
|
|
88
|
+
## Répartition tenant compte du budget
|
|
89
89
|
|
|
90
|
-
|
|
90
|
+
Role OS peut consulter un **analyste de budget de jetons** local pour chaque étape de répartition et joindre une prévision de dépenses indicative au manifeste — optionnel (`ROLEOS_BUDGET_CONSULT`), à titre indicatif (il ne bloque jamais une répartition) et, en cas d’échec, il revient à une base de référence déterministe. Désactivé par défaut ; la prévision est locale et gratuite. Voir le [manuel](https://mcp-tool-shop-org.github.io/role-os/handbook/specialist-budget/).
|
|
91
|
+
|
|
92
|
+
## État du déploiement à l’échelle de l’organisation
|
|
93
|
+
|
|
94
|
+
L’état du déploiement à l’échelle de l’organisation (file d’attente, décisions, enregistrements d’audit, paquets de verrouillage par dépôt) est stocké dans un dépôt privé distinct : [`role-os-rollout`](https://github.com/mcp-tool-shop-org/role-os-rollout). Ce dépôt est le produit ; ce dépôt est l’état opérationnel.
|
|
91
95
|
|
|
92
96
|
## Mémoire et continuité
|
|
93
97
|
|
|
94
|
-
Role OS ne possède ni ne duplique la couche de mémoire.
|
|
98
|
+
Role OS ne possède ni ne duplique la couche de mémoire. Là où la mémoire du projet Claude existe, c’est le système de continuité canonique — les faits du dépôt, les décisions, les points en suspens et l’historique du traitement s’y trouvent.
|
|
95
99
|
|
|
96
|
-
Role OS s
|
|
100
|
+
Role OS s’intègre à la mémoire du projet Claude. Il ne la remplace pas.
|
|
97
101
|
|
|
98
|
-
## Traitement complet et vérification
|
|
102
|
+
## Traitement complet et vérification avant lancement
|
|
99
103
|
|
|
100
|
-
Le traitement complet est un protocole canonique en 7
|
|
104
|
+
Le traitement complet est un protocole canonique en 7 phases défini dans la mémoire du projet Claude (`memory/full-treatment.md`). Role OS route et examine les traitements à l’aide de contrats de rôles, de transferts et de contrôles — il ne redéfinit pas le protocole.
|
|
101
105
|
|
|
102
|
-
La **vérification
|
|
106
|
+
La **vérification avant lancement** est le contrôle de qualité en 31 étapes qui s’exécute avant le traitement complet. Les contrôles stricts A à D doivent être réussis avant le début de tout traitement. Référence canonique : `memory/shipcheck.md`.
|
|
103
107
|
|
|
104
|
-
Ordre
|
|
108
|
+
Ordre : vérification avant lancement d’abord, puis traitement complet. Pas de version 1.0.0 sans avoir réussi les contrôles stricts.
|
|
105
109
|
|
|
106
|
-
##
|
|
110
|
+
## 61 rôles répartis en 10 paquets
|
|
107
111
|
|
|
108
|
-
|
|
|
112
|
+
| Paquet | Rôles |
|
|
109
113
|
|------|-------|
|
|
110
|
-
| **Core** (3) | Orchestrateur,
|
|
111
|
-
| **Engineering** (7) | Développeur
|
|
112
|
-
| **Design** (2) | Concepteur
|
|
113
|
-
| **Marketing** (1) | Rédacteur de
|
|
114
|
-
| **Treatment** (7) | Chercheur de
|
|
115
|
-
| **Product** (3) | Synthétiseur de
|
|
116
|
-
| **Research** (4) | Chercheur UX,
|
|
117
|
-
| **Growth** (4) | Stratège de
|
|
118
|
-
|
|
119
|
-
|
|
114
|
+
| **Core** (3) | Orchestrateur, stratège produit, critique |
|
|
115
|
+
| **Engineering** (7) | Développeur frontend, ingénieur backend, ingénieur de test, ingénieur de refactorisation, ingénieur de performance, auditeur de dépendances, examinateur de sécurité |
|
|
116
|
+
| **Design** (2) | Concepteur d’interface utilisateur, gardien de la marque |
|
|
117
|
+
| **Marketing** (1) | Rédacteur de contenu de lancement |
|
|
118
|
+
| **Treatment** (7) | Chercheur de dépôt, traducteur de dépôt, architecte de documentation, conservateur de métadonnées, auditeur de couverture, vérificateur de déploiement, ingénieur de publication |
|
|
119
|
+
| **Product** (3) | Synthétiseur de commentaires, priorisateur de feuille de route, rédacteur de spécifications |
|
|
120
|
+
| **Research** (4) | Chercheur UX, analyste concurrentiel, chercheur de tendances, synthétiseur d’entretiens avec les utilisateurs |
|
|
121
|
+
| **Growth** (4) | Stratège de lancement, stratège de contenu, responsable de la communauté, responsable du triage du support |
|
|
122
|
+
| **Deep Audit** (4) | Auditeur de composants, auditeur de la vérité des tests, auditeur des interfaces, synthétiseur d’audit |
|
|
123
|
+
| **Swarm** (7) | Coordinateur de l’équipe, agent backend de l’équipe, agent de liaison de l’équipe, agent de tests de l’équipe, agent d’infrastructure de l’équipe, agent frontend de l’équipe, synthétiseur de l’équipe |
|
|
124
|
+
|
|
125
|
+
Chaque rôle dispose d’un contrat complet : mission, quand l’utiliser, quand ne pas l’utiliser, entrées attendues, sorties requises, norme de qualité et déclencheurs d’escalade. Chaque rôle peut être affecté — `roleos route` peut en recommander l’un ou l’autre en fonction du contenu du paquet.
|
|
120
126
|
|
|
121
127
|
## Démarrage rapide
|
|
122
128
|
|
|
@@ -133,6 +139,19 @@ roleos complete artifact.md # Complete with artifact
|
|
|
133
139
|
roleos explain # Show full state
|
|
134
140
|
roleos report # Completion report
|
|
135
141
|
|
|
142
|
+
# Deep audit:
|
|
143
|
+
roleos audit manifest --generate # Create audit-manifest.json
|
|
144
|
+
roleos audit # Start component-level deep audit
|
|
145
|
+
roleos audit status # Check audit progress
|
|
146
|
+
roleos audit verify # Verify manifest and outputs
|
|
147
|
+
|
|
148
|
+
# Dogfood swarm:
|
|
149
|
+
roleos swarm manifest --generate # Auto-detect domains from repo structure
|
|
150
|
+
roleos swarm # Start multi-pass convergence swarm
|
|
151
|
+
roleos swarm status # Check swarm progress by stage
|
|
152
|
+
roleos swarm findings # List findings by severity
|
|
153
|
+
roleos swarm approve # Approve feature gate
|
|
154
|
+
|
|
136
155
|
# Or go manual:
|
|
137
156
|
roleos start "fix the crash" # Entry decision only (no run)
|
|
138
157
|
roleos packet new feature
|
|
@@ -146,55 +165,55 @@ roleos packs list
|
|
|
146
165
|
|
|
147
166
|
## Quand ne pas utiliser Role OS
|
|
148
167
|
|
|
149
|
-
- Corrections
|
|
168
|
+
- Corrections ponctuelles, fautes de frappe ou bogues évidents
|
|
150
169
|
- Recherche exploratoire sans résultat défini
|
|
151
|
-
-
|
|
152
|
-
- Corrections
|
|
153
|
-
- Projets où la rapidité est
|
|
170
|
+
- Travail qui tient dans l’esprit d’une seule personne en 5 minutes
|
|
171
|
+
- Corrections d’urgence qui doivent être déployées avant la fin du processus de révision
|
|
172
|
+
- Projets où la rapidité est plus importante que la structure
|
|
154
173
|
|
|
155
174
|
## Preuves
|
|
156
175
|
|
|
157
|
-
Role OS a été testé
|
|
176
|
+
Role OS a été testé avec trois configurations différentes dans deux référentiels structurellement distincts :
|
|
158
177
|
|
|
159
|
-
**Test 001 — Travail
|
|
160
|
-
- Chaîne de 7
|
|
161
|
-
-
|
|
178
|
+
**Test 001 — Travail sur une fonctionnalité** (écran de l’équipe, Star Freight)
|
|
179
|
+
- Chaîne de 7 rôles, 45 scénarios de test, 0 conflits de rôles
|
|
180
|
+
- Empêche la contamination provenant d’une branche ancestrale, détecte les inventions en ligne, met en évidence les obstacles réels
|
|
162
181
|
|
|
163
|
-
**Test 002 — Travail d
|
|
164
|
-
- Chaîne de 5
|
|
165
|
-
- Les tests anti-
|
|
182
|
+
**Test 002 — Travail d’intégration** (liaison CampaignState, Star Freight)
|
|
183
|
+
- Chaîne de 5 rôles, résolution d’une discontinuité architecturale sans recours à des solutions de contournement
|
|
184
|
+
- Les tests anti-contournement prouvent que le chemin actif est réel, et non un simple espace réservé
|
|
166
185
|
|
|
167
|
-
**Test 003 — Travail
|
|
168
|
-
- Chaîne de 6
|
|
169
|
-
-
|
|
186
|
+
**Test 003 — Travail sur l’identité** (purge de la contamination, Star Freight)
|
|
187
|
+
- Chaîne de 6 rôles, 51 scénarios de test, y compris une défense durable contre la contamination dans l’environnement CI
|
|
188
|
+
- Correction des dérives héritées sans entraîner une refonte complète
|
|
170
189
|
|
|
171
|
-
**
|
|
172
|
-
- Même structure de base,
|
|
173
|
-
-
|
|
190
|
+
**Test de portabilité** (cohérence de la persona, humour basé sur les capteurs)
|
|
191
|
+
- Même structure de base, langage/domaine/pile technologique différents
|
|
192
|
+
- Adapté avec des modifications contextuelles uniquement, sans modifications du contrat de base
|
|
174
193
|
|
|
175
194
|
**Traitement complet FT-001** (portlight-desktop)
|
|
176
|
-
- Traitement en 7
|
|
177
|
-
-
|
|
195
|
+
- Traitement en 7 phases avec les rôles du « Treatment Pack »
|
|
196
|
+
- La validation du « Shipcheck » a été prouvée, aucun conflit de rôles
|
|
178
197
|
|
|
179
198
|
**Traitement complet FT-002** (studioflow)
|
|
180
|
-
- Même
|
|
181
|
-
-
|
|
199
|
+
- Même « Treatment Pack », référentiel structurellement différent (espace de travail créatif par rapport à un jeu)
|
|
200
|
+
- Le « Treatment Pack » est portable, aucune modification du contrat n’est nécessaire
|
|
182
201
|
|
|
183
|
-
**
|
|
184
|
-
- Chaîne de 9
|
|
185
|
-
- 4
|
|
186
|
-
- Plus de 16
|
|
187
|
-
- Chaîne de traçabilité complète prouvée
|
|
202
|
+
**Session de brainstorming réussie** (sujet du marché MCP)
|
|
203
|
+
- Chaîne de 9 rôles, 4 analystes en parallèle, examen croisé + réfutation du graphique des litiges
|
|
204
|
+
- 4 défis lancés, 3 revendications affinées, 1 non résolue — une pression saine, pas d’impasse
|
|
205
|
+
- Plus de 16 liens de traçabilité à partir des artefacts rendus vers les atomes de la couche de vérité
|
|
206
|
+
- Chaîne de traçabilité complète prouvée : vérité → atomes → litige → synthèse → expansion → jugement → rendu → traçabilité
|
|
188
207
|
|
|
189
208
|
## Propriétés essentielles
|
|
190
209
|
|
|
191
|
-
|
|
210
|
+
Elles sont non négociables. Si une modification affaiblit l’une d’entre elles, rejetez-la.
|
|
192
211
|
|
|
193
|
-
- Les limites des rôles sont respectées
|
|
194
|
-
-
|
|
195
|
-
-
|
|
196
|
-
- Les
|
|
197
|
-
- La portabilité nécessite une adaptation
|
|
212
|
+
- Les limites des rôles sont respectées
|
|
213
|
+
- La révision est rigoureuse
|
|
214
|
+
- L’escalade reste honnête
|
|
215
|
+
- Les paquets restent testables
|
|
216
|
+
- La portabilité nécessite une adaptation contextuelle, et non une chirurgie du cœur
|
|
198
217
|
|
|
199
218
|
## Structure du projet
|
|
200
219
|
|
|
@@ -206,18 +225,23 @@ role-os/
|
|
|
206
225
|
entry-cmd.mjs ← `roleos start` CLI command
|
|
207
226
|
run.mjs ← Persistent run engine: create → step → pause → resume → report
|
|
208
227
|
run-cmd.mjs ← `roleos run/resume/next/explain/complete/fail` + interventions
|
|
209
|
-
mission.mjs ←
|
|
228
|
+
mission.mjs ← 9 named mission types (feature, bugfix, treatment, docs, security, research, brainstorm, deep-audit, dogfood-swarm)
|
|
210
229
|
mission-run.mjs ← Mission runner: create → step → complete → report
|
|
211
230
|
mission-cmd.mjs ← `roleos mission` CLI commands
|
|
212
|
-
|
|
213
|
-
|
|
231
|
+
audit-cmd.mjs ← `roleos audit` — deep audit entry point with manifest generation
|
|
232
|
+
swarm-cmd.mjs ← `roleos swarm` — dogfood swarm entry point with domain detection
|
|
233
|
+
swarm/ ← Domain detection, build gate, evidence persistence bridge
|
|
234
|
+
route.mjs ← 61-role routing + dynamic chain builder
|
|
235
|
+
packs.mjs ← 10 calibrated team packs + auto-selection
|
|
214
236
|
conflicts.mjs ← 4-pass conflict detection
|
|
215
237
|
escalation.mjs ← Auto-routing for blocked/rejected/split
|
|
216
238
|
evidence.mjs ← Structured evidence + role-aware requirements
|
|
217
239
|
dispatch.mjs ← Runtime dispatch manifests for multi-claude
|
|
218
|
-
|
|
240
|
+
tool-profiles.mjs ← Per-role tool sandboxing (shared by dispatch + trial)
|
|
241
|
+
state-machine.mjs ← Canonical step/run transition maps
|
|
242
|
+
artifacts.mjs ← Per-role artifact contracts + pack handoffs
|
|
219
243
|
decompose.mjs ← Composite task detection + splitting
|
|
220
|
-
composite.mjs ← Dependency-ordered execution + recovery
|
|
244
|
+
composite.mjs ← Dependency-ordered execution + recovery + cycle detection
|
|
221
245
|
replan.mjs ← Mid-run adaptive replanning
|
|
222
246
|
calibration.mjs ← Outcome recording + weight tuning
|
|
223
247
|
hooks.mjs ← 5 lifecycle hooks for runtime enforcement
|
|
@@ -225,56 +249,60 @@ role-os/
|
|
|
225
249
|
brainstorm.mjs ← Evidence modes, request validation, finding/synthesis/judge schemas
|
|
226
250
|
brainstorm-roles.mjs ← Role-native schemas, input partitioning, blindspot enforcement, cross-exam
|
|
227
251
|
brainstorm-render.mjs ← Two-layer rendering: lexical bans, render schemas, debate transcript
|
|
228
|
-
test/ ←
|
|
252
|
+
test/ ← 1150 tests across 37 test files
|
|
229
253
|
starter-pack/ ← Drop-in role contracts, policies, schemas, workflows
|
|
230
254
|
```
|
|
231
255
|
|
|
232
256
|
## Sécurité
|
|
233
257
|
|
|
234
|
-
|
|
258
|
+
Role OS fonctionne **uniquement en local**. Il copie les modèles Markdown et écrit les fichiers de paquets/décisions dans le répertoire `.claude/` de votre référentiel. Il n’accède pas au réseau, ne gère pas les secrets et ne collecte pas de données de télémétrie. Aucune opération dangereuse — par défaut, toutes les écritures de fichiers utilisent l’option « skip-if-exists ». Voir [SECURITY.md](SECURITY.md) pour la politique complète.
|
|
235
259
|
|
|
236
|
-
## Le système d
|
|
260
|
+
## Le système d’exploitation
|
|
237
261
|
|
|
238
|
-
| Couche | Ce
|
|
262
|
+
| Couche | Ce qu’il fait | Statut |
|
|
239
263
|
|-------|-------------|--------|
|
|
240
|
-
| **Routing** |
|
|
241
|
-
| **Chain builder** | Assemble des chaînes ordonnées
|
|
242
|
-
| **Conflict detection** | Validation en 4
|
|
243
|
-
| **Escalation** |
|
|
244
|
-
| **Evidence** | Preuves structurées et
|
|
245
|
-
| **Dispatch** |
|
|
246
|
-
| **Trials** | Ensemble complet
|
|
247
|
-
| **Team Packs** |
|
|
248
|
-
| **Outcome calibration** |
|
|
249
|
-
| **Mixed-task decomposition** |
|
|
250
|
-
| **Composite execution** |
|
|
251
|
-
| **Adaptive replanning** | Les modifications de
|
|
252
|
-
| **Session spine** | `roleos init claude` crée les fichiers CLAUDE.md, /roleos-route, /roleos-review, /roleos-status. `roleos doctor` vérifie la configuration. Les cartes de routage prouvent l
|
|
253
|
-
| **Hook spine** | 5
|
|
254
|
-
| **Artifact spine** |
|
|
255
|
-
| **Mission library** |
|
|
256
|
-
| **Mission runner** |
|
|
257
|
-
| **Unified entry** | `roleos start`
|
|
258
|
-
| **Persistent runs** | `roleos run` crée des exécutions
|
|
259
|
-
| **Brainstorm** | Architecture à deux
|
|
260
|
-
|
|
261
|
-
|
|
262
|
-
|
|
263
|
-
|
|
264
|
+
| **Routing** | Attribue un score à chacun des 61 rôles en fonction du contenu du paquet, explique les recommandations et évalue la confiance | ✓ Déployé |
|
|
265
|
+
| **Chain builder** | Assemble des chaînes ordonnées par phase à partir des rôles notés, en privilégiant le type de paquet plutôt qu’en se limitant aux modèles | ✓ Déployé |
|
|
266
|
+
| **Conflict detection** | Validation en 4 passes : conflits importants, séquence, redondance, lacunes de couverture. Suggestions de correction. | ✓ Déployé |
|
|
267
|
+
| **Escalation** | Acheminement automatique du travail bloqué/rejeté/divisé vers le bon résolveur avec la raison et l’artefact requis | ✓ Déployé |
|
|
268
|
+
| **Evidence** | Preuves structurées et spécifiques aux rôles dans les décisions. Vérifications de suffisance. 12 types de preuves. | ✓ Déployé |
|
|
269
|
+
| **Dispatch** | Génère des manifestes d’exécution pour multi-claude. Profils d’outils par rôle, invites système, budgets. | ✓ Déployé |
|
|
270
|
+
| **Trials** | Ensemble complet prouvé : 30 tâches « or » + 5 tests négatifs. 7 tests de paquets terminés. | ✓ Terminé |
|
|
271
|
+
| **Team Packs** | 10 paquets calibrés avec sélection automatique, protections contre les incompatibilités et solution de repli à routage libre. | ✓ Déployé |
|
|
272
|
+
| **Outcome calibration** | Enregistre les résultats de l’exécution, ajuste les pondérations des paquets/rôles en fonction des résultats et modifie les seuils de confiance. | ✓ Déployé |
|
|
273
|
+
| **Mixed-task decomposition** | Détecte le travail composite, le divise en paquets enfants, assigne des paquets et conserve les dépendances. | ✓ Déployé |
|
|
274
|
+
| **Composite execution** | Exécute les paquets enfants dans l’ordre des dépendances, avec transfert d’artefacts, récupération des branches et synthèse. | ✓ Déployé |
|
|
275
|
+
| **Adaptive replanning** | Les modifications de portée, les découvertes ou les nouvelles exigences en cours d’exécution mettent à jour le plan sans redémarrer. | ✓ Déployé |
|
|
276
|
+
| **Session spine** | `roleos init claude` crée les fichiers CLAUDE.md, /roleos-route, /roleos-review, /roleos-status. `roleos doctor` vérifie la configuration. Les cartes de routage prouvent l’engagement. | ✓ Déployé |
|
|
277
|
+
| **Hook spine** | 5 hooks de cycle de vie (SessionStart, PromptSubmit, PreToolUse, SubagentStart, Stop). Application consultative : rappels de la carte de routage, validation de l’utilisation des outils, injection du rôle du sous-agent, audit de l’achèvement. | ✓ Déployé |
|
|
278
|
+
| **Artifact spine** | Contrats d’artefacts par rôle. Contrats de transfert de paquets. Validation structurelle. Vérifications de l’exhaustivité de la chaîne. Les rôles en aval ne devinent jamais ce qu’ils ont reçu. | ✓ Déployé |
|
|
279
|
+
| **Mission library** | 9 missions nommées (feature-ship, bugfix, treatment, docs-release, security-hardening, research-launch, brainstorm, deep-audit, dogfood-swarm). Chacune déclare le paquet, la chaîne de rôles, le flux d’artefacts, les branches d’escalade et une définition honnête et partielle. | ✓ Déployé |
|
|
280
|
+
| **Mission runner** | Créer des exécutions, parcourir les étapes avec un état suivi, terminer/échouer avec un rapport honnête. Propagation des étapes bloquées, avertissements d’escalade hors chaîne, réouverture de la dernière étape. | ✓ Déployé |
|
|
281
|
+
| **Unified entry** | `roleos start` décide automatiquement de la mission, du paquet ou du routage libre. Échelle de repli avec des scores de confiance, des alternatives et une détection composite. | ✓ Déployé |
|
|
282
|
+
| **Persistent runs** | `roleos run` crée des exécutions stockées sur disque. `resume`, `next`, `explain`, `complete`, `fail`. Interventions : reroutage, escalade, nouvelle tentative, blocage, réouverture. Guide spécifique à chaque étape. Mesure du frottement. | ✓ Déployé |
|
|
283
|
+
| **Brainstorm** | Architecture à deux couches : vérité (schémas natifs des rôles, atomes de provenance, graphique des litiges d’examen croisé) + rendu (5 voix distinctes, interdictions lexicales, transcription du débat). Les liens de traçabilité prouvent que chaque revendication rendue correspond à un atome de vérité. Session réussie prouvée. | ✓ Déployé |
|
|
284
|
+
| **Deep Audit** | Audit de dépôt basé sur le manifeste : décomposer le dépôt en composants, affecter N auditeurs + M auditeurs de tests de validation + K auditeurs de points de jonction à partir du graphe de dépendances, synthétiser en un verdict classé et un plan d’action. L’affectation dynamique s’adapte à la taille du dépôt (formule : 2N + K + 3). Exécution native avec validation des artefacts à chaque étape. | ✓ Déployé |
|
|
285
|
+
| **Dogfood Swarm** | Convergence en plusieurs étapes : trois étapes de vérification (bogues/sécurité → proactivité → humanisation), puis étape des fonctionnalités. Propriété exclusive des fichiers, validations après chaque cycle, points de contrôle utilisateur. La détection automatique du domaine génère les manifestes. Pont de preuves vers les laboratoires de test. | ✓ Déployé |
|
|
286
|
+
|
|
287
|
+
## 9 missions
|
|
288
|
+
|
|
289
|
+
| Mission | Paquet | Rôles | Quand l’utiliser |
|
|
264
290
|
|---------|------|-------|-------------|
|
|
265
|
-
| `feature-ship` | Fonctionnalité | 5 | Livraison complète d
|
|
266
|
-
| `bugfix` | Correction de
|
|
267
|
-
| `treatment` |
|
|
268
|
-
| `docs-release` | Documentation | 2 |
|
|
269
|
-
| `security-hardening` | Sécurité | 4 |
|
|
270
|
-
| `research-launch` | Recherche | 4 |
|
|
271
|
-
| `brainstorm` |
|
|
272
|
-
|
|
273
|
-
|
|
291
|
+
| `feature-ship` | Fonctionnalité | 5 | Livraison complète d’une fonctionnalité : portée → spécification → implémentation → test → revue |
|
|
292
|
+
| `bugfix` | Correction de bogue | 4 | Diagnostiquer la cause première, corriger, tester, vérifier |
|
|
293
|
+
| `treatment` | Traitement | 4 | Vérification avant publication + amélioration + documentation + vérification CI + revue |
|
|
294
|
+
| `docs-release` | Documentation | 2 | Rédiger/mettre à jour la documentation, notes de publication |
|
|
295
|
+
| `security-hardening` | Sécurité | 4 | Modèle de menace, audit, correction des vulnérabilités, réaudit, vérification |
|
|
296
|
+
| `research-launch` | Recherche | 4 | Formuler la question, effectuer des recherches, documenter les résultats, prendre une décision |
|
|
297
|
+
| `brainstorm` | Brainstorming | 9 | Analyse structurée et multiperspective avec désaccord et verdict traçables |
|
|
298
|
+
| `deep-audit` | Audit approfondi | 5 (échelles) | Audit de dépôt basé sur le manifeste : le nombre de travailleurs s’adapte à la taille du graphe du dépôt via une affectation dynamique |
|
|
299
|
+
| `dogfood-swarm` | Essaim | 8 (échelles) | Convergence en plusieurs étapes : vérification-a → vérification-b → vérification-c → fonctionnalité → synthèse finale |
|
|
300
|
+
|
|
301
|
+
Chaque mission comprend des définitions honnêtes et partielles : lorsque le travail est interrompu, le système documente ce qui a été réalisé et ce qui reste à faire, au lieu de prétendre que tout est terminé.
|
|
274
302
|
|
|
275
303
|
### Mission de brainstorming
|
|
276
304
|
|
|
277
|
-
|
|
305
|
+
Pas de « brainstorming par IA ». La mission de brainstorming consiste en des **rôles spécialisés encadrés par la loi, avec un désaccord et un résultat traçables.**
|
|
278
306
|
|
|
279
307
|
```bash
|
|
280
308
|
roleos run "explore product directions for a developer tool discovery platform"
|
|
@@ -282,33 +310,61 @@ roleos run "explore product directions for a developer tool discovery platform"
|
|
|
282
310
|
# Chain: 4 Analysts (parallel) → Normalize → Cross-Examine → Rebut → Synthesize → Expand → Judge
|
|
283
311
|
```
|
|
284
312
|
|
|
285
|
-
**Ce qui
|
|
313
|
+
**Ce qui la rend différente :**
|
|
314
|
+
|
|
315
|
+
- **Niveau 1 (vérité) :** Quatre analystes émettent des schémas propres à leur rôle (ContextMap, UserValueMap, MechanicsMap, PositioningMap) : pas de texte partagé. Chaque rôle applique des restrictions : phrases interdites, types de revendications interdits, partitions d’entrée filtrées. Les atomes contiennent des informations sur leur provenance. Un graphe d’interrogation croisée dirigé produit des défis ciblés. Les analystes d’origine défendent, affinent ou retirent leurs affirmations sous la pression.
|
|
316
|
+
|
|
317
|
+
- **Niveau 2 (présentation) :** Cinq voix humaines distinctes (Note de synthèse, Notes de terrain, Schéma du système, Résumé des revendications, Transcription de l’interrogatoire) avec des interdictions lexicales empêchant la convergence des voix. La synthèse utilise la vérité, jamais le texte déjà présenté. Les deux niveaux sont toujours disponibles.
|
|
318
|
+
|
|
319
|
+
- **Chaîne de traçabilité :** Chaque phrase présentée peut être retracée jusqu’à un atome du niveau de vérité. Les directions de synthèse citent les atomes. Les cibles de l’interrogatoire sont des identifiants de revendications réels. Le graphe de désaccord est le résultat, et non le texte.
|
|
320
|
+
|
|
321
|
+
**Prouvé :** Exécution de référence v0.4 : chaîne de traçabilité complète vérifiée. Voir [`examples/golden-run.md`](examples/golden-run.md) pour la chaîne d’artefacts complète.
|
|
322
|
+
|
|
323
|
+
### Mission d’audit approfondi
|
|
324
|
+
|
|
325
|
+
Pas un simple scan de surface. La mission d’audit approfondi **décompose un dépôt en composants délimités et affecte des auditeurs spécialisés à une échelle déterminée par le propre graphe de dépendances du dépôt.**
|
|
326
|
+
|
|
327
|
+
```bash
|
|
328
|
+
roleos run "deep audit this repo" --manifest=audit-manifest.json
|
|
329
|
+
# → MISSION: Deep Audit (Manifest-Scaled)
|
|
330
|
+
# Steps: Component Auditor ×6 + Test Truth Auditor ×6 + Seam Auditor ×8 + Synthesizer + Action Plan + Critic = 23 steps
|
|
331
|
+
```
|
|
332
|
+
|
|
333
|
+
**Ce qui la rend différente :**
|
|
334
|
+
|
|
335
|
+
- **Affectation dynamique :** le nombre de travailleurs n’est pas fixe. Un dépôt de 10 composants avec 5 clusters de limites produit 28 étapes (2 × 10 + 5 + 3). Un dépôt de 3 composants produit 12 étapes. La formule d’adaptation est : `2N + K + 3`, où N = composants, K = limites.
|
|
336
|
+
- **Parcelles basées sur le manifeste :** un fichier `audit-manifest.json` définit les composants (avec les chemins de fichiers, le nombre de lignes, les descriptions) et les limites (de/à avec les descriptions de l’interface). Chaque auditeur ne reçoit que sa parcelle.
|
|
337
|
+
- **Quatre archétypes de rôles :** Auditeur de composants (vérité du code par module), Auditeur de tests de validation (tests qui prouvent par rapport aux tests qui existent), Auditeur de points de jonction (limites d’intégration du graphe de dépendances), Synthétiseur d’audit (verdict classé + plan d’action à partir de toutes les parcelles).
|
|
338
|
+
- **Validation des artefacts à chaque étape :** `validateArtifact()` est déclenché à la fin de chaque étape dans les deux chemins d’exécution. Les résultats sont joints aux objets d’étape. Le système sait si chaque artefact a respecté son contrat.
|
|
339
|
+
- **Honnêteté partielle :** lorsque le budget ou la portée empêchent l’achèvement, les résultats par composant sont valides individuellement. Le système synthétise à partir de ce qui a été réalisé, sans jamais prétendre à une couverture complète.
|
|
286
340
|
|
|
287
|
-
|
|
341
|
+
**Prouvé :** Exécution native du Runner : 18 tests sur un manifeste réel, cycle de vie complet vérifié, y compris la réouverture en cas d’escalade et l’échec partiel. La formule d’adaptation a été vérifiée pour les manifestes de 3/6/10/15 composants.
|
|
342
|
+
|
|
343
|
+
### Mission d’essaim de test en interne
|
|
344
|
+
|
|
345
|
+
Pas un simple analyseur en une seule passe. La mission d’essaim de test en interne **exécute un protocole de convergence en plusieurs étapes qui fait passer un dépôt de « fonctionnel » à « prêt pour la production » en trois étapes de vérification et en livrant des fonctionnalités de manière itérative.**
|
|
346
|
+
|
|
347
|
+
```bash
|
|
348
|
+
roleos swarm
|
|
349
|
+
# → MISSION: Dogfood Swarm (Multi-Pass Convergence)
|
|
350
|
+
# Stages: Health-A → Health-B → Health-C → Feature → Final
|
|
351
|
+
# Domain agents: 3-5 parallel per wave (exclusive file ownership)
|
|
352
|
+
```
|
|
288
353
|
|
|
289
|
-
|
|
354
|
+
**Ce qui la rend différente :**
|
|
290
355
|
|
|
291
|
-
- **
|
|
356
|
+
- **Système de validation en trois étapes** — L’étape A corrige les bogues et les problèmes de sécurité (boucle jusqu’à 0 CRITICAL + 0 HIGH). L’étape B applique un renforcement proactif (les utilisateurs examinent les résultats). L’étape C rend le code plus convivial — messages d’erreur qui aident les utilisateurs, commentaires sur la reconnexion, états de chargement, accessibilité. Chaque étape est une approche distincte, et non la même analyse répétée.
|
|
357
|
+
- **Propriété exclusive des fichiers** — chaque agent de domaine possède des fichiers spécifiques via `swarm-manifest.json`. Aucun agent ne modifie le même fichier. Pas de conflits de fusion. Pas de surcharge de coordination.
|
|
358
|
+
- **Contrôles de construction** — l’analyse statique, la vérification des types et les tests doivent être réussis après chaque cycle. Le système détecte automatiquement le système de construction (Node, Rust, Python, Go) et exécute les commandes appropriées.
|
|
359
|
+
- **Points de contrôle utilisateur** — Health-B et la validation des fonctionnalités nécessitent l’approbation explicite de l’utilisateur avant l’exécution. Le système présente les résultats, et l’utilisateur décide de ce qui doit être construit.
|
|
360
|
+
- **Convergence itérative** — les étapes sont répétées en cycles jusqu’à ce que les conditions de sortie soient remplies ou que le nombre maximal d’itérations soit atteint. Chaque cycle réévalue tout à partir de zéro afin de détecter les régressions introduites par les corrections précédentes.
|
|
361
|
+
- **Détection automatique du domaine** — `roleos swarm manifest --generate` détecte le type de dépôt (CLI, web, bureau, MCP, monorepo) et génère des affectations de domaine non superposées.
|
|
292
362
|
|
|
293
|
-
**
|
|
363
|
+
**Résultats prouvés :** claude-collaborate (2026-03-28) — 35→129 tests, 106 problèmes de validation corrigés, version v1.1.0 publiée. Protocole v2.0 avec 9 phases.
|
|
294
364
|
|
|
295
365
|
## Statut
|
|
296
366
|
|
|
297
|
-
|
|
298
|
-
- v1.0.0 : 32 rôles, CLI complète, traitement éprouvé, portabilité multi-dépôts.
|
|
299
|
-
- v1.0.2 : Blocage du système d'exploitation par rôle (corrections de la "vérité" de l'initialisation, `init --force`).
|
|
300
|
-
- v1.1.0 : 31 rôles, infrastructure de routage complète, détection de conflits, escalade, preuves, répartition, 7 ensembles d'équipe éprouvés. 35 essais d'exécution. 212 tests.
|
|
301
|
-
- v1.2.0 : Ensembles calibrés promus au point d'entrée par défaut. Sélection automatique, détection de discordances, suggestion alternative, repli sur le routage libre. 246 tests.
|
|
302
|
-
- v1.3.0 : Calibrage des résultats, décomposition de tâches complexes, exécution composite, replanification adaptative. 317 tests.
|
|
303
|
-
- v1.4.0 : Infrastructure de session – `roleos init claude`, `roleos doctor`, cartes de routage, commandes `/roleos-route`, `/roleos-review` et `/roleos-status`. 335 tests.
|
|
304
|
-
- v1.5.0 : Infrastructure de "hooks" – 5 "hooks" de cycle de vie pour l'application en temps réel. 358 tests.
|
|
305
|
-
- v1.6.0 : Infrastructure des artefacts – 20 contrats d'artefacts par rôle, 7 contrats de transmission d'ensembles, validation structurelle. 385 tests.
|
|
306
|
-
- v1.7.0 : Preuve de complétion – tâches réelles exécutées sur toute la pile. CLI `roleos artifacts`. Escalade honnête pour les corrections structurelles. 398 tests.
|
|
307
|
-
- v1.8.0 : Bibliothèque de missions (Phase S) – 6 missions nommées, moteur d'exécution, rapports de complétion. Durcissement basé sur 6 exécutions réelles. 481 tests.
|
|
308
|
-
- v1.9.0 : Chemin d'entrée unifié (Phase T) – `roleos start` décide automatiquement entre mission, ensemble et routage libre. Système de repli, détection composite, essais de comparaison du chemin d'entrée. 527 tests.
|
|
309
|
-
- **v2.0.0** : Optimisation de l'expérience utilisateur (Phase U) – `roleos run` crée des exécutions persistantes avec sauvegarde sur disque. Reprise, suivant, explication, complétion, échec. Interventions : réacheminement, escalade, nouvelle tentative, blocage, réouverture. Assistance spécifique à chaque étape. Mesure du niveau de difficulté. 6 essais de difficulté. 613 tests.
|
|
310
|
-
- **v2.0.1** : Audit du manuel, documentation pour débutants, corrections du nombre de tests. 617 tests.
|
|
311
|
-
- **v2.1.0** : Mission de brainstorming (v0.4) – rôles spécialisés dans le domaine juridique, désaccord traçable, résultat avec verdict. Architecture à deux niveaux (vérité + rendu), matrice de permissions de contre-interrogatoire, graphe de litiges, preuve d'exécution optimale. 7 missions, 50 rôles, 8 ensembles. 894 tests.
|
|
367
|
+
Stable et prêt à être déployé. Consultez le fichier [CHANGELOG](CHANGELOG.md) pour obtenir l’historique complet des versions et les modifications apportées à chaque version.
|
|
312
368
|
|
|
313
369
|
## Licence
|
|
314
370
|
|
|
@@ -316,4 +372,4 @@ MIT
|
|
|
316
372
|
|
|
317
373
|
---
|
|
318
374
|
|
|
319
|
-
Créé par <a href="https://mcp-tool-shop.github.io/">MCP Tool Shop</a
|
|
375
|
+
Créé par <a href="https://mcp-tool-shop.github.io/">MCP Tool Shop</a>
|