role-os 2.7.0 → 2.8.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
package/README.fr.md CHANGED
@@ -13,20 +13,20 @@
13
13
  <a href="https://mcp-tool-shop-org.github.io/role-os/"><img src="https://img.shields.io/badge/Landing_Page-live-brightgreen" alt="Landing Page"></a>
14
14
  </p>
15
15
 
16
- Un système d'exploitation multi-Claude qui affecte du personnel, gère les flux de travail, valide et exécute les tâches à travers 31 contrats de rôles spécialisés. Il crée des ensembles de tâches, assemble l'équipe appropriée en fonction de la compatibilité des rôles, détecte les problèmes potentiels avant l'exécution, redirige automatiquement la reprise en cas de blocage ou de rejet des tâches, et exige des preuves structurées pour chaque décision.
16
+ Un système dexploitation multi-Claude qui affecte du personnel, répartit les tâches, valide et exécute le travail à travers 61 contrats de rôles spécialisés. Il crée des ensembles de tâches, assemble l’équipe appropriée en fonction de critères définis, détecte les problèmes avant lexécution, redirige automatiquement vers une solution lorsque le travail est bloqué ou rejeté, et exige des preuves structurées pour chaque décision. Il comprend une répartition dynamique pour les missions à grande échelle — un dépôt de 10 composants devient automatiquement 28 étapes d’audit, au lieu de 6.
17
17
 
18
- ## Ce que cela fait
18
+ ## Ce qu’il fait
19
19
 
20
- Role OS est la manière professionnelle d'utiliser multi-Claude. Il évite les échecs spécifiques que produisent les flux de travail d'IA génériques :
20
+ Role OS est la méthode professionnelle pour utiliser multi-Claude. Il prévient les défaillances spécifiques que produisent les flux de travail dIA génériques :
21
21
 
22
- - **Dérive** : les rôles restent dans leur domaine. Le produit ne subit pas de refonte. L'interface utilisateur ne redéfinit pas la portée. Le backend n'invente pas la direction du produit.
23
- - **Fausse complétion** : la définition de "terminé" est concrète. Le travail qui masque des lacunes, saute des vérifications ou résout un problème différent est rejeté.
24
- - **Contamination** : les projets divisés ou hérités conservent des résidus d'identité. Role OS détecte et rejette les dérives inter-projets en termes de terminologie, de visuels et de modèles mentaux.
25
- - **Progrès basé sur des impressions** : chaque transmission est structurée. Chaque verdict est étayé par des preuves. "Cela semble terminé" n'est pas un état valide.
22
+ - **Dérive** les rôles restent dans leur domaine d’expertise. Le produit ne se redéfinit pas. Linterface utilisateur ne redéfinit pas la portée. La partie serveur ninvente pas l’orientation du produit.
23
+ - **Achèvement incorrect** la définition de ce qui est terminé est précise. Le travail qui dissimule des lacunes, omet des vérifications ou résout un problème différent est rejeté.
24
+ - **Contamination** les projets dérivés ou hérités conservent des éléments didentité. Role OS détecte et rejette la dérive inter-projets en termes de terminologie, d’éléments visuels et de modèles mentaux.
25
+ - **Progrès basé sur le ressenti** chaque transfert est structuré. Chaque décision est liée à des preuves. « Ça a l’air terminé » nest pas un état valide.
26
26
 
27
- ## Comment cela fonctionne
27
+ ## Comment il fonctionne
28
28
 
29
- Décrivez votre tâche. Role OS détermine automatiquement le niveau d'orchestration approprié.
29
+ Décrivez votre tâche. Role OS détermine automatiquement le niveau dorchestration approprié.
30
30
 
31
31
  ```bash
32
32
  roleos start "fix the crash in save handler"
@@ -42,15 +42,15 @@ roleos start "something completely novel"
42
42
  # Hint: Create a packet and run `roleos route` for role-level routing
43
43
  ```
44
44
 
45
- **L'échelle de secours :**
45
+ **L’échelle de repli :**
46
46
 
47
- 1. **Mission** — lorsque la tâche correspond à un flux de travail récurrent éprouvé (correction de bugs, traitement, déploiement de fonctionnalités, documentation, sécurité, recherche). Chaîne de rôles connue, flux d'artefacts, branches d'escalade et définitions partielles claires.
48
- 2. **Pack** — lorsque la tâche appartient à une famille connue, mais ne correspond pas à une mission complète. 7 ensembles d'équipe calibrés avec sélection automatique et mécanismes de prévention des incompatibilités.
49
- 3. **Routage libre** — lorsque la tâche est nouvelle, complexe ou incertaine. Évalue les 31 rôles en fonction du contenu de la tâche et assemble une chaîne dynamique.
47
+ 1. **Mission** — lorsque la tâche correspond à un flux de travail récurrent et éprouvé (correction de bug, traitement, lancement de fonctionnalité, documentation, sécurité, recherche, brainstorming, audit approfondi, test en conditions réelles). Chaîne de rôles connue, flux dartefacts, branches descalade et définitions honnêtes et partielles.
48
+ 2. **Ensemble** — lorsque la tâche appartient à une famille connue mais ne correspond pas entièrement à un modèle de mission. 10 ensembles d’équipes calibrées avec sélection automatique et protections contre les incompatibilités.
49
+ 3. **Répartition libre** — lorsque la tâche est nouvelle, mixte ou incertaine. Évalue tous les 61 rôles par rapport au contenu de l’ensemble et assemble une chaîne dynamique.
50
50
 
51
- Le système ne force jamais une tâche à travers le mauvais niveau d'abstraction. Il explique pourquoi il a choisi chaque niveau et propose des alternatives.
51
+ Le système ne force jamais le travail à travers une abstraction incorrecte. Il explique pourquoi il a choisi chaque niveau et propose des alternatives.
52
52
 
53
- **Une seule commande pour activer l'exécution :**
53
+ **Une seule commande pour lancer lexécution :**
54
54
 
55
55
  ```bash
56
56
  roleos run "fix the crash in save handler"
@@ -67,7 +67,7 @@ roleos report # Generate completion report
67
67
  roleos friction # Measure operator touches
68
68
  ```
69
69
 
70
- **Interventions en cas de problème :**
70
+ **Interventions en cas de problème :**
71
71
 
72
72
  ```bash
73
73
  roleos retry 0 # Retry a failed step
@@ -77,46 +77,59 @@ roleos block 2 "waiting for API spec"
77
77
  roleos reopen 0 "found issue in review"
78
78
  ```
79
79
 
80
- Les exécutions sont enregistrées sur le disque (dans le dossier `.claude/runs/`), ce qui permet de reprendre les sessions interrompues sans problème. Chaque étape comprend des instructions pour l'utilisateur : ce qu'il faut produire, les sections requises et les conditions d'arrêt.
80
+ Les exécutions sont conservées sur le disque (`.claude/runs/`), de sorte que les sessions interrompues reprennent sans problème. Chaque étape comprend des instructions pour l’opérateur : ce qui doit être produit, les sections requises et les conditions darrêt.
81
81
 
82
- **Une fois routée :**
82
+ **Une fois la tâche répartie :**
83
83
 
84
- 1. **Chaque rôle produit une transmission** — sortie structurée avec des éléments de preuve qui réduisent l'ambiguïté pour le rôle suivant.
85
- 2. **Le critique effectue une revue par rapport au contrat** — accepte, rejette ou bloque en fonction de preuves structurées, et non d'impressions.
86
- 3. **La reprise est gérée automatiquement** — les tâches bloquées ou rejetées sont redirigées vers le responsable approprié, avec une raison, un type de reprise et les artefacts requis.
84
+ 1. **Chaque rôle produit un transfert** — une sortie structurée avec des éléments de preuve qui réduisent lambiguïté pour le rôle suivant.
85
+ 2. **Un critique examine par rapport au contrat** — accepte, rejette ou bloque en fonction de preuves structurées, et non d’une impression.
86
+ 3. **La reprise se fait automatiquement** — le travail bloqué ou rejeté est redirigé vers la personne responsable avec une explication, un type de reprise et l’artefact requis.
87
87
 
88
- ## État de déploiement au sein de l'organisation
88
+ ## Répartition tenant compte du budget
89
89
 
90
- L'état de déploiement au niveau de l'organisation (file d'attente, décisions, enregistrements d'audit, ensembles de verrouillage par dépôt) se trouve dans un dépôt privé distinct : [`role-os-rollout`](https://github.com/mcp-tool-shop-org/role-os-rollout). Ce dépôt est le produit ; ce dernier est l'état opérationnel.
90
+ Role OS peut consulter un **analyste de budget de jetons** local pour chaque étape de répartition et joindre une prévision de dépenses indicative au manifeste — optionnel (`ROLEOS_BUDGET_CONSULT`), indicatif (il ne bloque jamais une répartition) et en cas d’échec, il revient à une base de référence déterministe. Désactivé par défaut ; la prévision est locale et gratuite. Voir le [manuel](https://mcp-tool-shop-org.github.io/role-os/handbook/specialist-budget/).
91
+
92
+ ## Supervision des appels d’outils
93
+
94
+ Role OS vérifie et contrôle les appels d’outils au niveau de `PreToolUse` — de manière déterministe, sans modèle sur le chemin critique :
95
+
96
+ - **Surveillance de la conformité** (indicatif, en cas d’échec, il revient à une base de référence) — un schéma déterministe + des seuils de contrat calculables vérifient un appel proposé par rapport à son contrat d’outil catalogué et joignent une évaluation indicative sur un appel *manifestement* non conforme ; il ne bloque jamais. Un plafond LLM optionnel (`ROLEOS_CONFORMANCE_CONSULT`) gère les éléments sémantiques restants.
97
+ - **Contrôle des capacités** (en cas d’échec, optionnel `ROLEOS_CAPABILITY_GATE`, désactivé par défaut) — privilèges minimums déterministes sur les actions *irréversibles* (publication npm/PyPI, `gh release`, `git push`, modifications du dépôt, déploiement de Pages). Une action contrôlée est refusée à moins que le responsable n’ait accordé sa capacité dans `.claude/role-os/capabilities.json`, de sorte qu’une étape incorrecte — une erreur honnête ou une injection malveillante — ne puisse pas déclencher une action irréversible non autorisée. Le complément préventif à la règle du compensateur nommé. Voir le [manuel](https://mcp-tool-shop-org.github.io/role-os/handbook/).
98
+
99
+ ## État de déploiement au niveau de l’organisation
100
+
101
+ L’état de déploiement à l’échelle de l’organisation (file d’attente, décisions, enregistrements d’audit, ensembles de verrouillage par dépôt) est stocké dans un dépôt privé distinct : [`role-os-rollout`](https://github.com/mcp-tool-shop-org/role-os-rollout). Ce dépôt est le produit ; ce dépôt est l’état opérationnel.
91
102
 
92
103
  ## Mémoire et continuité
93
104
 
94
- Role OS ne possède ni ne duplique la couche de mémoire. Lorsqu'une mémoire de projet Claude existe, elle constitue le système de continuité canonique : les faits du référentiel, les décisions, les boucles ouvertes et l'historique des traitements y sont stockés.
105
+ Role OS ne possède ni ne duplique la couche de mémoire. où la mémoire du projet Claude existe, c’est le système de continuité canonique les faits du dépôt, les décisions, les points en suspens et lhistorique des traitements s’y trouvent.
95
106
 
96
- Role OS s'intègre à la mémoire du projet Claude. Il ne la remplace pas.
107
+ Role OS sintègre à la mémoire du projet Claude. Il ne la remplace pas.
97
108
 
98
- ## Traitement complet et vérification de la livraison
109
+ ## Traitement complet et vérification finale
99
110
 
100
- Le traitement complet est un protocole canonique en 7 phases défini dans la mémoire du projet Claude (`memory/full-treatment.md`). Role OS dirige et examine les traitements à l'aide de contrats de rôle, de transmissions et de passerelles de critique ; il ne redéfinit pas le protocole.
111
+ Le traitement complet est un protocole canonique en 7 phases défini dans la mémoire du projet Claude (`memory/full-treatment.md`). Role OS répartit et examine les traitements à laide de contrats de rôles, de transferts et de contrôles critiques il ne redéfinit pas le protocole.
101
112
 
102
- La **vérification de la livraison** est la porte de qualité de 31 éléments qui s'exécute avant le traitement complet. Les portes obligatoires A à D doivent être validées avant que tout traitement ne commence. Référence canonique : `memory/shipcheck.md`.
113
+ La **vérification finale** est la grille de qualité en 31 éléments qui sexécute avant le traitement complet. Les étapes A à D doivent être franchies avant que tout traitement ne commence. Référence canonique : `memory/shipcheck.md`.
103
114
 
104
- Ordre : Vérification de la livraison, puis traitement complet. Aucune version 1.0.0 sans validation des portes obligatoires.
115
+ Ordre : vérification finale d’abord, puis traitement complet. Pas de version 1.0.0 sans avoir réussi les étapes obligatoires.
105
116
 
106
- ## 31 rôles répartis dans 8 ensembles
117
+ ## 61 rôles répartis en 10 ensembles
107
118
 
108
119
  | Ensemble | Rôles |
109
120
  |------|-------|
110
- | **Core** (3) | Orchestrateur, Stratège Produit, Critique |
111
- | **Engineering** (7) | Développeur Frontend, Ingénieur Backend, Ingénieur Tests, Ingénieur Refactoring, Ingénieur Performance, Auditeur de Dépendances, Expert en Sécurité |
112
- | **Design** (2) | Concepteur UI, Gardien de la Marque |
113
- | **Marketing** (1) | Rédacteur de Contenu de Lancement |
114
- | **Treatment** (7) | Chercheur de Dépôts, Traducteur de Dépôts, Architecte de Documentation, Conservateur de Métadonnées, Auditeur de Couverture, Vérificateur de Déploiement, Ingénieur de Release |
115
- | **Product** (3) | Synthétiseur de Commentaires, Priorisateur de Feuille de Route, Rédacteur de Spécifications |
116
- | **Research** (4) | Chercheur UX, Analyste Concurrentiel, Chercheur de Tendances, Synthétiseur d'Entretiens Utilisateurs |
117
- | **Growth** (4) | Stratège de Lancement, Stratège de Contenu, Community Manager, Responsable de Tri des Demandes d'Assistance |
118
-
119
- Chaque rôle a un contrat complet : mission, conditions d'utilisation, conditions de non-utilisation, entrées attendues, sorties requises, niveau de qualité et déclencheurs d'escalade. Chaque rôle peut être routé `roleos route` peut recommander n'importe lequel d'entre eux en fonction du contenu de la tâche.
121
+ | **Core** (3) | Orchestrateur, stratège produit, critique |
122
+ | **Engineering** (7) | Développeur frontend, ingénieur backend, ingénieur de test, ingénieur de refactoring, ingénieur de performance, auditeur des dépendances, examinateur de sécurité |
123
+ | **Design** (2) | Concepteur d’interface utilisateur, gardien de la marque |
124
+ | **Marketing** (1) | Rédacteur pour les lancements |
125
+ | **Treatment** (7) | Chercheur sur les dépôts, traducteur pour les dépôts, architecte de la documentation, conservateur des métadonnées, auditeur de la couverture, vérificateur du déploiement, ingénieur en charge des versions |
126
+ | **Product** (3) | Synthétiseur de commentaires, priorisateur de feuille de route, rédacteur de spécifications |
127
+ | **Research** (4) | Chercheur UX, analyste concurrentiel, chercheur sur les tendances, synthétiseur d’entretiens avec les utilisateurs |
128
+ | **Growth** (4) | Stratège pour les lancements, stratège en matière de contenu, responsable de la communauté, responsable du tri des demandes d’assistance |
129
+ | **Deep Audit** (4) | Auditeur des composants, auditeur de la véracité des tests, auditeur des interfaces, synthétiseur d’audits |
130
+ | **Swarm** (7) | Coordinateur de l’essaim, agent backend de l’essaim, agent de pont de l’essaim, agent de test de l’essaim, agent d’infrastructure de l’essaim, agent frontend de l’essaim, synthétiseur de l’essaim |
131
+
132
+ Chaque rôle est associé à un contrat complet : mission, cas d’utilisation, moments où il ne doit pas être utilisé, entrées attendues, sorties requises, niveau de qualité et déclencheurs d’escalade. Chaque rôle peut être affecté — `roleos route` peut en recommander n’importe lequel en fonction du contenu du paquet.
120
133
 
121
134
  ## Démarrage rapide
122
135
 
@@ -133,6 +146,19 @@ roleos complete artifact.md # Complete with artifact
133
146
  roleos explain # Show full state
134
147
  roleos report # Completion report
135
148
 
149
+ # Deep audit:
150
+ roleos audit manifest --generate # Create audit-manifest.json
151
+ roleos audit # Start component-level deep audit
152
+ roleos audit status # Check audit progress
153
+ roleos audit verify # Verify manifest and outputs
154
+
155
+ # Dogfood swarm:
156
+ roleos swarm manifest --generate # Auto-detect domains from repo structure
157
+ roleos swarm # Start multi-pass convergence swarm
158
+ roleos swarm status # Check swarm progress by stage
159
+ roleos swarm findings # List findings by severity
160
+ roleos swarm approve # Approve feature gate
161
+
136
162
  # Or go manual:
137
163
  roleos start "fix the crash" # Entry decision only (no run)
138
164
  roleos packet new feature
@@ -146,55 +172,55 @@ roleos packs list
146
172
 
147
173
  ## Quand ne pas utiliser Role OS
148
174
 
149
- - Corrections de ligne unique, fautes de frappe ou bugs évidents
175
+ - Corrections sur une seule ligne, fautes de frappe ou bogues évidents
150
176
  - Recherche exploratoire sans résultat défini
151
- - Tâches qui peuvent être comprises par une seule personne en 5 minutes
152
- - Corrections urgentes qui doivent être déployées avant qu'une chaîne de revue ne soit terminée
153
- - Projets où la rapidité est privilégiée par rapport à la structure
177
+ - Travail qui peut être réalisé par une personne en 5 minutes
178
+ - Correctifs d’urgence qui doivent être déployés avant la fin du processus d’examen
179
+ - Projets où vous privilégiez la rapidité à la structure
154
180
 
155
181
  ## Preuves
156
182
 
157
- Role OS a été testé sur trois types de tâches différents dans deux référentiels structurellement différents :
183
+ Role OS a été testé avec trois types de projets différents dans deux dépôts structurellement différents :
158
184
 
159
- **Test 001 — Travail de fonctionnalité** (Écran de l'équipe, Star Freight)
160
- - Chaîne de 7 rôles, 45 scénarios de test, 0 conflit de rôle.
161
- - A empêché la contamination provenant de l'ancêtre de la branche, a détecté les inventions improvisées, et a mis en évidence les blocages réels.
185
+ **Projet 001 — Travail sur une fonctionnalité** (écran Crew, Star Freight)
186
+ - Chaîne de 7 rôles, 45 scénarios de test, 0 conflits de rôles
187
+ - A empêché la contamination provenant d’un ancêtre du fork, a détecté une invention en ligne et a mis en évidence les blocages réels
162
188
 
163
- **Test 002 — Travail d'intégration** (Câblage de l'état de la campagne, Star Freight)
164
- - Chaîne de 5 rôles, a résolu la limite architecturale sans mensonges.
165
- - Les tests anti-fallback ont prouvé que le chemin actif est réel, et non un simple espace réservé.
189
+ **Projet 002 — Travail dintégration** (liaison CampaignState, Star Freight)
190
+ - Chaîne de 5 rôles, a résolu un problème architectural sans recourir à des solutions de contournement
191
+ - Les tests anti-contournement ont prouvé que le chemin actif est réel et non un simple espace réservé
166
192
 
167
- **Test 003 — Travail d'identité** (Suppression de la contamination, Star Freight)
168
- - Chaîne de 6 rôles, 51 scénarios de test, y compris une défense durable contre la contamination de l'intégration continue.
169
- - A corrigé la dérive de la fiction héritée sans se transformer en une refonte complète.
193
+ **Projet 003 — Travail sur l’identité** (suppression de la contamination, Star Freight)
194
+ - Chaîne de 6 rôles, 51 scénarios de test, y compris une défense durable contre la contamination dans le CI
195
+ - A corrigé les incohérences héritées sans entraîner une refonte importante
170
196
 
171
- **Phase d'essai de portabilité** (Cohérence des personas, humour lié aux capteurs)
172
- - Même structure de base, mais langage/domaine/pile différents.
173
- - adoption (du produit) avec modification du contexte uniquement aucune modification du contrat principal.
197
+ **Test de portabilité** (cohérence des personas, humour sensoriel)
198
+ - Même structure, langue/domaine/pile différents
199
+ - Adopté avec seulement des modifications contextuelles aucune modification du contrat principal
174
200
 
175
201
  **Traitement complet FT-001** (portlight-desktop)
176
- - Traitement en 7 phases avec rôles du "Traitement Pack"
177
- - Vérification de déploiement prouvée, absence de conflits de rôles
202
+ - Traitement en 7 phases avec les rôles du pack de traitement
203
+ - La validation avant le déploiement a été prouvée, aucun conflit de rôle
178
204
 
179
205
  **Traitement complet FT-002** (studioflow)
180
- - Même ensemble de traitement, dépôt structurellement différent (espace de travail créatif vs jeu)
181
- - Ensemble de traitement portable — aucune modification de contrat n'est nécessaire
206
+ - Même pack de traitement, dépôt structurellement différent (espace de travail créatif par rapport à un jeu)
207
+ - Le pack de traitement est portable — aucune modification du contrat nest nécessaire
182
208
 
183
- **Brainstorming pour une exécution optimale** (sujet du marché de serveurs MCP)
184
- - Chaîne de 9 rôles, 4 analystes en parallèle, examen croisé + réfutation, graphe de désaccord.
185
- - 4 défis lancés, 3 affirmations affinées, 1 non résolue pression saine, pas de blocage.
186
- - Plus de 16 liens de traçabilité des artefacts générés vers les éléments de base de la couche de vérité.
187
- - Chaîne de traçabilité complète prouvée : vérité → éléments de base → désaccord → synthèse → expansion → jugement → rendu → traçabilité.
209
+ **Session de brainstorming réussie** (sujet du marché MCP server)
210
+ - Chaîne de 9 rôles, 4 analystes en parallèle, examen croisé + réfutation du graphique des désaccords
211
+ - 4 défis lancés, 3 revendications affinées, 1 non résolu une pression saine, pas d’impasse
212
+ - Plus de 16 liens de traçabilité à partir des artefacts rendus vers les atomes de la couche de vérité
213
+ - Chaîne complète de traçabilité prouvée : vérité → atomes → désaccord → synthèse → expansion → jugement → rendu → traçabilité
188
214
 
189
- ## Propriétés essentielles
215
+ ## Propriétés principales
190
216
 
191
- Ce sont des éléments non négociables. Si une modification affaiblit l'un de ces éléments, elle doit être rejetée.
217
+ Elles sont non négociables. Si une modification affaiblit l’une d’entre elles, rejetez-la.
192
218
 
193
- - Les limites des rôles sont respectées.
194
- - Les revues sont rigoureuses.
195
- - Les escalades restent transparentes.
196
- - Les tests restent réalisables.
197
- - La portabilité nécessite une adaptation du contexte, et non une modification profonde.
219
+ - Les limites des rôles sont respectées
220
+ - L’examen est rigoureux
221
+ - L’escalade reste honnête
222
+ - Les paquets restent testables
223
+ - La portabilité nécessite une adaptation contextuelle, et non une chirurgie du cœur
198
224
 
199
225
  ## Structure du projet
200
226
 
@@ -206,18 +232,23 @@ role-os/
206
232
  entry-cmd.mjs ← `roleos start` CLI command
207
233
  run.mjs ← Persistent run engine: create → step → pause → resume → report
208
234
  run-cmd.mjs ← `roleos run/resume/next/explain/complete/fail` + interventions
209
- mission.mjs ← 7 named mission types (feature, bugfix, treatment, docs, security, research, brainstorm)
235
+ mission.mjs ← 9 named mission types (feature, bugfix, treatment, docs, security, research, brainstorm, deep-audit, dogfood-swarm)
210
236
  mission-run.mjs ← Mission runner: create → step → complete → report
211
237
  mission-cmd.mjs ← `roleos mission` CLI commands
212
- route.mjs 31-role routing + dynamic chain builder
213
- packs.mjs 7 calibrated team packs + auto-selection
238
+ audit-cmd.mjs `roleos audit` deep audit entry point with manifest generation
239
+ swarm-cmd.mjs `roleos swarm` dogfood swarm entry point with domain detection
240
+ swarm/ ← Domain detection, build gate, evidence persistence bridge
241
+ route.mjs ← 61-role routing + dynamic chain builder
242
+ packs.mjs ← 10 calibrated team packs + auto-selection
214
243
  conflicts.mjs ← 4-pass conflict detection
215
244
  escalation.mjs ← Auto-routing for blocked/rejected/split
216
245
  evidence.mjs ← Structured evidence + role-aware requirements
217
246
  dispatch.mjs ← Runtime dispatch manifests for multi-claude
218
- artifacts.mjs 30 per-role artifact contracts + 7 pack handoffs
247
+ tool-profiles.mjs Per-role tool sandboxing (shared by dispatch + trial)
248
+ state-machine.mjs ← Canonical step/run transition maps
249
+ artifacts.mjs ← Per-role artifact contracts + pack handoffs
219
250
  decompose.mjs ← Composite task detection + splitting
220
- composite.mjs ← Dependency-ordered execution + recovery
251
+ composite.mjs ← Dependency-ordered execution + recovery + cycle detection
221
252
  replan.mjs ← Mid-run adaptive replanning
222
253
  calibration.mjs ← Outcome recording + weight tuning
223
254
  hooks.mjs ← 5 lifecycle hooks for runtime enforcement
@@ -225,56 +256,60 @@ role-os/
225
256
  brainstorm.mjs ← Evidence modes, request validation, finding/synthesis/judge schemas
226
257
  brainstorm-roles.mjs ← Role-native schemas, input partitioning, blindspot enforcement, cross-exam
227
258
  brainstorm-render.mjs ← Two-layer rendering: lexical bans, render schemas, debate transcript
228
- test/ ← 894 tests across 30 test files
259
+ test/ ← 1150 tests across 37 test files
229
260
  starter-pack/ ← Drop-in role contracts, policies, schemas, workflows
230
261
  ```
231
262
 
232
263
  ## Sécurité
233
264
 
234
- Le rôle OS fonctionne **uniquement localement**. Il copie les modèles Markdown et écrit les fichiers de paquets/de verdicts dans le répertoire `.claude/` de votre dépôt. Il n'accède pas au réseau, ne gère pas les secrets et ne collecte pas de données télémétriques. Aucune opération dangereuse n'est effectuée : toutes les écritures de fichiers utilisent par défaut la fonction "skip-if-exists". Consultez le fichier [SECURITY.md](SECURITY.md) pour connaître la politique complète.
265
+ Role OS fonctionne **uniquement en local**. Il copie les modèles Markdown et écrit les fichiers de paquets/décisions dans le répertoire `.claude/` de votre dépôt. Il naccède pas au réseau, ne gère pas les secrets et ne collecte pas de données de télémétrie. Aucune opération dangereuse par défaut, toutes les écritures de fichiers utilisent l’option « ignorer si existant ». Consultez le fichier [SECURITY.md](SECURITY.md) pour connaître la politique complète.
235
266
 
236
- ## Le système d'exploitation
267
+ ## Le système dexploitation
237
268
 
238
- | Couche | Ce que cela fait | Statut |
269
+ | Couche | Ce qu’il fait | Statut |
239
270
  |-------|-------------|--------|
240
- | **Routing** | Évalue les 31 rôles en fonction du contenu de la tâche, explique les recommandations, évalue la confiance | ✓ Déployé |
241
- | **Chain builder** | Assemble des chaînes ordonnées en fonction des rôles, avec une préférence pour certains types de paquets, sans être verrouillée à un modèle spécifique. | ✓ Déployé |
242
- | **Conflict detection** | Validation en 4 étapes : conflits majeurs, séquences, redondances, lacunes de couverture. Suggestions de correction. | ✓ Déployé |
243
- | **Escalation** | Redirection automatique des tâches bloquées, rejetées ou divisées vers le module de résolution approprié, avec indication de la raison et des artefacts requis. | ✓ Déployé |
244
- | **Evidence** | Preuves structurées et adaptées aux rôles dans les verdicts. Vérifications de suffisance. 12 types de preuves. | ✓ Déployé |
245
- | **Dispatch** | Génération de manifestes d'exécution pour les environnements multi-Claude. Profils d'outils par rôle, instructions système, budgets. | ✓ Déployé |
246
- | **Trials** | Ensemble complet validé : 30 tâches réussies sur 30 + 5 essais négatifs réussis sur 5. 7 ensembles de tests terminés. | ✓ Terminé |
247
- | **Team Packs** | 7 ensembles calibrés avec sélection automatique, protections contre les erreurs et mécanisme de repli en cas de problème. | ✓ Déployé |
248
- | **Outcome calibration** | Enregistrement des résultats des exécutions, ajustement des poids des ensembles/rôles en fonction des résultats, modification des seuils de confiance. | ✓ Déployé |
249
- | **Mixed-task decomposition** | Détection des tâches complexes, division en paquets secondaires, attribution des ensembles, préservation des dépendances. | ✓ Déployé |
250
- | **Composite execution** | Exécution des paquets secondaires dans l'ordre des dépendances, avec transmission des artefacts, reprise en cas de branchement et synthèse. | ✓ Déployé |
251
- | **Adaptive replanning** | Les modifications de la portée, les résultats ou les nouvelles exigences pendant l'exécution mettent à jour le plan sans redémarrage. | ✓ Déployé |
252
- | **Session spine** | `roleos init claude` crée les fichiers CLAUDE.md, /roleos-route, /roleos-review, /roleos-status. `roleos doctor` vérifie la configuration. Les cartes de routage prouvent l'engagement. | ✓ Déployé |
253
- | **Hook spine** | 5 points d'accroche du cycle de vie (SessionStart, PromptSubmit, PreToolUse, SubagentStart, Stop). Application des règles : rappels sur les cartes de routage, contrôle de l'utilisation des outils, injection de rôle des sous-agents, audit de la finalisation. | ✓ Déployé |
254
- | **Artifact spine** | 20 contrats d'artefacts par rôle. 7 contrats de transmission d'ensembles. Validation structurelle. Vérifications de l'intégrité des chaînes. Les rôles suivants ne peuvent jamais deviner ce qu'ils ont reçu. | ✓ Déployé |
255
- | **Mission library** | 6 missions nommées (développement de fonctionnalité, correction de bug, amélioration, publication de documentation, renforcement de la sécurité, lancement de recherche). Chaque mission définit l'ensemble, la chaîne de rôles, le flux d'artefacts, les branches de relance et une définition partielle et honnête. Les 6 missions ont été testées et optimisées. | ✓ Déployé |
256
- | **Mission runner** | Création d'exécutions, suivi de l'état, finalisation ou échec avec un rapport précis. Propagation des étapes bloquées, avertissements de relance en dehors de la chaîne, réouverture de la dernière étape. | ✓ Déployé |
257
- | **Unified entry** | `roleos start` détermine automatiquement si l'exécution est une mission, un ensemble ou un routage libre. Mécanisme de repli avec scores de confiance, alternatives et détection des tâches complexes. | ✓ Déployé |
258
- | **Persistent runs** | `roleos run` crée des exécutions enregistrées sur le disque. Commandes : `resume` (reprendre), `next` (suivant), `explain` (expliquer), `complete` (terminer), `fail` (échec). Interventions : `reroute` (rediriger), `escalate` (escalader), `retry` (réessayer), `block` (bloquer), `reopen` (réouvrir). Instructions spécifiques à chaque étape. Mesure du niveau de friction. | ✓ Déployé |
259
- | **Brainstorm** | Architecture à deux niveaux : vérité (schémas natifs des rôles, éléments de base de provenance, graphe de désaccord) + rendu (5 voix distinctes, interdictions lexicales, transcription du débat). Les liens de traçabilité prouvent que chaque affirmation rendue correspond à un élément de base de la couche de vérité. Exécution optimale : 894 tests. | ✓ Déployé |
260
-
261
- ## 6 missions
262
-
263
- | Mission | Ensemble | Rôles | Quand utiliser |
271
+ | **Routing** | Attribue un score à chacun des 61 rôles en fonction du contenu du paquet, explique les recommandations et évalue la confiance. | ✓ Déployé |
272
+ | **Chain builder** | Assemble des chaînes ordonnées par phase à partir des rôles notés, avec une préférence pour le type de paquet plutôt que pour un modèle prédéfini. | ✓ Déployé |
273
+ | **Conflict detection** | Validation en 4 étapes : conflits importants, séquence, redondance, lacunes de couverture. Suggestions de correction. | ✓ Déployé |
274
+ | **Escalation** | Achemine automatiquement les travaux bloqués/rejetés/divisés vers le bon résolveur avec une explication et l’artefact requis. | ✓ Déployé |
275
+ | **Evidence** | Preuves structurées tenant compte du rôle dans les décisions. Vérifications de suffisance. 12 types de preuves. | ✓ Déployé |
276
+ | **Dispatch** | Génère des manifestes dexécution pour multi-claude. Profils doutils par rôle, invites système, budgets. | ✓ Déployé |
277
+ | **Trials** | Ensemble complet prouvé : 30/30 tâches réussies + 5/5 essais négatifs. 7 essais de pack terminés. | ✓ Terminé |
278
+ | **Team Packs** | 10 packs calibrés avec sélection automatique, protections contre les incompatibilités et repli en cas de routage libre. | ✓ Déployé |
279
+ | **Outcome calibration** | Enregistre les résultats des exécutions, ajuste les pondérations des packs/rôles à partir des résultats et modifie les seuils de confiance. | ✓ Déployé |
280
+ | **Mixed-task decomposition** | Détecte le travail composite, divise en paquets enfants, assigne des packs et conserve les dépendances. | ✓ Déployé |
281
+ | **Composite execution** | Exécute les paquets enfants dans lordre des dépendances avec transfert d’artefacts, récupération de branche et synthèse. | ✓ Déployé |
282
+ | **Adaptive replanning** | Les modifications de portée, les découvertes ou les nouvelles exigences en cours d’exécution mettent à jour le plan sans redémarrer. | ✓ Déployé |
283
+ | **Session spine** | `roleos init claude` crée les fichiers CLAUDE.md, /roleos-route, /roleos-review, /roleos-status. `roleos doctor` vérifie la configuration. Les cartes de routage prouvent lengagement. | ✓ Déployé |
284
+ | **Hook spine** | 5 hooks du cycle de vie (SessionStart, PromptSubmit, PreToolUse, SubagentStart, Stop). Application consultative : rappels sur les cartes de routage, validation avant lutilisation des outils, injection du rôle d’un sous-agent, audit de la complétion. | ✓ Déployé |
285
+ | **Artifact spine** | Contrats dartefacts par rôle. Contrats de transfert de pack. Validation structurelle. Vérifications de l’exhaustivité de la chaîne. Les rôles en aval ne devinent jamais ce quils ont reçu. | ✓ Déployé |
286
+ | **Mission library** | 9 missions nommées (fonctionnalité principale, correction de bugs, traitement, publication de la documentation, renforcement de la sécurité, lancement d’une recherche, séance de brainstorming, audit approfondi, phase de test interne). Chacune définit le groupe, la chaîne de rôles, le flux des éléments, les branches d’escalade et une définition partielle mais précise. | ✓ Déployé |
287
+ | **Mission runner** | Exécutez des tests, parcourez les étapes en suivant l’état, terminez ou échouez avec un compte rendu précis. Propagation d’étape bloquée, avertissements de dépassement du nombre maximal d’étapes, réouverture de la dernière étape. | ✓ Déployé |
288
+ | **Unified entry** | La commande `roleos start` détermine automatiquement le mode de routage à utiliser : mission, ensemble ou libre. En cas d’échec, elle utilise une série d’options de repli avec des niveaux de confiance, des itinéraires alternatifs et une détection combinée. | ✓ Déployé |
289
+ | **Persistent runs** | « `roleos run` » crée des exécutions dont les données sont stockées sur disque. « `resume` », « `next` », « `explain` », « `complete` », « `fail` ». Interventions possibles : redirection, escalade, nouvelle tentative, blocage, réouverture. Instructions spécifiques à chaque étape. Mesure des frottements. | ✓ Déployé |
290
+ | **Brainstorm** | Architecture à deux niveaux : vérité (schémas natifs liés aux rôles, éléments de provenance, graphe des arguments contradictoires) + rendu (5 voix distinctes, interdictions lexicales, transcription du débat). Les liens de traçabilité prouvent que chaque affirmation rendue correspond à un élément de vérité. Test réussi et validé. | ✓ Déployé |
291
+ | **Deep Audit** | Audit du dépôt basé sur le manifeste : décomposer le dépôt en composants, affecter N auditeurs, M auditeurs chargés de vérifier la conformité et K auditeurs chargés d’examiner les interfaces à partir du graphe des dépendances, synthétiser les résultats pour obtenir un classement et un plan d’action. L’affectation dynamique s’adapte à la taille du dépôt (formule : 2N + K + 3). Exécution native avec validation des artefacts à chaque étape. | ✓ Déployé |
292
+ | **Dogfood Swarm** | Convergence en plusieurs étapes : trois phases de développement (correction des bugs/sécurité → approche proactive → amélioration de l’expérience utilisateur), puis phase d’ajout de fonctionnalités. Propriété exclusive des fichiers, validation à chaque étape du processus, points de contrôle pour les utilisateurs. Détection automatique du domaine qui génère les manifestes. Liaison vers les environnements de test internes (dogfood-labs). | ✓ Déployé |
293
+
294
+ ## 9 missions
295
+
296
+ | Mission | Ensemble | Rôles | Quand l’utiliser ? |
264
297
  |---------|------|-------|-------------|
265
- | `feature-ship` | Fonctionnalité | 5 | Livraison complète d'une fonctionnalité : définition de la portée → spécifications → implémentationtestrevue |
266
- | `bugfix` | Correction de bug | 4 | Diagnostic de la cause profonde, correction, test, vérification |
267
- | `treatment` | Amélioration | 4 | Vérification + peaufinage + documentation + vérification CI + revue |
268
- | `docs-release` | Documentation | 2 | Rédaction/mise à jour de la documentation, notes de publication |
269
- | `security-hardening` | Sécurité | 4 | Analyse des menaces, audit, correction des vulnérabilités, nouvel audit, vérification |
270
- | `research-launch` | Recherche | 4 | Définition de la question, recherche, documentation des résultats, prise de décision |
271
- | `brainstorm` | brainstorming | 9 | Enquête structurée avec plusieurs perspectives, désaccord traçable et verdict. |
298
+ | `feature-ship` | fonctionnalité ; mettre en avant ; figurer dans | 5 | Déploiement complet des fonctionnalités : définition du périmètre → spécifications → mise en œuvre testsévaluation |
299
+ | `bugfix` | correction de bug | 4 | Identifier la cause profonde, corriger, tester, vérifier. |
300
+ | `treatment` | traitement | 4 | Vérification du code source + correction + documentation + vérification par l’intégration continue + relecture |
301
+ | `docs-release` | documents | 2 | Rédiger et mettre à jour la documentation, les notes de version. |
302
+ | `security-hardening` | sécurité | 4 | Analyse des risques, audit, correction des vulnérabilités, nouvel audit, vérification. |
303
+ | `research-launch` | recherche | 4 | Définir la problématique, mener des recherches, consigner les résultats, prendre une décision. |
304
+ | `brainstorm` | session de brainstorming / séance de remue-méninges | 9 | Enquête structurée et multidimensionnelle, permettant de suivre les désaccords et d’aboutir à une conclusion. |
305
+ | `deep-audit` | audit approfondi | 5 (gammes) | Audit de dépôt pris en charge par Manifest : le nombre d’utilisateurs participant à l’audit s’adapte à la taille du graphe du dépôt grâce à une répartition dynamique des tâches. |
306
+ | `dogfood-swarm` | essaim | 8 (gammes) | Convergence en plusieurs étapes : état de santé A → état de santé B → état de santé C → caractéristique → synthèse finale. |
272
307
 
273
- Chaque mission inclut des définitions partielles et honnêtes : lorsque le travail est bloqué, le système documente ce qui a été réalisé et ce qui reste, au lieu de prétendre que le travail est terminé.
308
+ Chaque tâche comprend une description précise et honnête de l’état d’avancement : lorsque la progression est interrompue, le système enregistre ce qui a été réalisé et ce qui reste à faire, au lieu de prétendre que la tâche est terminée.
274
309
 
275
- ### Mission de brainstorming
310
+ ### Session de brainstorming sur la mission
276
311
 
277
- Ce n'est pas un "brainstorming par IA". La mission de brainstorming est **l'attribution de rôles spécialisés dans le domaine juridique, avec un désaccord traçable et une production de résultats justifiés.**
312
+ Pas de « séances de remue-méninges sur l’IA ». La mission de la séance de remue-méninges consiste à définir des **rôles spécialisés encadrés par la loi, avec un processus clair permettant d’identifier les désaccords et aboutissant à une décision définitive.**
278
313
 
279
314
  ```bash
280
315
  roleos run "explore product directions for a developer tool discovery platform"
@@ -282,33 +317,61 @@ roleos run "explore product directions for a developer tool discovery platform"
282
317
  # Chain: 4 Analysts (parallel) → Normalize → Cross-Examine → Rebut → Synthesize → Expand → Judge
283
318
  ```
284
319
 
285
- **Ce qui le différencie :**
320
+ **Qu’est-ce qui le distingue ?**
321
+
322
+ - **Niveau 1 (vérité) :** Quatre analystes émettent des schémas spécifiques à leur rôle (ContextMap, UserValueMap, MechanicsMap, PositioningMap), et non un texte partagé. Chaque rôle est soumis à des contraintes visant à éviter les angles morts : expressions interdites, types d’affirmations interdits, partitions d’entrée filtrées. Les éléments de données contiennent des informations sur leur origine. Un graphique d’interrogation croisée dirigée permet de formuler des questions ciblées. Les analystes initiaux défendent leurs positions, les affinent ou s’en désistent sous la pression.
323
+
324
+ - **Couche 2 (rendu) :** Cinq voix humaines distinctes (Note de service, Observations sur le terrain, Schéma du système, Exposé des faits, Transcription d’un contre-interrogatoire), avec des restrictions lexicales empêchant la convergence des voix. La synthèse déforme la vérité, sans jamais produire un texte cohérent. Les deux couches sont toujours accessibles.
325
+
326
+ - **Chaîne de traçabilité :** Chaque phrase générée peut être retracée jusqu’à un élément fondamental de la couche de vérité. Les instructions de synthèse font référence à ces éléments. Les interrogatoires visent des identifiants de revendications réels. Le graphique des litiges est le résultat, et non le texte lui-même.
327
+
328
+ **Validé :** version 0.4, exécution de référence – l’intégrité de la chaîne de traçabilité a été vérifiée. Consultez le fichier [`examples/golden-run.md`](examples/golden-run.md) pour obtenir la liste complète des éléments constitutifs.
329
+
330
+ ### Mission d’audit approfondie
331
+
332
+ Il ne s’agit pas d’une simple analyse superficielle. La mission d’audit approfondi décompose le dépôt en composants distincts et affecte des auditeurs spécialisés, en fonction de l’échelle déterminée par le graphe de dépendances du dépôt.
333
+
334
+ ```bash
335
+ roleos run "deep audit this repo" --manifest=audit-manifest.json
336
+ # → MISSION: Deep Audit (Manifest-Scaled)
337
+ # Steps: Component Auditor ×6 + Test Truth Auditor ×6 + Seam Auditor ×8 + Synthesizer + Action Plan + Critic = 23 steps
338
+ ```
339
+
340
+ **Qu’est-ce qui le distingue ?**
286
341
 
287
- - **Couche 1 (vérité) :** Quatre analystes produisent des schémas spécifiques à chaque rôle (ContextMap, UserValueMap, MechanicsMap, PositioningMap) – pas de prose partagée. Chaque rôle est soumis à des contraintes pour éviter les biais : phrases interdites, types d'affirmations interdits, partitions d'entrée filtrées. Les éléments de base contiennent des informations de provenance. Un graphe d'examen croisé dirigé génère des défis ciblés. Les analystes originaux défendent, affinent ou retirent leurs affirmations sous pression.
342
+ - **Répartition dynamique** : le nombre d’agents n’est pas fixe. Un dépôt de 10 composants avec 5 groupes de limites produit 28 étapes (2 × 10 + 5 + 3). Un dépôt de 3 composants en produit 12. La formule de mise à l’échelle est « 2N + K + 3 », N = nombre de composants, K = nombre de limites.
343
+ - **Ensembles de données basés sur un manifeste** : un fichier `audit-manifest.json` définit les composants (avec les chemins d’accès aux fichiers, le nombre de lignes et les descriptions) et les limites (de/vers, avec des descriptions des interfaces). Chaque auditeur ne reçoit que son ensemble de données.
344
+ - **Quatre archétypes de rôles** : Auditeur de composants (vérification du code par module), Auditeur de la validité des tests (tests qui prouvent par rapport aux tests existants), Auditeur des points d’intégration (limites d’intégration à partir du graphe de dépendances), Synthétiseur d’audit (résultat classé + plan d’action à partir de tous les ensembles de données).
345
+ - **Validation des artefacts à chaque étape** : la fonction `validateArtifact()` est exécutée à la fin de chaque étape dans les deux chemins d’exécution. Les résultats sont associés aux objets d’étape. Le système sait si chaque artefact a respecté son contrat.
346
+ - **Résultats partiels honnêtes** : lorsque le budget ou la portée empêche l’achèvement, les résultats par composant sont valides individuellement. Le système synthétise à partir de ce qui a été achevé et ne prétend jamais avoir couvert tous les aspects.
347
+
348
+ **Résultats confirmés :** Exécution d’un test de validation effectué par un utilisateur natif – 18 tests réalisés sur des exemples réels, vérification complète du cycle de vie, y compris la réouverture en cas d’escalade et la gestion des échecs partiels. La formule de mise à l’échelle a été validée pour les exemples comportant 3, 6, 10 ou 15 composants.
349
+
350
+ ### Mission consistant à déployer un essaim de drones
351
+
352
+ Il ne s’agit pas d’un outil d’analyse statique en une seule passe. La mission « dogfood swarm » exécute un protocole de convergence multipasse qui fait passer un dépôt de l’état « fonctionnel » à l’état « prêt pour la production », en trois étapes et grâce à des livraisons itératives de fonctionnalités.
353
+
354
+ ```bash
355
+ roleos swarm
356
+ # → MISSION: Dogfood Swarm (Multi-Pass Convergence)
357
+ # Stages: Health-A → Health-B → Health-C → Feature → Final
358
+ # Domain agents: 3-5 parallel per wave (exclusive file ownership)
359
+ ```
288
360
 
289
- - **Couche 2 (rendu) :** Cinq voix humaines distinctes (Boundary Memo, Field Notes, System Sketch, Claim Brief, Cross-Exam Transcript) avec des interdictions lexicales pour éviter la convergence des voix. La synthèse utilise la couche de vérité, et non la prose rendue. Les deux couches sont toujours disponibles.
361
+ **Qu’est-ce qui le distingue ?**
290
362
 
291
- - **Chaîne de traçabilité :** Chaque phrase rendue est traçable jusqu un élément de base de la couche de vérité. Les instructions de synthèse citent les éléments de base. Les cibles de l'examen croisé sont des identifiants d'affirmations réels. Le graphe de désaccord est le résultat, et non la prose.
363
+ - **Étape d’évaluation en trois phases** : la phase A corrige les bogues et les problèmes de sécurité (boucle jusqu’à ce qu’il n’y ait plus 0 CRITICAL + 0 HIGH). La phase B applique un renforcement proactif (les utilisateurs examinent les résultats). La phase C améliore le code en le rendant plus convivial : messages d’erreur qui aident les utilisateurs, commentaires sur la reconnexion, états de chargement, accessibilité. Chaque étape est une approche distincte, et non la même analyse répétée.
364
+ - **Propriété exclusive des fichiers** : chaque agent de domaine possède des fichiers spécifiques via `swarm-manifest.json`. Aucun agent n’édite le même fichier. Pas de conflits de fusion. Pas de surcharge de coordination.
365
+ - **Contrôles avant la compilation** : l’analyse statique + la vérification du type + les tests doivent être réussis après chaque vague. Le système détecte automatiquement le système de compilation (Node, Rust, Python, Go) et exécute les commandes appropriées.
366
+ - **Points de contrôle utilisateur** : la phase d’évaluation Health-B et la phase de livraison des fonctionnalités nécessitent l’approbation explicite de l’utilisateur avant l’exécution. Le système présente les résultats, et l’utilisateur décide ce qui doit être compilé.
367
+ - **Convergence itérative** : les étapes sont répétées en boucle avec les vagues jusqu’à ce que les conditions de sortie soient remplies ou qu’un nombre maximal d’itérations soit atteint. Chaque vague effectue une nouvelle vérification à partir de zéro afin de détecter les régressions introduites par les corrections précédentes.
368
+ - **Détection automatique du domaine** : `roleos swarm manifest --generate` détecte le type de dépôt (CLI, web, bureau, MCP, monorepo) et génère des affectations de domaine non superposées.
292
369
 
293
- **Prouvé :** Exécution optimale v0.4 894 tests, chaîne de traçabilité complète vérifiée. Consultez [`examples/golden-run.md`](examples/golden-run.md) pour la chaîne complète des artefacts.
370
+ **Résultats prouvés** : claude-collaborate (2026-03-28) 35 → 129 tests, 106 problèmes d’évaluation corrigés, v1.1.0 publié. Protocole v2.0 avec 9 phases.
294
371
 
295
372
  ## Statut
296
373
 
297
- - v0.1–v0.4 : Bases essais, adoption (du produit), ensemble de traitement, ensemble de démarrage.
298
- - v1.0.0 : 32 rôles, CLI complète, traitement éprouvé, portabilité multi-dépôts.
299
- - v1.0.2 : Blocage du système d'exploitation par rôle (corrections de la "vérité" de l'initialisation, `init --force`).
300
- - v1.1.0 : 31 rôles, infrastructure de routage complète, détection de conflits, escalade, preuves, répartition, 7 ensembles d'équipe éprouvés. 35 essais d'exécution. 212 tests.
301
- - v1.2.0 : Ensembles calibrés promus au point d'entrée par défaut. Sélection automatique, détection de discordances, suggestion alternative, repli sur le routage libre. 246 tests.
302
- - v1.3.0 : Calibrage des résultats, décomposition de tâches complexes, exécution composite, replanification adaptative. 317 tests.
303
- - v1.4.0 : Infrastructure de session – `roleos init claude`, `roleos doctor`, cartes de routage, commandes `/roleos-route`, `/roleos-review` et `/roleos-status`. 335 tests.
304
- - v1.5.0 : Infrastructure de "hooks" – 5 "hooks" de cycle de vie pour l'application en temps réel. 358 tests.
305
- - v1.6.0 : Infrastructure des artefacts – 20 contrats d'artefacts par rôle, 7 contrats de transmission d'ensembles, validation structurelle. 385 tests.
306
- - v1.7.0 : Preuve de complétion – tâches réelles exécutées sur toute la pile. CLI `roleos artifacts`. Escalade honnête pour les corrections structurelles. 398 tests.
307
- - v1.8.0 : Bibliothèque de missions (Phase S) – 6 missions nommées, moteur d'exécution, rapports de complétion. Durcissement basé sur 6 exécutions réelles. 481 tests.
308
- - v1.9.0 : Chemin d'entrée unifié (Phase T) – `roleos start` décide automatiquement entre mission, ensemble et routage libre. Système de repli, détection composite, essais de comparaison du chemin d'entrée. 527 tests.
309
- - **v2.0.0** : Optimisation de l'expérience utilisateur (Phase U) – `roleos run` crée des exécutions persistantes avec sauvegarde sur disque. Reprise, suivant, explication, complétion, échec. Interventions : réacheminement, escalade, nouvelle tentative, blocage, réouverture. Assistance spécifique à chaque étape. Mesure du niveau de difficulté. 6 essais de difficulté. 613 tests.
310
- - **v2.0.1** : Audit du manuel, documentation pour débutants, corrections du nombre de tests. 617 tests.
311
- - **v2.1.0** : Mission de brainstorming (v0.4) – rôles spécialisés dans le domaine juridique, désaccord traçable, résultat avec verdict. Architecture à deux niveaux (vérité + rendu), matrice de permissions de contre-interrogatoire, graphe de litiges, preuve d'exécution optimale. 7 missions, 50 rôles, 8 ensembles. 894 tests.
374
+ Stable et prêt à être déployé. Consultez le fichier [CHANGELOG](CHANGELOG.md) pour obtenir l’historique complet des versions et les modifications apportées dans chaque version.
312
375
 
313
376
  ## Licence
314
377
 
@@ -316,4 +379,4 @@ MIT
316
379
 
317
380
  ---
318
381
 
319
- Créé par <a href="https://mcp-tool-shop.github.io/">MCP Tool Shop</a
382
+ Créé par <a href="https://mcp-tool-shop.github.io/">MCP Tool Shop</a>