role-os 2.3.1 → 2.6.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
package/README.fr.md CHANGED
@@ -1,319 +1,319 @@
1
- <p align="center">
2
- <a href="README.ja.md">日本語</a> | <a href="README.zh.md">中文</a> | <a href="README.es.md">Español</a> | <a href="README.md">English</a> | <a href="README.hi.md">हिन्दी</a> | <a href="README.it.md">Italiano</a> | <a href="README.pt-BR.md">Português (BR)</a>
3
- </p>
4
-
5
- <p align="center">
6
- <img src="https://raw.githubusercontent.com/mcp-tool-shop-org/brand/main/logos/role-os/readme.png" alt="Role OS" width="600">
7
- </p>
8
-
9
- <p align="center">
10
- <a href="https://github.com/mcp-tool-shop-org/role-os/actions"><img src="https://github.com/mcp-tool-shop-org/role-os/actions/workflows/ci.yml/badge.svg" alt="CI"></a>
11
- <a href="https://www.npmjs.com/package/role-os"><img src="https://img.shields.io/npm/v/role-os" alt="npm"></a>
12
- <a href="LICENSE"><img src="https://img.shields.io/badge/license-MIT-blue" alt="MIT License"></a>
13
- <a href="https://mcp-tool-shop-org.github.io/role-os/"><img src="https://img.shields.io/badge/Landing_Page-live-brightgreen" alt="Landing Page"></a>
14
- </p>
15
-
16
- Un système d'exploitation multi-Claude qui affecte du personnel, gère les flux de travail, valide et exécute les tâches à travers 31 contrats de rôles spécialisés. Il crée des ensembles de tâches, assemble l'équipe appropriée en fonction de la compatibilité des rôles, détecte les problèmes potentiels avant l'exécution, redirige automatiquement la reprise en cas de blocage ou de rejet des tâches, et exige des preuves structurées pour chaque décision.
17
-
18
- ## Ce que cela fait
19
-
20
- Role OS est la manière professionnelle d'utiliser multi-Claude. Il évite les échecs spécifiques que produisent les flux de travail d'IA génériques :
21
-
22
- - **Dérive** : les rôles restent dans leur domaine. Le produit ne subit pas de refonte. L'interface utilisateur ne redéfinit pas la portée. Le backend n'invente pas la direction du produit.
23
- - **Fausse complétion** : la définition de "terminé" est concrète. Le travail qui masque des lacunes, saute des vérifications ou résout un problème différent est rejeté.
24
- - **Contamination** : les projets divisés ou hérités conservent des résidus d'identité. Role OS détecte et rejette les dérives inter-projets en termes de terminologie, de visuels et de modèles mentaux.
25
- - **Progrès basé sur des impressions** : chaque transmission est structurée. Chaque verdict est étayé par des preuves. "Cela semble terminé" n'est pas un état valide.
26
-
27
- ## Comment cela fonctionne
28
-
29
- Décrivez votre tâche. Role OS détermine automatiquement le niveau d'orchestration approprié.
30
-
31
- ```bash
32
- roleos start "fix the crash in save handler"
33
- # → MISSION: Bugfix & Diagnosis (70% confidence)
34
- # Chain: Repo Researcher → Backend Engineer → Test Engineer → Critic Reviewer
35
-
36
- roleos start "add a new export command"
37
- # → PACK: Feature Build (50% confidence)
38
- # Roles: Orchestrator, Product Strategist, Spec Writer, Backend Engineer, Test Engineer, Critic Reviewer
39
-
40
- roleos start "something completely novel"
41
- # → FREE-ROUTING (10% confidence)
42
- # Hint: Create a packet and run `roleos route` for role-level routing
43
- ```
44
-
45
- **L'échelle de secours :**
46
-
47
- 1. **Mission** — lorsque la tâche correspond à un flux de travail récurrent éprouvé (correction de bugs, traitement, déploiement de fonctionnalités, documentation, sécurité, recherche). Chaîne de rôles connue, flux d'artefacts, branches d'escalade et définitions partielles claires.
48
- 2. **Pack** — lorsque la tâche appartient à une famille connue, mais ne correspond pas à une mission complète. 7 ensembles d'équipe calibrés avec sélection automatique et mécanismes de prévention des incompatibilités.
49
- 3. **Routage libre** — lorsque la tâche est nouvelle, complexe ou incertaine. Évalue les 31 rôles en fonction du contenu de la tâche et assemble une chaîne dynamique.
50
-
51
- Le système ne force jamais une tâche à travers le mauvais niveau d'abstraction. Il explique pourquoi il a choisi chaque niveau et propose des alternatives.
52
-
53
- **Une seule commande pour activer l'exécution :**
54
-
55
- ```bash
56
- roleos run "fix the crash in save handler"
57
- # → Created run: run-1234
58
- # → Entry: MISSION (bugfix)
59
- # → Started step 0: Repo Researcher → diagnosis-report
60
- # → Guidance: Required sections: entrypoints, module-map, build-test-commands
61
-
62
- roleos next # Start the next step
63
- roleos complete diagnosis.md # Complete the active step with artifact
64
- roleos explain # Show full run state and guidance
65
- roleos resume # Continue an interrupted run
66
- roleos report # Generate completion report
67
- roleos friction # Measure operator touches
68
- ```
69
-
70
- **Interventions en cas de problème :**
71
-
72
- ```bash
73
- roleos retry 0 # Retry a failed step
74
- roleos reroute 1 "Frontend Developer" "UI bug" # Swap a role
75
- roleos escalate "Test Engineer" "Repo Researcher" "missed edge case" "re-diagnose"
76
- roleos block 2 "waiting for API spec"
77
- roleos reopen 0 "found issue in review"
78
- ```
79
-
80
- Les exécutions sont enregistrées sur le disque (dans le dossier `.claude/runs/`), ce qui permet de reprendre les sessions interrompues sans problème. Chaque étape comprend des instructions pour l'utilisateur : ce qu'il faut produire, les sections requises et les conditions d'arrêt.
81
-
82
- **Une fois routée :**
83
-
84
- 1. **Chaque rôle produit une transmission** — sortie structurée avec des éléments de preuve qui réduisent l'ambiguïté pour le rôle suivant.
85
- 2. **Le critique effectue une revue par rapport au contrat** — accepte, rejette ou bloque en fonction de preuves structurées, et non d'impressions.
86
- 3. **La reprise est gérée automatiquement** — les tâches bloquées ou rejetées sont redirigées vers le responsable approprié, avec une raison, un type de reprise et les artefacts requis.
87
-
88
- ## État de déploiement au sein de l'organisation
89
-
90
- L'état de déploiement au niveau de l'organisation (file d'attente, décisions, enregistrements d'audit, ensembles de verrouillage par dépôt) se trouve dans un dépôt privé distinct : [`role-os-rollout`](https://github.com/mcp-tool-shop-org/role-os-rollout). Ce dépôt est le produit ; ce dernier est l'état opérationnel.
91
-
92
- ## Mémoire et continuité
93
-
94
- Role OS ne possède ni ne duplique la couche de mémoire. Lorsqu'une mémoire de projet Claude existe, elle constitue le système de continuité canonique : les faits du référentiel, les décisions, les boucles ouvertes et l'historique des traitements y sont stockés.
95
-
96
- Role OS s'intègre à la mémoire du projet Claude. Il ne la remplace pas.
97
-
98
- ## Traitement complet et vérification de la livraison
99
-
100
- Le traitement complet est un protocole canonique en 7 phases défini dans la mémoire du projet Claude (`memory/full-treatment.md`). Role OS dirige et examine les traitements à l'aide de contrats de rôle, de transmissions et de passerelles de critique ; il ne redéfinit pas le protocole.
101
-
102
- La **vérification de la livraison** est la porte de qualité de 31 éléments qui s'exécute avant le traitement complet. Les portes obligatoires A à D doivent être validées avant que tout traitement ne commence. Référence canonique : `memory/shipcheck.md`.
103
-
104
- Ordre : Vérification de la livraison, puis traitement complet. Aucune version 1.0.0 sans validation des portes obligatoires.
105
-
106
- ## 31 rôles répartis dans 8 ensembles
107
-
108
- | Ensemble | Rôles |
109
- |------|-------|
110
- | **Core** (3) | Orchestrateur, Stratège Produit, Critique |
111
- | **Engineering** (7) | Développeur Frontend, Ingénieur Backend, Ingénieur Tests, Ingénieur Refactoring, Ingénieur Performance, Auditeur de Dépendances, Expert en Sécurité |
112
- | **Design** (2) | Concepteur UI, Gardien de la Marque |
113
- | **Marketing** (1) | Rédacteur de Contenu de Lancement |
114
- | **Treatment** (7) | Chercheur de Dépôts, Traducteur de Dépôts, Architecte de Documentation, Conservateur de Métadonnées, Auditeur de Couverture, Vérificateur de Déploiement, Ingénieur de Release |
115
- | **Product** (3) | Synthétiseur de Commentaires, Priorisateur de Feuille de Route, Rédacteur de Spécifications |
116
- | **Research** (4) | Chercheur UX, Analyste Concurrentiel, Chercheur de Tendances, Synthétiseur d'Entretiens Utilisateurs |
117
- | **Growth** (4) | Stratège de Lancement, Stratège de Contenu, Community Manager, Responsable de Tri des Demandes d'Assistance |
118
-
119
- Chaque rôle a un contrat complet : mission, conditions d'utilisation, conditions de non-utilisation, entrées attendues, sorties requises, niveau de qualité et déclencheurs d'escalade. Chaque rôle peut être routé — `roleos route` peut recommander n'importe lequel d'entre eux en fonction du contenu de la tâche.
120
-
121
- ## Démarrage rapide
122
-
123
- ```bash
124
- npx role-os init
125
-
126
- # Describe what you need — Role OS picks the right level:
127
- roleos run "fix the crash in save handler"
128
- # → Creates run, picks bugfix mission, starts first step with guidance
129
-
130
- # Step through:
131
- roleos next # Start next step
132
- roleos complete artifact.md # Complete with artifact
133
- roleos explain # Show full state
134
- roleos report # Completion report
135
-
136
- # Or go manual:
137
- roleos start "fix the crash" # Entry decision only (no run)
138
- roleos packet new feature
139
- roleos route .claude/packets/my-feature.md
140
- roleos review .claude/packets/my-feature.md accept
141
-
142
- # Explore missions and packs:
143
- roleos mission list
144
- roleos packs list
145
- ```
146
-
147
- ## Quand ne pas utiliser Role OS
148
-
149
- - Corrections de ligne unique, fautes de frappe ou bugs évidents
150
- - Recherche exploratoire sans résultat défini
151
- - Tâches qui peuvent être comprises par une seule personne en 5 minutes
152
- - Corrections urgentes qui doivent être déployées avant qu'une chaîne de revue ne soit terminée
153
- - Projets où la rapidité est privilégiée par rapport à la structure
154
-
155
- ## Preuves
156
-
157
- Role OS a été testé sur trois types de tâches différents dans deux référentiels structurellement différents :
158
-
159
- **Test 001 — Travail de fonctionnalité** (Écran de l'équipe, Star Freight)
160
- - Chaîne de 7 rôles, 45 scénarios de test, 0 conflit de rôle.
161
- - A empêché la contamination provenant de l'ancêtre de la branche, a détecté les inventions improvisées, et a mis en évidence les blocages réels.
162
-
163
- **Test 002 — Travail d'intégration** (Câblage de l'état de la campagne, Star Freight)
164
- - Chaîne de 5 rôles, a résolu la limite architecturale sans mensonges.
165
- - Les tests anti-fallback ont prouvé que le chemin actif est réel, et non un simple espace réservé.
166
-
167
- **Test 003 — Travail d'identité** (Suppression de la contamination, Star Freight)
168
- - Chaîne de 6 rôles, 51 scénarios de test, y compris une défense durable contre la contamination de l'intégration continue.
169
- - A corrigé la dérive de la fiction héritée sans se transformer en une refonte complète.
170
-
171
- **Phase d'essai de portabilité** (Cohérence des personas, humour lié aux capteurs)
172
- - Même structure de base, mais langage/domaine/pile différents.
173
- - adoption (du produit) avec modification du contexte uniquement – aucune modification du contrat principal.
174
-
175
- **Traitement complet FT-001** (portlight-desktop)
176
- - Traitement en 7 phases avec rôles du "Traitement Pack"
177
- - Vérification de déploiement prouvée, absence de conflits de rôles
178
-
179
- **Traitement complet FT-002** (studioflow)
180
- - Même ensemble de traitement, dépôt structurellement différent (espace de travail créatif vs jeu)
181
- - Ensemble de traitement portable — aucune modification de contrat n'est nécessaire
182
-
183
- **Brainstorming pour une exécution optimale** (sujet du marché de serveurs MCP)
184
- - Chaîne de 9 rôles, 4 analystes en parallèle, examen croisé + réfutation, graphe de désaccord.
185
- - 4 défis lancés, 3 affirmations affinées, 1 non résolue – pression saine, pas de blocage.
186
- - Plus de 16 liens de traçabilité des artefacts générés vers les éléments de base de la couche de vérité.
187
- - Chaîne de traçabilité complète prouvée : vérité → éléments de base → désaccord → synthèse → expansion → jugement → rendu → traçabilité.
188
-
189
- ## Propriétés essentielles
190
-
191
- Ce sont des éléments non négociables. Si une modification affaiblit l'un de ces éléments, elle doit être rejetée.
192
-
193
- - Les limites des rôles sont respectées.
194
- - Les revues sont rigoureuses.
195
- - Les escalades restent transparentes.
196
- - Les tests restent réalisables.
197
- - La portabilité nécessite une adaptation du contexte, et non une modification profonde.
198
-
199
- ## Structure du projet
200
-
201
- ```
202
- role-os/
203
- bin/roleos.mjs ← CLI entrypoint
204
- src/
205
- entry.mjs ← Unified entry: mission → pack → free routing
206
- entry-cmd.mjs ← `roleos start` CLI command
207
- run.mjs ← Persistent run engine: create → step → pause → resume → report
208
- run-cmd.mjs ← `roleos run/resume/next/explain/complete/fail` + interventions
209
- mission.mjs ← 7 named mission types (feature, bugfix, treatment, docs, security, research, brainstorm)
210
- mission-run.mjs ← Mission runner: create → step → complete → report
211
- mission-cmd.mjs ← `roleos mission` CLI commands
212
- route.mjs ← 31-role routing + dynamic chain builder
213
- packs.mjs ← 7 calibrated team packs + auto-selection
214
- conflicts.mjs ← 4-pass conflict detection
215
- escalation.mjs ← Auto-routing for blocked/rejected/split
216
- evidence.mjs ← Structured evidence + role-aware requirements
217
- dispatch.mjs ← Runtime dispatch manifests for multi-claude
218
- artifacts.mjs ← 30 per-role artifact contracts + 7 pack handoffs
219
- decompose.mjs ← Composite task detection + splitting
220
- composite.mjs ← Dependency-ordered execution + recovery
221
- replan.mjs ← Mid-run adaptive replanning
222
- calibration.mjs ← Outcome recording + weight tuning
223
- hooks.mjs ← 5 lifecycle hooks for runtime enforcement
224
- session.mjs ← Session scaffolding + doctor
225
- brainstorm.mjs ← Evidence modes, request validation, finding/synthesis/judge schemas
226
- brainstorm-roles.mjs ← Role-native schemas, input partitioning, blindspot enforcement, cross-exam
227
- brainstorm-render.mjs ← Two-layer rendering: lexical bans, render schemas, debate transcript
228
- test/ ← 894 tests across 30 test files
229
- starter-pack/ ← Drop-in role contracts, policies, schemas, workflows
230
- ```
231
-
232
- ## Sécurité
233
-
234
- Le rôle OS fonctionne **uniquement localement**. Il copie les modèles Markdown et écrit les fichiers de paquets/de verdicts dans le répertoire `.claude/` de votre dépôt. Il n'accède pas au réseau, ne gère pas les secrets et ne collecte pas de données télémétriques. Aucune opération dangereuse n'est effectuée : toutes les écritures de fichiers utilisent par défaut la fonction "skip-if-exists". Consultez le fichier [SECURITY.md](SECURITY.md) pour connaître la politique complète.
235
-
236
- ## Le système d'exploitation
237
-
238
- | Couche | Ce que cela fait | Statut |
239
- |-------|-------------|--------|
240
- | **Routing** | Évalue les 31 rôles en fonction du contenu de la tâche, explique les recommandations, évalue la confiance | ✓ Déployé |
241
- | **Chain builder** | Assemble des chaînes ordonnées en fonction des rôles, avec une préférence pour certains types de paquets, sans être verrouillée à un modèle spécifique. | ✓ Déployé |
242
- | **Conflict detection** | Validation en 4 étapes : conflits majeurs, séquences, redondances, lacunes de couverture. Suggestions de correction. | ✓ Déployé |
243
- | **Escalation** | Redirection automatique des tâches bloquées, rejetées ou divisées vers le module de résolution approprié, avec indication de la raison et des artefacts requis. | ✓ Déployé |
244
- | **Evidence** | Preuves structurées et adaptées aux rôles dans les verdicts. Vérifications de suffisance. 12 types de preuves. | ✓ Déployé |
245
- | **Dispatch** | Génération de manifestes d'exécution pour les environnements multi-Claude. Profils d'outils par rôle, instructions système, budgets. | ✓ Déployé |
246
- | **Trials** | Ensemble complet validé : 30 tâches réussies sur 30 + 5 essais négatifs réussis sur 5. 7 ensembles de tests terminés. | ✓ Terminé |
247
- | **Team Packs** | 7 ensembles calibrés avec sélection automatique, protections contre les erreurs et mécanisme de repli en cas de problème. | ✓ Déployé |
248
- | **Outcome calibration** | Enregistrement des résultats des exécutions, ajustement des poids des ensembles/rôles en fonction des résultats, modification des seuils de confiance. | ✓ Déployé |
249
- | **Mixed-task decomposition** | Détection des tâches complexes, division en paquets secondaires, attribution des ensembles, préservation des dépendances. | ✓ Déployé |
250
- | **Composite execution** | Exécution des paquets secondaires dans l'ordre des dépendances, avec transmission des artefacts, reprise en cas de branchement et synthèse. | ✓ Déployé |
251
- | **Adaptive replanning** | Les modifications de la portée, les résultats ou les nouvelles exigences pendant l'exécution mettent à jour le plan sans redémarrage. | ✓ Déployé |
252
- | **Session spine** | `roleos init claude` crée les fichiers CLAUDE.md, /roleos-route, /roleos-review, /roleos-status. `roleos doctor` vérifie la configuration. Les cartes de routage prouvent l'engagement. | ✓ Déployé |
253
- | **Hook spine** | 5 points d'accroche du cycle de vie (SessionStart, PromptSubmit, PreToolUse, SubagentStart, Stop). Application des règles : rappels sur les cartes de routage, contrôle de l'utilisation des outils, injection de rôle des sous-agents, audit de la finalisation. | ✓ Déployé |
254
- | **Artifact spine** | 20 contrats d'artefacts par rôle. 7 contrats de transmission d'ensembles. Validation structurelle. Vérifications de l'intégrité des chaînes. Les rôles suivants ne peuvent jamais deviner ce qu'ils ont reçu. | ✓ Déployé |
255
- | **Mission library** | 6 missions nommées (développement de fonctionnalité, correction de bug, amélioration, publication de documentation, renforcement de la sécurité, lancement de recherche). Chaque mission définit l'ensemble, la chaîne de rôles, le flux d'artefacts, les branches de relance et une définition partielle et honnête. Les 6 missions ont été testées et optimisées. | ✓ Déployé |
256
- | **Mission runner** | Création d'exécutions, suivi de l'état, finalisation ou échec avec un rapport précis. Propagation des étapes bloquées, avertissements de relance en dehors de la chaîne, réouverture de la dernière étape. | ✓ Déployé |
257
- | **Unified entry** | `roleos start` détermine automatiquement si l'exécution est une mission, un ensemble ou un routage libre. Mécanisme de repli avec scores de confiance, alternatives et détection des tâches complexes. | ✓ Déployé |
258
- | **Persistent runs** | `roleos run` crée des exécutions enregistrées sur le disque. Commandes : `resume` (reprendre), `next` (suivant), `explain` (expliquer), `complete` (terminer), `fail` (échec). Interventions : `reroute` (rediriger), `escalate` (escalader), `retry` (réessayer), `block` (bloquer), `reopen` (réouvrir). Instructions spécifiques à chaque étape. Mesure du niveau de friction. | ✓ Déployé |
259
- | **Brainstorm** | Architecture à deux niveaux : vérité (schémas natifs des rôles, éléments de base de provenance, graphe de désaccord) + rendu (5 voix distinctes, interdictions lexicales, transcription du débat). Les liens de traçabilité prouvent que chaque affirmation rendue correspond à un élément de base de la couche de vérité. Exécution optimale : 894 tests. | ✓ Déployé |
260
-
261
- ## 6 missions
262
-
263
- | Mission | Ensemble | Rôles | Quand utiliser |
264
- |---------|------|-------|-------------|
265
- | `feature-ship` | Fonctionnalité | 5 | Livraison complète d'une fonctionnalité : définition de la portée → spécifications → implémentation → test → revue |
266
- | `bugfix` | Correction de bug | 4 | Diagnostic de la cause profonde, correction, test, vérification |
267
- | `treatment` | Amélioration | 4 | Vérification + peaufinage + documentation + vérification CI + revue |
268
- | `docs-release` | Documentation | 2 | Rédaction/mise à jour de la documentation, notes de publication |
269
- | `security-hardening` | Sécurité | 4 | Analyse des menaces, audit, correction des vulnérabilités, nouvel audit, vérification |
270
- | `research-launch` | Recherche | 4 | Définition de la question, recherche, documentation des résultats, prise de décision |
271
- | `brainstorm` | brainstorming | 9 | Enquête structurée avec plusieurs perspectives, désaccord traçable et verdict. |
272
-
273
- Chaque mission inclut des définitions partielles et honnêtes : lorsque le travail est bloqué, le système documente ce qui a été réalisé et ce qui reste, au lieu de prétendre que le travail est terminé.
274
-
275
- ### Mission de brainstorming
276
-
277
- Ce n'est pas un "brainstorming par IA". La mission de brainstorming est **l'attribution de rôles spécialisés dans le domaine juridique, avec un désaccord traçable et une production de résultats justifiés.**
278
-
279
- ```bash
280
- roleos run "explore product directions for a developer tool discovery platform"
281
- # → MISSION: Brainstorm (Structured Inquiry)
282
- # Chain: 4 Analysts (parallel) → Normalize → Cross-Examine → Rebut → Synthesize → Expand → Judge
283
- ```
284
-
285
- **Ce qui le différencie :**
286
-
287
- - **Couche 1 (vérité) :** Quatre analystes produisent des schémas spécifiques à chaque rôle (ContextMap, UserValueMap, MechanicsMap, PositioningMap) – pas de prose partagée. Chaque rôle est soumis à des contraintes pour éviter les biais : phrases interdites, types d'affirmations interdits, partitions d'entrée filtrées. Les éléments de base contiennent des informations de provenance. Un graphe d'examen croisé dirigé génère des défis ciblés. Les analystes originaux défendent, affinent ou retirent leurs affirmations sous pression.
288
-
289
- - **Couche 2 (rendu) :** Cinq voix humaines distinctes (Boundary Memo, Field Notes, System Sketch, Claim Brief, Cross-Exam Transcript) avec des interdictions lexicales pour éviter la convergence des voix. La synthèse utilise la couche de vérité, et non la prose rendue. Les deux couches sont toujours disponibles.
290
-
291
- - **Chaîne de traçabilité :** Chaque phrase rendue est traçable jusqu'à un élément de base de la couche de vérité. Les instructions de synthèse citent les éléments de base. Les cibles de l'examen croisé sont des identifiants d'affirmations réels. Le graphe de désaccord est le résultat, et non la prose.
292
-
293
- **Prouvé :** Exécution optimale v0.4 – 894 tests, chaîne de traçabilité complète vérifiée. Consultez [`examples/golden-run.md`](examples/golden-run.md) pour la chaîne complète des artefacts.
294
-
295
- ## Statut
296
-
297
- - v0.1–v0.4 : Bases – essais, adoption (du produit), ensemble de traitement, ensemble de démarrage.
298
- - v1.0.0 : 32 rôles, CLI complète, traitement éprouvé, portabilité multi-dépôts.
299
- - v1.0.2 : Blocage du système d'exploitation par rôle (corrections de la "vérité" de l'initialisation, `init --force`).
300
- - v1.1.0 : 31 rôles, infrastructure de routage complète, détection de conflits, escalade, preuves, répartition, 7 ensembles d'équipe éprouvés. 35 essais d'exécution. 212 tests.
301
- - v1.2.0 : Ensembles calibrés promus au point d'entrée par défaut. Sélection automatique, détection de discordances, suggestion alternative, repli sur le routage libre. 246 tests.
302
- - v1.3.0 : Calibrage des résultats, décomposition de tâches complexes, exécution composite, replanification adaptative. 317 tests.
303
- - v1.4.0 : Infrastructure de session – `roleos init claude`, `roleos doctor`, cartes de routage, commandes `/roleos-route`, `/roleos-review` et `/roleos-status`. 335 tests.
304
- - v1.5.0 : Infrastructure de "hooks" – 5 "hooks" de cycle de vie pour l'application en temps réel. 358 tests.
305
- - v1.6.0 : Infrastructure des artefacts – 20 contrats d'artefacts par rôle, 7 contrats de transmission d'ensembles, validation structurelle. 385 tests.
306
- - v1.7.0 : Preuve de complétion – tâches réelles exécutées sur toute la pile. CLI `roleos artifacts`. Escalade honnête pour les corrections structurelles. 398 tests.
307
- - v1.8.0 : Bibliothèque de missions (Phase S) – 6 missions nommées, moteur d'exécution, rapports de complétion. Durcissement basé sur 6 exécutions réelles. 481 tests.
308
- - v1.9.0 : Chemin d'entrée unifié (Phase T) – `roleos start` décide automatiquement entre mission, ensemble et routage libre. Système de repli, détection composite, essais de comparaison du chemin d'entrée. 527 tests.
309
- - **v2.0.0** : Optimisation de l'expérience utilisateur (Phase U) – `roleos run` crée des exécutions persistantes avec sauvegarde sur disque. Reprise, suivant, explication, complétion, échec. Interventions : réacheminement, escalade, nouvelle tentative, blocage, réouverture. Assistance spécifique à chaque étape. Mesure du niveau de difficulté. 6 essais de difficulté. 613 tests.
310
- - **v2.0.1** : Audit du manuel, documentation pour débutants, corrections du nombre de tests. 617 tests.
311
- - **v2.1.0** : Mission de brainstorming (v0.4) – rôles spécialisés dans le domaine juridique, désaccord traçable, résultat avec verdict. Architecture à deux niveaux (vérité + rendu), matrice de permissions de contre-interrogatoire, graphe de litiges, preuve d'exécution optimale. 7 missions, 50 rôles, 8 ensembles. 894 tests.
312
-
313
- ## Licence
314
-
315
- MIT
316
-
317
- ---
318
-
319
- Créé par <a href="https://mcp-tool-shop.github.io/">MCP Tool Shop</a
1
+ <p align="center">
2
+ <a href="README.ja.md">日本語</a> | <a href="README.zh.md">中文</a> | <a href="README.es.md">Español</a> | <a href="README.md">English</a> | <a href="README.hi.md">हिन्दी</a> | <a href="README.it.md">Italiano</a> | <a href="README.pt-BR.md">Português (BR)</a>
3
+ </p>
4
+
5
+ <p align="center">
6
+ <img src="https://raw.githubusercontent.com/mcp-tool-shop-org/brand/main/logos/role-os/readme.png" alt="Role OS" width="600">
7
+ </p>
8
+
9
+ <p align="center">
10
+ <a href="https://github.com/mcp-tool-shop-org/role-os/actions"><img src="https://github.com/mcp-tool-shop-org/role-os/actions/workflows/ci.yml/badge.svg" alt="CI"></a>
11
+ <a href="https://www.npmjs.com/package/role-os"><img src="https://img.shields.io/npm/v/role-os" alt="npm"></a>
12
+ <a href="LICENSE"><img src="https://img.shields.io/badge/license-MIT-blue" alt="MIT License"></a>
13
+ <a href="https://mcp-tool-shop-org.github.io/role-os/"><img src="https://img.shields.io/badge/Landing_Page-live-brightgreen" alt="Landing Page"></a>
14
+ </p>
15
+
16
+ Un système d'exploitation multi-Claude qui affecte du personnel, gère les flux de travail, valide et exécute les tâches à travers 31 contrats de rôles spécialisés. Il crée des ensembles de tâches, assemble l'équipe appropriée en fonction de la compatibilité des rôles, détecte les problèmes potentiels avant l'exécution, redirige automatiquement la reprise en cas de blocage ou de rejet des tâches, et exige des preuves structurées pour chaque décision.
17
+
18
+ ## Ce que cela fait
19
+
20
+ Role OS est la manière professionnelle d'utiliser multi-Claude. Il évite les échecs spécifiques que produisent les flux de travail d'IA génériques :
21
+
22
+ - **Dérive** : les rôles restent dans leur domaine. Le produit ne subit pas de refonte. L'interface utilisateur ne redéfinit pas la portée. Le backend n'invente pas la direction du produit.
23
+ - **Fausse complétion** : la définition de "terminé" est concrète. Le travail qui masque des lacunes, saute des vérifications ou résout un problème différent est rejeté.
24
+ - **Contamination** : les projets divisés ou hérités conservent des résidus d'identité. Role OS détecte et rejette les dérives inter-projets en termes de terminologie, de visuels et de modèles mentaux.
25
+ - **Progrès basé sur des impressions** : chaque transmission est structurée. Chaque verdict est étayé par des preuves. "Cela semble terminé" n'est pas un état valide.
26
+
27
+ ## Comment cela fonctionne
28
+
29
+ Décrivez votre tâche. Role OS détermine automatiquement le niveau d'orchestration approprié.
30
+
31
+ ```bash
32
+ roleos start "fix the crash in save handler"
33
+ # → MISSION: Bugfix & Diagnosis (70% confidence)
34
+ # Chain: Repo Researcher → Backend Engineer → Test Engineer → Critic Reviewer
35
+
36
+ roleos start "add a new export command"
37
+ # → PACK: Feature Build (50% confidence)
38
+ # Roles: Orchestrator, Product Strategist, Spec Writer, Backend Engineer, Test Engineer, Critic Reviewer
39
+
40
+ roleos start "something completely novel"
41
+ # → FREE-ROUTING (10% confidence)
42
+ # Hint: Create a packet and run `roleos route` for role-level routing
43
+ ```
44
+
45
+ **L'échelle de secours :**
46
+
47
+ 1. **Mission** — lorsque la tâche correspond à un flux de travail récurrent éprouvé (correction de bugs, traitement, déploiement de fonctionnalités, documentation, sécurité, recherche). Chaîne de rôles connue, flux d'artefacts, branches d'escalade et définitions partielles claires.
48
+ 2. **Pack** — lorsque la tâche appartient à une famille connue, mais ne correspond pas à une mission complète. 7 ensembles d'équipe calibrés avec sélection automatique et mécanismes de prévention des incompatibilités.
49
+ 3. **Routage libre** — lorsque la tâche est nouvelle, complexe ou incertaine. Évalue les 31 rôles en fonction du contenu de la tâche et assemble une chaîne dynamique.
50
+
51
+ Le système ne force jamais une tâche à travers le mauvais niveau d'abstraction. Il explique pourquoi il a choisi chaque niveau et propose des alternatives.
52
+
53
+ **Une seule commande pour activer l'exécution :**
54
+
55
+ ```bash
56
+ roleos run "fix the crash in save handler"
57
+ # → Created run: run-1234
58
+ # → Entry: MISSION (bugfix)
59
+ # → Started step 0: Repo Researcher → diagnosis-report
60
+ # → Guidance: Required sections: entrypoints, module-map, build-test-commands
61
+
62
+ roleos next # Start the next step
63
+ roleos complete diagnosis.md # Complete the active step with artifact
64
+ roleos explain # Show full run state and guidance
65
+ roleos resume # Continue an interrupted run
66
+ roleos report # Generate completion report
67
+ roleos friction # Measure operator touches
68
+ ```
69
+
70
+ **Interventions en cas de problème :**
71
+
72
+ ```bash
73
+ roleos retry 0 # Retry a failed step
74
+ roleos reroute 1 "Frontend Developer" "UI bug" # Swap a role
75
+ roleos escalate "Test Engineer" "Repo Researcher" "missed edge case" "re-diagnose"
76
+ roleos block 2 "waiting for API spec"
77
+ roleos reopen 0 "found issue in review"
78
+ ```
79
+
80
+ Les exécutions sont enregistrées sur le disque (dans le dossier `.claude/runs/`), ce qui permet de reprendre les sessions interrompues sans problème. Chaque étape comprend des instructions pour l'utilisateur : ce qu'il faut produire, les sections requises et les conditions d'arrêt.
81
+
82
+ **Une fois routée :**
83
+
84
+ 1. **Chaque rôle produit une transmission** — sortie structurée avec des éléments de preuve qui réduisent l'ambiguïté pour le rôle suivant.
85
+ 2. **Le critique effectue une revue par rapport au contrat** — accepte, rejette ou bloque en fonction de preuves structurées, et non d'impressions.
86
+ 3. **La reprise est gérée automatiquement** — les tâches bloquées ou rejetées sont redirigées vers le responsable approprié, avec une raison, un type de reprise et les artefacts requis.
87
+
88
+ ## État de déploiement au sein de l'organisation
89
+
90
+ L'état de déploiement au niveau de l'organisation (file d'attente, décisions, enregistrements d'audit, ensembles de verrouillage par dépôt) se trouve dans un dépôt privé distinct : [`role-os-rollout`](https://github.com/mcp-tool-shop-org/role-os-rollout). Ce dépôt est le produit ; ce dernier est l'état opérationnel.
91
+
92
+ ## Mémoire et continuité
93
+
94
+ Role OS ne possède ni ne duplique la couche de mémoire. Lorsqu'une mémoire de projet Claude existe, elle constitue le système de continuité canonique : les faits du référentiel, les décisions, les boucles ouvertes et l'historique des traitements y sont stockés.
95
+
96
+ Role OS s'intègre à la mémoire du projet Claude. Il ne la remplace pas.
97
+
98
+ ## Traitement complet et vérification de la livraison
99
+
100
+ Le traitement complet est un protocole canonique en 7 phases défini dans la mémoire du projet Claude (`memory/full-treatment.md`). Role OS dirige et examine les traitements à l'aide de contrats de rôle, de transmissions et de passerelles de critique ; il ne redéfinit pas le protocole.
101
+
102
+ La **vérification de la livraison** est la porte de qualité de 31 éléments qui s'exécute avant le traitement complet. Les portes obligatoires A à D doivent être validées avant que tout traitement ne commence. Référence canonique : `memory/shipcheck.md`.
103
+
104
+ Ordre : Vérification de la livraison, puis traitement complet. Aucune version 1.0.0 sans validation des portes obligatoires.
105
+
106
+ ## 31 rôles répartis dans 8 ensembles
107
+
108
+ | Ensemble | Rôles |
109
+ |------|-------|
110
+ | **Core** (3) | Orchestrateur, Stratège Produit, Critique |
111
+ | **Engineering** (7) | Développeur Frontend, Ingénieur Backend, Ingénieur Tests, Ingénieur Refactoring, Ingénieur Performance, Auditeur de Dépendances, Expert en Sécurité |
112
+ | **Design** (2) | Concepteur UI, Gardien de la Marque |
113
+ | **Marketing** (1) | Rédacteur de Contenu de Lancement |
114
+ | **Treatment** (7) | Chercheur de Dépôts, Traducteur de Dépôts, Architecte de Documentation, Conservateur de Métadonnées, Auditeur de Couverture, Vérificateur de Déploiement, Ingénieur de Release |
115
+ | **Product** (3) | Synthétiseur de Commentaires, Priorisateur de Feuille de Route, Rédacteur de Spécifications |
116
+ | **Research** (4) | Chercheur UX, Analyste Concurrentiel, Chercheur de Tendances, Synthétiseur d'Entretiens Utilisateurs |
117
+ | **Growth** (4) | Stratège de Lancement, Stratège de Contenu, Community Manager, Responsable de Tri des Demandes d'Assistance |
118
+
119
+ Chaque rôle a un contrat complet : mission, conditions d'utilisation, conditions de non-utilisation, entrées attendues, sorties requises, niveau de qualité et déclencheurs d'escalade. Chaque rôle peut être routé — `roleos route` peut recommander n'importe lequel d'entre eux en fonction du contenu de la tâche.
120
+
121
+ ## Démarrage rapide
122
+
123
+ ```bash
124
+ npx role-os init
125
+
126
+ # Describe what you need — Role OS picks the right level:
127
+ roleos run "fix the crash in save handler"
128
+ # → Creates run, picks bugfix mission, starts first step with guidance
129
+
130
+ # Step through:
131
+ roleos next # Start next step
132
+ roleos complete artifact.md # Complete with artifact
133
+ roleos explain # Show full state
134
+ roleos report # Completion report
135
+
136
+ # Or go manual:
137
+ roleos start "fix the crash" # Entry decision only (no run)
138
+ roleos packet new feature
139
+ roleos route .claude/packets/my-feature.md
140
+ roleos review .claude/packets/my-feature.md accept
141
+
142
+ # Explore missions and packs:
143
+ roleos mission list
144
+ roleos packs list
145
+ ```
146
+
147
+ ## Quand ne pas utiliser Role OS
148
+
149
+ - Corrections de ligne unique, fautes de frappe ou bugs évidents
150
+ - Recherche exploratoire sans résultat défini
151
+ - Tâches qui peuvent être comprises par une seule personne en 5 minutes
152
+ - Corrections urgentes qui doivent être déployées avant qu'une chaîne de revue ne soit terminée
153
+ - Projets où la rapidité est privilégiée par rapport à la structure
154
+
155
+ ## Preuves
156
+
157
+ Role OS a été testé sur trois types de tâches différents dans deux référentiels structurellement différents :
158
+
159
+ **Test 001 — Travail de fonctionnalité** (Écran de l'équipe, Star Freight)
160
+ - Chaîne de 7 rôles, 45 scénarios de test, 0 conflit de rôle.
161
+ - A empêché la contamination provenant de l'ancêtre de la branche, a détecté les inventions improvisées, et a mis en évidence les blocages réels.
162
+
163
+ **Test 002 — Travail d'intégration** (Câblage de l'état de la campagne, Star Freight)
164
+ - Chaîne de 5 rôles, a résolu la limite architecturale sans mensonges.
165
+ - Les tests anti-fallback ont prouvé que le chemin actif est réel, et non un simple espace réservé.
166
+
167
+ **Test 003 — Travail d'identité** (Suppression de la contamination, Star Freight)
168
+ - Chaîne de 6 rôles, 51 scénarios de test, y compris une défense durable contre la contamination de l'intégration continue.
169
+ - A corrigé la dérive de la fiction héritée sans se transformer en une refonte complète.
170
+
171
+ **Phase d'essai de portabilité** (Cohérence des personas, humour lié aux capteurs)
172
+ - Même structure de base, mais langage/domaine/pile différents.
173
+ - adoption (du produit) avec modification du contexte uniquement – aucune modification du contrat principal.
174
+
175
+ **Traitement complet FT-001** (portlight-desktop)
176
+ - Traitement en 7 phases avec rôles du "Traitement Pack"
177
+ - Vérification de déploiement prouvée, absence de conflits de rôles
178
+
179
+ **Traitement complet FT-002** (studioflow)
180
+ - Même ensemble de traitement, dépôt structurellement différent (espace de travail créatif vs jeu)
181
+ - Ensemble de traitement portable — aucune modification de contrat n'est nécessaire
182
+
183
+ **Brainstorming pour une exécution optimale** (sujet du marché de serveurs MCP)
184
+ - Chaîne de 9 rôles, 4 analystes en parallèle, examen croisé + réfutation, graphe de désaccord.
185
+ - 4 défis lancés, 3 affirmations affinées, 1 non résolue – pression saine, pas de blocage.
186
+ - Plus de 16 liens de traçabilité des artefacts générés vers les éléments de base de la couche de vérité.
187
+ - Chaîne de traçabilité complète prouvée : vérité → éléments de base → désaccord → synthèse → expansion → jugement → rendu → traçabilité.
188
+
189
+ ## Propriétés essentielles
190
+
191
+ Ce sont des éléments non négociables. Si une modification affaiblit l'un de ces éléments, elle doit être rejetée.
192
+
193
+ - Les limites des rôles sont respectées.
194
+ - Les revues sont rigoureuses.
195
+ - Les escalades restent transparentes.
196
+ - Les tests restent réalisables.
197
+ - La portabilité nécessite une adaptation du contexte, et non une modification profonde.
198
+
199
+ ## Structure du projet
200
+
201
+ ```
202
+ role-os/
203
+ bin/roleos.mjs ← CLI entrypoint
204
+ src/
205
+ entry.mjs ← Unified entry: mission → pack → free routing
206
+ entry-cmd.mjs ← `roleos start` CLI command
207
+ run.mjs ← Persistent run engine: create → step → pause → resume → report
208
+ run-cmd.mjs ← `roleos run/resume/next/explain/complete/fail` + interventions
209
+ mission.mjs ← 7 named mission types (feature, bugfix, treatment, docs, security, research, brainstorm)
210
+ mission-run.mjs ← Mission runner: create → step → complete → report
211
+ mission-cmd.mjs ← `roleos mission` CLI commands
212
+ route.mjs ← 31-role routing + dynamic chain builder
213
+ packs.mjs ← 7 calibrated team packs + auto-selection
214
+ conflicts.mjs ← 4-pass conflict detection
215
+ escalation.mjs ← Auto-routing for blocked/rejected/split
216
+ evidence.mjs ← Structured evidence + role-aware requirements
217
+ dispatch.mjs ← Runtime dispatch manifests for multi-claude
218
+ artifacts.mjs ← 30 per-role artifact contracts + 7 pack handoffs
219
+ decompose.mjs ← Composite task detection + splitting
220
+ composite.mjs ← Dependency-ordered execution + recovery
221
+ replan.mjs ← Mid-run adaptive replanning
222
+ calibration.mjs ← Outcome recording + weight tuning
223
+ hooks.mjs ← 5 lifecycle hooks for runtime enforcement
224
+ session.mjs ← Session scaffolding + doctor
225
+ brainstorm.mjs ← Evidence modes, request validation, finding/synthesis/judge schemas
226
+ brainstorm-roles.mjs ← Role-native schemas, input partitioning, blindspot enforcement, cross-exam
227
+ brainstorm-render.mjs ← Two-layer rendering: lexical bans, render schemas, debate transcript
228
+ test/ ← 894 tests across 30 test files
229
+ starter-pack/ ← Drop-in role contracts, policies, schemas, workflows
230
+ ```
231
+
232
+ ## Sécurité
233
+
234
+ Le rôle OS fonctionne **uniquement localement**. Il copie les modèles Markdown et écrit les fichiers de paquets/de verdicts dans le répertoire `.claude/` de votre dépôt. Il n'accède pas au réseau, ne gère pas les secrets et ne collecte pas de données télémétriques. Aucune opération dangereuse n'est effectuée : toutes les écritures de fichiers utilisent par défaut la fonction "skip-if-exists". Consultez le fichier [SECURITY.md](SECURITY.md) pour connaître la politique complète.
235
+
236
+ ## Le système d'exploitation
237
+
238
+ | Couche | Ce que cela fait | Statut |
239
+ |-------|-------------|--------|
240
+ | **Routing** | Évalue les 31 rôles en fonction du contenu de la tâche, explique les recommandations, évalue la confiance | ✓ Déployé |
241
+ | **Chain builder** | Assemble des chaînes ordonnées en fonction des rôles, avec une préférence pour certains types de paquets, sans être verrouillée à un modèle spécifique. | ✓ Déployé |
242
+ | **Conflict detection** | Validation en 4 étapes : conflits majeurs, séquences, redondances, lacunes de couverture. Suggestions de correction. | ✓ Déployé |
243
+ | **Escalation** | Redirection automatique des tâches bloquées, rejetées ou divisées vers le module de résolution approprié, avec indication de la raison et des artefacts requis. | ✓ Déployé |
244
+ | **Evidence** | Preuves structurées et adaptées aux rôles dans les verdicts. Vérifications de suffisance. 12 types de preuves. | ✓ Déployé |
245
+ | **Dispatch** | Génération de manifestes d'exécution pour les environnements multi-Claude. Profils d'outils par rôle, instructions système, budgets. | ✓ Déployé |
246
+ | **Trials** | Ensemble complet validé : 30 tâches réussies sur 30 + 5 essais négatifs réussis sur 5. 7 ensembles de tests terminés. | ✓ Terminé |
247
+ | **Team Packs** | 7 ensembles calibrés avec sélection automatique, protections contre les erreurs et mécanisme de repli en cas de problème. | ✓ Déployé |
248
+ | **Outcome calibration** | Enregistrement des résultats des exécutions, ajustement des poids des ensembles/rôles en fonction des résultats, modification des seuils de confiance. | ✓ Déployé |
249
+ | **Mixed-task decomposition** | Détection des tâches complexes, division en paquets secondaires, attribution des ensembles, préservation des dépendances. | ✓ Déployé |
250
+ | **Composite execution** | Exécution des paquets secondaires dans l'ordre des dépendances, avec transmission des artefacts, reprise en cas de branchement et synthèse. | ✓ Déployé |
251
+ | **Adaptive replanning** | Les modifications de la portée, les résultats ou les nouvelles exigences pendant l'exécution mettent à jour le plan sans redémarrage. | ✓ Déployé |
252
+ | **Session spine** | `roleos init claude` crée les fichiers CLAUDE.md, /roleos-route, /roleos-review, /roleos-status. `roleos doctor` vérifie la configuration. Les cartes de routage prouvent l'engagement. | ✓ Déployé |
253
+ | **Hook spine** | 5 points d'accroche du cycle de vie (SessionStart, PromptSubmit, PreToolUse, SubagentStart, Stop). Application des règles : rappels sur les cartes de routage, contrôle de l'utilisation des outils, injection de rôle des sous-agents, audit de la finalisation. | ✓ Déployé |
254
+ | **Artifact spine** | 20 contrats d'artefacts par rôle. 7 contrats de transmission d'ensembles. Validation structurelle. Vérifications de l'intégrité des chaînes. Les rôles suivants ne peuvent jamais deviner ce qu'ils ont reçu. | ✓ Déployé |
255
+ | **Mission library** | 6 missions nommées (développement de fonctionnalité, correction de bug, amélioration, publication de documentation, renforcement de la sécurité, lancement de recherche). Chaque mission définit l'ensemble, la chaîne de rôles, le flux d'artefacts, les branches de relance et une définition partielle et honnête. Les 6 missions ont été testées et optimisées. | ✓ Déployé |
256
+ | **Mission runner** | Création d'exécutions, suivi de l'état, finalisation ou échec avec un rapport précis. Propagation des étapes bloquées, avertissements de relance en dehors de la chaîne, réouverture de la dernière étape. | ✓ Déployé |
257
+ | **Unified entry** | `roleos start` détermine automatiquement si l'exécution est une mission, un ensemble ou un routage libre. Mécanisme de repli avec scores de confiance, alternatives et détection des tâches complexes. | ✓ Déployé |
258
+ | **Persistent runs** | `roleos run` crée des exécutions enregistrées sur le disque. Commandes : `resume` (reprendre), `next` (suivant), `explain` (expliquer), `complete` (terminer), `fail` (échec). Interventions : `reroute` (rediriger), `escalate` (escalader), `retry` (réessayer), `block` (bloquer), `reopen` (réouvrir). Instructions spécifiques à chaque étape. Mesure du niveau de friction. | ✓ Déployé |
259
+ | **Brainstorm** | Architecture à deux niveaux : vérité (schémas natifs des rôles, éléments de base de provenance, graphe de désaccord) + rendu (5 voix distinctes, interdictions lexicales, transcription du débat). Les liens de traçabilité prouvent que chaque affirmation rendue correspond à un élément de base de la couche de vérité. Exécution optimale : 894 tests. | ✓ Déployé |
260
+
261
+ ## 6 missions
262
+
263
+ | Mission | Ensemble | Rôles | Quand utiliser |
264
+ |---------|------|-------|-------------|
265
+ | `feature-ship` | Fonctionnalité | 5 | Livraison complète d'une fonctionnalité : définition de la portée → spécifications → implémentation → test → revue |
266
+ | `bugfix` | Correction de bug | 4 | Diagnostic de la cause profonde, correction, test, vérification |
267
+ | `treatment` | Amélioration | 4 | Vérification + peaufinage + documentation + vérification CI + revue |
268
+ | `docs-release` | Documentation | 2 | Rédaction/mise à jour de la documentation, notes de publication |
269
+ | `security-hardening` | Sécurité | 4 | Analyse des menaces, audit, correction des vulnérabilités, nouvel audit, vérification |
270
+ | `research-launch` | Recherche | 4 | Définition de la question, recherche, documentation des résultats, prise de décision |
271
+ | `brainstorm` | brainstorming | 9 | Enquête structurée avec plusieurs perspectives, désaccord traçable et verdict. |
272
+
273
+ Chaque mission inclut des définitions partielles et honnêtes : lorsque le travail est bloqué, le système documente ce qui a été réalisé et ce qui reste, au lieu de prétendre que le travail est terminé.
274
+
275
+ ### Mission de brainstorming
276
+
277
+ Ce n'est pas un "brainstorming par IA". La mission de brainstorming est **l'attribution de rôles spécialisés dans le domaine juridique, avec un désaccord traçable et une production de résultats justifiés.**
278
+
279
+ ```bash
280
+ roleos run "explore product directions for a developer tool discovery platform"
281
+ # → MISSION: Brainstorm (Structured Inquiry)
282
+ # Chain: 4 Analysts (parallel) → Normalize → Cross-Examine → Rebut → Synthesize → Expand → Judge
283
+ ```
284
+
285
+ **Ce qui le différencie :**
286
+
287
+ - **Couche 1 (vérité) :** Quatre analystes produisent des schémas spécifiques à chaque rôle (ContextMap, UserValueMap, MechanicsMap, PositioningMap) – pas de prose partagée. Chaque rôle est soumis à des contraintes pour éviter les biais : phrases interdites, types d'affirmations interdits, partitions d'entrée filtrées. Les éléments de base contiennent des informations de provenance. Un graphe d'examen croisé dirigé génère des défis ciblés. Les analystes originaux défendent, affinent ou retirent leurs affirmations sous pression.
288
+
289
+ - **Couche 2 (rendu) :** Cinq voix humaines distinctes (Boundary Memo, Field Notes, System Sketch, Claim Brief, Cross-Exam Transcript) avec des interdictions lexicales pour éviter la convergence des voix. La synthèse utilise la couche de vérité, et non la prose rendue. Les deux couches sont toujours disponibles.
290
+
291
+ - **Chaîne de traçabilité :** Chaque phrase rendue est traçable jusqu'à un élément de base de la couche de vérité. Les instructions de synthèse citent les éléments de base. Les cibles de l'examen croisé sont des identifiants d'affirmations réels. Le graphe de désaccord est le résultat, et non la prose.
292
+
293
+ **Prouvé :** Exécution optimale v0.4 – 894 tests, chaîne de traçabilité complète vérifiée. Consultez [`examples/golden-run.md`](examples/golden-run.md) pour la chaîne complète des artefacts.
294
+
295
+ ## Statut
296
+
297
+ - v0.1–v0.4 : Bases – essais, adoption (du produit), ensemble de traitement, ensemble de démarrage.
298
+ - v1.0.0 : 32 rôles, CLI complète, traitement éprouvé, portabilité multi-dépôts.
299
+ - v1.0.2 : Blocage du système d'exploitation par rôle (corrections de la "vérité" de l'initialisation, `init --force`).
300
+ - v1.1.0 : 31 rôles, infrastructure de routage complète, détection de conflits, escalade, preuves, répartition, 7 ensembles d'équipe éprouvés. 35 essais d'exécution. 212 tests.
301
+ - v1.2.0 : Ensembles calibrés promus au point d'entrée par défaut. Sélection automatique, détection de discordances, suggestion alternative, repli sur le routage libre. 246 tests.
302
+ - v1.3.0 : Calibrage des résultats, décomposition de tâches complexes, exécution composite, replanification adaptative. 317 tests.
303
+ - v1.4.0 : Infrastructure de session – `roleos init claude`, `roleos doctor`, cartes de routage, commandes `/roleos-route`, `/roleos-review` et `/roleos-status`. 335 tests.
304
+ - v1.5.0 : Infrastructure de "hooks" – 5 "hooks" de cycle de vie pour l'application en temps réel. 358 tests.
305
+ - v1.6.0 : Infrastructure des artefacts – 20 contrats d'artefacts par rôle, 7 contrats de transmission d'ensembles, validation structurelle. 385 tests.
306
+ - v1.7.0 : Preuve de complétion – tâches réelles exécutées sur toute la pile. CLI `roleos artifacts`. Escalade honnête pour les corrections structurelles. 398 tests.
307
+ - v1.8.0 : Bibliothèque de missions (Phase S) – 6 missions nommées, moteur d'exécution, rapports de complétion. Durcissement basé sur 6 exécutions réelles. 481 tests.
308
+ - v1.9.0 : Chemin d'entrée unifié (Phase T) – `roleos start` décide automatiquement entre mission, ensemble et routage libre. Système de repli, détection composite, essais de comparaison du chemin d'entrée. 527 tests.
309
+ - **v2.0.0** : Optimisation de l'expérience utilisateur (Phase U) – `roleos run` crée des exécutions persistantes avec sauvegarde sur disque. Reprise, suivant, explication, complétion, échec. Interventions : réacheminement, escalade, nouvelle tentative, blocage, réouverture. Assistance spécifique à chaque étape. Mesure du niveau de difficulté. 6 essais de difficulté. 613 tests.
310
+ - **v2.0.1** : Audit du manuel, documentation pour débutants, corrections du nombre de tests. 617 tests.
311
+ - **v2.1.0** : Mission de brainstorming (v0.4) – rôles spécialisés dans le domaine juridique, désaccord traçable, résultat avec verdict. Architecture à deux niveaux (vérité + rendu), matrice de permissions de contre-interrogatoire, graphe de litiges, preuve d'exécution optimale. 7 missions, 50 rôles, 8 ensembles. 894 tests.
312
+
313
+ ## Licence
314
+
315
+ MIT
316
+
317
+ ---
318
+
319
+ Créé par <a href="https://mcp-tool-shop.github.io/">MCP Tool Shop</a