role-os 2.7.0 → 2.8.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
package/CHANGELOG.md CHANGED
@@ -1,5 +1,38 @@
1
1
  # Changelog
2
2
 
3
+ ## 2.8.0
4
+
5
+ ### Added
6
+ - **Capability gate — deterministic least-privilege on irreversible tool calls.**
7
+ `src/specialist/capability-gate.mjs`: a gated set of irreversible / world-touching actions
8
+ (npm/PyPI publish, `gh release` / `pr` / `repo edit`, `git push`, Pages deploy), a director-authored
9
+ `.claude/role-os/capabilities.json` grant manifest, and `capabilityGate()`. Opt-in
10
+ (`ROLEOS_CAPABILITY_GATE`, default OFF → pure no-op), **fail-closed** for the gated set, deterministic
11
+ (no model). Wired into `onPreToolUse` (deny path) + the generated PreToolUse hook (exit 2), alongside
12
+ the advisory / fail-open conformance floor. Bounds what a wrong verdict — an honest mistake or an
13
+ injected one — can DO; the preventive complement to the named-compensator rule (POLA / CaMeL).
14
+
15
+ ### Changed
16
+ - **Wedge #1 conformance — live tool-contracts catalog rollout.** The deterministic schema + computable-
17
+ contract floor runs at the live `onPreToolUse` seam against `.claude/role-os/tool-contracts.json`
18
+ (advisory, fail-open), and generated hook scripts emit the current Claude Code wire protocol
19
+ (`hookSpecificOutput.additionalContext` + exit 0).
20
+
21
+ (Full suite 1400 tests green.)
22
+
23
+ ## 2.7.1
24
+
25
+ ### Docs
26
+ - **README + handbook for the production budget consult.** The README gains a "Budget-aware dispatch"
27
+ note (opt-in `ROLEOS_BUDGET_CONSULT`, advisory, fail-open to a deterministic baseline) and a new
28
+ handbook page documents the consult — `consultBudgetForManifest` / `buildDispatchManifestWithBudget`,
29
+ the per-step forecast + receipt, and the `roleos specialist rollback` compensator — wired to the
30
+ landing page. Re-translated across all 8 locales.
31
+ - **README front-door cleanup** — the per-version history block moved to this CHANGELOG; the README
32
+ keeps the value proposition.
33
+
34
+ (Docs only — no code changes from 2.7.0.)
35
+
3
36
  ## 2.7.0
4
37
 
5
38
  ### Added
package/README.es.md CHANGED
@@ -13,20 +13,20 @@
13
13
  <a href="https://mcp-tool-shop-org.github.io/role-os/"><img src="https://img.shields.io/badge/Landing_Page-live-brightgreen" alt="Landing Page"></a>
14
14
  </p>
15
15
 
16
- Un sistema operativo multi-Claude que asigna personal, dirige, valida y ejecuta tareas a través de 50 contratos de roles especializados. Crea paquetes de tareas, ensambla el equipo adecuado mediante la coincidencia de roles, detecta problemas antes de la ejecución, redirige automáticamente la recuperación cuando una tarea se bloquea o se rechaza, y requiere evidencia estructurada en cada decisión.
16
+ Un sistema operativo multi-Claude que asigna personal, dirige, valida y ejecuta tareas a través de 61 contratos de roles especializados. Crea paquetes de tareas, ensambla el equipo adecuado a partir de una evaluación de roles, detecta fallos en la cadena antes de la ejecución, redirige automáticamente la recuperación cuando una tarea se bloquea o se rechaza, y requiere pruebas estructuradas en cada evaluación. Incluye una distribución dinámica para misiones de gran escala: un repositorio de 10 componentes se convierte automáticamente en 28 pasos de auditoría, en lugar de 6.
17
17
 
18
- ## ¿Qué hace?
18
+ ## Qué hace
19
19
 
20
- Role OS es la forma profesional de utilizar multi-Claude. Evita los fallos específicos que producen los flujos de trabajo de IA genéricos:
20
+ Role OS es la forma profesional de utilizar multi-Claude. Evita los fallos específicos que producen los flujos de trabajo genéricos de IA:
21
21
 
22
- - **Desviación (Drift)**: Los roles se mantienen dentro de su ámbito. El producto no se rediseña. La interfaz de usuario no redefine el alcance. El backend no inventa la dirección del producto.
23
- - **Finalización falsa**: La definición de "hecho" es concreta. El trabajo que oculta deficiencias, omite la verificación o resuelve un problema diferente es rechazado.
24
- - **Contaminación**: Los proyectos bifurcados o heredados conservan residuos de identidad. Role OS detecta y rechaza las desviaciones entre proyectos en terminología, elementos visuales y modelos mentales.
25
- - **Progreso basado en impresiones**: Cada transferencia es estructurada. Cada decisión se basa en evidencia. "Parece que está terminado" no es un estado válido.
22
+ - **Desviación:** los roles se mantienen dentro de su ámbito. El producto no se rediseña. El frontend no redefine el alcance. El backend no inventa la dirección del producto.
23
+ - **Finalización falsa:** la definición de "completado" es concreta. El trabajo que oculta lagunas, omite la verificación o resuelve un problema diferente se rechaza.
24
+ - **Contaminación:** los proyectos derivados o heredados conservan residuos de identidad. Role OS detecta y rechaza la desviación entre proyectos en la terminología, los elementos visuales y los modelos mentales.
25
+ - **Progreso basado en "sensaciones":** cada transferencia es estructurada. Cada evaluación se vincula a pruebas. "Parece terminado" no es un estado válido.
26
26
 
27
- ## ¿Cómo funciona?
27
+ ## Cómo funciona
28
28
 
29
- Describa su tarea. Role OS decide automáticamente el nivel de orquestación adecuado.
29
+ Describe tu tarea. Role OS decide automáticamente el nivel de orquestación adecuado.
30
30
 
31
31
  ```bash
32
32
  roleos start "fix the crash in save handler"
@@ -44,13 +44,13 @@ roleos start "something completely novel"
44
44
 
45
45
  **La jerarquía de respaldo:**
46
46
 
47
- 1. **Misión:** cuando la tarea coincide con un flujo de trabajo recurrente probado (corrección de errores, tratamiento, lanzamiento de funciones, documentación, seguridad, investigación). Cadena de roles conocida, flujo de artefactos, ramas de escalamiento y definiciones parciales.
48
- 2. **Paquete:** cuando la tarea es una familia conocida pero no una misión completa. 7 paquetes de equipo calibrados con selección automática y protecciones contra errores.
49
- 3. **Enrutamiento libre:** cuando la tarea es novedosa, mixta o incierta. Asigna una puntuación a los 31 roles en función del contenido del paquete y ensambla una cadena dinámica.
47
+ 1. **Misión:** cuando la tarea coincide con un flujo de trabajo recurrente probado (corrección de errores, tratamiento, lanzamiento de funciones, documentación, seguridad, investigación, lluvia de ideas, auditoría exhaustiva, prueba con usuarios). Cadena de roles conocida, flujo de artefactos, ramas de escalamiento y definiciones honestas y parciales.
48
+ 2. **Paquete:** cuando la tarea pertenece a una familia conocida, pero no tiene la estructura completa de una misión. 10 paquetes de equipo calibrados con selección automática y mecanismos de protección contra errores.
49
+ 3. **Enrutamiento libre:** cuando la tarea es novedosa, mixta o incierta. Evalúa los 61 roles en función del contenido del paquete y ensambla una cadena dinámica.
50
50
 
51
- El sistema nunca fuerza una tarea a través de una abstracción incorrecta. Explica por qué eligió cada nivel y ofrece alternativas.
51
+ El sistema nunca fuerza la ejecución de una tarea a través de una abstracción incorrecta. Explica por qué eligió cada nivel y ofrece alternativas.
52
52
 
53
- **Un comando para iniciar la ejecución:**
53
+ **Un solo comando para iniciar la ejecución:**
54
54
 
55
55
  ```bash
56
56
  roleos run "fix the crash in save handler"
@@ -77,48 +77,61 @@ roleos block 2 "waiting for API spec"
77
77
  roleos reopen 0 "found issue in review"
78
78
  ```
79
79
 
80
- Las ejecuciones se guardan en disco (`.claude/runs/`), por lo que las sesiones interrumpidas se reanudan correctamente. Cada paso incluye orientación para el operador: qué producir, secciones requeridas y condiciones de parada.
80
+ Las ejecuciones se guardan en el disco (`.claude/runs/`), por lo que las sesiones interrumpidas se reanudan sin problemas. Cada paso incluye una guía para el operador: qué producir, las secciones requeridas y las condiciones de finalización.
81
81
 
82
82
  **Una vez enrutada:**
83
83
 
84
- 1. **Cada rol produce una transferencia:** salida estructurada con elementos de evidencia que reducen la ambigüedad para el siguiente rol.
85
- 2. **El revisor evalúa según el contrato:** acepta, rechaza o bloquea en función de la evidencia estructurada, no de la impresión.
86
- 3. **La recuperación se redirige automáticamente:** las tareas bloqueadas o rechazadas se redirigen al solucionador adecuado, junto con la razón, el tipo de recuperación y el artefacto requerido.
84
+ 1. **Cada rol produce una transferencia:** salida estructurada con elementos de prueba que reducen la ambigüedad para el siguiente rol.
85
+ 2. **El crítico revisa según el contrato:** acepta, rechaza o bloquea basándose en pruebas estructuradas, no en impresiones.
86
+ 3. **El enrutamiento de recuperación se realiza automáticamente:** el trabajo bloqueado o rechazado se redirige al solucionador adecuado con una razón, el tipo de recuperación y el artefacto requerido.
87
87
 
88
- ## Estado de implementación en la organización
88
+ ## Distribución consciente del presupuesto
89
89
 
90
- El estado de implementación en toda la organización (cola, decisiones, registros de auditoría, paquetes de bloqueo por repositorio) se encuentra en un repositorio privado separado: [`role-os-rollout`](https://github.com/mcp-tool-shop-org/role-os-rollout). Este repositorio es el producto; ese repositorio es el estado operativo.
90
+ Role OS puede consultar a un **analista de presupuesto de tokens** local en cada paso de la distribución y adjuntar una previsión de gasto orientativa al manifiesto: opcional (`ROLEOS_BUDGET_CONSULT`), orientativa (nunca bloquea una distribución) y con un mecanismo de seguridad que vuelve a una línea de base determinista. Desactivado por defecto; la previsión es local y gratuita. Consulte el [manual](https://mcp-tool-shop-org.github.io/role-os/handbook/specialist-budget/).
91
+
92
+ ## Supervisión de las llamadas a herramientas
93
+
94
+ El sistema operativo (OS) del rol verifica y controla las llamadas a herramientas en el punto `PreToolUse` de forma determinista, sin utilizar ningún modelo en la ruta principal:
95
+
96
+ - **Monitor de conformidad** (asesoramiento, falla abierta): un esquema determinista + una verificación del contrato computable comprueba una llamada propuesta con su contrato de herramienta catalogado y adjunta un veredicto asesor sobre una llamada *comprobada* como no conforme; nunca bloquea. Un límite opcional para el modelo lingüístico grande (LLM) (`ROLEOS_CONFORMANCE_CONSULT`) gestiona los residuos genuinamente semánticos.
97
+ - **Control de capacidad** (falla cerrada, opcional `ROLEOS_CAPABILITY_GATE`, desactivado por defecto): control determinista del privilegio mínimo en las acciones *irreversibles* (publicación en npm/PyPI, `gh release`, `git push`, edición de repositorios, despliegue de Páginas). Una acción controlada se deniega a menos que el administrador haya concedido su capacidad en `.claude/role-os/capabilities.json`, por lo que un paso incorrecto (un error honesto o uno inyectado) no puede desencadenar una acción irreversible no autorizada. El complemento preventivo de la regla del compensador con nombre. Consulte el [manual](https://mcp-tool-shop-org.github.io/role-os/handbook/).
98
+
99
+ ## Estado de la implementación a nivel de organización
100
+
101
+ El estado de la implementación a nivel de organización (cola, decisiones, registros de auditoría, paquetes de bloqueo por repositorio) se encuentra en un repositorio privado independiente: [`role-os-rollout`](https://github.com/mcp-tool-shop-org/role-os-rollout). Este repositorio es el producto; ese repositorio es el estado operativo.
91
102
 
92
103
  ## Memoria y continuidad
93
104
 
94
- Role OS no posee ni duplica la capa de memoria. Cuando existe la memoria del proyecto Claude, esta es el sistema de continuidad canónico: los hechos del repositorio, las decisiones, los problemas pendientes y el historial de tratamiento se almacenan allí.
105
+ Role OS no posee ni duplica la capa de memoria. Donde existe la memoria del proyecto Claude, es el sistema de continuidad canónico: los hechos del repositorio, las decisiones, los puntos pendientes y el historial del tratamiento se almacenan allí.
95
106
 
96
107
  Role OS se integra con la memoria del proyecto Claude. No la reemplaza.
97
108
 
98
- ## Tratamiento completo y verificación de entrega
109
+ ## Tratamiento completo y verificación final
99
110
 
100
- El tratamiento completo es un protocolo canónico de 7 fases definido en la memoria del proyecto Claude (`memory/full-treatment.md`). Role OS dirige y revisa los tratamientos utilizando contratos de roles, transferencias y puertas de revisión, y no redefine el protocolo.
111
+ El tratamiento completo es un protocolo canónico de 7 fases definido en la memoria del proyecto Claude (`memory/full-treatment.md`). Role OS enruta y revisa los tratamientos utilizando contratos de roles, transferencias y puertas de control: no redefine el protocolo.
101
112
 
102
- La **verificación de entrega (Shipcheck)** es la puerta de calidad de 31 elementos que se ejecuta antes del tratamiento completo. Las puertas A, B, C y D deben superarse antes de que comience cualquier tratamiento. Referencia canónica: `memory/shipcheck.md`.
113
+ La **verificación final** es la puerta de control de calidad de 31 elementos que se ejecuta antes del tratamiento completo. Las puertas de control A-D deben superarse antes de que comience cualquier tratamiento. Referencia canónica: `memory/shipcheck.md`.
103
114
 
104
- Orden: Verificación de entrega primero, luego tratamiento completo. No hay versión 1.0.0 sin superar las puertas obligatorias.
115
+ Orden: verificación final primero, luego tratamiento completo. No se lanzará la versión 1.0.0 sin superar las puertas de control obligatorias.
105
116
 
106
- ## 32 roles en 8 paquetes
117
+ ## 61 roles en 10 paquetes
107
118
 
108
119
  | Paquete | Roles |
109
120
  |------|-------|
110
- | **Core** (3) | Orquestador, Estratega de Producto, Evaluador Crítico. |
111
- | **Engineering** (7) | Desarrollador Frontend, Ingeniero Backend, Ingeniero de Pruebas, Ingeniero de Refactorización, Ingeniero de Rendimiento, Auditor de Dependencias, Evaluador de Seguridad. |
112
- | **Design** (2) | Diseñador de Interfaz de Usuario, Guardián de la Marca. |
113
- | **Marketing** (1) | Redactor para Lanzamiento. |
114
- | **Treatment** (7) | Investigador de Repositorios, Traductor de Repositorios, Arquitecto de Documentación, Curador de Metadatos, Auditor de Cobertura, Verificador de Despliegue, Ingeniero de Lanzamiento. |
115
- | **Product** (3) | Generador de comentarios, Priorizador de hoja de ruta, Redactor de especificaciones. |
116
- | **Research** (4) | Investigador de Experiencia de Usuario, Analista de la Competencia, Investigador de Tendencias, Sintetizador de Entrevistas con Usuarios. |
117
- | **Growth** (4) | Estratega de Lanzamiento, Estratega de Contenido, Community Manager, Líder de Soporte. |
121
+ | **Core** (3) | Orquestador, estratega de producto, revisor crítico |
122
+ | **Engineering** (7) | Desarrollador frontend, ingeniero backend, ingeniero de pruebas, ingeniero de refactorización, ingeniero de rendimiento, auditor de dependencias, revisor de seguridad |
123
+ | **Design** (2) | Diseñador de UI, guardián de la marca |
124
+ | **Marketing** (1) | Redactor de textos de lanzamiento |
125
+ | **Treatment** (7) | Investigador de repositorios, traductor de repositorios, arquitecto de documentación, curador de metadatos, auditor de cobertura, verificador de implementación, ingeniero de lanzamiento |
126
+ | **Product** (3) | Sintetizador de comentarios, priorizador de la hoja de ruta, redactor de especificaciones |
127
+ | **Research** (4) | Investigador de UX, analista de la competencia, investigador de tendencias, sintetizador de entrevistas con usuarios |
128
+ | **Growth** (4) | Estratega de lanzamiento, estratega de contenido, gestor de la comunidad, responsable de la gestión de incidencias de soporte |
129
+ | **Deep Audit** (4) | Auditor de componentes, auditor de la verdad de las pruebas, auditor de las uniones, sintetizador de auditorías |
130
+ | **Swarm** (7) | Coordinador de la colmena, agente backend de la colmena, agente puente de la colmena, agente de pruebas de la colmena, agente de infraestructura de la colmena, agente frontend de la colmena, sintetizador de la colmena |
118
131
 
119
- Cada rol tiene un contrato completo: misión, cuándo usar, cuándo no usar, entradas requeridas, salidas requeridas, nivel de calidad y desencadenantes de escalamiento. Cada rol se puede enrutar; `roleos route` puede recomendar cualquiera de ellos en función del contenido del paquete.
132
+ Cada rol tiene un contrato completo: misión, cuándo usar, cuándo no usar, entradas esperadas, salidas requeridas, estándar de calidad y desencadenantes de escalamiento. Cada rol se puede enrutar: `roleos route` puede recomendar cualquiera de ellos en función del contenido del paquete.
120
133
 
121
- ## Cómo empezar
134
+ ## Inicio rápido
122
135
 
123
136
  ```bash
124
137
  npx role-os init
@@ -133,6 +146,19 @@ roleos complete artifact.md # Complete with artifact
133
146
  roleos explain # Show full state
134
147
  roleos report # Completion report
135
148
 
149
+ # Deep audit:
150
+ roleos audit manifest --generate # Create audit-manifest.json
151
+ roleos audit # Start component-level deep audit
152
+ roleos audit status # Check audit progress
153
+ roleos audit verify # Verify manifest and outputs
154
+
155
+ # Dogfood swarm:
156
+ roleos swarm manifest --generate # Auto-detect domains from repo structure
157
+ roleos swarm # Start multi-pass convergence swarm
158
+ roleos swarm status # Check swarm progress by stage
159
+ roleos swarm findings # List findings by severity
160
+ roleos swarm approve # Approve feature gate
161
+
136
162
  # Or go manual:
137
163
  roleos start "fix the crash" # Entry decision only (no run)
138
164
  roleos packet new feature
@@ -146,55 +172,55 @@ roleos packs list
146
172
 
147
173
  ## Cuándo no usar Role OS
148
174
 
149
- - Correcciones de una sola línea, errores tipográficos o errores obvios.
150
- - Investigación exploratoria sin una salida definida.
151
- - Trabajo que se puede realizar en la mente de una persona en 5 minutos.
152
- - Correcciones urgentes que deben enviarse antes de que se complete una cadena de revisión.
153
- - Proyectos donde se prioriza la velocidad sobre la estructura.
175
+ - Correcciones de una sola línea, errores tipográficos u errores evidentes
176
+ - Investigación exploratoria sin resultados definidos
177
+ - Trabajo que cabe en la cabeza de una persona en 5 minutos
178
+ - Correcciones urgentes que deben enviarse antes de que se complete la cadena de revisión
179
+ - Proyectos en los que se prioriza la velocidad sobre la estructura
154
180
 
155
181
  ## Evidencia
156
182
 
157
- Role OS se ha probado en tres tipos de tareas diferentes en dos repositorios con estructuras diferentes:
183
+ Se demostró la eficacia de Role OS en tres configuraciones de prueba en dos repositorios estructuralmente diferentes:
158
184
 
159
185
  **Prueba 001: Trabajo de funciones** (Pantalla de la tripulación, Star Freight)
160
- - Cadena de 7 roles, 45 escenarios de prueba, 0 conflictos de roles.
161
- - Evitó la contaminación de un proyecto derivado, detectó invenciones realizadas directamente y reveló bloqueos reales.
186
+ - Cadena de 7 roles, 45 escenarios de prueba, 0 conflictos de roles
187
+ - Evitó la contaminación del ancestro de la bifurcación, detectó la invención en línea y reveló obstáculos reales
162
188
 
163
189
  **Prueba 002: Trabajo de integración** (Conexión de CampaignState, Star Freight)
164
- - Cadena de 5 roles, resolvió la interfaz arquitectónica sin soluciones alternativas falsas.
165
- - Las pruebas anti-fallback demostraron que la ruta activa es real, no un marcador de posición.
190
+ - Cadena de 5 roles, resolvió la discontinuidad arquitectónica sin recurrir a soluciones provisionales
191
+ - Las pruebas anti-provisional demostraron que la ruta activa es real, no un marcador de posición
166
192
 
167
- **Prueba 003: Trabajo de identidad** (Eliminación de contaminación, Star Freight)
168
- - Cadena de 6 roles, 51 escenarios de prueba, incluyendo una defensa duradera contra la contaminación en el sistema de integración continua.
169
- - Corrigió la desviación de la ficción heredada sin provocar una reestructuración general.
193
+ **Prueba 003: Trabajo de identidad** (Purga de contaminación, Star Freight)
194
+ - Cadena de 6 roles, 51 escenarios de prueba, incluida una defensa duradera contra la contaminación de CI
195
+ - Reparó la desviación heredada sin colapsar en una reestructuración amplia
170
196
 
171
- **Prueba de portabilidad** (Consistencia de la persona, sensor-humor)
172
- - Misma estructura base, diferentes idioma/dominio/entorno.
173
- - Se adapta solo con cambios de contexto; no se realizan modificaciones en el contrato principal.
197
+ **Prueba de portabilidad** (Consistencia de la persona, humor del sensor)
198
+ - Misma estructura, diferente idioma/dominio/pila
199
+ - Adoptado con cambios de contexto únicamente, sin modificaciones del contrato principal
174
200
 
175
201
  **Tratamiento completo FT-001** (portlight-desktop)
176
- - Tratamiento con personal en 7 fases con roles del paquete de tratamiento.
177
- - Verificación de envío probada, sin colisiones de roles.
202
+ - Tratamiento de 7 fases con roles del Treatment Pack
203
+ - Se demostró la validación de Shipcheck, cero conflictos de roles
178
204
 
179
205
  **Tratamiento completo FT-002** (studioflow)
180
- - Mismo paquete de tratamiento, repositorio estructuralmente diferente (espacio de trabajo creativo vs. juego).
181
- - Paquete de tratamiento portátil: no se requieren modificaciones en el contrato.
206
+ - Mismo Treatment Pack, repositorio estructuralmente diferente (espacio de trabajo creativo frente a juego)
207
+ - El Treatment Pack es portátil, no se necesitan modificaciones del contrato
182
208
 
183
- **Ejecución de prueba ideal** (tema del mercado de servidores MCP)
184
- - Cadena de 9 roles, 4 analistas en paralelo, examen cruzado + gráfico de refutación de disputas.
185
- - Se plantearon 4 desafíos, se redujeron 3 afirmaciones, 1 sin resolver: presión saludable, no un punto muerto.
186
- - Más de 16 enlaces de trazado desde los artefactos renderizados hasta los átomos de la capa de verdad.
187
- - Cadena de custodia completa probada: verdad → átomos → disputa → síntesis → expansión → juez → renderizado → trazado.
209
+ **Sesión de lluvia de ideas** (tema del mercado de servidores MCP)
210
+ - Cadena de 9 roles, 4 analistas en paralelo, examen cruzado + refutación del gráfico de disputas
211
+ - Se plantearon 4 desafíos, se redujeron 3 afirmaciones, 1 sin resolver: presión saludable, no un punto muerto
212
+ - Más de 16 enlaces de rastreo desde los artefactos renderizados hasta los átomos de la capa de verdad
213
+ - Se demostró la cadena completa de custodia: verdad → átomos → disputa → síntesis → expansión → juicio → renderizado → rastreo
188
214
 
189
- ## Propiedades fundamentales
215
+ ## Propiedades principales
190
216
 
191
- Estas son innegociables. Si un cambio debilita alguna de ellas, recházalo.
217
+ Estas son innegociables. Si un cambio debilita alguna de ellas, rechácelo.
192
218
 
193
- - Los límites de los roles se mantienen.
194
- - La revisión es rigurosa.
195
- - La escalación se mantiene transparente.
196
- - Los paquetes siguen siendo verificables.
197
- - La portabilidad requiere adaptación al contexto, no una modificación profunda.
219
+ - Los límites de los roles se mantienen
220
+ - La revisión es rigurosa
221
+ - La escalada se mantiene honesta
222
+ - Los paquetes siguen siendo comprobables
223
+ - La portabilidad requiere adaptación al contexto, no cirugía del núcleo
198
224
 
199
225
  ## Estructura del proyecto
200
226
 
@@ -206,18 +232,23 @@ role-os/
206
232
  entry-cmd.mjs ← `roleos start` CLI command
207
233
  run.mjs ← Persistent run engine: create → step → pause → resume → report
208
234
  run-cmd.mjs ← `roleos run/resume/next/explain/complete/fail` + interventions
209
- mission.mjs ← 7 named mission types (feature, bugfix, treatment, docs, security, research, brainstorm)
235
+ mission.mjs ← 9 named mission types (feature, bugfix, treatment, docs, security, research, brainstorm, deep-audit, dogfood-swarm)
210
236
  mission-run.mjs ← Mission runner: create → step → complete → report
211
237
  mission-cmd.mjs ← `roleos mission` CLI commands
212
- route.mjs 31-role routing + dynamic chain builder
213
- packs.mjs 7 calibrated team packs + auto-selection
238
+ audit-cmd.mjs `roleos audit` deep audit entry point with manifest generation
239
+ swarm-cmd.mjs `roleos swarm` dogfood swarm entry point with domain detection
240
+ swarm/ ← Domain detection, build gate, evidence persistence bridge
241
+ route.mjs ← 61-role routing + dynamic chain builder
242
+ packs.mjs ← 10 calibrated team packs + auto-selection
214
243
  conflicts.mjs ← 4-pass conflict detection
215
244
  escalation.mjs ← Auto-routing for blocked/rejected/split
216
245
  evidence.mjs ← Structured evidence + role-aware requirements
217
246
  dispatch.mjs ← Runtime dispatch manifests for multi-claude
218
- artifacts.mjs 30 per-role artifact contracts + 7 pack handoffs
247
+ tool-profiles.mjs Per-role tool sandboxing (shared by dispatch + trial)
248
+ state-machine.mjs ← Canonical step/run transition maps
249
+ artifacts.mjs ← Per-role artifact contracts + pack handoffs
219
250
  decompose.mjs ← Composite task detection + splitting
220
- composite.mjs ← Dependency-ordered execution + recovery
251
+ composite.mjs ← Dependency-ordered execution + recovery + cycle detection
221
252
  replan.mjs ← Mid-run adaptive replanning
222
253
  calibration.mjs ← Outcome recording + weight tuning
223
254
  hooks.mjs ← 5 lifecycle hooks for runtime enforcement
@@ -225,56 +256,60 @@ role-os/
225
256
  brainstorm.mjs ← Evidence modes, request validation, finding/synthesis/judge schemas
226
257
  brainstorm-roles.mjs ← Role-native schemas, input partitioning, blindspot enforcement, cross-exam
227
258
  brainstorm-render.mjs ← Two-layer rendering: lexical bans, render schemas, debate transcript
228
- test/ ← 894 tests across 30 test files
259
+ test/ ← 1150 tests across 37 test files
229
260
  starter-pack/ ← Drop-in role contracts, policies, schemas, workflows
230
261
  ```
231
262
 
232
263
  ## Seguridad
233
264
 
234
- El sistema operativo del rol opera **únicamente de forma local**. Copia las plantillas de Markdown y escribe archivos de paquetes/verdictos en el directorio `.claude/` de su repositorio. No accede a la red, no maneja secretos ni recopila datos de telemetría. No se realizan operaciones peligrosas; todas las escrituras de archivos utilizan la opción "omitir si existe" de forma predeterminada. Consulte [SECURITY.md](SECURITY.md) para obtener la política completa.
265
+ Role OS opera **solo localmente**. Copia las plantillas de Markdown y escribe los archivos de paquetes/verdictos en el directorio `.claude/` de su repositorio. No accede a la red, no gestiona secretos ni recopila datos de telemetría. No realiza operaciones peligrosas: todos los archivos se escriben utilizando la opción "omitir si existe" de forma predeterminada. Consulte [SECURITY.md](SECURITY.md) para obtener la política completa.
235
266
 
236
267
  ## El sistema operativo
237
268
 
238
- | Capa | ¿Qué hace? | Estado |
269
+ | Capa | Qué hace | Estado |
239
270
  |-------|-------------|--------|
240
- | **Routing** | Asigna una puntuación a los 31 roles en función del contenido del paquete, explica las recomendaciones, evalúa la confianza. | ✓ Implementado |
241
- | **Chain builder** | Ensambla cadenas ordenadas por fase a partir de roles con puntuación, sesgadas por tipo de paquete, no bloqueadas por plantillas. | ✓ Implementado |
242
- | **Conflict detection** | Validación de 4 pasos: conflictos duros, secuencia, redundancia, lagunas de cobertura. Sugerencias de reparación. | ✓ Implementado |
243
- | **Escalation** | Redirige automáticamente las tareas bloqueadas/rechazadas/divididas al solucionador adecuado, junto con la razón y el artefacto requerido. | ✓ Implementado |
244
- | **Evidence** | Evidencia estructurada en las decisiones, específica para cada rol. Comprobaciones de suficiencia. 12 tipos de evidencia. | ✓ Implementado |
245
- | **Dispatch** | Genera manifiestos de ejecución para multi-claude. Perfiles de herramientas por rol, indicaciones del sistema, presupuestos. | ✓ Implementado |
246
- | **Trials** | Lista completa probada: 30/30 tareas de oro + 5/5 pruebas negativas. 7 pruebas de paquete completadas. | ✓ Completo |
247
- | **Team Packs** | 7 paquetes calibrados con selección automática, protección contra errores y recuperación flexible. | ✓ Implementado |
248
- | **Outcome calibration** | Registra los resultados de las ejecuciones, ajusta los pesos de los paquetes/roles según los resultados y modifica los umbrales de confianza. | ✓ Implementado |
249
- | **Mixed-task decomposition** | Detecta tareas compuestas, las divide en paquetes secundarios, asigna paquetes, preserva las dependencias. | ✓ Implementado |
250
- | **Composite execution** | Ejecuta los paquetes secundarios en orden de dependencia, transfiriendo artefactos, recuperando ramas y sintetizando. | ✓ Implementado |
251
- | **Adaptive replanning** | Los cambios en el alcance, los hallazgos o los nuevos requisitos durante la ejecución actualizan el plan sin necesidad de reiniciarlo. | ✓ Implementado |
252
- | **Session spine** | `roleos init claude` crea los archivos CLAUDE.md, /roleos-route, /roleos-review y /roleos-status. `roleos doctor` verifica la configuración. Las tarjetas de ruta demuestran la participación. | ✓ Implementado |
253
- | **Hook spine** | 5 ganchos de ciclo de vida (SessionStart, PromptSubmit, PreToolUse, SubagentStart, Stop). Aplicación de políticas: recordatorios en las tarjetas de ruta, control de acceso a herramientas, inyección de roles de subagente, auditoría de finalización. | ✓ Implementado |
254
- | **Artifact spine** | 30 contratos de artefactos por rol. 7 contratos de transferencia de paquetes. Validación estructural. Comprobaciones de integridad de la cadena. Los roles posteriores nunca adivinan lo que recibieron. | ✓ Implementado |
255
- | **Mission library** | 7 misiones con nombre (feature-ship, bugfix, treatment, docs-release, security-hardening, research-launch, brainstorm). Cada una define el paquete, la cadena de roles, el flujo de artefactos, las ramas de escalada y una definición parcial y honesta. Las 7 están probadas. | ✓ Implementado |
256
- | **Mission runner** | Crea ejecuciones, avanza paso a paso con seguimiento del estado, completa o falla con informes precisos. Propagación de pasos bloqueados, advertencias de escalada fuera de la cadena, reapertura del último paso. | ✓ Implementado |
257
- | **Unified entry** | `roleos start` decide automáticamente entre una misión, un paquete o una ruta flexible. Escalera de recuperación con puntuaciones de confianza, alternativas y detección de tareas compuestas. | ✓ Implementado |
258
- | **Persistent runs** | `roleos run` crea ejecuciones respaldadas en disco. Comandos: `resume` (reanudar), `next` (siguiente), `explain` (explicar), `complete` (completar), `fail` (fallar). Intervenciones: `reroute` (redirigir), `escalate` (escalar), `retry` (reintentar), `block` (bloquear), `reopen` (reabrir). Guía específica para cada paso. Medición de la fricción. | ✓ Implementado |
259
- | **Brainstorm** | Arquitectura de dos capas: verdad (esquemas nativos del rol, átomos de procedencia, gráfico de disputa cruzada) + renderizado (5 voces distintas, prohibiciones léxicas, transcripción del debate). Los enlaces de trazado demuestran que cada afirmación renderizada se corresponde con un átomo de verdad. Ejecución de referencia: 894 pruebas. | ✓ Implementado |
260
-
261
- ## 7 misiones
271
+ | **Routing** | Califica los 61 roles según el contenido del paquete, explica las recomendaciones y evalúa la confianza | ✓ Enviado |
272
+ | **Chain builder** | Ensambla cadenas ordenadas por fases a partir de roles calificados, con un sesgo hacia el tipo de paquete, no bloqueado por plantillas | ✓ Enviado |
273
+ | **Conflict detection** | Validación de 4 pasos: conflictos duros, secuencia, redundancia, lagunas de cobertura. Sugerencias de reparación. | ✓ Enviado |
274
+ | **Escalation** | Enruta automáticamente el trabajo bloqueado/rechazado/dividido al resolutor correcto con la razón y el artefacto requerido | ✓ Enviado |
275
+ | **Evidence** | Evidencia estructurada consciente del rol en los veredictos. Comprobaciones de suficiencia. 12 tipos de evidencia. | ✓ Enviado |
276
+ | **Dispatch** | Genera manifiestos de ejecución para multi-claude. Perfiles de herramientas por rol, indicaciones del sistema, presupuestos. | ✓ Enviado |
277
+ | **Trials** | Lista completa probada: 30/30 tareas de oro + 5/5 pruebas negativas. 7 pruebas de paquetes completadas. | ✓ Completo |
278
+ | **Team Packs** | 10 paquetes calibrados con selección automática, protecciones de desajuste y alternativa de enrutamiento libre. | ✓ Enviado |
279
+ | **Outcome calibration** | Registra los resultados de la ejecución, ajusta los pesos de los paquetes/roles a partir de los resultados y ajusta los umbrales de confianza. | ✓ Enviado |
280
+ | **Mixed-task decomposition** | Detecta el trabajo compuesto, lo divide en paquetes secundarios, asigna paquetes y conserva las dependencias. | ✓ Enviado |
281
+ | **Composite execution** | Ejecuta los paquetes secundarios en orden de dependencia con el paso de artefactos, la recuperación de ramas y la síntesis. | ✓ Enviado |
282
+ | **Adaptive replanning** | Los cambios de alcance, los hallazgos o los nuevos requisitos a mitad de la ejecución actualizan el plan sin reiniciar. | ✓ Enviado |
283
+ | **Session spine** | `roleos init claude` crea CLAUDE.md, /roleos-route, /roleos-review, /roleos-status. `roleos doctor` verifica la configuración. Las tarjetas de ruta demuestran la participación. | ✓ Enviado |
284
+ | **Hook spine** | 5 ganchos del ciclo de vida (SessionStart, PromptSubmit, PreToolUse, SubagentStart, Stop). Aplicación de asesoramiento: recordatorios de la tarjeta de ruta, validación de la escritura de herramientas, inyección del rol del subagente, auditoría de finalización. | ✓ Enviado |
285
+ | **Artifact spine** | Contratos de artefactos por rol. Contratos de transferencia de paquetes. Validación estructural. Comprobaciones de la integridad de la cadena. Los roles posteriores nunca adivinan lo que recibieron. | ✓ Enviado |
286
+ | **Mission library** | 9 misiones nombradas (envío de funciones, corrección de errores, tratamiento, lanzamiento de documentación, fortalecimiento de la seguridad, lanzamiento de investigación, lluvia de ideas, auditoría profunda, prueba en grupo). Cada una declara el paquete, la cadena de roles, el flujo de artefactos, las ramas de escalada y la definición honesta-parcial. | ✓ Enviado |
287
+ | **Mission runner** | Cree ejecuciones, avance paso a paso con el estado rastreado, complete/falle con informes honestos. Propagación de pasos bloqueados, advertencias de escalada fuera de la cadena, reapertura del último paso. | ✓ Enviado |
288
+ | **Unified entry** | `roleos start` decide automáticamente la misión frente al paquete frente al enrutamiento libre. Escalera de respaldo con puntuaciones de confianza, alternativas y detección de composición. | ✓ Enviado |
289
+ | **Persistent runs** | `roleos run` crea ejecuciones respaldadas por disco. `resume`, `next`, `explain`, `complete`, `fail`. Intervenciones: reroute, escalate, retry, block, reopen. Guía local del paso. Medición de la fricción. | ✓ Enviado |
290
+ | **Brainstorm** | Arquitectura de dos capas: verdad (esquemas nativos del rol, átomos de procedencia, gráfico de disputas de examen cruzado) + renderizado (5 voces distintas, prohibiciones léxicas, transcripción del debate). Los enlaces de rastreo demuestran que cada afirmación renderizada se asigna a un átomo de verdad. Sesión de prueba exitosa. | ✓ Enviado |
291
+ | **Deep Audit** | Auditoría de repositorio basada en manifiestos: descomponer el repositorio en componentes, asignar N auditores + M auditores de pruebas de veracidad + K auditores de límites a partir del grafo de dependencias, sintetizar en un veredicto clasificado y un plan de acción. La asignación dinámica se escala con el tamaño del repositorio (fórmula 2N + K + 3). Ejecución nativa con validación de artefactos en cada paso. | ✓ Enviado |
292
+ | **Dogfood Swarm** | Convergencia de múltiples pasos: tres etapas de verificación (errores/seguridad → proactiva → humanización) y luego paso de características. Propiedad exclusiva de archivos, puertas de control después de cada iteración, puntos de control del usuario. La detección automática de dominios genera manifiestos. Puente de evidencia hacia los laboratorios de pruebas internas. | ✓ Enviado |
293
+
294
+ ## 9 misiones
262
295
 
263
296
  | Misión | Paquete | Roles | Cuándo usar |
264
297
  |---------|------|-------|-------------|
265
- | `feature-ship` | Característica | 5 | Entrega completa de la característica: alcance → especificación → implementación → prueba → revisión |
266
- | `bugfix` | Corrección de errores | 4 | Diagnosticar la causa raíz, corregir, probar, verificar |
267
- | `treatment` | Tratamiento | 4 | Verificación + pulido + documentación + verificación CI + revisión |
268
- | `docs-release` | Documentación | 2 | Escribir/actualizar documentación, notas de la versión |
269
- | `security-hardening` | Seguridad | 4 | Modelo de amenazas, auditoría, corregir vulnerabilidades, volver a auditar, verificar |
270
- | `research-launch` | Investigación | 4 | Formular la pregunta, investigar, documentar los hallazgos, decidir |
271
- | `brainstorm` | Lluvia de ideas | 9 | Investigación estructurada con múltiples perspectivas, con desacuerdos trazables y resultados. |
272
-
273
- Cada misión incluye definiciones parciales y honestas: cuando el trabajo se detiene, el sistema documenta lo que se completó y lo que queda, en lugar de simular una finalización.
298
+ | `feature-ship` | característica | 5 | Entrega completa de una característica: alcance → especificación → implementación → prueba → revisión |
299
+ | `bugfix` | corrección de errores | 4 | Diagnosticar la causa raíz, corregir, probar, verificar |
300
+ | `treatment` | tratamiento | 4 | Revisión previa al lanzamiento + pulido + documentación + verificación de CI + revisión |
301
+ | `docs-release` | documentación | 2 | Escribir/actualizar la documentación, notas de la versión |
302
+ | `security-hardening` | seguridad | 4 | Modelo de amenazas, auditoría, corrección de vulnerabilidades, reauditoría, verificación |
303
+ | `research-launch` | investigación | 4 | Formular la pregunta, investigar, documentar los hallazgos, decidir |
304
+ | `brainstorm` | lluvia de ideas | 9 | Consulta estructurada con múltiples perspectivas, desacuerdo rastreable y resultado verificable |
305
+ | `deep-audit` | auditoría profunda | 5 (escalas) | Auditoría de repositorio basada en manifiestos: el número de trabajadores se escala con el grafo del repositorio mediante la asignación dinámica |
306
+ | `dogfood-swarm` | enjambre | 8 (escalas) | Convergencia de múltiples pasos: verificación-a verificación-b verificación-c característica síntesis final |
307
+
308
+ Cada misión incluye definiciones honestas y parciales: cuando el trabajo se detiene, el sistema documenta lo que se completó y lo que queda, en lugar de simular que se completó todo.
274
309
 
275
310
  ### Misión de lluvia de ideas
276
311
 
277
- No es una "lluvia de ideas de IA". La misión de lluvia de ideas es **un conjunto de roles especializados bajo un marco legal, con desacuerdos trazables y resultados con valor de juicio.**
312
+ No es una "lluvia de ideas con IA". La misión de lluvia de ideas se basa en **roles especializados bajo la ley, con desacuerdo rastreable y resultados verificables.**
278
313
 
279
314
  ```bash
280
315
  roleos run "explore product directions for a developer tool discovery platform"
@@ -282,33 +317,61 @@ roleos run "explore product directions for a developer tool discovery platform"
282
317
  # Chain: 4 Analysts (parallel) → Normalize → Cross-Examine → Rebut → Synthesize → Expand → Judge
283
318
  ```
284
319
 
285
- **¿Qué la diferencia?**
320
+ **Qué la hace diferente:**
321
+
322
+ - **Capa 1 (veracidad):** Cuatro analistas emiten esquemas nativos de su rol (ContextMap, UserValueMap, MechanicsMap, PositioningMap), no prosa compartida. Cada rol tiene limitaciones impuestas: frases prohibidas, tipos de afirmaciones prohibidas, particiones de entrada filtradas. Los átomos llevan información de procedencia. Un grafo de interrogatorio cruzado dirigido produce desafíos específicos. Los analistas originales defienden, limitan o retiran sus afirmaciones bajo presión.
323
+
324
+ - **Capa 2 (representación):** Cinco voces humanas distintas (Memorándum de límites, Notas de campo, Esquema del sistema, Resumen de afirmaciones, Transcripción del interrogatorio cruzado) con prohibiciones léxicas que impiden la convergencia de las voces. La síntesis consume la veracidad, nunca la prosa representada. Ambas capas siempre están disponibles.
325
+
326
+ - **Cadena de custodia:** Cada oración representada se remonta a un átomo de la capa de veracidad. Las direcciones de síntesis citan átomos. Los objetivos del interrogatorio cruzado son identificadores de afirmaciones reales. El grafo de disputa es el producto, no la prosa.
327
+
328
+ **Probado:** Ejecución de referencia v0.4: se verificó la cadena de custodia completa. Consulte [`examples/golden-run.md`](examples/golden-run.md) para ver la cadena de artefactos completa.
329
+
330
+ ### Misión de auditoría profunda
331
+
332
+ No es un escaneo superficial. La misión de auditoría profunda **descompone un repositorio en componentes delimitados y asigna auditores especializados a una escala determinada por el propio grafo de dependencias del repositorio.**
333
+
334
+ ```bash
335
+ roleos run "deep audit this repo" --manifest=audit-manifest.json
336
+ # → MISSION: Deep Audit (Manifest-Scaled)
337
+ # Steps: Component Auditor ×6 + Test Truth Auditor ×6 + Seam Auditor ×8 + Synthesizer + Action Plan + Critic = 23 steps
338
+ ```
339
+
340
+ **Qué la hace diferente:**
286
341
 
287
- - **Capa 1 (verdad):** Cuatro analistas emiten esquemas nativos del rol (ContextMap, UserValueMap, MechanicsMap, PositioningMap) no prosa compartida. Cada rol tiene restricciones para evitar puntos ciegos: frases prohibidas, tipos de afirmaciones prohibidas, particiones de entrada filtradas. Los átomos llevan información de procedencia. Un gráfico de interrogatorio dirigido genera desafíos específicos. Los analistas originales defienden, refinan o retiran sus afirmaciones bajo presión.
342
+ - **Asignación dinámica:** el número de trabajadores no es fijo. Un repositorio de 10 componentes con 5 clústeres de límites produce 28 pasos (2 × 10 + 5 + 3). Un repositorio de 3 componentes produce 12. La fórmula de escalado es `2N + K + 3`, donde N = componentes, K = límites.
343
+ - **Paquetes basados en manifiestos:** un archivo `audit-manifest.json` define los componentes (con rutas de archivo, recuentos de líneas, descripciones) y los límites (de/a con descripciones de la interfaz). Cada auditor recibe solo su paquete.
344
+ - **Cuatro arquetipos de roles:** Auditor de componentes (veracidad del código por módulo), Auditor de pruebas de veracidad (pruebas que demuestran vs. pruebas que existen), Auditor de límites (límites de integración del grafo de dependencias), Sintetizador de auditoría (veredicto clasificado + plan de acción de todos los paquetes).
345
+ - **Validación de artefactos en cada paso:** `validateArtifact()` se activa en cada paso completado en ambos caminos de ejecución. Los resultados se adjuntan a los objetos de paso. El sistema sabe si cada artefacto cumplió con su contrato.
346
+ - **Honestidad parcial:** cuando el presupuesto o el alcance impiden la finalización, los hallazgos por componente son individualmente válidos. El sistema sintetiza a partir de lo que se completó, nunca simula una cobertura completa.
347
+
348
+ **Probado:** Ejecución nativa de Runner: 18 pruebas contra un manifiesto real, se verificó el ciclo de vida completo, incluida la reapertura de la escalada y el fallo parcial. Se verificó la fórmula de escalado para manifiestos de 3/6/10/15 componentes.
349
+
350
+ ### Misión de enjambre de pruebas internas
351
+
352
+ No es un análisis de un solo paso. La misión de enjambre de pruebas internas **ejecuta un protocolo de convergencia de múltiples pasos que mueve un repositorio de "funciona" a "listo para producción" a través de tres etapas de verificación y la entrega iterativa de características.**
353
+
354
+ ```bash
355
+ roleos swarm
356
+ # → MISSION: Dogfood Swarm (Multi-Pass Convergence)
357
+ # Stages: Health-A → Health-B → Health-C → Feature → Final
358
+ # Domain agents: 3-5 parallel per wave (exclusive file ownership)
359
+ ```
288
360
 
289
- - **Capa 2 (renderizado):** Cinco voces humanas distintas (Memorándum de Límites, Notas de Campo, Esquema del Sistema, Resumen de Reclamación, Transcripción del Interrogatorio) con restricciones léxicas que evitan la convergencia de las voces. La síntesis consume información verídica, pero nunca produce prosa. Ambas capas están siempre disponibles.
361
+ **Qué la hace diferente:**
290
362
 
291
- - **Cadena de custodia:** Cada oración generada se remonta a un átomo de la capa de verdad. Las instrucciones de síntesis citan átomos. Los interrogatorios se dirigen a identificadores de reclamaciones reales. El grafo de disputas es el producto, no la prosa.
363
+ - **Proceso de verificación en tres etapas:** la etapa A corrige errores y problemas de seguridad (se repite hasta que no haya más errores CRÍTICOS ni ALTOS). La etapa B aplica medidas de seguridad proactivas (los usuarios revisan los resultados). La etapa C humaniza el código: mensajes de error que ayudan a los usuarios, comentarios sobre la reconexión, estados de carga, accesibilidad. Cada etapa es una lente distinta, no es la misma verificación repetida.
364
+ - **Propiedad exclusiva de archivos:** cada agente de dominio posee archivos específicos a través de `swarm-manifest.json`. Ningún agente edita el mismo archivo. No hay conflictos de fusión. No hay sobrecarga de coordinación.
365
+ - **Barreras de compilación:** después de cada iteración, deben superarse las pruebas de lint, verificación de tipos y pruebas. El sistema detecta automáticamente el sistema de compilación (Node, Rust, Python, Go) y ejecuta los comandos correspondientes.
366
+ - **Puntos de control del usuario:** la etapa Health-B y la etapa de características requieren la aprobación explícita del usuario antes de la ejecución. El sistema presenta los resultados y el usuario decide qué compilar.
367
+ - **Convergencia iterativa:** las etapas se repiten en bucle con las iteraciones hasta que se cumplen las condiciones de salida o se alcanza el número máximo de iteraciones. Cada iteración vuelve a auditar desde cero para detectar regresiones introducidas por correcciones anteriores.
368
+ - **Detección automática de dominio:** `roleos swarm manifest --generate` detecta el tipo de repositorio (CLI, web, escritorio, MCP, monorepositorio) y genera asignaciones de dominio que no se superponen.
292
369
 
293
- **Comprobado:** Versión 0.4, ejecución de referencia 894 pruebas, cadena de custodia completamente verificada. Consulte [`examples/golden-run.md`](examples/golden-run.md) para ver la cadena de artefactos completa.
370
+ **Probado:** claude-collaborate (28-03-2026)35→129 pruebas, 106 problemas de verificación resueltos, versión v1.1.0 lanzada. Protocolo v2.0 con 9 fases.
294
371
 
295
372
  ## Estado
296
373
 
297
- - v0.1–v0.4: Fundación pruebas, adopción, paquete de tratamiento, paquete de inicio.
298
- - v1.0.0: 32 roles, interfaz de línea de comandos completa, tratamiento comprobado, portabilidad entre múltiples repositorios.
299
- - v1.0.2: Bloqueo del sistema de roles (correcciones de inicialización de la verdad, init --force).
300
- - v1.1.0: 31 roles, columna vertebral de enrutamiento completa, detección de conflictos, escalamiento, evidencia, despacho, 7 paquetes de equipo comprobados. 35 pruebas de ejecución. 212 pruebas.
301
- - v1.2.0: Paquetes calibrados promovidos a la entrada predeterminada. Selección automática, detección de incompatibilidades, sugerencia alternativa, recuperación de enrutamiento libre. 246 pruebas.
302
- - v1.3.0: Calibración de resultados, descomposición de tareas mixtas, ejecución compuesta, replanificación adaptativa. 317 pruebas.
303
- - v1.4.0: Columna vertebral de la sesión — `roleos init claude`, `roleos doctor`, tarjetas de ruta, comandos /roleos-route + /roleos-review + /roleos-status. 335 pruebas.
304
- - v1.5.0: Columna vertebral de los ganchos — 5 ganchos de ciclo de vida para la aplicación en tiempo de ejecución. 358 pruebas.
305
- - v1.6.0: Columna vertebral de los artefactos — 20 contratos de artefactos por rol, 7 contratos de entrega de paquetes, validación estructural. 385 pruebas.
306
- - v1.7.0: Prueba de finalización — tareas reales ejecutadas a través de toda la pila. Interfaz de línea de comandos `roleos artifacts`. Escalamiento honesto para correcciones estructurales. 398 pruebas.
307
- - v1.8.0: Biblioteca de misiones (Fase S) — 6 misiones con nombre, motor de ejecución, informes de finalización. Endurecido a partir de 6 ejecuciones de prueba reales. 481 pruebas.
308
- - v1.9.0: Ruta de entrada unificada (Fase T) — `roleos start` decide automáticamente entre misión, paquete o enrutamiento libre. Escalera de recuperación, detección compuesta, pruebas de comparación de rutas de entrada. 527 pruebas.
309
- - **v2.0.0**: Optimización de la experiencia del usuario (Fase U) — `roleos run` crea ejecuciones persistentes respaldadas por disco. Reanudar, siguiente, explicar, completar, fallar. Intervenciones: redirigir, escalar, reintentar, bloquear, reabrir. Guía específica para cada paso. Medición de la fricción. 6 pruebas de fricción. 613 pruebas.
310
- - **v2.0.1**: Auditoría del manual, documentación para principiantes, correcciones del número de pruebas. 617 pruebas.
311
- - **v2.1.0**: Misión de lluvia de ideas (v0.4) — roles especializados en el ámbito legal, desacuerdo trazable, salida con valor de veredicto. Arquitectura de dos capas (verdad + renderizado), matriz de permisos de interrogatorio, grafo de disputas, prueba de ejecución de referencia. 7 misiones, 50 roles, 8 paquetes. 894 pruebas.
374
+ Estable y en producción. Consulte el [REGISTRO DE CAMBIOS](CHANGELOG.md) para obtener el historial completo de versiones y los cambios realizados en cada lanzamiento.
312
375
 
313
376
  ## Licencia
314
377
 
@@ -316,4 +379,4 @@ MIT
316
379
 
317
380
  ---
318
381
 
319
- Creado por <a href="https://mcp-tool-shop.github.io/">MCP Tool Shop</a
382
+ Creado por <a href="https://mcp-tool-shop.github.io/">MCP Tool Shop</a>