role-os 2.6.0 → 2.7.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
package/CHANGELOG.md CHANGED
@@ -1,5 +1,31 @@
1
1
  # Changelog
2
2
 
3
+ ## 2.7.1
4
+
5
+ ### Docs
6
+ - **README + handbook for the production budget consult.** The README gains a "Budget-aware dispatch"
7
+ note (opt-in `ROLEOS_BUDGET_CONSULT`, advisory, fail-open to a deterministic baseline) and a new
8
+ handbook page documents the consult — `consultBudgetForManifest` / `buildDispatchManifestWithBudget`,
9
+ the per-step forecast + receipt, and the `roleos specialist rollback` compensator — wired to the
10
+ landing page. Re-translated across all 8 locales.
11
+ - **README front-door cleanup** — the per-version history block moved to this CHANGELOG; the README
12
+ keeps the value proposition.
13
+
14
+ (Docs only — no code changes from 2.7.0.)
15
+
16
+ ## 2.7.0
17
+
18
+ ### Added
19
+
20
+ #### Token Budget Analyst — production budget consult (opt-in, default-off)
21
+
22
+ - **`src/specialist/budget-consult.mjs`** — wires the budgeter specialist into dispatch assembly. `consultBudgetForManifest(manifest)` / `buildDispatchManifestWithBudget(options)` consult the Token Budget Analyst per dispatch step (via the proven `dispatchSpecialist` path), attaching an advisory `budgetForecast` + `budgetReceipt` to each step.
23
+ - **Opt-in** via `ROLEOS_BUDGET_CONSULT` (default **off** — production dispatch is byte-identical until the flip, which is a release decision). **Fail-open** to the deterministic baseline `max(ctx*1.5, 50000)` (not Claude); the consult swallows any error into a receipt so it can never break manifest assembly. **Advisory** — it never blocks or gates a dispatch. Compensator: `roleos specialist rollback <role> <version>`.
24
+ - Also lands the **Token Budget Analyst dataset tooling** under `tools/token-budget-dataset/` (the v0.1 harvester + puzzle curriculum + review/freeze pipeline that produced the budgeter's training corpus). Not part of the published CLI package (`files` ships `bin`/`src`/`starter-pack`).
25
+
26
+ ### Tests
27
+ - 9 new tests (`specialist-budget-consult`: off=no-op, specialist forecast, fail-open on backend-down + no-registry, never-throws). **1334 total, all green.**
28
+
3
29
  ## 2.6.0
4
30
 
5
31
  ### Changed
package/README.es.md CHANGED
@@ -13,20 +13,20 @@
13
13
  <a href="https://mcp-tool-shop-org.github.io/role-os/"><img src="https://img.shields.io/badge/Landing_Page-live-brightgreen" alt="Landing Page"></a>
14
14
  </p>
15
15
 
16
- Un sistema operativo multi-Claude que asigna personal, dirige, valida y ejecuta tareas a través de 50 contratos de roles especializados. Crea paquetes de tareas, ensambla el equipo adecuado mediante la coincidencia de roles, detecta problemas antes de la ejecución, redirige automáticamente la recuperación cuando una tarea se bloquea o se rechaza, y requiere evidencia estructurada en cada decisión.
16
+ Un sistema operativo multi-Claude que asigna personal, dirige, valida y ejecuta tareas a través de 61 contratos de roles especializados. Crea paquetes de tareas, ensambla el equipo adecuado a partir de una evaluación de roles, detecta fallos en la cadena antes de la ejecución, redirige automáticamente la recuperación cuando una tarea se bloquea o se rechaza, y requiere pruebas estructuradas en cada evaluación. Incluye una distribución dinámica para misiones de gran escala: un repositorio de 10 componentes se convierte automáticamente en 28 pasos de auditoría, en lugar de 6.
17
17
 
18
- ## ¿Qué hace?
18
+ ## Qué hace
19
19
 
20
- Role OS es la forma profesional de utilizar multi-Claude. Evita los fallos específicos que producen los flujos de trabajo de IA genéricos:
20
+ Role OS es la forma profesional de utilizar multi-Claude. Evita los fallos específicos que producen los flujos de trabajo genéricos de IA:
21
21
 
22
- - **Desviación (Drift)**: Los roles se mantienen dentro de su ámbito. El producto no se rediseña. La interfaz de usuario no redefine el alcance. El backend no inventa la dirección del producto.
23
- - **Finalización falsa**: La definición de "hecho" es concreta. El trabajo que oculta deficiencias, omite la verificación o resuelve un problema diferente es rechazado.
24
- - **Contaminación**: Los proyectos bifurcados o heredados conservan residuos de identidad. Role OS detecta y rechaza las desviaciones entre proyectos en terminología, elementos visuales y modelos mentales.
25
- - **Progreso basado en impresiones**: Cada transferencia es estructurada. Cada decisión se basa en evidencia. "Parece que está terminado" no es un estado válido.
22
+ - **Desviación:** los roles se mantienen dentro de su ámbito. El producto no se rediseña. El frontend no redefine el alcance. El backend no inventa la dirección del producto.
23
+ - **Finalización falsa:** la definición de "completado" es concreta. El trabajo que oculta lagunas, omite la verificación o resuelve un problema diferente se rechaza.
24
+ - **Contaminación:** los proyectos derivados o heredados conservan residuos de identidad. Role OS detecta y rechaza la desviación entre proyectos en la terminología, los elementos visuales y los modelos mentales.
25
+ - **Progreso basado en "sensaciones":** cada transferencia es estructurada. Cada evaluación se vincula a pruebas. "Parece terminado" no es un estado válido.
26
26
 
27
- ## ¿Cómo funciona?
27
+ ## Cómo funciona
28
28
 
29
- Describa su tarea. Role OS decide automáticamente el nivel de orquestación adecuado.
29
+ Describe tu tarea. Role OS decide automáticamente el nivel de orquestación adecuado.
30
30
 
31
31
  ```bash
32
32
  roleos start "fix the crash in save handler"
@@ -44,13 +44,13 @@ roleos start "something completely novel"
44
44
 
45
45
  **La jerarquía de respaldo:**
46
46
 
47
- 1. **Misión:** cuando la tarea coincide con un flujo de trabajo recurrente probado (corrección de errores, tratamiento, lanzamiento de funciones, documentación, seguridad, investigación). Cadena de roles conocida, flujo de artefactos, ramas de escalamiento y definiciones parciales.
48
- 2. **Paquete:** cuando la tarea es una familia conocida pero no una misión completa. 7 paquetes de equipo calibrados con selección automática y protecciones contra errores.
49
- 3. **Enrutamiento libre:** cuando la tarea es novedosa, mixta o incierta. Asigna una puntuación a los 31 roles en función del contenido del paquete y ensambla una cadena dinámica.
47
+ 1. **Misión:** cuando la tarea coincide con un flujo de trabajo recurrente probado (corrección de errores, tratamiento, lanzamiento de funciones, documentación, seguridad, investigación, lluvia de ideas, auditoría exhaustiva, prueba con usuarios). Cadena de roles conocida, flujo de artefactos, ramas de escalamiento y definiciones honestas y parciales.
48
+ 2. **Paquete:** cuando la tarea pertenece a una familia conocida, pero no tiene la estructura completa de una misión. 10 paquetes de equipo calibrados con selección automática y mecanismos de protección contra errores.
49
+ 3. **Enrutamiento libre:** cuando la tarea es novedosa, mixta o incierta. Evalúa los 61 roles en función del contenido del paquete y ensambla una cadena dinámica.
50
50
 
51
- El sistema nunca fuerza una tarea a través de una abstracción incorrecta. Explica por qué eligió cada nivel y ofrece alternativas.
51
+ El sistema nunca fuerza la ejecución de una tarea a través de una abstracción incorrecta. Explica por qué eligió cada nivel y ofrece alternativas.
52
52
 
53
- **Un comando para iniciar la ejecución:**
53
+ **Un solo comando para iniciar la ejecución:**
54
54
 
55
55
  ```bash
56
56
  roleos run "fix the crash in save handler"
@@ -77,48 +77,54 @@ roleos block 2 "waiting for API spec"
77
77
  roleos reopen 0 "found issue in review"
78
78
  ```
79
79
 
80
- Las ejecuciones se guardan en disco (`.claude/runs/`), por lo que las sesiones interrumpidas se reanudan correctamente. Cada paso incluye orientación para el operador: qué producir, secciones requeridas y condiciones de parada.
80
+ Las ejecuciones se guardan en el disco (`.claude/runs/`), por lo que las sesiones interrumpidas se reanudan sin problemas. Cada paso incluye una guía para el operador: qué producir, las secciones requeridas y las condiciones de finalización.
81
81
 
82
82
  **Una vez enrutada:**
83
83
 
84
- 1. **Cada rol produce una transferencia:** salida estructurada con elementos de evidencia que reducen la ambigüedad para el siguiente rol.
85
- 2. **El revisor evalúa según el contrato:** acepta, rechaza o bloquea en función de la evidencia estructurada, no de la impresión.
86
- 3. **La recuperación se redirige automáticamente:** las tareas bloqueadas o rechazadas se redirigen al solucionador adecuado, junto con la razón, el tipo de recuperación y el artefacto requerido.
84
+ 1. **Cada rol produce una transferencia:** salida estructurada con elementos de prueba que reducen la ambigüedad para el siguiente rol.
85
+ 2. **El crítico revisa según el contrato:** acepta, rechaza o bloquea basándose en pruebas estructuradas, no en impresiones.
86
+ 3. **El enrutamiento de recuperación se realiza automáticamente:** el trabajo bloqueado o rechazado se redirige al solucionador adecuado con una razón, el tipo de recuperación y el artefacto requerido.
87
87
 
88
- ## Estado de implementación en la organización
88
+ ## Distribución consciente del presupuesto
89
89
 
90
- El estado de implementación en toda la organización (cola, decisiones, registros de auditoría, paquetes de bloqueo por repositorio) se encuentra en un repositorio privado separado: [`role-os-rollout`](https://github.com/mcp-tool-shop-org/role-os-rollout). Este repositorio es el producto; ese repositorio es el estado operativo.
90
+ Role OS puede consultar a un **analista de presupuesto de tokens** local en cada paso de la distribución y adjuntar una previsión de gasto orientativa al manifiesto: opcional (`ROLEOS_BUDGET_CONSULT`), orientativa (nunca bloquea una distribución) y con un mecanismo de seguridad que vuelve a una línea de base determinista. Desactivado por defecto; la previsión es local y gratuita. Consulte el [manual](https://mcp-tool-shop-org.github.io/role-os/handbook/specialist-budget/).
91
+
92
+ ## Estado de la implementación a nivel de organización
93
+
94
+ El estado de la implementación a nivel de organización (cola, decisiones, registros de auditoría, paquetes de bloqueo por repositorio) se encuentra en un repositorio privado independiente: [`role-os-rollout`](https://github.com/mcp-tool-shop-org/role-os-rollout). Este repositorio es el producto; ese repositorio es el estado operativo.
91
95
 
92
96
  ## Memoria y continuidad
93
97
 
94
- Role OS no posee ni duplica la capa de memoria. Cuando existe la memoria del proyecto Claude, esta es el sistema de continuidad canónico: los hechos del repositorio, las decisiones, los problemas pendientes y el historial de tratamiento se almacenan allí.
98
+ Role OS no posee ni duplica la capa de memoria. Donde existe la memoria del proyecto Claude, es el sistema de continuidad canónico: los hechos del repositorio, las decisiones, los puntos pendientes y el historial del tratamiento se almacenan allí.
95
99
 
96
100
  Role OS se integra con la memoria del proyecto Claude. No la reemplaza.
97
101
 
98
- ## Tratamiento completo y verificación de entrega
102
+ ## Tratamiento completo y verificación final
99
103
 
100
- El tratamiento completo es un protocolo canónico de 7 fases definido en la memoria del proyecto Claude (`memory/full-treatment.md`). Role OS dirige y revisa los tratamientos utilizando contratos de roles, transferencias y puertas de revisión, y no redefine el protocolo.
104
+ El tratamiento completo es un protocolo canónico de 7 fases definido en la memoria del proyecto Claude (`memory/full-treatment.md`). Role OS enruta y revisa los tratamientos utilizando contratos de roles, transferencias y puertas de control: no redefine el protocolo.
101
105
 
102
- La **verificación de entrega (Shipcheck)** es la puerta de calidad de 31 elementos que se ejecuta antes del tratamiento completo. Las puertas A, B, C y D deben superarse antes de que comience cualquier tratamiento. Referencia canónica: `memory/shipcheck.md`.
106
+ La **verificación final** es la puerta de control de calidad de 31 elementos que se ejecuta antes del tratamiento completo. Las puertas de control A-D deben superarse antes de que comience cualquier tratamiento. Referencia canónica: `memory/shipcheck.md`.
103
107
 
104
- Orden: Verificación de entrega primero, luego tratamiento completo. No hay versión 1.0.0 sin superar las puertas obligatorias.
108
+ Orden: verificación final primero, luego tratamiento completo. No se lanzará la versión 1.0.0 sin superar las puertas de control obligatorias.
105
109
 
106
- ## 32 roles en 8 paquetes
110
+ ## 61 roles en 10 paquetes
107
111
 
108
112
  | Paquete | Roles |
109
113
  |------|-------|
110
- | **Core** (3) | Orquestador, Estratega de Producto, Evaluador Crítico. |
111
- | **Engineering** (7) | Desarrollador Frontend, Ingeniero Backend, Ingeniero de Pruebas, Ingeniero de Refactorización, Ingeniero de Rendimiento, Auditor de Dependencias, Evaluador de Seguridad. |
112
- | **Design** (2) | Diseñador de Interfaz de Usuario, Guardián de la Marca. |
113
- | **Marketing** (1) | Redactor para Lanzamiento. |
114
- | **Treatment** (7) | Investigador de Repositorios, Traductor de Repositorios, Arquitecto de Documentación, Curador de Metadatos, Auditor de Cobertura, Verificador de Despliegue, Ingeniero de Lanzamiento. |
115
- | **Product** (3) | Generador de comentarios, Priorizador de hoja de ruta, Redactor de especificaciones. |
116
- | **Research** (4) | Investigador de Experiencia de Usuario, Analista de la Competencia, Investigador de Tendencias, Sintetizador de Entrevistas con Usuarios. |
117
- | **Growth** (4) | Estratega de Lanzamiento, Estratega de Contenido, Community Manager, Líder de Soporte. |
114
+ | **Core** (3) | Orquestador, estratega de producto, revisor crítico |
115
+ | **Engineering** (7) | Desarrollador frontend, ingeniero backend, ingeniero de pruebas, ingeniero de refactorización, ingeniero de rendimiento, auditor de dependencias, revisor de seguridad |
116
+ | **Design** (2) | Diseñador de UI, guardián de la marca |
117
+ | **Marketing** (1) | Redactor de textos de lanzamiento |
118
+ | **Treatment** (7) | Investigador de repositorios, traductor de repositorios, arquitecto de documentación, curador de metadatos, auditor de cobertura, verificador de implementación, ingeniero de lanzamiento |
119
+ | **Product** (3) | Sintetizador de comentarios, priorizador de la hoja de ruta, redactor de especificaciones |
120
+ | **Research** (4) | Investigador de UX, analista de la competencia, investigador de tendencias, sintetizador de entrevistas con usuarios |
121
+ | **Growth** (4) | Estratega de lanzamiento, estratega de contenido, gestor de la comunidad, responsable de la gestión de incidencias de soporte |
122
+ | **Deep Audit** (4) | Auditor de componentes, auditor de la verdad de las pruebas, auditor de las uniones, sintetizador de auditorías |
123
+ | **Swarm** (7) | Coordinador de la colmena, agente backend de la colmena, agente puente de la colmena, agente de pruebas de la colmena, agente de infraestructura de la colmena, agente frontend de la colmena, sintetizador de la colmena |
118
124
 
119
- Cada rol tiene un contrato completo: misión, cuándo usar, cuándo no usar, entradas requeridas, salidas requeridas, nivel de calidad y desencadenantes de escalamiento. Cada rol se puede enrutar; `roleos route` puede recomendar cualquiera de ellos en función del contenido del paquete.
125
+ Cada rol tiene un contrato completo: misión, cuándo usar, cuándo no usar, entradas esperadas, salidas requeridas, estándar de calidad y desencadenantes de escalamiento. Cada rol se puede enrutar: `roleos route` puede recomendar cualquiera de ellos en función del contenido del paquete.
120
126
 
121
- ## Cómo empezar
127
+ ## Inicio rápido
122
128
 
123
129
  ```bash
124
130
  npx role-os init
@@ -133,6 +139,19 @@ roleos complete artifact.md # Complete with artifact
133
139
  roleos explain # Show full state
134
140
  roleos report # Completion report
135
141
 
142
+ # Deep audit:
143
+ roleos audit manifest --generate # Create audit-manifest.json
144
+ roleos audit # Start component-level deep audit
145
+ roleos audit status # Check audit progress
146
+ roleos audit verify # Verify manifest and outputs
147
+
148
+ # Dogfood swarm:
149
+ roleos swarm manifest --generate # Auto-detect domains from repo structure
150
+ roleos swarm # Start multi-pass convergence swarm
151
+ roleos swarm status # Check swarm progress by stage
152
+ roleos swarm findings # List findings by severity
153
+ roleos swarm approve # Approve feature gate
154
+
136
155
  # Or go manual:
137
156
  roleos start "fix the crash" # Entry decision only (no run)
138
157
  roleos packet new feature
@@ -146,55 +165,55 @@ roleos packs list
146
165
 
147
166
  ## Cuándo no usar Role OS
148
167
 
149
- - Correcciones de una sola línea, errores tipográficos o errores obvios.
150
- - Investigación exploratoria sin una salida definida.
151
- - Trabajo que se puede realizar en la mente de una persona en 5 minutos.
152
- - Correcciones urgentes que deben enviarse antes de que se complete una cadena de revisión.
153
- - Proyectos donde se prioriza la velocidad sobre la estructura.
168
+ - Correcciones de una sola línea, errores tipográficos u errores evidentes
169
+ - Investigación exploratoria sin resultados definidos
170
+ - Trabajo que cabe en la cabeza de una persona en 5 minutos
171
+ - Correcciones urgentes que deben enviarse antes de que se complete la cadena de revisión
172
+ - Proyectos en los que se prioriza la velocidad sobre la estructura
154
173
 
155
174
  ## Evidencia
156
175
 
157
- Role OS se ha probado en tres tipos de tareas diferentes en dos repositorios con estructuras diferentes:
176
+ Se demostró la eficacia de Role OS en tres configuraciones de prueba en dos repositorios estructuralmente diferentes:
158
177
 
159
178
  **Prueba 001: Trabajo de funciones** (Pantalla de la tripulación, Star Freight)
160
- - Cadena de 7 roles, 45 escenarios de prueba, 0 conflictos de roles.
161
- - Evitó la contaminación de un proyecto derivado, detectó invenciones realizadas directamente y reveló bloqueos reales.
179
+ - Cadena de 7 roles, 45 escenarios de prueba, 0 conflictos de roles
180
+ - Evitó la contaminación del ancestro de la bifurcación, detectó la invención en línea y reveló obstáculos reales
162
181
 
163
182
  **Prueba 002: Trabajo de integración** (Conexión de CampaignState, Star Freight)
164
- - Cadena de 5 roles, resolvió la interfaz arquitectónica sin soluciones alternativas falsas.
165
- - Las pruebas anti-fallback demostraron que la ruta activa es real, no un marcador de posición.
183
+ - Cadena de 5 roles, resolvió la discontinuidad arquitectónica sin recurrir a soluciones provisionales
184
+ - Las pruebas anti-provisional demostraron que la ruta activa es real, no un marcador de posición
166
185
 
167
- **Prueba 003: Trabajo de identidad** (Eliminación de contaminación, Star Freight)
168
- - Cadena de 6 roles, 51 escenarios de prueba, incluyendo una defensa duradera contra la contaminación en el sistema de integración continua.
169
- - Corrigió la desviación de la ficción heredada sin provocar una reestructuración general.
186
+ **Prueba 003: Trabajo de identidad** (Purga de contaminación, Star Freight)
187
+ - Cadena de 6 roles, 51 escenarios de prueba, incluida una defensa duradera contra la contaminación de CI
188
+ - Reparó la desviación heredada sin colapsar en una reestructuración amplia
170
189
 
171
- **Prueba de portabilidad** (Consistencia de la persona, sensor-humor)
172
- - Misma estructura base, diferentes idioma/dominio/entorno.
173
- - Se adapta solo con cambios de contexto; no se realizan modificaciones en el contrato principal.
190
+ **Prueba de portabilidad** (Consistencia de la persona, humor del sensor)
191
+ - Misma estructura, diferente idioma/dominio/pila
192
+ - Adoptado con cambios de contexto únicamente, sin modificaciones del contrato principal
174
193
 
175
194
  **Tratamiento completo FT-001** (portlight-desktop)
176
- - Tratamiento con personal en 7 fases con roles del paquete de tratamiento.
177
- - Verificación de envío probada, sin colisiones de roles.
195
+ - Tratamiento de 7 fases con roles del Treatment Pack
196
+ - Se demostró la validación de Shipcheck, cero conflictos de roles
178
197
 
179
198
  **Tratamiento completo FT-002** (studioflow)
180
- - Mismo paquete de tratamiento, repositorio estructuralmente diferente (espacio de trabajo creativo vs. juego).
181
- - Paquete de tratamiento portátil: no se requieren modificaciones en el contrato.
199
+ - Mismo Treatment Pack, repositorio estructuralmente diferente (espacio de trabajo creativo frente a juego)
200
+ - El Treatment Pack es portátil, no se necesitan modificaciones del contrato
182
201
 
183
- **Ejecución de prueba ideal** (tema del mercado de servidores MCP)
184
- - Cadena de 9 roles, 4 analistas en paralelo, examen cruzado + gráfico de refutación de disputas.
185
- - Se plantearon 4 desafíos, se redujeron 3 afirmaciones, 1 sin resolver: presión saludable, no un punto muerto.
186
- - Más de 16 enlaces de trazado desde los artefactos renderizados hasta los átomos de la capa de verdad.
187
- - Cadena de custodia completa probada: verdad → átomos → disputa → síntesis → expansión → juez → renderizado → trazado.
202
+ **Sesión de lluvia de ideas** (tema del mercado de servidores MCP)
203
+ - Cadena de 9 roles, 4 analistas en paralelo, examen cruzado + refutación del gráfico de disputas
204
+ - Se plantearon 4 desafíos, se redujeron 3 afirmaciones, 1 sin resolver: presión saludable, no un punto muerto
205
+ - Más de 16 enlaces de rastreo desde los artefactos renderizados hasta los átomos de la capa de verdad
206
+ - Se demostró la cadena completa de custodia: verdad → átomos → disputa → síntesis → expansión → juicio → renderizado → rastreo
188
207
 
189
- ## Propiedades fundamentales
208
+ ## Propiedades principales
190
209
 
191
- Estas son innegociables. Si un cambio debilita alguna de ellas, recházalo.
210
+ Estas son innegociables. Si un cambio debilita alguna de ellas, rechácelo.
192
211
 
193
- - Los límites de los roles se mantienen.
194
- - La revisión es rigurosa.
195
- - La escalación se mantiene transparente.
196
- - Los paquetes siguen siendo verificables.
197
- - La portabilidad requiere adaptación al contexto, no una modificación profunda.
212
+ - Los límites de los roles se mantienen
213
+ - La revisión es rigurosa
214
+ - La escalada se mantiene honesta
215
+ - Los paquetes siguen siendo comprobables
216
+ - La portabilidad requiere adaptación al contexto, no cirugía del núcleo
198
217
 
199
218
  ## Estructura del proyecto
200
219
 
@@ -206,18 +225,23 @@ role-os/
206
225
  entry-cmd.mjs ← `roleos start` CLI command
207
226
  run.mjs ← Persistent run engine: create → step → pause → resume → report
208
227
  run-cmd.mjs ← `roleos run/resume/next/explain/complete/fail` + interventions
209
- mission.mjs ← 7 named mission types (feature, bugfix, treatment, docs, security, research, brainstorm)
228
+ mission.mjs ← 9 named mission types (feature, bugfix, treatment, docs, security, research, brainstorm, deep-audit, dogfood-swarm)
210
229
  mission-run.mjs ← Mission runner: create → step → complete → report
211
230
  mission-cmd.mjs ← `roleos mission` CLI commands
212
- route.mjs 31-role routing + dynamic chain builder
213
- packs.mjs 7 calibrated team packs + auto-selection
231
+ audit-cmd.mjs `roleos audit` deep audit entry point with manifest generation
232
+ swarm-cmd.mjs `roleos swarm` dogfood swarm entry point with domain detection
233
+ swarm/ ← Domain detection, build gate, evidence persistence bridge
234
+ route.mjs ← 61-role routing + dynamic chain builder
235
+ packs.mjs ← 10 calibrated team packs + auto-selection
214
236
  conflicts.mjs ← 4-pass conflict detection
215
237
  escalation.mjs ← Auto-routing for blocked/rejected/split
216
238
  evidence.mjs ← Structured evidence + role-aware requirements
217
239
  dispatch.mjs ← Runtime dispatch manifests for multi-claude
218
- artifacts.mjs 30 per-role artifact contracts + 7 pack handoffs
240
+ tool-profiles.mjs Per-role tool sandboxing (shared by dispatch + trial)
241
+ state-machine.mjs ← Canonical step/run transition maps
242
+ artifacts.mjs ← Per-role artifact contracts + pack handoffs
219
243
  decompose.mjs ← Composite task detection + splitting
220
- composite.mjs ← Dependency-ordered execution + recovery
244
+ composite.mjs ← Dependency-ordered execution + recovery + cycle detection
221
245
  replan.mjs ← Mid-run adaptive replanning
222
246
  calibration.mjs ← Outcome recording + weight tuning
223
247
  hooks.mjs ← 5 lifecycle hooks for runtime enforcement
@@ -225,56 +249,60 @@ role-os/
225
249
  brainstorm.mjs ← Evidence modes, request validation, finding/synthesis/judge schemas
226
250
  brainstorm-roles.mjs ← Role-native schemas, input partitioning, blindspot enforcement, cross-exam
227
251
  brainstorm-render.mjs ← Two-layer rendering: lexical bans, render schemas, debate transcript
228
- test/ ← 894 tests across 30 test files
252
+ test/ ← 1150 tests across 37 test files
229
253
  starter-pack/ ← Drop-in role contracts, policies, schemas, workflows
230
254
  ```
231
255
 
232
256
  ## Seguridad
233
257
 
234
- El sistema operativo del rol opera **únicamente de forma local**. Copia las plantillas de Markdown y escribe archivos de paquetes/verdictos en el directorio `.claude/` de su repositorio. No accede a la red, no maneja secretos ni recopila datos de telemetría. No se realizan operaciones peligrosas; todas las escrituras de archivos utilizan la opción "omitir si existe" de forma predeterminada. Consulte [SECURITY.md](SECURITY.md) para obtener la política completa.
258
+ Role OS opera **solo localmente**. Copia las plantillas de Markdown y escribe los archivos de paquetes/verdictos en el directorio `.claude/` de su repositorio. No accede a la red, no gestiona secretos ni recopila datos de telemetría. No realiza operaciones peligrosas: todos los archivos se escriben utilizando la opción "omitir si existe" de forma predeterminada. Consulte [SECURITY.md](SECURITY.md) para obtener la política completa.
235
259
 
236
260
  ## El sistema operativo
237
261
 
238
- | Capa | ¿Qué hace? | Estado |
262
+ | Capa | Qué hace | Estado |
239
263
  |-------|-------------|--------|
240
- | **Routing** | Asigna una puntuación a los 31 roles en función del contenido del paquete, explica las recomendaciones, evalúa la confianza. | ✓ Implementado |
241
- | **Chain builder** | Ensambla cadenas ordenadas por fase a partir de roles con puntuación, sesgadas por tipo de paquete, no bloqueadas por plantillas. | ✓ Implementado |
242
- | **Conflict detection** | Validación de 4 pasos: conflictos duros, secuencia, redundancia, lagunas de cobertura. Sugerencias de reparación. | ✓ Implementado |
243
- | **Escalation** | Redirige automáticamente las tareas bloqueadas/rechazadas/divididas al solucionador adecuado, junto con la razón y el artefacto requerido. | ✓ Implementado |
244
- | **Evidence** | Evidencia estructurada en las decisiones, específica para cada rol. Comprobaciones de suficiencia. 12 tipos de evidencia. | ✓ Implementado |
245
- | **Dispatch** | Genera manifiestos de ejecución para multi-claude. Perfiles de herramientas por rol, indicaciones del sistema, presupuestos. | ✓ Implementado |
246
- | **Trials** | Lista completa probada: 30/30 tareas de oro + 5/5 pruebas negativas. 7 pruebas de paquete completadas. | ✓ Completo |
247
- | **Team Packs** | 7 paquetes calibrados con selección automática, protección contra errores y recuperación flexible. | ✓ Implementado |
248
- | **Outcome calibration** | Registra los resultados de las ejecuciones, ajusta los pesos de los paquetes/roles según los resultados y modifica los umbrales de confianza. | ✓ Implementado |
249
- | **Mixed-task decomposition** | Detecta tareas compuestas, las divide en paquetes secundarios, asigna paquetes, preserva las dependencias. | ✓ Implementado |
250
- | **Composite execution** | Ejecuta los paquetes secundarios en orden de dependencia, transfiriendo artefactos, recuperando ramas y sintetizando. | ✓ Implementado |
251
- | **Adaptive replanning** | Los cambios en el alcance, los hallazgos o los nuevos requisitos durante la ejecución actualizan el plan sin necesidad de reiniciarlo. | ✓ Implementado |
252
- | **Session spine** | `roleos init claude` crea los archivos CLAUDE.md, /roleos-route, /roleos-review y /roleos-status. `roleos doctor` verifica la configuración. Las tarjetas de ruta demuestran la participación. | ✓ Implementado |
253
- | **Hook spine** | 5 ganchos de ciclo de vida (SessionStart, PromptSubmit, PreToolUse, SubagentStart, Stop). Aplicación de políticas: recordatorios en las tarjetas de ruta, control de acceso a herramientas, inyección de roles de subagente, auditoría de finalización. | ✓ Implementado |
254
- | **Artifact spine** | 30 contratos de artefactos por rol. 7 contratos de transferencia de paquetes. Validación estructural. Comprobaciones de integridad de la cadena. Los roles posteriores nunca adivinan lo que recibieron. | ✓ Implementado |
255
- | **Mission library** | 7 misiones con nombre (feature-ship, bugfix, treatment, docs-release, security-hardening, research-launch, brainstorm). Cada una define el paquete, la cadena de roles, el flujo de artefactos, las ramas de escalada y una definición parcial y honesta. Las 7 están probadas. | ✓ Implementado |
256
- | **Mission runner** | Crea ejecuciones, avanza paso a paso con seguimiento del estado, completa o falla con informes precisos. Propagación de pasos bloqueados, advertencias de escalada fuera de la cadena, reapertura del último paso. | ✓ Implementado |
257
- | **Unified entry** | `roleos start` decide automáticamente entre una misión, un paquete o una ruta flexible. Escalera de recuperación con puntuaciones de confianza, alternativas y detección de tareas compuestas. | ✓ Implementado |
258
- | **Persistent runs** | `roleos run` crea ejecuciones respaldadas en disco. Comandos: `resume` (reanudar), `next` (siguiente), `explain` (explicar), `complete` (completar), `fail` (fallar). Intervenciones: `reroute` (redirigir), `escalate` (escalar), `retry` (reintentar), `block` (bloquear), `reopen` (reabrir). Guía específica para cada paso. Medición de la fricción. | ✓ Implementado |
259
- | **Brainstorm** | Arquitectura de dos capas: verdad (esquemas nativos del rol, átomos de procedencia, gráfico de disputa cruzada) + renderizado (5 voces distintas, prohibiciones léxicas, transcripción del debate). Los enlaces de trazado demuestran que cada afirmación renderizada se corresponde con un átomo de verdad. Ejecución de referencia: 894 pruebas. | ✓ Implementado |
260
-
261
- ## 7 misiones
264
+ | **Routing** | Califica los 61 roles según el contenido del paquete, explica las recomendaciones y evalúa la confianza | ✓ Enviado |
265
+ | **Chain builder** | Ensambla cadenas ordenadas por fases a partir de roles calificados, con un sesgo hacia el tipo de paquete, no bloqueado por plantillas | ✓ Enviado |
266
+ | **Conflict detection** | Validación de 4 pasos: conflictos duros, secuencia, redundancia, lagunas de cobertura. Sugerencias de reparación. | ✓ Enviado |
267
+ | **Escalation** | Enruta automáticamente el trabajo bloqueado/rechazado/dividido al resolutor correcto con la razón y el artefacto requerido | ✓ Enviado |
268
+ | **Evidence** | Evidencia estructurada consciente del rol en los veredictos. Comprobaciones de suficiencia. 12 tipos de evidencia. | ✓ Enviado |
269
+ | **Dispatch** | Genera manifiestos de ejecución para multi-claude. Perfiles de herramientas por rol, indicaciones del sistema, presupuestos. | ✓ Enviado |
270
+ | **Trials** | Lista completa probada: 30/30 tareas de oro + 5/5 pruebas negativas. 7 pruebas de paquetes completadas. | ✓ Completo |
271
+ | **Team Packs** | 10 paquetes calibrados con selección automática, protecciones de desajuste y alternativa de enrutamiento libre. | ✓ Enviado |
272
+ | **Outcome calibration** | Registra los resultados de la ejecución, ajusta los pesos de los paquetes/roles a partir de los resultados y ajusta los umbrales de confianza. | ✓ Enviado |
273
+ | **Mixed-task decomposition** | Detecta el trabajo compuesto, lo divide en paquetes secundarios, asigna paquetes y conserva las dependencias. | ✓ Enviado |
274
+ | **Composite execution** | Ejecuta los paquetes secundarios en orden de dependencia con el paso de artefactos, la recuperación de ramas y la síntesis. | ✓ Enviado |
275
+ | **Adaptive replanning** | Los cambios de alcance, los hallazgos o los nuevos requisitos a mitad de la ejecución actualizan el plan sin reiniciar. | ✓ Enviado |
276
+ | **Session spine** | `roleos init claude` crea CLAUDE.md, /roleos-route, /roleos-review, /roleos-status. `roleos doctor` verifica la configuración. Las tarjetas de ruta demuestran la participación. | ✓ Enviado |
277
+ | **Hook spine** | 5 ganchos del ciclo de vida (SessionStart, PromptSubmit, PreToolUse, SubagentStart, Stop). Aplicación de asesoramiento: recordatorios de la tarjeta de ruta, validación de la escritura de herramientas, inyección del rol del subagente, auditoría de finalización. | ✓ Enviado |
278
+ | **Artifact spine** | Contratos de artefactos por rol. Contratos de transferencia de paquetes. Validación estructural. Comprobaciones de la integridad de la cadena. Los roles posteriores nunca adivinan lo que recibieron. | ✓ Enviado |
279
+ | **Mission library** | 9 misiones nombradas (envío de funciones, corrección de errores, tratamiento, lanzamiento de documentación, fortalecimiento de la seguridad, lanzamiento de investigación, lluvia de ideas, auditoría profunda, prueba en grupo). Cada una declara el paquete, la cadena de roles, el flujo de artefactos, las ramas de escalada y la definición honesta-parcial. | ✓ Enviado |
280
+ | **Mission runner** | Cree ejecuciones, avance paso a paso con el estado rastreado, complete/falle con informes honestos. Propagación de pasos bloqueados, advertencias de escalada fuera de la cadena, reapertura del último paso. | ✓ Enviado |
281
+ | **Unified entry** | `roleos start` decide automáticamente la misión frente al paquete frente al enrutamiento libre. Escalera de respaldo con puntuaciones de confianza, alternativas y detección de composición. | ✓ Enviado |
282
+ | **Persistent runs** | `roleos run` crea ejecuciones respaldadas por disco. `resume`, `next`, `explain`, `complete`, `fail`. Intervenciones: reroute, escalate, retry, block, reopen. Guía local del paso. Medición de la fricción. | ✓ Enviado |
283
+ | **Brainstorm** | Arquitectura de dos capas: verdad (esquemas nativos del rol, átomos de procedencia, gráfico de disputas de examen cruzado) + renderizado (5 voces distintas, prohibiciones léxicas, transcripción del debate). Los enlaces de rastreo demuestran que cada afirmación renderizada se asigna a un átomo de verdad. Sesión de prueba exitosa. | ✓ Enviado |
284
+ | **Deep Audit** | Auditoría de repositorio basada en manifiestos: descomponer el repositorio en componentes, asignar N auditores + M auditores de pruebas de veracidad + K auditores de límites a partir del grafo de dependencias, sintetizar en un veredicto clasificado y un plan de acción. La asignación dinámica se escala con el tamaño del repositorio (fórmula 2N + K + 3). Ejecución nativa con validación de artefactos en cada paso. | ✓ Enviado |
285
+ | **Dogfood Swarm** | Convergencia de múltiples pasos: tres etapas de verificación (errores/seguridad → proactiva → humanización) y luego paso de características. Propiedad exclusiva de archivos, puertas de control después de cada iteración, puntos de control del usuario. La detección automática de dominios genera manifiestos. Puente de evidencia hacia los laboratorios de pruebas internas. | ✓ Enviado |
286
+
287
+ ## 9 misiones
262
288
 
263
289
  | Misión | Paquete | Roles | Cuándo usar |
264
290
  |---------|------|-------|-------------|
265
- | `feature-ship` | Característica | 5 | Entrega completa de la característica: alcance → especificación → implementación → prueba → revisión |
266
- | `bugfix` | Corrección de errores | 4 | Diagnosticar la causa raíz, corregir, probar, verificar |
267
- | `treatment` | Tratamiento | 4 | Verificación + pulido + documentación + verificación CI + revisión |
268
- | `docs-release` | Documentación | 2 | Escribir/actualizar documentación, notas de la versión |
269
- | `security-hardening` | Seguridad | 4 | Modelo de amenazas, auditoría, corregir vulnerabilidades, volver a auditar, verificar |
270
- | `research-launch` | Investigación | 4 | Formular la pregunta, investigar, documentar los hallazgos, decidir |
271
- | `brainstorm` | Lluvia de ideas | 9 | Investigación estructurada con múltiples perspectivas, con desacuerdos trazables y resultados. |
272
-
273
- Cada misión incluye definiciones parciales y honestas: cuando el trabajo se detiene, el sistema documenta lo que se completó y lo que queda, en lugar de simular una finalización.
291
+ | `feature-ship` | característica | 5 | Entrega completa de una característica: alcance → especificación → implementación → prueba → revisión |
292
+ | `bugfix` | corrección de errores | 4 | Diagnosticar la causa raíz, corregir, probar, verificar |
293
+ | `treatment` | tratamiento | 4 | Revisión previa al lanzamiento + pulido + documentación + verificación de CI + revisión |
294
+ | `docs-release` | documentación | 2 | Escribir/actualizar la documentación, notas de la versión |
295
+ | `security-hardening` | seguridad | 4 | Modelo de amenazas, auditoría, corrección de vulnerabilidades, reauditoría, verificación |
296
+ | `research-launch` | investigación | 4 | Formular la pregunta, investigar, documentar los hallazgos, decidir |
297
+ | `brainstorm` | lluvia de ideas | 9 | Consulta estructurada con múltiples perspectivas, desacuerdo rastreable y resultado verificable |
298
+ | `deep-audit` | auditoría profunda | 5 (escalas) | Auditoría de repositorio basada en manifiestos: el número de trabajadores se escala con el grafo del repositorio mediante la asignación dinámica |
299
+ | `dogfood-swarm` | enjambre | 8 (escalas) | Convergencia de múltiples pasos: verificación-a verificación-b verificación-c característica síntesis final |
300
+
301
+ Cada misión incluye definiciones honestas y parciales: cuando el trabajo se detiene, el sistema documenta lo que se completó y lo que queda, en lugar de simular que se completó todo.
274
302
 
275
303
  ### Misión de lluvia de ideas
276
304
 
277
- No es una "lluvia de ideas de IA". La misión de lluvia de ideas es **un conjunto de roles especializados bajo un marco legal, con desacuerdos trazables y resultados con valor de juicio.**
305
+ No es una "lluvia de ideas con IA". La misión de lluvia de ideas se basa en **roles especializados bajo la ley, con desacuerdo rastreable y resultados verificables.**
278
306
 
279
307
  ```bash
280
308
  roleos run "explore product directions for a developer tool discovery platform"
@@ -282,33 +310,61 @@ roleos run "explore product directions for a developer tool discovery platform"
282
310
  # Chain: 4 Analysts (parallel) → Normalize → Cross-Examine → Rebut → Synthesize → Expand → Judge
283
311
  ```
284
312
 
285
- **¿Qué la diferencia?**
313
+ **Qué la hace diferente:**
314
+
315
+ - **Capa 1 (veracidad):** Cuatro analistas emiten esquemas nativos de su rol (ContextMap, UserValueMap, MechanicsMap, PositioningMap), no prosa compartida. Cada rol tiene limitaciones impuestas: frases prohibidas, tipos de afirmaciones prohibidas, particiones de entrada filtradas. Los átomos llevan información de procedencia. Un grafo de interrogatorio cruzado dirigido produce desafíos específicos. Los analistas originales defienden, limitan o retiran sus afirmaciones bajo presión.
316
+
317
+ - **Capa 2 (representación):** Cinco voces humanas distintas (Memorándum de límites, Notas de campo, Esquema del sistema, Resumen de afirmaciones, Transcripción del interrogatorio cruzado) con prohibiciones léxicas que impiden la convergencia de las voces. La síntesis consume la veracidad, nunca la prosa representada. Ambas capas siempre están disponibles.
318
+
319
+ - **Cadena de custodia:** Cada oración representada se remonta a un átomo de la capa de veracidad. Las direcciones de síntesis citan átomos. Los objetivos del interrogatorio cruzado son identificadores de afirmaciones reales. El grafo de disputa es el producto, no la prosa.
320
+
321
+ **Probado:** Ejecución de referencia v0.4: se verificó la cadena de custodia completa. Consulte [`examples/golden-run.md`](examples/golden-run.md) para ver la cadena de artefactos completa.
322
+
323
+ ### Misión de auditoría profunda
324
+
325
+ No es un escaneo superficial. La misión de auditoría profunda **descompone un repositorio en componentes delimitados y asigna auditores especializados a una escala determinada por el propio grafo de dependencias del repositorio.**
286
326
 
287
- - **Capa 1 (verdad):** Cuatro analistas emiten esquemas nativos del rol (ContextMap, UserValueMap, MechanicsMap, PositioningMap) — no prosa compartida. Cada rol tiene restricciones para evitar puntos ciegos: frases prohibidas, tipos de afirmaciones prohibidas, particiones de entrada filtradas. Los átomos llevan información de procedencia. Un gráfico de interrogatorio dirigido genera desafíos específicos. Los analistas originales defienden, refinan o retiran sus afirmaciones bajo presión.
327
+ ```bash
328
+ roleos run "deep audit this repo" --manifest=audit-manifest.json
329
+ # → MISSION: Deep Audit (Manifest-Scaled)
330
+ # Steps: Component Auditor ×6 + Test Truth Auditor ×6 + Seam Auditor ×8 + Synthesizer + Action Plan + Critic = 23 steps
331
+ ```
332
+
333
+ **Qué la hace diferente:**
334
+
335
+ - **Asignación dinámica:** el número de trabajadores no es fijo. Un repositorio de 10 componentes con 5 clústeres de límites produce 28 pasos (2 × 10 + 5 + 3). Un repositorio de 3 componentes produce 12. La fórmula de escalado es `2N + K + 3`, donde N = componentes, K = límites.
336
+ - **Paquetes basados en manifiestos:** un archivo `audit-manifest.json` define los componentes (con rutas de archivo, recuentos de líneas, descripciones) y los límites (de/a con descripciones de la interfaz). Cada auditor recibe solo su paquete.
337
+ - **Cuatro arquetipos de roles:** Auditor de componentes (veracidad del código por módulo), Auditor de pruebas de veracidad (pruebas que demuestran vs. pruebas que existen), Auditor de límites (límites de integración del grafo de dependencias), Sintetizador de auditoría (veredicto clasificado + plan de acción de todos los paquetes).
338
+ - **Validación de artefactos en cada paso:** `validateArtifact()` se activa en cada paso completado en ambos caminos de ejecución. Los resultados se adjuntan a los objetos de paso. El sistema sabe si cada artefacto cumplió con su contrato.
339
+ - **Honestidad parcial:** cuando el presupuesto o el alcance impiden la finalización, los hallazgos por componente son individualmente válidos. El sistema sintetiza a partir de lo que se completó, nunca simula una cobertura completa.
340
+
341
+ **Probado:** Ejecución nativa de Runner: 18 pruebas contra un manifiesto real, se verificó el ciclo de vida completo, incluida la reapertura de la escalada y el fallo parcial. Se verificó la fórmula de escalado para manifiestos de 3/6/10/15 componentes.
342
+
343
+ ### Misión de enjambre de pruebas internas
344
+
345
+ No es un análisis de un solo paso. La misión de enjambre de pruebas internas **ejecuta un protocolo de convergencia de múltiples pasos que mueve un repositorio de "funciona" a "listo para producción" a través de tres etapas de verificación y la entrega iterativa de características.**
346
+
347
+ ```bash
348
+ roleos swarm
349
+ # → MISSION: Dogfood Swarm (Multi-Pass Convergence)
350
+ # Stages: Health-A → Health-B → Health-C → Feature → Final
351
+ # Domain agents: 3-5 parallel per wave (exclusive file ownership)
352
+ ```
288
353
 
289
- - **Capa 2 (renderizado):** Cinco voces humanas distintas (Memorándum de Límites, Notas de Campo, Esquema del Sistema, Resumen de Reclamación, Transcripción del Interrogatorio) con restricciones léxicas que evitan la convergencia de las voces. La síntesis consume información verídica, pero nunca produce prosa. Ambas capas están siempre disponibles.
354
+ **Qué la hace diferente:**
290
355
 
291
- - **Cadena de custodia:** Cada oración generada se remonta a un átomo de la capa de verdad. Las instrucciones de síntesis citan átomos. Los interrogatorios se dirigen a identificadores de reclamaciones reales. El grafo de disputas es el producto, no la prosa.
356
+ - **Proceso de verificación en tres etapas:** la etapa A corrige errores y problemas de seguridad (se repite hasta que no haya más errores CRÍTICOS ni ALTOS). La etapa B aplica medidas de seguridad proactivas (los usuarios revisan los resultados). La etapa C humaniza el código: mensajes de error que ayudan a los usuarios, comentarios sobre la reconexión, estados de carga, accesibilidad. Cada etapa es una lente distinta, no es la misma verificación repetida.
357
+ - **Propiedad exclusiva de archivos:** cada agente de dominio posee archivos específicos a través de `swarm-manifest.json`. Ningún agente edita el mismo archivo. No hay conflictos de fusión. No hay sobrecarga de coordinación.
358
+ - **Barreras de compilación:** después de cada iteración, deben superarse las pruebas de lint, verificación de tipos y pruebas. El sistema detecta automáticamente el sistema de compilación (Node, Rust, Python, Go) y ejecuta los comandos correspondientes.
359
+ - **Puntos de control del usuario:** la etapa Health-B y la etapa de características requieren la aprobación explícita del usuario antes de la ejecución. El sistema presenta los resultados y el usuario decide qué compilar.
360
+ - **Convergencia iterativa:** las etapas se repiten en bucle con las iteraciones hasta que se cumplen las condiciones de salida o se alcanza el número máximo de iteraciones. Cada iteración vuelve a auditar desde cero para detectar regresiones introducidas por correcciones anteriores.
361
+ - **Detección automática de dominio:** `roleos swarm manifest --generate` detecta el tipo de repositorio (CLI, web, escritorio, MCP, monorepositorio) y genera asignaciones de dominio que no se superponen.
292
362
 
293
- **Comprobado:** Versión 0.4, ejecución de referencia 894 pruebas, cadena de custodia completamente verificada. Consulte [`examples/golden-run.md`](examples/golden-run.md) para ver la cadena de artefactos completa.
363
+ **Probado:** claude-collaborate (28-03-2026)35→129 pruebas, 106 problemas de verificación resueltos, versión v1.1.0 lanzada. Protocolo v2.0 con 9 fases.
294
364
 
295
365
  ## Estado
296
366
 
297
- - v0.1–v0.4: Fundación pruebas, adopción, paquete de tratamiento, paquete de inicio.
298
- - v1.0.0: 32 roles, interfaz de línea de comandos completa, tratamiento comprobado, portabilidad entre múltiples repositorios.
299
- - v1.0.2: Bloqueo del sistema de roles (correcciones de inicialización de la verdad, init --force).
300
- - v1.1.0: 31 roles, columna vertebral de enrutamiento completa, detección de conflictos, escalamiento, evidencia, despacho, 7 paquetes de equipo comprobados. 35 pruebas de ejecución. 212 pruebas.
301
- - v1.2.0: Paquetes calibrados promovidos a la entrada predeterminada. Selección automática, detección de incompatibilidades, sugerencia alternativa, recuperación de enrutamiento libre. 246 pruebas.
302
- - v1.3.0: Calibración de resultados, descomposición de tareas mixtas, ejecución compuesta, replanificación adaptativa. 317 pruebas.
303
- - v1.4.0: Columna vertebral de la sesión — `roleos init claude`, `roleos doctor`, tarjetas de ruta, comandos /roleos-route + /roleos-review + /roleos-status. 335 pruebas.
304
- - v1.5.0: Columna vertebral de los ganchos — 5 ganchos de ciclo de vida para la aplicación en tiempo de ejecución. 358 pruebas.
305
- - v1.6.0: Columna vertebral de los artefactos — 20 contratos de artefactos por rol, 7 contratos de entrega de paquetes, validación estructural. 385 pruebas.
306
- - v1.7.0: Prueba de finalización — tareas reales ejecutadas a través de toda la pila. Interfaz de línea de comandos `roleos artifacts`. Escalamiento honesto para correcciones estructurales. 398 pruebas.
307
- - v1.8.0: Biblioteca de misiones (Fase S) — 6 misiones con nombre, motor de ejecución, informes de finalización. Endurecido a partir de 6 ejecuciones de prueba reales. 481 pruebas.
308
- - v1.9.0: Ruta de entrada unificada (Fase T) — `roleos start` decide automáticamente entre misión, paquete o enrutamiento libre. Escalera de recuperación, detección compuesta, pruebas de comparación de rutas de entrada. 527 pruebas.
309
- - **v2.0.0**: Optimización de la experiencia del usuario (Fase U) — `roleos run` crea ejecuciones persistentes respaldadas por disco. Reanudar, siguiente, explicar, completar, fallar. Intervenciones: redirigir, escalar, reintentar, bloquear, reabrir. Guía específica para cada paso. Medición de la fricción. 6 pruebas de fricción. 613 pruebas.
310
- - **v2.0.1**: Auditoría del manual, documentación para principiantes, correcciones del número de pruebas. 617 pruebas.
311
- - **v2.1.0**: Misión de lluvia de ideas (v0.4) — roles especializados en el ámbito legal, desacuerdo trazable, salida con valor de veredicto. Arquitectura de dos capas (verdad + renderizado), matriz de permisos de interrogatorio, grafo de disputas, prueba de ejecución de referencia. 7 misiones, 50 roles, 8 paquetes. 894 pruebas.
367
+ Estable y en producción. Consulte el [REGISTRO DE CAMBIOS](CHANGELOG.md) para obtener el historial completo de versiones y los cambios realizados en cada lanzamiento.
312
368
 
313
369
  ## Licencia
314
370
 
@@ -316,4 +372,4 @@ MIT
316
372
 
317
373
  ---
318
374
 
319
- Creado por <a href="https://mcp-tool-shop.github.io/">MCP Tool Shop</a
375
+ Creado por <a href="https://mcp-tool-shop.github.io/">MCP Tool Shop</a>