role-os 2.6.0 → 2.7.1
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
- package/CHANGELOG.md +26 -0
- package/README.es.md +185 -129
- package/README.fr.md +193 -137
- package/README.hi.md +191 -135
- package/README.it.md +186 -130
- package/README.ja.md +191 -135
- package/README.md +6 -18
- package/README.pt-BR.md +188 -132
- package/README.zh.md +192 -139
- package/bin/roleos.mjs +10 -0
- package/package.json +1 -1
- package/src/specialist/budget-consult.mjs +120 -0
- package/src/specialist/client.mjs +131 -0
- package/src/specialist/dispatch.mjs +237 -0
- package/src/specialist/events.mjs +56 -0
- package/src/specialist/gate.mjs +202 -0
- package/src/specialist/registry.mjs +219 -0
- package/src/specialist/shadow.mjs +122 -0
- package/src/specialist/state.mjs +125 -0
- package/src/specialist-cmd.mjs +378 -0
- package/starter-pack/policy/specialist-tier.md +288 -0
- package/starter-pack/schemas/specialist.md +155 -0
package/CHANGELOG.md
CHANGED
|
@@ -1,5 +1,31 @@
|
|
|
1
1
|
# Changelog
|
|
2
2
|
|
|
3
|
+
## 2.7.1
|
|
4
|
+
|
|
5
|
+
### Docs
|
|
6
|
+
- **README + handbook for the production budget consult.** The README gains a "Budget-aware dispatch"
|
|
7
|
+
note (opt-in `ROLEOS_BUDGET_CONSULT`, advisory, fail-open to a deterministic baseline) and a new
|
|
8
|
+
handbook page documents the consult — `consultBudgetForManifest` / `buildDispatchManifestWithBudget`,
|
|
9
|
+
the per-step forecast + receipt, and the `roleos specialist rollback` compensator — wired to the
|
|
10
|
+
landing page. Re-translated across all 8 locales.
|
|
11
|
+
- **README front-door cleanup** — the per-version history block moved to this CHANGELOG; the README
|
|
12
|
+
keeps the value proposition.
|
|
13
|
+
|
|
14
|
+
(Docs only — no code changes from 2.7.0.)
|
|
15
|
+
|
|
16
|
+
## 2.7.0
|
|
17
|
+
|
|
18
|
+
### Added
|
|
19
|
+
|
|
20
|
+
#### Token Budget Analyst — production budget consult (opt-in, default-off)
|
|
21
|
+
|
|
22
|
+
- **`src/specialist/budget-consult.mjs`** — wires the budgeter specialist into dispatch assembly. `consultBudgetForManifest(manifest)` / `buildDispatchManifestWithBudget(options)` consult the Token Budget Analyst per dispatch step (via the proven `dispatchSpecialist` path), attaching an advisory `budgetForecast` + `budgetReceipt` to each step.
|
|
23
|
+
- **Opt-in** via `ROLEOS_BUDGET_CONSULT` (default **off** — production dispatch is byte-identical until the flip, which is a release decision). **Fail-open** to the deterministic baseline `max(ctx*1.5, 50000)` (not Claude); the consult swallows any error into a receipt so it can never break manifest assembly. **Advisory** — it never blocks or gates a dispatch. Compensator: `roleos specialist rollback <role> <version>`.
|
|
24
|
+
- Also lands the **Token Budget Analyst dataset tooling** under `tools/token-budget-dataset/` (the v0.1 harvester + puzzle curriculum + review/freeze pipeline that produced the budgeter's training corpus). Not part of the published CLI package (`files` ships `bin`/`src`/`starter-pack`).
|
|
25
|
+
|
|
26
|
+
### Tests
|
|
27
|
+
- 9 new tests (`specialist-budget-consult`: off=no-op, specialist forecast, fail-open on backend-down + no-registry, never-throws). **1334 total, all green.**
|
|
28
|
+
|
|
3
29
|
## 2.6.0
|
|
4
30
|
|
|
5
31
|
### Changed
|
package/README.es.md
CHANGED
|
@@ -13,20 +13,20 @@
|
|
|
13
13
|
<a href="https://mcp-tool-shop-org.github.io/role-os/"><img src="https://img.shields.io/badge/Landing_Page-live-brightgreen" alt="Landing Page"></a>
|
|
14
14
|
</p>
|
|
15
15
|
|
|
16
|
-
Un sistema operativo multi-Claude que asigna personal, dirige, valida y ejecuta tareas a través de
|
|
16
|
+
Un sistema operativo multi-Claude que asigna personal, dirige, valida y ejecuta tareas a través de 61 contratos de roles especializados. Crea paquetes de tareas, ensambla el equipo adecuado a partir de una evaluación de roles, detecta fallos en la cadena antes de la ejecución, redirige automáticamente la recuperación cuando una tarea se bloquea o se rechaza, y requiere pruebas estructuradas en cada evaluación. Incluye una distribución dinámica para misiones de gran escala: un repositorio de 10 componentes se convierte automáticamente en 28 pasos de auditoría, en lugar de 6.
|
|
17
17
|
|
|
18
|
-
##
|
|
18
|
+
## Qué hace
|
|
19
19
|
|
|
20
|
-
Role OS es la forma profesional de utilizar multi-Claude. Evita los fallos específicos que producen los flujos de trabajo de IA
|
|
20
|
+
Role OS es la forma profesional de utilizar multi-Claude. Evita los fallos específicos que producen los flujos de trabajo genéricos de IA:
|
|
21
21
|
|
|
22
|
-
- **Desviación
|
|
23
|
-
- **Finalización falsa
|
|
24
|
-
- **Contaminación
|
|
25
|
-
- **Progreso basado en
|
|
22
|
+
- **Desviación:** los roles se mantienen dentro de su ámbito. El producto no se rediseña. El frontend no redefine el alcance. El backend no inventa la dirección del producto.
|
|
23
|
+
- **Finalización falsa:** la definición de "completado" es concreta. El trabajo que oculta lagunas, omite la verificación o resuelve un problema diferente se rechaza.
|
|
24
|
+
- **Contaminación:** los proyectos derivados o heredados conservan residuos de identidad. Role OS detecta y rechaza la desviación entre proyectos en la terminología, los elementos visuales y los modelos mentales.
|
|
25
|
+
- **Progreso basado en "sensaciones":** cada transferencia es estructurada. Cada evaluación se vincula a pruebas. "Parece terminado" no es un estado válido.
|
|
26
26
|
|
|
27
|
-
##
|
|
27
|
+
## Cómo funciona
|
|
28
28
|
|
|
29
|
-
|
|
29
|
+
Describe tu tarea. Role OS decide automáticamente el nivel de orquestación adecuado.
|
|
30
30
|
|
|
31
31
|
```bash
|
|
32
32
|
roleos start "fix the crash in save handler"
|
|
@@ -44,13 +44,13 @@ roleos start "something completely novel"
|
|
|
44
44
|
|
|
45
45
|
**La jerarquía de respaldo:**
|
|
46
46
|
|
|
47
|
-
1. **Misión:** cuando la tarea coincide con un flujo de trabajo recurrente probado (corrección de errores, tratamiento, lanzamiento de funciones, documentación, seguridad, investigación). Cadena de roles conocida, flujo de artefactos, ramas de escalamiento y definiciones parciales.
|
|
48
|
-
2. **Paquete:** cuando la tarea
|
|
49
|
-
3. **Enrutamiento libre:** cuando la tarea es novedosa, mixta o incierta.
|
|
47
|
+
1. **Misión:** cuando la tarea coincide con un flujo de trabajo recurrente probado (corrección de errores, tratamiento, lanzamiento de funciones, documentación, seguridad, investigación, lluvia de ideas, auditoría exhaustiva, prueba con usuarios). Cadena de roles conocida, flujo de artefactos, ramas de escalamiento y definiciones honestas y parciales.
|
|
48
|
+
2. **Paquete:** cuando la tarea pertenece a una familia conocida, pero no tiene la estructura completa de una misión. 10 paquetes de equipo calibrados con selección automática y mecanismos de protección contra errores.
|
|
49
|
+
3. **Enrutamiento libre:** cuando la tarea es novedosa, mixta o incierta. Evalúa los 61 roles en función del contenido del paquete y ensambla una cadena dinámica.
|
|
50
50
|
|
|
51
|
-
El sistema nunca fuerza una tarea a través de una abstracción incorrecta. Explica por qué eligió cada nivel y ofrece alternativas.
|
|
51
|
+
El sistema nunca fuerza la ejecución de una tarea a través de una abstracción incorrecta. Explica por qué eligió cada nivel y ofrece alternativas.
|
|
52
52
|
|
|
53
|
-
**Un comando para iniciar la ejecución:**
|
|
53
|
+
**Un solo comando para iniciar la ejecución:**
|
|
54
54
|
|
|
55
55
|
```bash
|
|
56
56
|
roleos run "fix the crash in save handler"
|
|
@@ -77,48 +77,54 @@ roleos block 2 "waiting for API spec"
|
|
|
77
77
|
roleos reopen 0 "found issue in review"
|
|
78
78
|
```
|
|
79
79
|
|
|
80
|
-
Las ejecuciones se guardan en disco (`.claude/runs/`), por lo que las sesiones interrumpidas se reanudan
|
|
80
|
+
Las ejecuciones se guardan en el disco (`.claude/runs/`), por lo que las sesiones interrumpidas se reanudan sin problemas. Cada paso incluye una guía para el operador: qué producir, las secciones requeridas y las condiciones de finalización.
|
|
81
81
|
|
|
82
82
|
**Una vez enrutada:**
|
|
83
83
|
|
|
84
|
-
1. **Cada rol produce una transferencia:** salida estructurada con elementos de
|
|
85
|
-
2. **El
|
|
86
|
-
3. **
|
|
84
|
+
1. **Cada rol produce una transferencia:** salida estructurada con elementos de prueba que reducen la ambigüedad para el siguiente rol.
|
|
85
|
+
2. **El crítico revisa según el contrato:** acepta, rechaza o bloquea basándose en pruebas estructuradas, no en impresiones.
|
|
86
|
+
3. **El enrutamiento de recuperación se realiza automáticamente:** el trabajo bloqueado o rechazado se redirige al solucionador adecuado con una razón, el tipo de recuperación y el artefacto requerido.
|
|
87
87
|
|
|
88
|
-
##
|
|
88
|
+
## Distribución consciente del presupuesto
|
|
89
89
|
|
|
90
|
-
|
|
90
|
+
Role OS puede consultar a un **analista de presupuesto de tokens** local en cada paso de la distribución y adjuntar una previsión de gasto orientativa al manifiesto: opcional (`ROLEOS_BUDGET_CONSULT`), orientativa (nunca bloquea una distribución) y con un mecanismo de seguridad que vuelve a una línea de base determinista. Desactivado por defecto; la previsión es local y gratuita. Consulte el [manual](https://mcp-tool-shop-org.github.io/role-os/handbook/specialist-budget/).
|
|
91
|
+
|
|
92
|
+
## Estado de la implementación a nivel de organización
|
|
93
|
+
|
|
94
|
+
El estado de la implementación a nivel de organización (cola, decisiones, registros de auditoría, paquetes de bloqueo por repositorio) se encuentra en un repositorio privado independiente: [`role-os-rollout`](https://github.com/mcp-tool-shop-org/role-os-rollout). Este repositorio es el producto; ese repositorio es el estado operativo.
|
|
91
95
|
|
|
92
96
|
## Memoria y continuidad
|
|
93
97
|
|
|
94
|
-
Role OS no posee ni duplica la capa de memoria.
|
|
98
|
+
Role OS no posee ni duplica la capa de memoria. Donde existe la memoria del proyecto Claude, es el sistema de continuidad canónico: los hechos del repositorio, las decisiones, los puntos pendientes y el historial del tratamiento se almacenan allí.
|
|
95
99
|
|
|
96
100
|
Role OS se integra con la memoria del proyecto Claude. No la reemplaza.
|
|
97
101
|
|
|
98
|
-
## Tratamiento completo y verificación
|
|
102
|
+
## Tratamiento completo y verificación final
|
|
99
103
|
|
|
100
|
-
El tratamiento completo es un protocolo canónico de 7 fases definido en la memoria del proyecto Claude (`memory/full-treatment.md`). Role OS
|
|
104
|
+
El tratamiento completo es un protocolo canónico de 7 fases definido en la memoria del proyecto Claude (`memory/full-treatment.md`). Role OS enruta y revisa los tratamientos utilizando contratos de roles, transferencias y puertas de control: no redefine el protocolo.
|
|
101
105
|
|
|
102
|
-
La **verificación
|
|
106
|
+
La **verificación final** es la puerta de control de calidad de 31 elementos que se ejecuta antes del tratamiento completo. Las puertas de control A-D deben superarse antes de que comience cualquier tratamiento. Referencia canónica: `memory/shipcheck.md`.
|
|
103
107
|
|
|
104
|
-
Orden:
|
|
108
|
+
Orden: verificación final primero, luego tratamiento completo. No se lanzará la versión 1.0.0 sin superar las puertas de control obligatorias.
|
|
105
109
|
|
|
106
|
-
##
|
|
110
|
+
## 61 roles en 10 paquetes
|
|
107
111
|
|
|
108
112
|
| Paquete | Roles |
|
|
109
113
|
|------|-------|
|
|
110
|
-
| **Core** (3) | Orquestador,
|
|
111
|
-
| **Engineering** (7) | Desarrollador
|
|
112
|
-
| **Design** (2) | Diseñador de
|
|
113
|
-
| **Marketing** (1) | Redactor
|
|
114
|
-
| **Treatment** (7) | Investigador de
|
|
115
|
-
| **Product** (3) |
|
|
116
|
-
| **Research** (4) | Investigador de
|
|
117
|
-
| **Growth** (4) | Estratega de
|
|
114
|
+
| **Core** (3) | Orquestador, estratega de producto, revisor crítico |
|
|
115
|
+
| **Engineering** (7) | Desarrollador frontend, ingeniero backend, ingeniero de pruebas, ingeniero de refactorización, ingeniero de rendimiento, auditor de dependencias, revisor de seguridad |
|
|
116
|
+
| **Design** (2) | Diseñador de UI, guardián de la marca |
|
|
117
|
+
| **Marketing** (1) | Redactor de textos de lanzamiento |
|
|
118
|
+
| **Treatment** (7) | Investigador de repositorios, traductor de repositorios, arquitecto de documentación, curador de metadatos, auditor de cobertura, verificador de implementación, ingeniero de lanzamiento |
|
|
119
|
+
| **Product** (3) | Sintetizador de comentarios, priorizador de la hoja de ruta, redactor de especificaciones |
|
|
120
|
+
| **Research** (4) | Investigador de UX, analista de la competencia, investigador de tendencias, sintetizador de entrevistas con usuarios |
|
|
121
|
+
| **Growth** (4) | Estratega de lanzamiento, estratega de contenido, gestor de la comunidad, responsable de la gestión de incidencias de soporte |
|
|
122
|
+
| **Deep Audit** (4) | Auditor de componentes, auditor de la verdad de las pruebas, auditor de las uniones, sintetizador de auditorías |
|
|
123
|
+
| **Swarm** (7) | Coordinador de la colmena, agente backend de la colmena, agente puente de la colmena, agente de pruebas de la colmena, agente de infraestructura de la colmena, agente frontend de la colmena, sintetizador de la colmena |
|
|
118
124
|
|
|
119
|
-
Cada rol tiene un contrato completo: misión, cuándo usar, cuándo no usar, entradas
|
|
125
|
+
Cada rol tiene un contrato completo: misión, cuándo usar, cuándo no usar, entradas esperadas, salidas requeridas, estándar de calidad y desencadenantes de escalamiento. Cada rol se puede enrutar: `roleos route` puede recomendar cualquiera de ellos en función del contenido del paquete.
|
|
120
126
|
|
|
121
|
-
##
|
|
127
|
+
## Inicio rápido
|
|
122
128
|
|
|
123
129
|
```bash
|
|
124
130
|
npx role-os init
|
|
@@ -133,6 +139,19 @@ roleos complete artifact.md # Complete with artifact
|
|
|
133
139
|
roleos explain # Show full state
|
|
134
140
|
roleos report # Completion report
|
|
135
141
|
|
|
142
|
+
# Deep audit:
|
|
143
|
+
roleos audit manifest --generate # Create audit-manifest.json
|
|
144
|
+
roleos audit # Start component-level deep audit
|
|
145
|
+
roleos audit status # Check audit progress
|
|
146
|
+
roleos audit verify # Verify manifest and outputs
|
|
147
|
+
|
|
148
|
+
# Dogfood swarm:
|
|
149
|
+
roleos swarm manifest --generate # Auto-detect domains from repo structure
|
|
150
|
+
roleos swarm # Start multi-pass convergence swarm
|
|
151
|
+
roleos swarm status # Check swarm progress by stage
|
|
152
|
+
roleos swarm findings # List findings by severity
|
|
153
|
+
roleos swarm approve # Approve feature gate
|
|
154
|
+
|
|
136
155
|
# Or go manual:
|
|
137
156
|
roleos start "fix the crash" # Entry decision only (no run)
|
|
138
157
|
roleos packet new feature
|
|
@@ -146,55 +165,55 @@ roleos packs list
|
|
|
146
165
|
|
|
147
166
|
## Cuándo no usar Role OS
|
|
148
167
|
|
|
149
|
-
- Correcciones de una sola línea, errores tipográficos
|
|
150
|
-
- Investigación exploratoria sin
|
|
151
|
-
- Trabajo que
|
|
152
|
-
- Correcciones urgentes que deben enviarse antes de que se complete
|
|
153
|
-
- Proyectos
|
|
168
|
+
- Correcciones de una sola línea, errores tipográficos u errores evidentes
|
|
169
|
+
- Investigación exploratoria sin resultados definidos
|
|
170
|
+
- Trabajo que cabe en la cabeza de una persona en 5 minutos
|
|
171
|
+
- Correcciones urgentes que deben enviarse antes de que se complete la cadena de revisión
|
|
172
|
+
- Proyectos en los que se prioriza la velocidad sobre la estructura
|
|
154
173
|
|
|
155
174
|
## Evidencia
|
|
156
175
|
|
|
157
|
-
|
|
176
|
+
Se demostró la eficacia de Role OS en tres configuraciones de prueba en dos repositorios estructuralmente diferentes:
|
|
158
177
|
|
|
159
178
|
**Prueba 001: Trabajo de funciones** (Pantalla de la tripulación, Star Freight)
|
|
160
|
-
- Cadena de 7 roles, 45 escenarios de prueba, 0 conflictos de roles
|
|
161
|
-
- Evitó la contaminación de
|
|
179
|
+
- Cadena de 7 roles, 45 escenarios de prueba, 0 conflictos de roles
|
|
180
|
+
- Evitó la contaminación del ancestro de la bifurcación, detectó la invención en línea y reveló obstáculos reales
|
|
162
181
|
|
|
163
182
|
**Prueba 002: Trabajo de integración** (Conexión de CampaignState, Star Freight)
|
|
164
|
-
- Cadena de 5 roles, resolvió la
|
|
165
|
-
- Las pruebas anti-
|
|
183
|
+
- Cadena de 5 roles, resolvió la discontinuidad arquitectónica sin recurrir a soluciones provisionales
|
|
184
|
+
- Las pruebas anti-provisional demostraron que la ruta activa es real, no un marcador de posición
|
|
166
185
|
|
|
167
|
-
**Prueba 003: Trabajo de identidad** (
|
|
168
|
-
- Cadena de 6 roles, 51 escenarios de prueba,
|
|
169
|
-
-
|
|
186
|
+
**Prueba 003: Trabajo de identidad** (Purga de contaminación, Star Freight)
|
|
187
|
+
- Cadena de 6 roles, 51 escenarios de prueba, incluida una defensa duradera contra la contaminación de CI
|
|
188
|
+
- Reparó la desviación heredada sin colapsar en una reestructuración amplia
|
|
170
189
|
|
|
171
|
-
**Prueba de portabilidad** (Consistencia de la persona, sensor
|
|
172
|
-
- Misma estructura
|
|
173
|
-
-
|
|
190
|
+
**Prueba de portabilidad** (Consistencia de la persona, humor del sensor)
|
|
191
|
+
- Misma estructura, diferente idioma/dominio/pila
|
|
192
|
+
- Adoptado con cambios de contexto únicamente, sin modificaciones del contrato principal
|
|
174
193
|
|
|
175
194
|
**Tratamiento completo FT-001** (portlight-desktop)
|
|
176
|
-
- Tratamiento
|
|
177
|
-
-
|
|
195
|
+
- Tratamiento de 7 fases con roles del Treatment Pack
|
|
196
|
+
- Se demostró la validación de Shipcheck, cero conflictos de roles
|
|
178
197
|
|
|
179
198
|
**Tratamiento completo FT-002** (studioflow)
|
|
180
|
-
- Mismo
|
|
181
|
-
-
|
|
199
|
+
- Mismo Treatment Pack, repositorio estructuralmente diferente (espacio de trabajo creativo frente a juego)
|
|
200
|
+
- El Treatment Pack es portátil, no se necesitan modificaciones del contrato
|
|
182
201
|
|
|
183
|
-
**
|
|
184
|
-
- Cadena de 9 roles, 4 analistas en paralelo, examen cruzado +
|
|
185
|
-
- Se plantearon 4 desafíos, se redujeron 3 afirmaciones, 1 sin resolver: presión saludable, no un punto muerto
|
|
186
|
-
- Más de 16 enlaces de
|
|
187
|
-
-
|
|
202
|
+
**Sesión de lluvia de ideas** (tema del mercado de servidores MCP)
|
|
203
|
+
- Cadena de 9 roles, 4 analistas en paralelo, examen cruzado + refutación del gráfico de disputas
|
|
204
|
+
- Se plantearon 4 desafíos, se redujeron 3 afirmaciones, 1 sin resolver: presión saludable, no un punto muerto
|
|
205
|
+
- Más de 16 enlaces de rastreo desde los artefactos renderizados hasta los átomos de la capa de verdad
|
|
206
|
+
- Se demostró la cadena completa de custodia: verdad → átomos → disputa → síntesis → expansión → juicio → renderizado → rastreo
|
|
188
207
|
|
|
189
|
-
## Propiedades
|
|
208
|
+
## Propiedades principales
|
|
190
209
|
|
|
191
|
-
Estas son innegociables. Si un cambio debilita alguna de ellas,
|
|
210
|
+
Estas son innegociables. Si un cambio debilita alguna de ellas, rechácelo.
|
|
192
211
|
|
|
193
|
-
- Los límites de los roles se mantienen
|
|
194
|
-
- La revisión es rigurosa
|
|
195
|
-
- La
|
|
196
|
-
- Los paquetes siguen siendo
|
|
197
|
-
- La portabilidad requiere adaptación al contexto, no
|
|
212
|
+
- Los límites de los roles se mantienen
|
|
213
|
+
- La revisión es rigurosa
|
|
214
|
+
- La escalada se mantiene honesta
|
|
215
|
+
- Los paquetes siguen siendo comprobables
|
|
216
|
+
- La portabilidad requiere adaptación al contexto, no cirugía del núcleo
|
|
198
217
|
|
|
199
218
|
## Estructura del proyecto
|
|
200
219
|
|
|
@@ -206,18 +225,23 @@ role-os/
|
|
|
206
225
|
entry-cmd.mjs ← `roleos start` CLI command
|
|
207
226
|
run.mjs ← Persistent run engine: create → step → pause → resume → report
|
|
208
227
|
run-cmd.mjs ← `roleos run/resume/next/explain/complete/fail` + interventions
|
|
209
|
-
mission.mjs ←
|
|
228
|
+
mission.mjs ← 9 named mission types (feature, bugfix, treatment, docs, security, research, brainstorm, deep-audit, dogfood-swarm)
|
|
210
229
|
mission-run.mjs ← Mission runner: create → step → complete → report
|
|
211
230
|
mission-cmd.mjs ← `roleos mission` CLI commands
|
|
212
|
-
|
|
213
|
-
|
|
231
|
+
audit-cmd.mjs ← `roleos audit` — deep audit entry point with manifest generation
|
|
232
|
+
swarm-cmd.mjs ← `roleos swarm` — dogfood swarm entry point with domain detection
|
|
233
|
+
swarm/ ← Domain detection, build gate, evidence persistence bridge
|
|
234
|
+
route.mjs ← 61-role routing + dynamic chain builder
|
|
235
|
+
packs.mjs ← 10 calibrated team packs + auto-selection
|
|
214
236
|
conflicts.mjs ← 4-pass conflict detection
|
|
215
237
|
escalation.mjs ← Auto-routing for blocked/rejected/split
|
|
216
238
|
evidence.mjs ← Structured evidence + role-aware requirements
|
|
217
239
|
dispatch.mjs ← Runtime dispatch manifests for multi-claude
|
|
218
|
-
|
|
240
|
+
tool-profiles.mjs ← Per-role tool sandboxing (shared by dispatch + trial)
|
|
241
|
+
state-machine.mjs ← Canonical step/run transition maps
|
|
242
|
+
artifacts.mjs ← Per-role artifact contracts + pack handoffs
|
|
219
243
|
decompose.mjs ← Composite task detection + splitting
|
|
220
|
-
composite.mjs ← Dependency-ordered execution + recovery
|
|
244
|
+
composite.mjs ← Dependency-ordered execution + recovery + cycle detection
|
|
221
245
|
replan.mjs ← Mid-run adaptive replanning
|
|
222
246
|
calibration.mjs ← Outcome recording + weight tuning
|
|
223
247
|
hooks.mjs ← 5 lifecycle hooks for runtime enforcement
|
|
@@ -225,56 +249,60 @@ role-os/
|
|
|
225
249
|
brainstorm.mjs ← Evidence modes, request validation, finding/synthesis/judge schemas
|
|
226
250
|
brainstorm-roles.mjs ← Role-native schemas, input partitioning, blindspot enforcement, cross-exam
|
|
227
251
|
brainstorm-render.mjs ← Two-layer rendering: lexical bans, render schemas, debate transcript
|
|
228
|
-
test/ ←
|
|
252
|
+
test/ ← 1150 tests across 37 test files
|
|
229
253
|
starter-pack/ ← Drop-in role contracts, policies, schemas, workflows
|
|
230
254
|
```
|
|
231
255
|
|
|
232
256
|
## Seguridad
|
|
233
257
|
|
|
234
|
-
|
|
258
|
+
Role OS opera **solo localmente**. Copia las plantillas de Markdown y escribe los archivos de paquetes/verdictos en el directorio `.claude/` de su repositorio. No accede a la red, no gestiona secretos ni recopila datos de telemetría. No realiza operaciones peligrosas: todos los archivos se escriben utilizando la opción "omitir si existe" de forma predeterminada. Consulte [SECURITY.md](SECURITY.md) para obtener la política completa.
|
|
235
259
|
|
|
236
260
|
## El sistema operativo
|
|
237
261
|
|
|
238
|
-
| Capa |
|
|
262
|
+
| Capa | Qué hace | Estado |
|
|
239
263
|
|-------|-------------|--------|
|
|
240
|
-
| **Routing** |
|
|
241
|
-
| **Chain builder** | Ensambla cadenas ordenadas por
|
|
242
|
-
| **Conflict detection** | Validación de 4 pasos: conflictos duros, secuencia, redundancia, lagunas de cobertura. Sugerencias de reparación. | ✓
|
|
243
|
-
| **Escalation** |
|
|
244
|
-
| **Evidence** | Evidencia estructurada
|
|
245
|
-
| **Dispatch** | Genera manifiestos de ejecución para multi-claude. Perfiles de herramientas por rol, indicaciones del sistema, presupuestos. | ✓
|
|
246
|
-
| **Trials** | Lista completa probada: 30/30 tareas de oro + 5/5 pruebas negativas. 7 pruebas de
|
|
247
|
-
| **Team Packs** |
|
|
248
|
-
| **Outcome calibration** | Registra los resultados de
|
|
249
|
-
| **Mixed-task decomposition** | Detecta
|
|
250
|
-
| **Composite execution** | Ejecuta los paquetes secundarios en orden de dependencia
|
|
251
|
-
| **Adaptive replanning** | Los cambios
|
|
252
|
-
| **Session spine** | `roleos init claude` crea
|
|
253
|
-
| **Hook spine** | 5 ganchos
|
|
254
|
-
| **Artifact spine** |
|
|
255
|
-
| **Mission library** |
|
|
256
|
-
| **Mission runner** |
|
|
257
|
-
| **Unified entry** | `roleos start` decide automáticamente
|
|
258
|
-
| **Persistent runs** | `roleos run` crea ejecuciones respaldadas
|
|
259
|
-
| **Brainstorm** | Arquitectura de dos capas: verdad (esquemas nativos del rol, átomos de procedencia, gráfico de
|
|
260
|
-
|
|
261
|
-
|
|
264
|
+
| **Routing** | Califica los 61 roles según el contenido del paquete, explica las recomendaciones y evalúa la confianza | ✓ Enviado |
|
|
265
|
+
| **Chain builder** | Ensambla cadenas ordenadas por fases a partir de roles calificados, con un sesgo hacia el tipo de paquete, no bloqueado por plantillas | ✓ Enviado |
|
|
266
|
+
| **Conflict detection** | Validación de 4 pasos: conflictos duros, secuencia, redundancia, lagunas de cobertura. Sugerencias de reparación. | ✓ Enviado |
|
|
267
|
+
| **Escalation** | Enruta automáticamente el trabajo bloqueado/rechazado/dividido al resolutor correcto con la razón y el artefacto requerido | ✓ Enviado |
|
|
268
|
+
| **Evidence** | Evidencia estructurada consciente del rol en los veredictos. Comprobaciones de suficiencia. 12 tipos de evidencia. | ✓ Enviado |
|
|
269
|
+
| **Dispatch** | Genera manifiestos de ejecución para multi-claude. Perfiles de herramientas por rol, indicaciones del sistema, presupuestos. | ✓ Enviado |
|
|
270
|
+
| **Trials** | Lista completa probada: 30/30 tareas de oro + 5/5 pruebas negativas. 7 pruebas de paquetes completadas. | ✓ Completo |
|
|
271
|
+
| **Team Packs** | 10 paquetes calibrados con selección automática, protecciones de desajuste y alternativa de enrutamiento libre. | ✓ Enviado |
|
|
272
|
+
| **Outcome calibration** | Registra los resultados de la ejecución, ajusta los pesos de los paquetes/roles a partir de los resultados y ajusta los umbrales de confianza. | ✓ Enviado |
|
|
273
|
+
| **Mixed-task decomposition** | Detecta el trabajo compuesto, lo divide en paquetes secundarios, asigna paquetes y conserva las dependencias. | ✓ Enviado |
|
|
274
|
+
| **Composite execution** | Ejecuta los paquetes secundarios en orden de dependencia con el paso de artefactos, la recuperación de ramas y la síntesis. | ✓ Enviado |
|
|
275
|
+
| **Adaptive replanning** | Los cambios de alcance, los hallazgos o los nuevos requisitos a mitad de la ejecución actualizan el plan sin reiniciar. | ✓ Enviado |
|
|
276
|
+
| **Session spine** | `roleos init claude` crea CLAUDE.md, /roleos-route, /roleos-review, /roleos-status. `roleos doctor` verifica la configuración. Las tarjetas de ruta demuestran la participación. | ✓ Enviado |
|
|
277
|
+
| **Hook spine** | 5 ganchos del ciclo de vida (SessionStart, PromptSubmit, PreToolUse, SubagentStart, Stop). Aplicación de asesoramiento: recordatorios de la tarjeta de ruta, validación de la escritura de herramientas, inyección del rol del subagente, auditoría de finalización. | ✓ Enviado |
|
|
278
|
+
| **Artifact spine** | Contratos de artefactos por rol. Contratos de transferencia de paquetes. Validación estructural. Comprobaciones de la integridad de la cadena. Los roles posteriores nunca adivinan lo que recibieron. | ✓ Enviado |
|
|
279
|
+
| **Mission library** | 9 misiones nombradas (envío de funciones, corrección de errores, tratamiento, lanzamiento de documentación, fortalecimiento de la seguridad, lanzamiento de investigación, lluvia de ideas, auditoría profunda, prueba en grupo). Cada una declara el paquete, la cadena de roles, el flujo de artefactos, las ramas de escalada y la definición honesta-parcial. | ✓ Enviado |
|
|
280
|
+
| **Mission runner** | Cree ejecuciones, avance paso a paso con el estado rastreado, complete/falle con informes honestos. Propagación de pasos bloqueados, advertencias de escalada fuera de la cadena, reapertura del último paso. | ✓ Enviado |
|
|
281
|
+
| **Unified entry** | `roleos start` decide automáticamente la misión frente al paquete frente al enrutamiento libre. Escalera de respaldo con puntuaciones de confianza, alternativas y detección de composición. | ✓ Enviado |
|
|
282
|
+
| **Persistent runs** | `roleos run` crea ejecuciones respaldadas por disco. `resume`, `next`, `explain`, `complete`, `fail`. Intervenciones: reroute, escalate, retry, block, reopen. Guía local del paso. Medición de la fricción. | ✓ Enviado |
|
|
283
|
+
| **Brainstorm** | Arquitectura de dos capas: verdad (esquemas nativos del rol, átomos de procedencia, gráfico de disputas de examen cruzado) + renderizado (5 voces distintas, prohibiciones léxicas, transcripción del debate). Los enlaces de rastreo demuestran que cada afirmación renderizada se asigna a un átomo de verdad. Sesión de prueba exitosa. | ✓ Enviado |
|
|
284
|
+
| **Deep Audit** | Auditoría de repositorio basada en manifiestos: descomponer el repositorio en componentes, asignar N auditores + M auditores de pruebas de veracidad + K auditores de límites a partir del grafo de dependencias, sintetizar en un veredicto clasificado y un plan de acción. La asignación dinámica se escala con el tamaño del repositorio (fórmula 2N + K + 3). Ejecución nativa con validación de artefactos en cada paso. | ✓ Enviado |
|
|
285
|
+
| **Dogfood Swarm** | Convergencia de múltiples pasos: tres etapas de verificación (errores/seguridad → proactiva → humanización) y luego paso de características. Propiedad exclusiva de archivos, puertas de control después de cada iteración, puntos de control del usuario. La detección automática de dominios genera manifiestos. Puente de evidencia hacia los laboratorios de pruebas internas. | ✓ Enviado |
|
|
286
|
+
|
|
287
|
+
## 9 misiones
|
|
262
288
|
|
|
263
289
|
| Misión | Paquete | Roles | Cuándo usar |
|
|
264
290
|
|---------|------|-------|-------------|
|
|
265
|
-
| `feature-ship` |
|
|
266
|
-
| `bugfix` |
|
|
267
|
-
| `treatment` |
|
|
268
|
-
| `docs-release` |
|
|
269
|
-
| `security-hardening` |
|
|
270
|
-
| `research-launch` |
|
|
271
|
-
| `brainstorm` |
|
|
272
|
-
|
|
273
|
-
|
|
291
|
+
| `feature-ship` | característica | 5 | Entrega completa de una característica: alcance → especificación → implementación → prueba → revisión |
|
|
292
|
+
| `bugfix` | corrección de errores | 4 | Diagnosticar la causa raíz, corregir, probar, verificar |
|
|
293
|
+
| `treatment` | tratamiento | 4 | Revisión previa al lanzamiento + pulido + documentación + verificación de CI + revisión |
|
|
294
|
+
| `docs-release` | documentación | 2 | Escribir/actualizar la documentación, notas de la versión |
|
|
295
|
+
| `security-hardening` | seguridad | 4 | Modelo de amenazas, auditoría, corrección de vulnerabilidades, reauditoría, verificación |
|
|
296
|
+
| `research-launch` | investigación | 4 | Formular la pregunta, investigar, documentar los hallazgos, decidir |
|
|
297
|
+
| `brainstorm` | lluvia de ideas | 9 | Consulta estructurada con múltiples perspectivas, desacuerdo rastreable y resultado verificable |
|
|
298
|
+
| `deep-audit` | auditoría profunda | 5 (escalas) | Auditoría de repositorio basada en manifiestos: el número de trabajadores se escala con el grafo del repositorio mediante la asignación dinámica |
|
|
299
|
+
| `dogfood-swarm` | enjambre | 8 (escalas) | Convergencia de múltiples pasos: verificación-a → verificación-b → verificación-c → característica → síntesis final |
|
|
300
|
+
|
|
301
|
+
Cada misión incluye definiciones honestas y parciales: cuando el trabajo se detiene, el sistema documenta lo que se completó y lo que queda, en lugar de simular que se completó todo.
|
|
274
302
|
|
|
275
303
|
### Misión de lluvia de ideas
|
|
276
304
|
|
|
277
|
-
No es una "lluvia de ideas
|
|
305
|
+
No es una "lluvia de ideas con IA". La misión de lluvia de ideas se basa en **roles especializados bajo la ley, con desacuerdo rastreable y resultados verificables.**
|
|
278
306
|
|
|
279
307
|
```bash
|
|
280
308
|
roleos run "explore product directions for a developer tool discovery platform"
|
|
@@ -282,33 +310,61 @@ roleos run "explore product directions for a developer tool discovery platform"
|
|
|
282
310
|
# Chain: 4 Analysts (parallel) → Normalize → Cross-Examine → Rebut → Synthesize → Expand → Judge
|
|
283
311
|
```
|
|
284
312
|
|
|
285
|
-
|
|
313
|
+
**Qué la hace diferente:**
|
|
314
|
+
|
|
315
|
+
- **Capa 1 (veracidad):** Cuatro analistas emiten esquemas nativos de su rol (ContextMap, UserValueMap, MechanicsMap, PositioningMap), no prosa compartida. Cada rol tiene limitaciones impuestas: frases prohibidas, tipos de afirmaciones prohibidas, particiones de entrada filtradas. Los átomos llevan información de procedencia. Un grafo de interrogatorio cruzado dirigido produce desafíos específicos. Los analistas originales defienden, limitan o retiran sus afirmaciones bajo presión.
|
|
316
|
+
|
|
317
|
+
- **Capa 2 (representación):** Cinco voces humanas distintas (Memorándum de límites, Notas de campo, Esquema del sistema, Resumen de afirmaciones, Transcripción del interrogatorio cruzado) con prohibiciones léxicas que impiden la convergencia de las voces. La síntesis consume la veracidad, nunca la prosa representada. Ambas capas siempre están disponibles.
|
|
318
|
+
|
|
319
|
+
- **Cadena de custodia:** Cada oración representada se remonta a un átomo de la capa de veracidad. Las direcciones de síntesis citan átomos. Los objetivos del interrogatorio cruzado son identificadores de afirmaciones reales. El grafo de disputa es el producto, no la prosa.
|
|
320
|
+
|
|
321
|
+
**Probado:** Ejecución de referencia v0.4: se verificó la cadena de custodia completa. Consulte [`examples/golden-run.md`](examples/golden-run.md) para ver la cadena de artefactos completa.
|
|
322
|
+
|
|
323
|
+
### Misión de auditoría profunda
|
|
324
|
+
|
|
325
|
+
No es un escaneo superficial. La misión de auditoría profunda **descompone un repositorio en componentes delimitados y asigna auditores especializados a una escala determinada por el propio grafo de dependencias del repositorio.**
|
|
286
326
|
|
|
287
|
-
|
|
327
|
+
```bash
|
|
328
|
+
roleos run "deep audit this repo" --manifest=audit-manifest.json
|
|
329
|
+
# → MISSION: Deep Audit (Manifest-Scaled)
|
|
330
|
+
# Steps: Component Auditor ×6 + Test Truth Auditor ×6 + Seam Auditor ×8 + Synthesizer + Action Plan + Critic = 23 steps
|
|
331
|
+
```
|
|
332
|
+
|
|
333
|
+
**Qué la hace diferente:**
|
|
334
|
+
|
|
335
|
+
- **Asignación dinámica:** el número de trabajadores no es fijo. Un repositorio de 10 componentes con 5 clústeres de límites produce 28 pasos (2 × 10 + 5 + 3). Un repositorio de 3 componentes produce 12. La fórmula de escalado es `2N + K + 3`, donde N = componentes, K = límites.
|
|
336
|
+
- **Paquetes basados en manifiestos:** un archivo `audit-manifest.json` define los componentes (con rutas de archivo, recuentos de líneas, descripciones) y los límites (de/a con descripciones de la interfaz). Cada auditor recibe solo su paquete.
|
|
337
|
+
- **Cuatro arquetipos de roles:** Auditor de componentes (veracidad del código por módulo), Auditor de pruebas de veracidad (pruebas que demuestran vs. pruebas que existen), Auditor de límites (límites de integración del grafo de dependencias), Sintetizador de auditoría (veredicto clasificado + plan de acción de todos los paquetes).
|
|
338
|
+
- **Validación de artefactos en cada paso:** `validateArtifact()` se activa en cada paso completado en ambos caminos de ejecución. Los resultados se adjuntan a los objetos de paso. El sistema sabe si cada artefacto cumplió con su contrato.
|
|
339
|
+
- **Honestidad parcial:** cuando el presupuesto o el alcance impiden la finalización, los hallazgos por componente son individualmente válidos. El sistema sintetiza a partir de lo que se completó, nunca simula una cobertura completa.
|
|
340
|
+
|
|
341
|
+
**Probado:** Ejecución nativa de Runner: 18 pruebas contra un manifiesto real, se verificó el ciclo de vida completo, incluida la reapertura de la escalada y el fallo parcial. Se verificó la fórmula de escalado para manifiestos de 3/6/10/15 componentes.
|
|
342
|
+
|
|
343
|
+
### Misión de enjambre de pruebas internas
|
|
344
|
+
|
|
345
|
+
No es un análisis de un solo paso. La misión de enjambre de pruebas internas **ejecuta un protocolo de convergencia de múltiples pasos que mueve un repositorio de "funciona" a "listo para producción" a través de tres etapas de verificación y la entrega iterativa de características.**
|
|
346
|
+
|
|
347
|
+
```bash
|
|
348
|
+
roleos swarm
|
|
349
|
+
# → MISSION: Dogfood Swarm (Multi-Pass Convergence)
|
|
350
|
+
# Stages: Health-A → Health-B → Health-C → Feature → Final
|
|
351
|
+
# Domain agents: 3-5 parallel per wave (exclusive file ownership)
|
|
352
|
+
```
|
|
288
353
|
|
|
289
|
-
|
|
354
|
+
**Qué la hace diferente:**
|
|
290
355
|
|
|
291
|
-
- **
|
|
356
|
+
- **Proceso de verificación en tres etapas:** la etapa A corrige errores y problemas de seguridad (se repite hasta que no haya más errores CRÍTICOS ni ALTOS). La etapa B aplica medidas de seguridad proactivas (los usuarios revisan los resultados). La etapa C humaniza el código: mensajes de error que ayudan a los usuarios, comentarios sobre la reconexión, estados de carga, accesibilidad. Cada etapa es una lente distinta, no es la misma verificación repetida.
|
|
357
|
+
- **Propiedad exclusiva de archivos:** cada agente de dominio posee archivos específicos a través de `swarm-manifest.json`. Ningún agente edita el mismo archivo. No hay conflictos de fusión. No hay sobrecarga de coordinación.
|
|
358
|
+
- **Barreras de compilación:** después de cada iteración, deben superarse las pruebas de lint, verificación de tipos y pruebas. El sistema detecta automáticamente el sistema de compilación (Node, Rust, Python, Go) y ejecuta los comandos correspondientes.
|
|
359
|
+
- **Puntos de control del usuario:** la etapa Health-B y la etapa de características requieren la aprobación explícita del usuario antes de la ejecución. El sistema presenta los resultados y el usuario decide qué compilar.
|
|
360
|
+
- **Convergencia iterativa:** las etapas se repiten en bucle con las iteraciones hasta que se cumplen las condiciones de salida o se alcanza el número máximo de iteraciones. Cada iteración vuelve a auditar desde cero para detectar regresiones introducidas por correcciones anteriores.
|
|
361
|
+
- **Detección automática de dominio:** `roleos swarm manifest --generate` detecta el tipo de repositorio (CLI, web, escritorio, MCP, monorepositorio) y genera asignaciones de dominio que no se superponen.
|
|
292
362
|
|
|
293
|
-
**
|
|
363
|
+
**Probado:** claude-collaborate (28-03-2026) — 35→129 pruebas, 106 problemas de verificación resueltos, versión v1.1.0 lanzada. Protocolo v2.0 con 9 fases.
|
|
294
364
|
|
|
295
365
|
## Estado
|
|
296
366
|
|
|
297
|
-
|
|
298
|
-
- v1.0.0: 32 roles, interfaz de línea de comandos completa, tratamiento comprobado, portabilidad entre múltiples repositorios.
|
|
299
|
-
- v1.0.2: Bloqueo del sistema de roles (correcciones de inicialización de la verdad, init --force).
|
|
300
|
-
- v1.1.0: 31 roles, columna vertebral de enrutamiento completa, detección de conflictos, escalamiento, evidencia, despacho, 7 paquetes de equipo comprobados. 35 pruebas de ejecución. 212 pruebas.
|
|
301
|
-
- v1.2.0: Paquetes calibrados promovidos a la entrada predeterminada. Selección automática, detección de incompatibilidades, sugerencia alternativa, recuperación de enrutamiento libre. 246 pruebas.
|
|
302
|
-
- v1.3.0: Calibración de resultados, descomposición de tareas mixtas, ejecución compuesta, replanificación adaptativa. 317 pruebas.
|
|
303
|
-
- v1.4.0: Columna vertebral de la sesión — `roleos init claude`, `roleos doctor`, tarjetas de ruta, comandos /roleos-route + /roleos-review + /roleos-status. 335 pruebas.
|
|
304
|
-
- v1.5.0: Columna vertebral de los ganchos — 5 ganchos de ciclo de vida para la aplicación en tiempo de ejecución. 358 pruebas.
|
|
305
|
-
- v1.6.0: Columna vertebral de los artefactos — 20 contratos de artefactos por rol, 7 contratos de entrega de paquetes, validación estructural. 385 pruebas.
|
|
306
|
-
- v1.7.0: Prueba de finalización — tareas reales ejecutadas a través de toda la pila. Interfaz de línea de comandos `roleos artifacts`. Escalamiento honesto para correcciones estructurales. 398 pruebas.
|
|
307
|
-
- v1.8.0: Biblioteca de misiones (Fase S) — 6 misiones con nombre, motor de ejecución, informes de finalización. Endurecido a partir de 6 ejecuciones de prueba reales. 481 pruebas.
|
|
308
|
-
- v1.9.0: Ruta de entrada unificada (Fase T) — `roleos start` decide automáticamente entre misión, paquete o enrutamiento libre. Escalera de recuperación, detección compuesta, pruebas de comparación de rutas de entrada. 527 pruebas.
|
|
309
|
-
- **v2.0.0**: Optimización de la experiencia del usuario (Fase U) — `roleos run` crea ejecuciones persistentes respaldadas por disco. Reanudar, siguiente, explicar, completar, fallar. Intervenciones: redirigir, escalar, reintentar, bloquear, reabrir. Guía específica para cada paso. Medición de la fricción. 6 pruebas de fricción. 613 pruebas.
|
|
310
|
-
- **v2.0.1**: Auditoría del manual, documentación para principiantes, correcciones del número de pruebas. 617 pruebas.
|
|
311
|
-
- **v2.1.0**: Misión de lluvia de ideas (v0.4) — roles especializados en el ámbito legal, desacuerdo trazable, salida con valor de veredicto. Arquitectura de dos capas (verdad + renderizado), matriz de permisos de interrogatorio, grafo de disputas, prueba de ejecución de referencia. 7 misiones, 50 roles, 8 paquetes. 894 pruebas.
|
|
367
|
+
Estable y en producción. Consulte el [REGISTRO DE CAMBIOS](CHANGELOG.md) para obtener el historial completo de versiones y los cambios realizados en cada lanzamiento.
|
|
312
368
|
|
|
313
369
|
## Licencia
|
|
314
370
|
|
|
@@ -316,4 +372,4 @@ MIT
|
|
|
316
372
|
|
|
317
373
|
---
|
|
318
374
|
|
|
319
|
-
Creado por <a href="https://mcp-tool-shop.github.io/">MCP Tool Shop</a
|
|
375
|
+
Creado por <a href="https://mcp-tool-shop.github.io/">MCP Tool Shop</a>
|