role-os 2.3.1 → 2.6.0
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
- package/CHANGELOG.md +484 -437
- package/README.es.md +319 -319
- package/README.fr.md +319 -319
- package/README.hi.md +319 -319
- package/README.it.md +319 -319
- package/README.ja.md +319 -319
- package/README.md +387 -387
- package/README.pt-BR.md +319 -319
- package/README.zh.md +322 -322
- package/bin/roleos.mjs +230 -225
- package/package.json +51 -51
- package/src/artifacts.mjs +693 -647
- package/src/brainstorm-render.mjs +462 -462
- package/src/brainstorm-roles.mjs +817 -817
- package/src/brainstorm.mjs +778 -778
- package/src/citation-panel.mjs +251 -0
- package/src/dispatch.mjs +265 -265
- package/src/mission.mjs +655 -655
- package/src/packs.mjs +467 -467
- package/src/route.mjs +766 -766
- package/src/run-cmd.mjs +408 -408
- package/src/run.mjs +1000 -1000
- package/src/swarm/persist-bridge.mjs +4 -4
- package/src/verify-citations-cmd.mjs +138 -0
- package/src/verify-citations.mjs +523 -0
- package/starter-pack/agents/engineering/caption-auditor.md +61 -0
- package/starter-pack/agents/engineering/monster-taxonomy-verifier.md +62 -0
- package/starter-pack/agents/engineering/red-teamer.md +75 -0
- package/starter-pack/policy/tool-permissions.md +19 -0
package/README.es.md
CHANGED
|
@@ -1,319 +1,319 @@
|
|
|
1
|
-
<p align="center">
|
|
2
|
-
<a href="README.ja.md">日本語</a> | <a href="README.zh.md">中文</a> | <a href="README.md">English</a> | <a href="README.fr.md">Français</a> | <a href="README.hi.md">हिन्दी</a> | <a href="README.it.md">Italiano</a> | <a href="README.pt-BR.md">Português (BR)</a>
|
|
3
|
-
</p>
|
|
4
|
-
|
|
5
|
-
<p align="center">
|
|
6
|
-
<img src="https://raw.githubusercontent.com/mcp-tool-shop-org/brand/main/logos/role-os/readme.png" alt="Role OS" width="600">
|
|
7
|
-
</p>
|
|
8
|
-
|
|
9
|
-
<p align="center">
|
|
10
|
-
<a href="https://github.com/mcp-tool-shop-org/role-os/actions"><img src="https://github.com/mcp-tool-shop-org/role-os/actions/workflows/ci.yml/badge.svg" alt="CI"></a>
|
|
11
|
-
<a href="https://www.npmjs.com/package/role-os"><img src="https://img.shields.io/npm/v/role-os" alt="npm"></a>
|
|
12
|
-
<a href="LICENSE"><img src="https://img.shields.io/badge/license-MIT-blue" alt="MIT License"></a>
|
|
13
|
-
<a href="https://mcp-tool-shop-org.github.io/role-os/"><img src="https://img.shields.io/badge/Landing_Page-live-brightgreen" alt="Landing Page"></a>
|
|
14
|
-
</p>
|
|
15
|
-
|
|
16
|
-
Un sistema operativo multi-Claude que asigna personal, dirige, valida y ejecuta tareas a través de 50 contratos de roles especializados. Crea paquetes de tareas, ensambla el equipo adecuado mediante la coincidencia de roles, detecta problemas antes de la ejecución, redirige automáticamente la recuperación cuando una tarea se bloquea o se rechaza, y requiere evidencia estructurada en cada decisión.
|
|
17
|
-
|
|
18
|
-
## ¿Qué hace?
|
|
19
|
-
|
|
20
|
-
Role OS es la forma profesional de utilizar multi-Claude. Evita los fallos específicos que producen los flujos de trabajo de IA genéricos:
|
|
21
|
-
|
|
22
|
-
- **Desviación (Drift)**: Los roles se mantienen dentro de su ámbito. El producto no se rediseña. La interfaz de usuario no redefine el alcance. El backend no inventa la dirección del producto.
|
|
23
|
-
- **Finalización falsa**: La definición de "hecho" es concreta. El trabajo que oculta deficiencias, omite la verificación o resuelve un problema diferente es rechazado.
|
|
24
|
-
- **Contaminación**: Los proyectos bifurcados o heredados conservan residuos de identidad. Role OS detecta y rechaza las desviaciones entre proyectos en terminología, elementos visuales y modelos mentales.
|
|
25
|
-
- **Progreso basado en impresiones**: Cada transferencia es estructurada. Cada decisión se basa en evidencia. "Parece que está terminado" no es un estado válido.
|
|
26
|
-
|
|
27
|
-
## ¿Cómo funciona?
|
|
28
|
-
|
|
29
|
-
Describa su tarea. Role OS decide automáticamente el nivel de orquestación adecuado.
|
|
30
|
-
|
|
31
|
-
```bash
|
|
32
|
-
roleos start "fix the crash in save handler"
|
|
33
|
-
# → MISSION: Bugfix & Diagnosis (70% confidence)
|
|
34
|
-
# Chain: Repo Researcher → Backend Engineer → Test Engineer → Critic Reviewer
|
|
35
|
-
|
|
36
|
-
roleos start "add a new export command"
|
|
37
|
-
# → PACK: Feature Build (50% confidence)
|
|
38
|
-
# Roles: Orchestrator, Product Strategist, Spec Writer, Backend Engineer, Test Engineer, Critic Reviewer
|
|
39
|
-
|
|
40
|
-
roleos start "something completely novel"
|
|
41
|
-
# → FREE-ROUTING (10% confidence)
|
|
42
|
-
# Hint: Create a packet and run `roleos route` for role-level routing
|
|
43
|
-
```
|
|
44
|
-
|
|
45
|
-
**La jerarquía de respaldo:**
|
|
46
|
-
|
|
47
|
-
1. **Misión:** cuando la tarea coincide con un flujo de trabajo recurrente probado (corrección de errores, tratamiento, lanzamiento de funciones, documentación, seguridad, investigación). Cadena de roles conocida, flujo de artefactos, ramas de escalamiento y definiciones parciales.
|
|
48
|
-
2. **Paquete:** cuando la tarea es una familia conocida pero no una misión completa. 7 paquetes de equipo calibrados con selección automática y protecciones contra errores.
|
|
49
|
-
3. **Enrutamiento libre:** cuando la tarea es novedosa, mixta o incierta. Asigna una puntuación a los 31 roles en función del contenido del paquete y ensambla una cadena dinámica.
|
|
50
|
-
|
|
51
|
-
El sistema nunca fuerza una tarea a través de una abstracción incorrecta. Explica por qué eligió cada nivel y ofrece alternativas.
|
|
52
|
-
|
|
53
|
-
**Un comando para iniciar la ejecución:**
|
|
54
|
-
|
|
55
|
-
```bash
|
|
56
|
-
roleos run "fix the crash in save handler"
|
|
57
|
-
# → Created run: run-1234
|
|
58
|
-
# → Entry: MISSION (bugfix)
|
|
59
|
-
# → Started step 0: Repo Researcher → diagnosis-report
|
|
60
|
-
# → Guidance: Required sections: entrypoints, module-map, build-test-commands
|
|
61
|
-
|
|
62
|
-
roleos next # Start the next step
|
|
63
|
-
roleos complete diagnosis.md # Complete the active step with artifact
|
|
64
|
-
roleos explain # Show full run state and guidance
|
|
65
|
-
roleos resume # Continue an interrupted run
|
|
66
|
-
roleos report # Generate completion report
|
|
67
|
-
roleos friction # Measure operator touches
|
|
68
|
-
```
|
|
69
|
-
|
|
70
|
-
**Intervenciones cuando algo sale mal:**
|
|
71
|
-
|
|
72
|
-
```bash
|
|
73
|
-
roleos retry 0 # Retry a failed step
|
|
74
|
-
roleos reroute 1 "Frontend Developer" "UI bug" # Swap a role
|
|
75
|
-
roleos escalate "Test Engineer" "Repo Researcher" "missed edge case" "re-diagnose"
|
|
76
|
-
roleos block 2 "waiting for API spec"
|
|
77
|
-
roleos reopen 0 "found issue in review"
|
|
78
|
-
```
|
|
79
|
-
|
|
80
|
-
Las ejecuciones se guardan en disco (`.claude/runs/`), por lo que las sesiones interrumpidas se reanudan correctamente. Cada paso incluye orientación para el operador: qué producir, secciones requeridas y condiciones de parada.
|
|
81
|
-
|
|
82
|
-
**Una vez enrutada:**
|
|
83
|
-
|
|
84
|
-
1. **Cada rol produce una transferencia:** salida estructurada con elementos de evidencia que reducen la ambigüedad para el siguiente rol.
|
|
85
|
-
2. **El revisor evalúa según el contrato:** acepta, rechaza o bloquea en función de la evidencia estructurada, no de la impresión.
|
|
86
|
-
3. **La recuperación se redirige automáticamente:** las tareas bloqueadas o rechazadas se redirigen al solucionador adecuado, junto con la razón, el tipo de recuperación y el artefacto requerido.
|
|
87
|
-
|
|
88
|
-
## Estado de implementación en la organización
|
|
89
|
-
|
|
90
|
-
El estado de implementación en toda la organización (cola, decisiones, registros de auditoría, paquetes de bloqueo por repositorio) se encuentra en un repositorio privado separado: [`role-os-rollout`](https://github.com/mcp-tool-shop-org/role-os-rollout). Este repositorio es el producto; ese repositorio es el estado operativo.
|
|
91
|
-
|
|
92
|
-
## Memoria y continuidad
|
|
93
|
-
|
|
94
|
-
Role OS no posee ni duplica la capa de memoria. Cuando existe la memoria del proyecto Claude, esta es el sistema de continuidad canónico: los hechos del repositorio, las decisiones, los problemas pendientes y el historial de tratamiento se almacenan allí.
|
|
95
|
-
|
|
96
|
-
Role OS se integra con la memoria del proyecto Claude. No la reemplaza.
|
|
97
|
-
|
|
98
|
-
## Tratamiento completo y verificación de entrega
|
|
99
|
-
|
|
100
|
-
El tratamiento completo es un protocolo canónico de 7 fases definido en la memoria del proyecto Claude (`memory/full-treatment.md`). Role OS dirige y revisa los tratamientos utilizando contratos de roles, transferencias y puertas de revisión, y no redefine el protocolo.
|
|
101
|
-
|
|
102
|
-
La **verificación de entrega (Shipcheck)** es la puerta de calidad de 31 elementos que se ejecuta antes del tratamiento completo. Las puertas A, B, C y D deben superarse antes de que comience cualquier tratamiento. Referencia canónica: `memory/shipcheck.md`.
|
|
103
|
-
|
|
104
|
-
Orden: Verificación de entrega primero, luego tratamiento completo. No hay versión 1.0.0 sin superar las puertas obligatorias.
|
|
105
|
-
|
|
106
|
-
## 32 roles en 8 paquetes
|
|
107
|
-
|
|
108
|
-
| Paquete | Roles |
|
|
109
|
-
|------|-------|
|
|
110
|
-
| **Core** (3) | Orquestador, Estratega de Producto, Evaluador Crítico. |
|
|
111
|
-
| **Engineering** (7) | Desarrollador Frontend, Ingeniero Backend, Ingeniero de Pruebas, Ingeniero de Refactorización, Ingeniero de Rendimiento, Auditor de Dependencias, Evaluador de Seguridad. |
|
|
112
|
-
| **Design** (2) | Diseñador de Interfaz de Usuario, Guardián de la Marca. |
|
|
113
|
-
| **Marketing** (1) | Redactor para Lanzamiento. |
|
|
114
|
-
| **Treatment** (7) | Investigador de Repositorios, Traductor de Repositorios, Arquitecto de Documentación, Curador de Metadatos, Auditor de Cobertura, Verificador de Despliegue, Ingeniero de Lanzamiento. |
|
|
115
|
-
| **Product** (3) | Generador de comentarios, Priorizador de hoja de ruta, Redactor de especificaciones. |
|
|
116
|
-
| **Research** (4) | Investigador de Experiencia de Usuario, Analista de la Competencia, Investigador de Tendencias, Sintetizador de Entrevistas con Usuarios. |
|
|
117
|
-
| **Growth** (4) | Estratega de Lanzamiento, Estratega de Contenido, Community Manager, Líder de Soporte. |
|
|
118
|
-
|
|
119
|
-
Cada rol tiene un contrato completo: misión, cuándo usar, cuándo no usar, entradas requeridas, salidas requeridas, nivel de calidad y desencadenantes de escalamiento. Cada rol se puede enrutar; `roleos route` puede recomendar cualquiera de ellos en función del contenido del paquete.
|
|
120
|
-
|
|
121
|
-
## Cómo empezar
|
|
122
|
-
|
|
123
|
-
```bash
|
|
124
|
-
npx role-os init
|
|
125
|
-
|
|
126
|
-
# Describe what you need — Role OS picks the right level:
|
|
127
|
-
roleos run "fix the crash in save handler"
|
|
128
|
-
# → Creates run, picks bugfix mission, starts first step with guidance
|
|
129
|
-
|
|
130
|
-
# Step through:
|
|
131
|
-
roleos next # Start next step
|
|
132
|
-
roleos complete artifact.md # Complete with artifact
|
|
133
|
-
roleos explain # Show full state
|
|
134
|
-
roleos report # Completion report
|
|
135
|
-
|
|
136
|
-
# Or go manual:
|
|
137
|
-
roleos start "fix the crash" # Entry decision only (no run)
|
|
138
|
-
roleos packet new feature
|
|
139
|
-
roleos route .claude/packets/my-feature.md
|
|
140
|
-
roleos review .claude/packets/my-feature.md accept
|
|
141
|
-
|
|
142
|
-
# Explore missions and packs:
|
|
143
|
-
roleos mission list
|
|
144
|
-
roleos packs list
|
|
145
|
-
```
|
|
146
|
-
|
|
147
|
-
## Cuándo no usar Role OS
|
|
148
|
-
|
|
149
|
-
- Correcciones de una sola línea, errores tipográficos o errores obvios.
|
|
150
|
-
- Investigación exploratoria sin una salida definida.
|
|
151
|
-
- Trabajo que se puede realizar en la mente de una persona en 5 minutos.
|
|
152
|
-
- Correcciones urgentes que deben enviarse antes de que se complete una cadena de revisión.
|
|
153
|
-
- Proyectos donde se prioriza la velocidad sobre la estructura.
|
|
154
|
-
|
|
155
|
-
## Evidencia
|
|
156
|
-
|
|
157
|
-
Role OS se ha probado en tres tipos de tareas diferentes en dos repositorios con estructuras diferentes:
|
|
158
|
-
|
|
159
|
-
**Prueba 001: Trabajo de funciones** (Pantalla de la tripulación, Star Freight)
|
|
160
|
-
- Cadena de 7 roles, 45 escenarios de prueba, 0 conflictos de roles.
|
|
161
|
-
- Evitó la contaminación de un proyecto derivado, detectó invenciones realizadas directamente y reveló bloqueos reales.
|
|
162
|
-
|
|
163
|
-
**Prueba 002: Trabajo de integración** (Conexión de CampaignState, Star Freight)
|
|
164
|
-
- Cadena de 5 roles, resolvió la interfaz arquitectónica sin soluciones alternativas falsas.
|
|
165
|
-
- Las pruebas anti-fallback demostraron que la ruta activa es real, no un marcador de posición.
|
|
166
|
-
|
|
167
|
-
**Prueba 003: Trabajo de identidad** (Eliminación de contaminación, Star Freight)
|
|
168
|
-
- Cadena de 6 roles, 51 escenarios de prueba, incluyendo una defensa duradera contra la contaminación en el sistema de integración continua.
|
|
169
|
-
- Corrigió la desviación de la ficción heredada sin provocar una reestructuración general.
|
|
170
|
-
|
|
171
|
-
**Prueba de portabilidad** (Consistencia de la persona, sensor-humor)
|
|
172
|
-
- Misma estructura base, diferentes idioma/dominio/entorno.
|
|
173
|
-
- Se adapta solo con cambios de contexto; no se realizan modificaciones en el contrato principal.
|
|
174
|
-
|
|
175
|
-
**Tratamiento completo FT-001** (portlight-desktop)
|
|
176
|
-
- Tratamiento con personal en 7 fases con roles del paquete de tratamiento.
|
|
177
|
-
- Verificación de envío probada, sin colisiones de roles.
|
|
178
|
-
|
|
179
|
-
**Tratamiento completo FT-002** (studioflow)
|
|
180
|
-
- Mismo paquete de tratamiento, repositorio estructuralmente diferente (espacio de trabajo creativo vs. juego).
|
|
181
|
-
- Paquete de tratamiento portátil: no se requieren modificaciones en el contrato.
|
|
182
|
-
|
|
183
|
-
**Ejecución de prueba ideal** (tema del mercado de servidores MCP)
|
|
184
|
-
- Cadena de 9 roles, 4 analistas en paralelo, examen cruzado + gráfico de refutación de disputas.
|
|
185
|
-
- Se plantearon 4 desafíos, se redujeron 3 afirmaciones, 1 sin resolver: presión saludable, no un punto muerto.
|
|
186
|
-
- Más de 16 enlaces de trazado desde los artefactos renderizados hasta los átomos de la capa de verdad.
|
|
187
|
-
- Cadena de custodia completa probada: verdad → átomos → disputa → síntesis → expansión → juez → renderizado → trazado.
|
|
188
|
-
|
|
189
|
-
## Propiedades fundamentales
|
|
190
|
-
|
|
191
|
-
Estas son innegociables. Si un cambio debilita alguna de ellas, recházalo.
|
|
192
|
-
|
|
193
|
-
- Los límites de los roles se mantienen.
|
|
194
|
-
- La revisión es rigurosa.
|
|
195
|
-
- La escalación se mantiene transparente.
|
|
196
|
-
- Los paquetes siguen siendo verificables.
|
|
197
|
-
- La portabilidad requiere adaptación al contexto, no una modificación profunda.
|
|
198
|
-
|
|
199
|
-
## Estructura del proyecto
|
|
200
|
-
|
|
201
|
-
```
|
|
202
|
-
role-os/
|
|
203
|
-
bin/roleos.mjs ← CLI entrypoint
|
|
204
|
-
src/
|
|
205
|
-
entry.mjs ← Unified entry: mission → pack → free routing
|
|
206
|
-
entry-cmd.mjs ← `roleos start` CLI command
|
|
207
|
-
run.mjs ← Persistent run engine: create → step → pause → resume → report
|
|
208
|
-
run-cmd.mjs ← `roleos run/resume/next/explain/complete/fail` + interventions
|
|
209
|
-
mission.mjs ← 7 named mission types (feature, bugfix, treatment, docs, security, research, brainstorm)
|
|
210
|
-
mission-run.mjs ← Mission runner: create → step → complete → report
|
|
211
|
-
mission-cmd.mjs ← `roleos mission` CLI commands
|
|
212
|
-
route.mjs ← 31-role routing + dynamic chain builder
|
|
213
|
-
packs.mjs ← 7 calibrated team packs + auto-selection
|
|
214
|
-
conflicts.mjs ← 4-pass conflict detection
|
|
215
|
-
escalation.mjs ← Auto-routing for blocked/rejected/split
|
|
216
|
-
evidence.mjs ← Structured evidence + role-aware requirements
|
|
217
|
-
dispatch.mjs ← Runtime dispatch manifests for multi-claude
|
|
218
|
-
artifacts.mjs ← 30 per-role artifact contracts + 7 pack handoffs
|
|
219
|
-
decompose.mjs ← Composite task detection + splitting
|
|
220
|
-
composite.mjs ← Dependency-ordered execution + recovery
|
|
221
|
-
replan.mjs ← Mid-run adaptive replanning
|
|
222
|
-
calibration.mjs ← Outcome recording + weight tuning
|
|
223
|
-
hooks.mjs ← 5 lifecycle hooks for runtime enforcement
|
|
224
|
-
session.mjs ← Session scaffolding + doctor
|
|
225
|
-
brainstorm.mjs ← Evidence modes, request validation, finding/synthesis/judge schemas
|
|
226
|
-
brainstorm-roles.mjs ← Role-native schemas, input partitioning, blindspot enforcement, cross-exam
|
|
227
|
-
brainstorm-render.mjs ← Two-layer rendering: lexical bans, render schemas, debate transcript
|
|
228
|
-
test/ ← 894 tests across 30 test files
|
|
229
|
-
starter-pack/ ← Drop-in role contracts, policies, schemas, workflows
|
|
230
|
-
```
|
|
231
|
-
|
|
232
|
-
## Seguridad
|
|
233
|
-
|
|
234
|
-
El sistema operativo del rol opera **únicamente de forma local**. Copia las plantillas de Markdown y escribe archivos de paquetes/verdictos en el directorio `.claude/` de su repositorio. No accede a la red, no maneja secretos ni recopila datos de telemetría. No se realizan operaciones peligrosas; todas las escrituras de archivos utilizan la opción "omitir si existe" de forma predeterminada. Consulte [SECURITY.md](SECURITY.md) para obtener la política completa.
|
|
235
|
-
|
|
236
|
-
## El sistema operativo
|
|
237
|
-
|
|
238
|
-
| Capa | ¿Qué hace? | Estado |
|
|
239
|
-
|-------|-------------|--------|
|
|
240
|
-
| **Routing** | Asigna una puntuación a los 31 roles en función del contenido del paquete, explica las recomendaciones, evalúa la confianza. | ✓ Implementado |
|
|
241
|
-
| **Chain builder** | Ensambla cadenas ordenadas por fase a partir de roles con puntuación, sesgadas por tipo de paquete, no bloqueadas por plantillas. | ✓ Implementado |
|
|
242
|
-
| **Conflict detection** | Validación de 4 pasos: conflictos duros, secuencia, redundancia, lagunas de cobertura. Sugerencias de reparación. | ✓ Implementado |
|
|
243
|
-
| **Escalation** | Redirige automáticamente las tareas bloqueadas/rechazadas/divididas al solucionador adecuado, junto con la razón y el artefacto requerido. | ✓ Implementado |
|
|
244
|
-
| **Evidence** | Evidencia estructurada en las decisiones, específica para cada rol. Comprobaciones de suficiencia. 12 tipos de evidencia. | ✓ Implementado |
|
|
245
|
-
| **Dispatch** | Genera manifiestos de ejecución para multi-claude. Perfiles de herramientas por rol, indicaciones del sistema, presupuestos. | ✓ Implementado |
|
|
246
|
-
| **Trials** | Lista completa probada: 30/30 tareas de oro + 5/5 pruebas negativas. 7 pruebas de paquete completadas. | ✓ Completo |
|
|
247
|
-
| **Team Packs** | 7 paquetes calibrados con selección automática, protección contra errores y recuperación flexible. | ✓ Implementado |
|
|
248
|
-
| **Outcome calibration** | Registra los resultados de las ejecuciones, ajusta los pesos de los paquetes/roles según los resultados y modifica los umbrales de confianza. | ✓ Implementado |
|
|
249
|
-
| **Mixed-task decomposition** | Detecta tareas compuestas, las divide en paquetes secundarios, asigna paquetes, preserva las dependencias. | ✓ Implementado |
|
|
250
|
-
| **Composite execution** | Ejecuta los paquetes secundarios en orden de dependencia, transfiriendo artefactos, recuperando ramas y sintetizando. | ✓ Implementado |
|
|
251
|
-
| **Adaptive replanning** | Los cambios en el alcance, los hallazgos o los nuevos requisitos durante la ejecución actualizan el plan sin necesidad de reiniciarlo. | ✓ Implementado |
|
|
252
|
-
| **Session spine** | `roleos init claude` crea los archivos CLAUDE.md, /roleos-route, /roleos-review y /roleos-status. `roleos doctor` verifica la configuración. Las tarjetas de ruta demuestran la participación. | ✓ Implementado |
|
|
253
|
-
| **Hook spine** | 5 ganchos de ciclo de vida (SessionStart, PromptSubmit, PreToolUse, SubagentStart, Stop). Aplicación de políticas: recordatorios en las tarjetas de ruta, control de acceso a herramientas, inyección de roles de subagente, auditoría de finalización. | ✓ Implementado |
|
|
254
|
-
| **Artifact spine** | 30 contratos de artefactos por rol. 7 contratos de transferencia de paquetes. Validación estructural. Comprobaciones de integridad de la cadena. Los roles posteriores nunca adivinan lo que recibieron. | ✓ Implementado |
|
|
255
|
-
| **Mission library** | 7 misiones con nombre (feature-ship, bugfix, treatment, docs-release, security-hardening, research-launch, brainstorm). Cada una define el paquete, la cadena de roles, el flujo de artefactos, las ramas de escalada y una definición parcial y honesta. Las 7 están probadas. | ✓ Implementado |
|
|
256
|
-
| **Mission runner** | Crea ejecuciones, avanza paso a paso con seguimiento del estado, completa o falla con informes precisos. Propagación de pasos bloqueados, advertencias de escalada fuera de la cadena, reapertura del último paso. | ✓ Implementado |
|
|
257
|
-
| **Unified entry** | `roleos start` decide automáticamente entre una misión, un paquete o una ruta flexible. Escalera de recuperación con puntuaciones de confianza, alternativas y detección de tareas compuestas. | ✓ Implementado |
|
|
258
|
-
| **Persistent runs** | `roleos run` crea ejecuciones respaldadas en disco. Comandos: `resume` (reanudar), `next` (siguiente), `explain` (explicar), `complete` (completar), `fail` (fallar). Intervenciones: `reroute` (redirigir), `escalate` (escalar), `retry` (reintentar), `block` (bloquear), `reopen` (reabrir). Guía específica para cada paso. Medición de la fricción. | ✓ Implementado |
|
|
259
|
-
| **Brainstorm** | Arquitectura de dos capas: verdad (esquemas nativos del rol, átomos de procedencia, gráfico de disputa cruzada) + renderizado (5 voces distintas, prohibiciones léxicas, transcripción del debate). Los enlaces de trazado demuestran que cada afirmación renderizada se corresponde con un átomo de verdad. Ejecución de referencia: 894 pruebas. | ✓ Implementado |
|
|
260
|
-
|
|
261
|
-
## 7 misiones
|
|
262
|
-
|
|
263
|
-
| Misión | Paquete | Roles | Cuándo usar |
|
|
264
|
-
|---------|------|-------|-------------|
|
|
265
|
-
| `feature-ship` | Característica | 5 | Entrega completa de la característica: alcance → especificación → implementación → prueba → revisión |
|
|
266
|
-
| `bugfix` | Corrección de errores | 4 | Diagnosticar la causa raíz, corregir, probar, verificar |
|
|
267
|
-
| `treatment` | Tratamiento | 4 | Verificación + pulido + documentación + verificación CI + revisión |
|
|
268
|
-
| `docs-release` | Documentación | 2 | Escribir/actualizar documentación, notas de la versión |
|
|
269
|
-
| `security-hardening` | Seguridad | 4 | Modelo de amenazas, auditoría, corregir vulnerabilidades, volver a auditar, verificar |
|
|
270
|
-
| `research-launch` | Investigación | 4 | Formular la pregunta, investigar, documentar los hallazgos, decidir |
|
|
271
|
-
| `brainstorm` | Lluvia de ideas | 9 | Investigación estructurada con múltiples perspectivas, con desacuerdos trazables y resultados. |
|
|
272
|
-
|
|
273
|
-
Cada misión incluye definiciones parciales y honestas: cuando el trabajo se detiene, el sistema documenta lo que se completó y lo que queda, en lugar de simular una finalización.
|
|
274
|
-
|
|
275
|
-
### Misión de lluvia de ideas
|
|
276
|
-
|
|
277
|
-
No es una "lluvia de ideas de IA". La misión de lluvia de ideas es **un conjunto de roles especializados bajo un marco legal, con desacuerdos trazables y resultados con valor de juicio.**
|
|
278
|
-
|
|
279
|
-
```bash
|
|
280
|
-
roleos run "explore product directions for a developer tool discovery platform"
|
|
281
|
-
# → MISSION: Brainstorm (Structured Inquiry)
|
|
282
|
-
# Chain: 4 Analysts (parallel) → Normalize → Cross-Examine → Rebut → Synthesize → Expand → Judge
|
|
283
|
-
```
|
|
284
|
-
|
|
285
|
-
**¿Qué la diferencia?**
|
|
286
|
-
|
|
287
|
-
- **Capa 1 (verdad):** Cuatro analistas emiten esquemas nativos del rol (ContextMap, UserValueMap, MechanicsMap, PositioningMap) — no prosa compartida. Cada rol tiene restricciones para evitar puntos ciegos: frases prohibidas, tipos de afirmaciones prohibidas, particiones de entrada filtradas. Los átomos llevan información de procedencia. Un gráfico de interrogatorio dirigido genera desafíos específicos. Los analistas originales defienden, refinan o retiran sus afirmaciones bajo presión.
|
|
288
|
-
|
|
289
|
-
- **Capa 2 (renderizado):** Cinco voces humanas distintas (Memorándum de Límites, Notas de Campo, Esquema del Sistema, Resumen de Reclamación, Transcripción del Interrogatorio) con restricciones léxicas que evitan la convergencia de las voces. La síntesis consume información verídica, pero nunca produce prosa. Ambas capas están siempre disponibles.
|
|
290
|
-
|
|
291
|
-
- **Cadena de custodia:** Cada oración generada se remonta a un átomo de la capa de verdad. Las instrucciones de síntesis citan átomos. Los interrogatorios se dirigen a identificadores de reclamaciones reales. El grafo de disputas es el producto, no la prosa.
|
|
292
|
-
|
|
293
|
-
**Comprobado:** Versión 0.4, ejecución de referencia — 894 pruebas, cadena de custodia completamente verificada. Consulte [`examples/golden-run.md`](examples/golden-run.md) para ver la cadena de artefactos completa.
|
|
294
|
-
|
|
295
|
-
## Estado
|
|
296
|
-
|
|
297
|
-
- v0.1–v0.4: Fundación — pruebas, adopción, paquete de tratamiento, paquete de inicio.
|
|
298
|
-
- v1.0.0: 32 roles, interfaz de línea de comandos completa, tratamiento comprobado, portabilidad entre múltiples repositorios.
|
|
299
|
-
- v1.0.2: Bloqueo del sistema de roles (correcciones de inicialización de la verdad, init --force).
|
|
300
|
-
- v1.1.0: 31 roles, columna vertebral de enrutamiento completa, detección de conflictos, escalamiento, evidencia, despacho, 7 paquetes de equipo comprobados. 35 pruebas de ejecución. 212 pruebas.
|
|
301
|
-
- v1.2.0: Paquetes calibrados promovidos a la entrada predeterminada. Selección automática, detección de incompatibilidades, sugerencia alternativa, recuperación de enrutamiento libre. 246 pruebas.
|
|
302
|
-
- v1.3.0: Calibración de resultados, descomposición de tareas mixtas, ejecución compuesta, replanificación adaptativa. 317 pruebas.
|
|
303
|
-
- v1.4.0: Columna vertebral de la sesión — `roleos init claude`, `roleos doctor`, tarjetas de ruta, comandos /roleos-route + /roleos-review + /roleos-status. 335 pruebas.
|
|
304
|
-
- v1.5.0: Columna vertebral de los ganchos — 5 ganchos de ciclo de vida para la aplicación en tiempo de ejecución. 358 pruebas.
|
|
305
|
-
- v1.6.0: Columna vertebral de los artefactos — 20 contratos de artefactos por rol, 7 contratos de entrega de paquetes, validación estructural. 385 pruebas.
|
|
306
|
-
- v1.7.0: Prueba de finalización — tareas reales ejecutadas a través de toda la pila. Interfaz de línea de comandos `roleos artifacts`. Escalamiento honesto para correcciones estructurales. 398 pruebas.
|
|
307
|
-
- v1.8.0: Biblioteca de misiones (Fase S) — 6 misiones con nombre, motor de ejecución, informes de finalización. Endurecido a partir de 6 ejecuciones de prueba reales. 481 pruebas.
|
|
308
|
-
- v1.9.0: Ruta de entrada unificada (Fase T) — `roleos start` decide automáticamente entre misión, paquete o enrutamiento libre. Escalera de recuperación, detección compuesta, pruebas de comparación de rutas de entrada. 527 pruebas.
|
|
309
|
-
- **v2.0.0**: Optimización de la experiencia del usuario (Fase U) — `roleos run` crea ejecuciones persistentes respaldadas por disco. Reanudar, siguiente, explicar, completar, fallar. Intervenciones: redirigir, escalar, reintentar, bloquear, reabrir. Guía específica para cada paso. Medición de la fricción. 6 pruebas de fricción. 613 pruebas.
|
|
310
|
-
- **v2.0.1**: Auditoría del manual, documentación para principiantes, correcciones del número de pruebas. 617 pruebas.
|
|
311
|
-
- **v2.1.0**: Misión de lluvia de ideas (v0.4) — roles especializados en el ámbito legal, desacuerdo trazable, salida con valor de veredicto. Arquitectura de dos capas (verdad + renderizado), matriz de permisos de interrogatorio, grafo de disputas, prueba de ejecución de referencia. 7 misiones, 50 roles, 8 paquetes. 894 pruebas.
|
|
312
|
-
|
|
313
|
-
## Licencia
|
|
314
|
-
|
|
315
|
-
MIT
|
|
316
|
-
|
|
317
|
-
---
|
|
318
|
-
|
|
319
|
-
Creado por <a href="https://mcp-tool-shop.github.io/">MCP Tool Shop</a
|
|
1
|
+
<p align="center">
|
|
2
|
+
<a href="README.ja.md">日本語</a> | <a href="README.zh.md">中文</a> | <a href="README.md">English</a> | <a href="README.fr.md">Français</a> | <a href="README.hi.md">हिन्दी</a> | <a href="README.it.md">Italiano</a> | <a href="README.pt-BR.md">Português (BR)</a>
|
|
3
|
+
</p>
|
|
4
|
+
|
|
5
|
+
<p align="center">
|
|
6
|
+
<img src="https://raw.githubusercontent.com/mcp-tool-shop-org/brand/main/logos/role-os/readme.png" alt="Role OS" width="600">
|
|
7
|
+
</p>
|
|
8
|
+
|
|
9
|
+
<p align="center">
|
|
10
|
+
<a href="https://github.com/mcp-tool-shop-org/role-os/actions"><img src="https://github.com/mcp-tool-shop-org/role-os/actions/workflows/ci.yml/badge.svg" alt="CI"></a>
|
|
11
|
+
<a href="https://www.npmjs.com/package/role-os"><img src="https://img.shields.io/npm/v/role-os" alt="npm"></a>
|
|
12
|
+
<a href="LICENSE"><img src="https://img.shields.io/badge/license-MIT-blue" alt="MIT License"></a>
|
|
13
|
+
<a href="https://mcp-tool-shop-org.github.io/role-os/"><img src="https://img.shields.io/badge/Landing_Page-live-brightgreen" alt="Landing Page"></a>
|
|
14
|
+
</p>
|
|
15
|
+
|
|
16
|
+
Un sistema operativo multi-Claude que asigna personal, dirige, valida y ejecuta tareas a través de 50 contratos de roles especializados. Crea paquetes de tareas, ensambla el equipo adecuado mediante la coincidencia de roles, detecta problemas antes de la ejecución, redirige automáticamente la recuperación cuando una tarea se bloquea o se rechaza, y requiere evidencia estructurada en cada decisión.
|
|
17
|
+
|
|
18
|
+
## ¿Qué hace?
|
|
19
|
+
|
|
20
|
+
Role OS es la forma profesional de utilizar multi-Claude. Evita los fallos específicos que producen los flujos de trabajo de IA genéricos:
|
|
21
|
+
|
|
22
|
+
- **Desviación (Drift)**: Los roles se mantienen dentro de su ámbito. El producto no se rediseña. La interfaz de usuario no redefine el alcance. El backend no inventa la dirección del producto.
|
|
23
|
+
- **Finalización falsa**: La definición de "hecho" es concreta. El trabajo que oculta deficiencias, omite la verificación o resuelve un problema diferente es rechazado.
|
|
24
|
+
- **Contaminación**: Los proyectos bifurcados o heredados conservan residuos de identidad. Role OS detecta y rechaza las desviaciones entre proyectos en terminología, elementos visuales y modelos mentales.
|
|
25
|
+
- **Progreso basado en impresiones**: Cada transferencia es estructurada. Cada decisión se basa en evidencia. "Parece que está terminado" no es un estado válido.
|
|
26
|
+
|
|
27
|
+
## ¿Cómo funciona?
|
|
28
|
+
|
|
29
|
+
Describa su tarea. Role OS decide automáticamente el nivel de orquestación adecuado.
|
|
30
|
+
|
|
31
|
+
```bash
|
|
32
|
+
roleos start "fix the crash in save handler"
|
|
33
|
+
# → MISSION: Bugfix & Diagnosis (70% confidence)
|
|
34
|
+
# Chain: Repo Researcher → Backend Engineer → Test Engineer → Critic Reviewer
|
|
35
|
+
|
|
36
|
+
roleos start "add a new export command"
|
|
37
|
+
# → PACK: Feature Build (50% confidence)
|
|
38
|
+
# Roles: Orchestrator, Product Strategist, Spec Writer, Backend Engineer, Test Engineer, Critic Reviewer
|
|
39
|
+
|
|
40
|
+
roleos start "something completely novel"
|
|
41
|
+
# → FREE-ROUTING (10% confidence)
|
|
42
|
+
# Hint: Create a packet and run `roleos route` for role-level routing
|
|
43
|
+
```
|
|
44
|
+
|
|
45
|
+
**La jerarquía de respaldo:**
|
|
46
|
+
|
|
47
|
+
1. **Misión:** cuando la tarea coincide con un flujo de trabajo recurrente probado (corrección de errores, tratamiento, lanzamiento de funciones, documentación, seguridad, investigación). Cadena de roles conocida, flujo de artefactos, ramas de escalamiento y definiciones parciales.
|
|
48
|
+
2. **Paquete:** cuando la tarea es una familia conocida pero no una misión completa. 7 paquetes de equipo calibrados con selección automática y protecciones contra errores.
|
|
49
|
+
3. **Enrutamiento libre:** cuando la tarea es novedosa, mixta o incierta. Asigna una puntuación a los 31 roles en función del contenido del paquete y ensambla una cadena dinámica.
|
|
50
|
+
|
|
51
|
+
El sistema nunca fuerza una tarea a través de una abstracción incorrecta. Explica por qué eligió cada nivel y ofrece alternativas.
|
|
52
|
+
|
|
53
|
+
**Un comando para iniciar la ejecución:**
|
|
54
|
+
|
|
55
|
+
```bash
|
|
56
|
+
roleos run "fix the crash in save handler"
|
|
57
|
+
# → Created run: run-1234
|
|
58
|
+
# → Entry: MISSION (bugfix)
|
|
59
|
+
# → Started step 0: Repo Researcher → diagnosis-report
|
|
60
|
+
# → Guidance: Required sections: entrypoints, module-map, build-test-commands
|
|
61
|
+
|
|
62
|
+
roleos next # Start the next step
|
|
63
|
+
roleos complete diagnosis.md # Complete the active step with artifact
|
|
64
|
+
roleos explain # Show full run state and guidance
|
|
65
|
+
roleos resume # Continue an interrupted run
|
|
66
|
+
roleos report # Generate completion report
|
|
67
|
+
roleos friction # Measure operator touches
|
|
68
|
+
```
|
|
69
|
+
|
|
70
|
+
**Intervenciones cuando algo sale mal:**
|
|
71
|
+
|
|
72
|
+
```bash
|
|
73
|
+
roleos retry 0 # Retry a failed step
|
|
74
|
+
roleos reroute 1 "Frontend Developer" "UI bug" # Swap a role
|
|
75
|
+
roleos escalate "Test Engineer" "Repo Researcher" "missed edge case" "re-diagnose"
|
|
76
|
+
roleos block 2 "waiting for API spec"
|
|
77
|
+
roleos reopen 0 "found issue in review"
|
|
78
|
+
```
|
|
79
|
+
|
|
80
|
+
Las ejecuciones se guardan en disco (`.claude/runs/`), por lo que las sesiones interrumpidas se reanudan correctamente. Cada paso incluye orientación para el operador: qué producir, secciones requeridas y condiciones de parada.
|
|
81
|
+
|
|
82
|
+
**Una vez enrutada:**
|
|
83
|
+
|
|
84
|
+
1. **Cada rol produce una transferencia:** salida estructurada con elementos de evidencia que reducen la ambigüedad para el siguiente rol.
|
|
85
|
+
2. **El revisor evalúa según el contrato:** acepta, rechaza o bloquea en función de la evidencia estructurada, no de la impresión.
|
|
86
|
+
3. **La recuperación se redirige automáticamente:** las tareas bloqueadas o rechazadas se redirigen al solucionador adecuado, junto con la razón, el tipo de recuperación y el artefacto requerido.
|
|
87
|
+
|
|
88
|
+
## Estado de implementación en la organización
|
|
89
|
+
|
|
90
|
+
El estado de implementación en toda la organización (cola, decisiones, registros de auditoría, paquetes de bloqueo por repositorio) se encuentra en un repositorio privado separado: [`role-os-rollout`](https://github.com/mcp-tool-shop-org/role-os-rollout). Este repositorio es el producto; ese repositorio es el estado operativo.
|
|
91
|
+
|
|
92
|
+
## Memoria y continuidad
|
|
93
|
+
|
|
94
|
+
Role OS no posee ni duplica la capa de memoria. Cuando existe la memoria del proyecto Claude, esta es el sistema de continuidad canónico: los hechos del repositorio, las decisiones, los problemas pendientes y el historial de tratamiento se almacenan allí.
|
|
95
|
+
|
|
96
|
+
Role OS se integra con la memoria del proyecto Claude. No la reemplaza.
|
|
97
|
+
|
|
98
|
+
## Tratamiento completo y verificación de entrega
|
|
99
|
+
|
|
100
|
+
El tratamiento completo es un protocolo canónico de 7 fases definido en la memoria del proyecto Claude (`memory/full-treatment.md`). Role OS dirige y revisa los tratamientos utilizando contratos de roles, transferencias y puertas de revisión, y no redefine el protocolo.
|
|
101
|
+
|
|
102
|
+
La **verificación de entrega (Shipcheck)** es la puerta de calidad de 31 elementos que se ejecuta antes del tratamiento completo. Las puertas A, B, C y D deben superarse antes de que comience cualquier tratamiento. Referencia canónica: `memory/shipcheck.md`.
|
|
103
|
+
|
|
104
|
+
Orden: Verificación de entrega primero, luego tratamiento completo. No hay versión 1.0.0 sin superar las puertas obligatorias.
|
|
105
|
+
|
|
106
|
+
## 32 roles en 8 paquetes
|
|
107
|
+
|
|
108
|
+
| Paquete | Roles |
|
|
109
|
+
|------|-------|
|
|
110
|
+
| **Core** (3) | Orquestador, Estratega de Producto, Evaluador Crítico. |
|
|
111
|
+
| **Engineering** (7) | Desarrollador Frontend, Ingeniero Backend, Ingeniero de Pruebas, Ingeniero de Refactorización, Ingeniero de Rendimiento, Auditor de Dependencias, Evaluador de Seguridad. |
|
|
112
|
+
| **Design** (2) | Diseñador de Interfaz de Usuario, Guardián de la Marca. |
|
|
113
|
+
| **Marketing** (1) | Redactor para Lanzamiento. |
|
|
114
|
+
| **Treatment** (7) | Investigador de Repositorios, Traductor de Repositorios, Arquitecto de Documentación, Curador de Metadatos, Auditor de Cobertura, Verificador de Despliegue, Ingeniero de Lanzamiento. |
|
|
115
|
+
| **Product** (3) | Generador de comentarios, Priorizador de hoja de ruta, Redactor de especificaciones. |
|
|
116
|
+
| **Research** (4) | Investigador de Experiencia de Usuario, Analista de la Competencia, Investigador de Tendencias, Sintetizador de Entrevistas con Usuarios. |
|
|
117
|
+
| **Growth** (4) | Estratega de Lanzamiento, Estratega de Contenido, Community Manager, Líder de Soporte. |
|
|
118
|
+
|
|
119
|
+
Cada rol tiene un contrato completo: misión, cuándo usar, cuándo no usar, entradas requeridas, salidas requeridas, nivel de calidad y desencadenantes de escalamiento. Cada rol se puede enrutar; `roleos route` puede recomendar cualquiera de ellos en función del contenido del paquete.
|
|
120
|
+
|
|
121
|
+
## Cómo empezar
|
|
122
|
+
|
|
123
|
+
```bash
|
|
124
|
+
npx role-os init
|
|
125
|
+
|
|
126
|
+
# Describe what you need — Role OS picks the right level:
|
|
127
|
+
roleos run "fix the crash in save handler"
|
|
128
|
+
# → Creates run, picks bugfix mission, starts first step with guidance
|
|
129
|
+
|
|
130
|
+
# Step through:
|
|
131
|
+
roleos next # Start next step
|
|
132
|
+
roleos complete artifact.md # Complete with artifact
|
|
133
|
+
roleos explain # Show full state
|
|
134
|
+
roleos report # Completion report
|
|
135
|
+
|
|
136
|
+
# Or go manual:
|
|
137
|
+
roleos start "fix the crash" # Entry decision only (no run)
|
|
138
|
+
roleos packet new feature
|
|
139
|
+
roleos route .claude/packets/my-feature.md
|
|
140
|
+
roleos review .claude/packets/my-feature.md accept
|
|
141
|
+
|
|
142
|
+
# Explore missions and packs:
|
|
143
|
+
roleos mission list
|
|
144
|
+
roleos packs list
|
|
145
|
+
```
|
|
146
|
+
|
|
147
|
+
## Cuándo no usar Role OS
|
|
148
|
+
|
|
149
|
+
- Correcciones de una sola línea, errores tipográficos o errores obvios.
|
|
150
|
+
- Investigación exploratoria sin una salida definida.
|
|
151
|
+
- Trabajo que se puede realizar en la mente de una persona en 5 minutos.
|
|
152
|
+
- Correcciones urgentes que deben enviarse antes de que se complete una cadena de revisión.
|
|
153
|
+
- Proyectos donde se prioriza la velocidad sobre la estructura.
|
|
154
|
+
|
|
155
|
+
## Evidencia
|
|
156
|
+
|
|
157
|
+
Role OS se ha probado en tres tipos de tareas diferentes en dos repositorios con estructuras diferentes:
|
|
158
|
+
|
|
159
|
+
**Prueba 001: Trabajo de funciones** (Pantalla de la tripulación, Star Freight)
|
|
160
|
+
- Cadena de 7 roles, 45 escenarios de prueba, 0 conflictos de roles.
|
|
161
|
+
- Evitó la contaminación de un proyecto derivado, detectó invenciones realizadas directamente y reveló bloqueos reales.
|
|
162
|
+
|
|
163
|
+
**Prueba 002: Trabajo de integración** (Conexión de CampaignState, Star Freight)
|
|
164
|
+
- Cadena de 5 roles, resolvió la interfaz arquitectónica sin soluciones alternativas falsas.
|
|
165
|
+
- Las pruebas anti-fallback demostraron que la ruta activa es real, no un marcador de posición.
|
|
166
|
+
|
|
167
|
+
**Prueba 003: Trabajo de identidad** (Eliminación de contaminación, Star Freight)
|
|
168
|
+
- Cadena de 6 roles, 51 escenarios de prueba, incluyendo una defensa duradera contra la contaminación en el sistema de integración continua.
|
|
169
|
+
- Corrigió la desviación de la ficción heredada sin provocar una reestructuración general.
|
|
170
|
+
|
|
171
|
+
**Prueba de portabilidad** (Consistencia de la persona, sensor-humor)
|
|
172
|
+
- Misma estructura base, diferentes idioma/dominio/entorno.
|
|
173
|
+
- Se adapta solo con cambios de contexto; no se realizan modificaciones en el contrato principal.
|
|
174
|
+
|
|
175
|
+
**Tratamiento completo FT-001** (portlight-desktop)
|
|
176
|
+
- Tratamiento con personal en 7 fases con roles del paquete de tratamiento.
|
|
177
|
+
- Verificación de envío probada, sin colisiones de roles.
|
|
178
|
+
|
|
179
|
+
**Tratamiento completo FT-002** (studioflow)
|
|
180
|
+
- Mismo paquete de tratamiento, repositorio estructuralmente diferente (espacio de trabajo creativo vs. juego).
|
|
181
|
+
- Paquete de tratamiento portátil: no se requieren modificaciones en el contrato.
|
|
182
|
+
|
|
183
|
+
**Ejecución de prueba ideal** (tema del mercado de servidores MCP)
|
|
184
|
+
- Cadena de 9 roles, 4 analistas en paralelo, examen cruzado + gráfico de refutación de disputas.
|
|
185
|
+
- Se plantearon 4 desafíos, se redujeron 3 afirmaciones, 1 sin resolver: presión saludable, no un punto muerto.
|
|
186
|
+
- Más de 16 enlaces de trazado desde los artefactos renderizados hasta los átomos de la capa de verdad.
|
|
187
|
+
- Cadena de custodia completa probada: verdad → átomos → disputa → síntesis → expansión → juez → renderizado → trazado.
|
|
188
|
+
|
|
189
|
+
## Propiedades fundamentales
|
|
190
|
+
|
|
191
|
+
Estas son innegociables. Si un cambio debilita alguna de ellas, recházalo.
|
|
192
|
+
|
|
193
|
+
- Los límites de los roles se mantienen.
|
|
194
|
+
- La revisión es rigurosa.
|
|
195
|
+
- La escalación se mantiene transparente.
|
|
196
|
+
- Los paquetes siguen siendo verificables.
|
|
197
|
+
- La portabilidad requiere adaptación al contexto, no una modificación profunda.
|
|
198
|
+
|
|
199
|
+
## Estructura del proyecto
|
|
200
|
+
|
|
201
|
+
```
|
|
202
|
+
role-os/
|
|
203
|
+
bin/roleos.mjs ← CLI entrypoint
|
|
204
|
+
src/
|
|
205
|
+
entry.mjs ← Unified entry: mission → pack → free routing
|
|
206
|
+
entry-cmd.mjs ← `roleos start` CLI command
|
|
207
|
+
run.mjs ← Persistent run engine: create → step → pause → resume → report
|
|
208
|
+
run-cmd.mjs ← `roleos run/resume/next/explain/complete/fail` + interventions
|
|
209
|
+
mission.mjs ← 7 named mission types (feature, bugfix, treatment, docs, security, research, brainstorm)
|
|
210
|
+
mission-run.mjs ← Mission runner: create → step → complete → report
|
|
211
|
+
mission-cmd.mjs ← `roleos mission` CLI commands
|
|
212
|
+
route.mjs ← 31-role routing + dynamic chain builder
|
|
213
|
+
packs.mjs ← 7 calibrated team packs + auto-selection
|
|
214
|
+
conflicts.mjs ← 4-pass conflict detection
|
|
215
|
+
escalation.mjs ← Auto-routing for blocked/rejected/split
|
|
216
|
+
evidence.mjs ← Structured evidence + role-aware requirements
|
|
217
|
+
dispatch.mjs ← Runtime dispatch manifests for multi-claude
|
|
218
|
+
artifacts.mjs ← 30 per-role artifact contracts + 7 pack handoffs
|
|
219
|
+
decompose.mjs ← Composite task detection + splitting
|
|
220
|
+
composite.mjs ← Dependency-ordered execution + recovery
|
|
221
|
+
replan.mjs ← Mid-run adaptive replanning
|
|
222
|
+
calibration.mjs ← Outcome recording + weight tuning
|
|
223
|
+
hooks.mjs ← 5 lifecycle hooks for runtime enforcement
|
|
224
|
+
session.mjs ← Session scaffolding + doctor
|
|
225
|
+
brainstorm.mjs ← Evidence modes, request validation, finding/synthesis/judge schemas
|
|
226
|
+
brainstorm-roles.mjs ← Role-native schemas, input partitioning, blindspot enforcement, cross-exam
|
|
227
|
+
brainstorm-render.mjs ← Two-layer rendering: lexical bans, render schemas, debate transcript
|
|
228
|
+
test/ ← 894 tests across 30 test files
|
|
229
|
+
starter-pack/ ← Drop-in role contracts, policies, schemas, workflows
|
|
230
|
+
```
|
|
231
|
+
|
|
232
|
+
## Seguridad
|
|
233
|
+
|
|
234
|
+
El sistema operativo del rol opera **únicamente de forma local**. Copia las plantillas de Markdown y escribe archivos de paquetes/verdictos en el directorio `.claude/` de su repositorio. No accede a la red, no maneja secretos ni recopila datos de telemetría. No se realizan operaciones peligrosas; todas las escrituras de archivos utilizan la opción "omitir si existe" de forma predeterminada. Consulte [SECURITY.md](SECURITY.md) para obtener la política completa.
|
|
235
|
+
|
|
236
|
+
## El sistema operativo
|
|
237
|
+
|
|
238
|
+
| Capa | ¿Qué hace? | Estado |
|
|
239
|
+
|-------|-------------|--------|
|
|
240
|
+
| **Routing** | Asigna una puntuación a los 31 roles en función del contenido del paquete, explica las recomendaciones, evalúa la confianza. | ✓ Implementado |
|
|
241
|
+
| **Chain builder** | Ensambla cadenas ordenadas por fase a partir de roles con puntuación, sesgadas por tipo de paquete, no bloqueadas por plantillas. | ✓ Implementado |
|
|
242
|
+
| **Conflict detection** | Validación de 4 pasos: conflictos duros, secuencia, redundancia, lagunas de cobertura. Sugerencias de reparación. | ✓ Implementado |
|
|
243
|
+
| **Escalation** | Redirige automáticamente las tareas bloqueadas/rechazadas/divididas al solucionador adecuado, junto con la razón y el artefacto requerido. | ✓ Implementado |
|
|
244
|
+
| **Evidence** | Evidencia estructurada en las decisiones, específica para cada rol. Comprobaciones de suficiencia. 12 tipos de evidencia. | ✓ Implementado |
|
|
245
|
+
| **Dispatch** | Genera manifiestos de ejecución para multi-claude. Perfiles de herramientas por rol, indicaciones del sistema, presupuestos. | ✓ Implementado |
|
|
246
|
+
| **Trials** | Lista completa probada: 30/30 tareas de oro + 5/5 pruebas negativas. 7 pruebas de paquete completadas. | ✓ Completo |
|
|
247
|
+
| **Team Packs** | 7 paquetes calibrados con selección automática, protección contra errores y recuperación flexible. | ✓ Implementado |
|
|
248
|
+
| **Outcome calibration** | Registra los resultados de las ejecuciones, ajusta los pesos de los paquetes/roles según los resultados y modifica los umbrales de confianza. | ✓ Implementado |
|
|
249
|
+
| **Mixed-task decomposition** | Detecta tareas compuestas, las divide en paquetes secundarios, asigna paquetes, preserva las dependencias. | ✓ Implementado |
|
|
250
|
+
| **Composite execution** | Ejecuta los paquetes secundarios en orden de dependencia, transfiriendo artefactos, recuperando ramas y sintetizando. | ✓ Implementado |
|
|
251
|
+
| **Adaptive replanning** | Los cambios en el alcance, los hallazgos o los nuevos requisitos durante la ejecución actualizan el plan sin necesidad de reiniciarlo. | ✓ Implementado |
|
|
252
|
+
| **Session spine** | `roleos init claude` crea los archivos CLAUDE.md, /roleos-route, /roleos-review y /roleos-status. `roleos doctor` verifica la configuración. Las tarjetas de ruta demuestran la participación. | ✓ Implementado |
|
|
253
|
+
| **Hook spine** | 5 ganchos de ciclo de vida (SessionStart, PromptSubmit, PreToolUse, SubagentStart, Stop). Aplicación de políticas: recordatorios en las tarjetas de ruta, control de acceso a herramientas, inyección de roles de subagente, auditoría de finalización. | ✓ Implementado |
|
|
254
|
+
| **Artifact spine** | 30 contratos de artefactos por rol. 7 contratos de transferencia de paquetes. Validación estructural. Comprobaciones de integridad de la cadena. Los roles posteriores nunca adivinan lo que recibieron. | ✓ Implementado |
|
|
255
|
+
| **Mission library** | 7 misiones con nombre (feature-ship, bugfix, treatment, docs-release, security-hardening, research-launch, brainstorm). Cada una define el paquete, la cadena de roles, el flujo de artefactos, las ramas de escalada y una definición parcial y honesta. Las 7 están probadas. | ✓ Implementado |
|
|
256
|
+
| **Mission runner** | Crea ejecuciones, avanza paso a paso con seguimiento del estado, completa o falla con informes precisos. Propagación de pasos bloqueados, advertencias de escalada fuera de la cadena, reapertura del último paso. | ✓ Implementado |
|
|
257
|
+
| **Unified entry** | `roleos start` decide automáticamente entre una misión, un paquete o una ruta flexible. Escalera de recuperación con puntuaciones de confianza, alternativas y detección de tareas compuestas. | ✓ Implementado |
|
|
258
|
+
| **Persistent runs** | `roleos run` crea ejecuciones respaldadas en disco. Comandos: `resume` (reanudar), `next` (siguiente), `explain` (explicar), `complete` (completar), `fail` (fallar). Intervenciones: `reroute` (redirigir), `escalate` (escalar), `retry` (reintentar), `block` (bloquear), `reopen` (reabrir). Guía específica para cada paso. Medición de la fricción. | ✓ Implementado |
|
|
259
|
+
| **Brainstorm** | Arquitectura de dos capas: verdad (esquemas nativos del rol, átomos de procedencia, gráfico de disputa cruzada) + renderizado (5 voces distintas, prohibiciones léxicas, transcripción del debate). Los enlaces de trazado demuestran que cada afirmación renderizada se corresponde con un átomo de verdad. Ejecución de referencia: 894 pruebas. | ✓ Implementado |
|
|
260
|
+
|
|
261
|
+
## 7 misiones
|
|
262
|
+
|
|
263
|
+
| Misión | Paquete | Roles | Cuándo usar |
|
|
264
|
+
|---------|------|-------|-------------|
|
|
265
|
+
| `feature-ship` | Característica | 5 | Entrega completa de la característica: alcance → especificación → implementación → prueba → revisión |
|
|
266
|
+
| `bugfix` | Corrección de errores | 4 | Diagnosticar la causa raíz, corregir, probar, verificar |
|
|
267
|
+
| `treatment` | Tratamiento | 4 | Verificación + pulido + documentación + verificación CI + revisión |
|
|
268
|
+
| `docs-release` | Documentación | 2 | Escribir/actualizar documentación, notas de la versión |
|
|
269
|
+
| `security-hardening` | Seguridad | 4 | Modelo de amenazas, auditoría, corregir vulnerabilidades, volver a auditar, verificar |
|
|
270
|
+
| `research-launch` | Investigación | 4 | Formular la pregunta, investigar, documentar los hallazgos, decidir |
|
|
271
|
+
| `brainstorm` | Lluvia de ideas | 9 | Investigación estructurada con múltiples perspectivas, con desacuerdos trazables y resultados. |
|
|
272
|
+
|
|
273
|
+
Cada misión incluye definiciones parciales y honestas: cuando el trabajo se detiene, el sistema documenta lo que se completó y lo que queda, en lugar de simular una finalización.
|
|
274
|
+
|
|
275
|
+
### Misión de lluvia de ideas
|
|
276
|
+
|
|
277
|
+
No es una "lluvia de ideas de IA". La misión de lluvia de ideas es **un conjunto de roles especializados bajo un marco legal, con desacuerdos trazables y resultados con valor de juicio.**
|
|
278
|
+
|
|
279
|
+
```bash
|
|
280
|
+
roleos run "explore product directions for a developer tool discovery platform"
|
|
281
|
+
# → MISSION: Brainstorm (Structured Inquiry)
|
|
282
|
+
# Chain: 4 Analysts (parallel) → Normalize → Cross-Examine → Rebut → Synthesize → Expand → Judge
|
|
283
|
+
```
|
|
284
|
+
|
|
285
|
+
**¿Qué la diferencia?**
|
|
286
|
+
|
|
287
|
+
- **Capa 1 (verdad):** Cuatro analistas emiten esquemas nativos del rol (ContextMap, UserValueMap, MechanicsMap, PositioningMap) — no prosa compartida. Cada rol tiene restricciones para evitar puntos ciegos: frases prohibidas, tipos de afirmaciones prohibidas, particiones de entrada filtradas. Los átomos llevan información de procedencia. Un gráfico de interrogatorio dirigido genera desafíos específicos. Los analistas originales defienden, refinan o retiran sus afirmaciones bajo presión.
|
|
288
|
+
|
|
289
|
+
- **Capa 2 (renderizado):** Cinco voces humanas distintas (Memorándum de Límites, Notas de Campo, Esquema del Sistema, Resumen de Reclamación, Transcripción del Interrogatorio) con restricciones léxicas que evitan la convergencia de las voces. La síntesis consume información verídica, pero nunca produce prosa. Ambas capas están siempre disponibles.
|
|
290
|
+
|
|
291
|
+
- **Cadena de custodia:** Cada oración generada se remonta a un átomo de la capa de verdad. Las instrucciones de síntesis citan átomos. Los interrogatorios se dirigen a identificadores de reclamaciones reales. El grafo de disputas es el producto, no la prosa.
|
|
292
|
+
|
|
293
|
+
**Comprobado:** Versión 0.4, ejecución de referencia — 894 pruebas, cadena de custodia completamente verificada. Consulte [`examples/golden-run.md`](examples/golden-run.md) para ver la cadena de artefactos completa.
|
|
294
|
+
|
|
295
|
+
## Estado
|
|
296
|
+
|
|
297
|
+
- v0.1–v0.4: Fundación — pruebas, adopción, paquete de tratamiento, paquete de inicio.
|
|
298
|
+
- v1.0.0: 32 roles, interfaz de línea de comandos completa, tratamiento comprobado, portabilidad entre múltiples repositorios.
|
|
299
|
+
- v1.0.2: Bloqueo del sistema de roles (correcciones de inicialización de la verdad, init --force).
|
|
300
|
+
- v1.1.0: 31 roles, columna vertebral de enrutamiento completa, detección de conflictos, escalamiento, evidencia, despacho, 7 paquetes de equipo comprobados. 35 pruebas de ejecución. 212 pruebas.
|
|
301
|
+
- v1.2.0: Paquetes calibrados promovidos a la entrada predeterminada. Selección automática, detección de incompatibilidades, sugerencia alternativa, recuperación de enrutamiento libre. 246 pruebas.
|
|
302
|
+
- v1.3.0: Calibración de resultados, descomposición de tareas mixtas, ejecución compuesta, replanificación adaptativa. 317 pruebas.
|
|
303
|
+
- v1.4.0: Columna vertebral de la sesión — `roleos init claude`, `roleos doctor`, tarjetas de ruta, comandos /roleos-route + /roleos-review + /roleos-status. 335 pruebas.
|
|
304
|
+
- v1.5.0: Columna vertebral de los ganchos — 5 ganchos de ciclo de vida para la aplicación en tiempo de ejecución. 358 pruebas.
|
|
305
|
+
- v1.6.0: Columna vertebral de los artefactos — 20 contratos de artefactos por rol, 7 contratos de entrega de paquetes, validación estructural. 385 pruebas.
|
|
306
|
+
- v1.7.0: Prueba de finalización — tareas reales ejecutadas a través de toda la pila. Interfaz de línea de comandos `roleos artifacts`. Escalamiento honesto para correcciones estructurales. 398 pruebas.
|
|
307
|
+
- v1.8.0: Biblioteca de misiones (Fase S) — 6 misiones con nombre, motor de ejecución, informes de finalización. Endurecido a partir de 6 ejecuciones de prueba reales. 481 pruebas.
|
|
308
|
+
- v1.9.0: Ruta de entrada unificada (Fase T) — `roleos start` decide automáticamente entre misión, paquete o enrutamiento libre. Escalera de recuperación, detección compuesta, pruebas de comparación de rutas de entrada. 527 pruebas.
|
|
309
|
+
- **v2.0.0**: Optimización de la experiencia del usuario (Fase U) — `roleos run` crea ejecuciones persistentes respaldadas por disco. Reanudar, siguiente, explicar, completar, fallar. Intervenciones: redirigir, escalar, reintentar, bloquear, reabrir. Guía específica para cada paso. Medición de la fricción. 6 pruebas de fricción. 613 pruebas.
|
|
310
|
+
- **v2.0.1**: Auditoría del manual, documentación para principiantes, correcciones del número de pruebas. 617 pruebas.
|
|
311
|
+
- **v2.1.0**: Misión de lluvia de ideas (v0.4) — roles especializados en el ámbito legal, desacuerdo trazable, salida con valor de veredicto. Arquitectura de dos capas (verdad + renderizado), matriz de permisos de interrogatorio, grafo de disputas, prueba de ejecución de referencia. 7 misiones, 50 roles, 8 paquetes. 894 pruebas.
|
|
312
|
+
|
|
313
|
+
## Licencia
|
|
314
|
+
|
|
315
|
+
MIT
|
|
316
|
+
|
|
317
|
+
---
|
|
318
|
+
|
|
319
|
+
Creado por <a href="https://mcp-tool-shop.github.io/">MCP Tool Shop</a
|