@saulwade/swl-ses 1.4.2 → 1.5.0
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
- package/CLAUDE.md +3 -3
- package/README.md +561 -560
- package/bin/swl-mcp-server.js +214 -187
- package/bin/swl-ses.js +74 -0
- package/comandos/swl/ejecutar-fase.md +33 -4
- package/comandos/swl/metricas.md +72 -0
- package/habilidades/discutir-fase/SKILL.md +50 -2
- package/habilidades/ejecutar-task-iterativo/SKILL.md +278 -0
- package/habilidades/protocolo-revision-swl/SKILL.md +276 -0
- package/habilidades/verificar-trabajo/SKILL.md +49 -5
- package/manifiestos/modulos.json +1321 -1267
- package/package.json +3 -3
- package/plugin.json +351 -351
- package/scripts/derivar-feature-list.js +489 -0
- package/scripts/doctor.js +31 -4
- package/scripts/instalador.js +56 -5
- package/scripts/lib/detectar-runtime.js +75 -9
- package/scripts/lib/estado.js +13 -1
- package/scripts/lib/expandir-targets.js +71 -0
- package/scripts/lib/parsear-opciones.js +3 -0
- package/scripts/lib/toml-merge.js +204 -0
- package/scripts/lib/transformadores/base.js +43 -9
- package/scripts/lib/transformadores/codex.js +375 -115
- package/scripts/lib/transformadores/cursor.js +359 -0
- package/scripts/lib/transformadores/index.js +2 -0
- package/scripts/mcp-server/README.md +170 -128
- package/scripts/mcp-server/auth.js +105 -0
- package/scripts/mcp-server/cache.js +106 -0
- package/scripts/mcp-server/handlers.js +190 -10
- package/scripts/mcp-server/telemetry.js +78 -0
|
@@ -1,7 +1,7 @@
|
|
|
1
1
|
---
|
|
2
2
|
name: discutir-fase
|
|
3
|
-
description: Cuestionario adaptativo que se ejecuta antes de planear una fase de desarrollo. Extrae decisiones técnicas y de negocio del usuario, clasifica respuestas como "cerradas" (no negociables) o "abiertas" (decisión delegada al agente), y produce un archivo CONTEXTO.md que alimenta al planificador.
|
|
4
|
-
version: "1.
|
|
3
|
+
description: Cuestionario adaptativo que se ejecuta antes de planear una fase de desarrollo. Extrae decisiones técnicas y de negocio del usuario, clasifica respuestas como "cerradas" (no negociables) o "abiertas" (decisión delegada al agente), y produce un archivo CONTEXTO.md que alimenta al planificador. Inicia con discovery routing (5 paths) que evita el cuestionario completo cuando no aplica.
|
|
4
|
+
version: "1.1.0"
|
|
5
5
|
herramientasPermitidas: [Read, Write, Edit, Bash, Glob, Grep]
|
|
6
6
|
exclusiones:
|
|
7
7
|
- "No cargar si el usuario ya tiene un CONTEXTO.md poblado para la fase en curso — ir directo a `planear-fase`."
|
|
@@ -35,6 +35,54 @@ antipatrón de planear con suposiciones implícitas que luego se contradicen.
|
|
|
35
35
|
|
|
36
36
|
---
|
|
37
37
|
|
|
38
|
+
## Paso 0 — Discovery routing (obligatorio antes del cuestionario)
|
|
39
|
+
|
|
40
|
+
Antes de lanzar el cuestionario adaptativo, ejecuta **scan ligero** de
|
|
41
|
+
`.planning/` para identificar la ruta correcta. Esto evita gastar turnos en
|
|
42
|
+
un cuestionario cuando la petición del usuario no requiere una fase nueva.
|
|
43
|
+
|
|
44
|
+
Inspirado en `kiro-discovery` (cc-sdd) — ver `temp/cc-sdd-main/tools/cc-sdd/templates/agents/claude-code-skills/skills/kiro-discovery/SKILL.md`.
|
|
45
|
+
|
|
46
|
+
### Inventario rápido (solo metadata, NO leer contenido completo)
|
|
47
|
+
|
|
48
|
+
1. `Glob` sobre `.planning/fases/*.md` → lista de fases existentes y su estado.
|
|
49
|
+
2. `Read` de `.planning/HOJA-RUTA.md` (si existe) — para mapear la petición a roadmap.
|
|
50
|
+
3. `Read` del `.planning/ESTADO.md` (si existe) — para conocer fase activa.
|
|
51
|
+
|
|
52
|
+
Si no hay `.planning/`, marca **proyecto verde** y salta al cuestionario completo (Ruta C por defecto).
|
|
53
|
+
|
|
54
|
+
### Determinar la ruta
|
|
55
|
+
|
|
56
|
+
| Ruta | Cuándo aplica | Acción |
|
|
57
|
+
|------|--------------|--------|
|
|
58
|
+
| **RUTA_A** — Extiende fase existente | La petición es una extensión, fix o enhancement dentro del scope de una fase ya planeada. Cabe en `tasks` de un PLAN.md existente. | NO ejecutar cuestionario. Informar al usuario: "Esto encaja en la fase `<N>`. ¿Procedo a actualizar su PLAN.md o lanzar `/swl:ejecutar-fase <N>` directo?" |
|
|
59
|
+
| **RUTA_B** — Sin fase necesaria | Fix trivial (<5 archivos, 1 tarea, sin decisiones de scope). Bug puntual, typo, dependencia, refactor menor. | NO ejecutar cuestionario. Informar al usuario: "Esto no requiere fase formal. Procedo directo con `implementador-swl` o el agente de stack. ¿De acuerdo?" |
|
|
60
|
+
| **RUTA_C** — Nueva fase single-scope | Petición nueva, no encaja en fases existentes, single-domain. | Ejecutar cuestionario completo (Bloques 1-4). |
|
|
61
|
+
| **RUTA_D** — Decomposición multi-fase | Petición spans múltiples dominios o produciría >20 tareas en una sola fase. | Ejecutar cuestionario **resumido** (Bloque 1 + Bloque 4) para extraer decisiones de scope. Luego sugerir descomposición en N fases. Confirmar con usuario antes de proceder. |
|
|
62
|
+
| **RUTA_E** — Mixto | La petición combina: extensión de fase existente + nueva fase + posiblemente fix trivial. | Presentar al usuario la decomposición propuesta y confirmar antes de proceder. Para la parte "nueva fase" ejecutar cuestionario reducido. |
|
|
63
|
+
|
|
64
|
+
### Heurísticas de matching
|
|
65
|
+
|
|
66
|
+
- Si la petición menciona explícitamente "fase N" → considerar RUTA_A primero.
|
|
67
|
+
- Si la petición empieza con "arregla", "corrige", "fix", "elimina" → considerar RUTA_B primero.
|
|
68
|
+
- Si la petición empieza con "implementa", "crea", "agrega feature" → RUTA_C o RUTA_D.
|
|
69
|
+
- Si la petición tiene `y`, `,`, `también` enumerando >2 cosas distintas → RUTA_D o RUTA_E.
|
|
70
|
+
|
|
71
|
+
### Cómo presentar el veredicto
|
|
72
|
+
|
|
73
|
+
Tras el scan, emite un mensaje corto al usuario antes del cuestionario:
|
|
74
|
+
|
|
75
|
+
```
|
|
76
|
+
Discovery routing: RUTA_<X>
|
|
77
|
+
Justificación: <una oración explicando por qué>
|
|
78
|
+
Próximo paso: <qué se hará a continuación>
|
|
79
|
+
¿Procedo? [s/N o sugerir otra ruta]
|
|
80
|
+
```
|
|
81
|
+
|
|
82
|
+
Solo después de confirmar la ruta procede con el cuestionario (si aplica).
|
|
83
|
+
|
|
84
|
+
---
|
|
85
|
+
|
|
38
86
|
## Protocolo de entrevista adaptativa
|
|
39
87
|
|
|
40
88
|
### Regla 1 — Máximo 4 preguntas por mensaje
|
|
@@ -0,0 +1,278 @@
|
|
|
1
|
+
---
|
|
2
|
+
name: ejecutar-task-iterativo
|
|
3
|
+
description: >
|
|
4
|
+
Modo iterativo de ejecución por tarea (opt-in via /swl:ejecutar-fase --iterative)
|
|
5
|
+
donde cada tarea atómica recibe contexto fresco, implementer dispatched como
|
|
6
|
+
sub-agente independiente, revisión task-local con protocolo-revision-swl,
|
|
7
|
+
auto-debug en BLOCKED, y commit por tarea. Alternativa al modo default
|
|
8
|
+
(oleadas paralelas con verificación al final de fase). Cargar cuando la fase
|
|
9
|
+
tiene tareas con dependencias secuenciales fuertes, módulos críticos donde
|
|
10
|
+
cada tarea merece revisión adversarial inmediata, o cuando la fase tiene
|
|
11
|
+
>12 tareas y el modo paralelo arriesga acumular deuda no detectada.
|
|
12
|
+
version: "1.0.0"
|
|
13
|
+
herramientasPermitidas: [Read, Write, Edit, Bash, Glob, Grep, Agent]
|
|
14
|
+
exclusiones:
|
|
15
|
+
- "No cargar si /swl:ejecutar-fase NO recibió el flag --iterative — el modo default sigue siendo oleadas paralelas."
|
|
16
|
+
- "No cargar para fases pequeñas (<5 tareas) — el overhead per-task supera el beneficio."
|
|
17
|
+
- "No cargar para tareas que no son atómicas o no tienen verificación clara — la iteración requiere boundary explícito por tarea."
|
|
18
|
+
- "No cargar si PLAN.md no tiene `estado: aprobado` — requirement freeze obligatorio antes de ejecutar."
|
|
19
|
+
evolvable: true
|
|
20
|
+
---
|
|
21
|
+
|
|
22
|
+
# Ejecución iterativa per-task
|
|
23
|
+
|
|
24
|
+
## Propósito
|
|
25
|
+
|
|
26
|
+
El modo default de `/swl:ejecutar-fase` ejecuta tareas en **oleadas paralelas**
|
|
27
|
+
y verifica al final de la fase con `verificar-trabajo` goal-backward. Esto es
|
|
28
|
+
eficiente para fases con tareas independientes y bajo riesgo.
|
|
29
|
+
|
|
30
|
+
Sin embargo, hay casos donde la granularidad task-por-task es superior:
|
|
31
|
+
|
|
32
|
+
- Tareas con dependencias secuenciales fuertes (cada una depende del resultado de la anterior).
|
|
33
|
+
- Módulos críticos (dinero, permisos, datos irreversibles) donde cada tarea merece revisión adversarial.
|
|
34
|
+
- Fases con >12 tareas, donde el modo paralelo arriesga acumular deuda silenciosa.
|
|
35
|
+
- El usuario explícitamente pide "una a una, revisando cada una".
|
|
36
|
+
|
|
37
|
+
Este skill implementa ese modo: 1 tarea por iteración, contexto fresco,
|
|
38
|
+
implementer dispatchado como sub-agente, review task-local con
|
|
39
|
+
`protocolo-revision-swl`, auto-debug en `BLOCKED`, y commit por tarea.
|
|
40
|
+
|
|
41
|
+
Adaptado del patrón `kiro-impl` de cc-sdd, manteniendo identidad SWL.
|
|
42
|
+
|
|
43
|
+
## Cuándo cargar
|
|
44
|
+
|
|
45
|
+
- `/swl:ejecutar-fase N --iterative` (flag explícito del usuario)
|
|
46
|
+
- El usuario pide "ejecuta el plan tarea por tarea con revisión en cada una"
|
|
47
|
+
- El PLAN.md declara en su frontmatter `modo_ejecucion: iterativo`
|
|
48
|
+
|
|
49
|
+
## Cuándo NO cargar
|
|
50
|
+
|
|
51
|
+
Ver `exclusiones` en frontmatter.
|
|
52
|
+
|
|
53
|
+
---
|
|
54
|
+
|
|
55
|
+
## Precondiciones (verificar antes de iterar)
|
|
56
|
+
|
|
57
|
+
1. `.planning/fases/0N-PLAN.md` con `estado: aprobado` (requirement freeze).
|
|
58
|
+
2. `.planning/ESTADO.md` inicializado o actualizado.
|
|
59
|
+
3. Working tree limpio (`git status --porcelain` vacío) o el usuario explícitamente autoriza cambios pendientes.
|
|
60
|
+
4. Tests del proyecto en estado "verde de base" — capturar baseline antes del primer task para detectar regresiones limpiamente.
|
|
61
|
+
5. Validation commands descubiertos del proyecto (test, build, lint, smoke):
|
|
62
|
+
|
|
63
|
+
```bash
|
|
64
|
+
node -e "const p=require('./package.json');console.log(JSON.stringify(p.scripts||{}))" 2>/dev/null
|
|
65
|
+
```
|
|
66
|
+
|
|
67
|
+
Si no se pueden derivar comandos canónicos → reportar al usuario y pedir
|
|
68
|
+
guía antes de iterar.
|
|
69
|
+
|
|
70
|
+
---
|
|
71
|
+
|
|
72
|
+
## El loop iterativo (1 task por iteración)
|
|
73
|
+
|
|
74
|
+
### Disciplina del loop
|
|
75
|
+
|
|
76
|
+
- **Una sola sub-tarea por iteración** (ej. 3.1, luego 3.2, luego 3.3 — no batch).
|
|
77
|
+
- **Contexto fresco**: al inicio de cada iteración, re-leer `PLAN.md` para
|
|
78
|
+
determinar la siguiente tarea actionable. NO confiar en memoria acumulada
|
|
79
|
+
de iteraciones previas.
|
|
80
|
+
- **Memoria residual mínima**: tras cada iteración, retener solo 1 línea
|
|
81
|
+
("3.1: APPROVED, 3 archivos cambiados"). Descartar status report completo
|
|
82
|
+
y detalles del reviewer.
|
|
83
|
+
- **Re-read tasks.md antes de cada nuevo dispatch** — el implementer previo
|
|
84
|
+
pudo agregar `## Implementation Notes` que aplican a la siguiente tarea.
|
|
85
|
+
|
|
86
|
+
### Iteración estándar
|
|
87
|
+
|
|
88
|
+
Para cada sub-tarea pendiente, en orden:
|
|
89
|
+
|
|
90
|
+
#### Paso 1 — Identificar la siguiente tarea
|
|
91
|
+
|
|
92
|
+
```bash
|
|
93
|
+
# Re-leer PLAN.md y encontrar primera tarea no marcada [x]
|
|
94
|
+
grep -E "^\s*- \[ \]" .planning/fases/0N-PLAN.md | head -1
|
|
95
|
+
```
|
|
96
|
+
|
|
97
|
+
- Saltear tareas con anotación `_Blocked:_`.
|
|
98
|
+
- Verificar dependencias declaradas en `_Depends:_` — si una dependencia no está `[x]`, ejecutarla primero o pedir resolución al usuario.
|
|
99
|
+
- Leer `_Boundary:_` para identificar los paths/módulos que esta tarea puede tocar.
|
|
100
|
+
|
|
101
|
+
#### Paso 2 — Dispatch del implementer (como sub-agente fresh)
|
|
102
|
+
|
|
103
|
+
Construir prompt con:
|
|
104
|
+
|
|
105
|
+
- Texto literal de la tarea (no parafrasear).
|
|
106
|
+
- Boundary scope.
|
|
107
|
+
- Paths a spec files (`PLAN.md`, `CONTEXTO.md`, otros).
|
|
108
|
+
- IDs literales de requirements/design references (NO inventar `REQ-*` aliases).
|
|
109
|
+
- Validation commands del proyecto (test, build, smoke) relevantes a la tarea.
|
|
110
|
+
- Implementation Notes previas del PLAN.md que apliquen al boundary actual.
|
|
111
|
+
- Indicación de si la tarea es behavioral (requiere feature flag opcional) o no-behavioral.
|
|
112
|
+
|
|
113
|
+
Invocar el sub-agente vía `Agent` tool con `subagent_type` apropiado:
|
|
114
|
+
|
|
115
|
+
- Backend Python → `backend-python-swl`
|
|
116
|
+
- Backend Node → `backend-node-swl`
|
|
117
|
+
- Frontend React → `frontend-react-swl`
|
|
118
|
+
- ... (matriz `usar-sistema-swl.md`)
|
|
119
|
+
- Fallback: `implementador-swl`
|
|
120
|
+
|
|
121
|
+
El sub-agente debe devolver un **Status Report estructurado** con campo
|
|
122
|
+
`STATUS: READY_FOR_REVIEW | BLOCKED | NEEDS_CONTEXT`.
|
|
123
|
+
|
|
124
|
+
#### Paso 3 — Manejar el status del implementer
|
|
125
|
+
|
|
126
|
+
Parsear el status solo del bloque exacto `## Status Report` con campo `STATUS:`.
|
|
127
|
+
Si el status no es parseable, re-dispatch UNA VEZ pidiendo el bloque estructurado.
|
|
128
|
+
Sin status parseable tras 2 dispatches → escalar.
|
|
129
|
+
|
|
130
|
+
| Status | Acción |
|
|
131
|
+
|--------|--------|
|
|
132
|
+
| `READY_FOR_REVIEW` | Continuar al Paso 4 (review) |
|
|
133
|
+
| `NEEDS_CONTEXT` | Re-dispatch UNA VEZ con el contexto adicional solicitado. Si persiste → Paso 5 (debug) |
|
|
134
|
+
| `BLOCKED` | Saltar a Paso 5 (debug). NO marcar la tarea como saltada |
|
|
135
|
+
|
|
136
|
+
#### Paso 4 — Review task-local
|
|
137
|
+
|
|
138
|
+
Invocar el revisor apropiado al stack:
|
|
139
|
+
|
|
140
|
+
- `revisor-codigo-swl` (general)
|
|
141
|
+
- `revisor-react-swl` / `revisor-angular-swl` (frontend)
|
|
142
|
+
- `revisor-typescript-swl` / `revisor-python-*` / etc.
|
|
143
|
+
- `revisor-seguridad-swl` (si la tarea toca auth, secretos, input externo)
|
|
144
|
+
|
|
145
|
+
El revisor carga `Skill("protocolo-revision-swl")` y emite veredicto:
|
|
146
|
+
|
|
147
|
+
| Verdict | Acción |
|
|
148
|
+
|---------|--------|
|
|
149
|
+
| `APPROVED` con score ≥9.0 | Continuar al Paso 6 (commit) |
|
|
150
|
+
| `REJECTED` (1er ciclo) | Re-dispatch del implementer con las findings del revisor. Volver al Paso 3 |
|
|
151
|
+
| `REJECTED` (2do ciclo) | Saltar al Paso 5 (debug) — la remediación no convergió |
|
|
152
|
+
|
|
153
|
+
Veredictos persistidos en `.planning/audit/reviews/<task-id>-<ts>.json`.
|
|
154
|
+
|
|
155
|
+
#### Paso 5 — Auto-debug (cuando BLOCKED o REJECTED persiste)
|
|
156
|
+
|
|
157
|
+
Invocar `depurador-swl` con contexto fresh:
|
|
158
|
+
|
|
159
|
+
- Síntoma exacto del blocker o de los findings que no se resolvieron.
|
|
160
|
+
- Stack trace, output del comando fallido, exit code.
|
|
161
|
+
- Reviewer feedback si aplica.
|
|
162
|
+
- `_Boundary:_` de la tarea.
|
|
163
|
+
- Implementation Notes relacionadas.
|
|
164
|
+
|
|
165
|
+
El depurador retorna:
|
|
166
|
+
|
|
167
|
+
```
|
|
168
|
+
ROOT_CAUSE: <descripción>
|
|
169
|
+
FIX_PLAN: <pasos concretos>
|
|
170
|
+
VERIFICATION: <cómo verificar el fix>
|
|
171
|
+
NEXT_ACTION: RETRY_TASK | BLOCK_TASK | STOP_FOR_HUMAN
|
|
172
|
+
CONFIDENCE: HIGH | MEDIUM | LOW
|
|
173
|
+
```
|
|
174
|
+
|
|
175
|
+
- `RETRY_TASK` con CONFIDENCE HIGH/MEDIUM → re-dispatch implementer con el fix plan. Volver al Paso 3.
|
|
176
|
+
- `BLOCK_TASK` → marcar tarea con `_Blocked:_<razón>_` en PLAN.md. Actualizar ESTADO.md. Continuar con la SIGUIENTE tarea (no esta).
|
|
177
|
+
- `STOP_FOR_HUMAN` → pausar el loop y escalar al usuario con el informe del depurador.
|
|
178
|
+
|
|
179
|
+
#### Paso 6 — Commit atómico de la tarea
|
|
180
|
+
|
|
181
|
+
Tras APPROVED:
|
|
182
|
+
|
|
183
|
+
```bash
|
|
184
|
+
git add <archivos del diff de esta tarea>
|
|
185
|
+
git commit -m "<tipo>(<scope>): <descripción imperativa de la tarea>
|
|
186
|
+
|
|
187
|
+
Tarea: <task-id> — <texto literal>
|
|
188
|
+
Plan: .planning/fases/0N-PLAN.md
|
|
189
|
+
Review: .planning/audit/reviews/<task-id>-<ts>.json"
|
|
190
|
+
```
|
|
191
|
+
|
|
192
|
+
Marcar la tarea como `[x]` en PLAN.md en el mismo commit (o en commit
|
|
193
|
+
inmediato siguiente atómico).
|
|
194
|
+
|
|
195
|
+
#### Paso 7 — Update de ESTADO.md y memoria
|
|
196
|
+
|
|
197
|
+
- Marcar tarea `[x]` en PLAN.md.
|
|
198
|
+
- Actualizar ESTADO.md con: tarea completada, commit hash, archivos cambiados, score del review.
|
|
199
|
+
- Agregar al final del PLAN.md, en sección `## Implementation Notes`, cualquier learning relevante para tareas futuras del mismo boundary o dependencia.
|
|
200
|
+
- Retener solo 1 línea en memoria de iteración para el siguiente loop.
|
|
201
|
+
|
|
202
|
+
#### Paso 8 — Próxima iteración o cierre
|
|
203
|
+
|
|
204
|
+
- Si quedan tareas pendientes: volver al Paso 1.
|
|
205
|
+
- Si todas las tareas están `[x]` o `_Blocked:_`: cerrar el loop e invocar
|
|
206
|
+
el flujo de cierre estándar de `ejecutar-fase` (RESUMEN.md, actualizar
|
|
207
|
+
HOJA-RUTA.md, verificación goal-backward final con `verificar-trabajo` —
|
|
208
|
+
ver Paso 6-8 del comando `/swl:ejecutar-fase`).
|
|
209
|
+
|
|
210
|
+
---
|
|
211
|
+
|
|
212
|
+
## Persistencia de aprendizajes entre tareas
|
|
213
|
+
|
|
214
|
+
A diferencia del modo paralelo (donde cada wave es relativamente
|
|
215
|
+
independiente), el modo iterativo propaga aprendizajes:
|
|
216
|
+
|
|
217
|
+
### En PLAN.md, sección `## Implementation Notes`:
|
|
218
|
+
|
|
219
|
+
```markdown
|
|
220
|
+
## Implementation Notes
|
|
221
|
+
|
|
222
|
+
- **Tarea 1.2 (POST /facturas)**: `Pydantic v2` cambia `parse_obj` → `model_validate`.
|
|
223
|
+
Aplica a futuras tareas que validen schemas con v2.
|
|
224
|
+
- **Tarea 2.1 (migración)**: `Alembic` no detecta cambios en `JSONB` automáticamente —
|
|
225
|
+
marcar con `nullable=False` explícito.
|
|
226
|
+
```
|
|
227
|
+
|
|
228
|
+
El implementer del paso 2 lee estas notes antes de empezar. Esto evita
|
|
229
|
+
repetir los mismos errores task-a-task.
|
|
230
|
+
|
|
231
|
+
---
|
|
232
|
+
|
|
233
|
+
## Diferencias clave con el modo default (paralelo por oleadas)
|
|
234
|
+
|
|
235
|
+
| Aspecto | Modo default (paralelo) | Modo iterativo (este skill) |
|
|
236
|
+
|---------|------------------------|----------------------------|
|
|
237
|
+
| Granularidad | Oleada (varias tareas en paralelo) | 1 tarea por iteración |
|
|
238
|
+
| Contexto del implementer | Acumulado entre tareas de la misma oleada | Fresco por tarea (sub-agente nuevo) |
|
|
239
|
+
| Review | Al final de fase con `verificar-trabajo` | Tras cada tarea con `protocolo-revision-swl` |
|
|
240
|
+
| Auto-debug | Manual o post-mortem | Automático en BLOCKED |
|
|
241
|
+
| Commit | Atómico por slice/tarea (similar) | Atómico estricto por tarea + review JSON |
|
|
242
|
+
| Implementation Notes | No requeridas | Propagadas entre tareas |
|
|
243
|
+
| Costo en tokens | Menor | Mayor (~1.5-2× por contexto fresh) |
|
|
244
|
+
| Cuándo preferir | Fases con tareas independientes, riesgo bajo | Tareas con dependencias fuertes, módulos críticos, fases grandes |
|
|
245
|
+
|
|
246
|
+
---
|
|
247
|
+
|
|
248
|
+
## Gotchas / Errores comunes no obvios
|
|
249
|
+
|
|
250
|
+
- **Re-usar contexto acumulado del implementer entre iteraciones**: el implementer del task 3.2 NO debe tener en su contexto el reporte completo del task 3.1 — solo el `## Implementation Notes` relevante. Causa: ahorro falso de tokens. Solución: dispatch fresh siempre, los notes son el canal explícito de propagación.
|
|
251
|
+
- **Saltar el Paso 4 (review) "porque la tarea es chica"**: el review per-task es lo que distingue este modo del default. Sin review per-task, el modo iterativo es solo "lento sin beneficio". Solución: si la tarea es realmente trivial, no usar modo iterativo.
|
|
252
|
+
- **Auto-debug que sugiere FIX y se aplica sin re-review**: tras debug → fix → COMMIT directo es anti-patrón. Solución: cada FIX debe volver al Paso 4 (review) antes de commit.
|
|
253
|
+
- **Boundary violations toleradas porque "el implementer tenía que tocar eso"**: si un archivo fuera del boundary aparece en el diff y el revisor lo marca como finding, no se puede aceptar sin extender el boundary EN EL PLAN.md (decisión documentada). Solución: si el boundary necesita extenderse, actualizar PLAN.md primero y volver a iterar.
|
|
254
|
+
- **`MERGED` en main sin marcar la tarea `[x]` en PLAN.md**: deja ESTADO.md y PLAN.md desincronizados. Solución: marcar `[x]` está en el MISMO commit del cambio (no commit aparte).
|
|
255
|
+
|
|
256
|
+
---
|
|
257
|
+
|
|
258
|
+
## Relación con otros componentes SWL
|
|
259
|
+
|
|
260
|
+
| Componente | Relación |
|
|
261
|
+
|-----------|----------|
|
|
262
|
+
| `ejecutar-fase` | Skill padre — el flag `--iterative` cede el control a este skill |
|
|
263
|
+
| `protocolo-revision-swl` | Invocado en Paso 4 por el revisor |
|
|
264
|
+
| `verificar-trabajo` | Invocado al cerrar el loop como verificación goal-backward final |
|
|
265
|
+
| `depurador-swl` | Invocado en Paso 5 cuando hay BLOCKED o REJECTED persistente |
|
|
266
|
+
| `implementador-swl` y agentes de stack | Dispatchados como sub-agentes en Paso 2 |
|
|
267
|
+
| `notificador-swl` | Invocado en STOP_FOR_HUMAN o ESCALATE |
|
|
268
|
+
| `reglas/seguridad-agentes.md` § Recovery Catalog | Marco de escalada (reprompt → reduce-autonomy → escalate → terminate) |
|
|
269
|
+
|
|
270
|
+
## Checklist de cierre del loop
|
|
271
|
+
|
|
272
|
+
- [ ] Todas las tareas pendientes están `[x]` o `_Blocked:_<razón>_`
|
|
273
|
+
- [ ] Cada tarea tiene su review JSON en `.planning/audit/reviews/`
|
|
274
|
+
- [ ] PLAN.md tiene `## Implementation Notes` con aprendizajes relevantes
|
|
275
|
+
- [ ] ESTADO.md actualizado con commit hashes y scores
|
|
276
|
+
- [ ] Verificación goal-backward final ejecutada (`verificar-trabajo`)
|
|
277
|
+
- [ ] RESUMEN.md generado (paso del flujo estándar de `ejecutar-fase`)
|
|
278
|
+
- [ ] Working tree limpio o con cambios pendientes documentados
|
|
@@ -0,0 +1,276 @@
|
|
|
1
|
+
---
|
|
2
|
+
name: protocolo-revision-swl
|
|
3
|
+
description: >
|
|
4
|
+
Protocolo de revisión adversarial per-task con git diff como single source of
|
|
5
|
+
truth. Adapta el patrón task-local review de cc-sdd al ecosistema SWL: los
|
|
6
|
+
revisores existentes (revisor-codigo-swl, revisor-seguridad-swl, revisor-*-swl)
|
|
7
|
+
aplican este protocolo cuando trabajan sobre una sola tarea atómica en lugar
|
|
8
|
+
de una fase completa. Devuelve APPROVED o REJECTED con findings de severidad
|
|
9
|
+
estructurados y boundary checks. Cargar desde el agente revisor cuando
|
|
10
|
+
ejecutar-fase corre en modo --iterative (task por task) o cuando se solicita
|
|
11
|
+
revisión acotada a un commit / patch específico.
|
|
12
|
+
version: "1.0.0"
|
|
13
|
+
herramientasPermitidas: [Read, Grep, Glob, Bash]
|
|
14
|
+
exclusiones:
|
|
15
|
+
- "No cargar para revisión de fase completa multi-archivo — usar el flujo estándar del revisor con `/swl:revisar` y `/swl:verificar`."
|
|
16
|
+
- "No cargar para auditoría de seguridad profunda — usar `revisor-seguridad-swl` con `checklist-seguridad`."
|
|
17
|
+
- "No cargar como sustituto de la verificación goal-backward post-ejecución — `verificar-trabajo` cubre eso a nivel de fase."
|
|
18
|
+
- "No cargar para revisar código que no ha sido staged ni commiteado todavía — el protocolo requiere un diff o set de archivos definido."
|
|
19
|
+
evolvable: true
|
|
20
|
+
---
|
|
21
|
+
|
|
22
|
+
# Protocolo de revisión per-task
|
|
23
|
+
|
|
24
|
+
## Propósito
|
|
25
|
+
|
|
26
|
+
Revisar el resultado de UNA tarea atómica de implementación (no una fase
|
|
27
|
+
completa) con el rigor de un revisor adversarial. El protocolo está diseñado
|
|
28
|
+
para coexistir con los revisores especializados existentes (`revisor-codigo-swl`,
|
|
29
|
+
`revisor-react-swl`, `revisor-typescript-swl`, etc.): esos agentes cargan
|
|
30
|
+
este skill cuando el alcance es task-local en lugar de phase-wide.
|
|
31
|
+
|
|
32
|
+
Adaptado del patrón `kiro-review` de cc-sdd. Mantiene los principios de
|
|
33
|
+
swl-ses (separación revisor/ejecutor de `reglas/gobernanza.md`, veto items
|
|
34
|
+
y cap enforcement, scoring 9.0+ obligatorio para APPROVED).
|
|
35
|
+
|
|
36
|
+
## Cuándo cargar
|
|
37
|
+
|
|
38
|
+
- El orquestador ejecuta `/swl:ejecutar-fase --iterative` y necesita revisión task-por-task
|
|
39
|
+
- Un agente implementador reportó `READY_FOR_REVIEW` para una sub-tarea específica
|
|
40
|
+
- El usuario pide "revisa este último commit" o "revisa lo que acabo de hacer"
|
|
41
|
+
- Tras una remediación de un finding previo y se necesita re-verificación acotada
|
|
42
|
+
|
|
43
|
+
## Cuándo NO cargar
|
|
44
|
+
|
|
45
|
+
Ver `exclusiones` en frontmatter.
|
|
46
|
+
|
|
47
|
+
---
|
|
48
|
+
|
|
49
|
+
## Inputs requeridos
|
|
50
|
+
|
|
51
|
+
Antes de empezar, identifica los siguientes inputs. Si falta cualquiera, pide
|
|
52
|
+
clarificación al caller (orquestador o implementador) en lugar de proceder
|
|
53
|
+
con asunciones.
|
|
54
|
+
|
|
55
|
+
| Input | Forma | Obligatorio |
|
|
56
|
+
|-------|-------|-------------|
|
|
57
|
+
| Task ID | Texto de la tarea desde PLAN.md (ej. "3.2 — Crear endpoint POST /facturas") | Sí |
|
|
58
|
+
| Boundary scope | Lista de paths/módulos que la tarea puede modificar | Sí |
|
|
59
|
+
| Spec references | IDs de requirements y design sections que la tarea satisface | Sí — si existen |
|
|
60
|
+
| Diff | `git diff <base>..HEAD` o set de archivos modificados | Sí |
|
|
61
|
+
| Validation commands | Comandos descubiertos por el caller (test, build, lint, smoke) | Sí — si aplica el stack |
|
|
62
|
+
| Implementer status report | El reporte estructurado del ejecutor (`READY_FOR_REVIEW`, archivos tocados, decisiones) | Recomendado |
|
|
63
|
+
|
|
64
|
+
---
|
|
65
|
+
|
|
66
|
+
## Paso 1 — Primera acción obligatoria: `git diff`
|
|
67
|
+
|
|
68
|
+
Antes de leer cualquier otro archivo, ejecuta:
|
|
69
|
+
|
|
70
|
+
```bash
|
|
71
|
+
git diff --stat # alcance del cambio
|
|
72
|
+
git diff <base>..HEAD # contenido real
|
|
73
|
+
```
|
|
74
|
+
|
|
75
|
+
El reporte del implementador NO es fuente de verdad. El diff sí. Si el diff
|
|
76
|
+
es grande, lee los archivos modificados directamente — no resuamen ni inferas
|
|
77
|
+
desde el reporte del ejecutor.
|
|
78
|
+
|
|
79
|
+
**Por qué**: el implementador puede honestamente reportar "implementé X" pero
|
|
80
|
+
haber introducido Y como efecto colateral. El diff captura todo, incluido lo
|
|
81
|
+
que el ejecutor no recuerda haber tocado.
|
|
82
|
+
|
|
83
|
+
---
|
|
84
|
+
|
|
85
|
+
## Paso 2 — Checks mecánicos (resultado = señal primaria)
|
|
86
|
+
|
|
87
|
+
Estos checks son determinísticos y producen evidencia directa. Aplica TODOS
|
|
88
|
+
antes de pasar a interpretación.
|
|
89
|
+
|
|
90
|
+
### Check 1: Regression safety
|
|
91
|
+
|
|
92
|
+
Corre la suite de tests del proyecto con las `validation_commands` provistas.
|
|
93
|
+
Ejemplo:
|
|
94
|
+
|
|
95
|
+
```bash
|
|
96
|
+
npm test # o pytest, o cargo test, etc.
|
|
97
|
+
```
|
|
98
|
+
|
|
99
|
+
- **Tests pasan** → continuar.
|
|
100
|
+
- **Tests fallan** → `REJECTED` inmediato. Incluye el conteo y nombres de tests fallidos en el reporte.
|
|
101
|
+
- **Tests skipped aumentan vs base** → riesgo de regresión silenciosa (regla `monitor-ci.md`). Reportar el delta como finding de severidad MAJOR.
|
|
102
|
+
|
|
103
|
+
### Check 2: Sin marcadores placeholder nuevos
|
|
104
|
+
|
|
105
|
+
```bash
|
|
106
|
+
git diff <base>..HEAD | grep -E "\+.*\b(TBD|TODO|FIXME|HACK|XXX)\b" || true
|
|
107
|
+
```
|
|
108
|
+
|
|
109
|
+
Marcadores nuevos solo se aceptan con justificación explícita en el reporte
|
|
110
|
+
del implementador asociada al PLAN.md vigente (referencia a task ID, no texto suelto).
|
|
111
|
+
Sin justificación → finding MAYOR.
|
|
112
|
+
|
|
113
|
+
### Check 3: Sin secretos hardcodeados
|
|
114
|
+
|
|
115
|
+
```bash
|
|
116
|
+
git diff <base>..HEAD | grep -E "(api[_-]?key|password|secret|token)\s*[=:]\s*[\"'][^\"'\s]{8,}[\"']" -i || true
|
|
117
|
+
```
|
|
118
|
+
|
|
119
|
+
Cualquier match → `REJECTED` con finding CRÍTICO. Aplica los patrones
|
|
120
|
+
documentados en `reglas/seguridad-agentes.md` § "Protección de secretos".
|
|
121
|
+
|
|
122
|
+
### Check 4: Boundary violations
|
|
123
|
+
|
|
124
|
+
Lista de archivos modificados:
|
|
125
|
+
|
|
126
|
+
```bash
|
|
127
|
+
git diff --name-only <base>..HEAD
|
|
128
|
+
```
|
|
129
|
+
|
|
130
|
+
Cada archivo modificado DEBE estar dentro del `boundary scope` declarado en
|
|
131
|
+
la tarea. Si un archivo fuera del boundary aparece modificado:
|
|
132
|
+
|
|
133
|
+
- Si es modificación trivial (formateo, comentario) → finding MENOR.
|
|
134
|
+
- Si es modificación funcional → finding MAYOR. La tarea debe declarar el
|
|
135
|
+
boundary extendido o el cambio se devuelve al implementador para extraer
|
|
136
|
+
a una tarea aparte.
|
|
137
|
+
|
|
138
|
+
---
|
|
139
|
+
|
|
140
|
+
## Paso 3 — Verificación de alineación con spec
|
|
141
|
+
|
|
142
|
+
Lee directamente:
|
|
143
|
+
|
|
144
|
+
- El texto de la tarea en `PLAN.md` (no parafrases — copia literal).
|
|
145
|
+
- Los requirements citados en el campo `requirements` de la tarea.
|
|
146
|
+
- Las secciones de design citadas si existen.
|
|
147
|
+
|
|
148
|
+
Para cada requirement/design ref, verifica:
|
|
149
|
+
|
|
150
|
+
| Pregunta | Cómo verificar |
|
|
151
|
+
|----------|----------------|
|
|
152
|
+
| ¿El código implementa lo que el requirement dice? | Mapear líneas concretas del diff al texto del requirement |
|
|
153
|
+
| ¿Falta algo del requirement que el código no cubre? | Listar gaps específicos |
|
|
154
|
+
| ¿Hay código fuera del scope del requirement? | Comparar con design — si no está justificado, es scope creep |
|
|
155
|
+
|
|
156
|
+
Si hay gap de cobertura → finding MAYOR con cita del requirement y línea
|
|
157
|
+
faltante en el diff.
|
|
158
|
+
|
|
159
|
+
---
|
|
160
|
+
|
|
161
|
+
## Paso 4 — Veto items (heredados del revisor base)
|
|
162
|
+
|
|
163
|
+
Los revisores SWL existentes declaran sus propios veto items (ver
|
|
164
|
+
`reglas/gobernanza.md` § "Veto items y cap enforcement"). Cuando este
|
|
165
|
+
protocolo se carga desde uno de ellos, los veto items del revisor padre
|
|
166
|
+
aplican íntegros.
|
|
167
|
+
|
|
168
|
+
**Si detectas CUALQUIER veto item**:
|
|
169
|
+
|
|
170
|
+
- Score CAP automático a 6.0/10.
|
|
171
|
+
- Verdict pasa a `REJECTED` independientemente de qué tan limpio esté el resto.
|
|
172
|
+
- 2+ veto items → cap a 3.0/10.
|
|
173
|
+
|
|
174
|
+
Lista de veto items del revisor padre debe estar disponible en su SKILL/agente.
|
|
175
|
+
Si no se puede determinar, reporta `MANUAL_VERIFY_REQUIRED` en lugar de inventar.
|
|
176
|
+
|
|
177
|
+
---
|
|
178
|
+
|
|
179
|
+
## Paso 5 — Emitir veredicto estructurado
|
|
180
|
+
|
|
181
|
+
### Formato del reporte
|
|
182
|
+
|
|
183
|
+
```json
|
|
184
|
+
{
|
|
185
|
+
"protocol": "protocolo-revision-swl",
|
|
186
|
+
"task_id": "3.2 — Crear endpoint POST /facturas",
|
|
187
|
+
"verdict": "APPROVED | REJECTED",
|
|
188
|
+
"score": 9.2,
|
|
189
|
+
"score_cap_applied": null,
|
|
190
|
+
"mechanical_checks": {
|
|
191
|
+
"regression_safety": "PASS",
|
|
192
|
+
"no_new_placeholders": "PASS",
|
|
193
|
+
"no_hardcoded_secrets": "PASS",
|
|
194
|
+
"boundary_respected": "PASS | VIOLATIONS_FOUND"
|
|
195
|
+
},
|
|
196
|
+
"spec_alignment": {
|
|
197
|
+
"requirements_covered": ["R-12", "R-13"],
|
|
198
|
+
"requirements_gap": [],
|
|
199
|
+
"design_drift": "NONE | SLIGHT | SIGNIFICANT"
|
|
200
|
+
},
|
|
201
|
+
"veto_items": [],
|
|
202
|
+
"findings": [
|
|
203
|
+
{
|
|
204
|
+
"severity": "CRITICAL | MAJOR | MINOR",
|
|
205
|
+
"file": "app/api/facturas.py:42",
|
|
206
|
+
"issue": "Descripción breve",
|
|
207
|
+
"remediation": "Qué cambiar y cómo"
|
|
208
|
+
}
|
|
209
|
+
],
|
|
210
|
+
"summary": "Una oración resumiendo el veredicto y la razón principal.",
|
|
211
|
+
"next_action": "MERGE | FIX_AND_RE_REVIEW | ESCALATE_TO_HUMAN"
|
|
212
|
+
}
|
|
213
|
+
```
|
|
214
|
+
|
|
215
|
+
### Reglas de scoring (compatibles con `checklist-calidad`)
|
|
216
|
+
|
|
217
|
+
- `APPROVED` requiere `score >= 9.0` Y `veto_items.length === 0` Y todos los
|
|
218
|
+
mechanical_checks en PASS.
|
|
219
|
+
- Severidad MAJOR baja el score 1.0 punto cada una.
|
|
220
|
+
- Severidad MINOR baja 0.3 puntos cada una.
|
|
221
|
+
- Severidad CRITICAL → automaticamente `REJECTED` (score irrelevante).
|
|
222
|
+
- 1 veto item → cap a 6.0. 2+ veto items → cap a 3.0.
|
|
223
|
+
|
|
224
|
+
### Reglas del `next_action`
|
|
225
|
+
|
|
226
|
+
- `MERGE`: APPROVED — el caller (orquestador) puede commitear y avanzar a la siguiente tarea.
|
|
227
|
+
- `FIX_AND_RE_REVIEW`: REJECTED con findings MAYORES — el implementador aplica remediation, se vuelve a invocar este protocolo. Máximo 2 ciclos antes de escalar.
|
|
228
|
+
- `ESCALATE_TO_HUMAN`: 2 ciclos de FIX no convergieron, O hay CRÍTICO sin remediación clara, O hay decisión de scope ambigua. Activa el `notificador-swl` si está configurado.
|
|
229
|
+
|
|
230
|
+
---
|
|
231
|
+
|
|
232
|
+
## Persistencia del veredicto
|
|
233
|
+
|
|
234
|
+
El veredicto JSON se persiste en:
|
|
235
|
+
|
|
236
|
+
```
|
|
237
|
+
.planning/audit/reviews/<task-id>-<timestamp>.json
|
|
238
|
+
```
|
|
239
|
+
|
|
240
|
+
Esto permite que `auto-evolucion-swl` y `/swl:metricas` calculen tasas de
|
|
241
|
+
APPROVED vs REJECTED por agente revisor y por tipo de tarea — datos
|
|
242
|
+
necesarios para identificar revisores con calibración floja o tipos de
|
|
243
|
+
tarea sistemáticamente problemáticos.
|
|
244
|
+
|
|
245
|
+
---
|
|
246
|
+
|
|
247
|
+
## Gotchas / Errores comunes no obvios
|
|
248
|
+
|
|
249
|
+
- **Confiar en el reporte del implementador como source of truth**: el primer paso obligatorio es `git diff`. Saltarse esto y derivar el veredicto del status report del implementador deja pasar bugs colaterales no reportados. Causa: optimización falsa para ahorrar tokens. Solución: `git diff --stat` siempre antes de cualquier interpretación.
|
|
250
|
+
- **Boundary violation reportada como MENOR sin verificar funcionalidad**: el revisor ve que se modificó un archivo fuera del boundary y lo marca MENOR porque "se ve pequeño". Causa: no se inspeccionó qué hace el cambio. Solución: para CUALQUIER archivo fuera del boundary, abrir el cambio y clasificar trivial vs funcional antes de asignar severidad.
|
|
251
|
+
- **Tests skipped tratados como tests pasados**: el conteo de tests verde no distingue entre pasados y saltados. Causa: parsing superficial del output del runner. Solución: comparar `skipped` count vs base — si aumenta sin causa documentada en el diff, es regresión silenciosa (regla `monitor-ci.md`).
|
|
252
|
+
- **APPROVED con score < 9.0 "porque la tarea era pequeña"**: el revisor reduce el umbral subjetivamente. Causa: ceder a presión de entrega. Solución: la regla es 9.0 estricto; tareas pequeñas que no llegan a 9.0 indican findings que valen MENOR o MAYOR — emitir como findings y devolver al implementador.
|
|
253
|
+
- **Veto items ignorados porque "el resto está limpio"**: el cap de score es no-negociable. Causa: el revisor pondera "promedio" de calidad. Solución: 1 veto item = score capped automáticamente, sin compensación posible desde otras dimensiones.
|
|
254
|
+
|
|
255
|
+
---
|
|
256
|
+
|
|
257
|
+
## Relación con otros componentes SWL
|
|
258
|
+
|
|
259
|
+
| Componente | Relación |
|
|
260
|
+
|-----------|----------|
|
|
261
|
+
| `revisor-codigo-swl` y revisores de lenguaje | Cargan este skill cuando trabajan task-local en lugar de phase-wide |
|
|
262
|
+
| `ejecutar-task-iterativo` (Sub-fase 4) | Invoca este protocolo después de cada implementer dispatch en modo `--iterative` |
|
|
263
|
+
| `verificar-trabajo` | Complementario — verificar-trabajo es goal-backward post-fase; este protocolo es task-local post-implementación |
|
|
264
|
+
| `reglas/gobernanza.md` | Veto items + cap enforcement heredados |
|
|
265
|
+
| `checklist-calidad` | Score >=9.0 unificado |
|
|
266
|
+
| `auto-evolucion-swl` | Consume los veredictos persistidos para detectar revisores descalibrados |
|
|
267
|
+
|
|
268
|
+
## Checklist de cierre del protocolo
|
|
269
|
+
|
|
270
|
+
- [ ] `git diff --stat` ejecutado y diff leído antes de cualquier interpretación
|
|
271
|
+
- [ ] 4 mechanical checks ejecutados (regression, placeholders, secretos, boundary)
|
|
272
|
+
- [ ] Alineación con spec verificada citando IDs concretos
|
|
273
|
+
- [ ] Veto items del revisor padre evaluados
|
|
274
|
+
- [ ] Score calculado y cap aplicado si corresponde
|
|
275
|
+
- [ ] Veredicto JSON persistido en `.planning/audit/reviews/`
|
|
276
|
+
- [ ] `next_action` claro (MERGE / FIX_AND_RE_REVIEW / ESCALATE_TO_HUMAN)
|