@saulwade/swl-ses 1.4.2 → 1.5.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
@@ -1,7 +1,7 @@
1
1
  ---
2
2
  name: discutir-fase
3
- description: Cuestionario adaptativo que se ejecuta antes de planear una fase de desarrollo. Extrae decisiones técnicas y de negocio del usuario, clasifica respuestas como "cerradas" (no negociables) o "abiertas" (decisión delegada al agente), y produce un archivo CONTEXTO.md que alimenta al planificador.
4
- version: "1.0.0"
3
+ description: Cuestionario adaptativo que se ejecuta antes de planear una fase de desarrollo. Extrae decisiones técnicas y de negocio del usuario, clasifica respuestas como "cerradas" (no negociables) o "abiertas" (decisión delegada al agente), y produce un archivo CONTEXTO.md que alimenta al planificador. Inicia con discovery routing (5 paths) que evita el cuestionario completo cuando no aplica.
4
+ version: "1.1.0"
5
5
  herramientasPermitidas: [Read, Write, Edit, Bash, Glob, Grep]
6
6
  exclusiones:
7
7
  - "No cargar si el usuario ya tiene un CONTEXTO.md poblado para la fase en curso — ir directo a `planear-fase`."
@@ -35,6 +35,54 @@ antipatrón de planear con suposiciones implícitas que luego se contradicen.
35
35
 
36
36
  ---
37
37
 
38
+ ## Paso 0 — Discovery routing (obligatorio antes del cuestionario)
39
+
40
+ Antes de lanzar el cuestionario adaptativo, ejecuta **scan ligero** de
41
+ `.planning/` para identificar la ruta correcta. Esto evita gastar turnos en
42
+ un cuestionario cuando la petición del usuario no requiere una fase nueva.
43
+
44
+ Inspirado en `kiro-discovery` (cc-sdd) — ver `temp/cc-sdd-main/tools/cc-sdd/templates/agents/claude-code-skills/skills/kiro-discovery/SKILL.md`.
45
+
46
+ ### Inventario rápido (solo metadata, NO leer contenido completo)
47
+
48
+ 1. `Glob` sobre `.planning/fases/*.md` → lista de fases existentes y su estado.
49
+ 2. `Read` de `.planning/HOJA-RUTA.md` (si existe) — para mapear la petición a roadmap.
50
+ 3. `Read` del `.planning/ESTADO.md` (si existe) — para conocer fase activa.
51
+
52
+ Si no hay `.planning/`, marca **proyecto verde** y salta al cuestionario completo (Ruta C por defecto).
53
+
54
+ ### Determinar la ruta
55
+
56
+ | Ruta | Cuándo aplica | Acción |
57
+ |------|--------------|--------|
58
+ | **RUTA_A** — Extiende fase existente | La petición es una extensión, fix o enhancement dentro del scope de una fase ya planeada. Cabe en `tasks` de un PLAN.md existente. | NO ejecutar cuestionario. Informar al usuario: "Esto encaja en la fase `<N>`. ¿Procedo a actualizar su PLAN.md o lanzar `/swl:ejecutar-fase <N>` directo?" |
59
+ | **RUTA_B** — Sin fase necesaria | Fix trivial (<5 archivos, 1 tarea, sin decisiones de scope). Bug puntual, typo, dependencia, refactor menor. | NO ejecutar cuestionario. Informar al usuario: "Esto no requiere fase formal. Procedo directo con `implementador-swl` o el agente de stack. ¿De acuerdo?" |
60
+ | **RUTA_C** — Nueva fase single-scope | Petición nueva, no encaja en fases existentes, single-domain. | Ejecutar cuestionario completo (Bloques 1-4). |
61
+ | **RUTA_D** — Decomposición multi-fase | Petición spans múltiples dominios o produciría >20 tareas en una sola fase. | Ejecutar cuestionario **resumido** (Bloque 1 + Bloque 4) para extraer decisiones de scope. Luego sugerir descomposición en N fases. Confirmar con usuario antes de proceder. |
62
+ | **RUTA_E** — Mixto | La petición combina: extensión de fase existente + nueva fase + posiblemente fix trivial. | Presentar al usuario la decomposición propuesta y confirmar antes de proceder. Para la parte "nueva fase" ejecutar cuestionario reducido. |
63
+
64
+ ### Heurísticas de matching
65
+
66
+ - Si la petición menciona explícitamente "fase N" → considerar RUTA_A primero.
67
+ - Si la petición empieza con "arregla", "corrige", "fix", "elimina" → considerar RUTA_B primero.
68
+ - Si la petición empieza con "implementa", "crea", "agrega feature" → RUTA_C o RUTA_D.
69
+ - Si la petición tiene `y`, `,`, `también` enumerando >2 cosas distintas → RUTA_D o RUTA_E.
70
+
71
+ ### Cómo presentar el veredicto
72
+
73
+ Tras el scan, emite un mensaje corto al usuario antes del cuestionario:
74
+
75
+ ```
76
+ Discovery routing: RUTA_<X>
77
+ Justificación: <una oración explicando por qué>
78
+ Próximo paso: <qué se hará a continuación>
79
+ ¿Procedo? [s/N o sugerir otra ruta]
80
+ ```
81
+
82
+ Solo después de confirmar la ruta procede con el cuestionario (si aplica).
83
+
84
+ ---
85
+
38
86
  ## Protocolo de entrevista adaptativa
39
87
 
40
88
  ### Regla 1 — Máximo 4 preguntas por mensaje
@@ -0,0 +1,278 @@
1
+ ---
2
+ name: ejecutar-task-iterativo
3
+ description: >
4
+ Modo iterativo de ejecución por tarea (opt-in via /swl:ejecutar-fase --iterative)
5
+ donde cada tarea atómica recibe contexto fresco, implementer dispatched como
6
+ sub-agente independiente, revisión task-local con protocolo-revision-swl,
7
+ auto-debug en BLOCKED, y commit por tarea. Alternativa al modo default
8
+ (oleadas paralelas con verificación al final de fase). Cargar cuando la fase
9
+ tiene tareas con dependencias secuenciales fuertes, módulos críticos donde
10
+ cada tarea merece revisión adversarial inmediata, o cuando la fase tiene
11
+ >12 tareas y el modo paralelo arriesga acumular deuda no detectada.
12
+ version: "1.0.0"
13
+ herramientasPermitidas: [Read, Write, Edit, Bash, Glob, Grep, Agent]
14
+ exclusiones:
15
+ - "No cargar si /swl:ejecutar-fase NO recibió el flag --iterative — el modo default sigue siendo oleadas paralelas."
16
+ - "No cargar para fases pequeñas (<5 tareas) — el overhead per-task supera el beneficio."
17
+ - "No cargar para tareas que no son atómicas o no tienen verificación clara — la iteración requiere boundary explícito por tarea."
18
+ - "No cargar si PLAN.md no tiene `estado: aprobado` — requirement freeze obligatorio antes de ejecutar."
19
+ evolvable: true
20
+ ---
21
+
22
+ # Ejecución iterativa per-task
23
+
24
+ ## Propósito
25
+
26
+ El modo default de `/swl:ejecutar-fase` ejecuta tareas en **oleadas paralelas**
27
+ y verifica al final de la fase con `verificar-trabajo` goal-backward. Esto es
28
+ eficiente para fases con tareas independientes y bajo riesgo.
29
+
30
+ Sin embargo, hay casos donde la granularidad task-por-task es superior:
31
+
32
+ - Tareas con dependencias secuenciales fuertes (cada una depende del resultado de la anterior).
33
+ - Módulos críticos (dinero, permisos, datos irreversibles) donde cada tarea merece revisión adversarial.
34
+ - Fases con >12 tareas, donde el modo paralelo arriesga acumular deuda silenciosa.
35
+ - El usuario explícitamente pide "una a una, revisando cada una".
36
+
37
+ Este skill implementa ese modo: 1 tarea por iteración, contexto fresco,
38
+ implementer dispatchado como sub-agente, review task-local con
39
+ `protocolo-revision-swl`, auto-debug en `BLOCKED`, y commit por tarea.
40
+
41
+ Adaptado del patrón `kiro-impl` de cc-sdd, manteniendo identidad SWL.
42
+
43
+ ## Cuándo cargar
44
+
45
+ - `/swl:ejecutar-fase N --iterative` (flag explícito del usuario)
46
+ - El usuario pide "ejecuta el plan tarea por tarea con revisión en cada una"
47
+ - El PLAN.md declara en su frontmatter `modo_ejecucion: iterativo`
48
+
49
+ ## Cuándo NO cargar
50
+
51
+ Ver `exclusiones` en frontmatter.
52
+
53
+ ---
54
+
55
+ ## Precondiciones (verificar antes de iterar)
56
+
57
+ 1. `.planning/fases/0N-PLAN.md` con `estado: aprobado` (requirement freeze).
58
+ 2. `.planning/ESTADO.md` inicializado o actualizado.
59
+ 3. Working tree limpio (`git status --porcelain` vacío) o el usuario explícitamente autoriza cambios pendientes.
60
+ 4. Tests del proyecto en estado "verde de base" — capturar baseline antes del primer task para detectar regresiones limpiamente.
61
+ 5. Validation commands descubiertos del proyecto (test, build, lint, smoke):
62
+
63
+ ```bash
64
+ node -e "const p=require('./package.json');console.log(JSON.stringify(p.scripts||{}))" 2>/dev/null
65
+ ```
66
+
67
+ Si no se pueden derivar comandos canónicos → reportar al usuario y pedir
68
+ guía antes de iterar.
69
+
70
+ ---
71
+
72
+ ## El loop iterativo (1 task por iteración)
73
+
74
+ ### Disciplina del loop
75
+
76
+ - **Una sola sub-tarea por iteración** (ej. 3.1, luego 3.2, luego 3.3 — no batch).
77
+ - **Contexto fresco**: al inicio de cada iteración, re-leer `PLAN.md` para
78
+ determinar la siguiente tarea actionable. NO confiar en memoria acumulada
79
+ de iteraciones previas.
80
+ - **Memoria residual mínima**: tras cada iteración, retener solo 1 línea
81
+ ("3.1: APPROVED, 3 archivos cambiados"). Descartar status report completo
82
+ y detalles del reviewer.
83
+ - **Re-read tasks.md antes de cada nuevo dispatch** — el implementer previo
84
+ pudo agregar `## Implementation Notes` que aplican a la siguiente tarea.
85
+
86
+ ### Iteración estándar
87
+
88
+ Para cada sub-tarea pendiente, en orden:
89
+
90
+ #### Paso 1 — Identificar la siguiente tarea
91
+
92
+ ```bash
93
+ # Re-leer PLAN.md y encontrar primera tarea no marcada [x]
94
+ grep -E "^\s*- \[ \]" .planning/fases/0N-PLAN.md | head -1
95
+ ```
96
+
97
+ - Saltear tareas con anotación `_Blocked:_`.
98
+ - Verificar dependencias declaradas en `_Depends:_` — si una dependencia no está `[x]`, ejecutarla primero o pedir resolución al usuario.
99
+ - Leer `_Boundary:_` para identificar los paths/módulos que esta tarea puede tocar.
100
+
101
+ #### Paso 2 — Dispatch del implementer (como sub-agente fresh)
102
+
103
+ Construir prompt con:
104
+
105
+ - Texto literal de la tarea (no parafrasear).
106
+ - Boundary scope.
107
+ - Paths a spec files (`PLAN.md`, `CONTEXTO.md`, otros).
108
+ - IDs literales de requirements/design references (NO inventar `REQ-*` aliases).
109
+ - Validation commands del proyecto (test, build, smoke) relevantes a la tarea.
110
+ - Implementation Notes previas del PLAN.md que apliquen al boundary actual.
111
+ - Indicación de si la tarea es behavioral (requiere feature flag opcional) o no-behavioral.
112
+
113
+ Invocar el sub-agente vía `Agent` tool con `subagent_type` apropiado:
114
+
115
+ - Backend Python → `backend-python-swl`
116
+ - Backend Node → `backend-node-swl`
117
+ - Frontend React → `frontend-react-swl`
118
+ - ... (matriz `usar-sistema-swl.md`)
119
+ - Fallback: `implementador-swl`
120
+
121
+ El sub-agente debe devolver un **Status Report estructurado** con campo
122
+ `STATUS: READY_FOR_REVIEW | BLOCKED | NEEDS_CONTEXT`.
123
+
124
+ #### Paso 3 — Manejar el status del implementer
125
+
126
+ Parsear el status solo del bloque exacto `## Status Report` con campo `STATUS:`.
127
+ Si el status no es parseable, re-dispatch UNA VEZ pidiendo el bloque estructurado.
128
+ Sin status parseable tras 2 dispatches → escalar.
129
+
130
+ | Status | Acción |
131
+ |--------|--------|
132
+ | `READY_FOR_REVIEW` | Continuar al Paso 4 (review) |
133
+ | `NEEDS_CONTEXT` | Re-dispatch UNA VEZ con el contexto adicional solicitado. Si persiste → Paso 5 (debug) |
134
+ | `BLOCKED` | Saltar a Paso 5 (debug). NO marcar la tarea como saltada |
135
+
136
+ #### Paso 4 — Review task-local
137
+
138
+ Invocar el revisor apropiado al stack:
139
+
140
+ - `revisor-codigo-swl` (general)
141
+ - `revisor-react-swl` / `revisor-angular-swl` (frontend)
142
+ - `revisor-typescript-swl` / `revisor-python-*` / etc.
143
+ - `revisor-seguridad-swl` (si la tarea toca auth, secretos, input externo)
144
+
145
+ El revisor carga `Skill("protocolo-revision-swl")` y emite veredicto:
146
+
147
+ | Verdict | Acción |
148
+ |---------|--------|
149
+ | `APPROVED` con score ≥9.0 | Continuar al Paso 6 (commit) |
150
+ | `REJECTED` (1er ciclo) | Re-dispatch del implementer con las findings del revisor. Volver al Paso 3 |
151
+ | `REJECTED` (2do ciclo) | Saltar al Paso 5 (debug) — la remediación no convergió |
152
+
153
+ Veredictos persistidos en `.planning/audit/reviews/<task-id>-<ts>.json`.
154
+
155
+ #### Paso 5 — Auto-debug (cuando BLOCKED o REJECTED persiste)
156
+
157
+ Invocar `depurador-swl` con contexto fresh:
158
+
159
+ - Síntoma exacto del blocker o de los findings que no se resolvieron.
160
+ - Stack trace, output del comando fallido, exit code.
161
+ - Reviewer feedback si aplica.
162
+ - `_Boundary:_` de la tarea.
163
+ - Implementation Notes relacionadas.
164
+
165
+ El depurador retorna:
166
+
167
+ ```
168
+ ROOT_CAUSE: <descripción>
169
+ FIX_PLAN: <pasos concretos>
170
+ VERIFICATION: <cómo verificar el fix>
171
+ NEXT_ACTION: RETRY_TASK | BLOCK_TASK | STOP_FOR_HUMAN
172
+ CONFIDENCE: HIGH | MEDIUM | LOW
173
+ ```
174
+
175
+ - `RETRY_TASK` con CONFIDENCE HIGH/MEDIUM → re-dispatch implementer con el fix plan. Volver al Paso 3.
176
+ - `BLOCK_TASK` → marcar tarea con `_Blocked:_<razón>_` en PLAN.md. Actualizar ESTADO.md. Continuar con la SIGUIENTE tarea (no esta).
177
+ - `STOP_FOR_HUMAN` → pausar el loop y escalar al usuario con el informe del depurador.
178
+
179
+ #### Paso 6 — Commit atómico de la tarea
180
+
181
+ Tras APPROVED:
182
+
183
+ ```bash
184
+ git add <archivos del diff de esta tarea>
185
+ git commit -m "<tipo>(<scope>): <descripción imperativa de la tarea>
186
+
187
+ Tarea: <task-id> — <texto literal>
188
+ Plan: .planning/fases/0N-PLAN.md
189
+ Review: .planning/audit/reviews/<task-id>-<ts>.json"
190
+ ```
191
+
192
+ Marcar la tarea como `[x]` en PLAN.md en el mismo commit (o en commit
193
+ inmediato siguiente atómico).
194
+
195
+ #### Paso 7 — Update de ESTADO.md y memoria
196
+
197
+ - Marcar tarea `[x]` en PLAN.md.
198
+ - Actualizar ESTADO.md con: tarea completada, commit hash, archivos cambiados, score del review.
199
+ - Agregar al final del PLAN.md, en sección `## Implementation Notes`, cualquier learning relevante para tareas futuras del mismo boundary o dependencia.
200
+ - Retener solo 1 línea en memoria de iteración para el siguiente loop.
201
+
202
+ #### Paso 8 — Próxima iteración o cierre
203
+
204
+ - Si quedan tareas pendientes: volver al Paso 1.
205
+ - Si todas las tareas están `[x]` o `_Blocked:_`: cerrar el loop e invocar
206
+ el flujo de cierre estándar de `ejecutar-fase` (RESUMEN.md, actualizar
207
+ HOJA-RUTA.md, verificación goal-backward final con `verificar-trabajo` —
208
+ ver Paso 6-8 del comando `/swl:ejecutar-fase`).
209
+
210
+ ---
211
+
212
+ ## Persistencia de aprendizajes entre tareas
213
+
214
+ A diferencia del modo paralelo (donde cada wave es relativamente
215
+ independiente), el modo iterativo propaga aprendizajes:
216
+
217
+ ### En PLAN.md, sección `## Implementation Notes`:
218
+
219
+ ```markdown
220
+ ## Implementation Notes
221
+
222
+ - **Tarea 1.2 (POST /facturas)**: `Pydantic v2` cambia `parse_obj` → `model_validate`.
223
+ Aplica a futuras tareas que validen schemas con v2.
224
+ - **Tarea 2.1 (migración)**: `Alembic` no detecta cambios en `JSONB` automáticamente —
225
+ marcar con `nullable=False` explícito.
226
+ ```
227
+
228
+ El implementer del paso 2 lee estas notes antes de empezar. Esto evita
229
+ repetir los mismos errores task-a-task.
230
+
231
+ ---
232
+
233
+ ## Diferencias clave con el modo default (paralelo por oleadas)
234
+
235
+ | Aspecto | Modo default (paralelo) | Modo iterativo (este skill) |
236
+ |---------|------------------------|----------------------------|
237
+ | Granularidad | Oleada (varias tareas en paralelo) | 1 tarea por iteración |
238
+ | Contexto del implementer | Acumulado entre tareas de la misma oleada | Fresco por tarea (sub-agente nuevo) |
239
+ | Review | Al final de fase con `verificar-trabajo` | Tras cada tarea con `protocolo-revision-swl` |
240
+ | Auto-debug | Manual o post-mortem | Automático en BLOCKED |
241
+ | Commit | Atómico por slice/tarea (similar) | Atómico estricto por tarea + review JSON |
242
+ | Implementation Notes | No requeridas | Propagadas entre tareas |
243
+ | Costo en tokens | Menor | Mayor (~1.5-2× por contexto fresh) |
244
+ | Cuándo preferir | Fases con tareas independientes, riesgo bajo | Tareas con dependencias fuertes, módulos críticos, fases grandes |
245
+
246
+ ---
247
+
248
+ ## Gotchas / Errores comunes no obvios
249
+
250
+ - **Re-usar contexto acumulado del implementer entre iteraciones**: el implementer del task 3.2 NO debe tener en su contexto el reporte completo del task 3.1 — solo el `## Implementation Notes` relevante. Causa: ahorro falso de tokens. Solución: dispatch fresh siempre, los notes son el canal explícito de propagación.
251
+ - **Saltar el Paso 4 (review) "porque la tarea es chica"**: el review per-task es lo que distingue este modo del default. Sin review per-task, el modo iterativo es solo "lento sin beneficio". Solución: si la tarea es realmente trivial, no usar modo iterativo.
252
+ - **Auto-debug que sugiere FIX y se aplica sin re-review**: tras debug → fix → COMMIT directo es anti-patrón. Solución: cada FIX debe volver al Paso 4 (review) antes de commit.
253
+ - **Boundary violations toleradas porque "el implementer tenía que tocar eso"**: si un archivo fuera del boundary aparece en el diff y el revisor lo marca como finding, no se puede aceptar sin extender el boundary EN EL PLAN.md (decisión documentada). Solución: si el boundary necesita extenderse, actualizar PLAN.md primero y volver a iterar.
254
+ - **`MERGED` en main sin marcar la tarea `[x]` en PLAN.md**: deja ESTADO.md y PLAN.md desincronizados. Solución: marcar `[x]` está en el MISMO commit del cambio (no commit aparte).
255
+
256
+ ---
257
+
258
+ ## Relación con otros componentes SWL
259
+
260
+ | Componente | Relación |
261
+ |-----------|----------|
262
+ | `ejecutar-fase` | Skill padre — el flag `--iterative` cede el control a este skill |
263
+ | `protocolo-revision-swl` | Invocado en Paso 4 por el revisor |
264
+ | `verificar-trabajo` | Invocado al cerrar el loop como verificación goal-backward final |
265
+ | `depurador-swl` | Invocado en Paso 5 cuando hay BLOCKED o REJECTED persistente |
266
+ | `implementador-swl` y agentes de stack | Dispatchados como sub-agentes en Paso 2 |
267
+ | `notificador-swl` | Invocado en STOP_FOR_HUMAN o ESCALATE |
268
+ | `reglas/seguridad-agentes.md` § Recovery Catalog | Marco de escalada (reprompt → reduce-autonomy → escalate → terminate) |
269
+
270
+ ## Checklist de cierre del loop
271
+
272
+ - [ ] Todas las tareas pendientes están `[x]` o `_Blocked:_<razón>_`
273
+ - [ ] Cada tarea tiene su review JSON en `.planning/audit/reviews/`
274
+ - [ ] PLAN.md tiene `## Implementation Notes` con aprendizajes relevantes
275
+ - [ ] ESTADO.md actualizado con commit hashes y scores
276
+ - [ ] Verificación goal-backward final ejecutada (`verificar-trabajo`)
277
+ - [ ] RESUMEN.md generado (paso del flujo estándar de `ejecutar-fase`)
278
+ - [ ] Working tree limpio o con cambios pendientes documentados
@@ -0,0 +1,276 @@
1
+ ---
2
+ name: protocolo-revision-swl
3
+ description: >
4
+ Protocolo de revisión adversarial per-task con git diff como single source of
5
+ truth. Adapta el patrón task-local review de cc-sdd al ecosistema SWL: los
6
+ revisores existentes (revisor-codigo-swl, revisor-seguridad-swl, revisor-*-swl)
7
+ aplican este protocolo cuando trabajan sobre una sola tarea atómica en lugar
8
+ de una fase completa. Devuelve APPROVED o REJECTED con findings de severidad
9
+ estructurados y boundary checks. Cargar desde el agente revisor cuando
10
+ ejecutar-fase corre en modo --iterative (task por task) o cuando se solicita
11
+ revisión acotada a un commit / patch específico.
12
+ version: "1.0.0"
13
+ herramientasPermitidas: [Read, Grep, Glob, Bash]
14
+ exclusiones:
15
+ - "No cargar para revisión de fase completa multi-archivo — usar el flujo estándar del revisor con `/swl:revisar` y `/swl:verificar`."
16
+ - "No cargar para auditoría de seguridad profunda — usar `revisor-seguridad-swl` con `checklist-seguridad`."
17
+ - "No cargar como sustituto de la verificación goal-backward post-ejecución — `verificar-trabajo` cubre eso a nivel de fase."
18
+ - "No cargar para revisar código que no ha sido staged ni commiteado todavía — el protocolo requiere un diff o set de archivos definido."
19
+ evolvable: true
20
+ ---
21
+
22
+ # Protocolo de revisión per-task
23
+
24
+ ## Propósito
25
+
26
+ Revisar el resultado de UNA tarea atómica de implementación (no una fase
27
+ completa) con el rigor de un revisor adversarial. El protocolo está diseñado
28
+ para coexistir con los revisores especializados existentes (`revisor-codigo-swl`,
29
+ `revisor-react-swl`, `revisor-typescript-swl`, etc.): esos agentes cargan
30
+ este skill cuando el alcance es task-local en lugar de phase-wide.
31
+
32
+ Adaptado del patrón `kiro-review` de cc-sdd. Mantiene los principios de
33
+ swl-ses (separación revisor/ejecutor de `reglas/gobernanza.md`, veto items
34
+ y cap enforcement, scoring 9.0+ obligatorio para APPROVED).
35
+
36
+ ## Cuándo cargar
37
+
38
+ - El orquestador ejecuta `/swl:ejecutar-fase --iterative` y necesita revisión task-por-task
39
+ - Un agente implementador reportó `READY_FOR_REVIEW` para una sub-tarea específica
40
+ - El usuario pide "revisa este último commit" o "revisa lo que acabo de hacer"
41
+ - Tras una remediación de un finding previo y se necesita re-verificación acotada
42
+
43
+ ## Cuándo NO cargar
44
+
45
+ Ver `exclusiones` en frontmatter.
46
+
47
+ ---
48
+
49
+ ## Inputs requeridos
50
+
51
+ Antes de empezar, identifica los siguientes inputs. Si falta cualquiera, pide
52
+ clarificación al caller (orquestador o implementador) en lugar de proceder
53
+ con asunciones.
54
+
55
+ | Input | Forma | Obligatorio |
56
+ |-------|-------|-------------|
57
+ | Task ID | Texto de la tarea desde PLAN.md (ej. "3.2 — Crear endpoint POST /facturas") | Sí |
58
+ | Boundary scope | Lista de paths/módulos que la tarea puede modificar | Sí |
59
+ | Spec references | IDs de requirements y design sections que la tarea satisface | Sí — si existen |
60
+ | Diff | `git diff <base>..HEAD` o set de archivos modificados | Sí |
61
+ | Validation commands | Comandos descubiertos por el caller (test, build, lint, smoke) | Sí — si aplica el stack |
62
+ | Implementer status report | El reporte estructurado del ejecutor (`READY_FOR_REVIEW`, archivos tocados, decisiones) | Recomendado |
63
+
64
+ ---
65
+
66
+ ## Paso 1 — Primera acción obligatoria: `git diff`
67
+
68
+ Antes de leer cualquier otro archivo, ejecuta:
69
+
70
+ ```bash
71
+ git diff --stat # alcance del cambio
72
+ git diff <base>..HEAD # contenido real
73
+ ```
74
+
75
+ El reporte del implementador NO es fuente de verdad. El diff sí. Si el diff
76
+ es grande, lee los archivos modificados directamente — no resuamen ni inferas
77
+ desde el reporte del ejecutor.
78
+
79
+ **Por qué**: el implementador puede honestamente reportar "implementé X" pero
80
+ haber introducido Y como efecto colateral. El diff captura todo, incluido lo
81
+ que el ejecutor no recuerda haber tocado.
82
+
83
+ ---
84
+
85
+ ## Paso 2 — Checks mecánicos (resultado = señal primaria)
86
+
87
+ Estos checks son determinísticos y producen evidencia directa. Aplica TODOS
88
+ antes de pasar a interpretación.
89
+
90
+ ### Check 1: Regression safety
91
+
92
+ Corre la suite de tests del proyecto con las `validation_commands` provistas.
93
+ Ejemplo:
94
+
95
+ ```bash
96
+ npm test # o pytest, o cargo test, etc.
97
+ ```
98
+
99
+ - **Tests pasan** → continuar.
100
+ - **Tests fallan** → `REJECTED` inmediato. Incluye el conteo y nombres de tests fallidos en el reporte.
101
+ - **Tests skipped aumentan vs base** → riesgo de regresión silenciosa (regla `monitor-ci.md`). Reportar el delta como finding de severidad MAJOR.
102
+
103
+ ### Check 2: Sin marcadores placeholder nuevos
104
+
105
+ ```bash
106
+ git diff <base>..HEAD | grep -E "\+.*\b(TBD|TODO|FIXME|HACK|XXX)\b" || true
107
+ ```
108
+
109
+ Marcadores nuevos solo se aceptan con justificación explícita en el reporte
110
+ del implementador asociada al PLAN.md vigente (referencia a task ID, no texto suelto).
111
+ Sin justificación → finding MAYOR.
112
+
113
+ ### Check 3: Sin secretos hardcodeados
114
+
115
+ ```bash
116
+ git diff <base>..HEAD | grep -E "(api[_-]?key|password|secret|token)\s*[=:]\s*[\"'][^\"'\s]{8,}[\"']" -i || true
117
+ ```
118
+
119
+ Cualquier match → `REJECTED` con finding CRÍTICO. Aplica los patrones
120
+ documentados en `reglas/seguridad-agentes.md` § "Protección de secretos".
121
+
122
+ ### Check 4: Boundary violations
123
+
124
+ Lista de archivos modificados:
125
+
126
+ ```bash
127
+ git diff --name-only <base>..HEAD
128
+ ```
129
+
130
+ Cada archivo modificado DEBE estar dentro del `boundary scope` declarado en
131
+ la tarea. Si un archivo fuera del boundary aparece modificado:
132
+
133
+ - Si es modificación trivial (formateo, comentario) → finding MENOR.
134
+ - Si es modificación funcional → finding MAYOR. La tarea debe declarar el
135
+ boundary extendido o el cambio se devuelve al implementador para extraer
136
+ a una tarea aparte.
137
+
138
+ ---
139
+
140
+ ## Paso 3 — Verificación de alineación con spec
141
+
142
+ Lee directamente:
143
+
144
+ - El texto de la tarea en `PLAN.md` (no parafrases — copia literal).
145
+ - Los requirements citados en el campo `requirements` de la tarea.
146
+ - Las secciones de design citadas si existen.
147
+
148
+ Para cada requirement/design ref, verifica:
149
+
150
+ | Pregunta | Cómo verificar |
151
+ |----------|----------------|
152
+ | ¿El código implementa lo que el requirement dice? | Mapear líneas concretas del diff al texto del requirement |
153
+ | ¿Falta algo del requirement que el código no cubre? | Listar gaps específicos |
154
+ | ¿Hay código fuera del scope del requirement? | Comparar con design — si no está justificado, es scope creep |
155
+
156
+ Si hay gap de cobertura → finding MAYOR con cita del requirement y línea
157
+ faltante en el diff.
158
+
159
+ ---
160
+
161
+ ## Paso 4 — Veto items (heredados del revisor base)
162
+
163
+ Los revisores SWL existentes declaran sus propios veto items (ver
164
+ `reglas/gobernanza.md` § "Veto items y cap enforcement"). Cuando este
165
+ protocolo se carga desde uno de ellos, los veto items del revisor padre
166
+ aplican íntegros.
167
+
168
+ **Si detectas CUALQUIER veto item**:
169
+
170
+ - Score CAP automático a 6.0/10.
171
+ - Verdict pasa a `REJECTED` independientemente de qué tan limpio esté el resto.
172
+ - 2+ veto items → cap a 3.0/10.
173
+
174
+ Lista de veto items del revisor padre debe estar disponible en su SKILL/agente.
175
+ Si no se puede determinar, reporta `MANUAL_VERIFY_REQUIRED` en lugar de inventar.
176
+
177
+ ---
178
+
179
+ ## Paso 5 — Emitir veredicto estructurado
180
+
181
+ ### Formato del reporte
182
+
183
+ ```json
184
+ {
185
+ "protocol": "protocolo-revision-swl",
186
+ "task_id": "3.2 — Crear endpoint POST /facturas",
187
+ "verdict": "APPROVED | REJECTED",
188
+ "score": 9.2,
189
+ "score_cap_applied": null,
190
+ "mechanical_checks": {
191
+ "regression_safety": "PASS",
192
+ "no_new_placeholders": "PASS",
193
+ "no_hardcoded_secrets": "PASS",
194
+ "boundary_respected": "PASS | VIOLATIONS_FOUND"
195
+ },
196
+ "spec_alignment": {
197
+ "requirements_covered": ["R-12", "R-13"],
198
+ "requirements_gap": [],
199
+ "design_drift": "NONE | SLIGHT | SIGNIFICANT"
200
+ },
201
+ "veto_items": [],
202
+ "findings": [
203
+ {
204
+ "severity": "CRITICAL | MAJOR | MINOR",
205
+ "file": "app/api/facturas.py:42",
206
+ "issue": "Descripción breve",
207
+ "remediation": "Qué cambiar y cómo"
208
+ }
209
+ ],
210
+ "summary": "Una oración resumiendo el veredicto y la razón principal.",
211
+ "next_action": "MERGE | FIX_AND_RE_REVIEW | ESCALATE_TO_HUMAN"
212
+ }
213
+ ```
214
+
215
+ ### Reglas de scoring (compatibles con `checklist-calidad`)
216
+
217
+ - `APPROVED` requiere `score >= 9.0` Y `veto_items.length === 0` Y todos los
218
+ mechanical_checks en PASS.
219
+ - Severidad MAJOR baja el score 1.0 punto cada una.
220
+ - Severidad MINOR baja 0.3 puntos cada una.
221
+ - Severidad CRITICAL → automaticamente `REJECTED` (score irrelevante).
222
+ - 1 veto item → cap a 6.0. 2+ veto items → cap a 3.0.
223
+
224
+ ### Reglas del `next_action`
225
+
226
+ - `MERGE`: APPROVED — el caller (orquestador) puede commitear y avanzar a la siguiente tarea.
227
+ - `FIX_AND_RE_REVIEW`: REJECTED con findings MAYORES — el implementador aplica remediation, se vuelve a invocar este protocolo. Máximo 2 ciclos antes de escalar.
228
+ - `ESCALATE_TO_HUMAN`: 2 ciclos de FIX no convergieron, O hay CRÍTICO sin remediación clara, O hay decisión de scope ambigua. Activa el `notificador-swl` si está configurado.
229
+
230
+ ---
231
+
232
+ ## Persistencia del veredicto
233
+
234
+ El veredicto JSON se persiste en:
235
+
236
+ ```
237
+ .planning/audit/reviews/<task-id>-<timestamp>.json
238
+ ```
239
+
240
+ Esto permite que `auto-evolucion-swl` y `/swl:metricas` calculen tasas de
241
+ APPROVED vs REJECTED por agente revisor y por tipo de tarea — datos
242
+ necesarios para identificar revisores con calibración floja o tipos de
243
+ tarea sistemáticamente problemáticos.
244
+
245
+ ---
246
+
247
+ ## Gotchas / Errores comunes no obvios
248
+
249
+ - **Confiar en el reporte del implementador como source of truth**: el primer paso obligatorio es `git diff`. Saltarse esto y derivar el veredicto del status report del implementador deja pasar bugs colaterales no reportados. Causa: optimización falsa para ahorrar tokens. Solución: `git diff --stat` siempre antes de cualquier interpretación.
250
+ - **Boundary violation reportada como MENOR sin verificar funcionalidad**: el revisor ve que se modificó un archivo fuera del boundary y lo marca MENOR porque "se ve pequeño". Causa: no se inspeccionó qué hace el cambio. Solución: para CUALQUIER archivo fuera del boundary, abrir el cambio y clasificar trivial vs funcional antes de asignar severidad.
251
+ - **Tests skipped tratados como tests pasados**: el conteo de tests verde no distingue entre pasados y saltados. Causa: parsing superficial del output del runner. Solución: comparar `skipped` count vs base — si aumenta sin causa documentada en el diff, es regresión silenciosa (regla `monitor-ci.md`).
252
+ - **APPROVED con score < 9.0 "porque la tarea era pequeña"**: el revisor reduce el umbral subjetivamente. Causa: ceder a presión de entrega. Solución: la regla es 9.0 estricto; tareas pequeñas que no llegan a 9.0 indican findings que valen MENOR o MAYOR — emitir como findings y devolver al implementador.
253
+ - **Veto items ignorados porque "el resto está limpio"**: el cap de score es no-negociable. Causa: el revisor pondera "promedio" de calidad. Solución: 1 veto item = score capped automáticamente, sin compensación posible desde otras dimensiones.
254
+
255
+ ---
256
+
257
+ ## Relación con otros componentes SWL
258
+
259
+ | Componente | Relación |
260
+ |-----------|----------|
261
+ | `revisor-codigo-swl` y revisores de lenguaje | Cargan este skill cuando trabajan task-local en lugar de phase-wide |
262
+ | `ejecutar-task-iterativo` (Sub-fase 4) | Invoca este protocolo después de cada implementer dispatch en modo `--iterative` |
263
+ | `verificar-trabajo` | Complementario — verificar-trabajo es goal-backward post-fase; este protocolo es task-local post-implementación |
264
+ | `reglas/gobernanza.md` | Veto items + cap enforcement heredados |
265
+ | `checklist-calidad` | Score >=9.0 unificado |
266
+ | `auto-evolucion-swl` | Consume los veredictos persistidos para detectar revisores descalibrados |
267
+
268
+ ## Checklist de cierre del protocolo
269
+
270
+ - [ ] `git diff --stat` ejecutado y diff leído antes de cualquier interpretación
271
+ - [ ] 4 mechanical checks ejecutados (regression, placeholders, secretos, boundary)
272
+ - [ ] Alineación con spec verificada citando IDs concretos
273
+ - [ ] Veto items del revisor padre evaluados
274
+ - [ ] Score calculado y cap aplicado si corresponde
275
+ - [ ] Veredicto JSON persistido en `.planning/audit/reviews/`
276
+ - [ ] `next_action` claro (MERGE / FIX_AND_RE_REVIEW / ESCALATE_TO_HUMAN)