@saulwade/swl-ses 1.5.1 → 1.5.2

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (133) hide show
  1. package/CLAUDE.md +225 -209
  2. package/README.md +561 -561
  3. package/agentes/arquitecto-swl.md +33 -1
  4. package/agentes/nemesis-auditor-swl.md +59 -19
  5. package/bin/swl-mcp-server.js +214 -214
  6. package/comandos/swl/.evolved.json +22 -22
  7. package/comandos/swl/contribuir.md +233 -233
  8. package/comandos/swl/nemesis.md +230 -56
  9. package/gateway/lib/event-channel.js +191 -191
  10. package/habilidades/backend-production-resilience/SKILL.md +288 -288
  11. package/habilidades/benchmark-memoria/SKILL.md +186 -186
  12. package/habilidades/diagrama-arquitectura/assets/template.html +276 -276
  13. package/habilidades/doubt-driven-review/SKILL.md +171 -171
  14. package/habilidades/doubt-driven-review/recursos/EXAMPLES.md +130 -130
  15. package/habilidades/ejecutar-task-iterativo/SKILL.md +278 -278
  16. package/habilidades/eval-framework/SKILL.md +212 -212
  17. package/habilidades/feynman-auditor-swl/SKILL.md +123 -123
  18. package/habilidades/feynman-auditor-swl/recursos/preguntas-language-agnostic.md +108 -108
  19. package/habilidades/harness-claude-code/SKILL.md +299 -299
  20. package/habilidades/infra-github-actions/SKILL.md +166 -166
  21. package/habilidades/legacy-code-rescue/SKILL.md +267 -267
  22. package/habilidades/manejo-errores/.evolved.json +8 -8
  23. package/habilidades/meta-skills-estandar/SKILL.md +207 -4
  24. package/habilidades/meta-skills-estandar/recursos/convencion-examples.md +93 -93
  25. package/habilidades/meta-skills-estandar/recursos/skills-as-agents.md +163 -163
  26. package/habilidades/nemesis-evaluacion-json/SKILL.md +266 -0
  27. package/habilidades/nemesis-redistribuir/SKILL.md +341 -0
  28. package/habilidades/node-experto/SKILL.md +94 -4
  29. package/habilidades/patrones-python/SKILL.md +229 -229
  30. package/habilidades/patrones-python/recursos/patrones-avanzados.md +469 -469
  31. package/habilidades/planear-fase/SKILL.md +319 -319
  32. package/habilidades/protocolo-revision-swl/SKILL.md +350 -276
  33. package/habilidades/release-semver/.evolved.json +8 -8
  34. package/habilidades/state-inconsistency-auditor-swl/SKILL.md +166 -166
  35. package/habilidades/state-inconsistency-auditor-swl/recursos/coupled-state-patterns.md +147 -147
  36. package/habilidades/tdd-workflow/SKILL.md +121 -4
  37. package/habilidades/testing-python/SKILL.md +340 -340
  38. package/habilidades/web-fetcher-routing/SKILL.md +75 -75
  39. package/hooks/check-update.js +31 -3
  40. package/hooks/claudemd-bloat-detector.js +161 -161
  41. package/hooks/lib/agent-routing.js +107 -107
  42. package/hooks/lib/auto-consolidator.js +335 -335
  43. package/hooks/lib/error-classifier.js +308 -308
  44. package/hooks/lib/merkle-audit.js +96 -96
  45. package/hooks/lib/provenance-tracker.js +191 -191
  46. package/hooks/lib/rate-limit-tracker.js +253 -253
  47. package/hooks/lib/resource-quota.js +122 -122
  48. package/hooks/lib/retry-jitter.js +165 -165
  49. package/hooks/lib/security-net.js +201 -201
  50. package/hooks/lib/skill-auditor.js +588 -588
  51. package/hooks/lib/sync-status.js +228 -228
  52. package/hooks/lib/taint-tracker.js +107 -107
  53. package/hooks/lib/text-similarity.js +241 -241
  54. package/hooks/lib/toon-compressor.js +245 -245
  55. package/hooks/registro-turnos.js +209 -209
  56. package/hooks/sugerir-regenerar-inventario.js +170 -170
  57. package/hooks/validar-formato-post-subagente.js +140 -140
  58. package/hooks/validar-memoria-hook.js +218 -218
  59. package/instintos/prompt-appendices.yaml +57 -57
  60. package/manifiestos/agent-output-schemas.json +57 -57
  61. package/manifiestos/modulos.json +1324 -1321
  62. package/manifiestos/skills-lock.json +1114 -1114
  63. package/package.json +2 -2
  64. package/plantillas/auditor-veto-template.md +105 -105
  65. package/plantillas/github-workflows/README.md +47 -47
  66. package/plantillas/github-workflows/release-please.yml +44 -44
  67. package/plantillas/github-workflows/swl-ci.yml +107 -107
  68. package/plantillas/github-workflows/swl-security.yml +51 -51
  69. package/plugin.json +353 -351
  70. package/reglas/analisis-previo-tareas-grandes.md +172 -172
  71. package/reglas/arreglar-al-detectar.md +147 -147
  72. package/reglas/fragmentos-compartidos.md +152 -152
  73. package/reglas/harness-claude-code.md +213 -213
  74. package/reglas/registro-componentes-nuevos.md +192 -0
  75. package/reglas/usar-context7.md +226 -226
  76. package/schemas/diary-entry.schema.json +80 -80
  77. package/scripts/actualizar.js +110 -1
  78. package/scripts/audit-tools/audit-history.js +330 -330
  79. package/scripts/audit-tools/bundle-tracker.js +290 -290
  80. package/scripts/audit-tools/canary-monitor.js +352 -352
  81. package/scripts/audit-tools/code-profiler.js +605 -605
  82. package/scripts/audit-tools/dep-doctor.js +320 -320
  83. package/scripts/audit-tools/env-validator.js +206 -206
  84. package/scripts/audit-tools/lib/fs-walk.js +48 -48
  85. package/scripts/audit-tools/lib/output.js +23 -23
  86. package/scripts/audit-tools/migration-checker.js +392 -392
  87. package/scripts/audit-tools/pentest-scanner.js +1436 -1436
  88. package/scripts/benchmark-memoria.js +167 -167
  89. package/scripts/configurar-branch-protection.js +418 -418
  90. package/scripts/derivar-feature-list.js +489 -489
  91. package/scripts/detectar-aprendizajes-duplicados.js +151 -151
  92. package/scripts/doctor.js +27 -0
  93. package/scripts/field-report.js +199 -199
  94. package/scripts/generar-checklists-consolidados.js +273 -273
  95. package/scripts/generar-inventario.js +420 -420
  96. package/scripts/generar-matriz-lenguajes.js +271 -271
  97. package/scripts/lib/artefactos-python.js +43 -43
  98. package/scripts/lib/benchmark-metrics.js +160 -160
  99. package/scripts/lib/budget-enforcer.js +252 -252
  100. package/scripts/lib/configurar-ci.js +380 -380
  101. package/scripts/lib/contadores-inventario.js +217 -217
  102. package/scripts/lib/detectar-stack-detallado.js +307 -307
  103. package/scripts/lib/diary-entry.js +234 -234
  104. package/scripts/lib/eval-metrics-store.js +218 -218
  105. package/scripts/lib/eval-quality.js +171 -171
  106. package/scripts/lib/eval-schemas.js +144 -144
  107. package/scripts/lib/eval-self-correct.js +106 -106
  108. package/scripts/lib/eval-validator.js +185 -185
  109. package/scripts/lib/expandir-targets.js +71 -71
  110. package/scripts/lib/jaccard-similarity.js +98 -98
  111. package/scripts/lib/longmemeval-runner.js +125 -125
  112. package/scripts/lib/mcp_config.py +127 -0
  113. package/scripts/lib/npm-version.js +261 -261
  114. package/scripts/lib/paquetes-conocidos.js +50 -50
  115. package/scripts/lib/prompt-builder.js +264 -264
  116. package/scripts/lib/rrf-fusion.js +175 -175
  117. package/scripts/lib/scoring-instintos.js +277 -277
  118. package/scripts/lib/semantic-search.js +252 -252
  119. package/scripts/lib/toml-merge.js +204 -204
  120. package/scripts/lib/transformadores/codex.js +375 -375
  121. package/scripts/lib/transformadores/cursor.js +359 -359
  122. package/scripts/limpiar-artefactos-python.js +131 -131
  123. package/scripts/mcp-orchestrator.py +8 -18
  124. package/scripts/mcp-pool-manager.py +12 -23
  125. package/scripts/mcp-server/README.md +170 -170
  126. package/scripts/mcp-server/auth.js +105 -105
  127. package/scripts/mcp-server/cache.js +106 -106
  128. package/scripts/mcp-server/telemetry.js +78 -78
  129. package/scripts/migrar-csv-a-array.js +168 -168
  130. package/scripts/migrar-fase-dominio.js +201 -201
  131. package/scripts/publicar.js +511 -511
  132. package/scripts/run-eval.js +141 -141
  133. package/scripts/validar-userland-vacio.js +110 -110
@@ -1,276 +1,350 @@
1
- ---
2
- name: protocolo-revision-swl
3
- description: >
4
- Protocolo de revisión adversarial per-task con git diff como single source of
5
- truth. Adapta el patrón task-local review de cc-sdd al ecosistema SWL: los
6
- revisores existentes (revisor-codigo-swl, revisor-seguridad-swl, revisor-*-swl)
7
- aplican este protocolo cuando trabajan sobre una sola tarea atómica en lugar
8
- de una fase completa. Devuelve APPROVED o REJECTED con findings de severidad
9
- estructurados y boundary checks. Cargar desde el agente revisor cuando
10
- ejecutar-fase corre en modo --iterative (task por task) o cuando se solicita
11
- revisión acotada a un commit / patch específico.
12
- version: "1.0.0"
13
- herramientasPermitidas: [Read, Grep, Glob, Bash]
14
- exclusiones:
15
- - "No cargar para revisión de fase completa multi-archivo — usar el flujo estándar del revisor con `/swl:revisar` y `/swl:verificar`."
16
- - "No cargar para auditoría de seguridad profunda — usar `revisor-seguridad-swl` con `checklist-seguridad`."
17
- - "No cargar como sustituto de la verificación goal-backward post-ejecución `verificar-trabajo` cubre eso a nivel de fase."
18
- - "No cargar para revisar código que no ha sido staged ni commiteado todavía — el protocolo requiere un diff o set de archivos definido."
19
- evolvable: true
20
- ---
21
-
22
- # Protocolo de revisión per-task
23
-
24
- ## Propósito
25
-
26
- Revisar el resultado de UNA tarea atómica de implementación (no una fase
27
- completa) con el rigor de un revisor adversarial. El protocolo está diseñado
28
- para coexistir con los revisores especializados existentes (`revisor-codigo-swl`,
29
- `revisor-react-swl`, `revisor-typescript-swl`, etc.): esos agentes cargan
30
- este skill cuando el alcance es task-local en lugar de phase-wide.
31
-
32
- Adaptado del patrón `kiro-review` de cc-sdd. Mantiene los principios de
33
- swl-ses (separación revisor/ejecutor de `reglas/gobernanza.md`, veto items
34
- y cap enforcement, scoring 9.0+ obligatorio para APPROVED).
35
-
36
- ## Cuándo cargar
37
-
38
- - El orquestador ejecuta `/swl:ejecutar-fase --iterative` y necesita revisión task-por-task
39
- - Un agente implementador reportó `READY_FOR_REVIEW` para una sub-tarea específica
40
- - El usuario pide "revisa este último commit" o "revisa lo que acabo de hacer"
41
- - Tras una remediación de un finding previo y se necesita re-verificación acotada
42
-
43
- ## Cuándo NO cargar
44
-
45
- Ver `exclusiones` en frontmatter.
46
-
47
- ---
48
-
49
- ## Inputs requeridos
50
-
51
- Antes de empezar, identifica los siguientes inputs. Si falta cualquiera, pide
52
- clarificación al caller (orquestador o implementador) en lugar de proceder
53
- con asunciones.
54
-
55
- | Input | Forma | Obligatorio |
56
- |-------|-------|-------------|
57
- | Task ID | Texto de la tarea desde PLAN.md (ej. "3.2 Crear endpoint POST /facturas") | Sí |
58
- | Boundary scope | Lista de paths/módulos que la tarea puede modificar | Sí |
59
- | Spec references | IDs de requirements y design sections que la tarea satisface | Sí — si existen |
60
- | Diff | `git diff <base>..HEAD` o set de archivos modificados | |
61
- | Validation commands | Comandos descubiertos por el caller (test, build, lint, smoke) | Sí — si aplica el stack |
62
- | Implementer status report | El reporte estructurado del ejecutor (`READY_FOR_REVIEW`, archivos tocados, decisiones) | Recomendado |
63
-
64
- ---
65
-
66
- ## Paso 1Primera acción obligatoria: `git diff`
67
-
68
- Antes de leer cualquier otro archivo, ejecuta:
69
-
70
- ```bash
71
- git diff --stat # alcance del cambio
72
- git diff <base>..HEAD # contenido real
73
- ```
74
-
75
- El reporte del implementador NO es fuente de verdad. El diff sí. Si el diff
76
- es grande, lee los archivos modificados directamente — no resuamen ni inferas
77
- desde el reporte del ejecutor.
78
-
79
- **Por qué**: el implementador puede honestamente reportar "implementé X" pero
80
- haber introducido Y como efecto colateral. El diff captura todo, incluido lo
81
- que el ejecutor no recuerda haber tocado.
82
-
83
- ---
84
-
85
- ## Paso 2 Checks mecánicos (resultado = señal primaria)
86
-
87
- Estos checks son determinísticos y producen evidencia directa. Aplica TODOS
88
- antes de pasar a interpretación.
89
-
90
- ### Check 1: Regression safety
91
-
92
- Corre la suite de tests del proyecto con las `validation_commands` provistas.
93
- Ejemplo:
94
-
95
- ```bash
96
- npm test # o pytest, o cargo test, etc.
97
- ```
98
-
99
- - **Tests pasan** → continuar.
100
- - **Tests fallan** → `REJECTED` inmediato. Incluye el conteo y nombres de tests fallidos en el reporte.
101
- - **Tests skipped aumentan vs base** riesgo de regresión silenciosa (regla `monitor-ci.md`). Reportar el delta como finding de severidad MAJOR.
102
-
103
- ### Check 2: Sin marcadores placeholder nuevos
104
-
105
- ```bash
106
- git diff <base>..HEAD | grep -E "\+.*\b(TBD|TODO|FIXME|HACK|XXX)\b" || true
107
- ```
108
-
109
- Marcadores nuevos solo se aceptan con justificación explícita en el reporte
110
- del implementador asociada al PLAN.md vigente (referencia a task ID, no texto suelto).
111
- Sin justificación finding MAYOR.
112
-
113
- ### Check 3: Sin secretos hardcodeados
114
-
115
- ```bash
116
- git diff <base>..HEAD | grep -E "(api[_-]?key|password|secret|token)\s*[=:]\s*[\"'][^\"'\s]{8,}[\"']" -i || true
117
- ```
118
-
119
- Cualquier match → `REJECTED` con finding CRÍTICO. Aplica los patrones
120
- documentados en `reglas/seguridad-agentes.md` § "Protección de secretos".
121
-
122
- ### Check 4: Boundary violations
123
-
124
- Lista de archivos modificados:
125
-
126
- ```bash
127
- git diff --name-only <base>..HEAD
128
- ```
129
-
130
- Cada archivo modificado DEBE estar dentro del `boundary scope` declarado en
131
- la tarea. Si un archivo fuera del boundary aparece modificado:
132
-
133
- - Si es modificación trivial (formateo, comentario) → finding MENOR.
134
- - Si es modificación funcional → finding MAYOR. La tarea debe declarar el
135
- boundary extendido o el cambio se devuelve al implementador para extraer
136
- a una tarea aparte.
137
-
138
- ---
139
-
140
- ## Paso 3 Verificación de alineación con spec
141
-
142
- Lee directamente:
143
-
144
- - El texto de la tarea en `PLAN.md` (no parafrases — copia literal).
145
- - Los requirements citados en el campo `requirements` de la tarea.
146
- - Las secciones de design citadas si existen.
147
-
148
- Para cada requirement/design ref, verifica:
149
-
150
- | Pregunta | Cómo verificar |
151
- |----------|----------------|
152
- | ¿El código implementa lo que el requirement dice? | Mapear líneas concretas del diff al texto del requirement |
153
- | ¿Falta algo del requirement que el código no cubre? | Listar gaps específicos |
154
- | ¿Hay código fuera del scope del requirement? | Comparar con design — si no está justificado, es scope creep |
155
-
156
- Si hay gap de cobertura → finding MAYOR con cita del requirement y línea
157
- faltante en el diff.
158
-
159
- ---
160
-
161
- ## Paso 4 Veto items (heredados del revisor base)
162
-
163
- Los revisores SWL existentes declaran sus propios veto items (ver
164
- `reglas/gobernanza.md` § "Veto items y cap enforcement"). Cuando este
165
- protocolo se carga desde uno de ellos, los veto items del revisor padre
166
- aplican íntegros.
167
-
168
- **Si detectas CUALQUIER veto item**:
169
-
170
- - Score CAP automático a 6.0/10.
171
- - Verdict pasa a `REJECTED` independientemente de qué tan limpio esté el resto.
172
- - 2+ veto items → cap a 3.0/10.
173
-
174
- Lista de veto items del revisor padre debe estar disponible en su SKILL/agente.
175
- Si no se puede determinar, reporta `MANUAL_VERIFY_REQUIRED` en lugar de inventar.
176
-
177
- ---
178
-
179
- ## Paso 5 Emitir veredicto estructurado
180
-
181
- ### Formato del reporte
182
-
183
- ```json
184
- {
185
- "protocol": "protocolo-revision-swl",
186
- "task_id": "3.2 Crear endpoint POST /facturas",
187
- "verdict": "APPROVED | REJECTED",
188
- "score": 9.2,
189
- "score_cap_applied": null,
190
- "mechanical_checks": {
191
- "regression_safety": "PASS",
192
- "no_new_placeholders": "PASS",
193
- "no_hardcoded_secrets": "PASS",
194
- "boundary_respected": "PASS | VIOLATIONS_FOUND"
195
- },
196
- "spec_alignment": {
197
- "requirements_covered": ["R-12", "R-13"],
198
- "requirements_gap": [],
199
- "design_drift": "NONE | SLIGHT | SIGNIFICANT"
200
- },
201
- "veto_items": [],
202
- "findings": [
203
- {
204
- "severity": "CRITICAL | MAJOR | MINOR",
205
- "file": "app/api/facturas.py:42",
206
- "issue": "Descripción breve",
207
- "remediation": "Qué cambiar y cómo"
208
- }
209
- ],
210
- "summary": "Una oración resumiendo el veredicto y la razón principal.",
211
- "next_action": "MERGE | FIX_AND_RE_REVIEW | ESCALATE_TO_HUMAN"
212
- }
213
- ```
214
-
215
- ### Reglas de scoring (compatibles con `checklist-calidad`)
216
-
217
- - `APPROVED` requiere `score >= 9.0` Y `veto_items.length === 0` Y todos los
218
- mechanical_checks en PASS.
219
- - Severidad MAJOR baja el score 1.0 punto cada una.
220
- - Severidad MINOR baja 0.3 puntos cada una.
221
- - Severidad CRITICAL → automaticamente `REJECTED` (score irrelevante).
222
- - 1 veto item cap a 6.0. 2+ veto items cap a 3.0.
223
-
224
- ### Reglas del `next_action`
225
-
226
- - `MERGE`: APPROVED el caller (orquestador) puede commitear y avanzar a la siguiente tarea.
227
- - `FIX_AND_RE_REVIEW`: REJECTED con findings MAYORES el implementador aplica remediation, se vuelve a invocar este protocolo. Máximo 2 ciclos antes de escalar.
228
- - `ESCALATE_TO_HUMAN`: 2 ciclos de FIX no convergieron, O hay CRÍTICO sin remediación clara, O hay decisión de scope ambigua. Activa el `notificador-swl` si está configurado.
229
-
230
- ---
231
-
232
- ## Persistencia del veredicto
233
-
234
- El veredicto JSON se persiste en:
235
-
236
- ```
237
- .planning/audit/reviews/<task-id>-<timestamp>.json
238
- ```
239
-
240
- Esto permite que `auto-evolucion-swl` y `/swl:metricas` calculen tasas de
241
- APPROVED vs REJECTED por agente revisor y por tipo de tarea — datos
242
- necesarios para identificar revisores con calibración floja o tipos de
243
- tarea sistemáticamente problemáticos.
244
-
245
- ---
246
-
247
- ## Gotchas / Errores comunes no obvios
248
-
249
- - **Confiar en el reporte del implementador como source of truth**: el primer paso obligatorio es `git diff`. Saltarse esto y derivar el veredicto del status report del implementador deja pasar bugs colaterales no reportados. Causa: optimización falsa para ahorrar tokens. Solución: `git diff --stat` siempre antes de cualquier interpretación.
250
- - **Boundary violation reportada como MENOR sin verificar funcionalidad**: el revisor ve que se modificó un archivo fuera del boundary y lo marca MENOR porque "se ve pequeño". Causa: no se inspeccionó qué hace el cambio. Solución: para CUALQUIER archivo fuera del boundary, abrir el cambio y clasificar trivial vs funcional antes de asignar severidad.
251
- - **Tests skipped tratados como tests pasados**: el conteo de tests verde no distingue entre pasados y saltados. Causa: parsing superficial del output del runner. Solución: comparar `skipped` count vs base — si aumenta sin causa documentada en el diff, es regresión silenciosa (regla `monitor-ci.md`).
252
- - **APPROVED con score < 9.0 "porque la tarea era pequeña"**: el revisor reduce el umbral subjetivamente. Causa: ceder a presión de entrega. Solución: la regla es 9.0 estricto; tareas pequeñas que no llegan a 9.0 indican findings que valen MENOR o MAYOR — emitir como findings y devolver al implementador.
253
- - **Veto items ignorados porque "el resto está limpio"**: el cap de score es no-negociable. Causa: el revisor pondera "promedio" de calidad. Solución: 1 veto item = score capped automáticamente, sin compensación posible desde otras dimensiones.
254
-
255
- ---
256
-
257
- ## Relación con otros componentes SWL
258
-
259
- | Componente | Relación |
260
- |-----------|----------|
261
- | `revisor-codigo-swl` y revisores de lenguaje | Cargan este skill cuando trabajan task-local en lugar de phase-wide |
262
- | `ejecutar-task-iterativo` (Sub-fase 4) | Invoca este protocolo después de cada implementer dispatch en modo `--iterative` |
263
- | `verificar-trabajo` | Complementario — verificar-trabajo es goal-backward post-fase; este protocolo es task-local post-implementación |
264
- | `reglas/gobernanza.md` | Veto items + cap enforcement heredados |
265
- | `checklist-calidad` | Score >=9.0 unificado |
266
- | `auto-evolucion-swl` | Consume los veredictos persistidos para detectar revisores descalibrados |
267
-
268
- ## Checklist de cierre del protocolo
269
-
270
- - [ ] `git diff --stat` ejecutado y diff leído antes de cualquier interpretación
271
- - [ ] 4 mechanical checks ejecutados (regression, placeholders, secretos, boundary)
272
- - [ ] Alineación con spec verificada citando IDs concretos
273
- - [ ] Veto items del revisor padre evaluados
274
- - [ ] Score calculado y cap aplicado si corresponde
275
- - [ ] Veredicto JSON persistido en `.planning/audit/reviews/`
276
- - [ ] `next_action` claro (MERGE / FIX_AND_RE_REVIEW / ESCALATE_TO_HUMAN)
1
+ ---
2
+ name: protocolo-revision-swl
3
+ description: >
4
+ Protocolo de revisión adversarial per-task con git diff como single source of
5
+ truth. Adapta el patrón task-local review de cc-sdd al ecosistema SWL: los
6
+ revisores existentes (revisor-codigo-swl, revisor-seguridad-swl, revisor-*-swl)
7
+ aplican este protocolo cuando trabajan sobre una sola tarea atómica en lugar
8
+ de una fase completa. Devuelve APPROVED o REJECTED con findings de severidad
9
+ estructurados y boundary checks. Cargar desde el agente revisor cuando
10
+ ejecutar-fase corre en modo --iterative (task por task) o cuando se solicita
11
+ revisión acotada a un commit / patch específico.
12
+ version: "1.0.1"
13
+ evolved: true
14
+ evolved-from: "1.0.0"
15
+ evolved-at: "2026-05-16"
16
+ evolved-by: "aprender"
17
+ evolved-note: "v1.0.1: sección 'Validación de afirmaciones de existencia/no-existencia' formaliza regla `verificar-citas-normativas § Familia 2` aplicada a revisores. Origen: 2 falsos positivos del revisor externo en PR #28 v1.5.2."
18
+ herramientasPermitidas: [Read, Grep, Glob, Bash]
19
+ exclusiones:
20
+ - "No cargar para revisión de fase completa multi-archivo — usar el flujo estándar del revisor con `/swl:revisar` y `/swl:verificar`."
21
+ - "No cargar para auditoría de seguridad profunda — usar `revisor-seguridad-swl` con `checklist-seguridad`."
22
+ - "No cargar como sustituto de la verificación goal-backward post-ejecución — `verificar-trabajo` cubre eso a nivel de fase."
23
+ - "No cargar para revisar código que no ha sido staged ni commiteado todavía — el protocolo requiere un diff o set de archivos definido."
24
+ evolvable: true
25
+ ---
26
+
27
+ # Protocolo de revisión per-task
28
+
29
+ ## Propósito
30
+
31
+ Revisar el resultado de UNA tarea atómica de implementación (no una fase
32
+ completa) con el rigor de un revisor adversarial. El protocolo está diseñado
33
+ para coexistir con los revisores especializados existentes (`revisor-codigo-swl`,
34
+ `revisor-react-swl`, `revisor-typescript-swl`, etc.): esos agentes cargan
35
+ este skill cuando el alcance es task-local en lugar de phase-wide.
36
+
37
+ Adaptado del patrón `kiro-review` de cc-sdd. Mantiene los principios de
38
+ swl-ses (separación revisor/ejecutor de `reglas/gobernanza.md`, veto items
39
+ y cap enforcement, scoring 9.0+ obligatorio para APPROVED).
40
+
41
+ ## Cuándo cargar
42
+
43
+ - El orquestador ejecuta `/swl:ejecutar-fase --iterative` y necesita revisión task-por-task
44
+ - Un agente implementador reportó `READY_FOR_REVIEW` para una sub-tarea específica
45
+ - El usuario pide "revisa este último commit" o "revisa lo que acabo de hacer"
46
+ - Tras una remediación de un finding previo y se necesita re-verificación acotada
47
+
48
+ ## Cuándo NO cargar
49
+
50
+ Ver `exclusiones` en frontmatter.
51
+
52
+ ---
53
+
54
+ ## Inputs requeridos
55
+
56
+ Antes de empezar, identifica los siguientes inputs. Si falta cualquiera, pide
57
+ clarificación al caller (orquestador o implementador) en lugar de proceder
58
+ con asunciones.
59
+
60
+ | Input | Forma | Obligatorio |
61
+ |-------|-------|-------------|
62
+ | Task ID | Texto de la tarea desde PLAN.md (ej. "3.2 Crear endpoint POST /facturas") | |
63
+ | Boundary scope | Lista de paths/módulos que la tarea puede modificar | Sí |
64
+ | Spec references | IDs de requirements y design sections que la tarea satisface | Sí — si existen |
65
+ | Diff | `git diff <base>..HEAD` o set de archivos modificados | Sí |
66
+ | Validation commands | Comandos descubiertos por el caller (test, build, lint, smoke) | Sí si aplica el stack |
67
+ | Implementer status report | El reporte estructurado del ejecutor (`READY_FOR_REVIEW`, archivos tocados, decisiones) | Recomendado |
68
+
69
+ ---
70
+
71
+ ## Paso 1 Primera acción obligatoria: `git diff`
72
+
73
+ Antes de leer cualquier otro archivo, ejecuta:
74
+
75
+ ```bash
76
+ git diff --stat # alcance del cambio
77
+ git diff <base>..HEAD # contenido real
78
+ ```
79
+
80
+ El reporte del implementador NO es fuente de verdad. El diff sí. Si el diff
81
+ es grande, lee los archivos modificados directamente — no resuamen ni inferas
82
+ desde el reporte del ejecutor.
83
+
84
+ **Por qué**: el implementador puede honestamente reportar "implementé X" pero
85
+ haber introducido Y como efecto colateral. El diff captura todo, incluido lo
86
+ que el ejecutor no recuerda haber tocado.
87
+
88
+ ---
89
+
90
+ ## Paso 2 Checks mecánicos (resultado = señal primaria)
91
+
92
+ Estos checks son determinísticos y producen evidencia directa. Aplica TODOS
93
+ antes de pasar a interpretación.
94
+
95
+ ### Check 1: Regression safety
96
+
97
+ Corre la suite de tests del proyecto con las `validation_commands` provistas.
98
+ Ejemplo:
99
+
100
+ ```bash
101
+ npm test # o pytest, o cargo test, etc.
102
+ ```
103
+
104
+ - **Tests pasan** → continuar.
105
+ - **Tests fallan** → `REJECTED` inmediato. Incluye el conteo y nombres de tests fallidos en el reporte.
106
+ - **Tests skipped aumentan vs base** riesgo de regresión silenciosa (regla `monitor-ci.md`). Reportar el delta como finding de severidad MAJOR.
107
+
108
+ ### Check 2: Sin marcadores placeholder nuevos
109
+
110
+ ```bash
111
+ git diff <base>..HEAD | grep -E "\+.*\b(TBD|TODO|FIXME|HACK|XXX)\b" || true
112
+ ```
113
+
114
+ Marcadores nuevos solo se aceptan con justificación explícita en el reporte
115
+ del implementador asociada al PLAN.md vigente (referencia a task ID, no texto suelto).
116
+ Sin justificación finding MAYOR.
117
+
118
+ ### Check 3: Sin secretos hardcodeados
119
+
120
+ ```bash
121
+ git diff <base>..HEAD | grep -E "(api[_-]?key|password|secret|token)\s*[=:]\s*[\"'][^\"'\s]{8,}[\"']" -i || true
122
+ ```
123
+
124
+ Cualquier match `REJECTED` con finding CRÍTICO. Aplica los patrones
125
+ documentados en `reglas/seguridad-agentes.md` § "Protección de secretos".
126
+
127
+ ### Check 4: Boundary violations
128
+
129
+ Lista de archivos modificados:
130
+
131
+ ```bash
132
+ git diff --name-only <base>..HEAD
133
+ ```
134
+
135
+ Cada archivo modificado DEBE estar dentro del `boundary scope` declarado en
136
+ la tarea. Si un archivo fuera del boundary aparece modificado:
137
+
138
+ - Si es modificación trivial (formateo, comentario) → finding MENOR.
139
+ - Si es modificación funcional → finding MAYOR. La tarea debe declarar el
140
+ boundary extendido o el cambio se devuelve al implementador para extraer
141
+ a una tarea aparte.
142
+
143
+ ---
144
+
145
+ ## Paso 3 Verificación de alineación con spec
146
+
147
+ Lee directamente:
148
+
149
+ - El texto de la tarea en `PLAN.md` (no parafrases — copia literal).
150
+ - Los requirements citados en el campo `requirements` de la tarea.
151
+ - Las secciones de design citadas si existen.
152
+
153
+ Para cada requirement/design ref, verifica:
154
+
155
+ | Pregunta | Cómo verificar |
156
+ |----------|----------------|
157
+ | ¿El código implementa lo que el requirement dice? | Mapear líneas concretas del diff al texto del requirement |
158
+ | ¿Falta algo del requirement que el código no cubre? | Listar gaps específicos |
159
+ | ¿Hay código fuera del scope del requirement? | Comparar con design — si no está justificado, es scope creep |
160
+
161
+ Si hay gap de cobertura finding MAYOR con cita del requirement y línea
162
+ faltante en el diff.
163
+
164
+ ---
165
+
166
+ ## Paso 4 — Veto items (heredados del revisor base)
167
+
168
+ Los revisores SWL existentes declaran sus propios veto items (ver
169
+ `reglas/gobernanza.md` § "Veto items y cap enforcement"). Cuando este
170
+ protocolo se carga desde uno de ellos, los veto items del revisor padre
171
+ aplican íntegros.
172
+
173
+ **Si detectas CUALQUIER veto item**:
174
+
175
+ - Score CAP automático a 6.0/10.
176
+ - Verdict pasa a `REJECTED` independientemente de qué tan limpio esté el resto.
177
+ - 2+ veto items → cap a 3.0/10.
178
+
179
+ Lista de veto items del revisor padre debe estar disponible en su SKILL/agente.
180
+ Si no se puede determinar, reporta `MANUAL_VERIFY_REQUIRED` en lugar de inventar.
181
+
182
+ ---
183
+
184
+ ## Paso 5 — Emitir veredicto estructurado
185
+
186
+ ### Formato del reporte
187
+
188
+ ```json
189
+ {
190
+ "protocol": "protocolo-revision-swl",
191
+ "task_id": "3.2 — Crear endpoint POST /facturas",
192
+ "verdict": "APPROVED | REJECTED",
193
+ "score": 9.2,
194
+ "score_cap_applied": null,
195
+ "mechanical_checks": {
196
+ "regression_safety": "PASS",
197
+ "no_new_placeholders": "PASS",
198
+ "no_hardcoded_secrets": "PASS",
199
+ "boundary_respected": "PASS | VIOLATIONS_FOUND"
200
+ },
201
+ "spec_alignment": {
202
+ "requirements_covered": ["R-12", "R-13"],
203
+ "requirements_gap": [],
204
+ "design_drift": "NONE | SLIGHT | SIGNIFICANT"
205
+ },
206
+ "veto_items": [],
207
+ "findings": [
208
+ {
209
+ "severity": "CRITICAL | MAJOR | MINOR",
210
+ "file": "app/api/facturas.py:42",
211
+ "issue": "Descripción breve",
212
+ "remediation": "Qué cambiar y cómo"
213
+ }
214
+ ],
215
+ "summary": "Una oración resumiendo el veredicto y la razón principal.",
216
+ "next_action": "MERGE | FIX_AND_RE_REVIEW | ESCALATE_TO_HUMAN"
217
+ }
218
+ ```
219
+
220
+ ### Reglas de scoring (compatibles con `checklist-calidad`)
221
+
222
+ - `APPROVED` requiere `score >= 9.0` Y `veto_items.length === 0` Y todos los
223
+ mechanical_checks en PASS.
224
+ - Severidad MAJOR baja el score 1.0 punto cada una.
225
+ - Severidad MINOR baja 0.3 puntos cada una.
226
+ - Severidad CRITICAL automaticamente `REJECTED` (score irrelevante).
227
+ - 1 veto item cap a 6.0. 2+ veto items cap a 3.0.
228
+
229
+ ### Reglas del `next_action`
230
+
231
+ - `MERGE`: APPROVED — el caller (orquestador) puede commitear y avanzar a la siguiente tarea.
232
+ - `FIX_AND_RE_REVIEW`: REJECTED con findings MAYORES — el implementador aplica remediation, se vuelve a invocar este protocolo. Máximo 2 ciclos antes de escalar.
233
+ - `ESCALATE_TO_HUMAN`: 2 ciclos de FIX no convergieron, O hay CRÍTICO sin remediación clara, O hay decisión de scope ambigua. Activa el `notificador-swl` si está configurado.
234
+
235
+ ---
236
+
237
+ ## Persistencia del veredicto
238
+
239
+ El veredicto JSON se persiste en:
240
+
241
+ ```
242
+ .planning/audit/reviews/<task-id>-<timestamp>.json
243
+ ```
244
+
245
+ Esto permite que `auto-evolucion-swl` y `/swl:metricas` calculen tasas de
246
+ APPROVED vs REJECTED por agente revisor y por tipo de tarea — datos
247
+ necesarios para identificar revisores con calibración floja o tipos de
248
+ tarea sistemáticamente problemáticos.
249
+
250
+ ---
251
+
252
+ ## Gotchas / Errores comunes no obvios
253
+
254
+ - **Confiar en el reporte del implementador como source of truth**: el primer paso obligatorio es `git diff`. Saltarse esto y derivar el veredicto del status report del implementador deja pasar bugs colaterales no reportados. Causa: optimización falsa para ahorrar tokens. Solución: `git diff --stat` siempre antes de cualquier interpretación.
255
+ - **Boundary violation reportada como MENOR sin verificar funcionalidad**: el revisor ve que se modificó un archivo fuera del boundary y lo marca MENOR porque "se ve pequeño". Causa: no se inspeccionó qué hace el cambio. Solución: para CUALQUIER archivo fuera del boundary, abrir el cambio y clasificar trivial vs funcional antes de asignar severidad.
256
+ - **Tests skipped tratados como tests pasados**: el conteo de tests verde no distingue entre pasados y saltados. Causa: parsing superficial del output del runner. Solución: comparar `skipped` count vs base — si aumenta sin causa documentada en el diff, es regresión silenciosa (regla `monitor-ci.md`).
257
+ - **APPROVED con score < 9.0 "porque la tarea era pequeña"**: el revisor reduce el umbral subjetivamente. Causa: ceder a presión de entrega. Solución: la regla es 9.0 estricto; tareas pequeñas que no llegan a 9.0 indican findings que valen MENOR o MAYOR — emitir como findings y devolver al implementador.
258
+ - **Veto items ignorados porque "el resto está limpio"**: el cap de score es no-negociable. Causa: el revisor pondera "promedio" de calidad. Solución: 1 veto item = score capped automáticamente, sin compensación posible desde otras dimensiones.
259
+
260
+ ---
261
+
262
+ ## Validación de afirmaciones de existencia / no-existencia
263
+
264
+ Anti-patrón recurrente observado en revisores externos (sesión swl-ses
265
+ 2026-05-16): el revisor emite findings del tipo *"X no existe en Y"* o
266
+ *"X no está registrado en Z"* basados en context incompleto del propio
267
+ revisor (vio un archivo del repo pero no verificó el filesystem actual
268
+ tras los últimos cambios). Casos documentados:
269
+
270
+ 1. *"Two new skills were added but are not listed in plugin.json"*
271
+ verificado con `grep -n "nemesis-evaluacion-json" plugin.json`:
272
+ estaban listados (líneas 107-108). Falso positivo.
273
+ 2. *"The skill `nemesis-redistribuir` doesn't exist in the habilidades/
274
+ directory"* verificado con `ls habilidades/nemesis-redistribuir/`:
275
+ 12,640 bytes presentes. Falso positivo.
276
+
277
+ ### Regla
278
+
279
+ Antes de emitir un finding del tipo "X no existe / X no está registrado / X
280
+ está ausente", el revisor DEBE verificar con `Read`, `Grep` o `ls` directo
281
+ sobre el filesystem actual. Una afirmación de no-existencia sin verificación
282
+ es **propagación de cita ajena**, prohibida por la regla global del usuario
283
+ `verificar-citas-normativas.md § Familia 2` (citas archivo:línea en reportes
284
+ de auditoría).
285
+
286
+ ### Protocolo de verificación obligatorio
287
+
288
+ | Afirmación | Comando de verificación mínimo |
289
+ |---|---|
290
+ | "X no existe en el directorio Y/" | `ls Y/X` o `find Y -name "X*"` |
291
+ | "X no está registrado en plugin.json" | `grep -n "X" plugin.json` |
292
+ | "X no está en manifiestos/modulos.json" | `grep -n "X" manifiestos/modulos.json` |
293
+ | "El archivo Z no tiene la sección W" | `Read` del archivo + buscar W |
294
+ | "El path A no resuelve a B" | `node -e "console.log(require('path').resolve('A'))"` o equivalente |
295
+
296
+ Si el comando confirma la afirmación → emitir finding válido.
297
+ Si el comando contradice la afirmación → **descartar como falso positivo** y
298
+ no emitirlo. Si el revisor lo emite igual, queda como ruido que el equipo
299
+ debe filtrar manualmente — degrada confianza en futuros findings.
300
+
301
+ ### Pattern correcto del finding
302
+
303
+ ```
304
+ ## [SEVERIDAD] Título
305
+
306
+ **Verificación**: `grep -n "nemesis-redistribuir" plugin.json`
307
+ **Resultado**: 0 ocurrencias (línea 108 esperada por habilidades/nemesis-redistribuir/ en disco).
308
+ **Causa**: skill creado pero no registrado en plugin.json.
309
+ **Fix**: agregar `"habilidades/nemesis-redistribuir"` en el array `skills`.
310
+ ```
311
+
312
+ El finding cita el comando ejecutado y su output. El reviewer humano puede
313
+ re-ejecutarlo para validar. Sin esta evidencia, el finding es opaco.
314
+
315
+ ### Anti-patrón explícito
316
+
317
+ NO emitir findings de no-existencia derivados de "leí el ADR/contexto y
318
+ asumo que X no existe porque no se menciona". El ADR documenta una
319
+ DECISIÓN; el filesystem documenta el ESTADO. Son ortogonales.
320
+
321
+ ### Origen
322
+
323
+ Detectado en sesión 2026-05-16 (swl-ses): revisor externo emitió 2 findings
324
+ de no-existencia (skills no listados) que fueron falsos positivos. La regla
325
+ extendida `verificar-citas-normativas.md § Familia 2` los descartó al
326
+ verificar con `ls`/`grep` directos. Esta sección formaliza la regla a nivel
327
+ de skill para que aplique automáticamente al cargarlo.
328
+
329
+ ---
330
+
331
+ ## Relación con otros componentes SWL
332
+
333
+ | Componente | Relación |
334
+ |-----------|----------|
335
+ | `revisor-codigo-swl` y revisores de lenguaje | Cargan este skill cuando trabajan task-local en lugar de phase-wide |
336
+ | `ejecutar-task-iterativo` (Sub-fase 4) | Invoca este protocolo después de cada implementer dispatch en modo `--iterative` |
337
+ | `verificar-trabajo` | Complementario — verificar-trabajo es goal-backward post-fase; este protocolo es task-local post-implementación |
338
+ | `reglas/gobernanza.md` | Veto items + cap enforcement heredados |
339
+ | `checklist-calidad` | Score >=9.0 unificado |
340
+ | `auto-evolucion-swl` | Consume los veredictos persistidos para detectar revisores descalibrados |
341
+
342
+ ## Checklist de cierre del protocolo
343
+
344
+ - [ ] `git diff --stat` ejecutado y diff leído antes de cualquier interpretación
345
+ - [ ] 4 mechanical checks ejecutados (regression, placeholders, secretos, boundary)
346
+ - [ ] Alineación con spec verificada citando IDs concretos
347
+ - [ ] Veto items del revisor padre evaluados
348
+ - [ ] Score calculado y cap aplicado si corresponde
349
+ - [ ] Veredicto JSON persistido en `.planning/audit/reviews/`
350
+ - [ ] `next_action` claro (MERGE / FIX_AND_RE_REVIEW / ESCALATE_TO_HUMAN)