@saulwade/swl-ses 1.9.0 → 2.0.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (108) hide show
  1. package/CLAUDE.md +8 -8
  2. package/README.md +12 -12
  3. package/agentes/accesibilidad-wcag-swl.md +3 -3
  4. package/agentes/auto-evolucion-swl.md +908 -908
  5. package/agentes/disenador-ui-swl.md +6 -5
  6. package/agentes/frontend-angular-swl.md +2 -2
  7. package/agentes/frontend-css-swl.md +2 -2
  8. package/agentes/frontend-react-swl.md +4 -4
  9. package/agentes/frontend-swl.md +6 -6
  10. package/agentes/investigador-ux-swl.md +5 -5
  11. package/agentes/orquestador-swl.md +7 -7
  12. package/agentes/perfilador-usuario-swl.md +308 -308
  13. package/agentes/producto-prd-swl.md +1 -1
  14. package/agentes/red-team-swl.md +218 -218
  15. package/agentes/tdd-qa-swl.md +17 -1
  16. package/comandos/swl/actualizar.md +1 -1
  17. package/comandos/swl/aprender.md +2 -2
  18. package/comandos/swl/aprobar-plan.md +152 -0
  19. package/comandos/swl/ayuda.md +3 -3
  20. package/comandos/swl/discutir-fase.md +20 -2
  21. package/comandos/swl/ejecutar-fase.md +53 -6
  22. package/comandos/swl/evolucionar.md +1 -1
  23. package/comandos/swl/inbox.md +1 -1
  24. package/comandos/swl/instalar.md +1 -1
  25. package/comandos/swl/nemesis.md +1 -1
  26. package/comandos/swl/planear-fase.md +17 -1
  27. package/comandos/swl/plugins.md +1 -1
  28. package/comandos/swl/release.md +1 -1
  29. package/comandos/swl/status.md +279 -0
  30. package/comandos/swl/verificar.md +26 -1
  31. package/habilidades/ai-runtime-security/SKILL.md +1 -1
  32. package/habilidades/auto-evolucion-protocolo/SKILL.md +276 -276
  33. package/habilidades/benchmark-memoria/SKILL.md +1 -1
  34. package/habilidades/calidad-contract-testing/SKILL.md +165 -0
  35. package/habilidades/changelog-generator/SKILL.md +9 -2
  36. package/habilidades/changelog-generator/scripts/parse-commits.js +11 -1
  37. package/habilidades/diagrama-arquitectura/SKILL.md +1 -1
  38. package/habilidades/drift-detection/SKILL.md +179 -179
  39. package/habilidades/ejecutar-fase/SKILL.md +64 -14
  40. package/habilidades/estructura-proyecto-claude/SKILL.md +17 -14
  41. package/habilidades/estructura-proyecto-claude/recursos/configuracion-y-extensiones.md +34 -23
  42. package/habilidades/estructura-proyecto-claude/recursos/frontmatter-y-hooks-referencia.md +70 -53
  43. package/habilidades/estructura-proyecto-claude/recursos/mcp-json-template.json +57 -77
  44. package/habilidades/extractor-de-aprendizajes/SKILL.md +9 -5
  45. package/habilidades/harness-claude-code/SKILL.md +10 -7
  46. package/{reglas/harness-claude-code.md → habilidades/harness-claude-code/recursos/disciplina-harness-regla.md} +2 -2
  47. package/habilidades/instalar-sistema/SKILL.md +3 -3
  48. package/habilidades/meta-skills-estandar/recursos/frameworks-seguridad.md +1 -1
  49. package/habilidades/perfil-usuario/SKILL.md +200 -200
  50. package/habilidades/planear-fase/SKILL.md +25 -4
  51. package/habilidades/proceso-ddia-fundamentos/SKILL.md +1 -1
  52. package/habilidades/proceso-ddia-streaming/SKILL.md +4 -4
  53. package/habilidades/proceso-debate-adversarial/SKILL.md +2 -2
  54. package/habilidades/protocolo-revision-swl/SKILL.md +1 -1
  55. package/habilidades/seguridad-skills-ia/SKILL.md +1 -1
  56. package/habilidades/swl-claudemd/SKILL.md +50 -210
  57. package/habilidades/swl-claudemd/recursos/contrato-aprender.md +83 -0
  58. package/habilidades/swl-claudemd/recursos/duplicacion-reglas-globales.md +85 -0
  59. package/habilidades/swl-claudemd/recursos/plantillas-init.md +94 -0
  60. package/habilidades/swl-dashboard/SKILL.md +9 -9
  61. package/habilidades/swl-revisar-impacto/SKILL.md +1 -1
  62. package/habilidades/tdd-workflow/SKILL.md +45 -5
  63. package/habilidades/validacion-ci-sistema/SKILL.md +3 -3
  64. package/hooks/calidad-pre-commit.js +340 -3
  65. package/hooks/ciclo-evolucion-subagente.js +26 -0
  66. package/hooks/ciclo-evolucion.js +26 -0
  67. package/hooks/extraccion-aprendizajes.js +13 -0
  68. package/hooks/lib/ciclo-evolucion.js +47 -0
  69. package/hooks/{auto-evolucion.js → lib/etapa-auto-evolucion.js} +701 -700
  70. package/hooks/{metricas-evolucion.js → lib/etapa-metricas.js} +388 -376
  71. package/hooks/{actualizar-perfil-usuario.js → lib/etapa-perfil-usuario.js} +376 -364
  72. package/hooks/lib/evolution-tracker.js +24 -3
  73. package/hooks/spec-gate.js +211 -0
  74. package/hooks/tdd-gate.js +241 -0
  75. package/hooks/validar-intent-spec.js +30 -10
  76. package/llms.txt +6 -6
  77. package/manifiestos/hooks-config.json +26 -17
  78. package/manifiestos/modulos.json +17 -14
  79. package/manifiestos/skills-lock.json +63 -56
  80. package/package.json +2 -2
  81. package/plugin.json +6 -10
  82. package/reglas/accesibilidad.md +10 -0
  83. package/reglas/api-diseno.md +9 -0
  84. package/reglas/auditorias-documentales-estructurales.md +7 -0
  85. package/reglas/cloud-infra.md +8 -0
  86. package/reglas/fragmentos-compartidos.md +5 -0
  87. package/reglas/gobernanza.md +4 -4
  88. package/reglas/hooks.md +6 -0
  89. package/reglas/intent-engineering.md +4 -0
  90. package/reglas/markitdown.md +8 -0
  91. package/reglas/memoria-consolidada.md +1 -1
  92. package/reglas/patrones.md +6 -0
  93. package/reglas/registro-componentes-nuevos.md +10 -1
  94. package/reglas/seguridad-agentes.md +1 -1
  95. package/reglas/skills-estandar.md +6 -0
  96. package/reglas/testing.md +7 -0
  97. package/reglas/tests-cleanup.md +4 -0
  98. package/reglas/usar-sistema-swl.md +1 -1
  99. package/scripts/lib/gitignore-manifest.js +29 -1
  100. package/scripts/lib/plan-lock.js +275 -0
  101. package/scripts/migrar-fase-dominio.js +0 -1
  102. package/scripts/verificar-trazabilidad.js +292 -0
  103. package/agentes/ux-disenador-swl.md +0 -503
  104. package/comandos/swl/dashboard.md +0 -146
  105. package/comandos/swl/evolucion-estado.md +0 -191
  106. package/comandos/swl/metricas.md +0 -376
  107. package/comandos/swl/salud.md +0 -481
  108. package/reglas/verificar-citas-temporales.md +0 -139
@@ -0,0 +1,165 @@
1
+ ---
2
+ name: calidad-contract-testing
3
+ description: >
4
+ Contract testing: verificar que la implementación honra el contrato declarado
5
+ en la spec (Pydantic, Zod, JSON Schema, OpenAPI/AsyncAPI, protobuf) y que
6
+ consumidor y proveedor de una API no divergen. Cubre herramientas por stack
7
+ (schemathesis, Dredd, Pact, zod, Pydantic, openapi-typescript), las dos
8
+ familias de contract testing (schema-based property testing y
9
+ consumer-driven contracts), generación de tests desde el schema del PLAN, y
10
+ uso como gate de verificación. Cargar cuando el PLAN declara schemas como
11
+ parte de la spec, al integrar dos servicios con un contrato compartido, o al
12
+ detectar drift entre lo que la API documenta y lo que devuelve.
13
+ version: "1.0.0"
14
+ herramientasPermitidas: [Read, Bash, Grep, Glob]
15
+ exclusiones:
16
+ - "No cargar para tests unitarios de lógica de negocio — eso es tdd-workflow; el contract testing verifica el límite spec↔implementación, no la lógica interna."
17
+ - "No cargar si no hay un contrato declarado (schema, OpenAPI, Pact) — sin contrato no hay nada que verificar; primero declarar el schema en el PLAN."
18
+ - "No cargar para validación de input en runtime — eso es responsabilidad del framework (Pydantic/Zod en el endpoint); el contract testing corre en CI, no en cada request."
19
+ evolvable: true
20
+ ---
21
+ # Contract Testing — La Spec que se Verifica a Sí Misma
22
+
23
+ La cobertura responde "¿qué código ejecutan los tests?". El mutation testing,
24
+ "¿los tests detectarían un bug?". El contract testing responde la pregunta del
25
+ límite: **"¿la implementación honra el contrato que la spec promete?"**. Un
26
+ endpoint con 90% de cobertura puede devolver un campo con el tipo equivocado,
27
+ omitir uno requerido o aceptar un payload que el schema prohíbe — los tests
28
+ unitarios no lo ven porque usan los mismos supuestos que el código.
29
+
30
+ **Principio**: el schema declarado en el PLAN (Pydantic/Zod/JSON Schema/OpenAPI)
31
+ ES parte de la spec. Un contrato que no se verifica es documentación que miente.
32
+
33
+ ## Cuándo cargar este skill
34
+
35
+ - El PLAN de la fase declara schemas (Pydantic, Zod, JSON Schema, OpenAPI) como
36
+ entregable — esos schemas son contrato verificable, no decoración.
37
+ - Integración de dos servicios (frontend↔backend, microservicio↔microservicio)
38
+ con un contrato compartido que ambos lados deben respetar.
39
+ - Drift detectado: la API documenta un campo que ya no devuelve, o devuelve uno
40
+ no documentado; un cliente generado rompe tras un cambio de backend.
41
+ - Configurar contract testing como paso de `/swl:verificar` o gate de `tdd-qa-swl`.
42
+
43
+ ## Las dos familias de contract testing
44
+
45
+ | Familia | Pregunta | Cuándo |
46
+ |---------|----------|--------|
47
+ | **Schema-based / property testing** | ¿La API respeta su propio schema OpenAPI ante cualquier input válido? | API con spec OpenAPI; un solo equipo controla ambos lados |
48
+ | **Consumer-driven contracts (CDC)** | ¿El proveedor sigue cumpliendo lo que cada consumidor concreto espera? | Múltiples consumidores, equipos separados, despliegue independiente |
49
+
50
+ Schema-based es más barato (un solo artefacto, la spec) y cubre el 80% del valor
51
+ en proyectos de un equipo. CDC paga su complejidad cuando hay equipos y
52
+ despliegues independientes que pueden romperse mutuamente sin saberlo.
53
+
54
+ ## Cómo funciona (schema-based)
55
+
56
+ 1. El schema (OpenAPI/Pydantic/Zod) define el contrato: rutas, métodos, forma de
57
+ request y response, campos requeridos, tipos, constraints.
58
+ 2. La herramienta **genera casos** desde el schema (property-based: cientos de
59
+ payloads válidos e inválidos) y los lanza contra la API real.
60
+ 3. Verifica que cada response **conforme al schema**: status esperado, forma,
61
+ tipos, requeridos presentes, sin campos extra prohibidos.
62
+ 4. Reporta violaciones: el contrato dice X, la implementación devolvió Y.
63
+
64
+ ## Herramientas por stack
65
+
66
+ Antes de instalar, verificar versión vigente con Context7
67
+ (regla `usar-context7.md`) — los nombres de paquete cambian entre majors.
68
+
69
+ | Stack | Herramienta | Familia | Comando típico |
70
+ |-------|------------|---------|----------------|
71
+ | OpenAPI (cualquier lenguaje) | `schemathesis` | schema-based | `schemathesis run http://localhost:8000/openapi.json` |
72
+ | OpenAPI (Node) | Dredd | schema-based | `dredd openapi.yaml http://localhost:3000` |
73
+ | Python | Pydantic v2 (`model_validate`) | schema (límite) | validar request/response contra el modelo en el test |
74
+ | JS/TS | Zod (`.parse`/`.safeParse`) | schema (límite) | parsear la response contra el schema en el test |
75
+ | TS desde OpenAPI | `openapi-typescript` + tsc | schema (compile-time) | generar tipos y dejar que el compilador detecte drift |
76
+ | Multi-equipo (poliglota) | Pact (`@pact-foundation/pact`, `pact-python`) | CDC | consumer genera pacto → provider lo verifica |
77
+ | gRPC | `buf breaking` / protovalidate | schema-based | `buf breaking --against '.git#branch=main'` |
78
+
79
+ ## Generar tests desde el schema del PLAN
80
+
81
+ Cuando `planear-fase` declara un schema como entregable, la tarea que lo
82
+ implementa se verifica generando el contract test, no escribiéndolo a mano:
83
+
84
+ ```
85
+ # OpenAPI + FastAPI: schemathesis deriva los casos del propio /openapi.json
86
+ schemathesis run http://localhost:8000/openapi.json --checks all
87
+ ```
88
+
89
+ ```python
90
+ # Pydantic como contrato en el test de integración:
91
+ def test_endpoint_respeta_contrato():
92
+ # verifica: REQ-NN
93
+ r = client.get("/facturas/1")
94
+ FacturaResponse.model_validate(r.json()) # falla si la forma no conforma
95
+ ```
96
+
97
+ ```typescript
98
+ // Zod como contrato del lado consumidor:
99
+ const FacturaSchema = z.object({ id: z.number(), total: z.number(), vigencia: z.string() });
100
+ const data = FacturaSchema.parse(await res.json()); // throw si el backend cambió la forma
101
+ ```
102
+
103
+ ## Umbrales y cuándo aplica el gate
104
+
105
+ | Contexto | Gate | Justificación |
106
+ |----------|------|---------------|
107
+ | API pública o consumida por otro equipo | obligatorio: 0 violaciones de contrato | Un drift rompe consumidores en silencio |
108
+ | Integración interna front↔back del mismo proyecto | recomendado: schema-based en CI | Barato con OpenAPI ya existente; atrapa el campo renombrado |
109
+ | Endpoint interno sin consumidores externos | opcional | El esfuerzo de mantener pactos no paga |
110
+
111
+ No imponer CDC donde schema-based basta: Pact con broker es infraestructura que
112
+ solo paga con equipos y despliegues independientes.
113
+
114
+ ## Uso como gate de verificación
115
+
116
+ En `/swl:verificar`, tras los tests unitarios: si la fase declaró schemas en el
117
+ PLAN, correr el contract test contra la API real (entorno de test) y tratar cada
118
+ violación de contrato como hallazgo CRÍTICO — la implementación contradice la
119
+ spec aprobada. En `tdd-qa-swl` es gate opt-in: requiere la API levantable en CI.
120
+
121
+ ## Cuándo NO cargar
122
+
123
+ - No hay contrato declarado (ni OpenAPI, ni schema, ni Pact) — primero declarar
124
+ el schema en el PLAN; sin contrato el contract testing no tiene qué verificar.
125
+ - Lógica de negocio pura sin límite de API — eso es `tdd-workflow`/`testing-*`.
126
+ - Prototipo de descarte donde la API cambia cada hora — el contrato se
127
+ estabiliza primero, luego se verifica.
128
+
129
+ ## Gotchas / Errores comunes no obvios
130
+
131
+ - **Schema permisivo da falso verde**: un OpenAPI con `additionalProperties: true`
132
+ y casi todo opcional "conforma" con cualquier response — el contract test pasa
133
+ sin verificar nada. Causa: schema generado laxo (FastAPI sin `model_config`
134
+ estricto, Zod con `.passthrough()`). Solución: el contrato debe ser tan
135
+ estricto como la promesa real — requeridos marcados, `additionalProperties:
136
+ false` donde aplica.
137
+ - **Property testing encuentra "bugs" en el schema, no en el código**: schemathesis
138
+ genera un edge case válido por schema que el código nunca contempló (string de
139
+ 10000 chars, número en el límite). A veces el bug es del schema (demasiado
140
+ permisivo), no del endpoint. Diagnosticar antes de "arreglar" el código.
141
+ - **Pact sin broker compartido es teatro**: si consumer y provider verifican
142
+ contra pactos en ramas distintas sin un broker central que versione, cada lado
143
+ pasa en aislamiento y rompen juntos en producción. CDC sin broker = falsa
144
+ seguridad; usar schema-based si no hay broker.
145
+ - **Tipos generados que nadie recompila**: `openapi-typescript` genera tipos al
146
+ día del commit; si el pipeline no los regenera contra la spec viva, el
147
+ compilador valida contra un contrato fósil. El gate debe regenerar y comparar,
148
+ no confiar en el archivo commiteado (regla `verificar-citas-normativas.md §
149
+ comentarios temporales`).
150
+ - **Contract test que levanta la app real es lento y flaky en CI**: si requiere
151
+ BD y servicios, hereda toda su fragilidad. Para schema-based puro, preferir el
152
+ modo que valida la spec estáticamente o contra un mock conformante antes de
153
+ exigir la app completa levantada.
154
+
155
+ ## Anti-patrones
156
+
157
+ - **Schema decorativo**: declarar OpenAPI/Pydantic y nunca verificar que la
158
+ implementación lo cumple — documentación que diverge en silencio.
159
+ - **CDC donde basta schema-based**: montar Pact + broker para un front↔back de
160
+ un solo equipo; complejidad sin retorno.
161
+ - **Verificar el contrato contra un mock que usa el mismo schema**: tautología —
162
+ el mock conforma por construcción; el contract test debe correr contra la
163
+ implementación real.
164
+ - **Tratar la violación de contrato como warning**: si la API rompe su contrato,
165
+ un consumidor ya está roto; es CRÍTICO, no observación.
@@ -8,7 +8,12 @@ description: >
8
8
  de conformidad para decidir fallback manual. Cargar en /swl:release Paso 7
9
9
  cuando hay commits Conventional, o manualmente para previsualizar el
10
10
  changelog antes de un release.
11
- version: 1.0.0
11
+ version: 1.1.0
12
+ evolved: true
13
+ evolved-from: "1.0.0"
14
+ evolved-at: "2026-06-11"
15
+ evolved-by: "fase-10-slice-5"
16
+ evolved-note: "v1.1.0: el parser CC tolera el prefijo de trazabilidad [T-NN]/[REQ-NN] de la convención de ejecutar-fase — commits con prefijo de tarea cuentan como conformes (Fase 10)."
12
17
  nivelRiesgo: BAJO
13
18
  herramientasPermitidas: [Read, Bash]
14
19
  skillsInvocables: [release-semver]
@@ -47,7 +52,9 @@ exclusiones:
47
52
  2. **Parsea con Conventional Commits 1.0.0**: regex que captura tipo, scope,
48
53
  marca `!`, descripción. Soporta tipos extendidos del proyecto SWL:
49
54
  `evolucion` (cambios de skills/agentes), además de `feat/fix/perf/refactor/
50
- docs/style/test/ci/build/chore/revert`.
55
+ docs/style/test/ci/build/chore/revert`. Tolera el prefijo opcional de
56
+ trazabilidad `[T-NN]` / `[REQ-NN]` de la convención de `ejecutar-fase`
57
+ (no altera la semántica CC — el tipo+scope+descripción siguen presentes).
51
58
  3. **Detecta breaking changes** por marca `!` después del tipo o trailer
52
59
  `BREAKING CHANGE:` en el body. Los breaking siempre van al inicio del
53
60
  release, sin importar el tipo original.
@@ -50,8 +50,18 @@ const { execSync } = require('node:child_process');
50
50
  * feat!: breaking change inline
51
51
  * refactor(hooks/lib): split evolution-tracker
52
52
  * chore(release): bump version
53
+ * [T-01] feat(hooks): prefijo de trazabilidad de tarea (ejecutar-fase)
54
+ * [T-07][T-08] refactor(hooks): varios prefijos consecutivos
55
+ * [REQ-08] feat(scripts): prefijo de requisito
56
+ *
57
+ * El prefijo opcional `[T-NN]` / `[REQ-NN]` (uno o más, consecutivos) proviene
58
+ * de la convención de commits de `habilidades/ejecutar-fase/SKILL.md`
59
+ * (trazabilidad de tarea/requisito). No altera la semántica CC: el
60
+ * tipo+scope+descripción siguen presentes después del/los prefijo(s), por lo
61
+ * que el commit cuenta como conforme. Grupo non-capturing para no desplazar
62
+ * los índices [1]=tipo [2]=scope [3]=! [4]=descripcion.
53
63
  */
54
- const RE_CONVENTIONAL = /^(feat|fix|perf|refactor|docs|style|test|ci|build|chore|revert|evolucion|evolve)(?:\(([^)]+)\))?(!)?:\s*(.+)$/;
64
+ const RE_CONVENTIONAL = /^(?:\[(?:T|REQ)-\d+\]\s*)*(feat|fix|perf|refactor|docs|style|test|ci|build|chore|revert|evolucion|evolve)(?:\(([^)]+)\))?(!)?:\s*(.+)$/;
55
65
 
56
66
  /** Mapa tipo CC → categoría Keep a Changelog en es-MX. */
57
67
  const CATEGORIAS = Object.freeze({
@@ -33,7 +33,7 @@ Basado en architecture-diagram-generator (MIT, Cocoon AI) — adaptado al sistem
33
33
  - El usuario pide un diagrama de arquitectura del proyecto
34
34
  - `arquitecto-swl` necesita visualizar la arquitectura propuesta
35
35
  - `documentador-swl` genera documentación visual
36
- - `/swl:wiki` o `/swl:dashboard` necesitan representación gráfica
36
+ - `/swl:wiki` o `/swl:status dashboard` necesitan representación gráfica
37
37
  - Cualquier tarea de RFC, ADR o propuesta arquitectónica
38
38
 
39
39
  ## Sistema de diseño
@@ -1,179 +1,179 @@
1
- ---
2
- name: drift-detection
3
- version: 1.0.0
4
- herramientasPermitidas: [Read]
5
- description: "Detección de drift de métricas de agentes/skills via ventana deslizante (7d) vs baseline (4 semanas). Integrado al operador Reflect del ciclo AGP."
6
- exclusiones:
7
- - "No cargar para detectar drift en código de aplicación (regressions de negocio); este skill detecta drift en métricas de uso de agentes/skills del sistema SWL."
8
- - "No cargar si hay menos de 7 días de trazas en `.planning/traces/`; el baseline de 4 semanas no existirá y los resultados serán estadísticamente inválidos."
9
- - "No cargar para observabilidad de la aplicación en producción; usar `monitoring-alertas` para eso."
10
- - "No cargar manualmente cuando el ciclo AGP ya ejecuta `ejecutarDriftAutomatico()` en cada SubagentStop — invocarlo dos veces dobla el trabajo sin beneficio."
11
- author: swl-ses
12
- evolvable: true
13
- evolvable_scope: [content, examples]
14
- domain: ingeniería-de-software
15
- tags: [agp, observabilidad, drift, métricas, ciclo-agp]
16
- ---
17
- # drift-detection — Detección de drift para el ciclo AGP
18
-
19
- Algoritmo de ventana deslizante que compara métricas recientes (últimos 7 días)
20
- contra un baseline histórico (4 semanas previas) para detectar degradación de
21
- skills y agentes antes de que el health score lo refleje.
22
-
23
- Adaptado de `runDriftCheck`/`getDriftTimeline` en mission-control-main (MIT).
24
-
25
- ## Módulo principal
26
-
27
- `scripts/lib/drift-detector.js` — zero-deps, Node stdlib únicamente.
28
-
29
- ## Cuándo se activa
30
-
31
- - Manual: desde cualquier script o agente que necesite análisis de degradación.
32
- - Automático (vía `hooks/auto-evolucion.js`): el hook ejecuta `ejecutarDriftAutomatico()`
33
- en cada `SubagentStop` con un throttle de 24 h (configurable con `SWL_DRIFT_THROTTLE_H`).
34
- Se evalúan los últimos 5 archivos JSONL de trazas. Opt-out total con `SWL_DRIFT_DISABLED=1`.
35
- - Automático (vía ciclo AGP): `hooks/lib/reflect-classifier.js` expone
36
- `ejecutarDriftReflect(rutaJsonl, nombreAgente)` como punto de extensión alternativo.
37
- - Las trazas de agentes viven en `.planning/traces/YYYY-MM-DD.jsonl`.
38
-
39
- ## Exports del módulo
40
-
41
- ```js
42
- const { detectarDrift, generarLineaTemporal } = require('./scripts/lib/drift-detector');
43
- ```
44
-
45
- ### `detectarDrift(opts)`
46
-
47
- ```js
48
- detectarDrift({
49
- rutaJsonl: '/ruta/a/traces.jsonl',
50
- ventanaDias: 7, // default
51
- baselineSemanasBase: 4, // default
52
- umbralPct: 10, // warn si |drift| > 10%
53
- metricas: ['tokens_promedio_por_sesion', 'tasa_exito_tool', 'tasa_finalizacion_tarea'],
54
- agente: 'backend-python-swl', // para nudges
55
- })
56
- ```
57
-
58
- **Retorna:**
59
-
60
- ```json
61
- {
62
- "drifts": [
63
- {
64
- "metrica": "tokens_promedio_por_sesion",
65
- "baseline": 1000,
66
- "reciente": 2100,
67
- "driftPct": 110.0,
68
- "estado": "critico"
69
- },
70
- {
71
- "metrica": "tasa_exito_tool",
72
- "baseline": 0.9,
73
- "reciente": 0.85,
74
- "driftPct": -5.56,
75
- "estado": "ok"
76
- }
77
- ],
78
- "timestamp": "2026-04-19T12:00:00.000Z",
79
- "estado_global": "critico"
80
- }
81
- ```
82
-
83
- **Estados por métrica:**
84
-
85
- | Condición | Estado |
86
- |-----------|--------|
87
- | `abs(driftPct) <= umbralPct` | `ok` |
88
- | `abs(driftPct) > umbralPct` | `warn` |
89
- | `abs(driftPct) > umbralPct * 2` | `critico` |
90
-
91
- **Estado global:** el peor estado entre todas las métricas.
92
-
93
- ### `generarLineaTemporal(opts)`
94
-
95
- ```js
96
- generarLineaTemporal({
97
- rutaJsonl: '/ruta/a/traces.jsonl',
98
- dias: 30, // default
99
- })
100
- // → [{ fecha: '2026-04-19', tokens: 3200, exitos: 12, fallos: 1 }, ...]
101
- ```
102
-
103
- Retorna un array de longitud `dias`, uno por día, para visualización en
104
- el dashboard o en reportes de salud.
105
-
106
- ## Estructura de eventos esperada en el JSONL
107
-
108
- El módulo es permisivo: extrae métricas de cualquier campo que coincida.
109
-
110
- | Métrica | Campos aceptados en el evento |
111
- |---------|-------------------------------|
112
- | Tokens | `atributos.tokens_totales`, `tokens`, `total_tokens` |
113
- | Éxito de tool | `success`, `exito`, `atributos.success` |
114
- | Finalización de tarea | `estado`, `status`, `atributos.estado` (valores: `OK`, `done`, `completado`) |
115
- | Timestamp | `timestamp`, `ts`, `inicio`, `created_at` |
116
-
117
- Formato nativo de `.planning/traces/YYYY-MM-DD.jsonl`:
118
-
119
- ```json
120
- {"traceId":"...","nombre":"agent:backend-python-swl","inicio":"2026-04-19T10:00:00.000Z","estado":"OK","atributos":{"tokens_totales":1500}}
121
- ```
122
-
123
- ## Integración con el ciclo AGP
124
-
125
- El operador Reflect (`hooks/lib/reflect-classifier.js`) expone:
126
-
127
- ```js
128
- const { ejecutarDriftReflect } = require('./hooks/lib/reflect-classifier');
129
-
130
- const resultado = ejecutarDriftReflect(
131
- '.planning/traces/2026-04-19.jsonl',
132
- 'backend-python-swl'
133
- );
134
- // resultado: { drifts, timestamp, estado_global } o null si módulo no disponible
135
- ```
136
-
137
- Cuando `estado_global === 'critico'`, el módulo emite automáticamente un nudge
138
- a `.planning/evolution/nudges.jsonl`:
139
-
140
- ```json
141
- {
142
- "timestamp": "2026-04-19T12:00:00.000Z",
143
- "tipo": "drift-detectado",
144
- "agente_o_skill": "backend-python-swl",
145
- "metrica": "tokens_promedio_por_sesion",
146
- "drift_pct": 110.0,
147
- "estado": "critico"
148
- }
149
- ```
150
-
151
- El agente `auto-evolucion-swl` consume estos nudges para proponer mejoras.
152
-
153
- ## Cómo interpretar los resultados
154
-
155
- - **`ok`**: métricas estables. Sin acción requerida.
156
- - **`warn`**: degradación moderada. Revisar en el próximo ciclo de evolución.
157
- - **`critico`**: degradación severa. Invocar `/swl:evolucionar` con el agente
158
- identificado. El nudge ya fue emitido — aparecerá en `/swl:salud`.
159
-
160
- ## Cuándo NO cargar
161
-
162
- - Se busca detectar regresiones en el código de la aplicación (tests fallando, performance degradada); para eso usar `monitoring-alertas` o el revisor de código correspondiente.
163
- - El proyecto tiene menos de 7 días de trazas — el baseline de 4 semanas no puede calcularse y `detectarDrift` retornará resultados sin significado estadístico.
164
- - El ciclo AGP ya tiene configurado el throttle automático de 24 h; invocar el drift manualmente en el mismo intervalo produce el mismo nudge dos veces sin nuevo valor.
165
-
166
- ## Gotchas / Errores comunes no obvios
167
-
168
- - **Timestamps inválidos en eventos JSONL provocan líneas ignoradas silenciosamente**: el módulo es permisivo con los campos pero si ningún campo de timestamp (`timestamp`, `ts`, `inicio`, `created_at`) tiene una fecha ISO válida, el evento se descarta del cálculo. Causa: eventos generados con timestamps de formato local (ej. `"19/04/2026"`) no pasan la validación. Solución: verificar que todos los eventos JSONL del trace tengan al menos un campo de timestamp en formato ISO 8601 — si el baseline aparece como 0, es el primer síntoma de eventos descartados.
169
- - **Estado `critico` emitido por baseline con muy pocos eventos**: si el baseline de 4 semanas tiene solo 3 eventos y la ventana de 7 días tiene 8, el `driftPct` de tokens se dispara al 166% cuando en realidad el agente está más activo, no degradado. Causa: el módulo no valida que el baseline tenga suficientes eventos para ser estadísticamente válido. Solución: antes de interpretar un estado `critico`, verificar que el baseline tiene al menos 20 eventos — si no, marcar el resultado como `insufficient-data` en lugar de accionar.
170
- - **Nudge duplicado en `.planning/evolution/nudges.jsonl` por falta de deduplicación**: el hook se ejecuta dos veces en el mismo `SubagentStop` (por bug de throttle) y emite el mismo nudge dos veces. Causa: el throttle `SWL_DRIFT_THROTTLE_H` no validó correctamente el timestamp del último run. Solución: el archivo `nudges.jsonl` es append-only — antes de emitir un nudge, verificar si el último evento del mismo `agente_o_skill` y `metrica` tiene un timestamp dentro de la ventana de throttle.
171
- - **`atomicWriteJSON` usado para escribir en nudges.jsonl**: escribir el archivo completo en lugar de hacer append corrompe el historial de nudges previos. Causa: confusión entre archivos de estado mutable (usan `atomicWriteJSON`) y archivos de eventos de alta frecuencia (usan `fs.appendFileSync`). Solución: `nudges.jsonl` es un JSONL de alta frecuencia — siempre usar `fs.appendFileSync(ruta, JSON.stringify(nudge) + '\n')`, nunca reescribir el archivo completo.
172
-
173
- ## Referencia cruzada
174
-
175
- - Módulo: `scripts/lib/drift-detector.js`
176
- - Tests: `tests/lib/drift-detector.test.js`
177
- - Operador Reflect: `hooks/lib/reflect-classifier.js`
178
- - Ciclo AGP: `.planning/evolution/nudges.jsonl`
179
- - Origen (adaptado de): `temp/mission-control-main/src/lib/agent-evals.ts` — MIT
1
+ ---
2
+ name: drift-detection
3
+ version: 1.0.0
4
+ herramientasPermitidas: [Read]
5
+ description: "Detección de drift de métricas de agentes/skills via ventana deslizante (7d) vs baseline (4 semanas). Integrado al operador Reflect del ciclo AGP."
6
+ exclusiones:
7
+ - "No cargar para detectar drift en código de aplicación (regressions de negocio); este skill detecta drift en métricas de uso de agentes/skills del sistema SWL."
8
+ - "No cargar si hay menos de 7 días de trazas en `.planning/traces/`; el baseline de 4 semanas no existirá y los resultados serán estadísticamente inválidos."
9
+ - "No cargar para observabilidad de la aplicación en producción; usar `monitoring-alertas` para eso."
10
+ - "No cargar manualmente cuando el ciclo AGP ya ejecuta `ejecutarDriftAutomatico()` en cada SubagentStop — invocarlo dos veces dobla el trabajo sin beneficio."
11
+ author: swl-ses
12
+ evolvable: true
13
+ evolvable_scope: [content, examples]
14
+ domain: ingeniería-de-software
15
+ tags: [agp, observabilidad, drift, métricas, ciclo-agp]
16
+ ---
17
+ # drift-detection — Detección de drift para el ciclo AGP
18
+
19
+ Algoritmo de ventana deslizante que compara métricas recientes (últimos 7 días)
20
+ contra un baseline histórico (4 semanas previas) para detectar degradación de
21
+ skills y agentes antes de que el health score lo refleje.
22
+
23
+ Adaptado de `runDriftCheck`/`getDriftTimeline` en mission-control-main (MIT).
24
+
25
+ ## Módulo principal
26
+
27
+ `scripts/lib/drift-detector.js` — zero-deps, Node stdlib únicamente.
28
+
29
+ ## Cuándo se activa
30
+
31
+ - Manual: desde cualquier script o agente que necesite análisis de degradación.
32
+ - Automático (vía `hooks/lib/etapa-auto-evolucion.js`): el hook ejecuta `ejecutarDriftAutomatico()`
33
+ en cada `SubagentStop` con un throttle de 24 h (configurable con `SWL_DRIFT_THROTTLE_H`).
34
+ Se evalúan los últimos 5 archivos JSONL de trazas. Opt-out total con `SWL_DRIFT_DISABLED=1`.
35
+ - Automático (vía ciclo AGP): `hooks/lib/reflect-classifier.js` expone
36
+ `ejecutarDriftReflect(rutaJsonl, nombreAgente)` como punto de extensión alternativo.
37
+ - Las trazas de agentes viven en `.planning/traces/YYYY-MM-DD.jsonl`.
38
+
39
+ ## Exports del módulo
40
+
41
+ ```js
42
+ const { detectarDrift, generarLineaTemporal } = require('./scripts/lib/drift-detector');
43
+ ```
44
+
45
+ ### `detectarDrift(opts)`
46
+
47
+ ```js
48
+ detectarDrift({
49
+ rutaJsonl: '/ruta/a/traces.jsonl',
50
+ ventanaDias: 7, // default
51
+ baselineSemanasBase: 4, // default
52
+ umbralPct: 10, // warn si |drift| > 10%
53
+ metricas: ['tokens_promedio_por_sesion', 'tasa_exito_tool', 'tasa_finalizacion_tarea'],
54
+ agente: 'backend-python-swl', // para nudges
55
+ })
56
+ ```
57
+
58
+ **Retorna:**
59
+
60
+ ```json
61
+ {
62
+ "drifts": [
63
+ {
64
+ "metrica": "tokens_promedio_por_sesion",
65
+ "baseline": 1000,
66
+ "reciente": 2100,
67
+ "driftPct": 110.0,
68
+ "estado": "critico"
69
+ },
70
+ {
71
+ "metrica": "tasa_exito_tool",
72
+ "baseline": 0.9,
73
+ "reciente": 0.85,
74
+ "driftPct": -5.56,
75
+ "estado": "ok"
76
+ }
77
+ ],
78
+ "timestamp": "2026-04-19T12:00:00.000Z",
79
+ "estado_global": "critico"
80
+ }
81
+ ```
82
+
83
+ **Estados por métrica:**
84
+
85
+ | Condición | Estado |
86
+ |-----------|--------|
87
+ | `abs(driftPct) <= umbralPct` | `ok` |
88
+ | `abs(driftPct) > umbralPct` | `warn` |
89
+ | `abs(driftPct) > umbralPct * 2` | `critico` |
90
+
91
+ **Estado global:** el peor estado entre todas las métricas.
92
+
93
+ ### `generarLineaTemporal(opts)`
94
+
95
+ ```js
96
+ generarLineaTemporal({
97
+ rutaJsonl: '/ruta/a/traces.jsonl',
98
+ dias: 30, // default
99
+ })
100
+ // → [{ fecha: '2026-04-19', tokens: 3200, exitos: 12, fallos: 1 }, ...]
101
+ ```
102
+
103
+ Retorna un array de longitud `dias`, uno por día, para visualización en
104
+ el dashboard o en reportes de salud.
105
+
106
+ ## Estructura de eventos esperada en el JSONL
107
+
108
+ El módulo es permisivo: extrae métricas de cualquier campo que coincida.
109
+
110
+ | Métrica | Campos aceptados en el evento |
111
+ |---------|-------------------------------|
112
+ | Tokens | `atributos.tokens_totales`, `tokens`, `total_tokens` |
113
+ | Éxito de tool | `success`, `exito`, `atributos.success` |
114
+ | Finalización de tarea | `estado`, `status`, `atributos.estado` (valores: `OK`, `done`, `completado`) |
115
+ | Timestamp | `timestamp`, `ts`, `inicio`, `created_at` |
116
+
117
+ Formato nativo de `.planning/traces/YYYY-MM-DD.jsonl`:
118
+
119
+ ```json
120
+ {"traceId":"...","nombre":"agent:backend-python-swl","inicio":"2026-04-19T10:00:00.000Z","estado":"OK","atributos":{"tokens_totales":1500}}
121
+ ```
122
+
123
+ ## Integración con el ciclo AGP
124
+
125
+ El operador Reflect (`hooks/lib/reflect-classifier.js`) expone:
126
+
127
+ ```js
128
+ const { ejecutarDriftReflect } = require('./hooks/lib/reflect-classifier');
129
+
130
+ const resultado = ejecutarDriftReflect(
131
+ '.planning/traces/2026-04-19.jsonl',
132
+ 'backend-python-swl'
133
+ );
134
+ // resultado: { drifts, timestamp, estado_global } o null si módulo no disponible
135
+ ```
136
+
137
+ Cuando `estado_global === 'critico'`, el módulo emite automáticamente un nudge
138
+ a `.planning/evolution/nudges.jsonl`:
139
+
140
+ ```json
141
+ {
142
+ "timestamp": "2026-04-19T12:00:00.000Z",
143
+ "tipo": "drift-detectado",
144
+ "agente_o_skill": "backend-python-swl",
145
+ "metrica": "tokens_promedio_por_sesion",
146
+ "drift_pct": 110.0,
147
+ "estado": "critico"
148
+ }
149
+ ```
150
+
151
+ El agente `auto-evolucion-swl` consume estos nudges para proponer mejoras.
152
+
153
+ ## Cómo interpretar los resultados
154
+
155
+ - **`ok`**: métricas estables. Sin acción requerida.
156
+ - **`warn`**: degradación moderada. Revisar en el próximo ciclo de evolución.
157
+ - **`critico`**: degradación severa. Invocar `/swl:evolucionar` con el agente
158
+ identificado. El nudge ya fue emitido — aparecerá en `/swl:status salud`.
159
+
160
+ ## Cuándo NO cargar
161
+
162
+ - Se busca detectar regresiones en el código de la aplicación (tests fallando, performance degradada); para eso usar `monitoring-alertas` o el revisor de código correspondiente.
163
+ - El proyecto tiene menos de 7 días de trazas — el baseline de 4 semanas no puede calcularse y `detectarDrift` retornará resultados sin significado estadístico.
164
+ - El ciclo AGP ya tiene configurado el throttle automático de 24 h; invocar el drift manualmente en el mismo intervalo produce el mismo nudge dos veces sin nuevo valor.
165
+
166
+ ## Gotchas / Errores comunes no obvios
167
+
168
+ - **Timestamps inválidos en eventos JSONL provocan líneas ignoradas silenciosamente**: el módulo es permisivo con los campos pero si ningún campo de timestamp (`timestamp`, `ts`, `inicio`, `created_at`) tiene una fecha ISO válida, el evento se descarta del cálculo. Causa: eventos generados con timestamps de formato local (ej. `"19/04/2026"`) no pasan la validación. Solución: verificar que todos los eventos JSONL del trace tengan al menos un campo de timestamp en formato ISO 8601 — si el baseline aparece como 0, es el primer síntoma de eventos descartados.
169
+ - **Estado `critico` emitido por baseline con muy pocos eventos**: si el baseline de 4 semanas tiene solo 3 eventos y la ventana de 7 días tiene 8, el `driftPct` de tokens se dispara al 166% cuando en realidad el agente está más activo, no degradado. Causa: el módulo no valida que el baseline tenga suficientes eventos para ser estadísticamente válido. Solución: antes de interpretar un estado `critico`, verificar que el baseline tiene al menos 20 eventos — si no, marcar el resultado como `insufficient-data` en lugar de accionar.
170
+ - **Nudge duplicado en `.planning/evolution/nudges.jsonl` por falta de deduplicación**: el hook se ejecuta dos veces en el mismo `SubagentStop` (por bug de throttle) y emite el mismo nudge dos veces. Causa: el throttle `SWL_DRIFT_THROTTLE_H` no validó correctamente el timestamp del último run. Solución: el archivo `nudges.jsonl` es append-only — antes de emitir un nudge, verificar si el último evento del mismo `agente_o_skill` y `metrica` tiene un timestamp dentro de la ventana de throttle.
171
+ - **`atomicWriteJSON` usado para escribir en nudges.jsonl**: escribir el archivo completo en lugar de hacer append corrompe el historial de nudges previos. Causa: confusión entre archivos de estado mutable (usan `atomicWriteJSON`) y archivos de eventos de alta frecuencia (usan `fs.appendFileSync`). Solución: `nudges.jsonl` es un JSONL de alta frecuencia — siempre usar `fs.appendFileSync(ruta, JSON.stringify(nudge) + '\n')`, nunca reescribir el archivo completo.
172
+
173
+ ## Referencia cruzada
174
+
175
+ - Módulo: `scripts/lib/drift-detector.js`
176
+ - Tests: `tests/lib/drift-detector.test.js`
177
+ - Operador Reflect: `hooks/lib/reflect-classifier.js`
178
+ - Ciclo AGP: `.planning/evolution/nudges.jsonl`
179
+ - Origen (adaptado de): `temp/mission-control-main/src/lib/agent-evals.ts` — MIT