@saulwade/swl-ses 1.9.0 → 2.0.0
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
- package/CLAUDE.md +8 -8
- package/README.md +12 -12
- package/agentes/accesibilidad-wcag-swl.md +3 -3
- package/agentes/auto-evolucion-swl.md +908 -908
- package/agentes/disenador-ui-swl.md +6 -5
- package/agentes/frontend-angular-swl.md +2 -2
- package/agentes/frontend-css-swl.md +2 -2
- package/agentes/frontend-react-swl.md +4 -4
- package/agentes/frontend-swl.md +6 -6
- package/agentes/investigador-ux-swl.md +5 -5
- package/agentes/orquestador-swl.md +7 -7
- package/agentes/perfilador-usuario-swl.md +308 -308
- package/agentes/producto-prd-swl.md +1 -1
- package/agentes/red-team-swl.md +218 -218
- package/agentes/tdd-qa-swl.md +17 -1
- package/comandos/swl/actualizar.md +1 -1
- package/comandos/swl/aprender.md +2 -2
- package/comandos/swl/aprobar-plan.md +152 -0
- package/comandos/swl/ayuda.md +3 -3
- package/comandos/swl/discutir-fase.md +20 -2
- package/comandos/swl/ejecutar-fase.md +53 -6
- package/comandos/swl/evolucionar.md +1 -1
- package/comandos/swl/inbox.md +1 -1
- package/comandos/swl/instalar.md +1 -1
- package/comandos/swl/nemesis.md +1 -1
- package/comandos/swl/planear-fase.md +17 -1
- package/comandos/swl/plugins.md +1 -1
- package/comandos/swl/release.md +1 -1
- package/comandos/swl/status.md +279 -0
- package/comandos/swl/verificar.md +26 -1
- package/habilidades/ai-runtime-security/SKILL.md +1 -1
- package/habilidades/auto-evolucion-protocolo/SKILL.md +276 -276
- package/habilidades/benchmark-memoria/SKILL.md +1 -1
- package/habilidades/calidad-contract-testing/SKILL.md +165 -0
- package/habilidades/changelog-generator/SKILL.md +9 -2
- package/habilidades/changelog-generator/scripts/parse-commits.js +11 -1
- package/habilidades/diagrama-arquitectura/SKILL.md +1 -1
- package/habilidades/drift-detection/SKILL.md +179 -179
- package/habilidades/ejecutar-fase/SKILL.md +64 -14
- package/habilidades/estructura-proyecto-claude/SKILL.md +17 -14
- package/habilidades/estructura-proyecto-claude/recursos/configuracion-y-extensiones.md +34 -23
- package/habilidades/estructura-proyecto-claude/recursos/frontmatter-y-hooks-referencia.md +70 -53
- package/habilidades/estructura-proyecto-claude/recursos/mcp-json-template.json +57 -77
- package/habilidades/extractor-de-aprendizajes/SKILL.md +9 -5
- package/habilidades/harness-claude-code/SKILL.md +10 -7
- package/{reglas/harness-claude-code.md → habilidades/harness-claude-code/recursos/disciplina-harness-regla.md} +2 -2
- package/habilidades/instalar-sistema/SKILL.md +3 -3
- package/habilidades/meta-skills-estandar/recursos/frameworks-seguridad.md +1 -1
- package/habilidades/perfil-usuario/SKILL.md +200 -200
- package/habilidades/planear-fase/SKILL.md +25 -4
- package/habilidades/proceso-ddia-fundamentos/SKILL.md +1 -1
- package/habilidades/proceso-ddia-streaming/SKILL.md +4 -4
- package/habilidades/proceso-debate-adversarial/SKILL.md +2 -2
- package/habilidades/protocolo-revision-swl/SKILL.md +1 -1
- package/habilidades/seguridad-skills-ia/SKILL.md +1 -1
- package/habilidades/swl-claudemd/SKILL.md +50 -210
- package/habilidades/swl-claudemd/recursos/contrato-aprender.md +83 -0
- package/habilidades/swl-claudemd/recursos/duplicacion-reglas-globales.md +85 -0
- package/habilidades/swl-claudemd/recursos/plantillas-init.md +94 -0
- package/habilidades/swl-dashboard/SKILL.md +9 -9
- package/habilidades/swl-revisar-impacto/SKILL.md +1 -1
- package/habilidades/tdd-workflow/SKILL.md +45 -5
- package/habilidades/validacion-ci-sistema/SKILL.md +3 -3
- package/hooks/calidad-pre-commit.js +340 -3
- package/hooks/ciclo-evolucion-subagente.js +26 -0
- package/hooks/ciclo-evolucion.js +26 -0
- package/hooks/extraccion-aprendizajes.js +13 -0
- package/hooks/lib/ciclo-evolucion.js +47 -0
- package/hooks/{auto-evolucion.js → lib/etapa-auto-evolucion.js} +701 -700
- package/hooks/{metricas-evolucion.js → lib/etapa-metricas.js} +388 -376
- package/hooks/{actualizar-perfil-usuario.js → lib/etapa-perfil-usuario.js} +376 -364
- package/hooks/lib/evolution-tracker.js +24 -3
- package/hooks/spec-gate.js +211 -0
- package/hooks/tdd-gate.js +241 -0
- package/hooks/validar-intent-spec.js +30 -10
- package/llms.txt +6 -6
- package/manifiestos/hooks-config.json +26 -17
- package/manifiestos/modulos.json +17 -14
- package/manifiestos/skills-lock.json +63 -56
- package/package.json +2 -2
- package/plugin.json +6 -10
- package/reglas/accesibilidad.md +10 -0
- package/reglas/api-diseno.md +9 -0
- package/reglas/auditorias-documentales-estructurales.md +7 -0
- package/reglas/cloud-infra.md +8 -0
- package/reglas/fragmentos-compartidos.md +5 -0
- package/reglas/gobernanza.md +4 -4
- package/reglas/hooks.md +6 -0
- package/reglas/intent-engineering.md +4 -0
- package/reglas/markitdown.md +8 -0
- package/reglas/memoria-consolidada.md +1 -1
- package/reglas/patrones.md +6 -0
- package/reglas/registro-componentes-nuevos.md +10 -1
- package/reglas/seguridad-agentes.md +1 -1
- package/reglas/skills-estandar.md +6 -0
- package/reglas/testing.md +7 -0
- package/reglas/tests-cleanup.md +4 -0
- package/reglas/usar-sistema-swl.md +1 -1
- package/scripts/lib/gitignore-manifest.js +29 -1
- package/scripts/lib/plan-lock.js +275 -0
- package/scripts/migrar-fase-dominio.js +0 -1
- package/scripts/verificar-trazabilidad.js +292 -0
- package/agentes/ux-disenador-swl.md +0 -503
- package/comandos/swl/dashboard.md +0 -146
- package/comandos/swl/evolucion-estado.md +0 -191
- package/comandos/swl/metricas.md +0 -376
- package/comandos/swl/salud.md +0 -481
- package/reglas/verificar-citas-temporales.md +0 -139
|
@@ -0,0 +1,165 @@
|
|
|
1
|
+
---
|
|
2
|
+
name: calidad-contract-testing
|
|
3
|
+
description: >
|
|
4
|
+
Contract testing: verificar que la implementación honra el contrato declarado
|
|
5
|
+
en la spec (Pydantic, Zod, JSON Schema, OpenAPI/AsyncAPI, protobuf) y que
|
|
6
|
+
consumidor y proveedor de una API no divergen. Cubre herramientas por stack
|
|
7
|
+
(schemathesis, Dredd, Pact, zod, Pydantic, openapi-typescript), las dos
|
|
8
|
+
familias de contract testing (schema-based property testing y
|
|
9
|
+
consumer-driven contracts), generación de tests desde el schema del PLAN, y
|
|
10
|
+
uso como gate de verificación. Cargar cuando el PLAN declara schemas como
|
|
11
|
+
parte de la spec, al integrar dos servicios con un contrato compartido, o al
|
|
12
|
+
detectar drift entre lo que la API documenta y lo que devuelve.
|
|
13
|
+
version: "1.0.0"
|
|
14
|
+
herramientasPermitidas: [Read, Bash, Grep, Glob]
|
|
15
|
+
exclusiones:
|
|
16
|
+
- "No cargar para tests unitarios de lógica de negocio — eso es tdd-workflow; el contract testing verifica el límite spec↔implementación, no la lógica interna."
|
|
17
|
+
- "No cargar si no hay un contrato declarado (schema, OpenAPI, Pact) — sin contrato no hay nada que verificar; primero declarar el schema en el PLAN."
|
|
18
|
+
- "No cargar para validación de input en runtime — eso es responsabilidad del framework (Pydantic/Zod en el endpoint); el contract testing corre en CI, no en cada request."
|
|
19
|
+
evolvable: true
|
|
20
|
+
---
|
|
21
|
+
# Contract Testing — La Spec que se Verifica a Sí Misma
|
|
22
|
+
|
|
23
|
+
La cobertura responde "¿qué código ejecutan los tests?". El mutation testing,
|
|
24
|
+
"¿los tests detectarían un bug?". El contract testing responde la pregunta del
|
|
25
|
+
límite: **"¿la implementación honra el contrato que la spec promete?"**. Un
|
|
26
|
+
endpoint con 90% de cobertura puede devolver un campo con el tipo equivocado,
|
|
27
|
+
omitir uno requerido o aceptar un payload que el schema prohíbe — los tests
|
|
28
|
+
unitarios no lo ven porque usan los mismos supuestos que el código.
|
|
29
|
+
|
|
30
|
+
**Principio**: el schema declarado en el PLAN (Pydantic/Zod/JSON Schema/OpenAPI)
|
|
31
|
+
ES parte de la spec. Un contrato que no se verifica es documentación que miente.
|
|
32
|
+
|
|
33
|
+
## Cuándo cargar este skill
|
|
34
|
+
|
|
35
|
+
- El PLAN de la fase declara schemas (Pydantic, Zod, JSON Schema, OpenAPI) como
|
|
36
|
+
entregable — esos schemas son contrato verificable, no decoración.
|
|
37
|
+
- Integración de dos servicios (frontend↔backend, microservicio↔microservicio)
|
|
38
|
+
con un contrato compartido que ambos lados deben respetar.
|
|
39
|
+
- Drift detectado: la API documenta un campo que ya no devuelve, o devuelve uno
|
|
40
|
+
no documentado; un cliente generado rompe tras un cambio de backend.
|
|
41
|
+
- Configurar contract testing como paso de `/swl:verificar` o gate de `tdd-qa-swl`.
|
|
42
|
+
|
|
43
|
+
## Las dos familias de contract testing
|
|
44
|
+
|
|
45
|
+
| Familia | Pregunta | Cuándo |
|
|
46
|
+
|---------|----------|--------|
|
|
47
|
+
| **Schema-based / property testing** | ¿La API respeta su propio schema OpenAPI ante cualquier input válido? | API con spec OpenAPI; un solo equipo controla ambos lados |
|
|
48
|
+
| **Consumer-driven contracts (CDC)** | ¿El proveedor sigue cumpliendo lo que cada consumidor concreto espera? | Múltiples consumidores, equipos separados, despliegue independiente |
|
|
49
|
+
|
|
50
|
+
Schema-based es más barato (un solo artefacto, la spec) y cubre el 80% del valor
|
|
51
|
+
en proyectos de un equipo. CDC paga su complejidad cuando hay equipos y
|
|
52
|
+
despliegues independientes que pueden romperse mutuamente sin saberlo.
|
|
53
|
+
|
|
54
|
+
## Cómo funciona (schema-based)
|
|
55
|
+
|
|
56
|
+
1. El schema (OpenAPI/Pydantic/Zod) define el contrato: rutas, métodos, forma de
|
|
57
|
+
request y response, campos requeridos, tipos, constraints.
|
|
58
|
+
2. La herramienta **genera casos** desde el schema (property-based: cientos de
|
|
59
|
+
payloads válidos e inválidos) y los lanza contra la API real.
|
|
60
|
+
3. Verifica que cada response **conforme al schema**: status esperado, forma,
|
|
61
|
+
tipos, requeridos presentes, sin campos extra prohibidos.
|
|
62
|
+
4. Reporta violaciones: el contrato dice X, la implementación devolvió Y.
|
|
63
|
+
|
|
64
|
+
## Herramientas por stack
|
|
65
|
+
|
|
66
|
+
Antes de instalar, verificar versión vigente con Context7
|
|
67
|
+
(regla `usar-context7.md`) — los nombres de paquete cambian entre majors.
|
|
68
|
+
|
|
69
|
+
| Stack | Herramienta | Familia | Comando típico |
|
|
70
|
+
|-------|------------|---------|----------------|
|
|
71
|
+
| OpenAPI (cualquier lenguaje) | `schemathesis` | schema-based | `schemathesis run http://localhost:8000/openapi.json` |
|
|
72
|
+
| OpenAPI (Node) | Dredd | schema-based | `dredd openapi.yaml http://localhost:3000` |
|
|
73
|
+
| Python | Pydantic v2 (`model_validate`) | schema (límite) | validar request/response contra el modelo en el test |
|
|
74
|
+
| JS/TS | Zod (`.parse`/`.safeParse`) | schema (límite) | parsear la response contra el schema en el test |
|
|
75
|
+
| TS desde OpenAPI | `openapi-typescript` + tsc | schema (compile-time) | generar tipos y dejar que el compilador detecte drift |
|
|
76
|
+
| Multi-equipo (poliglota) | Pact (`@pact-foundation/pact`, `pact-python`) | CDC | consumer genera pacto → provider lo verifica |
|
|
77
|
+
| gRPC | `buf breaking` / protovalidate | schema-based | `buf breaking --against '.git#branch=main'` |
|
|
78
|
+
|
|
79
|
+
## Generar tests desde el schema del PLAN
|
|
80
|
+
|
|
81
|
+
Cuando `planear-fase` declara un schema como entregable, la tarea que lo
|
|
82
|
+
implementa se verifica generando el contract test, no escribiéndolo a mano:
|
|
83
|
+
|
|
84
|
+
```
|
|
85
|
+
# OpenAPI + FastAPI: schemathesis deriva los casos del propio /openapi.json
|
|
86
|
+
schemathesis run http://localhost:8000/openapi.json --checks all
|
|
87
|
+
```
|
|
88
|
+
|
|
89
|
+
```python
|
|
90
|
+
# Pydantic como contrato en el test de integración:
|
|
91
|
+
def test_endpoint_respeta_contrato():
|
|
92
|
+
# verifica: REQ-NN
|
|
93
|
+
r = client.get("/facturas/1")
|
|
94
|
+
FacturaResponse.model_validate(r.json()) # falla si la forma no conforma
|
|
95
|
+
```
|
|
96
|
+
|
|
97
|
+
```typescript
|
|
98
|
+
// Zod como contrato del lado consumidor:
|
|
99
|
+
const FacturaSchema = z.object({ id: z.number(), total: z.number(), vigencia: z.string() });
|
|
100
|
+
const data = FacturaSchema.parse(await res.json()); // throw si el backend cambió la forma
|
|
101
|
+
```
|
|
102
|
+
|
|
103
|
+
## Umbrales y cuándo aplica el gate
|
|
104
|
+
|
|
105
|
+
| Contexto | Gate | Justificación |
|
|
106
|
+
|----------|------|---------------|
|
|
107
|
+
| API pública o consumida por otro equipo | obligatorio: 0 violaciones de contrato | Un drift rompe consumidores en silencio |
|
|
108
|
+
| Integración interna front↔back del mismo proyecto | recomendado: schema-based en CI | Barato con OpenAPI ya existente; atrapa el campo renombrado |
|
|
109
|
+
| Endpoint interno sin consumidores externos | opcional | El esfuerzo de mantener pactos no paga |
|
|
110
|
+
|
|
111
|
+
No imponer CDC donde schema-based basta: Pact con broker es infraestructura que
|
|
112
|
+
solo paga con equipos y despliegues independientes.
|
|
113
|
+
|
|
114
|
+
## Uso como gate de verificación
|
|
115
|
+
|
|
116
|
+
En `/swl:verificar`, tras los tests unitarios: si la fase declaró schemas en el
|
|
117
|
+
PLAN, correr el contract test contra la API real (entorno de test) y tratar cada
|
|
118
|
+
violación de contrato como hallazgo CRÍTICO — la implementación contradice la
|
|
119
|
+
spec aprobada. En `tdd-qa-swl` es gate opt-in: requiere la API levantable en CI.
|
|
120
|
+
|
|
121
|
+
## Cuándo NO cargar
|
|
122
|
+
|
|
123
|
+
- No hay contrato declarado (ni OpenAPI, ni schema, ni Pact) — primero declarar
|
|
124
|
+
el schema en el PLAN; sin contrato el contract testing no tiene qué verificar.
|
|
125
|
+
- Lógica de negocio pura sin límite de API — eso es `tdd-workflow`/`testing-*`.
|
|
126
|
+
- Prototipo de descarte donde la API cambia cada hora — el contrato se
|
|
127
|
+
estabiliza primero, luego se verifica.
|
|
128
|
+
|
|
129
|
+
## Gotchas / Errores comunes no obvios
|
|
130
|
+
|
|
131
|
+
- **Schema permisivo da falso verde**: un OpenAPI con `additionalProperties: true`
|
|
132
|
+
y casi todo opcional "conforma" con cualquier response — el contract test pasa
|
|
133
|
+
sin verificar nada. Causa: schema generado laxo (FastAPI sin `model_config`
|
|
134
|
+
estricto, Zod con `.passthrough()`). Solución: el contrato debe ser tan
|
|
135
|
+
estricto como la promesa real — requeridos marcados, `additionalProperties:
|
|
136
|
+
false` donde aplica.
|
|
137
|
+
- **Property testing encuentra "bugs" en el schema, no en el código**: schemathesis
|
|
138
|
+
genera un edge case válido por schema que el código nunca contempló (string de
|
|
139
|
+
10000 chars, número en el límite). A veces el bug es del schema (demasiado
|
|
140
|
+
permisivo), no del endpoint. Diagnosticar antes de "arreglar" el código.
|
|
141
|
+
- **Pact sin broker compartido es teatro**: si consumer y provider verifican
|
|
142
|
+
contra pactos en ramas distintas sin un broker central que versione, cada lado
|
|
143
|
+
pasa en aislamiento y rompen juntos en producción. CDC sin broker = falsa
|
|
144
|
+
seguridad; usar schema-based si no hay broker.
|
|
145
|
+
- **Tipos generados que nadie recompila**: `openapi-typescript` genera tipos al
|
|
146
|
+
día del commit; si el pipeline no los regenera contra la spec viva, el
|
|
147
|
+
compilador valida contra un contrato fósil. El gate debe regenerar y comparar,
|
|
148
|
+
no confiar en el archivo commiteado (regla `verificar-citas-normativas.md §
|
|
149
|
+
comentarios temporales`).
|
|
150
|
+
- **Contract test que levanta la app real es lento y flaky en CI**: si requiere
|
|
151
|
+
BD y servicios, hereda toda su fragilidad. Para schema-based puro, preferir el
|
|
152
|
+
modo que valida la spec estáticamente o contra un mock conformante antes de
|
|
153
|
+
exigir la app completa levantada.
|
|
154
|
+
|
|
155
|
+
## Anti-patrones
|
|
156
|
+
|
|
157
|
+
- **Schema decorativo**: declarar OpenAPI/Pydantic y nunca verificar que la
|
|
158
|
+
implementación lo cumple — documentación que diverge en silencio.
|
|
159
|
+
- **CDC donde basta schema-based**: montar Pact + broker para un front↔back de
|
|
160
|
+
un solo equipo; complejidad sin retorno.
|
|
161
|
+
- **Verificar el contrato contra un mock que usa el mismo schema**: tautología —
|
|
162
|
+
el mock conforma por construcción; el contract test debe correr contra la
|
|
163
|
+
implementación real.
|
|
164
|
+
- **Tratar la violación de contrato como warning**: si la API rompe su contrato,
|
|
165
|
+
un consumidor ya está roto; es CRÍTICO, no observación.
|
|
@@ -8,7 +8,12 @@ description: >
|
|
|
8
8
|
de conformidad para decidir fallback manual. Cargar en /swl:release Paso 7
|
|
9
9
|
cuando hay commits Conventional, o manualmente para previsualizar el
|
|
10
10
|
changelog antes de un release.
|
|
11
|
-
version: 1.
|
|
11
|
+
version: 1.1.0
|
|
12
|
+
evolved: true
|
|
13
|
+
evolved-from: "1.0.0"
|
|
14
|
+
evolved-at: "2026-06-11"
|
|
15
|
+
evolved-by: "fase-10-slice-5"
|
|
16
|
+
evolved-note: "v1.1.0: el parser CC tolera el prefijo de trazabilidad [T-NN]/[REQ-NN] de la convención de ejecutar-fase — commits con prefijo de tarea cuentan como conformes (Fase 10)."
|
|
12
17
|
nivelRiesgo: BAJO
|
|
13
18
|
herramientasPermitidas: [Read, Bash]
|
|
14
19
|
skillsInvocables: [release-semver]
|
|
@@ -47,7 +52,9 @@ exclusiones:
|
|
|
47
52
|
2. **Parsea con Conventional Commits 1.0.0**: regex que captura tipo, scope,
|
|
48
53
|
marca `!`, descripción. Soporta tipos extendidos del proyecto SWL:
|
|
49
54
|
`evolucion` (cambios de skills/agentes), además de `feat/fix/perf/refactor/
|
|
50
|
-
docs/style/test/ci/build/chore/revert`.
|
|
55
|
+
docs/style/test/ci/build/chore/revert`. Tolera el prefijo opcional de
|
|
56
|
+
trazabilidad `[T-NN]` / `[REQ-NN]` de la convención de `ejecutar-fase`
|
|
57
|
+
(no altera la semántica CC — el tipo+scope+descripción siguen presentes).
|
|
51
58
|
3. **Detecta breaking changes** por marca `!` después del tipo o trailer
|
|
52
59
|
`BREAKING CHANGE:` en el body. Los breaking siempre van al inicio del
|
|
53
60
|
release, sin importar el tipo original.
|
|
@@ -50,8 +50,18 @@ const { execSync } = require('node:child_process');
|
|
|
50
50
|
* feat!: breaking change inline
|
|
51
51
|
* refactor(hooks/lib): split evolution-tracker
|
|
52
52
|
* chore(release): bump version
|
|
53
|
+
* [T-01] feat(hooks): prefijo de trazabilidad de tarea (ejecutar-fase)
|
|
54
|
+
* [T-07][T-08] refactor(hooks): varios prefijos consecutivos
|
|
55
|
+
* [REQ-08] feat(scripts): prefijo de requisito
|
|
56
|
+
*
|
|
57
|
+
* El prefijo opcional `[T-NN]` / `[REQ-NN]` (uno o más, consecutivos) proviene
|
|
58
|
+
* de la convención de commits de `habilidades/ejecutar-fase/SKILL.md`
|
|
59
|
+
* (trazabilidad de tarea/requisito). No altera la semántica CC: el
|
|
60
|
+
* tipo+scope+descripción siguen presentes después del/los prefijo(s), por lo
|
|
61
|
+
* que el commit cuenta como conforme. Grupo non-capturing para no desplazar
|
|
62
|
+
* los índices [1]=tipo [2]=scope [3]=! [4]=descripcion.
|
|
53
63
|
*/
|
|
54
|
-
const RE_CONVENTIONAL = /^(feat|fix|perf|refactor|docs|style|test|ci|build|chore|revert|evolucion|evolve)(?:\(([^)]+)\))?(!)?:\s*(.+)$/;
|
|
64
|
+
const RE_CONVENTIONAL = /^(?:\[(?:T|REQ)-\d+\]\s*)*(feat|fix|perf|refactor|docs|style|test|ci|build|chore|revert|evolucion|evolve)(?:\(([^)]+)\))?(!)?:\s*(.+)$/;
|
|
55
65
|
|
|
56
66
|
/** Mapa tipo CC → categoría Keep a Changelog en es-MX. */
|
|
57
67
|
const CATEGORIAS = Object.freeze({
|
|
@@ -33,7 +33,7 @@ Basado en architecture-diagram-generator (MIT, Cocoon AI) — adaptado al sistem
|
|
|
33
33
|
- El usuario pide un diagrama de arquitectura del proyecto
|
|
34
34
|
- `arquitecto-swl` necesita visualizar la arquitectura propuesta
|
|
35
35
|
- `documentador-swl` genera documentación visual
|
|
36
|
-
- `/swl:wiki` o `/swl:dashboard` necesitan representación gráfica
|
|
36
|
+
- `/swl:wiki` o `/swl:status dashboard` necesitan representación gráfica
|
|
37
37
|
- Cualquier tarea de RFC, ADR o propuesta arquitectónica
|
|
38
38
|
|
|
39
39
|
## Sistema de diseño
|
|
@@ -1,179 +1,179 @@
|
|
|
1
|
-
---
|
|
2
|
-
name: drift-detection
|
|
3
|
-
version: 1.0.0
|
|
4
|
-
herramientasPermitidas: [Read]
|
|
5
|
-
description: "Detección de drift de métricas de agentes/skills via ventana deslizante (7d) vs baseline (4 semanas). Integrado al operador Reflect del ciclo AGP."
|
|
6
|
-
exclusiones:
|
|
7
|
-
- "No cargar para detectar drift en código de aplicación (regressions de negocio); este skill detecta drift en métricas de uso de agentes/skills del sistema SWL."
|
|
8
|
-
- "No cargar si hay menos de 7 días de trazas en `.planning/traces/`; el baseline de 4 semanas no existirá y los resultados serán estadísticamente inválidos."
|
|
9
|
-
- "No cargar para observabilidad de la aplicación en producción; usar `monitoring-alertas` para eso."
|
|
10
|
-
- "No cargar manualmente cuando el ciclo AGP ya ejecuta `ejecutarDriftAutomatico()` en cada SubagentStop — invocarlo dos veces dobla el trabajo sin beneficio."
|
|
11
|
-
author: swl-ses
|
|
12
|
-
evolvable: true
|
|
13
|
-
evolvable_scope: [content, examples]
|
|
14
|
-
domain: ingeniería-de-software
|
|
15
|
-
tags: [agp, observabilidad, drift, métricas, ciclo-agp]
|
|
16
|
-
---
|
|
17
|
-
# drift-detection — Detección de drift para el ciclo AGP
|
|
18
|
-
|
|
19
|
-
Algoritmo de ventana deslizante que compara métricas recientes (últimos 7 días)
|
|
20
|
-
contra un baseline histórico (4 semanas previas) para detectar degradación de
|
|
21
|
-
skills y agentes antes de que el health score lo refleje.
|
|
22
|
-
|
|
23
|
-
Adaptado de `runDriftCheck`/`getDriftTimeline` en mission-control-main (MIT).
|
|
24
|
-
|
|
25
|
-
## Módulo principal
|
|
26
|
-
|
|
27
|
-
`scripts/lib/drift-detector.js` — zero-deps, Node stdlib únicamente.
|
|
28
|
-
|
|
29
|
-
## Cuándo se activa
|
|
30
|
-
|
|
31
|
-
- Manual: desde cualquier script o agente que necesite análisis de degradación.
|
|
32
|
-
- Automático (vía `hooks/auto-evolucion.js`): el hook ejecuta `ejecutarDriftAutomatico()`
|
|
33
|
-
en cada `SubagentStop` con un throttle de 24 h (configurable con `SWL_DRIFT_THROTTLE_H`).
|
|
34
|
-
Se evalúan los últimos 5 archivos JSONL de trazas. Opt-out total con `SWL_DRIFT_DISABLED=1`.
|
|
35
|
-
- Automático (vía ciclo AGP): `hooks/lib/reflect-classifier.js` expone
|
|
36
|
-
`ejecutarDriftReflect(rutaJsonl, nombreAgente)` como punto de extensión alternativo.
|
|
37
|
-
- Las trazas de agentes viven en `.planning/traces/YYYY-MM-DD.jsonl`.
|
|
38
|
-
|
|
39
|
-
## Exports del módulo
|
|
40
|
-
|
|
41
|
-
```js
|
|
42
|
-
const { detectarDrift, generarLineaTemporal } = require('./scripts/lib/drift-detector');
|
|
43
|
-
```
|
|
44
|
-
|
|
45
|
-
### `detectarDrift(opts)`
|
|
46
|
-
|
|
47
|
-
```js
|
|
48
|
-
detectarDrift({
|
|
49
|
-
rutaJsonl: '/ruta/a/traces.jsonl',
|
|
50
|
-
ventanaDias: 7, // default
|
|
51
|
-
baselineSemanasBase: 4, // default
|
|
52
|
-
umbralPct: 10, // warn si |drift| > 10%
|
|
53
|
-
metricas: ['tokens_promedio_por_sesion', 'tasa_exito_tool', 'tasa_finalizacion_tarea'],
|
|
54
|
-
agente: 'backend-python-swl', // para nudges
|
|
55
|
-
})
|
|
56
|
-
```
|
|
57
|
-
|
|
58
|
-
**Retorna:**
|
|
59
|
-
|
|
60
|
-
```json
|
|
61
|
-
{
|
|
62
|
-
"drifts": [
|
|
63
|
-
{
|
|
64
|
-
"metrica": "tokens_promedio_por_sesion",
|
|
65
|
-
"baseline": 1000,
|
|
66
|
-
"reciente": 2100,
|
|
67
|
-
"driftPct": 110.0,
|
|
68
|
-
"estado": "critico"
|
|
69
|
-
},
|
|
70
|
-
{
|
|
71
|
-
"metrica": "tasa_exito_tool",
|
|
72
|
-
"baseline": 0.9,
|
|
73
|
-
"reciente": 0.85,
|
|
74
|
-
"driftPct": -5.56,
|
|
75
|
-
"estado": "ok"
|
|
76
|
-
}
|
|
77
|
-
],
|
|
78
|
-
"timestamp": "2026-04-19T12:00:00.000Z",
|
|
79
|
-
"estado_global": "critico"
|
|
80
|
-
}
|
|
81
|
-
```
|
|
82
|
-
|
|
83
|
-
**Estados por métrica:**
|
|
84
|
-
|
|
85
|
-
| Condición | Estado |
|
|
86
|
-
|-----------|--------|
|
|
87
|
-
| `abs(driftPct) <= umbralPct` | `ok` |
|
|
88
|
-
| `abs(driftPct) > umbralPct` | `warn` |
|
|
89
|
-
| `abs(driftPct) > umbralPct * 2` | `critico` |
|
|
90
|
-
|
|
91
|
-
**Estado global:** el peor estado entre todas las métricas.
|
|
92
|
-
|
|
93
|
-
### `generarLineaTemporal(opts)`
|
|
94
|
-
|
|
95
|
-
```js
|
|
96
|
-
generarLineaTemporal({
|
|
97
|
-
rutaJsonl: '/ruta/a/traces.jsonl',
|
|
98
|
-
dias: 30, // default
|
|
99
|
-
})
|
|
100
|
-
// → [{ fecha: '2026-04-19', tokens: 3200, exitos: 12, fallos: 1 }, ...]
|
|
101
|
-
```
|
|
102
|
-
|
|
103
|
-
Retorna un array de longitud `dias`, uno por día, para visualización en
|
|
104
|
-
el dashboard o en reportes de salud.
|
|
105
|
-
|
|
106
|
-
## Estructura de eventos esperada en el JSONL
|
|
107
|
-
|
|
108
|
-
El módulo es permisivo: extrae métricas de cualquier campo que coincida.
|
|
109
|
-
|
|
110
|
-
| Métrica | Campos aceptados en el evento |
|
|
111
|
-
|---------|-------------------------------|
|
|
112
|
-
| Tokens | `atributos.tokens_totales`, `tokens`, `total_tokens` |
|
|
113
|
-
| Éxito de tool | `success`, `exito`, `atributos.success` |
|
|
114
|
-
| Finalización de tarea | `estado`, `status`, `atributos.estado` (valores: `OK`, `done`, `completado`) |
|
|
115
|
-
| Timestamp | `timestamp`, `ts`, `inicio`, `created_at` |
|
|
116
|
-
|
|
117
|
-
Formato nativo de `.planning/traces/YYYY-MM-DD.jsonl`:
|
|
118
|
-
|
|
119
|
-
```json
|
|
120
|
-
{"traceId":"...","nombre":"agent:backend-python-swl","inicio":"2026-04-19T10:00:00.000Z","estado":"OK","atributos":{"tokens_totales":1500}}
|
|
121
|
-
```
|
|
122
|
-
|
|
123
|
-
## Integración con el ciclo AGP
|
|
124
|
-
|
|
125
|
-
El operador Reflect (`hooks/lib/reflect-classifier.js`) expone:
|
|
126
|
-
|
|
127
|
-
```js
|
|
128
|
-
const { ejecutarDriftReflect } = require('./hooks/lib/reflect-classifier');
|
|
129
|
-
|
|
130
|
-
const resultado = ejecutarDriftReflect(
|
|
131
|
-
'.planning/traces/2026-04-19.jsonl',
|
|
132
|
-
'backend-python-swl'
|
|
133
|
-
);
|
|
134
|
-
// resultado: { drifts, timestamp, estado_global } o null si módulo no disponible
|
|
135
|
-
```
|
|
136
|
-
|
|
137
|
-
Cuando `estado_global === 'critico'`, el módulo emite automáticamente un nudge
|
|
138
|
-
a `.planning/evolution/nudges.jsonl`:
|
|
139
|
-
|
|
140
|
-
```json
|
|
141
|
-
{
|
|
142
|
-
"timestamp": "2026-04-19T12:00:00.000Z",
|
|
143
|
-
"tipo": "drift-detectado",
|
|
144
|
-
"agente_o_skill": "backend-python-swl",
|
|
145
|
-
"metrica": "tokens_promedio_por_sesion",
|
|
146
|
-
"drift_pct": 110.0,
|
|
147
|
-
"estado": "critico"
|
|
148
|
-
}
|
|
149
|
-
```
|
|
150
|
-
|
|
151
|
-
El agente `auto-evolucion-swl` consume estos nudges para proponer mejoras.
|
|
152
|
-
|
|
153
|
-
## Cómo interpretar los resultados
|
|
154
|
-
|
|
155
|
-
- **`ok`**: métricas estables. Sin acción requerida.
|
|
156
|
-
- **`warn`**: degradación moderada. Revisar en el próximo ciclo de evolución.
|
|
157
|
-
- **`critico`**: degradación severa. Invocar `/swl:evolucionar` con el agente
|
|
158
|
-
identificado. El nudge ya fue emitido — aparecerá en `/swl:salud`.
|
|
159
|
-
|
|
160
|
-
## Cuándo NO cargar
|
|
161
|
-
|
|
162
|
-
- Se busca detectar regresiones en el código de la aplicación (tests fallando, performance degradada); para eso usar `monitoring-alertas` o el revisor de código correspondiente.
|
|
163
|
-
- El proyecto tiene menos de 7 días de trazas — el baseline de 4 semanas no puede calcularse y `detectarDrift` retornará resultados sin significado estadístico.
|
|
164
|
-
- El ciclo AGP ya tiene configurado el throttle automático de 24 h; invocar el drift manualmente en el mismo intervalo produce el mismo nudge dos veces sin nuevo valor.
|
|
165
|
-
|
|
166
|
-
## Gotchas / Errores comunes no obvios
|
|
167
|
-
|
|
168
|
-
- **Timestamps inválidos en eventos JSONL provocan líneas ignoradas silenciosamente**: el módulo es permisivo con los campos pero si ningún campo de timestamp (`timestamp`, `ts`, `inicio`, `created_at`) tiene una fecha ISO válida, el evento se descarta del cálculo. Causa: eventos generados con timestamps de formato local (ej. `"19/04/2026"`) no pasan la validación. Solución: verificar que todos los eventos JSONL del trace tengan al menos un campo de timestamp en formato ISO 8601 — si el baseline aparece como 0, es el primer síntoma de eventos descartados.
|
|
169
|
-
- **Estado `critico` emitido por baseline con muy pocos eventos**: si el baseline de 4 semanas tiene solo 3 eventos y la ventana de 7 días tiene 8, el `driftPct` de tokens se dispara al 166% cuando en realidad el agente está más activo, no degradado. Causa: el módulo no valida que el baseline tenga suficientes eventos para ser estadísticamente válido. Solución: antes de interpretar un estado `critico`, verificar que el baseline tiene al menos 20 eventos — si no, marcar el resultado como `insufficient-data` en lugar de accionar.
|
|
170
|
-
- **Nudge duplicado en `.planning/evolution/nudges.jsonl` por falta de deduplicación**: el hook se ejecuta dos veces en el mismo `SubagentStop` (por bug de throttle) y emite el mismo nudge dos veces. Causa: el throttle `SWL_DRIFT_THROTTLE_H` no validó correctamente el timestamp del último run. Solución: el archivo `nudges.jsonl` es append-only — antes de emitir un nudge, verificar si el último evento del mismo `agente_o_skill` y `metrica` tiene un timestamp dentro de la ventana de throttle.
|
|
171
|
-
- **`atomicWriteJSON` usado para escribir en nudges.jsonl**: escribir el archivo completo en lugar de hacer append corrompe el historial de nudges previos. Causa: confusión entre archivos de estado mutable (usan `atomicWriteJSON`) y archivos de eventos de alta frecuencia (usan `fs.appendFileSync`). Solución: `nudges.jsonl` es un JSONL de alta frecuencia — siempre usar `fs.appendFileSync(ruta, JSON.stringify(nudge) + '\n')`, nunca reescribir el archivo completo.
|
|
172
|
-
|
|
173
|
-
## Referencia cruzada
|
|
174
|
-
|
|
175
|
-
- Módulo: `scripts/lib/drift-detector.js`
|
|
176
|
-
- Tests: `tests/lib/drift-detector.test.js`
|
|
177
|
-
- Operador Reflect: `hooks/lib/reflect-classifier.js`
|
|
178
|
-
- Ciclo AGP: `.planning/evolution/nudges.jsonl`
|
|
179
|
-
- Origen (adaptado de): `temp/mission-control-main/src/lib/agent-evals.ts` — MIT
|
|
1
|
+
---
|
|
2
|
+
name: drift-detection
|
|
3
|
+
version: 1.0.0
|
|
4
|
+
herramientasPermitidas: [Read]
|
|
5
|
+
description: "Detección de drift de métricas de agentes/skills via ventana deslizante (7d) vs baseline (4 semanas). Integrado al operador Reflect del ciclo AGP."
|
|
6
|
+
exclusiones:
|
|
7
|
+
- "No cargar para detectar drift en código de aplicación (regressions de negocio); este skill detecta drift en métricas de uso de agentes/skills del sistema SWL."
|
|
8
|
+
- "No cargar si hay menos de 7 días de trazas en `.planning/traces/`; el baseline de 4 semanas no existirá y los resultados serán estadísticamente inválidos."
|
|
9
|
+
- "No cargar para observabilidad de la aplicación en producción; usar `monitoring-alertas` para eso."
|
|
10
|
+
- "No cargar manualmente cuando el ciclo AGP ya ejecuta `ejecutarDriftAutomatico()` en cada SubagentStop — invocarlo dos veces dobla el trabajo sin beneficio."
|
|
11
|
+
author: swl-ses
|
|
12
|
+
evolvable: true
|
|
13
|
+
evolvable_scope: [content, examples]
|
|
14
|
+
domain: ingeniería-de-software
|
|
15
|
+
tags: [agp, observabilidad, drift, métricas, ciclo-agp]
|
|
16
|
+
---
|
|
17
|
+
# drift-detection — Detección de drift para el ciclo AGP
|
|
18
|
+
|
|
19
|
+
Algoritmo de ventana deslizante que compara métricas recientes (últimos 7 días)
|
|
20
|
+
contra un baseline histórico (4 semanas previas) para detectar degradación de
|
|
21
|
+
skills y agentes antes de que el health score lo refleje.
|
|
22
|
+
|
|
23
|
+
Adaptado de `runDriftCheck`/`getDriftTimeline` en mission-control-main (MIT).
|
|
24
|
+
|
|
25
|
+
## Módulo principal
|
|
26
|
+
|
|
27
|
+
`scripts/lib/drift-detector.js` — zero-deps, Node stdlib únicamente.
|
|
28
|
+
|
|
29
|
+
## Cuándo se activa
|
|
30
|
+
|
|
31
|
+
- Manual: desde cualquier script o agente que necesite análisis de degradación.
|
|
32
|
+
- Automático (vía `hooks/lib/etapa-auto-evolucion.js`): el hook ejecuta `ejecutarDriftAutomatico()`
|
|
33
|
+
en cada `SubagentStop` con un throttle de 24 h (configurable con `SWL_DRIFT_THROTTLE_H`).
|
|
34
|
+
Se evalúan los últimos 5 archivos JSONL de trazas. Opt-out total con `SWL_DRIFT_DISABLED=1`.
|
|
35
|
+
- Automático (vía ciclo AGP): `hooks/lib/reflect-classifier.js` expone
|
|
36
|
+
`ejecutarDriftReflect(rutaJsonl, nombreAgente)` como punto de extensión alternativo.
|
|
37
|
+
- Las trazas de agentes viven en `.planning/traces/YYYY-MM-DD.jsonl`.
|
|
38
|
+
|
|
39
|
+
## Exports del módulo
|
|
40
|
+
|
|
41
|
+
```js
|
|
42
|
+
const { detectarDrift, generarLineaTemporal } = require('./scripts/lib/drift-detector');
|
|
43
|
+
```
|
|
44
|
+
|
|
45
|
+
### `detectarDrift(opts)`
|
|
46
|
+
|
|
47
|
+
```js
|
|
48
|
+
detectarDrift({
|
|
49
|
+
rutaJsonl: '/ruta/a/traces.jsonl',
|
|
50
|
+
ventanaDias: 7, // default
|
|
51
|
+
baselineSemanasBase: 4, // default
|
|
52
|
+
umbralPct: 10, // warn si |drift| > 10%
|
|
53
|
+
metricas: ['tokens_promedio_por_sesion', 'tasa_exito_tool', 'tasa_finalizacion_tarea'],
|
|
54
|
+
agente: 'backend-python-swl', // para nudges
|
|
55
|
+
})
|
|
56
|
+
```
|
|
57
|
+
|
|
58
|
+
**Retorna:**
|
|
59
|
+
|
|
60
|
+
```json
|
|
61
|
+
{
|
|
62
|
+
"drifts": [
|
|
63
|
+
{
|
|
64
|
+
"metrica": "tokens_promedio_por_sesion",
|
|
65
|
+
"baseline": 1000,
|
|
66
|
+
"reciente": 2100,
|
|
67
|
+
"driftPct": 110.0,
|
|
68
|
+
"estado": "critico"
|
|
69
|
+
},
|
|
70
|
+
{
|
|
71
|
+
"metrica": "tasa_exito_tool",
|
|
72
|
+
"baseline": 0.9,
|
|
73
|
+
"reciente": 0.85,
|
|
74
|
+
"driftPct": -5.56,
|
|
75
|
+
"estado": "ok"
|
|
76
|
+
}
|
|
77
|
+
],
|
|
78
|
+
"timestamp": "2026-04-19T12:00:00.000Z",
|
|
79
|
+
"estado_global": "critico"
|
|
80
|
+
}
|
|
81
|
+
```
|
|
82
|
+
|
|
83
|
+
**Estados por métrica:**
|
|
84
|
+
|
|
85
|
+
| Condición | Estado |
|
|
86
|
+
|-----------|--------|
|
|
87
|
+
| `abs(driftPct) <= umbralPct` | `ok` |
|
|
88
|
+
| `abs(driftPct) > umbralPct` | `warn` |
|
|
89
|
+
| `abs(driftPct) > umbralPct * 2` | `critico` |
|
|
90
|
+
|
|
91
|
+
**Estado global:** el peor estado entre todas las métricas.
|
|
92
|
+
|
|
93
|
+
### `generarLineaTemporal(opts)`
|
|
94
|
+
|
|
95
|
+
```js
|
|
96
|
+
generarLineaTemporal({
|
|
97
|
+
rutaJsonl: '/ruta/a/traces.jsonl',
|
|
98
|
+
dias: 30, // default
|
|
99
|
+
})
|
|
100
|
+
// → [{ fecha: '2026-04-19', tokens: 3200, exitos: 12, fallos: 1 }, ...]
|
|
101
|
+
```
|
|
102
|
+
|
|
103
|
+
Retorna un array de longitud `dias`, uno por día, para visualización en
|
|
104
|
+
el dashboard o en reportes de salud.
|
|
105
|
+
|
|
106
|
+
## Estructura de eventos esperada en el JSONL
|
|
107
|
+
|
|
108
|
+
El módulo es permisivo: extrae métricas de cualquier campo que coincida.
|
|
109
|
+
|
|
110
|
+
| Métrica | Campos aceptados en el evento |
|
|
111
|
+
|---------|-------------------------------|
|
|
112
|
+
| Tokens | `atributos.tokens_totales`, `tokens`, `total_tokens` |
|
|
113
|
+
| Éxito de tool | `success`, `exito`, `atributos.success` |
|
|
114
|
+
| Finalización de tarea | `estado`, `status`, `atributos.estado` (valores: `OK`, `done`, `completado`) |
|
|
115
|
+
| Timestamp | `timestamp`, `ts`, `inicio`, `created_at` |
|
|
116
|
+
|
|
117
|
+
Formato nativo de `.planning/traces/YYYY-MM-DD.jsonl`:
|
|
118
|
+
|
|
119
|
+
```json
|
|
120
|
+
{"traceId":"...","nombre":"agent:backend-python-swl","inicio":"2026-04-19T10:00:00.000Z","estado":"OK","atributos":{"tokens_totales":1500}}
|
|
121
|
+
```
|
|
122
|
+
|
|
123
|
+
## Integración con el ciclo AGP
|
|
124
|
+
|
|
125
|
+
El operador Reflect (`hooks/lib/reflect-classifier.js`) expone:
|
|
126
|
+
|
|
127
|
+
```js
|
|
128
|
+
const { ejecutarDriftReflect } = require('./hooks/lib/reflect-classifier');
|
|
129
|
+
|
|
130
|
+
const resultado = ejecutarDriftReflect(
|
|
131
|
+
'.planning/traces/2026-04-19.jsonl',
|
|
132
|
+
'backend-python-swl'
|
|
133
|
+
);
|
|
134
|
+
// resultado: { drifts, timestamp, estado_global } o null si módulo no disponible
|
|
135
|
+
```
|
|
136
|
+
|
|
137
|
+
Cuando `estado_global === 'critico'`, el módulo emite automáticamente un nudge
|
|
138
|
+
a `.planning/evolution/nudges.jsonl`:
|
|
139
|
+
|
|
140
|
+
```json
|
|
141
|
+
{
|
|
142
|
+
"timestamp": "2026-04-19T12:00:00.000Z",
|
|
143
|
+
"tipo": "drift-detectado",
|
|
144
|
+
"agente_o_skill": "backend-python-swl",
|
|
145
|
+
"metrica": "tokens_promedio_por_sesion",
|
|
146
|
+
"drift_pct": 110.0,
|
|
147
|
+
"estado": "critico"
|
|
148
|
+
}
|
|
149
|
+
```
|
|
150
|
+
|
|
151
|
+
El agente `auto-evolucion-swl` consume estos nudges para proponer mejoras.
|
|
152
|
+
|
|
153
|
+
## Cómo interpretar los resultados
|
|
154
|
+
|
|
155
|
+
- **`ok`**: métricas estables. Sin acción requerida.
|
|
156
|
+
- **`warn`**: degradación moderada. Revisar en el próximo ciclo de evolución.
|
|
157
|
+
- **`critico`**: degradación severa. Invocar `/swl:evolucionar` con el agente
|
|
158
|
+
identificado. El nudge ya fue emitido — aparecerá en `/swl:status salud`.
|
|
159
|
+
|
|
160
|
+
## Cuándo NO cargar
|
|
161
|
+
|
|
162
|
+
- Se busca detectar regresiones en el código de la aplicación (tests fallando, performance degradada); para eso usar `monitoring-alertas` o el revisor de código correspondiente.
|
|
163
|
+
- El proyecto tiene menos de 7 días de trazas — el baseline de 4 semanas no puede calcularse y `detectarDrift` retornará resultados sin significado estadístico.
|
|
164
|
+
- El ciclo AGP ya tiene configurado el throttle automático de 24 h; invocar el drift manualmente en el mismo intervalo produce el mismo nudge dos veces sin nuevo valor.
|
|
165
|
+
|
|
166
|
+
## Gotchas / Errores comunes no obvios
|
|
167
|
+
|
|
168
|
+
- **Timestamps inválidos en eventos JSONL provocan líneas ignoradas silenciosamente**: el módulo es permisivo con los campos pero si ningún campo de timestamp (`timestamp`, `ts`, `inicio`, `created_at`) tiene una fecha ISO válida, el evento se descarta del cálculo. Causa: eventos generados con timestamps de formato local (ej. `"19/04/2026"`) no pasan la validación. Solución: verificar que todos los eventos JSONL del trace tengan al menos un campo de timestamp en formato ISO 8601 — si el baseline aparece como 0, es el primer síntoma de eventos descartados.
|
|
169
|
+
- **Estado `critico` emitido por baseline con muy pocos eventos**: si el baseline de 4 semanas tiene solo 3 eventos y la ventana de 7 días tiene 8, el `driftPct` de tokens se dispara al 166% cuando en realidad el agente está más activo, no degradado. Causa: el módulo no valida que el baseline tenga suficientes eventos para ser estadísticamente válido. Solución: antes de interpretar un estado `critico`, verificar que el baseline tiene al menos 20 eventos — si no, marcar el resultado como `insufficient-data` en lugar de accionar.
|
|
170
|
+
- **Nudge duplicado en `.planning/evolution/nudges.jsonl` por falta de deduplicación**: el hook se ejecuta dos veces en el mismo `SubagentStop` (por bug de throttle) y emite el mismo nudge dos veces. Causa: el throttle `SWL_DRIFT_THROTTLE_H` no validó correctamente el timestamp del último run. Solución: el archivo `nudges.jsonl` es append-only — antes de emitir un nudge, verificar si el último evento del mismo `agente_o_skill` y `metrica` tiene un timestamp dentro de la ventana de throttle.
|
|
171
|
+
- **`atomicWriteJSON` usado para escribir en nudges.jsonl**: escribir el archivo completo en lugar de hacer append corrompe el historial de nudges previos. Causa: confusión entre archivos de estado mutable (usan `atomicWriteJSON`) y archivos de eventos de alta frecuencia (usan `fs.appendFileSync`). Solución: `nudges.jsonl` es un JSONL de alta frecuencia — siempre usar `fs.appendFileSync(ruta, JSON.stringify(nudge) + '\n')`, nunca reescribir el archivo completo.
|
|
172
|
+
|
|
173
|
+
## Referencia cruzada
|
|
174
|
+
|
|
175
|
+
- Módulo: `scripts/lib/drift-detector.js`
|
|
176
|
+
- Tests: `tests/lib/drift-detector.test.js`
|
|
177
|
+
- Operador Reflect: `hooks/lib/reflect-classifier.js`
|
|
178
|
+
- Ciclo AGP: `.planning/evolution/nudges.jsonl`
|
|
179
|
+
- Origen (adaptado de): `temp/mission-control-main/src/lib/agent-evals.ts` — MIT
|