@saulwade/swl-ses 1.4.2 → 1.5.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
@@ -1,12 +1,12 @@
1
1
  ---
2
2
  name: verificar-trabajo
3
- description: Verificación goal-backward del trabajo ejecutado en 4 niveles progresivos — EXISTE, SUSTANTIVO, CONECTADO, DATOS_FLUYEN. Detecta stubs, componentes huérfanos, integraciones rotas y flujos incompletos. Produce veredictos estructurados JSON con clasificación de riesgo (Low/Medium/High) y evidencia verificable. Soporta loop de reparación cuando el veredicto es Fail.
4
- version: "1.1.1"
3
+ description: Verificación goal-backward del trabajo ejecutado en 4 niveles progresivos — EXISTE, SUSTANTIVO, CONECTADO, DATOS_FLUYEN. Clasifica claims en 4 tipos (TASK, FIX, TEST_OR_BUILD, FEATURE_GO) con evidencia proporcional. Detecta stubs, componentes huérfanos, integraciones rotas y flujos incompletos. Produce veredictos estructurados JSON con clasificación de riesgo (Low/Medium/High) y evidencia verificable. Soporta loop de reparación cuando el veredicto es Fail.
4
+ version: "1.2.0"
5
5
  evolved: true
6
- evolved-from: "1.1.0"
7
- evolved-at: "2026-05-05"
6
+ evolved-from: "1.1.1"
7
+ evolved-at: "2026-05-15"
8
8
  evolved-by: "aprender"
9
- evolved-note: "Gotcha de la sesión SIGM 2026-05-05 (L7): tests + linter no detectan schema-seed drift; cuando el alcance toca BD, Nivel 4 obligatorio con docker compose down -v && up fresco"
9
+ evolved-note: "Taxonomía de claim types adoptada de cc-sdd kiro-verify-completion: cada tipo de claim (TASK/FIX/TEST_OR_BUILD/FEATURE_GO) requiere evidencia distinta. Previene declarar éxito broader que la evidencia disponible."
10
10
  herramientasPermitidas: [Read, Write, Edit, Bash, Glob, Grep]
11
11
  exclusiones:
12
12
  - "No cargar durante la implementación activa de una tarea; la verificación es posterior a la implementación, no concurrente."
@@ -60,6 +60,50 @@ El skill `verificacion-evidencia` tiene el detalle completo de este protocolo.
60
60
 
61
61
  ---
62
62
 
63
+ ## Taxonomía de claims (clasifica ANTES de verificar)
64
+
65
+ El nivel de evidencia requerido depende del tipo de claim que se quiere validar.
66
+ Antes de aplicar los 4 niveles, identifica qué clase de claim estás verificando.
67
+
68
+ Inspirado en `kiro-verify-completion` (cc-sdd) — ver `temp/cc-sdd-main/tools/cc-sdd/templates/agents/claude-code-skills/skills/kiro-verify-completion/SKILL.md`.
69
+
70
+ ### Los 4 tipos de claim
71
+
72
+ | Claim type | Cuándo aplica | Evidencia mínima obligatoria |
73
+ |------------|---------------|-------------------------------|
74
+ | **TASK** | "Esta tarea está completa" — una sub-tarea atómica del PLAN.md | Niveles 1-3; tests locales de la tarea pasan; sin findings de revisor bloqueantes; evidencia alineada al boundary de la tarea |
75
+ | **FIX** | "Este bug está arreglado" — corrección de un defecto reportado | Síntoma original reproducido antes del fix + ya no se reproduce después; sin regresiones en el scope relevante |
76
+ | **TEST_OR_BUILD** | "Los tests pasan" / "el build pasa" — claim mecánico | Output literal del comando + exit code 0; conteo de pass/fail/skipped explícito; NO inferir desde checks no relacionados |
77
+ | **FEATURE_GO** | "Esta feature/fase está lista para producción" — claim de cierre mayor | Suite de tests completa verde + smoke test runtime (la app realmente arranca a estado usable) + cobertura de requisitos evaluada + alineación end-to-end con design + integración cross-task verificada |
78
+
79
+ ### Reglas duras
80
+
81
+ 1. **Identifica el claim type ANTES** de seleccionar evidencia. No reverse-engineer "qué tipo es" desde la evidencia que ya tienes.
82
+ 2. **Rechaza claims más amplios que la evidencia**. Si solo verificaste una tarea (TASK), no puedes emitir FEATURE_GO. Reporta el alcance real.
83
+ 3. **Para TEST_OR_BUILD**: la evidencia es el output del comando, no la inferencia. Si los tests pasan pero hay 47 skipped por preconditions falsas, NO es un Pass limpio — reporta los skipped como riesgo (ver regla `monitor-ci.md` § "verde con N skipped").
84
+ 4. **Para FEATURE_GO**: un test suite verde NO basta. Requiere también smoke runtime, cobertura de requisitos y alineación end-to-end.
85
+ 5. **Si la validación canónica no puede completarse** (sin BD disponible, sin red, sin runtime), retorna `MANUAL_VERIFY_REQUIRED` en lugar de inventar evidencia.
86
+
87
+ ### Mapeo a salidas del veredicto
88
+
89
+ El claim type se incluye en el veredicto estructurado JSON:
90
+
91
+ ```json
92
+ {
93
+ "claim_type": "TASK | FIX | TEST_OR_BUILD | FEATURE_GO",
94
+ "claim_text": "Tarea 3.2 — Crear endpoint POST /facturas",
95
+ "verdict": "VERIFIED | NOT_VERIFIED | MANUAL_VERIFY_REQUIRED",
96
+ "scope_evidence_match": "exact | broader_claim_than_evidence | narrower_claim_than_evidence",
97
+ ...
98
+ }
99
+ ```
100
+
101
+ Si `scope_evidence_match` es `broader_claim_than_evidence`, el verdict se
102
+ degrada automáticamente a `NOT_VERIFIED` con instrucción de re-emitir el
103
+ claim con scope acotado.
104
+
105
+ ---
106
+
63
107
  ## Los 4 niveles de verificación
64
108
 
65
109
  ### Nivel 1 — EXISTE