@saulwade/swl-ses 1.9.0 → 2.1.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (142) hide show
  1. package/CLAUDE.md +196 -196
  2. package/README.md +579 -579
  3. package/agentes/_propose-step.md +90 -0
  4. package/agentes/accesibilidad-wcag-swl.md +3 -3
  5. package/agentes/auto-evolucion-swl.md +908 -908
  6. package/agentes/disenador-ui-swl.md +6 -5
  7. package/agentes/frontend-angular-swl.md +2 -2
  8. package/agentes/frontend-css-swl.md +2 -2
  9. package/agentes/frontend-react-swl.md +4 -4
  10. package/agentes/frontend-swl.md +6 -6
  11. package/agentes/implementador-swl.md +2 -0
  12. package/agentes/investigador-ux-swl.md +5 -5
  13. package/agentes/orquestador-swl.md +9 -7
  14. package/agentes/perfilador-usuario-swl.md +321 -308
  15. package/agentes/producto-prd-swl.md +1 -1
  16. package/agentes/red-team-swl.md +218 -218
  17. package/agentes/tdd-qa-swl.md +17 -1
  18. package/bin/swl-ses.js +1 -1
  19. package/comandos/swl/actualizar.md +1 -1
  20. package/comandos/swl/aprender.md +2 -2
  21. package/comandos/swl/aprobar-plan.md +153 -0
  22. package/comandos/swl/ayuda.md +3 -3
  23. package/comandos/swl/briefing.md +122 -0
  24. package/comandos/swl/compactar.md +29 -2
  25. package/comandos/swl/discutir-fase.md +23 -2
  26. package/comandos/swl/ejecutar-fase.md +59 -6
  27. package/comandos/swl/evolucionar.md +1 -1
  28. package/comandos/swl/inbox.md +1 -1
  29. package/comandos/swl/instalar.md +1 -1
  30. package/comandos/swl/nemesis.md +1 -1
  31. package/comandos/swl/planear-fase.md +19 -1
  32. package/comandos/swl/plugins.md +1 -1
  33. package/comandos/swl/release.md +47 -1
  34. package/comandos/swl/status.md +348 -0
  35. package/comandos/swl/verificar.md +27 -1
  36. package/habilidades/ai-runtime-security/SKILL.md +1 -1
  37. package/habilidades/auto-evolucion-protocolo/SKILL.md +276 -276
  38. package/habilidades/benchmark-memoria/SKILL.md +1 -1
  39. package/habilidades/calidad-contract-testing/SKILL.md +165 -0
  40. package/habilidades/changelog-generator/SKILL.md +9 -2
  41. package/habilidades/changelog-generator/scripts/parse-commits.js +13 -1
  42. package/habilidades/diagrama-arquitectura/SKILL.md +1 -1
  43. package/habilidades/drift-detection/SKILL.md +179 -179
  44. package/habilidades/ejecutar-fase/SKILL.md +541 -468
  45. package/habilidades/estructura-proyecto-claude/SKILL.md +17 -14
  46. package/habilidades/estructura-proyecto-claude/recursos/configuracion-y-extensiones.md +34 -23
  47. package/habilidades/estructura-proyecto-claude/recursos/frontmatter-y-hooks-referencia.md +70 -53
  48. package/habilidades/estructura-proyecto-claude/recursos/mcp-json-template.json +57 -77
  49. package/habilidades/extractor-de-aprendizajes/SKILL.md +9 -5
  50. package/habilidades/harness-claude-code/SKILL.md +10 -7
  51. package/{reglas/harness-claude-code.md → habilidades/harness-claude-code/recursos/disciplina-harness-regla.md} +2 -2
  52. package/habilidades/instalar-sistema/SKILL.md +3 -3
  53. package/habilidades/meta-skills-estandar/recursos/frameworks-seguridad.md +1 -1
  54. package/habilidades/perfil-usuario/SKILL.md +200 -200
  55. package/habilidades/planear-fase/SKILL.md +26 -4
  56. package/habilidades/proceso-ddia-fundamentos/SKILL.md +1 -1
  57. package/habilidades/proceso-ddia-streaming/SKILL.md +4 -4
  58. package/habilidades/proceso-debate-adversarial/SKILL.md +2 -2
  59. package/habilidades/protocolo-revision-swl/SKILL.md +1 -1
  60. package/habilidades/seguridad-skills-ia/SKILL.md +1 -1
  61. package/habilidades/swl-claudemd/SKILL.md +50 -210
  62. package/habilidades/swl-claudemd/recursos/contrato-aprender.md +83 -0
  63. package/habilidades/swl-claudemd/recursos/duplicacion-reglas-globales.md +85 -0
  64. package/habilidades/swl-claudemd/recursos/plantillas-init.md +94 -0
  65. package/habilidades/swl-dashboard/SKILL.md +9 -9
  66. package/habilidades/swl-revisar-impacto/SKILL.md +1 -1
  67. package/habilidades/tdd-workflow/SKILL.md +715 -673
  68. package/habilidades/validacion-ci-sistema/SKILL.md +20 -4
  69. package/hooks/calidad-pre-commit.js +344 -3
  70. package/hooks/check-update.js +39 -1
  71. package/hooks/ciclo-evolucion-subagente.js +26 -0
  72. package/hooks/ciclo-evolucion.js +26 -0
  73. package/hooks/extraccion-aprendizajes.js +13 -0
  74. package/hooks/lib/autonomia.js +208 -0
  75. package/hooks/lib/briefing.js +474 -0
  76. package/hooks/lib/ciclo-evolucion.js +47 -0
  77. package/hooks/{auto-evolucion.js → lib/etapa-auto-evolucion.js} +701 -700
  78. package/hooks/{metricas-evolucion.js → lib/etapa-metricas.js} +388 -376
  79. package/hooks/{actualizar-perfil-usuario.js → lib/etapa-perfil-usuario.js} +376 -364
  80. package/hooks/lib/evolution-tracker.js +24 -3
  81. package/hooks/lib/propose-step.js +357 -0
  82. package/hooks/session-briefing.js +98 -0
  83. package/hooks/spec-gate.js +211 -0
  84. package/hooks/tdd-gate.js +241 -0
  85. package/hooks/telemetria-skill-routing.js +100 -0
  86. package/hooks/validar-intent-spec.js +30 -10
  87. package/instintos/autonomia.yaml +27 -0
  88. package/llms.txt +6 -6
  89. package/manifiestos/hooks-config.json +44 -17
  90. package/manifiestos/modulos.json +40 -15
  91. package/manifiestos/skills-lock.json +64 -57
  92. package/package.json +93 -93
  93. package/plugin.json +371 -375
  94. package/reglas/accesibilidad.md +10 -0
  95. package/reglas/analizar-directorios-antes-de-escribir.md +228 -0
  96. package/reglas/api-diseno.md +9 -0
  97. package/reglas/auditorias-documentales-estructurales.md +7 -0
  98. package/reglas/cloud-infra.md +8 -0
  99. package/reglas/consultar-vault-primero.md +195 -0
  100. package/reglas/debatir-antes-de-aceptar.md +158 -0
  101. package/reglas/fragmentos-compartidos.md +5 -0
  102. package/reglas/git-coauthor.md +100 -0
  103. package/reglas/gobernanza.md +4 -4
  104. package/reglas/hooks.md +6 -0
  105. package/reglas/intent-engineering.md +4 -0
  106. package/reglas/markitdown.md +8 -0
  107. package/reglas/memoria-consolidada.md +1 -1
  108. package/reglas/monitor-ci.md +309 -0
  109. package/reglas/patrones.md +6 -0
  110. package/reglas/registro-componentes-nuevos.md +39 -2
  111. package/reglas/seguridad-agentes.md +1 -1
  112. package/reglas/sesiones-paralelas.md +180 -0
  113. package/reglas/skills-estandar.md +6 -0
  114. package/reglas/testing.md +7 -0
  115. package/reglas/tests-cleanup.md +4 -0
  116. package/reglas/usar-code-review-graph.md +155 -0
  117. package/reglas/usar-sistema-swl.md +1 -1
  118. package/reglas/verificar-citas-normativas.md +548 -0
  119. package/scripts/instalador.js +52 -6
  120. package/scripts/lib/ci-reader.js +193 -0
  121. package/scripts/lib/detectar-host-swl.js +175 -0
  122. package/scripts/lib/evidencia-release.js +322 -0
  123. package/scripts/lib/gate-hooks-requires.js +249 -0
  124. package/scripts/lib/gate-licencias.js +212 -0
  125. package/scripts/lib/git-metricas.js +257 -0
  126. package/scripts/lib/gitignore-manifest.js +29 -1
  127. package/scripts/lib/metricas-dora.js +204 -0
  128. package/scripts/lib/plan-lock.js +275 -0
  129. package/scripts/migrar-fase-dominio.js +0 -1
  130. package/scripts/tui/ejecutores.js +1 -1
  131. package/scripts/validar-manifest.js +92 -1
  132. package/scripts/verificar-evolucion.js +54 -4
  133. package/scripts/verificar-release.js +102 -0
  134. package/scripts/verificar-trazabilidad.js +298 -0
  135. package/agentes/ux-disenador-swl.md +0 -503
  136. package/comandos/swl/dashboard.md +0 -146
  137. package/comandos/swl/evolucion-estado.md +0 -191
  138. package/comandos/swl/metricas.md +0 -376
  139. package/comandos/swl/salud.md +0 -481
  140. package/reglas/arquitectura.evolved.json +0 -7
  141. package/reglas/seguridad.evolved.json +0 -7
  142. package/reglas/verificar-citas-temporales.md +0 -139
@@ -1,673 +1,715 @@
1
- ---
2
- name: tdd-workflow
3
- description: Flujo completo de Test-Driven Development. Ciclo RED (el test falla) → GREEN (implementación mínima) → REFACTOR (limpieza). Incluye cobertura mínima obligatoria, tests de frontera, factories, fixtures y estrategias para diferentes tipos de código (APIs, services, componentes Angular).
4
- version: "1.1.0"
5
- evolved: true
6
- evolved-from: "1.0.4"
7
- evolved-at: "2026-05-16"
8
- evolved-by: "aprender"
9
- evolved-note: "v1.0.5: gotcha 'Tests E2E de CLIs interactivos sin PTY real'. Origen M2 sesión 2026-05-16 — harness TTY mockeado en swl-ses v1.6.0 que evita instalar node-pty. v1.0.4: silenced tests por race en path único compartido + anti-patrón `if (X) assert(Y)` sin else. v1.0.3: gotcha cwd cacheado al require()."
10
- herramientasPermitidas: [Read, Bash]
11
- evolvable: true # default para skill estandar
12
- exclusiones:
13
- - "No cargar para escribir tests de regresión sobre código legacy sin suite existente — en código legacy sin tests, comenzar con caracterización de comportamiento actual antes del ciclo TDD."
14
- - "No cargar para pruebas de carga o performance testing — para benchmarks y load testing cargar `performance-baseline`."
15
- - "No cargar para configurar pipelines de CI/CD o runners de tests en GitHub Actions / GitLab CI — para configuración de CI cargar el skill de cloud correspondiente."
16
- - "No cargar para pruebas de seguridad o fuzzing automático — para testing de seguridad cargar `threat-model-lite` y usar herramientas especializadas (Bandit, OWASP ZAP)."
17
- ---
18
- # Habilidad: TDD Workflow Completo
19
-
20
- ## Cuándo NO cargar
21
-
22
- - La tarea es añadir tests a código legacy sin suite existente: comenzar con tests de caracterización del comportamiento actual antes del ciclo TDD.
23
- - La tarea es pruebas de carga o benchmarks: cargar `performance-baseline`.
24
- - La tarea es configurar CI/CD pipelines: cargar el skill de cloud correspondiente.
25
- - La tarea es fuzzing o testing de seguridad: cargar `threat-model-lite` y usar herramientas especializadas.
26
-
27
- ## Propósito
28
-
29
- TDD no es "escribir tests después" ni "escribir tests antes por costumbre". Es
30
- un método de diseño donde los tests guían la API pública del código antes de
31
- que exista la implementación. El resultado es código que hace exactamente lo
32
- que los tests exigen — ni más, ni menos.
33
-
34
- ## Cuándo activar
35
-
36
- - CONTEXT.md o PLAN.md indica que la fase requiere TDD
37
- - Se implementa lógica de negocio crítica (cálculos, validaciones, permisos)
38
- - El usuario pide explícitamente TDD
39
- - Se trabaja en un módulo con historial de bugs
40
-
41
- ---
42
-
43
- ## Etapa opcional previa: Gherkin (BDD) y gate de mutación
44
-
45
- Dos extensiones opt-in del ciclo, ambas con guía completa en recursos:
46
-
47
- - **Antes del ciclo** — si la fase tiene criterios de aceptación de negocio,
48
- convertirlos en escenarios Given–When–Then validados por el usuario ANTES de
49
- implementar; cada escenario es el test RED de su criterio. Guía, runners por
50
- stack y anti-patrones en [recursos/gherkin-bdd.md](recursos/gherkin-bdd.md).
51
- - **Después del ciclo** — en módulos críticos, verificar la calidad de los
52
- asserts con mutation testing incremental sobre el diff:
53
- `Skill("calidad-mutation-testing")`. La cobertura mide ejecución; los
54
- mutantes sobrevivientes miden si los tests detectarían un bug.
55
-
56
- ## El ciclo fundamental RED → GREEN → REFACTOR
57
-
58
- ### Fase RED — El test debe fallar por la razón correcta
59
-
60
- **Paso 1**: Escribir el test que describe el comportamiento esperado.
61
-
62
- ```python
63
- # RED: Este test falla porque calcular_descuento no existe todavía
64
- def test_descuento_cliente_premium_es_15_porciento():
65
- cliente = ClienteFactory(tipo="premium")
66
- resultado = calcular_descuento(cliente, monto=100.0)
67
- assert resultado == 15.0
68
- ```
69
-
70
- **Verificar que el test falla BIEN**:
71
- - Falla con `NameError` o `ImportError` si la función no existe: CORRECTO
72
- - Falla con `AssertionError` si el comportamiento es incorrecto: CORRECTO
73
- - Falla con `TypeError` si la firma es incorrecta: CORRECTO
74
- - Pasa sin que exista implementación: SEÑAL DE ALARMA — el test no prueba nada
75
-
76
- **NUNCA avanzar a GREEN si el test pasa en RED.**
77
-
78
- ### Fase GREENImplementación mínima
79
-
80
- **Regla de oro**: Implementar solo lo que hace pasar el test. Nada más.
81
-
82
- ```python
83
- # GREEN: Implementación mínima que hace pasar el test
84
- def calcular_descuento(cliente: Cliente, monto: float) -> float:
85
- if cliente.tipo == "premium":
86
- return monto * 0.15
87
- return 0.0
88
- ```
89
-
90
- **Anti-patrón GREEN**: implementar todos los casos de una vez sin tests que los
91
- exijan. Si no hay un test para clientes "gold", no implementes el descuento gold.
92
-
93
- **Verificar**: `pytest -v test_descuentos.py` pasa con el test nuevo.
94
-
95
- ### Fase REFACTOR Limpieza sin cambiar comportamiento
96
-
97
- **Qué refactorizar en esta fase**:
98
- - Nombres de variables o funciones poco claros
99
- - Duplicación de lógica (si ya existe en otro test)
100
- - Magic numbers que deberían ser constantes
101
- - Estructura de código que anticipa el próximo test
102
-
103
- ```python
104
- # REFACTOR: Extraer constante y mejorar legibilidad
105
- DESCUENTO_POR_TIPO = {
106
- "premium": 0.15,
107
- "gold": 0.20,
108
- "standard": 0.0,
109
- }
110
-
111
- def calcular_descuento(cliente: Cliente, monto: float) -> float:
112
- tasa = DESCUENTO_POR_TIPO.get(cliente.tipo, 0.0)
113
- return monto * tasa
114
- ```
115
-
116
- **Verificar**: todos los tests siguen pasando después del refactor.
117
-
118
- ---
119
-
120
- ## Tests de frontera (boundary tests)
121
-
122
- Para toda función que procesa datos, escribir tests de:
123
-
124
- | Tipo de frontera | Ejemplo |
125
- |----------------|---------|
126
- | Valor cero | `monto=0.0` |
127
- | Valor negativo | `monto=-100.0` |
128
- | Valor máximo | `monto=999_999_999.99` |
129
- | String vacío | `nombre=""` |
130
- | None / null | `cliente=None` |
131
- | Lista vacía | `items=[]` |
132
- | Un solo elemento | `items=[item]` |
133
- | Muchos elementos | `items=lista_de_10000` |
134
- | Valor fuera de dominio | `tipo="inexistente"` |
135
- | Caracteres especiales | `nombre="<script>alert(1)</script>"` |
136
-
137
- ---
138
-
139
- ## Factories y Fixtures
140
-
141
- ### Factories (para datos de test)
142
-
143
- Las factories crean objetos con valores válidos por defecto. Los tests solo
144
- sobreescriben lo que importa para ese test específico.
145
-
146
- **Python con factory_boy**:
147
- ```python
148
- import factory
149
- from myapp.models import Cliente, Pedido
150
-
151
- class ClienteFactory(factory.Factory):
152
- class Meta:
153
- model = Cliente
154
-
155
- id = factory.Sequence(lambda n: f"cliente-{n}")
156
- nombre = factory.Faker("name", locale="es_MX")
157
- email = factory.Faker("email")
158
- tipo = "standard" # default explícito
159
- activo = True
160
-
161
- # Uso en test
162
- def test_descuento_premium():
163
- # Solo especificar lo que importa para este test
164
- cliente = ClienteFactory(tipo="premium")
165
- assert calcular_descuento(cliente, 100.0) == 15.0
166
- ```
167
-
168
- **TypeScript con factory functions**:
169
- ```typescript
170
- // factories/user.factory.ts
171
- export const createUser = (overrides: Partial<User> = {}): User => ({
172
- id: 'user-1',
173
- name: 'Test User',
174
- email: 'test@example.com',
175
- role: 'standard',
176
- active: true,
177
- ...overrides,
178
- });
179
-
180
- // Uso en test
181
- it('should show admin panel for admin users', () => {
182
- const user = createUser({ role: 'admin' });
183
- // ...
184
- });
185
- ```
186
-
187
- ### Fixtures (para estado persistente)
188
-
189
- ```python
190
- # conftest.py
191
- import pytest
192
- from sqlalchemy.ext.asyncio import AsyncSession
193
-
194
- @pytest.fixture
195
- async def db_session():
196
- """Sesión de BD en transacción que hace rollback al terminar."""
197
- async with AsyncSessionLocal() as session:
198
- async with session.begin():
199
- yield session
200
- await session.rollback()
201
-
202
- @pytest.fixture
203
- async def cliente_premium(db_session: AsyncSession):
204
- """Cliente premium persistido en BD de test."""
205
- cliente = ClienteFactory.build(tipo="premium")
206
- db_session.add(cliente)
207
- await db_session.flush()
208
- return cliente
209
- ```
210
-
211
- ---
212
-
213
- ## TDD por tipo de código
214
-
215
- ### Services (lógica de negocio)
216
-
217
- ```python
218
- # Orden de tests para un service nuevo:
219
- # 1. Caso feliz principal
220
- # 2. Validaciones de input inválido
221
- # 3. Casos de borde del dominio
222
- # 4. Interacciones con dependencias (mocks)
223
-
224
- @pytest.mark.asyncio
225
- async def test_crear_pedido_valida_stock_disponible():
226
- producto = ProductoFactory(stock=5)
227
- with pytest.raises(StockInsuficienteError):
228
- await PedidoService.crear(producto_id=producto.id, cantidad=10)
229
- ```
230
-
231
- ### Endpoints FastAPI
232
-
233
- ```python
234
- # Usar TestClient de FastAPI
235
- from fastapi.testclient import TestClient
236
-
237
- def test_endpoint_requiere_autenticacion():
238
- response = client.get("/api/v1/pedidos")
239
- assert response.status_code == 401
240
-
241
- def test_endpoint_retorna_solo_pedidos_del_usuario(cliente_autenticado):
242
- pedido_propio = PedidoFactory(usuario_id=cliente_autenticado.id)
243
- pedido_ajeno = PedidoFactory(usuario_id="otro-usuario")
244
-
245
- response = cliente_autenticado.get("/api/v1/pedidos")
246
- ids = [p["id"] for p in response.json()["items"]]
247
-
248
- assert pedido_propio.id in ids
249
- assert pedido_ajeno.id not in ids # IDOR check
250
- ```
251
-
252
- ### Componentes Angular
253
-
254
- ```typescript
255
- // Usar TestBed + ComponentHarness
256
- describe('PedidosComponent', () => {
257
- it('should display empty state when no orders exist', async () => {
258
- const mockService = { getPedidos: () => of({ items: [], total: 0 }) };
259
- await TestBed.configureTestingModule({
260
- providers: [{ provide: PedidosService, useValue: mockService }]
261
- }).compileComponents();
262
-
263
- const fixture = TestBed.createComponent(PedidosComponent);
264
- fixture.detectChanges();
265
-
266
- const emptyState = fixture.nativeElement.querySelector('[data-testid="empty-state"]');
267
- expect(emptyState).toBeTruthy();
268
- });
269
- });
270
- ```
271
-
272
- ---
273
-
274
- ## Cobertura mínima obligatoria
275
-
276
- | Tipo de módulo | Cobertura mínima |
277
- |---------------|-----------------|
278
- | Services (lógica crítica) | 90% |
279
- | Endpoints (API) | 85% |
280
- | Utilities / helpers | 95% |
281
- | Componentes Angular | 75% |
282
- | Modelos ORM | 70% |
283
-
284
- **Verificar** con reporte de cobertura antes de marcar tarea como completada:
285
- ```bash
286
- pytest --cov=src/services --cov-fail-under=90
287
- ```
288
-
289
- ---
290
-
291
- ## Anti-patrones TDD a evitar
292
-
293
- | Anti-patrón | Descripción | Solución |
294
- |-------------|-------------|---------|
295
- | Test del mock | El test solo verifica que se llamó el mock, no el comportamiento real | Testear el efecto observable |
296
- | Test omnibus | Un solo test que verifica 10 cosas a la vez | Un test, un comportamiento |
297
- | Test frágil | Falla si cambias nombres internos sin cambiar comportamiento | Testear comportamiento, no implementación |
298
- | Fixture global | Un fixture que modifica estado global compartido entre tests | Fixtures con scope limitado, rollback |
299
- | Skip como solución | `@pytest.mark.skip` para tests que fallan | Arreglar el bug o eliminar el test |
300
-
301
- ---
302
-
303
- ## Gotchas / Errores comunes no obvios
304
-
305
- **El ciclo TDD se rompe cuando el test en fase RED pasa sin implementación porque la función ya existe con otro nombre en el módulo y Python la importa silenciosamente desde un namespace diferente**: escribir `from app.services import calcular_descuento` en el test cuando `calcular_descuento` ya existe en `app.utils` (importada en `__init__.py`) hace que el test pase en RED sin error, invalidando el ciclo. Causa: los imports con `from app.services import *` en `__init__.py` pueden re-exportar funciones de submódulos, haciendo que el test encuentre una implementación inesperada. Fix: verificar con `python -c "from app.services import calcular_descuento; print(calcular_descuento.__module__)"` que el símbolo viene del módulo correcto. Usar imports explícitos en los tests (`from app.services.descuentos import calcular_descuento`) en lugar de imports de paquete.
306
-
307
- **`pytest.mark.asyncio` con `asyncio_mode = "auto"` en `pytest.ini` hace que fixtures síncronos que retornan coroutines sean llamados sin `await`, causando que el fixture entregue un objeto coroutine en lugar del valor esperado**: un fixture `def cliente_premium(db_session)` que retorna `ClienteFactory.build(tipo="premium")` funciona, pero si accidentalmente se define como `async def cliente_premium(db_session)` y se usa en un test síncrono, pytest lo trata como fixture síncrono y el test recibe el objeto coroutine. Causa: la mezcla de fixtures `async def` y `def` en el mismo `conftest.py` con `asyncio_mode = "auto"` puede crear comportamientos inesperados dependiendo de la versión de `pytest-asyncio`. Fix: en proyectos async, definir TODOS los fixtures relevantes como `async def` explícitamente y verificar que el test use `@pytest.mark.asyncio` o tenga el modo auto configurado correctamente.
308
-
309
- **La fase REFACTOR del ciclo TDD en componentes Angular introduce regresiones silenciosas cuando se extrae lógica a un `computed()` pero el template sigue usando la función directa que ahora devuelve `undefined`**: refactorizar `getTotal()` como método del componente hacia `total = computed(() => ...)` y olvidar actualizar el template de `{{ getTotal() }}` a `{{ total() }}` no genera error de compilación con Angular 17+; el template simplemente muestra `undefined`. Causa: Angular no verifica en tiempo de compilación que los métodos referenciados en templates existen en la clase si el template usa la sintaxis de interpolación sin type-checking estricto. Fix: activar `strictTemplates: true` en `tsconfig.app.json` para que el compilador de Angular valide que todas las referencias en templates corresponden a miembros públicos del componente. Ejecutar `ng build` antes de considerar el REFACTOR completo.
310
-
311
- **`db_session.rollback()` en el fixture de pytest-asyncio no deshace los datos insertados por `db.flush()` dentro de la función testeada cuando la sesión usa `autocommit=True` implícito por configuración del engine**: algunos proyectos configuran `AsyncEngine` con `isolation_level="AUTOCOMMIT"` para compatibilidad con operaciones DDL; en ese contexto, cada `flush()` hace commit inmediatamente y el `rollback()` del fixture no puede deshacer esos cambios. Causa: `AUTOCOMMIT` en PostgreSQL significa que no hay transacción activa que se pueda revertir. Fix: verificar que el engine de tests NO use `isolation_level="AUTOCOMMIT"` (la configuración debe ser solo para el engine de migraciones Alembic, no para el de la app). Para tests que necesitan AUTOCOMMIT por alguna razón, usar una BD de test separada que se trunca con `TRUNCATE ... RESTART IDENTITY CASCADE` en el teardown del fixture.
312
-
313
- **Reloj inyectable como parámetro `ahora` habilita tests deterministas sin `freezegun`, `jest.useFakeTimers()` ni `sinon.useFakeTimers()`** [PATRÓN VALIDADO en SWL Opción C webhook]: cuando una API depende del tiempo (rate-limit con bucket que se rellena, dedup con ventana de retención, cache con TTL, schedulers), recibir el timestamp por parámetro en lugar de llamar `Date.now()` internamente permite que los tests pasen 1000 segundos en 0 ms reales. Diseño: `metodo(arg1, arg2, ahora = Date.now())` — producción no cambia (llamadas siguen siendo `obj.consumir(1)`), tests pasan `ahora` explícito (`obj.consumir(1, T0 + 5000)`). Validado en 3 módulos esta sesión: `rate-limit-ip.js` (40+ tests bucket refill, capacidad, cleanup), `webhook-dedup.js` (ventana de retención, rotación idempotente), helpers internos de `webhook-server.js`. Ningún test usa `sleep`, ningún test es flaky, ningún test mockea `Date`. Aplicable a JS/TS y a Python (`def consumir(self, tokens, ahora=None)` con `ahora = ahora or datetime.now(UTC)` al inicio).
314
-
315
- ```js
316
- // MAL test no-determinista, requiere sleep o mock global
317
- class Bucket {
318
- consumir(n) {
319
- const ahora = Date.now(); // ← imposible de controlar desde el test
320
- this._rellenar(ahora);
321
- if (this.tokens >= n) { this.tokens -= n; return true; }
322
- return false;
323
- }
324
- }
325
-
326
- // BIEN reloj inyectable, test determinista
327
- class Bucket {
328
- consumir(n, ahora = Date.now()) { // ← default en producción, inyectable en test
329
- this._rellenar(ahora);
330
- if (this.tokens >= n) { this.tokens -= n; return true; }
331
- return false;
332
- }
333
- }
334
-
335
- // En el test:
336
- const T0 = 1700000000000;
337
- const b = new Bucket(10, 1, T0);
338
- for (let i = 0; i < 10; i++) b.consumir(1, T0); // saturar
339
- assert.equal(b.consumir(1, T0), false); // sin refill aún
340
- assert.equal(b.consumir(5, T0 + 5000), true); // 5 seg después: 5 tokens
341
- ```
342
-
343
- Aplica también a tests de clock skew (tiempo retrocede por NTP): pasar `T0 - 1000` y validar que la lógica no rompe. Origen: rate-limit-ip.js + webhook-dedup.js sesión 2026-05-13.
344
-
345
- **Tests nombrados por feature (`test_emitir_factura_exitosa`) pierden poder regresivo; nombrados por causa raíz (`test_repository_no_usa_columna_inexistente_p_monto`) detectan regresiones específicas sin reproducción manual** [CONFIRMADO en SIGM Opción C F1.4]: cuando se descubre un bug por una causa raíz concreta (typo en nombre de columna SQL, omisión de `selectinload`, mock que devuelve dict en vez de objeto, schema obsoleto), el test de regresión que se escribe debe llevar el nombre de la causa, no del feature afectado. Caso real: durante F1.4 de SIGM, el repository de pagos referenciaba `p.monto` cuando la columna se llamaba `p.monto_pagado`; el test escrito como `test_repository_no_usa_columna_inexistente_p_monto` falló inmediatamente en la siguiente sesión cuando otro agente reintrodujo el typo, sin necesidad de reproducir el escenario de negocio (emitir cobro real, verificar respuesta). Causa: los nombres orientados a feature (`test_pago_exitoso`) son ambiguos sobre QUÉ falla — si el test falla, el desarrollador debe diagnosticar; los nombres orientados a causa raíz (`test_X_no_usa_Y`, `test_query_incluye_selectinload_Z`, `test_service_devuelve_dict_no_objeto`) son auto-diagnósticos. Fix: para cada bug que cueste >30 min diagnosticar, escribir UN test adicional cuyo nombre describa la condición técnica violada, no el escenario de negocio. Convención: `test_<componente>_<condicion_tecnica>` o `test_<componente>_no_<anti_patron>`. Estos tests son tu segunda línea de defensa contra regresiones de la misma causa raíz, complementarios a los tests de comportamiento.
346
-
347
- **`process.cwd()` cacheado al `require()` rompe tests con `process.chdir(sandbox)`** [PATRÓN GENÉRICO TESTING CLI]: scripts Node exportables que leen `process.cwd()` en el scope del módulo (al cargar) congelan el cwd al directorio de invocación. Los tests que crean sandboxes con `fs.mkdtempSync()` y luego `process.chdir(sandbox)` no afectan al cwd cacheado — el script sigue leyendo del cwd original y los assertions fallan con paths inesperados. Caso real (swl-ses `scripts/derivar-feature-list.js` 2026-05-15): la función `enriquecerDesdeFases(fases)` leía `const CWD = process.cwd()` calculado al `require()`; 2 tests con `process.chdir(sandbox)` retornaron `[]` en lugar de detectar el PLAN.md fixture. Causa: el constante se evaluó cuando el `node --test` cargó el módulo desde el cwd del proyecto, no desde el sandbox del test individual. Fix obligatorio: funciones exportables deben aceptar `cwd` como parámetro opcional con fallback dinámico (`function fn(args, opciones = {}) { const cwd = opciones.cwd || process.cwd(); ... }`). El código de producción no cambia (sin args extras), pero los tests pueden inyectar el cwd correcto. Aplica también a Python (`def fn(args, cwd: str | None = None): cwd = cwd or os.getcwd()`) y a cualquier lenguaje con tests que usen chdir.
348
-
349
- ```js
350
- // MAL — cwd cacheado al require, tests con process.chdir() fallan
351
- const CWD = process.cwd();
352
- const PLANNING_DIR = path.join(CWD, '.planning');
353
-
354
- function enriquecerDesdeFases(fases) {
355
- const archivos = fs.readdirSync(path.join(PLANNING_DIR, 'fases')); // cwd congelado
356
- // ...
357
- }
358
-
359
- // BIEN — cwd dinámico con parámetro opcional para tests
360
- function enriquecerDesdeFases(fases, opciones = {}) {
361
- const cwd = opciones.cwd || process.cwd(); // recalcula al llamar
362
- const archivos = fs.readdirSync(path.join(cwd, '.planning', 'fases'));
363
- // ...
364
- }
365
-
366
- // En el test (usa setupSandboxes — regla tests-cleanup.md):
367
- const { setupSandboxes } = require('../_helpers/sandbox');
368
- const sandboxes = setupSandboxes('swl-test-');
369
-
370
- const sandbox = sandboxes.create();
371
- fs.mkdirSync(path.join(sandbox, '.planning', 'fases'), { recursive: true });
372
- // Opción A: pasar cwd explícito (recomendado)
373
- const r = enriquecerDesdeFases([], { cwd: sandbox });
374
- // Opción B: process.chdir() — solo funciona con cwd dinámico
375
- process.chdir(sandbox);
376
- const r2 = enriquecerDesdeFases([]);
377
- // Cleanup automático al final del archivo vía after() registrado por setupSandboxes.
378
- ```
379
-
380
- ---
381
-
382
- ## Gotcha: silenced tests por race condition sobre estado compartido
383
-
384
- ### El anti-patrón
385
-
386
- ```javascript
387
- // MAL assertion condicional dentro de if que puede ser false por race
388
- const FLAG = path.join(os.tmpdir(), 'mi-app.json');
389
-
390
- test('flag sin contenido emite warning', () => {
391
- borrarFlag();
392
- const res = correrSubproceso();
393
- if (fs.existsSync(FLAG)) { // ← otro test paralelo creó el flag
394
- assert.match(res.stdout, /WARN/); // ← NUNCA se ejecuta si el if es false
395
- }
396
- // sin else → test PASA sin haber validado nada
397
- });
398
-
399
- // El test "verde" no significa "pasó" — significa "no falló ninguna assertion".
400
- // Si la assertion vive dentro de un `if (race)`, una race favorable la salta
401
- // y el test es vacío.
402
- ```
403
-
404
- ### Por qué pasa
405
-
406
- `node:test` paraleliza **archivos** `.test.js` por default (no tests dentro
407
- del mismo archivo). Si dos archivos tocan el mismo path único de filesystem
408
- (`/tmp/foo.json`, lockfiles, sockets), las operaciones se intercalan no
409
- deterministamente. Patrones típicos:
410
-
411
- - Archivo A: `borrarFlag()` → spawn subprocess → assert
412
- - Archivo B: spawn subprocess → `crearFlag()` durante A → assert de A condicionado falla
413
-
414
- ### Patrones correctos
415
-
416
- **Patrón 1Aislamiento por path único** (recomendado):
417
-
418
- ```javascript
419
- const { setupSandboxes } = require('../_helpers/sandbox');
420
- const sandboxes = setupSandboxes('swl-mi-app-test-');
421
- const env = { ...process.env };
422
-
423
- // Path único por test usando el helper canónico (regla tests-cleanup.md).
424
- // El cleanup es automático al final del archivo vía after() registrado.
425
- const dir = sandboxes.create();
426
- env.MI_APP_FLAG_PATH = path.join(dir, 'flag.json');
427
-
428
- const res = spawnSync('node', [BIN], { env, ... });
429
-
430
- // Ahora el assert es incondicional — el path es del test, no compartido
431
- assert.match(res.stdout, /WARN/);
432
- ```
433
-
434
- Requiere que el SUT (System Under Test) honre una env var para override
435
- del path. Si no la honra, agregar el override es parte del fix.
436
-
437
- **Patrón 2 — Serialización forzada** (cuando el path es hardcoded):
438
-
439
- ```bash
440
- # Forzar --test-concurrency=1 en la suite completa
441
- node --test --test-concurrency=1 tests/
442
- ```
443
-
444
- Tradeoff: tests más lentos pero deterministas. Aceptable si el aislamiento
445
- no es factible (legacy code).
446
-
447
- **Patrón 3 — assertions incondicionales** con setup determinista:
448
-
449
- ```javascript
450
- // MAL
451
- if (fs.existsSync(FLAG)) assert.match(...)
452
-
453
- // BIEN setup garantiza la precondición, assertion no se salta
454
- escribirFlag({ ... });
455
- assert.ok(fs.existsSync(FLAG), 'precondición del test'); // ← assertion sobre el setup
456
- const res = correrSubproceso();
457
- assert.match(res.stdout, /WARN/); // ← assertion incondicional sobre el resultado
458
- ```
459
-
460
- ### Anti-patrón: `if (X) assert(Y)` sin `else`
461
-
462
- ```javascript
463
- // MAL un test que pasa silenciosamente cuando X es false
464
- test('hace algo', () => {
465
- const algo = obtenerAlgo();
466
- if (algo) { // race u otra fuente de no-determinismo
467
- assert.equal(algo.valor, 42);
468
- }
469
- // sin else → veredicto "pass" sin haber validado nada
470
- });
471
-
472
- // BIEN el setup garantiza la precondición o el test falla explícito
473
- test('hace algo', () => {
474
- const algo = obtenerAlgo();
475
- assert.ok(algo, 'precondición: obtenerAlgo debe devolver valor');
476
- assert.equal(algo.valor, 42);
477
- });
478
- ```
479
-
480
- **Regla**: una assertion dentro de un `if` sin `else` es **un test que
481
- puede pasar sin validar nada**. Estos "silenced tests" son la peor clase
482
- de falsa cobertura: el reporter dice "pass" y nadie revisa el código
483
- hasta que un bug llega a producción.
484
-
485
- ### Detección
486
-
487
- - Buscar `if (` dentro de cuerpos de `test(...)`/`it(...)` sin `else { fail() }`
488
- o `else { assert(...) }` correspondiente.
489
- - Si el cuerpo del `if` contiene `assert.*`, considerarlo silenced test
490
- hasta que se demuestre que el `if` no puede ser false en ningún escenario.
491
-
492
- ### Origen
493
-
494
- Detectado en sesión 2026-05-16 del proyecto swl-ses (PR #30): tests del
495
- flag `swl-ses-update-check.json` compartido entre dos archivos `.test.js`
496
- paralelos. El test "sin flag → debe advertir" pasaba en CI cuando otro
497
- archivo creaba el flag, sin ejecutar ninguna assertion. Fix: env var
498
- `SWL_UPDATE_FLAG_PATH` para aislamiento + assertions incondicionales.
499
-
500
- ---
501
-
502
- ## Tests E2E de CLIs interactivos sin PTY real
503
-
504
- ### El problema
505
-
506
- Probar un CLI interactivo (TUI con `readline`, prompts, keypress events,
507
- `process.stdin.isTTY`) en CI requiere normalmente un **pseudo-terminal
508
- emulado** (PTY) usualmente vía `node-pty`, una dependencia **nativa** que:
509
-
510
- - Requiere compilación de extensiones C++ al instalar (puede fallar en
511
- contenedores minimal o en Windows sin Visual Studio Build Tools).
512
- - Agrega ~5 MB al `node_modules` por imagen.
513
- - Hace que el test suite no corra en `npm test` sin setup extra.
514
-
515
- Para CLIs interactivos donde no se necesita probar **el comportamiento
516
- real del terminal** (escape codes, redibujado, scroll), sino solo la
517
- **lógica del wizard** (¿qué pasa si el usuario presiona Esc en el paso 3?,
518
- ¿qué resuelve el promise tras Enter con default?), un harness TTY mockeado
519
- cubre ~90% de los casos sin dep nativa.
520
-
521
- ### Patrón del harness
522
-
523
- ```javascript
524
- // tests/harness-tty.js
525
- 'use strict';
526
-
527
- const readline = require('readline');
528
-
529
- function crearHarness() {
530
- // 1. Capturar estado original para restauración
531
- const stdoutOriginal = process.stdout.write.bind(process.stdout);
532
- const isTtyStdoutOriginal = process.stdout.isTTY;
533
- const isTtyStdinOriginal = process.stdin.isTTY;
534
- const setRawModeOriginal = process.stdin.setRawMode
535
- ? process.stdin.setRawMode.bind(process.stdin) : null;
536
- const emitKeypressOriginal = readline.emitKeypressEvents;
537
-
538
- let capturado = '';
539
- let listenersKeypress = [];
540
-
541
- // 2. Forzar TTY antes de cargar módulos UI (que evalúan ES_TTY al require)
542
- Object.defineProperty(process.stdout, 'isTTY', { value: true, configurable: true });
543
- Object.defineProperty(process.stdin, 'isTTY', { value: true, configurable: true });
544
-
545
- // 3. Capturar stdout en string buffer
546
- process.stdout.write = (chunk) => {
547
- capturado += typeof chunk === 'string' ? chunk : chunk.toString();
548
- return true;
549
- };
550
-
551
- // 4. Mockear setRawMode/resume/pause como no-op (evita tomar control del terminal de test)
552
- process.stdin.setRawMode = () => process.stdin;
553
- process.stdin.resume = () => process.stdin;
554
- process.stdin.pause = () => process.stdin;
555
-
556
- // 5. Interceptar registros de 'keypress' para poder emitirlos a mano
557
- const onListenerOriginal = process.stdin.on.bind(process.stdin);
558
- process.stdin.on = (evento, listener) => {
559
- if (evento === 'keypress') listenersKeypress.push(listener);
560
- return onListenerOriginal(evento, listener);
561
- };
562
-
563
- // 6. Mockear readline.emitKeypressEvents (no necesita stdin real)
564
- readline.emitKeypressEvents = (stream) => stream;
565
-
566
- // 7. Limpiar require cache de módulos UI para que se evalúen con TTY=true
567
- delete require.cache[require.resolve('../scripts/tui/lib/render')];
568
-
569
- function cargarUI() {
570
- return require('../scripts/tui/lib/render');
571
- }
572
-
573
- // 8. Emitir keypress programáticamente
574
- function tecla(nombre, extras = {}) {
575
- const key = { name: nombre, ctrl: false, meta: false, shift: false, ...extras };
576
- const str = nombre.length === 1 ? nombre : '';
577
- for (const listener of [...listenersKeypress]) {
578
- try { listener(str, key); } catch (_) { /* swallow */ }
579
- }
580
- }
581
-
582
- // 9. Esperar N ticks del event loop para promesas internas
583
- function esperarTicks(n = 1) {
584
- let p = Promise.resolve();
585
- for (let i = 0; i < n; i++) p = p.then(() => undefined);
586
- return p;
587
- }
588
-
589
- function captura(opts = {}) {
590
- const valor = capturado;
591
- if (opts.limpiar) capturado = '';
592
- return valor;
593
- }
594
-
595
- function restaurar() {
596
- Object.defineProperty(process.stdout, 'isTTY', { value: isTtyStdoutOriginal, configurable: true });
597
- Object.defineProperty(process.stdin, 'isTTY', { value: isTtyStdinOriginal, configurable: true });
598
- process.stdout.write = stdoutOriginal;
599
- if (setRawModeOriginal) process.stdin.setRawMode = setRawModeOriginal;
600
- process.stdin.on = onListenerOriginal;
601
- readline.emitKeypressEvents = emitKeypressOriginal;
602
- listenersKeypress = [];
603
- // Limpiar require cache para no contaminar otros tests
604
- delete require.cache[require.resolve('../scripts/tui/lib/render')];
605
- }
606
-
607
- return { cargarUI, tecla, esperarTicks, captura, restaurar };
608
- }
609
-
610
- module.exports = { crearHarness };
611
- ```
612
-
613
- ### Uso típico
614
-
615
- ```javascript
616
- const test = require('node:test');
617
- const assert = require('node:assert/strict');
618
- const { crearHarness } = require('./harness-tty');
619
-
620
- test('preguntarSiNo con harness: Enter resuelve con default true', async () => {
621
- const h = crearHarness();
622
- try {
623
- const ui = h.cargarUI();
624
- const promesa = ui.preguntarSiNo('test prompt', true);
625
-
626
- await h.esperarTicks(2);
627
- h.tecla('return');
628
-
629
- const timeout = new Promise((_, reject) =>
630
- setTimeout(() => reject(new Error('no resolvió en 500ms')), 500));
631
-
632
- const r = await Promise.race([promesa, timeout]).catch(() => null);
633
- // r === true si el harness simuló bien; null si readline real bloquea
634
- // (caso esperado en Windows sin PTY real; documentar limitación)
635
- } finally {
636
- h.restaurar();
637
- }
638
- });
639
- ```
640
-
641
- ### Reglas operativas
642
-
643
- - **`restaurar()` en `finally`**: el harness modifica state global
644
- (process.stdout, process.stdin, readline, require.cache). Si un test
645
- no restaura, contamina los siguientes.
646
- - **Test de captura como smoke**: agregar un test "harness captura stdout"
647
- que valida que `process.stdout.write('hola')` aparece en `captura()`.
648
- Si falla, el harness está roto antes de testear el SUT.
649
- - **Test "tecla() es no-op sin listeners"**: validar que emitir keypress
650
- cuando nadie escucha NO rompe el harness ni propaga errores.
651
- - **Limitación reconocida**: si `readline.createInterface()` real toma
652
- control de stdin (en Windows con Git Bash sin PTY), el callback de
653
- `rl.question()` no se invoca aunque el harness emita teclas. Usar
654
- `Promise.race([promesa, timeout])` para que el test no cuelgue —
655
- el test marca limitación, no falla.
656
-
657
- ### Cuándo NO usar este patrón
658
-
659
- - Cuando necesitas probar **redibujado real del terminal** (alt screen
660
- buffer, escape codes complejos, scrollback). Ahí sí necesitas PTY real
661
- via `node-pty` o test manual.
662
- - Cuando el SUT depende de **timing real del teclado** (input rates,
663
- paste detection). El mock no replica latencia.
664
- - Para CLIs sin lógica de control de flujo (solo `console.log` lineal) —
665
- ahí basta capturar stdout sin mockear TTY.
666
-
667
- ### Origen
668
-
669
- Aplicado en swl-ses v1.6.0 (`tests/scripts/tui/harness-tty.js`, ~180 LOC).
670
- Validó el TUI completo de 5 fases sin instalar `node-pty`. Limitación
671
- documentada: 1 test E2E "preguntarSiNo con harness" marca timeout en
672
- Windows + Node 22+ porque readline real bloquea pese a stdin mockeado —
673
- el harness emite la limitación sin fallar.
1
+ ---
2
+ name: tdd-workflow
3
+ description: Flujo completo de Test-Driven Development. Ciclo RED (el test falla) → GREEN (implementación mínima) → REFACTOR (limpieza). Incluye cobertura mínima obligatoria, tests de frontera, factories, fixtures y estrategias para diferentes tipos de código (APIs, services, componentes Angular).
4
+ version: "1.2.1"
5
+ evolved: true
6
+ evolved-from: "1.1.0"
7
+ evolved-at: "2026-06-11"
8
+ evolved-by: "fase-10-slice-2"
9
+ evolved-note: "v1.2.0: sección 'Evidencia RED en telemetría' (gate G2, ADR-0035, cierra F-TDD-6) — registro de corridas tdd-* en loop-telemetry. v1.0.5: gotcha 'Tests E2E de CLIs interactivos sin PTY real'. Origen M2 sesión 2026-05-16. v1.0.4: silenced tests por race en path único compartido. v1.0.3: gotcha cwd cacheado al require()."
10
+ herramientasPermitidas: [Read, Bash]
11
+ evolvable: true # default para skill estandar
12
+ exclusiones:
13
+ - "No cargar para escribir tests de regresión sobre código legacy sin suite existente — en código legacy sin tests, comenzar con caracterización de comportamiento actual antes del ciclo TDD."
14
+ - "No cargar para pruebas de carga o performance testing — para benchmarks y load testing cargar `performance-baseline`."
15
+ - "No cargar para configurar pipelines de CI/CD o runners de tests en GitHub Actions / GitLab CI — para configuración de CI cargar el skill de cloud correspondiente."
16
+ - "No cargar para pruebas de seguridad o fuzzing automático — para testing de seguridad cargar `threat-model-lite` y usar herramientas especializadas (Bandit, OWASP ZAP)."
17
+ ---
18
+ # Habilidad: TDD Workflow Completo
19
+
20
+ ## Cuándo NO cargar
21
+
22
+ - La tarea es añadir tests a código legacy sin suite existente: comenzar con tests de caracterización del comportamiento actual antes del ciclo TDD.
23
+ - La tarea es pruebas de carga o benchmarks: cargar `performance-baseline`.
24
+ - La tarea es configurar CI/CD pipelines: cargar el skill de cloud correspondiente.
25
+ - La tarea es fuzzing o testing de seguridad: cargar `threat-model-lite` y usar herramientas especializadas.
26
+
27
+ ## Propósito
28
+
29
+ TDD no es "escribir tests después" ni "escribir tests antes por costumbre". Es
30
+ un método de diseño donde los tests guían la API pública del código antes de
31
+ que exista la implementación. El resultado es código que hace exactamente lo
32
+ que los tests exigen — ni más, ni menos.
33
+
34
+ ## Cuándo activar
35
+
36
+ - CONTEXT.md o PLAN.md indica que la fase requiere TDD
37
+ - Se implementa lógica de negocio crítica (cálculos, validaciones, permisos)
38
+ - El usuario pide explícitamente TDD
39
+ - Se trabaja en un módulo con historial de bugs
40
+
41
+ ---
42
+
43
+ ## Etapa opcional previa: Gherkin (BDD) y gate de mutación
44
+
45
+ Dos extensiones opt-in del ciclo, ambas con guía completa en recursos:
46
+
47
+ - **Antes del ciclo** — si la fase tiene criterios de aceptación de negocio,
48
+ convertirlos en escenarios Given–When–Then validados por el usuario ANTES de
49
+ implementar; cada escenario es el test RED de su criterio. Guía, runners por
50
+ stack y anti-patrones en [recursos/gherkin-bdd.md](recursos/gherkin-bdd.md).
51
+ - **Después del ciclo** — en módulos críticos, verificar la calidad de los
52
+ asserts con mutation testing incremental sobre el diff:
53
+ `Skill("calidad-mutation-testing")`. La cobertura mide ejecución; los
54
+ mutantes sobrevivientes miden si los tests detectarían un bug.
55
+
56
+ ## El ciclo fundamental RED → GREEN → REFACTOR
57
+
58
+ ### Fase RED — El test debe fallar por la razón correcta
59
+
60
+ **Paso 1**: Escribir el test que describe el comportamiento esperado.
61
+
62
+ ```python
63
+ # RED: Este test falla porque calcular_descuento no existe todavía
64
+ def test_descuento_cliente_premium_es_15_porciento():
65
+ cliente = ClienteFactory(tipo="premium")
66
+ resultado = calcular_descuento(cliente, monto=100.0)
67
+ assert resultado == 15.0
68
+ ```
69
+
70
+ **Verificar que el test falla BIEN**:
71
+ - Falla con `NameError` o `ImportError` si la función no existe: CORRECTO
72
+ - Falla con `AssertionError` si el comportamiento es incorrecto: CORRECTO
73
+ - Falla con `TypeError` si la firma es incorrecta: CORRECTO
74
+ - Pasa sin que exista implementación: SEÑAL DE ALARMA — el test no prueba nada
75
+
76
+ **NUNCA avanzar a GREEN si el test pasa en RED.**
77
+
78
+ #### Evidencia RED en telemetría (gate G2 proyectos con SWL)
79
+
80
+ El RED debe dejar rastro verificable (cierra F-TDD-6: "TDD declarativo sin
81
+ evidencia"). En proyectos con `.planning/`, registrar la corrida en
82
+ `hooks/lib/loop-telemetry.js` ANTES de pasar a GREEN:
83
+
84
+ ```bash
85
+ # Una vez por fase/tarea — abre la corrida
86
+ node -e "const lt=require('./hooks/lib/loop-telemetry');const r=lt.iniciarCorrida({tipo:'tdd',direccion:'lower_is_better',config:{fase:'0N',tarea:'T-NN'}});console.log(r.dir)"
87
+
88
+ # Al confirmar el RED — métrica = número de tests fallando, descripción = fallo exacto
89
+ node -e "const lt=require('./hooks/lib/loop-telemetry');lt.registrarIteracion('<dir>',{iteracion:0,metrica:N,delta:0,estado:'baseline',descripcion:'RED T-NN: <error textual del runner>'})"
90
+
91
+ # Al llegar a GREEN
92
+ node -e "const lt=require('./hooks/lib/loop-telemetry');lt.registrarIteracion('<dir>',{iteracion:1,metrica:0,delta:-N,estado:'keep',descripcion:'GREEN T-NN: suite verde'})"
93
+ ```
94
+
95
+ `hooks/tdd-gate.js` (warn-only, ADR-0035) busca la fila RED en
96
+ `.planning/loops/tdd-*/iteraciones.tsv` al commitear un feature con tests; sin
97
+ evidencia emite nudge `tdd-red-evidence`. Sin `.planning/` no aplica.
98
+
99
+ #### Marker de trazabilidad REQ en tests (proyectos con REQ-IDs)
100
+
101
+ Cuando la fase tiene criterios `REQ-NN` (fases 01-11) o `REQ-<fase>-NN`
102
+ (namespaceados, fases ≥12 — DT-IDS-NAMESPACE) en el CONTEXTO, cada test que
103
+ verifica un criterio lleva el marker en comentario —
104
+ `scripts/verificar-trazabilidad.js` lo usa para cerrar la cadena
105
+ REQ→T→commit→test (reconoce ambos formatos):
106
+
107
+ ```python
108
+ def test_descuento_cliente_premium():
109
+ # verifica: REQ-12-03
110
+ ...
111
+ ```
112
+
113
+ ```javascript
114
+ test('descuento cliente premium', () => {
115
+ // verifica: REQ-12-03
116
+ ...
117
+ });
118
+ ```
119
+
120
+ ### Fase GREEN Implementación mínima
121
+
122
+ **Regla de oro**: Implementar solo lo que hace pasar el test. Nada más.
123
+
124
+ ```python
125
+ # GREEN: Implementación mínima que hace pasar el test
126
+ def calcular_descuento(cliente: Cliente, monto: float) -> float:
127
+ if cliente.tipo == "premium":
128
+ return monto * 0.15
129
+ return 0.0
130
+ ```
131
+
132
+ **Anti-patrón GREEN**: implementar todos los casos de una vez sin tests que los
133
+ exijan. Si no hay un test para clientes "gold", no implementes el descuento gold.
134
+
135
+ **Verificar**: `pytest -v test_descuentos.py` pasa con el test nuevo.
136
+
137
+ ### Fase REFACTOR — Limpieza sin cambiar comportamiento
138
+
139
+ **Qué refactorizar en esta fase**:
140
+ - Nombres de variables o funciones poco claros
141
+ - Duplicación de lógica (si ya existe en otro test)
142
+ - Magic numbers que deberían ser constantes
143
+ - Estructura de código que anticipa el próximo test
144
+
145
+ ```python
146
+ # REFACTOR: Extraer constante y mejorar legibilidad
147
+ DESCUENTO_POR_TIPO = {
148
+ "premium": 0.15,
149
+ "gold": 0.20,
150
+ "standard": 0.0,
151
+ }
152
+
153
+ def calcular_descuento(cliente: Cliente, monto: float) -> float:
154
+ tasa = DESCUENTO_POR_TIPO.get(cliente.tipo, 0.0)
155
+ return monto * tasa
156
+ ```
157
+
158
+ **Verificar**: todos los tests siguen pasando después del refactor.
159
+
160
+ ---
161
+
162
+ ## Tests de frontera (boundary tests)
163
+
164
+ Para toda función que procesa datos, escribir tests de:
165
+
166
+ | Tipo de frontera | Ejemplo |
167
+ |----------------|---------|
168
+ | Valor cero | `monto=0.0` |
169
+ | Valor negativo | `monto=-100.0` |
170
+ | Valor máximo | `monto=999_999_999.99` |
171
+ | String vacío | `nombre=""` |
172
+ | None / null | `cliente=None` |
173
+ | Lista vacía | `items=[]` |
174
+ | Un solo elemento | `items=[item]` |
175
+ | Muchos elementos | `items=lista_de_10000` |
176
+ | Valor fuera de dominio | `tipo="inexistente"` |
177
+ | Caracteres especiales | `nombre="<script>alert(1)</script>"` |
178
+
179
+ ---
180
+
181
+ ## Factories y Fixtures
182
+
183
+ ### Factories (para datos de test)
184
+
185
+ Las factories crean objetos con valores válidos por defecto. Los tests solo
186
+ sobreescriben lo que importa para ese test específico.
187
+
188
+ **Python con factory_boy**:
189
+ ```python
190
+ import factory
191
+ from myapp.models import Cliente, Pedido
192
+
193
+ class ClienteFactory(factory.Factory):
194
+ class Meta:
195
+ model = Cliente
196
+
197
+ id = factory.Sequence(lambda n: f"cliente-{n}")
198
+ nombre = factory.Faker("name", locale="es_MX")
199
+ email = factory.Faker("email")
200
+ tipo = "standard" # default explícito
201
+ activo = True
202
+
203
+ # Uso en test
204
+ def test_descuento_premium():
205
+ # Solo especificar lo que importa para este test
206
+ cliente = ClienteFactory(tipo="premium")
207
+ assert calcular_descuento(cliente, 100.0) == 15.0
208
+ ```
209
+
210
+ **TypeScript con factory functions**:
211
+ ```typescript
212
+ // factories/user.factory.ts
213
+ export const createUser = (overrides: Partial<User> = {}): User => ({
214
+ id: 'user-1',
215
+ name: 'Test User',
216
+ email: 'test@example.com',
217
+ role: 'standard',
218
+ active: true,
219
+ ...overrides,
220
+ });
221
+
222
+ // Uso en test
223
+ it('should show admin panel for admin users', () => {
224
+ const user = createUser({ role: 'admin' });
225
+ // ...
226
+ });
227
+ ```
228
+
229
+ ### Fixtures (para estado persistente)
230
+
231
+ ```python
232
+ # conftest.py
233
+ import pytest
234
+ from sqlalchemy.ext.asyncio import AsyncSession
235
+
236
+ @pytest.fixture
237
+ async def db_session():
238
+ """Sesión de BD en transacción que hace rollback al terminar."""
239
+ async with AsyncSessionLocal() as session:
240
+ async with session.begin():
241
+ yield session
242
+ await session.rollback()
243
+
244
+ @pytest.fixture
245
+ async def cliente_premium(db_session: AsyncSession):
246
+ """Cliente premium persistido en BD de test."""
247
+ cliente = ClienteFactory.build(tipo="premium")
248
+ db_session.add(cliente)
249
+ await db_session.flush()
250
+ return cliente
251
+ ```
252
+
253
+ ---
254
+
255
+ ## TDD por tipo de código
256
+
257
+ ### Services (lógica de negocio)
258
+
259
+ ```python
260
+ # Orden de tests para un service nuevo:
261
+ # 1. Caso feliz principal
262
+ # 2. Validaciones de input inválido
263
+ # 3. Casos de borde del dominio
264
+ # 4. Interacciones con dependencias (mocks)
265
+
266
+ @pytest.mark.asyncio
267
+ async def test_crear_pedido_valida_stock_disponible():
268
+ producto = ProductoFactory(stock=5)
269
+ with pytest.raises(StockInsuficienteError):
270
+ await PedidoService.crear(producto_id=producto.id, cantidad=10)
271
+ ```
272
+
273
+ ### Endpoints FastAPI
274
+
275
+ ```python
276
+ # Usar TestClient de FastAPI
277
+ from fastapi.testclient import TestClient
278
+
279
+ def test_endpoint_requiere_autenticacion():
280
+ response = client.get("/api/v1/pedidos")
281
+ assert response.status_code == 401
282
+
283
+ def test_endpoint_retorna_solo_pedidos_del_usuario(cliente_autenticado):
284
+ pedido_propio = PedidoFactory(usuario_id=cliente_autenticado.id)
285
+ pedido_ajeno = PedidoFactory(usuario_id="otro-usuario")
286
+
287
+ response = cliente_autenticado.get("/api/v1/pedidos")
288
+ ids = [p["id"] for p in response.json()["items"]]
289
+
290
+ assert pedido_propio.id in ids
291
+ assert pedido_ajeno.id not in ids # IDOR check
292
+ ```
293
+
294
+ ### Componentes Angular
295
+
296
+ ```typescript
297
+ // Usar TestBed + ComponentHarness
298
+ describe('PedidosComponent', () => {
299
+ it('should display empty state when no orders exist', async () => {
300
+ const mockService = { getPedidos: () => of({ items: [], total: 0 }) };
301
+ await TestBed.configureTestingModule({
302
+ providers: [{ provide: PedidosService, useValue: mockService }]
303
+ }).compileComponents();
304
+
305
+ const fixture = TestBed.createComponent(PedidosComponent);
306
+ fixture.detectChanges();
307
+
308
+ const emptyState = fixture.nativeElement.querySelector('[data-testid="empty-state"]');
309
+ expect(emptyState).toBeTruthy();
310
+ });
311
+ });
312
+ ```
313
+
314
+ ---
315
+
316
+ ## Cobertura mínima obligatoria
317
+
318
+ | Tipo de módulo | Cobertura mínima |
319
+ |---------------|-----------------|
320
+ | Services (lógica crítica) | 90% |
321
+ | Endpoints (API) | 85% |
322
+ | Utilities / helpers | 95% |
323
+ | Componentes Angular | 75% |
324
+ | Modelos ORM | 70% |
325
+
326
+ **Verificar** con reporte de cobertura antes de marcar tarea como completada:
327
+ ```bash
328
+ pytest --cov=src/services --cov-fail-under=90
329
+ ```
330
+
331
+ ---
332
+
333
+ ## Anti-patrones TDD a evitar
334
+
335
+ | Anti-patrón | Descripción | Solución |
336
+ |-------------|-------------|---------|
337
+ | Test del mock | El test solo verifica que se llamó el mock, no el comportamiento real | Testear el efecto observable |
338
+ | Test omnibus | Un solo test que verifica 10 cosas a la vez | Un test, un comportamiento |
339
+ | Test frágil | Falla si cambias nombres internos sin cambiar comportamiento | Testear comportamiento, no implementación |
340
+ | Fixture global | Un fixture que modifica estado global compartido entre tests | Fixtures con scope limitado, rollback |
341
+ | Skip como solución | `@pytest.mark.skip` para tests que fallan | Arreglar el bug o eliminar el test |
342
+
343
+ ---
344
+
345
+ ## Gotchas / Errores comunes no obvios
346
+
347
+ **El ciclo TDD se rompe cuando el test en fase RED pasa sin implementación porque la función ya existe con otro nombre en el módulo y Python la importa silenciosamente desde un namespace diferente**: escribir `from app.services import calcular_descuento` en el test cuando `calcular_descuento` ya existe en `app.utils` (importada en `__init__.py`) hace que el test pase en RED sin error, invalidando el ciclo. Causa: los imports con `from app.services import *` en `__init__.py` pueden re-exportar funciones de submódulos, haciendo que el test encuentre una implementación inesperada. Fix: verificar con `python -c "from app.services import calcular_descuento; print(calcular_descuento.__module__)"` que el símbolo viene del módulo correcto. Usar imports explícitos en los tests (`from app.services.descuentos import calcular_descuento`) en lugar de imports de paquete.
348
+
349
+ **`pytest.mark.asyncio` con `asyncio_mode = "auto"` en `pytest.ini` hace que fixtures síncronos que retornan coroutines sean llamados sin `await`, causando que el fixture entregue un objeto coroutine en lugar del valor esperado**: un fixture `def cliente_premium(db_session)` que retorna `ClienteFactory.build(tipo="premium")` funciona, pero si accidentalmente se define como `async def cliente_premium(db_session)` y se usa en un test síncrono, pytest lo trata como fixture síncrono y el test recibe el objeto coroutine. Causa: la mezcla de fixtures `async def` y `def` en el mismo `conftest.py` con `asyncio_mode = "auto"` puede crear comportamientos inesperados dependiendo de la versión de `pytest-asyncio`. Fix: en proyectos async, definir TODOS los fixtures relevantes como `async def` explícitamente y verificar que el test use `@pytest.mark.asyncio` o tenga el modo auto configurado correctamente.
350
+
351
+ **La fase REFACTOR del ciclo TDD en componentes Angular introduce regresiones silenciosas cuando se extrae lógica a un `computed()` pero el template sigue usando la función directa que ahora devuelve `undefined`**: refactorizar `getTotal()` como método del componente hacia `total = computed(() => ...)` y olvidar actualizar el template de `{{ getTotal() }}` a `{{ total() }}` no genera error de compilación con Angular 17+; el template simplemente muestra `undefined`. Causa: Angular no verifica en tiempo de compilación que los métodos referenciados en templates existen en la clase si el template usa la sintaxis de interpolación sin type-checking estricto. Fix: activar `strictTemplates: true` en `tsconfig.app.json` para que el compilador de Angular valide que todas las referencias en templates corresponden a miembros públicos del componente. Ejecutar `ng build` antes de considerar el REFACTOR completo.
352
+
353
+ **`db_session.rollback()` en el fixture de pytest-asyncio no deshace los datos insertados por `db.flush()` dentro de la función testeada cuando la sesión usa `autocommit=True` implícito por configuración del engine**: algunos proyectos configuran `AsyncEngine` con `isolation_level="AUTOCOMMIT"` para compatibilidad con operaciones DDL; en ese contexto, cada `flush()` hace commit inmediatamente y el `rollback()` del fixture no puede deshacer esos cambios. Causa: `AUTOCOMMIT` en PostgreSQL significa que no hay transacción activa que se pueda revertir. Fix: verificar que el engine de tests NO use `isolation_level="AUTOCOMMIT"` (la configuración debe ser solo para el engine de migraciones Alembic, no para el de la app). Para tests que necesitan AUTOCOMMIT por alguna razón, usar una BD de test separada que se trunca con `TRUNCATE ... RESTART IDENTITY CASCADE` en el teardown del fixture.
354
+
355
+ **Reloj inyectable como parámetro `ahora` habilita tests deterministas sin `freezegun`, `jest.useFakeTimers()` ni `sinon.useFakeTimers()`** [PATRÓN VALIDADO en SWL Opción C webhook]: cuando una API depende del tiempo (rate-limit con bucket que se rellena, dedup con ventana de retención, cache con TTL, schedulers), recibir el timestamp por parámetro en lugar de llamar `Date.now()` internamente permite que los tests pasen 1000 segundos en 0 ms reales. Diseño: `metodo(arg1, arg2, ahora = Date.now())` — producción no cambia (llamadas siguen siendo `obj.consumir(1)`), tests pasan `ahora` explícito (`obj.consumir(1, T0 + 5000)`). Validado en 3 módulos esta sesión: `rate-limit-ip.js` (40+ tests bucket refill, capacidad, cleanup), `webhook-dedup.js` (ventana de retención, rotación idempotente), helpers internos de `webhook-server.js`. Ningún test usa `sleep`, ningún test es flaky, ningún test mockea `Date`. Aplicable a JS/TS y a Python (`def consumir(self, tokens, ahora=None)` con `ahora = ahora or datetime.now(UTC)` al inicio).
356
+
357
+ ```js
358
+ // MAL — test no-determinista, requiere sleep o mock global
359
+ class Bucket {
360
+ consumir(n) {
361
+ const ahora = Date.now(); // imposible de controlar desde el test
362
+ this._rellenar(ahora);
363
+ if (this.tokens >= n) { this.tokens -= n; return true; }
364
+ return false;
365
+ }
366
+ }
367
+
368
+ // BIEN reloj inyectable, test determinista
369
+ class Bucket {
370
+ consumir(n, ahora = Date.now()) { // ← default en producción, inyectable en test
371
+ this._rellenar(ahora);
372
+ if (this.tokens >= n) { this.tokens -= n; return true; }
373
+ return false;
374
+ }
375
+ }
376
+
377
+ // En el test:
378
+ const T0 = 1700000000000;
379
+ const b = new Bucket(10, 1, T0);
380
+ for (let i = 0; i < 10; i++) b.consumir(1, T0); // saturar
381
+ assert.equal(b.consumir(1, T0), false); // sin refill aún
382
+ assert.equal(b.consumir(5, T0 + 5000), true); // 5 seg después: 5 tokens
383
+ ```
384
+
385
+ Aplica también a tests de clock skew (tiempo retrocede por NTP): pasar `T0 - 1000` y validar que la lógica no rompe. Origen: rate-limit-ip.js + webhook-dedup.js sesión 2026-05-13.
386
+
387
+ **Tests nombrados por feature (`test_emitir_factura_exitosa`) pierden poder regresivo; nombrados por causa raíz (`test_repository_no_usa_columna_inexistente_p_monto`) detectan regresiones específicas sin reproducción manual** [CONFIRMADO en SIGM Opción C F1.4]: cuando se descubre un bug por una causa raíz concreta (typo en nombre de columna SQL, omisión de `selectinload`, mock que devuelve dict en vez de objeto, schema obsoleto), el test de regresión que se escribe debe llevar el nombre de la causa, no del feature afectado. Caso real: durante F1.4 de SIGM, el repository de pagos referenciaba `p.monto` cuando la columna se llamaba `p.monto_pagado`; el test escrito como `test_repository_no_usa_columna_inexistente_p_monto` falló inmediatamente en la siguiente sesión cuando otro agente reintrodujo el typo, sin necesidad de reproducir el escenario de negocio (emitir cobro real, verificar respuesta). Causa: los nombres orientados a feature (`test_pago_exitoso`) son ambiguos sobre QUÉ falla — si el test falla, el desarrollador debe diagnosticar; los nombres orientados a causa raíz (`test_X_no_usa_Y`, `test_query_incluye_selectinload_Z`, `test_service_devuelve_dict_no_objeto`) son auto-diagnósticos. Fix: para cada bug que cueste >30 min diagnosticar, escribir UN test adicional cuyo nombre describa la condición técnica violada, no el escenario de negocio. Convención: `test_<componente>_<condicion_tecnica>` o `test_<componente>_no_<anti_patron>`. Estos tests son tu segunda línea de defensa contra regresiones de la misma causa raíz, complementarios a los tests de comportamiento.
388
+
389
+ **`process.cwd()` cacheado al `require()` rompe tests con `process.chdir(sandbox)`** [PATRÓN GENÉRICO TESTING CLI]: scripts Node exportables que leen `process.cwd()` en el scope del módulo (al cargar) congelan el cwd al directorio de invocación. Los tests que crean sandboxes con `fs.mkdtempSync()` y luego `process.chdir(sandbox)` no afectan al cwd cacheado — el script sigue leyendo del cwd original y los assertions fallan con paths inesperados. Caso real (swl-ses `scripts/derivar-feature-list.js` 2026-05-15): la función `enriquecerDesdeFases(fases)` leía `const CWD = process.cwd()` calculado al `require()`; 2 tests con `process.chdir(sandbox)` retornaron `[]` en lugar de detectar el PLAN.md fixture. Causa: el constante se evaluó cuando el `node --test` cargó el módulo desde el cwd del proyecto, no desde el sandbox del test individual. Fix obligatorio: funciones exportables deben aceptar `cwd` como parámetro opcional con fallback dinámico (`function fn(args, opciones = {}) { const cwd = opciones.cwd || process.cwd(); ... }`). El código de producción no cambia (sin args extras), pero los tests pueden inyectar el cwd correcto. Aplica también a Python (`def fn(args, cwd: str | None = None): cwd = cwd or os.getcwd()`) y a cualquier lenguaje con tests que usen chdir.
390
+
391
+ ```js
392
+ // MAL cwd cacheado al require, tests con process.chdir() fallan
393
+ const CWD = process.cwd();
394
+ const PLANNING_DIR = path.join(CWD, '.planning');
395
+
396
+ function enriquecerDesdeFases(fases) {
397
+ const archivos = fs.readdirSync(path.join(PLANNING_DIR, 'fases')); // cwd congelado
398
+ // ...
399
+ }
400
+
401
+ // BIEN cwd dinámico con parámetro opcional para tests
402
+ function enriquecerDesdeFases(fases, opciones = {}) {
403
+ const cwd = opciones.cwd || process.cwd(); // recalcula al llamar
404
+ const archivos = fs.readdirSync(path.join(cwd, '.planning', 'fases'));
405
+ // ...
406
+ }
407
+
408
+ // En el test (usa setupSandboxes regla tests-cleanup.md):
409
+ const { setupSandboxes } = require('../_helpers/sandbox');
410
+ const sandboxes = setupSandboxes('swl-test-');
411
+
412
+ const sandbox = sandboxes.create();
413
+ fs.mkdirSync(path.join(sandbox, '.planning', 'fases'), { recursive: true });
414
+ // Opción A: pasar cwd explícito (recomendado)
415
+ const r = enriquecerDesdeFases([], { cwd: sandbox });
416
+ // Opción B: process.chdir() solo funciona con cwd dinámico
417
+ process.chdir(sandbox);
418
+ const r2 = enriquecerDesdeFases([]);
419
+ // Cleanup automático al final del archivo vía after() registrado por setupSandboxes.
420
+ ```
421
+
422
+ ---
423
+
424
+ ## Gotcha: silenced tests por race condition sobre estado compartido
425
+
426
+ ### El anti-patrón
427
+
428
+ ```javascript
429
+ // MAL — assertion condicional dentro de if que puede ser false por race
430
+ const FLAG = path.join(os.tmpdir(), 'mi-app.json');
431
+
432
+ test('flag sin contenido emite warning', () => {
433
+ borrarFlag();
434
+ const res = correrSubproceso();
435
+ if (fs.existsSync(FLAG)) { // otro test paralelo creó el flag
436
+ assert.match(res.stdout, /WARN/); // ← NUNCA se ejecuta si el if es false
437
+ }
438
+ // sin else → test PASA sin haber validado nada
439
+ });
440
+
441
+ // El test "verde" no significa "pasó" — significa "no falló ninguna assertion".
442
+ // Si la assertion vive dentro de un `if (race)`, una race favorable la salta
443
+ // y el test es vacío.
444
+ ```
445
+
446
+ ### Por qué pasa
447
+
448
+ `node:test` paraleliza **archivos** `.test.js` por default (no tests dentro
449
+ del mismo archivo). Si dos archivos tocan el mismo path único de filesystem
450
+ (`/tmp/foo.json`, lockfiles, sockets), las operaciones se intercalan no
451
+ deterministamente. Patrones típicos:
452
+
453
+ - Archivo A: `borrarFlag()` spawn subprocess assert
454
+ - Archivo B: spawn subprocess → `crearFlag()` durante A → assert de A condicionado falla
455
+
456
+ ### Patrones correctos
457
+
458
+ **Patrón 1 — Aislamiento por path único** (recomendado):
459
+
460
+ ```javascript
461
+ const { setupSandboxes } = require('../_helpers/sandbox');
462
+ const sandboxes = setupSandboxes('swl-mi-app-test-');
463
+ const env = { ...process.env };
464
+
465
+ // Path único por test usando el helper canónico (regla tests-cleanup.md).
466
+ // El cleanup es automático al final del archivo vía after() registrado.
467
+ const dir = sandboxes.create();
468
+ env.MI_APP_FLAG_PATH = path.join(dir, 'flag.json');
469
+
470
+ const res = spawnSync('node', [BIN], { env, ... });
471
+
472
+ // Ahora el assert es incondicional el path es del test, no compartido
473
+ assert.match(res.stdout, /WARN/);
474
+ ```
475
+
476
+ Requiere que el SUT (System Under Test) honre una env var para override
477
+ del path. Si no la honra, agregar el override es parte del fix.
478
+
479
+ **Patrón 2 — Serialización forzada** (cuando el path es hardcoded):
480
+
481
+ ```bash
482
+ # Forzar --test-concurrency=1 en la suite completa
483
+ node --test --test-concurrency=1 tests/
484
+ ```
485
+
486
+ Tradeoff: tests más lentos pero deterministas. Aceptable si el aislamiento
487
+ no es factible (legacy code).
488
+
489
+ **Patrón 3 assertions incondicionales** con setup determinista:
490
+
491
+ ```javascript
492
+ // MAL
493
+ if (fs.existsSync(FLAG)) assert.match(...)
494
+
495
+ // BIEN setup garantiza la precondición, assertion no se salta
496
+ escribirFlag({ ... });
497
+ assert.ok(fs.existsSync(FLAG), 'precondición del test'); // assertion sobre el setup
498
+ const res = correrSubproceso();
499
+ assert.match(res.stdout, /WARN/); // ← assertion incondicional sobre el resultado
500
+ ```
501
+
502
+ ### Anti-patrón: `if (X) assert(Y)` sin `else`
503
+
504
+ ```javascript
505
+ // MAL — un test que pasa silenciosamente cuando X es false
506
+ test('hace algo', () => {
507
+ const algo = obtenerAlgo();
508
+ if (algo) { // race u otra fuente de no-determinismo
509
+ assert.equal(algo.valor, 42);
510
+ }
511
+ // sin else veredicto "pass" sin haber validado nada
512
+ });
513
+
514
+ // BIEN — el setup garantiza la precondición o el test falla explícito
515
+ test('hace algo', () => {
516
+ const algo = obtenerAlgo();
517
+ assert.ok(algo, 'precondición: obtenerAlgo debe devolver valor');
518
+ assert.equal(algo.valor, 42);
519
+ });
520
+ ```
521
+
522
+ **Regla**: una assertion dentro de un `if` sin `else` es **un test que
523
+ puede pasar sin validar nada**. Estos "silenced tests" son la peor clase
524
+ de falsa cobertura: el reporter dice "pass" y nadie revisa el código
525
+ hasta que un bug llega a producción.
526
+
527
+ ### Detección
528
+
529
+ - Buscar `if (` dentro de cuerpos de `test(...)`/`it(...)` sin `else { fail() }`
530
+ o `else { assert(...) }` correspondiente.
531
+ - Si el cuerpo del `if` contiene `assert.*`, considerarlo silenced test
532
+ hasta que se demuestre que el `if` no puede ser false en ningún escenario.
533
+
534
+ ### Origen
535
+
536
+ Detectado en sesión 2026-05-16 del proyecto swl-ses (PR #30): tests del
537
+ flag `swl-ses-update-check.json` compartido entre dos archivos `.test.js`
538
+ paralelos. El test "sin flag → debe advertir" pasaba en CI cuando otro
539
+ archivo creaba el flag, sin ejecutar ninguna assertion. Fix: env var
540
+ `SWL_UPDATE_FLAG_PATH` para aislamiento + assertions incondicionales.
541
+
542
+ ---
543
+
544
+ ## Tests E2E de CLIs interactivos sin PTY real
545
+
546
+ ### El problema
547
+
548
+ Probar un CLI interactivo (TUI con `readline`, prompts, keypress events,
549
+ `process.stdin.isTTY`) en CI requiere normalmente un **pseudo-terminal
550
+ emulado** (PTY) — usualmente vía `node-pty`, una dependencia **nativa** que:
551
+
552
+ - Requiere compilación de extensiones C++ al instalar (puede fallar en
553
+ contenedores minimal o en Windows sin Visual Studio Build Tools).
554
+ - Agrega ~5 MB al `node_modules` por imagen.
555
+ - Hace que el test suite no corra en `npm test` sin setup extra.
556
+
557
+ Para CLIs interactivos donde no se necesita probar **el comportamiento
558
+ real del terminal** (escape codes, redibujado, scroll), sino solo la
559
+ **lógica del wizard** (¿qué pasa si el usuario presiona Esc en el paso 3?,
560
+ ¿qué resuelve el promise tras Enter con default?), un harness TTY mockeado
561
+ cubre ~90% de los casos sin dep nativa.
562
+
563
+ ### Patrón del harness
564
+
565
+ ```javascript
566
+ // tests/harness-tty.js
567
+ 'use strict';
568
+
569
+ const readline = require('readline');
570
+
571
+ function crearHarness() {
572
+ // 1. Capturar estado original para restauración
573
+ const stdoutOriginal = process.stdout.write.bind(process.stdout);
574
+ const isTtyStdoutOriginal = process.stdout.isTTY;
575
+ const isTtyStdinOriginal = process.stdin.isTTY;
576
+ const setRawModeOriginal = process.stdin.setRawMode
577
+ ? process.stdin.setRawMode.bind(process.stdin) : null;
578
+ const emitKeypressOriginal = readline.emitKeypressEvents;
579
+
580
+ let capturado = '';
581
+ let listenersKeypress = [];
582
+
583
+ // 2. Forzar TTY antes de cargar módulos UI (que evalúan ES_TTY al require)
584
+ Object.defineProperty(process.stdout, 'isTTY', { value: true, configurable: true });
585
+ Object.defineProperty(process.stdin, 'isTTY', { value: true, configurable: true });
586
+
587
+ // 3. Capturar stdout en string buffer
588
+ process.stdout.write = (chunk) => {
589
+ capturado += typeof chunk === 'string' ? chunk : chunk.toString();
590
+ return true;
591
+ };
592
+
593
+ // 4. Mockear setRawMode/resume/pause como no-op (evita tomar control del terminal de test)
594
+ process.stdin.setRawMode = () => process.stdin;
595
+ process.stdin.resume = () => process.stdin;
596
+ process.stdin.pause = () => process.stdin;
597
+
598
+ // 5. Interceptar registros de 'keypress' para poder emitirlos a mano
599
+ const onListenerOriginal = process.stdin.on.bind(process.stdin);
600
+ process.stdin.on = (evento, listener) => {
601
+ if (evento === 'keypress') listenersKeypress.push(listener);
602
+ return onListenerOriginal(evento, listener);
603
+ };
604
+
605
+ // 6. Mockear readline.emitKeypressEvents (no necesita stdin real)
606
+ readline.emitKeypressEvents = (stream) => stream;
607
+
608
+ // 7. Limpiar require cache de módulos UI para que se evalúen con TTY=true
609
+ delete require.cache[require.resolve('../scripts/tui/lib/render')];
610
+
611
+ function cargarUI() {
612
+ return require('../scripts/tui/lib/render');
613
+ }
614
+
615
+ // 8. Emitir keypress programáticamente
616
+ function tecla(nombre, extras = {}) {
617
+ const key = { name: nombre, ctrl: false, meta: false, shift: false, ...extras };
618
+ const str = nombre.length === 1 ? nombre : '';
619
+ for (const listener of [...listenersKeypress]) {
620
+ try { listener(str, key); } catch (_) { /* swallow */ }
621
+ }
622
+ }
623
+
624
+ // 9. Esperar N ticks del event loop para promesas internas
625
+ function esperarTicks(n = 1) {
626
+ let p = Promise.resolve();
627
+ for (let i = 0; i < n; i++) p = p.then(() => undefined);
628
+ return p;
629
+ }
630
+
631
+ function captura(opts = {}) {
632
+ const valor = capturado;
633
+ if (opts.limpiar) capturado = '';
634
+ return valor;
635
+ }
636
+
637
+ function restaurar() {
638
+ Object.defineProperty(process.stdout, 'isTTY', { value: isTtyStdoutOriginal, configurable: true });
639
+ Object.defineProperty(process.stdin, 'isTTY', { value: isTtyStdinOriginal, configurable: true });
640
+ process.stdout.write = stdoutOriginal;
641
+ if (setRawModeOriginal) process.stdin.setRawMode = setRawModeOriginal;
642
+ process.stdin.on = onListenerOriginal;
643
+ readline.emitKeypressEvents = emitKeypressOriginal;
644
+ listenersKeypress = [];
645
+ // Limpiar require cache para no contaminar otros tests
646
+ delete require.cache[require.resolve('../scripts/tui/lib/render')];
647
+ }
648
+
649
+ return { cargarUI, tecla, esperarTicks, captura, restaurar };
650
+ }
651
+
652
+ module.exports = { crearHarness };
653
+ ```
654
+
655
+ ### Uso típico
656
+
657
+ ```javascript
658
+ const test = require('node:test');
659
+ const assert = require('node:assert/strict');
660
+ const { crearHarness } = require('./harness-tty');
661
+
662
+ test('preguntarSiNo con harness: Enter resuelve con default true', async () => {
663
+ const h = crearHarness();
664
+ try {
665
+ const ui = h.cargarUI();
666
+ const promesa = ui.preguntarSiNo('test prompt', true);
667
+
668
+ await h.esperarTicks(2);
669
+ h.tecla('return');
670
+
671
+ const timeout = new Promise((_, reject) =>
672
+ setTimeout(() => reject(new Error('no resolvió en 500ms')), 500));
673
+
674
+ const r = await Promise.race([promesa, timeout]).catch(() => null);
675
+ // r === true si el harness simuló bien; null si readline real bloquea
676
+ // (caso esperado en Windows sin PTY real; documentar limitación)
677
+ } finally {
678
+ h.restaurar();
679
+ }
680
+ });
681
+ ```
682
+
683
+ ### Reglas operativas
684
+
685
+ - **`restaurar()` en `finally`**: el harness modifica state global
686
+ (process.stdout, process.stdin, readline, require.cache). Si un test
687
+ no restaura, contamina los siguientes.
688
+ - **Test de captura como smoke**: agregar un test "harness captura stdout"
689
+ que valida que `process.stdout.write('hola')` aparece en `captura()`.
690
+ Si falla, el harness está roto antes de testear el SUT.
691
+ - **Test "tecla() es no-op sin listeners"**: validar que emitir keypress
692
+ cuando nadie escucha NO rompe el harness ni propaga errores.
693
+ - **Limitación reconocida**: si `readline.createInterface()` real toma
694
+ control de stdin (en Windows con Git Bash sin PTY), el callback de
695
+ `rl.question()` no se invoca aunque el harness emita teclas. Usar
696
+ `Promise.race([promesa, timeout])` para que el test no cuelgue —
697
+ el test marca limitación, no falla.
698
+
699
+ ### Cuándo NO usar este patrón
700
+
701
+ - Cuando necesitas probar **redibujado real del terminal** (alt screen
702
+ buffer, escape codes complejos, scrollback). Ahí sí necesitas PTY real
703
+ via `node-pty` o test manual.
704
+ - Cuando el SUT depende de **timing real del teclado** (input rates,
705
+ paste detection). El mock no replica latencia.
706
+ - Para CLIs sin lógica de control de flujo (solo `console.log` lineal) —
707
+ ahí basta capturar stdout sin mockear TTY.
708
+
709
+ ### Origen
710
+
711
+ Aplicado en swl-ses v1.6.0 (`tests/scripts/tui/harness-tty.js`, ~180 LOC).
712
+ Validó el TUI completo de 5 fases sin instalar `node-pty`. Limitación
713
+ documentada: 1 test E2E "preguntarSiNo con harness" marca timeout en
714
+ Windows + Node 22+ porque readline real bloquea pese a stdin mockeado —
715
+ el harness emite la limitación sin fallar.