@saulwade/swl-ses 2.1.0 → 2.2.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (113) hide show
  1. package/CLAUDE.md +199 -196
  2. package/README.md +597 -579
  3. package/agentes/arquitecto-swl.md +0 -5
  4. package/agentes/backend-python-swl.md +0 -5
  5. package/agentes/implementador-swl.md +0 -5
  6. package/agentes/nemesis-auditor-swl.md +0 -5
  7. package/agentes/orquestador-swl.md +0 -5
  8. package/agentes/planificador-swl.md +0 -5
  9. package/agentes/revisor-codigo-swl.md +0 -5
  10. package/bin/swl-ses.js +63 -0
  11. package/comandos/swl/adoptar-proyecto.md +12 -14
  12. package/comandos/swl/aprender.md +30 -47
  13. package/comandos/swl/aprobar-plan.md +23 -35
  14. package/comandos/swl/autoresearch.md +12 -14
  15. package/comandos/swl/briefing.md +5 -8
  16. package/comandos/swl/checkpoint.md +10 -15
  17. package/comandos/swl/claudemd.md +12 -12
  18. package/comandos/swl/configurar-ci.md +20 -19
  19. package/comandos/swl/cron.md +10 -12
  20. package/comandos/swl/ejecutar-fase.md +10 -8
  21. package/comandos/swl/evolucionar.md +6 -11
  22. package/comandos/swl/inbox.md +10 -10
  23. package/comandos/swl/modelo.md +7 -9
  24. package/comandos/swl/notificaciones.md +19 -116
  25. package/comandos/swl/nuevo-proyecto.md +9 -14
  26. package/comandos/swl/release.md +19 -5
  27. package/comandos/swl/revisar-impacto.md +0 -5
  28. package/comandos/swl/status.md +333 -348
  29. package/comandos/swl/verificar.md +817 -813
  30. package/habilidades/agent-browser/SKILL.md +0 -5
  31. package/habilidades/angular-moderno/SKILL.md +0 -5
  32. package/habilidades/api-rest-diseno/SKILL.md +0 -5
  33. package/habilidades/aprendizaje-continuo/SKILL.md +0 -5
  34. package/habilidades/auth-patrones/SKILL.md +0 -5
  35. package/habilidades/build-errors-nextjs/SKILL.md +0 -5
  36. package/habilidades/changelog-generator/SKILL.md +174 -179
  37. package/habilidades/checklist-seguridad/SKILL.md +0 -5
  38. package/habilidades/contenedores-docker/SKILL.md +0 -5
  39. package/habilidades/datos-etl/SKILL.md +0 -5
  40. package/habilidades/doc-sync/SKILL.md +0 -5
  41. package/habilidades/extractor-de-aprendizajes/SKILL.md +0 -5
  42. package/habilidades/fastapi-experto/SKILL.md +0 -5
  43. package/habilidades/frontend-avanzado/SKILL.md +0 -5
  44. package/habilidades/iam-secretos/SKILL.md +0 -5
  45. package/habilidades/manejo-errores/SKILL.md +0 -5
  46. package/habilidades/mapear-codebase/SKILL.md +0 -5
  47. package/habilidades/meta-skills-estandar/SKILL.md +0 -5
  48. package/habilidades/monitoring-alertas/SKILL.md +0 -5
  49. package/habilidades/nextjs-experto/SKILL.md +0 -5
  50. package/habilidades/nextjs-testing/SKILL.md +0 -5
  51. package/habilidades/node-experto/SKILL.md +0 -5
  52. package/habilidades/orquestacion-async/SKILL.md +0 -5
  53. package/habilidades/patrones-python/SKILL.md +227 -232
  54. package/habilidades/planear-fase/SKILL.md +336 -341
  55. package/habilidades/postgresql-experto/SKILL.md +0 -5
  56. package/habilidades/prevencion-sobreingenieria/SKILL.md +0 -5
  57. package/habilidades/protocolo-revision-swl/SKILL.md +0 -5
  58. package/habilidades/react-experto/SKILL.md +0 -5
  59. package/habilidades/release-semver/SKILL.md +0 -5
  60. package/habilidades/swl-claudemd/SKILL.md +10 -11
  61. package/habilidades/tdd-workflow/SKILL.md +710 -715
  62. package/habilidades/testing-python/SKILL.md +335 -340
  63. package/habilidades/verificar-trabajo/SKILL.md +0 -5
  64. package/hooks/lib/evolution-tracker.js +191 -35
  65. package/hooks/lib/propose-step.js +1 -0
  66. package/llms.txt +1 -1
  67. package/manifiestos/canonical-hashes.json +656 -0
  68. package/manifiestos/modulos.json +3 -0
  69. package/manifiestos/skills-lock.json +71 -71
  70. package/package.json +1 -1
  71. package/plugin.json +1 -1
  72. package/scripts/auditar-claudemd.js +38 -0
  73. package/scripts/cli/aprobar-plan.js +73 -0
  74. package/scripts/cli/briefing.js +23 -0
  75. package/scripts/cli/ciclo-evolucion.js +26 -0
  76. package/scripts/cli/configurar-ci.js +40 -0
  77. package/scripts/cli/derivar-feature-list.js +25 -0
  78. package/scripts/cli/detectar-host.js +27 -0
  79. package/scripts/cli/diary-entry.js +69 -0
  80. package/scripts/cli/execution-state.js +18 -0
  81. package/scripts/cli/gateway-notify.js +41 -0
  82. package/scripts/cli/liberar-fase.js +42 -0
  83. package/scripts/cli/loop-telemetry.js +125 -0
  84. package/scripts/cli/mark-evolved.js +56 -0
  85. package/scripts/cli/metricas-dora.js +26 -0
  86. package/scripts/cli/near-duplicate.js +55 -0
  87. package/scripts/cli/notificaciones.js +123 -0
  88. package/scripts/cli/propose-step.js +29 -0
  89. package/scripts/cli/schedule-parse.js +19 -0
  90. package/scripts/cli/sugerir-modelo.js +20 -0
  91. package/scripts/cli/verificar-plan.js +36 -0
  92. package/scripts/cli/verificar-trazabilidad.js +35 -0
  93. package/scripts/derivar-feature-list.js +1 -0
  94. package/scripts/generar-canonical-hashes.js +147 -0
  95. package/scripts/instalador.js +126 -53
  96. package/scripts/lib/audit-evolved.js +71 -0
  97. package/scripts/lib/auditar-invocaciones-comandos.js +104 -0
  98. package/scripts/lib/canonical-hash.js +94 -0
  99. package/scripts/lib/evolved-fuente.js +138 -0
  100. package/scripts/lib/resolver-plan-fase.js +37 -0
  101. package/scripts/remediar-evolved-instaladas.js +239 -0
  102. package/scripts/validar.js +27 -0
  103. package/scripts/verificar-evolucion.js +36 -0
  104. package/scripts/verificar-release.js +33 -0
  105. package/scripts/verificar-trazabilidad.js +1 -1
  106. package/agentes/.evolved.json +0 -9
  107. package/comandos/swl/.evolved.json +0 -23
  108. package/habilidades/auth-patrones/.evolved.json +0 -9
  109. package/habilidades/extractor-de-aprendizajes/.evolved.json +0 -9
  110. package/habilidades/instalar-sistema/.evolved.json +0 -9
  111. package/habilidades/manejo-errores/.evolved.json +0 -9
  112. package/habilidades/node-experto/.evolved.json +0 -9
  113. package/habilidades/release-semver/.evolved.json +0 -9
@@ -1,715 +1,710 @@
1
- ---
2
- name: tdd-workflow
3
- description: Flujo completo de Test-Driven Development. Ciclo RED (el test falla) → GREEN (implementación mínima) → REFACTOR (limpieza). Incluye cobertura mínima obligatoria, tests de frontera, factories, fixtures y estrategias para diferentes tipos de código (APIs, services, componentes Angular).
4
- version: "1.2.1"
5
- evolved: true
6
- evolved-from: "1.1.0"
7
- evolved-at: "2026-06-11"
8
- evolved-by: "fase-10-slice-2"
9
- evolved-note: "v1.2.0: sección 'Evidencia RED en telemetría' (gate G2, ADR-0035, cierra F-TDD-6) registro de corridas tdd-* en loop-telemetry. v1.0.5: gotcha 'Tests E2E de CLIs interactivos sin PTY real'. Origen M2 sesión 2026-05-16. v1.0.4: silenced tests por race en path único compartido. v1.0.3: gotcha cwd cacheado al require()."
10
- herramientasPermitidas: [Read, Bash]
11
- evolvable: true # default para skill estandar
12
- exclusiones:
13
- - "No cargar para escribir tests de regresión sobre código legacy sin suite existente — en código legacy sin tests, comenzar con caracterización de comportamiento actual antes del ciclo TDD."
14
- - "No cargar para pruebas de carga o performance testing — para benchmarks y load testing cargar `performance-baseline`."
15
- - "No cargar para configurar pipelines de CI/CD o runners de tests en GitHub Actions / GitLab CI — para configuración de CI cargar el skill de cloud correspondiente."
16
- - "No cargar para pruebas de seguridad o fuzzing automático — para testing de seguridad cargar `threat-model-lite` y usar herramientas especializadas (Bandit, OWASP ZAP)."
17
- ---
18
- # Habilidad: TDD Workflow Completo
19
-
20
- ## Cuándo NO cargar
21
-
22
- - La tarea es añadir tests a código legacy sin suite existente: comenzar con tests de caracterización del comportamiento actual antes del ciclo TDD.
23
- - La tarea es pruebas de carga o benchmarks: cargar `performance-baseline`.
24
- - La tarea es configurar CI/CD pipelines: cargar el skill de cloud correspondiente.
25
- - La tarea es fuzzing o testing de seguridad: cargar `threat-model-lite` y usar herramientas especializadas.
26
-
27
- ## Propósito
28
-
29
- TDD no es "escribir tests después" ni "escribir tests antes por costumbre". Es
30
- un método de diseño donde los tests guían la API pública del código antes de
31
- que exista la implementación. El resultado es código que hace exactamente lo
32
- que los tests exigen ni más, ni menos.
33
-
34
- ## Cuándo activar
35
-
36
- - CONTEXT.md o PLAN.md indica que la fase requiere TDD
37
- - Se implementa lógica de negocio crítica (cálculos, validaciones, permisos)
38
- - El usuario pide explícitamente TDD
39
- - Se trabaja en un módulo con historial de bugs
40
-
41
- ---
42
-
43
- ## Etapa opcional previa: Gherkin (BDD) y gate de mutación
44
-
45
- Dos extensiones opt-in del ciclo, ambas con guía completa en recursos:
46
-
47
- - **Antes del ciclo** si la fase tiene criterios de aceptación de negocio,
48
- convertirlos en escenarios Given–When–Then validados por el usuario ANTES de
49
- implementar; cada escenario es el test RED de su criterio. Guía, runners por
50
- stack y anti-patrones en [recursos/gherkin-bdd.md](recursos/gherkin-bdd.md).
51
- - **Después del ciclo** en módulos críticos, verificar la calidad de los
52
- asserts con mutation testing incremental sobre el diff:
53
- `Skill("calidad-mutation-testing")`. La cobertura mide ejecución; los
54
- mutantes sobrevivientes miden si los tests detectarían un bug.
55
-
56
- ## El ciclo fundamental RED → GREEN → REFACTOR
57
-
58
- ### Fase RED El test debe fallar por la razón correcta
59
-
60
- **Paso 1**: Escribir el test que describe el comportamiento esperado.
61
-
62
- ```python
63
- # RED: Este test falla porque calcular_descuento no existe todavía
64
- def test_descuento_cliente_premium_es_15_porciento():
65
- cliente = ClienteFactory(tipo="premium")
66
- resultado = calcular_descuento(cliente, monto=100.0)
67
- assert resultado == 15.0
68
- ```
69
-
70
- **Verificar que el test falla BIEN**:
71
- - Falla con `NameError` o `ImportError` si la función no existe: CORRECTO
72
- - Falla con `AssertionError` si el comportamiento es incorrecto: CORRECTO
73
- - Falla con `TypeError` si la firma es incorrecta: CORRECTO
74
- - Pasa sin que exista implementación: SEÑAL DE ALARMA — el test no prueba nada
75
-
76
- **NUNCA avanzar a GREEN si el test pasa en RED.**
77
-
78
- #### Evidencia RED en telemetría (gate G2 — proyectos con SWL)
79
-
80
- El RED debe dejar rastro verificable (cierra F-TDD-6: "TDD declarativo sin
81
- evidencia"). En proyectos con `.planning/`, registrar la corrida en
82
- `hooks/lib/loop-telemetry.js` ANTES de pasar a GREEN:
83
-
84
- ```bash
85
- # Una vez por fase/tarea — abre la corrida
86
- node -e "const lt=require('./hooks/lib/loop-telemetry');const r=lt.iniciarCorrida({tipo:'tdd',direccion:'lower_is_better',config:{fase:'0N',tarea:'T-NN'}});console.log(r.dir)"
87
-
88
- # Al confirmar el RED — métrica = número de tests fallando, descripción = fallo exacto
89
- node -e "const lt=require('./hooks/lib/loop-telemetry');lt.registrarIteracion('<dir>',{iteracion:0,metrica:N,delta:0,estado:'baseline',descripcion:'RED T-NN: <error textual del runner>'})"
90
-
91
- # Al llegar a GREEN
92
- node -e "const lt=require('./hooks/lib/loop-telemetry');lt.registrarIteracion('<dir>',{iteracion:1,metrica:0,delta:-N,estado:'keep',descripcion:'GREEN T-NN: suite verde'})"
93
- ```
94
-
95
- `hooks/tdd-gate.js` (warn-only, ADR-0035) busca la fila RED en
96
- `.planning/loops/tdd-*/iteraciones.tsv` al commitear un feature con tests; sin
97
- evidencia emite nudge `tdd-red-evidence`. Sin `.planning/` no aplica.
98
-
99
- #### Marker de trazabilidad REQ en tests (proyectos con REQ-IDs)
100
-
101
- Cuando la fase tiene criterios `REQ-NN` (fases 01-11) o `REQ-<fase>-NN`
102
- (namespaceados, fases ≥12 — DT-IDS-NAMESPACE) en el CONTEXTO, cada test que
103
- verifica un criterio lleva el marker en comentario —
104
- `scripts/verificar-trazabilidad.js` lo usa para cerrar la cadena
105
- REQ→T→commit→test (reconoce ambos formatos):
106
-
107
- ```python
108
- def test_descuento_cliente_premium():
109
- # verifica: REQ-12-03
110
- ...
111
- ```
112
-
113
- ```javascript
114
- test('descuento cliente premium', () => {
115
- // verifica: REQ-12-03
116
- ...
117
- });
118
- ```
119
-
120
- ### Fase GREEN Implementación mínima
121
-
122
- **Regla de oro**: Implementar solo lo que hace pasar el test. Nada más.
123
-
124
- ```python
125
- # GREEN: Implementación mínima que hace pasar el test
126
- def calcular_descuento(cliente: Cliente, monto: float) -> float:
127
- if cliente.tipo == "premium":
128
- return monto * 0.15
129
- return 0.0
130
- ```
131
-
132
- **Anti-patrón GREEN**: implementar todos los casos de una vez sin tests que los
133
- exijan. Si no hay un test para clientes "gold", no implementes el descuento gold.
134
-
135
- **Verificar**: `pytest -v test_descuentos.py` pasa con el test nuevo.
136
-
137
- ### Fase REFACTOR Limpieza sin cambiar comportamiento
138
-
139
- **Qué refactorizar en esta fase**:
140
- - Nombres de variables o funciones poco claros
141
- - Duplicación de lógica (si ya existe en otro test)
142
- - Magic numbers que deberían ser constantes
143
- - Estructura de código que anticipa el próximo test
144
-
145
- ```python
146
- # REFACTOR: Extraer constante y mejorar legibilidad
147
- DESCUENTO_POR_TIPO = {
148
- "premium": 0.15,
149
- "gold": 0.20,
150
- "standard": 0.0,
151
- }
152
-
153
- def calcular_descuento(cliente: Cliente, monto: float) -> float:
154
- tasa = DESCUENTO_POR_TIPO.get(cliente.tipo, 0.0)
155
- return monto * tasa
156
- ```
157
-
158
- **Verificar**: todos los tests siguen pasando después del refactor.
159
-
160
- ---
161
-
162
- ## Tests de frontera (boundary tests)
163
-
164
- Para toda función que procesa datos, escribir tests de:
165
-
166
- | Tipo de frontera | Ejemplo |
167
- |----------------|---------|
168
- | Valor cero | `monto=0.0` |
169
- | Valor negativo | `monto=-100.0` |
170
- | Valor máximo | `monto=999_999_999.99` |
171
- | String vacío | `nombre=""` |
172
- | None / null | `cliente=None` |
173
- | Lista vacía | `items=[]` |
174
- | Un solo elemento | `items=[item]` |
175
- | Muchos elementos | `items=lista_de_10000` |
176
- | Valor fuera de dominio | `tipo="inexistente"` |
177
- | Caracteres especiales | `nombre="<script>alert(1)</script>"` |
178
-
179
- ---
180
-
181
- ## Factories y Fixtures
182
-
183
- ### Factories (para datos de test)
184
-
185
- Las factories crean objetos con valores válidos por defecto. Los tests solo
186
- sobreescriben lo que importa para ese test específico.
187
-
188
- **Python con factory_boy**:
189
- ```python
190
- import factory
191
- from myapp.models import Cliente, Pedido
192
-
193
- class ClienteFactory(factory.Factory):
194
- class Meta:
195
- model = Cliente
196
-
197
- id = factory.Sequence(lambda n: f"cliente-{n}")
198
- nombre = factory.Faker("name", locale="es_MX")
199
- email = factory.Faker("email")
200
- tipo = "standard" # default explícito
201
- activo = True
202
-
203
- # Uso en test
204
- def test_descuento_premium():
205
- # Solo especificar lo que importa para este test
206
- cliente = ClienteFactory(tipo="premium")
207
- assert calcular_descuento(cliente, 100.0) == 15.0
208
- ```
209
-
210
- **TypeScript con factory functions**:
211
- ```typescript
212
- // factories/user.factory.ts
213
- export const createUser = (overrides: Partial<User> = {}): User => ({
214
- id: 'user-1',
215
- name: 'Test User',
216
- email: 'test@example.com',
217
- role: 'standard',
218
- active: true,
219
- ...overrides,
220
- });
221
-
222
- // Uso en test
223
- it('should show admin panel for admin users', () => {
224
- const user = createUser({ role: 'admin' });
225
- // ...
226
- });
227
- ```
228
-
229
- ### Fixtures (para estado persistente)
230
-
231
- ```python
232
- # conftest.py
233
- import pytest
234
- from sqlalchemy.ext.asyncio import AsyncSession
235
-
236
- @pytest.fixture
237
- async def db_session():
238
- """Sesión de BD en transacción que hace rollback al terminar."""
239
- async with AsyncSessionLocal() as session:
240
- async with session.begin():
241
- yield session
242
- await session.rollback()
243
-
244
- @pytest.fixture
245
- async def cliente_premium(db_session: AsyncSession):
246
- """Cliente premium persistido en BD de test."""
247
- cliente = ClienteFactory.build(tipo="premium")
248
- db_session.add(cliente)
249
- await db_session.flush()
250
- return cliente
251
- ```
252
-
253
- ---
254
-
255
- ## TDD por tipo de código
256
-
257
- ### Services (lógica de negocio)
258
-
259
- ```python
260
- # Orden de tests para un service nuevo:
261
- # 1. Caso feliz principal
262
- # 2. Validaciones de input inválido
263
- # 3. Casos de borde del dominio
264
- # 4. Interacciones con dependencias (mocks)
265
-
266
- @pytest.mark.asyncio
267
- async def test_crear_pedido_valida_stock_disponible():
268
- producto = ProductoFactory(stock=5)
269
- with pytest.raises(StockInsuficienteError):
270
- await PedidoService.crear(producto_id=producto.id, cantidad=10)
271
- ```
272
-
273
- ### Endpoints FastAPI
274
-
275
- ```python
276
- # Usar TestClient de FastAPI
277
- from fastapi.testclient import TestClient
278
-
279
- def test_endpoint_requiere_autenticacion():
280
- response = client.get("/api/v1/pedidos")
281
- assert response.status_code == 401
282
-
283
- def test_endpoint_retorna_solo_pedidos_del_usuario(cliente_autenticado):
284
- pedido_propio = PedidoFactory(usuario_id=cliente_autenticado.id)
285
- pedido_ajeno = PedidoFactory(usuario_id="otro-usuario")
286
-
287
- response = cliente_autenticado.get("/api/v1/pedidos")
288
- ids = [p["id"] for p in response.json()["items"]]
289
-
290
- assert pedido_propio.id in ids
291
- assert pedido_ajeno.id not in ids # IDOR check
292
- ```
293
-
294
- ### Componentes Angular
295
-
296
- ```typescript
297
- // Usar TestBed + ComponentHarness
298
- describe('PedidosComponent', () => {
299
- it('should display empty state when no orders exist', async () => {
300
- const mockService = { getPedidos: () => of({ items: [], total: 0 }) };
301
- await TestBed.configureTestingModule({
302
- providers: [{ provide: PedidosService, useValue: mockService }]
303
- }).compileComponents();
304
-
305
- const fixture = TestBed.createComponent(PedidosComponent);
306
- fixture.detectChanges();
307
-
308
- const emptyState = fixture.nativeElement.querySelector('[data-testid="empty-state"]');
309
- expect(emptyState).toBeTruthy();
310
- });
311
- });
312
- ```
313
-
314
- ---
315
-
316
- ## Cobertura mínima obligatoria
317
-
318
- | Tipo de módulo | Cobertura mínima |
319
- |---------------|-----------------|
320
- | Services (lógica crítica) | 90% |
321
- | Endpoints (API) | 85% |
322
- | Utilities / helpers | 95% |
323
- | Componentes Angular | 75% |
324
- | Modelos ORM | 70% |
325
-
326
- **Verificar** con reporte de cobertura antes de marcar tarea como completada:
327
- ```bash
328
- pytest --cov=src/services --cov-fail-under=90
329
- ```
330
-
331
- ---
332
-
333
- ## Anti-patrones TDD a evitar
334
-
335
- | Anti-patrón | Descripción | Solución |
336
- |-------------|-------------|---------|
337
- | Test del mock | El test solo verifica que se llamó el mock, no el comportamiento real | Testear el efecto observable |
338
- | Test omnibus | Un solo test que verifica 10 cosas a la vez | Un test, un comportamiento |
339
- | Test frágil | Falla si cambias nombres internos sin cambiar comportamiento | Testear comportamiento, no implementación |
340
- | Fixture global | Un fixture que modifica estado global compartido entre tests | Fixtures con scope limitado, rollback |
341
- | Skip como solución | `@pytest.mark.skip` para tests que fallan | Arreglar el bug o eliminar el test |
342
-
343
- ---
344
-
345
- ## Gotchas / Errores comunes no obvios
346
-
347
- **El ciclo TDD se rompe cuando el test en fase RED pasa sin implementación porque la función ya existe con otro nombre en el módulo y Python la importa silenciosamente desde un namespace diferente**: escribir `from app.services import calcular_descuento` en el test cuando `calcular_descuento` ya existe en `app.utils` (importada en `__init__.py`) hace que el test pase en RED sin error, invalidando el ciclo. Causa: los imports con `from app.services import *` en `__init__.py` pueden re-exportar funciones de submódulos, haciendo que el test encuentre una implementación inesperada. Fix: verificar con `python -c "from app.services import calcular_descuento; print(calcular_descuento.__module__)"` que el símbolo viene del módulo correcto. Usar imports explícitos en los tests (`from app.services.descuentos import calcular_descuento`) en lugar de imports de paquete.
348
-
349
- **`pytest.mark.asyncio` con `asyncio_mode = "auto"` en `pytest.ini` hace que fixtures síncronos que retornan coroutines sean llamados sin `await`, causando que el fixture entregue un objeto coroutine en lugar del valor esperado**: un fixture `def cliente_premium(db_session)` que retorna `ClienteFactory.build(tipo="premium")` funciona, pero si accidentalmente se define como `async def cliente_premium(db_session)` y se usa en un test síncrono, pytest lo trata como fixture síncrono y el test recibe el objeto coroutine. Causa: la mezcla de fixtures `async def` y `def` en el mismo `conftest.py` con `asyncio_mode = "auto"` puede crear comportamientos inesperados dependiendo de la versión de `pytest-asyncio`. Fix: en proyectos async, definir TODOS los fixtures relevantes como `async def` explícitamente y verificar que el test use `@pytest.mark.asyncio` o tenga el modo auto configurado correctamente.
350
-
351
- **La fase REFACTOR del ciclo TDD en componentes Angular introduce regresiones silenciosas cuando se extrae lógica a un `computed()` pero el template sigue usando la función directa que ahora devuelve `undefined`**: refactorizar `getTotal()` como método del componente hacia `total = computed(() => ...)` y olvidar actualizar el template de `{{ getTotal() }}` a `{{ total() }}` no genera error de compilación con Angular 17+; el template simplemente muestra `undefined`. Causa: Angular no verifica en tiempo de compilación que los métodos referenciados en templates existen en la clase si el template usa la sintaxis de interpolación sin type-checking estricto. Fix: activar `strictTemplates: true` en `tsconfig.app.json` para que el compilador de Angular valide que todas las referencias en templates corresponden a miembros públicos del componente. Ejecutar `ng build` antes de considerar el REFACTOR completo.
352
-
353
- **`db_session.rollback()` en el fixture de pytest-asyncio no deshace los datos insertados por `db.flush()` dentro de la función testeada cuando la sesión usa `autocommit=True` implícito por configuración del engine**: algunos proyectos configuran `AsyncEngine` con `isolation_level="AUTOCOMMIT"` para compatibilidad con operaciones DDL; en ese contexto, cada `flush()` hace commit inmediatamente y el `rollback()` del fixture no puede deshacer esos cambios. Causa: `AUTOCOMMIT` en PostgreSQL significa que no hay transacción activa que se pueda revertir. Fix: verificar que el engine de tests NO use `isolation_level="AUTOCOMMIT"` (la configuración debe ser solo para el engine de migraciones Alembic, no para el de la app). Para tests que necesitan AUTOCOMMIT por alguna razón, usar una BD de test separada que se trunca con `TRUNCATE ... RESTART IDENTITY CASCADE` en el teardown del fixture.
354
-
355
- **Reloj inyectable como parámetro `ahora` habilita tests deterministas sin `freezegun`, `jest.useFakeTimers()` ni `sinon.useFakeTimers()`** [PATRÓN VALIDADO en SWL Opción C webhook]: cuando una API depende del tiempo (rate-limit con bucket que se rellena, dedup con ventana de retención, cache con TTL, schedulers), recibir el timestamp por parámetro en lugar de llamar `Date.now()` internamente permite que los tests pasen 1000 segundos en 0 ms reales. Diseño: `metodo(arg1, arg2, ahora = Date.now())` — producción no cambia (llamadas siguen siendo `obj.consumir(1)`), tests pasan `ahora` explícito (`obj.consumir(1, T0 + 5000)`). Validado en 3 módulos esta sesión: `rate-limit-ip.js` (40+ tests bucket refill, capacidad, cleanup), `webhook-dedup.js` (ventana de retención, rotación idempotente), helpers internos de `webhook-server.js`. Ningún test usa `sleep`, ningún test es flaky, ningún test mockea `Date`. Aplicable a JS/TS y a Python (`def consumir(self, tokens, ahora=None)` con `ahora = ahora or datetime.now(UTC)` al inicio).
356
-
357
- ```js
358
- // MAL test no-determinista, requiere sleep o mock global
359
- class Bucket {
360
- consumir(n) {
361
- const ahora = Date.now(); // ← imposible de controlar desde el test
362
- this._rellenar(ahora);
363
- if (this.tokens >= n) { this.tokens -= n; return true; }
364
- return false;
365
- }
366
- }
367
-
368
- // BIEN — reloj inyectable, test determinista
369
- class Bucket {
370
- consumir(n, ahora = Date.now()) { // ← default en producción, inyectable en test
371
- this._rellenar(ahora);
372
- if (this.tokens >= n) { this.tokens -= n; return true; }
373
- return false;
374
- }
375
- }
376
-
377
- // En el test:
378
- const T0 = 1700000000000;
379
- const b = new Bucket(10, 1, T0);
380
- for (let i = 0; i < 10; i++) b.consumir(1, T0); // saturar
381
- assert.equal(b.consumir(1, T0), false); // sin refill aún
382
- assert.equal(b.consumir(5, T0 + 5000), true); // 5 seg después: 5 tokens
383
- ```
384
-
385
- Aplica también a tests de clock skew (tiempo retrocede por NTP): pasar `T0 - 1000` y validar que la lógica no rompe. Origen: rate-limit-ip.js + webhook-dedup.js sesión 2026-05-13.
386
-
387
- **Tests nombrados por feature (`test_emitir_factura_exitosa`) pierden poder regresivo; nombrados por causa raíz (`test_repository_no_usa_columna_inexistente_p_monto`) detectan regresiones específicas sin reproducción manual** [CONFIRMADO en SIGM Opción C F1.4]: cuando se descubre un bug por una causa raíz concreta (typo en nombre de columna SQL, omisión de `selectinload`, mock que devuelve dict en vez de objeto, schema obsoleto), el test de regresión que se escribe debe llevar el nombre de la causa, no del feature afectado. Caso real: durante F1.4 de SIGM, el repository de pagos referenciaba `p.monto` cuando la columna se llamaba `p.monto_pagado`; el test escrito como `test_repository_no_usa_columna_inexistente_p_monto` falló inmediatamente en la siguiente sesión cuando otro agente reintrodujo el typo, sin necesidad de reproducir el escenario de negocio (emitir cobro real, verificar respuesta). Causa: los nombres orientados a feature (`test_pago_exitoso`) son ambiguos sobre QUÉ falla — si el test falla, el desarrollador debe diagnosticar; los nombres orientados a causa raíz (`test_X_no_usa_Y`, `test_query_incluye_selectinload_Z`, `test_service_devuelve_dict_no_objeto`) son auto-diagnósticos. Fix: para cada bug que cueste >30 min diagnosticar, escribir UN test adicional cuyo nombre describa la condición técnica violada, no el escenario de negocio. Convención: `test_<componente>_<condicion_tecnica>` o `test_<componente>_no_<anti_patron>`. Estos tests son tu segunda línea de defensa contra regresiones de la misma causa raíz, complementarios a los tests de comportamiento.
388
-
389
- **`process.cwd()` cacheado al `require()` rompe tests con `process.chdir(sandbox)`** [PATRÓN GENÉRICO TESTING CLI]: scripts Node exportables que leen `process.cwd()` en el scope del módulo (al cargar) congelan el cwd al directorio de invocación. Los tests que crean sandboxes con `fs.mkdtempSync()` y luego `process.chdir(sandbox)` no afectan al cwd cacheado — el script sigue leyendo del cwd original y los assertions fallan con paths inesperados. Caso real (swl-ses `scripts/derivar-feature-list.js` 2026-05-15): la función `enriquecerDesdeFases(fases)` leía `const CWD = process.cwd()` calculado al `require()`; 2 tests con `process.chdir(sandbox)` retornaron `[]` en lugar de detectar el PLAN.md fixture. Causa: el constante se evaluó cuando el `node --test` cargó el módulo desde el cwd del proyecto, no desde el sandbox del test individual. Fix obligatorio: funciones exportables deben aceptar `cwd` como parámetro opcional con fallback dinámico (`function fn(args, opciones = {}) { const cwd = opciones.cwd || process.cwd(); ... }`). El código de producción no cambia (sin args extras), pero los tests pueden inyectar el cwd correcto. Aplica también a Python (`def fn(args, cwd: str | None = None): cwd = cwd or os.getcwd()`) y a cualquier lenguaje con tests que usen chdir.
390
-
391
- ```js
392
- // MAL cwd cacheado al require, tests con process.chdir() fallan
393
- const CWD = process.cwd();
394
- const PLANNING_DIR = path.join(CWD, '.planning');
395
-
396
- function enriquecerDesdeFases(fases) {
397
- const archivos = fs.readdirSync(path.join(PLANNING_DIR, 'fases')); // cwd congelado
398
- // ...
399
- }
400
-
401
- // BIEN — cwd dinámico con parámetro opcional para tests
402
- function enriquecerDesdeFases(fases, opciones = {}) {
403
- const cwd = opciones.cwd || process.cwd(); // recalcula al llamar
404
- const archivos = fs.readdirSync(path.join(cwd, '.planning', 'fases'));
405
- // ...
406
- }
407
-
408
- // En el test (usa setupSandboxes — regla tests-cleanup.md):
409
- const { setupSandboxes } = require('../_helpers/sandbox');
410
- const sandboxes = setupSandboxes('swl-test-');
411
-
412
- const sandbox = sandboxes.create();
413
- fs.mkdirSync(path.join(sandbox, '.planning', 'fases'), { recursive: true });
414
- // Opción A: pasar cwd explícito (recomendado)
415
- const r = enriquecerDesdeFases([], { cwd: sandbox });
416
- // Opción B: process.chdir() — solo funciona con cwd dinámico
417
- process.chdir(sandbox);
418
- const r2 = enriquecerDesdeFases([]);
419
- // Cleanup automático al final del archivo vía after() registrado por setupSandboxes.
420
- ```
421
-
422
- ---
423
-
424
- ## Gotcha: silenced tests por race condition sobre estado compartido
425
-
426
- ### El anti-patrón
427
-
428
- ```javascript
429
- // MAL assertion condicional dentro de if que puede ser false por race
430
- const FLAG = path.join(os.tmpdir(), 'mi-app.json');
431
-
432
- test('flag sin contenido emite warning', () => {
433
- borrarFlag();
434
- const res = correrSubproceso();
435
- if (fs.existsSync(FLAG)) { // ← otro test paralelo creó el flag
436
- assert.match(res.stdout, /WARN/); // NUNCA se ejecuta si el if es false
437
- }
438
- // sin else test PASA sin haber validado nada
439
- });
440
-
441
- // El test "verde" no significa "pasó" — significa "no falló ninguna assertion".
442
- // Si la assertion vive dentro de un `if (race)`, una race favorable la salta
443
- // y el test es vacío.
444
- ```
445
-
446
- ### Por qué pasa
447
-
448
- `node:test` paraleliza **archivos** `.test.js` por default (no tests dentro
449
- del mismo archivo). Si dos archivos tocan el mismo path único de filesystem
450
- (`/tmp/foo.json`, lockfiles, sockets), las operaciones se intercalan no
451
- deterministamente. Patrones típicos:
452
-
453
- - Archivo A: `borrarFlag()` spawn subprocess → assert
454
- - Archivo B: spawn subprocess → `crearFlag()` durante A → assert de A condicionado falla
455
-
456
- ### Patrones correctos
457
-
458
- **Patrón 1 Aislamiento por path único** (recomendado):
459
-
460
- ```javascript
461
- const { setupSandboxes } = require('../_helpers/sandbox');
462
- const sandboxes = setupSandboxes('swl-mi-app-test-');
463
- const env = { ...process.env };
464
-
465
- // Path único por test usando el helper canónico (regla tests-cleanup.md).
466
- // El cleanup es automático al final del archivo vía after() registrado.
467
- const dir = sandboxes.create();
468
- env.MI_APP_FLAG_PATH = path.join(dir, 'flag.json');
469
-
470
- const res = spawnSync('node', [BIN], { env, ... });
471
-
472
- // Ahora el assert es incondicional el path es del test, no compartido
473
- assert.match(res.stdout, /WARN/);
474
- ```
475
-
476
- Requiere que el SUT (System Under Test) honre una env var para override
477
- del path. Si no la honra, agregar el override es parte del fix.
478
-
479
- **Patrón 2 — Serialización forzada** (cuando el path es hardcoded):
480
-
481
- ```bash
482
- # Forzar --test-concurrency=1 en la suite completa
483
- node --test --test-concurrency=1 tests/
484
- ```
485
-
486
- Tradeoff: tests más lentos pero deterministas. Aceptable si el aislamiento
487
- no es factible (legacy code).
488
-
489
- **Patrón 3 — assertions incondicionales** con setup determinista:
490
-
491
- ```javascript
492
- // MAL
493
- if (fs.existsSync(FLAG)) assert.match(...)
494
-
495
- // BIEN — setup garantiza la precondición, assertion no se salta
496
- escribirFlag({ ... });
497
- assert.ok(fs.existsSync(FLAG), 'precondición del test'); // assertion sobre el setup
498
- const res = correrSubproceso();
499
- assert.match(res.stdout, /WARN/); // ← assertion incondicional sobre el resultado
500
- ```
501
-
502
- ### Anti-patrón: `if (X) assert(Y)` sin `else`
503
-
504
- ```javascript
505
- // MAL — un test que pasa silenciosamente cuando X es false
506
- test('hace algo', () => {
507
- const algo = obtenerAlgo();
508
- if (algo) { // ← race u otra fuente de no-determinismo
509
- assert.equal(algo.valor, 42);
510
- }
511
- // sin else → veredicto "pass" sin haber validado nada
512
- });
513
-
514
- // BIEN — el setup garantiza la precondición o el test falla explícito
515
- test('hace algo', () => {
516
- const algo = obtenerAlgo();
517
- assert.ok(algo, 'precondición: obtenerAlgo debe devolver valor');
518
- assert.equal(algo.valor, 42);
519
- });
520
- ```
521
-
522
- **Regla**: una assertion dentro de un `if` sin `else` es **un test que
523
- puede pasar sin validar nada**. Estos "silenced tests" son la peor clase
524
- de falsa cobertura: el reporter dice "pass" y nadie revisa el código
525
- hasta que un bug llega a producción.
526
-
527
- ### Detección
528
-
529
- - Buscar `if (` dentro de cuerpos de `test(...)`/`it(...)` sin `else { fail() }`
530
- o `else { assert(...) }` correspondiente.
531
- - Si el cuerpo del `if` contiene `assert.*`, considerarlo silenced test
532
- hasta que se demuestre que el `if` no puede ser false en ningún escenario.
533
-
534
- ### Origen
535
-
536
- Detectado en sesión 2026-05-16 del proyecto swl-ses (PR #30): tests del
537
- flag `swl-ses-update-check.json` compartido entre dos archivos `.test.js`
538
- paralelos. El test "sin flag → debe advertir" pasaba en CI cuando otro
539
- archivo creaba el flag, sin ejecutar ninguna assertion. Fix: env var
540
- `SWL_UPDATE_FLAG_PATH` para aislamiento + assertions incondicionales.
541
-
542
- ---
543
-
544
- ## Tests E2E de CLIs interactivos sin PTY real
545
-
546
- ### El problema
547
-
548
- Probar un CLI interactivo (TUI con `readline`, prompts, keypress events,
549
- `process.stdin.isTTY`) en CI requiere normalmente un **pseudo-terminal
550
- emulado** (PTY) usualmente vía `node-pty`, una dependencia **nativa** que:
551
-
552
- - Requiere compilación de extensiones C++ al instalar (puede fallar en
553
- contenedores minimal o en Windows sin Visual Studio Build Tools).
554
- - Agrega ~5 MB al `node_modules` por imagen.
555
- - Hace que el test suite no corra en `npm test` sin setup extra.
556
-
557
- Para CLIs interactivos donde no se necesita probar **el comportamiento
558
- real del terminal** (escape codes, redibujado, scroll), sino solo la
559
- **lógica del wizard** (¿qué pasa si el usuario presiona Esc en el paso 3?,
560
- ¿qué resuelve el promise tras Enter con default?), un harness TTY mockeado
561
- cubre ~90% de los casos sin dep nativa.
562
-
563
- ### Patrón del harness
564
-
565
- ```javascript
566
- // tests/harness-tty.js
567
- 'use strict';
568
-
569
- const readline = require('readline');
570
-
571
- function crearHarness() {
572
- // 1. Capturar estado original para restauración
573
- const stdoutOriginal = process.stdout.write.bind(process.stdout);
574
- const isTtyStdoutOriginal = process.stdout.isTTY;
575
- const isTtyStdinOriginal = process.stdin.isTTY;
576
- const setRawModeOriginal = process.stdin.setRawMode
577
- ? process.stdin.setRawMode.bind(process.stdin) : null;
578
- const emitKeypressOriginal = readline.emitKeypressEvents;
579
-
580
- let capturado = '';
581
- let listenersKeypress = [];
582
-
583
- // 2. Forzar TTY antes de cargar módulos UI (que evalúan ES_TTY al require)
584
- Object.defineProperty(process.stdout, 'isTTY', { value: true, configurable: true });
585
- Object.defineProperty(process.stdin, 'isTTY', { value: true, configurable: true });
586
-
587
- // 3. Capturar stdout en string buffer
588
- process.stdout.write = (chunk) => {
589
- capturado += typeof chunk === 'string' ? chunk : chunk.toString();
590
- return true;
591
- };
592
-
593
- // 4. Mockear setRawMode/resume/pause como no-op (evita tomar control del terminal de test)
594
- process.stdin.setRawMode = () => process.stdin;
595
- process.stdin.resume = () => process.stdin;
596
- process.stdin.pause = () => process.stdin;
597
-
598
- // 5. Interceptar registros de 'keypress' para poder emitirlos a mano
599
- const onListenerOriginal = process.stdin.on.bind(process.stdin);
600
- process.stdin.on = (evento, listener) => {
601
- if (evento === 'keypress') listenersKeypress.push(listener);
602
- return onListenerOriginal(evento, listener);
603
- };
604
-
605
- // 6. Mockear readline.emitKeypressEvents (no necesita stdin real)
606
- readline.emitKeypressEvents = (stream) => stream;
607
-
608
- // 7. Limpiar require cache de módulos UI para que se evalúen con TTY=true
609
- delete require.cache[require.resolve('../scripts/tui/lib/render')];
610
-
611
- function cargarUI() {
612
- return require('../scripts/tui/lib/render');
613
- }
614
-
615
- // 8. Emitir keypress programáticamente
616
- function tecla(nombre, extras = {}) {
617
- const key = { name: nombre, ctrl: false, meta: false, shift: false, ...extras };
618
- const str = nombre.length === 1 ? nombre : '';
619
- for (const listener of [...listenersKeypress]) {
620
- try { listener(str, key); } catch (_) { /* swallow */ }
621
- }
622
- }
623
-
624
- // 9. Esperar N ticks del event loop para promesas internas
625
- function esperarTicks(n = 1) {
626
- let p = Promise.resolve();
627
- for (let i = 0; i < n; i++) p = p.then(() => undefined);
628
- return p;
629
- }
630
-
631
- function captura(opts = {}) {
632
- const valor = capturado;
633
- if (opts.limpiar) capturado = '';
634
- return valor;
635
- }
636
-
637
- function restaurar() {
638
- Object.defineProperty(process.stdout, 'isTTY', { value: isTtyStdoutOriginal, configurable: true });
639
- Object.defineProperty(process.stdin, 'isTTY', { value: isTtyStdinOriginal, configurable: true });
640
- process.stdout.write = stdoutOriginal;
641
- if (setRawModeOriginal) process.stdin.setRawMode = setRawModeOriginal;
642
- process.stdin.on = onListenerOriginal;
643
- readline.emitKeypressEvents = emitKeypressOriginal;
644
- listenersKeypress = [];
645
- // Limpiar require cache para no contaminar otros tests
646
- delete require.cache[require.resolve('../scripts/tui/lib/render')];
647
- }
648
-
649
- return { cargarUI, tecla, esperarTicks, captura, restaurar };
650
- }
651
-
652
- module.exports = { crearHarness };
653
- ```
654
-
655
- ### Uso típico
656
-
657
- ```javascript
658
- const test = require('node:test');
659
- const assert = require('node:assert/strict');
660
- const { crearHarness } = require('./harness-tty');
661
-
662
- test('preguntarSiNo con harness: Enter resuelve con default true', async () => {
663
- const h = crearHarness();
664
- try {
665
- const ui = h.cargarUI();
666
- const promesa = ui.preguntarSiNo('test prompt', true);
667
-
668
- await h.esperarTicks(2);
669
- h.tecla('return');
670
-
671
- const timeout = new Promise((_, reject) =>
672
- setTimeout(() => reject(new Error('no resolvió en 500ms')), 500));
673
-
674
- const r = await Promise.race([promesa, timeout]).catch(() => null);
675
- // r === true si el harness simuló bien; null si readline real bloquea
676
- // (caso esperado en Windows sin PTY real; documentar limitación)
677
- } finally {
678
- h.restaurar();
679
- }
680
- });
681
- ```
682
-
683
- ### Reglas operativas
684
-
685
- - **`restaurar()` en `finally`**: el harness modifica state global
686
- (process.stdout, process.stdin, readline, require.cache). Si un test
687
- no restaura, contamina los siguientes.
688
- - **Test de captura como smoke**: agregar un test "harness captura stdout"
689
- que valida que `process.stdout.write('hola')` aparece en `captura()`.
690
- Si falla, el harness está roto antes de testear el SUT.
691
- - **Test "tecla() es no-op sin listeners"**: validar que emitir keypress
692
- cuando nadie escucha NO rompe el harness ni propaga errores.
693
- - **Limitación reconocida**: si `readline.createInterface()` real toma
694
- control de stdin (en Windows con Git Bash sin PTY), el callback de
695
- `rl.question()` no se invoca aunque el harness emita teclas. Usar
696
- `Promise.race([promesa, timeout])` para que el test no cuelgue
697
- el test marca limitación, no falla.
698
-
699
- ### Cuándo NO usar este patrón
700
-
701
- - Cuando necesitas probar **redibujado real del terminal** (alt screen
702
- buffer, escape codes complejos, scrollback). Ahí sí necesitas PTY real
703
- via `node-pty` o test manual.
704
- - Cuando el SUT depende de **timing real del teclado** (input rates,
705
- paste detection). El mock no replica latencia.
706
- - Para CLIs sin lógica de control de flujo (solo `console.log` lineal)
707
- ahí basta capturar stdout sin mockear TTY.
708
-
709
- ### Origen
710
-
711
- Aplicado en swl-ses v1.6.0 (`tests/scripts/tui/harness-tty.js`, ~180 LOC).
712
- Validó el TUI completo de 5 fases sin instalar `node-pty`. Limitación
713
- documentada: 1 test E2E "preguntarSiNo con harness" marca timeout en
714
- Windows + Node 22+ porque readline real bloquea pese a stdin mockeado —
715
- el harness emite la limitación sin fallar.
1
+ ---
2
+ name: tdd-workflow
3
+ description: Flujo completo de Test-Driven Development. Ciclo RED (el test falla) → GREEN (implementación mínima) → REFACTOR (limpieza). Incluye cobertura mínima obligatoria, tests de frontera, factories, fixtures y estrategias para diferentes tipos de código (APIs, services, componentes Angular).
4
+ version: "1.2.1"
5
+ herramientasPermitidas: [Read, Bash]
6
+ evolvable: true # default para skill estandar
7
+ exclusiones:
8
+ - "No cargar para escribir tests de regresión sobre código legacy sin suite existente — en código legacy sin tests, comenzar con caracterización de comportamiento actual antes del ciclo TDD."
9
+ - "No cargar para pruebas de carga o performance testingpara benchmarks y load testing cargar `performance-baseline`."
10
+ - "No cargar para configurar pipelines de CI/CD o runners de tests en GitHub Actions / GitLab CI — para configuración de CI cargar el skill de cloud correspondiente."
11
+ - "No cargar para pruebas de seguridad o fuzzing automático — para testing de seguridad cargar `threat-model-lite` y usar herramientas especializadas (Bandit, OWASP ZAP)."
12
+ ---
13
+ # Habilidad: TDD Workflow Completo
14
+
15
+ ## Cuándo NO cargar
16
+
17
+ - La tarea es añadir tests a código legacy sin suite existente: comenzar con tests de caracterización del comportamiento actual antes del ciclo TDD.
18
+ - La tarea es pruebas de carga o benchmarks: cargar `performance-baseline`.
19
+ - La tarea es configurar CI/CD pipelines: cargar el skill de cloud correspondiente.
20
+ - La tarea es fuzzing o testing de seguridad: cargar `threat-model-lite` y usar herramientas especializadas.
21
+
22
+ ## Propósito
23
+
24
+ TDD no es "escribir tests después" ni "escribir tests antes por costumbre". Es
25
+ un método de diseño donde los tests guían la API pública del código antes de
26
+ que exista la implementación. El resultado es código que hace exactamente lo
27
+ que los tests exigen — ni más, ni menos.
28
+
29
+ ## Cuándo activar
30
+
31
+ - CONTEXT.md o PLAN.md indica que la fase requiere TDD
32
+ - Se implementa lógica de negocio crítica (cálculos, validaciones, permisos)
33
+ - El usuario pide explícitamente TDD
34
+ - Se trabaja en un módulo con historial de bugs
35
+
36
+ ---
37
+
38
+ ## Etapa opcional previa: Gherkin (BDD) y gate de mutación
39
+
40
+ Dos extensiones opt-in del ciclo, ambas con guía completa en recursos:
41
+
42
+ - **Antes del ciclo** — si la fase tiene criterios de aceptación de negocio,
43
+ convertirlos en escenarios Given–When–Then validados por el usuario ANTES de
44
+ implementar; cada escenario es el test RED de su criterio. Guía, runners por
45
+ stack y anti-patrones en [recursos/gherkin-bdd.md](recursos/gherkin-bdd.md).
46
+ - **Después del ciclo** — en módulos críticos, verificar la calidad de los
47
+ asserts con mutation testing incremental sobre el diff:
48
+ `Skill("calidad-mutation-testing")`. La cobertura mide ejecución; los
49
+ mutantes sobrevivientes miden si los tests detectarían un bug.
50
+
51
+ ## El ciclo fundamental RED GREEN REFACTOR
52
+
53
+ ### Fase RED El test debe fallar por la razón correcta
54
+
55
+ **Paso 1**: Escribir el test que describe el comportamiento esperado.
56
+
57
+ ```python
58
+ # RED: Este test falla porque calcular_descuento no existe todavía
59
+ def test_descuento_cliente_premium_es_15_porciento():
60
+ cliente = ClienteFactory(tipo="premium")
61
+ resultado = calcular_descuento(cliente, monto=100.0)
62
+ assert resultado == 15.0
63
+ ```
64
+
65
+ **Verificar que el test falla BIEN**:
66
+ - Falla con `NameError` o `ImportError` si la función no existe: CORRECTO
67
+ - Falla con `AssertionError` si el comportamiento es incorrecto: CORRECTO
68
+ - Falla con `TypeError` si la firma es incorrecta: CORRECTO
69
+ - Pasa sin que exista implementación: SEÑAL DE ALARMA — el test no prueba nada
70
+
71
+ **NUNCA avanzar a GREEN si el test pasa en RED.**
72
+
73
+ #### Evidencia RED en telemetría (gate G2 proyectos con SWL)
74
+
75
+ El RED debe dejar rastro verificable (cierra F-TDD-6: "TDD declarativo sin
76
+ evidencia"). En proyectos con `.planning/`, registrar la corrida en
77
+ `hooks/lib/loop-telemetry.js` ANTES de pasar a GREEN:
78
+
79
+ ```bash
80
+ # Una vez por fase/tarea abre la corrida
81
+ node -e "const lt=require('./hooks/lib/loop-telemetry');const r=lt.iniciarCorrida({tipo:'tdd',direccion:'lower_is_better',config:{fase:'0N',tarea:'T-NN'}});console.log(r.dir)"
82
+
83
+ # Al confirmar el RED — métrica = número de tests fallando, descripción = fallo exacto
84
+ node -e "const lt=require('./hooks/lib/loop-telemetry');lt.registrarIteracion('<dir>',{iteracion:0,metrica:N,delta:0,estado:'baseline',descripcion:'RED T-NN: <error textual del runner>'})"
85
+
86
+ # Al llegar a GREEN
87
+ node -e "const lt=require('./hooks/lib/loop-telemetry');lt.registrarIteracion('<dir>',{iteracion:1,metrica:0,delta:-N,estado:'keep',descripcion:'GREEN T-NN: suite verde'})"
88
+ ```
89
+
90
+ `hooks/tdd-gate.js` (warn-only, ADR-0035) busca la fila RED en
91
+ `.planning/loops/tdd-*/iteraciones.tsv` al commitear un feature con tests; sin
92
+ evidencia emite nudge `tdd-red-evidence`. Sin `.planning/` no aplica.
93
+
94
+ #### Marker de trazabilidad REQ en tests (proyectos con REQ-IDs)
95
+
96
+ Cuando la fase tiene criterios `REQ-NN` (fases 01-11) o `REQ-<fase>-NN`
97
+ (namespaceados, fases ≥12 — DT-IDS-NAMESPACE) en el CONTEXTO, cada test que
98
+ verifica un criterio lleva el marker en comentario —
99
+ `scripts/verificar-trazabilidad.js` lo usa para cerrar la cadena
100
+ REQ→T→commit→test (reconoce ambos formatos):
101
+
102
+ ```python
103
+ def test_descuento_cliente_premium():
104
+ # verifica: REQ-12-03
105
+ ...
106
+ ```
107
+
108
+ ```javascript
109
+ test('descuento cliente premium', () => {
110
+ // verifica: REQ-12-03
111
+ ...
112
+ });
113
+ ```
114
+
115
+ ### Fase GREEN — Implementación mínima
116
+
117
+ **Regla de oro**: Implementar solo lo que hace pasar el test. Nada más.
118
+
119
+ ```python
120
+ # GREEN: Implementación mínima que hace pasar el test
121
+ def calcular_descuento(cliente: Cliente, monto: float) -> float:
122
+ if cliente.tipo == "premium":
123
+ return monto * 0.15
124
+ return 0.0
125
+ ```
126
+
127
+ **Anti-patrón GREEN**: implementar todos los casos de una vez sin tests que los
128
+ exijan. Si no hay un test para clientes "gold", no implementes el descuento gold.
129
+
130
+ **Verificar**: `pytest -v test_descuentos.py` pasa con el test nuevo.
131
+
132
+ ### Fase REFACTOR Limpieza sin cambiar comportamiento
133
+
134
+ **Qué refactorizar en esta fase**:
135
+ - Nombres de variables o funciones poco claros
136
+ - Duplicación de lógica (si ya existe en otro test)
137
+ - Magic numbers que deberían ser constantes
138
+ - Estructura de código que anticipa el próximo test
139
+
140
+ ```python
141
+ # REFACTOR: Extraer constante y mejorar legibilidad
142
+ DESCUENTO_POR_TIPO = {
143
+ "premium": 0.15,
144
+ "gold": 0.20,
145
+ "standard": 0.0,
146
+ }
147
+
148
+ def calcular_descuento(cliente: Cliente, monto: float) -> float:
149
+ tasa = DESCUENTO_POR_TIPO.get(cliente.tipo, 0.0)
150
+ return monto * tasa
151
+ ```
152
+
153
+ **Verificar**: todos los tests siguen pasando después del refactor.
154
+
155
+ ---
156
+
157
+ ## Tests de frontera (boundary tests)
158
+
159
+ Para toda función que procesa datos, escribir tests de:
160
+
161
+ | Tipo de frontera | Ejemplo |
162
+ |----------------|---------|
163
+ | Valor cero | `monto=0.0` |
164
+ | Valor negativo | `monto=-100.0` |
165
+ | Valor máximo | `monto=999_999_999.99` |
166
+ | String vacío | `nombre=""` |
167
+ | None / null | `cliente=None` |
168
+ | Lista vacía | `items=[]` |
169
+ | Un solo elemento | `items=[item]` |
170
+ | Muchos elementos | `items=lista_de_10000` |
171
+ | Valor fuera de dominio | `tipo="inexistente"` |
172
+ | Caracteres especiales | `nombre="<script>alert(1)</script>"` |
173
+
174
+ ---
175
+
176
+ ## Factories y Fixtures
177
+
178
+ ### Factories (para datos de test)
179
+
180
+ Las factories crean objetos con valores válidos por defecto. Los tests solo
181
+ sobreescriben lo que importa para ese test específico.
182
+
183
+ **Python con factory_boy**:
184
+ ```python
185
+ import factory
186
+ from myapp.models import Cliente, Pedido
187
+
188
+ class ClienteFactory(factory.Factory):
189
+ class Meta:
190
+ model = Cliente
191
+
192
+ id = factory.Sequence(lambda n: f"cliente-{n}")
193
+ nombre = factory.Faker("name", locale="es_MX")
194
+ email = factory.Faker("email")
195
+ tipo = "standard" # default explícito
196
+ activo = True
197
+
198
+ # Uso en test
199
+ def test_descuento_premium():
200
+ # Solo especificar lo que importa para este test
201
+ cliente = ClienteFactory(tipo="premium")
202
+ assert calcular_descuento(cliente, 100.0) == 15.0
203
+ ```
204
+
205
+ **TypeScript con factory functions**:
206
+ ```typescript
207
+ // factories/user.factory.ts
208
+ export const createUser = (overrides: Partial<User> = {}): User => ({
209
+ id: 'user-1',
210
+ name: 'Test User',
211
+ email: 'test@example.com',
212
+ role: 'standard',
213
+ active: true,
214
+ ...overrides,
215
+ });
216
+
217
+ // Uso en test
218
+ it('should show admin panel for admin users', () => {
219
+ const user = createUser({ role: 'admin' });
220
+ // ...
221
+ });
222
+ ```
223
+
224
+ ### Fixtures (para estado persistente)
225
+
226
+ ```python
227
+ # conftest.py
228
+ import pytest
229
+ from sqlalchemy.ext.asyncio import AsyncSession
230
+
231
+ @pytest.fixture
232
+ async def db_session():
233
+ """Sesión de BD en transacción que hace rollback al terminar."""
234
+ async with AsyncSessionLocal() as session:
235
+ async with session.begin():
236
+ yield session
237
+ await session.rollback()
238
+
239
+ @pytest.fixture
240
+ async def cliente_premium(db_session: AsyncSession):
241
+ """Cliente premium persistido en BD de test."""
242
+ cliente = ClienteFactory.build(tipo="premium")
243
+ db_session.add(cliente)
244
+ await db_session.flush()
245
+ return cliente
246
+ ```
247
+
248
+ ---
249
+
250
+ ## TDD por tipo de código
251
+
252
+ ### Services (lógica de negocio)
253
+
254
+ ```python
255
+ # Orden de tests para un service nuevo:
256
+ # 1. Caso feliz principal
257
+ # 2. Validaciones de input inválido
258
+ # 3. Casos de borde del dominio
259
+ # 4. Interacciones con dependencias (mocks)
260
+
261
+ @pytest.mark.asyncio
262
+ async def test_crear_pedido_valida_stock_disponible():
263
+ producto = ProductoFactory(stock=5)
264
+ with pytest.raises(StockInsuficienteError):
265
+ await PedidoService.crear(producto_id=producto.id, cantidad=10)
266
+ ```
267
+
268
+ ### Endpoints FastAPI
269
+
270
+ ```python
271
+ # Usar TestClient de FastAPI
272
+ from fastapi.testclient import TestClient
273
+
274
+ def test_endpoint_requiere_autenticacion():
275
+ response = client.get("/api/v1/pedidos")
276
+ assert response.status_code == 401
277
+
278
+ def test_endpoint_retorna_solo_pedidos_del_usuario(cliente_autenticado):
279
+ pedido_propio = PedidoFactory(usuario_id=cliente_autenticado.id)
280
+ pedido_ajeno = PedidoFactory(usuario_id="otro-usuario")
281
+
282
+ response = cliente_autenticado.get("/api/v1/pedidos")
283
+ ids = [p["id"] for p in response.json()["items"]]
284
+
285
+ assert pedido_propio.id in ids
286
+ assert pedido_ajeno.id not in ids # IDOR check
287
+ ```
288
+
289
+ ### Componentes Angular
290
+
291
+ ```typescript
292
+ // Usar TestBed + ComponentHarness
293
+ describe('PedidosComponent', () => {
294
+ it('should display empty state when no orders exist', async () => {
295
+ const mockService = { getPedidos: () => of({ items: [], total: 0 }) };
296
+ await TestBed.configureTestingModule({
297
+ providers: [{ provide: PedidosService, useValue: mockService }]
298
+ }).compileComponents();
299
+
300
+ const fixture = TestBed.createComponent(PedidosComponent);
301
+ fixture.detectChanges();
302
+
303
+ const emptyState = fixture.nativeElement.querySelector('[data-testid="empty-state"]');
304
+ expect(emptyState).toBeTruthy();
305
+ });
306
+ });
307
+ ```
308
+
309
+ ---
310
+
311
+ ## Cobertura mínima obligatoria
312
+
313
+ | Tipo de módulo | Cobertura mínima |
314
+ |---------------|-----------------|
315
+ | Services (lógica crítica) | 90% |
316
+ | Endpoints (API) | 85% |
317
+ | Utilities / helpers | 95% |
318
+ | Componentes Angular | 75% |
319
+ | Modelos ORM | 70% |
320
+
321
+ **Verificar** con reporte de cobertura antes de marcar tarea como completada:
322
+ ```bash
323
+ pytest --cov=src/services --cov-fail-under=90
324
+ ```
325
+
326
+ ---
327
+
328
+ ## Anti-patrones TDD a evitar
329
+
330
+ | Anti-patrón | Descripción | Solución |
331
+ |-------------|-------------|---------|
332
+ | Test del mock | El test solo verifica que se llamó el mock, no el comportamiento real | Testear el efecto observable |
333
+ | Test omnibus | Un solo test que verifica 10 cosas a la vez | Un test, un comportamiento |
334
+ | Test frágil | Falla si cambias nombres internos sin cambiar comportamiento | Testear comportamiento, no implementación |
335
+ | Fixture global | Un fixture que modifica estado global compartido entre tests | Fixtures con scope limitado, rollback |
336
+ | Skip como solución | `@pytest.mark.skip` para tests que fallan | Arreglar el bug o eliminar el test |
337
+
338
+ ---
339
+
340
+ ## Gotchas / Errores comunes no obvios
341
+
342
+ **El ciclo TDD se rompe cuando el test en fase RED pasa sin implementación porque la función ya existe con otro nombre en el módulo y Python la importa silenciosamente desde un namespace diferente**: escribir `from app.services import calcular_descuento` en el test cuando `calcular_descuento` ya existe en `app.utils` (importada en `__init__.py`) hace que el test pase en RED sin error, invalidando el ciclo. Causa: los imports con `from app.services import *` en `__init__.py` pueden re-exportar funciones de submódulos, haciendo que el test encuentre una implementación inesperada. Fix: verificar con `python -c "from app.services import calcular_descuento; print(calcular_descuento.__module__)"` que el símbolo viene del módulo correcto. Usar imports explícitos en los tests (`from app.services.descuentos import calcular_descuento`) en lugar de imports de paquete.
343
+
344
+ **`pytest.mark.asyncio` con `asyncio_mode = "auto"` en `pytest.ini` hace que fixtures síncronos que retornan coroutines sean llamados sin `await`, causando que el fixture entregue un objeto coroutine en lugar del valor esperado**: un fixture `def cliente_premium(db_session)` que retorna `ClienteFactory.build(tipo="premium")` funciona, pero si accidentalmente se define como `async def cliente_premium(db_session)` y se usa en un test síncrono, pytest lo trata como fixture síncrono y el test recibe el objeto coroutine. Causa: la mezcla de fixtures `async def` y `def` en el mismo `conftest.py` con `asyncio_mode = "auto"` puede crear comportamientos inesperados dependiendo de la versión de `pytest-asyncio`. Fix: en proyectos async, definir TODOS los fixtures relevantes como `async def` explícitamente y verificar que el test use `@pytest.mark.asyncio` o tenga el modo auto configurado correctamente.
345
+
346
+ **La fase REFACTOR del ciclo TDD en componentes Angular introduce regresiones silenciosas cuando se extrae lógica a un `computed()` pero el template sigue usando la función directa que ahora devuelve `undefined`**: refactorizar `getTotal()` como método del componente hacia `total = computed(() => ...)` y olvidar actualizar el template de `{{ getTotal() }}` a `{{ total() }}` no genera error de compilación con Angular 17+; el template simplemente muestra `undefined`. Causa: Angular no verifica en tiempo de compilación que los métodos referenciados en templates existen en la clase si el template usa la sintaxis de interpolación sin type-checking estricto. Fix: activar `strictTemplates: true` en `tsconfig.app.json` para que el compilador de Angular valide que todas las referencias en templates corresponden a miembros públicos del componente. Ejecutar `ng build` antes de considerar el REFACTOR completo.
347
+
348
+ **`db_session.rollback()` en el fixture de pytest-asyncio no deshace los datos insertados por `db.flush()` dentro de la función testeada cuando la sesión usa `autocommit=True` implícito por configuración del engine**: algunos proyectos configuran `AsyncEngine` con `isolation_level="AUTOCOMMIT"` para compatibilidad con operaciones DDL; en ese contexto, cada `flush()` hace commit inmediatamente y el `rollback()` del fixture no puede deshacer esos cambios. Causa: `AUTOCOMMIT` en PostgreSQL significa que no hay transacción activa que se pueda revertir. Fix: verificar que el engine de tests NO use `isolation_level="AUTOCOMMIT"` (la configuración debe ser solo para el engine de migraciones Alembic, no para el de la app). Para tests que necesitan AUTOCOMMIT por alguna razón, usar una BD de test separada que se trunca con `TRUNCATE ... RESTART IDENTITY CASCADE` en el teardown del fixture.
349
+
350
+ **Reloj inyectable como parámetro `ahora` habilita tests deterministas sin `freezegun`, `jest.useFakeTimers()` ni `sinon.useFakeTimers()`** [PATRÓN VALIDADO en SWL Opción C webhook]: cuando una API depende del tiempo (rate-limit con bucket que se rellena, dedup con ventana de retención, cache con TTL, schedulers), recibir el timestamp por parámetro en lugar de llamar `Date.now()` internamente permite que los tests pasen 1000 segundos en 0 ms reales. Diseño: `metodo(arg1, arg2, ahora = Date.now())` — producción no cambia (llamadas siguen siendo `obj.consumir(1)`), tests pasan `ahora` explícito (`obj.consumir(1, T0 + 5000)`). Validado en 3 módulos esta sesión: `rate-limit-ip.js` (40+ tests bucket refill, capacidad, cleanup), `webhook-dedup.js` (ventana de retención, rotación idempotente), helpers internos de `webhook-server.js`. Ningún test usa `sleep`, ningún test es flaky, ningún test mockea `Date`. Aplicable a JS/TS y a Python (`def consumir(self, tokens, ahora=None)` con `ahora = ahora or datetime.now(UTC)` al inicio).
351
+
352
+ ```js
353
+ // MAL test no-determinista, requiere sleep o mock global
354
+ class Bucket {
355
+ consumir(n) {
356
+ const ahora = Date.now(); // ← imposible de controlar desde el test
357
+ this._rellenar(ahora);
358
+ if (this.tokens >= n) { this.tokens -= n; return true; }
359
+ return false;
360
+ }
361
+ }
362
+
363
+ // BIEN reloj inyectable, test determinista
364
+ class Bucket {
365
+ consumir(n, ahora = Date.now()) { // ← default en producción, inyectable en test
366
+ this._rellenar(ahora);
367
+ if (this.tokens >= n) { this.tokens -= n; return true; }
368
+ return false;
369
+ }
370
+ }
371
+
372
+ // En el test:
373
+ const T0 = 1700000000000;
374
+ const b = new Bucket(10, 1, T0);
375
+ for (let i = 0; i < 10; i++) b.consumir(1, T0); // saturar
376
+ assert.equal(b.consumir(1, T0), false); // sin refill aún
377
+ assert.equal(b.consumir(5, T0 + 5000), true); // 5 seg después: 5 tokens
378
+ ```
379
+
380
+ Aplica también a tests de clock skew (tiempo retrocede por NTP): pasar `T0 - 1000` y validar que la lógica no rompe. Origen: rate-limit-ip.js + webhook-dedup.js sesión 2026-05-13.
381
+
382
+ **Tests nombrados por feature (`test_emitir_factura_exitosa`) pierden poder regresivo; nombrados por causa raíz (`test_repository_no_usa_columna_inexistente_p_monto`) detectan regresiones específicas sin reproducción manual** [CONFIRMADO en SIGM Opción C F1.4]: cuando se descubre un bug por una causa raíz concreta (typo en nombre de columna SQL, omisión de `selectinload`, mock que devuelve dict en vez de objeto, schema obsoleto), el test de regresión que se escribe debe llevar el nombre de la causa, no del feature afectado. Caso real: durante F1.4 de SIGM, el repository de pagos referenciaba `p.monto` cuando la columna se llamaba `p.monto_pagado`; el test escrito como `test_repository_no_usa_columna_inexistente_p_monto` falló inmediatamente en la siguiente sesión cuando otro agente reintrodujo el typo, sin necesidad de reproducir el escenario de negocio (emitir cobro real, verificar respuesta). Causa: los nombres orientados a feature (`test_pago_exitoso`) son ambiguos sobre QUÉ falla — si el test falla, el desarrollador debe diagnosticar; los nombres orientados a causa raíz (`test_X_no_usa_Y`, `test_query_incluye_selectinload_Z`, `test_service_devuelve_dict_no_objeto`) son auto-diagnósticos. Fix: para cada bug que cueste >30 min diagnosticar, escribir UN test adicional cuyo nombre describa la condición técnica violada, no el escenario de negocio. Convención: `test_<componente>_<condicion_tecnica>` o `test_<componente>_no_<anti_patron>`. Estos tests son tu segunda línea de defensa contra regresiones de la misma causa raíz, complementarios a los tests de comportamiento.
383
+
384
+ **`process.cwd()` cacheado al `require()` rompe tests con `process.chdir(sandbox)`** [PATRÓN GENÉRICO TESTING CLI]: scripts Node exportables que leen `process.cwd()` en el scope del módulo (al cargar) congelan el cwd al directorio de invocación. Los tests que crean sandboxes con `fs.mkdtempSync()` y luego `process.chdir(sandbox)` no afectan al cwd cacheado — el script sigue leyendo del cwd original y los assertions fallan con paths inesperados. Caso real (swl-ses `scripts/derivar-feature-list.js` 2026-05-15): la función `enriquecerDesdeFases(fases)` leía `const CWD = process.cwd()` calculado al `require()`; 2 tests con `process.chdir(sandbox)` retornaron `[]` en lugar de detectar el PLAN.md fixture. Causa: el constante se evaluó cuando el `node --test` cargó el módulo desde el cwd del proyecto, no desde el sandbox del test individual. Fix obligatorio: funciones exportables deben aceptar `cwd` como parámetro opcional con fallback dinámico (`function fn(args, opciones = {}) { const cwd = opciones.cwd || process.cwd(); ... }`). El código de producción no cambia (sin args extras), pero los tests pueden inyectar el cwd correcto. Aplica también a Python (`def fn(args, cwd: str | None = None): cwd = cwd or os.getcwd()`) y a cualquier lenguaje con tests que usen chdir.
385
+
386
+ ```js
387
+ // MAL cwd cacheado al require, tests con process.chdir() fallan
388
+ const CWD = process.cwd();
389
+ const PLANNING_DIR = path.join(CWD, '.planning');
390
+
391
+ function enriquecerDesdeFases(fases) {
392
+ const archivos = fs.readdirSync(path.join(PLANNING_DIR, 'fases')); // cwd congelado
393
+ // ...
394
+ }
395
+
396
+ // BIEN — cwd dinámico con parámetro opcional para tests
397
+ function enriquecerDesdeFases(fases, opciones = {}) {
398
+ const cwd = opciones.cwd || process.cwd(); // recalcula al llamar
399
+ const archivos = fs.readdirSync(path.join(cwd, '.planning', 'fases'));
400
+ // ...
401
+ }
402
+
403
+ // En el test (usa setupSandboxes regla tests-cleanup.md):
404
+ const { setupSandboxes } = require('../_helpers/sandbox');
405
+ const sandboxes = setupSandboxes('swl-test-');
406
+
407
+ const sandbox = sandboxes.create();
408
+ fs.mkdirSync(path.join(sandbox, '.planning', 'fases'), { recursive: true });
409
+ // Opción A: pasar cwd explícito (recomendado)
410
+ const r = enriquecerDesdeFases([], { cwd: sandbox });
411
+ // Opción B: process.chdir() — solo funciona con cwd dinámico
412
+ process.chdir(sandbox);
413
+ const r2 = enriquecerDesdeFases([]);
414
+ // Cleanup automático al final del archivo vía after() registrado por setupSandboxes.
415
+ ```
416
+
417
+ ---
418
+
419
+ ## Gotcha: silenced tests por race condition sobre estado compartido
420
+
421
+ ### El anti-patrón
422
+
423
+ ```javascript
424
+ // MAL assertion condicional dentro de if que puede ser false por race
425
+ const FLAG = path.join(os.tmpdir(), 'mi-app.json');
426
+
427
+ test('flag sin contenido emite warning', () => {
428
+ borrarFlag();
429
+ const res = correrSubproceso();
430
+ if (fs.existsSync(FLAG)) { // ← otro test paralelo creó el flag
431
+ assert.match(res.stdout, /WARN/); // ← NUNCA se ejecuta si el if es false
432
+ }
433
+ // sin else → test PASA sin haber validado nada
434
+ });
435
+
436
+ // El test "verde" no significa "pasó" significa "no falló ninguna assertion".
437
+ // Si la assertion vive dentro de un `if (race)`, una race favorable la salta
438
+ // y el test es vacío.
439
+ ```
440
+
441
+ ### Por qué pasa
442
+
443
+ `node:test` paraleliza **archivos** `.test.js` por default (no tests dentro
444
+ del mismo archivo). Si dos archivos tocan el mismo path único de filesystem
445
+ (`/tmp/foo.json`, lockfiles, sockets), las operaciones se intercalan no
446
+ deterministamente. Patrones típicos:
447
+
448
+ - Archivo A: `borrarFlag()` spawn subprocess assert
449
+ - Archivo B: spawn subprocess `crearFlag()` durante A assert de A condicionado falla
450
+
451
+ ### Patrones correctos
452
+
453
+ **Patrón 1 Aislamiento por path único** (recomendado):
454
+
455
+ ```javascript
456
+ const { setupSandboxes } = require('../_helpers/sandbox');
457
+ const sandboxes = setupSandboxes('swl-mi-app-test-');
458
+ const env = { ...process.env };
459
+
460
+ // Path único por test usando el helper canónico (regla tests-cleanup.md).
461
+ // El cleanup es automático al final del archivo vía after() registrado.
462
+ const dir = sandboxes.create();
463
+ env.MI_APP_FLAG_PATH = path.join(dir, 'flag.json');
464
+
465
+ const res = spawnSync('node', [BIN], { env, ... });
466
+
467
+ // Ahora el assert es incondicional — el path es del test, no compartido
468
+ assert.match(res.stdout, /WARN/);
469
+ ```
470
+
471
+ Requiere que el SUT (System Under Test) honre una env var para override
472
+ del path. Si no la honra, agregar el override es parte del fix.
473
+
474
+ **Patrón 2 — Serialización forzada** (cuando el path es hardcoded):
475
+
476
+ ```bash
477
+ # Forzar --test-concurrency=1 en la suite completa
478
+ node --test --test-concurrency=1 tests/
479
+ ```
480
+
481
+ Tradeoff: tests más lentos pero deterministas. Aceptable si el aislamiento
482
+ no es factible (legacy code).
483
+
484
+ **Patrón 3 — assertions incondicionales** con setup determinista:
485
+
486
+ ```javascript
487
+ // MAL
488
+ if (fs.existsSync(FLAG)) assert.match(...)
489
+
490
+ // BIEN — setup garantiza la precondición, assertion no se salta
491
+ escribirFlag({ ... });
492
+ assert.ok(fs.existsSync(FLAG), 'precondición del test'); // ← assertion sobre el setup
493
+ const res = correrSubproceso();
494
+ assert.match(res.stdout, /WARN/); // ← assertion incondicional sobre el resultado
495
+ ```
496
+
497
+ ### Anti-patrón: `if (X) assert(Y)` sin `else`
498
+
499
+ ```javascript
500
+ // MAL — un test que pasa silenciosamente cuando X es false
501
+ test('hace algo', () => {
502
+ const algo = obtenerAlgo();
503
+ if (algo) { // ← race u otra fuente de no-determinismo
504
+ assert.equal(algo.valor, 42);
505
+ }
506
+ // sin else veredicto "pass" sin haber validado nada
507
+ });
508
+
509
+ // BIEN — el setup garantiza la precondición o el test falla explícito
510
+ test('hace algo', () => {
511
+ const algo = obtenerAlgo();
512
+ assert.ok(algo, 'precondición: obtenerAlgo debe devolver valor');
513
+ assert.equal(algo.valor, 42);
514
+ });
515
+ ```
516
+
517
+ **Regla**: una assertion dentro de un `if` sin `else` es **un test que
518
+ puede pasar sin validar nada**. Estos "silenced tests" son la peor clase
519
+ de falsa cobertura: el reporter dice "pass" y nadie revisa el código
520
+ hasta que un bug llega a producción.
521
+
522
+ ### Detección
523
+
524
+ - Buscar `if (` dentro de cuerpos de `test(...)`/`it(...)` sin `else { fail() }`
525
+ o `else { assert(...) }` correspondiente.
526
+ - Si el cuerpo del `if` contiene `assert.*`, considerarlo silenced test
527
+ hasta que se demuestre que el `if` no puede ser false en ningún escenario.
528
+
529
+ ### Origen
530
+
531
+ Detectado en sesión 2026-05-16 del proyecto swl-ses (PR #30): tests del
532
+ flag `swl-ses-update-check.json` compartido entre dos archivos `.test.js`
533
+ paralelos. El test "sin flag → debe advertir" pasaba en CI cuando otro
534
+ archivo creaba el flag, sin ejecutar ninguna assertion. Fix: env var
535
+ `SWL_UPDATE_FLAG_PATH` para aislamiento + assertions incondicionales.
536
+
537
+ ---
538
+
539
+ ## Tests E2E de CLIs interactivos sin PTY real
540
+
541
+ ### El problema
542
+
543
+ Probar un CLI interactivo (TUI con `readline`, prompts, keypress events,
544
+ `process.stdin.isTTY`) en CI requiere normalmente un **pseudo-terminal
545
+ emulado** (PTY) — usualmente vía `node-pty`, una dependencia **nativa** que:
546
+
547
+ - Requiere compilación de extensiones C++ al instalar (puede fallar en
548
+ contenedores minimal o en Windows sin Visual Studio Build Tools).
549
+ - Agrega ~5 MB al `node_modules` por imagen.
550
+ - Hace que el test suite no corra en `npm test` sin setup extra.
551
+
552
+ Para CLIs interactivos donde no se necesita probar **el comportamiento
553
+ real del terminal** (escape codes, redibujado, scroll), sino solo la
554
+ **lógica del wizard** (¿qué pasa si el usuario presiona Esc en el paso 3?,
555
+ ¿qué resuelve el promise tras Enter con default?), un harness TTY mockeado
556
+ cubre ~90% de los casos sin dep nativa.
557
+
558
+ ### Patrón del harness
559
+
560
+ ```javascript
561
+ // tests/harness-tty.js
562
+ 'use strict';
563
+
564
+ const readline = require('readline');
565
+
566
+ function crearHarness() {
567
+ // 1. Capturar estado original para restauración
568
+ const stdoutOriginal = process.stdout.write.bind(process.stdout);
569
+ const isTtyStdoutOriginal = process.stdout.isTTY;
570
+ const isTtyStdinOriginal = process.stdin.isTTY;
571
+ const setRawModeOriginal = process.stdin.setRawMode
572
+ ? process.stdin.setRawMode.bind(process.stdin) : null;
573
+ const emitKeypressOriginal = readline.emitKeypressEvents;
574
+
575
+ let capturado = '';
576
+ let listenersKeypress = [];
577
+
578
+ // 2. Forzar TTY antes de cargar módulos UI (que evalúan ES_TTY al require)
579
+ Object.defineProperty(process.stdout, 'isTTY', { value: true, configurable: true });
580
+ Object.defineProperty(process.stdin, 'isTTY', { value: true, configurable: true });
581
+
582
+ // 3. Capturar stdout en string buffer
583
+ process.stdout.write = (chunk) => {
584
+ capturado += typeof chunk === 'string' ? chunk : chunk.toString();
585
+ return true;
586
+ };
587
+
588
+ // 4. Mockear setRawMode/resume/pause como no-op (evita tomar control del terminal de test)
589
+ process.stdin.setRawMode = () => process.stdin;
590
+ process.stdin.resume = () => process.stdin;
591
+ process.stdin.pause = () => process.stdin;
592
+
593
+ // 5. Interceptar registros de 'keypress' para poder emitirlos a mano
594
+ const onListenerOriginal = process.stdin.on.bind(process.stdin);
595
+ process.stdin.on = (evento, listener) => {
596
+ if (evento === 'keypress') listenersKeypress.push(listener);
597
+ return onListenerOriginal(evento, listener);
598
+ };
599
+
600
+ // 6. Mockear readline.emitKeypressEvents (no necesita stdin real)
601
+ readline.emitKeypressEvents = (stream) => stream;
602
+
603
+ // 7. Limpiar require cache de módulos UI para que se evalúen con TTY=true
604
+ delete require.cache[require.resolve('../scripts/tui/lib/render')];
605
+
606
+ function cargarUI() {
607
+ return require('../scripts/tui/lib/render');
608
+ }
609
+
610
+ // 8. Emitir keypress programáticamente
611
+ function tecla(nombre, extras = {}) {
612
+ const key = { name: nombre, ctrl: false, meta: false, shift: false, ...extras };
613
+ const str = nombre.length === 1 ? nombre : '';
614
+ for (const listener of [...listenersKeypress]) {
615
+ try { listener(str, key); } catch (_) { /* swallow */ }
616
+ }
617
+ }
618
+
619
+ // 9. Esperar N ticks del event loop para promesas internas
620
+ function esperarTicks(n = 1) {
621
+ let p = Promise.resolve();
622
+ for (let i = 0; i < n; i++) p = p.then(() => undefined);
623
+ return p;
624
+ }
625
+
626
+ function captura(opts = {}) {
627
+ const valor = capturado;
628
+ if (opts.limpiar) capturado = '';
629
+ return valor;
630
+ }
631
+
632
+ function restaurar() {
633
+ Object.defineProperty(process.stdout, 'isTTY', { value: isTtyStdoutOriginal, configurable: true });
634
+ Object.defineProperty(process.stdin, 'isTTY', { value: isTtyStdinOriginal, configurable: true });
635
+ process.stdout.write = stdoutOriginal;
636
+ if (setRawModeOriginal) process.stdin.setRawMode = setRawModeOriginal;
637
+ process.stdin.on = onListenerOriginal;
638
+ readline.emitKeypressEvents = emitKeypressOriginal;
639
+ listenersKeypress = [];
640
+ // Limpiar require cache para no contaminar otros tests
641
+ delete require.cache[require.resolve('../scripts/tui/lib/render')];
642
+ }
643
+
644
+ return { cargarUI, tecla, esperarTicks, captura, restaurar };
645
+ }
646
+
647
+ module.exports = { crearHarness };
648
+ ```
649
+
650
+ ### Uso típico
651
+
652
+ ```javascript
653
+ const test = require('node:test');
654
+ const assert = require('node:assert/strict');
655
+ const { crearHarness } = require('./harness-tty');
656
+
657
+ test('preguntarSiNo con harness: Enter resuelve con default true', async () => {
658
+ const h = crearHarness();
659
+ try {
660
+ const ui = h.cargarUI();
661
+ const promesa = ui.preguntarSiNo('test prompt', true);
662
+
663
+ await h.esperarTicks(2);
664
+ h.tecla('return');
665
+
666
+ const timeout = new Promise((_, reject) =>
667
+ setTimeout(() => reject(new Error('no resolvió en 500ms')), 500));
668
+
669
+ const r = await Promise.race([promesa, timeout]).catch(() => null);
670
+ // r === true si el harness simuló bien; null si readline real bloquea
671
+ // (caso esperado en Windows sin PTY real; documentar limitación)
672
+ } finally {
673
+ h.restaurar();
674
+ }
675
+ });
676
+ ```
677
+
678
+ ### Reglas operativas
679
+
680
+ - **`restaurar()` en `finally`**: el harness modifica state global
681
+ (process.stdout, process.stdin, readline, require.cache). Si un test
682
+ no restaura, contamina los siguientes.
683
+ - **Test de captura como smoke**: agregar un test "harness captura stdout"
684
+ que valida que `process.stdout.write('hola')` aparece en `captura()`.
685
+ Si falla, el harness está roto antes de testear el SUT.
686
+ - **Test "tecla() es no-op sin listeners"**: validar que emitir keypress
687
+ cuando nadie escucha NO rompe el harness ni propaga errores.
688
+ - **Limitación reconocida**: si `readline.createInterface()` real toma
689
+ control de stdin (en Windows con Git Bash sin PTY), el callback de
690
+ `rl.question()` no se invoca aunque el harness emita teclas. Usar
691
+ `Promise.race([promesa, timeout])` para que el test no cuelgue
692
+ el test marca limitación, no falla.
693
+
694
+ ### Cuándo NO usar este patrón
695
+
696
+ - Cuando necesitas probar **redibujado real del terminal** (alt screen
697
+ buffer, escape codes complejos, scrollback). Ahí sí necesitas PTY real
698
+ via `node-pty` o test manual.
699
+ - Cuando el SUT depende de **timing real del teclado** (input rates,
700
+ paste detection). El mock no replica latencia.
701
+ - Para CLIs sin lógica de control de flujo (solo `console.log` lineal) —
702
+ ahí basta capturar stdout sin mockear TTY.
703
+
704
+ ### Origen
705
+
706
+ Aplicado en swl-ses v1.6.0 (`tests/scripts/tui/harness-tty.js`, ~180 LOC).
707
+ Validó el TUI completo de 5 fases sin instalar `node-pty`. Limitación
708
+ documentada: 1 test E2E "preguntarSiNo con harness" marca timeout en
709
+ Windows + Node 22+ porque readline real bloquea pese a stdin mockeado —
710
+ el harness emite la limitación sin fallar.