@saulwade/swl-ses 2.0.0 → 2.2.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (97) hide show
  1. package/CLAUDE.md +196 -196
  2. package/README.md +579 -579
  3. package/agentes/_propose-step.md +90 -0
  4. package/agentes/implementador-swl.md +2 -0
  5. package/agentes/orquestador-swl.md +2 -0
  6. package/agentes/perfilador-usuario-swl.md +14 -1
  7. package/bin/swl-ses.js +64 -1
  8. package/comandos/swl/adoptar-proyecto.md +258 -255
  9. package/comandos/swl/aprender.md +828 -840
  10. package/comandos/swl/aprobar-plan.md +26 -37
  11. package/comandos/swl/autoresearch.md +12 -14
  12. package/comandos/swl/briefing.md +119 -0
  13. package/comandos/swl/checkpoint.md +10 -15
  14. package/comandos/swl/claudemd.md +239 -234
  15. package/comandos/swl/compactar.md +29 -2
  16. package/comandos/swl/configurar-ci.md +20 -19
  17. package/comandos/swl/cron.md +10 -12
  18. package/comandos/swl/discutir-fase.md +8 -5
  19. package/comandos/swl/ejecutar-fase.md +15 -2
  20. package/comandos/swl/evolucionar.md +6 -11
  21. package/comandos/swl/inbox.md +10 -10
  22. package/comandos/swl/modelo.md +7 -9
  23. package/comandos/swl/notificaciones.md +19 -116
  24. package/comandos/swl/nuevo-proyecto.md +205 -205
  25. package/comandos/swl/planear-fase.md +5 -3
  26. package/comandos/swl/release.md +46 -0
  27. package/comandos/swl/status.md +333 -279
  28. package/comandos/swl/verificar.md +817 -812
  29. package/habilidades/changelog-generator/scripts/parse-commits.js +6 -4
  30. package/habilidades/ejecutar-fase/SKILL.md +541 -518
  31. package/habilidades/planear-fase/SKILL.md +3 -2
  32. package/habilidades/swl-claudemd/SKILL.md +10 -6
  33. package/habilidades/tdd-workflow/SKILL.md +715 -713
  34. package/habilidades/validacion-ci-sistema/SKILL.md +17 -1
  35. package/hooks/calidad-pre-commit.js +5 -1
  36. package/hooks/check-update.js +39 -1
  37. package/hooks/lib/autonomia.js +208 -0
  38. package/hooks/lib/briefing.js +474 -0
  39. package/hooks/lib/propose-step.js +358 -0
  40. package/hooks/session-briefing.js +98 -0
  41. package/hooks/telemetria-skill-routing.js +100 -0
  42. package/instintos/autonomia.yaml +27 -0
  43. package/llms.txt +4 -4
  44. package/manifiestos/hooks-config.json +18 -0
  45. package/manifiestos/modulos.json +25 -3
  46. package/manifiestos/skills-lock.json +17 -17
  47. package/package.json +93 -93
  48. package/plugin.json +371 -371
  49. package/reglas/analizar-directorios-antes-de-escribir.md +228 -0
  50. package/reglas/consultar-vault-primero.md +195 -0
  51. package/reglas/debatir-antes-de-aceptar.md +158 -0
  52. package/reglas/git-coauthor.md +100 -0
  53. package/reglas/monitor-ci.md +309 -0
  54. package/reglas/registro-componentes-nuevos.md +38 -10
  55. package/reglas/sesiones-paralelas.md +180 -0
  56. package/reglas/usar-code-review-graph.md +155 -0
  57. package/reglas/verificar-citas-normativas.md +548 -0
  58. package/scripts/auditar-claudemd.js +38 -0
  59. package/scripts/cli/aprobar-plan.js +73 -0
  60. package/scripts/cli/briefing.js +23 -0
  61. package/scripts/cli/ciclo-evolucion.js +26 -0
  62. package/scripts/cli/configurar-ci.js +40 -0
  63. package/scripts/cli/derivar-feature-list.js +25 -0
  64. package/scripts/cli/detectar-host.js +27 -0
  65. package/scripts/cli/diary-entry.js +69 -0
  66. package/scripts/cli/execution-state.js +18 -0
  67. package/scripts/cli/gateway-notify.js +41 -0
  68. package/scripts/cli/liberar-fase.js +42 -0
  69. package/scripts/cli/loop-telemetry.js +125 -0
  70. package/scripts/cli/mark-evolved.js +56 -0
  71. package/scripts/cli/metricas-dora.js +26 -0
  72. package/scripts/cli/near-duplicate.js +55 -0
  73. package/scripts/cli/notificaciones.js +123 -0
  74. package/scripts/cli/propose-step.js +29 -0
  75. package/scripts/cli/schedule-parse.js +19 -0
  76. package/scripts/cli/sugerir-modelo.js +20 -0
  77. package/scripts/cli/verificar-plan.js +36 -0
  78. package/scripts/cli/verificar-trazabilidad.js +35 -0
  79. package/scripts/derivar-feature-list.js +1 -0
  80. package/scripts/instalador.js +52 -6
  81. package/scripts/lib/auditar-invocaciones-comandos.js +104 -0
  82. package/scripts/lib/ci-reader.js +193 -0
  83. package/scripts/lib/detectar-host-swl.js +175 -0
  84. package/scripts/lib/evidencia-release.js +322 -0
  85. package/scripts/lib/gate-hooks-requires.js +249 -0
  86. package/scripts/lib/gate-licencias.js +212 -0
  87. package/scripts/lib/git-metricas.js +257 -0
  88. package/scripts/lib/metricas-dora.js +204 -0
  89. package/scripts/lib/resolver-plan-fase.js +37 -0
  90. package/scripts/tui/ejecutores.js +1 -1
  91. package/scripts/validar-manifest.js +92 -1
  92. package/scripts/validar.js +13 -0
  93. package/scripts/verificar-evolucion.js +54 -4
  94. package/scripts/verificar-release.js +102 -0
  95. package/scripts/verificar-trazabilidad.js +12 -6
  96. package/reglas/arquitectura.evolved.json +0 -7
  97. package/reglas/seguridad.evolved.json +0 -7
@@ -1,713 +1,715 @@
1
- ---
2
- name: tdd-workflow
3
- description: Flujo completo de Test-Driven Development. Ciclo RED (el test falla) → GREEN (implementación mínima) → REFACTOR (limpieza). Incluye cobertura mínima obligatoria, tests de frontera, factories, fixtures y estrategias para diferentes tipos de código (APIs, services, componentes Angular).
4
- version: "1.2.0"
5
- evolved: true
6
- evolved-from: "1.1.0"
7
- evolved-at: "2026-06-11"
8
- evolved-by: "fase-10-slice-2"
9
- evolved-note: "v1.2.0: sección 'Evidencia RED en telemetría' (gate G2, ADR-0035, cierra F-TDD-6) — registro de corridas tdd-* en loop-telemetry. v1.0.5: gotcha 'Tests E2E de CLIs interactivos sin PTY real'. Origen M2 sesión 2026-05-16. v1.0.4: silenced tests por race en path único compartido. v1.0.3: gotcha cwd cacheado al require()."
10
- herramientasPermitidas: [Read, Bash]
11
- evolvable: true # default para skill estandar
12
- exclusiones:
13
- - "No cargar para escribir tests de regresión sobre código legacy sin suite existente — en código legacy sin tests, comenzar con caracterización de comportamiento actual antes del ciclo TDD."
14
- - "No cargar para pruebas de carga o performance testing — para benchmarks y load testing cargar `performance-baseline`."
15
- - "No cargar para configurar pipelines de CI/CD o runners de tests en GitHub Actions / GitLab CI — para configuración de CI cargar el skill de cloud correspondiente."
16
- - "No cargar para pruebas de seguridad o fuzzing automático — para testing de seguridad cargar `threat-model-lite` y usar herramientas especializadas (Bandit, OWASP ZAP)."
17
- ---
18
- # Habilidad: TDD Workflow Completo
19
-
20
- ## Cuándo NO cargar
21
-
22
- - La tarea es añadir tests a código legacy sin suite existente: comenzar con tests de caracterización del comportamiento actual antes del ciclo TDD.
23
- - La tarea es pruebas de carga o benchmarks: cargar `performance-baseline`.
24
- - La tarea es configurar CI/CD pipelines: cargar el skill de cloud correspondiente.
25
- - La tarea es fuzzing o testing de seguridad: cargar `threat-model-lite` y usar herramientas especializadas.
26
-
27
- ## Propósito
28
-
29
- TDD no es "escribir tests después" ni "escribir tests antes por costumbre". Es
30
- un método de diseño donde los tests guían la API pública del código antes de
31
- que exista la implementación. El resultado es código que hace exactamente lo
32
- que los tests exigen — ni más, ni menos.
33
-
34
- ## Cuándo activar
35
-
36
- - CONTEXT.md o PLAN.md indica que la fase requiere TDD
37
- - Se implementa lógica de negocio crítica (cálculos, validaciones, permisos)
38
- - El usuario pide explícitamente TDD
39
- - Se trabaja en un módulo con historial de bugs
40
-
41
- ---
42
-
43
- ## Etapa opcional previa: Gherkin (BDD) y gate de mutación
44
-
45
- Dos extensiones opt-in del ciclo, ambas con guía completa en recursos:
46
-
47
- - **Antes del ciclo** — si la fase tiene criterios de aceptación de negocio,
48
- convertirlos en escenarios Given–When–Then validados por el usuario ANTES de
49
- implementar; cada escenario es el test RED de su criterio. Guía, runners por
50
- stack y anti-patrones en [recursos/gherkin-bdd.md](recursos/gherkin-bdd.md).
51
- - **Después del ciclo** — en módulos críticos, verificar la calidad de los
52
- asserts con mutation testing incremental sobre el diff:
53
- `Skill("calidad-mutation-testing")`. La cobertura mide ejecución; los
54
- mutantes sobrevivientes miden si los tests detectarían un bug.
55
-
56
- ## El ciclo fundamental RED → GREEN → REFACTOR
57
-
58
- ### Fase RED — El test debe fallar por la razón correcta
59
-
60
- **Paso 1**: Escribir el test que describe el comportamiento esperado.
61
-
62
- ```python
63
- # RED: Este test falla porque calcular_descuento no existe todavía
64
- def test_descuento_cliente_premium_es_15_porciento():
65
- cliente = ClienteFactory(tipo="premium")
66
- resultado = calcular_descuento(cliente, monto=100.0)
67
- assert resultado == 15.0
68
- ```
69
-
70
- **Verificar que el test falla BIEN**:
71
- - Falla con `NameError` o `ImportError` si la función no existe: CORRECTO
72
- - Falla con `AssertionError` si el comportamiento es incorrecto: CORRECTO
73
- - Falla con `TypeError` si la firma es incorrecta: CORRECTO
74
- - Pasa sin que exista implementación: SEÑAL DE ALARMA — el test no prueba nada
75
-
76
- **NUNCA avanzar a GREEN si el test pasa en RED.**
77
-
78
- #### Evidencia RED en telemetría (gate G2 — proyectos con SWL)
79
-
80
- El RED debe dejar rastro verificable (cierra F-TDD-6: "TDD declarativo sin
81
- evidencia"). En proyectos con `.planning/`, registrar la corrida en
82
- `hooks/lib/loop-telemetry.js` ANTES de pasar a GREEN:
83
-
84
- ```bash
85
- # Una vez por fase/tarea — abre la corrida
86
- node -e "const lt=require('./hooks/lib/loop-telemetry');const r=lt.iniciarCorrida({tipo:'tdd',direccion:'lower_is_better',config:{fase:'0N',tarea:'T-NN'}});console.log(r.dir)"
87
-
88
- # Al confirmar el RED — métrica = número de tests fallando, descripción = fallo exacto
89
- node -e "const lt=require('./hooks/lib/loop-telemetry');lt.registrarIteracion('<dir>',{iteracion:0,metrica:N,delta:0,estado:'baseline',descripcion:'RED T-NN: <error textual del runner>'})"
90
-
91
- # Al llegar a GREEN
92
- node -e "const lt=require('./hooks/lib/loop-telemetry');lt.registrarIteracion('<dir>',{iteracion:1,metrica:0,delta:-N,estado:'keep',descripcion:'GREEN T-NN: suite verde'})"
93
- ```
94
-
95
- `hooks/tdd-gate.js` (warn-only, ADR-0035) busca la fila RED en
96
- `.planning/loops/tdd-*/iteraciones.tsv` al commitear un feature con tests; sin
97
- evidencia emite nudge `tdd-red-evidence`. Sin `.planning/` no aplica.
98
-
99
- #### Marker de trazabilidad REQ en tests (proyectos con REQ-IDs)
100
-
101
- Cuando la fase tiene criterios `REQ-NN` en el CONTEXTO, cada test que verifica un
102
- criterio lleva el marker en comentario `scripts/verificar-trazabilidad.js` lo usa
103
- para cerrar la cadena REQ→T→commit→test:
104
-
105
- ```python
106
- def test_descuento_cliente_premium():
107
- # verifica: REQ-03
108
- ...
109
- ```
110
-
111
- ```javascript
112
- test('descuento cliente premium', () => {
113
- // verifica: REQ-03
114
- ...
115
- });
116
- ```
117
-
118
- ### Fase GREEN — Implementación mínima
119
-
120
- **Regla de oro**: Implementar solo lo que hace pasar el test. Nada más.
121
-
122
- ```python
123
- # GREEN: Implementación mínima que hace pasar el test
124
- def calcular_descuento(cliente: Cliente, monto: float) -> float:
125
- if cliente.tipo == "premium":
126
- return monto * 0.15
127
- return 0.0
128
- ```
129
-
130
- **Anti-patrón GREEN**: implementar todos los casos de una vez sin tests que los
131
- exijan. Si no hay un test para clientes "gold", no implementes el descuento gold.
132
-
133
- **Verificar**: `pytest -v test_descuentos.py` pasa con el test nuevo.
134
-
135
- ### Fase REFACTOR Limpieza sin cambiar comportamiento
136
-
137
- **Qué refactorizar en esta fase**:
138
- - Nombres de variables o funciones poco claros
139
- - Duplicación de lógica (si ya existe en otro test)
140
- - Magic numbers que deberían ser constantes
141
- - Estructura de código que anticipa el próximo test
142
-
143
- ```python
144
- # REFACTOR: Extraer constante y mejorar legibilidad
145
- DESCUENTO_POR_TIPO = {
146
- "premium": 0.15,
147
- "gold": 0.20,
148
- "standard": 0.0,
149
- }
150
-
151
- def calcular_descuento(cliente: Cliente, monto: float) -> float:
152
- tasa = DESCUENTO_POR_TIPO.get(cliente.tipo, 0.0)
153
- return monto * tasa
154
- ```
155
-
156
- **Verificar**: todos los tests siguen pasando después del refactor.
157
-
158
- ---
159
-
160
- ## Tests de frontera (boundary tests)
161
-
162
- Para toda función que procesa datos, escribir tests de:
163
-
164
- | Tipo de frontera | Ejemplo |
165
- |----------------|---------|
166
- | Valor cero | `monto=0.0` |
167
- | Valor negativo | `monto=-100.0` |
168
- | Valor máximo | `monto=999_999_999.99` |
169
- | String vacío | `nombre=""` |
170
- | None / null | `cliente=None` |
171
- | Lista vacía | `items=[]` |
172
- | Un solo elemento | `items=[item]` |
173
- | Muchos elementos | `items=lista_de_10000` |
174
- | Valor fuera de dominio | `tipo="inexistente"` |
175
- | Caracteres especiales | `nombre="<script>alert(1)</script>"` |
176
-
177
- ---
178
-
179
- ## Factories y Fixtures
180
-
181
- ### Factories (para datos de test)
182
-
183
- Las factories crean objetos con valores válidos por defecto. Los tests solo
184
- sobreescriben lo que importa para ese test específico.
185
-
186
- **Python con factory_boy**:
187
- ```python
188
- import factory
189
- from myapp.models import Cliente, Pedido
190
-
191
- class ClienteFactory(factory.Factory):
192
- class Meta:
193
- model = Cliente
194
-
195
- id = factory.Sequence(lambda n: f"cliente-{n}")
196
- nombre = factory.Faker("name", locale="es_MX")
197
- email = factory.Faker("email")
198
- tipo = "standard" # default explícito
199
- activo = True
200
-
201
- # Uso en test
202
- def test_descuento_premium():
203
- # Solo especificar lo que importa para este test
204
- cliente = ClienteFactory(tipo="premium")
205
- assert calcular_descuento(cliente, 100.0) == 15.0
206
- ```
207
-
208
- **TypeScript con factory functions**:
209
- ```typescript
210
- // factories/user.factory.ts
211
- export const createUser = (overrides: Partial<User> = {}): User => ({
212
- id: 'user-1',
213
- name: 'Test User',
214
- email: 'test@example.com',
215
- role: 'standard',
216
- active: true,
217
- ...overrides,
218
- });
219
-
220
- // Uso en test
221
- it('should show admin panel for admin users', () => {
222
- const user = createUser({ role: 'admin' });
223
- // ...
224
- });
225
- ```
226
-
227
- ### Fixtures (para estado persistente)
228
-
229
- ```python
230
- # conftest.py
231
- import pytest
232
- from sqlalchemy.ext.asyncio import AsyncSession
233
-
234
- @pytest.fixture
235
- async def db_session():
236
- """Sesión de BD en transacción que hace rollback al terminar."""
237
- async with AsyncSessionLocal() as session:
238
- async with session.begin():
239
- yield session
240
- await session.rollback()
241
-
242
- @pytest.fixture
243
- async def cliente_premium(db_session: AsyncSession):
244
- """Cliente premium persistido en BD de test."""
245
- cliente = ClienteFactory.build(tipo="premium")
246
- db_session.add(cliente)
247
- await db_session.flush()
248
- return cliente
249
- ```
250
-
251
- ---
252
-
253
- ## TDD por tipo de código
254
-
255
- ### Services (lógica de negocio)
256
-
257
- ```python
258
- # Orden de tests para un service nuevo:
259
- # 1. Caso feliz principal
260
- # 2. Validaciones de input inválido
261
- # 3. Casos de borde del dominio
262
- # 4. Interacciones con dependencias (mocks)
263
-
264
- @pytest.mark.asyncio
265
- async def test_crear_pedido_valida_stock_disponible():
266
- producto = ProductoFactory(stock=5)
267
- with pytest.raises(StockInsuficienteError):
268
- await PedidoService.crear(producto_id=producto.id, cantidad=10)
269
- ```
270
-
271
- ### Endpoints FastAPI
272
-
273
- ```python
274
- # Usar TestClient de FastAPI
275
- from fastapi.testclient import TestClient
276
-
277
- def test_endpoint_requiere_autenticacion():
278
- response = client.get("/api/v1/pedidos")
279
- assert response.status_code == 401
280
-
281
- def test_endpoint_retorna_solo_pedidos_del_usuario(cliente_autenticado):
282
- pedido_propio = PedidoFactory(usuario_id=cliente_autenticado.id)
283
- pedido_ajeno = PedidoFactory(usuario_id="otro-usuario")
284
-
285
- response = cliente_autenticado.get("/api/v1/pedidos")
286
- ids = [p["id"] for p in response.json()["items"]]
287
-
288
- assert pedido_propio.id in ids
289
- assert pedido_ajeno.id not in ids # IDOR check
290
- ```
291
-
292
- ### Componentes Angular
293
-
294
- ```typescript
295
- // Usar TestBed + ComponentHarness
296
- describe('PedidosComponent', () => {
297
- it('should display empty state when no orders exist', async () => {
298
- const mockService = { getPedidos: () => of({ items: [], total: 0 }) };
299
- await TestBed.configureTestingModule({
300
- providers: [{ provide: PedidosService, useValue: mockService }]
301
- }).compileComponents();
302
-
303
- const fixture = TestBed.createComponent(PedidosComponent);
304
- fixture.detectChanges();
305
-
306
- const emptyState = fixture.nativeElement.querySelector('[data-testid="empty-state"]');
307
- expect(emptyState).toBeTruthy();
308
- });
309
- });
310
- ```
311
-
312
- ---
313
-
314
- ## Cobertura mínima obligatoria
315
-
316
- | Tipo de módulo | Cobertura mínima |
317
- |---------------|-----------------|
318
- | Services (lógica crítica) | 90% |
319
- | Endpoints (API) | 85% |
320
- | Utilities / helpers | 95% |
321
- | Componentes Angular | 75% |
322
- | Modelos ORM | 70% |
323
-
324
- **Verificar** con reporte de cobertura antes de marcar tarea como completada:
325
- ```bash
326
- pytest --cov=src/services --cov-fail-under=90
327
- ```
328
-
329
- ---
330
-
331
- ## Anti-patrones TDD a evitar
332
-
333
- | Anti-patrón | Descripción | Solución |
334
- |-------------|-------------|---------|
335
- | Test del mock | El test solo verifica que se llamó el mock, no el comportamiento real | Testear el efecto observable |
336
- | Test omnibus | Un solo test que verifica 10 cosas a la vez | Un test, un comportamiento |
337
- | Test frágil | Falla si cambias nombres internos sin cambiar comportamiento | Testear comportamiento, no implementación |
338
- | Fixture global | Un fixture que modifica estado global compartido entre tests | Fixtures con scope limitado, rollback |
339
- | Skip como solución | `@pytest.mark.skip` para tests que fallan | Arreglar el bug o eliminar el test |
340
-
341
- ---
342
-
343
- ## Gotchas / Errores comunes no obvios
344
-
345
- **El ciclo TDD se rompe cuando el test en fase RED pasa sin implementación porque la función ya existe con otro nombre en el módulo y Python la importa silenciosamente desde un namespace diferente**: escribir `from app.services import calcular_descuento` en el test cuando `calcular_descuento` ya existe en `app.utils` (importada en `__init__.py`) hace que el test pase en RED sin error, invalidando el ciclo. Causa: los imports con `from app.services import *` en `__init__.py` pueden re-exportar funciones de submódulos, haciendo que el test encuentre una implementación inesperada. Fix: verificar con `python -c "from app.services import calcular_descuento; print(calcular_descuento.__module__)"` que el símbolo viene del módulo correcto. Usar imports explícitos en los tests (`from app.services.descuentos import calcular_descuento`) en lugar de imports de paquete.
346
-
347
- **`pytest.mark.asyncio` con `asyncio_mode = "auto"` en `pytest.ini` hace que fixtures síncronos que retornan coroutines sean llamados sin `await`, causando que el fixture entregue un objeto coroutine en lugar del valor esperado**: un fixture `def cliente_premium(db_session)` que retorna `ClienteFactory.build(tipo="premium")` funciona, pero si accidentalmente se define como `async def cliente_premium(db_session)` y se usa en un test síncrono, pytest lo trata como fixture síncrono y el test recibe el objeto coroutine. Causa: la mezcla de fixtures `async def` y `def` en el mismo `conftest.py` con `asyncio_mode = "auto"` puede crear comportamientos inesperados dependiendo de la versión de `pytest-asyncio`. Fix: en proyectos async, definir TODOS los fixtures relevantes como `async def` explícitamente y verificar que el test use `@pytest.mark.asyncio` o tenga el modo auto configurado correctamente.
348
-
349
- **La fase REFACTOR del ciclo TDD en componentes Angular introduce regresiones silenciosas cuando se extrae lógica a un `computed()` pero el template sigue usando la función directa que ahora devuelve `undefined`**: refactorizar `getTotal()` como método del componente hacia `total = computed(() => ...)` y olvidar actualizar el template de `{{ getTotal() }}` a `{{ total() }}` no genera error de compilación con Angular 17+; el template simplemente muestra `undefined`. Causa: Angular no verifica en tiempo de compilación que los métodos referenciados en templates existen en la clase si el template usa la sintaxis de interpolación sin type-checking estricto. Fix: activar `strictTemplates: true` en `tsconfig.app.json` para que el compilador de Angular valide que todas las referencias en templates corresponden a miembros públicos del componente. Ejecutar `ng build` antes de considerar el REFACTOR completo.
350
-
351
- **`db_session.rollback()` en el fixture de pytest-asyncio no deshace los datos insertados por `db.flush()` dentro de la función testeada cuando la sesión usa `autocommit=True` implícito por configuración del engine**: algunos proyectos configuran `AsyncEngine` con `isolation_level="AUTOCOMMIT"` para compatibilidad con operaciones DDL; en ese contexto, cada `flush()` hace commit inmediatamente y el `rollback()` del fixture no puede deshacer esos cambios. Causa: `AUTOCOMMIT` en PostgreSQL significa que no hay transacción activa que se pueda revertir. Fix: verificar que el engine de tests NO use `isolation_level="AUTOCOMMIT"` (la configuración debe ser solo para el engine de migraciones Alembic, no para el de la app). Para tests que necesitan AUTOCOMMIT por alguna razón, usar una BD de test separada que se trunca con `TRUNCATE ... RESTART IDENTITY CASCADE` en el teardown del fixture.
352
-
353
- **Reloj inyectable como parámetro `ahora` habilita tests deterministas sin `freezegun`, `jest.useFakeTimers()` ni `sinon.useFakeTimers()`** [PATRÓN VALIDADO en SWL Opción C webhook]: cuando una API depende del tiempo (rate-limit con bucket que se rellena, dedup con ventana de retención, cache con TTL, schedulers), recibir el timestamp por parámetro en lugar de llamar `Date.now()` internamente permite que los tests pasen 1000 segundos en 0 ms reales. Diseño: `metodo(arg1, arg2, ahora = Date.now())` — producción no cambia (llamadas siguen siendo `obj.consumir(1)`), tests pasan `ahora` explícito (`obj.consumir(1, T0 + 5000)`). Validado en 3 módulos esta sesión: `rate-limit-ip.js` (40+ tests bucket refill, capacidad, cleanup), `webhook-dedup.js` (ventana de retención, rotación idempotente), helpers internos de `webhook-server.js`. Ningún test usa `sleep`, ningún test es flaky, ningún test mockea `Date`. Aplicable a JS/TS y a Python (`def consumir(self, tokens, ahora=None)` con `ahora = ahora or datetime.now(UTC)` al inicio).
354
-
355
- ```js
356
- // MAL — test no-determinista, requiere sleep o mock global
357
- class Bucket {
358
- consumir(n) {
359
- const ahora = Date.now(); // ← imposible de controlar desde el test
360
- this._rellenar(ahora);
361
- if (this.tokens >= n) { this.tokens -= n; return true; }
362
- return false;
363
- }
364
- }
365
-
366
- // BIEN — reloj inyectable, test determinista
367
- class Bucket {
368
- consumir(n, ahora = Date.now()) { // default en producción, inyectable en test
369
- this._rellenar(ahora);
370
- if (this.tokens >= n) { this.tokens -= n; return true; }
371
- return false;
372
- }
373
- }
374
-
375
- // En el test:
376
- const T0 = 1700000000000;
377
- const b = new Bucket(10, 1, T0);
378
- for (let i = 0; i < 10; i++) b.consumir(1, T0); // saturar
379
- assert.equal(b.consumir(1, T0), false); // sin refill aún
380
- assert.equal(b.consumir(5, T0 + 5000), true); // 5 seg después: 5 tokens
381
- ```
382
-
383
- Aplica también a tests de clock skew (tiempo retrocede por NTP): pasar `T0 - 1000` y validar que la lógica no rompe. Origen: rate-limit-ip.js + webhook-dedup.js sesión 2026-05-13.
384
-
385
- **Tests nombrados por feature (`test_emitir_factura_exitosa`) pierden poder regresivo; nombrados por causa raíz (`test_repository_no_usa_columna_inexistente_p_monto`) detectan regresiones específicas sin reproducción manual** [CONFIRMADO en SIGM Opción C F1.4]: cuando se descubre un bug por una causa raíz concreta (typo en nombre de columna SQL, omisión de `selectinload`, mock que devuelve dict en vez de objeto, schema obsoleto), el test de regresión que se escribe debe llevar el nombre de la causa, no del feature afectado. Caso real: durante F1.4 de SIGM, el repository de pagos referenciaba `p.monto` cuando la columna se llamaba `p.monto_pagado`; el test escrito como `test_repository_no_usa_columna_inexistente_p_monto` falló inmediatamente en la siguiente sesión cuando otro agente reintrodujo el typo, sin necesidad de reproducir el escenario de negocio (emitir cobro real, verificar respuesta). Causa: los nombres orientados a feature (`test_pago_exitoso`) son ambiguos sobre QUÉ falla — si el test falla, el desarrollador debe diagnosticar; los nombres orientados a causa raíz (`test_X_no_usa_Y`, `test_query_incluye_selectinload_Z`, `test_service_devuelve_dict_no_objeto`) son auto-diagnósticos. Fix: para cada bug que cueste >30 min diagnosticar, escribir UN test adicional cuyo nombre describa la condición técnica violada, no el escenario de negocio. Convención: `test_<componente>_<condicion_tecnica>` o `test_<componente>_no_<anti_patron>`. Estos tests son tu segunda línea de defensa contra regresiones de la misma causa raíz, complementarios a los tests de comportamiento.
386
-
387
- **`process.cwd()` cacheado al `require()` rompe tests con `process.chdir(sandbox)`** [PATRÓN GENÉRICO TESTING CLI]: scripts Node exportables que leen `process.cwd()` en el scope del módulo (al cargar) congelan el cwd al directorio de invocación. Los tests que crean sandboxes con `fs.mkdtempSync()` y luego `process.chdir(sandbox)` no afectan al cwd cacheado el script sigue leyendo del cwd original y los assertions fallan con paths inesperados. Caso real (swl-ses `scripts/derivar-feature-list.js` 2026-05-15): la función `enriquecerDesdeFases(fases)` leía `const CWD = process.cwd()` calculado al `require()`; 2 tests con `process.chdir(sandbox)` retornaron `[]` en lugar de detectar el PLAN.md fixture. Causa: el constante se evaluó cuando el `node --test` cargó el módulo desde el cwd del proyecto, no desde el sandbox del test individual. Fix obligatorio: funciones exportables deben aceptar `cwd` como parámetro opcional con fallback dinámico (`function fn(args, opciones = {}) { const cwd = opciones.cwd || process.cwd(); ... }`). El código de producción no cambia (sin args extras), pero los tests pueden inyectar el cwd correcto. Aplica también a Python (`def fn(args, cwd: str | None = None): cwd = cwd or os.getcwd()`) y a cualquier lenguaje con tests que usen chdir.
388
-
389
- ```js
390
- // MAL — cwd cacheado al require, tests con process.chdir() fallan
391
- const CWD = process.cwd();
392
- const PLANNING_DIR = path.join(CWD, '.planning');
393
-
394
- function enriquecerDesdeFases(fases) {
395
- const archivos = fs.readdirSync(path.join(PLANNING_DIR, 'fases')); // cwd congelado
396
- // ...
397
- }
398
-
399
- // BIEN — cwd dinámico con parámetro opcional para tests
400
- function enriquecerDesdeFases(fases, opciones = {}) {
401
- const cwd = opciones.cwd || process.cwd(); // recalcula al llamar
402
- const archivos = fs.readdirSync(path.join(cwd, '.planning', 'fases'));
403
- // ...
404
- }
405
-
406
- // En el test (usa setupSandboxes — regla tests-cleanup.md):
407
- const { setupSandboxes } = require('../_helpers/sandbox');
408
- const sandboxes = setupSandboxes('swl-test-');
409
-
410
- const sandbox = sandboxes.create();
411
- fs.mkdirSync(path.join(sandbox, '.planning', 'fases'), { recursive: true });
412
- // Opción A: pasar cwd explícito (recomendado)
413
- const r = enriquecerDesdeFases([], { cwd: sandbox });
414
- // Opción B: process.chdir() solo funciona con cwd dinámico
415
- process.chdir(sandbox);
416
- const r2 = enriquecerDesdeFases([]);
417
- // Cleanup automático al final del archivo vía after() registrado por setupSandboxes.
418
- ```
419
-
420
- ---
421
-
422
- ## Gotcha: silenced tests por race condition sobre estado compartido
423
-
424
- ### El anti-patrón
425
-
426
- ```javascript
427
- // MAL — assertion condicional dentro de if que puede ser false por race
428
- const FLAG = path.join(os.tmpdir(), 'mi-app.json');
429
-
430
- test('flag sin contenido emite warning', () => {
431
- borrarFlag();
432
- const res = correrSubproceso();
433
- if (fs.existsSync(FLAG)) { // ← otro test paralelo creó el flag
434
- assert.match(res.stdout, /WARN/); // ← NUNCA se ejecuta si el if es false
435
- }
436
- // sin else test PASA sin haber validado nada
437
- });
438
-
439
- // El test "verde" no significa "pasó" — significa "no falló ninguna assertion".
440
- // Si la assertion vive dentro de un `if (race)`, una race favorable la salta
441
- // y el test es vacío.
442
- ```
443
-
444
- ### Por qué pasa
445
-
446
- `node:test` paraleliza **archivos** `.test.js` por default (no tests dentro
447
- del mismo archivo). Si dos archivos tocan el mismo path único de filesystem
448
- (`/tmp/foo.json`, lockfiles, sockets), las operaciones se intercalan no
449
- deterministamente. Patrones típicos:
450
-
451
- - Archivo A: `borrarFlag()` → spawn subprocess → assert
452
- - Archivo B: spawn subprocess → `crearFlag()` durante A → assert de A condicionado falla
453
-
454
- ### Patrones correctos
455
-
456
- **Patrón 1 — Aislamiento por path único** (recomendado):
457
-
458
- ```javascript
459
- const { setupSandboxes } = require('../_helpers/sandbox');
460
- const sandboxes = setupSandboxes('swl-mi-app-test-');
461
- const env = { ...process.env };
462
-
463
- // Path único por test usando el helper canónico (regla tests-cleanup.md).
464
- // El cleanup es automático al final del archivo vía after() registrado.
465
- const dir = sandboxes.create();
466
- env.MI_APP_FLAG_PATH = path.join(dir, 'flag.json');
467
-
468
- const res = spawnSync('node', [BIN], { env, ... });
469
-
470
- // Ahora el assert es incondicional — el path es del test, no compartido
471
- assert.match(res.stdout, /WARN/);
472
- ```
473
-
474
- Requiere que el SUT (System Under Test) honre una env var para override
475
- del path. Si no la honra, agregar el override es parte del fix.
476
-
477
- **Patrón 2 Serialización forzada** (cuando el path es hardcoded):
478
-
479
- ```bash
480
- # Forzar --test-concurrency=1 en la suite completa
481
- node --test --test-concurrency=1 tests/
482
- ```
483
-
484
- Tradeoff: tests más lentos pero deterministas. Aceptable si el aislamiento
485
- no es factible (legacy code).
486
-
487
- **Patrón 3 assertions incondicionales** con setup determinista:
488
-
489
- ```javascript
490
- // MAL
491
- if (fs.existsSync(FLAG)) assert.match(...)
492
-
493
- // BIEN — setup garantiza la precondición, assertion no se salta
494
- escribirFlag({ ... });
495
- assert.ok(fs.existsSync(FLAG), 'precondición del test'); // assertion sobre el setup
496
- const res = correrSubproceso();
497
- assert.match(res.stdout, /WARN/); // ← assertion incondicional sobre el resultado
498
- ```
499
-
500
- ### Anti-patrón: `if (X) assert(Y)` sin `else`
501
-
502
- ```javascript
503
- // MAL — un test que pasa silenciosamente cuando X es false
504
- test('hace algo', () => {
505
- const algo = obtenerAlgo();
506
- if (algo) { // ← race u otra fuente de no-determinismo
507
- assert.equal(algo.valor, 42);
508
- }
509
- // sin else → veredicto "pass" sin haber validado nada
510
- });
511
-
512
- // BIEN — el setup garantiza la precondición o el test falla explícito
513
- test('hace algo', () => {
514
- const algo = obtenerAlgo();
515
- assert.ok(algo, 'precondición: obtenerAlgo debe devolver valor');
516
- assert.equal(algo.valor, 42);
517
- });
518
- ```
519
-
520
- **Regla**: una assertion dentro de un `if` sin `else` es **un test que
521
- puede pasar sin validar nada**. Estos "silenced tests" son la peor clase
522
- de falsa cobertura: el reporter dice "pass" y nadie revisa el código
523
- hasta que un bug llega a producción.
524
-
525
- ### Detección
526
-
527
- - Buscar `if (` dentro de cuerpos de `test(...)`/`it(...)` sin `else { fail() }`
528
- o `else { assert(...) }` correspondiente.
529
- - Si el cuerpo del `if` contiene `assert.*`, considerarlo silenced test
530
- hasta que se demuestre que el `if` no puede ser false en ningún escenario.
531
-
532
- ### Origen
533
-
534
- Detectado en sesión 2026-05-16 del proyecto swl-ses (PR #30): tests del
535
- flag `swl-ses-update-check.json` compartido entre dos archivos `.test.js`
536
- paralelos. El test "sin flag debe advertir" pasaba en CI cuando otro
537
- archivo creaba el flag, sin ejecutar ninguna assertion. Fix: env var
538
- `SWL_UPDATE_FLAG_PATH` para aislamiento + assertions incondicionales.
539
-
540
- ---
541
-
542
- ## Tests E2E de CLIs interactivos sin PTY real
543
-
544
- ### El problema
545
-
546
- Probar un CLI interactivo (TUI con `readline`, prompts, keypress events,
547
- `process.stdin.isTTY`) en CI requiere normalmente un **pseudo-terminal
548
- emulado** (PTY) usualmente vía `node-pty`, una dependencia **nativa** que:
549
-
550
- - Requiere compilación de extensiones C++ al instalar (puede fallar en
551
- contenedores minimal o en Windows sin Visual Studio Build Tools).
552
- - Agrega ~5 MB al `node_modules` por imagen.
553
- - Hace que el test suite no corra en `npm test` sin setup extra.
554
-
555
- Para CLIs interactivos donde no se necesita probar **el comportamiento
556
- real del terminal** (escape codes, redibujado, scroll), sino solo la
557
- **lógica del wizard** (¿qué pasa si el usuario presiona Esc en el paso 3?,
558
- ¿qué resuelve el promise tras Enter con default?), un harness TTY mockeado
559
- cubre ~90% de los casos sin dep nativa.
560
-
561
- ### Patrón del harness
562
-
563
- ```javascript
564
- // tests/harness-tty.js
565
- 'use strict';
566
-
567
- const readline = require('readline');
568
-
569
- function crearHarness() {
570
- // 1. Capturar estado original para restauración
571
- const stdoutOriginal = process.stdout.write.bind(process.stdout);
572
- const isTtyStdoutOriginal = process.stdout.isTTY;
573
- const isTtyStdinOriginal = process.stdin.isTTY;
574
- const setRawModeOriginal = process.stdin.setRawMode
575
- ? process.stdin.setRawMode.bind(process.stdin) : null;
576
- const emitKeypressOriginal = readline.emitKeypressEvents;
577
-
578
- let capturado = '';
579
- let listenersKeypress = [];
580
-
581
- // 2. Forzar TTY antes de cargar módulos UI (que evalúan ES_TTY al require)
582
- Object.defineProperty(process.stdout, 'isTTY', { value: true, configurable: true });
583
- Object.defineProperty(process.stdin, 'isTTY', { value: true, configurable: true });
584
-
585
- // 3. Capturar stdout en string buffer
586
- process.stdout.write = (chunk) => {
587
- capturado += typeof chunk === 'string' ? chunk : chunk.toString();
588
- return true;
589
- };
590
-
591
- // 4. Mockear setRawMode/resume/pause como no-op (evita tomar control del terminal de test)
592
- process.stdin.setRawMode = () => process.stdin;
593
- process.stdin.resume = () => process.stdin;
594
- process.stdin.pause = () => process.stdin;
595
-
596
- // 5. Interceptar registros de 'keypress' para poder emitirlos a mano
597
- const onListenerOriginal = process.stdin.on.bind(process.stdin);
598
- process.stdin.on = (evento, listener) => {
599
- if (evento === 'keypress') listenersKeypress.push(listener);
600
- return onListenerOriginal(evento, listener);
601
- };
602
-
603
- // 6. Mockear readline.emitKeypressEvents (no necesita stdin real)
604
- readline.emitKeypressEvents = (stream) => stream;
605
-
606
- // 7. Limpiar require cache de módulos UI para que se evalúen con TTY=true
607
- delete require.cache[require.resolve('../scripts/tui/lib/render')];
608
-
609
- function cargarUI() {
610
- return require('../scripts/tui/lib/render');
611
- }
612
-
613
- // 8. Emitir keypress programáticamente
614
- function tecla(nombre, extras = {}) {
615
- const key = { name: nombre, ctrl: false, meta: false, shift: false, ...extras };
616
- const str = nombre.length === 1 ? nombre : '';
617
- for (const listener of [...listenersKeypress]) {
618
- try { listener(str, key); } catch (_) { /* swallow */ }
619
- }
620
- }
621
-
622
- // 9. Esperar N ticks del event loop para promesas internas
623
- function esperarTicks(n = 1) {
624
- let p = Promise.resolve();
625
- for (let i = 0; i < n; i++) p = p.then(() => undefined);
626
- return p;
627
- }
628
-
629
- function captura(opts = {}) {
630
- const valor = capturado;
631
- if (opts.limpiar) capturado = '';
632
- return valor;
633
- }
634
-
635
- function restaurar() {
636
- Object.defineProperty(process.stdout, 'isTTY', { value: isTtyStdoutOriginal, configurable: true });
637
- Object.defineProperty(process.stdin, 'isTTY', { value: isTtyStdinOriginal, configurable: true });
638
- process.stdout.write = stdoutOriginal;
639
- if (setRawModeOriginal) process.stdin.setRawMode = setRawModeOriginal;
640
- process.stdin.on = onListenerOriginal;
641
- readline.emitKeypressEvents = emitKeypressOriginal;
642
- listenersKeypress = [];
643
- // Limpiar require cache para no contaminar otros tests
644
- delete require.cache[require.resolve('../scripts/tui/lib/render')];
645
- }
646
-
647
- return { cargarUI, tecla, esperarTicks, captura, restaurar };
648
- }
649
-
650
- module.exports = { crearHarness };
651
- ```
652
-
653
- ### Uso típico
654
-
655
- ```javascript
656
- const test = require('node:test');
657
- const assert = require('node:assert/strict');
658
- const { crearHarness } = require('./harness-tty');
659
-
660
- test('preguntarSiNo con harness: Enter resuelve con default true', async () => {
661
- const h = crearHarness();
662
- try {
663
- const ui = h.cargarUI();
664
- const promesa = ui.preguntarSiNo('test prompt', true);
665
-
666
- await h.esperarTicks(2);
667
- h.tecla('return');
668
-
669
- const timeout = new Promise((_, reject) =>
670
- setTimeout(() => reject(new Error('no resolvió en 500ms')), 500));
671
-
672
- const r = await Promise.race([promesa, timeout]).catch(() => null);
673
- // r === true si el harness simuló bien; null si readline real bloquea
674
- // (caso esperado en Windows sin PTY real; documentar limitación)
675
- } finally {
676
- h.restaurar();
677
- }
678
- });
679
- ```
680
-
681
- ### Reglas operativas
682
-
683
- - **`restaurar()` en `finally`**: el harness modifica state global
684
- (process.stdout, process.stdin, readline, require.cache). Si un test
685
- no restaura, contamina los siguientes.
686
- - **Test de captura como smoke**: agregar un test "harness captura stdout"
687
- que valida que `process.stdout.write('hola')` aparece en `captura()`.
688
- Si falla, el harness está roto antes de testear el SUT.
689
- - **Test "tecla() es no-op sin listeners"**: validar que emitir keypress
690
- cuando nadie escucha NO rompe el harness ni propaga errores.
691
- - **Limitación reconocida**: si `readline.createInterface()` real toma
692
- control de stdin (en Windows con Git Bash sin PTY), el callback de
693
- `rl.question()` no se invoca aunque el harness emita teclas. Usar
694
- `Promise.race([promesa, timeout])` para que el test no cuelgue
695
- el test marca limitación, no falla.
696
-
697
- ### Cuándo NO usar este patrón
698
-
699
- - Cuando necesitas probar **redibujado real del terminal** (alt screen
700
- buffer, escape codes complejos, scrollback). Ahí sí necesitas PTY real
701
- via `node-pty` o test manual.
702
- - Cuando el SUT depende de **timing real del teclado** (input rates,
703
- paste detection). El mock no replica latencia.
704
- - Para CLIs sin lógica de control de flujo (solo `console.log` lineal) —
705
- ahí basta capturar stdout sin mockear TTY.
706
-
707
- ### Origen
708
-
709
- Aplicado en swl-ses v1.6.0 (`tests/scripts/tui/harness-tty.js`, ~180 LOC).
710
- Validó el TUI completo de 5 fases sin instalar `node-pty`. Limitación
711
- documentada: 1 test E2E "preguntarSiNo con harness" marca timeout en
712
- Windows + Node 22+ porque readline real bloquea pese a stdin mockeado —
713
- el harness emite la limitación sin fallar.
1
+ ---
2
+ name: tdd-workflow
3
+ description: Flujo completo de Test-Driven Development. Ciclo RED (el test falla) → GREEN (implementación mínima) → REFACTOR (limpieza). Incluye cobertura mínima obligatoria, tests de frontera, factories, fixtures y estrategias para diferentes tipos de código (APIs, services, componentes Angular).
4
+ version: "1.2.1"
5
+ evolved: true
6
+ evolved-from: "1.1.0"
7
+ evolved-at: "2026-06-11"
8
+ evolved-by: "fase-10-slice-2"
9
+ evolved-note: "v1.2.0: sección 'Evidencia RED en telemetría' (gate G2, ADR-0035, cierra F-TDD-6) — registro de corridas tdd-* en loop-telemetry. v1.0.5: gotcha 'Tests E2E de CLIs interactivos sin PTY real'. Origen M2 sesión 2026-05-16. v1.0.4: silenced tests por race en path único compartido. v1.0.3: gotcha cwd cacheado al require()."
10
+ herramientasPermitidas: [Read, Bash]
11
+ evolvable: true # default para skill estandar
12
+ exclusiones:
13
+ - "No cargar para escribir tests de regresión sobre código legacy sin suite existente — en código legacy sin tests, comenzar con caracterización de comportamiento actual antes del ciclo TDD."
14
+ - "No cargar para pruebas de carga o performance testing — para benchmarks y load testing cargar `performance-baseline`."
15
+ - "No cargar para configurar pipelines de CI/CD o runners de tests en GitHub Actions / GitLab CI — para configuración de CI cargar el skill de cloud correspondiente."
16
+ - "No cargar para pruebas de seguridad o fuzzing automático — para testing de seguridad cargar `threat-model-lite` y usar herramientas especializadas (Bandit, OWASP ZAP)."
17
+ ---
18
+ # Habilidad: TDD Workflow Completo
19
+
20
+ ## Cuándo NO cargar
21
+
22
+ - La tarea es añadir tests a código legacy sin suite existente: comenzar con tests de caracterización del comportamiento actual antes del ciclo TDD.
23
+ - La tarea es pruebas de carga o benchmarks: cargar `performance-baseline`.
24
+ - La tarea es configurar CI/CD pipelines: cargar el skill de cloud correspondiente.
25
+ - La tarea es fuzzing o testing de seguridad: cargar `threat-model-lite` y usar herramientas especializadas.
26
+
27
+ ## Propósito
28
+
29
+ TDD no es "escribir tests después" ni "escribir tests antes por costumbre". Es
30
+ un método de diseño donde los tests guían la API pública del código antes de
31
+ que exista la implementación. El resultado es código que hace exactamente lo
32
+ que los tests exigen — ni más, ni menos.
33
+
34
+ ## Cuándo activar
35
+
36
+ - CONTEXT.md o PLAN.md indica que la fase requiere TDD
37
+ - Se implementa lógica de negocio crítica (cálculos, validaciones, permisos)
38
+ - El usuario pide explícitamente TDD
39
+ - Se trabaja en un módulo con historial de bugs
40
+
41
+ ---
42
+
43
+ ## Etapa opcional previa: Gherkin (BDD) y gate de mutación
44
+
45
+ Dos extensiones opt-in del ciclo, ambas con guía completa en recursos:
46
+
47
+ - **Antes del ciclo** — si la fase tiene criterios de aceptación de negocio,
48
+ convertirlos en escenarios Given–When–Then validados por el usuario ANTES de
49
+ implementar; cada escenario es el test RED de su criterio. Guía, runners por
50
+ stack y anti-patrones en [recursos/gherkin-bdd.md](recursos/gherkin-bdd.md).
51
+ - **Después del ciclo** — en módulos críticos, verificar la calidad de los
52
+ asserts con mutation testing incremental sobre el diff:
53
+ `Skill("calidad-mutation-testing")`. La cobertura mide ejecución; los
54
+ mutantes sobrevivientes miden si los tests detectarían un bug.
55
+
56
+ ## El ciclo fundamental RED → GREEN → REFACTOR
57
+
58
+ ### Fase RED — El test debe fallar por la razón correcta
59
+
60
+ **Paso 1**: Escribir el test que describe el comportamiento esperado.
61
+
62
+ ```python
63
+ # RED: Este test falla porque calcular_descuento no existe todavía
64
+ def test_descuento_cliente_premium_es_15_porciento():
65
+ cliente = ClienteFactory(tipo="premium")
66
+ resultado = calcular_descuento(cliente, monto=100.0)
67
+ assert resultado == 15.0
68
+ ```
69
+
70
+ **Verificar que el test falla BIEN**:
71
+ - Falla con `NameError` o `ImportError` si la función no existe: CORRECTO
72
+ - Falla con `AssertionError` si el comportamiento es incorrecto: CORRECTO
73
+ - Falla con `TypeError` si la firma es incorrecta: CORRECTO
74
+ - Pasa sin que exista implementación: SEÑAL DE ALARMA — el test no prueba nada
75
+
76
+ **NUNCA avanzar a GREEN si el test pasa en RED.**
77
+
78
+ #### Evidencia RED en telemetría (gate G2 — proyectos con SWL)
79
+
80
+ El RED debe dejar rastro verificable (cierra F-TDD-6: "TDD declarativo sin
81
+ evidencia"). En proyectos con `.planning/`, registrar la corrida en
82
+ `hooks/lib/loop-telemetry.js` ANTES de pasar a GREEN:
83
+
84
+ ```bash
85
+ # Una vez por fase/tarea — abre la corrida
86
+ node -e "const lt=require('./hooks/lib/loop-telemetry');const r=lt.iniciarCorrida({tipo:'tdd',direccion:'lower_is_better',config:{fase:'0N',tarea:'T-NN'}});console.log(r.dir)"
87
+
88
+ # Al confirmar el RED — métrica = número de tests fallando, descripción = fallo exacto
89
+ node -e "const lt=require('./hooks/lib/loop-telemetry');lt.registrarIteracion('<dir>',{iteracion:0,metrica:N,delta:0,estado:'baseline',descripcion:'RED T-NN: <error textual del runner>'})"
90
+
91
+ # Al llegar a GREEN
92
+ node -e "const lt=require('./hooks/lib/loop-telemetry');lt.registrarIteracion('<dir>',{iteracion:1,metrica:0,delta:-N,estado:'keep',descripcion:'GREEN T-NN: suite verde'})"
93
+ ```
94
+
95
+ `hooks/tdd-gate.js` (warn-only, ADR-0035) busca la fila RED en
96
+ `.planning/loops/tdd-*/iteraciones.tsv` al commitear un feature con tests; sin
97
+ evidencia emite nudge `tdd-red-evidence`. Sin `.planning/` no aplica.
98
+
99
+ #### Marker de trazabilidad REQ en tests (proyectos con REQ-IDs)
100
+
101
+ Cuando la fase tiene criterios `REQ-NN` (fases 01-11) o `REQ-<fase>-NN`
102
+ (namespaceados, fases ≥12 DT-IDS-NAMESPACE) en el CONTEXTO, cada test que
103
+ verifica un criterio lleva el marker en comentario —
104
+ `scripts/verificar-trazabilidad.js` lo usa para cerrar la cadena
105
+ REQ→T→commit→test (reconoce ambos formatos):
106
+
107
+ ```python
108
+ def test_descuento_cliente_premium():
109
+ # verifica: REQ-12-03
110
+ ...
111
+ ```
112
+
113
+ ```javascript
114
+ test('descuento cliente premium', () => {
115
+ // verifica: REQ-12-03
116
+ ...
117
+ });
118
+ ```
119
+
120
+ ### Fase GREEN Implementación mínima
121
+
122
+ **Regla de oro**: Implementar solo lo que hace pasar el test. Nada más.
123
+
124
+ ```python
125
+ # GREEN: Implementación mínima que hace pasar el test
126
+ def calcular_descuento(cliente: Cliente, monto: float) -> float:
127
+ if cliente.tipo == "premium":
128
+ return monto * 0.15
129
+ return 0.0
130
+ ```
131
+
132
+ **Anti-patrón GREEN**: implementar todos los casos de una vez sin tests que los
133
+ exijan. Si no hay un test para clientes "gold", no implementes el descuento gold.
134
+
135
+ **Verificar**: `pytest -v test_descuentos.py` pasa con el test nuevo.
136
+
137
+ ### Fase REFACTOR Limpieza sin cambiar comportamiento
138
+
139
+ **Qué refactorizar en esta fase**:
140
+ - Nombres de variables o funciones poco claros
141
+ - Duplicación de lógica (si ya existe en otro test)
142
+ - Magic numbers que deberían ser constantes
143
+ - Estructura de código que anticipa el próximo test
144
+
145
+ ```python
146
+ # REFACTOR: Extraer constante y mejorar legibilidad
147
+ DESCUENTO_POR_TIPO = {
148
+ "premium": 0.15,
149
+ "gold": 0.20,
150
+ "standard": 0.0,
151
+ }
152
+
153
+ def calcular_descuento(cliente: Cliente, monto: float) -> float:
154
+ tasa = DESCUENTO_POR_TIPO.get(cliente.tipo, 0.0)
155
+ return monto * tasa
156
+ ```
157
+
158
+ **Verificar**: todos los tests siguen pasando después del refactor.
159
+
160
+ ---
161
+
162
+ ## Tests de frontera (boundary tests)
163
+
164
+ Para toda función que procesa datos, escribir tests de:
165
+
166
+ | Tipo de frontera | Ejemplo |
167
+ |----------------|---------|
168
+ | Valor cero | `monto=0.0` |
169
+ | Valor negativo | `monto=-100.0` |
170
+ | Valor máximo | `monto=999_999_999.99` |
171
+ | String vacío | `nombre=""` |
172
+ | None / null | `cliente=None` |
173
+ | Lista vacía | `items=[]` |
174
+ | Un solo elemento | `items=[item]` |
175
+ | Muchos elementos | `items=lista_de_10000` |
176
+ | Valor fuera de dominio | `tipo="inexistente"` |
177
+ | Caracteres especiales | `nombre="<script>alert(1)</script>"` |
178
+
179
+ ---
180
+
181
+ ## Factories y Fixtures
182
+
183
+ ### Factories (para datos de test)
184
+
185
+ Las factories crean objetos con valores válidos por defecto. Los tests solo
186
+ sobreescriben lo que importa para ese test específico.
187
+
188
+ **Python con factory_boy**:
189
+ ```python
190
+ import factory
191
+ from myapp.models import Cliente, Pedido
192
+
193
+ class ClienteFactory(factory.Factory):
194
+ class Meta:
195
+ model = Cliente
196
+
197
+ id = factory.Sequence(lambda n: f"cliente-{n}")
198
+ nombre = factory.Faker("name", locale="es_MX")
199
+ email = factory.Faker("email")
200
+ tipo = "standard" # default explícito
201
+ activo = True
202
+
203
+ # Uso en test
204
+ def test_descuento_premium():
205
+ # Solo especificar lo que importa para este test
206
+ cliente = ClienteFactory(tipo="premium")
207
+ assert calcular_descuento(cliente, 100.0) == 15.0
208
+ ```
209
+
210
+ **TypeScript con factory functions**:
211
+ ```typescript
212
+ // factories/user.factory.ts
213
+ export const createUser = (overrides: Partial<User> = {}): User => ({
214
+ id: 'user-1',
215
+ name: 'Test User',
216
+ email: 'test@example.com',
217
+ role: 'standard',
218
+ active: true,
219
+ ...overrides,
220
+ });
221
+
222
+ // Uso en test
223
+ it('should show admin panel for admin users', () => {
224
+ const user = createUser({ role: 'admin' });
225
+ // ...
226
+ });
227
+ ```
228
+
229
+ ### Fixtures (para estado persistente)
230
+
231
+ ```python
232
+ # conftest.py
233
+ import pytest
234
+ from sqlalchemy.ext.asyncio import AsyncSession
235
+
236
+ @pytest.fixture
237
+ async def db_session():
238
+ """Sesión de BD en transacción que hace rollback al terminar."""
239
+ async with AsyncSessionLocal() as session:
240
+ async with session.begin():
241
+ yield session
242
+ await session.rollback()
243
+
244
+ @pytest.fixture
245
+ async def cliente_premium(db_session: AsyncSession):
246
+ """Cliente premium persistido en BD de test."""
247
+ cliente = ClienteFactory.build(tipo="premium")
248
+ db_session.add(cliente)
249
+ await db_session.flush()
250
+ return cliente
251
+ ```
252
+
253
+ ---
254
+
255
+ ## TDD por tipo de código
256
+
257
+ ### Services (lógica de negocio)
258
+
259
+ ```python
260
+ # Orden de tests para un service nuevo:
261
+ # 1. Caso feliz principal
262
+ # 2. Validaciones de input inválido
263
+ # 3. Casos de borde del dominio
264
+ # 4. Interacciones con dependencias (mocks)
265
+
266
+ @pytest.mark.asyncio
267
+ async def test_crear_pedido_valida_stock_disponible():
268
+ producto = ProductoFactory(stock=5)
269
+ with pytest.raises(StockInsuficienteError):
270
+ await PedidoService.crear(producto_id=producto.id, cantidad=10)
271
+ ```
272
+
273
+ ### Endpoints FastAPI
274
+
275
+ ```python
276
+ # Usar TestClient de FastAPI
277
+ from fastapi.testclient import TestClient
278
+
279
+ def test_endpoint_requiere_autenticacion():
280
+ response = client.get("/api/v1/pedidos")
281
+ assert response.status_code == 401
282
+
283
+ def test_endpoint_retorna_solo_pedidos_del_usuario(cliente_autenticado):
284
+ pedido_propio = PedidoFactory(usuario_id=cliente_autenticado.id)
285
+ pedido_ajeno = PedidoFactory(usuario_id="otro-usuario")
286
+
287
+ response = cliente_autenticado.get("/api/v1/pedidos")
288
+ ids = [p["id"] for p in response.json()["items"]]
289
+
290
+ assert pedido_propio.id in ids
291
+ assert pedido_ajeno.id not in ids # IDOR check
292
+ ```
293
+
294
+ ### Componentes Angular
295
+
296
+ ```typescript
297
+ // Usar TestBed + ComponentHarness
298
+ describe('PedidosComponent', () => {
299
+ it('should display empty state when no orders exist', async () => {
300
+ const mockService = { getPedidos: () => of({ items: [], total: 0 }) };
301
+ await TestBed.configureTestingModule({
302
+ providers: [{ provide: PedidosService, useValue: mockService }]
303
+ }).compileComponents();
304
+
305
+ const fixture = TestBed.createComponent(PedidosComponent);
306
+ fixture.detectChanges();
307
+
308
+ const emptyState = fixture.nativeElement.querySelector('[data-testid="empty-state"]');
309
+ expect(emptyState).toBeTruthy();
310
+ });
311
+ });
312
+ ```
313
+
314
+ ---
315
+
316
+ ## Cobertura mínima obligatoria
317
+
318
+ | Tipo de módulo | Cobertura mínima |
319
+ |---------------|-----------------|
320
+ | Services (lógica crítica) | 90% |
321
+ | Endpoints (API) | 85% |
322
+ | Utilities / helpers | 95% |
323
+ | Componentes Angular | 75% |
324
+ | Modelos ORM | 70% |
325
+
326
+ **Verificar** con reporte de cobertura antes de marcar tarea como completada:
327
+ ```bash
328
+ pytest --cov=src/services --cov-fail-under=90
329
+ ```
330
+
331
+ ---
332
+
333
+ ## Anti-patrones TDD a evitar
334
+
335
+ | Anti-patrón | Descripción | Solución |
336
+ |-------------|-------------|---------|
337
+ | Test del mock | El test solo verifica que se llamó el mock, no el comportamiento real | Testear el efecto observable |
338
+ | Test omnibus | Un solo test que verifica 10 cosas a la vez | Un test, un comportamiento |
339
+ | Test frágil | Falla si cambias nombres internos sin cambiar comportamiento | Testear comportamiento, no implementación |
340
+ | Fixture global | Un fixture que modifica estado global compartido entre tests | Fixtures con scope limitado, rollback |
341
+ | Skip como solución | `@pytest.mark.skip` para tests que fallan | Arreglar el bug o eliminar el test |
342
+
343
+ ---
344
+
345
+ ## Gotchas / Errores comunes no obvios
346
+
347
+ **El ciclo TDD se rompe cuando el test en fase RED pasa sin implementación porque la función ya existe con otro nombre en el módulo y Python la importa silenciosamente desde un namespace diferente**: escribir `from app.services import calcular_descuento` en el test cuando `calcular_descuento` ya existe en `app.utils` (importada en `__init__.py`) hace que el test pase en RED sin error, invalidando el ciclo. Causa: los imports con `from app.services import *` en `__init__.py` pueden re-exportar funciones de submódulos, haciendo que el test encuentre una implementación inesperada. Fix: verificar con `python -c "from app.services import calcular_descuento; print(calcular_descuento.__module__)"` que el símbolo viene del módulo correcto. Usar imports explícitos en los tests (`from app.services.descuentos import calcular_descuento`) en lugar de imports de paquete.
348
+
349
+ **`pytest.mark.asyncio` con `asyncio_mode = "auto"` en `pytest.ini` hace que fixtures síncronos que retornan coroutines sean llamados sin `await`, causando que el fixture entregue un objeto coroutine en lugar del valor esperado**: un fixture `def cliente_premium(db_session)` que retorna `ClienteFactory.build(tipo="premium")` funciona, pero si accidentalmente se define como `async def cliente_premium(db_session)` y se usa en un test síncrono, pytest lo trata como fixture síncrono y el test recibe el objeto coroutine. Causa: la mezcla de fixtures `async def` y `def` en el mismo `conftest.py` con `asyncio_mode = "auto"` puede crear comportamientos inesperados dependiendo de la versión de `pytest-asyncio`. Fix: en proyectos async, definir TODOS los fixtures relevantes como `async def` explícitamente y verificar que el test use `@pytest.mark.asyncio` o tenga el modo auto configurado correctamente.
350
+
351
+ **La fase REFACTOR del ciclo TDD en componentes Angular introduce regresiones silenciosas cuando se extrae lógica a un `computed()` pero el template sigue usando la función directa que ahora devuelve `undefined`**: refactorizar `getTotal()` como método del componente hacia `total = computed(() => ...)` y olvidar actualizar el template de `{{ getTotal() }}` a `{{ total() }}` no genera error de compilación con Angular 17+; el template simplemente muestra `undefined`. Causa: Angular no verifica en tiempo de compilación que los métodos referenciados en templates existen en la clase si el template usa la sintaxis de interpolación sin type-checking estricto. Fix: activar `strictTemplates: true` en `tsconfig.app.json` para que el compilador de Angular valide que todas las referencias en templates corresponden a miembros públicos del componente. Ejecutar `ng build` antes de considerar el REFACTOR completo.
352
+
353
+ **`db_session.rollback()` en el fixture de pytest-asyncio no deshace los datos insertados por `db.flush()` dentro de la función testeada cuando la sesión usa `autocommit=True` implícito por configuración del engine**: algunos proyectos configuran `AsyncEngine` con `isolation_level="AUTOCOMMIT"` para compatibilidad con operaciones DDL; en ese contexto, cada `flush()` hace commit inmediatamente y el `rollback()` del fixture no puede deshacer esos cambios. Causa: `AUTOCOMMIT` en PostgreSQL significa que no hay transacción activa que se pueda revertir. Fix: verificar que el engine de tests NO use `isolation_level="AUTOCOMMIT"` (la configuración debe ser solo para el engine de migraciones Alembic, no para el de la app). Para tests que necesitan AUTOCOMMIT por alguna razón, usar una BD de test separada que se trunca con `TRUNCATE ... RESTART IDENTITY CASCADE` en el teardown del fixture.
354
+
355
+ **Reloj inyectable como parámetro `ahora` habilita tests deterministas sin `freezegun`, `jest.useFakeTimers()` ni `sinon.useFakeTimers()`** [PATRÓN VALIDADO en SWL Opción C webhook]: cuando una API depende del tiempo (rate-limit con bucket que se rellena, dedup con ventana de retención, cache con TTL, schedulers), recibir el timestamp por parámetro en lugar de llamar `Date.now()` internamente permite que los tests pasen 1000 segundos en 0 ms reales. Diseño: `metodo(arg1, arg2, ahora = Date.now())` — producción no cambia (llamadas siguen siendo `obj.consumir(1)`), tests pasan `ahora` explícito (`obj.consumir(1, T0 + 5000)`). Validado en 3 módulos esta sesión: `rate-limit-ip.js` (40+ tests bucket refill, capacidad, cleanup), `webhook-dedup.js` (ventana de retención, rotación idempotente), helpers internos de `webhook-server.js`. Ningún test usa `sleep`, ningún test es flaky, ningún test mockea `Date`. Aplicable a JS/TS y a Python (`def consumir(self, tokens, ahora=None)` con `ahora = ahora or datetime.now(UTC)` al inicio).
356
+
357
+ ```js
358
+ // MAL — test no-determinista, requiere sleep o mock global
359
+ class Bucket {
360
+ consumir(n) {
361
+ const ahora = Date.now(); // imposible de controlar desde el test
362
+ this._rellenar(ahora);
363
+ if (this.tokens >= n) { this.tokens -= n; return true; }
364
+ return false;
365
+ }
366
+ }
367
+
368
+ // BIEN reloj inyectable, test determinista
369
+ class Bucket {
370
+ consumir(n, ahora = Date.now()) { // default en producción, inyectable en test
371
+ this._rellenar(ahora);
372
+ if (this.tokens >= n) { this.tokens -= n; return true; }
373
+ return false;
374
+ }
375
+ }
376
+
377
+ // En el test:
378
+ const T0 = 1700000000000;
379
+ const b = new Bucket(10, 1, T0);
380
+ for (let i = 0; i < 10; i++) b.consumir(1, T0); // saturar
381
+ assert.equal(b.consumir(1, T0), false); // sin refill aún
382
+ assert.equal(b.consumir(5, T0 + 5000), true); // 5 seg después: 5 tokens
383
+ ```
384
+
385
+ Aplica también a tests de clock skew (tiempo retrocede por NTP): pasar `T0 - 1000` y validar que la lógica no rompe. Origen: rate-limit-ip.js + webhook-dedup.js sesión 2026-05-13.
386
+
387
+ **Tests nombrados por feature (`test_emitir_factura_exitosa`) pierden poder regresivo; nombrados por causa raíz (`test_repository_no_usa_columna_inexistente_p_monto`) detectan regresiones específicas sin reproducción manual** [CONFIRMADO en SIGM Opción C F1.4]: cuando se descubre un bug por una causa raíz concreta (typo en nombre de columna SQL, omisión de `selectinload`, mock que devuelve dict en vez de objeto, schema obsoleto), el test de regresión que se escribe debe llevar el nombre de la causa, no del feature afectado. Caso real: durante F1.4 de SIGM, el repository de pagos referenciaba `p.monto` cuando la columna se llamaba `p.monto_pagado`; el test escrito como `test_repository_no_usa_columna_inexistente_p_monto` falló inmediatamente en la siguiente sesión cuando otro agente reintrodujo el typo, sin necesidad de reproducir el escenario de negocio (emitir cobro real, verificar respuesta). Causa: los nombres orientados a feature (`test_pago_exitoso`) son ambiguos sobre QUÉ falla si el test falla, el desarrollador debe diagnosticar; los nombres orientados a causa raíz (`test_X_no_usa_Y`, `test_query_incluye_selectinload_Z`, `test_service_devuelve_dict_no_objeto`) son auto-diagnósticos. Fix: para cada bug que cueste >30 min diagnosticar, escribir UN test adicional cuyo nombre describa la condición técnica violada, no el escenario de negocio. Convención: `test_<componente>_<condicion_tecnica>` o `test_<componente>_no_<anti_patron>`. Estos tests son tu segunda línea de defensa contra regresiones de la misma causa raíz, complementarios a los tests de comportamiento.
388
+
389
+ **`process.cwd()` cacheado al `require()` rompe tests con `process.chdir(sandbox)`** [PATRÓN GENÉRICO TESTING CLI]: scripts Node exportables que leen `process.cwd()` en el scope del módulo (al cargar) congelan el cwd al directorio de invocación. Los tests que crean sandboxes con `fs.mkdtempSync()` y luego `process.chdir(sandbox)` no afectan al cwd cacheado — el script sigue leyendo del cwd original y los assertions fallan con paths inesperados. Caso real (swl-ses `scripts/derivar-feature-list.js` 2026-05-15): la función `enriquecerDesdeFases(fases)` leía `const CWD = process.cwd()` calculado al `require()`; 2 tests con `process.chdir(sandbox)` retornaron `[]` en lugar de detectar el PLAN.md fixture. Causa: el constante se evaluó cuando el `node --test` cargó el módulo desde el cwd del proyecto, no desde el sandbox del test individual. Fix obligatorio: funciones exportables deben aceptar `cwd` como parámetro opcional con fallback dinámico (`function fn(args, opciones = {}) { const cwd = opciones.cwd || process.cwd(); ... }`). El código de producción no cambia (sin args extras), pero los tests pueden inyectar el cwd correcto. Aplica también a Python (`def fn(args, cwd: str | None = None): cwd = cwd or os.getcwd()`) y a cualquier lenguaje con tests que usen chdir.
390
+
391
+ ```js
392
+ // MAL cwd cacheado al require, tests con process.chdir() fallan
393
+ const CWD = process.cwd();
394
+ const PLANNING_DIR = path.join(CWD, '.planning');
395
+
396
+ function enriquecerDesdeFases(fases) {
397
+ const archivos = fs.readdirSync(path.join(PLANNING_DIR, 'fases')); // cwd congelado
398
+ // ...
399
+ }
400
+
401
+ // BIEN cwd dinámico con parámetro opcional para tests
402
+ function enriquecerDesdeFases(fases, opciones = {}) {
403
+ const cwd = opciones.cwd || process.cwd(); // recalcula al llamar
404
+ const archivos = fs.readdirSync(path.join(cwd, '.planning', 'fases'));
405
+ // ...
406
+ }
407
+
408
+ // En el test (usa setupSandboxes — regla tests-cleanup.md):
409
+ const { setupSandboxes } = require('../_helpers/sandbox');
410
+ const sandboxes = setupSandboxes('swl-test-');
411
+
412
+ const sandbox = sandboxes.create();
413
+ fs.mkdirSync(path.join(sandbox, '.planning', 'fases'), { recursive: true });
414
+ // Opción A: pasar cwd explícito (recomendado)
415
+ const r = enriquecerDesdeFases([], { cwd: sandbox });
416
+ // Opción B: process.chdir() — solo funciona con cwd dinámico
417
+ process.chdir(sandbox);
418
+ const r2 = enriquecerDesdeFases([]);
419
+ // Cleanup automático al final del archivo vía after() registrado por setupSandboxes.
420
+ ```
421
+
422
+ ---
423
+
424
+ ## Gotcha: silenced tests por race condition sobre estado compartido
425
+
426
+ ### El anti-patrón
427
+
428
+ ```javascript
429
+ // MAL — assertion condicional dentro de if que puede ser false por race
430
+ const FLAG = path.join(os.tmpdir(), 'mi-app.json');
431
+
432
+ test('flag sin contenido emite warning', () => {
433
+ borrarFlag();
434
+ const res = correrSubproceso();
435
+ if (fs.existsSync(FLAG)) { // ← otro test paralelo creó el flag
436
+ assert.match(res.stdout, /WARN/); // NUNCA se ejecuta si el if es false
437
+ }
438
+ // sin else → test PASA sin haber validado nada
439
+ });
440
+
441
+ // El test "verde" no significa "pasó" — significa "no falló ninguna assertion".
442
+ // Si la assertion vive dentro de un `if (race)`, una race favorable la salta
443
+ // y el test es vacío.
444
+ ```
445
+
446
+ ### Por qué pasa
447
+
448
+ `node:test` paraleliza **archivos** `.test.js` por default (no tests dentro
449
+ del mismo archivo). Si dos archivos tocan el mismo path único de filesystem
450
+ (`/tmp/foo.json`, lockfiles, sockets), las operaciones se intercalan no
451
+ deterministamente. Patrones típicos:
452
+
453
+ - Archivo A: `borrarFlag()` → spawn subprocess → assert
454
+ - Archivo B: spawn subprocess → `crearFlag()` durante A → assert de A condicionado falla
455
+
456
+ ### Patrones correctos
457
+
458
+ **Patrón 1 — Aislamiento por path único** (recomendado):
459
+
460
+ ```javascript
461
+ const { setupSandboxes } = require('../_helpers/sandbox');
462
+ const sandboxes = setupSandboxes('swl-mi-app-test-');
463
+ const env = { ...process.env };
464
+
465
+ // Path único por test usando el helper canónico (regla tests-cleanup.md).
466
+ // El cleanup es automático al final del archivo vía after() registrado.
467
+ const dir = sandboxes.create();
468
+ env.MI_APP_FLAG_PATH = path.join(dir, 'flag.json');
469
+
470
+ const res = spawnSync('node', [BIN], { env, ... });
471
+
472
+ // Ahora el assert es incondicional — el path es del test, no compartido
473
+ assert.match(res.stdout, /WARN/);
474
+ ```
475
+
476
+ Requiere que el SUT (System Under Test) honre una env var para override
477
+ del path. Si no la honra, agregar el override es parte del fix.
478
+
479
+ **Patrón 2 — Serialización forzada** (cuando el path es hardcoded):
480
+
481
+ ```bash
482
+ # Forzar --test-concurrency=1 en la suite completa
483
+ node --test --test-concurrency=1 tests/
484
+ ```
485
+
486
+ Tradeoff: tests más lentos pero deterministas. Aceptable si el aislamiento
487
+ no es factible (legacy code).
488
+
489
+ **Patrón 3 — assertions incondicionales** con setup determinista:
490
+
491
+ ```javascript
492
+ // MAL
493
+ if (fs.existsSync(FLAG)) assert.match(...)
494
+
495
+ // BIEN setup garantiza la precondición, assertion no se salta
496
+ escribirFlag({ ... });
497
+ assert.ok(fs.existsSync(FLAG), 'precondición del test'); // ← assertion sobre el setup
498
+ const res = correrSubproceso();
499
+ assert.match(res.stdout, /WARN/); // ← assertion incondicional sobre el resultado
500
+ ```
501
+
502
+ ### Anti-patrón: `if (X) assert(Y)` sin `else`
503
+
504
+ ```javascript
505
+ // MAL un test que pasa silenciosamente cuando X es false
506
+ test('hace algo', () => {
507
+ const algo = obtenerAlgo();
508
+ if (algo) { // ← race u otra fuente de no-determinismo
509
+ assert.equal(algo.valor, 42);
510
+ }
511
+ // sin else → veredicto "pass" sin haber validado nada
512
+ });
513
+
514
+ // BIEN el setup garantiza la precondición o el test falla explícito
515
+ test('hace algo', () => {
516
+ const algo = obtenerAlgo();
517
+ assert.ok(algo, 'precondición: obtenerAlgo debe devolver valor');
518
+ assert.equal(algo.valor, 42);
519
+ });
520
+ ```
521
+
522
+ **Regla**: una assertion dentro de un `if` sin `else` es **un test que
523
+ puede pasar sin validar nada**. Estos "silenced tests" son la peor clase
524
+ de falsa cobertura: el reporter dice "pass" y nadie revisa el código
525
+ hasta que un bug llega a producción.
526
+
527
+ ### Detección
528
+
529
+ - Buscar `if (` dentro de cuerpos de `test(...)`/`it(...)` sin `else { fail() }`
530
+ o `else { assert(...) }` correspondiente.
531
+ - Si el cuerpo del `if` contiene `assert.*`, considerarlo silenced test
532
+ hasta que se demuestre que el `if` no puede ser false en ningún escenario.
533
+
534
+ ### Origen
535
+
536
+ Detectado en sesión 2026-05-16 del proyecto swl-ses (PR #30): tests del
537
+ flag `swl-ses-update-check.json` compartido entre dos archivos `.test.js`
538
+ paralelos. El test "sin flag → debe advertir" pasaba en CI cuando otro
539
+ archivo creaba el flag, sin ejecutar ninguna assertion. Fix: env var
540
+ `SWL_UPDATE_FLAG_PATH` para aislamiento + assertions incondicionales.
541
+
542
+ ---
543
+
544
+ ## Tests E2E de CLIs interactivos sin PTY real
545
+
546
+ ### El problema
547
+
548
+ Probar un CLI interactivo (TUI con `readline`, prompts, keypress events,
549
+ `process.stdin.isTTY`) en CI requiere normalmente un **pseudo-terminal
550
+ emulado** (PTY) usualmente vía `node-pty`, una dependencia **nativa** que:
551
+
552
+ - Requiere compilación de extensiones C++ al instalar (puede fallar en
553
+ contenedores minimal o en Windows sin Visual Studio Build Tools).
554
+ - Agrega ~5 MB al `node_modules` por imagen.
555
+ - Hace que el test suite no corra en `npm test` sin setup extra.
556
+
557
+ Para CLIs interactivos donde no se necesita probar **el comportamiento
558
+ real del terminal** (escape codes, redibujado, scroll), sino solo la
559
+ **lógica del wizard** (¿qué pasa si el usuario presiona Esc en el paso 3?,
560
+ ¿qué resuelve el promise tras Enter con default?), un harness TTY mockeado
561
+ cubre ~90% de los casos sin dep nativa.
562
+
563
+ ### Patrón del harness
564
+
565
+ ```javascript
566
+ // tests/harness-tty.js
567
+ 'use strict';
568
+
569
+ const readline = require('readline');
570
+
571
+ function crearHarness() {
572
+ // 1. Capturar estado original para restauración
573
+ const stdoutOriginal = process.stdout.write.bind(process.stdout);
574
+ const isTtyStdoutOriginal = process.stdout.isTTY;
575
+ const isTtyStdinOriginal = process.stdin.isTTY;
576
+ const setRawModeOriginal = process.stdin.setRawMode
577
+ ? process.stdin.setRawMode.bind(process.stdin) : null;
578
+ const emitKeypressOriginal = readline.emitKeypressEvents;
579
+
580
+ let capturado = '';
581
+ let listenersKeypress = [];
582
+
583
+ // 2. Forzar TTY antes de cargar módulos UI (que evalúan ES_TTY al require)
584
+ Object.defineProperty(process.stdout, 'isTTY', { value: true, configurable: true });
585
+ Object.defineProperty(process.stdin, 'isTTY', { value: true, configurable: true });
586
+
587
+ // 3. Capturar stdout en string buffer
588
+ process.stdout.write = (chunk) => {
589
+ capturado += typeof chunk === 'string' ? chunk : chunk.toString();
590
+ return true;
591
+ };
592
+
593
+ // 4. Mockear setRawMode/resume/pause como no-op (evita tomar control del terminal de test)
594
+ process.stdin.setRawMode = () => process.stdin;
595
+ process.stdin.resume = () => process.stdin;
596
+ process.stdin.pause = () => process.stdin;
597
+
598
+ // 5. Interceptar registros de 'keypress' para poder emitirlos a mano
599
+ const onListenerOriginal = process.stdin.on.bind(process.stdin);
600
+ process.stdin.on = (evento, listener) => {
601
+ if (evento === 'keypress') listenersKeypress.push(listener);
602
+ return onListenerOriginal(evento, listener);
603
+ };
604
+
605
+ // 6. Mockear readline.emitKeypressEvents (no necesita stdin real)
606
+ readline.emitKeypressEvents = (stream) => stream;
607
+
608
+ // 7. Limpiar require cache de módulos UI para que se evalúen con TTY=true
609
+ delete require.cache[require.resolve('../scripts/tui/lib/render')];
610
+
611
+ function cargarUI() {
612
+ return require('../scripts/tui/lib/render');
613
+ }
614
+
615
+ // 8. Emitir keypress programáticamente
616
+ function tecla(nombre, extras = {}) {
617
+ const key = { name: nombre, ctrl: false, meta: false, shift: false, ...extras };
618
+ const str = nombre.length === 1 ? nombre : '';
619
+ for (const listener of [...listenersKeypress]) {
620
+ try { listener(str, key); } catch (_) { /* swallow */ }
621
+ }
622
+ }
623
+
624
+ // 9. Esperar N ticks del event loop para promesas internas
625
+ function esperarTicks(n = 1) {
626
+ let p = Promise.resolve();
627
+ for (let i = 0; i < n; i++) p = p.then(() => undefined);
628
+ return p;
629
+ }
630
+
631
+ function captura(opts = {}) {
632
+ const valor = capturado;
633
+ if (opts.limpiar) capturado = '';
634
+ return valor;
635
+ }
636
+
637
+ function restaurar() {
638
+ Object.defineProperty(process.stdout, 'isTTY', { value: isTtyStdoutOriginal, configurable: true });
639
+ Object.defineProperty(process.stdin, 'isTTY', { value: isTtyStdinOriginal, configurable: true });
640
+ process.stdout.write = stdoutOriginal;
641
+ if (setRawModeOriginal) process.stdin.setRawMode = setRawModeOriginal;
642
+ process.stdin.on = onListenerOriginal;
643
+ readline.emitKeypressEvents = emitKeypressOriginal;
644
+ listenersKeypress = [];
645
+ // Limpiar require cache para no contaminar otros tests
646
+ delete require.cache[require.resolve('../scripts/tui/lib/render')];
647
+ }
648
+
649
+ return { cargarUI, tecla, esperarTicks, captura, restaurar };
650
+ }
651
+
652
+ module.exports = { crearHarness };
653
+ ```
654
+
655
+ ### Uso típico
656
+
657
+ ```javascript
658
+ const test = require('node:test');
659
+ const assert = require('node:assert/strict');
660
+ const { crearHarness } = require('./harness-tty');
661
+
662
+ test('preguntarSiNo con harness: Enter resuelve con default true', async () => {
663
+ const h = crearHarness();
664
+ try {
665
+ const ui = h.cargarUI();
666
+ const promesa = ui.preguntarSiNo('test prompt', true);
667
+
668
+ await h.esperarTicks(2);
669
+ h.tecla('return');
670
+
671
+ const timeout = new Promise((_, reject) =>
672
+ setTimeout(() => reject(new Error('no resolvió en 500ms')), 500));
673
+
674
+ const r = await Promise.race([promesa, timeout]).catch(() => null);
675
+ // r === true si el harness simuló bien; null si readline real bloquea
676
+ // (caso esperado en Windows sin PTY real; documentar limitación)
677
+ } finally {
678
+ h.restaurar();
679
+ }
680
+ });
681
+ ```
682
+
683
+ ### Reglas operativas
684
+
685
+ - **`restaurar()` en `finally`**: el harness modifica state global
686
+ (process.stdout, process.stdin, readline, require.cache). Si un test
687
+ no restaura, contamina los siguientes.
688
+ - **Test de captura como smoke**: agregar un test "harness captura stdout"
689
+ que valida que `process.stdout.write('hola')` aparece en `captura()`.
690
+ Si falla, el harness está roto antes de testear el SUT.
691
+ - **Test "tecla() es no-op sin listeners"**: validar que emitir keypress
692
+ cuando nadie escucha NO rompe el harness ni propaga errores.
693
+ - **Limitación reconocida**: si `readline.createInterface()` real toma
694
+ control de stdin (en Windows con Git Bash sin PTY), el callback de
695
+ `rl.question()` no se invoca aunque el harness emita teclas. Usar
696
+ `Promise.race([promesa, timeout])` para que el test no cuelgue —
697
+ el test marca limitación, no falla.
698
+
699
+ ### Cuándo NO usar este patrón
700
+
701
+ - Cuando necesitas probar **redibujado real del terminal** (alt screen
702
+ buffer, escape codes complejos, scrollback). Ahí necesitas PTY real
703
+ via `node-pty` o test manual.
704
+ - Cuando el SUT depende de **timing real del teclado** (input rates,
705
+ paste detection). El mock no replica latencia.
706
+ - Para CLIs sin lógica de control de flujo (solo `console.log` lineal) —
707
+ ahí basta capturar stdout sin mockear TTY.
708
+
709
+ ### Origen
710
+
711
+ Aplicado en swl-ses v1.6.0 (`tests/scripts/tui/harness-tty.js`, ~180 LOC).
712
+ Validó el TUI completo de 5 fases sin instalar `node-pty`. Limitación
713
+ documentada: 1 test E2E "preguntarSiNo con harness" marca timeout en
714
+ Windows + Node 22+ porque readline real bloquea pese a stdin mockeado —
715
+ el harness emite la limitación sin fallar.